説明

学習用音声合成システム及び学習用音声合成方法

【課題】利用者が学習を行う際に学習用の文章をテキストデータから音声データへ変換し音声データを入手可能とする学習用音声合成システム、音声合成方法の提供。
【解決手段】利用者がテキストデータを入力し、合成音声を入手するための利用者端末1と、利用者のWebページへのアクセス認証、テキストデータ、音声データの受渡しを行うWebサーバ21と、利用者が入力したテキストデータ及び前記Webサーバにて管理される利用者の固有情報を蓄積、管理するデータベースサーバ22と、テキストデータを変換した音声データの管理を行うファイルサーバ24と、Webサーバ、データベースサーバを介して送信されたテキストデータを音声データへ変換し、変換された音声データをファイルサーバへ受け渡す音声合成サーバ23からなる音声合成システム2とをインターネット網を介して接続するよう構成される特徴的構成手段の採用。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習用文字の音声化を行うシステム及び方法に関するものであり、詳しくは、利用者が学習を行う際に学習用の文章をテキストデータとして利用者の端末からインターネット回線を通じて音声合成サーバへ送信することにより、テキストデータが音声データとして変換され、再度端末を通じて利用者が変換された音声データを入手可能とする学習用音声合成システム及び学習用音声合成方法に係わる。
【背景技術】
【0002】
従来、学習方法の一つとして音声を教材として利用する方法が普及しており、音声データを教材として教材利用者が学習を行う場合には、利用される音声は、予めカセットテープや、CD等の記録媒体に音声データを記録したものが一般的である。
【0003】
しかしながら、記録媒体に音声データを記録する際、特にその音声データがデジタルデータの場合には、データの作成や音声データの記録媒体への記録など、音声データの作成者が音声データを作成し、利用者が音声データを入手するためには専用の録音機器や、複雑な作業行程を経なくてはならず、個人の利用用途としては、デジタルデータとして音声データを作成するまでもなく、利用者が自ら発した音声をカセットテープなどに直接録音する方法が定着している。
【0004】
そこで、利用者が音声データをデジタルデータで入手する場合、個人として準備するには困難であるような、暗記演習用に利用される場合等の膨大な量の音声データは、書籍等に音声データを収録した記録媒体を付録させるサービスや、記録媒体そのものを販売するサービスが一般的であった。
【0005】
一方、現在、一般家庭等に普及してきたインターネット回線を利用することにより、デジタルな音声データを個人利用者が入手する方法が普及してきている。
【0006】
インターネットを使用した教材用音声データの入手方法としては、音声データの教材提供元がインターネット上からデジタル音声データを再生できるようなシステムをサービスし、利用者がその音声データを再生するか、又は、教材提供元がインターネット上からデジタル音声データをダウンロード可能にし、利用者が必要に応じて音声データをパソコン等の端末へダウンロードした後、そのデータを端末上で再生することによるものが主である。
【0007】
この方法を利用することにより、利用者は、インターネットに接続されたパソコン等の端末さえあれば、利用用途に応じた音声データを必要なだけ手軽にインターネット上からダウンロードし、活用することが可能となるため、記録媒体や、専用のプレーヤーなどを購入するまでもなく、容易に、ネットワーク等を利用して音声データを手に入れることができることが大きな利点となる。
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、現在インターネット上からダウンロードできる教材用音声データの種類としては、語学用途に利用される発音練習用の音声データや、暗記用途に利用される音声データの例文等など、その内容は限られたものとなっている。
【0009】
また、暗記用教材の場合、利用者のニーズに合った教材用音声データがそれぞれの利用者によって異なるため、多種多様なニーズに対応するためには膨大な量の教材用音声データをインターネットを介して配信する必要が出てくる。
【0010】
しかし、膨大な量の音声データは、教材提供先のサーバの負担にもなるため懸念されがちであり、前述したように、書籍への付録としてや、CD単体を教材用音声データとしてサービスを実施したほうが効率的であるため、インターネット上から入手する方法は有益とは言えず、教材用音声データサービスとしてはあくまで例文等の少量のデータの再生、ダウンロードのみに限られてしまっている。
【0011】
ここにおいて、本発明の解決すべき主要な目的は、次の通りである。
【0012】
即ち、本発明の第1の目的は、利用者のニーズに合ったテキスト文章を音声として出力することが可能となる学習用音声合成システム及び学習用音声合成方法を提供せんとするものである。
【0013】
本発明第2の目的は、利用者が、大掛かりな装置や複雑な手段を講じることなく、単にインターネット回線に接続された利用者端末から文章を入力し、送信するだけで、必要なテキストデータを音声データとして入手することが可能となる学習用音声合成システム及び学習用音声合成方法を提供せんとするものである。
【0014】
本発明第3の目的は、利用者が入手する音声データを、より人間の自然な音声として合成できるような学習用音声合成システム及び学習用音声合成方法を提供せんとするものである。
【0015】
本発明第4の目的は、利用者の利用時間、利用量によって、利用者の状態に応じた決済処理が可能となる学習用音声合成システム及び学習用音声合成方法を提供せんとするものである。
【0016】
本発明の他の目的は、明細書、図面、特に、特許請求の範囲の各請求項の記載から、自ずと明らかになろう。
【課題を解決するための手段】
【0017】
本発明システムは、上記課題の解決に当たり、利用者がテキストデータを入力し、合成音声を入手するための利用者端末と、利用者の本システムの利用状況、ユーザID、パスワード等の固有情報に応じて、Webページへのアクセス認証、テキストデータ、音声データの受渡しを行うWebサーバと、利用者が入力したテキストデータ及び前記Webサーバにて管理される利用者の固有情報を蓄積、管理するデータベースサーバと、テキストデータを変換した音声データの管理を行うファイルサーバと、Webサーバ、データベースサーバを介して送信されたテキストデータを音声データへ変換し、変換された音声データをファイルサーバへ受け渡す音声合成サーバと、を備える学習用音声合成システムの手段を講じる特徴を有する。
【0018】
また、本発明方法は、利用者が利用者端末を用いてインターネットにテキストデータを入力し、当該テキストデータをインターネット回線を通じてWebサーバに送信し、Webサーバからデータベースサーバを介して音声合成サーバ内にて音声データに変換した後、ファイルサーバへ当該音声データを格納し、前記利用者が前記音声データをダウンロード要求すると、前記ファイルサーバが前記Webサーバを介して前記音声データをダウンロード可能にし、利用者が前記音声データを入手可能となる学習用音声合成方法を講じる特徴を有する。
【0019】
さらに具体的詳細に述べると、当該課題の解決では、本発明が次に列挙する上位概念から下位概念に係る新規な特徴的構成手段又は手法を採用することにより、前記目的を達成するよう為される。
【0020】
本発明システムの第1の特徴は、インターネット網に接続された利用者端末からWebページを通じて任意に入力、送信されたテキストデータを、複数のサーバからなる音声合成システムにて音声データに変換後、当該音声データをインターネット網を通じて端末へ配信する学習用音声合成システムであって、前記利用者端末は、利用者が入力した任意の文章を前記インターネット網を通じて前記サーバ群側へ送信するとともに、当該サーバ群側にてテキストデータから変換された音声データを受信する手段を具備する一方、前記音声合成システムは、前記利用者端末と前記テキストデータ及び前記音声データの送受を行うとともに、前記利用者の認証を行うWebサーバと、前記利用者のユーザID、パスワード及び利用履歴等の個人情報を管理するとともに、前記利用者端末から入力された前記テキストデータの格納及び他サーバへのデータの受渡しを行うデータベースサーバと、前記テキストデータを音声データとして音声合成変換する音声合成サーバと、前記音声データの格納保持及び、前記Webサーバへの前記音声データの受渡しを行うファイルサーバと、で構成され、前記Webサーバは、前記利用者端末から入力された任意の文章をテキストデータとして受信し、当該テキストデータを前記データベースサーバへ送信する一方、前記ファイルサーバから、前記テキストデータが音声データへと合成音声変換された旨の通知を受けると、前記利用者端末へダウンロードが可能である旨通知するとともに、当該利用者端末から前記音声データのダウンロード要求があれば、前記ファイルサーバから当該音声データを受け取り、当該利用者端末へと送信する手段を具備し、前記データベースサーバは、前記Webサーバからテキストデータを受け取ると、当該テキストデータを当該データベースサーバ内に格納保持するとともに、前記音声合成サーバに当該テキストデータを送信する手段を具備し、前記音声合成サーバは、前記データベースサーバから前記テキストデータを受信すると、当該テキストデータを音声に合成変換し、音声データとして前記ファイルサーバに送信する手段を具備し、前記ファイルサーバは、前記音声合成サーバから、変換された前記音声データを受け取ると、当該音声データを保持格納し、前記Webサーバへ音声データ変換完了の通知をするとともに、当該Webサーバから前記音声データのダウンロード要求があれば、当該音声データを当該Webサーバに受け渡す手段を具備してなる学習用音声合成システムの構成採用にある。
【0021】
本発明システムの第2の特徴は、前記本発明システムの第1の特徴における前記音声合成サーバが、コーパスベース音声合成手段を具備してなる学習用音声合成システムの構成採用にある。
【0022】
本発明システムの第3の特徴は、前記本発明システムの第1又は第2の特徴における前記利用者が、パーソナルコンピュータを利用するか、又は、携帯電話、デジタルプレイヤー等の前記インターネット網に接続可能な携帯型端末も利用可能としてなる学習用音声合成システムの構成採用にある。
【0023】
即ち、本発明方法の第1の特徴は、学習用として利用するための任意の文章を、利用者がインターネットに接続された利用者端末のWebページ上から入力・送信した後、複数のサーバで構成される音声合成システムが、前記任意の文章からなるテキストデータを受信し、音声データとして変換した後、再度インターネット網を通じて利用者端末へアップロードする学習用音声合成方法であって、前記利用者が、前記利用者端末に表示されたWebページ上に前記任意の文章を入力し、当該任意の文章を前記音声合成システムに対し送信を行うと、当該音声合成システム側において、前記インターネット網に接続されたWebサーバが、送信された前記任意の文章をテキストデータとして受信するとともに、当該テキストデータを、前記利用者の個人情報及びテキストデータの管理を行うデータベースサーバへと送信する処理と、当該データベースサーバが、前記Webサーバから前記テキストデータを受信すると、当該テキストデータを保持格納するとともに、テキストデータを音声データへと変換する音声合成サーバへと受渡す処理と、当該音声合成サーバが、前記データベースサーバから受け取った前記テキストデータから音声データを作成するとともに、音声データを保持管理するファイルサーバへ当該音声データをアップロードする処理と、当該ファイルサーバが、当該音声合成サーバから前記音声データをアップロードされると、当該ファイルサーバ内に当該音声データを保持するとともに、前記Webサーバに前記テキストデータが音声データとして変換された旨を通知する処理と、前記Webサーバが前記ファイルサーバから通知を受けると、Webページにて前記音声データをダウンロード可能にする処理とを実行するとともに、前記利用者が、前記利用者端末に表示されたWebページ上から前記ダウンロード可能になった音声データをダウンロード要求すると、前記Webサーバが、前記ファイルサーバに前記音声データを配信する旨通知し、当該ファイルサーバから、前記利用者から要求のあった当該音声データを受信するとともに、当該音声データを前記利用者端末に対しインターネット網を通じて配信する処理を行う、一連の処理手順を順次実行することにより、前記利用者端末にて、前記音声データがダウンロード可能である、学習用音声合成方法の構成採用にある。
【0024】
本発明方法の第2の特徴は、前記本発明方法の第1の特徴における前記利用者端末に表示されるWebページが、前記利用者のユーザID、パスワードを入力することにより表示可能であり、前記Webサーバが前記利用者からの音声合成用Webページにアクセスがある度に、前記利用者のユーザID、パスワード等の利用者の個人情報及び、利用履歴を格納したデータベースサーバから、逐次利用者の認証を行うアクセス許可、拒否の判断を行ってなる、学習用音声合成方法の構成採用にある。
【0025】
本発明方法の第3の特徴は、前記本発明方法の第1又は第2の特徴における前記Webサーバから前記利用者端末へのダウンロード許可の通知が、電子メール及びWebページへの表示にて行ってなる学習用音声合成方法の構成採用にある。
【0026】
本発明方法の第4の特徴は、前記本発明方法の第1、2又は第3の特徴における前記音声合成サーバが、コーパスベース音声合成にて前記テキストデータから前記音声データへの変換を行ってなる学習用音声合成方法の構成採用にある。
【0027】
本発明方法の第5の特徴は、前記本発明方法の第1又は第2の特徴における前記利用者端末が、携帯電話、デジタルプレイヤー等の前記インターネット網に接続可能な携帯型端末である場合、前記ファイルサーバから前記Webサーバへ前記音声データのアップロードが完了すると、前記Webサーバは当該携帯型端末へ自動的に直接当該音声データをアップロードしてなる学習用音声合成方法の構成採用にある。
【発明の効果】
【0028】
本発明によれば、利用者端末からテキストデータを入力するのみで音声データへと変換することができ、大掛かりな装置や、複雑な手順などを踏むことなく、利用者のニーズに応じた内容、量の音声データを容易に入手することが可能となる。
【0029】
また、テキストデータから音声データへの音声合成変換に、コーパスベースを利用することにより、より人間の発声に近い自然な音声データへの変換が可能となるため、教材用音声データとして有益である。
【0030】
また、利用者の利用状況を管理することにより、利用者の本システムの利用状況に応じた課金決済処理を実施することが可能となり、サービスとしても実用的である。
【発明を実施するための最良の形態】
【0031】
以下、本発明の実施形態であるシステム例、及びこれに対応する方法例につき順に説明する。
【0032】
(システム例)
本システム例を図1を用いて説明する。図1は、本システム例である音声合成システムを示す構成図である。
【0033】
本システム例のテキスト音声変換システムαは、音声合成を行うシステム利用者がテキスト入力を行うための利用者端末1と、利用者端末1から入力、送信されたテキストデータを音声データへと変換する音声変換システム部2とをインターネット網3を介して構成され、音声変換システム部2は、Webサーバ21とデータベースサーバ22と音声合成サーバ23とファイルサーバ24とを具備して構成される。
【0034】
利用者端末1は、音声合成の実行要求を送信するためのWebページを表示するための画面表示部11を持ち、インターネット網3に接続されるパーソナルコンピュータであるが、パーソナルコンピュータのみには限定されず、インターネットの利用ができ、さらにテキストの入力、音声の再生が実行できる機能を有するPDA、携帯電話等の端末であってもよい。
【0035】
Webサーバ21は、インターネット網3を通じて利用者端末1に対し、データの送受信を行うものであり、利用者端末1から送信されたテキストデータ及び、ファイルサーバからから送信された音声データの送受状況を管理する構成であるとともに、利用者端末1を利用するユーザが、音声合成システム2にアクセスする際のユーザ認証、照会及び管理も行う。
【0036】
データベースサーバ22は、利用者のIDやパスワード、利用状況等を保持するとともに、利用者端末1から入力されたテキストデータを格納するサーバであり、利用者端末1がインターネット網3を通じてWebサーバ21にアクセスした際、Webサーバ21は、データベースサーバ22を利用して利用者端末1の特定、認証及び、利用状況の確認を行うとともに、利用者端末1からテキストデータが入力されると、Webサーバを通じデータベースサーバ22にテキストデータが格納され、データベースサーバ22は、該テキストデータを音声合成サーバ23に送信することにより、入力されたテキストデータと本システムの利用者との関連付けを行いながら管理することができ、利用者に対しての課金処理を実施することとなる。
【0037】
音声合成サーバ23は、利用者端末1から入力され、データベースサーバ22からを介して送信されたテキストデータを音声合成技術を用いて音声データに変換するものであり、音声の合成にはコーパスベース音声合成を用いる。
【0038】
ここで、コーパスべース音声合成は、予め人の肉声を文章として数多く収録したものを事前にデータベース化し、これらの膨大な音声データを音源として音声を合成する技術であり、この技術を利用することにより人間の肉声に近い自然な音声の再生が可能となる。
【0039】
ファイルサーバ24は、音声合成サーバ23にてテキストデータから変換された音声データを格納するサーバであり、音声合成サーバ23にて音声データが作成されると、音声データはファイルサーバ23に格納され、利用者端末1から音声データのダウンロード要求が送信されることを契機として、Webサーバを通じ利用者端末1へ音声データを送信する。
【0040】
(実施例)
次に、以上のように構成されたシステム例に係る学習用音声合成システムαに適用される実施例につき説明する。図2は、図1に示したシステム例に適用される本発明の実施形態を説明するためのフローチャートである。
【0041】
図1及び図2に示すように、この実施例においては、まず、利用者は利用者端末1に表示されたコンテンツ表示部11へアクセスするためIDとパスワードをWebサーバ21へ送信する(ST11)。
【0042】
Webサーバ21は、利用者が、利用者端末1にて音声合成用Webページへアクセス要求を行うと、利用者の現在入力されたユーザID及びパスワードのアクセス認証を(ST211)するため、データベースサーバ22に格納された利用者のユーザID及びパスワードの問い合わせ(ST221)から認証の妥当性を確認し、妥当であればアクセス許可をし音声合成用画面を表示させ(ST13)、妥当でなければアクセス拒否とし改めてユーザIDとパスワード入力画面を表示させる(ST12)。
【0043】
アクセス許可を受けた利用者は、コンテンツ表示部から文章を入力し、当該文章をテキストデータとしてWebサーバ21に送信する(ST14)。すると、Webサーバ21は、利用者端末1から送信されたテキストデータをデータベースサーバ22へとアップロードする(ST212)。
【0044】
データベースサーバ22は、Webサーバ21からアップロードされたテキストデータと、利用者の個人情報と関連付けしデータベース内に格納保持するとともに(ST222)、音声合成サーバ23へテキストデータをインプットする(ST23)。
【0045】
音声合成サーバ23は、データベースサーバ22から送信されたテキストデータを音声データに変換する(ST231)と、音声データをファイルサーバへアウトプット(ST232)し、ファイルサーバ24は、音声合成サーバ23から受け取った音声データを保持しておくとともに(ST241)、音声合成サーバ23によりテキストデータから音声データの変換が終了した旨Webサーバ21へ通知する(ST242)。
【0046】
Webサーバ21は、ファイルサーバ24から音声データの変換が終了した旨の通知を受けると、音声データのダウンロードが可能となるようにし(ST213)、さらに、予め会員登録の際に記録された利用者の電子メールアドレスに対し、音声合成の完了として電子メールを送信し(ST214)、かつ、利用者端末1の画面表示部11に表示されたWebページ上に音声合成完了の旨を表示することにより利用者への通知とし、ダウンロード画面を表示させる(ST15)。
【0047】
利用者が、音声合成の完了通知電子メール又は完了通知画面を確認し、画面表示部11に表示されたWebページから音声データのダウンロード要求を発すると(ST16)、Webサーバ21は、ファイルサーバ24に対し、利用者から要求のあった音声データをダウンロード要求があった旨通知し(ST215)、ファイルサーバ24はWebサーバからの通知をもとに格納してあった音声データをWebサーバ21へと送信する(ST243)。
【0048】
Webサーバ21は、利用者端末1へインターネット網3を通じてファイルサーバ24から受け取った音声データを配信し(ST216)、利用者は、音声データを受信することとなる(ST17)。
【0049】
ここで、利用者による本システムの利用状況は、Webサーバ21から送信されたアクセス状況、ダウンロード状況、テキストデータ情報等の情報を関連付けることによりデータベースサーバ22に格納され、本システム利用において課金管理などを行う場合は、データベースサーバ22から、決済代行会社へ課金対象者の履歴データを送信することにより課金処理を行うことも可能となる。
【0050】
また、上述したように、本システムの発展形として、本システムにおける利用者端末1を、パソコンに限定せずに、携帯電話やデジタル音声プレーヤーに直接ダウンロードすることも可能であり、例えば、デジタル音声プレーヤーの場合には、利用者が自らダウンロード要求を行わなくとも、Webサイトの更新情報を簡易に配信するためのフォーマットであるRSS(RDF Site Summary)を利用するなどして音声合成が完了した後にRSSを利用するためのアプリケーションであるアグリゲータソフトで自動的に音声データを入手するなども可能となる。
【0051】
以上、本発明の実施の形態につき、学習用音声合成システムαのシステム例、方法例を挙げて説明したが、本発明は必ずしも上述した手段にのみ限定されるものではなく、前述した効果を有する範囲内において、適宜、変更実施することが可能なものである。
【図面の簡単な説明】
【0052】
【図1】本発明のシステム例に係る学習用音声合成システムのシステム構成を示す図である。
【図2】本発明のシステム例に適用される本発明の方法例を説明するためのフローチャートである。
【符号の説明】
【0053】
α…学習用音声合成システム
1…利用者端末
11…コンテンツ表示部
2…音声合成システム
21…Webサーバ
22…データベースサーバ
23…音声合成サーバ
24…ファイルサーバ
3…インターネット網

【特許請求の範囲】
【請求項1】
インターネット網に接続された利用者端末からWebページを通じて任意に入力、送信されたテキストデータを、複数のサーバからなる音声合成システムにて音声データに変換後、当該音声データをインターネット網を通じて端末へ配信する学習用音声合成システムであって、
前記利用者端末は、利用者が入力した任意の文章を前記インターネット網を通じて前記サーバ群側へ送信するとともに、当該サーバ群側にてテキストデータから変換された音声データを受信する手段を具備する一方、
前記音声合成システムは、
前記利用者端末と前記テキストデータ及び前記音声データの送受を行うとともに、前記利用者の認証を行うWebサーバと、
前記利用者のユーザID、パスワード及び利用履歴等の個人情報を管理するとともに、前記利用者端末から入力された前記テキストデータの格納及び他サーバへのデータの受渡しを行うデータベースサーバと、
前記テキストデータを音声データとして音声合成変換する音声合成サーバと、
前記音声データの格納保持及び、前記Webサーバへの前記音声データの受渡しを行うファイルサーバと、で構成され、
前記Webサーバは、前記利用者端末から入力された任意の文章をテキストデータとして受信し、当該テキストデータを前記データベースサーバへ送信する一方、前記ファイルサーバから、前記テキストデータが音声データへと合成音声変換された旨の通知を受けると、前記利用者端末へダウンロードが可能である旨通知するとともに、当該利用者端末から前記音声データのダウンロード要求があれば、前記ファイルサーバから当該音声データを受け取り、当該利用者端末へと送信する手段を具備し、
前記データベースサーバは、前記Webサーバからテキストデータを受け取ると、当該テキストデータを当該データベースサーバ内に格納保持するとともに、前記音声合成サーバに当該テキストデータを送信する手段を具備し、
前記音声合成サーバは、前記データベースサーバから前記テキストデータを受信すると、当該テキストデータを音声に合成変換し、音声データとして前記ファイルサーバに送信する手段を具備し、
前記ファイルサーバは、前記音声合成サーバから、変換された前記音声データを受け取ると、当該音声データを保持格納し、前記Webサーバへ音声データ変換完了の通知をするとともに、当該Webサーバから前記音声データのダウンロード要求があれば、当該音声データを当該Webサーバに受け渡す手段を具備する、
ことを特徴とする学習用音声合成システム。
【請求項2】
前記音声合成サーバは、
コーパスベース音声合成手段を具備する、
ことを特徴とする請求項1に記載の学習用音声合成システム。
【請求項3】
前記利用者端末は、
パーソナルコンピュータを利用するか、
又は、携帯電話、デジタルプレイヤー等の前記インターネット網に接続可能な携帯型端末も利用可能とする、
ことを特徴とする請求項1又は2に記載の学習用音声合成システム。
【請求項4】
学習用として利用するための任意の文章を、利用者がインターネットに接続された利用者端末のWebページ上から入力・送信した後、複数のサーバで構成される音声合成システムが、前記任意の文章からなるテキストデータを受信し、音声データとして変換した後、再度インターネット網を通じて利用者端末へアップロードする学習用音声合成方法であって、
前記利用者が、前記利用者端末に表示されたWebページ上に前記任意の文章を入力し、当該任意の文章を前記音声合成システムに対し送信を行うと、
当該音声合成システム側において、
前記インターネット網に接続されたWebサーバが、送信された前記任意の文章をテキストデータとして受信するとともに、当該テキストデータを、前記利用者の個人情報及びテキストデータの管理を行うデータベースサーバへと送信する処理と、
当該データベースサーバが、前記Webサーバから前記テキストデータを受信すると、当該テキストデータを保持格納するとともに、テキストデータを音声データへと変換する音声合成サーバへと受渡す処理と、
当該音声合成サーバが、前記データベースサーバから受け取った前記テキストデータから音声データを作成するとともに、音声データを保持管理するファイルサーバへ当該音声データをアップロードする処理と、
当該ファイルサーバが、当該音声合成サーバから前記音声データをアップロードされると、当該ファイルサーバ内に当該音声データを保持するとともに、前記Webサーバに前記テキストデータが音声データとして変換された旨を通知する処理と、
前記Webサーバが前記ファイルサーバから通知を受けると、前記Webページにて前記音声データをダウンロード可能にする処理とを実行するとともに、
前記利用者が、前記利用者端末に表示された前記Webページ上から前記ダウンロード可能になった音声データをダウンロード要求すると、
前記Webサーバが、前記ファイルサーバに前記音声データを配信する旨通知し、当該ファイルサーバから、前記利用者から要求のあった当該音声データを受信するとともに、当該音声データを前記利用者端末に対しインターネット網を通じて配信する処理を行う、
一連の処理手順を順次実行することにより、
前記利用者端末にて、前記音声データがダウンロード可能となる、
ことを特徴とする学習用音声合成方法。
【請求項5】
前記利用者端末に表示されるWebページは、
前記利用者のユーザID、パスワードを入力しログインすることにより表示され、
前記Webサーバが前記利用者からのアクセスがある度に、前記利用者のユーザID、パスワード等の利用者の個人情報及び、利用履歴を格納した前記データベースサーバから、逐次利用者の認証を行うアクセス許可、拒否の判断を行う、
ことを特徴とする請求項4に記載の学習用音声合成方法。
【請求項6】
前記Webサーバから前記利用者端末への前記音声データのダウンロード可能の通知は、
電子メール及びWebページへの表示にて行う、
ことを特徴とする請求項4又は5に記載の学習用音声合成方法。
【請求項7】
前記音声合成サーバは、
コーパスベース音声合成にて前記テキストデータから前記音声データへの変換を行う、
ことを特徴とする請求項4、5又は6に記載の学習用音声合成方法。
【請求項8】
前記利用者端末が、
携帯電話、デジタルプレイヤー等の前記インターネット網に接続可能な携帯型端末である場合、
前記ファイルサーバから前記Webサーバへ前記音声データのアップロードが完了すると、前記Webサーバは当該携帯型端末へ自動的に直接当該音声データをアップロードする、
ことを特徴とする請求項4又は5に記載の学習用音声合成方法。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2008−89853(P2008−89853A)
【公開日】平成20年4月17日(2008.4.17)
【国際特許分類】
【出願番号】特願2006−269326(P2006−269326)
【出願日】平成18年9月29日(2006.9.29)
【出願人】(304014578)株式会社エーアイ (1)
【Fターム(参考)】