説明

音声変換支援装置、プログラムおよび音声変換支援方法

【課題】 文字/音声変換の応答性を維持しつつコストダウンを図り、さらには、特徴のあるサービスを実現する。
【解決手段】音声変換支援装置はキャッシュデータ保存部、インデックス情報記憶部、検索部、データ処理部を備える。前記データ処理部は前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去に使用された音声データを前記キャッシュデータ保存部から読み出して前記変換要求元へ返す一方、いずれのインデックス情報にも存在しない前記テキストデータを前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返す。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、例えば文字等のキャラクタを音声に変換するサービスに利用される音声変換支援装置、プログラムおよび音声変換支援方法に関する。
【背景技術】
【0002】
近年、例えばインターネットなどでは、文字を音声に変換するサービスが開始されており、このサービスには音声合成装置が利用されている。
【0003】
一般に、音声合成装置は、ユーザが入力したテキストの文面(文字列)を音声合成波形データに変換し、音声信号または音声ファイルを出力するものである。
【0004】
ところで、文字を音声に変換するためには処理性能の高い音声合成装置が必要であり、この種のサービスを開始するためにはコストがかかる。一方、性能の低い音声合成装置を用いた場合は、音声合成処理に時間がかかり、応答性が損なわれるという問題もある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2004−117778号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
一般に、この種のサービスでは、ユーザが入力したテキストに対して、特色のない一定の音声データが返されるだけであるため、サービスに特徴を持たせるために何らかの付加価値を付ける必要がある。
【0007】
本発明が解決しようとする課題は、文字/音声変換の応答性を維持しつつコストダウンを図り、さらには、特徴のあるサービスを実現することができる音声変換支援装置、プログラムおよび音声変換支援方法を提供することにある。
【課題を解決するための手段】
【0008】
実施形態の音声変換支援装置は、テキストデータを音声データに変換する音声変換装置とネットワークを介して接続されている。前記音声変換支援装置はキャッシュデータ保存部、インデックス情報記憶部、検索部、データ処理部を備える。前記キャッシュデータ保存部には前記音声変換装置により以前に変換された音声データとこの音声データの変換元のテキストデータとが対応して過去データとして保存される。前記インデックス情報記憶部には前記キャッシュデータ保存部に保存されている過去データをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶される。前記検索部は要求元から入力されたテキストデータを基に前記インデックス情報記憶部の複数のインデックス情報を前記順位付けの順に検索する。前記データ処理部は前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去に使用された音声データを前記キャッシュデータ保存部から読み出して前記変換要求元へ返す一方、いずれのインデックス情報にも存在しない前記テキストデータを前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返す。
【図面の簡単な説明】
【0009】
【図1】実施形態の音声合成システムの全体の構成を示す図である。
【図2】アプリケーションサーバのブロック図である。
【図3】インデックス情報の一例を示す図である。
【図4】この音声合成システムの動作を示すフローチャートである。
【図5】ユーザ毎の辞書登録動作を示すフローチャートである。
【図6】アプリケーションサーバにおけるキャッシュデータの検索動作を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照して、実施形態を詳細に説明する。
(第1の実施形態)図1は第1の実施形態の音声合成システムの構成を示す図である。
【0011】
図1に示すように、この実施形態の音声合成システムは、サービス利用者(以下「ユーザ」と称す)が操作する端末装置であるコンピュータ1(以下「ユーザPC1」と称す)、音声合成エンジンを搭載したコンピュータである音声合成サーバ3と、音声変換支援装置としてのコンピュータ2(以下「アプリケーションサーバ2」と称す)と、これらの機器を接続するネットワーク4等から構成されている。
【0012】
音声合成サーバ3は、アプリケーションサーバ2から転送(入力)された中間ファイル(テキストデータとアクセント記号の組)を音声データ(以下「音声ファイル」と称す)に変換してアプリケーションサーバ2に返す。
【0013】
アプリケーションサーバ2は、音声合成サーバ3とユーザPC1との間に介在してテキストデータ、中間ファイルおよび音声ファイルのやりとりを行う。
【0014】
図2に示すように、アプリケーションサーバ2は、グラフィックユーザインターフェース部21(以下「GUI部21」と称す)、メモリ22、中間ファイル生成部23、キャッシュされたデータを管理するためのインデックス情報記憶部24、キャッシュデータ保存部25、検索部26、通信処理部27、データ処理部28、登録部29などを有している。
【0015】
アプリケーションサーバ2は、ユーザPC1から入力されたテキストデータをキーワード(検索キー)にしてインデックス情報記憶部24のインデックス情報を利用してキャッシュデータ保存部25にキャッシュ(記憶)された音声ファイルを検索し、ヒットした場合は、音声合成サーバ3に音声合成を要求することなく、キャッシュされた音声ファイルを読み出して要求元であるユーザPC1に返す。
【0016】
すなわち、アプリケーションサーバ2は、自身のハードディスク装置にキャッシュされているか否かをチェックし、キャッシュされていない場合に、ユーザPC1から入力されたテキストデータを音声合成サーバ3へ出力し、このテキストデータに対する応答として音声合成サーバ3にて変換(音声合成)された音声ファイルを取得しユーザPC1へ送る。
【0017】
GUI部21は、ユーザPC1からアプリケーションサーバ2にログインするための画面、検索画面、登録画面など表示し、ユーザPC1からの音声合成要求、テキストデータの入力などを受け付けるとともに、要求に対する応答として音声ファイルをPCへ送る。
【0018】
つまり、GUI部21は、ユーザPC1とアプリケーションサーバ2との間の入出力インターフェースを実現するものである。
【0019】
メモリ22には、音声変換辞書が記憶されている。音声変換辞書は音声合成サーバ3により変換(音声合成)される音声データの変換元のテキストデータとこのテキストデータを音声に変換する際に音の強弱を指定するアクセント記号(アクセント情報)とが対応して保存され参照用の辞書である。この音声変換辞書は中間ファイル生成部23により利用される。
【0020】
またメモリ22は、データ処理部28、検索部26および登録部29などがそれぞれの処理を実行する際のワークエリアとして利用される。
【0021】
中間ファイル生成部23は、ユーザPC1から入力された変換対象のテキストデータをキーにして音声変換辞書を参照して、対応するアクセント記号を音声変換辞書から読み出してテキストデータとアクセント記号との組の中間ファイルを生成し、メモリ22に記憶する。中間ファイルは、音声合成用の元データとして音声合成サーバ3へ送信される。
【0022】
キャッシュデータ保存部25には、以前(過去)に変換された音声ファイル、テキストデータ、中間ファイルなどが保存されている。
【0023】
インデックス情報記憶部24には、キャッシュデータ保存部25にキャッシュ(保存)されている過去のデータをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶されている。
【0024】
つまりインデックス情報記憶部24には、キャッシュデータ保存部25にキャッシュされたデータを管理するためのインデックス情報が記憶されている。なおインデックス情報については図3で具体的に説明する。
【0025】
検索部26は、ユーザID毎に設定された登録辞書42、ユーザID毎の使用履歴43、サーバ使用履歴44を順位の順に検索する。すなわち検索部26は、要求元から入力されたテキストデータを基にインデックス情報記憶部24の複数のインデックス情報を順位付けの順に検索する。
【0026】
通信処理部27は、音声合成サーバ3との間で、TCP(HTTP)通信により、データのやりとりを行う。
【0027】
データ処理部28は、検索部26による検索の結果、テキストデータ(検索キーまたはキーワード等とも言う)が存在したインデックス情報により示される過去のデータの保存場所、つまりキャッシュデータ保存部25からキャッシュされている音声ファイルを読み出して変換要求元のユーザPC1へ返す。
【0028】
一方、いずれのインデックス情報にもキーワードが存在しない場合は、入力されたテキストデータを基に中間ファイル生成部23により生成されメモリ22に記憶された中間ファイルを音声合成サーバ3へ送り、音声合成サーバ3により変換(音声合成)された音声ファイルを要求元のユーザPC1へ返す。なおテキストデータを送ってもよい。
【0029】
登録部29は、GUI部21により表示される辞書登録画面にて、ユーザID毎の登録辞書42にユーザが独自に入力または編集した辞書情報(テキストデータとアクセント記号)を登録する。
【0030】
インデックス情報記憶部24には、図3に示すように、ユーザIDテーブル41の各ユーザIDに紐付けられた複数のインデックス情報(ユーザID毎の登録辞書42、ユーザID毎の使用履歴43、このアプリケーションサーバ2のすべてのユーザの使用履歴44(以下「サーバ使用履歴44」と称す)などの3つのインデックス情報)が記憶されている。
【0031】
ユーザIDテーブル41には、このアプリケーションサーバ2にログイン可能なユーザの識別情報であるユーザIDが設定されている。ユーザの識別情報は、ユーザIDだけでなくパスワードなども含まれる。
【0032】
ユーザID毎の登録辞書42には、ユーザが独自に登録したテキストデータ(これを「テキスト」という)と、テキストとそのアクセスト記号の組である中間ファイルと、これらのデータに対応する音声ファイルの保存先を示す保存先インデックスとが記憶されている。
【0033】
このユーザID毎の登録辞書42は、検索の際の順位として第1,2番目の順位(第1,2順位)に設定されており、検索部26がキャッシュデータを検索するときに初めに参照される。この辞書の中での順位は、第1順位が中間ファイル、第2順位がテキストである。インデックス情報としての検索順位は第1番目である。
【0034】
ユーザID毎の使用履歴43には、ログインしたユーザID毎にこの音声変換機能を使用したときのテキストと、テキストとそのアクセスト記号の組である中間ファイルと、これらのデータに対応する音声ファイルの保存先を示す保存先インデックスとが記憶されている。テキスト、中間ファイル、保存先インデックスなどを使用履歴という。
【0035】
ユーザID毎の使用履歴43は、検索の際の順位として第3,4番目の順位(第3,4順位)に設定されており、検索部26がキャッシュデータを検索するときに第3,4番目に参照される。この履歴の中での順位は、第3順位が中間ファイル、第4順位がテキストである。インデックス情報としての検索順位は第2番目である。
【0036】
サーバ使用履歴44には、このアプリケーションサーバ2にユーザがログインしてこの音声変換機能を使用した際のすべてのユーザの使用履歴が記憶されている。サーバ使用履歴44は、検索の際の順位として第5,6番目の順位(第5,6順位)に設定されており、検索部26がキャッシュデータを検索するときに第5,6番目に参照される。この履歴の中での順位は、第5順位が中間ファイル、第6順位がテキストである。インデックス情報としての検索順位は第3番目である。
【0037】
次に、図4乃至図6のフローチャートを参照してこの実施形態の音声合成システムに動作を説明する。まず、図4のフローチャートを参照してこのシステム全体の動作を説明する。
【0038】
この実施形態の音声合成システムの場合、ユーザがユーザPC1から所定のURLを入力し、アプリケーションサーバ2にアクセスすると、GUI部21はログイン画面をユーザPC1に表示するので、ユーザは表示されたログイン画面の入力欄に、ログインIDなどのログイン情報を入力する(図4のステップS101)。この他、ログイン情報としてパスワードなども入力する場合がある。
【0039】
すると、GUI部21は入力されたログイン情報をメモリ22のユーザIDテーブル41のユーザIDと照合することで、ログイン情報が登録済みか否かを判定し(ステップS102)、ログイン情報が登録済みの場合(ステップS102のYes)、アプリケーションサーバ2へのログインを許可し、音声変換画面を表示する(ステップS103)。
【0040】
ユーザが、音声変換画面の文字入力欄に、キー入力により、変換対象の文字(テキストデータ)を入力すると(ステップS104)、GUI部21はその入力を受け付ける。
【0041】
そして、音声変換画面に表示されている音声ファイル作成指示のためのボタンを押下すると(ステップS105)、中間ファイル生成部23が、受け付けた変換対象のテキストデータをキーにして音声変換辞書を参照して、対応するアクセント記号を音声変換辞書から読み出してテキストデータとアクセント記号との組の中間ファイルを生成し(ステップS106)、生成した中間ファイルを音声変換画面に表示する(ステップS107)。
【0042】
続いて、ユーザが、音声変換画面に表示されている検索指示のためのボタンを押下すると(ステップS108)、検索部26が、受け付けたテキストデータをキーにしてインデックス情報を、設定された順位の順に検索する(ステップS109)。なお検索動作の詳細について図5で説明する。
【0043】
検索の結果、対象のテキストデータが、インデックス情報記憶部24の複数のインデックス情報のうちのいずれにも存在しない場合(ステップS110のNo)、データ処理部28は、中間ファイル生成部23により生成された中間ファイルと共に音声変換要求を音声合成サーバ3へ転送(送信)する(ステップS111)。
【0044】
音声合成サーバ3は、中間ファイル及び音声変換要求を受けて、中間ファイルを基に音声合成し、生成した音声ファイルを、ネットワークを通じてアプリケーションサーバ2に返信する(ステップS112)。
【0045】
アプリケーションサーバ2では、音声合成サーバ3により送信された音声ファイルが通信処理部27により受信されると、その音声ファイルをデータ処理部28に渡し、データ処理部28が取得する(ステップS113)。
【0046】
データ処理部28は、取得した音声ファイルを、キャッシュデータ保存部25に保存すると共にユーザPC1へ送り、ユーザPC1のスピーカから音声が出力される(ステップS114)。
【0047】
上記S109の検索ステップの検索の結果、対象のテキストデータが、インデックス情報記憶部24の複数のインデックス情報のうちのいずれかに存在した場合(ステップS110のYes)、データ処理部28は、検索されたインデックス情報により示される保存場所(キャッシュデータ保存部25)から、該当する音声ファイルを読み出して取得し(ステップS113)、音声合成サーバ3に依頼することなく、ユーザPC1へ転送(送信)する(ステップS114)。
【0048】
その後、処理終了操作が行われなければ(ステップS115のNo)、次のテキスト入力を待機する。また処理終了操作が行われると(ステップS115のYes)、データ処理部28は、テキスト/音声の変換処理を終了する。
【0049】
続いて、図5を参照して一度作成された音声ファイルのキャッシュ処理を説明する。
アプリケーションサーバ2では、作成された中間ファイルおよび音声ファイルは、メモリ22に一旦キャッシュされる。
【0050】
そして、ユーザにより当該音声ファイルの変換元の中間ファイルが音声変換画面上で指定されると(ステップS121)、登録部29は、メモリ22から中間ファイルを読み出し音声変換画面にその内容(テキストデータとアクセント部号)を表示する(ステップS122)。
【0051】
そして、ユーザが、音声変換画面に表示された中間ファイルの内容であるテキストデータとアクセント符号を編集した後(ステップS123)、音声変換画面に設けられている音声ファイル保存指示用のボタンを押下すると(ステップS124)、保存先指定用のダイアログボックスが表示される。
【0052】
ユーザがこの画面より、保存先を指定すると(ステップS125)、登録部29は、指定された保存先のフォルダへ音声ファイルを保存する(ステップS126)。そして、終了操作が行われると(ステップS127のYes)、登録部29は、保存した音声ファイルのインデックス情報をインデックス情報記憶部24のユーザID毎の登録辞書42に登録する(ステップS128)。
【0053】
続いて、図6を参照して上記ステップS109の検索処理の詳細を説明する。
この場合、GUI部21により表示された音声変換画面から、検索ボタンを操作すると、検索部26は、作成された中間ファイルのテキストデータとアクセント記号を検索キーにして、インデックス情報記憶部24に記憶されているインデック情報のうちの、第1順位であるユーザID毎の登録辞書42の中の中間ファイルを検索する(ステップS201:第1検索)。
【0054】
この第1検索の結果、ユーザID毎の登録辞書42の中の中間ファイルに、検索キーと同じデータが存在すると(ステップS202のYes)、次のステップ110で、検索部26は、そのデータに対応する音声ファイルをキャッシュデータ保存部25から読み出してデータ処理部28に渡す。これにより音声ファイルがデータ処理部28に取得される。
【0055】
一方、第1検索の結果、ユーザID毎の登録辞書42の中の中間ファイルに、検索キーと同じデータが存在しない場合(ステップS202のNo)、検索部26は、次に同中間ファイルのテキストデータを検索キーにして、インデックス情報記憶部24に記憶されているインデック情報のうちの、第2順位であるユーザID毎の登録辞書42の中のテキストを検索する(ステップS203:第2検索)。
【0056】
この第2検索の結果、ユーザID毎の登録辞書42の中のテキストに、検索キーと同じデータが存在すると(ステップS204のYes)、次のステップ110に移る。
【0057】
また、第2検索の結果、ユーザID毎の登録辞書42の中のテキストに、検索キーと同じデータが存在しない場合(ステップS204のNo)、検索部26は、次に同中間ファイルのテキストデータとアクセント記号を検索キーにして、インデックス情報記憶部24に記憶されているインデック情報のうちの、第3順位であるユーザ毎の使用履歴43の中の中間ファイルを検索する(ステップS205:第3検索)。
【0058】
この第3検索の結果、ユーザID毎の登録辞書42の中の中間ファイルに、検索キーと同じデータが存在すると(ステップS206のYes)、次のステップ110に移る。
【0059】
一方、第3検索の結果、ユーザID毎の登録辞書42の中の中間ファイルに、検索キーと同じデータが存在しない場合(ステップS206のNo)、検索部26は、次に同中間ファイルのテキストデータを検索キーにして、インデックス情報記憶部24に記憶されているインデック情報のうちの、第4順位であるユーザID毎の登録辞書42の中のテキストを検索する(ステップS207:第4検索)。
【0060】
この第4検索の結果、ユーザID毎の登録辞書42の中のテキストに、検索キーと同じデータが存在すると(ステップS208のYes)、次のステップ110に移る。
【0061】
また、第4検索の結果、ユーザID毎の登録辞書42の中のテキストに、検索キーと同じデータが存在しない場合(ステップS208のNo)、検索部26は、次に同中間ファイルのテキストデータとアクセント記号を検索キーにして、インデックス情報記憶部24に記憶されているインデック情報のうちの、第5順位であるサーバ使用履歴44の中の中間ファイルを検索する(ステップS209:第5検索)。
【0062】
この第5検索の結果、サーバ使用履歴44の中の中間ファイルに、検索キーと同じデータが存在すると(ステップS210のYes)、次のステップ110に移る。
【0063】
一方、第5検索の結果、サーバ使用履歴44の中の中間ファイルに、検索キーと同じデータが存在しない場合(ステップS210のNo)、検索部26は、次に同中間ファイルのテキストデータを検索キーにして、インデックス情報記憶部24に記憶されているインデック情報のうちの、第6順位であるサーバ使用履歴44の中のテキストを検索する(ステップS211:第6検索)。
【0064】
この第6検索の結果、サーバ使用履歴44の中のテキストに、検索キーと同じデータが存在すると(ステップS212のYes)、次のステップ110に移る。
【0065】
また、第6検索の結果、サーバ使用履歴44の中のテキストに、検索キーと同じデータが存在しない場合(ステップS212のNo)、検索部26は、キャッシュデータ保存部25にデータが存在しない旨をデータ処理部28に通知する。この通知を受けたデータ処理部28は、音声変換要求と中間ファイルを音声合成サーバ3へ送信する。
【0066】
このようにこの実施形態によれば、ユーザからの要求に応じてテキストを音声に変換する機能を、ユーザインターフェース部分であるアプリケーションサーバ2と音声合成エンジン部部分である音声合成サーバ3とに分けたことで、負荷分散を図ることができる。
【0067】
また、ユーザがアプリケーションサーバ2に入力した文字または文章(テキストデータ、文字列)が以前に使用された文字または文章と同一であった場合は音声合成サーバ3に処理を依頼せずに、自身のハードディスク装置にキャッシュされている音声ファイルを読み出して返すことで、音声合成サーバ3側の処理負荷を軽減することができる。
【0068】
さらに、ユーザが独自に登録したユーザID毎の登録辞書42を第1に検索することで、例えばユーザ独自のアクセストの音声をユーザへ提供することができる。
【0069】
この結果、文字/音声変換の応答性を維持しつつコストダウンを図り、さらには、特徴のあるサービスを実現することができる。
【0070】
説明した実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
上記実施形態では、中間ファイルとテキストデータとを交互に検索したが、中間ファイルのみ、またはテキストデータのみで複数のインデックス情報に順位を設定し、その順位の順にインデックス情報を検索してもよい。
【0071】
また上記実施形態に示した各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよく、また上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
【符号の説明】
【0072】
1…ユーザPC、2…アプリケーションサーバ、3…音声合成サーバ31…グラフィックユーザインターフェース部(GUI部)、22…メモリ、23…中間ファイル生成部、24…インデックス情報記憶部、25…キャッシュデータ保存部、25…キャッシュデータ保存部、26…検索部、27…通信処理部、28…データ処理部、29…登録部、41…ユーザIDテーブル、42…ユーザID毎の登録辞書、43…ユーザID毎の使用履歴、44…サーバ使用履歴。

【特許請求の範囲】
【請求項1】
テキストデータを音声データに変換する音声変換装置とネットワークを介して接続される音声変換支援装置において、
前記音声変換装置により以前に変換された音声データとこの音声データの変換元のテキストデータとが対応して過去データとして保存されるキャッシュデータ保存部と、
前記キャッシュデータ保存部に保存されている過去データをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶されるインデックス情報記憶部と、
要求元から入力されたテキストデータを基に前記インデックス情報記憶部の複数のインデックス情報を前記順位付けの順に検索する検索部と、
前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去に使用された音声データを前記キャッシュデータ保存部から読み出して前記変換要求元へ返す一方、いずれのインデックス情報にも存在しない前記テキストデータを前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返すデータ処理部と
を具備することを特徴とする音声変換支援装置。
【請求項2】
テキストデータを音声データに変換する音声変換装置とネットワークを介して接続される音声変換支援装置において、
前記音声変換装置により以前に変換された音声データとこの音声データの変換元のテキストデータとこのテキストデータを音声に変換する際に音の強弱を指定するアクセント情報とが対応して過去データとして保存されるキャッシュデータ保存部と、
前記キャッシュデータ保存部に保存されている過去データをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶されるインデックス情報記憶部と、
要求元から入力されたテキストデータを基に前記インデックス情報記憶部の複数のインデックス情報を前記順位付けの順に検索する検索部と、
前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去の音声データを前記キャッシュデータ保存部から読み出して前記要求元へ返す一方、いずれのインデックス情報にもテキストデータが存在しない場合、前記テキストデータと対応するアクセント情報と共に音声合成用のデータとして前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返すデータ処理部と
を具備することを特徴とする音声変換支援装置。
【請求項3】
前記インデックス情報記憶部は、この装置にログインしたユーザが独自に登録したユーザ登録辞書と、前記ユーザの使用履歴である第1使用履歴と、この装置にログインした全てのユーザの使用履歴である第2使用履歴とを備え、
前記検索部は、
第1に前記ユーザ辞書を検索し、前記ユーザ辞書に、入力されたテキストデータが存在しない場合に、第2に前記第1使用履歴を検索し、前記第1使用履歴に前記テキストデータが存在しない場合、第3に前記第2使用履歴を検索することを特徴とする請求項1記載の音声変換支援装置。
【請求項4】
前記ユーザ辞書、前記第1使用履歴、前記第2使用履歴には、以前に変換した音声データの変換元のテキストデータと、テキストデータとアクセント記号とで構成される中間データとが記憶されており、
前記検索部は、
第1に前記中間データを検索し、前記中間データの中に、入力されたテキストデータが存在しない場合に、第2に前記テキストデータを検索することを特徴とする請求項2記載の音声変換支援装置。
【請求項5】
入力されたテキストデータを音声データに変換する音声変換装置と、この音声変換装置とネットワークを介して接続され、前記音声変換装置に対して前記テキストデータを音声データに変換する変換要求を送り、この変換要求に対して前記音声変換装置から出力された音声データを取得し、テキストデータの入力元へ返信する音声変換支援装置とを有する音声合成システムにおいて、
前記音声変換支援装置は、
前記音声変換装置により以前に変換された音声データとこの音声データの変換元のテキストデータとこのテキストデータを音声に変換する際に音の強弱を指定するアクセント情報とが対応して過去データとして保存されるキャッシュデータ保存部と、
前記キャッシュデータ保存部に保存されている過去データをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶されるインデックス情報記憶部と、
要求元から入力されたテキストデータを基に前記インデックス情報記憶部の複数のインデックス情報を前記順位付けの順に検索する検索部と、
前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去の音声データを前記キャッシュデータ保存部から読み出して前記要求元へ返す一方、いずれのインデックス情報にもテキストデータが存在しない場合、前記テキストデータと対応するアクセント情報と共に音声合成用のデータとして前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返すデータ処理部と
を具備することを特徴とする音声合成システム。
【請求項6】
テキストデータを音声データに変換する音声変換装置とネットワークを介して接続される音声変換支援装置に処理を実行させるプログラムにおいて、
前記音声変換支援装置を、
前記音声変換装置により以前に変換された音声データとこの音声データの変換元のテキストデータとこのテキストデータを音声に変換する際に音の強弱を指定するアクセント情報とが対応して過去データとして保存されるキャッシュデータ保存部と、
前記キャッシュデータ保存部に保存されている過去データをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶されるインデックス情報記憶部と、
要求元から入力されたテキストデータを基に前記インデックス情報記憶部の複数のインデックス情報を前記順位付けの順に検索する検索部と、
前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去の音声データを前記キャッシュデータ保存部から読み出して前記要求元へ返す一方、いずれのインデックス情報にもテキストデータが存在しない場合、前記テキストデータと対応するアクセント情報と共に音声合成用のデータとして前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返すデータ処理部
として機能させることを特徴とするプログラム。
【請求項7】
テキストデータを音声データに変換する音声変換装置とネットワークを介して接続され、前記音声変換装置により以前に変換された音声データとこの音声データの変換元のテキストデータとこのテキストデータを音声に変換する際に音の強弱を指定するアクセント情報とが対応して過去データとして保存されるキャッシュデータ保存部と、前記キャッシュデータ保存部に保存されている過去データをユーザとの親和性の高い順に検索するための、絞り込み範囲の異なる複数のインデックス情報が順位付けして記憶されるインデックス情報記憶部とを備える音声変換支援装置における音声変換支援方法において、
要求元から入力されたテキストデータを基に前記インデックス情報記憶部の複数のインデックス情報を前記順位付けの順に検索する検索ステップと、
前記検索ステップによる検索の結果、前記テキストデータが存在したインデックス情報により示される過去の音声データを前記キャッシュデータ保存部から読み出して前記要求元へ返す一方、いずれのインデックス情報にもテキストデータが存在しない場合、前記テキストデータと対応するアクセント情報と共に音声合成用のデータとして前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返すデータ処理ステップと
を具備することを特徴とする音声変換支援方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−194284(P2012−194284A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−57229(P2011−57229)
【出願日】平成23年3月15日(2011.3.15)
【出願人】(000003078)株式会社東芝 (54,554)