説明

移動電話からの要求があったときにサーバ上でオーディオ・ファイルを生成する方法

配布されたサーバ/クライアント・アーキテクチャを用いて、リクエストされたオーディオ・ファイルをサーバに生成させる専用オーディオ機能を実現する。好ましい実施形態において、移動電話機のユーザは、テキストまたはオーディオ・データからなるファイルを含むリクエストをサーバに送信する。サーバは、テキストまたはオーディオ・データを用いてオーディオ・ファイルを生成し、それを移動電話機に送信し返す。オーディオ・ファイルは、移動電話機によって再生される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば移動電話機のような移動通信装置においてオーディオ・ファイルから音声(サウンド)を発生することに関する。
【背景技術】
【0002】
今日では、移動(モバイル、携帯)電話機を用いてリアルタイムの通話または会話を行うだけでなくソフトウェア・アプリケーションを実行させることもできる。
【0003】
移動電話機ベースのアプリケーションは既に繁栄した市場であるが、数年後にはさらに繁栄しているであろう。それらのアプリケーションにおいて、人気のあるsms(ショート・メッセージ・サービス)およびゲームから、プラグイン・カメラからビデオを記録して別の電話機に送信するまでにいたる、多くのタスクを実行することが可能である。
【0004】
現在不可能なことは、専用オーディオ機能、即ちオーディオ・データの動的な生成の能力である。それは、最終的には非常に高価なハンドセット上だけでなく可能になるだろうが、しばらくはそうではないであろう。
【0005】
配布されるアーキテクチャは、全ての高負荷の仕事を行うサーバにネットワークを介して接続する単純なクライアントを有することによって、ハンドセットを専用機能から開放することができる。この文脈において、“クライアント”とは、サーバのサービスを利用するアプリケーションを意味する。
【0006】
本発明は、配布されるアークテクチャによって専用オーディオ機能を実現することができるという提案に基づくものである。これは、サーバが要求されたオーディオ・ファイルを生成する高負荷の仕事を行い、電話機上にあるクライアントが単純にその結果得られたオーディオ・ファイルをダウンロードすることによって、実現される。
【発明の開示】
【0007】
従って、本発明は通信ネットワークにおいて動作する移動電話機において音声を発生する方法に関する。そのネットワークに含まれるサーバは、幾つかの移動電話機との間で同時に通信することができ、その移動電話機上で動作するアプリケーションは、オーディオ・ファイルの要求がそのサーバへと送信されるようにし、その要求されたオーディオ・ファイルはその要求に応答してサーバ内の手段によって発生され、サーバから移動電話機へ送信され、移動電話機によって再生(reproduce)される。
【0008】
本発明の幾つかの可能なアプリケーション(適用例)は次の通りである。
1.テキストから話の音声(スピーチ)へ(の変換)
2.音楽生成
3.サウンド効果生成
4.テキストから音楽へ(の変換)
5.オーディオ増強(enhancement)(以下で説明する)
【0009】
次に、本発明の幾つかの実施形態を例として用いて図面を参照して説明する。
【発明を実施するための最良の形態】
【0010】
図1は、本発明を用いることができる通信ネットワークの概略図である。
【0011】
図2は、本発明を実現する可能なソフトウェア・アーキテクチャの概略図である。
【0012】
図1に示されている移動電話機10は、無線アクセス・ネットワークを介したサーバ13を有するデータ・センタ11への通信チャネルを有する。その無線アクセス・ネットワークは、複数の送信機基地局12と、複数の基地局12を種々のデータ・センタに接続(リンク)させるコア・ネットワークとを含んでいる。
【0013】
図2に示されている例において、電話機10は、20で示された配布(distributed、配置、配信)されたオーディオ・クライアント・ソフトウェアを有し、サーバ13は、23で示された配布(配置)されたオーディオ・サーバ・ソフトウェアを有する。
【0014】
次の具体例において、電話機10は、次のクライアント・ソフトウェアを支援(サポート)しなければならない。
1.アプリケーション環境、および
2.アプリケーション環境を通して音声(サウンド)ファイルを再生(play)する能力、
または
1.SMS機能、および
2.MMSオーディオ・ファイルを再生(playback)する能力。
【0015】
次のタイプの現在利用可能なハンドセットは、次の所要の基準を満たす例である。
1.オーディオ拡張性を有するMIDP1.0
2.オーディオ拡張性を有するDoJava1.0
3.MIDP2.0
4.オーディオ機能を有する独自のまたは民間仕様の(native、proprietary)アプリケーション・サポート。
【0016】
電話機は、クライアントとして機能するアプリケーション20を実行する。そのクライアントはサーバ・ソフトウェア23に要求(リクエスト)を送信して、タスクを実行し、即ちオーディオ・ファイルを生成する。
【0017】
以下は例のタスクである。
1.テキスト・ベースの入力を取り出し、テキストを話の音声(スピーチ)に変換し、WAVオーディオ・ファイルを出力する。
2.音楽ファイルを記述するテキスト・ベースの入力を取り出し、それを音楽ファイルに変換し、MIDIファイルを出力する。
3.オーディオ入力を取り出し、それを増強されたまたは修正された話の音声(スピーチ)ファイルに変換し、例えばバック・ミュージックを付加したヴォーカルに変換する。
【0018】
サーバ23は、要求(リクエスト)を読み込んで、要求された要求(リクエスト)を実行して、結果のオーディオ・ファイルを送り返す。
【0019】
サーバは次のことを支援(サポート)できることが好ましい。
1.Httpによってメッセージを受信する。
2.MMSまたはHttpよってメッセージを送信。
3.オーディオ・ファイルを生成する。
【0020】
次のタイプの現在利用可能なサーバは、所要の基準(criteria)を満たす。
1.J2SE 1.3+
2.オーディオ機能を有するC/C++
3.オーディオ機能を有するPERL。
【0021】
事例1:テキストを話の音声へ:
1.クライアント20は、MIDP2.0で書かれている。
2.クライアントは、“ゲーム・オーバー”と発話する或る音声(スピーチ)を再生(play)しようとするゲームによって用いられる。
3.ゲームは、クライアントに、“ゲーム・オーバー”という音声をリクエストするよう依頼する。
4.クライアントは、“ゲーム・オーバー”というメッセージを含む、テキスト・ベースのメッセージを、サーバ23に(TCP/IPを用いて)送信する。
5.サーバは、テキスト・ベースのメッセージを受信して、“ゲーム・オーバー”というテキストを(8ビット、8K、PCM、モノラルの)WAVファイルに変換するプログラムを呼び出すよう手順を進める。
6.サーバは、そのWAVファイルをクライアントに送信する。
7.クライアントは、そのWAVファイルを受信して、ゲームに対して、クライアントが音声ファイルを受信したことを通知する。
8.ゲームは、音声ファイルを検索しまたは取り出してそれを再生(play)する。
9.競技者(ゲームをしている人、プレイヤ)は、“ゲーム・オーバー”という音声を聞く。
往復時間は、短い各話音声については5秒未満であろう。
【0022】
事例2:テキスト・ベースの楽譜(音符)を音楽へ:
1.クライアント20は、MIDI再生(play back)機能を有するMIDP2.0で書かれている。
2.クライアントは、或る音楽を発生しようとするDJディスク・ジョッキー・アプリケーションによって用いられる。
3.DJアプリケーションは、クライアントに音楽をリクエストするよう要請し、1組の音符および休止符で構成された音楽の記述(楽譜)を指定する。
4.クライアントは、発生すべき音楽の記述を含むテキスト・ベースのメッセージを、サーバ23に(TCP/IPを用いて)送信する。
5.サーバは、テキスト・ベースのメッセージを受信して、音楽記述(楽譜)をMIDI(フォーマット0)ファイルに変換するプログラムを呼び出すよう手順を進める。
6.サーバは、そのMIDIファイルをクライアントに送信する。
7.クライアントは、そのMIDIファイルを受信して、DJアプリケーションに対して、クライアントが音声(音楽)ファイルを受信したことを通知する。
8.DJアプリケーションは、音楽を検索して、それを再生(play)する。
9.再生者(聴取者、player)は、その音楽を聴く。
往復時間は、短い各音楽については10秒未満であろう。
【0023】
事例3:オーディオ・ファイルの増強(改善)
例:バリー・ホワイト(Barry White)のように歌う。
[MMS=マルチメディア・メッセージ]
1.ハンドセットはMMSを支援する。
2.ユーザは自分の歌を記録(録音)する。
3.ユーザは、オーディオ・クリップおよび “バリー・ホワイト” というテキストをMMSに添付する。
4.ユーザは、そのMMSを、テキスト−音声(スピーチ)(変換)サーバに送信する。
5.サーバは、MMSを受信して、オーディオ・サンプルおよびテキスト・パラメータを抽出する。
6.サーバは、テキスト・パラメータに基づいてオーディオ・クリップにオーディオ効果を加える。
7.サーバは、この場合、オーディオ・クリップにオーディオ効果を加えて、バリー・ホワイト風のユーザの音声を生成する。
8.サーバは、その結果得られた変換済みのオーディオ・クリップを新しいMMSに添付する。
9.サーバは、MMSをユーザに送信し返す。
10.ユーザは、MMSを受信して、それを再生(play)してバリー・ホワイト風に歌う自分の歌を聴く。
11.ユーザは、MMSを非同期的に受信し、従って往復時間は重要でない。往復時間は30秒未満であろう。
【0024】
用語解説
SMS:ショート・メッセージ・サービス
MMS:マルチメディア・メッセージ
MIDP:モバイル(移動)情報デバイス・プロファイル
Java(登録商標):プラットフォームに依存しないプログラム言語
MIDI:楽器(musical instrument)ディジタル・インタフェース
Http:ハイパーテキスト転送プロトコル
WAV:オーディオ・ファイル用のファイルのタイプ
TCP:伝送制御プロトコル
IP:インターネット・プロトコル
RAN:無線アクセス・ネットワーク
【図面の簡単な説明】
【0025】
【図1】図1は、本発明を用いることができる通信ネットワークの概略図である。
【図2】図2は、本発明を実現する可能なソフトウェア・アーキテクチャの概略図である。

【特許請求の範囲】
【請求項1】
幾つかの移動電話機との間で同時に通信することができるサーバを含む通信ネットワークにおいて動作する移動電話機において音声を発生する方法であって、
前記移動電話機上で動作するアプリケーションは、オーディオ・ファイルの要求が前記サーバへ送信されるようにし、
前記要求されたオーディオ・ファイルは、前記要求に応答して前記サーバ内の手段によって発生され、前記サーバから前記移動電話機へ送信され、前記移動電話機によって再生される、
方法。
【請求項2】
要求データは、前記電話機のユーザによってキーパッドを用いて入力されたテキストから生成されるものである、請求項1に記載の方法。
【請求項3】
前記要求データが前記サーバにおける手段によって用いられて音声ファイルが生成される、請求項2に記載の方法。
【請求項4】
前記要求データが前記サーバにおける手段によって用いられて音楽ファイルが生成される、請求項2に記載の方法。
【請求項5】
前記要求はオーディオ・ファイルを含むものである、請求項1乃至4のいずれかに記載の方法。
【請求項6】
前記要求中のオーディオ・ファイルは、前記サーバによって生成されたオーディオ・ファイルに組み込まれるものである、請求項5に記載の方法。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2006−509224(P2006−509224A)
【公表日】平成18年3月16日(2006.3.16)
【国際特許分類】
【出願番号】特願2004−554671(P2004−554671)
【出願日】平成15年11月24日(2003.11.24)
【国際出願番号】PCT/GB2003/005098
【国際公開番号】WO2004/049300
【国際公開日】平成16年6月10日(2004.6.10)
【出願人】(505190725)ハッチソン ワンポア スリー ジー アイ・ピー(バハマ) リミテッド (1)
【氏名又は名称原語表記】Hutchison Whampoa Three G IP(Bahamas) Limited
【住所又は居所原語表記】Offshore Group Chambers,P.O.Box CB−12751,Nassau,New Providence,Bahamas
【Fターム(参考)】