音声処理方法と通信システム並びに通信端末およびサーバとプログラム

【課題】通信端末にあらかじめ内蔵されたプログラムおよびデータと音声処理とを連携させて動作させるシステムの提供。
【解決手段】通信端末１００は、第１プログラムおよびデータ格納手段１０１と、音声処理手段１０２と、音声処理手段用の言語情報を作成する音声処理言語情報作成手段１０３と、サーバ２００からプログラム／データを取得する送受信手段１０４と、取得したプログラム／データを記憶する第２プログラムおよびデータ格納手段１０５と、第２プログラムおよびデータ格納手段１０５に記憶されたプログラム／データに基づいて、音声処理手段１０２と、第１プログラムおよびデータ格納手段１０１のプログラム／データを連携制御する制御手段１０６を含み、サーバ２００は、送受信手段２０１と、通信端末から送信されたデータを基に言語情報を作成する音声処理言語情報作成手段２０２を含む。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、通信システムに関し、特に、端末と、該端末と通信接続されるサーバとが処理の連携を実現するシステムと方法並びにコンピュータ・プログラムに関する。
【背景技術】
【０００２】
従来の通信端末およびシステムの一例が、後記特許文献１、特許文献２等に記載されている。このうち、後記特許文献１に記載の通信端末は、音声認識部と、音声合成部、制御部、送受信部、データ変換部を備え、入力音声を音声認識によりテキストに変換して送信し、送受信部より受信したデータを音声合成により読み上げるものである。
【０００３】
また、後記特許文献２に記載された通信端末は、音声認識部と、音声合成部、制御部（メール処理部）を備え、音声入力によりメールを作成し、音声合成によりメールを読み上げるものである。
【０００４】
【特許文献１】特開２００３−１８８９４８号公報（第４頁、第１図）
【特許文献２】特開２００２−０７７３１５号号公報（第２、３頁、第１図）
【発明の開示】
【発明が解決しようとする課題】
【０００５】
上記した従来の端末では、端末外部より受信したプログラムが、端末に内蔵されているプログラムや、プログラムが管理するデータ、特に、ユーザ独自のデータやシステムの状態に応じて、ダイナミックに変化するデータと、音声処理機能とを、例えば端末に固有の所望の態様で、連携させて動作させることができない。
【０００６】
したがって、本発明の目的は、通信端末に内蔵されたプログラム及び／又はデータと、音声処理等の処理とを組み合わせて所望の機能を実現可能とした通信システムおよびサーバおよび通信端末を提供することにある。
【課題を解決するための手段】
【０００７】
本願で開示される発明は、上記目的を達成するため、概略以下の構成とされる。
【０００８】
本発明の一つのアスペクト（側面）に係る通信端末は、音声認識及び／又は音声合成の処理を行う音声処理部と、通信端末上で予め定められた所定の機能を実現するためのプログラム及び／又はデータを少なくとも記憶する第１の記憶部と、前記通信端末外部から前記通信端末に入力され、前記第１の記憶部に記憶されているプログラム及び／又はデータと、前記音声処理部による音声処理との連携の仕方を規定するプログラム及び又はデータを少なくとも記憶する第２の記憶部と、前記通信端末外部から入力された前記プログラム及び／又はデータと、前記第１の記憶部に記憶されている前記プログラム及び／又はデータと用いて、前記音声処理部による音声処理と、前記第１の記憶部に記憶されている前記プログラム及び／又はデータによる前記機能と、を連携動作させる制御を行う制御部と、を備えている。
【０００９】
本発明において、前記制御部は、前記第２の記憶部に記憶されているプログラムを起動し、起動された前記プログラムが、前記第１の記憶部に記憶されているプログラムを呼び出すか、データを用いて、前記音声処理部による音声処理と、前記第１の記憶部に記憶されているプログラム及び／又はデータとを連携動作させる。
【００１０】
本発明の一つのアスペクト（側面）に係る通信端末は、音声認識及び／又は音声合成の処理を行う音声処理部と、通信端末が保持する情報を少なくとも記憶する第１の記憶部と、前記通信端末の外部から前記通信端末に入力され、音声処理用の言語情報を作成する手順を規定したプログラムを少なくとも記憶する第２の記憶部と、前記第２の記憶部に記憶されている、音声処理用の言語情報を作成する手順を規定したプログラムの起動を制御する制御部と、を備え、前記第２の記憶部に記憶されている前記音声処理用の言語情報を作成する手順を規定したプログラムは、少なくとも、前記第１の記憶部に記憶された情報を用いて、前記音声処理部での音声処理に用いられる言語情報を作成し、前記音声処理部は、前記作成された言語情報を用いて前記音声処理を行う。
【００１１】
本発明の他のアスペクト（側面）に係るシステムと、前記通信端末と通信接続するサーバと、を備え、前記通信端末は、前記通信端末に予め記憶されているプログラム及び／又はデータに基づいて、音声処理手段で用いられる言語情報を作成する手段と、前記言語情報を用いて、前記通信端末に予め記憶されているプログラム及び／又はデータと、前記サーバからダウンロードしたプログラム及び／又はデータとに基づき音声処理を連携動作する手段と、を備えている。
【００１２】
本発明の他のアスペクト（側面）に係るシステムは、通信端末と、前記通信端末と通信接続するサーバと、を備え、前記通信端末が、前記通信端末が予め記憶保持するプログラム及び／又はデータを記憶する第１の記憶部と、音声認識と音声合成の少なくとも一方の音声処理を行う音声処理手段と、前記第１の記憶部に記憶されているプログラム及び／又はデータに従って、前記音声処理手段で用いられる言語情報（例えば辞書や文法や言語モデル等）を作成する音声処理言語情報作成手段と、前記サーバからプログラム及び／又はデータを取得する手段と、前記サーバから取得した前記プログラム及び／又はデータを記憶する第２の記憶部と、前記第２の記憶部に記憶されたプログラム及び／又はデータに基づいて、前記音声処理手段と、前記第１の記憶部のプログラム及び／又はデータを連携制御する制御手段と、を含む。また、前記サーバは、前記通信端末から送信される情報を受信し、前記サーバで生成されたプログラム及び／又はデータを前記通信端末に送信する手段と、前記通信端末から送信されたデータを基に前記サーバ側に格納されているデータより、音声処理手段で用いられる言語情報を作成する音声処理言語情報作成手段と、を含む。
【００１３】
本発明のさらに他のアスペクト（側面）に係るシステムは、前記音声処理言語情報作成手段が、前記第１の記憶部と前記第２の記憶部に記憶されているプログラム及び／又はデータに従って、前記音声処理手段で用いられる言語情報を作成し、前記制御手段が、第２の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理手段と、前記第１の記憶部のプログラム及び／又はデータを、連携させる制御を行う構成とされる。
【００１４】
本発明のさらに他のアスペクト（側面）に係るシステムは、通信端末と、１つ又は複数のサーバを含み、前記サーバは、前記通信端末から送信される情報を受信し、前記サーバ側で生成したプログラム及び／又はデータを通信端末に送信する手段と、前記通信端末から送信されたデータと、前記サーバ側に格納されているデータとから音声処理用の辞書を作成する音声処理言語情報作成手段と、を含む。また、前記通信端末は、前記通信端末に予め記憶保持されるプログラム及び／又はデータを記憶する第１の記憶部と、音声認識と音声合成の少なくとも一方の音声処理を行う音声処理手段と、前記サーバからプログラム及び／又はデータを取得する手段と、前記サーバから取得したプログラム及び／又はデータを記憶する第２の記憶部と、前記第１の記憶部と前記第２の記憶部の双方に記憶されているプログラム及び／又はデータに従って、前記音声処理手段で用いられる言語情報を作成する音声処理言語情報作成手段と、前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理手段と、前記第１の記憶部に記憶されているプログラム及び／又はデータを連携させる制御手段と、前記音声処理言語情報作成手段で作成した音声言語情報と、前記サーバの前記音声処理言語情報作成手段で作成した音声言語情報とを合成する音声処理言語情報統合手段と、を含む。
【００１５】
本発明の１つのアスペクトに係る方法は、
（Ａ）通信端末が、通信端末外部より前記通信端末にダウンロードされたプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータとに基づき、音声処理で用いられる言語情報を生成する工程と、
（Ｂ）前記通信端末が、前記音声言語情報を用いて、前記通信端末に予め記憶されているプログラム及び／又はデータと、音声処理とを連携動作させる処理を実行する工程と、を含む。
【００１６】
本発明の他のアスペクトに係る方法は、
（Ａ）通信端末が、通信端末外部よりプログラム及び／又はデータを取得する工程と、
（Ｂ）前記通信端末が、前記取得したプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータとに基づいて、音声処理で用いられる音声言語情報を生成する工程と、
（Ｃ）前記通信端末が、前記音声言語情報を用いて、前記通信端末に予め記憶されているプログラムと、前記通信端末外部よりダウンロードしたプログラム及び／又はデータと、前記音声処理とを連携動作させる工程と、
を含む。
【００１７】
本発明のさらに他のアスペクトに係る方法は、
（Ａ）通信端末が、１つ又は複数のサーバよりダウンロードされたプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータより、通信端末内及び／又は複数のサーバの少なくとも１つで生成された音声処理用の音声言語情報を統合する工程と、
（Ｂ）前記通信端末が、前記音声言語情報を用いて、前記通信端末に予め記憶されているプログラム及び／又はデータと、サーバよりダウンロードしたプログラム及び／又はデータと、前記音声処理とを連携動作させる工程と、
を含む。
【００１８】
本発明の１つのアスペクトに係るコンピュータ・プログラムは、通信端末を構成するコンピュータに、
（Ａ）前記通信端末に予め記憶されているプログラム及び／又はデータを記憶する処理と、
（Ｂ）前記通信端末の外部で生成されたプログラム及び／又はデータを受信する処理と、
（Ｃ）前記受信したプログラム及び／又はデータを記憶する処理と、
（Ｄ）音声認識と音声合成の少なくとも一方を実行する処理と、
（Ｅ）前記通信端末に予め記憶されているプログラム及び／又はデータに基づいて音声処理を行うための音声言語情報を生成する処理と、
（Ｆ）前記受信したプログラム及び／又はデータにより、前記通信端末に予め記憶されているプログラム及び／又はデータと、音声処理とを連携させる処理と、
を実行させるためのプログラムよりなる。
【００１９】
本発明の他のアスペクトに係るコンピュータ・プログラムは、通信端末を構成するコンピュータに、
（Ａ）通信端末外部よりプログラム及び／又はデータを取得する処理と、
（Ｂ）音声認識と音声合成の少なくとも一方を実行する処理と、
（Ｃ）前記ダウンロードされたプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータと、に基づいて、音声処理で用いられる音声言語情報を生成する処理と、
（Ｄ）前記音声言語情報を用いて、前記通信端末に予め記憶されているプログラムと、前記通信端末外部よりダウンロードしたプログラム及び／又はデータと、前記音声処理とを連携動作させる処理と、を実行させるためのプログラムよりなる。
【００２０】
本発明のさらに他のアスペクトに係るコンピュータ・プログラムは、通信端末を構成するコンピュータに、
（Ａ）前記通信端末に予め記憶保持されるプログラム及び／又はデータを第１の記憶部に記憶する処理と、
（Ｂ）通信端末外部の１つ又は複数のサーバより、プログラム及び／又はデータを受信する処理と、
（Ｃ）前記受信したプログラム及び／又はデータを第２の記憶部に記憶する処理と、
（Ｄ）音声認識と音声合成の内の少なくとも一方を行う処理と、
（Ｅ）前記第２の記憶部に記憶されているプログラム及び／又はデータと、前記第１の記憶部に予め記憶されているプログラム及び／又はデータとに基づいて、音声処理を行うための音声言語情報を通信端末内で生成する処理と、
（Ｆ）前記通信端末内で又は前記サーバで生成された音声言語情報を統合するための処理と、
（Ｇ）前記第２の記憶部のプログラム及び／又はデータにより、前記第１の記憶部に予め記憶されているプログラム及び／又はデータと、音声処理とを連携させる処理と、を実行させるためのプログラムよりなる。
【発明の効果】
【００２１】
本発明によれば、携帯端末等通信端末に内蔵されているプログラムが、音声処理に対応していない場合でも、サーバより、プログラムをダウンロードすることで、音声処理機能と連携させて動作させることができる。
【００２２】
また、本発明によれば、連携方法が異なるプログラムを、ユーザの好み等によって自在に入れ替えて、実行させることができる。
【発明を実施するための最良の形態】
【００２３】
次に、本発明を実施するための最良の形態について、図面を参照して詳細に説明する。
【００２４】
図１を参照すると、本発明の第１の実施の形態は、通信端末１００とサーバ２００とを備えている。通信端末１００は、第１プログラムおよびデータ格納手段１０１と、音声処理手段１０２と、音声処理言語情報作成手段１０３と、送受信手段１０４と、第２プログラムおよびデータ格納手段１０５と、制御手段１０６とを備えている。サーバ２００は、送受信手段２０１と、音声処理言語情報作成手段２０２とを備えている。これらの手段はそれぞれ概略つぎのように動作する。
【００２５】
第１プログラムおよびデータ格納手段１０１は、通信端末１００に予め内蔵されているプログラムやプログラムが管理するデータを格納する。第１プログラムおよびデータ格納手段１０１に格納されるデータとしては、通信端末１００の状態に応じて動的に変化するデータや、通信端末１００の利用者の個人データがある。
【００２６】
音声処理手段１０２は、音声認識と音声合成の少なくとも１つを行う。
【００２７】
音声処理言語情報作成手段１０３は、第１プログラムおよびデータ格納手段１０１に記憶されている第１のプログラムおよびデータ基づいて、音声処理手段１０２用の辞書や文法や言語モデル等を作成する。
【００２８】
送受信手段１０４は、通信端末１００側の情報をサーバ２００に送信し、また、プログラムおよびデータを、通信端末１００外部から受信する。
【００２９】
第２プログラムおよびデータ格納手段１０５は、送受信手段１０４により、通信端末１００外部から受信したプログラムおよびデータを格納する。
【００３０】
制御手段１０６は、送受信手段１０４により取得した第２のプログラムおよびデータから、プログラムおよびデータを呼び出して（サブルーチンコール等）、音声処理手段１０２と、第１のプログラムおよびデータを連携させる。
【００３１】
サーバ２００の送受信手段２０１は、通信端末１００側からの情報を受信し、またサーバ２００からプログラムやデータを通信端末１００側に送信する。
【００３２】
音声処理言語情報作成手段２０２は、通信端末１００から送信されたデータを基に、サーバ２００側に格納されているデータより、音声処理用の辞書を作成する。
【００３３】
図２は、本発明の一実施形態の動作を説明するためのフローチャートである。図１及び図２を参照して、本実施の形態の全体の動作について詳細に説明する。
【００３４】
通信端末１００の音声処理手段１０２で用いる音声言語情報は、通信端末１００側で生成される場合と、サーバ２００側で生成される場合の２通りがある。
【００３５】
通信端末１００側で生成する場合、送受信手段１０４により、通信端末１００外部からプログラムおよびデータを受信し（ステップＳａ１）、第２プログラムおよびデータ格納手段１０５に格納する（ステップＳａ２）。
【００３６】
次に、制御手段１０６は、第２プログラムおよびデータ格納手段１０５に記憶されたプログラムおよびデータを呼び出し、起動する（ステップＳａ３）。
【００３７】
起動されたプログラム中に記述されている、音声処理用の言語情報作成手順により、第１プログラムおよびデータ格納手段１０１のデータを用いて、言語情報を生成する（ステップＳａ４）。
【００３８】
制御手段１０６では、前述の生成された音声処理用言語情報を読み出し、音声処理手段１０２を起動させる（ステップＳａ５）。
【００３９】
ステップＳａ３で起動されたプログラムに従って、第１プログラムおよびデータ格納手段１０１のプログラムを呼び出し（ステップＳａ６）、音声処理手段１０２と連携動作させる（ステップＳａ７）。
【００４０】
サーバ２００側で生成する場合には、送受信手段１０４により、通信端末１００外部からプログラムおよびデータを受信し（ステップＳｂ１）、第２プログラムおよびデータ格納手段１０５に格納する（ステップＳｂ２）。
【００４１】
次に、制御手段１０６は、第２プログラムおよびデータ格納手段１０５から前述のプログラムおよびデータを起動する（ステップＳｂ３）。
【００４２】
起動されたプログラム中に記述された音声処理用の言語情報作成手順と、言語情報作成に必要なデータを、サーバ２００に送信する（ステップＳｂ４）。サーバ２００側では、音声処理言語情報作成手段２０２が、通信端末１００から送信された言語情報作成手順とデータと、サーバ２００側に格納しているデータとを用いて音声言語情報を生成し（ステップＳｂ５）、通信端末１００に送信する（ステップＳｂ６）。
【００４３】
通信端末１００では、これを受けて、生成された音声処理用言語情報を読み出し、音声処理手段１０２を起動させる（ステップＳｂ７）。
【００４４】
さらに、ステップＳｂ３で起動されたプログラムに従って第１プログラムおよびデータ格納手段１０１のプログラムを呼び出し（ステップＳｂ８）、音声処理手段１０２と連携動作させる（ステップＳｂ９）。
【００４５】
次に、本実施の形態の作用効果について説明する。
【００４６】
本実施の形態では、通信端末１００およびサーバ２００で音声処理言語情報作成手段１０３、２０２を実行するように構成されているため、通信端末１００に予め内蔵されているプログラムや、該プログラムが管理するデータが、音声認識や音声合成といった音声処理に対応していない場合であっても、通信端末１００外から、音声処理と連携されるプログラムをダウンロードすることで、通信端末１００で、音声処理機能を利用することができる。
【００４７】
また、本実施の形態では、送受信手段１０４と、受信により取得したプログラムを格納する手段と、このプログラムを呼び出して実行するための制御を行う制御手段１０６と、を有しているため、連携方法が異なるプログラムを、ユーザの好みによって入れ替え可能である。
【００４８】
次に、本発明を第２の実施形態について図面を参照して詳細に説明する。
【００４９】
図２０を参照すると、本発明の第２の実施の形態は、通信端末１０００とサーバ２００とを備えている。通信端末１０００は、第１プログラムおよびデータ格納手段１１０１と、音声処理手段１１０２と、音声処理言語情報作成手段１１０３と、送受信手段１１０４と、第２プログラムおよびデータ格納手段１１０５と、制御手段１１０６とを備えている。サーバ２００は、送受信手段２０１と、音声処理言語情報作成手段２０２を備えている。これらの手段はそれぞれ概略つぎのように動作する。
【００５０】
第１プログラムおよびデータ格納手段１１０１は、通信端末１０００に予め内蔵されているプログラムや、プログラムが管理するデータを格納する。第１プログラムおよびデータ格納手段１１０１に格納されるデータとしては、通信端末１０００の状態に応じて、動的に変化するデータや、端末利用者の個人データ等がある。音声処理手段１１０２は、音声認識及び／又は音声合成を行う。
【００５１】
音声処理言語情報作成手段１１０３は、第１のプログラムおよびデータと第２のプログラムおよびデータが記憶している内容に従って、音声処理手段１１０２用の辞書や文法や言語モデル等を作成する。
【００５２】
送受信手段１１０４は、通信端末１０００側の情報を送信し、プログラムおよびデータを端末外部から受信する。
【００５３】
第２プログラムおよびデータ格納手段１１０５は、送受信手段１１０４により、通信端末１０００外部から受信したプログラムおよびデータを格納する。
【００５４】
制御手段１１０６は、送受信手段１１０４により取得した第２のプログラムおよびデータからプログラムおよびデータを呼び出して、音声処理手段１１０２および第１のプログラムおよびデータを連携させる。
【００５５】
送受信手段２０１は、通信端末１０００側からの情報を受信し、サーバ２００で生成されたプログラムやデータを端末側に送信する。
【００５６】
音声処理言語情報作成手段２０２は、通信端末１０００から送信されたデータを基に、サーバ２００側に格納されているデータより音声処理用の辞書を作成する。
【００５７】
次に、図２０及び図２１のフローチャートを参照して、本実施の形態の全体の動作について詳細に説明する。
【００５８】
まず、送受信手段１１０４により、通信端末１０００外部から第２プログラムおよびデータ格納手段１１０５にプログラムおよびデータを受信し（ステップＳ２１０１）、第２プログラムおよびデータ格納手段１１０５に格納する（ステップＳ２１０２）。
【００５９】
次に、制御手段１１０６は、第２プログラムおよびデータ格納手段１１０５より、前述のプログラムおよびデータを起動し（ステップＳ２１０３）、プログラム中に記述された音声処理用の言語情報作成手順をサブルーチンコール等で呼び出す（ステップＳ２１０４）。
【００６０】
ステップＳ２１０４で、呼び出した作成手順において、作成の対象となるプログラムおよびデータを、第１プログラムおよびデータ格納手段１１０１と、第２プログラムおよびデータ格納手段１１０５の双方よりを呼び出す（ステップＳ２１０５）。
【００６１】
ステップＳ２１０４で読み出した言語情報生成手順により、通信端末１０００の音声処理言語情報作成手段１１０３で生成する場合（ステップＳ２１０６）、ステップＳ２１０５で呼び出したプログラムおよびデータを基に、音声処理言語情報作成手段１１０３において言語情報を生成する（ステップＳ２１０７）。
【００６２】
ステップＳ２１０７において、通信端末１０００の音声処理言語情報作成手段１１０３で作成しない場合、ステップＳ２１０８に進む。
【００６３】
ステップＳ２１０４で読み出した言語情報生成手順により、サーバ２００の音声処理言語情報作成手段２０２で生成する場合（ステップＳ２１０８）、ステップＳ２１０５において読み出したデータを送受信手段１１０４によりサーバ２００に送信し送受信手段２０１では、このデータを受信する（ステップＳ２１０９）。前述のデータとサーバ内に格納しているデータより、音声処理言語情報作成手段２０２で音声処理用言語情報を生成する（ステップＳ２１１０）。
【００６４】
サーバ２００の送受信手段２０１により生成された音声処理用辞書を、通信端末１０００に送信し、送受信手段１１０４は、これを受信する（ステップＳ２１１１）。
【００６５】
ステップＳ２１０８において、サーバ２００の音声処理言語情報作成手段２０２において音声処理用言語情報を作成しない場合、ステップＳ２１１２に進む。
【００６６】
制御手段１１０６ではこれを受けて、前述の生成された音声処理用言語情報を読みこんで、音声処理手段１１０２を起動させる（ステップＳ２１１２）。
【００６７】
さらに、ステップＳ２１０３で起動されたプログラムに従って、第１プログラムおよびデータ格納手段１１０２のプログラムをよびだし（ステップＳ２１１３）、音声処理手段１１０２と連携動作させる（ステップＳ２１１４）。
【００６８】
次に、本実施の形態の作用効果について説明する。
【００６９】
本実施形態では、音声処理言語情報作成手段１１０３において、第１プログラムおよびデータ格納手段１１０１と、第２プログラムおよびデータ格納手段１１０５の双方よりプログラムおよびデータを呼び出して、音声言語情報を作成するため、通信端末１０００に予め内蔵されているプログラムと、受信したプログラムとを連携させて音声認識や音声合成などの音声処理を行うことが可能である。
【００７０】
次に、本発明の第３の実施の形態について図面を参照して詳細に説明する。
【００７１】
図２３を参照すると、本発明の第３の実施の形態は、通信端末２０００と、複数のサーバ２００と、サーバｎ００を備えている。通信端末２０００は、第１プログラムおよびデータ格納手段２１０１と、音声処理手段２１０２と、音声処理言語情報作成手段２１０３と、送受信手段２１０４と、第２プログラムおよびデータ格納手段２１０５と、制御手段２１０６と、音声処理言語情報統合手段２１０７を備えている。
【００７２】
サーバ２００は、送受信手段２０１と、音声処理言語情報作成手段２０２を備えている。サーバｎ００は、送受信手段ｎ０１と、音声処理言語情報作成手段ｎ０２から構成されている。これらの手段はそれぞれ概略つぎのように動作する。
【００７３】
第１プログラムおよびデータ格納手段２１０１は、通信端末２０００に予め内蔵されているプログラムやプログラムが管理するデータを格納する。第１プログラムおよびデータ格納手段２１０１に格納されるデータとしては、通信端末２０００の状態に応じて動的に変化するデータや端末利用者の個人データがある。音声処理手段２１０２は、音声認識及び／又は音声合成を行う。
【００７４】
音声処理言語情報作成手段２１０３は、第１のプログラムおよびデータと第２のプログラムおよびデータとが記憶している内容に従って、音声処理手段２１０２用の辞書や文法や言語モデル等を作成する。送受信手段２１０４は、通信端末２０００側の情報を送信し、プログラムおよびデータを端末外部から受信する。第２プログラムおよびデータ格納手段２１０５は、送受信手段２１０４により端末外部から受信したプログラムおよびデータを格納する。
【００７５】
制御手段２１０６は、送受信手段２１０４により取得した第２のプログラムおよびデータからプログラムおよびデータを呼び出して、音声処理手段２１０２、および第１のプログラムおよびデータを連携させる。
【００７６】
音声処理言語情報統合手段２１０７は、通信端末２０００の音声処理言語情報作成手段２１０３で生成された音声言語情報と、サーバ２００の音声処理言語情報生成手段２０２およびサーバｎ００の音声処理言語情報生成手段ｎ０２で生成された音声言語情報とを合成して音声言語情報を生成する。
【００７７】
サーバ２００の送受信手段２０１は、通信端末２０００側からの情報を受信し、サーバ２００で生成されたプログラムやデータを通信端末２０００側に送信する。音声処理言語情報作成手段２０２は、通信端末２０００から送信されたデータを基に、サーバ２００側に格納されているデータより、音声処理用の音声言語情報を作成する。
【００７８】
また、サーバｎ００でも同様に、送受信手段ｎ０１は、通信端末２０００側からの情報を受信し、サーバｎ００で生成されたプログラムやデータを通信端末２０００側に送信する。音声処理言語情報作成手段ｎ０２は、通信端末２０００から送信されたデータを基にサーバｎ００側に格納されているデータより、音声処理用の音声言語情報を作成する。
【００７９】
次に、図２３及び図２４のフローチャートを参照して、本実施の形態の全体の動作について詳細に説明する。
【００８０】
まず、送受信手段２１０４により、通信端末２０００外部から第２プログラムおよびデータ格納手段２１０５に、プログラムおよびデータを受信し（ステップＳ２４０１）、第２プログラムおよびデータ格納手段２１０５に格納する（ステップＳ２４０２）。
【００８１】
次に、制御手段２１０６は、第２プログラムおよびデータ格納手段２１０５より前述のプログラムおよびデータを起動し（ステップＳ２４０３）、プログラム中に記述された音声処理用の言語情報作成手順を呼びだす。ステップＳ２４０４で呼び出した音声情報作成手順において、作成の対象となるプログラムおよびデータを、第１プログラムおよびデータ格納手段２１０１と、第２プログラムおよびデータ格納手段２１０５の双方よりを呼びだす（ステップＳ２４０５）。
【００８２】
ステップＳ２４０４で読み出した言語情報生成手順により、通信端末２０００の音声処理言語情報作成手段２１０３で生成する場合（ステップＳ２４０６）、ステップＳ２４０５で呼び出したプログラムおよびデータを基に、音声処理言語情報作成手段２１０３において言語情報を生成する（ステップＳ２４０７）。
【００８３】
ステップＳ２４０６において、通信端末２０００の音声処理言語情報作成手段２１０３で作成しない場合、ステップＳ２４０８に進む。
【００８４】
ステップＳ２４０４で読みだした言語情報生成手順により、サーバ２００の音声処理言語情報作成手段２０２で生成する場合（ステップＳ２４０８）、ステップＳ２４０５において読み出したデータを送受信手段２１０４によりサーバ２００に送信し、送受信手段２０１では、このデータを受信する（ステップＳ２４０９）。
【００８５】
前述のデータとサーバ内に格納しているデータより音声処理言語情報作成手段２０２で音声処理用言語情報を生成する（ステップＳ２４１０）。
【００８６】
サーバ２００の送受信手段２０１により生成された音声処理用辞書を通信端末２０００に送信し、送受信手段２１０４は、これを受信する（ステップＳ２４１１）。
【００８７】
ステップＳ２４０８において、サーバ２００の音声処理言語情報作成手段２０２において音声処理用言語情報を作成しない場合には、ステップＳ２４１２に進む。
【００８８】
音声処理言語情報統合手段２１０７では、通信端末２０００の音声処理言語情報作成手段２１０３およびサーバ２００の音声言語作成手段２０２およびサーバｎ００の音声処理言語情報作成手段ｎ０２のそれぞれで生成した音声言語情報を、１つの音声言語情報に合成する（ステップＳ２４１２）。
【００８９】
ステップＳ２４１２を受けて、制御手段２１０６では、前述の生成された音声処理用言語情報を読みこんで音声処理手段２１０２を起動させる（ステップＳ２４１３）。
【００９０】
さらに、ステップＳ２４０３で起動されたプログラムに従って、第１プログラムおよびデータ格納手段２１０１のプログラムを呼び出し（ステップＳ２４１４）、音声処理手段２１０２と連携動作させる（ステップＳ２４１５）。
【００９１】
次に、本実施の形態の作用効果について説明する。本実施形態では、音声処理言語情報統合手段２１０７を有し、通信端末２０００側で生成した音声言語情報と、複数のサーバ２００〜ｎ００側で生成した音声言語情報とを合成する構成としており、複数のプログラムやデータを連携させて、音声処理を行う、ことが可能になる。
【実施例１】
【００９２】
次に、本発明の第１の実施例を、図面を参照して説明する。本発明の第１の実施例の構成は、図１に示した構成とされる。図３乃至図８は、図１に示した本実施例の第１プログラムおよびデータ格納手段１０１に格納されるプログラムおよびデータの一例を説明するものである。
【００９３】
図３は、第１プログラムおよびデータ格納手段１０１に格納されるプログラムと、プログラムが管理するデータとの対応を説明するための図である。図３では、プログラムとして、端末管理、アドレス帳、送信着信（発信受信）履歴、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）、赤外線の５つのプログラムが格納されている。また、それぞれに対応するデータとして、端末管理データ、アドレス帳データ、送信着信履歴データ、ＧＰＳデータ、赤外線でデータが格納されている。
【００９４】
図４乃至図８は、図３に示した第１プログラムおよびデータ格納手段１０１に格納されるプログラムが管理するデータの一例を示す図であり、通信端末１００のユーザ独自の情報や通信端末の動的に変化するデータを想定している。
【００９５】
図４は、図３の端末管理プログラムが管理する端末管理データの一例である。図４に示すように、端末管理データは、項目と、その値（パラメータ）より構成される。
【００９６】
項目としては、電源、電池の残量、電波状態、蓋の開閉があり、それぞれの値は、電源＝ON、電池の残量＝４５％、電波状態＝良好、蓋の開閉＝閉となっている。
【００９７】
図５は、図３のアドレス帳プログラムが管理するアドレス帳データの一例である。アドレス帳データは、データに番号付けをするためのID、名前、名前の読み、メールアドレス、電話番号から構成される。図５に示す例では、ID=001、名前＝田中一郎、読み＝いっちゃん、メールアドレス＝ichiro@xxx.com、電話番号＝090-2222-3333となっている。
【００９８】
図６は、図３に示した発信着信（発信受信）履歴プログラムが管理する発信着信（送信受信）履歴データの一例である。発信着信履歴データは、データを番号付けするためのＩＤ、発信着信の別、発信または着信した日時、発信または着信した先の電話番号より構成される。
【００９９】
図６に示す例では、データが３件あり、
ID=001のデータでは、発信着信の別=発信、発信日時＝2003年12月18日1時2分34秒、発信先＝090-2222-3333となっており、
ID=002のデータでは、発信着信の別=着信、着信日時＝2003年12月18日1時4分34秒、着信先＝090-2222-3333となっており、
ID=003のデータでは、発信着信の別=着信、着信日時＝2003年12月18日2時4分34秒、着信先＝090-2222-3333となっている。
【０１００】
図７は、図３のＧＰＳプログラムが管理するＧＰＳデータの一例である。ＧＰＳデータでは、直前にＧＰＳプログラムが動作したときに取得したデータを保持する。図７に示す例では、ＧＰＳデータは、項目名とその値とから構成される。項目としては、計測日時、緯度、経度、現在地の住所より構成され、計測日時＝2003年12月18日1時0分34秒、緯度＝N35°51.475、経度＝E139°51.475、現在地の住所＝東京都港区芝1-1-1となっている。
【０１０１】
図８は、図３の赤外線プログラムが管理する赤外線データの一例である。赤外線データでは、端末外の赤外線ポートとの通信履歴を保持する。図８に示す例では、赤外線データは、データを番号付けするためのＩＤと、通信日時と、通信先ＩＤと、通信コマンドと、コマンドに付随したパラメータと、から構成されており、４件のデータがあり、
ID＝001のデータでは、通信日時＝2003年12月18日1時0分34秒10ms、通信先＝IDxxxxxx、通信コマンド＝接続要求となっており、
ID＝002のデータでは、通信日時＝2003年12月18日1時0分34秒30ms、通信先＝IDxxxxxx、通信コマンド＝接続要求応答となっており、
ID＝003のデータでは、通信日時＝2003年12月18日1時0分34秒50ms、通信先＝IDxxxxxx、通信コマンド＝データ読み出し要求、パラメータ＝“データ名=ファイル1.txt ファイルタイプ=txt”となっており、
ID＝004のデータでは、通信日時＝2003年12月18日1時0分34秒0ms、通信先＝Idxxxxxx、通信コマンド＝データ読み出し応答、パラメータ＝“データ名=ファイル1.txt ファイルタイプ=txt”となっている。
【０１０２】
図８に示す例では、
ID=001のデータの示す時刻に、ID=001のデータの示す通信先に、通信端末より接続要求が送信され、
ID=002のデータの示す時刻に通信先との接続が確立し、
ID=003のデータの示す時刻にテキスト形式のファイルであるファイル1.txtのファイルを読み出すように要求を送信し、
ID=004のデータの示す時刻に前記ファイル1.txtのファイルが通信端末に送信された、
ことを意味している。
【０１０３】
次に、図９乃至図１１を用いて、本発明の一実施例の通信端末１００の音声処理言語情報作成手段１０３の動作を説明する。
【０１０４】
音声処理言語情報作成手段１０３は、音声処理手段１０２で用いる音声言語情報を作成する。音声処理手段１０２は、音声認識と音声合成を行う。
【０１０５】
音声認識用の音声言語情報としては、単語列とその読みから構成される単語辞書、有限言語ネットワークによる文法、確率統計モデルに基づく言語モデルを用いる。
【０１０６】
また、音声合成用の音声言語情報としては、単語列とその読みから構成される辞書を用いる。
【０１０７】
音声認識用の単語辞書作成の一例としては、対象とするプログラムやデータの形式を用いて形態素解析を行い、特定の品詞の単語に読み付けを行い、単語辞書に登録する。
【０１０８】
この際、品詞ごとに読み付けルール定め、これに従って、読みを行う。
【０１０９】
また、格納されているデータの構造が明らかなものに関しては、構造解析を、事前に行い、この結果を用いて、データの種類を分類し、分類した結果毎に、読みづけを行う。
【０１１０】
前者の形態素解析が有効なデータとしては、Ｗｅｂブラウザが管理するＷｅｂページデータやメーラが管理するメールデータなどがある。
【０１１１】
また後者のデータの構造解析が有効な例としては、アドレス帳データや端末状態データがある。
【０１１２】
解析結果が人名のものは、同じデータ内に該当する読み情報がある場合、その情報を優先し、読みがない場合は仮名漢字変換機能により、読みを生成する。
【０１１３】
解析の結果が、電話番号およびメールアドレスでは、数字やアルファベットでの読みの他、「田中さんの電話」や「田中さんのメールアドレス」のように名前をふくめたものも含めて登録する。
【０１１４】
解析の結果が、「電池」や「電源」などの端末の機能や部品を示す名詞や、それらの状態を示す名詞や形容詞や動詞は、予め類義語、発音変形、省略形の読みを予めデータベースとしておき、データベースより該当するものを辞書に登録する。
【０１１５】
音声認識用の文法作成方法の一例としては、対象とするプログラム毎に、文法のテンプレートを予め用意しておく。この文法テンプレートは、文法の構造である単語列のネットワークや単語列の生成方法を定義するものである。
【０１１６】
音声処理言語情報作成手段１０３では、文法テンプレートしたがって、データを挿入し、文法を作成する。
【０１１７】
音声合成用の辞書生成方法の一例としては、音声認識用の単語辞書と同様に対象とするプログラムやデータの形式を用いて形態素解析を行い、品詞ごとに、読み付けルールを定め、このルールに従って、読みを登録する。
【０１１８】
また、格納されているデータの構造が明らかなものに関しては、構造解析を事前におこないこの結果を用いてデータの種類を分類し、分類した結果ごとに読みづけルールを用意しておき、これを用いて読み付けを行う。
【０１１９】
読み付けのルールの一例としては、以下のような方法がある。
【０１２０】
解析結果が人名のものは、読み付けルールとして、同じデータ内に、該当する読み情報がある場合、その情報を優先し、読みがない場合には、仮名漢字変換機能により、読みを生成する。
【０１２１】
解析の結果が、メールアドレス場合、読み付けのルールとして、形態素解析の結果を用いて、メールアドレスの前後の関係から、持ち主が判定できる場合、「田中さんのメールアドレス」のように、メールアドレスの持ち主の名前を含めた読み付けを行い、持ち主が判定できない場合、「このメールアドレス」のように読み付けを行う。
【０１２２】
辞書への登録を必要としない通常のアルファベットや、数字の読み付けを用いるか、前記読み付けルールを用いるかは、プログラム中に定義しておく。
【０１２３】
解析の結果が、電話番号の場合、読み付けルールとしては、形態素解析の結果を用いて、電話番号の前後の関係から持ち主が判定できる場合には、例えば「田中さんの電話番号」のように、持ち主の名前を含めた読み付けを行う。一方、持ち主が判定できない場合には、「この電話番号」のように読み付けを行う。また、局番から固定電話、携帯電話、IP電話、フリーダイアル等の電話の種類を判定し、たとえば、０１２０で始まるものの場合、「このフリーダイアル」のように読み付けを行う。
【０１２４】
このほかにも、音声合成が定義している数字や記号の読みを用いる方法や、局番間の区切り記号であるハイフンやマイナスや括弧を‘の’に置き換える方法などがある。たとえば、ハイフンやマイナスや括弧を‘の’に置き換える方法では、「０４４−９９９−１２３４」は、「ぜろよんよんのきゅーきゅーきゅーのいちにーさんしー」と読みづけがされる。いずれの読み付けルールを採用するかは、プログラム中に定義する。
【０１２５】
解析の結果が「電池」や「電源」などの端末の機能や部品をしめす名詞では、予め、その読みをデータベースに登録しておき、データベースより該当するものを辞書に登録する。
【０１２６】
図９は、音声認識用の単語辞書の生成を説明するための図である。図９には、一例として、図４に示した端末情報データに対して、辞書が生成される例が示されている。端末情報データは、端末の機能や部品をしめす名詞や、それらの状態を示す名詞であることから、予め登録されたデータベースより、該当するものを辞書に登録する。
【０１２７】
端末情報データの項目名である、「電源」および「電池の残量」を表記として、辞書が生成される例を示している。
【０１２８】
表記「電源」には、単語の読み仮名である「でんげん」と、電源の類義語である「ぱわー」の２つを音声認識用の読みとして登録する。
【０１２９】
また、表記「電池の残量」では、単語の読み仮名である「でんちのざんりょう」のほかに、「電池」の類義語である「ばってりー」および「ばってりー」の発音変形「ばってり」、「残量」の類義語である「のこり」とを合わせて、「でんちののこり」、「ばってりーのざんりょう」、「ばってりのざんりょう」、「ばってりーののこり」、「ばってりののこり」を登録する。
【０１３０】
また、「電池の残量」の省略形である「でんち」、「ざんりょう」と、これらの類義語や発音変形の「ばってりー」、「ばってり」、「のこり」もあわせて登録する。
【０１３１】
図１０は、音声合成用の辞書の生成を説明するための図である。図１０には、一例として、図５に示したアドレス帳データに対して、辞書が生成される例が示されており、「田中一郎」、「ichiro@xxx.com」、「090-2222-3333」の３種類の表記に対して、音声合成の読みを生成する例を示している。
【０１３２】
表記「田中一郎」に対しては、人名であることから、アドレス帳データに与えられている読み「いっちゃん」を登録する。
【０１３３】
また、表記「ichiro@xxx.com」に対しては、メールアドレスであるので、メールの持ち主の読みを含めた形式である「いっちゃんのめーるあどれす」を登録する。
【０１３４】
さらに、表記「090-2222-3333」に対しては、電話番号であるので、電話番号の持ち主の読みと局番の解析結果を含めた形式である「いっちゃんのけいたいでんわ」を登録する。
【０１３５】
図１１は、音声認識用文法の生成を説明するための図である。図１１には、一例として図５で示したアドレス帳データを用いてアドレス帳に対して操作を行うための文法が示されている。
【０１３６】
図１１（ａ）では、文法生成のための文法テンプレートの一例を示している。文法テンプレートでは、文法の構造や登録する単語列の定義の方法を定義する。この例では、アドレス帳の［読み］、［助詞］、アドレス帳の［項目］、［助詞］、［操作］の各項目を順々に発声するような言い回しを定義している。また、このうち、［読み］と、［項目］に登録する単語列はアドレス帳から参照する。また、それ以外の［助詞］と、［操作］は、登録する単語列を予め定義しておく。
【０１３７】
図１１（ｂ）では、図１１（ａ）の文法テンプレートに従って登録される単語列の例を示したものである。各単語列は、表記と読みで構成されている。アドレス帳から参照された［読み］と［項目名］、予め登録された［助詞］と［操作］の４項目の単語列を定義している。［読み］には、“いっちゃん”の１単語が、［項目名］には、“名前”、“読み”、“メールアドレス”、“電話番号”の４単語が、［助詞］には、“の”、“を”の２単語が、［操作］には、“消去する”、“消す”、“編集する”、“編集します”、“編集したい”の５単語が登録されている。また、各単語には読みと表記が与えられている。
【０１３８】
図１１（ｃ）では、図１１（ａ）および図１１（ｂ）により、テンプレートに単語列を挿入した結果、認識可能となる発声の一例とテンプレートとの対応を示したものである。
【０１３９】
以上のように定義することにより、「いっちゃんの電話番号を編集したい」という発声を、認識するための文法が生成される。
【０１４０】
次に、図１２乃至図１４を用いて、図１に示した実施例のサーバ２００の音声処理言語情報作成手段２０２の動作を説明する。
【０１４１】
音声処理言語情報作成手段１０３では、通信端末１００側からデータの生成方法と、通信端末１００で管理しているデータを、サーバ２００に送信する。これらを用いて、サーバ２００内に格納しているデータにより、音声言語情報を生成する。
【０１４２】
サーバ２００の音声処理言語情報作成手段２０２で生成する音声言語情報は、通信端末１００の音声合成情報作成手段１０３で生成されるものと同様に、音声認識用としては単語列とその読みから構成される単語辞書、有限言語ネットワークによる文法、確率統計モデルに基づく言語モデルを想定している。
【０１４３】
音声合成用の音声言語情報も、単語列と、その読みから構成される辞書を想定している。また、音声認識用の単語辞書および文法および言語モデルの作成方法は、サーバ２００内に格納しているデータを用いる他は同様とする。音声合成用辞書に関しても同様とする。
【０１４４】
以下、図１２乃至図１４を参照して、音声言語情報の生成について説明する。
【０１４５】
図１２と図１３では、サーバ２００での音声言語情報生成の一例として、サーバ２００に格納されたデータを用いて、音声認識用の単語辞書を生成する例を示している。
【０１４６】
ここでは、サーバ２００側から、通信端末１００の電話番号を送信し、サーバ２００で管理している利用履歴を基に、サービスを利用するための単語辞書を作成する方法を説明する。
【０１４７】
図１２は、サーバ２００で管理しているデータの一例である利用履歴データを示す図である。このデータは、データを番号付けするためのID、利用者の電話番号、サービス名、利用回数、最終利用日、利用金額合計、サービス主体者の利用希望の度合いを示すキャンペーンより構成されている。図１２では、通信端末１００よりサーバ２００に送付された通信端末の電話番号が、０９０−XXXXYYYYの場合、該当するものが、ID=001〜003の3件があることを示している。
【０１４８】
また、それぞれの利用については、
ID=001では、AA美術館のチケット購入が5回利用があり、最終利用日時が2003年03月12日19時30分25秒で利用金額が5500円でサービス主体者の利用希望の度合いは低であり、
ID=002では、中華料理店Bが8回利用があり、最終利用日時が2003年03月12日22時30分25秒で利用金額が25800円でサービス主体者の利用希望の度合いは中であり、
ID=003では、エステサロンCは利用履歴がなくサービス主体者の利用希望の度合いは高である、
ことを示している。
【０１４９】
図１３は、図１２を用いて作成された音声認識用の単語辞書である。図１３に示す例では、利用履歴から利用可能なサービスを列挙し、登録されたサービス名やサービスを利用するための単語を辞書に登録する。サービスを利用するための単語列は、予めサーバ２００内に定義しておく。
【０１５０】
登録する単語列に登録可能な数や登録順などの制約がある場合には、利用回数、最終の利用日、金額合計やサービス主体者の利用希望の度合いにより制約を行う。
【０１５１】
例えば、図１２のID＝001に登録されているAA美術館チケット購入のサービスについての場合、利用するための言い回しとして、
AA美術館、美術館、チケット購入などを
音声認識用の単語辞書に登録する。
【０１５２】
サーバ２００の音声処理言語情報作成手段２０２が生成する音声言語情報としては、複数のプログラムを連携動作させるための音声言語情報を作成することも想定している。
【０１５３】
図１４を参照して、複数のプログラムを連携動作させるための音声言語情報の生成について説明する。図１４に示す例では、複合施設の情報案内プログラムと、複合施設内の店舗のサービス予約プログラムと、を連携させて動作させるための音声認識用文法の生成について説明する。
【０１５４】
図１４（ａ）および図１４（ｂ）は、すでに生成された音声認識用文法を示している。
【０１５５】
図１４（ａ）は、複合施設の情報案内プログラムを音声で制御させるための文法である。この文法は、複合施設内の店舗のカテゴリーを特定するための［カテゴリー］と、［店舗名］と、案内の内容を指定するための［項目］と、［コマンド］の４つの単語列より構成される。
【０１５６】
単語列［カテゴリー］には“レストラン”、“エステティック”、“美術館”の３つの単語が、
［店舗施設名］には、“店Ａ”、“美術館Ａ”、“エステティックサロンＡ”の４つの単語が、
［項目］には、“場所”、“営業時間”、“定休日”、“予算”の４つの単語が、
［コマンド］には、“どこ”、“いくら”、“いつ”
の３つの単語が登録されている。
【０１５７】
なお、各単語列に登録された単語はそれぞれ表記と読みをもつ。
【０１５８】
この文法では、「エステティックのエステサロンＡの定休日はいつ」が認識可能である。
【０１５９】
図１４（ｂ）は、複合施設内の店舗のサービス予約プログラムで、
サービスを特定するための［サービス名］と、
サービスを受けたい時間を指定するための［時間］と、
予約に関する操作を指定するための［予約コマンド］
より構成されている。
【０１６０】
単語列［サービス名］には“サービスＡを”、“サービスＢを”の２つの単語が、
［時間］には“１０：００に”、“１１：００に”の２つの単語が、
［予約コマンド］には“予約”、“取り消し”、“確認”の３つの単語が登録されている。なお、各単語列に登録された単語は、それぞれ表記と読みをもつ。
【０１６１】
この文法では、「サービスＡを１０：００に予約」が認識可能である。
【０１６２】
図１４（ｃ）は、図１４（ａ）および図１４（ｂ）の文法を融合して、新たな文法を生成するための文法テンプレートである。
【０１６３】
このテンプレートでは、
［カテゴリー］と、［店舗施設名］と、［項目］と、［コマンド］を順々に指定する文法と、
［カテゴリー］と、［店舗施設名］と、［サービス名］と、［時間］と、［予約コマンド］と、を順々に指定する文法の２つを定義している。
【０１６４】
［カテゴリー］と、［店舗施設名］と、［項目］と、［コマンド］の項目に定義する単語列は、図１４（ａ）の文法より挿入する。
【０１６５】
また、［サービス名］と、［時間］と、［予約コマンド］の各項目に定義する単語列は、図１４（ｂ）より挿入する。
【０１６６】
図１４（ｄ）は、図１４（ｃ）の文法テンプレートを用いて作成された文法を示す図である。これにより、
「エステティックのエステティックサロンＡの定休日はいつ」と、
「エスティックのエステティックサロンＡのサービスＡを１０：００に予約」
の双方の文法が認識可能となる。
【０１６７】
次に、図１５乃至図１９を参照して、図１の第２プログラムおよびデータ格納手段１０５に格納されるプログラムについて説明する。
【０１６８】
第２プログラムおよびデータ格納手段１０５に格納されるプログラムでは、第１プログラムおよびデータ格納手段１０１に格納されたプログラムおよびデータや、音声処理手段１０２や、サーバ２００との連携動作の方法を定義している。
【０１６９】
この場合、第１プログラムおよびデータ格納手段１０１に格納されるプログラム（通信端末１００に予め格納されるプログラム）としては、発信や着信を管理する発信着信プログラム、現在地を割り出すためのGPSプログラムや、赤外線通信を行うための赤外線通信プログラムなどがある。
【０１７０】
以下では、図１５乃至図１９を参照して、具体的なプログラムについて説明する。
【０１７１】
図１５、図１６を参照して、第２プログラムおよびデータ格納手段１０５に格納されるプログラムの一例として、第１プログラムおよびデータ格納手段１０１に格納された発信着信プログラムと、音声処理手段１０２とを連携して動作させるプログラムの動作を説明する。具体的には前述のプログラムでは、電話を着信すると、発信着信履歴や、端末状態に応じたメッセージを合成音で出力する。
【０１７２】
図１５は、第２プログラムおよびデータ格納手段１０５に格納されるプログラムの処理手順を説明するためのフローチャートである。図１５に示すように、制御手段１０６は、電話を着信すると、まずアドレス帳より着信した電話番号に該当するデータを検索する（ステップＳ１３０１）。着信番号が登録されている場合（ステップＳ１３０２の「ある」分岐）、名前を一時的保存する（ステップＳ１３０３）。次に、発信着信履歴を検索し、該当する電話番号がある場合（ステップＳ１３０４の「ある」分岐）、発信回数と受信回数を一時的に保存する（ステップＳ１３０５）。次に、端末状態を検索し、バッテリー状態を一時的に保存する（ステップＳ１３０６）。
【０１７３】
さらに、ステップＳ１３０３、ステップＳ１３０５、およびステップＳ１３０６での保存状態を受けて、出力する文章を作成し（ステップＳ１３０７）、音声合成で出力する（ステップＳ１３０８）。
【０１７４】
図１６は、ステップＳ１３０７における発声文を作成するためのルールの一例を説明するための図である。まず、ステップＳ１３０２において、アドレス帳に該当するデータがない場合、「でんわだよ」とする。アドレス帳に該当するデータがある場合、アドレス帳に登録されている読みを用いて「田中一郎さんから電話だよ」のように作成する。
【０１７５】
次に、ステップＳ１３０４において、発信回数および着信回数がともに０〜４回の場合、該当する文章は作成しない。
【０１７６】
発信回数が５回以上で、着信回数が０〜４回のときは、「お待ちどう様、やっと、かかってきてよかったね」とする。さらに、着信回数が５回以上のときは、「今日は、よくかかってくるね」とする。
【０１７７】
さらに、ステップＳ１３０６において、電池の残量が、４０％以上の場合は、該当する文章はない。４０％未満の場合は、「どうでもいいけど、電源につないでくれよー。電池の残量がきれるよ。」とする。
【０１７８】
例えば、ステップＳ１３０２において該当するデータがあり、着信回数が５回以上で、電池の残量が４０％未満の場合、「田中さんから電話だよ。今日は、よくかかってくるね。どうでもいいけど、電源につないでくれよー。電池の残量がきれるよ。」となり、ステップＳ１３０２において該当するデータがなく、着信回数および発信回数がなく、電池の残量が４０％以上の場合には、「でんわだよ」となる。
【０１７９】
次に、図１７には、第２プログラムおよびデータ格納手段１０５に格納されれたプログラムの一例が示されている。図１７を参照して、第１プログラムおよびデータ格納手段１０１に格納されたＧＰＳプログラムと音声処理とを連携動作させるプログラムの動作について説明する。図１７は、ＧＰＳプログラムとサーバと音声処理とを連携して動作させる例を示す図であり、具体的には通信端末の現在の位置から複合施設を割り出し複合施設サービスを音声検索するためのプログラムのフローチャートである。
【０１８０】
まず、通信端末１００内の第１プログラムおよびデータ格納手段１０１に格納されているＧＳＰプログラムを起動し（ステップＳ１５０１）、現在地を計測する（ステップＳ１５０２）。送受信手段１０４より現在地のデータをサーバに送信し、サーバ２００の送受信手段２０１ではこれを受信する（ステップＳ１５０３）。
【０１８１】
サーバ２００の音声処理言語情報作成手段２０２では、ステップＳ１５０３で受信した現在地データとサーバ内で管理している複合施設のサービスリストとにより辞書を作成する（ステップＳ１５０４）。
【０１８２】
辞書を、サーバ２００の送受信手段２０１により通信端末１００に送信し、通信端末１００の送受信手段１０４で、辞書を受信する（ステップＳ１５０５）。
【０１８３】
次に、ステップＳ１５０５において受信した音声処理辞書を用いて、音声処理手段１０２の音声認識を起動する（ステップＳ１５０６）。
【０１８４】
さらに、通信端末１００内の第１プログラムおよびデータ格納手段１０１に格納されているブラウザを起動し（ステップＳ１５０７）、ステップＳ１５０２において取得した現在地の住所から複合施設サービスページを表示する（ステップＳ１５０８）。
【０１８５】
ブラウザの表示中にユーザの発声があった場合（ステップＳ１５０９）、音声処理手段１０２で音声認識され（ステップＳ１５１０）、ページ中のリンクへのジャンプや文字入力などのコマンド処理が行われる（ステップＳ１５１１）。コマンドが終了コマンドであった場合、終了する。
【０１８６】
次に、図１８および図１９を参照して、図１の第２プログラムおよびデータ格納手段１０５に格納されるプログラムの一例として、第１プログラムおよびデータ格納手段１０１に格納された赤外線プログラムと、音声処理と、サーバ２００とを連携動作させるプログラムの動作について説明する。
【０１８７】
図１８および図１９は、赤外線プログラムと、音声処理手段１０２とを連動させて使用するプログラムの一例を示す図であり、具体的には映画館やショッピングモール等の複合型施設でのサービスを音声認識や合成により受けるためのプログラムの一例である。
【０１８８】
このプログラムでは、複合施設の壁や柱や家具などの什器に、赤外線ポートを埋め込んだり、赤外線ポート専用の端末などのインフラを設けておくことが前提とされている。
【０１８９】
図１８は、サービスの形態を説明するための図であり、複合施設内の赤外線ポート毎のサービス一覧を表している。この例では、各赤外線固有のポートIDと、各ポートの店舗名や設置フロアなど固定の位置情報と、什器や端末を特定するための情報と、ポートより受けられるサービスにより表している。
【０１９０】
例えば、ポートID=001の赤外線ポートは、美術館１階のＡ２柱に設置の展示Ａに設置されている。このポートからは、展示品情報提供サービスの呼び出しが可動である。具体的には、展示Ａに関連した情報を音声合成により読み上げを行う。
【０１９１】
また、ポートID=100の赤外線ポートは、西館６Ｆ中華料理店ＢにあるＴ１００テーブルに設置されている。このポートからは、メニュー説明注文のサービスが可動である。具体的には、メニューの紹介を音声合成により読み上げたり、音声認識により注文を行う。
【０１９２】
図１９は、赤外線プログラムと、音声処理とを連動させるプログラムの動作手順を示す図である。この例では、動作に必要なプログラムや音声処理に必要な辞書は、予め生成し、第１プログラムおよびデータ格納手段１０１に格納しておく。
【０１９３】
まず、第１プログラムおよびデータ格納手段１０１に格納されている赤外線プログラムを起動し（ステップＳ１７０１）、現在地の赤外線ポートＩＤを取得する（ステップＳ１７０２）。取得したポートＩＤに従ったサービスプログラムに切り替える（ステップＳ１７０３）。
【０１９４】
サービスプログラムでは、音声認識または音声合成が設定されているので、音声処理機能を起動する（ステップＳ１７０４）。
【０１９５】
起動されたプログラムに対して、ボタン入力や発声などのユーザ入力ある場合（ステップＳ１７０５）は、音声処理を実行する（ステップＳ１７０６）。具体的に、この処理では、音声合成による出力や、音声認識の結果をコマンドに変換して実行する。さらに、音声処理の結果が終了の場合には（ステップＳ１７０７）、終了する。
【０１９６】
次に、本発明の第２の実施例を図面を参照して説明する。図２０は、この実施例の構成を示す図である。本実施例では、音声処理言語情報作成手段１１０３が、第１プログラムおよびデータ格納手段１１０１と第２プログラムおよびデータ格納手段１１０５の双方を参照して、音声言語情報を生成する点が、前記第１の実施例とは相違している。
【０１９７】
図２２は、音声処理言語情報作成手段１１０３の動作を説明するための図である。
【０１９８】
図２２（ａ）は、音声処理言語情報作成手段１１０３が第１プログラムおよびデータ格納手段１１０３より読み込んだプログラムおよびデータを説明するための図であり、この例では、メーラとメーラの管理するデータであるアドレス帳データとメールデータとを用いるものとする。
【０１９９】
図２２（ｂ）は、音声処理言語情報作成手段１１０３が、第２プログラムおよびデータ格納手段１１０５より読み込んだプログラムおよびデータを説明するための図である。この例では、商品検索プログラムと商品データを用いる。
【０２００】
図２２（ｃ）は、前記商品データの一例を説明するための図であり、商品ＩＤと商品名と商品データファイルとにより構成されている。
【０２０１】
図２２（ｄ）は、音声処理言語情報作成手段１１０３で生成する文法のテンプレートである。このテンプレートを用いると、読みと助詞と商品名とメールコマンドより構成される文法が生成される。また、メールコマンドは、メールとコマンド（メール）より構成される。読みはアドレス帳より参照する。また、商品名は商品データより参照する。
【０２０２】
それぞれのプログラムが管理するデータより参照できない、助詞、メール、コマンド（メール）に登録する単語列は予め与えておく。
【０２０３】
図２２（ｅ）は、文法テンプレートに、データを参照して文法を生成することを説明するための図で、参照後、「いっちゃんに商品００１をメールで送る」という発声を音声認識するための文法が生成されたことを意味している。
【０２０４】
以上のように、音声処理言語情報作成手段１１０３で、第１プログラムおよびデータ格納手段１１０１より読み込んだプログラムおよびデータと、第２プログラムおよびデータ格納手段１１０１より読み込んだプログラムおよびデータとを連携させて音声言語情報を生成することにより、端末に固有のプログラムや機種やユーザに固有の情報や端末の状態によってダイナミックに変化する情報と機種に依存することなく作られた汎用的なプログラムやそのデータとを連携させ、音声認識や音声合成といった音声処理で制御することが可能になる。
【０２０５】
次に、本発明の第３の実施例を図面を参照して説明する。図２３は、本発明の第３の実施例の構成を示す図である。
【０２０６】
本実施例では、複数のサーバ２００〜ｎ００より構成されている点と、通信端末２０００や複数のサーバ２００〜ｎ００で生成される音声言語情報を統合するための通信端末２０００が音声処理言語情報統合手段２１０７を備えている点が前記第１の実施例と相違している。。
【０２０７】
図２４は、音声処理言語情報統合手段２１０７の動作を説明するための図である。音声処理言語情報統合手段２１０７は、サーバ２００とサーバｎ００と通信端末２０００のそれぞれで生成された音声言語情報を読み込んで、音声言語情報を生成する。
【０２０８】
図２５（ａ）は、サーバ２００で生成された音声言語情報の一例を示す図であり、映画に関する情報検索を行うための音声認識用文法の構成図と構成図に対応する文法の一例を示している。
【０２０９】
この文法は、映画名に関する項目である[映画]と、映画に関する項目である[項目(200)]と、問い合わせのための項目である[コマンド(200)]より構成されており、それぞれの項目に登録する単語列が定義されている。このように定義することにより、「映画Ａの開始時間を教えて」がこの文法で認識可能となる。
【０２１０】
図２５（ｂ）は、サーバｎ００で生成された音声言語情報の一例で、店舗および施設に関する情報検索を行うための音声認識用文法の構成と対応する文法の一例を示している。
【０２１１】
この文法は、店舗や施設を特定するための項目である［店舗および施設名］と、店舗および施設に関する項目である［項目（ｎ００）］と、問い合わせのための項目である［コマンド（ｎ００）］より構成されており、［店舗および施設名］の［カテゴリ］と［名前］のそれぞれの項目に登録する単語列が定義されている。このように定義することにより、「レストランの店Ａの予算はいくら」がこの文法で認識可能となる。
【０２１２】
図２５（ｃ）は、通信端末２０００で生成された音声言語情報の一例で、メール操作を行うための音声認識用文法の構成と対応する文法の一例を示している。
【０２１３】
この文法は、メールのあて先を指定するための項目である［読み］と、メールに関する項目である［メール］と、問い合わせのための項目である［コマンド（メール）］より構成されており、それぞれの項目に登録する単語列が定義されている。このように定義することにより、「いっちゃんにメールを送る」がこの文法で認識可能となる。
【０２１４】
図２５（ｄ）は、音声処理言語情報統合手段２１０７で音声言語情報を合成するための一例であり、図２５（ａ）から図２５（ｃ）での音声言語情報を合成するための文法テンプレートの構成を示している。この文法テンプレートでは、映画や施設の情報をメールで送信するための文法を想定している。文法は、メールのあて先を指定するための［読み］と、［助詞］と、映画や施設の名前や項目を指定するための［映画および施設情報］と、メールを送信するための［メールコマンド］より構成される。項目［読み］は、通信端末２０００で生成された文法より参照する。また、項目［映画および施設情報］は、［映画情報］と、［助詞］と、［施設情報］と［助詞］より構成される。
【０２１５】
さらに、［映画情報］は、［映画］と、［項目（２００）］より構成され、［映画］と、［項目（２００）］は、サーバ２００で生成された文法より参照する。
【０２１６】
［施設情報］は［店舗および施設名］と［項目（ｎ００）］より構成され、［店舗および施設名］と［項目（ｎ００）］は、サーバｎ００で生成された文法より参照する。
【０２１７】
図２５（ｅ）は、文法テンプレートに、データを参照して文法を生成することを説明するための図である。データを参照することで、「いっちゃんに映画Ａの開始時間とレストランの店Ａの予算をメールで送る」という発声を行う、音声認識のための文法が生成されたことを意味している。
【０２１８】
以上のように、音声処理言語情報作成手段で複数のサーバで生成された音声言語情報と通信端末内で生成された音声言語情報を合成して音声言語情報を生成することにより、端末に固有のプログラムや機種やユーザに固有の情報や端末の状態によってダイナミックに変化する情報と機種に依存することなく作られた汎用的なプログラムやそのデータとを連携させ、音声認識や音声合成といった音声処理で制御することが可能になる。
【０２１９】
以上本発明を上記実施例に即して説明したが、本発明は上記実施例の構成にのみ限定されるものでなく、本発明の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
【産業上の利用可能性】
【０２２０】
本発明によれば、携帯電話や携帯端末で音声認識や音声合成などの音声処理と端末に内蔵されたプログラムやそのプログラムが管理するデータとを連携されるといった用途に適用できる。特に、端末が管理するシステムの状態によって動的に変化するデータや個人情報を音声処理とを連携させる用途に適用できる。
【０２２１】
また、音声処理と端末に内蔵されたプログラムやそのプログラムが管理するデータとサーバとを連携させる用途にも適用可能である。具体的には、携帯電話を用いて複合施設の情報検索案内サービス用途に適用可能である。例えば、上記実施例では、携帯型通信端末を例に説明したが、音声処理機能を具備した任意の電子装置等に対して適用できることは勿論である。
【図面の簡単な説明】
【０２２２】
【図１】本発明の第１の実施の形態の構成を示すブロック図である。
【図２】本発明の第１の実施の形態の動作を示す流れ図である。
【図３】本発明の第１の実施の形態の通信端末に記憶されているプログラムおよびそのデータの具体例を示す図である。
【図４】本発明の第１の実施の形態の通信端末に予め格納されているプログラムおよびそのデータの具体例を示す図である。
【図５】本発明の第１の実施の形態の通信端末に予め格納されているプログラムおよびそのデータの具体例を示す図である。
【図６】本発明の第１の実施の形態の通信端末に予め格納されているプログラムおよびそのデータの具体例を示す図である。
【図７】本発明の第１の実施の形態の通信端末に予め格納されているプログラムおよびそのデータの具体例を示す図である。
【図８】本発明の第１の実施の形態の通信端末に予め格納されているプログラムおよびそのデータの具体例を示す図である。
【図９】本発明の第１の実施の形態の通信端末での音声処理用の音声言語情報作成の具体例を示す図である。
【図１０】本発明の第１の実施の形態の通信端末での音声処理用の音声言語情報作成の具体例を示す図である。
【図１１】本発明の第１の実施の形態の通信端末での音声処理用の音声言語情報作成の具体例を示す図である。
【図１２】本発明の第１の実施の形態のサーバに格納されているデータの具体例を示す図である。
【図１３】本発明の第１の実施の形態のサーバでの音声処理用の音声言語情報作成の具体例を示す図である。
【図１４】本発明の第１の実施の形態のサーバでの音声処理用の音声言語情報作成の具体例を示す図である。
【図１５】本発明の第１の実施の形態の端末外部よりダウンロードされたプログラムの動作の一例を示すための図である。
【図１６】本発明の第１の実施の形態の端末外部よりダウンロードされたプログラムの動作の一例を示すための図である。
【図１７】本発明の第１の実施の形態の端末外部よりダウンロードされたプログラムの動作の一例を示すための図である。
【図１８】本発明の第１の実施の形態の端末外部よりダウンロードされたプログラムの動作の一例を示すための図である。
【図１９】本発明の第１の実施の形態の端末外部よりダウンロードされたプログラムの動作の一例を示すための図である。
【図２０】本発明の第２の実施の形態の構成を示す図である。
【図２１】本発明の第２の実施の形態の動作を示す流れ図である。
【図２２】本発明の第２の実施の形態の通信端末での音声処理用の音声言語情報作成の具体例を示す図である。
【図２３】本発明の第３の実施の形態の構成を示す図である。
【図２４】本発明の第３の実施の形態の動作を示す流れ図である。
【図２５】本発明の第３の実施の形態の通信端末での音声処理言語情報統合の具体例を示す図である。
【符号の説明】
【０２２３】
１００、１０００、２０００通信端末
１０１、１１０１、２１０１第１プログラムおよびデータ格納手段
１０２、１１０２、２１０２音声処理手段
１０３、１１０３、２１０３音声処理言語情報作成手段
１０４、１１０４、２１０４送受信手段
１０５、１１０５、２１０５第２プログラムおよびデータ格納手段
１０６、１１０６、２１０６制御手段
２１０７音声処理言語情報統合手段
２００、ｎ００サーバ
２０１、ｎ０１送受信手段
２０２、ｎ０２音声処理言語情報作成手段

【特許請求の範囲】
【請求項１】
音声認識及び／又は音声合成の処理を行う音声処理部と、
通信端末上で予め定められた所定の機能を実現するためのプログラム及び／又はデータを少なくとも記憶する第１の記憶部と、
前記通信端末外部から前記通信端末に入力され、前記第１の記憶部に記憶されているプログラム及び／又はデータと、前記音声処理部による音声処理との連携の仕方を規定するプログラム及び／又はデータを少なくとも記憶する第２の記憶部と、
前記通信端末外部から入力された前記プログラム及び／又はデータと、前記第１の記憶部に記憶されている前記プログラム及び／又はデータとを用いて、前記音声処理部による音声処理と、前記第１の記憶部に記憶されている前記プログラム及び／又はデータによる前記機能と、を連携動作させる制御を行う制御部と、
を備えている、ことを特徴とする通信端末。
【請求項２】
前記制御部は、前記第２の記憶部に記憶されているプログラムを起動し、起動された前記プログラムが、前記第１の記憶部に記憶されているプログラムを呼び出すか、データを用いて、前記音声処理部による音声処理と、前記第１の記憶部に記憶されているプログラム及び／又はデータとを連携動作させる、ことを特徴とする請求項１に記載の通信端末。
【請求項３】
音声認識及び／又は音声合成の処理を行う音声処理部と、
通信端末が保持する情報を少なくとも記憶する第１の記憶部と、
前記通信端末の外部から前記通信端末に入力され、音声処理用の言語情報を作成する手順を規定したプログラムを少なくとも記憶する第２の記憶部と、
前記第２の記憶部に記憶されている、前記音声処理用の言語情報を作成する手順を規定したプログラムの起動を制御する制御部と、
を備え、
前記音声処理用の言語情報を作成する手順を規定したプログラムは、起動されると、少なくとも、前記第１の記憶部に記憶された情報を用いて、前記音声処理部での音声処理に用いられる言語情報を作成し、
前記音声処理部は、前記作成された言語情報を用いて前記音声処理を行う、ことを特徴とする通信端末。
【請求項４】
前記第２の記憶部は、前記通信端末の外部から前記通信端末に入力され、前記第１の記憶部に記憶されているプログラム及び／又はデータと、前記音声処理部による音声処理との連携の仕方を規定するプログラムを記憶し、
前記第１の記憶部が、前記通信端末上で実行され、予め定められた所定の機能を実現するプログラム又は前記プログラムとデータを記憶し、
前記制御部は、前記第２の記憶部に記憶されているプログラムを起動し、前記音声処理部による音声処理と、前記第１の記憶部に記憶されているプログラム及び／又はデータとを連携動作させる、ことを特徴とする請求項３に記載の通信端末。
【請求項５】
前記通信端末外部から前記通信端末に入力され、前記第２の記憶部に記憶されるプログラム及び／又はデータは、前記通信端末が通信接続するサーバから転送される、ことを特徴とする請求項１乃至４のいずれか一に記載の通信端末。
【請求項６】
前記通信端末は、前記サーバに対して、音声処理用の言語情報の作成に必要な情報を送信し、
前記通信端末は、前記音声処理用の言語情報を受信した前記サーバ側で作成された前記音声処理用の言語情報を受け取り、前記音声処理部で音声処理を行う、ことを特徴とする請求項５に記載の通信端末。
【請求項７】
前記第１の記憶部には、前記音声処理部で用いられる、辞書、文法、言語モデルのうちの少なくとも一つを含む音声処理用の言語情報を生成するプログラム及び／又はデータが記憶されており、
前記通信端末は、少なくとも前記第１の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理用の言語情報を作成する音声処理言語情報作成部を備えている、ことを特徴とする請求項１乃至４のいずれか一に記載の通信端末。
【請求項８】
前記第２の記憶部には、前記通信端末外部から入力され、前記音声処理部で用いられる、辞書、文法、言語モデルのうちの少なくとも一つを含む言語情報を生成するプログラム及び／又はデータが記憶され、
前記音声処理言語情報作成部は、前記第１の記憶部と前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて音声処理用の言語情報を作成する、ことを特徴とする請求項７に記載の通信端末。
【請求項９】
前記通信端末が、前記通信端末の前記音声処理言語情報作成部で作成された音声処理用の言語情報と、前記通信端末外部から入力された１つ又は複数の音声処理用の言語情報とを合成した言語情報を作成する音声処理用の言語情報統合部をさらに備えている、ことを特徴とする請求項７に記載の通信端末。
【請求項１０】
前記通信端末外部から前記通信端末に入力される音声処理用の言語情報は、前記通信端末が通信接続するサーバで作成され前記サーバより前記通信端末に転送されたものである、ことを特徴とする請求項９に記載の通信端末。
【請求項１１】
請求項１乃至１０のいずれか一に記載の通信端末と通信接続するサーバ装置。
【請求項１２】
通信端末上で予め定められた所定の機能を実現するプログラム及び／又はデータを少なくとも記憶する第１の記憶部を有し、音声認識及び／又は音声合成の音声処理を行う通信端末が、
前記通信端末外部から、前記第１の記憶部に記憶されているプログラム及び／又はデータと、前記音声処理との連携の仕方を規定するプログラムを少なくとも入力し、入力した前記プログラムを第２の記憶部に記憶する工程と、
前記通信端末外部から入力された前記プログラム及び／又はデータと、前記第１の記憶部に記憶されている前記プログラム及び／又はデータとを用いて、前記音声処理部による音声処理と、前記第１の記憶部に記憶されている前記プログラム及び／又はデータによる前記機能と、を連携動作させる制御を行う工程と、
を含む、ことを特徴とする音声処理方法。
【請求項１３】
前記第２の記憶部に記憶されているプログラムを起動し、起動された前記プログラムが、前記第１の記憶部に記憶されているプログラムを呼び出すか、データを用いて、前記音声処理部による音声処理と、前記第１の記憶部に記憶されているプログラム及び／又はデータとを連携動作させる工程を含む、ことを特徴とする請求項１２に記載の音声処理方法。
【請求項１４】
通信端末が保持する情報を少なくとも記憶する第１の記憶部を有し、音声認識及び／又は音声合成の音声処理を行う通信端末が、
前記通信端末の外部から、音声処理用の言語情報を作成する手順を規定したプログラムを少なくとも入力し、入力した前記プログラムを第２の記憶部に記憶する工程と、
前記第２の記憶部に記憶されている、音声処理用の言語情報を作成する手順を規定したプログラムを起動する工程と、
前記第２の記憶部に記憶されている前記音声処理用の言語情報を作成する手順を規定したプログラムが、少なくとも、前記第１の記憶部に記憶された情報を用いて、前記音声処理部での音声処理に用いられる言語情報を作成する工程と、
前記作成された言語情報を用いて前記音声処理を行う工程と、
を含む、ことを特徴とする音声処理方法。
【請求項１５】
前記第２の記憶部には、前記通信端末の外部から前記通信端末に入力され、前記第１の記憶部に記憶されているプログラム及び／又はデータと、前記音声処理との連携の仕方を規定するプログラムが記憶され、
前記第１の記憶部には、前記通信端末上で実行され所定の機能を実現するプログラム又は前記プログラムとデータが記憶され、
前記第２の記憶部に記憶されているプログラムを起動し、前記音声処理と、前記第１の記憶部に記憶されているプログラム及び／又はデータとを連携動作させる工程を含む、ことを特徴とする請求項１４に記載の音声処理方法。
【請求項１６】
前記通信端末外部から前記通信端末に入力され、前記第２の記憶部に記憶されるプログラム及び／又はデータは、前記通信端末が通信接続するサーバから転送される、ことを特徴とする請求項１２乃至１５のいずれか一に記載の音声処理方法。
【請求項１７】
前記通信端末は、前記サーバに対して、音声処理用の言語情報の作成に必要な情報を送信する工程と、
前記サーバが、前記情報を受け取り前記音声処理用の言語情報を作成する工程と、
前記通信端末は、前記サーバ側で作成された前記音声処理用の言語情報を受け取り、前記音声処理部で音声処理を行う工程と、
を含む、ことを特徴とする請求項１６に記載の音声処理方法。
【請求項１８】
前記第１の記憶部には、前記音声処理部で用いられる、辞書、文法、言語モデルのうちの少なくとも一つを含む音声処理用の言語情報を生成するプログラム及び／又はデータが記憶されており、
少なくとも前記第１の記憶部に記憶されているプログラム及び／又はデータを用いて前記言語情報を作成する工程を含む、ことを特徴とする請求項１２乃至１５のいずれか一に記載の音声処理方法。
【請求項１９】
前記第２の記憶部には、前記通信端末外部から入力され、前記音声処理部で用いられる、辞書、文法、言語モデルのうちの少なくとも一つを含む音声処理用の言語情報を生成するプログラム及び／又はデータが記憶され、
前記第１の記憶部と前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて前記言語情報を作成する工程を含む、ことを特徴とする請求項１２乃至１５のいずれか一に記載の音声処理方法。
【請求項２０】
前記通信端末の音声処理言語情報作成部で作成された音声処理用の言語情報と、前記通信端末外部から入力された１つ又は複数の音声処理用の言語情報とを合成した言語情報を作成する工程をさらに含む、ことを特徴とする請求項１９に記載の音声処理方法。
【請求項２１】
前記通信端末外部から前記通信端末に入力される音声処理用の言語情報は、前記通信端末が通信接続するサーバで作成され、前記サーバより前記通信端末に転送されたものである、ことを特徴とする請求項２０に記載の音声処理方法。
【請求項２２】
通信端末と、前記通信端末と通信接続するサーバとを備え、
前記通信端末は、認識及び／又は合成の音声処理を行う音声処理手段と、
前記通信端末に予め記憶されているプログラム及び／又はデータに基づき前記音声処理手段で用いられる言語情報を作成する手段と、
前記サーバからダウンロードされたプログラム及び／又はデータにより、前記通信端末に予め記憶されているプログラム及び／又はデータと、前記言語情報を用いた前記音声処理とを連携動作させる手段と、
を備えている、ことを特徴とする通信システム。
【請求項２３】
通信端末と、前記通信端末と通信接続するサーバと、
を備え、
前記通信端末が、
前記通信端末が予め記憶保持するプログラム及び／又はデータを記憶する第１の記憶部と、
音声認識と音声合成の少なくとも一方の音声処理を行う音声処理部と、
前記第１の記憶部に記憶されているプログラム及び／又はデータに従って、前記音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
前記サーバからプログラム及び／又はデータを取得する手段と、
前記サーバから取得した前記プログラム及び／又はデータを記憶する第２の記憶部と、
前記第２の記憶部に記憶されたプログラム及び／又はデータに基づいて、前記音声処理部と、前記第１の記憶部のプログラム及び／又はデータを連携制御する制御手段と、
を含み、
前記サーバが、
前記通信端末から送信される情報を受信し、前記サーバで生成されたプログラム及び／又はデータを前記通信端末に送信する手段と、
前記通信端末から送信されたデータを基に前記サーバ側に格納されているデータより、音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
を含む、ことを特徴とする通信システム。
【請求項２４】
通信端末で予め記憶保持するプログラム及び／又はデータを記憶する第１の記憶部と、
音声認識と音声合成の少なくとも一方の音声処理を行う音声処理部と、
前記第１の記憶部に記憶されているプログラム及び／又はデータに従って前記音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
通信端末外部からプログラム及び／又はデータを受信する手段と、
前記通信端末外部から受信したプログラム及び／又はデータを記憶する第２の記憶部と
前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理部と、前記第１の記憶部のプログラム及び／又はデータとを連携させる制御手段と、
を含む、ことを特徴とする通信端末。
【請求項２５】
請求項２４に記載の通信端末に通信接続されるサーバが、
前記通信端末から送信された情報を受信し、サーバで生成したプログラム及び／又はデータを前記通信端末に送信する手段と、
前記通信端末から送信されたデータを基に、前記サーバ側に格納されているデータより、音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
を含む、ことを特徴とするサーバ。
【請求項２６】
請求項２４に記載の通信端末において、
前記第１の記憶部には、少なくとも前記通信端末の状態が記憶されており、
前記音声処理言語情報作成手段は、前記通信端末の状態に応じて可変するデータを基に、前記言語情報を作成する、ことを特徴とする通信端末。
【請求項２７】
請求項２５に記載のサーバにおいて、
前記音声処理言語情報作成手段が、前記通信端末の前記第１の記憶部に記憶されている前記通信端末の状態に応じて可変するデータを、前記通信端末より受信し、受信したデータと、前記サーバ側で記憶管理しているデータとを基に、言語情報を作成し、作成した言語情報を、前記通信端末に送信する、ことを特徴とするサーバ。
【請求項２８】
通信端末が、通信端末の外部より前記通信端末に送信されたプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータとに基づき、音声処理で用いられる言語情報を生成する工程と、
前記通信端末が、前記音声処理用の言語情報を用いて、前記通信端末に予め記憶されているプログラム及び／又はデータと、音声処理とを連携動作させる処理を実行する工程と、
を含む、ことを特徴とする音声処理方法。
【請求項２９】
通信端末を構成するコンピュータに、
前記通信端末に予め記憶されているプログラム及び／又はデータを記憶する処理と、
前記通信端末の外部で生成されたプログラム及び／又はデータを受信する処理と、
前記受信したプログラム及び／又はデータを記憶する処理と、
音声認識と音声合成の少なくとも一方を実行する処理と、
前記通信端末に予め記憶されているプログラム及び／又はデータに基づいて音声処理を行うための音声処理用の言語情報を生成する処理と、
前記受信したプログラム及び／又はデータにより、前記通信端末に予め記憶されているプログラム及び／又はデータと、音声処理とを連携させる処理と、
を実行させるためのプログラム。
【請求項３０】
通信端末と、サーバとを有し、
前記通信端末が、
前記通信端末に予め記憶保持されるプログラム及び／又はデータを記憶する第１の記憶部と、
音声認識と音声合成の少なくとも一方の音声処理を行う音声処理部と、
前記サーバからプログラム及び／又はデータを取得する手段と、
前記サーバから取得したプログラム及び／又はデータを記憶する第２の記憶部と、
前記第１の記憶部と前記第２の記憶部に記憶されているプログラム及び／又はデータに従って、前記音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理部と、前記第１の記憶部のプログラム及び／又はデータを、連携させる制御手段と、
を含み、
前記サーバが
前記通信端末側からの情報を受信し、前記サーバが生成したプログラム及び／又はデータを通信端末側に送信する手段と、
前記通信端末から送信されたデータを基に、サーバ側に格納されているデータより音声処理用の辞書を作成する音声処理言語情報作成手段と、
を含む、ことを特徴とする通信システム。
【請求項３１】
前記通信端末に予め記憶保持されるプログラム及び／又はデータを記憶する第１の記憶部と、
音声認識と音声合成の少なくとも一方の音声処理を行う音声処理部と、
通信端末外部からプログラム及び／又はデータを取得する手段と、
前記通信端末外部から取得したプログラム及び／又はデータを記憶する第２の記憶部と、
前記第１の記憶部と前記第２の記憶部に記憶されているプログラム及び／又はデータに従って、前記音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理部と、前記第１の記憶部に記憶されているプログラム及び／又はデータと、を連携させる制御手段と、
を含む、ことを特徴とする通信端末。
【請求項３２】
請求項２９に記載の通信端末から送信された情報を受信し、サーバ側で生成したプログラム及び／又はデータを、前記通信端末に送信する手段と、
前記通信端末から送信されたデータと、前記サーバ側に格納されているデータとから、前記音声処理部で用いられる辞書を作成する音声処理言語情報作成手段と、
を含む、ことを特徴とするサーバ。
【請求項３３】
前記通信端末が、通信端末外部よりダウンロードされたプログラム及び／又はデータを取得する工程と、
前記通信端末が、前記ダウンロードされたプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータとに基づいて、音声処理で用いられる音声処理用の言語情報を生成する工程と、
前記通信端末が、前記音声処理用の言語情報を用いて、前記通信端末に予め記憶されているプログラムと、前記通信端末外部よりダウンロードしたプログラム及び／又はデータと、前記音声処理とを連携動作させる工程と、
を含む、ことを特徴とする音声処理方法。
【請求項３４】
通信端末を構成するコンピュータに、
通信端末外部よりプログラム及び／又はデータを取得する処理と、
前記取得したプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータと、に基づいて、音声処理で用いられる音声処理用の言語情報を生成する処理と、
音声認識と音声合成の少なくとも一方を実行する処理と、
前記音声処理用の言語情報を用いて、前記通信端末に予め記憶されているプログラムと、前記通信端末外部よりダウンロードしたプログラム及び／又はデータと、前記音声処理とを連携動作させる処理と、
を実行させるためのプログラム。
【請求項３５】
通信端末と、１つ又は複数のサーバを含み、
前記サーバは、前記通信端末から送信される情報を受信し、前記サーバ側で生成したプログラム及び／又はデータを通信端末に送信する手段と、
前記通信端末から送信されたデータと、前記サーバ側に格納されているデータとから音声処理用の辞書を作成する音声処理言語情報作成手段と、
を含み、
前記通信端末は、
前記通信端末に予め記憶保持されるプログラム及び／又はデータを記憶する第１の記憶部と、
音声認識と音声合成の少なくとも一方の音声処理を行う音声処理部と、
前記サーバからプログラム及び／又はデータを取得する手段と、
前記サーバから取得したプログラム及び／又はデータを記憶する第２の記憶部と、
前記第１の記憶部と前記第２の記憶部の双方に記憶されているプログラム及び／又はデータに従って、前記音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
前記第２の記憶部に記憶されているプログラム及び／又はデータを用いて、前記音声処理部と、前記第１の記憶部に記憶されているプログラム及び／又はデータを連携させる制御手段と、
前記音声処理言語情報作成手段で作成した音声処理用の言語情報と、前記サーバの前記音声処理言語情報作成手段で作成した音声処理用の言語情報とを合成する音声処理用の言語情報統合手段と、
を含む、ことを特徴とする通信システム。
【請求項３６】
サーバ側で生成したプログラム及び／又はデータを通信端末に送信する送受信手段と、前記通信端末から送信されたデータとサーバ側に格納されているデータとから音声処理用の辞書を作成する音声処理言語情報作成手段と、を含むサーバと通信接続される通信端末が、
前記通信端末に予め記憶保持されるプログラム及び／又はデータを記憶する第１の記憶部と、
音声認識と音声合成の少なくとも一方の処理を行う音声処理部と、
前記サーバからプログラム及び／又はデータを取得する手段と、
前記サーバから取得したプログラム及び／又はデータを記憶する第２の記憶部と、
前記第１の記憶部と前記第２の記憶部の双方が記憶されているプログラム及び／又はデータに従って音声処理部で用いられる言語情報を作成する音声処理言語情報作成手段と、
前記取得したプログラム及び／又はデータを用いて、前記音声処理部と前記第１の記憶部のプログラム及び／又はデータを連携させる制御手段と、
前記音声処理言語情報作成手段で作成した音声処理用の言語情報と、前記サーバの音声処理言語情報作成手段で作成した音声処理用の言語情報とを合成する音声処理用の言語情報統合手段と、
を含む、ことを特徴とする通信端末。
【請求項３７】
通信端末が、１つ又は複数のサーバよりダウンロードされたプログラム及び／又はデータと、前記通信端末に予め記憶されているプログラム及び／又はデータより、通信端末内及び／又は複数のサーバの少なくとも１つで生成された音声処理用の言語情報を統合する工程と、
前記通信端末が、前記音声処理用の言語情報を用いて、前記通信端末に予め記憶されているプログラム及び／又はデータと、サーバよりダウンロードしたプログラム及び／又はデータと、前記音声処理とを連携動作させる工程と、
を含む、ことを特徴とする音声処理方法。
【請求項３８】
通信端末を構成するコンピュータに、
前記通信端末に予め記憶保持されるプログラム及び／又はデータを第１の記憶部に記憶する処理と、
通信端末外部の１つ又は複数のサーバより、プログラム及び／又はデータを受信する処理と、
前記受信したプログラム及び／又はデータを第２の記憶部に記憶する処理と、
音声認識と音声合成の少なくとも１方を行う処理と、
前記第２の記憶部に記憶されているプログラム及び／又はデータと、前記第１の記憶部に予め記憶されているプログラム及び／又はデータとに基づいて、音声処理を行うための音声処理用の言語情報を通信端末内で生成する処理と、
前記通信端末内で又は前記サーバで生成された音声処理用の言語情報を統合するための処理と、
前記第２の記憶部のプログラム及び／又はデータにより、前記第１の記憶部に予め記憶されているプログラム及び／又はデータと、音声処理とを連携させる処理と、
を実行させるためのプログラム。
【請求項３９】
予め定められた所定の処理を行う第１の処理部と、
通信端末上で実行され、予め定められた機能を実現するためのプログラム及び／又はデータを少なくとも記憶する第１の記憶部と、
前記通信端末外部から前記通信端末に入力され、前記第１の記憶部に記憶されている前記プログラム及び／又はデータと、前記第１の処理部による前記処理との連携の仕方を規定するプログラム及び／又はデータを少なくとも記憶する第２の記憶部と、
前記第２の記憶部に記憶されているプログラム及び／又はデータを用い、さらに、前記第１の記憶部に記憶されている前記プログラム及び／又はデータを用いて、前記第１の記憶部に記憶されている前記プログラム及び／又はデータによる前記機能と、前記第１の処理部による前記処理とを、互いに連携動作させる制御を行う制御部と、
を備えている、ことを特徴とする通信端末。
【請求項４０】
前記第１の処理部が、音声認識及び／又は音声合成処理を行う、ことを特徴とする請求項３９に記載の通信端末。
【請求項４１】
請求項３９又は４０に記載の通信端末と通信接続し、前記通信端末の前記第２の記憶部に記憶される前記プログラム及び／又はデータを前記通信端末に対して転送するサーバ装置。
【請求項４２】
予め定められた所定の処理を行う第１の処理部と、
電子装置上で予め定められた機能を実現するためのプログラム及び／又はデータを少なくとも記憶する第１の記憶部と、
前記電子装置外部から、前記電子装置に入力され、前記第１の記憶部に記憶されている前記プログラム及び／又はデータと、前記第１の処理部による前記処理との連携の仕方を規定するプログラム及び／又はデータを少なくとも記憶する第２の記憶部と、
前記第２の記憶部に記憶されているプログラム及び／又はデータを用い、さらに、前記第１の記憶部に記憶されている前記プログラム及び／又はデータを用いて、前記第１の記憶部に記憶されている前記プログラム及び／又はデータによる前記機能と、前記第１の処理部による前記処理とを、互いに連携動作させる制御を行う制御部と、
を備えている、ことを特徴とする電子装置。
【請求項４３】
前記第１の処理部が、音声認識及び／又は音声合成処理を行う、ことを特徴とする請求項４２に記載の電子装置。

【図１】