説明

携帯端末通信システム、及び携帯端末

【課題】 ユーザが携帯端末の表示画面を見ることなくボタン操作を行えるようにすること。
【解決手段】 ユーザがフォーカス移動ボタンB2を操作すると、ボタンコントローラ8からの指令により表示制御部9のフォーカス移動手段11が画像表示部10の画面におけるフォーカスを移動させ、フォーカステキスト取得手段12がテキスト情報を取得する。音声合成コントローラ17は音声波形データ取得指令をブラウザ14に出力する。ブラウザ14は、この指令内容についてのハイパーテキストをデータ送受信部13を介して音声合成サーバ7の音声合成装置6に送信する。音声合成装置6が作成した音声波形データは、データ送受信部13を介して音声合成コントローラ17に送られ、コントローラ17はこれを用いてスピーカ部19に音声出力させる。

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電話機能を有する携帯端末を用いてデータの送受信を行う携帯端末通信システム、及びその携帯端末に関するものである。
【0002】
【従来の技術】近年のコンピュータ技術の発展に伴い、携帯型パソコンやPDA(Personal Digital Assistants)などの携帯端末が広汎に普及しているが、とりわけ、最近はインターネットにアクセスすることが可能なタイプの携帯電話機が著しく普及している。
【0003】このような携帯電話機を用いてインターネット上のあるホームページからある情報を得ようとする場合、ユーザは、表示画面を見ながら矢印キー、テンキー等の操作ボタンを操作する必要がある。例えば、ある表示画面に複数のアンカーポイント(通常、アンダーラインが付されている。)が表示されている場合、ユーザが矢印キー又はテンキーにより、ある一つのアンカーポイントを指定すると、その指定された文字の周囲が青色又は黒色のブロックに囲まれ、その文字が反転表示されるようになる(このように、ある指定された範囲が青色又は黒色のブロックに囲まれて文字が反転表示された状態を、本明細書では、その文字にフォーカスが当てられた状態と表現する。)。そして、この状態でユーザが選択キー又は決定キーを押してそのアンカーポイントを選択すると、そのリンク先のファイルが開かれ、ユーザが得ようとする情報が画面上に表示されるようになる。
【0004】
【発明が解決しようとする課題】上記のように、ユーザは表示画面を注視しながらボタンを操作する必要があるが、目的とする情報を得るまでに何段階にもわたって多数のアンカーポイントが設定されているような場合、ユーザはその都度表示画面を注視しながら上記のボタン操作を何度も行わなければならない。
【0005】ところで、携帯電話機はその利便性故に、最近では各種の現場作業に従事する人々が多く利用するようになってきている。しかし、これらの人々が現場作業を行う場合、監視対象から目を離せない状況が多く発生することがあり、その都度上記のように、表示画面を注視しながらボタン操作を行っていたのでは、本来の業務に支障を来す虞がある。
【0006】また、一般のユーザが、テレビあるいは現地でスポーツ観戦している間に携帯電話機により目的とする情報を得ようとする場合、決定的瞬間となりそうな場面から目を離したくないことがあるが、このような場合、ユーザはスポーツ観戦又は携帯電話機操作のいずれを取るか二者択一を迫られることになる。
【0007】本発明は上記事情に鑑みてなされたものであり、ユーザが表示画面を見ることなくボタン操作を行うことが可能な携帯端末通信システム、及び携帯端末を提供することを目的としている。
【0008】
【課題を解決するための手段】上記課題を解決するための手段として請求項1記載の発明は、電話機能を有する一の携帯端末と他の携帯端末、又はこれら携帯端末とサーバとが、通信回線を介してデータの送受信を行うことが可能な携帯端末通信システムにおいて、前記携帯端末は、所定の機能が割り当てられた複数のボタンからの各操作信号に基づき、指令信号を出力するボタンコントローラと、前記ボタンコントローラからのフォーカス移動指令の入力に基づいて、画面に表示されているテキストに順次フォーカスを当てていくフォーカス移動手段と、前記フォーカス移動手段によりフォーカスが当てられたテキストについてのデータを取得するフォーカステキスト取得手段と、前記フォーカステキスト取得手段が取得したテキストを、音声合成装置に出力すると共に、この音声合成装置が作成した音声波形データに基づき、このテキストをスピーカ部から音声出力させる音声合成コントローラと、を有するものであり、前記音声合成装置は、前記サーバ又は前記携帯端末のいずれかに設けられているものである、ことを特徴とする。
【0009】請求項2記載の発明は、請求項1記載の発明において、前記音声合成コントローラは、前記フォーカステキスト取得手段が取得したテキスト中にアンカー情報が含まれている場合に、このアンカー情報部分を他のテキスト部分とは異なる音質で前記スピーカ部から音声出力させるものである、ことを特徴とする。
【0010】請求項3記載の発明は、請求項1又は2記載の発明において、前記音声合成コントローラは、あるテキストを前記スピーカ部から音声出力させている間に、前記フォーカス移動手段がフォーカス移動動作を行った場合は、そのテキストの音声出力を直ちに中断させ、その後に前記フォーカステキスト取得手段が取得した新たなテキストを前記スピーカ部から音声出力させるものである、ことを特徴とする。
【0011】請求項4記載の発明は、電話機能を有する携帯端末において、所定の機能が割り当てられた複数のボタンからの各操作信号に基づき、指令信号を出力するボタンコントローラと、前記ボタンコントローラからのフォーカス移動指令の入力に基づいて、画面に表示されているテキストに順次フォーカスを当てていくフォーカス移動手段と、前記フォーカス移動手段によりフォーカスが当てられたテキストについてのデータを取得するフォーカステキスト取得手段と、前記フォーカステキスト取得手段が取得したテキストに応じた音声波形データを作成する音声合成装置と、この音声波形データに基づき、前記テキストをスピーカ部から音声出力させる音声合成コントローラと、を設けたものである、ことを特徴とする。
【0012】請求項5記載の発明は、電話機能を有する携帯端末において、所定の機能が割り当てられた複数のボタンからの各操作信号に基づき、指令信号を出力するボタンコントローラと、前記ボタンコントローラからのフォーカス移動指令の入力に基づいて、画面に表示されているテキストに順次フォーカスを当てていくフォーカス移動手段と、前記フォーカス移動手段によりフォーカスが当てられたテキストについてのデータを取得するフォーカステキスト取得手段と、前記フォーカステキスト取得手段が取得したテキストを、外部の音声合成装置に出力すると共に、この音声合成装置が前記テキストに応じて作成した音声波形データを受け取り、この音声波形データに基づき前記テキストをスピーカ部から音声出力させる音声合成コントローラと、を設けたものである、ことを特徴とする。
【0013】
【発明の実施の形態】図1は、本発明の実施形態の構成を示すブロック図である。この図において、携帯端末1A,1Bは基地局2A,2Bと無線による通信が可能になっており、この基地局2A,2Bは通信回線3を介してインターネット4に接続されている。そして、インターネット4には、Webサーバ5、及び音声合成装置6を有する音声合成サーバ7が通信回線3を介して接続されている。なお、携帯端末1A,1Bは同一構成のものであるため、1Aのみにつき詳細な構成を示してある。
【0014】携帯端末1Aには、モード選択ボタンB1、フォーカス移動ボタンB2、再再生ボタンB3、及び図示を省略してあるその他の操作ボタンが設けられている。モード選択ボタンB1は、「音声合成モード」と「非音声合成モード」とのいずれかを選択するためのボタンである。フォーカス移動ボタンB2は、モード選択ボタンB1により「音声合成モード」が選択されている場合に、表示画面上のテキストに対してフォーカスが当てられる範囲を移動させるためのボタンである。再再生ボタンB3は、表示画面上のテキストが音声出力され、その音声データが記憶された場合に、再度その音声出力を行わせるためのボタンである。なお、通常、留守番電話機能により録音された音声データを再生する場合に用いられるボタンが「再生ボタン」と呼ばれているので、この再生ボタンと区別するために「再再生ボタン」と称している。
【0015】ボタンコントローラ8は、これらの操作ボタンからの操作信号に基づき指令信号を表示制御部9又は音声合成コントローラ17に出力するようになっている。表示制御部9は、画像表示部10に対する制御を行うものであり、フォーカス移動手段11を有している。フォーカス移動手段11は、フォーカス移動ボタンB2が押された場合のボタンコントローラ8からのフォーカス移動指令に基づき、表示画面上のテキストに対してフォーカスが当てられる範囲を移動させる制御を行うものである。フォーカステキスト取得手段12は、このフォーカス移動手段11からの情報に基づきフォーカスが当てられたテキストを取得し、そのテキストデータを音声合成コントローラ17に出力するようになっている。
【0016】データ送受信部13は、基地局2Aとの間で無線によりデータの送受信を行うものである。そして、基地局2A及びインターネット4を介してWebサーバ5及び音声合成サーバ7から受け取ったデータをブラウザ14又は音声合成コントローラ17に出力するようになっており、一方、ブラウザ14から入力したハイパーテキストを基地局2A及びインターネット4を介してWebサーバ5及び音声合成サーバ7に送出するようになっている。
【0017】ブラウザ14は、HTML入出力手段15及びHTML解析手段16を有している。HTML入出力手段15は、データ送受信部13を介して送られてくる、Webサーバ5又は音声合成サーバ7からのハイパーテキストを入力し、あるいは表示制御部9又は音声合成コントローラ17からのハイパーテキストをデータ送受信部13を介してWebサーバ5又は音声合成サーバ7に送出するものである。そして、HTML解析手段16は、HTML入出力手段15から入力したハイパーテキストの内容を解析し、表示制御部9に出力するようになっている。表示制御部9では、このHTML解析手段16の解析に基づき表示画面の整形を行うようになっている。
【0018】音声合成コントローラ17は、音声合成のための各制御を司るものであり、データ送受信部13を介して音声合成サーバ7の音声合成装置6から送られてくる音声波形データを用いて、あるいは音声合成メモリ(キャッシュメモリ)18に記憶されている音声波形データを用いてスピーカ部19に音声出力を行わせるものである。
【0019】音声合成サーバ7の音声合成装置6の構成についての図示、及び詳細な説明は省略するが、この音声合成装置6は、音声合成に用いる音素列についての波形データ及びその特徴データが格納されている音声データベースと、音声合成用のテキスト情報を入力し、このテキスト情報を分解して音声データベースに格納されている音素列と等しい音素記号の音素列を順次出力する音素列出力部と、音素列出力部からの音素列に対応する候補音素列を音声データベースから抽出し、この抽出した候補音素列のうちから最適の音素列の波形データを選択する音素列波形選択部と、音素列波形選択部で選択された各音素列の波形データを接続する波形データ接続部と、を備えており、波形データ接続部から接続波形データを携帯端末1A側に送出するものである。このような音声合成装置6の詳細な構成は、例えば、特願平2000−311473号において呈示されている。
【0020】次に、上記のように構成される本実施形態の動作につき説明する。ユーザは、まず、モード選択ボタンB1を「音声合成モード」に選択し、次いで、インターネット4上に開設されている所定のホームページにアクセスすべく、図示を省略してあるB1〜B3以外の所定のボタンを操作してその操作信号をボタンコントローラ8に入力させる。すると、このボタンコントローラ8からのアクセス指令が表示制御部9を介してブラウザ14に入力され、ブラウザ14が起動する。そして、HTML入出力手段15から所定のURL信号がデータ送受信部13及び基地局2Aを介して送信され、更にインターネット4を介してWebサーバ5への接続が行われる。次いで、Webサーバ5からのハイパーテキスト情報がデータ送受信部13を介してブラウザ14のHTML入出力手段15に入力され、HTML解析手段16がこのハイパーテキスト情報の内容を解析する。表示制御部9は、このHTML解析手段16の解析情報に基づいて画像表示部10に所定の画面を表示させる。
【0021】例えば、HTML入出力手段15が入力したハイパーテキスト情報が、<a href=゛http://www.victor.co.jp/゛ ACCESSKEY=1>日本ビクター</a> というものであったとすると、画像表示部10の画面には「日本ビクター」という文字がアンダーラインを付されて表示される。ここで、<a…>及び</a>はアンカータグと呼ばれるものであり、<a…>は開始タグ、</a>は終了タグと呼ばれるものである。そして、この開始タグと終了タグとの間に挟まれた部分が「アンカーポイント」であり、リンク先の名称を表している。また、開始タグ<a…>の…部分は、このリンク先のアクセス情報を示すものであり、上記の例では、1番のアクセスキーを押せば日本ビクター株式会社のホームページにアクセスできることを意味している。
【0022】図2は、このようなアンカーポイントについての画面表示例を示した説明図であり、「日本ビクター」及びA〜Dの会社の名称が、アクセスキーの番号、及びアンカーポイントであることを表すアンダーラインと共に表示されている。そして、図2の状態では「日本ビクター」の文字部分にフォーカスが当てられている。すなわち、表示制御部9は、HTML解析手段16の解析に基づき、図2に示す画面表示を画像表示部10に行わせ、フォーカス移動手段11は、アクセスキーの順番が最初である1番の文字部分「日本ビクター」にフォーカスを当てる。フォーカステキスト取得手段12は、フォーカス移動手段11からの情報により、現在フォーカスが当てられているテキストの内容を読み取り、そのテキスト情報を音声合成コントローラ17に出力する。
【0023】音声合成コントローラ17は、フォーカステキスト取得手段12からテキスト情報を受け取ると、このテキスト情報についての音声波形データ取得指令をブラウザ14に出力する。ブラウザ14のHTML解析手段16は、この音声波形データ取得についてのハイパーテキストを作成し、HTML解析手段16はこの作成したハイパーテキストをデータ送受信部13に出力する。データ送受信部13は、このハイパーテキストを無線により基地局2Aに送信し、送信されたハイパーテキストはインターネット4を介して音声合成サーバ7の音声合成装置6に送られる。
【0024】音声合成装置6は、入力したハイパーテキスト指示に基づきフォーカステキストの音声波形データを作成し、これをインターネット4、基地局2A、データ送受信部13を介して音声合成コントローラ17に出力する。音声合成コントローラ17は、この音声波形データに基づきスピーカ部19に「日本ビクター」という言葉を音声出力させる。このとき、音声合成コントローラ17は、この音声出力した内容を音声合成メモリ18に記憶させるようにする。そして、ユーザは、周囲の騒音等によりこのときの音声出力の内容がよく聞き取れなかったような場合に、再再生ボタンB3を押すようにする。すると、ボタンコントローラ8は再再生指令を音声合成コントローラ17に出力し、音声合成コントローラ17は記憶させておいた音声波形データを音声合成メモリ18から取り出し、スピーカ部19に再度同じ音声出力を行わせるようにする。
【0025】次いで、ユーザは、フォーカス移動ボタンB2としての下側矢印キーあるいはテンキーのうちの2番キーを操作し、フォーカスを「A株式会社」に当てるようにする。すると、上記と同様の過程を経て、スピーカ部19から「A株式会社」という言葉が音声出力される。以下、同様にして、ユーザはフォーカス移動ボタンB2を操作することにより、順次、「株式会社B」、「C株式会社」、及び「株式会社D」という言葉をスピーカ部19に音声出力させることができる。このとき、ユーザのボタン操作のスピードが速く、例えば、スピーカ部19が「A株式会社」を途中までしか音声出力していないうちに、次の「株式会社B」にフォーカスが当てられた場合、音声合成コントローラ17は直ちにスピーカ部19に「A株式会社」の音声出力を中断させ、次の「株式会社B」の音声出力をスピーカ部19に行わせるようにする。そして、この場合、音声合成コントローラ17は、スピーカ部19がフェイドアウトしながら「A株式会社」の音声出力を中断するように制御を行う。これにより、ユーザにとって違和感のない自然な音声出力の中断、及び次の新たな音声出力を実現することができる。
【0026】上記のように、図1の携帯端末1Aは、ユーザがボタン操作により移動させたフォーカス部分のテキストを直ちに音声出力できる構成となっている。ビギナーを除く多くのユーザは、各ボタンの位置については目視しなくても認識でき、所謂ブラインドタッチを行えるのが通常である。したがって、ユーザは、この携帯端末1Aを耳に当てた状態でボタン操作することにより、最終的に取得しようとする目的の情報を画面に表示させることができる。すなわち、現場作業に従事する人は監視対象から目を離すことなく、また、テレビあるいは現地でスポーツ観戦している一般のユーザは決定的瞬間を見逃すことなく、携帯端末1Aのボタン操作を行なうことにより目的の情報を得ることができるようになる。
【0027】ところで、上述した実施形態では、インターネット上のリンク先を示すアンカーポイントについてスピーカ部19が音声出力する例につき説明したが、本発明では、アンカーポイントだけでなく、これ以外の通常のテキスト部分についても音声出力させることが可能である。図3は、このような場合のテキストについての画面表示例を示す説明図である。すなわち、図3において、画面には「当地は今がちょうど紅葉の季節です。ホテルZ館は皆様の御来館を心よりお待ちしています。」というテキストが表示されると共に、「ホテルZ館」の文字の下にアンダーラインが付され、更に「ホテルZ館は」の範囲にフォーカスが当てられている。
【0028】このような画面が表示された状態で、ユーザがフォーカス移動ボタンB2(例えば、上下の矢印キー)を操作すると、まず最初に、「当地は今がちょうど紅葉の季節です。」の部分にフォーカスが当てられ、このテキスト部分が女性の声で音声出力される。次いで、ユーザがフォーカス移動ボタンB2を操作すると、「ホテルZ館は」の部分にフォーカスが当てられ、このテキスト部分は男性の声で音声出力される。そして、更にユーザがフォーカス移動ボタンB2を操作すると、「皆様の御来館を心よりお待ちしています。」の部分が女性の声で音声出力される。この場合、ユーザは、携帯端末1Aの受話部分を耳に当てて各音声出力を聞きながらボタン操作を行い、「ホテルZ館は」が男性の声で音声出力された時点で「決定ボタン」を押すことにより、このホテルZ館についてのホームページに対してアクセスを行うことができる。
【0029】なお、フォーカスが当たる範囲についての長さは、所定の基準に従って決まるようになっている。例えば、フォーカスを当てる最大の文字数をN1文字とし、N1文字以上のテキストについては、N1文字目に達する直前の句点又は読点を最終地点としてフォーカスを当てるようにする。また、フォーカスを当てる最小の文字数をN2文字とし(N2<N1)、N2文字以下のテキストについては、N2文字目を超えた直後の句点又は読点を最終地点としてフォーカスを当てるようにする。これにより、長すぎる文章、あるいは短すぎる文章についても適切な長さのフレーズに対してフォーカスを当てることができ、音声合成装置6に対する負担を軽減できると共に自然な音声合成を行うことができる。但し、アンカーポイントに対しては、この基準を適用せず、アンカーポイントのみでフレーズを区切り(尤も、アンカーポイントのみで区切るとその後のフレーズが不自然になるような場合は、不自然にならないようにアンカーポイントの後に適当な数の文字を付加することが許容されるものとする。)、フォーカスを当てるようにする。
【0030】このように、アンカーポイントに限ることなく、全てのテキスト情報を音声出力することにより、ユーザは表示画面を見ることなく、ホームページの内容やメールの内容を理解することができるようになる。したがって、携帯端末1Aの利便性をより一層高めることができる。
【0031】なお、上記の例では、アンカーポイントを男性の声で音声出力し、他のテキスト部分を女性の声で音声出力するようにして両者を聴覚的に識別できるようにしているが、これのみに限られるわけではなく、低音及び高音の音声などの聴覚的に識別可能な異なる音質の音声出力であればよく、種々の音声を使い分けることができる。
【0032】また、図2の画面表示例は、アンカーポイントのみのメニュー画面を示したものであるが、アンカーポイントが含まれないその他のメニュー画面においても、その表示項目について音声出力させるようにすることができる。
【0033】さらに、図1の構成では、音声合成装置6を音声合成サーバ7内に設けた構成としてあるが、この音声合成装置6は携帯端末1A内に配設する構成とすることも可能である。
【0034】
【発明の効果】以上のように、本発明によれば、ユーザは携帯端末の表示画面を見ることなくボタン操作を行うことができる。したがって、現場作業に従事する人は監視対象から目を離すことなく、また、テレビあるいは現地でスポーツ観戦している一般のユーザは決定的瞬間を見逃すことなく、携帯端末のボタン操作を行なうことだけで目的の情報を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施形態の構成を示すブロック図。
【図2】図1における携帯端末1Aの画面表示例1を示す説明図。
【図3】図1における携帯端末1Aの画面表示例2を示す説明図。
【符号の説明】
1A,1B 携帯端末
2A,2B 基地局
3 通信回線
4 インターネット
5 Webサーバ
6 音声合成装置
7 音声合成サーバ
B1 モード選択ボタン
B2 フォーカス移動ボタン
B3 再再生ボタン
8 ボタンコントローラ
9 表示制御部
10 画像表示部
11 フォーカス移動手段
12 フォーカステキスト取得手段
13 データ送受信部
14 ブラウザ
15 HTML入出力手段
16 HTML解析手段
17 音声合成コントローラ
18 音声合成メモリ
19 スピーカ部

【特許請求の範囲】
【請求項1】電話機能を有する一の携帯端末と他の携帯端末、又はこれら携帯端末とサーバとが、通信回線を介してデータの送受信を行うことが可能な携帯端末通信システムにおいて、前記携帯端末は、所定の機能が割り当てられた複数のボタンからの各操作信号に基づき、指令信号を出力するボタンコントローラと、前記ボタンコントローラからのフォーカス移動指令の入力に基づいて、画面に表示されているテキストに順次フォーカスを当てていくフォーカス移動手段と、前記フォーカス移動手段によりフォーカスが当てられたテキストについてのデータを取得するフォーカステキスト取得手段と、前記フォーカステキスト取得手段が取得したテキストを、音声合成装置に出力すると共に、この音声合成装置が作成した音声波形データに基づき、このテキストをスピーカ部から音声出力させる音声合成コントローラと、を有するものであり、前記音声合成装置は、前記サーバ又は前記携帯端末のいずれかに設けられているものである、ことを特徴とする携帯端末通信システム。
【請求項2】前記音声合成コントローラは、前記フォーカステキスト取得手段が取得したテキスト中にアンカー情報が含まれている場合に、このアンカー情報部分を他のテキスト部分とは異なる音質で前記スピーカ部から音声出力させるものである、ことを特徴とする請求項1記載の携帯端末通信システム。
【請求項3】前記音声合成コントローラは、あるテキストを前記スピーカ部から音声出力させている間に、前記フォーカス移動手段がフォーカス移動動作を行った場合は、そのテキストの音声出力を直ちに中断させ、その後に前記フォーカステキスト取得手段が取得した新たなテキストを前記スピーカ部から音声出力させるものである、ことを特徴とする請求項1又は2記載の携帯端末通信システム。
【請求項4】電話機能を有する携帯端末において、所定の機能が割り当てられた複数のボタンからの各操作信号に基づき、指令信号を出力するボタンコントローラと、前記ボタンコントローラからのフォーカス移動指令の入力に基づいて、画面に表示されているテキストに順次フォーカスを当てていくフォーカス移動手段と、前記フォーカス移動手段によりフォーカスが当てられたテキストについてのデータを取得するフォーカステキスト取得手段と、前記フォーカステキスト取得手段が取得したテキストに応じた音声波形データを作成する音声合成装置と、この音声波形データに基づき、前記テキストをスピーカ部から音声出力させる音声合成コントローラと、を設けたものである、ことを特徴とする携帯端末。
【請求項5】電話機能を有する携帯端末において、所定の機能が割り当てられた複数のボタンからの各操作信号に基づき、指令信号を出力するボタンコントローラと、前記ボタンコントローラからのフォーカス移動指令の入力に基づいて、画面に表示されているテキストに順次フォーカスを当てていくフォーカス移動手段と、前記フォーカス移動手段によりフォーカスが当てられたテキストについてのデータを取得するフォーカステキスト取得手段と、前記フォーカステキスト取得手段が取得したテキストを、外部の音声合成装置に出力すると共に、この音声合成装置が前記テキストに応じて作成した音声波形データを受け取り、この音声波形データに基づき前記テキストをスピーカ部から音声出力させる音声合成コントローラと、を設けたものである、ことを特徴とする携帯端末。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【公開番号】特開2002−158803(P2002−158803A)
【公開日】平成14年5月31日(2002.5.31)
【国際特許分類】
【出願番号】特願2000−350513(P2000−350513)
【出願日】平成12年11月17日(2000.11.17)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】