説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

11 - 20 / 925


【課題】音声出力される複数の情報からの迅速な情報抽出を支援するための音声制御装置、音声制御方法、およびプログラムを提供する。
【解決手段】周囲の位置と対応付けられている情報を取得する情報取得部と、前記情報取得部によって複数の情報が取得された場合、前記複数の情報が同時に出力されるように音声制御を行う音声制御部と、を備える音声制御装置。 (もっと読む)


【課題】利用者が求める任意の文章について任意に読み上げる操作を可能にしたことに合わせて、利用者の意向に沿った操作によって利用者に便利なようにして音声読み上げのできるように、スクロールコントロールを画面表示するようにした文章テキストを提供する。
【解決手段】スクロールコントロールに、任意の文章毎発音記号列付きテキストデータの音声データ読み上げ制御を行う制御項目が付加され、文章毎音声付きホームページテキストデータ生成手段が、前記文章毎音声付きホームページテキストデータに、音声データ読み上げ制御を行う制御項目を有したスクロールコントロールを添付して、利用者端末で文章毎音声の読み上げ制御を行うようにして利用者端末へ送信させる。 (もっと読む)


【課題】通信、特にアナログ通信においては通信の秘話性を高めるため、音声波形を様々な方法で変形させていた。しかしながら、変形は入力音声の波形のブロックを単に置換するレベルのものであったため、一部音声が聞き取れると、これを手がかりに元の入力音声の復元ができてしまう場合があった。
【解決手段】以上課題解決のため、本発明では入力音声の素片を暗号鍵により別の音声素片に置換することで伝送を行う。これにより、音声の一部を聞きとって復元することは不可能となり、通信の秘匿性が向上する。 (もっと読む)


【課題】音声合成処理の終了から音声認識処理の開始までの間に適切な時間間隔を設ける処理に対するホスト装置の負荷を低減する。
【解決手段】半導体集積回路が、音声認識部と、外部から入力された制御コマンドを記憶する第1の記憶部と、前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする。 (もっと読む)


【課題】広範なソーシャル・コミュニケーションを喚起する。
【解決手段】インターネットに接続可能なネットワーク端末に接続され、ユーザの頭部に装着可能なヘッドセットシステムから得られるユーザの主観的な視野等を反映した画像、及び音声信号を、ネットワーク端末経由で知識情報処理サーバシステムにアップロードし、画像に内包されているユーザが着目した特定物体等に対し、音声認識システムとの協調動作により、ユーザ自身の音声による着目対象の指定、選択等を、サーバシステム上で可能にし、ユーザによる一連の画像認識プロセス及び画像認識結果を、音声合成システムとの協調動作により、サーバシステム側がインターネットを介し、ユーザのネットワーク端末経由で、画像認識結果及びその認識プロセスをユーザのヘッドセットシステムに組込まれたイヤフォンに対し音声情報として通知し、ユーザのメッセージやつぶやきを広範なユーザ間で共有可能にする。 (もっと読む)


【課題】できるだけ不快な印象を与えることなく、音声によって不特定多数の人間に効果的に情報を与える。
【解決手段】対話を行う複数の話者の発話内容を表す複数の発話情報を含む単数又は複数の対話情報から特定の対話情報を抽出し、複数の話者に対応する複数の音声出力部で、特定の対話情報に含まれる発話情報が表す発話内容の音声を出力する。話者に対応する前記音声出力部は、それぞれ、音声出力部に対応する前記話者の発話内容の音声を出力する。 (もっと読む)


【課題】読み上げスタイルのカスタマイズの容易性と、文書データの読み上げに使用するシステム環境の柔軟性を確保し且つ読み上げの再現性を損なわないようにする。
【解決手段】実施形態によれば、文書取得部は、複数のテキストを含む文書データを取得し、メタデータ取得部は、ルールを適用すべきテキストに関する条件と該条件が適合するテキストに対する読み上げスタイルとを含む定義情報を複数含むメタデータを取得し、抽出部は、各々の定義情報を文書データに含まれるテキストに適用することで、文書データの特徴を抽出する。実行環境情報取得部は、読み上げを実行する実行環境情報を取得する。決定部は、文書データの特徴及び実行環境情報に基づいて、メタデータを文書データに適用して読み上げを実行する際に使用するパラメータの候補を決定する。ユーザ検証部は、パラメータの候補をユーザに提示し、選択又は確定を含む検証指示を受け付ける。 (もっと読む)


【課題】実装された状態遷移モデルの評価において、時間などの要件に対するコストバランスを考慮した評価が可能な音声処理装置を提供する。
【解決手段】音声処理装置が、音声認識部と、状態遷移モデルと、前記音声認識部の認識結果を用いて前記状態遷移モデルの状態遷移を制御する第1の制御部と、を含み、前記第1の制御部は、第1の実行モードと第2の実行モードとを有し、前記第1の実行モードは、前記状態遷移モデルにおける分岐ノードの実行が1回であり、前記第2の実行モードは、前記分岐ノードの実行がすべての分岐に対して行われることが可能であることを特徴とする。 (もっと読む)


【課題】一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることを目的とする。
【解決手段】電子辞書コンテンツの読み上げを行う情報処理装置であって、見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制手段と、見出し語と、発音記号と、音声合成用発音記号と、を辞書に登録する登録手段と、一時抑制手段で一時的に使用不可とされた単語を辞書で使用可能とする抑制解除手段と、を有することによって課題を解決する。 (もっと読む)


【課題】患者のコミュニケーション能力を回復すること。
【解決手段】軽度脳障害を持つ高齢者100が好むワードを好みワード情報として記録手段に記録しておくと共に、その高齢者100に親しい近親者300の音声を音声情報として蓄積手段に蓄積しておき、テレビ7から出力された音声情報を文字情報に変換して、その文字情報から抽出したワード情報が上記好みワード情報に合致する場合に、合致したワード情報の最後に高齢者100の発話を誘発する「だって」を付加して、そのワード情報のワードになるよう組成した近親者300の音声情報を音声として高齢者100に出力する。 (もっと読む)


11 - 20 / 925