説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

871 - 880 / 925


【課題】 音声情報を種々のユーザが興味を持つようにして聞かせる。
【解決手段】 音声出力装置100は、近傍に位置する物体の属性に関する情報を含む物体の説明情報を取得する物体情報取得部102と、属性に関する情報に基づき物体を擬人化して所定の類型の人間に設定した場合に、当該類型の人間が話すことが想定される言葉で、物体の説明情報を音声出力する音声出力部110と、を含む。 (もっと読む)


【課題】 楽曲を再生し、再生する楽曲の紹介音声を出力する楽曲再生装置が、従来よりも多様な楽曲紹介を行えるようにすることを目的とする。
【解決手段】 楽曲再生機能を有するカーナビゲーション装置が、再生する楽曲が切り替わる毎に(ステップ210)、楽曲の再生順序の形式を特定し(ステップ220)、さらにタイトルの長さ、副題の有無、バージョンの有無、アーティスト名、発売日、トラック番号、録音日、過去の再生回数等の、これから再生する楽曲の情報を特定し(ステップ230)、さらに現在の自車両の走行環境を特定する(ステップ240)。そして、このような特定した情報に基づいて、楽曲紹介用の定型句を選択し(ステップ250)、選出した定型句を用いて、再生する楽曲の紹介音声を出力する(ステップ260、270)。 (もっと読む)


【課題】 画像形成装置を利用するユーザがより短時間で音声ガイドによる情報提供を受けられることを可能にする。
【解決手段】 複数の音声応答方法、音声応答方法を設定できる手段及び設定を変更できる手段を備える。 (もっと読む)


単語から構成されたテキストからのテキストデータ(Ti)に対応する、メモリ手段(19)に記憶された音声データ(Ai)の再生であって、音声データ(Ai)の順方向モードおよび逆方向モードでの再生を制御することのできる再生の間に、音声データ(Ai)中の特定の一時点の再生位置から開始して、ターゲット位置へ向かって、少なくとも約2つの単語分の長さに相当する戻り距離(1A、2A、3A、6A)に亘り、順方向シーケンスと反対向きの逆方向ジャンプが、逆方向モードでの音声データ(Ai)の再生のために自動的に始動され、その後、その特定のターゲット位置から開始して、戻り距離の一部(1B、2B、3B、6B)のみについて、順方向シーケンスでの音声データ(Ai)の再生が行われる。
(もっと読む)


【課題】 録音されたメッセージや受け取った電子メールに対する返信のし忘れを防止する。
【解決手段】 情報処理装置は、通話の発信元からのメッセージを録音するメッセージ録音部(101)と、このメッセージ録音部(101)により録音されたメッセージを再生するメッセージ再生部(104)とを有し、さらに、メッセージ録音部(101)により録音されたメッセージに対する返信の要否をDTMF信号に基づき設定するためのDTMF解釈部(102)と、要返信に設定されたメッセージに対する返信がなされていない場合、そのメッセージをメッセージ再生部(104)に再生させる再生管理部(103)とを有する。 (もっと読む)


双方向マニュアルを提供するための方法及びシステムにおいて、ユーザからの音声を受け取り処理し、音声をワード・シーケンスへ変換し、ワード・シーケンスから意味構造を識別する音声エンジンと、デバイスの操作に関する情報を含む構造化マニュアルと、情報の視覚表示に関連する視覚モデルと、文脈において意味構造を解釈し、適切な情報、構造化マニュアルから視覚表示、及び視覚モデルを取り出す対話管理アレンジメントと、出力情報及び視覚表示を出力する出力アレンジメントと、を含む方法及びシステム。
(もっと読む)


【課題】テキストから音声を合成するテキスト音声合成技術おいて、最適素片選択型音声合成を、比較的計算パワーの小さい端末装置にて行えるようにする。
【解決手段】テキストから音声を合成するテキスト音声合成において、コンテンツ生成、出力に関して、素片選択処理の結果を二次コンテンツとして出力することで、負荷の高い素片選択処理と、負荷の軽い音声波形合成処理とに分離して処理可能とした。これにより、素片選択処理をサーバ側で実施し、使用素片情報を端末に送信し合成用のデータとする。 (もっと読む)


【課題】 個々のユーザの聴覚特性に合わせて聴感補正を行うことができるオーディオ再生装置を提供する。
【解決手段】 テストトーン発生回路4は、各々の周波数が異なり、時間経過に従って音量が変化する複数種類のテストトーン信号を順次出力する。制御回路3は、リモコン7が操作された時点における各テストトーン信号の音量を検出し、聴覚特性として記憶する。また、制御回路3は、この聴覚特性に基づき、聴感補正回路2により行われるダイナミックレンジ圧縮およびラウドネス補正のパラメータ設定を行う。 (もっと読む)


【課題】 入力音声から自然な出力音声を生成する。
【解決手段】 エンベロープ特定部23は、入力音声信号SinのスペクトルエンベロープEVinを示す入力エンベロープデータDEVinを生成する。テンプレート取得部33は、変換用音声の周波数スペクトルSPtを示す変換用スペクトルデータDSPtを記憶部51から読み出す。データ生成部3aは、入力エンベロープデータDEVinと変換用スペクトルデータDSPtとに基づいて、変換用音声の周波数スペクトルSPtに対応した形状の周波数スペクトルであってスペクトルエンベロープが入力音声のスペクトルエンベロープEVinと略一致する周波数スペクトルSPnewを特定し、この周波数スペクトルSPnewを示す新規スペクトルデータDSPnewを生成する。逆FFT部15および出力処理部16は、この新規スペクトルデータDSPnewに基づいて出力音声信号Snewを生成する。 (もっと読む)


【課題】 使用者が初心者である場合にはわかりやすい案内をし、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる案内をするための音声応答装置、音声応答方法および音声応答プログラムを提供する。
【解決手段】 応答装置のCPUは、音声による機器の操作案内を行う(ステップS1)。次に、CPUは、後戻り操作が必要であるか否かを判定する(ステップS2)。後戻り操作が必要でない場合には、CPUは、使用者による次の操作までのタイムラグが長いか否かを判定する(ステップS3)。使用者による次の操作までの時間が所定時間を超えていない場合、CPUは、音声のテキストの簡略化の段階を進める(ステップS4)。ステップS2において後戻り操作が必要な場合およびステップS3において次の操作までの時間が所定時間を超えている場合には、CPUは、音声のテキストの簡略化の段階を戻す(ステップS5)。 (もっと読む)


871 - 880 / 925