説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

51 - 60 / 925


【課題】
正確な情報であるシステム応答文中の自立語と認識結果中の自立語を用いて共起を生成することで、システム応答文の生成に利用される共起の信頼度を向上させることである。
【解決手段】
実施形態の音声対話装置は、第1のシステム応答文に対するユーザの発声を認識する音声認識手段と、前記音声認識手段で得られた認識結果を形態素解析する形態素解析手段と、前記形態素解析手段で得られた前記認識結果中の自立語と前記第1のシステム応答文中の自立語の共起を生成する共起生成手段と、自立語の共起および当該共起の共起スコアを記憶した共起辞書と、前記共起辞書を用いて、前記共起生成手段で生成された共起に共起スコアを付与する共起スコア付与手段と、前記共起スコア付与手段で付与された共起スコアを利用して、第2のシステム応答文を生成する応答文生成手段とを備える。 (もっと読む)


【課題】実音声に基づいて、アバターの口唇を見る人に違和感なく動かせる口唇動作パラメータの生成装置を提供する。
【解決手段】生成装置は、発話者の音声から得られる音声信号をフレーム化し、各フレームから第1フォルマントF1及び第2フォルマントF1を抽出するフォルマント抽出部80と、F1及びF2について、話者による母音空間の相違を補償するようにフォルマント空間の原点を移動させる原点移動処理部84と、F1及びF2の線形写像により、F1を補正するよう、フォルマント空間を原点周りに回転させる回転処理部86と、各フレームに対し、回転処理部86が出力する補正後の第1フォルマントの値の関数として、発話者の音声と同期して口唇形状を上下方向に変化させるためのパラメータを生成して出力する形状推定部88を含む。 (もっと読む)


【課題】少ない消費電力量で情報を処理する。
【解決手段】ユーザ操作を受け付ける受け付手段と、テキストを音声に変換して読み上げるプレーヤ部404と、テキストにリンクされたリンク情報の所在を示すリンク先データに基づき、当該テキストのリンク情報を取得するブラウザ401と、取得されたリンク情報を含む情報を表示する表示手段と、表示手段を、情報を表示可能な通電状態と非通電状態とに切替える状態切替手段と、を備え、非通電状態におけるテキストの読み上げ中に、受け付手段が通電状態への遷移を指示するための遷移操作を受け付けると、ブラウザ401にリンク情報を取得させる。 (もっと読む)


【課題】録音音声を極力使用して音声案内することができ、また、合成音声を使用する場合であっても、高品質の音声案内を実行可能にする。
【解決手段】車載装置2において、分割された単語あるいは文節に対応する録音音声データが記憶手段に存在するか否かを検索し、録音音声データがない単語あるいは文節については、外部サーバ装置4に送信して、録音音声データがサーバ側記憶手段に存在するか否かを検索し、検索された録音音声データを車載装置2へ送信し、検索手段により検索した録音音声データと外部サーバ装置4から受信した録音音声データとを接続し、接続した音声データを音声出力するように構成した。 (もっと読む)


【課題】 コミュニケーションの感情を十分に表現でき、趣向的に富んだテキスト音声変換再生をすることができるテキスト音声変換装置を提供する。
【解決手段】 再生される音声データの抑揚再生条件を設定する再生条件設定部54と、与えられたテキストデータ30を前記再生条件設定部54によって決定された抑揚再生条件を具備する読み上げ用の音声データに変換する音声変換部55とを備えるテキスト音声変換装置である。再生条件設定部54は、互いに交差する第1及び第2方向に広がりを有する描画領域22に描画された画像情報を前記第1方向に細分したセグメントの画像情報に基づいて音階を決定して線状オブジェクトに変換し、音声変換部55は、前記線状オブジェクトに沿って割り付けられたテキストデータの文字に前記線状オブジェクトの第2の方向の位置に応じた抑揚再生条件を与える。 (もっと読む)


【課題】音声出力のタイミングが重なる場合であってもそれらの内容を確実に伝えることができる音声出力装置を提供すること。
【解決手段】音声情報に対応する音声を出力する音声出力部部36と、音声出力部36に対して、音声の出力タイミングを指示する出力タイミング指示部32と、音声情報の分割位置を設定する音声情報分割部34とを備えている。出力タイミング指示部32は、音声出力部36によって第1の音声情報に対応する第1の音声を出力中に、第2の音声情報に対応する第2の音声の出力開始タイミングが到来する場合に、この出力開始タイミングよりも前に到来する分割位置で第1の音声の出力を中断する指示を音声出力部36に対して行う。 (もっと読む)


【課題】演奏された楽曲の楽譜位置をより頑健に推定できる楽譜位置推定装置及び楽譜位置推定方法を提供する。
【解決手段】周波数特性分析部は、入力された音響信号の周波数特性を分析して第1の周波数特性を算出し、関連度算出部は、楽譜情報が表す楽譜の位置毎の音階に基づく第2の周波数特性と前記第1の周波数特性の関連度を表す重み値を、前記第2の周波数特性に含まれる成分毎の前記第1の周波数特性の確率分布に基づいて、前記楽譜の位置毎に算出し、楽譜位置探索部は、前記重み値に基づいて前記音響信号に対応する楽譜の位置を探索する。 (もっと読む)


【課題】
利用者の現在の利用シーンに対応する適応モデルをオンラインで動的に生成する機械翻訳装置を実現することである。
【解決手段】
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。 (もっと読む)


【課題】読み記号列の編集に要する時間を短縮すると共に編集後の音声波形の品質を確保する読み記号列編集装置を実現する。
【解決手段】読み記号列編集装置は、読み記号列を生成する言語処理手段と、前記読み記号列を記憶する読み記号列記憶手段と、前記読み記号列記憶手段の読み記号列を第1の音声波形に変換する第1の音声合成手段と、前記読み記号列記憶手段の読み記号列を第2の音声波形に変換する第2の音声合成手段と、前記第2の音声合成手段を利用して、前記読み記号列記憶手段の読み記号列の少なくともアクセント型を編集する読み記号列編集手段とを備える。前記第2の音声合成手段の処理時間は、前記第1の音声合成手段の処理時間よりも短い、あるいは、前記第2の音声合成手段で変換された前記第2の音声波形の発話速度は、前記第1の音声合成手段で変換された前記第1の音声波形の発話速度とは異なる。 (もっと読む)


【課題】より汎用な音声再生の速度を制御する技術を提供する。
【解決手段】外部から配信される書籍データを受信する通信部と、この書籍データを記憶する記憶部と、ユーザの操作を電気信号に変換する操作部と、前記操作に基づき前記記憶部から前記書籍データを音声で再生する音声出力制御部と、前記書籍データのうちユーザにとって重要な個所を決定する制御部とを備え、前記音声出力制御部は前記書籍データを音声で再生する際にこの音声の再生速度を制御しながら再生し、前記制御部は前記音声出力制御部が前記書籍データを音声再生した位置を前記記憶部に保存して音声再生した位置と前記書籍データ内の再生位置を同期させる電子機器。 (もっと読む)


51 - 60 / 925