説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

841 - 850 / 925


言語処理部(31)は、対話処理部(20)からのテキストを解析して発音およびアクセントの情報に変換する。韻律生成部(32)は、対話処理部(20)からの制御信号に応じた抑揚パターンを生成する。波形DB(34)には、あらかじめ録音された波形データとそれに対し付与されたピッチマークのデータとが記憶されている。波形切り出し部(33)は、波形DB(34)から所望のピッチ波形を切り出す。位相操作部(35)は、波形切り出し部(33)によって切り出されたピッチ波形の位相スペクトルを定型化することにより位相揺らぎを除去し、その後、対話処理部(20)からの制御信号に応じて高域の位相成分のみをランダムに拡散させることによって位相揺らぎを付与する。こうしてできたピッチ波形は波形重畳部(36)によって所望の間隔で並べられ、重ね合わせて配置される。
(もっと読む)


【課題】変換精度の低いD/A変換器を用いて音声を再生する場合でも、D/A変換器の変換誤差によるノイズを聴感上軽減する音声録音再生装置を得ること。
【解決手段】A/D変換器11は入力された音声信号をデジタル変換してデジタル音声信号を生成し、音声特徴強調フィルタ12はデジタル音声信号の周波数の中で音声の特徴を示す周波数を強調した音声強調デジタル信号を生成し、音声圧縮符号化部13は音声強調デジタル信号に符号化処理を施して音声符号化データを生成し、記憶部14,31は音声符号化データを記憶する。音声復号化部32は、記憶部31に記憶されている音声符号化データに復号処理を施して復号したデジタル音声信号を生成し、D/A変換器33は復号したデジタル音声信号をアナログ変換して出力する。 (もっと読む)


【課題】 調音位置の変化とフォルマント周波数の変化量の関係を調音運動の拘束に基づき作成される刺激音声として用いることを可能にする。
【解決手段】 刺激音声を、連続音声発声時における、顎、舌、唇、軟口蓋、喉頭等、調音器官の調音運動軌跡の確率的な動的モデルを考慮して作成し、また、各運動の平均調音位置の間を補間し、当該補間された各調音位置からフォルマント周波数とそのバンド幅、基本周波数を決定して各調音位置に対して当該調音位置に対するフォルマント周波数の変化量を計算することで、調音ジェスチャの変化とフォルマント周波数の変化量との関係を刺激音声として、調音器官や運動の動的な振る舞いを考慮した精緻な音声合成を実現する。 (もっと読む)


【目的】 周辺ノイズが大きくなっても、あるいは、大きな不規則ノイズが発生しても出力された音声をユーザが認識できるようにする「音声出力装置及び音声/映像出力装置」を提供することである。
【構成】 音声/映像出力装置は、音声をスピーカに入力するオーディオ部、映像をモニターに入力するビデオ部、音声に応じた文字列を発生する音声文字列発生部、ノイズを検出するノイズ検出部、ノイズが設定レベル以上の時、音声に応じた文字列を映像に重ねてモニターに表示する表示制御部を備えており、表示制御部は、周辺ノイズが設定レベル以上の時、音声文字列を映像に重ねてモニターに表示して音声の聞き逃しを防止する。 (もっと読む)


【課題】再生される音声内の雑音を低減させる方法はあるが、入力される音声信号を加工し聴視者にメリハリのある音声を提供することができなかった。
【解決手段】入力された音声信号の周波数強度分布を監視している音声処理回路において、音声周波数分布を一定時間モニタ、メモリし、音声周波数強度分布に閾値(2値)を設け、大きい方の閾値より高い音声強度が一定時間以上入力された場合はその周波数強度を強くし、小さい方の閾値より低い音声強度が一定時間以上入力された場合はその周波数強度を弱くすることを行う音声周波数分布可変装置を用いることにより、聴視者にメリハリのある音声を提供することができる。 (もっと読む)


【課題】利用者への応答を自我状態に応じて変化させ、利用者に違和感や不快感の生じない自然な対話を行うことを可能とした対話エージェントを提供する。
【解決手段】顔感情推定部13はカメラ41で撮像した利用者の表情から感情を推定する。マイクロホン42から入力された利用者の音声は、音声感情推定部14で感情が推定され、口調推定部15で口調が推定され、テキスト抽出部16でテキストが抽出される。自我状態推定部20では、利用者の表情から得た感情と音声から得た感情と口調とテキストとの4種類の情報を組み合わせることにより利用者の発話に対する自我状態ベクトルを推定する。対話制御部30は、利用者の発話により推定された自我状態ベクトルから応答用の自我状態ベクトルおよびテキストを決定し、スピーカ43を通して合成音声で応答する。 (もっと読む)


【課題】応答音に背景音を同期させて合成する作業を容易化する技術の提供。
【解決手段】応答音と背景音とを合成して応答メッセージを作成する装置であって、前記応答音及び背景音の各データを取得する取得手段と、前記背景音を出力する出力手段と、前記応答音の出力開始点を指示する開始点指示手段と、前記出力された背景音と前記指示された応答音の出力開始点とに基づいて算出した、当該応答音と背景音間の同期情報を保持する同期情報保持手段とを具備する。 (もっと読む)


【課題】原音に対応する音響波形を基に人間にとって意味のある必須の情報を抽出することのできる音響情報の抽出方法および音響情報抽出装置を提供することを目的とする。
【解決手段】サンプリング部130は、フィルタリングされた複数の音響波形毎に、音響波形の極値の存在する時刻Tnと、隣り合う第1の極値に対応する時点から第2の極値に対応する時点までの時間Dnと、第1の極値から第2の極値までのピークトゥピーク値Anとを時変サンプリングする。信号処理部150は、複数の音響波形毎に、時変サンプリングされたピークトゥピーク値Anを、時間Dnに応じてラウドネス補正する。音響情報抽出部170は、複数の音響波形毎に、ラウドネス補正されたピークトゥピーク値の絶対値Bnの時系列の中から、極大値を有する信号についてのみ、時刻Tn、時間Dnおよび絶対値Bnを抽出する。 (もっと読む)


【課題】 他の参加者による各展示物に対する見学の履歴や感想の内容などに関わる情報を、後の時刻に見学に来たユーザが音声により自然に獲得することが可能な見学ガイドシステムを提供する。
【解決手段】 音声ガイドシステム1000は、見学する各参加者により装着され、各参加者の見学する対象物をIRタグにより特定する情報を獲得するための装着型センサ系と、据置カメラ30により見学領域内の見学者や対象物を観測するための据置型センサ系とを備える。データ管理用サーバ400内には、時間データと関連付けて各参加者の音声情報を記憶されており、アプリケーションサーバ410は、装着型センサシステムからの情報に基づいて、見学者が対象物を注視する度合いに応じた重畳度で、当該対象物に対して各参加者が残した音声情報を重畳して、見学者に提供する。 (もっと読む)


【課題】本発明は、特に観光客の再訪及び名所旧跡のある観光地全体への波及効果を促進して観光地を活性化することのできるカード式音声案内システム及び該カード式音声案内システムを利用した観光開発システムを提供することを課題とする。
【解決手段】本発明は上記課題を達成するために、カード式音声案内システムとして観光地で多目的に使用されるカードと、該カードを用いることで各種の案内を音声で発声する音声発生装置とから構成されていることであり、カード式音声案内システムを利用した観光開発システムとして、名所旧跡のある観光地内等でカードを購入し、該カードを用いて観光地内の名所旧跡にそれぞれ設けられた音声発生装置を通して自在に各種の案内を音声で聞とことができるとともに、観光地内の宿泊施設、売店(お土産屋)等の各種利用施設で割引等の特典を受けることで、名所旧跡のある観光地全域の新たな開発を行うことである。 (もっと読む)


841 - 850 / 925