説明

国際特許分類[G10L13/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 合成音作成の方法;音声合成器 (464)

国際特許分類[G10L13/02]の下位に属する分類

国際特許分類[G10L13/02]に分類される特許

81 - 90 / 365


【課題】 五線譜に自動変換した際に、演奏者が楽器で演奏可能な程度に簡略化された符号データ(MIDIデータ等)を基本として音声合成機能を実現する場合において、作業負荷を軽減するとともに、音声再生品質の明瞭性を改善することが可能な音素符号変換装置、音素符号データベース、および音声合成装置を提供する。
【解決手段】 符号コード群として構成される音節符号を読み込み、各音高ごとに発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積で与えられるエネルギー値の総和であるエネルギー総和値を算出し、複数の音節符号間で、各音高ごとに全てのエネルギー総和値を乗算して統合エネルギー値を算出し、統合エネルギー値が高い上位の音高を抽出し、各音高に対応する強度、開始時刻、終了時刻を設定して音素符号を得る。 (もっと読む)


【課題】 演奏者が楽器で演奏可能な程度に、五線譜に自動変換できる簡略化した符号データを基本として音声合成機能を実現する場合において、作業負荷を軽減するとともに、音声再生品質の明瞭性を改善することが可能な音素符号補正装置、音素符号データベース、および音声合成装置を提供する。
【解決手段】 音素符号を構成する符号コード群の各符号コードについて、発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積で与えられるエネルギー値が高い上位のものを抽出し、抽出された符号コードより強さのパラメータを削除した補正符号コード群で構成される音素符号に変換し、変換後の音素符号を構成する補正符号コードの発音開始時刻および発音終了時刻の各々に対して、所定の時間単位の整数倍になるように補正する。この結果、和音の発音時間が時間単位の整数倍の音素符号が得られる。 (もっと読む)


【課題】入力操作への応答が認識し易くなるような設定を、任意かつ簡単な操作により実現可能とする給湯機用リモートコントローラ等を得ること。
【解決手段】ふろ給湯機本体1の稼動に関する入力操作を受け付ける入力手段21と、音声出力手段25と、表示手段24と、制御手段20と、を有し、制御手段20は、音声出力手段25により出力される音声ガイダンスの設定を、第1モードと、音声ガイダンスの再生速度及び音量のうち少なくとも一方を第1モードとは異ならせた第2モードと、の間で変更させるとともに、表示手段24に表示される文字ガイダンスの設定を、第1モードと、文字ガイダンスの表示速度を第1モードとは異ならせた第2モードと、へ変更させ、音声ガイダンス及び文字ガイダンスの第1モードと第2モードとを一括して切り換えるためのモード切り換え手段を有する。 (もっと読む)


【課題】コミュニケーションの意図を有効に伝える音声合成装置とそのためのF輪郭生成装置とを提供する。
【解決手段】F生成装置84は、ベースラインF輪郭96を生成するベースラインF輪郭推定部94と、目標とする意図を表すF輪郭パターン信号を生成するパターン生成部110と、再構築されたF輪郭信号f86がF輪郭パターン信号Z(t)によって変調されるように、ベースラインF輪郭96を再構築する射影モジュール98及び組合せモジュール114とを含む。射影モジュール98はベースラインF輪郭信号96を、位相空間内の構造保存マップを用いて底空間に射影する。組合せモジュール114は射影されたF輪郭信号100とF輪郭パターン信号112とを、位相空間で規定される同相写像を用いて融合し、配置空間内に再構築されたF輪郭を生成する。 (もっと読む)


【課題】 原文の自然な発音を身につけさせる。
【解決手段】 学習支援装置(10)は、記憶媒体(48)およびコンピュータ(42)を備える。記憶媒体は、語学学習の対象となる原文(ES)の内容を示す原文内容情報(781a,781d)と、原文に関しアクセントの時間軸上での位置を示すアクセント位置情報(781c)とを記憶している。コンピュータは、原文の内容を原文内容情報に基づいて報知しながら(S55,S105)、原文に関しアクセントの時間軸上での位置をユーザに報知するためのアクセント画像(G,AP1,AP2,…)をアクセント位置情報に基づいて画面(14)に表示する(S111)。 (もっと読む)


【課題】人の音声を迅速に判別して利便性の向上やコストの削減を図ることのできる音声記録装置を提供する。
【解決手段】マイク6により捉えた音声データに基づく音声パワーの単位時間内の変化量を検出する変化量検出部22と、該変化量が所定値P0よりも大きい変化点Cを検出する変化点検出部23とを備え、所定の判定期間T0内に変化点Cが所定数N0よりも多いときに録音を開始した。 (もっと読む)


著作権のあるフレームベース作品の著作権収益獲得強化方法が提供される。本方法は、著作権のあるフレームベース作品の少なくとも1つのデータフィールド内に、著作権・再生管理情報を埋め込むステップを含む。著作権・再生管理情報は、著作権のあるフレームベース作品へのアクセスに対応する。本方法は、著作権のあるフレームベース作品をエンコードするステップと、エンコードされた著作権のあるフレームベース作品を送信するステップと、埋め込まれた著作権・再生管理情報の少なくとも一部に基づいて、著作権のあるフレームベース作品に支払われるべき著作権使用料の適切な支払を確実にするステップとを含む。 (もっと読む)


【課題】実際の人間に近い振る舞いを行える、サービス性の高い受付装置を実現する。
【解決手段】受付端末20は、スピーカ208を有し、来訪者の来訪に係わる来訪情報を取得し、この取得した来訪情報に対応して、シナリオに基づく案内音声をスピーカ208を介し出力し、複数のシナリオに沿った受付処理において、音声加工条件が満たされたかどうかを判定し、この判定が満たされた場合、スピーカ208を介して出力される案内音声を加工し、当該案内音声の音声状態量を変化させる。 (もっと読む)


【課題】使用者個々のニーズに合った音声案内を可能とした音声案内装置を提供する。
【解決手段】使用者により任意の音声を登録可能な入力手段としてのマイク72、84とこのマイク72により入力された音声を登録する記憶手段としての音声IC94、96と、この音声IC94、96に登録された音声を再生する出力手段としてのスピーカ73、86と、これら各手段を制御する制御手段としての制御装置4を備え、制御装置4は、音声IC94、96に登録された音声を出力手段にて再生することにより、音声案内を行うと共に、この音声案内を再生する際、選択可能な通常モードと高齢者モードを有する。 (もっと読む)


【課題】特定音声に特化されていない音声生成モデル予測器を含む音声合成装置において、音声合成記号と比較的小さい修正情報を用いて、原音声の特徴を再現した音声を合成する。
【解決手段】一連の音声合成記号入力に基づき音声生成モデルを生成し、生成された音声生成モデルに基づき音声波形を生成する音声合成装置であって、音声生成モデルの修正情報を入力する手段と、音声生成モデルの修正情報に基づき、音声合成記号入力に基づき生成された音声生成モデルを修正する手段とを備えており、前記修正情報は、合成対象の原音声から推定された所定の音声合成パラメータを生成する音声生成モデルと、一連の音声合成記号入力から生成された音声生成モデルとの間で定義される、所定の誤差尺度が小さくなるように音声生成モデルを修正する情報で構成される。 (もっと読む)


81 - 90 / 365