説明

国際特許分類[G10L13/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 音声合成器で使われる音声素片;結合規則 (315)

国際特許分類[G10L13/06]に分類される特許

11 - 20 / 315


【課題】電子メール等のテキストデータの発信者の特定および受信内容の認識を容易にした車載電子装置を提供することを目的とする。
【解決手段】車載電子装置は、携帯電話端末20から受信した発信者の音声信号を解析して該発信者の声質データを生成する音声解析部14と、音声解析部14で生成した声質データを記憶する記憶部16と、携帯電話端末20から受信したテキストデータの発信者に対応した声質データを記憶部16から読み出し、読み出した声質データに基づいて受信したテキストデータを音声変換する音声変換部12とを備える。 (もっと読む)


【課題】
音声を強調する際のフィルタ特性を適切に制御できる音声処理装置を実現することである。
【解決手段】
実施形態の音声処理装置は、音声データから抽出された第1の音声特徴量から第1のヒストグラムを計算し、前記第1の音声特徴量とは異なる第2の音声特徴量から第2のヒストグラムを計算するヒストグラム計算手段と、前記第1のヒストグラムの度数を累積した第1の累積度数と、前記第2のヒストグラムの度数を累積した第2の累積度数とを計算する累積度数計算手段と、前記第1および第2の累積度数に基づいて、前記第2の累積度数を前記第1の累積度数に近づける特性をもつフィルタを作成するフィルタ作成手段とを備える音声処理装置である。 (もっと読む)


【課題】発音速度が高い自然な音声を合成する。
【解決手段】記憶装置14は、相異なる音素に対応する複数の音素区間Sを含む音声素片Vを示す複数の音声素片データDAを記憶する。素片選択部22は、音声素片Vを順次に選択する。音素長設定部24は、素片選択部22が選択した音声素片Vの各音素区間Sについて合成時間長Tを可変に設定する。音声合成部26は、素片選択部22が選択した音声素片Vの各音素区間Sのうち音素長設定部24が設定した合成時間長Tの対象区間Wについて音声素片データDAが示す音声波形を相互に連結して音声信号VOUTを生成する。音素区間Sにおける対象区間Wの位置(前方/後方)は音素種別に応じて決定される。 (もっと読む)


【課題】少量の音素ラベリングデータから新音素体系の大量の音素ラベリングデータを精度良く生成する音素ラベリングデータ音素継続時間長変換装置を提供する。
【解決手段】音素継続時間長分布推定部は、変換対象話者の新音素体系における少数の音素ラベリングデータである参照ラベリングデータと、複数話者のある音素体系における音素種別の音素継続時間長の平均値・分散値を、統計的に信頼できる値として得ることが可能な数の複数話者ラベリングデータを入力として、参照ラベリングデータを複数話者ラベリングデータで直線回帰し、複数話者ラベリングデータの全ての音素種別に対応する変換対象話者の音素継続時間長の平均値と分散値である音素継続時間長分布を求め、1個の音素継続時間長に対して複数の音素情報を持つ音素ラベリングデータを、音素情報毎に時間長を分割して新音素ラベリングデータとして出力する。 (もっと読む)


【課題】回路・ソフトウェア規模の増大を抑えつつ、特徴パラメータ時系列の分散も考慮して特徴パラメータを生成する。
【解決手段】シンボルの系列情報に対応する特徴パラメータの時系列の分布を再現する特徴パラメータ生成装置100であって、特徴パラメータの分布が最尤となるように、初期値の系列データを修正して特徴パラメータの時系列データを生成し、特徴パラメータの分布および特徴パラメータの時系列データの分散の尤度がより大きくなるように、生成された特徴パラメータの時系列データを繰り返し修正する構成のうち、初期値の修正と繰り返しの修正を同一の構成(修正データ生成部120)により行なう。このように、初期値の修正と繰り返しの修正を同一の構成により行なうため、回路やソフトウェアを重複して設ける必要がなくなり、回路規模・ソフトウェア規模を低減できる。 (もっと読む)


【課題】自然なイントネーションの合成音声が得られる音声合成装置の提供。
【解決手段】ターゲットF0パターンを変形する1個以上の変形量を算出するターゲットF0変形量算出手段と、ターゲットF0パターンを変形量の周波数分シフトして1個以上のターゲット変形F0パターンを生成するターゲットF0変形手段と、変形量に対応するF0変形サブコストを計算するF0変形サブコスト計算手段と、ターゲット変形F0パターンと音声データベースに格納された候補素片を入力として、ターゲット変形F0パターンと候補素片との間の歪みを表す複数のサブコストを計算するサブコスト計算手段と、複数のサブコストと、F0変形サブコストを入力として、合成対象の文全体に対する総コストを、探索仮説ごとに計算して上記総コストが最も小さくなる候補素片番号列を出力する探索仮説展開手段とを具備する。 (もっと読む)


【課題】各音声素片の重複区間における音質の劣化を抑制する。
【解決手段】素片選択部26は、音声素片Vを順次に選択する。相関算定部52は、素片選択部26が選択した相前後する音声素片V1および音声素片V2の各々の相関算定区間QC(QC1,QC2)について両者間の時間差τを変数とする相互相関関数C(τ)を算定する。素片連結部54は、音声素片V1の相関算定区間QC1と音声素片V2の相関算定区間QC2との時間差を相互相関関数C(τ)が最大となる時間差τmaxに設定したときの音声素片V1と音声素片V2との重複区間Wをクロスフェードして音声素片V1と音声素片V2とを接続する。 (もっと読む)


【課題】記憶容量を削減しながら音声波形の反復に起因した音質の低下を防止する。
【解決手段】記憶装置12は、有声音の音声波形Vbのうち時間軸上の相異なる位置から抽出されたM個の単位波形u[1]〜u[M]を記憶する。音声合成部28は、N個の処理期間R[1]〜R[N]の各々について、M個の単位波形u[1]〜u[M]から選択された第1単位波形Ua[n]の複数個を処理期間R[n]内で経時的に強度が増加するように配列した第1波形系列Sa[n]と、M個の単位波形u[1]〜u[M]のうち第1単位波形Ua[n]とは相違する第2単位波形Ub[n]の複数個を処理期間R[n]内で経時的に強度が減少するように配列した第2波形系列Sb[n]とを加算(すなわちクロスフェード)した合成波形C[n]を生成する。 (もっと読む)


【課題】音声合成に必要な素片データの個数を削減する。
【解決手段】記憶装置12は、音声素片の波形を示す素片データWを複数の音声素片の各々について継続長毎に記憶する。情報生成部24は、合成対象音の各音声素片について継続長Dを指定する合成情報Zを生成する。素片選択部26は、合成対象音の音声素片毎に素片データWを選択する。例えば音声素片[#-bh]について、素片選択部26は、合成情報Zで指定される継続長Dが閾値DTHよりも長い場合には、継続長Dに対応する自身の素片データW[#-bh]_nを選択し、合成情報Zで指定される継続長Dが閾値DTHよりも短い場合には、音響特性が類似する他の音声素片[#-b]に対応する継続長Dの素片データW[#-b]_nを選択する。音声合成部28は、素片選択部26が選択した素片データWを連結することで音声信号SOUTを生成する。 (もっと読む)


【課題】アクセント情報を付与する必要のある辞書に単語を登録する際のユーザの負担を軽減する。
【解決手段】辞書登録装置は、辞書に登録する単語群の入力を受け付ける入力部と、前記単語群に含まれる各単語の読みにおけるアクセントの位置を示すアクセント情報を求めるアクセント情報推定部と、前記アクセント情報に基づいて、前記単語群に含まれる各単語を分類する単語分類部と、を備え、前記単語分類部による分類結果に基づいて、入力された複数の単語を分類表示し、辞書登録操作を受け付ける。 (もっと読む)


11 - 20 / 315