説明

Fターム[5D015FF07]の内容

音声認識 (5,191) | 特徴抽出 (44) | 音素の存在の検出 (6)

Fターム[5D015FF07]に分類される特許

1 - 6 / 6


【課題】音声情報に基づいて音声認識部を自動的に切り替えることができる音声認識方法および音声認識装置を提供する。
【解決手段】ユーザによりマイクから入力される音声の音声区間を検出して当該区間のパワーを計算する音声パワー検出部と、前記区間のパワーをユーザとマイク間の距離に変換するユーザ-マイク間距離算出部と、この距離に基づいて前記音声による音声信号の出力先として複数の音声認識部を選択する音声認識辞書切替部とを備えた音声認識装置。 (もっと読む)


【課題】 比較的低演算負荷でありながらも、キャラクタの口形状と音との高い適合率を確保しながら音声再生に同期した口形状制御を実現する新しい技術を提供する。
【解決手段】マイクで集音されたプレーヤの音声の音データ50から所定時間幅の部分52を切り出し、当該部分の声道断面積関数54を算出する。そして、声道断面積関数54の喉側の平均断面積d1から口の縦長さlyを算出し、口側の平均断面積d2から口の面積dmを算出する。そして、この口の面積dmと口の縦長さlyとから口の横長さを算出する。 (もっと読む)


音声認識が、近い実時間に実行されてかつイベントかつイベント・シーケンスを利用して、ブーストされたクラシファイヤ、アンサンブル、検出器かつカスケードを含んでいる機械学習技術を利用し、かつ、知覚クラスタを使用することによって改善される。音声認識も、縦並びに処理するものを使用して改善される。自動句読点挿入器は、認識されたテキスト・ストリームに句読点を挿入する。 (もっと読む)


【課題】音響分析パラメータ生成装置を高速・省メモリ化する。
【解決手段】この発明の音響分析パラメータ生成装置の出力確率計算部は、調整パラメータを用いて算出されたフレーム単位の音響特徴量と音響モデルとを入力としてフレーム毎の各状態の出力確率を計算する。スコア計算部が、出力確率の最尤状態系列を所定フレーム数に渡って累積して出力確率スコアを求める。スコア評価部は、出力確率スコアを評価して出力確率スコアが最大になる調整パラメータを最適調整パラメータ候補として出力する。最適調整パラメータ候補記録部が、その最適調整パラメータ候補を記録する。所定フレーム数に対して調整パラメータをそれぞれ出力した後に記録した最適調整パラメータ候補を調整パラメータとして出力する。 (もっと読む)


【課題】高精度に子音部の音声認識を行なう。
【解決手段】入力された音声の音声波形信号から所定時間間隔で複数の音声区間の特徴量を抽出し、音節別状態遷移モデルと抽出した特徴量とを用いて、入力された音声の段を判定し、段別状態遷移モデルと判定された段とを用いて、判定された段に対応する段別状態遷移モデルの前半部分の状態に割り当てられた音声区間に対し、子音認識に最適な分析条件で子音部分の特徴量を抽出し、音節別子音状態遷移モデルと抽出した子音部分の特徴量とを用いて子音部を判定することにより、音節音声を判定する。 (もっと読む)


【課題】長い消失区間に対しても音声を復元する事ができる音声信号の復元装置を提供する。
【解決手段】音声信号の復元装置は、入力される音声信号データ列に消失区間があるか否かを判定し、判定結果を示す第1の信号を出力するモニタ部48と、音響モデル42と言語モデル44とを用いて音声認識を行なう音声認識部46と、音声認識部46の認識結果から音声合成を行なう音声合成部52と、モニタ部48により制御され,消失区間では音声合成部52の出力を、それ以外では入力音声データを、それぞれ選択する信号混合部56とを含む。 (もっと読む)


1 - 6 / 6