説明

Fターム[5D015CC04]の内容

音声認識 (5,191) | 音声パラメータ (219) | ホルマント (14)

Fターム[5D015CC04]に分類される特許

1 - 14 / 14


【課題】実音声に基づいて、アバターの口唇を見る人に違和感なく動かせる口唇動作パラメータの生成装置を提供する。
【解決手段】生成装置は、発話者の音声から得られる音声信号をフレーム化し、各フレームから第1フォルマントF1及び第2フォルマントF1を抽出するフォルマント抽出部80と、F1及びF2について、話者による母音空間の相違を補償するようにフォルマント空間の原点を移動させる原点移動処理部84と、F1及びF2の線形写像により、F1を補正するよう、フォルマント空間を原点周りに回転させる回転処理部86と、各フレームに対し、回転処理部86が出力する補正後の第1フォルマントの値の関数として、発話者の音声と同期して口唇形状を上下方向に変化させるためのパラメータを生成して出力する形状推定部88を含む。 (もっと読む)


【課題】英語発音の学習方法について一定の基準を広く提示し、学習者が取得しにくかった口腔内の舌の動き、息の出し方等について、3Dアニメーション映像を駆使し、ネイティブの発音を身につけることを、容易かつ効率的に学習をすることができる、音声分析機能を持つ言語発音学習装置及びそのシステムを提供する。
【解決手段】マスターすべき主なフォルマント(F1〜F3)を抽出表示し、学習者はビジュアルで自分の発話結果と模範者の発話との相違点を視覚で把握できることを備え、学習者の発話結果の相違点を改善するための考察について、文字及び3Dアニメーションで提示する。 (もっと読む)


【課題】現実の利用環境における多様な状況によらず、音声に固有の特徴を確実かつ頑健に抽出して、音声認識に利用する。
【解決手段】一般的な音声認識手法として現在広く普及している隠れマルコフモデル(HMM)に基づく手法では、入力音声を標準パターンと照合する際に、音声区間全体における全ての分析時点(フレーム)の特徴量を均一に評価するため、音声も雑音も同等にスコアに反映されるのに対して、本方法は、音声を識別するための重要な特徴が存在するフォルマントの極大及び極小部分の特徴量を集中的に利用することにより、雑音に頑健な音声認識が可能になる。 (もっと読む)


【課題】 音声の認識率を高めることができる音声認識装置及び音声認識方法を提供すること。
【解決手段】 本発明による音声認識装置1は、フレーム毎の音声信号を平滑化して線形予測係数を求める平滑化手段4aと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段4bと、線形予測係数と自己相関関数に基づいてフレーム毎の符号化後パラメータを演算する符号化後パラメータ演算手段4cと、平滑化手段4aの前段の音声信号の各フォルマント周波数における符号化前特徴量を抽出する符号化前特徴量抽出手段4dと、を含むことを特徴とする。 (もっと読む)


【課題】 より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供すること。
【解決手段】 本発明による老若判定装置1は、フレーム毎の音声信号を平滑化する平滑化手段4aと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段4bと、自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段4cと、母音判定手段4cがフレーム毎の音声信号が母音であると判定する場合に、音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段4dと、スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段4eと、スペクトル傾きに基づいて音声信号の基となる音声の発話者の老若判定を行う老若判定手段4fと、を含むことを特徴とする。 (もっと読む)


音声認識が、近い実時間に実行されてかつイベントかつイベント・シーケンスを利用して、ブーストされたクラシファイヤ、アンサンブル、検出器かつカスケードを含んでいる機械学習技術を利用し、かつ、知覚クラスタを使用することによって改善される。音声認識も、縦並びに処理するものを使用して改善される。自動句読点挿入器は、認識されたテキスト・ストリームに句読点を挿入する。 (もっと読む)


【課題】発話者の発話行為に対して影響を与えうる要因による影響を補正し、発話者の感情の識別や評価を、より正確に行うことが可能な感情識別装置、感情識別方法およびプログラムを提供する。
【解決手段】本発明に係る感情識別装置に、音声特徴量またはその変化量に基づいて、所定の感情カテゴリの感情適合度を算出する感情適合度算出部と、発話者に対してストレスを与えうる要因を表す特徴量、または、その変化量を用いて、ストレスを与えうる要因が発話者の発声に与える影響度を、所定の基準に基づいて数値化する影響度算出部と、ストレスを与えうる要因と、ストレスを与えうる要因が所定の感情カテゴリに与える影響の度合いを数値化した補正値と、が互いに関連付けられた補正値データベースが予め記録された記憶部と、算出された影響度と補正値データベースとを用いて、算出された感情適合度を補正する感情適合度補正部と、を設けた。 (もっと読む)


【課題】音声認識性能に影響を与えるユーザ音声の物理量の改善を支援する音声診断装置及びユーザ音声診断方法を提供する。
【解決手段】ユーザ音声診断装置10の音声信号入力部101は、ユーザの発声による音声信号を入力し、物理量算出部102は、入力された音声信号に基づいて母音間距離と話者固有度の両方を含む物理量を算出する。物理量提示部103は、算出された物理量をユーザに提示する。 (もっと読む)


本発明は、オーディオ信号処理に関する。より具体的には、本発明は、テレビのオーディオのようなエンターテイメントオーディオを強調し、せりふや物語のオーディオのような音声の明瞭度と了解度を向上する。本発明は、方法、その方法を実行するための装置、および、コンピュータにそのような方法を実行させるためのコンピュータ可読媒体に保存されたソフトウェアに関する。 (もっと読む)


【課題】音声信号の自動処理の分野に関し、特に、音声信号におけるフォルマント周波数を追跡する方法を提供する。
【解決手段】本方法は、音声信号の聴覚イメージを取得するステップ、フォルマント位置を順次推定するするステップ、 周波数範囲を小領域に分割するステップ、取得されたコンポーネント・フィルタリング分布を平滑化するステップ、および、正確なフォルマント位置を計算するステップを含む。 (もっと読む)


【課題】 音声信号を受け取って処理する側の装置が負う音声信号の解析のための負担を軽減する。
【解決手段】 抽出部20−k(k=1〜m)は、マイクロフォン11−k(k=1〜m)により得られたデジタルオーディオ信号S−k(k=1〜m)から音声強度信号Es−k(k=1〜m)と雑音強度信号En−k(k=1〜m)を各々抽出する。S/N比信号生成部50は、音声強度信号Es−k(k=1〜m)と雑音強度信号En−k(k=1〜m)からS/N比信号を演算する。出力部60は、デジタルオーディオ信号S−k(k=1〜m)から合成されたデジタルオーディオ信号SSとS/N比信号とを出力する。 (もっと読む)


【課題】従来の情報処理装置においては、母音を同定できない、という課題があった。
【解決手段】音声情報を受け付ける音声情報受付部と、前記音声情報から第一フォルマント周波数(F1)を取得するF1取得部と、前記音声情報から第二フォルマント周波数(F2)を取得するF2取得部と、前記音声情報から第三フォルマント周波数(F3)を取得するF3取得部と、前記F1、前記F2、および前記F3に基づいて、前記音声情報の母音を同定する母音同定部と、前記母音同定部が同定した母音に基づいて処理する処理部と、を具備する情報処理装置により、母音を同定できる。 (もっと読む)


【課題】 認識対象である音声に背景雑音が付加されている音声区間のパターンマッチングをする場合において、背景雑音が街中の人声の場合や、ガベジモデル学習時に使用したデータ以外の音声であっても、ガベジモデルが正しい音声区間とマッチすることを防止し、誤認識率を低下させる音声認識装置を得る。
【解決手段】 入力データの特徴量に基づき、認識対象の音声である可能性の高い区間に対してはガベジモデルに対する尤度を低くする補正を、認識対象の音声である可能性の低い区間に対してはガベジモデルに対する尤度を高くする補正を行い、補正後の尤度を用いてパターンマッチングを行う。 (もっと読む)


【課題】 会話の中に現れる「訛り」を効率的に矯正させるシステムを提供すること。
【解決手段】 生徒端末10が生徒の発音内容を示す音声情報をDSPサーバ装置40に送信すると、DSPサーバ装置40は、その音声情報を変換して得た発音記号列を構成する一連の発音記号のうち、お手本となる発音記号列と一致しない箇所を特定する。そして、特定した箇所の音声を生徒本人の声で矯正した矯正音声情報を生徒端末10へ送信する。 (もっと読む)


1 - 14 / 14