説明

国際特許分類[G10L15/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識のための特徴抽出;認識単位の選択 (203)

国際特許分類[G10L15/02]に分類される特許

101 - 110 / 203


【課題】過去のユーザ入力に対する誤った解釈を、その後のユーザ入力により容易にしかも正確に訂正することができる対話装置及び方法を提供する。
【解決手段】対話状態の履歴を記憶する記憶手段と、現在の対話状態におけるシステム応答を出力する応答出力手段と、入力されたユーザ発話を音声認識して、該ユーザ発話に対する1または複数の認識候補とその尤度を求める音声認識手段と、前記記憶手段に記憶されている現在の対話状態及びその1つ前の対話状態を含む複数の対話状態のそれぞれについて、前記ユーザ発話との適合度を算出する算出手段と、各対話状態の前記適合度と各認識候補の前記尤度との組合せを基に、前記複数の対話状態のうちの1つと、前記1または複数の認識候補のうちの1つとを選択する選択手段と、選択された対話状態及び認識候補を基に新たな対話状態へ遷移する遷移手段とを備える。 (もっと読む)


本発明は、オーディオ信号処理に関する。より具体的には、本発明は、テレビのオーディオのようなエンターテイメントオーディオを強調し、せりふや物語のオーディオのような音声の明瞭度と了解度を向上する。本発明は、方法、その方法を実行するための装置、および、コンピュータにそのような方法を実行させるためのコンピュータ可読媒体に保存されたソフトウェアに関する。 (もっと読む)


【課題】周波数軸上の位置情報を考慮した1次元信号の変換値からHLAC特徴量を求めるHLAC特徴抽出方法および装置を提供すること。
【解決手段】1次元信号の変換値からのHLAC特徴抽出方法は、1次元信号をベクトル時系列に変換し、変換されたベクトルの各要素の時系列に1次元GrayHLACを適用し、全ての要素から得られたHLAC特徴量を結合して1つの特徴量として出力する手順を有する。 (もっと読む)


【課題】探索処理以前に入力が音節強調発声であるか否かを判定できる音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体を提供する。
【解決手段】音節強調発声判定部13は、音響分析部で抽出された入力音声のパワー(E)やn次元のMFCC(MFCCの0次項C0を含む)等の音響特徴量に基づいて入力音声の発声区間を検知する発声区間検知部131と、検知された発声区間の出現周期性を判定する周期性判定部132とを主要な構成とし、発声区間の出現周期性が所定の基準値よりも高いときに入力音声を音節強調発声と判定する。入力音声が音節強調発声と判定されると、利用者に通常達成での再発生を要求したり、あるいは音声認識用の統計モデルを音節強調発声用の統計モデルに切り換えて音声認識が実行される。 (もっと読む)


【課題】発声者に固有の特徴を登録情報に有効に反映させる。
【解決手段】記憶装置50は、音声の特徴量CAを含む登録情報Rを記憶する。指標算定部122は、入力音声VINに含まれる音素の個数を反映した音素数指標値Nを算定する。判定部124は、入力音声VINが登録情報Rの作成または更新のための音声として適切か否かを音素数指標値Nに基づいて判定する。管理部14は、判定部124が入力音声VINを適切と判定した場合に限り、入力音声VINの特徴量CAに基づいて登録情報Rを作成または更新する。報知部15は、判定部124が入力音声VINを不適切と判定した場合にその旨を発声者に報知する。 (もっと読む)


【課題】ジェスチャーを交えながらユーザと会話することができるようにする。
【解決手段】会話集データベース1から音声認識処理部6により解析された言葉に応答する台詞を表現する音声データを検索する音声データ検索部7と、ジェスチャーデータベース3から台詞に対応するジェスチャーを実現する制御データを検索する制御データ検索部8とを設け、音声再生部9が音声データ検索部7により検索された音声データにしたがって音声を出力し、体制御部10が制御データ検索部8により検索された制御データにしたがって体を動かすようにする。 (もっと読む)


【課題】
雑音信号区間の判別精度の向上を図ることを可能とする端末装置及び判別方法を提供する。
【解決手段】
ネットワークを介して音声認識サーバ200に接続された端末装置100が、音声信号区間と雑音信号区間とを判別する音声/雑音判別部130と、音声信号区間に対応する音声信号に基づいて音声信号情報を抽出する音声特徴量抽出部140と、雑音信号区間に対応する雑音信号に基づいて雑音信号情報を抽出する雑音特徴量抽出部150と、音声信号情報及び雑音信号情報を音声認識サーバ200に送信する送信部160とを備え、音声/雑音判別部130が、音声認識を開始する条件である開始条件が満たされるまでの所定区間を雑音信号区間として判別する。 (もっと読む)


【課題】音声区間非音声区間の仮判定の精度を上げることによって、最終的な音声区間非音声区間の判定の精度を上げることを目的とする。
【解決手段】入力された音声信号からフレーム毎に音声パラメータを計算する。上記音声パラメータを予め定められたフレーム数分だけ遅延バッファに蓄積する。上記音声パラメータから、その音声パラメータに係るフレームが、音声区間に属するか非音声区間に属するかを仮に決定する。上記決定された、音声区間に属するか非音声区間に属するかについての仮の情報(以下、仮VADフラグとする。)を、予め定められたフレーム数分だけVADフラグバッファに蓄積する。VADフラグバッファに蓄積された仮VADフラグを、上記遅延バッファから読み出した音声パラメータの経時的変化を観測し、予め定めた規則に基づいて過去に遡って修正する。上記修正された仮VADフラグを出力する。 (もっと読む)


【課題】 音声特徴ベクトル変換方法及び装置を提供する。
【解決手段】 音声信号中で音声認識に必要な特徴ベクトルを抽出し、抽出された特徴ベクトルを自動連想神経網を利用して変換することによって、音声認識過程でノイズが含まれた音声特徴ベクトルが入っても、強い特徴出力値を得ることができる。 (もっと読む)


【課題】頑健に信号の検出を行う信号箇所・変動パラメータ検出方法を提供する。
【解決手段】
目的信号からベクトルからなる目的基本特徴を抽出し、目的基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで目的縮退特徴を抽出する。また目的縮退特徴と同一または類似の蓄積縮退特徴に対応する基本特徴同士の入力を受け付けて、当該基本特徴同士の関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する。そして、目的基本特徴から蓄積基本特徴に対応する目的生成特徴を生成し、または、蓄積基本特徴から目的基本特徴に対応する蓄積生成特徴を生成する。さらに目的生成特徴と蓄積基本特徴との類似度、記目的基本特徴と蓄積生成特徴との類似度を計算し、目的信号と類似する蓄積信号の箇所と変動パラメータを計算する。 (もっと読む)


101 - 110 / 203