説明

国際特許分類[G10L15/20]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 不利な環境に特に適した音声認識技術,例.雑音またはアクセントのある音声 (334)

国際特許分類[G10L15/20]に分類される特許

101 - 110 / 334


【課題】 ユーザーが車外で過ごす時間も含めて、該ユーザーの最新の趣味や興味を反映した情報をより濃密に吸い上げることができ、千差万別な嗜好にも的確に対応できる自動車用情報提供システムを提供する。
【解決手段】 ユーザーによる音声や手入力等でなされる会話入力内容から、会話し援用に予め定められた参照キーワードを辞書照合により抽出し、抽出された参照キーワード自体か、又はその参照キーワードと予め関連付けられている別の参照キーワードを、別途用意された応答文雛型に誘導用キーワードとしてはめ込み合成する形で誘導会話応答文を作成し、音声や文字等で出力する会話支援手段を設ける。該会話支援により入力されたユーザーの一連の会話内容を興味特定用母データとして蓄積し、これを解析して適切な情報提供を図る。 (もっと読む)


【課題】残響パターンを初期反射成分と拡散残響成分とに良好に分割する。
【解決手段】本発明に係る処理装置は、インパルス応答から残響パターンを測定し、測定した残響パターンを、該残響パターンの前半部である初期反射成分と、該残響パターンの後半部である拡散残響成分とに分割して、入力音声の音声認識を行うための処理装置であって、残響パターンの減衰曲線を計算し、該減衰曲線に基づいて初期反射成分と拡散残響成分との時間的な境界を示す減衰時間境界を計算する減衰時間境界計算部6と、計算した減衰時間境界に基づいて、音響モデルで用いる分析フレーム長と、フレームシフトと、動的特徴量の数と、を決定する音響モデル用パラメタ決定部7と、を備える。 (もっと読む)


【課題】音声の認識率を向上することができる処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラムを提供する。
【解決手段】本発明にかかる音声認識装置は、環境中に設けられたマイクロフォンで検出した音声信号に対して音声認識を行うための処理を行う処理装置であって、環境中で発生したインパルス応答の残響パターンから拡散残響成分を取り除いた初期反射成分を抽出する初期反射成分抽出処理部11と、初期反射成分を学習用の音声データに反映させて、前記音声認識に用いられる音響モデルを学習する音響モデル学習処理部14と、を備えるものである。 (もっと読む)


【課題】テキストに読み方を決定することができない文字が含まれている場合でも、ユーザの発声音声を正確に認識することが可能な音声認識用語彙辞書を生成することができるようにする。
【解決手段】テキスト取得部22により取得されたテキストを構成している文字の読み方を決定する読み方決定部23を設け、辞書生成部24が読み方決定部23により読み方が決定された文字に対して音節を割り当て、読み方決定部23により読み方が決定されない文字又は文字列に対して全種類の音節から構成されたガベジモデルを割り当てることにより、音声認識用語彙辞書を生成する。 (もっと読む)


【課題】人から発話された発話信号を抽出する音響エコー除去を行う環境が複雑な場合でも、高精度に音響エコーを除去することを課題とする。
【解決手段】この音響エコー除去装置は、集音された音声信号を示す観測信号から人により発話された発話信号を抽出する音声認識を行う環境内において、想定しうる状況それぞれに対して伝達特性を予め測定し、測定した伝達特性を保持し、環境内に複数チャンネルで出力される音声信号を示す参照信号を、複数チャンネルのまま受け付け、受け付けられた複数チャンネルの参照信号それぞれに対して、保持される伝達特性それぞれを用いて、音響エコーを推定し、推定された音響エコーそれぞれを用いて、音響エコー除去を行い、音響エコー除去された結果から、発話音声の特徴の強さを表す音声尤度が最も高い結果を選択する。 (もっと読む)


【課題】パーミュテーション問題を解決し、抽出すべきユーザ音声を分離可能な信号分離装置及び信号分離方法を提供すること。
【解決手段】本発明にかかる信号分離装置10は、入力された音信号から特定の音声信号とノイズ信号を分離するものである。パーミュテーション解決部24の結合確率密度分布推定部241は、まず、分離信号のそれぞれの結合確率密度分布を算出する。次に、パーミュテーション解決部24のクラスタリング決定部242は、算出された結合確率密度分布の形状に基づいて、クラスタリングを決定する。 (もっと読む)


【課題】音響モデル学習時の音響分析条件と認識対象の入力信号に対して行う音響分析条件が異なると認識性能が低くなり、音響分析条件を変更すると多くの計算コストとデータが必要となる。
【解決手段】認識対象の入力信号に対し音響分析条件(I)で特徴量を抽出する音響分析手段(I)と、第1の学習用の入力信号に対し音響分析手段(I)において音響分析条件(I)で抽出された特徴量から音声モデル(I)を作成し格納する音声モデル格納手段と、第2の学習用の入力信号に対し音響分析手段(O)において音響モデル作成時と同じ音響分析条件(O)で抽出された特徴量から作成された音声モデル(O)と音声モデル(I)との対応テーブルを格納する対応テーブル格納手段と、音声モデル(I)と対応テーブルとを用いて認識対象の入力信号の特徴量を補正する音響分析条件補正手段と、を少なくとも備える。 (もっと読む)


【課題】情報家電製品等の操作対象を音声により容易且つ確実に操作する操作方法およびそのための操作装置、プログラムを提供すること。
【解決手段】操作方法は、全操作対象の辞書と文法の読込を行う手順a、発声位置−操作対象マップの読込を行う手順b、マイクロフォンアレイから音声データの取り込みを行う手順c、ユーザの発声位置と周囲雑音の到来方向推定を行う手順d、ユーザの発声があると判断したとき、周囲雑音の抑圧と特徴補正を行うと同時に、頭部方向推定および操作対象の特定と操作対象に基づく辞書および文法の切替を行う手順e、切り替えた操作対象の辞書と文法に基づいて求めた特徴補正の結果より音声認識処理を行う手順f、音声認識結果を受け取ったときにはその結果により操作対象を遠隔制御し、これら以外の判断結果のときには手順cへ戻る手順からなる。 (もっと読む)


【課題】音声信号区間推定技術と雑音除去技術とを統合的に扱うことにより、高精度な音声信号区間推定及び雑音除去を行う。
【解決手段】入力信号の音響特徴量をフレームごとに抽出する。クリーン音声信号と無音信号の確率モデルを利用し、雑音モデルパラメータを、並列処理により、かつ時間軸に対し順方向だけでなく逆方向にも推定する。そして、フレーム毎に非音声状態/音声確率及び非音声状態確率に対する音声確率の比を算出し、当該音声確率の比と閾値を比較して音声区間推定を行う。さらに、各確率モデルのパラメータと非音声状態/音声確率とを用い、雑音信号を除去する周波数応答フィルタを生成し、当該周波数応答フィルタをインパルス応答フィルタに変換し、入力信号に対して当該インパルス応答フィルタを畳み込んで雑音除去音声信号を生成して出力する。 (もっと読む)


【課題】従来よりもアラインメント精度を高めることができる音楽音響信号と歌詞の時間的対応付けを自動で行うシステムを提供する。
【解決手段】非摩擦音区間抽出部4は、音楽音響信号から摩擦音が存在しない区間を抽出する。アラインメント部17は、時間的対応付け用特徴量に対応する音素を推定する歌声用音響モデル15を備える。アラインメント部17は、時間的対応付け用特徴量抽出部11から得た時間的対応付け用特徴量と、歌声区間推定部9から得た歌声区間と非歌声区間に関する情報と、音素ネットワークSNとを入力として、少なくとも非歌声区間には音素が存在しないという条件及び摩擦音が存在しない区間には摩擦音となる音素が存在しないという条件の下で、アラインメント動作を実行する。 (もっと読む)


101 - 110 / 334