説明

国際特許分類[G10L15/20]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 不利な環境に特に適した音声認識技術,例.雑音またはアクセントのある音声 (334)

国際特許分類[G10L15/20]に分類される特許

41 - 50 / 334


【課題】ハンズフリー通話時において、ユーザの位置や数が逐次変わるような状況においても、高音質で話者の音声を伝送することができる雑音抑圧装置、雑音抑圧方法およびプログラムを提供する。
【解決手段】音声認識処理部11は、マイクロホンアレイ5が収集した周囲の音の音声信号をADC6がデジタル変換し、エコーキャンセラ7がエコーを除去した音声信号を受信する。音声認識処理部11は、受信した音声信号について音声認識を行い、特定の単語を含むか否かを判定する。特定の単語を含む場合、音源方向推定部13は、音声信号に基づいて、音源の方向を推定する。雑音抑圧処理部14は、音源の方向以外の音声を抑圧し、音源の方向の音質を高める。伝送音声選択部12は、音源の方向の音質を高めた音声信号を携帯電話基幹部2に送信する。 (もっと読む)


【課題】エコーキャンセリングしたい音源が、電気的に接続していなくても、当該音源からの音に対してエコーキャンセル処理を確実に施す。
【解決手段】収音装置10のマイクロホンMCからの収音信号Ssはエコーキャンセル部12に与えられるともに音声認識サーバ20へ与えられる。音声認識サーバ20は収音信号Ssに基づいてコンテンツ情報Cimとタイミング情報Ctpとを検出する。コンテンツサーバ30はコンテンツ情報Cimに基づいてコンテンツ音声ファイルCmを読み出す。収音装置10の音声再生部11は、コンテンツ音声ファイルCmをデコードして、タイミング情報Ctpに基づくタイミングで再生し、再生音信号Smをエコーキャンセル部12へ出力する。エコーキャンセル部12は、再生音信号Smに基づいて、収音信号Ssのエコーキャンセル処理を行う。 (もっと読む)


【課題】特徴量に含まれる残留エコー成分を抑制する。
【解決手段】音声判別装置100は、第1音響信号の周波数スペクトルを解析する第1音響信号解析部103と、前記第1音響信号のエコー成分を第2音響信号から抑圧した第3音響信号から、前記第1音響信号の周波数スペクトルを除外して、前記第3音響信号の周波数スペクトルの特徴量を抽出する特徴抽出部101と、を備える。 (もっと読む)


【課題】変化する雑音環境下においても、高精度に音声認識を行うことができるようにする。
【解決手段】入力信号の複数フレームに対して推定された雑音のデータから、雑音の統計量を算出する雑音統計量算出手段11と、雑音統計量算出手段11によって算出された雑音の統計量に基づいて、入力信号の各フレームに含まれる雑音の短時間変動成分を算出する短時間変動雑音成分算出手段12と、雑音統計量算出手段11によって算出された雑音の統計量を用いて、音響モデルを雑音に適応させる音響モデル適応手段13と、入力信号の各フレームに対して、短時間変動雑音成分算出手段12によって算出された当該フレームに含まれる雑音の短時間変動成分を抑圧する雑音抑圧手段14と、雑音抑圧手段14によって抑圧された入力信号を、音響モデル適応手段13によって雑音適応された音響モデルを用いて音声認識を行う音声認識手段15とを備える。 (もっと読む)


【課題】環境の変化に対応することのできる構造を有したソフトマスクを使用した音声認識装置を提供する。
【解決手段】音声認識装置は、複数音源からの混合音を分離する音源分離部(100)と、分離された音声信号の周波数のスペクトル成分ごとに、0から1の間の連続的な値をとりうるソフトマスクを、分離された音声信号の分離信頼度に対する音声信号及びノイズの分布を使用して生成するマスク生成部(400)と、前記音源分離部によって分離された音声を、前記マスク生成部で生成されたソフトマスクを使用して認識する音声認識部(500)と、を備えている。 (もっと読む)


【課題】利用者の聴覚に与える不快感を抑制しつつ、移動体のドアから侵入する雑音を逆位相の音で減衰させることができる音声認識装置を提供する。
【解決手段】音声認識装置2Aは、集音装置41A,41Bによる検出結果を解析し、その解析結果に基づいて音声を認識する音声認識処理部30と、集音装置42による検出結果に応じて雑音消去信号を生成し、可変の増幅率η,ηに基づいて雑音消去信号ncを増幅して増幅雑音消去信号Nca,Ncbを生成し、増幅雑音消去信号Nca,Ncbを消音スピーカ40A,40Bに出力する雑音消去処理部20Aとを備える。雑音消去処理部20Aは、ドア91の開動作及び閉動作のうちの少なくとも一方と連動して増幅率η,ηを変化させる。 (もっと読む)


【課題】現実の利用環境における多様な状況によらず、音声に固有の特徴を確実かつ頑健に抽出して、音声認識に利用する。
【解決手段】一般的な音声認識手法として現在広く普及している隠れマルコフモデル(HMM)に基づく手法では、入力音声を標準パターンと照合する際に、音声区間全体における全ての分析時点(フレーム)の特徴量を均一に評価するため、音声も雑音も同等にスコアに反映されるのに対して、本方法は、音声を識別するための重要な特徴が存在するフォルマントの極大及び極小部分の特徴量を集中的に利用することにより、雑音に頑健な音声認識が可能になる。 (もっと読む)


【課題】ノイズ環境の変動に適応して設置環境下で所期の識別性能を発揮できるか否かの判定を容易に行うことができ、発声検出装置等に適用可能な識別装置を提供する。
【解決手段】識別装置1は、入力信号の入力部2と、識別対象を含むモデル信号を記憶する記憶部8と、入力信号とモデル信号からテスト信号を生成するテスト信号生成部6と、識別モードとテストモードを切り替える切替部3と、両モードにおいて識別対象信号から識別対象を識別できるか否かを判定する識別部4を有する。テストモードで識別部がテスト信号から識別対象を識別できないと判定した場合には、識別モードにおいて識別装置が正常に動作しない異常状態にあることを環境判定出力部7が報知する。 (もっと読む)


【課題】 雑音を正確に推定してパターン認識信号中の雑音を低減するシステムおよび方法を提供する。
【解決手段】 本方法およびシステムは、少なくともクリーン信号確率変数および雑音確率変数の関数として、マッピング確率変数を定義する。次いで、マッピング確率変数の値の分布の少なくとも1つのアスペクトを記述するモデルパラメータを判定する。モデルパラメータに基づいて、クリーン信号確率変数の推定値を判定する。本発明の多くの態様では、マッピング確率変数は信号対雑音比変数であり、本方法およびシステムは、モデルパラメータから信号対雑音比変数の値を推定する。 (もっと読む)


【課題】音声認識システムを持つ各種情報装置において,装置が想定しない発話が装置利用者から発せられたときに,その発話を棄却することで,誤動作する割合を大幅に減らす。
【解決手段】音声認識システムを持つ各種情報処理装置1において,言語モデル学習手段10が情報処理装置1の想定しない文章をモデル化することで言語モデル7を作製し,音声認識辞書作製装置11が想定しない単語を登録した音声認識辞書8を作製する。音声認識手段3がこれらの言語モデル7と音声認識辞書8,音響モデル9を用いて音声入力手段2より入力された人間の発話を音声認識すると,音声認識結果6には各種情報処理装置1が想定しない単語であるというタグ(ラベル)が付いているため,処理手段4において自動的に情報処理装置1が想定しない発話を棄却することで,出力手段5において誤動作することを防ぐ。 (もっと読む)


41 - 50 / 334