説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,131 - 1,140 / 1,255


【課題】対話する人間の操作負担を増加させることなく、音声認識精度を向上させることのできる対話型ロボットを提供する。
【解決手段】音声認識可能な対話型ロボット400であって、音声認識の対象となる目的音声の音源方向を推定する音源方向推定手段と、音源方向推定手段が推定した音源方向に当該対話型ロボット自身を移動させる移動手段と、移動手段による移動後の位置において、目的音声を取得する目的音声取得手段と、目的音声取得手段が取得した目的音声に対して音声認識を行う音声認識手段とを備えた。 (もっと読む)


【課題】アナログディスク再生時などに生じるパルス性ノイズを検出し除去する
【解決手段】 パルス性ノイズ検出において、従来の技術では困難であったノイズか楽音の一部なのかを判定する手段として自己相関関数および単峰性かどうかという指標を導入することで検出精度を高めた。また、ノイズ除去方法として線形予測法を用いることで、本来の音声信号の再現性を高めるとともに、誤検出された区間の本来の音声信号への影響を最小限に抑えた。 (もっと読む)


【課題】原信号を連続的かつ忠実に再生することの可能な混合信号分離・抽出装置を提供すること。
【解決手段】連続する2つのサンプリング期間Δt1、Δt2ごとに独立成分分析による分離・抽出処理を実施し、信号分離出力XA(XA,…,XA),XB(XB,…,XB)を得る。さらにΔt1+Δt2における信号分離出力XC(XC,…,XC)を生成し、XCを期間△t1に相当する成分(XA’)と、△t2に相当する成分(XB’)とに分割する。そして(XA,…,XA)の各成分と、(XB,…,XB)の各成分との連結すべき組み合わせを、XAとXA’との相関値、およびXBとXB’との相関値に基づいて算出する。 (もっと読む)


【課題】定常時は1本のマイクロホンで収音した目的音から雑音を除去し、SN比のよい目的音を再生する。
【解決手段】音源分離学習装置は予め2本のマイクロホンで収音した信号を用いて模範となる雑音除去用の帯域別重み値で構成される第1学習データと、この第1学習データに最も近似する帯域別重み値が得られる音響特徴量の種別を第2学習データとして取得する。音源分離装置は単一のマイクロホンで収音した信号を第2学習データで指定される種別の音響特徴量を用いて雑音除去用の帯域別重み値を算出し、この帯域別重み値を単一のマイクロホンで収音した信号を帯域分割した帯域分割信号のそれぞれに乗算し、雑音成分を除去する。 (もっと読む)


【課題】目的音源の近傍に雑音源が存在し、双方が同時に鳴っている場合でも、目的音をSN比よく取り出す。
【解決手段】目的音信号と雑音信号とが混合された信号を複数の帯域信号に分割し、分割された各帯域信号の特徴量を求める。或る帯域信号の特徴量が目的音を表わす値である場合その帯域信号を目的音として判定し、特徴量が雑音を表わす値である場合、その帯域信号を雑音と判定し、その判定結果に従って各帯域信号に重み付けを施し、この重み付けにより雑音成分を除去し、目的音をSN比よく取り出す。 (もっと読む)


【課題】音響エコーキャンセラは、リアルタイムで動作しなければならないという制約がある。複数の発話者に対応するため、同時に複数のマイクロホンに対して音響エコーキャンセル処理を行うと処理量が多くなるため、処理量を減らすことを目的とする。
【解決手段】複数のマイクロホンの音響エコーキャンセラを順次時分割で学習をするときに、マイク一つ当たりのエコーキャンセラの学習において短いタップ長から長いタップ長とするタップ長制御部12と、マイクロホンを順次選択する入力音声選択制御部11とを設けたことにより、マイクロホン全体に対する音響エコーキャンセラの処理量を減らすことができ、これによりマイクロホン全体に対する学習期間を短くし、音響空間の伝達特性の変化に対応しやすくなり、キャンセル量が大きく聞きやすく、ハウリングなどが起こりにくい安定したエコーキャンセラを実現できる。 (もっと読む)


【課題】 小音量の信号のスピーカからの再生特性を、実際に設置されたスピーカの特性に合わせて改善する。
【解決手段】 入力したオーディオ信号を、所定の入出力特性のスピーカ装置から出力させるための補正処理を行う場合に、スピーカ装置に基準となるオーディオ信号を入力し、その基準オーディオ信号による出力をマイクロフォンで拾い、マイクロフォンで得たオーディオ信号と基準オーディオ信号とを比較して、レベル毎の感度の低下量を解析し、スピーカ装置に供給するオーディオ信号の、解析された感度が低下するレベルの信号成分に対して、感度の低下分を補う補正処理を行うようにした。 (もっと読む)


【課題】使用者が発話中にカーナビゲーションのガイダンス音声等の背景音がある場合、発話音声の特徴が背景音声で乱され、正しい音声認識の妨げとなっていた。このため、幾つかの手法が発表されてきているが、なお、十分な認識性能を得るに至っていない。本発明は、より認識精度を向上し、実用性の向上した音声認識装置の提供を目的とした。
【解決手段】先ず、ガイダンス音声信号のみを音声認識装置により分析した結果を記憶装置に登録しておく。使用者の発話と背景音としてガイダンス音声が混在した入力音声信号から、前記記憶装置に登録しているガイダンス音声信号を抽出し、減算して背景音声信号を除去する方法とした。また、エコーキャンセラを併用してさらに除去精度を向上した。 (もっと読む)


【課題】 入出力情報が音に限定される場合においても、ユーザに対話を中断させることなく対話の進捗率度を対話を中断することなく提示することができる音声対話装置を提供する。
【解決手段】 複数のスロットから構成されるタスクフレームの各スロットにデータを入力する音声対話装置であって、ユーザからの各スロットへのデータの入力を受け付ける入力部101と、タスクフレームの複数のスロットへのデータの入力の進捗度を算出する対話管理部103と、タスクフレームに対応した音情報を記憶する音情報DB105と、進捗度に基づいて、音情報の変化または選択を行なう出力音生成部106と、ユーザへ各スロットのデータの入力を要求する音声出力部104と、音声出力部104によるデータの入力要求と同時に、変化または選択後の音情報を再生出力する音出力部107とを備える。 (もっと読む)


【課題】音声認識の精度をより向上することのできる「音声入力装置」を提供する。
【解決手段】ゲイン制御部10は、オーディオ信号のスピーカ3への出力を増幅する出力調整アンプ22のゲインを、発話音声抽出部7で推定されるA/D変換器6が出力するデジタル信号中のオーディオ信号成分のレベルの大きさが、発話音声抽出部7が過去に推定した、A/D変換器6が出力するデジタル信号中の発話音声信号成分のレベルの大きの最小値よりも小さくなるように設定する。また、A/D変換器6へ入力する信号を増幅する入力調整アンプ5のゲインを、発話音声抽出部7が推定した、A/D変換器6が出力するデジタル信号中の発話音声信号成分のレベルの大きさと、A/D変換器6の出力可能な最大レベルとの比率が、1:2となるように設定する。 (もっと読む)


1,131 - 1,140 / 1,255