説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

251 - 260 / 1,255


【課題】複数音源からの混合信号に対する音源分離と音声認識を実行し、必要とする認識結果を効率的に取得する装置、方法を提供する。
【解決手段】複数音源からの出力を混合した混合信号からなる観測信号に対して、独立成分分析(ICA)を適用した処理により分離信号を生成するとともに、各分離信号に対する音声認識処理を実行する。さらに音声認識結果の評価情報としての付加情報を生成する。付加情報として音声認識結果の認識信頼度や、音声認識結果が音声認識装置において想定したタスクに関連する認識結果であるか否かを示すタスク内発話度を算出する。これらの付加情報を適用して各チャンネル対応の音声認識結果のスコアを算出してスコアの高い認識結果を選択出力する。 (もっと読む)


【課題】再生対象の音声を切り替える際、ポップノイズの発生による不快感をユーザに与えず、再生音声の切り替え処理時間を短縮することが可能な「音声再生制御装置および音声再生制御方法」を提供する。
【解決手段】第1音声の再生中に、第2音声の再生のトリガとなる操作が行われた場合、自車両の走行状態に応じて定められる規定レベルまで第1音声の音量レベルを段階的に下げた後、第1音声の再生を停止し、第2音声の再生を開始することにより、第1音声の音量が規定レベルに達した後で第1音声の再生が停止される段階において、ポップノイズが発生してもそのレベルが車室内の推定騒音レベルよりも小さくなるようにして、車室内の騒音によるマスキング効果によってポップノイズが聞こえないようにするとともに、規定レベルから0(ゼロ)まで音量レベルを下げるのに要していた時間だけ早く第2音声の再生処理を開始できるようにする。 (もっと読む)


【課題】時間領域の入力信号をフィルタリングするためのフィルタ装置および方法、中間フィルタ定義信号を生成するためのフィルタ発生器および方法を提供する。
【解決手段】時間領域入力信号から複数の複素サブバンド信号を生成するための複素解析フィルタバンクと、複数の中間フィルタとを含み、複数の中間フィルタのうちの少なくとも1つの中間フィルタは、不均一な振幅/周波数特性を有し、複数の中間フィルタはフィルタ特性を有するフィルタのインパルス応答に比べてより短いインパルス応答を有する。これにより複数の中間フィルタの不均一な振幅/周波数特性は不均一なフィルタ特性、および時間領域出力信号を得るために中間フィルタの出力を合成するための複素合成フィルタバンクを実現する。 (もっと読む)


【課題】時間領域入力信号をフィルタリングする為のフィルタ装置とその方法、及び中間フィルタ定義信号を出力する為のフィルタ発生器とその方法の提供。
【解決手段】時間領域出力信号を得る為に不均一な振幅/周波数特性を有するフィルタ特性を用いてフィルタリングされる時間領域入力信号をフィルタリングするフィルタ装置は、時間領域入力信号から複数の複素サブバンド信号を生成するための複素解析フィルタバンク101と、複数の中間フィルタとを含み、複数の中間フィルタのうちの少なくとも1つの中間フィルタは、不均一な振幅/周波数特性を有し、複数の中間フィルタはフィルタ特性を有するフィルタのインパルス応答に比べてより短いインパルス応答を有し、複数の中間フィルタの不均一な振幅/周波数特性は不均一なフィルタ特性、および時間領域出力信号を得るために中間フィルタの出力を合成するための複素合成フィルタバンク103を示す。 (もっと読む)


【課題】音声入力用マイクロフォンの指向性軸を音源に対して向ける。
【解決手段】ナビゲーション装置は、音声入力用の複数のマイクロフォンと、上記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、上記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し上記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、上記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、上記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、選択するディレイ量選択部、選択されたディレイ量の組合せを用いて生成された上記音声信号を認識する認識部と、上記認識部の認識結果に基づいて当該装置の動作を制御する制御部と、を有する。 (もっと読む)


【課題】雑音が抑圧されたより高い音声品質を実現する。
【解決手段】音信号処理方法200は、時間期間において第1の入力音信号の音声区間と雑音区間を判定し(222)、雑音区間における第1の入力音信号の電力の大きさが第1の閾値より大きいかどうかを判定する(230)。雑音区間における第1の入力音信号の電力の大きさが第1の閾値より大きくないと判定された場合には、第1の抑圧部226により、雑音区間における判定された電力の大きさに基づいて、第1の入力音信号の音声区間および雑音区間における雑音を抑圧する。雑音区間における第1の入力音信号の電力の大きさが第1の閾値より大きいと判定された場合には、第2の抑圧部270により、第1と第2の入力音信号の間の位相差に応じて第1の入力音信号を抑圧する。 (もっと読む)


【課題】被写体である人物の声を鮮明に記録する撮像装置を提供する。
【解決手段】被写体を撮像する撮像手段と、音声を入力する音声入力手段と、撮像手段により撮像された被写体が発声を行っているかどうかを判定する発声判定手段と、を有し、発声判定手段により被写体が発声を行っていると判定されたときに、被写体の特性を判定し、音声入力手段により入力された音声のうち、被写体の特性に適した帯域を強調して記録する。 (もっと読む)


【課題】予め多数の雑音情報を記憶することなく、未知な雑音を含む多種多様な雑音を抑圧する雑音抑圧技術を提供すること。
【解決手段】 情報処理装置に接続可能な付属装置であって、情報処理装置は、雑音情報を用いて劣化信号中の雑音を抑圧する雑音抑圧劣化信号中の雑音を抑圧し、雑音抑圧結果に基づいて雑音情報を生成し、生成された雑音情報を用いて劣化信号中の雑音を抑圧する手段と、劣化信号中の雑音を抑圧した結果に基づいて雑音情報を生成する雑音情報生成手段と、を備え、付属装置は、雑音抑圧手段が抑圧すべき雑音を発生させる機構部と、雑音抑圧手段が雑音抑圧処理を行なうタイミングで雑音が発生するように機構部を制御する機構制御部と、を備える。 (もっと読む)


【課題】予め多数の雑音情報を記憶することなく、未知な雑音を含む多種多様な雑音を抑圧する雑音抑圧技術を提供する。
【解決手段】複数の周波数成分に分割された劣化信号(所望の信号と雑音とが混合された信号)中の雑音を抑圧し、位相情報を除外された振幅スペクトルから雑音抑圧結果に基づいて雑音情報を生成し、生成された雑音情報を用いて劣化信号中の雑音を抑圧し、抑圧されたスペクトルと該位相情報とから強調信号を生成する。 (もっと読む)


【課題】所望の音声と同時に発生したキー押下時の衝撃音を、スピーカから出力するとき減衰させることができる携帯端末装置を提供する。
【解決手段】集音した音を第1電気信号へ変換するマイク部20と、第1電気信号を符号化した第1音声信号を生成する音声処理部41と、ユーザの入力に基づいて検知信号を出力するキー部30と、検知信号を受け取ると、第1電気信号に含まれるキー部30の押下時の衝撃音100に相当する電気信号を符号化した第2音声信号を生成し、第2音声信号に対して逆位相の第3音声信号を生成するノイズキャンセラ部42とを具備する。 (もっと読む)


251 - 260 / 1,255