説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,061 - 1,070 / 1,255


【課題】訂正発話の認識率を向上させる。
【解決手段】
ユーザによって訂正スイッチ4bが押下されたことに応じて、信号処理装置14は、音響モデル、ポーズ時間、入力ゲインといった音響条件を、通常発話に対して発話速度が遅く、一音一音区切って発話される訂正発話として入力される発話音声に対応するように変更することで実現する。 (もっと読む)


【課題】出力信号に雑音を発生することがなく、主観的な音質に優れた強調音声を得ることのできる雑音抑圧の方法及び装置を提供することである。また、あらゆる背景雑音に対して適切な抑圧係数を用いることによって、十分高い強調音声の品質を達成できる雑音抑圧の方法及び装置を提供することである。
【解決手段】
強調音声パワースペクトルと推定雑音パワースペクトルに基づいて無音部用係数を計算する無音部用係数計算部と、有音部用係数を記憶する有音部用係数記憶部と、得られた無音部用係数と有音部用係数をもとに後抑圧係数を計算するための後抑圧係数計算部を有する。 (もっと読む)


【課題】 入力信号の遅延時間を短くしてエコーを防止し、アタック時間を長くする。
【解決手段】 デジタルオーディオ信号のレベルに基づきコンプレス/リミット用のゲインを生成するゲイン生成処理4とゲイン生成処理4により出力されたコンプレス/リミット用のゲインに時定数を付与するスムーズフィルタ処理5を設けている。スムーズフィルタ処理5は付与された時定数でゲインを従来例より比較的急峻に下げ、スムーズフィルタ処理5により付与されるゲインの時定数が時定数延長処理6により延長され、ゲイン調整処理2に設定される。また、コンプレス/リミット処理プログラムや、このプログラムにより処理されたオーディオ信号がネットワークNWを介して伝送される。 (もっと読む)


【課題】 複数の信号が混合された音声信号を独立成分分析を用いて信号毎に分離する際に、原信号についての知識やマイクロホンの位置等についての情報を利用することなく高い精度でパーミュテーション問題を解消する。
【解決手段】 短時間フーリエ変換部12は、時間領域の観測信号から観測信号のスペクトログラムを生成し、信号分離部13は、観測信号のスペクトログラムを信号毎に分離し、分離信号のスペクトログラムを生成する。パーミュテーション問題解消部15は、パーミュテーションの程度に対応した尺度、具体的には多次元確率密度関数を用いて計算されるKullback-Leiblar情報量、又は多次元の尖度を分離信号のスペクトログラムの略々全体から計算し、当該尺度に基づいて分離信号のスペクトログラムの各周波数binの信号をチャンネル間で入れ替えることでパーミュテーション問題を解消する。 (もっと読む)


オーディオ信号を処理し信号増幅器(24)を制御するオーディオ・コンプレッサ(20)であって、時間フレーム(28)内の入力信号を分析して、その信号が雑音であるかオーディオデータであるかを判定する信号分析部(27,29)を備え、オーディオ・コンプレッサは、その分析結果に基づき信号増幅器のゲインを設定する。分析部は、その信号が雑音であるかオーディオデータであるかを判定する処理において入力信号の自己相関を演算する自己相関部(27)を有するとよい。
(もっと読む)


【課題】雑音環境下において、強い雑音除去を行った場合にも正しく音声区間を検出するとともに、歪みの少ない雑音除去後音声を照合することにより、高い認識性能が得られる音声認識装置を実現する。
【解決手段】音声認識装置は、認識の対象となる音声とこの音声以外の音からなる雑音とを含む音声信号から雑音成分を互いに異なる強度で除去して、SN比が良い第1の雑音除去信号S1及び音声成分の劣化が少ない第2の雑音除去信号S2を生成する雑音除去部3と、第1の雑音除去信号S1の信号パワーに基づいて、音声信号のうち音声成分が存在する区間を検出する音声区間検出部4と、第2の雑音除去信号S2から、音声成分が存在する区間に対応する区間の信号を抽出して、周波数変換を行う周波数変換部5と、周波数変換が行われた第2の雑音除去信号S2と予め準備された音声パターン信号との類似度を求めるパターン照合部6とを備える。 (もっと読む)


【課題】非定常雑音の存在する実環境下において混合された混合信号に好適な信号分離を行うこと。
【解決手段】時系列データx(n)の短時間離散フーリエ変換演算結果X(f,m)と、分離行列W(f)との積の演算をしてY(f,m)を求める。このY(f,m)から求められるパラメータで決定されたピアソン分布系の微分形式をスコア関数とし、Y(f,m)のスコア関数演算結果Φ(Y(f,m))と分離行列W(f)とから、新たな分離行列W(f)を求めることを繰り返して分離行列W(f)を最適化する。この最適化された分離行列W(f)とX(f,m)との積の演算結果を、短時間離散フーリエ変換することで分離信号が得られる。 (もっと読む)


【課題】 記録文書の作成を少ない労力、短時間で行えるように支援する記録文書作成支援システムを提供する。
【解決手段】 特定の分野、例えば裁判の分野に特有の用語等を裁判関連用語データベース25に格納し、裁判関連用語データベース25を参照して高機能音声認識処理部21で音声認識処理を行って認識テキストを作成し、修正処理部35でスピーチ区間検出情報を活用して音声認識対象の音声データと認識テキストとを照合して認識テキストの修正処理を行う。 (もっと読む)


オーディオ入力信号の修正のためのシステムおよび方法が提供される。例示的な実施形態では、適応的複数モデル最適化器が、分解された信号の修正を容易にするために少なくとも一つの源モデル・パラメータを生成するよう構成される。前記適応的複数モデル最適化器は、セグメント・グループ化エンジンおよび源グループ化エンジンを有する。前記セグメント・グループ化エンジンは、同時の諸特徴セグメントをグループ化して、少なくとも一つのセグメント・モデルを生成するよう構成される。前記少なくとも一つのセグメント・モデルは、少なくとも一つの源モデルを生成するために源グループ化エンジンによって使用される。前記少なくとも一つの源モデルは、前記少なくとも一つの源モデル・パラメータを有する。次いで、前記少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の修正のための制御信号が生成されうる。

(もっと読む)


【課題】 音量レベルがしばしば変化するような音声であっても、その変化に追従して音声信号に対する信号処理を施すことができる音声処理装置を提供すること。
【解決手段】 複合機が備える音声処理装置は、通信先機器との間で伝送される音声信号の信号レベルLcを測定し(S145)、RAMに格納されたピーク値LpとS145の処理で測定された信号レベルLcとの差の絶対値(|Lp−Lc|)が、あらかじめ定められた閾値Lhより大きく(S150:はい)、且つ、S145の処理で測定された信号レベルLcが−30dBmより大きい場合に(S155:はい)、音響パラメータ群を更新する(S165)。その結果、音量の最適化、音量に応じたノイズ成分のカット、音量に応じたエコーキャンセルなどが施され、通信先機器との間で伝送される音声信号が聞き取りやすい音声に補正される。 (もっと読む)


1,061 - 1,070 / 1,255