説明

Fターム[5D015JJ02]の内容

音声認識 (5,191) | パターン照合によらない認識 (78) | 子音の識別 (12)

Fターム[5D015JJ02]の下位に属するFターム

Fターム[5D015JJ02]に分類される特許

1 - 6 / 6


【課題】口先だけで発せられる短い子音のみからなる音素を認識する場合、簡単な計算処理で認識できるようにするとともに、その音素の種類も特定できるようにする。
【解決手段】入力された音にたいして周波数解析し、そのスペクトル重心を抽出する。また、あらかじめ2つの周波数に対する協和度を示す値を記憶させておき、前記パワースペクトルのうち、最も強いパワースペクトルから順に複数の周波数を抽出して、それぞれの協和度を抽出する。また、パワースペクトルのうち、所定の周波数を超える周波数領域におけるパワースペクトルの特性を示す特性値を抽出し、これらのスペクトル重心、協和度、シャープネスの特性値のそれぞれの組み合わせによって音素の種類を特定する。 (もっと読む)


【課題】騒音レベルの増長を抑えた上で音声の内容を隠蔽する。
【解決手段】音声情報秘話システムは、ブース2にいる顧客6の発話音声を受け、それを表す音声信号を生成するマイクロホンMicと、マイクロホンMicによって生成された音声信号を変更するSDコントローラ部SDと、SDコントローラ部SDによって変更された音声信号を音声に変換して発話音声が受聴されうる隣接ブース2’に出力するスピーカSPと、を有する。SDコントローラ部SDは、マイクロホンMicによって生成された音声信号から子音部分を抽出する部分抽出部と、その子音部分を置換もしくは時間反転する部分変更部と、そのように子音部分が置換もしくは反転された音声信号をスピーカSPに出力する出力部と、を含む。 (もっと読む)


【課題】隠れマルコフモデルを用いる音声認識を高精度に行う。
【解決手段】特徴量抽出手段111は、入力音声にフレームを割り当て、各フレーム毎の特徴量を抽出する。累積尤度算出手段113は、隠れマルコフモデルを用いて、各フレーム毎における状態毎の累積尤度を算出する。このとき、子音を示すフレームについては通常の尤度演算を行うが、母音を示すフレームにおいては、類似したモデルを集めたグループ毎に尤度演算を行う。そして、最大の累積尤度を与えるグループが定まった後は、そのグループについてだけ尤度演算を行うことに決定する。これにより、話者の個人差の少ない子音と、個人差の多い母音とに分け、母音についてだけ個人差を考慮した認識ができ、その結果、音声認識処理の高精度化が図られる。 (もっと読む)


【課題】 無声音声と口唇画像とから有音音声を合成する際に、発話者が意図する抑揚を合成音声に反映させる。
【解決手段】 本発明は、発話者の無声音声と撮像口唇画像とが同期して入力され、有音音声を合成する音声合成装置に関する。映像信号分析手段は、入力口唇画像から有声音の母音情報を抽出し、母音発声時の口唇の開閉大きさと、予め設定した基準大きさとの比率をピッチ比率として抽出する。音声信号分析手段は、入力無声音声と、映像信号分析手段が抽出した母音に対応する無声母音の音響モデルとから、子音情報を抽出し、音素列と単語を対応付けた内蔵する辞書と、どの単語の並びであるかを計算する言語モデルとから、テキスト情報を抽出し、入力無声音声のパワー変化から発声全体の継続時間長を抽出する。音声合成手段は、上述の両分析手段によって抽出された各種情報から、抑揚を付与した有音音声を合成する。 (もっと読む)


【課題】本発明は、アルタイムに近い音声情報伝達が行え、信号処理が簡単で、騒音の多い環境でも、高齢者や聴覚障害者でも子音が聞き取り易く、安価な子音加工装置と音声情報伝達装置及び子音加工方法を提供することを目的とする。
【解決手段】本発明は、入力された音声信号から複数の時間フレームによってそれぞれでフレーム信号を抽出するフレーム分割部1と、フレーム信号のそれぞれで平均パワーまたは音圧レベルを算出するパワー算出部2と、フレーム信号間で平均パワーまたは音圧レベルを互いに比較する比較部3と、比較部3の比較結果に基づいて音声信号が子音であるか否かを判定する子音判定部4と、子音判定部4が子音と判断した場合は音声信号の増幅対象点または増幅対象幅を増幅すると共に、子音または音節の端点でないと判断した場合は増幅しない増幅部とを備えたことを主要な特徴とする。 (もっと読む)


【課題】入力された音声信号に対して的確にスピーチ/非スピーチを判別することが可能な音声信号判別装置を提供する。
【解決手段】音声信号判別装置において、入力された音声信号がスピーチに対応するものか、非スピーチに対応するものかを判別するための判定を行うスピーチ/非スピーチ判定手段12と、入力された音声信号が、モノラル信号又はステレオ信号のいずれであるかを判定するモノラル/ステレオ判定手段13と、モノラル/ステレオ判定手段13での判定結果に基づいて、スピーチ/非スピーチ判定手段12における判定基準を最適化する基準最適化手段14とを有する。 (もっと読む)


1 - 6 / 6