説明

国際特許分類[G10L15/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識のための特徴抽出;認識単位の選択 (203)

国際特許分類[G10L15/02]に分類される特許

31 - 40 / 203


【課題】認識するカテゴリ間の部分空間同士の角度を広げる場合に、同時に同一カテゴリに属する部分空間の間の角度も広げてしまうという問題があった。
【解決手段】2つのパターンの集合の類似性をパターンの集合から主成分分析により生成した線型部分空間同士の角度で定義する手法において、カテゴリ間の差とカテゴリ内の変動を測る基準に部分空間同士の角度を用い、カテゴリ間の差の強調とカテゴリ内の変動の抑制を同時に行う手法を提供する。 (もっと読む)


【課題】話者や発声場面に依存する特徴のばらつきを考慮して入力音声を所定の意味単位で区切る境界を推定する境界推定装置を提供する。
【解決手段】第1の音声と相関のある第2の音声を第1の意味単位と相関のある第2の意味単位で区切る第2の境界を推定する第1の推定部102と;第2の音声における第2の境界の直前及び直後の少なくとも一方の分析区間の音響的特徴及び言語的特徴の少なくとも一方を分析して分析区間の代表的な特徴を示す代表パターンを生成する生成部110と;代表パターンと第1の音声の複数の算出区間の特徴を示す特徴パターンとの類似度を算出する算出部130と;類似度が閾値より高い算出区間あるいは類似度が相対的に高い算出区間の直前、直後または当該算出区間内のいずれかの位置を第1の境界として推定する第2の推定部141と;を具備する。 (もっと読む)


【課題】認識性を向上させつつ使い勝手の低下を抑制することが可能な音声認識装置及び方法を提供する。
【解決手段】音声認識装置1は、ユーザにより連続的に発話された数字の音声を入力するマイクロフォン10と、マイクロフォン10により入力された連続的な数字の音声を認識する音声認識部20とを備えている。音声認識部20は、マイクロフォン10により入力された連続的な数字の音声を、メタ発話情報に基づいて分割するチャンク判別部24と、発話対象の種別に応じた分割音声毎の桁数を記憶する桁数パターン記憶部25と、チャンク判別部24により分割された音声を、桁数パターン記憶部25に記憶される分割音声毎の桁数とを比較して、音声を認識する認識部27とを備えている。 (もっと読む)


【課題】話者毎の音声の違いを吸収し、より滑らか且つ正確な実ピッチパターンを生成する。
【解決手段】入力音声を音声信号に変換し、所定の信号処理を用いて当該音声信号から音声の基本周波数の時系列データを実ピッチパターンとして抽出し、抽出された実ピッチパターンを次数2以上の縦続一次系モデルの線形和で近似する。 (もっと読む)


【課題】音声の動的信号そのものを高精度にモデル化することを可能にし、これにより、高精度の音声認識や特徴量生成を可能にするに音声信号モデルを用いた音声信号モデル化方法を提供する。
【解決手段】状態方程式(a)及び観測方程式(b)による複数の異なる線形動的システム
xt=Fxt−1+Gwt+ut …(a)
zt=Cxt+vt …(b)
但し、F、C、G:変換行列、xt、zt、wt、vt:確率変数、ut:固定値
を時間毎に切り替えることによって観測信号をモデル化する音声信号モデルであって、状態方程式(a)のシステム入力utを観測値ytとし、観測方程式(b)の変換行列Cに非因果的フィルタを用い、前記観測方程式(b)の観測値ztを非因果的フィルタの動きを規定する目標値mqtとする音声信号モデルを用いた音声信号モデル化方法である。 (もっと読む)


【課題】音声認識前のエンロール機能を活用するための登録作業が必要なく、音声認識に係る認識率を飛躍的に向上させ、誤認識や誤動作を起こすことのない音声認識システムを提供することを課題とする。
【解決手段】認識システム1における認識コンピュータ2は、話者Sが発声する音声Vを検出し、音声情報17を取得する音声情報取得手段8と、音声情報17に基づいて、音声Vに係る発音傾向を分析し、特定する発音傾向特定手段9と、標準辞書SD及び複数の発音傾向辞書X1等を記憶する辞書群記憶手段10と、発音傾向に合致等する一の発音傾向辞書X1等を選定する辞書選定手段11と、標準辞書SDを利用して語彙を照合する標準照合手段12と、発音傾向辞書X1等を利用して語彙を照合する発音傾向照合手段13と、認識された音声Vに係る語彙を出力する語彙出力手段14とを具備する。 (もっと読む)


【課題】検知した音声信号を処理して、行動制御に適した、大まかで管理することのできる音声信号の表現を与える音声プロト・オブジェクトに変換する。
【解決手段】音声信号を感知する一つまたは複数のセンサと、コヒーレントな信号エレメントの音声信号セグメントを計算するためのセグメント計算モジュールと、各音声信号セグメントの一つまたは好ましくは複数の音声特徴の圧縮された表現を計算する、少なくとも一つの圧縮モジュールと、関連する音声信号セグメントの、該圧縮された表現及び時間情報、特に、開始時間及び/または時間間隔を含むデータオブジェクトである、音声プロト・オブジェクトを保管する保管モジュールと、を含む音声信号処理システム。 (もっと読む)


【課題】 音韻、語彙の特徴をより効果的に表現でき、音韻、語彙を含む音声の認識率を高めることができる音声認識装置及び音声認識方法を提供すること。
【解決手段】 本発明による音声認識装置1は、フレーム毎の音声信号を平滑化して線形予測係数を求める平滑化手段4aと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段4bと、線形予測係数と自己相関関数に基づいてフレーム毎の発話時間確率を演算する発話時間確率演算手段4cと、自己相関関数に基づいてフレーム毎の雑音比確率を演算する雑音比確率演算手段4dと、隠れマルコフモデルを用いて、状態遷移確率、出力確率に加えて、発話時間確率と、雑音比確率とに基づいて総体確率を演算して、音声認識を実行する音声認識手段4eと、を含むことを特徴とする。 (もっと読む)


【課題】 音声の認識率を高めることができる音声認識装置及び音声認識方法を提供すること。
【解決手段】 本発明による音声認識装置1は、フレーム毎の音声信号を平滑化して線形予測係数を求める平滑化手段4aと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段4bと、線形予測係数と自己相関関数に基づいてフレーム毎の符号化後パラメータを演算する符号化後パラメータ演算手段4cと、平滑化手段4aの前段の音声信号の各フォルマント周波数における符号化前特徴量を抽出する符号化前特徴量抽出手段4dと、を含むことを特徴とする。 (もっと読む)


【課題】 話者の1つ又は複数の口語言語技能を評価するための技術を提供すること。
【解決手段】 本技術は、話者により発声された音声パッセージにおいて、1つ又は複数の対象となる時間的位置を識別するステップと、1つ又は複数の音響パラメータを計算するステップであって、1つ又は複数の音響パラメータが、1つ又は複数の対象となる位置の1つ又は複数の音響音声学的特徴の1つ又は複数の特性を捉えるステップと、口語言語技能評価の出力を修正するために1つ又は複数の音響パラメータを自動音声認識装置の出力と組み合わせるステップとを含む。 (もっと読む)


31 - 40 / 203