説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

41 - 50 / 119


【課題】発話対象の認識精度を向上すると共に、発話対象の特定が不十分な状態であっても適切な入力処理を行なうことのできる音声入力処理装置および音声入力処理方法を提供すること。
【解決手段】音声入力処理部10は、運転者の顔の向きや生体情報、車両の状況、音声認識エンジン20による認識確度、音声区間の長さなどからユーザの音声が車載装置に対する音声入力である可能性を判定し、その判定結果に基づいて段階入力処理部11が音声入力の動作を段階的に変化させる。 (もっと読む)


【課題】使用者の1回の発話から複数のコマンドを認識して複数の操作対象を操作可能な音声認識装置、音声認識方法、及び音声認識用プログラムを提供する。
【解決手段】音声認識装置は、入力音声の認識結果に基づいて、予め定められた種類の操作対象及びその操作内容から、操作対象及びその操作内容を決定する。音声認識装置は、入力音声を認識することにより、該音声を単語列で表現されるテキストに変換する音声認識手段11と、テキストを構文解析して第1の操作候補群を特定する処理を実行する第1の構文解析手段31と、予め定められた種類の操作対象のうち第1の操作候補群に含まれない操作対象に対して、テキストを構文解析することによって、第2の操作候補群を特定する処理を実行する第2の構文解析手段32と、第1及び第2の操作候補群から、操作対象及びその操作内容を決定するための最終的な操作候補群を特定する操作候補特定手段33とを備える。 (もっと読む)


【課題】話者特定処理に必要な計算量や記憶容量等を最小限に抑制しつつ、ある程度の認識率が得られる話者特定装置を提供する。
【解決手段】話者による発話の音響的特徴を示す話者モデルと、当該話者の発話に相当する特徴量信号Soと、を比較し、それらの間の類似度を検出すると共に、検出された類似度と、当該類似度の検出の際に比較された類似度閾値と、を比較して話者特定を行う話者認識部5と、話者の特定に用いられた話者モデルの更新数に基づいて類似度閾値を更新する閾値設定部6と、を備え、閾値設定部6は、当該更新数を用いて類似度閾値を表した閾値関数であって且つ予め設定された閾値関数と、当該更新数と、を用いて更新後の類似度閾値を求める。 (もっと読む)


【課題】音声認識において、確定はできないが確からしい程度の認識である場合に操作性のよいデータ処理装置を提供する。
【解決手段】データ処理装置は、L1未満であってL2以上の認識率となる入力音声データに対し、認識率の高い順から認識の適否を確認する返答の音声を出力する。 (もっと読む)


【課題】利用者の主観評価を向上させながら、間違った対話を継続しない、かつ不要な応答を行わない音声対話装置を提供する。
【解決手段】受理と確認との閾値である第1の閾値と確認と棄却との閾値である第2の閾値との組合せ条件を複数設定し、入力された音声データを文字データに変換する音声認識手段23と、文字データに含まれる単語の信頼度を算出する信頼度算出手段25と、信頼度を、第1の閾値と、第2の閾値と比較し、受理、確認、棄却のいずれの応答を行うかを制御する応答制御手段27と、を有する音声対話装置1の評価実験を行い、被験者の主観評価結果、特に正確性と効率性の評価結果に基づいて第1の閾値と第2の閾値との組合せ条件の中で最も好ましい条件を決定する。 (もっと読む)


【課題】アプリケーションに適したサイズに言語モデルを枝刈りできる言語モデルの枝刈り方法及び装置を提供する。
【解決手段】(a)複数のn(nは2以上の任意の整数)及び複数のn´(n´は1≦n´<nを満たす整数)−グラムと、各n−グラムの確率及び各n´−グラムの確率とを含む言語モデルに基づき、前記複数のn−グラム及び各n−グラムの確率を含まない初期のベースモデルを生成し、(b)複数のトレーニングデータ及びその標準解答を含むトレーニングコーパスを用いて、前記複数のn−グラムのそれぞれに、対象アプリケーションに関する重要度を計算し、(c)前記複数のn−グラムのうち高い重要度をもつ少なくとも1つのn−グラム及びその確率を前記ベースモデルに追加することにより、枝刈りされた自然言語モデルを得る。 (もっと読む)


【課題】高精度な音声認識を実現する。
【解決手段】学習用の音声信号及び該音声信号に対応して書き起こされたテキストから学習した確率モデルを用いて、入力される認識対象の音声信号に対する音声認識を行う音声認識装置において、前記学習用の音声信号に対して音響特徴量の分析を行う音響分析手段と、前記テキストに対して形態素解析を行う形態素解析手段と、前記音響分析手段及び前記形態素解析手段の結果から所定処理時間毎における音声と文字の対応関係を生成するアライメント生成手段と、前記アライメント生成手段により得られる前記対応関係に基づいて、音声と言語の相関関係確率モデルを学習する相関関係確率学習手段と、前記相関関係確率学習手段により得られる相関関係確率モデルに基づいて、前記認識対象の音声信号に対する音声認識を行う音声認識手段とを有することにより、上記課題を解決する。 (もっと読む)


【課題】ユーザが認識語彙を発話しているにも関わらず、ユーザの発話が誤って棄却されることを防止しながら、認識単語辞書に格納されている認識語彙が変更された場合であっても、棄却単語辞書を更新する手間と時間を削減することができる音声認識装置、音声認識方法、および、音声認識プログラムを提供する。
【解決手段】音声照合部7は、認識対象単語の類似度が第2の閾値よりも大きい場合には、認識対象単語を認識結果として出力し、認識対象単語の類似度が第2の閾値よりも小さい場合には、認識対象単語の類似度が第1の閾値よりも大きく、かつ認識対象単語の類似度が棄却対象単語の類似度よりも大きい場合に、認識対象単語を認識結果として出力する。なお、第1の閾値は、入力音声を棄却するための尺度を示す。第2の閾値は、第1の閾値よりも大きく、認識対象単語を認識結果として出力するための尺度を示す。 (もっと読む)


【課題】メモリ容量が小さい小型端末機器でも比較的長い入力音声を音声認識することができる連続音声認識方法、装置を提案する。
【解決手段】探索処理で使用可能なメモリ制限量をあらかじめ設定し、探索処理中の処理繰返回数が所定値に達するごとにメモリの使用量を計測し、計測したメモリ使用量がメモリ制限量を超えた場合に、一旦探索処理を中断し、中断前までに展開した単語列の仮説を基に中断前までの認識結果を部分認識結果として出力し、中断前までに使用したメモリ領域を開放し、メモリ領域解放後に探索処理を再開する。 (もっと読む)


【課題】離散型HMMの探索コストを低減する。
【解決手段】本発明は、入力されたオリジナルのHMMの状態を初期状態確率、状態遷移確率、または、シンボル出力確率を用いて該HMMをクラスタリングすることにより状態数を削減し、クラスタリングされたHMMと該オリジナルのHMMをデータ格納手段に格納し、近似尤度による探索結果から閾値の初期値を計算し、閾値を用いて近似尤度または正確な尤度を計算し、正確な尤度を用いて閾値を更新する。正確な尤度を計算する際には閾値を用いて計算するかしないかを判断することにより枝刈りを行う。 (もっと読む)


41 - 50 / 119