説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

61 - 70 / 119


【課題】本発明は従来システムに関連した問題を実質的に減少、或いは除去する話者に依存しない認識システム及び方法を提供する。
【解決手段】ユーザが定義したフレーズの話者に依存しない認識のための外れ語彙のスコアを決定するシステム及び方法が、登録文法(36)を用いて話者に依存しない(SI)認識モデル(34)のセットと共にユーザが定義したフレーズを登録することを含む。話されたフレーズの登録文法のスコアは、登録文法(36)を用いて話されたフレーズの特徴をSI認識モデル(34)と比較することによって、決定される。登録文法のスコアは、外れスコア(94)を発生するためにペナルティーが適用される。 (もっと読む)


【課題】単語グループ間バイグラムテーブルのテーブルサイズを削減することができる音声認識装置を得ることを目的とする。
【解決手段】先行単語グループに属する単語と後続単語グループに属する単語の組み合わせの中に、単語バイグラムテーブル3に保存されている単語バイグラムに適合する単語の組み合わせが存在すれば、先行単語グループと後続単語グループ間の単語グループ間バイグラムを算出する。これにより、単語グループ間バイグラムテーブル10のテーブルサイズを削減することができるようになる。 (もっと読む)


【課題】発話の評価を効率的に、かつ、その評価結果の有効性を担保しつつ実施可能にすること。
【解決手段】発話の音声データに基づいて音声認識部6が生成した認識結果データから、選別部4が評価着目点管理部3を介して評価着目点管理テーブル2を参照して、着目点情報と対応付けられた選別動作に従い、データ格納部7から評価の対象とする認識結果データを選別し、評価部5が評価着目点管理部3を介して評価着目点管理テーブル2を参照して、着目点情報と対応付けられたデータ出力動作に従い、認識結果データの表示、音声データの再生を行う。 (もっと読む)


【課題】 認識対象語を木構造で表現する音声認識において、尤度計算にかかる演算量を低減する。
【解決手段】 注目ノードを共有する各認識対象語の言語スコアに基づいて当該注目ノードの言語スコア予測値を生成するとともに、ルートノードから注目ノードの親ノードまでのパスで表現される連接仮説の尤度に注目ノードの音響スコアを加算する。その後、その加算結果から、上記親ノードが注目ノードであった時の言語スコア予測値を減じたうえで注目ノードの言語スコア予測値を加算することで言語スコア予測値の更新を行う。ここで、上記言語スコア予測値の更新は、木構造の特定の位置で打ち切られる。 (もっと読む)


【課題】音声認識の精度を向上させることにより、誤動作の発生を低下させることのできるロボットおよび音声認識装置ならびにその方法を提供することを目的とする。
【解決手段】マイクロフォン14と、マイクロフォン14から入力された音声を認識する音声認識部50と、ロボット本体周辺の人物を検知する人物検知部51aと、人物検知部51aにより人物が検知された場合に、音声認識部50による音声認識結果を有効とする音声認識採否判断部53と、音声認識採否判断部53により音声認識結果が有効とされた場合に、該音声認識結果に対応する応答動作を実行する応答動作実行部53とを具備するロボットを提供する。 (もっと読む)


【課題】対話システムにおいて、複雑なルール構築を不要とする。
【解決手段】応答文生成装置100はユーザ発話とその応答文との発話対、およびその発話対における対話状態のラベル値を付与した対話コーパスを記憶する対話コーパス記憶部133を備える構成とした。すなわち、まず対話状態管理部140はこの対話コーパスに含まれるユーザ発話とその応答文と前記したラベル値とに基づき、入力されたユーザ発話がどのような対話状態か(どのようなラベル値に該当するか)を判断する。そして、応答文生成部150は、判断した対話状態に類似するユーザ発話の応答文を対話コーパスから検索する。つまり、入力されたユーザ発話の応答文として最も適切である可能性が高い応答文を対話コーパス記憶部133から検索する。そして、この検索した応答文に修正を行い、入力されたユーザ発話に対する応答文として出力する構成とした。 (もっと読む)


【課題】 本発明は、音声内容を示す単語などの認識単位に対する可能性を確率で表現したものを出力でき、また、隠れマルコフモデルなどの音響モデルを用いた従来法に比して音声認識性能を確実に向上できる音声認識装置及び音声認識方法を提供する。
【解決手段】 受信した音声信号について、従来の音響モデルの尤度を、罰金付ロジスティック回帰機械(Penalized Logistic Regression Machine;PLRM)の回帰関数に取り込み、PLRMの係数パラメータWとハイパーパラメータΛを学習して最適化し、これらのパラメータを用いて、音声信号の発声内容を表す認識単位の予測確率を計算する。 (もっと読む)


【課題】従来の音声処理装置においては、音声認識結果をユーザへ効率的に提示することができないという課題があった。
【解決手段】音声を受け付ける音声受付部と、前記音声に対して音声認識し、予め決められた数の音声認識結果の候補であるNベスト候補を取得する候補取得部と、前記候補取得部が取得したNベスト候補のそれぞれの候補に対して、信頼性を算出する信頼性算出部と、前記信頼性算出部が算出した各候補の信頼性に基づいて、各候補の一部または全部を出力する出力部とを具備する音声処理装置により、音声認識結果をユーザへ効率的に提示することができる。 (もっと読む)


【課題】 ユーザが言い直し発声を行った場合に、人間同士の会話のように言い直しを正しく受理できる音声認識システムおよび音声処理システムを提供する。
【解決手段】 発話音声データを特徴量に変換する音響処理部11と、発話音声データから音声区間を判定する音声区間判定部12と、音声区間判定部12により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部18と、優先度判定部18により選択された音声区間の特徴量と音響モデルとを用いて、認識語彙との一致度を算出する照合部13とを備える。優先度判定部18は、前記所定の優先度判定基準として下記の少なくとも一つを用いる。
(1)音声区間長
(2)音声区間のパワーまたはSN比
(3)音声区間の時系列的な前後関係 (もっと読む)


【課題】音声認識の対象となる語彙の高認識率化が可能な認識文法モデル作成方法を提供する。
【解決手段】入力された語彙が発音辞書部に記憶されている場合は、入力された語彙に関係付けられた音素列を発音辞書部から取得し(S2)取得先が発音辞書部であることを識別する辞書区別を生成し(S4)、入力された語彙が発音辞書部に記憶されていない場合は、入力された語彙の音素列を発音生成部で生成し(S3)取得先が発音生成部であることを識別する生成区別を生成し(S4)、入力された語彙、入力された語彙の音素列と、入力された語彙の辞書区別又は生成区別を関係付けた認識文法モデルを記憶し(S5)、認識パラメータを生成する(S10)。 (もっと読む)


61 - 70 / 119