説明

Fターム[5D015GG00]の内容

音声認識 (5,191) | 標準パターンの学習 (485)

Fターム[5D015GG00]の下位に属するFターム

Fターム[5D015GG00]に分類される特許

101 - 120 / 166


【課題】雑音等の個別の変動に実時間で追従して、精度高く認識できる音声認識システムを提供する。
【解決手段】音声認識システムは、異なる発話環境での発話音声のデコードに最適化された、それぞれ所定の音響特徴量をパラメータとする複数の音響モデル群を記憶する記憶部と、入力音声から所定の音響特徴量を算出する特徴量算出部と、この音響特徴量に基づいて、それぞれ複数の音響モデル群の混合重み適応化により、入力音声の発話環境に適応化された複数の適応化音響モデルを作成するモデル適応化部と、複数の適応化音響モデルを用いて、入力音声の所定の音響特徴量をデコードし複数の仮説を出力するデコーダと、デコーダが出力する複数の仮説に基づいて、各単語に対し、当該単語に対する一般化単語事後確率の関数で定まるスコアが付与された単語ラティスを生成し、当該単語ラティス上で、スコアが所定の条件を充足する経路上の単語列を音声認識結果として出力する仮説統合部314とを含む。 (もっと読む)


【課題】 利用者やアプリケーション開発者に負担を与えずに高精度な認識機能を実現することができる認識器構築システム、認識器構築方法、組立サービス提供システム、およびプログラムを提供すること。
【解決手段】 認識処理実行端末装置(例えば音声認識処理実行端末装置20)のプロキシエージェント処理手段30から組立サービス提供システム70へ組立データ取得要求信号を送信し、組立サービス提供システム70で、要求に応じた組立データを選択し、これを音声認識処理実行端末装置20へ送信し、音声認識処理実行端末装置20のプロキシエージェント処理手段30が、組立データを用いてモジュール提供システム100からパターン認識器(例えば音声認識器)の構成モジュールを取得し、音声認識器を組み立てる。 (もっと読む)


【課題】 テスト発話なしで音声認識の精度を予測できるようにする。
【解決手段】 雑音を含む音声に対し、複数の音声認識方式のうちで最も精度が高い音声認識が可能であると予測される方式を判定するための最適音声認識方式選択装置は、入力音声から所定の音響特徴量ベクトルを算出する特徴量算出部180と、変換行列でこの音響特徴量ベクトルを次元数の小さな特徴量ベクトルに変換する変換処理部182と、変換後の特徴量ベクトルと予め準備されていた重回帰係数とを用いて、音声認識の精度を音声認識方式毎に予測する予測精度算出部184と、最も高い精度で音声認識が可能な音声認識方式を選択する最大値選択部185とを含む。 (もっと読む)


【課題】乗車などに起因する発話歪があっても音声を性能良く認識できる音響モデルを提供する。
【解決手段】音響的雑音が実質的にない環境において所定の音声を収録して無歪音声コーパス1を作成するステップと、ステップで作成した無歪音声コーパスの音声を、移動体の移動速度に対応した発話に変形する発話変換フィルタ手段2を用いて補正し、移動環境音声コーパス3を作成するステップと、ステップで作成された移動環境音声コーパス3を学習データとして学習して音響モデル4を作成するステップと、を有する。 (もっと読む)


【課題】訂正発話時におけるユーザの負担を軽減することができる音声対話装置を提供する。
【解決手段】音声対話装置における信号処理装置14は、音声認識の対象となる語彙を含む第1の言語モデルを用いて第1の発話音声を照合した第1の照合結果が採用されなかった場合には、その語彙の属性を表す他の語彙を含む第2の言語モデルを用いて第2の発話音声を照合し、得られた第2の照合結果によって限定される言語モデルを用いて第1の発話音声を再度音声認識し、音声認識結果に応じたシステム応答を生成する。 (もっと読む)


【課題】 音声認識を用いた番組等の情報検索における音声認識精度を向上させること。
【解決手段】 視聴履歴記憶部103は、利用者が過去に視聴した番組の視聴頻度の情報を含む視聴履歴を記憶している。キーワード抽出部102は、視聴頻度に関する基準を上回る番組を番組情報データから抽出する。認識辞書作成部106は、抽出された番組の関連語を認識辞書に登録する。その後、音声認識部108は、入力した音声に対し、関連語が登録された認識辞書を用いて音声認識を行う。 (もっと読む)


【課題】音声認識における単語認識率を向上させることができる辞書を作成する辞書作成装置を提供する。
【解決手段】辞書30に属する単語を用いた文章に対して単語区切りと文節区切りとが予め付与された学習テキストを記憶した学習テキストDB10に基づいて、辞書30を更新して作成する辞書作成装置20であって、学習テキストに出現する単語ペアの出現頻度をそれぞれ計算する出現頻度計算手段21と、出現頻度の高いN個の単語ペアについて、学習テキストにおいて、単語ペアを複数の単語とみなしたときのエントロピーと、単語ペアを1つの単語とみなしたときのエントロピーとの差分をそれぞれ計算し、この差分が最大となる単語ペアを抽出するエントロピー計算手段22と、抽出された単語ペアを1つの単語とみなした複合語として辞書30に追加する語彙更新手段23とを備える。 (もっと読む)


【課題】ターゲット言語とは異なるソース言語の言語資源を用いて、ターゲット言語の音響モデルを迅速に開発することが可能な装置を提供する。
【解決手段】第1の言語の音響モデル(AM)を開発するためのモデル50は、第2の言語の音声データと、第2の言語の音素ラベルを第1の言語の音素ラベルにマッピングするためのマッピングテーブル66と、テーブル66に従って、第2の言語の音素ラベルを第1の言語の音素ラベルに置換するための置換モジュール62と、第2の言語の音素ラベルが第1の言語の音素ラベルと置換された音声データを用いて、シード音響モデル72をトレーニングするトレーニングモジュール70とを含む。 (もっと読む)


【課題】 機能や電話帳の発信先等の誤認識を低減可能な電話機を提供する。
【解決手段】 操作者Aが電話機1を操作する時、撮影部12で操作者A自身を撮影する。撮影部12で撮影した画像が画像認識部13で、画像特徴記憶部14に記憶されている画像との比較を行い、操作者Aが画像特徴記憶部14のデータテーブルに登録されているデータの中から“操作者A”であることを識別し、制御部11に通知する。制御部11はその認識結果にしたがって、音声特徴記憶部17に記憶されている認識辞書から音声認識部16が使用する認識辞書を“操作者A”の辞書である認識辞書Aに切替える。音声認識部16は音声入力部15から入力された音声に対して認識辞書Aに登録されている単語との比較を行う。制御部11は音声認識部16からの認識結果の処理を起動するように制御する。 (もっと読む)


【課題】 通信端末からの音声入力時の背景騒音環境が変化する様々な場面においても、精度よく音声認識を行う。
【解決手段】 通信端末1と通信網200を介して接続される記憶手段2を備え、通信端末1は、音声や周囲の騒音が入力される音声入力手段11と、音声入力手段11から入力された音声の特徴量を抽出する特徴抽出手段12と、音声の特徴量を所定の認識モデルパラメータと照合することにより音声を認識する音声認識手段13と、音声入力手段11から入力された周囲の騒音を検証する騒音検証手段14とを有し、騒音検証手段14は、周囲の騒音を検証したときに、検証した騒音の種類に応じた認識モデルパラメータを記憶手段2に記憶されている複数の認識モデルパラメータセットの中から選択し、音声認識手段13は、騒音検証手段14によって選択された認識モデルパラメータを用いて、音声認識を行なう。 (もっと読む)


【課題】多様な検索範囲の設定が可能な施設検索装置を提供する。
【解決手段】入力装置から入力された施設名称または施設ジャンルに該当する施設を、地図データの所定の検索範囲内から検索する施設検索装置において、地図データに記憶されている場所名称と、その場所名称と施設名称または施設ジャンルとの間の位置関係を指定する位置指定語との組み合わせに基づいて検索範囲を決定するようにし、位置指定語として、指定する位置関係が異なる複数種類の位置指定語を予め記憶しておく。このようにすれば、同一の場所名称であっても、位置指定語が異なる場合には異なる検索範囲が設定されるので、多様な検索範囲の設定が可能となる。 (もっと読む)


【課題】音声が背景雑音もしくはこの抑圧処理の影響により歪んだり話者の発話内容が異なる場合でも、他人話者の音声の特徴ベクトルを必要とすることなく照合精度を高める。
【解決手段】音声特徴生成処理部1において入力音声から特徴量を抽出して特徴ベクトルを生成すると共に、この生成された特徴ベクトル集合の重心を求めることにより特徴代表ベクトルを生成する。そして照合モードにおいて、第1及び第2の話者特徴変換処理部6,7により、変換係数・しきい値制御部4から与えられる変換係数をもとにコードベクトル及び話者の特徴ベクトル集合をそれぞれの特徴代表ベクトルに近づけるための変換処理を行い、この変換処理後のベクトル間のVQ歪みをしきい値判定処理部9によりしきい値と比較し、これにより話者の本人判定を行っている。 (もっと読む)


【課題】 音声認識に代表される認識結果に誤りが含まれるテキストを入力としてマイニング処理した場合に、その認識の信頼度をテキストマイニング結果と共に利用者へ提供する。
【解決手段】 音声認識手段21では、音声データを認識しテキスト化し、音声認識信頼度計算手段22では、音声認識結果に含まれる単語1語1語に対する信頼度が計算される。マイニング計算手段24は、音声認識テキストに対しマイニング処理する。マイニング結果信頼度計算手段25では、音声認識信頼度を参照しつつ、テキストマイニング処理結果の上位リストに含まれる単語または表現について信頼度を計算する。マイニング結果提示手段26では、テキストマイニング結果の上位リストに含まれる単語または表現について、その単語または表現と共に計算した信頼度を利用者へ提示する。 (もっと読む)


【課題】 音声操作にともなうスイッチ操作の手間を省きながら音声認識精度を向上させる。
【解決手段】 機器の操作部材をグループ分けし、操作部材が操作されたときにその操作部材が属するグループに関連のある語彙が認識されやすくなるように言語辞書の内容を変更し、操作部材のいずれかが操作されると音声認識処理を開始するとともに、集音手段により集音した音声と操作部材に応じて変更された言語辞書とを照合して発話者の発話した言葉を認識する。また、認識された言葉に関連のある語彙が認識されやすくなるように言語辞書の内容を変更するとともに、集音手段により集音した音声と認識言葉に応じて変更された言語辞書とを照合して発話者の発話した言葉を認識する。 (もっと読む)


【課題】音響信号の質を向上させる超音波ドップラ技法を使用する。
【解決手段】方法及びシステムは、同時に音響源の可動部分から超音波ドップラ信号を取得しながら、音響源からマイクロフォンによって取得された音響信号の質を向上させる。そして、モデルに従って音響信号とドップラ信号とを分析することにより、質の向上した音響信号を生成する。 (もっと読む)


【課題】より使い勝手の良い、音声及び手動による操作手段を装備した機器制御システムを提供すること。
【解決手段】音声及び手動による操作手段を備え、その操作手段から選択された操作命令項目に基づいて機器の制御を行なう機器制御システムにおいて、音声操作による操作命令項目が手動操作による操作命令項目よりもより最終的な操作命令項目で構成し、手動操作による階層数よりも音声操作による階層数を少なくする。
(もっと読む)


【課題】住人の日々の生活行動の情報の蓄積から住人にとって生活に関わる意味のある生活支援情報を提示することで、生活支援効果を高めることができる宅内システムを提供することにある。
【解決手段】空間インタフェース1のセンサ手段10は住空間RMにいる住人Mの行動を検知して、その検知データを生活情報としてホームサーバ2へ宅内ネットワークNTを介して送る。ホームサーバ2の生活情報収集手段21は空間インタフェース1から送られてきた生活情報を生活行動の観点された生活情報に変換して生活情報記憶手段22に記憶させ、意味情報抽出手段23はこの記憶された生活情報から更に現時点、現空間で住人Mに意味のある情報を抽出する。この意味のある情報は意味情報提示制御手段25により生活支援情報として空間インタフェース1へ送って提示手段11に分かり易くする提示させる。 (もっと読む)


【課題】 複数の音声認識システムを用いる場合であっても、認識用辞書を容易にダウンロードし使用することができるようにする。
【解決手段】 RFIDタグ202,302を含む辞書タグ201,301を用意し、RFIDタグ202,302に認識用辞書を特定するための認識辞書IDを予め記憶させる。音声認識システム100の情報読込部102は、ユーザによってセットされた辞書タグ201,301から認識用辞書IDを読み込む。また、音声認識システム100の制御部104は、読み込んだ認識用辞書IDを辞書配信サーバ108に送信する。すると、辞書配信サーバ108は、対応する認識用辞書を抽出し、通信ネットワーク500を介して音声認識システム100に配信する。そして、音声認識システムの音声認識部105は、受信した認識用辞書を用いて、入力音声を音声認識する。 (もっと読む)


【課題】 見知らぬ外国人と会話をするための翻訳装置において、相手の話す言語を確実に決定し会話を成立させる翻訳システムを提供する。
【解決手段】 ユーザ端末100に、現在の位置情報を決定する位置決定手段113と、相手の映像を撮影するカメラ130とを備え、翻訳センタサーバ200に、会話を行っている相手の音声から言語を判別する言語判別手段221と、その撮影された映像からその人物の人種を判別し言語を判別する人種判別手段231とを備える。 (もっと読む)


【課題】 HMMのパラメータである平均値ベクトルを状態内で直線的または2次曲線的に変化させかつ、状態間でも連続させることにより、入力音声との親和性を高め、従来と比較してより認識性能の高い音声認識方法を提供する。
【解決手段】 予めカテゴリR(w)(w=1〜W)に属することが分かっている入力信号を訓練データとして、同一状態が連続するときは、そこに含まれるフレームに対して、その状態におけるパラメータは時間的に線形に変化し、かつ隣り合う状態のパラメータは連続するという拘束条件のもとに、そのモデルからの上記入力信号の発生尤度が最大になるように上記パラメータを算出するパラメータ算出手段505〜518を備える。 (もっと読む)


101 - 120 / 166