説明

Fターム[5D015GG01]の内容

音声認識 (5,191) | 標準パターンの学習 (485) | 標準パターンの置換、更新 (134)

Fターム[5D015GG01]に分類される特許

21 - 40 / 134


【課題】学習データに基づいた最適な単語区切りではなく、適応データに応じて逐次的に最適な単語区切りを設定することができる辞書作成装置を提供する。
【解決手段】学習データに内包されている単語情報を単語区切りとともに単語情報記憶部101が記憶する。学習データとは別個の入力データに関連して入力される適応データに内包されている単語情報とnグラムの出現頻度とを出現頻度計算部103が算出する。算出された単語情報と出現頻度とに対応して単語情報記憶部101に記憶されている単語情報の単語区切りを単語情報更新部104が更新する。 (もっと読む)


【課題】本発明の目的は、大量のデータを学習する必要がなく、評価用データを作成せずに、多くの事前準備や計算を行うことなく、言語モデルを会話に適応させ、認識率の高い音声認識を行うことである。
【解決手段】上記の課題を解決するために、本発明に係る音声認識技術は、会話音声を認識し、音声信号から特徴量を抽出し、所定の話者Aの発話内容を含む音声信号から得られる特徴量と音響モデルと適応前の言語モデルを用いて音声認識を行い、認識結果A’を求め、認識結果A’のみと適応前の言語モデルを用いて、適応後の言語モデルを求め、所定の話者以外の話者Bの発話内容を含む音声信号から得られる特徴量と音響モデルと適応後の言語モデルを用いて音声認識を行い、認識結果B’を求める。 (もっと読む)


【課題】限られた時間で効率よく高精度な音響モデル適応を行う。
【解決手段】音響モデル適応装置は、分割部11によって分割された音声信号を音響的な違いに応じてクラスタリングするクラスタリング部12と、クラスタに含まれる音声信号について信頼度を計算する信頼度計算部13と、クラスタに含まれる音声信号を認識することによって推定ラベルを得るラベル推定部14と、信頼度にもとづいて選択された第1のクラスタに含まれる音声信号と推定ラベルとをユーザに提示する提示部15と、提示された音声信号に対する教師ラベルを得る教師ラベル取得部16と、所定の条件が成立すると、提示部15に、第1のクラスタを扱う状態から、第1のクラスタとは異なる第2のクラスタを扱う状態に遷移することを指示する遷移指示部17と、教師ラベルを用いて音響モデルをクラスタ内の音声信号に適応させる音響モデル適応部18とを備えている。 (もっと読む)


【課題】音声認識対象となる単語の言い換え語が複数存在する場合でも、ユーザが意図する単語を選択することが可能な「音声認識装置及び音声認識方法」を提供すること。
【解決手段】音声認識装置は、外部機器又は媒体から音声認識の対象となる原テキストを入力する入力手段と、原テキストを解析して読みデータを生成する読みデータ生成手段と、音声認識辞書用の文字列に変換する変換規則が格納された記憶手段と、音声認識辞書と、入力手段を介して入力された原テキストを記憶手段に格納する制御手段とを有する。制御手段は、原テキストに対する言い換え語を生成し、言い換え語のうち原テキストと一致する言い換え語を特定可能な識別番号をその言い換え語に付与し、言い換え語を読みデータ生成手段に入力して読みデータを取得して、読みデータと認識対象の言い換え語とを関連付けて音声認識辞書に登録する。 (もっと読む)


【課題】ユーザに負担をかけなくても、ユーザに特化して音声モデルを更新する。
【解決手段】電話システム1では、複数の端末装置10間の電話音声のデータが音声モデル更新装置30に送信され、音声モデル更新装置30は当該電話音声データを用いて音声モデルを更新し、当該更新後の音声モデルが端末装置10に送信される。つまり、音声モデルの更新に使われる学習データはユーザの電話音声であり、この電話音声はユーザの通常の電話通信によるものである。言い換えれば、音声モデル更新装置30は音声モデルの更新のためにわざわざユーザに発話をさせる必要がなく、ユーザの通常の端末装置10の使用態様からそのユーザ用の音声モデルを更新するための学習データを得ることができる。以上により、ユーザに負担をかけなくても、ユーザの電話音声を用いてユーザに特化した音声モデル更新を行うことができる。 (もっと読む)


【課題】入力音声から認識される音素系列の精度を高めることができる言語学習装置を提供する。
【解決手段】単語の知識を当初備えていないが学習を進めることで単語の知識を習得する言語学習装置100であって、音素モデルに基づいて音声を音素認識する音素認識手段110と、音素認識手段110で認識された音素情報から単語リストを作成するリスト作成手段120と、リスト作成手段120で作成された単語リスに基づいて音声を単語認識する単語認識手段130と、単語認識手段130で認識された単語情報を利用して言語知識θを学習する学習処理手段140と、単語リストを修正するリスト修正手段150と、を備え、学習処理手段140はリスト修正手段150によって修正された単語リストに基づいて言語知識θを修正する。 (もっと読む)


【課題】発話入力に基づいて複数の機能を有効にするための方法及びシステムを開示する。
【解決手段】システムは、複数の状態を格納するメモリを備える。各状態は、複数の機能からの少なくとも1つの機能に関連付けられる。システムは、データモデルのセットに動作可能に接続される自動音声認識(ASR)エンジンであって、状態毎に1つのデータモデルが存在し、該ASRエンジンは、システムが或る状態にある間、該状態に関連付けられるデータモデルを使用して発話入力を解釈して機能入力にするように構成され、それによって機能が該機能入力に従って有効にされる、自動音声認識エンジンを備える。。システムは、複数の制御部であって、状態毎に1つの制御部が存在し、各制御部は、該状態に関連付けられる信号を生成するように構成される、複数の制御部と、信号に基づいてシステムを上記状態に遷移させるように構成される、状態遷移モジュールとを備える。 (もっと読む)


【課題】高い汎化能力を持ち、少ない適応データで話者独立な音響モデルを話者適応できる話者適応装置を提供する。
【解決手段】話者適応装置は、話者適応のための変換行列及び話者適応用データを記憶する記憶装置と、話者独立な音響モデルに変換行列を適用し、話者適応音響モデルを算出する音響モデル変換部150と、話者適応用データのうち正解データの事後確率が所定範囲に存在するフレームを選択するフレーム選択部142と、選択されたフレームを用い、ソフトマージン推定の目的関数の値を算出する目的関数算出部144、146と、最適化アルゴリズムを用い、目的関数の値を極小化するよう変換行列を更新する更新部148と、更新後の変換行列を用い、音響モデル変換部150、フレーム選択部142、目的関数算出部144,146、及び更新部150を終了条件が充足されるまで繰返し動作させる繰返し制御部154とを含む。 (もっと読む)


【課題】音声認識に用いられる音声認識辞書の更新中に音声認識を可能とする車載情報制御装置を提供する。
【解決手段】車載情報処理装置1は、情報データと当該情報データを特定する識別情報を含む属性データとを有する情報端末2の接続される外部通信装置22と、情報端末2から取得した属性データの一部を音声認識データに変換した音声認識辞書を作成する音声認識辞書作成部34と、音声認識辞書を記憶する音声認識辞書テーブル40と、処理した音声に対応する音声認識データを有する音声認識辞書から識別情報を検出する音声認識処理を行なう音声認識装置25と、識別情報から情報端末2の情報データを情報データ取得部31を介して取得する処理装置20と、音声認識処理により検出される識別情報と情報端末の識別情報との一致または不一致を判定する判定部35とを有し、一致と不一致の場合で取得し提供される情報データを異なるものとする。 (もっと読む)


【課題】認識辞書の更新に係る読み仮名の変更履歴データを効率的に記憶できる携帯電子機器を提供すること。
【解決手段】携帯電話機1は、所定の処理と編集可能な読み仮名とが対応付けられた読み仮名対応データを記憶する読み仮名DB51と、音声認識の結果と照合する読み仮名の選択肢を含む認識辞書データを記憶する認識辞書DB52と、照合された読み仮名に対応する所定の処理を実行する実行部41と、読み仮名対応データと認識辞書データとの読み仮名の差分を示す更新データを記憶する更新情報DB53と、読み仮名対応データが更新された場合に更新データを更新情報DB53へ記憶し、所定のタイミングで認識辞書データを更新する更新部42と、を備え、更新部42は、認識辞書データの更新前に読み仮名対応データが複数回更新された場合に、最後に更新された読み仮名へ認識辞書データを更新するための差分を、1つの更新データに最適化して記憶する。 (もっと読む)


【課題】音声認識装置の認識辞書において、ユーザの発声入力に発声区切りや発声誤りが生じ易い認識語彙についても、確実に認識することが可能な音声認識装置及び音声認識方法を提供することを目的とする
【解決手段】音声認識装置は、認識語彙を記憶する認識辞書と、認識語彙を複数の部分認識語彙に分割する解析部と、部分認識語彙に対して、所定音素の追加、他の語彙との置換、該当する部分認識語彙の削除およびこれらの再結合を行い、派生認識語彙を生成する派生認識語彙生成部と、音声データの入力を受け付ける音声入力部と、音声データの音声区間を検出する音声検出部と、音声データを認識辞書に記憶された認識語彙と派生認識語彙生成部で生成された派生認識語彙を用いて音声認識処理を行う音声認識部を備える。 (もっと読む)


【課題】雑音環境における音声認識方式を提供する。
【解決手段】音声認識の方法は、観測値のシーケンスを含む第1の雑音環境における音声入力を受け取ることと、音響モデルを使用して観測値のシーケンスから生じる単語のシーケンスの尤度を求めることとを備える。上記モデルは、第2の雑音環境において音声を認識するように学習されており、観測値に関連付けられている単語または単語の部分の確率分布に関連する複数のモデルパラメータを有する。上記求めることはさらに、第2の環境において学習されたモデルを第1の環境のモデルに適応させることも備える。 (もっと読む)


【課題】不特定多数の利用者が携帯端末を利用する場合においても、音声認識率を低下させることなく向上させることができる音声認識率の向上方法、管理システム、携帯端末及び携帯端末の音声認識率向上プログラムを提供する。
【解決手段】取得した音を音声認識エンジンにより音声として認識する音声認識部1−3を有した携帯端末1Aには、認識処理した作業者の個人特徴情報を管理サーバー2に送信させ、管理サーバー2は携帯端末1Aから送信された個人特徴情報を各業者毎に個人別データ記憶部2−3bに記憶すると共に、その携帯端末1Aを次回に使用する作業者について個人別データ記憶部2−3bに記憶されている個人特徴情報から次回作業者用音声認識エンジンを作成し、携帯端末1Aは次回の作業者の使用前に、音声認識エンジンを次回作業者用音声認識エンジンに更新する。 (もっと読む)


【課題】テキストと当該テキストの発音データとを登録した音声認識データを、認識対象とする各テキストについて蓄積した音声認識辞書に登録されている一部の音声認識データの編集を行う機能を備えていない場合においても、効率的に音声認識辞書の音声認識データの編集を行える「音声認識辞書編集装置及び音声認識装置」を提供する。
【解決手段】n個の曲名毎に音声認識辞書を作成する(901)。曲名のヨミがユーザによって変更されたならば、当該曲名のヨミ変換ルールを修正する。そして、ヨミが変更された曲名のヨミデータが含まれる各音声認識辞書を、修正後のヨミ変換ルールを用いて再作成する(902-904)。 (もっと読む)


【課題】雑音が変化する環境下でも高い音声認識性能を達成すること。
【解決手段】第1の音声特徴を抽出する特徴抽出部1と、雑音を推定する雑音推定部2と、第1の基底分布の集合を記憶する制御を行う第1の分布記憶制御部4と、推定された雑音に基づいて第1の基底分布の各々から第2の基底分布を合成し記憶する分布合成部6と、第1の音響モデルを記憶する制御を行う第1の音響モデル記憶制御部8と、第1の音声特徴の系列と第1の音響モデルとを照合して状態事後確率を算出する確率算出部9と、第2の基底分布の各々に対応する混合重みを記憶する制御を行う混合重み記憶制御部11と、状態事後確率を用いて混合重みを融合して融合混合重みを算出する混合重み融合部12と、融合混合重みで第2の基底分布を混合し混合分布を生成する混合分布生成部13と、混合分布を用いて第1の音声特徴から第2の音声特徴を推定する特徴強調部14と、を備えた。 (もっと読む)


【課題】音声認識における認識率を高く保つことができる車載装置20を提供する。
【解決手段】本発明の車載装置20は、ユーザが発声した音声の特徴との類似度が高い標準パターンに対応するコマンドを標準パターン格納部23から抽出して実行する。また、車載装置20は、ユーザからの手動操作を受け付け、当該手動操作に対応するコマンドを実行する。また、車載装置20は、ユーザの音声に対応するコマンドを実行してから所定時間が経過するまでの間に、ユーザから手動操作を受け付けた場合に、当該手動操作に対応するコマンドに対応付けて、ユーザの音声から抽出した特徴情報を特徴情報格納部26に追加登録し、当該追加登録した特徴情報に対応するコマンドについて、当該コマンドに対応付けて特徴情報格納部26に格納されている複数の特徴情報から、当該コマンドの標準パターンを作成し直して標準パターン格納部23に登録する。 (もっと読む)


【課題】語彙数を実用に耐える認識精度を担保する範囲におさえ、発話に対するカバー率を向上させる音声認識検索システムを提供する。
【解決手段】放送番組の番組情報のデータを蓄積するEPG DB29と、音声入力部11と、入力された音声を認識してテキスト化する音声認識部21と、音声認識部21で参照される音声認識辞書22と、音声認識部21が認識したテキストを検索キーワードとしてEPG DB29内の検索対象範囲を検索する検索部28と、音声認識結果、検索結果などを表示する表示部27と、表示される音声認識候補の選択、表示の切り替えなどを行う操作部12と、音声認識部21が認識したテキストから、ユーザの発話傾向を抽出する発話傾向抽出部23と、発話傾向をデータとして蓄積する発話傾向DB24と、検索対象範囲のデータと発話傾向DB24の内容に基づいて、音声認識辞書22を生成する音声認識辞書生成部25を具備する。 (もっと読む)


【課題】求められる記憶容量の増大化を抑制しつつ、既存の学習データから対象とするタスクに適した学習データのみをきめ細かく選択することにより、高精度な統計モデルを構築でき得る、統計モデル学習装置、統計モデル学習方法、及びプログラムを提供する。
【解決手段】複数の学習データセットに分割された学習データに基づいて統計モデルを学習する統計モデル学習装置であり、学習データセット毎に統計モデルを構築する統計モデル構築部21と、統計モデルの構築後に、各学習データセットから一部のデータをランダムに取り出す学習データ取出部24と、取り出された一部のデータを、再度、各学習データセットに、ランダムに分配する学習データ分配部25とを備えている。そして、統計モデル構築部21は、学習データ分配部による分配後に、取り出された一部のデータが分配された、学習データセット毎に、再度、統計モデルを構築する。 (もっと読む)


【課題】決定木を入力音声の話者が発声した話者適応データに話者適応させること。
【解決手段】話者適応装置は、音声認識に用いる特徴量がどのような音素又は単語で構成されているかを推定するために、前記音素又は単語毎に複数の状態を有するHMM101と、前記特徴量に関する質問に答えて前記HMM101の各状態における尤度を出力する決定木102と、を有する音響モデルを取得する取得部100と、入力音声の話者が発声した話者適応データを用いて、前記決定木102を前記話者に対して話者適応させるデコーダ104とを有する。 (もっと読む)


【課題】シーンを精度よく識別するための辞書を更新できる辞書学習装置を提供する。
【解決手段】音響信号を分析してシーンを識別するための音響特徴量を抽出する音響特徴抽出部11と、前記音響信号以外の情報を関連情報として取得する関連情報取得部21と、前記音響特徴量の辞書を、前記関連情報と対応付けて管理する辞書管理部61と、前記音響特徴量と前記辞書とを照合して類似度を算出する類似度算出部41と、前記辞書から前記関連情報が共通のものを対象に前記類似度を算出し、前記類似度が第1の閾値より大きいときは前記辞書の更新を行うように制御する学習制御部31と、前記辞書の更新を行う場合に、前記類似度を求めるために音響特徴量との照合に用いる音響信号パラメータを更新する辞書更新部51とを備える。 (もっと読む)


21 - 40 / 134