説明

Fターム[5D015GG00]の内容

音声認識 (5,191) | 標準パターンの学習 (485)

Fターム[5D015GG00]の下位に属するFターム

Fターム[5D015GG00]に分類される特許

41 - 60 / 166


【課題】階層型パルスニューラルネットワークに適用可能なバックプロパゲーション学習法を提供する。
【解決手段】パルスニューロンモデルの双対性を利用して教師信号を生成し、該教師信号を用いて学習を行うことを特徴とするパルスニューロンモデルのためのバックプロパゲーション学習法。パルスニューロンモデルの双対性を利用して教師信号を生成することにより、誤差関数を微分する計算が必要でなくなり、階層型パルスニューラルネットワークに適用可能となる。 (もっと読む)


【課題】全体的な認識精度が向上された音響モデルを作成する。
【解決手段】発音辞書記憶部に記憶されている発音辞書を用いて、言語モデル記憶部に記憶されている言語モデル中の単語を音素系列に変換し、全ての対象音素ごとに、当該対象音素を含む音素系列の出現確率の総和を当該対象音素の音素出現確率を求め、音素出現確率が高い高出現確率音素を選択し、学習データ記憶部から、高出現確率音素を含む音素系列についての学習データを抽出して、強化学習データとし、強化学習データとベース音響モデルから強化統計量を計算し、学習データ記憶部からの学習データについての十分統計量と強化統計量とから強化音響モデルを作成する。 (もっと読む)


【課題】ツリー構造の音声認識用辞書を作成し始めてから音声認識を開始できるまでの時間の短くできる音声認識用辞書作成装置の提供。
【解決手段】指示が初期登録だと(S110で初期登録)、楽曲データ群の入力を受け(S120)、ソート優先度に従ってデータをソートすると共に、複数の集合に分割し(S130)、ソート順位が高い楽曲データを含む集合から順に、音声認識用辞書を作成する(S140)。指示が楽曲データの追加であると判断すると(S110で追加)、楽曲データの入力を受け(S145)、追加データのみの辞書を作成する(S150)。指示が楽曲データの削除であると判断すると(S110で削除)、楽曲名の入力を受け(S155)、削除対象の楽曲名に対応させて、認識対象外フラグを立てる(S160)。指示が楽曲データの変更であると判断すると(S110で変更)、追加と削除とを組み合わせた処理をする(S165〜S180)。 (もっと読む)


音声認識方法は、第1の雑音環境において観測系列を備える音声入力を受信することと、音響モデルを用いて観測系列から生じる単語系列の尤度を判定することと、第2の雑音環境においてトレーニングされたモデルを第1の環境のモデルに適応させることとを具備する。第2の環境においてトレーニングされたモデルを第1の環境のモデルに適応させることは、確率分布のグループについて導出された二次またはより高次のテーラー展開係数を用いることを具備する。同一の展開係数がグループ全体で使用される。
(もっと読む)


【課題】発話者が交替したか否かを推定することが可能な話者交替推定装置を提供する。
【解決手段】無音区間で区切られた発話の内容を表すテキスト情報Daから発話の末尾部分である発話末語を抽出する発話末語抽出部11と、抽出された発話末語に基づいて発話者が交替したか否かを推定する話者交替推定部12と、を備える。 (もっと読む)


【課題】本発明は、発話を、入力データ・ストリームに基づいて認識するためのシステムを提供する。
【解決手段】本発明のシステムは、モデル・サイズを有する音響モデルを含む。このモデルは、この認識システムがランするコンピュータ・システムの特性に基づく所望のサイズに調節可能である。この調節は、セノン・ツリーのパラメータをクラスタ化することによって得られる。 (もっと読む)


【課題】音声認識の精度を高くすることができる音声認識方法を提供する。
【解決手段】音声記録ステップとして、オペレータの音声および顧客の音声をそれぞれ別途録音すると共に時刻を記録する(S11)。このとき、操作画面IDを時刻と共に記録する(S12)。次に、記録された操作画面IDに対応する音声認識辞書IDを音声認識辞書ID選択部28により選択する。そして、記録された時刻に応じて、音声認識辞書IDと操作画面IDとのタイムテーブルを作成する(S13、S14)。音声認識辞書IDが切り替わるタイミングで、音声分割部23によりオペレータの音声および顧客の音声をそれぞれ分割する(S15)。その後、オペレータの音声および顧客の音声の音声認識を実施する(S17)。 (もっと読む)


【課題】テキストに読み方を決定することができない文字が含まれている場合でも、ユーザの発声音声を正確に認識することが可能な音声認識用語彙辞書を生成することができるようにする。
【解決手段】テキスト取得部22により取得されたテキストを構成している文字の読み方を決定する読み方決定部23を設け、辞書生成部24が読み方決定部23により読み方が決定された文字に対して音節を割り当て、読み方決定部23により読み方が決定されない文字又は文字列に対して全種類の音節から構成されたガベジモデルを割り当てることにより、音声認識用語彙辞書を生成する。 (もっと読む)


【課題】従来はテキストデータを形態素解析して読み候補付与、分割位置決定をするが演算時間が掛かり、表記テキストデータの分割・読み付与は、同一表記に複数読み候補が返り演算時間の増大、認識精度の低下を、読みテキストデータの分割・読み付与は、分割位置精度の低下を来す。
【解決手段】ユーザの発話が、表記・読みテキスト記憶部の表記と読み対のテキストデータのいずれかを音声認識用語彙辞書を用いて認識する音声認識用語彙辞書を作成するため、表記・読みテキスト記憶部からのテキストデータの表記と読み対の対応付けを表記読み対応記憶手段の表記とその読み候補を参照して表記・読み対応付け手段で決定し、対応付けされた表記と読みのテキストデータを単語又は語句単位に分割手段で分割し、分割後の表記・読みの対に対し認識語彙辞書作成手段で音声認識用語彙辞書を生成、認識語彙辞書記憶部に格納する。 (もっと読む)


【課題】字幕と発話内容の一致率が低いオフライン字幕を利用した場合にも、高い認識率によって音響モデルの学習データを自動生成し、多様な発話スタイルに対応できる音響モデルを作成できる音響モデル学習装置を提供する。
【解決手段】音響処理装置が、音声の認識処理を行い、認識仮説および前記認識仮説に付随する信頼度データを含んだ認識結果データを出力する認識処理部と、前記音声に対応するテキストデータと前記認識処理部が出力した認識結果データとに基づきこれら両データの一致区間を選択するとともに、前記一致区間の時間を含み且つ前記テキストデータとは一致しない前記認識仮説を枝刈りし、枝刈り後の認識仮説および付随する信頼度データを基に信頼区間を選択し、前記一致区間および前記信頼区間のデータを出力する選択処理部とを具備する。 (もっと読む)


【課題】HTMLのような既存のハイパーテキスト文書において、容易に音声入力によるWebサービスとして利用可能とすることを目的とする。
【解決手段】ユーザの入力を求める箇所を解析し、入力を求める箇所に係る語句を抽出する解析手段と、解析結果に基づく語句が音声によって認識されるように音声認識用文法を作成する文法変換手段と、解析手段における解析結果に基づく語句とその入力箇所を判定するための属性値とを関連付けする属性値付与手段とを有する文法生成手段と、音声を入力する音声入力手段と、入力された音声において、文法生成手段にて作成された音声認識用文法に基づいて、音声の認識処理を行い、音声認識結果単語列を出力する音声認識手段と、音声認識結果単語列における語句を、属性値付与手段の関連付けに基づいて入力箇所を判定し、入力箇所に入力を行う結果判定手段とを備える。 (もっと読む)


【課題】音声認識の精度を高くすることを目的とする。
【解決手段】属性毎辞書情報記憶部150は、端末に表示する画面情報の入力項目の属性毎に辞書情報を記憶する。音声情報入力部110は、音声情報を入力する。属性情報取得部130は、画面情報の入力項目のうち、カーソルが合わされている入力項目の属性を取得する。文字情報取得部140は、属性情報取得部130が取得した属性用の辞書情報に基づき、音声情報入力部110が入力した音声情報に対応する文字情報へ変換することにより、音声情報を認識する。 (もっと読む)


【課題】音響モデル学習時の音響分析条件と認識対象の入力信号に対して行う音響分析条件が異なると認識性能が低くなり、音響分析条件を変更すると多くの計算コストとデータが必要となる。
【解決手段】認識対象の入力信号に対し音響分析条件(I)で特徴量を抽出する音響分析手段(I)と、第1の学習用の入力信号に対し音響分析手段(I)において音響分析条件(I)で抽出された特徴量から音声モデル(I)を作成し格納する音声モデル格納手段と、第2の学習用の入力信号に対し音響分析手段(O)において音響モデル作成時と同じ音響分析条件(O)で抽出された特徴量から作成された音声モデル(O)と音声モデル(I)との対応テーブルを格納する対応テーブル格納手段と、音声モデル(I)と対応テーブルとを用いて認識対象の入力信号の特徴量を補正する音響分析条件補正手段と、を少なくとも備える。 (もっと読む)


【課題】未登録語の読みを高い精度で推定して音声認識辞書に登録する。
【解決手段】未登録語抽出部105は、入力された文書から音声認識辞書103に存在しない未登録語を抽出する。読み確率記憶部107は、読みと表記及びその読みから表記への条件付確率を対応付けた第1のテーブルと、読みとその出現確率とを対応付けた第2のテーブルとを記憶する。読み推定部106は、上記読み確率記憶部107に記憶された第1のテーブル及び第2のテーブルを用いて未登録語抽出部105で抽出された未登録語の表記に対応する条件付確率が最大となる読み候補を生成し、読み候補と未登録語の表記とのペアを検索キーワードとして文書検索を行い、該キーワードを含む文書数を求め、この文書数に基づいて読み候補から未登録語の読みを選択する。 (もっと読む)


【課題】短時間で正しい音声認識用辞書を作成し、これを用いて正確に、且つ高速で音声認識を行うことができる「音声認識用辞書生成システム」とする。
【解決手段】、利用者の発話音声を認識して機器操作を行うために用いる音声認識機器操作用辞書を、音声認識対象データ収集部で収集した音声認識辞書生成用元データに読み仮名を付与することにより生成する音声認識用辞書生成システムにおいて、音声認識対象データ収集部では、音声認識辞書生成用元データをデータの種類毎に分けて収集し、別途作成した音声認識辞書生成用基本辞書を用いて、音声認識辞書生成用元データに読み仮名を付与することにより音声認識機器操作用辞書を生成する。音声認識辞書生成用基本辞書は、予め前記音声認識装置で用いると予測される読み変換用元データを収集して読み仮名を付与し、音声認識辞書生成用元データを分ける種類と同じ種類に分けて作成する。 (もっと読む)


【課題】人の行動や感情を含んだ発話を音声認識するための言語モデルを作成するための、不特定多数の話者に適用可能な学習データ作成装置及びプログラムを提供する。
【解決手段】言語モデル学習データ作成装置は、インターネットを介してWEBページのテキストデータを獲得するテキストデータ獲得手段と、前記テキスト獲得手段により獲得されたWEBページの記述内容が人の行動又は感情に関するものであるか否かを、前記WEBページのURLと、WEBページのURLの所定のルールとに基づいて判定する記述内容判定手段と、言語モデル作成のためのテキストデータを蓄積するテキストデータ蓄積手段と、前記記述内容判定手段により、記述内容が人の行動又は感情に関するものであると判定されたWEBページのテキストデータを前記テキストデータ蓄積手段に登録するテキストデータ登録手段と、を備えている。 (もっと読む)


【課題】音声認識の精度が高い音声認識装置を実現する。
【解決手段】本発明の音声認識装置1は、位置を示す位置情報に対応付けられた、音声の特徴量に対応する文字情報を出力するデータベースを選択する使用データベース決定部18と、使用データベース決定部18により選択されたデータベースを用いて音声認識を行う音声認識部12とを備えている。これにより、自装置の現在位置に応じたデータベースを用いた音声認識を行うことができ、精度の高い音声認識を実現できる。 (もっと読む)


【課題】 言語モデルを変更せずに、大語彙連続音声認識において未知語をある信頼度をもって認識できるようにするための木構造辞書を記憶した記憶媒体、その作成装置、及びその作成プログラムを提供する。
【解決手段】 音声認識装置140は、予め用意されている既知単語のための木構造辞書を記憶するための単語辞書150と、既知単語のユニグラム確率及びバイグラム確率を記憶するための言語モデル152と、クラス毎に未知語のための木構造辞書を記憶するための未知語を含む木構造辞書156と、単語辞書150及び言語モデル152を用いて、未知語を含む木構造辞書156を作成したり、未知語を含む木構造辞書156に新たな未知語を追加したりすることにより、木構造辞書156を管理するための未知語辞書管理部160とを含む。 (もっと読む)


【課題】異なる母音を有する英語発音の識別に用いる、英語変異発音を識別するモジュールの構築方法を提供する。
【解決手段】英単語に対応する複数の発音情報を収集し、一地区の母音と英語の音標とを複数の国際標準音標に対応し複数の発音モジュールを形成させ、この複数の発音モジュールが各英単語の発音情報をコンバートすることを利用し、英単語の発音音標と共に対応する英単語の変異発音ネットワークを構築し、英単語の変異発音の順番の存否を検出し、変異発音順番を集約することで複数の変異発音規則を推測し、形成された変異発音モジュールを保存することによって、構築される英語変異発音を識別するモジュールの構築方法を提供する。この変異発音モジュールの構造が、英語識別システムの適用性および発音の識別力の正確性を高めることができる。 (もっと読む)


【課題】複数の機器に使用される不特定話者音声認識エンジンをインターネットを介して個別のユーザに提供するシステム及び方法を提供する。
【解決手段】このシステムは、ユーザログインユニット10、記憶ユニット20、音声認識エンジン作成ユニット30及びエンジンダウンロードユニット40を含む。この方法は、ステップa及びステップbを含む。ステップaは、ユーザが異なる電子機器により音声を入力し、入力された音声はインターネットによりインターネット上で提供されるシステムの記憶ユニット20内に送信、保存されるステップである。ステップbは、インターネット上で提供される音声認識エンジン作成ユニット30を利用して、ユーザにより入力された音声及び各電子機器の特性に基づき、各電子機器に使用されるのに適当な音声認識エンジンを作成するステップである (もっと読む)


41 - 60 / 166