説明

国際特許分類[G10L15/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 標準パタンの作成;音声認識システムの学習,例.話者適応 (725)

国際特許分類[G10L15/06]に分類される特許

1 - 10 / 725



Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285

【課題】少量の関連文書からでも、入力音声のタスクに関連した未登録単語を効果的に選択することで、認識辞書の語彙数の増大を抑え、認識精度を向上することができる単語追加装置を提供する。
【解決手段】本発明の単語追加装置10は、未登録単語抽出部100が、認識辞書を用いて、未登録単語を抽出する。未登録単語特徴量抽出部200が、未登録単語を特徴づける共起頻度ベクトルを生成する。認識結果特徴量抽出部300が、認識結果を特徴づける単語頻度ベクトルを生成する。タスク関連度算出部400が、タスク関連度を算出する。未登録単語頻度算出部500が、未登録単語の関連文書における出現頻度である未登録単語頻度を算出する。登録優先度算出部600が、登録優先度を算出する。認識辞書登録部700が、予め設定された閾値を用いて、追加登録単語を抽出し、認識辞書に追加登録単語を追加して拡張認識辞書を生成する。 (もっと読む)


【課題】精度良く音声の認識を行うこと。
【解決手段】認識装置20は、記憶部24と、第一の算出部26aと、第二の算出部26bと、決定部26cとを有する。記憶部24は、文章に含まれる単語と単語の文章内の位置を示す位置情報とを記憶する。第一の算出部26aは、入力された音声信号と、記憶部24に記憶された複数の単語を接続した文字列の読み情報とを比較して、類似度を算出する。第二の算出部26bは、記憶部24に記憶された各単語の位置情報に基づいて、接続した複数の単語間の近さを示す接続スコアを算出する。決定部26cは、類似度および接続スコアに基づいて、音声信号に対応する文字列を決定する。 (もっと読む)


【課題】音声認識精度を向上することにある。
【解決手段】一実施形態に係る音声認識装置は、業務推定部、音声認識部及び特徴量抽出部を含む。業務推定部は、利用者の業務に関連する非音声情報を用いて利用者が行っている業務を推定し、該業務の内容を示す業務情報を生成する。音声認識部は、前記業務情報に対応する音声認識手法に従って前記利用者が発した音声情報に対して音声認識を行い、音声認識結果を生成する。特徴量抽出部は、前記音声認識結果から、前記利用者が行っている業務に関連する特徴量を抽出する。前記業務推定部は、少なくとも前記特徴量を用いて前記利用者の業務を再推定し、前記音声認識部は、再推定の結果得られる業務情報に基づいて音声認識を行う。 (もっと読む)


【課題】音声認識の精度を向上させる。
【解決手段】音声認識装置は、番組情報記憶部と、辞書記憶部と、算出部と、更新部と、認識部と、操作制御部とを備える。番組情報記憶部は、放送番組のメタデータとユーザの視聴状態とを記憶する。辞書記憶部は、音声認識の対象となる認識語と優先度とを含む認識辞書を記憶する。算出部は、メタデータと視聴状態とに基づいて、放送番組の特徴語と特徴語に対するユーザの嗜好の度合いを表す第1スコアとを算出する。更新部は、特徴語を含む認識語の優先度を第1スコアに応じて更新する。認識部は、認識辞書を用いて音声を認識する。操作制御部は、認識結果に基づいて放送番組に対する操作を制御する。 (もっと読む)


【課題】本発明が解決しようとする課題は、任意の雑音抑圧方式で作成された雑音抑圧信号にマッチした音響モデルを作る技術を提供することにある。
【解決手段】本願発明は、雑音の無い環境で収録した音声であるクリーン信号に、リアルタイムで収録している雑音信号を付加して雑音付加信号を作成し、前記作成された雑音付加信号から雑音を取り除いて雑音抑圧信号を作成し、前記作成した雑音抑圧信号を用いて計算したGMMを、前記クリーン信号を学習したモデルであるクリーンモデルのGMMと入れ替えることで、雑音抑圧モデルを作成することを特徴とする。 (もっと読む)


【課題】同じシナリオであっても使用したい音声認識部を使い分けることが出来る音声認識装置を提供すること。
【解決手段】本発明の音声認識装置は、一又は複数の接続機器と接続されて音声認識を行う音声認識装置であって、音声を取り込むマイクと、前記一又は複数の接続機器と接続するための接続部と、前記一又は複数の接続機器より取得した音声認識対象の文字データを記憶する記憶部と、前記記憶部の音声認識対象の文字データから音声認識処理用の音素への変換を行う変換部と、前記変換部が変換した音素を含み音声認識に利用される音声認識辞書と、前記音声認識辞書と前記マイクより取り込んだ音声を利用して音声認識を実施する音声認識部と、前記一又は複数の接続機器から前記音声認識対象の文字データを取得しているか否かを判断し、その判断結果に基づいて前記マイクより取り込んだ音声を前記音声認識部で認識させるか否かを制御する制御部とを備える。 (もっと読む)


【課題】高精度の音響モデルを構築すること。
【解決手段】音響モデル適応装置は、複数の音声認識データの中から、音声認識用のテストデータと音響モデルの学習用の学習データとを選択する選択手段と、学習データを用いて音響モデルの予備的な適応処理を行う第1適応手段と、テストデータを用いて適応処理された音響モデルに基づいて音声認識処理を行う音声認識手段と、その音声認識結果と複数の音声認識データとを比較して認識結果の精度が向上しているか否かを判定する第1判定手段と、その判定結果に基づいて音声認識データの信頼度を変更する信頼度変更手段と、変更された信頼度に基づいて音声認識データを判別するデータ判別手段と、判別された音声認識データを用いて音響モデルの最終的な適応処理を行う第2適応手段と、を備えている。 (もっと読む)


【課題】多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書が存在しなかった。
【解決手段】一の言語の単語情報と、当該単語情報の単語情報群内における位置示す分類フラグと、単語の発音情報とを有する1以上の発音エントリを格納し得る発音辞書と、単語情報群と発音情報群との組である情報群を1組以上格納し、1以上の単語情報群を単語に分割し、単語の位置を特定する分類フラグを決定し、単語情報に対応付ける分類部と、単語情報と分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置により、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる。 (もっと読む)


【課題】識別対象となるデータに含まれる非音声区間に影響を受けずに男女識別を行うことができる音響モデル生成装置を提供する。
【解決手段】男性音声データと、女性音声データと、非音声データとを音響モデルの生成に用いる音響モデル生成装置100であって、音響モデルの生成に用いられるデータから特徴量を抽出する特徴量抽出部930と、男性音声データから抽出された特徴量から男性音声区間モデルを、女性音声データから抽出された特徴量から女性音声区間モデルを、非音声データから抽出された特徴量から非音声区間モデルを学習するモデル学習部940と、男性音声区間モデルと非音声区間モデルを統合して男声音響モデルを生成し、女性音声区間モデルと非音声区間モデルを統合して女声音響モデルを生成するモデル統合部150とを備える。 (もっと読む)


1 - 10 / 725