説明

Fターム[5D015GG00]の内容

音声認識 (5,191) | 標準パターンの学習 (485)

Fターム[5D015GG00]の下位に属するFターム

Fターム[5D015GG00]に分類される特許

81 - 100 / 166


【課題】
雑音信号区間の判別精度の向上を図ることを可能とする端末装置及び判別方法を提供する。
【解決手段】
ネットワークを介して音声認識サーバ200に接続された端末装置100が、音声信号区間と雑音信号区間とを判別する音声/雑音判別部130と、音声信号区間に対応する音声信号に基づいて音声信号情報を抽出する音声特徴量抽出部140と、雑音信号区間に対応する雑音信号に基づいて雑音信号情報を抽出する雑音特徴量抽出部150と、音声信号情報及び雑音信号情報を音声認識サーバ200に送信する送信部160とを備え、音声/雑音判別部130が、音声認識を開始する条件である開始条件が満たされるまでの所定区間を雑音信号区間として判別する。 (もっと読む)


【課題】利用者による再発声を不必要とし、音響モデルの変更に対応した発声登録語彙情報を生成できる音声認識装置及び音声認識方法を提供する。
【解決手段】発声登録モード時、利用者の発声による入力音声は、音響分析部3で音響分析された後、認識語彙作成部6に入力され、使用される音響モデルに依存した例えば音素列情報が生成されると共に、複数の音響モデルに対応した特徴量15が保存される。そして、音響モデルが切り替えられた場合、特徴量15を用いて特徴量・語彙変換処理部16は、切り替えられた音響モデルに対応した利用者登録認識語彙を作成する。 (もっと読む)


【課題】使用者の発話内容を音声認識すること。
【解決手段】音声認識処理部111は、認識対象語句に含まれるキーワードを待ち受け単語として、入力された発話音声に含まれるキーワードを認識し、認識したキーワードを含む認識対象語彙に共通して含まれるキーワードをマイナーキーワードとして抽出し、抽出したマイナーキーワードの集合を待ち受け単語として、発話音声に含まれるマイナーキーワードを認識し、認識したマイナーキーワードを含む認識対象語彙の集合を待ち受け単語として、発話音声を認識する。 (もっと読む)


【課題】未知語についてカナ文字出力を可能にする言語モデルを作成する言語モデル作成装置及び言語モデル作成プログラム並びに未知語の前後の単語について認識誤りを少なくすることができる音声認識装置及び音声認識プラグラムを提供する。
【解決手段】言語モデル作成装置3は、音声認識する際に用いられる辞書に登録されていない単語である未知語を、カナ文字列で表現した言語モデルを作成するもので、単語蓄積手段13と、音節単位分割手段15と、隠れマルコフモデル推定手段17と、部分文字列選択手段19と、正規化手段21と、情報量基準値計算手段23と、言語モデル作成手段25と、を備えた。 (もっと読む)


【課題】高価な装置を用いることなく、かつ、短時間に音響モデルの適応化処理を実行することができる音響モデル適応化処理方法、装置を提案する。
【解決手段】学習音声データの前端及び後端に同期信号を付与した再生音声データを生成し、再生音声データを適応化対象経路を通じて収録し、収録した収録音声データから前記同期信号を使って前記学習音声データに相当する部分を切り出し、切り出した収録音声データにより適応前音響モデルを適応化処理し、適応後音響モデルを生成する。 (もっと読む)


【課題】モータ雑音下におけるロボット用音声認識の性能向上を図る。
【解決手段】所定の動作またはジェスチャを行いつつ人の音声を認識するロボットであって、前記動作またはジェスチャを行わせる駆動ユニットと、実行されている前記動作またはジェスチャを判別する判別ユニットと、マルチコンディション学習を含む少なくとも2つの認識アルゴリズムを備えた音声認識ユニットと、判別された前記動作またはジェスチャに応じて前記認識アルゴリズムの1つを選択する切り替えユニットと、を備えたロボット。 (もっと読む)


【課題】管理されていない学習を適用した話し手に依存する(SD)音響モデルの生成前および生成中においても、良好に機能する音声認識方法を実現する。
【解決手段】純粋な話し手に依存しない(SI)音響モデル230,232と少なくとも等しい音声認識レベルを与えるために、少なくとも1つのSI音響モデル230,232と、少なくとも1つの話し手に依存する(SD)音響モデル234とが組み合わされ使用されている。そして、管理されていない学習を連続的に行うことによって、1つ以上の音響モデルにおける音響テンプレートを更新する。その後、更新したSD音響モデル234を、少なくとも1つのSI音響モデル230,232と組み合わせる。これによって、音声認識テストを行っている間であっても高い音声認識性能を得る。 (もっと読む)


【課題】過学習が生じることなく、蓄積音声の有効的な利用を行うことができる音響モデル作成装置及び音声認識装置並びに音響モデル作成プログラムを提供する。
【解決手段】音響モデル作成装置1は、参照する音声である参照音声に含まれる各音素で観測される特徴量の確率密度分布を用いた参照音響モデルを使用し、当該参照音声とは異なる学習音声について、当該参照音響モデルと共通の音素環境共有構造を有する音響モデルを作成するものであって、参照音響モデル取得手段3と、学習音声取得手段5と、学習音声統計量パラメータ算出手段7と、学習音声統計量パラメータ代入手段9と、モデル作成手段11と、を備える。 (もっと読む)


【課題】話者変動、様式変動および環境変動が複合的に影響する場合に、特徴パラメータ系列を精度よく変換するのに好適な音声信号変換装置を提供する。
【解決手段】入力音声信号から特徴パラメータ系列を抽出し、入力音声信号の特徴パラメータ系列を第1基準話者16aの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を第1基準様式16bの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を第2基準様式16cの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を第2基準話者16dの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を出力音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列から出力音声信号を生成する。 (もっと読む)


【課題】 言語モデルの切替及び適応のための装置及び方法を提供する。
【解決手段】 この言語モデル切替・適応装置は、目的アプリケーションの状態が変更される場合、現在の状態情報あるいは目的アプリケーションの言語モデルに対する要求の言語モデル切替え部に通知する通知管理部と、受信した現在の状態情報あるいは要求に従って言語モデルセットから切り替える1つ以上の言語モデルを選択する言語モデル切替え部と、選択された言語モデルを用いてユーザの入力をデコードするLMBエンジンと、デコードされた結果を受け取り、デコードされた結果に基づいて選択された言語モデルを修正する言語モデル適応部を備える。 (もっと読む)


【課題】 メモリに制約のある装置において、補助記憶装置からの、単語辞書を読み込みによる音声認識処理の遅延を削減することができる音声認識装置を提供する。
【解決手段】音声に含まれる複数の連続する単語を認識する音声認識装置は、音響モデル11を読み込む音響モデル読み込み部5と、辞書データ12から、必要なデータを読み込む辞書管理部9と、音響モデル11を用いて、辞書データ12が表す単語群と、入力された前記音声とを照合することで、連続する単語を順次認識する認識部7とを備え、辞書データ11は、単語の語頭を示す語頭辞書と、語末を示すデータが記録された語末辞書群とを含み、認識部7が認識した単語に応じて、語末辞書および/または語頭辞書を読み込み、認識部7は、辞書管理部9が語末辞書および/または語頭辞書を読み込む間に、後に続く音声と、語頭辞書に含まれる単語の語頭とを照合する。 (もっと読む)


【課題】反響音の影響によって音声認識の認識率が低下するのを抑制した浴室装置及びそれに用いる音声操作装置を提供する。
【解決手段】浴室装置Aに用いる音声操作装置Bは、浴室に設置された複数の浴室機器Cの稼働状態を検出する稼働状態検出部24と、稼働状態検出部24により検出された稼働中の浴室機器Cを使用する場合の予想位置を話者の居る領域として検出する領域検出部13と、異なる反響状態をそれぞれ想定した複数の音響モデルM1〜Mnを記憶する音響モデル記憶部14と、音響モデル記憶部14に記憶された音響モデルM1〜Mnの中から領域検出部13による検出領域の反響状態に対応するモデルを選択する音響モデル選択部15と、選択された音響モデルを用いてマイクMCが検出した音声の内容を認識する音声認識部16と、音声認識部16の認識結果に基づいて対応する浴室機器Cを操作する音声操作部17とを備える。 (もっと読む)


【課題】誤動作の発生を低減する音声処理装置を提供する。
【解決手段】操作者または操作者以外の者の発声を含む音声を入力するマイク104と、入力された音声のうち音声処理の対象とする区間として操作者により指定された指定区間の入力を受付ける指定区間受付部204と、入力された音声から発声が存在する区間である発声区間を検出する発声区間検出部202と、入力された音声に基づいて、操作者または操作者以外の者のいずれが発声の発話者であるかを判断する話者判断部203と、指定区間受付部204が受付けた指定区間と発声区間検出部202が検出した発声区間とが重複する部分を検出し、重複する部分が検出された場合であって、話者判断部203により話者は操作者以外の者であると判断された場合に、重複する部分が含まれる発声区間を処理区間として決定する処理内容判断部205と、を備えた。 (もっと読む)


【課題】浴室機器が稼働して騒音を発している場合でも音声認識の認識率を向上させた浴室装置及びそれに用いる音声操作装置を提供する。
【解決手段】浴室装置Aに用いる音声操作装置Bは、A/D変換部12によりA/D変換された音声信号から騒音を除去する騒音除去部13と、騒音を除去した音声と音響モデル記憶部14に記憶された音響モデルとのパターンマッチングを行うことにより認識処理を行う音声認識部15と、音声認識部15の認識結果に基づいて対応する浴室機器を操作する音声操作部16とを備える。騒音除去部13には、浴室内の各浴室機器に対応して、対応する浴室機器の発生する騒音を除去する複数の騒音除去手段13a〜13nが設けられ、騒音除去部13では、稼働状態検出部17により検出された稼働中の浴室機器に対応する騒音除去手段13a…を用いて、A/D変換部12から入力された音声信号から騒音を除去する。 (もっと読む)


【課題】音韻論や音声学の高度な知識を必要とせず、クラスタ生成に人手をかける必要もなく、音響モデルの中身はそのままでサイズを増加させることもない、音響モデルの適応化技術を提供する。
【解決手段】記憶部505Aに格納された適応化前音響モデルに含まれる音素モデルを、音素環境非依存モデル集合と音素環境依存モデル集合に分類する(510)。音素環境非依存モデル集合を、所定のクラスタ数になるようにクラスタリングをする(525)。音素環境依存モデル音素環境依存モデルを、それを包含する音素環境非依存モデルが所属する音素環境非依存モデルクラスタへとクラスタリングして、音素モデルクラスタを生成する(545)。音響モデル適応化用データと音素モデルクラスタから、音素モデルのパラメータを更新して、適応化後音響モデルを生成する(555)。 (もっと読む)


【解決課題】高精度に単語を解析するために、適切なサブワードによるサブワード単語モデルを作成することができるようにする。
【解決手段】隣接するサブワードペアの間に既知単語区切りが存在すると判定された場合には、処理対象となるサブワードペアとして取り出さないようにして、サブワード区切りが付加された単語区切り付き処理対象データから処理対象となる隣接するサブワードペアを取り出す。そして、取り出されたサブワードペアの中から新たにサブワードを獲得し、適切なサブワードによるサブワード単語モデルを作成する。 (もっと読む)


【課題】入力音声の言語に対応する言語辞書に速やかに切り替えることができる音声認識装置、及びナビゲーションシステムを提供する。
【解決手段】言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの各々が記憶する切り替えコマンドを集約した言語切り替え用辞書30dを用いて、この言語切り替え用辞書30dに記憶された切り替え用コマンドと入力音声との一致を判定する。そして、音声入力によってナビゲーションシステム1を操作する際に設定する言語辞書として、デフォルト設定された(現在設定された)言語辞書から、一致すると判定された切り替えコマンドに対応する言語辞書に切り替える。 (もっと読む)


【課題】音声認識精度を向上させる。
【解決手段】距離計算部47は、発話を行っているユーザからマイク21までの距離を求め、音声認識部41Bに供給する。音声認識部41Bは、複数の異なる距離だけ離れた位置から発せられた音声を収録した音声データそれぞれから生成された、音響環境を考慮した音響モデルのセットを記憶している。そして、音声認識部41Bは、その複数の音響モデルのセットの中から、距離計算部47から供給される距離に最も近い距離の音響モデルのセットを選択し、その音響モデルのセットを用いて、音声認識を行う。 (もっと読む)


【課題】高精度に音声認識を実現する。
【解決手段】入力音声から音響的特徴の異なる1又は複数の話者クラスタによる音声認識を行う音声認識装置において、前記入力音声を音響特徴量に変換する音響分析手段と、前記音響分析手段により得られる音響特徴量から話者クラスタ属性を同定する話者クラスタ属性同定手段と、予め設定される前記話者クラスタの音響モデル及び言語モデルから生成された正解単語探索用の探索ネットワークと、前記入力音声に対する前記話者クラスタ属性の制約情報とに基づいて、連続音声認識を行う連続音声認識手段とを有することにより、上記課題を解決する。 (もっと読む)


【課題】本発明は従来システムに関連した問題を実質的に減少、或いは除去する話者に依存しない認識システム及び方法を提供する。
【解決手段】ユーザが定義したフレーズの話者に依存しない認識のための外れ語彙のスコアを決定するシステム及び方法が、登録文法(36)を用いて話者に依存しない(SI)認識モデル(34)のセットと共にユーザが定義したフレーズを登録することを含む。話されたフレーズの登録文法のスコアは、登録文法(36)を用いて話されたフレーズの特徴をSI認識モデル(34)と比較することによって、決定される。登録文法のスコアは、外れスコア(94)を発生するためにペナルティーが適用される。 (もっと読む)


81 - 100 / 166