説明

Fターム[5D015GG01]の内容

音声認識 (5,191) | 標準パターンの学習 (485) | 標準パターンの置換、更新 (134)

Fターム[5D015GG01]に分類される特許

61 - 80 / 134


【課題】認識すべき重要なキーワードの認識性能を改善した音響モデルの生成技術を提供する。
【解決手段】学習部13が、学習データ記録部11から読み出した学習データと、ベース音響モデルとから十分統計量を計算する。強化学習データ選択部22が、所定のキーワードと同一及び/又は類似のキーワードを含む学習データを学習データ記録部11から抽出して、強化学習データとする。強化学習部24が、上記強化学習データと上記ベース音響モデルから強化十分統計量を計算する。強化モデル合成部26が、上記十分統計量と、上記強化十分統計量に重みをかけたものとから強化音響モデルを生成する。 (もっと読む)


【課題】音声信号の分類精度を向上させる。
【解決手段】音声信号の特定の周波数帯域を通過させるフィルタ部26と、特定の周波数帯域における音声信号のパワー値を求めるパワー値検出部27と、音声信号のパワー値が所定の閾値を超える時間帯を求めるピーク時間帯検出部28と、音声信号を周波数領域の信号へ変換する周波数変換部29と、閾値を超える時間帯における周波数領域の信号から音響モデルを作成する音響モデル作成部30と、音響モデルを用いて音声信号を分類する音声分類部22とを備える。 (もっと読む)


【課題】標準パターンを圧縮した場合でもマッチングエラーの発生率を低減する。
【解決手段】パターンマッチング装置10は、標準パターンを構成する各特徴要素B1,B2,B3について、パターン圧縮部12で、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって標準パターンを圧縮する。また、圧縮情報生成部13で、圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する。そして、圧縮された圧縮標準パターンを、記憶部14で当該圧縮標準パターンに対して生成された圧縮情報と関連付けて記憶する。また、パターンマッチング処理部15で、記憶された圧縮標準パターンを、当該圧縮標準パターンと関連付けて記憶されている圧縮情報に基づき伸長して標準パターンに復元する。そして、復元された標準パターンと入力パターンとのパターン間距離を動的計画法により算出する。 (もっと読む)


【課題】 未知語もしくは誤解析と判定される用語を含むテキストを、利用者に対して了解性の高いテキストへ変換し得る言語処理方法を提供することを目的としている。
【解決手段】 テキストを解析する言語処理装置において、テキストを解析するテキスト解析手段と、解析結果に未知語が含まれているか否かを判定する未知語判定手段と、解析結果に予め定められた用語が含まれているか否かを判定する特定用語判定手段と、特定用語を別の単語列に変換する単語列変換テーブルと、解析結果に未知語と特定用語が存在する場合に、前記単語列変換テーブルを参照して未知語と特定用語を別の単語列に変換する単語列変換手段とを備える。 (もっと読む)


【課題】その場にいるメンバが利用する単語の傾向を類推することにより音声認識の精度を高めることを可能とする。
【解決手段】
グループ内の利用者をサブグループに分割し、利用者が属するグループ内で共同利用されるネットワークシステム上のテキスト情報から前記利用者及び前記サブグループと関連付けて単語を抽出し、前記単語を利用者及び関連するサブグループ識別情報とともにカスタマイズ用辞書データベースに記憶しておき、音声入力装置の周囲に存在する利用者のサブグループを特定すると、認識対象語彙を格納した音声認識用辞書データベースに基づき単語を選択する際に、カスタマイズ用辞書データベースを参照してサブグループに応じて音声認識処理で選択する単語の優先順位を調節する。 (もっと読む)


【課題】生体情報が変動する場合でも認証の精度を高水準に維持する。
【解決手段】記憶装置20は、生体情報D0を含む辞書DIC_iを記憶する。情報取得部10は、被認証者の生体情報DINを取得する。認証部32は、記憶装置20が記憶する辞書DIC_iの生体情報D0と情報取得部10が取得した生体情報DINとの距離DST_iに基づいて被認証者の正当性を認証する。辞書管理部34は、距離DST_iが閾値VTHR1を下回る場合に、生体情報DINに基づいて記憶装置20の辞書DIC_iを更新し、距離DST_iが、閾値VTHR1とそれよりも大きい閾値VTHR2との間にある場合に、情報取得部10が取得した生体情報DINに応じた新規な辞書DICを生成して記憶装置20に格納する。 (もっと読む)


【課題】検査員の現在位置を検出するための地上設備を配置せずに、鉄道設備の検査記録の省力化を実現すること。
【解決手段】GPS装置8による現在位置の測位精度に基づいて、測位された現在位置を中心とする所定の範囲が設備検出範囲として可変に決定される。そして、当該設備検出範囲に設置位置が含まれる検査設備を対象として、検査工程に基づく検査設備の絞り込みがなされる。そして、マイク7aから入力された発話音声に該当する検査設備が、絞り込まれた検査設備に対応する音声データに基づいて音声認識処理されて特定される。そして、マイク7aから入力された発話音声が音声認識処理されて検査結果データがPDA2に入力され、特定された検査設備に対する検査結果として記録される。 (もっと読む)


【課題】音響モデルパラメータの推定誤差を加味した頑健な音響モデルを逐次作成する。
【解決手段】今回の適応用音声データの部分時系列の特徴量系列を抽出し(4、S64)、前回までの累積された特徴量系列が加味された前回求めた音響モデルパラメータの事後確率分布p(θ│O)と、上記今回抽出した特徴量系列Ot+1とに基づき、今回の特徴量系列に適応化させた今回の音響モデルパラメータの事後確率分布p(θt+1│Ot+1)を逐次的に求め(52、S68)、ここで、Ot+1は今回の特徴量系列であり、Ot+1およびOは今回および前回までに累積された特徴量系列であり、θt+1およびθは今回および前回の音響モデルパラメータであり、p(θt+1│Ot+1)を新たな音響モデルとする(56、S70)。 (もっと読む)


【課題】実際に使用者によって使用される語彙のみを音声認識対象語彙として登録することができる音声認識装置を提供する。
【解決手段】信号処理ユニット1は、正式名称を音声認識対象語彙として記憶した外部記憶装置15を備え、信号処理装置11により、正式名称から言い換え語を生成し、生成された言い換え語の実使用度を評価し、言い換え語を音声認識対象語彙として外部記憶装置15に登録する。この信号処理ユニット1は、実使用度が高いと評価された言い換え語のみを音声認識対象語彙として登録する。 (もっと読む)


【課題】音声認識サービスを中断させることなく、各音声認識処理部の認識辞書を効率よく更新できるようにする。
【解決手段】辞書更新要求受付部313は、システム管理者から指示された辞書更新要求を受信すると、声認識処理部管理テーブル30を参照して各音声認識処理部33の状態を識別し、「空き」状態の音声認識処理部33を複数回に分けて少なくとも一つずつ選択し、その認識辞書の更新を指示する。更新を指示された各音声認識処理部33は、認識辞書記憶部32に記憶されている認識辞書ファイルに基づいて、自身の辞書領域34に記憶されている認識辞書を順次に更新する。 (もっと読む)


装置は撮像デバイス及びロジックを含むことができる。ロジックはユーザから音声入力を受信し、音声入力を識別するように構成されることができる。ロジックはさらに、前記識別された音声入力に基づいて、撮像デバイスに関する制御動作を実行するように構成されることができる。
(もっと読む)


【課題】認識誤りによる影響を軽減するモデル学習方法および情報抽出方法を提供する。
【解決手段】識別モデルにおいて、端末装置が、モデル学習時に、抽出対象情報が付与された、誤りを含む認識単語列学習データと、同様に抽出対象情報が付与された、誤りを含まない参照単語列学習データとを用いてモデル情報を作成する。その際、認識確信度素性を2値化することで、認識単語列と参照単語列との両方を用いてモデル情報を作成する。情報抽出時には、入力データから認識された各認識単語が正しいか否かを示す認識確信度素性を認識単語列に付与する。この認識確信度素性がある閾値以上であれば、単語の認識は「正」、そうでなければ単語の認識は「誤」とする。そして、作成されたモデル情報を用いて抽出対象情報を認識単語列に付与し、付与された抽出対象情報に基づいて単語を抽出する。 (もっと読む)


【課題】複数のコマンド入力による動作処理を一のカスタマイズコマンド入力により制御することができ、ユーザによってより使い勝手のよい電子機器を提供することである。
【解決手段】ディジタルテレビ受像機100において、設定手段(マイク付きリモコン等)によってカスタマイズコマンド情報を設定し、特定手段(マイク付きリモコン)によってユーザ所望の複数のコマンド情報を特定し、カスタマイズコマンド情報登録手段(CPU121、カスタマイズコマンド情報登録プログラム)によって、カスタマイズコマンド情報記憶手段(カスタマイズコマンドテーブル123b)にカスタマイズコマンド情報を登録し、制御手段(CPU121、制御プログラム123f)によって、カスタマイズコマンド情報に対応付けられて登録されたコマンド情報に対応する制御情報に基づいて制御を行う。 (もっと読む)


【課題】複数の話者の会話が録音されている音声データから、特定の話者の発言を効率良く聴くことができ、その発言に至るまでの他者の発言内容も把握することができる装置を提供する。
【解決手段】録音サーバ101のネットワークI/F4は、ネットワーク100で通信される多地点音声会議の音声データを取得し、記録部3は音声データを議事録として記録する。記録部3は、各会議参加者の音声特徴量を記録している。特徴データ抽出部2は、パソコン102から再生リクエストを受信すると、記録部3に記録されている議事録の音声データから、音声特徴量を抽出し、各会議参加者の音声特徴量と比較する。その結果、特定の話者の記録音声データを抽出し、この話者の音声データ以外を話速変換(高速再生)し、ダイジェストデータを生成し、ストリーミング配信する。パソコン102は、ストリーミングデータを受信し、ダイジェスト再生をする。 (もっと読む)


【課題】処理の負担を軽減する。
【解決手段】SOMの一種である入力ネットワークnet11は、空間的な配置構造が与えられた複数のノードから構成され、各ノードは、時系列パターンを表現する時系列パターンモデルを有している。時系列データである入力データの学習時において、時刻tのフレームの入力データに対する勝者ノードNtの決定後、次のフレームである、時刻t+1のフレームの入力データに対する勝者ノードNt+1の決定は、その時刻t+1のフレームの入力データの直前の時刻tのフレームの入力データに対する勝者ノードNtとの距離が所定の距離以内のノードだけを対象にして行われる。本発明は、例えば、ロボットなどに適用できる。 (もっと読む)


システムに入力された語の筆記録を使用せずに、音声認識システムによって発生する、考えられる誤りを識別するための方法が開示される。音声認識システムに対するモデル適合の方法は、システムに入力された語の筆記録を使用せずに、1つの語の事象の認識または様々な語の事象の認識に対応する誤り率を決定する段階315を含む。方法は、誤り率に基づいて、1つの語に対する1つのモデルまたは様々な語に対する様々なモデルの適合を調整する段階320をさらに含みうる。システムに入力された語の筆記録を使用せずに、音声認識システムによって発生する、考えられる誤りを識別するための装置が開示される。音声認識システムに対するモデル適合の装置は、システムに入力された語の筆記録を使用せずに、1つの語の事象の認識または様々な語の事象の認識に対応する誤り率を推定するように適合された、プロセッサ210を含む。装置は、誤り率に基づいて、1つの語に対するモデル235および様々な語に対する様々なモデルの適合を調整するように適合されたコントローラ225をさらに含みうる。
(もっと読む)


【課題】 音声の類似度の評価の雑音耐性を高める。
【解決手段】 特徴量比較部36は、1〜Nの各nについて、特徴量抽出部34により生成された入力音声の帯域間相関行列Aと登録情報選択部35により読み出された帯域間相関行列Bの一方の第n行および第n列を他方に代入し、あるいは帯域間相関行列AおよびBの両方から第n行および第n列を間引き、代入後または間引き後の両帯域間相関行列AおよびB間の類似度Dを算出する類似度算出処理を実行する。そして、認証結果出力部37は、各nについて実行された類似度算出処理において類似度Dが閾値th1以上となった回数に基づいて認証を行う。 (もっと読む)


【課題】通信端末にあらかじめ内蔵されたプログラムおよびデータと音声処理とを連携させて動作させるシステムの提供。
【解決手段】通信端末100は、第1プログラムおよびデータ格納手段101と、音声処理手段102と、音声処理手段用の言語情報を作成する音声処理言語情報作成手段103と、サーバ200からプログラム/データを取得する送受信手段104と、取得したプログラム/データを記憶する第2プログラムおよびデータ格納手段105と、第2プログラムおよびデータ格納手段105に記憶されたプログラム/データに基づいて、音声処理手段102と、第1プログラムおよびデータ格納手段101のプログラム/データを連携制御する制御手段106を含み、サーバ200は、送受信手段201と、通信端末から送信されたデータを基に言語情報を作成する音声処理言語情報作成手段202を含む。 (もっと読む)


【課題】複数の話者が発生する音声または記す文字に出現する語彙を集めた言語モデルをクラスタリングすることができるクラスタリングシステムを提供する。
【解決手段】言語モデル群をクラスタリングするクラスタリングシステム1は、言語モデル群に含まれる語彙の和集合をエントリとして含む和集合言語モデルを、言語モデルそれぞれについて作成する和集合言語モデル作成部15と、和集合言語モデル群に対してクラスタリングを行って、前記和集合言語モデル群を複数のクラスタに分類するクラスタリング部14とを備え、和集合言語モデル作成部15は、ある言語モデルについて和集合言語モデルを作成する際に、基となる当該言語モデルに含まれている語彙については、当該言語モデルの対応するエントリの出現頻度を記録し、当該言語モデルに含まれていない語彙については、出現頻度が0であることを示すデータを記録する。 (もっと読む)


【課題】容易に音響モデルの教師なし適応に適した精度の高い音声認識結果を選択し、選択した音声認識結果を用い、精度の高い音響モデルを構築する。
【解決手段】信頼度付与部150が、音声認識結果を用い、当該音声認識結果の単語系列を分割した発話系列毎に、認識率の推定値である信頼度を算出し、発話選択部160が、音響モデルの認識率と発話系列毎の信頼度とを用い、音響モデルの適応に用いる発話系列を選択し、音響モデル適応部170が、発話選択部160が選択した発話系列及び当該発話系列に対応する特徴量を用い、音響モデルの適応を行う。 (もっと読む)


61 - 80 / 134