説明

Fターム[5D015GG02]の内容

音声認識 (5,191) | 標準パターンの学習 (485) | 標準パターンの削除 (37)

Fターム[5D015GG02]に分類される特許

21 - 37 / 37


【課題】 従来技術では、事前に認識ネットワークに挿入した付帯語と使用者が発話する付帯語が一致しない場合、演算量・メモリ量の増加、音声認識性能の低下という悪影響が生じる、という問題があった。本発明はかかる課題を、適切な付帯語を選択して動的に付帯語ネットワークを生成して認識ネットワークに挿入することにより解決する。
【解決手段】 認識対象語彙の音素系列である認識ネットワークを記憶する認識ネットワーク記憶部101と、認識対象語の前後で発声される付帯語とそれに付随する情報を記憶する付帯語記憶部102と、付帯語記憶部に記憶されている付帯語及び付随情報から生成される付帯語ネットワークを認識ネットワークに挿入する付帯語挿入部104と、付帯語ネットワークが挿入された認識ネットワークを使用して入力音声を認識する照合部105を備える。 (もっと読む)


【課題】同じ音声の発生をユーザに何度も促すことを回避してデッドロックを防止することができる音声対話システムを提供する。
【解決手段】この音声対話システムは、音声合成部10と、音声認識辞書を参照して入力音声信号に対する認識処理を行い音声認識結果を出力する音声認識部12と、音声認識結果に基づいて検索されるデータベース14と、音声認識辞書を記憶するための音声認識辞書記憶部16と、データベース14を参照して音声認識辞書記憶部16に音声認識辞書を構築する音声認識辞書構築部18と、音声対話のための対話シナリオを記憶及び管理する対話シナリオ部20と、対話シナリオ部20、音声合成部10及び音声認識部12を制御して音声対話を実行させ、音声対話の実行状態に基づいて、音声認識辞書を切り替える処理を音声認識辞書構築部18に実行させる対話制御部22と、を具備する。 (もっと読む)


【課題】音声認識の際に参照される単語を、利用者が視認できるようにした上で追加できるようにする。
【解決手段】被写体の画像を取得する撮像部10と、画像を表示する表示部40と、画像に含まれる文字列(第1文字列)を抽出し、抽出された文字列から、意味がある最小単位の単語を抽出する文字認識エンジン20と、抽出された単語を記憶する単語データベース26(第1記憶部)とを備える。 (もっと読む)


【課題】不要な単語がエントリされることがなく、また必要な単語がエントリから除外されることがない辞書作成装置を提供する。
【解決手段】単語区切りつき施設名称を表すデータが格納されたデータベースから単語区切りつき施設名称を表すデータを読み込み、読み込まれたデータに基づいて、区切られた単語を展開した展開単語を生成し、展開単語に対して形態素解析を行い、形態素解析された展開単語の品詞及び属性情報に基づいて、辞書エントリへの採用を判定し、判定結果に基づいて展開単語を辞書へエントリする。 (もっと読む)


【課題】 1度目の発話に対する音声認識に失敗し、利用者が再発話を行った際の認識性能を向上させることにより、少ない発話回数で正しい音声認識結果を導き出す。
【解決手段】 音声認識装置100は、音声認識の対象となる単語が登録された認識単語リスト5、認識単語リストに基づいて音声と比較し評価するための言語辞書を作成する辞書作成部4、音声を言語辞書によって評価することで音声の内容を認識し、認識結果を生成する音声認識部2、生成された認識結果を出力する認識結果出力部6、出力した認識結果が正しいか否かを確認するための認識結果確認部7とを備え、辞書作成部4が認識結果確認部7により得られた情報に基づいて作成する言語辞書3の調整を、認識結果確認部7により誤認識と確認された認識結果の認識単語を除外することにより行う。 (もっと読む)


【課題】EPGから得られる番組情報をリアルタイムに認識辞書に反映させることにより、音声入力の認識率を高め、検索率を向上させることを可能にする。
【解決手段】検索が行われた際の検索履歴情報を記憶する検索履歴情報記憶部と、キーワードに読みを付与するための形態素辞書を記憶する形態素辞書記憶部と、EPGの各番組情報から抽出したキーワードに対して形態素辞書に基づいて読みを付与することによりマスタ認識辞書を作成し、また、検索履歴情報から抽出したキーワードに対して読みを付与することによりユーザ認識辞書を作成する辞書生成部と、ユーザによる音声入力されたキーワードに基づいてマスタ認識辞書とユーザ認識辞書を参照して当該音声入力されたキーワードに対応する音声認識語彙を抽出してテキスト情報に変換する音声認識部を備える。 (もっと読む)


【課題】本発明は、話者テンプレート圧縮方法および装置、複数の話者テンプレートをマージする方法および装置、ならびに話者認証技術を提供する。
【解決手段】話者テンプレート圧縮方法および装置、複数の話者テンプレートをマージする方法および装置、話者認証登録の方法および装置、話者認証検証の方法および装置、ならびに話者認証のシステムを提供する。複数の特徴ベクトルを含む話者テンプレートを圧縮する上記方法は、複数のコードおよびコードに対応する特徴ベクトルを含むコードブックに従って、上記話者テンプレート内の上記複数の特徴ベクトルのそれぞれにコードを指定することと、話者テンプレート内の同じコードで指定された複数の隣接する特徴ベクトルを1つの特徴ベクトルで置換することを含む。 (もっと読む)


【課題】 クライアント端末装置の処理能力が小さくてもユーザの要求を満たす語彙を供給するようにする。
【解決手段】 第1音声認識部112Bは音声前処理部112Aより出力された音声特徴量に基づき、入力された音声を第1認識辞書113を用いて音声認識する。結果判定部115は第1音声認識部112Bにより音声認識された認識結果の信頼性を判定し、該認証結果を受理するか棄却するかを判定し、その結果、認証結果を棄却するものとした判定された場合には、通信部116は、他の音声認識手段としてのサーバ装置120からの認識結果を受信する。結果出力部11は受理された認証結果,又は通信手段116により受信したサーバ装置120からの認識結果を出力し、辞書更新制御部119は確定結果入力部118により入力された確定結果に基づき、第1認識辞書113を更新する。 (もっと読む)


【課題】 音声認識辞書が有する比較データの容量を好適に抑制し、同時に音声認識処理時間を短縮するとともに入力音声の認識結果のうちからユーザが所望の目的地を選択する操作の操作性向上を図ることが可能な音声認識装置及びこれを備えた車両用走行誘導装置を提供する。
【解決手段】 入力音声を認識するための比較データを格納する音声認識辞書3Aと、入力音声に基づき生成される入力音声データと比較データとを比較して入力音声を認識し、該入力音声の認識結果を出力する音声認識部4とを備えた音声認識装置1Aであって、音声認識辞書3Aは、地名を表示情報として有する地名比較データを有し、一の地名を表示情報として有する地名比較データを有している場合に、他の同一名称の地名を表示情報として有する地名比較データを有していないことを特徴とする。 (もっと読む)


【課題】対象者のシステムへの登録を受け入れるか否かを判定する音声バイオメトリックシステム及び方法を提供する。
【解決手段】対象者から取得したバイオメトリック入力の第一のインスタンスから抽出した特徴ベクトルから、テンプレートを生成する。前記対象者から取得した前記バイオメトリック入力の第二のインスタンスから抽出した特徴ベクトルと前記テンプレートとを比較し、前記バイオメトリック入力の前記第一のインスタンスと前記第二のインスタンスとの間の類似度に基づいて、合致スコアを生成する。前記合致スコアが所定の基準閾値を満たしていれば、バイオメトリックシステムへの前記登録者の登録を受け入れる。 (もっと読む)


【課題】認識のための音声が入力されてから短時間内に、音声認識処理を終えて、音声入力された語彙を特定する音声認識装置及び音声認識方法を提供すること。
【解決手段】入力される音声を音声信号に変換して出力する音声入力手段102と、音声入力手段102が出力する音声信号における語頭の1音節と語尾の1音節とを認識することが可能な語頭・語尾音声認識手段103と、語頭・語尾音声認識手段103が認識した語頭の1音節及び語尾の1音節の一方または両方を用いて認識対象語彙の範囲を絞込む語彙絞込み手段111と、語彙絞込み手段111によって絞込まれた範囲内の認識対象語彙を用いて上記音声信号における語彙の認識を行う単語音声認識手段104とを有することを特徴とする音声認識装置を構成する。 (もっと読む)


【課題】 音声認識装置を使用する環境によって周囲騒音の変化や発声レベルの変化があった場合でも、入力信号レベル情報と発声単語の使用頻度に連動して認識辞書の待ち受け語彙数の範囲を変化させることにより安定した音声認識が行える装置を提供する。
【解決手段】 辞書設定部2は、現在の入力信号レベルの情報と、話者が過去に発声した語彙の発声回数情報とに応じて、認識辞書格納部4に格納された認識辞書に対する語彙数の範囲を変化させる。そして、認識部3は、変化した語彙数の範囲を用いて音声認識を行う。また、語彙に対する使用回数を認識辞書格納部4に対して登録更新することで、使用環境に依存することなく安定した音声認識を行うことができる。 (もっと読む)


【課題】音声認識に用いる単語リストの性能を評価することができる認識性能推定装置及び単語リストに含まれる単語の中から認識障害となる単語を抽出することができる認識障害単語抽出装置を提案する。
【解決手段】対象単語と対立単語の二単語を入力とし、単語類似度を算出する単語類似度算出手段と、対象単語と単語リストを入力とし、単語誤認識スコアを算出する単語誤認識スコア算出手段と、単語リストを入力とし単語リストに含まれる全ての単語の平均的な単語誤認識スコアを算出する平均単語誤認識スコア算出手段と、単語リストに含まれる単語数と平均単語誤認識スコアと、音声認識処理において解候補を探索する際に設定される候補数絞込み基準値の三要素を入力として、音声認識率の推定値を算出する音声認識率推定手段とを備える音声認識性能推定装置および単語リストの中から認識障害となる単語を抽出する認識障害抽出装置。 (もっと読む)


【課題】段階的な入力操作を行わせることなく簡単に音声を精度良く認識する。
【解決手段】マイク3から音声が入力されると、音声認識装置1は、予め設定しておいた単語辞書を検索し、マイク3から入力した音声に対応した認識候補を一致度合いの順番を付して選択し、車内CAN通信網2からの現在の車両情報を基に、検索した各認識候補毎に予め設定しておいた車両情報に対応した重み付け係数を定め、一致度合いと重み付け係数とに基づき各認識候補の最終的な一致度合いを決定する。そして、最終的な一致度合いの認識候補の音声に基づき該当する車載機器4に対して信号を出力して作動させる。また、音声認識装置1は、認識した音声が正しいか否かをスピーカ5を通じて発声することにより常にドライバに確認しながら、認識結果の確認を行い、2回誤認識した場合には、再び、ドライバに対して音声入力を促す。 (もっと読む)


【課題】 待ち受け単語を限定して音声認識効率を向上すること。
【解決手段】 地名・施設名辞書110cから音声認識用辞書110aに音声認識実行時の待ち受け単語として読み込む施設名称の音声データを、使用者が発話する可能性の高いものだけに限定し、さらに音声認識実行時に使用者が発話する可能性がより高いものほど音声認識結果として決定されやすくするために、音声認識用辞書110aに読み込んだ全ての待ち受け単語に対して、使用者によって発話される可能性の高さに応じた音声近似度設定する。 (もっと読む)


【課題】キーワードによる認識対象語の絞り込みを適切に行って最適な語彙数の辞書を再構築し、その後の音声認識処理で適切な認識結果を得られるようにする。
【解決手段】信号処理装置6の認識処理手段11が、第1の音声認識処理でユーザ発話文から抽出したキーワードを検索キーワードとして用いて、辞書再構築のための認識対象語の絞り込みを行う。このとき、絞り込み度合い判断手段12が認識処理手段11による認識対象語の絞り込み度合いを判断し、絞り込みが過剰であると判断された場合には、絞り込み条件を緩和した上で認識対象語の絞り込みを再度行う。そして、最適な語彙数に絞り込まれた認識対象語で辞書を再構築し、再構築した辞書を用いた第2の音声認識処理により、ユーザ発話文に対する最終的な認識結果を得る。 (もっと読む)


地理的基準(GK)を考慮して自動的に進行される対話において入力要求(P)が生成されてユーザーに向けて出力され、前記ユーザーによって話された応答(S)が検出される、音声制御ナビゲーションシステム(1)を操作する方法が記載される。音声応答(S)は前記地理的基準(GK)を考慮に入れて自動音声認識法を使って位置データの認識のために解析される。さらに、対応するナビゲーションシステム用音声データユーザーインターフェースが記載される。
(もっと読む)


21 - 37 / 37