説明

国際特許分類[G10L15/10]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | 未知音声と標準パタンとの距離または歪みを用いるもの (838)

国際特許分類[G10L15/10]に分類される特許

81 - 90 / 838


【課題】緊急地震速報のチャイム音のように特定音を誤検出することなく的確に検出することが可能な特定音検出装置および防災受信機を提供する。
【解決手段】レベル変化を伴う複数の周波数成分を含む特定音の音声信号から少なくとも2つの周波数成分を抽出するフィルタ部13,14と、フィルタ部で抽出された複数の音声信号をアナログ信号からデジタル信号にそれぞれ変換するアナログデジタル(AD)変換部151,152と、AD変換部による複数の周波数成分のデータを演算処理し、演算処理結果により所望周波数成分の有無を判断する信号処理部155と、信号処理部の演算処理結果を継続して保存する記憶部156と、を含み、信号処理部155は、記憶部156に保存された演算処理結果の履歴情報を基に、複数の周波数成分のレベルを並列にかつ継続的に解析して所望周波数成分の有無を判断する。 (もっと読む)


【課題】自動撮影時、本番の撮影中に意図しない動作を行う恐れをなくし、かつ自動撮影の設定負荷を簡素化した撮影システムを提供する。
【解決手段】事前準備撮影時、音声・操作情報同期部8は、話者の音声と操作情報を、同期して音声・操作情報記憶部9に記憶する。本番の撮影時、音声同期操作情報識別部11は、話者の音声に同期して、音声・操作情報記憶部9に記憶した操作情報を用いて自動撮影を行う。 (もっと読む)


【課題】入力信号から楽曲を精度良く同定する。
【解決手段】マスクパターン生成部55は、時間周波数領域に変換された入力信号の各領域における楽曲らしさに応じた重み分布であるマスクパターンを生成し、類似度算出部71は、マスクパターンによる重み付けに基づいて、時間周波数領域に変換された入力信号の各領域における特徴量と、時間周波数領域に変換された参照信号の各領域における特徴量との類似度を算出する。本発明は、入力信号から楽曲を同定する信号処理装置に適用することができる。 (もっと読む)


【課題】情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なRT法によるパターン認識方法を提供する。
【解決手段】複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって平均値m、感度β及び、標準SN比ηに圧縮し、これらの値を用いて判別対象のデータが単位空間内に属するか否かを判別する。 (もっと読む)


【課題】円滑なコミュニケーションを実現できる。
【解決手段】音声翻訳装置は、入力部、音声認識部、感情認識部、平静文生成部、翻訳部、補足文生成部、及び音声合成部を含む。入力部は、第1言語の音声を音声信号に変換する。音声認識部は、音声信号を音声認識処理し文字列を生成する。感情識別部は、文字列がどの感情種別を含むかを識別して1以上の感情種別を含む感情識別情報を得る。平静文生成部は、感情に伴って語句が変化した非平静語句と、非平静語句に対応しかつ感情による変化を伴わない平静語句とを対応付けたモデルより、文字列に第1言語の非平静語句が含まれる場合、第1言語の非平静語句を対応する第1言語の平静語句に変換した平静文を生成する。翻訳部は、平静文を第2言語に翻訳した訳文を生成する。補足文生成部は、感情識別情報の感情種別を第2言語で説明する補足文を生成する。音声合成部は、訳文と補足文とを音声信号に変換する。 (もっと読む)


【課題】会話のような比較的長い音声データから特定のキーワードを認識する精度を向上できる音声認識装置を提供する。
【解決手段】音声認識装置1は、音声データの一部が分類される複数の区分の何れかに対応する複数の単語辞書を記憶する記憶部3と、処理部4とを有する。処理部4は、音声データから複数の会話区間を検出する会話区間検出機能11と、音声データから複数の発声区間を検出する発声区間検出機能12と、複数の発声区間のそれぞれを、複数の会話区間のうちのその発声区間が属する会話区間の順序に応じて複数の区分の何れかに分類する区間分類機能13と、少なくとも一つの発声区間について、複数の単語辞書のうち、発声区間が分類された区分に対応する単語辞書を記憶部から取得する単語辞書選択機能14と、発声区間の少なくとも一つから、その発声区間について取得された単語辞書を用いて特定のキーワードを検出する検出機能15とを実現する。 (もっと読む)


【課題】楽曲等の音響データを用いて、音響データベースの音響データに関連情報を検索するにあたり、複数のレコードが適合した場合に、その優先順位を的確に定めることが可能な音響データの関連情報検索装置を提供する。
【解決手段】音響データベースに、原音響データの特徴を表現した登録特徴ワード群と、登録特徴ワード群の比較のための個別判定参考値を登録しておく。所定の区間単位で、検索音響データの特徴を表現した検索特徴ワードを生成し登録特徴ワード群との照合を行い、両ワード群の最小の相違の程度である合算不一致ビット数Sを算出し(S322)、設定された標準最小相違度と登録特徴ワード群に対応して登録された個別判定参考値との比率に基づいて合算不一致ビット数Sを補正して補正値S´を得て(S323)、補正値S´が判定しきい値MM2以下の場合に、登録特徴ワード群に対応する原音響データを選出対象として特定する(S326)。 (もっと読む)


【課題】 音声認識辞書の単語単位とキーワードの単語単位とが異なる場合でも、音声認識結果に所定のキーワードが含まれるかどうかを精度よく判定できる音声認識結果検索装置を提供する。
【解決手段】 音声認識結果検索装置は、入力音声に対する認識処理の結果の候補である認識候補と、該各認識候補に付与された前記入力音声と類似する度合いを示す音声認識スコアとを、音声認識結果として取得すると共に、前記各音声認識スコアを、互いに共通の所定の特徴を有する認識候補にそれぞれ付与された音声認識スコアを用いて再計算する音声認識スコア再計算手段と、前記再計算された音声認識スコアに基づいて、所定のキーワードと前記音声認識結果との距離を算出する距離計算手段と、前記算出された距離に基づいて、前記所定のキーワードが前記音声認識結果に含まれるか否かを判定するキーワード探索手段とを備える。 (もっと読む)


【課題】自治体などの地理的領域毎に、当該地理的領域で使用されている領域固有音声データ(サイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定し、一致する場合には、その旨を車両内に報知することを可能にする。
【解決手段】本発明の特定音声認識装置は、入力される周辺の音声を取得してデジタル音声データとして出力する音声取得部と、自らの現在位置を算出して出力する現在位置生成部を含んでいる。また、所定の地理的領域でのみ聞かれる領域固有音声を記憶する領域固有音声記憶部と、現在位置が属する特定地理的領域を出力する現在位置認識特定部を含んでいる。さらに、特定地理的領域の領域固有音声と、デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する音声認識結果報知部を含んでいる。 (もっと読む)


【課題】歩行周期の揺らぎや足音検出の一部欠落がある場合であっても足音の周期を算出することができる物音検知装置、物音検知方法および物音検知システムを提供する。
【解決手段】物音の信号を検出する物音検出部102と、検出された複数の物音に、三角関数が描く波形の変曲点が合致するように三角関数の周期を変動させ、物音に変曲点が合致した波形の周期を物音の周期と決定する周期算出部104と、決定された物音の周期が所定の範囲内であるか否かを判断し、物音の周期が範囲内であると判断した場合に、検出された複数の物音が検出対象音であると判断する判断部105と、を備えた。 (もっと読む)


81 - 90 / 838