説明

国際特許分類[G10L15/10]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | 未知音声と標準パタンとの距離または歪みを用いるもの (838)

国際特許分類[G10L15/10]に分類される特許

71 - 80 / 838


【課題】写っている人物の体調/気分をわかりやすく撮影すること。
【解決手段】デジタルカメラは、被写体を撮像して画像データを生成する撮像手段13と、被写体画像データに基づいて人物の顔の表情を検出する表情検出手段17と、撮影開始前に撮像手段13で生成された画像データを用いて表情検出手段17が検出した表情に基づいて人物の体調/気分を判定する体調/気分判定手段17と、体調/気分判定手段17による判定結果に基づいて所定の撮影開始条件を選択する撮影開始条件選択手段17と、選択された撮影開始条件を満たす場合に撮影を開始させる撮影制御手段17と、を備える。 (もっと読む)


【課題】負荷を抑えつつ、特定の話者の状態を精度よく検出する状態検出装置を提供する。
【解決手段】音声に含まれる情報を利用して特定の話者の状態を精度よく検出するために、状態検出装置に、非抑圧状態における特定の話者の音声の特徴をモデル化した第1の特定話者モデルを生成する第1のモデル生成手段と、対応関係情報に基づいて、第1の不特定話者モデルに対する第2の不特定話者モデルへの変位量を、第1の特定話者モデルに反映することにより、抑圧状態における特定の話者の音声の特徴をモデル化した第2の特定話者モデルを生成する第2のモデル生成手段と、入力音声の特徴に対する第1の特定話者モデルの尤度である第1の尤度と、入力音声に対する第2の特定話者モデルの尤度である第2の尤度と、を算出する尤度算出手段と、第1の尤度および第2の尤度に基づいて、入力音声の話者の状態を判別する状態判別手段と、を備える。 (もっと読む)


【課題】電話を使った詐欺や悪徳商法などの犯罪を最小限にし又は未然に防止し、電話加入者の電話利用の安全性を向上させる。
【解決手段】電話網に、詐欺の手口の変化に柔軟に対応可能な音片データを持つデータベースと、電話呼制御が可能な詐欺対策装置を配備し、詐欺対策のサービスを享受したい電話加入者に対して着信する呼について、発信者及び着信者に、この通話は詐欺対策機能が動作するもとで呼接続される旨のガイダンスを送出し、呼接続成立後に、発信者及び着信者からの音声を音声認識し、詐欺で多用される用語を検出した際には、通話中又は呼切断後直ちに着信者又は予め設定された着信者の関係者に対して、詐欺対策装置から、先に行われた通話は詐欺である可能性が高い旨注意を喚起する。また、詐欺の可能性の高い通話を記録し、有識者に通話内容を提示し、新しい手口の詐欺に対応できる新しい用語を抽出させて新たに登録する。 (もっと読む)


【課題】観測音が認識対象とする音であるか否かの判定を漏れなく行う。
【解決手段】HMMを用いて、観測音から抽出した特徴量の、目的音に基づく第1の認識モデルおよび非目的音に基づく第2の認識モデルに対する尤度と、観測音が目的音および非目的音のうち何れであるかを示す認識結果とを認識部で求め、認識結果が示す認識モデルに対応する尤度を用いて信頼度算出部で認識結果の信頼度を算出する。認識結果と信頼度とを用いて、認識結果の正解率を、観測音が目的音と仮定した場合と、観測音が非目的音と仮定した場合とについて正解率算出部で算出する。警報出力処理部は、認識結果と正解率と基づき、認識結果が目的音を示し、正解率が第1の閾値以下の場合と、認識結果が非目的音を示し、正解率が第2の閾値以下の場合とにおいて、観測音が目的音と非目的音の何れにも属さない未知音であることを示す情報を出力する。 (もっと読む)


【課題】雑音環境下においても容易且つ高精度に特定音を検出する。
【解決手段】信号パワー算出部および傾き算出部で、集音された観測音による音データの特徴を示す特徴値を時系列に沿って算出する。一方、検出対象の音と種類が同一で音が互いに異なる複数の学習データのそれぞれから、時系列に沿って特徴値の期待値を、スコアパラメータとして予め求める。スコア算出部で、音データから求めた特徴値と、学習データから求めた特徴値の期待値との差分に基づき、音データを評価するスコアを算出する。発生区間検出部で、スコアの極大値の位置と極小値の位置とを検出し、極大値の位置および極小値の位置に基づき、観測音による音データ中の特定音発生区間を検出する。 (もっと読む)


【課題】 音声信号の音質を劣化させることなく、非定常音の目立たない音声信号を取得することができる技術を提供することを目的とする。
【解決手段】 撮像装置が発する駆動音の情報を記憶する記憶部と、録音した音声と駆動音との類似の度合いを示す類似度を駆動音の情報を用いて算出する演算部と、類似度に基づいて音声と駆動音とが類似するか否かを判定し、判定結果に応じて駆動音を伴う駆動動作を制御指示する制御部と、を備える。 (もっと読む)


【課題】単語の意味情報を記録したデータベース(例えば感情関係語DB)を用いずに、対象音声データまたは対象テキストデータから感情を推定する感情推定装置、その方法、そのプログラム及びその記録媒体を提供することを目的とする。
【解決手段】対象テキストデータの形態素解析結果と構文解析結果との少なくとも一方を用いて、対象テキストデータ内にどの程度その意味内容が明示されているかを表す明示性特徴量を推定し、怒りの感情が表現されているか否かを示す教師信号付きの学習用テキストデータの明示性特徴量から予め学習された識別器を用いて、対象テキストデータ内に怒りの感情が表現されているか否かを、明示性推定部で推定された対象テキストデータの明示性特徴量から識別する。 (もっと読む)


【課題】音情報を検知し、空調空間における使用者の活動状態をより正確に認識することで、操作性や快適性に配慮しながら省エネ運転を行う。
【解決手段】空調空間内の音を収音するマイクロフォン408を備える空気調和機であって、記マイクロフォン408で検知した音信号を増幅する増幅器と、増幅された音信号の中から特定の周波数帯域を抽出する帯域抽出部とを有する。そして、帯域抽出部を複数設け、それぞれ異なる周波数帯域を抽出する。 (もっと読む)


【課題】コンタクトセンタ等における対話内容の検索・分析・視聴の効率化を図る。
【解決手段】音声認識部は、対話音声信号が入力され、認識辞書を参照して音声認識処理を行うことにより、テキスト文書に変換して出力する。個人情報検出部は、認識辞書を参照してテキスト文書を構成する各単語について個人情報にあたるか否かを判断し、個人情報にあたる各単語のテキスト文書内での位置情報を出力する。本人確認発話位置特定部は、各単語の位置情報に基づき、個人情報にあたる単語が集中して現れている部分を特定する。挨拶発話位置特定部は、テキスト文書が入力され、定型辞書を参照して開始定型文と一致する文字列を含む部分及び終了定型文と一致する文字列を含む部分をそれぞれ特定する。対話内容抽出部は、本人確認発話位置特定部及び挨拶発話位置特定部でそれぞれ特定された部分以外の残りの部分をテキスト文書から時系列に抽出する。 (もっと読む)


【課題】発話データから、その発話の言語を信頼性高く識別できる音声言語の識別装置を提供する。
【解決手段】学習装置は、言語ラベル付の音声データの記憶装置、これら音声データについて、所定時間長かつ所定シフト長の音声特徴の系列を抽出するブロック特徴生成部180、抽出された音声特徴の系列からコードブックを生成するコードブック算出部184、複数の音声データの各々について、当該音声データから得られた音声特徴の系列に含まれる音声特徴と最も近い代表ベクトルをコードブックから求め、その分布に基づいて当該音声データの言語ラベル付音声言語特徴を生成する言語音素特徴ベクトル算出部186、及びこの音声言語特徴を学習データとして、音声言語特徴から言語を推定するためのSVMを生成するSVM学習部190を含む。 (もっと読む)


71 - 80 / 838