説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

241 - 250 / 337


【課題】音声は経年変化により変動することを考慮して、登録話者の識別器を低いコストで更新できる話者照合装置等を提供すること
【解決手段】登録話者音声特徴量データを登録話者の話者識別器に入力して仮説スコアを取得しこの仮説スコアを要素とする複数のベクトルからなる登録話者スコアベクトル列を生成する機能と、背景話者音声特徴量データを登録話者の話者識別器に入力して仮説スコアを取得しこの仮説スコアを要素とする複数のベクトルからなる背景話者スコアベクトル列を生成する機能と、登録話者スコアベクトル列と背景話者スコアベクトル列とを記憶装置18に格納する機能とを備えた更新用データ生成手段17を備えた更新用データ生成装置10。 (もっと読む)


【課題】音声によって情報処理を実行する車両用情報処理装置において、コストダウンを図りつつ、ドライバーが実行を指示すべき処理についてはドライバーの音声にのみ反応すること。
【解決手段】あらかじめドライバーの音声(音響的特徴量)を記憶しておく。そして、マイクロフォン35から入力された音声がドライバー用の処理に対する音声である場合には、その音声があらかじめ記憶したドライバーの音声(音響的特徴量)と一致する場合のみ、入力された音声に対応する処理を実行する。マイクロフォン35から入力された音声がドライバーの音声か否かの判定にCCDカメラ等のハードウェアを用いる必要がないので、コスト高となることはない。 (もっと読む)


【課題】 パスワード認証と声紋認証とを組み合わせた2要素認証による堅牢性を実現できると共にユーザ認証時間を短縮可能で、しかも煩雑な作業が要求されない操作性に優れたユーザ認証を提供すること。
【解決手段】 ユーザ通話端末1から対話型音声対応装置3に回線接続し、発話取得部16がユーザ通話端末1に入力されたパスワードの発話音声を電話網2経由で取得する。パスワード取得音声を音声認識サーバ5へ入力して、取得されたパスワード発話音声が予め登録された登録パスワードと一致するか否か音声認識により判定する。パスワード認証に成功した後、当該パスワード発話音声が声紋認証部27へ入力されて、パスワード発話音声の声紋データが当該ユーザのユーザプロファイル内の登録声紋データと一致するか否か判定する。声紋認証結果は認証結果通知28からユーザ管理サーバ7へ通知される。
(もっと読む)


【課題】 会議の現状を定量的に測ることにより、会議をファシリテートしやすくする装置を提供する。
【解決手段】 会議の活性状況を分析する会議活性状況分析装置10であって、各メンバの会議における寄与度をあらわす会議寄与情報を取得する会議寄与情報取得部400と、前記会議寄与情報を元に会議の活性状況を診断する会議活性状況診断部500と、前記診断の結果を出力する会議活性状況出力部600を有することを特徴とする。 (もっと読む)


【解決手段】 声紋キーは電子資料の暗号化と復号化の演算を行うのに用いられることによって声紋パスワードキーが構成される。声紋認証システムは声紋特徴値を生成するのに用いられ、声紋特徴値から声紋キーを選出する。声紋認証システムには前端処理部、特徴抜取部、保存部と運算部を含むことにより、原始入力音声資料に対して訓練またはテストの作業を行う。
【効果】 音声の特徴を抜取る前に、前端処理を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去することにより、資料の処理量を減らし、判別の確率を高めることができる。また、声紋認証システムを利用して声紋キーを生成し、さらに一つの声紋特徴値を選出して電子資料の暗号化または復号化の演算を行うことにより、声紋パスワードキーを構成して電子資料を保護することができる。 (もっと読む)


【課題】ユーザーが使用したい音声認識システムが複数存在する場合においても、ユーザーが音響モデルを何度も作成する必要がなく、かつ、各システムにて高精度の音声認識が可能となる音声認識システムを提供する。
【解決手段】音声認識システム1は、以下のような構成要素からなる。音響モデル作成装置50はユーザーを特定話者とした音声認識用の音響モデル51を作成する。携帯端末装置2は音響モデル作成装置50から取得した該音響モデル51を記憶し、該音響モデル51を、特定話者の音声認識を行なう音声認識装置100に向け出力する。音声認識装置100は携帯端末装置2から音響モデル51を取得する認識装置側音響モデル取得手段6と、取得した該音響モデル51を登録する音響モデル登録手段5Fと、入力された音声波に含まれる認識対象情報を、該音声波と音響モデル51との情報比較に基づいて認識・特定する音声認識手段とを備える。 (もっと読む)


【課題】音声が背景雑音もしくはこの抑圧処理の影響により歪んだり話者の発話内容が異なる場合でも、他人話者の音声の特徴ベクトルを必要とすることなく照合精度を高める。
【解決手段】音声特徴生成処理部1において入力音声から特徴量を抽出して特徴ベクトルを生成すると共に、この生成された特徴ベクトル集合の重心を求めることにより特徴代表ベクトルを生成する。そして照合モードにおいて、第1及び第2の話者特徴変換処理部6,7により、変換係数・しきい値制御部4から与えられる変換係数をもとにコードベクトル及び話者の特徴ベクトル集合をそれぞれの特徴代表ベクトルに近づけるための変換処理を行い、この変換処理後のベクトル間のVQ歪みをしきい値判定処理部9によりしきい値と比較し、これにより話者の本人判定を行っている。 (もっと読む)


【課題】吹き出しや字幕スーパーの作成、編集を容易化する。
【解決手段】動画データは顔検出手段103に入力されて顔特徴量と顔位置が検出され、音声識別手段104に入力されて音声特徴量が検出される。検出された各特徴量は話者特定手段107に送られ、音声・顔対応データ記憶手段106に登録されている話者の特徴量と比較されて特定話者の位置が特定される。特定された話者の音声は、音声認識手段105によりテキスト化される。話者の位置とテキストデータにより吹き出し作成手段112により吹き出しが作成され、動画像作成手段114により動画データと音声データと吹き出しデータとをまとめて新たな動画データが作成される。 (もっと読む)


【課題】 利用者がストレスを解消する際に過去のストレスの原因となった事象を振り返ることができるストレス解消環境提供システムを提供する。
【解決手段】 ストレス解消環境提供システムは、利用者が不満を含む任意の内容を発声する場所として提供される防音室10と、この防音室10の利用を管理する管理サーバとを備える。防音室10の室内に設置された端末装置30は、利用者が発声した発声内容の原因を含む情報が入力されるのに応じて、当該情報を管理サーバに対して送信する。これに応じて、管理サーバは、端末装置30から送信された情報を履歴として所定の情報蓄積部に蓄積し、利用者の要求操作に応じて当該利用者の過去の履歴情報を情報蓄積部から読み出して端末装置30に対して送信し、当該利用者に閲覧可能な形態でディスプレイ31に表示させる。 (もっと読む)


【課題】エンターテインメント性を向上させ得る学習装置及び学習方法並びにロボット装置を提案する。
【解決手段】対象とする物体の名前をユーザから取得する前から、当該対象とする物体の複数の異なる所定の特徴を学習するための学習用データを収集して当該物体の各特徴を学習し、対象とする物体の各特徴の学習結果及び予め記憶している既知の物体の各特徴の学習結果に基づいて当該対象とする物体を認識し、ユーザとの対話を通して取得した対象とする物体の名前と、当該対象とする物体の認識結果と、予め記憶している既知の物体の名前、当該既知の物体の各特徴に対する認識結果を関連付けた関連付け情報とに基づいて、対象とする物体が新規であると判断したときには、当該対象とする物体の必要な特徴を学習すると共に、当該対象とする物体についての関連付け情報を新たに記憶するようにした。 (もっと読む)


241 - 250 / 337