説明

Fターム[5D015AA03]の内容

音声認識 (5,191) | 目的、機能 (1,020) | 話者の識別、照合 (293)

Fターム[5D015AA03]に分類される特許

201 - 220 / 293


【課題】音声の識別能力を推定する方法及び装置、ならびに話者認証の登録及び評価方法及び装置を提供する。
【解決手段】話者認証の登録方法は、話者によって発話されるパスワードを含む音声を入力するステップ101と、入力音声から音素列を取得するステップ110と、音素毎の識別能力を含む識別能力表に基づき音素列の識別能力を推定するステップ115と、音声のための識別閾値を設定するステップ130と、音声のために音声テンプレートと生成するステップ135とを含む。 (もっと読む)


【課題】個人の発話器官の形状を反映し個人の同定を短時間に行なう装置を提供する。
【解決手段】 装置は、ある音素を発話中の発話者の声道形状を表すMRIデータ30及び音声データ32と、発話中の話者の音声データとに基づいて話者を同定する装置であり、複数の発話者について声道形状の主成分分析を行なうPCA分析部60と、発話者の各々につき音声データからケプストラム係数を算出するケプストラム算出部64と、複数の発話者の各々の声道形状を主成分ベクトルの線形和で近似するための主成分係数を算出する主成分係数算出部67と、複数の発話者の各々に対しケプストラム係数の線形和で主成分係数を推定するための回帰係数36を決定する重回帰分析処理部68と、同定時に、発話者の音声データより得たケプストラム係数と回帰係数36から主成分係数を推定し、複数の発話者から得ておいた係数と比較して同定を行なう同定処理装置とを含む。 (もっと読む)


【課題】生体認証に適さないユーザが、正当なユーザでないと誤って認証されることがあった。
【解決手段】ユーザが正当なユーザであることを認証するための認証方法であって、前記正当なユーザであることの認証を要求する前記ユーザから生体情報を取得し、前記取得された生体情報のサンプルから特徴を抽出し、前記抽出された特徴と前記正当なユーザに対応するテンプレートとの間の、スコアによって示される類似性を求めるために、前記抽出された特徴と前記テンプレートとを比較し、前記正当なユーザが補正要素を有するかどうかを判定し、前記正当なユーザが補正要素を有すると判定された場合、前記補正要素を用いて、前記スコアを変更し、前記スコアと閾値を比較し、前記ユーザが正当なユーザか否かを認証することを特徴とする。 (もっと読む)


【課題】複数人の会話を録音した場合に、会話者の区別を自動で行い、特定者の会話内容のみを簡単な操作で自動再生可能とする。
【解決手段】複数のマイクロホン3,4からの入力音声を音声メモリ19に録音(記録)する制御を行うとともに、音声メモリ19に録音された録音データを再生する制御を行うコントローラ1を備えており、コントローラ1は、マイクロホン3,4から入力される音声の音量を計測する音量計測手段と、音量の計測結果に基づいて発話者を特定する発話者特定手段とを備えており、発話者特定手段により特定された発話者の切り替わったことを検出した場合に、録音データにマークを付与することで、再生時にはそのマークを利用して、選択された発話者の録音データを抽出再生する。 (もっと読む)


【課題】 音声を文字化したデータをせりふや場面の内容に合った様式で自動的に表示することができる音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラムを提供する。
【解決手段】 映像・音声信号解析部48は、音声付き映像データ60中の音声データ62から文字に変換可能な人の声を音声認識処理により文字化して発話内容情報として出力する。また、映像・音声信号解析部48は、音声特徴量情報、発話時間情報、発話者識別するための発話者識別子及び発話者の画面上における位置座標を取得して発話者情報を取得する。メタデータ生成部50は、上記の発話時間情報、発話内容情報、発話者情報、音声特徴量情報等を所定のファイル形式(例えば、xml形式)のメタデータに格納する。このメタデータは、所定の形式(例えば、MPEG−2やAVI形式)で映像・音声信号記録部46に保存される。 (もっと読む)


【課題】 指定した人物が喋った内容が含まれるデータを効率よく検索可能とする。
【解決手段】 字幕データ比較部115は、話者を示す話者情報106及び当該話者の台詞の内容をテキスト化した字幕のテキスト情報107のデータの組のうち、入力された検索条件に合致するデータの組みを判定し、音声データ検索部118及び動画像データ検索部119は、判定されたデータの組みに対応する位置データに基づいて、その位置データにより示される位置のデータを検索対象データから検索する。 (もっと読む)


【課題】音声によって情報処理を実行する車両用情報処理装置において、コストダウンを図りつつ、ドライバーが実行を指示すべき処理についてはドライバーの音声にのみ反応すること。
【解決手段】あらかじめドライバーの音声(音響的特徴量)を記憶しておく。そして、マイクロフォン35から入力された音声がドライバー用の処理に対する音声である場合には、その音声があらかじめ記憶したドライバーの音声(音響的特徴量)と一致する場合のみ、入力された音声に対応する処理を実行する。マイクロフォン35から入力された音声がドライバーの音声か否かの判定にCCDカメラ等のハードウェアを用いる必要がないので、コスト高となることはない。 (もっと読む)


【課題】音声は経年変化により変動することを考慮して、登録話者の識別器を低いコストで更新できる話者照合装置等を提供すること
【解決手段】登録話者音声特徴量データを登録話者の話者識別器に入力して仮説スコアを取得しこの仮説スコアを要素とする複数のベクトルからなる登録話者スコアベクトル列を生成する機能と、背景話者音声特徴量データを登録話者の話者識別器に入力して仮説スコアを取得しこの仮説スコアを要素とする複数のベクトルからなる背景話者スコアベクトル列を生成する機能と、登録話者スコアベクトル列と背景話者スコアベクトル列とを記憶装置18に格納する機能とを備えた更新用データ生成手段17を備えた更新用データ生成装置10。 (もっと読む)


【課題】 パスワード認証と声紋認証とを組み合わせた2要素認証による堅牢性を実現できると共にユーザ認証時間を短縮可能で、しかも煩雑な作業が要求されない操作性に優れたユーザ認証を提供すること。
【解決手段】 ユーザ通話端末1から対話型音声対応装置3に回線接続し、発話取得部16がユーザ通話端末1に入力されたパスワードの発話音声を電話網2経由で取得する。パスワード取得音声を音声認識サーバ5へ入力して、取得されたパスワード発話音声が予め登録された登録パスワードと一致するか否か音声認識により判定する。パスワード認証に成功した後、当該パスワード発話音声が声紋認証部27へ入力されて、パスワード発話音声の声紋データが当該ユーザのユーザプロファイル内の登録声紋データと一致するか否か判定する。声紋認証結果は認証結果通知28からユーザ管理サーバ7へ通知される。
(もっと読む)


【解決手段】 声紋キーは電子資料の暗号化と復号化の演算を行うのに用いられることによって声紋パスワードキーが構成される。声紋認証システムは声紋特徴値を生成するのに用いられ、声紋特徴値から声紋キーを選出する。声紋認証システムには前端処理部、特徴抜取部、保存部と運算部を含むことにより、原始入力音声資料に対して訓練またはテストの作業を行う。
【効果】 音声の特徴を抜取る前に、前端処理を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去することにより、資料の処理量を減らし、判別の確率を高めることができる。また、声紋認証システムを利用して声紋キーを生成し、さらに一つの声紋特徴値を選出して電子資料の暗号化または復号化の演算を行うことにより、声紋パスワードキーを構成して電子資料を保護することができる。 (もっと読む)


【課題】ユーザーが使用したい音声認識システムが複数存在する場合においても、ユーザーが音響モデルを何度も作成する必要がなく、かつ、各システムにて高精度の音声認識が可能となる音声認識システムを提供する。
【解決手段】音声認識システム1は、以下のような構成要素からなる。音響モデル作成装置50はユーザーを特定話者とした音声認識用の音響モデル51を作成する。携帯端末装置2は音響モデル作成装置50から取得した該音響モデル51を記憶し、該音響モデル51を、特定話者の音声認識を行なう音声認識装置100に向け出力する。音声認識装置100は携帯端末装置2から音響モデル51を取得する認識装置側音響モデル取得手段6と、取得した該音響モデル51を登録する音響モデル登録手段5Fと、入力された音声波に含まれる認識対象情報を、該音声波と音響モデル51との情報比較に基づいて認識・特定する音声認識手段とを備える。 (もっと読む)


【課題】音声が背景雑音もしくはこの抑圧処理の影響により歪んだり話者の発話内容が異なる場合でも、他人話者の音声の特徴ベクトルを必要とすることなく照合精度を高める。
【解決手段】音声特徴生成処理部1において入力音声から特徴量を抽出して特徴ベクトルを生成すると共に、この生成された特徴ベクトル集合の重心を求めることにより特徴代表ベクトルを生成する。そして照合モードにおいて、第1及び第2の話者特徴変換処理部6,7により、変換係数・しきい値制御部4から与えられる変換係数をもとにコードベクトル及び話者の特徴ベクトル集合をそれぞれの特徴代表ベクトルに近づけるための変換処理を行い、この変換処理後のベクトル間のVQ歪みをしきい値判定処理部9によりしきい値と比較し、これにより話者の本人判定を行っている。 (もっと読む)


【課題】吹き出しや字幕スーパーの作成、編集を容易化する。
【解決手段】動画データは顔検出手段103に入力されて顔特徴量と顔位置が検出され、音声識別手段104に入力されて音声特徴量が検出される。検出された各特徴量は話者特定手段107に送られ、音声・顔対応データ記憶手段106に登録されている話者の特徴量と比較されて特定話者の位置が特定される。特定された話者の音声は、音声認識手段105によりテキスト化される。話者の位置とテキストデータにより吹き出し作成手段112により吹き出しが作成され、動画像作成手段114により動画データと音声データと吹き出しデータとをまとめて新たな動画データが作成される。 (もっと読む)


【課題】 利用者がストレスを解消する際に過去のストレスの原因となった事象を振り返ることができるストレス解消環境提供システムを提供する。
【解決手段】 ストレス解消環境提供システムは、利用者が不満を含む任意の内容を発声する場所として提供される防音室10と、この防音室10の利用を管理する管理サーバとを備える。防音室10の室内に設置された端末装置30は、利用者が発声した発声内容の原因を含む情報が入力されるのに応じて、当該情報を管理サーバに対して送信する。これに応じて、管理サーバは、端末装置30から送信された情報を履歴として所定の情報蓄積部に蓄積し、利用者の要求操作に応じて当該利用者の過去の履歴情報を情報蓄積部から読み出して端末装置30に対して送信し、当該利用者に閲覧可能な形態でディスプレイ31に表示させる。 (もっと読む)


【課題】 音声認証精度の向上を図る。
【解決手段】 予め、人の発話音声の空気伝導音を集音する第1マイクと、人の発話音声の体内伝導音を集音する第2マイクとにより集音した人の発話音声の特徴パラメーターを抽出して記憶しておき、第1マイクと第2マイクにより集音した人の発話音声から特徴パラメーターを抽出し、記憶されている特徴パラメーターとマイクごとに比較照合し、この比較照合結果に基づいて利用者として適格か否かを認証する。 (もっと読む)


【課題】 登録者の音声の本来の特徴を登録し、認識誤りが発生する虞を低減させる。
【解決手段】 登録者は、登録者の識別子を入力した後、所定の文言を複数回発音する。
登録者の音声は、音声入力部106に入力され音声データに変換される。CPU102は、音声データから音声の特徴量を抽出し記憶部105に記憶させる。記憶部105に記憶された各発音の特徴量のうち、共に記憶された他の特徴量との距離が所定値以上に大きな特徴量は記憶部105から消去される。この後、CPU102は、記憶部105に記憶された特徴量の平均値を求め、求めた平均値を、入力された識別子と対応付けて発音者の音声の特徴量として記憶部105に記憶させる。 (もっと読む)


【課題】 本発明は、ドライバをより良い運転傾向へと誘導することができる対話システムの提供を目的とする。
【解決手段】 本発明は、ドライバに対して適切な運転アドバイスの出力を行う車両における対話システムにおいて、運転操作情報から推定されるドライバの運転操作を、規範となる運転操作を基準にして評価する運転評価手段と、出力した運転アドバイスに対するドライバの反応を、運転アドバイス出力後のドライバの運転操作の変化に基づいて評価する反応評価手段と、ドライバへの運転アドバイスの出力内容に前記運転評価結果を反映させると共に、運転アドバイスの表現方法に前記反応評価結果を反映させる出力制御手段とを備えることを特徴とする。 (もっと読む)


【課題】 携帯情報端末の紛失・盗難発生時に起こり得る他者による不正利用を簡便かつ適切に防止する。
【解決手段】 通話を含む通信手段を有する携帯情報端末が、通話時に発信すべき音声情報から当該発声者を識別するための第1の特徴情報を抽出し、抽出した第1の特徴情報を自端末の記憶手段へ保存する。また、携帯情報端末は、通話時に受信した音声情報から自端末への機能停止命令が検出されたとき、この機能停止命令に継続して受信した音声情報から当該発声者を識別するための第2の特徴情報を抽出する。さらに、抽出した第2の特徴情報と過去に保存した第1の特徴情報とに基づき機能停止命令に対する認証の成否を判定し、認証が成功したとき通信手段の稼動を停止する。 (もっと読む)


【課題】原稿撮像装置の表示パネルやスイッチ等の手操作から解放され、照明の明るさ等の環境に影響されることなく、円滑なプレゼンテーションを行うことが可能となる原稿撮像装置を提供する。
【解決手段】原稿読取手段で読み取った原稿の画像情報を、表示装置に出力可能とした原稿撮像装置において、前記画像情報についての読み取りや出力処理等の操作を指示する音声を、電気信号に変換し入力する音声入力手段21〜23と、前記音声入力手段に入力された操作を指示する音声信号と、予め記録されている操作を指示する信号とが一致していることを認識する信号認識手段26、27と、前記信号認識手段によって一致していることが認識された信号と対応する操作を指示する操作指示手段28と、を有する構成とする。 (もっと読む)


【課題】ユーザを認証するシステムと方法を提供する。
【解決手段】ユーザを認証する方法(700)とシステム(900)が提供される。本方法は、ユーザから一以上の話された言葉を受取り(702)、一以上の話された言葉に対応するフレーズを認識し(704)、フレーズにおける一以上の話された言葉から、ユーザの生体測定の声紋を識別し(706)、デバイスと関連付けられたデバイス識別子を決定し(708)、フレーズ,生体測定の声紋,およびデバイス識別子に基づき、ユーザを認証すること(710)を含む。一以上の資源に対するアクセスを許可する判断基準として、送受信機すなわちユーザの位置が用いられる(712)。 (もっと読む)


201 - 220 / 293