説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

231 - 240 / 337


【課題】 誤識別率の小さい、かつ顔写真や録音された本人の声で詐称できない顔画像と音声を統合した個人認証・識別装置を提供することにある。
【解決手段】 撮像部1から出力されたユーザの顔画像と音声に分離される。顔画像照合部14は、顔画像特徴量抽出部12によって顔画像の静止画像から抽出された特徴量と、予め登録されている個人顔画像データ15とを照合し、尤度αを出力する。一方、音声照合部23は、音声特徴量抽出部22によって音声から抽出された特徴量と、予め登録されている個人音声データ24とを照合し、尤度βを出力する。尤度統合部4は、該尤度αとβを統合して統合尤度を出力し、認証・識別判定部6は該統合尤度を基にユーザの認証及び/又は識別判定をする。前記尤度α、βは、明るさ測定部16からの顔画像の明るさ、背景雑音測定部25からの背景雑音の大きさにより閾値を変えられる。
(もっと読む)


【課題】顧客等との会話が録音された音声データから、議事録を作成すると共に議事録の精度を考慮して緊急に作成すべき議事録を優先的に処理する議事録自動作成システムを提供する。
【解決手段】音声データを変換して議事録を作成する議事録自動作成システム1であって、音声データと議事録の仕上がり希望日からタスクを生成するタスク生成手段31と、文字情報への変換を終えた音声データの一部分の全体に占める割合である変換進捗度と仕上がり希望日から処理優先度をタスク毎に算出し、処理優先度に基づいて処理対象タスクを選出するタスク制御手段32と、処理対象タスクの音声データから声紋を抽出し、声紋に基づいて複数の話者毎の発言データを時系列に抽出すると共に、発言データを複数の電子辞書に基づいて文字情報に変換して議事録を作成し、データベース34に格納する音声変換手段33とを具備する。 (もっと読む)


【課題】 携帯電話で録音した鳥の声によりその鳥を特定し、その鳥の解説をする仕組みを提供する。
【解決手段】(イ)携帯電話端末にユーザーが知りたい鳥の実際の鳴き声を録音し、これをデジタル化したデータをデジタル音声記憶部に鳥の声紋として一時記憶する。
(ロ)本システムには、予め多数の鳥に関する情報(文字、画像、音声)がデジタル化され声紋をキーとしてデータベースに格納されており、このデータベースに鳥の声紋と地域情報および時季情報を与えると、照合し合致した情報(鳥の名前、鳥に関する情報、画像・音声データ等)がデータベースより取り出され検索結果データ記憶部へ一時記憶される。
(ハ)一時記憶されたデータは、制御部のコントロールのもとで端末の表示装置に文字や写真の形で表示されると共にスピーカに音として出力される。 (もっと読む)


【課題】なりすましによる機器の遠隔操作を防止する音声認識システムを提供する。
【解決手段】予め各ユーザの声紋情報が認証用のデータとして登録された認証データテーブル13と、外部から入力された音声から声紋情報と特徴量を抽出する音響分析部11と、声紋情報が認証データテーブル13に登録されているかどうかを検索し、声紋情報が登録されているときは認証済と判別する認証処理部12と、認証処理部12により認証済と判別されたとき、予め設けられた辞書15から特徴量をキーとしてメッセージを抽出する認識デコーダ部14と、予め各メッセージに対応してコマンドが登録されたコマンドテーブル17と、認識デコーダ部14により抽出されたメッセージをキーとしてコマンドテーブル17からコマンドを検索し、かつ、そのコマンドにより機器のコマンド1を操作するメッセージ処理部16とを備えた。 (もっと読む)


【課題】音声の識別能力を推定する方法及び装置、ならびに話者認証の登録及び評価方法及び装置を提供する。
【解決手段】話者認証の登録方法は、話者によって発話されるパスワードを含む音声を入力するステップ101と、入力音声から音素列を取得するステップ110と、音素毎の識別能力を含む識別能力表に基づき音素列の識別能力を推定するステップ115と、音声のための識別閾値を設定するステップ130と、音声のために音声テンプレートと生成するステップ135とを含む。 (もっと読む)


【課題】生体認証に適さないユーザが、正当なユーザでないと誤って認証されることがあった。
【解決手段】ユーザが正当なユーザであることを認証するための認証方法であって、前記正当なユーザであることの認証を要求する前記ユーザから生体情報を取得し、前記取得された生体情報のサンプルから特徴を抽出し、前記抽出された特徴と前記正当なユーザに対応するテンプレートとの間の、スコアによって示される類似性を求めるために、前記抽出された特徴と前記テンプレートとを比較し、前記正当なユーザが補正要素を有するかどうかを判定し、前記正当なユーザが補正要素を有すると判定された場合、前記補正要素を用いて、前記スコアを変更し、前記スコアと閾値を比較し、前記ユーザが正当なユーザか否かを認証することを特徴とする。 (もっと読む)


【課題】個人の発話器官の形状を反映し個人の同定を短時間に行なう装置を提供する。
【解決手段】 装置は、ある音素を発話中の発話者の声道形状を表すMRIデータ30及び音声データ32と、発話中の話者の音声データとに基づいて話者を同定する装置であり、複数の発話者について声道形状の主成分分析を行なうPCA分析部60と、発話者の各々につき音声データからケプストラム係数を算出するケプストラム算出部64と、複数の発話者の各々の声道形状を主成分ベクトルの線形和で近似するための主成分係数を算出する主成分係数算出部67と、複数の発話者の各々に対しケプストラム係数の線形和で主成分係数を推定するための回帰係数36を決定する重回帰分析処理部68と、同定時に、発話者の音声データより得たケプストラム係数と回帰係数36から主成分係数を推定し、複数の発話者から得ておいた係数と比較して同定を行なう同定処理装置とを含む。 (もっと読む)


【課題】複数人の会話を録音した場合に、会話者の区別を自動で行い、特定者の会話内容のみを簡単な操作で自動再生可能とする。
【解決手段】複数のマイクロホン3,4からの入力音声を音声メモリ19に録音(記録)する制御を行うとともに、音声メモリ19に録音された録音データを再生する制御を行うコントローラ1を備えており、コントローラ1は、マイクロホン3,4から入力される音声の音量を計測する音量計測手段と、音量の計測結果に基づいて発話者を特定する発話者特定手段とを備えており、発話者特定手段により特定された発話者の切り替わったことを検出した場合に、録音データにマークを付与することで、再生時にはそのマークを利用して、選択された発話者の録音データを抽出再生する。 (もっと読む)


【課題】 音声を文字化したデータをせりふや場面の内容に合った様式で自動的に表示することができる音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラムを提供する。
【解決手段】 映像・音声信号解析部48は、音声付き映像データ60中の音声データ62から文字に変換可能な人の声を音声認識処理により文字化して発話内容情報として出力する。また、映像・音声信号解析部48は、音声特徴量情報、発話時間情報、発話者識別するための発話者識別子及び発話者の画面上における位置座標を取得して発話者情報を取得する。メタデータ生成部50は、上記の発話時間情報、発話内容情報、発話者情報、音声特徴量情報等を所定のファイル形式(例えば、xml形式)のメタデータに格納する。このメタデータは、所定の形式(例えば、MPEG−2やAVI形式)で映像・音声信号記録部46に保存される。 (もっと読む)


【課題】 指定した人物が喋った内容が含まれるデータを効率よく検索可能とする。
【解決手段】 字幕データ比較部115は、話者を示す話者情報106及び当該話者の台詞の内容をテキスト化した字幕のテキスト情報107のデータの組のうち、入力された検索条件に合致するデータの組みを判定し、音声データ検索部118及び動画像データ検索部119は、判定されたデータの組みに対応する位置データに基づいて、その位置データにより示される位置のデータを検索対象データから検索する。 (もっと読む)


231 - 240 / 337