説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

191 - 200 / 337


【課題】生体情報が変動する場合でも認証の精度を高水準に維持する。
【解決手段】記憶装置20は、生体情報D0を含む辞書DIC_iを記憶する。情報取得部10は、被認証者の生体情報DINを取得する。認証部32は、記憶装置20が記憶する辞書DIC_iの生体情報D0と情報取得部10が取得した生体情報DINとの距離DST_iに基づいて被認証者の正当性を認証する。辞書管理部34は、距離DST_iが閾値VTHR1を下回る場合に、生体情報DINに基づいて記憶装置20の辞書DIC_iを更新し、距離DST_iが、閾値VTHR1とそれよりも大きい閾値VTHR2との間にある場合に、情報取得部10が取得した生体情報DINに応じた新規な辞書DICを生成して記憶装置20に格納する。 (もっと読む)


【課題】音声が経年変化しても利用者の手間をかけることなく登録音声情報を更新し且つセキュリティの向上を図る。
【解決手段】音声情報認証装置10によれば、利用者の日常的な音声情報に基づいて参照用音声情報を収集し、該参照用音声情報に基づいて検出した声質の変化に対応するように登録音声情報を補正し、該補正済登録音声情報と入力された音声情報が一致しているか否かを判定するようにしたことから、利用者は登録音声情報を一度登録するだけで、経年変化に応じた再登録を行う必要がなくなる。また、登録音声情報の更新も自動的に行われることから、利用者に手間をかけることを防止できる。さらに、登録音声情報の再登録を排除することで、パスワード等が他人に知られることを防止することができる。 (もっと読む)


【課題】音声会議の進行中であっても、並行して会議内容を参照することが可能で、利用者が必要とする発話箇所を効率的に特定でき、使い勝手の良い音声検索装置および音声配信システムの提供を図る。
【解決手段】 音声検索装置101は、音声会議装置102で取得している音声から発話の有無を検知する。また、発話取得位置から話者名を検知する。また音声波形から発話された単語を検知する。発話の有無が変化するたび、音声を区分して音声ファイルを生成し、各音声ファイルをネットワーク記憶装置103に分散させて記憶させる。音声検索装置101は各音声ファイルの索引として話者名と発話された単語を記録する。この索引に基づいて検索された音声ファイルを時系列に並べたリストをクライアント104に表示させ、リストから選択された音声ファイルをネットワーク記憶装置103から並行してネットワーク配信する。 (もっと読む)


【課題】話者交替箇所を迅速に検出する発話区間識別装置を提供する。
【解決手段】音声データ取得部10、処理区間決定部20、処理区間格納部30、特徴量抽出部40、話者交替判定部50、話者交替判定結果格納部60、結果出力部70、発話時間ルール80から構成され、前回検出された話者交替箇所から単一話者によって最低限発声されている最小発話時間の2倍の時刻に対応する時刻にリターンポイントを設定し、前記リターンポイントから時間の逆方向に沿って今回の話者交替箇所を調査するための処理時刻を決定し、前記リターンポイントから時間と同じ方向に沿って次回の話者交替箇所を調査するための処理時刻を決定する。 (もっと読む)


【課題】 バイオメトリクス認証を声紋、特に密閉した外耳道内で発生する外耳道内音声を利用することにより、確実な個人認証の実現を可能にした携帯個人認証方法及び電子商取引方法を提供すること。
【解決手段】 密閉した外耳道内で発生する外耳道内音声の音質と口から発生する口音の音質とを音響分析により確認した外耳道内音声をバイオメトリクス認証の声紋として用いる。音響分析により確認した外耳道内音声から得た電子データと予めコンピュータシステムの記憶手段に保存している電子データとの類似度を照合する声紋確認を行い、両データの類似度が一致あるいは誤差が小さければ本人と判定する。 (もっと読む)


【目的】本発明は、発言者の音声データをもとに氏名を表示する発言者表示システム、発言者表示方法および発言者表示プログラムに関し、発言者の音声データを音声認識して音声テキストデータに変換すると共に声紋テンプレートと照合していずれの氏名、権限の発言者かを判別して表示したり、音声テキストデータを検索して該当する発言を行った発言者の音声を発声すると共に併せて当該発言者の氏名、権限を表示することを目的とする。
【構成】音声データを音声テキストデータに変換すると共に声紋テンプレートと照合して発言者の氏名を判定する手段と、判定した発言者の氏名を表示する手段とを備える。 (もっと読む)


【課題】人物の撮影画像のデータから各部の特徴を表す表現を設定するためのルール(関数)を所望の種類だけ用意する。
【解決手段】撮影された人物の画像から顔などの各部の特徴を数値化したデータ(特徴データ)を容姿特徴データベース8に蓄えておく。また、人物の容姿(丸顔、色黒等)の特徴を表す容姿言葉を、特徴データと対応する容姿言葉を判定するための基準値とともに容姿判定データベース12に格納しておく。容姿言葉生成エンジン4は、特徴データがどの容姿言葉に結びつくか、特徴データと基準値との比較により判定し、当該特徴データと結びつく容姿言葉を統合データベース13に記録する。統合データベース13は、容姿言葉を当該人物の画像データとともに保存する。言葉登録エンジン5は、容姿判定データベース12に格納されている容姿言葉の変更、削除または追加する。 (もっと読む)


【課題】利用者が音楽鑑賞をしている場合に、周囲の状況変化を的確に把握することが可能な音声切換装置を提供することを目的とする。
【解決手段】外部音声を録音音声として記憶する記憶装置101と、外部音声が判定条件に一致するか否かを判定する解析装置103と、記憶装置101に記憶した録音音声を再生する再生装置102と、検出器104の指示に応じて、音楽再生装置10から入力される音楽、外部音声、および再生装置102で再生される録音音声を択一的に切り換えてスピーカー31に出力する切換器105と、を備え、解析装置103により外部音声が判定条件に一致すると判断された場合、条件一致を検出した時点よりも所定時間前からの録音音声を再生してスピーカー31から出力する。 (もっと読む)


方法が、装置においてメディアを取得し、画像/ビデオ認識及びオーディオ認識を介してメディア内のオブジェクトを識別し、このメディアの識別されたオブジェクトに基づいて識別情報を装置上に表示する。
(もっと読む)


【課題】簡易な構成でありながら、確実な発言の切れ目を用いて区間分割し、所望の発言を検索し易くする音声録音装置を提供する。
【解決手段】制御部14は、操作部18から入力される操作データを分析し、プレゼン資料のページ切り換えイベント情報、および資料切り換えイベント情報を抽出する。また、制御部14は、入力される音声データを分析し、特定の話者の音声区間を抽出する。制御部14は、プレゼン資料のページ情報、発表者識別情報、および記録時刻、を備えた音声状況データを生成する。制御部14は、ページ切り換えイベント情報を抽出したときに、プレゼン資料のページ情報を切り換え、話者の変更、かつ資料切り換えイベント情報を抽出したときに、発表者識別情報を切り替えて音声状況データを生成する。 (もっと読む)


191 - 200 / 337