国際特許分類[G10L17/00]の内容
物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)
国際特許分類[G10L17/00]に分類される特許
131 - 140 / 337
情報管理装置、情報管理システム、及びプログラム
【課題】表示情報に対して、利用者が注目している情報と利用者の音声とを容易に対応付けて格納することができる装置を提供する。
【解決手段】文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、格納部が格納した表示情報を表示する表示部と、利用者の視線を検出する視線検出部と、利用者の視線に基づいて、表示部に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部と、利用者の音声を検出し、音声を注目情報に対応付けて格納部に格納する音声検出部とを備える情報管理装置を提供する。
(もっと読む)
音声入出力装置
【課題】 ビデオカメラ等の音声入出力装置において、撮影者が音声入力装置に一番近い位置にいるため、被撮影者よりも音量が大きく記録・再生されるという問題があった。この問題をユーザーの手間やコストを掛けることなく解決すること。
【解決手段】 入力された音声データに対し、データベースとの音声認識を行い、音声認識の結果に応じてアナログアンプまたはデジタルアンプにより音量を制御する、または、音声認識の結果に応じてフィルタリング処理を行なう、または、音声認識された後、相関性算出の結果に応じて指向性制御を行なうことで音量が大きい撮影者の音声などの特定の音声に関して音量を下げることを可能とする。
(もっと読む)
話者認証の登録及び評価のための方法及び装置
【課題】話者認証の登録及び評価のための方法と装置、話者認証システムを提供すること。
【解決手段】話者認証の登録のための方法は、話者によって話された同一内容の複数の発話の各々に基づいて複数の音響特徴ベクトル系列を生成するステップと、前記複数の音響特徴ベクトル系列から参照テンプレートを生成するステップと、複数のコード及び前記複数のコードに対応する特徴ベクトルを含むコードブックに基づいて、前記複数の音響特徴ベクトル系列の各々に対応する擬似詐称者特徴ベクトル系列を生成するステップと、前記複数の音響特徴ベクトル系列、前記参照テンプレート及び前記複数の擬似詐称者特徴ベクトル系列に基づいて最適な音響特徴サブセットを選択するステップと、を含む。
(もっと読む)
オンライン話者逐次区別システム及びそのコンピュータプログラム
【課題】オンラインで動作可能でレイテンシの低い発話逐次区別システムを提供する。
【解決手段】話者区別システム30は、話者GMM74−78を記憶する記憶部42と、音声データをセグメント化する音声活動検出部30と、現セグメントが話者GMM74−78のいずれにも属していないかを判定する新規性判定部34と、現セグメントが話者GMM74−78のいずれにも属していないときに、新たな話者GMMを生成し、現セグメントを新たな話者GMMでラベル付けする新モデル生成部40と、現セグメントが話者GMM74−78の1つに属しているときに、話者を識別し、現セグメントをその話者でラベル付けする話者識別部44と、現セグメントを利用して話者GMMをトレーニングするトレーニング部48と、音声活動検出部30が出力したセグメントのシーケンスに従ってセグメントラベルをマージするマージ部46とを含む。
(もっと読む)
音声認識装置
【課題】処理負荷やコストの大幅な増大を招くことなく、制御機器をより適切に制御することが可能な音声認識装置を提供する。
【解決手段】音声認識装置10は、ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、その登録語彙に基づいて制御機器20を制御するもので、登録語彙を記憶した登録語彙記憶部12aと、登録語彙がどの話者によって発話されたかを識別するための複数の音声モデルを記憶した音声モデル記憶部12bと、ユーザによる登録語彙の発話音声が入力された場合に複数の音声モデルから登録語彙がどの話者によって発話されたかを識別する音声認識部13と、登録語彙が特定の話者によって発話された場合と他の話者によって発話された場合とで登録語彙に基づく制御機器20への制御内容を異ならせる制御機器制御部14と、を備えている。
(もっと読む)
画像形成装置
【課題】 ファクシミリを受信した際の処理を、送信者ごとに変更可能な電子メール機能を備える画像形成装置を提供する。
【解決手段】 この画像形成装置は、複数のユーザの声紋情報と各ユーザにつき登録された画情報ファイルの処理内容とを記憶する記憶手段44、46と、受信した電子メールに音声ファイルが添付されているか否かを識別する添付ファイル識別手段41と、音声ファイルに含まれる音声から声紋を抽出する声紋抽出手段42と、抽出された声紋を、記憶手段46に記憶された複数のユーザの声紋情報と照合する声紋照合手段43とを含み、抽出された声紋が複数のユーザのいずれかの声紋情報に一致する場合に、一致するユーザにつき登録された画情報ファイルの処理内容に基づき処理を実行する。
(もっと読む)
音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体
【課題】利用者の発話以外の音声による誤認識を防止すること。
【解決手段】音声認識装置100は、登録部101と、受付部102と、音声認識部103と、制御部104と、出力部105と、を備える。登録部101には、利用者の音声情報が予め登録される。受付部102は、利用者からの音声を受け付ける。音声認識部103は、受付部102が受け付けた音声のうち、登録部101に登録されている利用者の音声情報を認識する。制御部104は、音声認識部103によって認識された利用者の音声情報を抽出するとともに、当該利用者以外の音声情報を低減させる。出力部105は、制御部104によって制御された音声情報を出力する。
(もっと読む)
議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム
【課題】情報の精度が高く、かつ手間をかけずに効率良く議事録情報を生成する議事録情報生成システムを提供する。
【解決手段】音声情報をテキスト情報にテキスト変換する音声認識手段を用いて議事録情報を生成する議事録情報生成システムであって、ユーザから入力される音声を音声情報に変換する音声入力手段を備え、ユーザを識別する情報を含むユーザ情報を予め記憶し、ユーザが利用する音声入力手段とユーザ情報とを対応付けて記憶し、音声情報が入力された音声入力手段に対応するユーザ情報を検出し、検出したユーザ情報と、音声情報が音声認識手段によってテキスト変換された情報であるテキスト情報とを対応づけた情報である議事録情報を生成する。
(もっと読む)
音声認識装置、音声認識方法、音声認識プログラム、及び音声認識プログラムを記録した記録媒体
【課題】雑音が支配的になっている期間を音源定位過程で検出し、音声認識過程でこの期間の処理をうまく調整できるようにする。
【解決手段】 2地点で捉えられた第1と第2の音響信号から周波数成分毎の位相差とパワーとを算出し、周波数成分毎の周波数と位相差とを座標値とする散布図を生成する。該散布図上で所定の直線性を示す周波数成分の配置を、周波数成分のパワーに応じた直線スコアとともに検出し、該直線スコアが所定の閾値以上を得た配置を音源の存在を示す直線として検出する。このような直線の情報及び直線スコア等より成る音源ストリームを抽出し、音源ストリームの時刻毎の直線スコアの高低に基づいて該音源ストリームの各時刻に対して信頼可否情報を付与する。
(もっと読む)
議事録作成装置、議事録作成システム、議事録作成方法および議事録作成プログラム
【課題】 参加者ごとに発話した内容を容易に関連付けること。
【解決手段】 MFPは、ユーザを識別するためのユーザ識別情報を、会議の参加者を示す参加者情報として取得する参加者情報取得部(S03)と、会議の参加者が発話する音声を取得する音声取得部(S04)と、取得された参加者情報で識別されるユーザのうちから取得された音声を発話したユーザを特定する話者特定部(S05)と、取得された音声を文字情報に変換する音声変換部(S06)と、変換された文字情報を判別されたユーザの参加者情報と関連付ける関連付部(S07)と、を備える。
(もっと読む)
131 - 140 / 337
[ Back to top ]