説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

221 - 230 / 337


【課題】その使用環境下において、音声入力対象者以外の別の人間が存在しても、適切な音声認識を実現することのできる音声認識装置を提供すること。
【解決手段】音声入力対象者(運転者)から発せられた音声を認識する音声認識装置において、運転者による発声の有無を判定する第1の判定手段と、音声入力対象者以外の者(同乗者)による発声の有無を判定する第2の判定手段と、音声認識を開始する音声認識開始条件が成立したか否かを判断する条件成立判断手段とを備えると共に、その音声認識開始条件に、運転者が発声することと、運転者による発声直後に同乗者が発声していないこととを含めるようにする。
(もっと読む)


【課題】話者を識別可能な話者識別機能を有する通信端末を得ることを目的とする。
【解決手段】本通信端末は、通話相手の音声データから話者識別データを抽出する話者識別データ抽出処理部4と、話者識別データと話者識別データに対応する着信番号とを登録する電話帳データ記憶部5と、通話相手の話者識別データをキーとして、電話帳データ記憶部5から該当する電話番号と話者識別データとを検索し、該当する電話番号が存在しない場合には表示部8に未登録電話番号通知を表示させ、該当する話者識別データとキーとの照合を行って照合結果を表示部8に表示させる着信番号照合制御部12を備える。 (もっと読む)


【課題】ユーザの声紋パターンを登録しておくことで、暗証番号を入力せずに認証を行うことができ、且つ画面を確認しながら音声応答できることで操作の利便性を向上させる画像形成装置を提供する。
【解決手段】この画像形成装置100は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、を備えて構成される。 (もっと読む)


【課題】 指示の入力を容易にすると共にセキュリティを確保する。
【解決手段】 MFPは、ユーザを声紋認証するための声紋データ113Aを予め記憶するHDD113と、音声を受付ける通信制御部28と、受付けられた音声を、声紋データを用いて声紋認証する声紋認証部152と、声紋認証部152による声紋認証が成功した場合に、受付けられた音声を音声認識してテキストデータデータを出力する音声認識部153と、テキストデータに従って処理を実行する処理実行部156と、を備える。 (もっと読む)


【課題】議事録作成時に、様々な条件で発言音声を抽出して効率良く議事録を作成する。
【解決手段】本発明のモデリング装置は、音声入力部1、音線変換部2、発言者認識部3、発言者DB4、意味認識部5、意味DB6、時計部7、座標化処理部8、および関数演算部9からなる。音声入力部1は、発言音声が入力され、音声変換部2は、発言音声をデジタル音声信号に変換する。発言者認識部3は、発言者DB4内の音声特徴のデータパターン等を用いて、発言音声の発言者を認識する。意味認識部5は、発言音声の意味を、意味DB6内の意味の集合体を検索することで認識する。座標化処理部8は、発言者認識部3で認識された発言者、意味認識部5で認識された意味、およびその発言者がその意味の発言をした時点の時刻をそれぞれ座標数値化して3次元座標上の点に表す。関数演算部9は、3次元座標上の各点同士の相関を表す相関関数を演算する。 (もっと読む)


【課題】 ボイス・メール管理のための方法、システム、およびプログラムを提供することにある。
【解決手段】 ボイス・メール・フィルタリング・コントローラは、あるユーザのためのボイス・メールボックス内に受信された複数のボイス・メール・メッセージ項目のうちの各ボイス・メール・メッセージについて個別ベイズ・スコアを計算し、各個別ベイズ・スコアは関連のボイス・メール・メッセージが前記ユーザによって必要とされない確率を示す。再生中に、ボイス・メール・フィルタリング・コントローラは、ボイス・メールボックスから最後に再生されたボイス・メール・メッセージの特定のベイズ・スコアより大きい個別ベイズ・スコアをそれぞれが有する複数のボイス・メール・メッセージからの選択内容を自動的に削除する。 (もっと読む)


【課題】 複数ユーザの使用を前提とし、かつ、複数の機能を備えた共用機器で、ユーザごとの設定やグレードに対応した電子機器を提供する。
【解決手段】 ユーザの音声が入力される音声入力手段1と、複数のユーザごとに所定の操作内容と操作権限の有無とを記憶保存する記憶手段2と、入力音声情報からユーザを認証する認証手段3と、認証手段3にてユーザ認証が行われた場合に、入力音声情報を解読する音声解読手段4と、該音声解読手段4によって解読された内容が前記操作内容に含まれるか否か判断するとともに、含まれると判断した場合に、該操作内容がユーザに操作権限があるか否かを判断する判断手段5と、該判断手段5によってユーザに操作権限があると判断した場合に、前記操作内容に関連する指令を出力する指令出力手段6とを備えた構成としてある。 (もっと読む)


【課題】 複数のユーザの使用を前提とし、複数の機能を備えた共用機器で、ユーザの音声に基づいた操作及び割り込み操作を実現する。
【解決手段】 複数のユーザごとに少なくとも所定の操作内容を記憶保存する記憶手段2と、入力音声情報を解読する音声解読手段4と、該解読音声が、操作内容、又は操作内容及び「割り込み」であるか否かを判断する判断手段5と、解読音声が操作内容であると判断された場合には、該操作内容の関連処理を実行する指令を出力し、操作内容の関連処理の実行中に判断手段5で解読音声が操作内容及び「割り込み」であると判断された場合には、実行中の処理を中断して、割り込み操作内容の関連処理を先行して実行する指令を出力するとともに、該指令による処理後、前記中断処理を再開する指令を出力する指令出力手段6とを備えた。 (もっと読む)


【課題】 複数人が一つの電話機を有効に利用できるようにする。
【解決手段】 データベースの情報を音声認識して取得する音声認識装置であって,前記データベース内の情報に対して複数のユーザに対する発声情報を登録する発声情報登録手段と,音声認識時にどのユーザが発声するのかを識別する発声ユーザ識別手段と,前記発声ユーザ識別手段により識別されたユーザに対する前記発声情報を基に認識文法を作成する認識文法作成手段とを有する。 (もっと読む)


【課題】生体情報のサンプルが取得される環境の質が低い場合であっても、本人を拒否する率を向上させる生体認識方法が必要とされる。
【解決手段】入力サンプルの特性に関する一つ又は二つ以上の要素についてのデータを収集し、前記各要素についての定数を求め、シフト値を導出するために前記求められた定数を平均化し、前記導出されたシフト値に基づいて、生体認識システムの等価エラー率の値を調整することを特徴とする。 (もっと読む)


221 - 230 / 337