説明

Fターム[5D015AA03]の内容

音声認識 (5,191) | 目的、機能 (1,020) | 話者の識別、照合 (293)

Fターム[5D015AA03]に分類される特許

121 - 140 / 293


【課題】音声による本人性の確認を確実に実施でき、多重化により災害時の情報復元を可能とした通信回線を活用した音声蓄積・読み出しシステムを提供する。
【解決手段】通信網10を介して各々接続され、回線インタフェース機能、交換機能、機器制御機能を有し、端末15aa〜15nnからの音声の登録、蓄積、読み出しの各要求を各々受け付ける複数の回線ユーザインタフェース11a〜11nと、前記各インタフェースに各々接続され、音声特徴抽出部(音声認証装置12a〜12b)と、音声の特徴および端末から入力される音声データを蓄積する音声蓄積装置13a〜13nと、前記データの蓄積状況を、利用者識別番号、蓄積時刻および蓄積データの種類を含む形式で記録する音声蓄積状況管理装置14a〜14nと、前記音声の特徴と音声データとを比較してユーザを識別する音声特徴比較部(音声認証装置12a〜12n)とを備える。 (もっと読む)


【課題】本発明の課題は、信頼性の高い本人認証システムを提供することである。
【解決手段】楽器音情報とリズム情報を対応付けた認証情報を記憶する記憶手段と、楽器音設定の入力を受け付けて、キー特定情報と楽器音情報を関連付けた関連情報を作成して保持する楽器音設定手段と、テンポ設定の入力を受け付けて、メトロノーム音のテンポを設定するテンポ設定手段と、前記テンポに合わせてキー入力されたキー特定情報に対応する楽器音情報を前記関連情報から求めて、前記求めた楽器音とリズム情報を組合せて入力情報として保持する入力情報保持手段と、前記入力情報と、前記記憶手段に記憶されている認証情報とを照合して認証する認証手段と、を備えることを特徴とする認証装置である。 (もっと読む)


【課題】講義中の受講者の発言から取得した声紋情報基づき本人認証を実行して、事前に声紋情報を取得することなく本人認証を行なうことができ、また、受講者の発言を積極的に促して講義の活発化を図ることが可能な出席状態管理方法及びシステムを提供する。
【解決手段】出席状態管理装置1が、ハンディターミナル2から送信された、受講者IDコード及び座席IDコードと、在席センサー103による、受講者が在席しているかについての検知結果とに基づき、出席している受講者を認証し、該受講者の出席受講者リストを生成して表示する。また、該講義時間中に、ハンディターミナル2から送信される受講者IDコード及び音声情報から、発言した受講者の声紋データを取得し、該受講者の過去の声紋データと今回取得した声紋データとの一致度を求めて表示し、該受講者の出席日数に対応する出席点数を含む出席状態データを出席状態データ記憶部19に記憶する。 (もっと読む)


【課題】 一人暮らしのお年寄りなどを“オレオレ詐欺”等の被害から護ることができる電話機を提供する。
【解決手段】 音声入力部27から入力させた予め登録を要する者の音声信号から個人性を表す個人性特徴量を抽出し(第1特徴量抽出手段32)、記憶部8に記憶する。一方、電話がかかってきた場合には、電話回線からの音声信号から個人性を表す個人性特徴量を抽出し(第2特徴量抽出手段34)、当該個人性特徴量と記憶部8に記憶された個人性特徴量とを比較して電話回線から入力された音声信号の発信者が記憶部8に個人性特徴量が登録されている者であるか否かを判定し(判定手段35)、判定結果を報知する(判定結果報知手段36)。これにより、個人性特徴量が記憶部8に記憶されていない未登録者からの電話であった場合にはその旨が報知されるので、近親者等を登録者としておけば、“オレオレ詐欺”等の被害から護ることができる。 (もっと読む)


【課題】話者特定処理に必要な計算量や記憶容量等を最小限に抑制しつつ、長期間に渡って認識率が低下し難い話者特定装置を提供する。
【解決手段】話者による発話の音響的特徴を示す話者モデルと、話者の発話に相当する特徴量信号と、を比較し、当該話者を特定する音声認識装置において、同一の話者について、本来の話者特定に用いられる登録話者モデルRMの他に、当該話者に対応し且つ当該話者の認識率が当該登録話者モデルRMよりも高い予備話者モデルRSVを予め記憶し(ステップS11)、当該登録話者モデルRMにおける認識率が低くなったとき当該登録話者モデルRMを予備話者モデルRSVに入れ換えて以降の話者特定を行う(ステップS15)。 (もっと読む)


【課題】携帯端末の使用者の認証を行う際、操作の手間を軽減すること。
【解決手段】携帯端末20の使用者を認証するためのユーザ認証用のキーワード及び当該携帯端末20を特定するための携帯端末特定用のキーワードを記憶する記憶部15と、ユーザ認証用のキーワードに対応するユーザ認証用の音声情報を取得し、当該取得したユーザ認証用の音声情報と記憶部15から読み出したユーザ認証用のキーワードとを比較し、当該比較結果が一致した場合、携帯端末特定用のキーワード対応する携帯端末特定用の音声情報を取得し、当該取得した携帯端末特定用の音声情報と記憶部15から読み出した携帯端末特定用のキーワードとを比較し、当該比較結果が一致した場合、携帯端末20の使用者を認証する制御部CPU11と、を備える。 (もっと読む)


【課題】リモコン端末を利用するユーザの交代を検知して個人用Webページを確実に切り替えることで、前にリモコン端末を利用したユーザの個人用Webページから予約などを誤って行ってしまうことを防ぎ、ログアウトするまでの間にカラオケ装置やリモコン端末側で更新や追加されたユーザ各個人のカラオケ情報やその他の情報を、ホストサーバのデータベースに正しく記録させること。
【解決手段】ユーザの顔画像と先のログイン処理にてメモリ56に記憶した顔画像とを比較する(S406)。顔画像による利用者の確認ができないときには(S408:NO)、ユーザインターフェースを切り替えてサービス提供を継続しながら(S430)、今回の歌唱データと過去の歌唱データとの比較によって利用者の確認を行う(S426)。そして、ログアウト時にマイページ履歴をログインIDと対応付けてカラオケ用ホストサーバ2へ送信する(S418)。 (もっと読む)


【課題】言語学習用の会話文等を録音してなる音声データにおいて、話者の切り替え位置を検出すること。
【解決手段】音声データ処理システム1において、複数人の音声を一人分ずつ録音してなる音声データを取得する音声データ取得部12と、上記音声データに所定のパターン認識処理を施し、該パターン認識処理の結果に基づいて、上記音声データを音声を発した人ごとの部分に分類する分類部13と、分類部13の分類結果に基づき、上記音声データ中の話者の切り替え位置を決定する位置決定部14と、を含むことを特徴とする。 (もっと読む)


【課題】プライバシーを確保しつつ、リモコン装置を用いた個人情報を検索することが可能なカラオケシステムを提供する。
【解決手段】 カラオケ装置とリモコン装置を有し、リモコン装置は、個人ID情報入力処理を指示するユーザの操作入力に応じて個人ID情報入力画面がディスプレイに表示された状態でマイクからの入力が検出されると個人検索モードを設定して、個人ID情報を利用して楽曲を絞り込む個人演奏履歴検索又は個人ID情報を利用しないで楽曲を絞り込む通常検索の何れか一方の検索手法を選択可能な個人検索モード画面をディスプレイに表示し、個人検索モード画面で個人演奏履歴検索が選択されるとマイクから入力された音声の声紋情報と演奏履歴検索指示情報をカラオケ装置へ送信し、検索結果の情報リストが入力されると該リストをディスプレイに表示して選択させ、選択された楽曲の曲番情報を演奏すべき楽曲の曲番情報として送信する。 (もっと読む)


【課題】話者特定処理に必要な計算量や記憶容量等を最小限に抑制しつつ、ある程度の認識率が得られる話者特定装置を提供する。
【解決手段】話者による発話の音響的特徴を示す話者モデルと、当該話者の発話に相当する特徴量信号Soと、を比較し、それらの間の類似度を検出すると共に、検出された類似度と、当該類似度の検出の際に比較された類似度閾値と、を比較して話者特定を行う話者認識部5と、話者の特定に用いられた話者モデルの更新数に基づいて類似度閾値を更新する閾値設定部6と、を備え、閾値設定部6は、当該更新数を用いて類似度閾値を表した閾値関数であって且つ予め設定された閾値関数と、当該更新数と、を用いて更新後の類似度閾値を求める。 (もっと読む)


【解決手段】音声認識システムはサーバを含み、サーバでのデータベースには、複数の動作の各々に対応して作成された複数の動作雑音モデルと、複数の場所の各々に対応して作成された複数の環境雑音モデルとが記憶される。また、サーバには、複数の中継器が接続され、通信可能に携帯端末が接続される。携帯端末は、入力音声を取得するとともに、被験者の動作を検出し、入力音声に関する音声データおよび動作に関する加速度データを中継器に送信する。中継器は、音声データおよび加速度データに自身の中継器IDを付してサーバに送信する。サーバは、被験者の動作を特定し、また、中継器の設置場所を被験者の現在位置として推定する。そして、動作に応じた動作雑音モデルと被験者の現在位置に応じた環境雑音モデルとを用いて、入力音声に含まれる被験者の音声を認識する。
【効果】入力音声に含まれる雑音を適切に抑圧して、正確に音声認識することができる。 (もっと読む)


【課題】音声案内システムにおいて、オペレータの音声から合成音声に切り替わった際の、ユーザが感じる違和感を軽減する技術を提供する。
【解決手段】話者識別部42が、オペレータ16の音声から抽出した特徴量を用いて、オペレータ16の音声に最も当てはまりの良い識別モデルを、予め用意された複数の識別モデルの中から選択する。合成音声生成部43が、選択された識別モデルに対応する音声データを読み出して、オペレータが決定したユーザに提供する音声に関する情報に対応する、オペレータの音声の音質に近い音質を有する合成音声を生成する。 (もっと読む)


【課題】アダプタもしくはサーバで画像情報に音声情報を付与する場合、アダプタのマイク等から入力した音声信号をアダプタもしくはサーバで音声認識し、音声信号に含まれる言葉のみでなく、個人を識別する情報等も抽出するようにする。
【解決手段】画像撮影装置に保存された画像情報を取得する(ステップS4001)。次に画像情報に音声情報を付与するために、音声情報のもととなる音声信号をアダプタもしくは画像撮影装置のマイクから入力する(ステップS4003)。次に、入力した音声信号をアダプタで音声認識及び話者照合する(ステップS4004)。次に認識した情報を音声情報に変換する(ステップS4005)。次にステップS4005で作成された音声情報を取得した画像情報に付与・リンクして、音声情報付き画像情報を作成する。 (もっと読む)


【課題】 安全運転に支障を来すことなくガイドボーカルを伝達することができるようにする。
【解決手段】 楽曲データを格納する楽曲データベース55と、ガイドボーカルの出力を提供するための歌詞音声データを記憶する歌詞音声データ記憶手段59と、歌唱者が運転者として指定された選曲データに運転者フラグを付帯させて予約待ち行列に登録する予約管理手段58と、運転者フラグが付帯した楽曲の場合には運転席のみに対応した指向性スピーカ23からガイドボーカルを出力し、運転者フラグが付帯していない楽曲の場合にはガイドボーカルの出力を行わないような制御を行う歌詞音声出力制御手段60と、歌詞テロップデータを当該楽曲の演奏データに同期させて表示手段24に出力する再生制御手段61と、を備える。 (もっと読む)


【課題】認証局の照合によって、通話者を特定することができたか否かの認証結果を得られるため、他方の通話者が通話を開始するかどうかを判断することが可能な音声認証システム及び認証局サーバを提供すること。
【解決手段】複数の通信端末と接続された交換機と、交換機と接続され、通信端末を使用する通話者を特定する認証局サーバとを備え、認証局サーバは、通話者の本人属性と、本人属性に対応した通話者の登録音声データとを記録した記録部146と、認証用音声データと登録音声データとを照合し、通話者を特定する音声照合部148と、音声照合部による照合の結果得られた認証結果を交換機に送信する送信部150とを備えることを特徴とする。 (もっと読む)


【課題】
パワースペクトル情報だけでなく、従来から利用されてこなかった位相情報を話者認識に適用することを特徴とする話者同定あるいは話者照合を行う方法を提供すること。
【解決手段】
ある誰かが発声した音声に含まれる話者の個人性を表す特徴パラメータを抽出し、同じ特徴パラメータをもとに予め構築した話者モデルの中の誰のモデルの音声に相当するかを識別する方法(話者同定)あるいは、ある人の音声であるかどうかを判定する方法(話者照合)において、音声波形に含まれる話者の特徴を表す従来に使用されていなかった位相特徴パラメータの抽出方法と従来の特徴パラメータ抽出法を併用して、話者同定あるいは話者照合を行う。 (もっと読む)


【課題】 音声認識により選曲を行うと共に、他者の歌唱時であっても選曲を行うことができるようにして、円滑なカラオケ演奏を楽しむ。
【解決手段】 選曲手段14では、音声認識手段13の音声認識結果に基づき楽曲を選択すると共に、当該楽曲に対して、声紋識別手段12により識別された声紋データを関連付けて予約待ち行列に登録する。入力音声処理手段15では、楽曲の演奏が行われているか否か、及び入力された音声データに基づき識別した声紋データと現に歌唱中の楽曲に関連付けられた声紋データとの一致を判断する。両者が不一致の場合には、音声認識による選曲を行う共に、当該音声データを歌唱音声として出力しない。両者が一致する場合には、音声認識による選曲を行わずに、当該音声データを歌唱音声として出力する。 (もっと読む)


【課題】通話音声データをサーバに送信するだけで振り込め詐欺の判定結果情報を得る。
【解決手段】ユーザ電話端末10は通話音声データを記録して通話内容判定サーバ30に送信し、通話内容判定サーバ30は、ユーザ電話端末10から受信した通話音声データと予め登録された詐欺師の音声データを基に音声特徴を照合し、前記通話音声データをテキスト変換し、テキスト変換された通話内容に含まれる口座情報が予め登録された詐欺用口座情報と一致するかを照合し、予め登録されたキーワードとテキスト変換された通話内容に含まれるキーワードとの一致率を算出し、前記音声特徴,口座情報,キーワード一致率を基に判定レベルを決定し判定結果情報をユーザ電話端末10に送信するとともに、前記判定結果情報を含むメールを生成し予め登録された通知先に送信する。 (もっと読む)


【課題】画像印刷装置において、ICレコーダ等の録音装置に音声の内容を印刷するのに必要な構成を別途設けることなく、録音した音声の内容を印刷できるようにする。
【解決手段】画像印刷装置1は、印刷用紙に画像を印刷する印刷部7と、印刷部7によって印刷用紙に画像を印刷させる制御部21と、外部装置から音声信号を入力するための音声信号入力手段であるUSB通信部22と、音声信号に対応した音声の内容を表わす文言を認識する音声認識部31とを備える。USB通信部22には、外部装置として例えばICレコーダ90が接続され、ICレコーダ90で録音された音声の音声信号が、USB通信部22を介して画像印刷装置1に入力される。音声認識部31は、USB通信部22から入力される音声信号に対応した音声の内容を表わす文言を認識し、制御部21は、音声認識部31により認識した文言の画像を印刷部7によって印刷させる。 (もっと読む)


【課題】注文内容の入力にかかる手間を削減することができる注文データ管理システムを提供する。
【解決手段】集音装置から送信される音声情報を受信する音声情報受信部と、受信した音声情報の音声認識を行い、音声情報に含まれる、注文対象となる品名と当該品名に対する数量と注文した顧客を識別する顧客識別情報とを抽出して注文データを生成する音声認識部と、生成される注文データを記憶する注文データ記憶部と、品名と当該品名に対する単価とを対応づけて記憶する商品情報記憶部と、精算対象となる顧客を特定する識別情報を受信する識別情報受信部と、識別情報受信部によって受信した識別情報に対応する顧客情報識別情報の注文データを前記注文データ記憶部から読み出し、読み出した注文データに含まれる品名とその数量と前記商品情報記憶部に記憶された品名に対応する単価とに基づいて、精算金額を算出して精算金額情報を生成する。 (もっと読む)


121 - 140 / 293