説明

Fターム[5D015AA03]の内容

音声認識 (5,191) | 目的、機能 (1,020) | 話者の識別、照合 (293)

Fターム[5D015AA03]に分類される特許

81 - 100 / 293


【課題】運転者に煩わしさを感じさせずに当該運転者の飲酒状態を検知することができる車両用飲酒検知装置を提供する。
【解決手段】車両用飲酒検知装置は、運転者が発話した音声を音声認識部11によって検出し、検出した個人認識用の文言に対応する音声データと、話者モデルデータベース13bに発話者毎に記憶されている音声データのうち個人認識用の文言に対応する音声データとを話者照合部12によって比較し、その類似性に基づいて、発話した運転者に対応した話者モデルデータベース13bに発話者毎に記憶されている音声データを選択し、検出した飲酒判断用の文言に対応する音声データと、選択した飲酒判断用の文言に対応する音声データとを飲酒判定部14によって比較し、その類似性に基づいて、飲酒の有無を判定する。 (もっと読む)


【課題】打ち合わせ参加者の作業を最小にしつつ、参加者が適切な権限で容易に自身の発言を検索・修正できる枠組みを提供する。
【解決手段】打ち合わせの発話音声の話者音響特徴量や方向情報などからそれぞれの発話の話者を識別し、修正権設定部107で、その際の信頼度に応じた適切な音声修正権を発話ごとに付与する。また録音後に、音声を容易に検索・修正できる音声データ検索部111、音声修正部112を備えることにより、会議参加者が会議後に容易かつ適切な権限でもって会議音声を修正することができるようにする。このことにより、適切な会議音声の記録・共有を最低限の作業で行いつつ、参加者が自由に議論を行うことを可能とする。 (もっと読む)


【課題】外部から入力される音声に含まれる内容が外部に出力される範囲を制限する。
【解決手段】MFPは、外部から入力される音声を取得する音声取得部と、取得された音声を文字情報に変換する音声変換部と、文字情報のうちからユーザを識別するためのユーザ識別情報を抽出するユーザ抽出部と、抽出されたユーザ識別情報に基づいて、文字情報を出力する出力制御部とを備える。 (もっと読む)


【課題】容易に音声認識を行うことができるようにする。
【解決手段】特徴量抽出部31は、入力音声の波形形状の特徴と該特徴の関係性を特徴量として抽出する。音韻判別部34は、特徴量から音韻を判別する。音韻判別データベース32は、音韻毎の特徴量を不特定話者と話者毎に記憶する。音韻判別部34は、話者判別部37によって話者が判別されるまで、特徴量抽出部31で抽出した特徴量を、音韻判別データベース32に記憶されている不特定話者の音韻毎の特徴量と比較することによって音韻の判別を行う。話者判別部37によって話者が判別されたとき、音韻判別部34は、特徴量抽出部31で抽出された特徴量を、音韻判別データベース32に記憶されている判別された話者の音韻毎の特徴量と比較することによって音韻の判別を行う。 (もっと読む)


【課題】本発明は、生体の同一性の判断を、顔認証システムと声紋認証システムとの特徴を考慮して、顔認証システムの弱点を声紋認証システムの長所によって補い、声紋認証システムの弱点を顔認証システムの長所によって補って、総合的に認証速度が高く、他人受け入れ率が低い生体認証システム及び認証方法を提供することを目的とする。
【解決手段】被認証生体が、予め登録された生体をメンバーとする登録生体グループに属する1の生体と同一か否かを、生体の顔情報と声紋情報によって判断する生体同一性認証システムにおいて、予め、登録生体グループに属する各生体の顔情報と声紋を取得して、登録顔情報データベースと、登録声紋データベースを作成し、被認証生体顔情報と登録顔情報データベースに属する各顔情報とを比較することによって、顔の類似度が高い数人に絞り込んでから声紋を比較することによって、被認証生体と同一性を有する生体か否かを認証する。 (もっと読む)


【課題】ICタグやIDカード等の認証機器を携帯する煩わしさや不便さがなく、高い認証精度が得られる、安全性の高い監視制御端末装置を提供する。
【解決手段】顔認証手段、音声認証手段、及び体重認証手段を有するユーザ認証手段5を備え、監視制御端末装置の操作を開始しようとする者が操作を許可された正当な操作員であるかどうかを判定する。これにより、顔画像データと声紋データの2つの生体情報による認証と、さらに体重データによる認証を行うので誤認識率が低く、また、ICタグやIDカード等の認証機器を携帯する必要がないため、これらの認証機器を紛失したり盗難されて不正使用されたりする危険性もない。従って、操作員にとって便利であり、高い認証精度が得られ、安全性の高い監視制御端末装置を提供することができる。 (もっと読む)


【課題】会話の中の重要語を抽出してテキストデータとして提示することのできる装置を提供すること。
【解決手段】サーバ10は、会話の音声データを受信し、受信した音声データを、発言者毎に分離し、分離された音声データのそれぞれを、テキストデータに変換し、変換されたテキストデータのうち、発言時刻が新しいものから所定数のテキストデータを選択し、選択されたテキストデータに含まれる各語の出現頻度に関する指標に基づいて重要語を抽出する。 (もっと読む)


【課題】夫々の通話に基づく複数の音声データの内で、要件が継続する音声データを一連の音声データとして関連付ける関連付け装置、関連付け方法及びコンピュータプログラムを提供する。
【解決手段】関連付け装置1は、選択した複数の音声データに対する音声認識処理の結果に基づいて、各音声データ間で共通し、かつ要件の内容に関する要件語句の出現率に係る数値を、要件類似度として導出する(S102)。また関連付け装置1は、複数の音声データから抽出した夫々の音声の特徴の比較結果を示す類似度を、話者類似度として導出する(S103)。そして関連付け装置1は、要件類似度及び話者類似度に基づいて、選択した複数の音声データが関連している可能性を示す関連度を導出し(S104)、関連度が予め設定されている閾値以上となる場合に、選択した複数の音声データを関連付ける(S105)。 (もっと読む)


【課題】より高いセキュリティでユーザ認証を行うことができる認証サーバ、サービス提供サーバ、認証方法、通信端末、およびログイン方法を提供すること。
【解決手段】認証サーバ300は、通信端末から受信した発話データの特徴量をユーザIDに対応付けて登録する声紋抽出登録部330と、特徴量から暗号鍵を生成して通信端末に送信する暗号鍵生成部と340と、通信端末からユーザIDに対応する発話データおよび暗号化されたパスワードが送られてきたとき、その発話データの特徴量がそのユーザIDに対応付けて登録された特徴量と同一か否かを判断する照合部350と、同一であるとき、特徴量から暗号鍵生成部340で生成される暗号鍵により、暗号化されたパスワードを復号し、ユーザIDと対応付けて、情報サービスを提供するサービス提供サーバ200に送信するパスワード復号部360とを有する。 (もっと読む)


【課題】受信した映像だけから所望の出演者が登場しているシーンを特定する。
【解決手段】話者名を示す情報で特定された話者名と話者の発話時間とを含む話者時間を第1区間として取得する手段103と、映像中の有音区間から発話を含む第2区間を取得する手段101と、第2区間が第1区間に含まれる場合に第2区間の音声波形から話者を特徴付ける第1特徴量を抽出し第1区間に対応する話者名と特徴量とを対応付ける手段105と、話者毎の特徴量から話者の話者モデルを作成する手段106と、認識対象となる発話時間である第3区間を取得する手段108と、第2区間が第3区間に含まれる場合に第2区間の音声波形から話者を特徴付ける第2特徴量を抽出する手段109と、話者毎の話者モデルの特徴量と第2特徴量との類似度を計算する手段110と、類似度のうち、設定条件の話者モデルの話者名を出演者として認識する手段111と、を具備する。 (もっと読む)


【課題】 会議内容の正確な記録と守秘性の高い会議環境の整備に資する、守秘義務を前提とする研究発表に適した会議室設備及び会議室設備を用いた会議記録システムを提供する。
【解決手段】 会議室には、正面壁側にスクリーンとホワイトボードを設け、側面壁に沿って発表関係者と評価者が向かい合い、背面壁側には会議記録用のビデオレコーダと会議の管理者の机を配置する。発表関係者及び評価者の発言は、正面壁側のスピーカから再生されることで、発言を正確に録音して発言者の特定を確実にしている。背面壁側に設けられた入退室口には入室の管理者机を配置し、入室者を確認するとともに、入退室用のドアは開いた際にスクリーン等が視認できないように、内開きとなっている。以上の会議室設備の構造によって、会議内容を確実に録音して発言者が明確になり、かつ高い守秘性が確保されることで、参加者の活発な発言を促すことが可能になっている。 (もっと読む)


【課題】2者間の対話の音声データを適切に処理する。
【解決手段】2者間の対話の音声データを処理するシステムであって、2者間の対話における音声データから第1話者の発話割合の推移を算出する第1推移算出部と、2者間の対話における音声データから第2話者の発話割合の推移を算出する第2推移算出部と、第1話者の発話割合と第2話者の発話割合との差分の推移を表す差分データ列を算出する差分算出部と、差分データ列を平滑化した平滑差分データ列を生成する平滑化部と、平滑差分データ列を用いて表わされた、第1話者および第2話者の発話割合の推移を提示する提示部とを備えるシステムを提供する。 (もっと読む)


【課題】歌唱しているユーザの音声に基づき、そのユーザに類似した歌手を推薦する。
【解決手段】通常の会話に係る音声の発声者を特徴づける第一の音声特徴素を発声者別に格納した音響モデル辞書221と、歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を、発声者別に格納した歌唱モデル辞書222と、デジタル化された音声データを、音響モデル辞書221に格納されている第一の音声特徴素と比較分析し、音声データと類似する第一の音声特徴素の発声者を抽出する音響モデル検索部231と、デジタル化された音声データを、歌唱モデル辞書222に格納されている第二の音声特徴素と比較分析し、音声データと類似する前記第二の音声特徴素の発声者を抽出する歌唱モデル検索部232と、を備え、音響モデル検索部231での抽出結果及び歌唱モデル検索部232での抽出結果から、音声データに類似する音声の発声者をリストアップする。 (もっと読む)


【課題】発話者が離れた場所にいる対象者に対して話しかける場合に、その離れた場所にいる参加者が、話しかけられた対象者が誰であるかの判断を誤ることを抑制するようにした情報処理装置を提供する。
【解決手段】情報処理装置の状況提示手段は、通信回線を介して接続されている場所にいる参加者の状況を提示し、発話者判別手段は、発話者を判別し、対象者判別手段は、前記発話者判別手段によって判別された発話者の前記状況提示手段に対する行動を検知することによって、発話者が対象とする相手である前記場所にいる対象者を判別する。 (もっと読む)


【課題】キーワードを他人に知られても、ハンズフリー機能が使用されることがない携帯電話装置及びその制御方法を提供する。
【解決手段】携帯電話装置100は、例えばハンズフリー機能を提供するハンズフリー機能提供部12と、使用者の声紋と特定のキーワードとが予め登録された記憶部14と、入力部10から入力された音声の声紋と記憶部14に記憶された声紋とを比較して双方の一致を判定する声紋認証部18と、入力部10から入力された音声を認識し、認識した音声の内容が記憶部14に記憶されたキーワードと一致するか否かを判定する音声認識部16と、制御部13とを備える。制御部13は、声紋認証部18による判定結果が一致したときに、音声認識部16の判定結果に従って、ハンズフリー機能を有効にするか否かを制御する。 (もっと読む)


【課題】複数のユーザ発話の混在する環境から装置に対するユーザ発話を的確に選択する処理を実行する装置および方法を実現する。
【解決手段】発話を行なうユーザを含む環境から、ユーザ発話情報の他、カメラによって撮影された画像情報などの観測情報を入力してベイジアンネットワークを利用した確率値算出を行い、情報処理装置に対するユーザ発話を選択する。さらに、選択したユーザ発話を部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)を適用して、ユーザ要求を理解するグラウンディング処理を実行する構成としたので、複数の発話が混在する環境においても、装置に対する要求を的確に選択して迅速にタスクを行なうことが可能となる。 (もっと読む)


【課題】少ないデータ量及び計算量で話者の検証が可能となる話者認証の検証方法及び装置を提供する。
【解決手段】話者が話したパスワードを含むテスト用発話を入力し、入力された前記テスト用発話から音響特性ベクトル列を抽出し、登録話者により登録された話者テンプレートと、前記音響特性ベクトル列との間のマッチングパスを求め、前記テスト用発話のスペクトル変化及びまたは前記話者テンプレートのスペクトル変化を考慮して、前記マッチングパスのマッチングスコアを計算し、前記マッチングスコアと予め定義された識別用閾値とを比較して、前記テスト用発話が前記登録話者が話したパスワードを含む発話であるか否かを決定する。 (もっと読む)


【課題】本発明は、情報処理装置及び情報処理方法に関し、例えば携帯電話、パーソナルコンピュータ等の各種情報機器に適用して、一段と身近な親しみ易い電子ペット装置、電子ペットを有する情報処理装置、携帯機器、情報処理手順を記録した記録媒体及び情報処理方法を提案する。
【解決手段】本発明は、ネットワークに接続して種々のデータDTを送受し、また音声DAにより単語を登録できるようにし、またユーザー認証により応答を異ならせ、また音声入力と応答とを分類してこの分類により応答を生成し、さらに過去の履歴により感情を変化させる。 (もっと読む)


【課題】事業者が話者認識によりユーザの本人認証を行うシステムにおいて、取引先の事業者ごとにユーザが都度発話による話者モデルの登録を行う必要のないシステムを提供する。
【解決手段】ユーザ側装置20は音声入力手段24、話者モデル作成手段21、記憶手段22、話者モデルを転送する通信手段23を備え、事業者側の管理装置40は話者モデルの取得手段41、記憶手段42、通信手段43を備え、事業者側の話者認識装置50は話者モデルの取得手段51、話者モデル登録手段52、特徴取得手段53、話者認識手段54を備え、ユーザはユーザ側装置20を用いて話者認識に用いる話者モデルを作成して保持し、事業者はユーザを取引先として登録する際に、管理装置40を用いて取引に必要な個人情報とともに話者モデルをユーザから取得し、話者認識装置50において話者モデルを登録する。 (もっと読む)


【課題】発話者を特定しながら音声認識性能を向上させる音声認識装置を提供すること。
【解決手段】発話者が発する音声を認識する音声認識装置100は、発話者を特定する発話者特定手段11と、特定した発話者に応じて音声認識特性を調整する音声認識特性調整手段12とを備える。音声認識特性調整手段12は、特定した発話者に応じて、マイク感度、声域フィルタで除去する周波数帯域、方言認識辞書、又は、頻出語彙認識辞書を切り換えるようにする。音声認識装置100は、音声から声紋データを取得する音声認識手段10を備え、発話者特定手段11は、予め登録された声紋データと音声認識手段10が取得した声紋データとを照合して発話者を特定する。 (もっと読む)


81 - 100 / 293