説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

71 - 80 / 337


【課題】極力、認識語彙に含まれる不要語の数が少ない辞書を用いて音声認識を行なうことにより、音声認識性能の低下を抑制すること。
【解決手段】音声データに基づいて話者を識別し、その話者の発話音声における不要語の使用頻度を算出して、話者毎に不要語使用頻度として記憶しておく。この不要語使用頻度は、話者毎に、どの程度頻繁に不要語を使用するかの傾向を表すものとなる。従って、音声データに基づいて話者が識別されたとき、その話者に対して不要語使用頻度が記憶されている場合、音声認識部31において使用される不要語辞書313bを、記憶されている不要語使用頻度に応じた不要語の数の不要語辞書313bに切り替える。この結果、話者の不要語使用頻度に適した不要語の数の不要語辞書313bを用いて、音声認識を行なうことができる。 (もっと読む)


【課題】合成音声に判別情報を付加することなく、入力した音声から事前に設定したテキストに対応する複数の音声を取得し、抽出された特徴量を用いて、取得した各音声同士の類似度合いから、合成音声信号であるか肉声であるかを判別できるようにする。
【解決手段】本発明の合成音声判別装置は、入力された音声信号が合成音声信号であるか否かを判別する合成音声判別装置において、入力された音声信号をテキストに変換する音声認識手段と、音声認識手段により変換されたテキストから、対象テキストに該当する複数の音声を切り出し、この複数の音声間の類似度合いに応じて合成音声信号か否かを判別する合成音声判別手段とを備えることを特徴とする。 (もっと読む)


【課題】どの操作画面を表示した状態からでも、ユーザに手間をかけることなくかつ短時間で目的の操作画面に音声によって遷移できること。
【解決手段】音声入力部24、音声を認識して音声コマンドSWを生成するコマンド認識部44、複数の操作画面GMを記憶する操作画面記憶部40、操作画面GMのそれぞれに対応して設けられ、音声コマンドSWとリンク情報KWとを対応付けて登録する辞書テーブルTB、音声コマンドが生成されたときに表示されている操作画面に対応した辞書テーブルTBを参照して音声コマンドに対応する操作画面に遷移させる画面表示制御部42、および、特定の操作画面GMに遷移させるための音声コマンドを辞書テーブルに追加登録する旨の指令があったときに、追加登録する音声コマンドSWおよびリンク情報KWを、対象となる全ての辞書テーブルに追加登録する一括登録部45を設ける。 (もっと読む)


【課題】マイクロホンを手にして歌唱体勢にある歌唱者本人が、音声特徴パラメータ登録といった面倒を意識することなく、そのマイクロホンへの音声指示だけでもって、伴奏音楽を円満かつ円滑に途中終了させられるようにする。
【解決手段】歌唱者のマイクロホン21から得た歌声信号と、歌詞文字データとに基づいて、歌唱者の音声を分析して特徴パラメータを抽出し、カラオケ伴奏音楽の間奏区間において、直前までに音声分析手段が分析した特徴パラメータと、メモリに記憶されている演奏中止指示用単語とに基づいて、直前まで歌っていた歌唱者が演奏中止指示用単語を発話したか否かを分析し、声認識手段が演奏指示用単語を発話したと分析した場合i、演奏中のカラオケ伴奏音楽を途中終了させる。 (もっと読む)


【課題】
音声信号から話者の特定を行う話者特定装置において、話者特定のための精度向上を図る。
【解決手段】
音響モデルに個人名称を対応付けた個人別話者認識情報26aを記憶する記憶部26と、入力される音声信号と音響モデルを比較して、類似度が高い音響モデルを有する話者を抽出する話者認識部25と、入力される音声信号を音声認識する音声認識部22と、音声認識部22での認識結果から個人名称を抽出する解析部23と、話者認識部22での抽出結果、及び、解析部23で抽出した個人名称に基づいて話者を特定する話者特定部24を備える。 (もっと読む)


【課題】
車に乗車した同乗者を特定する、あるいは、同乗者特定のための精度向上を図る。
【解決手段】
入力される音声信号を音声認識する音声認識部23と、音声認識部23が認識した内容を解析してキーワードを抽出する解析部24と、個人識別情報とドライブ情報が対応付けられた同乗者履歴情報27と、同乗者履歴情報27を参照して、解析部24で抽出したキーワードに対応する個人識別情報を検索する同乗者検索部25を備えることを特徴とする。 (もっと読む)


【課題】携帯型機器によって操作可能な家電機器を使用する際に、個人認証により個人向け自動設定を低コストで簡易に行うことができる個人認証システムを提供する。
【解決手段】センサ部5を制御するCPU18と、センサ部5において検出された個人識別信号PSiを送信し、個人認証信号RSiを受信する送受信部20とを有するリモートコントローラ1と、認証部6を備える家電機器3と、リモートコントローラ1からの個人識別信号PSiを家電機器3に伝送し、家電機器3からの個人認証信号RSiをリモートコントローラ1に伝送する無線伝送部2とを備え、家電機器3は、ゲーム機やHDレコーダであっても良く、映像機器であっても良い。個人認証には、家電機器3の使用者の音声認証方式、リモートコントローラ1における静電認証方式、若しくは人体通信による静電認証方式を適用することができる。 (もっと読む)


【課題】来訪者を照合処理中の場合でも、居住者に迅速で防犯性の高い応対ができるよう音声を制御することが可能なインターホンシステムを提供する。
【解決手段】
子機10の呼出し信号を受信して来訪を検知した場合、応対者により親機20の通話信号を受信して、応対者の音声情報の入力が開始されたかどうか判断される(S13)。応対者から音声情報の入力が開始されたと判断された場合(S13:YES)、親機20のCPU201が、ステップS13で取得した応対者の音声情報から、周波数分布等を算出し、予め設定された設定値に変更して子機に音声情報を送信する。続いて、来訪者が登録済かどうか照合され、来訪者の評価結果に対応した音声情報に変更して、子機に送信する。 (もっと読む)


【課題】訪問者の個人情報を不要に公開することなく、訪問者の身元を容易に証明する。
【解決手段】訪問者用端末100が、音声を認識した際、訪問者を識別可能な識別情報を認証サーバ300へ送信し、応対者用端末200が、認識した音声を音声データとして認証サーバ300へ送信し、認証サーバ300が、識別情報とあらかじめ対応付けられてデータベースに格納されている音声データをデータベース上で参照可能にし、応対者用端末200から送信されてきた音声データを、データベース上で参照可能になっている音声データの中から検索し、検索された音声データとあらかじめ対応付けられている訪問者情報を応対者用端末200へ送信し、その後、音声データの参照を不可能し、応対者用端末200が、認証サーバ300から送信されてきた訪問者情報を表示する。 (もっと読む)


【課題】ダイアライゼーションにおいて、話者数と各話者を特徴づけるパラメータを正確に推定するクラスタリング技術を提供する。
【解決手段】クラスタリング計算装置3は、録音された会話データから抽出されたパワーベクトルを読み込んでdHDP近似モデルに対応したベクトルの観測量に変換する観測量生成部26と、変換された観測量の集合データを蓄積記憶する記憶手段10と、観測量の集合データから複数のクラスタをdHDP近似モデルにより生成するときの複数のパラメータの事後分布の値をEMアルゴリズムによりそれぞれ推定し、記憶手段10に順次蓄積および更新する変分事後分布推論部30と、事前に設定された終了条件が成立したときに、記憶手段10に記憶されている複数のパラメータの事後分布の最新の推定値を出力する出力制御部28とを備える。 (もっと読む)


71 - 80 / 337