説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

81 - 90 / 337


【課題】一定時間、一人の話者が主要な話者となる音声データが対象となる場合であっても、精度良く話者の分類を行い得る、音声分類装置、音声分類方法、及びこれらを実現するためのプログラムを提供する。
【解決手段】二以上の話者が発話を行っている音声データに含まれる複数の発話セグメントに対してクラスタリングを行い、クラスタリング結果に基づいて、音声分類を行う音声分類装置10を用いる。音声分類装置10は、複数の発話セグメントが時間軸に沿って配置されたときに、二つの発話セグメント間に存在するクラスタの数を計測するクラスタ数計測部2と、計測されたクラスタの数を用いて、二つの発話セグメント間の音響的類似度に基づく距離を算出する距離算出部3と、算出された距離を用いて、複数の発話セグメントのクラスタリングを実行するクラスタリング部4とを、備えている。 (もっと読む)


【課題】不確実で非同期な入力情報に基づく情報解析により、精度の高いユーザ識別処理を実行する構成を実現する。
【解決手段】カメラやマイクによって取得される画像情報や音声情報に基づいて実空間におけるユーザの存在と位置および識別情報を含む解析情報を生成する。仮想ユーザに対応する複数のターゲット各々について、(1)ターゲットの存在確率算出に適用するターゲット存在仮説情報、(2)ターゲットの存在位置の確率分布情報、(3)ターゲットが誰であるかを示すユーザ確信度情報を設定し、ターゲット存在仮説情報を適用して各ターゲットの存在確率を算出してターゲットの新規設定および削除を実行する構成としたので、例えば誤検出による誤生成ターゲットを削減し、高精度かつ高効率のユーザ識別処理を実行可能となる。 (もっと読む)


【課題】ユーザに対応して車載機器の動作の設定を自動的に行うにあたってコストを低減しつつユーザの負担を軽減する上で有利な車載機器用制御装置を提供する。
【解決手段】音質特徴量検出手段22は、音声入力部14から供給される運転者の音声データに基づいて、第1、第2特徴量を検出する。イントネーション特徴量検出手段24は、音声入力部14から供給される運転者の音声データに基づいて音声の第3特徴量を検出する。運転者類別手段26は、音質特徴量検出手段22およびイントネーション特徴量検出手段24によって検出された音声の第1、第2、第3特徴量に基づいて運転者を類別する。動作設定手段28は、運転者類別手段26により運転者が類別されると、該類別された運転者に対応する設定データをデータベース20から読み出すと共に、該読み出した設定データに基づいて車載機器200の動作を自動的に設定する。 (もっと読む)


【課題】適切な生体情報を照合元として個人の認証を行うことが可能な個人認証装置、個人認証方法、および個人認証プログラムを提供する。
【解決手段】インターホンシステム1の子機10のマイク111から入力された来訪者の音声の情報が親機20に送信される。親機20では、受信した音声の情報から来訪者の声紋データが生成され、フラッシュROM220に登録されている複数の人物の声紋データと照合されることにより、来訪者が登録者であるか否を決定する認証処理が行われる。認証結果が表示モニタ213に表示され、屋内対応者に通知される。さらに、子機10の降雨センサ121により測定された降雨強度と、風速センサ122により測定された風速が、それぞれ、登録可否の判断基準として予め定められた第1の閾値および第2の閾値以下である場合には、取得された来訪者の声紋データが、フラッシュROM220に登録される。 (もっと読む)


【課題】音声及び映像に基づく性別−年齢識別方法及びその装置を提供する。
【解決手段】性別情報と年齢情報との相互関連性を考慮して音声認識及び顔認識を組み合わせて行うことによって性別及び年齢を正確に演算することができる識別装置及び方法に関する。性別−年齢識別方法は、映像情報及び音声情報を収集するステップと、前記収集された音声情報に対して一つ以上の特徴値を抽出し、前記抽出された特徴値を用いて性別及び年齢を識別する音声情報を用いた性別及び年齢識別ステップと、前記収集された映像情報に対して一つ以上の特徴値を抽出し、前記抽出された特徴値を用いて性別及び年齢を識別する顔情報を用いた性別及び年齢識別ステップと、前記音声情報を用いて識別された性別及び年齢と前記顔情報を用いて識別された性別及び年齢とを組み合わせ演算を行って性別及び年齢を最終決定するステップと、を含む。 (もっと読む)


【課題】予め限定されない任意の方向又は場所に位置する対象に指向性を向けて音波を出力すること。
【解決手段】一実施形態において、所定の信号源から送信される無線信号を受信する受信部と、前記受信部により受信された前記無線信号から、前記信号源の位置に依存するパラメータ値を決定する決定部と、前記パラメータ値に基づいて、前記信号源の方向へ指向性を有する音波を出力する音波出力部と、を備える音波出力装置が提供される。 (もっと読む)


【課題】
画像には顔が現れずに声だけが聞こえる人物を視覚的に確認できるようにする。
【解決手段】
データベース(16)には、複数人について、顔画像データとその特徴量、声データとその特徴量が登録されている。人声認識部(32)及び人声照合部(34)により、再生音声信号に含まれる人声の特徴量をデータベースに照合して、発声者を探索する。顔画像認識部(20)及びは顔画像照合部(22)により、再生画像信号に含まれる顔画像の特徴量をデータベース(16)に照合して、画面内の人物を探索する。付加画像表示判定部(40)は、探索された発生者から、探索された人物を除外し、画面外の話者を特定する。付加画像生成部(24)は、特定された話者の付加画像をデータベース(16)から読み出し、表示画像生成部(26)に供給する。表示画像生成部(26)は、付加画像を再生画像信号に合成する。 (もっと読む)


【課題】 通話中の話者が予め登録された全有害顧客のそれぞれに該当するか否かを実時間内で検知し、電話応対者に警告する。
【解決手段】 声紋データベースを参照して、発信元話者の声紋情報と、声紋データベースに登録された各グループの基準者の声紋情報との間でのみ、相対距離を算出し、該相対距離が最も小さい声紋情報を有する基準者が属するグループを選択するグループ選択部と、発信元話者の声紋情報と、選択されたグループに属する、基準者以外の被登録話者の声紋情報との間の相対距離を算出し、この相対距離の算出を基準者以外の全被登録話者について繰り返し、選択されたグループ内で相対距離が最も小さい声紋情報を有し、かつ該相対距離が、前記第1の閾値より小さい第2の閾値内にある被登録話者を選択する被登録話者選択部とを備える。 (もっと読む)


【課題】電話音声により本人性を確認するための認証技術において、種々の認証方式を柔軟に組み合わせて、本人性確認の精度を向上させる
【解決手段】電話網に接続された電話端末を利用して通話を行う話者の本人性確認を行うための認証装置において、前記話者の音声を前記電話網から受信する手段と、受信した音声の声紋情報と、所定の声紋情報とを照合することにより声紋認証を行う手段と、第1のキーワードを用いた音声認識認証処理を行う手段と、前記声紋認証による認証結果と、前記第1のキーワードを用いた前記音声認識認証による認証結果とが異なる場合に、第2のキーワードを用いた音声認識認証処理を行わせる認証制御手段と、を備え、前記認証制御手段が、前記第2のキーワードを用いた音声認識認証結果に基づき前記話者の本人性の判定を行う。 (もっと読む)


【課題】各利用者に応じ音声案内及び音声応答を適切に行うことができる音声案内応答方法を提供する。
【解決手段】車両利用者の個人認証を行い、利用者ごとの各種機器7における各利用者音声による操作回数と各音声案内の中断回数に応じた音声案内及び音声応答を行う。 (もっと読む)


81 - 90 / 337