説明

国際特許分類[G10L17/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 話者の同定または識別 (337)

国際特許分類[G10L17/00]に分類される特許

141 - 150 / 337


【課題】VQ符号帳の信頼性が低い場合でも音声間の類否を高い精度で判定できる指標を算定する。
【解決手段】記憶装置30は、音声信号VAの特徴ベクトル系列XAおよびVQ符号帳CAと音声信号VBの特徴ベクトル系列XBおよびVQ符号帳CBとを記憶する。第1算定部161は、VQ符号帳CAと特徴ベクトル系列XBとのVQ歪DAB、VQ符号帳CBと特徴ベクトル系列XAとのVQ歪DBA、VQ符号帳CAと特徴ベクトル系列XAとのVQ歪DAA、VQ符号帳CBと特徴ベクトル系列XBとのVQ歪DBBを算定する。第2算定部162は、VQ歪DABやVQ歪DBAが大きいほどVQクロス歪DCが大きく、VQ歪DAAやVQ歪BBが大きいほどVQクロス歪DCが小さくなるように、第1算定部161による算定の結果から、音声信号VAと音声信号VBとの類否の指標となるVQクロス歪DCを算定する。 (もっと読む)


【課題】入力される音声を適切に処理し、音源認識、話者認識または音声認識を精度良く行う音声処理装置を提供する。
【解決手段】第1音源100より発生された音声を受信して複数チャネルの第1音声信号を出力する複数のマイクロホン101と;前記チャネル間の相関を示す第1特徴量を算出する算出部110と;第2音源より発生された音声を前記複数のマイクロホン101により受信して得られる複数チャネルの第2音声信号のチャネル間の相関を示す第2特徴量を予め記憶している記憶部120と;前記第1特徴量と前記第2特徴量を照合し、前記第1音源100が前記第2音源に一致するか否かを判定する照合部102と;を具備する。 (もっと読む)


【課題】不確実で非同期な入力情報に基づく情報解析により、精度の高いユーザ位置およびユーザ識別情報を効率的に生成する構成を実現する
【解決手段】カメラやマイクによって取得される画像情報や音声情報に基づいてユーザの推定位置および推定識別データを含むイベント情報を入力して、複数ターゲットを設定した複数パーティクルを適用したパーティクルフィルタリング処理を行い仮説の更新取捨選択によりユーザ位置および識別情報を生成する。また、カメラの画像フレーム外に仮想ターゲットを設定した暫定ターゲットとイベント検出部の生成するイベント情報との尤度を検証し、検証結果に応じて暫定ターゲットを各パーティクルに追加する。本構成により、フレーム外ユーザの音声入力に対応した処理が可能となり、ユーザ位置や識別の正確な推定処理が実現される。 (もっと読む)


【課題】顧客からの預かり物件を効率的に管理するための営業支援システム、営業支援方法及び営業支援プログラムを提供する。
【解決手段】携帯端末10から音声データを受信した営業支援サーバ20は、話者照合認証処理を実行する。認証ができた場合、営業支援サーバ20は、訪問情報を携帯端末10から取得する。そして、この訪問情報に応じて辞書を選択する。携帯端末10から音声データを受信した営業支援サーバ20は、この辞書を用いて、音声認識処理を実行する。そして、携帯端末10から預かり物件情報を取得して記録する。一方、帰店通知を受信した営業支援サーバ20は、ユーザ認証を行ない、預かり物件を抽出する。そして、顧客別預かり一覧及び回付用伝票の印刷データを生成し、プリンタ装置31において、顧客別預かり一覧及び回付用伝票の印刷を実行する。 (もっと読む)


【課題】指定単語に関連する単語を高精度に認識する。
【解決手段】関連語特定部12は、利用者が入力装置42から入力した指定単語KWについて複数の関連語RWを特定する。記憶装置30は、複数の単語の各々について出現確率Pを記憶する。確率調整部14は、複数の単語のうち関連語特定部12が特定した各関連語RWの出現確率Pを関連語RW以外の単語の出現確率Pに対して相対的に上昇させる。音声認識部16は、音声信号Sが表わす音声に対応した単語を、確率調整部14による調整後の出現確率Pに基づいて特定する。 (もっと読む)


【課題】音声信号を区分した各区間について適度な時間長を確保する。
【解決手段】音声区分部121は、音声信号Sを時間軸上で複数の区間bに区分する。音声区分部121は、音声信号SのSN比に基づいて音声信号Sを発音区間PAと非発音区間PBとに区分する第1区分部41と、音声信号Sの包絡線Eの各谷部Dを境界として音声信号Sを区分する第2区分部42とで構成される。特徴抽出部123は、複数の区間bの各々について音声信号Sの音響的な特徴量を抽出する。区間連結部125は、音声信号Sの特徴量が類似する複数の相前後する区間bを連結することで各区間Bを画定する。音声分類部14は、各区間Bの音声信号Sを発声者ごとに分類する。 (もっと読む)


【課題】発声者の位置が変化した場合における音声認識の精度の低下を抑制する。
【解決手段】位置特定部14は、音声信号Sから各発声者の方向jを特定する。話者識別部16は、音声信号Sが表わす各音声の発声者を区別する。適応モデル生成部24は、位置特定部14が適応用の音声信号S1から特定した方向jと話者識別部16が音声信号S1から区別した発声者との組合せに対応した音響モデルMを音声信号S1に応じて生成する。音声認識部26は、位置特定部14が認識用の音声信号S1から特定した方向jと話者識別部16が音声信号S2から区別した発声者との組合せに対応した音響モデルMに基づいて、音声信号S2が表わす音声に対応した文字を特定する。 (もっと読む)


【課題】音声信号を区分した複数の区間を正確に発声者ごとに分類する。
【解決手段】特徴抽出部41は、音声信号Sを時間軸上で区分したN個の区間Bの各々について特徴量を抽出する。指標算定部43は、N個の区間Bのなかから2個の区間Bを選択する総ての組合せについて、2個の区間Bにおける特徴量の類否を示す類否指標値を算定する。音声分類部45は、N個の区間Bの各々と当該区間Bに特徴量が最も類似する区間Bとが同じクラスタに属するように、各区間の類否指標値に基づいてN個の区間Bを複数の集合に分類する。 (もっと読む)


【課題】話者特定処理に必要な計算量や記憶容量等を最小限に抑制しつつ、且つ、話者特徴情報の更新の進行態様に柔軟に対応させて適切に類似度閾値を更新させることで、話者特定における正確性をより向上させることが可能な話者特定装置を提供する。
【解決手段】話者による発話の音響的特徴を示す話者モデルと、当該話者の発話に相当する特徴量信号Soと、を比較し、それらの間の類似度を検出すると共に、検出された類似度と、当該類似度の検出の際に比較された類似度閾値と、を比較して話者特定を行う話者認識部5と、特徴量信号Soを用いて話者モデルを更新するパラメータ更新部8と、類似度閾値を、検出された類似度を用いて更新する閾値設定部6と、を備える。 (もっと読む)


【課題】オーディオ信号の記録方式に対してプライバシーを保護する仕組みを導入する。
【解決手段】オーディオ信号記録装置は、入力された元オーディオ信号の全区間から人の音声の信号成分を含む音声区間を検出して、前記音声区間における信号に対して暗号化処理を施すことにより、前記元オーディオ信号から暗号化オーディオ信号を生成する。そして、前記暗号化オーディオ信号と、前記暗号化オーディオ信号を復号するための復号用情報と、前記復号用情報に従った前記暗号化オーディオ信号の復号及び前記元オーディオ信号の再生出力に対する許可/禁止を再生装置側で切替制御させるための権限管理情報と、を互いに関連付けて電子ファイルに格納する。 (もっと読む)


141 - 150 / 337