説明

Fターム[5D015JJ06]の内容

音声認識 (5,191) | パターン照合によらない認識 (78) | 識別関数法 (3)

Fターム[5D015JJ06]に分類される特許

1 - 3 / 3


【課題】歌唱音声を解析して声質を判定するだけでなく、声質を切り替える技法で歌唱されているかどうかを判定すること。
【解決手段】本発明の実施形態におけるカラオケ装置は、歌唱音声を取得する取得手段と、歌唱音声をフレームごとに周波数スペクトルに変換する変換手段と、各フレームの周波数スペクトルにおけるピーク値とディップ値との比に応じた歌唱SN比を算出する算出手段と、歌唱SN比の分布に応じて、歌唱音声が第1の声質もしくは第2の声質で歌唱された音声、または特定の技法により歌唱された音声であると判定する判定手段と、判定結果に応じた情報を出力する出力手段とを具備する。 (もっと読む)


【課題】正確な話者の通話状態を判定する。
【解決手段】第2話者と通話をしている第1話者が、第1状態か第2状態かを判定する通話状態判定装置であって、第1話者と第2話者の発話区間を検出し、予め定められた数の発話対をセグメントとして抽出し、発話対毎に、発話状況に関わる対話的特徴量を算出し、対話的特徴量をセグメント毎に集計することで特徴ベクトルを求め、予め定められた判別式に特徴ベクトルの各要素を代入することで、第1状態スコアを求め、第1状態スコアが予め定められた第1閾値以上であれば、そのセグメントを第1状態セグメントとして判定し、第1状態セグメントが予め定められた第2閾値以上であれば、通話状態は第1状態である旨の情報を出力する。 (もっと読む)


【課題】一定時間、一人の話者が主要な話者となる音声データが対象となる場合であっても、精度良く話者の分類を行い得る、音声分類装置、音声分類方法、及びこれらを実現するためのプログラムを提供する。
【解決手段】二以上の話者が発話を行っている音声データに含まれる複数の発話セグメントに対してクラスタリングを行い、クラスタリング結果に基づいて、音声分類を行う音声分類装置10を用いる。音声分類装置10は、複数の発話セグメントが時間軸に沿って配置されたときに、二つの発話セグメント間に存在するクラスタの数を計測するクラスタ数計測部2と、計測されたクラスタの数を用いて、二つの発話セグメント間の音響的類似度に基づく距離を算出する距離算出部3と、算出された距離を用いて、複数の発話セグメントのクラスタリングを実行するクラスタリング部4とを、備えている。 (もっと読む)


1 - 3 / 3