説明

国際特許分類[G10L15/10]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | 未知音声と標準パタンとの距離または歪みを用いるもの (838)

国際特許分類[G10L15/10]に分類される特許

61 - 70 / 838


【課題】従来装置は、人の発声ピッチパターンが、同じアクセント型でも発声速度や音韻継続時間の抑揚変化で異なるため、アクセント型を誤判別したり、発声する音韻環境、話者性、話者の調子、それら組合わせでの抑揚変化で、アクセント型判別精度が低下する。
【解決手段】ピッチパターン抽出手段で音声入力手段の音声データから入力ピッチパターンを抽出し、基準ピッチパターン選択手段で、言語情報入力手段での入力音声データの言語情報を基に、基準ピッチパターンコーパスからアクセント型推定用の基準ピッチパターンをアクセント型ごとに複数選択し、ピッチパターン照合手段で入力ピッチパターンと複数の基準ピッチパターンの類似度を算出、この類似度を基に最も類似する基準ピッチパターンのアクセント型を、入力ピッチパターンのアクセント型としてアクセント型決定部で出力する。 (もっと読む)


【課題】より簡易に会話スタイルを分析すること。
【解決手段】分析装置10は、取得部14aと、第1の検出部14bと、第2の検出部14cと、抽出部14eと、分析部14fとを有する。取得部14aは、音声データを取得する。第1の検出部14bは、取得された音声データから、第1の確率モデルを用いて、有声音領域および無声音領域を検出する。第2の検出部14cは、検出された有声音領域および無声音領域に基づいて、第2の確率モデルを用いて、音声データにおける発話領域および沈黙領域を検出する。抽出部14eは、検出された発話領域および沈黙領域の会話特性を抽出する。分析部14fは、抽出された会話特性に基づいて、会話スタイルを分析する。 (もっと読む)


【課題】誤りのない確実なオーディオデータの照合を実現することのできるオーディオデータ照合システムを提供する。
【解決手段】本発明のオーディオデータ照合システム1は、既知のオーディオデータから特徴データを抽出するオーディオデータ特徴抽出装置2と、既知のオーディオデータから生成された特徴データに識別情報を登録してデータベース31に格納する特徴データ格納サーバ3と、未知のオーディオデータから特徴データを生成し、データベース31に格納されている特徴データと比較して照合するオーディオデータ照合装置4とを備えていることを特徴とする。 (もっと読む)


【課題】入力される音声を逐次テキスト化して表示する際、利用者にとって読みやすく理解しやすい字幕を生成できるテキスト表示時間決定装置、テキスト表示システム、テキスト表示時間決定方法、およびテキスト表示時間決定プログラムを提供する。
【解決手段】テキスト表示装置は、認識結果作成手段81と、表示時間決定手段82とを備えている。認識結果作成手段81は、入力される音声を逐次認識してテキスト化した認識結果を作成する。表示時間決定手段82は、音声の発話時間に基づいて、認識結果に含まれる文章ごとに表示時間を決定する。 (もっと読む)


【課題】日常音のモデルの自動的な更新を可能とする。
【解決手段】日常音を特性に基づきクラスタに分類し、クラスタに基づき異常音の判定を行う。クラスタをガウス分布の表現に変換したガウス分布を決定するパラメータを、新たに採取した採取音の特性を用いて更新する。更新の際に、採取音の特性がガウス分布に含まれる確率が、パラメータに決定されるガウス分布に含まれる確率を示す値で表される学習閾値の範囲内にある場合に、パラメータの更新を行う。また、採取音の特性がガウス分布に含まれる確率が、学習閾値よりも低い確率を表す異常音検出閾値未満である場合に、採取音が異常音であると判定する。 (もっと読む)


【課題】比較的高いノイズレベルの環境下においても精度よく子音区間を検出する。
【解決手段】子音区間検出装置110は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部120と、フレーム化入力信号を、時間領域から周波数領域に変換して、スペクトルパターンを生成するスペクトル生成部122と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部126と、導出された帯域別平均エネルギー同士を比較し、第1の周波数帯域の帯域別平均エネルギーが、第1の周波数帯域より低い周波数帯域である第2の周波数帯域の帯域別エネルギーより高いことを検出することによりフレーム化入力信号に子音が含まれるかどうかを判定する子音判定部128とを備える。 (もっと読む)


【課題】本発明は、通話内容を把握することが容易な通信機器及び表示システムを提供する。
【解決手段】通信機器は、表示部21と、音声が入力され、入力された音声を音声データに変換して出力するマイク12と、外部通信機器との間での通話に利用され、その外部通信機器から音声データが入力される通信部32と、特定の単語に対応する登録単語データを記憶する記憶部33と、マイク12から出力された音声データと通信部32に入力された音声データとの少なくとも一方と、記憶部33に記憶された登録単語データとに基づいて、各音声データに基づく音声の中に含まれる特定の単語を抽出する抽出部41と、抽出部41によって抽出された特定の単語或いは当該特定の単語を含む文節又は文を表示部21に表示させる表示制御部42と、を備える。 (もっと読む)


【課題】周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供すること。
【解決手段】実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。 (もっと読む)


【課題】言語では明示的に認識されない情報を反映する語句を分析するための情報処理装置、情報処理方法、情報処理システム、およびプログラムを提供する。
【解決手段】情報処理装置120は、会話を記録した音声データから当該音声データにおける言語では明示されない情報を識別しており、音声データを音響データを使用して音響分析するための音響分析部208と、音声データの前後がポーズで分離された領域を識別し、識別された領域の音響分析により前記識別された領域の語句を識別し、当該語句の韻律特徴値を要素とする当該語句の1以上の韻律特徴値を生成する韻律情報取得部212と、音響分析部208が取得した語句の音声データにおける出現頻度を取得する出現頻度取得部210と、出現頻度の高い語句の韻律特徴値の前記音声データ中におけるばらつき度を計算し、特徴語句を決定する韻律ばらつき解析部214とを含む。 (もっと読む)


【課題】不特定の人物の間で不定期に発生する会話を解析する。
【解決手段】情報処理装置100は、ユーザの発話および1または複数の他の人物の発話の音声情報を取得する音声取得部112と、音声情報を外部装置200に送信し、音声情報に基づいて1または複数の他の人物の中から抽出される会話メンバーとユーザとを含む会話グループの情報を用いて生成される会話グループ関連情報を外部装置200から受信する通信部170とを含み、会話メンバーは、1または複数の他の人物のうち、音声情報の音声特徴量と類似した音声特徴量を有する音声情報を外部装置200に送信する他の情報処理装置を保持する1または複数の人物である。 (もっと読む)


61 - 70 / 838