説明

国際特許分類[G10L15/04]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | セグメンテーション,または語区切れ検出 (272)

国際特許分類[G10L15/04]に分類される特許

61 - 70 / 272


【課題】発話区間検出の処理負荷を少なくし、ユーザの誤操作を精度よく検知することができる音声認識システムを提供する。
【解決手段】本発明の音声認識システムは、発話開始の指示を含むユーザによる発話タイミングの指示を取得する発話タイミング指示取得手段と、入力される音声信号を保持し、前記発話タイミング指示取得手段により発話開始の指示が取得された場合、保持している音声信号およびそれ以降に入力される音声信号を出力する音声信号保持手段と、前記音声信号保持手段により出力された音声信号から発話区間を検出する発話区間検出手段と、前記発話区間検出手段により検出された発話区間と、前記発話タイミング指示取得手段により取得された発話タイミングの指示とに基づいて、ユーザの誤操作を検知する誤操作検知手段と、を備える。 (もっと読む)


【課題】音声認識装置の認識辞書において、ユーザの発声入力に発声区切りや発声誤りが生じ易い認識語彙についても、確実に認識することが可能な音声認識装置及び音声認識方法を提供することを目的とする
【解決手段】音声認識装置は、認識語彙を記憶する認識辞書と、認識語彙を複数の部分認識語彙に分割する解析部と、部分認識語彙に対して、所定音素の追加、他の語彙との置換、該当する部分認識語彙の削除およびこれらの再結合を行い、派生認識語彙を生成する派生認識語彙生成部と、音声データの入力を受け付ける音声入力部と、音声データの音声区間を検出する音声検出部と、音声データを認識辞書に記憶された認識語彙と派生認識語彙生成部で生成された派生認識語彙を用いて音声認識処理を行う音声認識部を備える。 (もっと読む)


【課題】操作性を向上させて音声データの文区切りを設定すること。
【解決手段】無音検出部106は、音声データに含まれる無音区間を検出し、無音情報保持部107は、無音区間の尤度を算出し、設定部108は、検出された無音区間のうち、予め設定された閾値以上の尤度を有する無音区間を音声データの区切り位置として設定し、修正部112は、音声データの区切りの追加を指示する修正指示が発生した時刻の直前の区切り位置と、修正指示が発生した時刻の直後の区切り位置との間の区間内の無音区間のうち、尤度が最も高い無音区間を音声データの区切り位置として追加する。 (もっと読む)


【課題】音素境界時刻の推定を従来よりも精度良く行なう。
【解決手段】入力された音声の各フレームの音声特徴量を抽出する。複数の音素の音声特徴量についての統計量を用いて、各フレームに最も尤もらしい音素を割り当てて、連続する2つのフレームで割り当てられた音素が異なる場合に、それらの2つのフレームに亘る時間範囲に含まれる時刻の何れかを音素境界時刻とすることにより音素境界時刻を推定する。音素境界時刻が信頼できるかどうか判定する。音素境界時刻が信頼できないと判定された音素境界を構成する各音素に、その各音素の継続長の、平均値が大きいほど長く、分散が大きいほど大きく伸縮した時間を割り当てることにより、その音素境界時刻が信頼できないと判定された音素境界の音素境界時刻を推定する。 (もっと読む)


【課題】発話者によって適切な速度及び間による発話ができるように、適切なタイミングで発話のための文字情報を提示する。
【解決手段】タイミング設定部2の音声認識手段10は、原稿の音声信号から単語を抽出し、単語単位の発話開始時刻及び発話時間長の認識結果を生成する。分割手段20は、原稿のテキスト情報から単語列の単語情報及び文節列の文節情報を生成する。DPマッチング手段30は、認識結果及び単語情報に基づいて、誤りのある認識結果の単語を単語情報に含まれる正しい単語に入れ替えてマッチング結果を生成する。タイミング情報生成手段40は、マッチング結果及び文節情報に基づいて、文節単位の発話開始時刻及び発話時間長のタイミング情報を生成する。文字情報提示部4は、タイミング情報が示す発話開始時刻及び発話時間長に基づいて、それに対応する文節の形態を変えて文字情報を提示する。 (もっと読む)


【課題】複数の通話端末装置間で行われる通話の通話区間を簡易な構成で正確に検出できるようにする。
【解決手段】何れかの通話端末装置を基準とした送話側チャネルと受話側チャネルの音声信号が入力される音声入力部11と、チャネル毎の音声区間と非音声区間を検出する音声検出部12と、複数チャネルの音声区間と非音声区間の情報より通話区間を検出する通話区間検出部13と、通話の開始を推測できるイベント音の存在を検出するマッチング部14と、通話区間修正部15とを備える。通話区間修正部15はイベント音が検出された時、その検出時刻で通話区間を分割し、さらに通話確定時刻が最初に検出されたイベント音の検出時刻より前で、分割により生成された一番目の通話区間と直前通話の通話区間の時間差が一定時間T1以内の時に、それら両通話区間を結合する。 (もっと読む)


【課題】騒音などのノイズによる誤作動を有効に防止できる音声対話装置を提供する。
【解決手段】ユーザに対するメッセージ情報をユーザに提示する提示手段と、音声を入力する入力手段20と、入力手段20により入力された音声のうち、所定の検出条件を満たす音声を、メッセージ情報に対するユーザの発話音声として検出する検出手段と、ユーザの状態を推定する推定手段と、推定手段により推定されたユーザの状態に基づいて、検出手段によるユーザの発話音声の検出条件を設定する設定手段と、を備えることを特徴とする音声対話装置。 (もっと読む)


【課題】複数の音声入力部から入力された音声から、特定方向から発せられる目的音と撮影者音声とを抽出し、当該撮影者音声を含むシーンの切れ目情報からなるチャプター情報を再生時に利用する音声処理装置等を提供する。
【解決手段】本発明に係る音声処理装置は、複数の音声を取得する音声取得部と、取得される複数の音声から、所定の音声を抽出する音声抽出部と、抽出される所定の音声に基づいて、複数の音声の区切りを判定する判定部と、判定される区切りに基づいて、所定の音声に対応付けられる区切りを示す情報を生成する生成部と、生成される区切りを示す情報を表示する表示部と、を備える。 (もっと読む)


【課題】発話推定を用いて音声処理システム全体の低消費電力化を図れる回路起動方法を提供する。
【解決手段】本回路起動方法は、発話推定処理を音声処理の前に行い、音声処理以下の回路電源を制御することにより、音声処理システム全体の低消費電力化を図る。具体的には、本回路起動方法は、収音装置および信号処理回路に電源を供給する一部電源供給ステップと、収音装置から信号処理回路を通じて音を入力する収音ステップと、入力された音に音声が含まれているかを推定する発話推定ステップと、発話推定ステップの推定結果から音声が含まれていると推定された場合に、発話区間の間、音声処理回路に電源を供給する電源供給ステップを備える。 (もっと読む)


【課題】二者が会話する音声データを複数の対話状態に分割する。
【解決手段】 この発明の対話状態分割装置は、発話区間検出部と、フレーム抽出部と、フレーム内発話時間比計算部と、対話状態分類部とを具備する。発話区間検出部は、二者が会話する音声データを入力として、その二者のそれぞれの発話区間を検出する。フレーム抽出部は、それぞれの発話区間を経過時間順に並べて所定数の発話区間を1フレームとして出力する。フレーム内発話時間比計算部は、フレーム毎のそれぞれの発話区間の時間比を計算する。フレーム代表スコア計算部は、発話区間の時間比から1フレーム内の代表スコアを発話区間の単位で決定する。対話状態分割部は、発話区間の時間比を少なくとも2個の閾値と比較することでフレームを少なくとも3つの対話状態にそれぞれ分割する。 (もっと読む)


61 - 70 / 272