説明

国際特許分類[G10L15/10]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | 未知音声と標準パタンとの距離または歪みを用いるもの (838)

国際特許分類[G10L15/10]に分類される特許

831 - 838 / 838


【課題】 携帯電話などを利用して、曲名が不明であっても、目的の楽曲に関するデータを利用者に対して配信できるようにする。
【解決手段】音声通話部101が、電話による音声通話を着信して応答し、音声変換部103が、応答して受話した音声による楽曲のメロディーを符号化して変換データとし、検索部104が、この変換データにマッチするメロディーデータを備えた楽曲情報をデータベース内より取り出し、送信部105が、取り出した楽曲情報を、応答した音声通話の送話元の電話番号に対応するメールアドレスに送信する。 (もっと読む)


【課題】 多数の人の記憶に残りやすい言葉を用いた検索によって、ユーザーが目的とする情報やサービスを簡単かつ確実に提供できるようにする。
【解決手段】 ユーザは、携帯電話により音声処理サーバ2に連絡して、あらかじめ公表された合言葉を発話する。音声処理サーバ2には、正しい合言葉が広告IDに対応づけて登録されており、発話された合言葉が正しいと判断されると、前記合言葉に対応する広告IDと発信者の電話番号とが情報配信サーバ3に送信される。情報配信サーバ3には、広告IDのリソースや各ユーザーのメールアドレスが登録されており、情報配信サーバ3は、広告管理用サーバ4より前記広告IDに対応する広告メール情報を取り込むとともに、前記発信者の電話番号から情報配信先のメールアドレスを特定し、前記広告メール情報の配信処理を行う。 (もっと読む)


【課題】 現在発言中のユーザの映像を強調表示することができるが、テレビ会議の参加者に次発言者(次に発言をする者)を認識させることができず、テレビ会議の進行の円滑化を図ることができないなどの課題があった。
【解決手段】 各回線から送信された音声情報から特定の語句を検出して次発言者を予測し、映像合成・表示切替部29に対して次発言者の映像の強調表示を指示する。 (もっと読む)


【課題】 より高い精度、より短い所用計算時間のパターン認識を実現する。
【解決手段】 単語シンボル及び単語シンボル連鎖親密度記憶部19には、多数の人間が各単語シンボル等にどの程度なじみがあるかを現した指標である親密度が記憶されている。親密度単語シンボル列スコア計算部18は、これらの単語シンボル等への親密度を元に親密度単語シンボル列スコアφ(W)を計算する。単語シンボル列スコア計算部15は、頻度単語シンボル列スコアf(W)と親密度単語シンボル列スコアφ(W)とを元に単語シンボル列スコアΦ(f(W)、φ(W))を計算する。最大総合スコア単語シンボル列探索部11は、音声スペクトルパターン列スコアg(X,W)と、単語シンボル列スコアΦ(f(W),φ(W))とから計算される総合スコアh(Φ(f(W),φ(W)),g(X,W))が最大となる単語シンボル列Wを探索し音声認識結果として出力する。 (もっと読む)



【課題】 音声認識性能の低下防止。
【解決手段】 音声入力モニター部8で入力信号の一部が音声認識に不適当か否か検出し、不適当であれば、音声モデル尤度計算部4では当該区間における音響モデルの出力確率を、本来の確率値bから、{b}a (但し0≦a<1)、例えば1(a=0のとき)に切り換えて音声モデル尤度を計算する。 (もっと読む)



発話音声の歪みのパラメトリックモデルに基づいてノイズ低減における不確実性を判定する方法および装置が提供される。この方法を使用して、まず、雑音のある信号内のノイズを低減する。特に、音響環境モデル(418)を使用することによって、雑音のある信号の一部の表現からノイズが低減され(304)て、浄化された信号の表現が生成される。次いでノイズ低減プロセスに関連する不確実性が算出される。一実施形態では、ノイズ低減信号とともにノイズ低減プロセスの不確実性を使用して、パターン状態がデコードされる(306)。 (もっと読む)


831 - 838 / 838