説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

111 - 119 / 119


【課題】 画像形成装置を利用するユーザがより短時間で音声ガイドによる情報提供を受けられることを可能にする。
【解決手段】 複数の音声応答方法、音声応答方法を設定できる手段及び設定を変更できる手段を備える。 (もっと読む)


【課題】 発話者の要求が特定できないときは、発話者の要求を推定して処理を続行すること。
【解決手段】 発話者によって入力された音声信号からキーワードを抽出し(ステップS50)、抽出したキーワードから発話者の要求を特定する(ステップS60)。このとき、発話者の要求を特定できない場合には、抽出したキーワードに基づいて発話者の要求を推定する(ステップS80)。その後、推定した発話者の要求を一意に特定するために必要な発話者の応答が得られるように、ガイダンス音声を生成して出力し(ステップS90)、当該ガイダンスに対する発話者の応答内容に基づいて、推定した発話者の要求を一意に特定する(ステップS60)。 (もっと読む)


【課題】 音響信号を客観的に、かつ、時間変化とともに分析できるシステムを提供する。
【解決手段】 曲調と情動あるいは感情との対応テーブルANLTBLを設ける。音響信号を所定の期間ごとに区切るとともに、その区切られた期間ごとに、この区切られた期間における音響信号の示す曲調を分析する。この分析により得られた曲調により対応テーブルANLTBLを参照して区切られた期間における音響信号を、この音響信号が引き起こす情動あるいは感情の情報に変換する。 (もっと読む)


【目的】 自動的に所望のテレビ画像をキャプチャーして表示する「テレビ画像自動キャプチャー方法及び装置」を提供することである。
【構成】 キャプチャーすべきテレビ画像に応じたキーワードを設定し、テレビ音声に該キーワードが含まれているか判別し、キーワードが含まれている場合にはテレビ音声に応じたテレビ画像をキャプチャーして表示する。 (もっと読む)


【課題】ライブ・スピーチの聞き手が、スピーチの間に発音された語句に関連する補足情報に、スピーチの直後に、またはその後でアクセスできるようにするためのシステム、方法、およびコンピュータ・プログラムを提供すること。
【解決手段】システムは、ハイパーリンク(すなわち、URL)と、スピーチの途中で話し手側によって発音される可能性が高い、選択された語句または単語とを結びつける。話し手側装置(すなわち、マイクロホンが接続されたコンピュータ・システム)で動作する音声認識システムは、スピーチの間に、そのハイパーリンクされた語句のいずれかが話し手側によって発音されたことを認識し(ワード・スポッティングし)、認識されたハイパーリンクされた語句が発音された時刻を記録する。また、システムは、同一のユニバーサル・タイムによる話し手側装置と何台かの聞き手側装置(例えば、ワークステーション、ポータブル・コンピュータ、PDA−パーソナル・デジタル・アシスタント、スマート・フォン、または他の任意の種類のハンドヘルド・コンピュータ装置など)との同期に基づくシステムであり、したがって、話し手によって送信され、聞き手によって受信される情報の流れは、話し手側と聞き手の相対的な位置関係とは無関係に常に同期している。聞き手は、スピーチの間に興味のあるトピックに気づくたびに、単に聞き手側装置の予約キーを押すことによって即時にトピックを選択する。聞き手がトピックを選択したときのユニバーサル・タイムは、聞き手側装置に格納される。
(もっと読む)


音声認識機の認識結果を改善するための方法では、認識結果を確定するための補助情報を使用する。ユーザーは音声を、離れた場所にある携帯機器あるいはサーバー上の音声認識機へ入力する。この音声認識機は、入力音声に基づいて認識結果を決定する。確度指標は、認識結果に対して計算される。もし確度指標が閾値よりも小さければ、ユーザーは、補助データを求められる。補助データは、入力音声と認識結果との間の不明確性に基づいて動的に決定され、補助データは、潜在的な不正確な結果に対して入力音声を区別する。補助データは、入力音声あるいは望む結果に関連する他のデータベースを備える、地域コードや位置のような英数字のサブセットで良い。ユーザーは、補助データを、口頭であるいは、キーパッドや接触型パッドや接触型画面やスタイラスペンを用いて手動で与えることができる。
(もっと読む)


ウェイクアップ・コマンドを受信した場合に、環境が、ノイズが非常に大きくて、ユーザが発声した音声の信頼性の高い認識を行うことができないと判定するステップと、ユーザに環境が非常にノイズが多いことを通知するステップと、を含むノイズの多い環境内で音声を処理するための方法。環境が、非常にノイズが多いと判定するステップは、信号対雑音比を計算するステップを含む。信号は発声した音声のエネルギーの量に対応し、ノイズは背景ノイズのエネルギーの量に対応する。この方法は、さらに前記信号対雑音比をしきい値と比較するステップを含む。
(もっと読む)


【課題】 多数の人の記憶に残りやすい言葉を用いた検索によって、ユーザーが目的とする情報やサービスを簡単かつ確実に提供できるようにする。
【解決手段】 ユーザは、携帯電話により音声処理サーバ2に連絡して、あらかじめ公表された合言葉を発話する。音声処理サーバ2には、正しい合言葉が広告IDに対応づけて登録されており、発話された合言葉が正しいと判断されると、前記合言葉に対応する広告IDと発信者の電話番号とが情報配信サーバ3に送信される。情報配信サーバ3には、広告IDのリソースや各ユーザーのメールアドレスが登録されており、情報配信サーバ3は、広告管理用サーバ4より前記広告IDに対応する広告メール情報を取り込むとともに、前記発信者の電話番号から情報配信先のメールアドレスを特定し、前記広告メール情報の配信処理を行う。 (もっと読む)


【課題】 現在発言中のユーザの映像を強調表示することができるが、テレビ会議の参加者に次発言者(次に発言をする者)を認識させることができず、テレビ会議の進行の円滑化を図ることができないなどの課題があった。
【解決手段】 各回線から送信された音声情報から特定の語句を検出して次発言者を予測し、映像合成・表示切替部29に対して次発言者の映像の強調表示を指示する。 (もっと読む)


111 - 119 / 119