説明

国際特許分類[G10L15/22]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識処理中の手順,例.マン・マシン対話 (884)

国際特許分類[G10L15/22]に分類される特許

61 - 70 / 884


【課題】入力される音声を逐次テキスト化して表示する際、利用者にとって読みやすく理解しやすい字幕を生成できるテキスト表示時間決定装置、テキスト表示システム、テキスト表示時間決定方法、およびテキスト表示時間決定プログラムを提供する。
【解決手段】テキスト表示装置は、認識結果作成手段81と、表示時間決定手段82とを備えている。認識結果作成手段81は、入力される音声を逐次認識してテキスト化した認識結果を作成する。表示時間決定手段82は、音声の発話時間に基づいて、認識結果に含まれる文章ごとに表示時間を決定する。 (もっと読む)


【課題】対話システムで、コミュニケーションギャップをリアルタイムに解決し、持続的かつ自然なコミュニケーションを行う。
【解決手段】インタラクション状態量算出部12は、ユーザPの発話における話者交替潜時、発話区間のピッチ、パワーまたはモーラを含むインタラクション状態量を検出する。コミュニケーション同調制御部13は、ユーザPとロボットシステム10とのコミュニケーション同調ずれ量を算出し、同調モデルを表す状態方程式による連続的な引き込み制御によりコミュニケーション同調ずれ量を最小化すると同時に、インタラクションルールによる離散的な引き込み制御により、ユーザPのインタラクション状態量をロボットシステム10のそれに近づけていく、または、ロボットシステム10のインタラクション状態量をユーザPのインタラクション状態量に近づけつつユーザPのインタラクション状態量をロボットシステム10のそれに近づけていく。 (もっと読む)


【課題】操作者が器具を咥えながら喋った単語を正しい単語に変換して送信する通信装置を提供する。
【解決手段】通信装置の補償回路7において、単語変換部72は、A/D変換器6から受けたデジタル信号に基づいて単語を認識し、その認識した単語を判定部73へ出力する。また、単語変換部72は、単語が誤っていることを示す信号ICORを判定部73から受けると、内蔵している電子辞書721を用いて正しい単語の候補単語を抽出して判定部73へ出力する。判定部73は、単語変換部72から受けた単語をスピーカ2を介して潜水者に提示し、その提示した単語が正しい単語であることを示す信号CORを操作ボタン11から受けると、単語変換部72から受けた単語を正しいと判定してモデム8へ出力する。一方、判定部73は、信号CORを受けないとき、信号ICORを単語変換部72へ出力する。 (もっと読む)


【課題】周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供すること。
【解決手段】実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。 (もっと読む)


【課題】本発明は、通話内容を把握することが容易な通信機器及び表示システムを提供する。
【解決手段】通信機器は、表示部21と、音声が入力され、入力された音声を音声データに変換して出力するマイク12と、外部通信機器との間での通話に利用され、その外部通信機器から音声データが入力される通信部32と、特定の単語に対応する登録単語データを記憶する記憶部33と、マイク12から出力された音声データと通信部32に入力された音声データとの少なくとも一方と、記憶部33に記憶された登録単語データとに基づいて、各音声データに基づく音声の中に含まれる特定の単語を抽出する抽出部41と、抽出部41によって抽出された特定の単語或いは当該特定の単語を含む文節又は文を表示部21に表示させる表示制御部42と、を備える。 (もっと読む)


【課題】
正確な情報であるシステム応答文中の自立語と認識結果中の自立語を用いて共起を生成することで、システム応答文の生成に利用される共起の信頼度を向上させることである。
【解決手段】
実施形態の音声対話装置は、第1のシステム応答文に対するユーザの発声を認識する音声認識手段と、前記音声認識手段で得られた認識結果を形態素解析する形態素解析手段と、前記形態素解析手段で得られた前記認識結果中の自立語と前記第1のシステム応答文中の自立語の共起を生成する共起生成手段と、自立語の共起および当該共起の共起スコアを記憶した共起辞書と、前記共起辞書を用いて、前記共起生成手段で生成された共起に共起スコアを付与する共起スコア付与手段と、前記共起スコア付与手段で付与された共起スコアを利用して、第2のシステム応答文を生成する応答文生成手段とを備える。 (もっと読む)


【課題】セキュリティが考慮された、使い勝手の良い情報処理装置を提供する。
【解決手段】画像を入力する第1入力装置(52)と、位置情報と時刻情報との少なくとも一方の情報を入力する第2入力装置(52)と、前記画像の出力指示があったときに、前記第2入力装置(52)が入力した情報に基づいて前記画像の出力に制限を加えるか否かを判断する判断装置(70)と、を備える情報処理装置(50)である。 (もっと読む)


【課題】音声認識のための音声が入力された時点での雑音等の環境音や、該入力音声の音量、音声信号の途絶等の特徴を好適に利用する。
【解決手段】音声信号処理システムは、音声信号を入力する音声入力手段101と、音声入力手段101を介して入力された音声信号である入力音声信号を格納する入力音声格納手段102と、入力音声格納手段102に格納された入力音声信号を参照し、入力音声信号に含まれる環境音を含む該入力音声信号によって示される入力音声の特徴を推定する特徴推定手段103と、参照音声となる所定の音声信号を発生させる参照音声発生手段104と、特徴推定手段103によって推定された入力音声の特徴を、参照音声発生手段104が発生させた音声信号である参照音声信号に反映する特徴反映手段105とを備えたことを特徴とする。 (もっと読む)


【課題】音声をテキストに変換する装置及び方法を提供することを目的とする。
【解決手段】音声受信モジュール、音声識別モジュール、表示モジュール、格納モジュール、話者識別モジュール及び制御モジュールを備え、格納モジュールは異なる音声データに対応するテキストデータ及び異なる音声信号に対応する話者データを格納し、音声受信モジュールは、外部の音声信号を受け取り、音声識別モジュールは、前記音声信号を音声データに変換してから、格納モジュールから前記音声データに対応するテキストデータを探して制御モジュールに送信し、話者識別モジュールは、格納モジュールから前記音声信号に対応する話者データを探して制御モジュールに送信し、制御モジュールは、前記テキストデータ及び前記話者データを表示モジュールに表示させる。 (もっと読む)


【課題】音声をテキストに変換する装置及び方法を提供することを目的とする。
【解決手段】本発明の音声をテキストに変換する装置は、音声受信モジュール、音声識別モジュール、表示モジュール、入力モジュール及び制御モジュールを備え、前記音声受信モジュールは、外部の音声信号を受け取って前記音声識別モジュールに送信し、前記音声識別モジュールは、異なる所定の時間範囲における各々の所定の時間範囲内の音声信号をテキストデータに変換してから前記制御モジュールに送信し、前記入力モジュールは、ユーザーが入力した文字データを前記制御モジュールに送信し、前記制御モジュールは、同じ所定の時間範囲内のユーザーが入力した文字、音声から変換されたテキスト及び同じ前記所定の時間範囲を前記表示モジュールに表示させる。 (もっと読む)


61 - 70 / 884