説明

国際特許分類[G10L15/28]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識システムの構造上の細部 (875)

国際特許分類[G10L15/28]に分類される特許

1 - 10 / 875


【課題】話者に対して音声認識の可能な期間を正確に明示できる音声処理装置を提供する。
【解決手段】入力された話者の音声を用いる音声処理装置が、中央制御部と、前記中央制御部により制御される音声認識部と、表示部と、前記音声認識部で用いられる選択肢情報と、を含み、前記選択肢情報は、選択肢データと、前記選択肢データに対応した表示タイミングデータと、を有し、前記表示タイミングデータは、前記表示部に対する所定の制御に用いられ、前記所定の制御は、前記音声認識部における音声認識処理の実行が可能である期間を前記話者に明示する制御であることを特徴とする。 (もっと読む)


【課題】音声合成処理の終了から音声認識処理の開始までの間に適切な時間間隔を設ける処理に対するホスト装置の負荷を低減する。
【解決手段】半導体集積回路が、音声認識部と、外部から入力された制御コマンドを記憶する第1の記憶部と、前記制御コマンドの内容の解釈を行い、前記解釈の結果に基づいて前記音声認識部の制御を行う第1の制御部と、を含み、前記音声認識部は、前記第1の制御部からの動作開始の指示の後、所定の時間の経過後に音声認識の処理を開始することを特徴とする。 (もっと読む)


【課題】1つの自然文によって複数のコマンドを実行可能とした音声制御システムにおいて、従来よりも幅広い表現の自然文を受け入れることを可能とし、ユーザの利便性を向上する。
【解決手段】自然文から抽出される言葉と制御コマンドとを直接結びつけるコマンド変換辞書を記憶手段104に備えると共に、制御コマンドに直接結びつかない言葉を制御コマンド生成用のパラメータに変換するための変換補助情報を記憶手段106に記憶する。また、制御コマンドに直接結びつかない言葉については変換補助情報を参照して制御コマンド生成用のパラメータに変換し、制御コマンドを生成するコマンド変換手段103を備える。 (もっと読む)


【課題】広範なソーシャル・コミュニケーションを喚起する。
【解決手段】インターネットに接続可能なネットワーク端末に接続され、ユーザの頭部に装着可能なヘッドセットシステムから得られるユーザの主観的な視野等を反映した画像、及び音声信号を、ネットワーク端末経由で知識情報処理サーバシステムにアップロードし、画像に内包されているユーザが着目した特定物体等に対し、音声認識システムとの協調動作により、ユーザ自身の音声による着目対象の指定、選択等を、サーバシステム上で可能にし、ユーザによる一連の画像認識プロセス及び画像認識結果を、音声合成システムとの協調動作により、サーバシステム側がインターネットを介し、ユーザのネットワーク端末経由で、画像認識結果及びその認識プロセスをユーザのヘッドセットシステムに組込まれたイヤフォンに対し音声情報として通知し、ユーザのメッセージやつぶやきを広範なユーザ間で共有可能にする。 (もっと読む)


【課題】音声入力時の指向方向を適切に設定して通話音声の品質を向上しつつ、音声を切り替えるときに不具合を招くおそれを低減する車両用装置を提供する。
【解決手段】車両用装置としての車載機10は、第一指向方向から入力された音声を第一音声として抽出する第一音声抽出部18と第二指向方向から入力された音声を第二音声として抽出する第二音声抽出部19とにおいて抽出された音声を音質比較部21にて比較し、その比較結果に基づいて、切替部22において第一音声および第二音声のうち音質が高い一方を送話音声として選択する。このとき、車載機10の制御部11は、切替部22による第一音声および第二音声の切り替えを、予め定められている判定条件が成立したときに許可する制御を行う。 (もっと読む)


【課題】使用環境に適した開始トリガを選択する音声認識装置を実現することである。
【解決手段】本実施形態の音声認識装置は、複数のトリガ検出手段とトリガ選択手段と認
識手段とを備える。トリガ検出手段は、機器を操作するためのコマンド発声の認識開始を
指示する開始トリガを検出する。トリガ選択手段は、前記機器に設置された1又は複数の
センサからの信号に基づいて、前記複数のトリガ検出手段から前記機器の使用環境に適し
たトリガ検出手段を選択する。認識手段は、前記トリガ選択手段で動作を有効にされた前
記トリガ検出手段が、前記開始トリガを検出した場合、前記コマンド発声の認識処理を開
始する。 (もっと読む)


【目的】
本発明は、音声認識装置において、電源制御機構にリセット信号処理を追加することにより、無駄な電源投入を避け、簡単に、かつ大幅に電源の消費電力の低減を図ることを目的とする。
【構成】
本発明は、音声認識装置において、マイコンにリセット信号出力機構を設け、リセット信号が入力されると一定時間内であっても信号の保持を停止するリセット入力機構を延長回路に設け、
音声認識装置の動作、行動、制御完了後にマイコンからリセット信号を出力し、
リセット信号を入力された延長回路が一定時間待つことなくすぐに音声信号制御回路の電源を遮断することで、無駄な電源投入を避け、簡単に、かつ大幅に電源の消費電力の低減を図る電源制御機構を特長とする。 (もっと読む)


【課題】音声取得手段にて音声を取得し、取得した音声の非言語情報に基づいて話者を識別する。
【解決手段】端末装置は、使用者の口からの距離が相異なる位置となるように使用者に装着される第1マイクロフォン11および第2マイクロフォン12と、第1マイクロフォン11により取得された音声の音声信号と第2マイクロフォン12により取得された音声の音声信号との比較結果に基づき、第1マイクロフォン11および第2マイクロフォン12により取得された音声が第1マイクロフォン11および第2マイクロフォン12を装着した使用者の発話音声か、使用者以外の他者の発話音声かを識別する音声解析部と、を備える。ホスト装置は、複数の端末装置から発話者の識別結果を含む発話情報を取得して解析し、発話者間のコミュニケーションの傾向を表す情報を出力する。 (もっと読む)


【課題】音声情報に基づいて音声認識部を自動的に切り替えることができる音声認識方法および音声認識装置を提供する。
【解決手段】ユーザによりマイクから入力される音声の音声区間を検出して当該区間のパワーを計算する音声パワー検出部と、前記区間のパワーをユーザとマイク間の距離に変換するユーザ-マイク間距離算出部と、この距離に基づいて前記音声による音声信号の出力先として複数の音声認識部を選択する音声認識辞書切替部とを備えた音声認識装置。 (もっと読む)


【課題】音声取得手段にて音声を取得し、取得した音声の非言語情報に基づいて話者の心理状態を推定する。
【解決手段】使用者に装着される端末装置と、端末装置から情報を取得するホスト装置とを備える。端末装置は、マイクロフォンにより取得された音声を解析して発話者を識別すると共に、非言語情報である音声特徴量に基づいて発話者の精神活性度を推定し、推定結果を含む発話情報をホスト装置に送信する。ホスト装置は、複数の端末装置から取得した発話情報の中から特定の会話に係る発話情報を抽出して解析し、各発話者の精神活性度の組み合わせに基づいて、会話に参加している各発話者の感情を推定する。 (もっと読む)


1 - 10 / 875