説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

1,021 - 1,030 / 1,893


【課題】ユーザにとって使い勝手のよい音声認識処理を行う。
【解決手段】ユーザへの問い掛けに応じて、音声信号取得手段から非言語が入力された場合には、この非言語が入力された際の状況に応じて、非言語の入力の有効性を判断し、有効性の判断結果に応じて、作業内容の確認、作業内容の保留、および、作業内容の実行のいずれかを判断する。 (もっと読む)


【課題】文章情報が示す内容を臨場感あふれる態様でユーザに提示する電子文書を簡単に作る。
【解決手段】サーバ装置は、ユーザに対して端末装置により提示させる複数の提示情報を、夫々関連する言葉に対応付けて記憶する提示情報記憶手段を備え、前記端末装置は、文章情報を記憶する文章情報記憶手段と、前記提示情報を、ネットワークを介して前記サーバ装置から取得する提示情報取得手段と、前記記憶された文章情報と、前記取得された提示情報と、に基づいて、電子文書を生成する生成手段と、前記生成された電子文書に基づいて、前記文章情報と、前記提示情報と、を前記ユーザに提示する提示手段と、を備え、前記端末装置の前記生成手段は、前記提示手段により前記文章情報を提示する際に、当該文章情報に含まれる文字情報の提示状況に適応して当該文字情報が示す言葉に関連する前記提示情報を前記提示手段により提示させる制御情報を含む電子文書を生成する。 (もっと読む)


【課題】従来からの、入力された音声データを文字に変換する技術については、音声データからテキストデータへ変換されたデータと、元からテキスト形態にて入力されたデータとが混在する状態では、元のデータが何であったかを出力されたデータから区別することは困難であった。
【解決手段】本発明は、データの表現形態を他の表現形態に変換可能であり、変換された、又は変換されなかったデータを、その旨や、表示形態を示す識別情報に関連付けて出力する情報処理装置を提案するものである。このとき、所定表現形態で取得されたデータを、その表現形態で出力することが適切な出力環境か判断するための条件と、出力環境情報とを比較することもできる。 (もっと読む)


【課題】音声認識率を向上させることができるロボット装置及びその動作制御方法を提供すること。
【解決手段】ロボット装置は、優先度が設定された音声入出力経路A1〜A4と、優先度に基づき音声入出力経路A1〜A4を切替選択する音声信号切替器11と、入力された音声を認識する音声認識モジュール12と、音声認識結果に基づき発話動作する音声発話モジュール13とを有する。音声認識モジュール12は、音声入出力経路からの音声のA/N比が所定の閾値以上であるか否かを判定するS/N比判定手段と、音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定手段を有し、音声信号切替器11は、音声入出力経路A1〜A4のうち、可変の優先度を有する音声入出力経路A2〜A4の優先度を、S/N比判定手段及び認識率判定手段の判定結果に基づき更新する優先度更新手段を有する。 (もっと読む)


【課題】好適な車両周囲における音声指令を処理する方法およびシステムを提供すること。
【解決手段】車両周囲における音声指令を処理する方法であって、該方法は、該車両周囲における音響信号を検出することと、該車両の外側の車両ユーザの位置に関する該位置情報を抽出することと、該検出された音響信号における該車両ユーザから発せられる該音声指令を識別することとを包含するという点を特徴とし、該音響信号の該検出および/または該音声指令の該識別は、該位置情報を考慮に入れて達成される、方法であって、上記方法は、前記車両ユーザの前記位置を検出し、該位置情報を生成することを包含する。 (もっと読む)


【課題】回線および端末の負荷を軽減させ、音声による表現を保ち、通話内容を欠如なく相手に伝達可能な通話端末装置の提供。
【解決手段】音声入力部102から入力された通話入力を認識し、通話入力を通話内容データに変換する通話内容認識部111と、通話内容認識部111によって変換された通話内容データを基に通話入力に関連する通話内容補助データを生成する通話内容補助データ生成部113と、通話品質レベルが予め設定された基準レベル以下かどうかを判断する通話品質判断部110と、通話品質判断部110において通話品質レベルが予め設定された基準レベル以下になったと判断されたとき、生成された通話内容補助データを通話中の相手に送信する送信部108とを備え、回線や端末の負荷を軽減し、音声による表現や臨場感を保ち、通話内容情報の欠如を防ぐことができる。 (もっと読む)


【課題】ゲームに対する思考を中断することなく、情報取得を行うことができるようにする。
【解決手段】本ゲームプログラムでは、サーバから受信したリアルタイム情報が、テキストデータとして制御部1に認識される。そして、テキストデータにおける用語データDに対応する部分のデータが、テキスト内用語データとして制御部1に認識される。そして、テキスト内用語データに対応する音声データVが制御部1に認識される。そして、制御部1に認識された音声データVを音声出力部4に供給する命令が制御部1から発行され、制御部1に認識された音声データVを音声信号に変換する処理が音声出力部4において実行される。そして、音声信号が音声出力部4から音声として出力される。 (もっと読む)


【課題】簡易な構成により発話訓練者が発した音声の正否などを直感的に知覚させることができる発話訓練装置を提供する。
【解決手段】発話訓練データ18を記憶する記憶手段17と、前記発話訓練データから訓練課題となる文字列を読み出し、該文字列を表示する表示手段13と、表示された前記文字列に従って発話訓練者が発する音声を入力する音声入力手段14と、入力された音声を認識し、認識結果を生成する音声認識手段15と、前記文字列と前記認識結果との正否を比較判定する比較判定手段11と、比較判定の結果を所定の態様で色を変化させて出力する出力手段16とを備えた構成としている。 (もっと読む)


【課題】従来の発音評定装置においては、精度高く発音評定ができなかった、という課題があった。
【解決手段】受け付けた音声を、フレームに区分するフレーム区分部と、区分された各フレームの特徴ベクトルを取得する特徴ベクトル系列取得部と、特徴ベクトル系列と母語音素HMMを用いて第一の最適状態番号系列を取得する第一最適状態番号系列取得部と、特徴ベクトル系列と連結HMMを用いて第二の最適状態番号系列を取得する第二最適状態番号系列取得部と、特徴ベクトル系列、母語音素HMM、第一の最適状態番号系列、および第二の最適状態番号系列を用いて、フレームごとに最適状態に対する確率を算出し、フレームごとに発音の良し悪しを示すスコアを算出するフレーム状態最適パススコア算出部と、スコアを出力する出力部を具備する発音評定装置により、精度高く発音評定ができる。 (もっと読む)


【課題】走行中に同乗者が快適な会話環境を共有できる車内会話支援システムを提供する。
【解決手段】本発明による車内会話支援システムは話者が他の話者が発した生音とスピーカからの拡声音を聴取する車内環境での車内会話を支援するシステムである。車内に配置される複数の個別マイクまたは共通マイクと、車内に配置される共通スピーカまたは複数の個別スピーカと、ハウリング防止用のフィルタ部と先行音効果用の遅延部からなる補正部および調整部を含み、前記個別マイクまたは共通マイクの出力を補正部により補正し、前記調整部で増幅して前記共通スピーカまたは個別スピーカに接続する音響処理部と、から構成されている。 (もっと読む)


1,021 - 1,030 / 1,893