説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

71 - 80 / 119


【構成】 警告システム10はサーバ12を含み、サーバ12はネットワーク14を介してセンサユニット20と通信可能に接続される。センサユニット20は、これを装着する看護師の音声を収集して、サーバ12に送信する。サーバ12は、看護師が会話するときの音声を単語に分解する。分解した結果、会話に、抽象的な語、意味の曖昧な語、複数の意味を有する語が存在したり、数量または単位或いはその両方が付されるべき語にいずれも付されていなかったりした場合に、不確定要素(不明確・不明瞭な内容)が存在すると判断する。その後、そのような不確定要素についての確認がない場合には、看護師にコミュニケーションエラーの発生や不確定要素を確認すべきことの警告(アラーム)を与える。
【効果】 コミュニケーションエラーに起因する事故やミスを未然に防止することができる。 (もっと読む)


【課題】 音声認識精度を向上させる。
【解決手段】 入力した音声を予め蓄積された音響モデル、言語モデル、及び信頼度モデルにより認識して前記音声に対応する単語列を出力する音声認識装置において、前記音声を認識して正解候補の単語仮説からなる単語ネットワークを生成する音声認識手段と、前記音声認識手段により得られる単語ネットワークと、前記音響モデルと、前記言語モデルとに基づいて、前記単語ネットワーク内の各単語仮説に対して少なくとも1つの特徴量を計算する特徴量計算手段と、前記特徴量計算手段により得られる少なくとも1つの特徴量付き単語ネットワークと前記信頼度モデルとに基づいて、前記単語仮説の系列からなる文仮説の単語認識率を推定する認識率推定手段とを有することにより、上記課題を解決する。 (もっと読む)


【課題】雑音条件にかかわらず、一定の性能を示すことが可能な発話区間検出装置を提供する。
【解決手段】発話区間検出装置80は、音声データの各フレームに対し、複数種類の特徴量を算出する特徴量算出部102と、算出された複数種類の特徴量にそれぞれ所定の重み付けをして統合し、統合スコアを算出する特徴量統合部106と、統合スコアに基づいて、音声データのフレームごとに発話区間と非発話区間との識別を行なう発話区間識別部108と、各フレームに対し、発話区間と非発話区間とを示すラベルが付されたラベル付データ124を準備する基準データ記憶部126及びラベルファイル作成部122と、ラベル付データ124を学習データとし、発話区間識別部108における識別誤りを最適化するように、特徴量統合部106における複数種類の特徴量に対する重み付けを学習するための初期化制御部130及び重み更新部128とを含む。 (もっと読む)


【課題】 周期的に記録される番組ごとに、ユーザが希望する場面のインデックス画像を自動的に登録することのできる番組データ記録装置を提供すること。
【解決手段】 周期記録予約情報にしたがって番組データの記録が行なわれた場合に(ステップS12)、識別情報(エピソード番号)に基づいて、当該番組データのインデックス画像(サムネイル画像)を登録する。すなわち、識別情報と関連付けられている音声データと、番組データに含まれる音声データとの一致区間を検索し(ステップS20)、検索の結果、一致区間が存在した場合に、一致区間に含まれる画像データを、インデックス画像として決定する(ステップS24)。 (もっと読む)


【課題】 映像に所望の検索ワードが含まれることを効率的に検索する。
【解決手段】 映像データに含まれる音声を認識して複数の単語データが抽出され、抽出された複数の単語データがそれぞれメタデータと対応されて、単語データ記憶部に記憶される。ユーザから所望の検索ワードの入力が受付けられ(S121)、単語データ記憶部に記憶された複数の単語データが検索され(S122)、受付けられた所望の検索ワードが含まれるか否かが判定され(S123)、含まれると判定された場合、その旨がユーザに報知するために出力される(S126,143)。その旨として、所望の検索ワードが含まれる位置に対応する映像データの部分の静止画像がユーザに報知するために出力される(S126,143)。出力された静止画像の選択がユーザから受付けられ(S151)、選択された静止画像の所定時間前から映像データで示される映像が再生される(S152)。 (もっと読む)


【課題】 販売員の説明内容が商品の特徴等を過不足なく含んでいるか否かをチェックすることが出来る、商品の販売支援装置を得る。
【解決手段】 音声認識部3は、音声言語による商品説明を受入れて、文字言語による商品説明に変換し、キーワード格納部5は、上記商品説明に含ませるべきキーワードを予め格納し、キーワード抽出部6は、文字言語による商品説明と、上記キーワード格納部5が格納するキーワードとを照合し、一致するキーワードを抽出し、発言内容確認部8は、キーワード抽出部6が、上記商品説明に含ませるべきキーワードを抽出できないと、欠落しているキーワードを含めることを販売員に要求する。 (もっと読む)


【課題】特定の言葉を使用した場合にその使用者に報知する装置を提供することを目的とする。特に、日常何気なく使ってしまうが本来は使いたくない言葉で、いったん口癖になってしまうと無意識に用いてしまい、自発的に矯正するのはなかなか難しい言葉を報知する装置等の提供を目的とする。
【解決手段】使用者が発音した音声を入力する音声入力手段10と、前記音声入力手段10により入力された音声データを比較元音声データとして事前に記憶する比較元音声データ記憶手段42とを有し、前記音声入力手段10に入力され、前記使用者の音声データを一時的に記憶する一時データ記憶手段44と、一時的に記憶された前記音声データと前記比較元音声データ記憶手段42に記憶されている音声データとを比較する比較手段32と、前記比較手段で両データがあらかじめ設定のレベルで一致した場合は前記使用者に報知する報知手段50と、を備えた報知装置。 (もっと読む)


【課題】音声入力文字化とキーボード操作を簡易にする為に、音声単音毎に定義処理即ち演算処理する為に、ランダムアクセスメモリーを並列にし、かつスイッチ素子で並列にしたランダムアクセスメモリーに音声をアナログ/ディジタルコンバーターで数値化した、サンプルを逐次ランダムアクセスメモリーに入力し、定義処理即ち演算処理し、単音の一つのパターンと比較して音声文字化を行い、かつソフトウエアの設定やインストールのキーボード操作入力の手続手順を記憶素子から発して行い、更にハードディスク記憶装置など、ソフトウエアプログラムの壊れて作動しないものに対して、強制消去、強制読出しを行え、操作を簡易にした。
【解決手段】磁気ディスク等の磁気のアナログ効果を利用してディジタル圧縮して、情報転送装置等を用い情報を一括管理し、更に情報の読み出し即ち盗みや書込みのイタズラに対処する為の情報安全装置を設け、情報の安全性を高めた。 (もっと読む)


【課題】原稿撮像装置の表示パネルやスイッチ等の手操作から解放され、照明の明るさ等の環境に影響されることなく、円滑なプレゼンテーションを行うことが可能となる原稿撮像装置を提供する。
【解決手段】原稿読取手段で読み取った原稿の画像情報を、表示装置に出力可能とした原稿撮像装置において、前記画像情報についての読み取りや出力処理等の操作を指示する音声を、電気信号に変換し入力する音声入力手段21〜23と、前記音声入力手段に入力された操作を指示する音声信号と、予め記録されている操作を指示する信号とが一致していることを認識する信号認識手段26、27と、前記信号認識手段によって一致していることが認識された信号と対応する操作を指示する操作指示手段28と、を有する構成とする。 (もっと読む)


【課題】 治療室内で交わされる会話や指示等から、特定の言語表現等を検出し、治療行為に対応するイベントを検出可能な医療音声情報処理装置を提供することを課題とする。
【解決手段】 音声処理装置1は、医療音声情報3の記録等の処理を行う処理装置本体4と、発生した音声を音声情報5として取得するための複数のマイク6と、治療行為提示情報21を提示するための液晶ディスプレイ8及びスピーカ9とによって主に構成されている。そして、マイク6によって取得された音声情報5から、言語データベース28に記憶された治療行為に対する特徴的な言語表現25が所定の時間幅で検出され、治療行為の要部を示すイベントが検出される。これにより、連続的に実施される治療行為で発生する各種イベントをリアルタイムで検出し、イベントインデックス2に記録することができる。 (もっと読む)


71 - 80 / 119