説明

国際特許分類[G10L15/24]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音響以外の特徴を用いる音声認識,例.唇の位置 (190)

国際特許分類[G10L15/24]に分類される特許

1 - 10 / 190


【課題】音声制御方法及びモーション制御方法を用いて電子装置のタスクを行うための電子装置の制御方法及びそれを適用した電子装置を提供する。
【解決手段】電子装置の制御方法は、音声認識モジュール及びモーション認識もジュールのいずれか一つを通じてユーザ音声及びユーザモーションのいずれか一つを認識し、音声認識モジュールを通じてユーザ音声が認識されると、遠隔制御装置によって制御可能なタスクの中で、認識されたユーザ音声に対応する音声タスクを行い、モーション認識モジュールを通じてユーザモーションが認識されると、遠隔制御装置で制御可能なタスクの中で、認識されたユーザモーションに対応するモーションタスクを行い、音声タスク及びモーションタスクは、遠隔制御装置に備えられたボタン毎に区分されてマッピングされる。ユーザは音声認識及びモーション認識を通じて電子装置をより効率的かつ直観的に制御することができる。 (もっと読む)


【課題】音声入力ワープロにおいて、音声認識エンジンが音声認識困難な単語、文章の入力を可能とする。
また、音声のみによる音声ワープロを可能にする。
【解決手段】(1)あらかじめ、音声認識が容易な単語、文章と音声認識困難な単語、文章は、対で登録しておく。
(2)音声入力者は、音声認識困難な単語、文章のかわりに、よく使用される音声認識が容易な単語、文章を連想文言として発声する。
(3)音声認識エンジンは、音声認識が容易な単語、文章のため、認識結果群を返却し、それらが音声認識が容易な単語、文章と一致する確率が高くなる。
(4)ひとつでも一致した場合、音声認識困難な単語、文章を表示させ、選択候補とする。これにより、音声認識エンジンでは、認識困難な語彙の入力が可能になる。
(5)選択候補のキー(番号など)を音声により、発声し、その認識結果が選択候補のキーと一致した場合、選択確定とする。
これにより、音声の発声のみによる音声ワープロが可能となる。 (もっと読む)


【課題】 リストの手動操作と音声操作とを融合し、ユーザにとって利便性の高い音声認識装置を提供する。
【解決手段】 入力される音声の信号レベルに基づき音声区間であることを判断し(S120〜S140)、当該音声区間に対応する音声データが記憶して(S150)音声を認識する(S170)。そして、認識結果と共に当該認識結果に対応するリスト表示を行う(S180)。このとき、確定操作が行われないうちは(S190:NO)、音声の抽出を繰り返すようにすると共に、リスト表示される対応項目の手動操作を可能にする(S110)。 (もっと読む)


【課題】文字ボタン(キー)による文字入力を主とする文字入力方式における小文字変換、符号や長音の付加に要するボタン(キー)操作量の低減。
【解決手段】携帯電話端末は、文字ボタンの押下と併せて、第1種の音声入力が行われた場合に、前記文字ボタンの押下による入力文字候補を小文字に変換する小文字入力補助手段と、文字ボタンの押下と併せて、第2種の音声入力が行われた場合に、前記文字ボタンの押下による入力文字候補に濁点を付し濁音に変換する濁音入力補助手段と、文字ボタンの押下と併せて、第3種の音声入力が行われた場合に、前記文字ボタンの押下による入力文字候補に半濁点を付し半濁音に変換する半濁音入力補助手段と、文字ボタンの押下と併せて、第4種の音声入力が行われた場合に、前記文字ボタンの押下による入力文字候補に長音を付加する長音入力補助手段と、を備える。 (もっと読む)


【課題】 精度良く音を検出する音検出装置及びその制御方法、プログラムを提供する。
【解決手段】 音を検出するための閾値を用いて、音入力部から入力した音から特定の音を検出する。撮像部が撮像した画像を記録する。記録した画像と撮像部が撮像した現在の画像との差分をとり、現在の画像から、動体のある箇所を検出する。撮像部が撮像する画像中の特定位置を示す情報とその特定位置で起こり得る音を示す情報との対応を管理する。動体が検出された場合には、位置・音対応情報管理部で管理される音を検出するための閾値を変更し、その変更した閾値を用いて、該位置・音対応情報管理部で管理される対応を参照して、音入力部から入力した音から特定の音を検出する。 (もっと読む)


【課題】過応答を低減しつつ、音声認識の認識率を高める、ことを目的とする。
【解決手段】音声認識装置40は、被写体を撮像すると共に被写体を示す画像情報をカメラ30によって取得し、該カメラ30による撮像が行われているときに発生している音を示す音情報をマイク32によって取得する。そして、音声認識装置40は、カメラ30によって取得された画像情報に基づいて、人が発話している発話区間を検出し、検出した発話区間において、発話区間が検出されない場合に比べて、音情報に基づいた人の音声認識の感度を上げる。 (もっと読む)


【課題】本装置を含む機器本体の動き又は状態の少なくとも一方を検出して、容易にかつ確実に動作モード切替えを行える音声認識装置を提供する。
【解決手段】実施形態によれば、音声入力部11と、加速度センサを備え、機器本体の動き又は状態もしくはその両方を検出する状態検出部12と、予め定めた機器本体の動き又は状態の動き・状態パターンモデルとそのモデルに対応する予め定めた複数の音声認識処理パターンとを記憶する保持部13と、状態検出部からの機器本体の動きまたは状態もしくはその両方と、保持部13に記憶された動き・状態パターンモデルとがマッチングするか否かを検出し、そのマッチングしたモデルに対応した音声認識処理パターンを検出するパターン検出部14と、検出された音声認識処理パターンに従い、音声入力部からのデジタル信号に対して音声認識処理を実行する音声認識処理実行部15と、を具備する。 (もっと読む)


【課題】写っている人物の体調/気分をわかりやすく撮影すること。
【解決手段】デジタルカメラは、被写体を撮像して画像データを生成する撮像手段13と、被写体画像データに基づいて人物の顔の表情を検出する表情検出手段17と、撮影開始前に撮像手段13で生成された画像データを用いて表情検出手段17が検出した表情に基づいて人物の体調/気分を判定する体調/気分判定手段17と、体調/気分判定手段17による判定結果に基づいて所定の撮影開始条件を選択する撮影開始条件選択手段17と、選択された撮影開始条件を満たす場合に撮影を開始させる撮影制御手段17と、を備える。 (もっと読む)


【課題】生体信号を用いた発話支援装置において、生体信号の検出精度が低いという課題がある。
【解決手段】被支援者Aは、生体信号センサ部1を装着している。生体信号センサ部1は、被支援者Aの生体信号を検出し、検出後生体信号を、波形整形部2に出力する。波形整形部2は、検出後生体信号に対して、雑音除去、干渉除去、波形整形処理を行った解析信号を語候補検出部3に出力する。取得部5は、生体信号センサ1と波形整形部2で構成される。複数語型語検出部は、解析信号に対して、各語ごとの特徴情報を用いるだけでなく、複数語にまたがる特徴情報を用いる事によって、高精度に語列を検出し、検出後語列を出力部4に出力する。出力部は、スピーカー、もしくは表示部、もしくはネットワーク接続器(例えば、コンピューター)、もしくは無線送信器などの出力装置であり、検出後語列を出力する。 (もっと読む)


【課題】対話時の発話から特定の発話を抽出する発話抽出プログラム、発話抽出方法、発話抽出装置を提供する。
【解決手段】第1の話者および第2の話者の発話区間を抽出して、日時または経過時間に関連付けて記録させる処理と、特徴操作記憶部を参照して、対話中に機器を第1の話者が操作した機器の状態を、日時または経過時間に関連付けて記録した操作情報から、特徴操作テーブルに合致する操作情報を抽出し、抽出した操作情報の発生した日時または経過時間を示す特徴操作時刻情報を取得させる処理と、発話抽出条件を参照して、発話抽出条件に合致する区間を、第1の話者および第2の話者の抽出した発話区間と抽出した特徴操作時刻情報を用いて抽出し、抽出した合致する区間から発話抽出条件に関連付けられている時間範囲に存在する第1の話者の発話区間に対応する発話を抽出させる処理と、をコンピュータに実行させる発話抽出プログラム。 (もっと読む)


1 - 10 / 190