説明

Fターム[5D015DD02]の内容

音声認識 (5,191) | 音声信号の検出 (328) | 音声検知手段の構成 (144) | マイクロホン (123)

Fターム[5D015DD02]に分類される特許

41 - 60 / 123


【課題】音声認識ロボットの音声取得部のチューニングを効率良く行う。
【解決手段】音声認識ロボット100は、音声取得部として機能するマイクロホンアレー180と、音声出力部として機能するスピーカ170と、スピーカ170が装着されるロボットアーム160と、マイクロホンアレー180に対してチューニングを行うチューニング部を備える。チューニング部は、チューニングに際し、スピーカ170に基準音声を出力させるチューニング制御部と、基準音声に対する音声取得部の応答を用いてチューニングを実行するチューニング実行部とを有する。 (もっと読む)


【課題】本発明の目的は、対雑音耐力向上のため、音響効果のみで音源方向の特定をせず、音声とセンサが収集した情報とを用いて簡易的に且つ総合的に音源の同定を行うことであり、また、音源が存在する方向の推定において、より小規模な構成で且つコストも削減できる音源方向の推定を実現することである。
【解決手段】本発明のシステムは、音源の方向を推定するにあたって、音源からの音情報を収集するマイクだけで行うのではなく、赤外線センサや超音波センサやスイッチ等によって音源の方向を特定するための情報を収集して、音源方向の同定精度を向上させることを特徴とする。 (もっと読む)


【課題】残響や背景雑音が存在し、観測される特徴量が明確にクラスタリングできず、重なり合うような場合に対しても、音源定位/音源分離性能を向上させることができる音源分離定位方法を提供する。
【解決手段】ブラインド音源分離(BSS)の問題に対し、EMアルゴリズムを適用した新しいアルゴリズムを提案する。具体的には、音源信号のスパース性に基づき、各時間周波数成分に寄与する音源は1個であるという観測モデルの下、各時間周波数成分に寄与している音源のインデックスを隠れ変数とみなし、最大尤度を与える音源方向と、各時間周波数成分への各音源の寄与率をEMアルゴリズムによって推定する。その結果、残響時間が多い場でも音源の分離定位を行うことが可能となった。 (もっと読む)


【課題】対象指示区間と対象音声区間との対応関係を明確にすることで認識失敗や誤認識を解消することを目的とする。
【解決手段】 音声が入力される音声入力部2と、音声入力部2により入力された音声のうち、音声処理の対象とする区間を指示する指示入力部4と、指示入力部4により指示入力された対象指示区間情報を通知する通知部5と、音声入力部2によって入力された音声のうち、指示入力部4により指示入力された対象指示区間の音声を音声処理の対象として抽出する音声抽出部6と、を具備したことを特徴とする音声認識装置1。 (もっと読む)


【課題】 話者の発話内容を効率的に音声認識装置によって認識する技術の分野において、騒音環境下における話者の発話内容を、環境に応じた音響モデルを用意することなく、従来の音声認識アルゴリズムによって効率的に認識することを可能とする技術を提供すること。
【解決手段】 音声認識システムであって、ユーザの耳孔内に装着され耳孔内を伝播する空気の振動を音声信号として入力する音声入力手段と、この音声信号を入力として音声認識を行う音声認識手段とを含む。 (もっと読む)


【課題】室内や車内などの反射や残響の存在する残響下において2つのマイクロホンだけでも奥行き方向も含む音源位置推定を行うことが可能な音響信号処理装置を提供する。
【解決手段】対象音源109からの直接波及び反射波をマイクロホン101−1,101−2で受信し、各受音信号を各フーリエ変換部102−1,102−2でフーリエ変換し、変換結果をもとにコヒーレンス特徴算出部110で受音信号の特徴量を算出する。また、特徴量辞書107には、予め複数の音源位置候補について学習された特徴量の代表値が登録されている。照合部106は、受音信号の特徴量を、特徴量辞書107に登録されている特徴量モデルと照合して、受音信号の特徴量により近い特徴量モデルを選択し、選択した特徴量モデルに対応付けられている音源位置候補を、対象音源の位置の推定結果とする。 (もっと読む)


【課題】操作者を限定せずに、広く一般的な使用を可能とする電動車椅子搭載用音声入力装置を提供すること。
【解決手段】電動車椅子搭載用音声入力装置は、それぞれマイクロフォン11を複数個離間してマイクロフォンアレイ12として設けたマイクロフォン取付体10a、10bを、電動車椅子の肘掛の先端部分に前記マイクロフォンが位置するように取付け、前記車両に設けた制御手段により前記両マイクロフォンから取り込んだ信号に対して音源位置推定または音声認識をすることにより操作者の指示を特定する。 (もっと読む)


【課題】偏微分方程式に基づく新たな理論的定式化を導入し、その時間空間重積分から導かれる代数方程式によって、厳密且つ高速な音源定位をより広い周波数帯域にわたって可能とする。
【解決手段】音源から発せられた音波の音圧を測定する。音源拘束式を時間及び空間で積分して得られた時空間積分型音源恒等式に、前記測定ステップで得られた測定値を適用し、方程式群を構築する。次に、前記方程式群を解き、前記音源の方位と距離とを求める。これによって、従来より精度が向上した音源の定位を行うことが可能である。 (もっと読む)


【課題】マイクロフォンアレイ処理で除去しきれない残留雑音を補正する機能を持った音声認識手段とマイクロフォンアレイを組み合わせることで、静止または移動している指向性雑音源や無指向性雑音源を含む一般的な雑音環境下でも高精度に音声認識を実現する音声認識方法およびそれを用いた音声認識装置を提供すること。
【解決手段】音声認識方法は、マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音する手順1、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成する手順2、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成する手順3、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声からユーザの音声を検出・分離して出力する手順4、前記ユーザの音声信号の特徴を補正処理する手順5、前記補正処理した音声信号を音声認識する手順6とからなる。 (もっと読む)


【課題】 現実空間で発生した音響で複合現実空間へのイベント入力を行えるようにして、比較的簡単なシステム構成で種々のイベント入力を実現する。
【解決手段】 操作者Uが装着した表示部11に現実空間と仮想空間を重畳してリアルタイムで表示する複合現実感システム1において、現実空間における操作者Uの位置及び方向を検出し、現実空間で発生した音響を検出し、所定の音源方向からの操作者Uによる操作指示を示す音響に基づいて仮想空間に対する処理を起動する。 (もっと読む)


【課題】接続された音声入力デバイスに対しより適切な感度設定を実現可能とする。
【解決手段】 音声を入力する音声入力デバイスを取り外し可能に接続する接続部と、前記接続部における前記音声入力デバイスの接続状態を監視し、該接続状態が非接続状態から接続状態に変化したときに該変化を通知するためのイベントを出力する監視手段と、前記音声入力デバイスにより前記接続部を介して入力された音声の信号レベルを予め指定された調整量に基づいて調整するレベル調整手段と、ユーザから前記調整量の設定入力を受け付ける設定手段と、前記監視手段から前記イベントを受信したとき前記設定手段を実行する実行制御手段とを備える。 (もっと読む)


【課題】音声認識率を向上させることができるロボット装置及びその動作制御方法を提供すること。
【解決手段】ロボット装置は、優先度が設定された音声入出力経路A1〜A4と、優先度に基づき音声入出力経路A1〜A4を切替選択する音声信号切替器11と、入力された音声を認識する音声認識モジュール12と、音声認識結果に基づき発話動作する音声発話モジュール13とを有する。音声認識モジュール12は、音声入出力経路からの音声のA/N比が所定の閾値以上であるか否かを判定するS/N比判定手段と、音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定手段を有し、音声信号切替器11は、音声入出力経路A1〜A4のうち、可変の優先度を有する音声入出力経路A2〜A4の優先度を、S/N比判定手段及び認識率判定手段の判定結果に基づき更新する優先度更新手段を有する。 (もっと読む)


【課題】ごく簡易な構成により、非可聴つぶやき音声を採取し、これを受話者や音声認識手段が認識しやすい音声信号に変換して出力することができる非可聴つぶやき音声採取用マイクロホン(NAMマイクロホン)を提供すること。
【解決手段】皮膚表面1aに密着されることにより、人体内を伝播する非可聴つぶやき音声(NAM)を伝播させる軟性部材であるNAM伝播部12、NAM伝播部12を伝播するNAMを電気信号に変換するマイクロホン11、マイクロホン11により得られる音声の信号に対して約1000Hzのカットオフ周波数のハイパスフィルタ処理を施すハイパスフィルタ22とを備えたNAMマイクロホンX。 (もっと読む)


【課題】好適な車両周囲における音声指令を処理する方法およびシステムを提供すること。
【解決手段】車両周囲における音声指令を処理する方法であって、該方法は、該車両周囲における音響信号を検出することと、該車両の外側の車両ユーザの位置に関する該位置情報を抽出することと、該検出された音響信号における該車両ユーザから発せられる該音声指令を識別することとを包含するという点を特徴とし、該音響信号の該検出および/または該音声指令の該識別は、該位置情報を考慮に入れて達成される、方法であって、上記方法は、前記車両ユーザの前記位置を検出し、該位置情報を生成することを包含する。 (もっと読む)


【課題】車室内で行う音声認識処理の認識率を更に向上させることができる車両用音声認識装置を提供する。
【解決手段】車室内において、集音マイク4〜7を、ハンドル11,ダッシュボード5,助手席側スピーカ14の前,助手席13後方側に設置し、音声分離処理部2は、BSS法により、これらの集音マイク4〜7により入力された音声信号を、ドライバ音声信号Sとその他の雑音信号N1〜N3とに分離し、車両用ナビゲーション装置1の音声認識処理部3は、分離されたドライバ音声信号について音声認識処理を行なう。 (もっと読む)


【課題】音源の位置変化を推定することのできる技術を提供する。
【解決手段】データサーバ200のCPU21は、複数のマイクシステム11で収音された音を表す音データを、当該音データが出力された時刻を表す時刻情報に対応付けるとともに、マイクシステム11を識別するマイク識別情報に関連付けて、音データ記憶領域24aに時系列に記憶する。区間が指定されると、CPU21は、指定された区間に対応する音データを、タイムスタンプに基づいて記憶部23から時系列に読出し、読み出した音データを、端末装置400に送信する。端末装置400のCPU41は、受信した音データの表す波形を、マイク識別情報毎に表示部46に表示させる。 (もっと読む)


【課題】駅構内のように騒音の激しい所であっても確実に音声入力ができるようにする。
【解決手段】利用者の発する所定の音声情報に基づいて発券処理等の所定の処理を行う駅務機器に対して音声情報を入力するための駅務機器用入力装置であって、利用者の発する音声情報を収集する単一指向性マイクロホンと、その単一指向性マイクロホンを動かしてその単一指向性マイクロホンの指向方向を変化させるマイクロホン可動手段と、前記駅務機器の前面側に位置する利用者の口の位置を検出する口位置検出手段と、その口位置検出手段で検出された利用者の口の位置に前記単一指向性マイクロホンの指向方向が一致するように前記マイクロホン可動手段を駆動制御する駆動制御手段とを有することを特徴としている。 (もっと読む)


【課題】人間の音声や環境音など多様な周囲音を視覚的に認識し得る聴覚障害者用ヘッドマウントディスプレイ装置を提供する。
【解決手段】本発明の聴覚障害者用ヘッドマウントディスプレイ装置は、眼鏡フレーム10および眼鏡レンズ11と、眼鏡フレーム10の所定位置に取り付けられた複数のマイクM1〜M4と、複数のマイクM1〜M4から出力されるマイク信号S1〜S4に基づき周囲音を認識し、認識結果に対応する文字情報を出力する認識手段と、眼鏡レンズ11を通した視野の一部において文字情報を表示する表示手段14と、を備えて構成される。 (もっと読む)


【課題】開放マイクにより被検者の音声をモニタする際に、周囲にノイズ音源がある場合でも、複雑な音声処理をすることなく精度良くモニタする。
【解決手段】被検者の周囲に配置され、経時的な音声レベルの変化である音声信号を出力する複数のマイクと、複数のマイクのそれぞれのマイクから出力されたそれぞれの音声信号に基づく信号から、互いに同時刻にピークを有し且つそれぞれのピーク値が共に予め設定されたそれぞれの閾値以上であるそれぞれの音声信号に基づく信号のピーク波形を検出し、検出されたそれぞれのピーク波形を被検者の発した音声によるそれぞれのピーク波形として抽出する。 (もっと読む)


【課題】 受音装置で受音した音源の存在方向を周囲に知らせる表示器を備えた受音装置を提供する。
【解決手段】 高い指向性を持つ方向(受音方向)を調整可能なマイク20と、マイク20で受音した音源が存在する方向を検出する音源方向検出部101と、検出した音源の存在方向とマイク20の受音方向を、ロボット1の周囲から視認可能に表示する表示器10を備えている。周囲にいる人間が、受音装置で受音している音源がいずれであるのかを理解することができる。 (もっと読む)


41 - 60 / 123