説明

Fターム[5D015DD02]の内容

音声認識 (5,191) | 音声信号の検出 (328) | 音声検知手段の構成 (144) | マイクロホン (123)

Fターム[5D015DD02]に分類される特許

61 - 80 / 123


【課題】複数の方向に存在する音源からの音声、雑音等を含む音声信号が入力された場合、多数のマイクロホンを設置する必要がなく、簡易な構成により所定の方向の音源が発する音声信号を強調して周囲の雑音を抑制することができる指向性集音装置、指向性集音方法、及びコンピュータプログラムを提供する。
【解決手段】複数方向に存在する音源からの音入力を受け付け、周波数軸上の信号に変換する。変換された周波数軸上の信号を抑制する抑制関数を算出し、算出された抑制関数を元の信号の周波数軸上の信号の振幅成分に乗算して、変換された周波数軸上の信号を補正する。変換された各周波数軸上の信号の位相成分を同じ周波数ごとに算出し、位相成分の差分を算出する。算出された差分に基づいて、所定の方向に音源が存在する確率を示す確率値を特定し、特定された確率値に基づいて、所定の方向の音源以外の音源からの音入力を抑制する抑制関数を算出する。 (もっと読む)


【課題】利用者の操作作業を介在させずに、複数の音声入力手段が搭載された車両において、音声認識の感度を従来技術よりも向上させる。
【解決手段】車両における複数箇所にそれぞれ搭載される複数の音声入力手段1,2と、音声信号に対する言語情報について保持する音声辞書部7と、音声入力手段1,2を通じて入力された音声信号についての音声認識を、該音声辞書部を参照することにより行なう音声認識部6と、上記車両内における乗員又は該車両外部の人員の状態、又は上記車両の状態について検出する状態検出部4と、状態検出部4における検出結果に応じて、複数の音声入力手段1,2の動作状態および音声辞書部7における認識候補の設定状態のうちのいずれか一方又は双方を切り替える切り替え制御部5と、をそなえる。 (もっと読む)


【課題】複数の話者の会話が録音されている音声データから、特定の話者の発言を効率良く聴くことができ、その発言に至るまでの他者の発言内容も把握することができる装置を提供する。
【解決手段】録音サーバ101のネットワークI/F4は、ネットワーク100で通信される多地点音声会議の音声データを取得し、記録部3は音声データを議事録として記録する。記録部3は、各会議参加者の音声特徴量を記録している。特徴データ抽出部2は、パソコン102から再生リクエストを受信すると、記録部3に記録されている議事録の音声データから、音声特徴量を抽出し、各会議参加者の音声特徴量と比較する。その結果、特定の話者の記録音声データを抽出し、この話者の音声データ以外を話速変換(高速再生)し、ダイジェストデータを生成し、ストリーミング配信する。パソコン102は、ストリーミングデータを受信し、ダイジェスト再生をする。 (もっと読む)


【課題】ICA法に基づくBSS方式による音源分離処理を行うに当たり、音響空間に存在する音源の数に増減があった場合でも、高い音源分離性能を維持できること。
【解決手段】n個の指向性マイク111〜11nが、0個〜n個の音源が存在し得る音響空間において各々異なる指向方向で配置され、パワー検出・信号選択部25が入力音声信号xi各々のパワーPiを検出するとともに、そのパワーPiに基づいて、入力音声信号xiの中から、指向性マイク111〜11nが配置される音響空間に存在する1又は複数の音源に対応する1又は複数の採用入力音声信号xj(チャンネル)を選択し、これにより複数の採用入力信号xjが選択された場合、ICA部20が、その複数の採用入力音声信号xjに対し、独立成分分析法に基づくブラインド音源分離方式の音源分離処理を施すことによって採用入力音声信号xjの数と同数の分離信号yjを生成する。 (もっと読む)


【課題】発話内容を音声認識して車載機器を制御するに際し、その発話内容に対する認識率を高めることができる「車載用音声認識装置及び音声認識方法」を提供すること。
【解決手段】音声入力手段9を介して発話したユーザを発話者特定手段11により特定したときに、制御手段12により、辞書格納手段8に格納されている複数の専用の音声認識辞書D1〜D3の中から、その発話者が視聴している情報のソース(制御対象機器)に対応した専用の音声認識辞書を選択し(12a)、その選択した辞書を使用して音声認識を実行し(12b)、その認識した発話内容に対応する制御を当該制御対象機器に対して行う(12c)。 (もっと読む)


【目的】ASCシステムをMAシステムの前段に設ける場合であっても処理量およびハード規模の増大を防止できるようにする「オーディオ音キャンセルシステム」を提供する。
【構成】アレイ構成の第1マイクに対応するキャンセルコントローラ53Lは周波数領域LMSアルゴリズムにより適応フィルタ63の全周波帯域のフィルタ係数を決定し、第1マイク検出信号に含まれるオーディオ音キャンセル信号yL(n)を出力する。第2マイクに対応するキャンセルコントローラ53Rは周波数領域LMSアルゴリズムにより適応フィルタ71の高周波帯域のフィルタ係数を決定し、合成部72は適応フィルタ63、71からそれぞれ出力する低周波帯域及び高周波帯域のオーディオ音キャンセル信号を合成して第2マイク検出信号のオーディオ音をキャンセルする信号yR(n)を出力する。 (もっと読む)


【課題】確実に発話の内容を検出できる音声検出装置を提供する。
【解決手段】気導音マイクロホン1と骨伝導マイクロホン3の出力が共に単位時間毎に予め設定したレベルを超えた場合に、相関値を計算し、相関が高いと判定された場合に、その時刻情報を音声区間検出部7に送ることで、確実に音声区間と想定される区間を音声検出の際に利用できる。 (もっと読む)


【課題】誤動作の発生を低減する音声処理装置を提供する。
【解決手段】操作者または操作者以外の者の発声を含む音声を入力するマイク104と、入力された音声のうち音声処理の対象とする区間として操作者により指定された指定区間の入力を受付ける指定区間受付部204と、入力された音声から発声が存在する区間である発声区間を検出する発声区間検出部202と、入力された音声に基づいて、操作者または操作者以外の者のいずれが発声の発話者であるかを判断する話者判断部203と、指定区間受付部204が受付けた指定区間と発声区間検出部202が検出した発声区間とが重複する部分を検出し、重複する部分が検出された場合であって、話者判断部203により話者は操作者以外の者であると判断された場合に、重複する部分が含まれる発声区間を処理区間として決定する処理内容判断部205と、を備えた。 (もっと読む)


【課題】複数の音源からの音声データを経時的に記録したデータを利用する際に、利用者に対して使い勝手の良い状態でデータを提供することにある。
【解決手段】録音サーバ101のネットワークI/F4は、ネットワーク100で通信される多地点音声会議の音声ファイルを取得する。音声ファイルには収音された装置を表す装置データ、収音方位を表す方位データ、収音時間を表す時間データが添付されている。音声ファイルは記録部3の音声ファイル記録部31へ装置毎に記録される。音声状況データ生成部2は、音声ファイルの方位データと時間データとに基づいて音声ファイルを区分化するための音声状況データを生成して記録部3に与え、音声状況データは記録部3の音声状況データ記録部32に記録される。議事録作成者が会議後に録音サーバ101にアクセスすると、音声状況データに基づいて音声ファイルを区分化されて表示され、編集可能となる。 (もっと読む)


【課題】体内伝導通常音声の音質を改善する。
【解決手段】耳介の下方部の、頭蓋骨の乳様突起直下の、胸鎖乳頭筋上の皮膚表面から採取される、体内軟部組織を伝導する体内伝導通常音声について線形予測分析を行う。また、気伝導音について線形予測分析を行う。これらの分析結果に基づいてGMM学習手段13により、混合正規分布モデルを学習し、GMM記憶用メモリ14に記憶する。GMM記憶用メモリ14に記憶された学習結果を用いて、体内伝導通常音声について擬似気伝導音への変換を行う。このような構成によれば、騒音が大きい環境においても、快適に気伝導音に近い音質で音声通話することが可能となる。 (もっと読む)


【課題】 会議中の発話のかぶりを取り除いて発話内容を話者毎に高精度で分離することができる、発話イベント分離方法、発話イベント分離システム、及び、発話イベント分離プログラムを提供する。
【解決手段】 会議中の連続した区間に当該会議の場で収録された多チャネルの音声データから時刻毎の音源方向を推定する。そして、音源となる話者の存在範囲を推定して時刻毎にどの話者が発話しているかを同定する。これから目的話者の位置ベクトルを推定するとともに、他の話者の雑音空間相関行列を計算して、目的話者の位置ベクトルと、目的話者に対する他の話者の雑音空間行列に基づいてフィルタを生成し、当該フィルタを用いて目的話者のみの発話を分離して出力する。 (もっと読む)


【課題】ユーザにとって便利な音声処理装置を提供する。
【解決手段】音声処理装置100は、ユーザが発する音声を検出し電気信号に変換する音声成分検出部12と、音声が発せられる際に同時に人の口から出る吐息成分を検出する吐息成分検出部13と吐息成分が検出された場合にのみ電気信号に変換された音声を有効な音声であると判定する有効音声判定部14とを具備する。 (もっと読む)


【課題】板バネ構造を有する超小型マイクロホン、スピーカ及びそれを利用した音声認識装置、音声合成装置を提供する。
【解決手段】フレーム、振動板、板バネ構造を有し、フレーム及び振動板に連結される弾性部、弾性部に位置して弾性部に伝えられる振動板の振動を感知するセンサー部を有するマイクロホンである。 (もっと読む)


【課題】非コヒーレント雑音フィールドでも高い雑音抑圧性能が得られるようにする。
【解決手段】ブロッキングマトリクス(BM)ユニット14は、マイクロホン111-1〜111-Mから出力される観測信号に含まれている目的音声信号の到来時刻のずれが較正された信号を受けて、基準チャネルとしてのマイクロホン111-1を除く残りのマイクロホンから出力される観測信号に対応し、目的音声信号が抑圧された雑音基準信号を生成する。フィルタユニット15は、BMユニット14によって生成される雑音基準信号の周波数スペクトルの歪みを、コヒーレンス関数を用いて定義された、雑音基準信号の周波数スペクトル及び音声基準信号の周波数スペクトルの相互相関と、コヒーレンス関数を用いて定義された、雑音基準信号の周波数スペクトルの自己相関との関係を反映した雑音キャンセラ係数を用いて補正する。 (もっと読む)


【課題】複数のマイクロフォンの感度を揃えることができ、所望の指向特性を形成することができるマイクロフォン感度調整方法およびそのシステムを提供すること。
【解決手段】音源分離や音声認識等の各種処理を実現するための指向特性制御を行うにあたり、複数のマイクロフォン41,42に感度調整用の校正信号を入力し、これらの出力信号を用いて校正用情報を作成しておく。例えば、各出力信号のスペクトル比を各周波数帯域毎に求め、これに基づきインパルス応答を求めておく。そして、携帯電話機等の各種機器を実働状態にして実際に音源分離や音声認識等の各種処理を行う場面で、校正処理で作成しておいた校正用情報を用いて感度調整を行う。例えば、求めておいたインパルス応答を用いて畳み込み演算を行うことによりマイクロフォン42の出力信号を補正し、マイクロフォン41と同じレベルの感度に調整することで、目的の指向特性を形成する。 (もっと読む)


【課題】 小型携帯IT端末において一つのオーディオジャックによって種々のオーディオ機器の動作をサポートできるオーディオ入出力装置および入出力機能の切り替え方法を提供すること。
【解決手段】 4極タイプのオーディオジャック20を用い、接地を含めた一般的な3極の信号箇所には、従来から存在するイヤホンマイク機能(マイク一入力、スピーカー一出力)を提供し、更に4極目に相当する箇所に高騒音下音声認識用マイク入力の機能を割り当て、接続されるオーディオ機器の必要性に応じてその機能を有効化する。 (もっと読む)


【課題】
地上波放送や衛星放送などのテレビ番組のシーンの中からユーザーが興味を持ったシーンを特定する場合、視線、瞳孔、瞬目等の表情に関わる感性情報だけでは、ユーザーが興味を持ったシーンを抽出するには不十分であるという課題がある。
【解決手段】
本発明のメディア処理装置では、画像取得部で取得した画像情報をもとに、ユーザー検出を行い、ユーザーの顔位置を推定する。またマイクロホンアレイで収録した音データより、音声区間の検出を行う。検出した音声区間の音源方向と顔位置とが一致した場合に、発話対象物がメディア処理装置であるとみなす。そしてその音声区間の発話をユーザーがメディア処理装置に表示される映像に対し、興味を持ったために発した発話であると判断し、音声区間と同じ時間の映像区間をユーザーが興味を持った映像区間であると判断する。 (もっと読む)


【課題】 低域から高域まで品質のよい音声を入力する。
【解決手段】 特性の異なる複数のマイクロフォンで集音した音声から、それぞれ予め設定した周波数帯域の音声を抽出して合成する。 (もっと読む)


【課題】 マイクロホンを近接配置した場合にも良好な分離性能を有し、かつ低コストのマイクロホンアレー装置を提供する。
【解決手段】 マルチチャンネルAD変換部11はN個のマイクロホンで収音されたN個のアナログ信号の各々を周波数Fs Hzで、時刻が(1/(FsN))秒ずつ異なるようサンプリングしてN個の信号を生成し、帯域分割部12はN個の信号の各々を複数の帯域のスペクトルに分割し、位相差検出・判定部13はN個の信号の各々が有するサンプリング時刻のずれに応じてスペクトルの位相の各々を補正し、補正したスペクトルの位相を比較して、それぞれの帯域のスペクトルが所望の音源に属するか否かを判定し、スペクトル選択部14は判定結果に基づいて所望の音源に含まれているスペクトルを選択し、帯域合成部15は選択されたスペクトルを帯域合成して時間信号に変換し所望の音源の信号を合成する。 (もっと読む)


【課題】自動車内などにおける残響下における目的音除去の問題を緩和して目的音信号の強調を行う。
【解決手段】マイクロホン101−1〜Nからの複数チャネルの入力音響信号に対してチャネル間特徴量算出部102によりチャネル間の差異を表すチャネル間特徴量を算出し、予め用意された重み係数辞書103から選択部104によって該特徴量に対応付けられた複数チャネルの重み係数を選択し、選択した重み係数を用いて重み付け部105−1〜Nと加算器106により入力音響信号を重み付け加算して出力音響信号を生成する。 (もっと読む)


61 - 80 / 123