説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

1,011 - 1,020 / 1,456


【課題】着信者側の状況を発信者側で把握することができ、状況を把握した上で、マナーモードの解除を行うかどうかの選択ができるようにする。
【解決手段】マナーモードの設定を行う制御手段(4,12,13)を備えた携帯電話機において、携帯電話機が置かれている状況を検出する状況検出部(20)と、マナーモードに設定されている状態で、呼びを受けたときに、検出された状況を示す情報を発信側の携帯電話機に対して送信する状況送信手段(4,3,2,1)とを備え、制御手段(4,12,13)は、状況送信手段(4,3,2,1)が、検出された状況を示す情報を発信側の携帯電話機に対して送信した後に、発信側の携帯電話機からマナーモードの解除のための操作が行われたときに、それに応じてマナーモードを解除する。 (もっと読む)


【課題】ブラインド音源分離処理を行うに当たり、マイクロホンに対する音源の位置が移動する場合でも、特定の音源に対応する分離信号を特定の出力端を通じて出力させることができる(音源の追跡ができる)こと。
【解決手段】人音声判別部27が、第1出力チャンネルOp1i各々を通じて出力される所定時間長分ごとの分離信号y1iが人の音声信号であるか否かを判別し、周波数解析部24が、人の音声信号であると判別された分離信号y1iに対して周波数解析計算を行い、これにより各分離信号y1iの周波数の特徴量を算出し、さらにその特徴量の変遷の自動評価により、分離信号y1iの入れ替わり状態を判別する。さらに、出力バッファ22により、分離信号y1iの入れ替わり判別の結果に基づいて、第1出力チャンネルOp1iを通じて出力されるいずれの分離信号y1iを、第2出力チャンネルOp2iのいずれを通じて出力するかを切り替える。 (もっと読む)


キー情報を抽出するため、オーディオ信号から音成分を選択すること(102)により、オーディオ信号が処理される。続いて、選択された音成分にマスクが適用され(104)、少なくとも1つの音成分が破棄される。残りの音成分の音符値が特定され(106)、1オクターブ分にマッピングされて、クロマ値が取得される(108)。クロマ値は、クロマグラムに累積され(110)、評価される(112)。
(もっと読む)


【課題】記載のシステム及び方法は音声ファイルを受信し、当該受信ファイルをハプティック・イベントに自動変換することを目的とする。
【解決手段】一実施形態において、受信ファイルはサンプルされたデジタルの又はデジタル化されたアナログ音声ファイルである。システム及び方法は音声ファイルを複数のサブバンド信号に分離し、サブバンド信号を複数のイベントにセグメント化する。次いでシステム及び方法はイベントにハプティック効果を割り当て、アクチュエータにより出力されるハプティック・イベント信号を生成する。システム及び方法は、音声に対応するハプティック・イベントを分析して提供するために、アクチュエータの物理パラメータ及び音声信号中の周波数特性と共に切取り及び最短時間分離パラメータを利用する。 (もっと読む)


時間でサンプルされた現実の信号の改良離散コサイン変換(MDCT)により表されるオーディオ信号の処理が開示され、そこでは変換されたオーディオ信号の音量が測定され、少なくとも一部は測定に応じて、変換されたオーディオ信号の音量が改良される。ゲインが1以上の周波数帯域を改良するときに、周波数帯域から周波数帯域へのゲインの変化が滑らかである。音量測定は、ヒトの音量感知あるいはそれより遅い積分時間に相応の平滑化時定数を用いる。 (もっと読む)


【課題】F0予測モデル訓練方法を提供する。
【解決手段】F0予測モデル訓練方法は、直交多項式を用いてF0を表し、直交多項式のパラメータ毎にF0予測に関連する属性と、属性の可能な属性組合せの少なくとも一部を用いて、属性と属性組合せの各々が項目として含まれる初期パラメータ予測モデルを生成し、パラメータ予測モデル中の各項目の重要度を計算し、最低算出重要度を有する項目を削除し、残りの項目を用いてパラメータ予測モデルを再生成し、再生成パラメータ予測モデルが最適モデルか否かを判定し、パラメータ予測モデルが最適モデルではないと判定された場合、新規再生成パラメータ予測モデルを用いて重要度を計算し、重要度を計算するステップに続く各ステップを繰り返すことを含み、直交多項式及び直交多項式の全てのパラメータ予測モデルがF0予測モデルを形成する。 (もっと読む)


【課題】従来のBurg法よりも少ない演算量でPARCOR係数を算出する。
【解決手段】モデル次数m−1における前向き予測誤差b′m−1、後向き予測誤差bm−1およびPARCOR係数γm−1,m−1からモデル次数mにおける前向き予測誤差b′を算出し、モデル次数m−1における前向き予測誤差b′m−1、後向き予測誤差bm−1およびPARCOR係数γm−1,m−1からモデル次数mにおける後向き予測誤差bを算出する。さらに、モデル次数m−1における平均エネルギーAm−1に、モデル次数m−1に応じて定まる値(更新係数)を乗ずることでモデル次数mにおける平均エネルギーAを算出する。そして、モデル次数mにおける前向き予測誤差b′と後向き予測誤差bとの内積を、平均エネルギーAで除することによってモデル次数mにおけるPARCOR係数γm,mを算出する。 (もっと読む)


オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計測と制御に関するオーディオ信号の処理が、例えば、次の1つ以上で役に立つ。すなわち、音量補償ボリューム制御、自動ゲイン制御、ダイナミックレンジ制御(例えば、リミッター、圧縮器、伸張器、等を含む)、ダイナミックイコライゼーション、及びオーディオ再生環境における暗騒音の相殺に有効である。種々の実施の形態において、その特定音量と目標特定音量との差を減少させるために、オーディオ信号を修正するための修正パラメータが導き出さ
(もっと読む)


【課題】粗い間隔で探索信号を入力信号から切出し、少数の探索信号で蓄積信号DB(データベース)から探索信号の類似信号を選び、これを集めたDBにて密な間隔で入力信号から切出した探索信号で類似信号を探索し、高速に信号検出する信号検出装置を提供する。
【解決手段】本発明の信号検出装置は、蓄積信号を登録した蓄積信号DBと、上位探索信号を入力信号の複数箇所から切出す上位探索信号切出部と、上位探索信号に類似区間を含む蓄積信号を、蓄積信号DBから探索し、探索された蓄積信号を出力する上位探索部と、直前の探索での蓄積信号を集めた下位蓄積信号DBを作成する下位蓄積信号DB作成部と、下位検索キー信号を入力信号から複数箇所から切出す下位探索信号切出部と、下位探索信号に類似区間を含む蓄積信号を、下位蓄積信号DBから探索する下位探索部を備え、段階数に応じた探索を行う。 (もっと読む)


【課題】複数の拠点同士で音声データの送受信を行って音声会議を行う際に、拠点Aから伝送された入力音声が、拠点Bにおいて期待する明瞭な音声品質で再生されているか否かを確認する。
【解決手段】拠点Bにおいて、ネットワークを介して他の拠点Aと音声信号を送受信する通信部11Bと、通信部11Bにおいて受信された音声信号VAabを再生して出力する音声出力部13Bと、音源より発生した音声VBbと音声出力部13Bから出力された音声であるエコーVAbとを集音して入力する音声入力部14Bと、音声入力部14Bに入力された音声信号VAba+VBbaから、エコーの音声信号VAbaと音源より発生した音声の音声信号VBbaとを分離して抽出する所望音声抽出部12Bと、所望音声抽出部12Bにより抽出されたエコーの音声信号VAbaと音源より発生した音声の音声信号VBbaとを選択するスイッチ16Bと、を有しており、スイッチ16Bにより選択されたエコーの音声信号VAba又は音源より発生した音声の音声信号VBbaを通信部11Bにより、拠点Aへ送信可能に構成する。 (もっと読む)


1,011 - 1,020 / 1,456