説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

1,431 - 1,440 / 1,456


放送源の識別のための方法および装置が提供される。ユーザは、何らかの放送手段から放送されているオーディオ・プログラムを聞くことがあり、オーディオのサンプルを記録することができる。次いで、サンプルは、ユーザがどの放送局を聴いているか決定するために分析手段に伝達される。分析手段は、多くの放送チャネルを監視する。したがって、オーディオ・サンプルの特性と放送チャネルから取られたサンプルの特性が、一致の検出のために比較され得る。次いで、一致が検出された放送チャネルに関係する放送情報が、たとえば販促の広告、懸賞の通知、割引きの案内、および特定のラジオ局に固有の他の情報と組み合わせてユーザに報告し返され得る。
(もっと読む)


本発明は、周波数バンドのオーディオ信号のフレームを入力する入力(201)、通話類オーディオ信号の第1の励起を行う少なくとも第1の励起ブロック(206)、および非通話類オーディオ信号の第2の励起を行う第2の励起ブロック(207)を有するエンコーダ(200)に関する。エンコーダ(200)は、周波数バンドを、それぞれが上記周波数バンドより狭いバンド幅を持つ複数のサブバンドに分割するフィルタ(300)をさらに含む。エンコーダ(200)はまた、少なくとも1つの上記サブバンドにおけるオーディオ信号の特性に基づいてオーディオ信号のフレームの励起を行うために、少なくとも上記第1の励起ブロック(206)と上記第2の励起ブロック(207)の中から1つの励起ブロックを選択する励起選択ブロック(203)を含む。本発明はまた、デバイス、システム、方法およびコンピュータプログラムの記憶媒体に関する。
(もっと読む)


オーディオコーデックで使用される既知の時間領域から周波数領域への、または周波数領域から時間領域への変換はMDCTである。このMDCTは、高精度の乗算のため大きな計算パワーを要する点で不利であるが、オーバーラッピング変換とサブサンプリングを容易にする。本発明は、乗算を含まない変換または逆変換を使用する。その理由は、変換行列と逆変換行列が+1と−1のみを含むが、オーバーラッピングとサブサンプリングの利点は保たれる。
(もっと読む)


到来する音響信号に応答し、刺激装置のアレイを含む聴覚人工器官(1;1’;1”)によって電気的刺激を生成する方法であって、この方法は、アレイ内において起動される刺激装置と、これらの電極の起動時間と、を判定する段階と;信号の低振幅成分を表している電極の起動が、信号の高振幅成分を表している近接した装置の起動よりも遅延するように、起動時間に対して時間的な調節を適用する段階と、を含んでいる。 (もっと読む)


メロディデータベース(114)中のオーディオフラグメントを表すクエリストリングを検索するシステムであって、ユーザからクエリストリングを受信する入力(122、132)を含む。メロディデータベース(114)は、複数のオーディオフラグメントの表示を格納している。プロセッサ(116)を用いて、前記クエリストリングを複数のクエリサブストリングのシーケンスに分解する(117)。各サブストリングは、データベースを独立に検索して(118)、少なくとも1つのそれぞれ前記サブストリングと最も一致するものを見つける。それぞれのサブストリングの検索結果に応じて、前記クエリストリングと最も近い少なくとも1つの一致を決定する(119)。
(もっと読む)


電子デバイスは、雑音信号を受信し、雑音信号の音響計測基準を生成する。呼出信号は、音響計測基準に基づき生成される。更に、電子デバイスは、複数の呼出プロファイルを提供することも可能である。ユーザは、複数の呼出プロファイルのうち1つを選択でき、呼出信号は、複数の呼出プロファイルから選択された1つに基づいて生成されうる。電子デバイスは、複数の呼出プロファイルを提供することにより更なる動作も可能である。雑音信号を受信し、複数のプロファイルのうちの1つが、雑音信号の受信に応答して選択されうる。呼出信号は、複数の呼出プロファイルのうち選択された1つに基づき生成されうる。
(もっと読む)


本発明は、通信信号中の音声動作を検出するための方法及び装置に関する。フィルタ手段は、通信信号のレベルのオフセット成分を概算又は抑制するために設けられている。フィルタパラメータは、フィルタ手段の出力に基づいて制御される。また、オフセット成分の概算又は抑制は、フィルタ手段の出力に応じて制限される。フィルタ手段は、非線形適応ノッチレベルフィルタ又はノイズ下限トラッキングフィルタに基づいていてもよい。これにより、ノイズ下限の突然の上昇に対するノイズ下限概算のトラッキング態様を向上させることができるとともに、幅広いダイナミックレンジに亘って音声動作検出を効率的に機能させることができる。
(もっと読む)


話者の種類、発話語彙、発話様式、発話環境等の特定条件により多様化する特徴パラメータの分布を考慮して不特定話者用の音響モデルを生成するのに好適で、且つ、特定の個人の音声に最も適合した不特定話者用の音響モデルを提供するのに好適なデータ処理装置及びデータ処理装置制御プログラムを提供する。 データ処理装置1を、データ分類部1aと、データ記憶部1bと、パターンモデル生成部1cと、データ制御部1dと、数学的距離算出部1eと、パターンモデル変換部1fと、パターンモデル表示部1gと、領域区分部1hと、区分内容変更部1iと、領域選択部1jと、特定パターンモデル生成部1kと、を含んだ構成とした。 (もっと読む)


ロングウィンドウタイプを用いて、データの現フレーム及びデータの次フレームについて、予備的修正離散コサイン変換(MDCT)係数を算出する。そして、現在及び次フレームの算出された予備的MDCT係数を用いて、現フレームのウィンドウタイプを決定する。決定されたウィンドウタイプがロングウィンドウタイプでない場合、現フレームについて、決定されたウィンドウタイプを用いて複数の最終的なMDCT係数を算出する。
(もっと読む)


エンコーダは、オーディオ信号(x(n)、y(n))を時間領域から周波数領域に変換し、周波数領域において相互相関関数(Ri、Pi)を決定する。複素コヒーレンス値(Qi)は、周波数領域において(複素)相互相関関数値(Ri、Pi)を合計することにより計算される。チャンネル間位相差(IPDi)は、複素コヒーレンス値(Qi)の偏角により推定され、チャンネル間コヒーレンス(ICi)は、複素コヒーレンス値(Qi)の絶対値により推定される。先行技術においては、計算量の多い逆高速フーリエ変換と時間領域における相互相関関数(Ri;Pi)の最大値のサーチが必要である。
(もっと読む)


1,431 - 1,440 / 1,456