説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

901 - 910 / 1,456


【課題】データ量の増加を抑制しながらも、音声に係るデータを画像データに付加する。
【解決手段】撮影モード中、CPU20は、音声データを音声メモリ29に記憶する。レリーズボタン8を半押しすると、CPU20は、フォーカスモータ32によるフォーカス調整を行う。レリーズボタン8を全押しすると、撮影を行い、撮影した画像データをバッファメモリ24に一時的に記憶するとともに、特徴抽出部31は、撮影時点を中心に、前後1秒ずつの計2秒の期間に音声メモリ29に記憶された音声データの実効音圧量を計測する。CPU20は、計測した音圧データを、バッファメモリ24に記憶された画像データに付加し、音圧データが付加された画像データをRAM26に記憶する。 (もっと読む)


【課題】音声信号の自動処理の分野に関し、特に、音声信号におけるフォルマント周波数を追跡する方法を提供する。
【解決手段】本方法は、音声信号の聴覚イメージを取得するステップ、フォルマント位置を順次推定するするステップ、 周波数範囲を小領域に分割するステップ、取得されたコンポーネント・フィルタリング分布を平滑化するステップ、および、正確なフォルマント位置を計算するステップを含む。 (もっと読む)


【課題】より簡単に、より迅速に、また、より正確に類似するコンテンツを特定する。
【解決手段】特徴量変換部131は、複数の特徴量が付与された複数のコンテンツに対して、複数の特徴量により定義されたコンテンツ間の距離が、ユーザから入力された複数のコンテンツ間の類似関係に対応する距離となるように複数の特徴量を変換し、複数の特徴量によって定義された特徴量空間に配置されたコンテンツを、複数の特徴量の変換により新たな特徴量空間に写像する関数を用いて、コンテンツの特徴量を変換する。検索処理部127は、変換された特徴量により、類似するコンテンツを検索する。本発明は、コンテンツを記録して再生する据え置きの機器に適用できる。 (もっと読む)


【課題】本発明は、ロボット装置の使い勝手を向上させる。
【解決手段】本発明は、可動部2を有するロボット装置1において、受信部3により音楽データを受信して出力部4により音楽として出力しながら、分析部5によりその音楽データを分析すると共に、設定部6により音楽データの分析結果に基づいて、音楽に対応する可動部動きパターンを設定して、駆動制御部7により、当該設定した可動部動きパターンに応じて可動部2を駆動することにより、ユーザに対し多数の音楽データを記憶するように操作させることなく、また何度も異なる音楽データを記憶し直すように操作させることもなく、容易に、より多くの音楽に合わせて可動部2を動かして見せることができ、ロボット装置1の使い勝手を向上させることができる。 (もっと読む)


【課題】所望の領域で用いられる発音を学習する。
【解決手段】 電子辞書装置1おいて、アメリカ英語についての英和辞書「リー○ーズ」の辞書データベース85aが指定される、つまり、発音の学習対象国として「アメリカ」が指定された後(図(a))、文字キー13c等の操作によって学習対象語句「blessed」が入力されると(図(b))、学習対象語句「blessed」に対応する見出語の発音記号データ及び説明情報データが表示される(図(c))。そして、発音学習キー13jが操作されると、録音部4に入力されたユーザ音声からユーザ音声データが生成され(図(d))、ユーザ音声データと、発音の学習対象国「アメリカ」に対応する模範音声データとに基づいて、ユーザ音声,模範音声が周波数分析され、これらの分析結果が比較評価された後、評価結果がディスプレイ10に表示される(図(e))。 (もっと読む)


風雑音を検出するための方法およびシステムが、複数の受音ユニットによって取得される複数の音信号のうちの2つについて、風雑音を含んでいるか否かを判断するように構成されている。この方法は、(a)前記2つの音信号のそれぞれを、複数の音フレームを含むそれぞれのデジタル化音信号へと変換するステップ、(b)前記2つのデジタル化音信号からの対応する音フレームの各組の相関係数を計算するステップ、(c)前記デジタル化音信号の一方を他方から減算し、得られたデジタル化音信号を周波数ドメインへと変換するステップ、(d)前記音フレームのそれぞれの周波数ドメインにおいて周波数境界として機能する周波数ビンを選択し、前記周波数境界に従って前記音フレームのそれぞれのdB差、低周波数エネルギー減衰係数、および低周波数リップル数を計算するステップ、ならびに(e)それぞれの音フレームの相関係数、dB差、低周波数エネルギー減衰係数、および低周波数リップル数が、所定の判定ルールを満足するか否かを判断し、満足する場合に、前記2つの音信号が風雑音を含んでいると判断するステップ、を含んでいる。
(もっと読む)


【課題】音源定位と音源同定の2つの機能の実装を容易化するとともに、実用的な演算速度を実現可能な音源定位・同定装置を提供する。
【解決手段】音源の方向を識別する音源定位部8と、音源の種類を識別する音源同定部9とを備え、音源定位部8と音源同定部9とは、いずれも、複数のパルスニューロンモデルを備えたニューラルネットワークにより構成され、各パルスニューロンモデルは、ディジタル回路により構成されている音源定位・同定装置1。 (もっと読む)


本発明は、言語的テストに対する人の精神生理学的反応を解析する方法および装置の分野に関する。ストレス状態を測定すべく本発明の方法を実行する本発明の装置(1)は例えばマイクロホン(5)から音声信号を受信するのに用いられる受信ユニット、スペクトルの基本周波数、強度、中央値および幅等のスペクトル特性に基づいて1個の無次元パラメータに従いストレス状態のレベルを測定する処理ユニット、およびストレス状態を決定すべく例えば発光装置(6)または振動を生成する装置(7)からなる表示ユニットを含んでいて、光の波長または振動周波数はストレス状態のレベルに依存する。 (もっと読む)


【課題】曲解析に基づいて決定された画像の表示条件に最適な画像の領域抽出方法および画像選択方法を提供し、楽曲に同期するスライドショーの質を向上させる。
【解決手段】S13では、抽出領域DBに位置情報の格納された物体領域の数U2と顔領域の数U1とを加えた数U1+U2と、必要領域数Vとを比較する。そして、U1+U2<VであればS15にそれぞれ移行する。S15では、物体の抽出精度の閾値を所定の段階(ここでは1段階)だけ下げ、S12に戻り、再び物体領域の抽出を行う。 (もっと読む)


【課題】 音声学習について所望の学習効果を得る。
【解決手段】電子辞書装置1において、ユーザにより音声学習条件が設定されると(図(a))、各学習対象語句が発声順序に従って「melon」、「orange」、「apple」,…の順に表示され、先頭の学習対象語句「melon」が模範音声部分として音声出力されるとともに、表示エリア右端の識別記号K1によって識別表示される(図(b))。次に、学習対象語句「orange」が音声出力されるとともに、表示エリア右端の識別記号K1によって識別表示される。また、復唱部分「melon」の復唱タイミングで、学習対象語句「melon」、「orange」、「apple」,…における復唱部分「melon」が表示エリア左端の識別記号K2によって識別表示されるとともに、復唱インジケータF内で「★」の記号により識別表示される(図(c))。 (もっと読む)


901 - 910 / 1,456