説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

1,411 - 1,420 / 1,456


【課題】 歌唱等の第1の内容の特徴がオーディオトラックの特性として検出されるオーディオトラックのオーディオサムネイルを生成する方法およびシステムを提供する。
【解決手段】 オーディオトラック内で第1の内容の特徴を検出すること、該検出した第1の内容の特徴に対応する前記オーディオトラックの第1の部分(122)を抽出すること、前記オーディオトラック内でエネルギーの増加の発生を検出すること、該検出したエネルギーの増加に対応する前記オーディオトラックの第2の部分(122)を抽出すること、および前記オーディオトラックの前記抽出した第1の部分および第2の部分(122)を結合して前記オーディオトラックのオーディオサムネイル(126)にすること、を含む、オーディオトラックのオーディオサムネイルを生成する方法とする。
(もっと読む)


【課題】
本発明は、複数の外部記憶媒体で音楽データを容易に利用可能にする。
【解決手段】
本発明は、ハードディスクに記憶される音楽データをチェックアウト可能な外部記憶媒体を検出し、音楽データをハードディスクに記憶し、その外部記憶媒体として検出したメモリスティック311及びMD312に対し、ハードディスクに記憶した音楽データを自動的にチェックアウトすることにより、ハードディスクに記憶した音楽データをメモリスティック311及びMD312に対し一括して容易にチェックアウトでき、ハードディスクに記憶した音楽データを複数の外部記憶媒体で容易に利用可能にすることができる。 (もっと読む)


格納されるコンテンツにおいて番組からコマーシャルを検出するシステム及び方法。本システムは、特定のタイムウィンドウにおいて顔を検出及び抽出する画像検出モジュールを有する。抽出された顔は、以降のタイムウィンドウにおいて検出される顔とマッチングされる。何れの顔も一致しない場合、コマーシャル部分の開始を示すフラグが設定される。音声または発話解析モジュールが、顔の検出に用いられたものと同一のタイムウィンドウにおいて音声署名を解析することにより、コマーシャル部分の開始を検証する。
(もっと読む)


入力信号(20)をエンコードし対応するエンコードされた出力信号(30)を生成する方法、及び該方法を実装するように構成されたエンコーダ(10)が記載される。本方法は、(a)エンコーダ(10)のサブエンコーダ(300、310及び320)に入力信号を配信するステップと、(b)サブエンコーダ(300、310及び320)に配信された入力信号(20)を処理し、サブエンコーダ(300、310及び320)からの対応する代表パラメータ出力(200、210及び220)を生成するステップと、(c)サブエンコーダ(300、310及び320)のパラメータ出力(200、210及び220)を結合し、エンコードされた出力信号(30)を生成するステップとを有する。サブエンコーダ(300、310及び320)における入力信号(20)の処理は、解析のための入力信号(20)のセグメント化を含む。斯かるセグメントは、入力信号(20)中に存在する情報内容に応じて少なくとも部分的に動的に可変である関連する継続時間を持つ。斯かる可変のセグメント継続時間は、知覚的なエンコード品質を改善し、達成可能なデータ圧縮を向上することが可能である。
(もっと読む)


【課題】 音声信号から推定した被写体の特徴に適した符号化パラメータを用いて効率的に映像信号を符号化することができる動画音声記録装置及び動画音声記録方法、並びに動画音声記録プログラムを提供する。
【解決手段】 動画音声記録装置は、音声信号及び映像信号を夫々取得し、音声符号化部101は、取得した音声信号の周波数分析を行って周波数特性を出力し、周波数特性に基づいて音声信号を符号化して符号化音声信号を出力し、音声特徴検出部102は、音声符号化部101が出力した周波数特性から検出した音声信号の特徴に基づいて映像の符号化パラメータを算出し、映像符号化部103は、取得した映像信号を符号化パラメータに基づいて符号化して符号化映像信号を出力し、多重化部104は、符号化音声信号及び符号化映像信号を多重化して映像音声多重化信号を出力し、記録部105は、映像音声多重化信号を記録媒体106に記録する。 (もっと読む)


和音の種類を決定するための装置(100)は、和音の種類のための参照ベクトルを提供するための手段(102)と、テスト信号から参照ベクトルを提供するための手段(104)と、参照ベクトルとテスト信号ベクトル(302)とを比較するための手段(106)とを含む。参照ベクトルを提供するための手段(102)は、複数の異なる参照ベクトルから和音の種類のための参照ベクトルを提供するように構成される。また、テスト信号からテスト信号ベクトルを提供するための手段(104)は、複数のテスト信号ベクトル・エレメントを有するテスト信号ベクトルを提供するように構成される。さらに、参照ベクトルとテスト信号ベクトルとを比較するための手段(106)は、参照ベクトルと、テスト信号ベクトルまたは異なるシフト値によって循環的にシフトされるテスト信号ベクトルのバージョンとを比較し、シフト値またはテスト信号ベクトルに割り当てられるさまざまな比較結果を取得し、最大の比較結果およびこれに関連するシフト値に基づいて和音の種類を決定するように構成される。 (もっと読む)


情報信号を時間表現から可変スペクトル表現に変換する装置は、情報信号のウインドウ化を行う手段(10)と、ウインドウ化情報信号をスペクトル表現に変換する手段(12)と、基本関数係数のセットを供給する手段(14)が供給した複素基本関数係数のいくつかのセットで情報信号スペクトル係数のセットの重み付けを行う手段(16)と備える。基本関数係数のセットを、ウインドウ化および変換を行うことにより、各種の周波数の基本関数から導出し、基本関数係数のいくつかのセットを、より高い周波数の基本関数に対するまったく同じ基本関数に対し供給する。ここで、これらのセットを供給するウインドウは、基本関数の各種の時間部分に関係する。可変スペクトル表現は、可変スペクトル係数の可変帯域幅を表し、効率的で正確に計算を行い、音楽分析に特に適している。 (もっと読む)


情報信号を解析するために、重要な短時間スペクトルは、情報信号から抽出され、抽出するための手段(16)は、情報信号の他の短時間スペクトルより特定の特徴により近くなるそのような短時間スペクトルを抽出するように構成されている。次に、抽出された短時間スペクトルは、ICA解析を用いて、成分信号に分解(18)され、成分信号スペクトルは、シークされる特徴に対応しているトーンを発生するトーンソースのプロファイルスペクトルを表す。情報信号の短時間スペクトルのシーケンスから、および、決定されたプロファイルスペクトルから、振幅エンベロープが、結局各々のプロファイルスペクトルのために計算(20)され、振幅エンベロープは、トーンソースのプロファイルスペクトルが全体で時間とともにどのように変わるかを示す。プロファイルスペクトルおよびそれに関連する全ての振幅エンベロープは、例えば音楽信号の場合におけるトランスクリプション目的のためにさらに評価される情報信号の記述を提供する。 (もっと読む)


音信号の特徴を記述するために、量子化ラスタに基づいて、時間とともに、少なくとも2つの音源それぞれの量子化エントリタイムのシーケンスを生成する。ここで、エントリタイムのシーケンスを用いて、少なくとも2つの音源の基礎となる共通の周期長が算出される。ここで、エントリタイムのシーケンスが、サブシーケンス長が共通の周期長と等しいサブシーケンスにそれぞれ分割される。最終的に、例えば、リズム、速度またはジャンルに対して、第1の合成したサブシーケンスと、第2の合成したサブシーケンスとにより、音信号の特徴を記述するために、すなわち、例えばパターンヒストグラム用いて、第1の音源のサブシーケンスを第1の合成したサブシーケンスに合成して、第2の音源のサブシーケンスを第2の合成したサブシーケンスに合成する。 (もっと読む)


本発明はオーディオ信号の符号化を支援する方法に関し、この方法では、該オーディオ信号の少なくとも1つのセクションは、各種の符号化フレーム長の使用を許す符号化モデルで符号化される。それぞれに最良の符号化フレーム長を簡単に選択可能とするために、該オーディオ信号の信号特性に基づいて少なくとも1つの制御パラメータを決定することを提案する。この制御パラメータは、その少なくとも1つのセクションについて可能な符号化フレーム長の選択肢を限定するために使用される。本発明は、同様に、この方法が実行されるモジュール10,11と、該モジュール10,11を含む装置1およびシステムと、この提案する方法を実行するためのソフトウェア・コードを含むソフトウェア・プログラムプロダクトとに関する。 (もっと読む)


1,411 - 1,420 / 1,456