説明

国際特許分類[G10L19/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 冗長を減らすための音声または音響信号の分析合成技術,例.ボコーダーにおける;音声または音響信号のコード化またはデコード化,例.圧縮,拡張,ソースフィルターモデルまたは心理音響分析のためのもの (3,650)

国際特許分類[G10L19/00]の下位に属する分類

国際特許分類[G10L19/00]に分類される特許

901 - 910 / 2,383


【課題】オーディオ信号の再生速度を変換する場合において、変換後の再生速度を聴覚的に認識させることが可能な、情報処理装置、情報処理方法およびプログラムを提供する。
【解決手段】本発明によれば、入力された再生倍率を表す第1のパラメータに応じて、第2のパラメータおよび第3のパラメータを設定するパラメータ調節部と、第2のパラメータおよび第3のパラメータに基づいて、オーディオ信号の話速および前記オーディオ信号の音の高さの少なくともいずれか一方を調節する信号処理部と、を設け、信号処理部は、入力された再生倍率が所定の閾値未満であった場合には、オーディオ信号の話速を調節し、入力された再生倍率が所定の閾値以上であった場合には、オーディオ信号の話速および音の高さを調節する。 (もっと読む)


【課題】コンテンツ再生装置において、所望するコンテンツをユーザに迅速に選択させる。
【解決手段】本発明のコンテンツ再生装置10は、ユーザインターフェース最適化処理部11cが、コンテンツ情報テーブル12bを参照して、リッピングアルバム数に対するリッピングアーティスト数、リッピングジャンル数、リッピング回数の比率をそれぞれ算出する。そして、この比率に基づき、表示部13aにユーザによるコンテンツ選択のために表示させるユーザインターフェースにおいて、どのようなプレイリストを表示させるためのプレイリスト表示ボタンを配置するかを決定するユーザインターフェース最適化処理をおこなう。 (もっと読む)


【課題】 音脈分凝の原理を利用して、人間がノイズを感じないような音とするとともに、埋め込み効率、抽出精度を高めることが可能な音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置を提供する。
【解決手段】 付加情報を音響信号に埋め込む際、音響信号の所定区間から奇数番目の音響フレーム、偶数番目の音響フレームを取得し、各音響フレームの所定周波数範囲のスペクトル集合を、それぞれ1D1、1D2、1U1、1U2、2D1、2D2、2U1、2U2としたときに(a)(b)、1D1の強度値と2D2の強度値との積と、1D2の強度値と2D1の強度値との積のいずれか一方が他方より所定の比率以上に大きくなり、同時に1U1の強度値と2U2の強度値との積と、1U2の強度値と2U1の強度値との積のいずれか一方が他方より所定の比率以上に大きくなるように、各スペクトル集合の強度を変更する(c)〜(f)。 (もっと読む)


通信を処理する方法が、符号化されたフレームのサブフレームの推定励振エネルギ成分を割り出すことを含む。サブフレームのフィルタ・エネルギ成分も推定される。サブフレームの推定エネルギを割り出すことは、推定励振エネルギ成分および推定フィルタ・エネルギ成分に基づく。この方式は、通信をフルにデコードする必要なしに音声通信などの通信のフレーム・エネルギを推定することを可能にする。
(もっと読む)


【課題】再生の目的に応じて最適なコンテンツの再生を実現する。
【解決手段】入力される音声を含むコンテンツデータの再生時に、通常速度の音声を所定のタイミングで再生するコンテンツ再生装置において、前記入力されるコンテンツデータの音声の属性情報を分析する音信号分析部と、前記コンテンツデータに前記音信号分析部により得られる属性情報を対応付けて記録する記録部と、前記コンテンツデータの再生条件を設定する再生条件設定部と、前記音信号分析部により得られる音声及び非音声の出力時間長を前記再生条件に基づいて伸張し、音声の出力速度及び出力時間を調整する出力時間長調整部と、前記出力時間長調整部により調整されたコンテンツを再生する再生部とを有することにより、上記課題を解決する。 (もっと読む)


【課題】複数の素片の反復的な再生を利用者に直感的に認識させる。
【解決手段】記憶装置20は、楽音の波形を表す素片データAと楽音の特徴量Fとを、楽曲を区分した複数の素片Pの各々について記憶する。表示制御部12は、複数の単位図柄GUを円環状に配置した素片環Cを表示装置34に表示する。素片割当部14は、各単位図柄GUに素片Pを割り当てる。素片Pが割り当てられた単位図柄GUは、当該素片Pの特徴量Fに応じた態様(色相)で表示される。再生部16は、各単位図柄GUに割り当てられた素片Pの素片データAを、素片環Cにおける複数の単位図柄GUの配列の順番に再生する。 (もっと読む)


エンコード装置が、少なくとも第1のマイクロフォン(101)からの第1の音響信号と第2のマイクロフォン(103)からの第2の音響信号とを含むマルチ・チャンネル音響信号を受信するフレーム・プロセッサ(105)を備える。ITDプロセッサ(107)が次に、第1の音響信号と第2の音響信号との間の相互時間差を決定し、遅延(109、111)の組が、第1および第2の音響信号の少なくとも一方を相互時間差信号に応じて遅延させることによってマルチ・チャンネル音響信号から補償済みマルチ・チャンネル音響信号を発生させる。結合器(113)が次に、補償済みマルチ・チャンネル音響信号のチャンネルを組み合わせることによってモノラル信号を生成し、モノラル信号エンコーダ(115)がモノラル信号をエンコードする。相互時間差は、第1および第2の音響信号間の相互相関を決定することに基づくアルゴリズムによって具体的に決定しても良い。
(もっと読む)


【課題】画像中の特定物を検出可能な音声記録装置において、特定物の大きさに基づいて音声処理を行い、撮影者の画像撮影の意図に応じた音声とする。
【解決手段】特定物を検出可能な音声記録装置100において、画像中のその特定物の大きさすなわち音声記録装置100からその特定物までの距離に応じた角度にマイクの指向角(正面指向性)θ2の変化、音声信号の特定の帯域の強調等の音声処理を行う。 (もっと読む)


【課題】振幅や周期に歪がなく、クリアで一定周期のブザー音を出力できる半導体集積回路を実現する。
【解決手段】半導体集積回路100aは、音声・ブザー切換レジスタ128を有し、音声・ブザー切換レジスタ128の設定が音声の場合には、音声用のクロックCLK1および圧縮音声データI124が音声伸張回路104aに入力され、音声・ブザー切換レジスタ128の設定がブザーの場合には、ブザー用のクロックCLK2、ブザー振幅データI126が音声伸張回路104aに入力される。音声伸張回路104aは、音声データDaとブザー音データDbの両方のデータを生成し、半導体集積回路100aの出力端子から音声信号およびブザー音信号のいずれか一方が出力される。 (もっと読む)


【課題】オーディオ再生装置における早送り再生時の再生音は聴き取りづらい。
【解決手段】再生するオーディオデータにはメタデータとして曲の拍をなすビートのタイミングを表すデータを対応づけておく。早送り再生時には対応するメタデータを読み出し、オーディオデータのうちビートのタイミングを含む部分を再生部分A、ビートの間隔Cのうち残りの部分を非再生部分Bとして決定し、再生部分Aのみを順次再生して出力する。再生部分Aと非再生部分Bの時間割合は、早送り再生時に要求される再生速度によって決定する。 (もっと読む)


901 - 910 / 2,383