説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

161 - 170 / 1,255


【課題】1ビットオーディオ信号の処理をプログラミングの簡素化を図りながら実行可能な装置を提供すること。
【解決手段】ビットストリームが与えられると、演算部110は、フェードカーブ記憶部120から順次、最小値から最大値までの値の小さなものから、フェードカーブを定義している実数データを取り出して演算を行うが、この際ビットストリームがデジタル値「1」の場合には、取り出してきたフェードカーブ定義値の符号部Aを「0」に置き換えて、指数部B及び仮数部Cをそのまま出力する一方、デジタル値「0」の場合には取り出してきたフェードカーブ定義値の符号部Aを「1」に置き換えて、指数部B及び仮数部Cをそのまま出力するので、フェード処理が極めて簡素な構成で実現可能となる。 (もっと読む)


【課題】ICレコーダのような録音装置において、ハードウエアの性能を最大限生かしつつ、ユーザの録音レベルの設定が多少大きすぎあるいは小さすぎた何れの場合であっても、クリップ歪の発生や録音音声がノイズに埋もれてしまうことなどを避けた録音データを取得することができ、例えば録音後に直ちにCDに焼けるデータを取得することができるようにすることを目的とする。
【解決手段】音声をデジタル録音する録音装置であって、入力音声に対して複数系列のそれぞれ録音レベルが異なる信号処理を行うことにより複数系列のデジタル音声信号を生成し、それらの複数系列のデジタル音声信号をそれぞれ録音データとして記憶手段に記録する。レベルオーバーが生じた時間位置をログファイルに記録する。複数系列の録音を行う際のサンプリング周波数Fs2とビット数B2と系列数nはハードウエアを効率的に使用できるように選択する。 (もっと読む)


【課題】システム全体のコストアップを抑制しつつ、周囲騒音を除去する。
【解決手段】呼制御部15により、呼出元インターホン20Aと電話機30とを接続する際、呼出元インターホン20Aとは異なるモニタ用インターホン20Bから、当該モニタ用インターホン20Bのマイクで得られた周囲騒音を示す周囲音声データの受信を開始し、音声処理部13により、中継処理部12で電話機30へ転送する呼出元インターホン20Aからの通話音声データについて、当該通話音声データと時刻同期する周囲音声データを中継処理部12で一時保存した周囲音声データから取得し、取得した当該周囲音声データを用いて当該通話音声データに含まれる周囲音声成分を除去する。 (もっと読む)


【課題】雑音の誤検出による応答音声の中断の発生を抑えること。
【解決手段】音声対話装置は、入力音声に含まれる応答音声のエコーを除去したエコー除去音声の始端と終端を検出する音声検出部8と、前記始端が検出されてから所定期間が経過した時点で前記終端が検出されていないときに応答中断指令を出力する応答中断制御部11と、応答中断制御部11から前記応答中断指令を受け取ると応答音声出力部に応答音声の出力を中断させる対話制御部3と、を備える。 (もっと読む)


【課題】混合信号に対する音源分離を高精度かつ計算量を削減して行うことを可能とする装置、方法を提供する。
【解決手段】複数音源の混合信号に基づいて生成した観測信号から選択された第1周波数ビンに対して1段目の分離処理を実行する。例えば独立成分分析(ICA)を適用した学習により第1分離結果を生成する。さらに第1分離結果に基づいてチャンネル対応の時間方向のパワー変化に相当するエンベロープを求め。エンベロープを固定値としたスコア関数を適用して第2周波数ビンに対して2段目の分離処理を実行して第2分離結果を取得する。最後に第1,第2分離結果を統合して最終分離結果を生成する。この処理により学習処理の計算量が大幅に削減される。 (もっと読む)


【課題】様々な遅延量を持つ混合音信号について遅延量を考慮した高精度な分離処理を可能とする構成を提供する。
【解決手段】入力音信号を時間周波数領域に変換して生成した観測信号スペクトログラムを時間周波数領域において畳み込み混合された観測信号として解釈し、畳み込み混合を解く独立成分分析により信号分離を行なう、または観測信号スペクトログラムに対する短時間フーリエ変換(STFT)により生成したモジュレーション・スペクトログラムを瞬時混合として解釈し、瞬時混合を解く独立成分分析によって信号分離結果を生成する。本構成により直接波、反射波など様々な遅延量を持つ混合音信号について遅延量を考慮した高精度な分離処理が実現される。 (もっと読む)


【課題】音声信号が有する音質的特徴を可能な限り損なうことなく、複数の音源からの音声を含む音声信号から所望の成分を取得すること。
【解決手段】複数の音源からの音声を含む音声信号の周波数スペクトルについて、当該周波数スペクトルを構成する音源ごとの成分を抽出する抽出部と、前記抽出部により抽出された各成分を、所定の分類条件に従って2つ以上のクラスのいずれかに分類する分類部と、前記分類部により第1のクラスに分類された成分から合成される第1の合成スペクトル及び前記分類部により第2のクラスに分類された成分から合成される第2の合成スペクトルを用いて、適応フィルタの特性を調整する調整部と、前記調整部により特性が調整された前記適応フィルタを前記音声信号に適用するフィルタリング部と、を備える信号処理装置を提供する。 (もっと読む)


【課題】混合音から楽器音を分離・抽出する際の精度を向上させた楽器音分離装置、及びプログラムの提供。
【解決手段】音源分離処理では、スペクトル振幅値tusp(twi,fi)に対して、1つの特定音から導出されたスペクトル振幅値ntsp(twi,fi)の相関値が最大となる、特定音範囲に対応する対応範囲を特定する。そして、特定された対応範囲において、振幅比率krを導出して、その導出された振幅比率krを、スペクトル振幅値ntsp(twi,fi)に乗算することで、特定音に対応する楽音推移tuwfでの楽器音の複素スペクトルを表す分離スペクトルを導出する(S310)。その分離スペクトルを逆フーリエ変換して、区間推移を導出し(S320)、その導出された区間推移にて、楽器音推移trwfにおける対応範囲を置換することで、楽器音推移trwfを新たに更新する(S330)。 (もっと読む)


【課題】エコーキャンセリングしたい音源が、電気的に接続していなくても、当該音源からの音に対してエコーキャンセル処理を確実に施す。
【解決手段】収音装置10のマイクロホンMCからの収音信号Ssはエコーキャンセル部12に与えられるともに音声認識サーバ20へ与えられる。音声認識サーバ20は収音信号Ssに基づいてコンテンツ情報Cimとタイミング情報Ctpとを検出する。コンテンツサーバ30はコンテンツ情報Cimに基づいてコンテンツ音声ファイルCmを読み出す。収音装置10の音声再生部11は、コンテンツ音声ファイルCmをデコードして、タイミング情報Ctpに基づくタイミングで再生し、再生音信号Smをエコーキャンセル部12へ出力する。エコーキャンセル部12は、再生音信号Smに基づいて、収音信号Ssのエコーキャンセル処理を行う。 (もっと読む)


【課題】歌声の周波数構造に拘わらず、歌声と演奏音とを含む混合音から、歌声を抽出可能な歌声分離装置の提供
【解決手段】歌声分離処理では、スペクトル振幅値tusp(twi,fi)に対して、1つの歌声素片siから導出されたスペクトル振幅値vssp(twi,fi)の相関値が最大となる特定範囲を特定する。そして、特定範囲に対して振幅比率krを導出して(S240)、その導出された振幅比率krを、スペクトル振幅値tusp(twi,fi)に乗算することで、スペクトル振幅値vscpsp(twi,fi)を導出する(S250)。そのスペクトル振幅値vscpsp(twi,fi)を逆フーリエ変換して区間推移vscpwfを導出し(S270)、その導出された区間推移vscpwfにて、歌声推移vowfにおける特定範囲を置換することで、歌声推移vowfを更新する(S280)。 (もっと読む)


161 - 170 / 1,255