説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

51 - 60 / 242


【課題】雑音環境下であって、なおかつ、目的信号の到来方向を正確に知ることが出来ない状況において、少ない計算量で精度よく目的信号区間を推定する。
【解決手段】複数のセンサで観測された各信号を所定の時間区間であるフレーム毎に切り出し、切り出された各センサについての各フレームの信号を周波数領域に変換し、時間周波数ビン毎の周波数領域信号を各センサについて生成する。また、基本周波数を推定し、基本周波数又はその倍音成分近傍のグリッドのみについて、基準センサに対応する周波数領域信号を基準として、当該基準センサ以外のセンサに対応する各周波数領域信号を正規化し、時間周波数ビン毎の正規化信号値を生成する。そして、グリッド毎に正規化信号値の偏在性を示す偏在値を求め、それらを用いてフレーム毎の偏在性を示す偏在性指標値を算出し、当該偏在性指標値を指標とし、各フレームが目的信号区間に対応するか否かを判定する。 (もっと読む)


【課題】音声データの総量を削減しつつ、良好な音声データの再生を可能にする音声データ作成方法、記憶装置、集積回路装置及び音声再生システムを提供する。
【解決手段】音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を選定する分割箇所選定手順(ステップS102)と、分割箇所選定手順で選定した分割箇所で音声データを分割する分割手順(ステップS104)とを含む。 (もっと読む)


【課題】楽曲部分の終端位置を検出することにより、録音途中で楽曲の途切れがないようにする。
【解決手段】音声記録再生装置は、デジタル音声データの周波数解析を行い、楽曲部分の開始および終端位置を検出する楽曲検出手段21と、仮終端位置記憶手段22と、仮記録消去手段23と、を備え、楽曲検出手段21は、基準値と、それより高い第1の閾値と、それよりも低い第2の閾値とを有し、デジタル音楽データの周波数を解析して得られた解析値が第1の閾値より高いことを検出すると記録を開始し、第2の閾値より低いことを検出すると楽曲部分の終端位置と判別し、仮終端位置記憶手段22に仮終端位置を記憶して、所定時間周波数監視と楽曲部分の記録を継続し、その間に解析値が第1の閾値より高いことを検出しなければ、仮記録消去手段23は仮終端位置以降の記録を削除する。 (もっと読む)


【課題】音声信号から有音部分を検出する検出手段と、音声信号の時間軸を伸縮する時間軸加工手段と、音声信号の基本周波数を変更する基本周波数加工手段と、前記時間軸加工手段が前記検出手段で検出された有音部分を伸縮しているとき、前記基本周波数加工手段で基本周波数が変更された音声信号を出力する出力手段とを設けることにより、時間軸加工処理において生ずる聴感上の印象の変化を軽減するという効果を有するディジタル音声処理装置および音声処理方法を提供する。
【解決手段】時間軸加工処理手段2、基本周波数変換処理手段3、時間軸加工量制御手段4、基本周波数変換量制御手段5、制御手段6、データ蓄積部7、および有音検出手段8とを備え、時間軸加工処理が行われた信号に対し、基本周波数変化量制御部によって音声信号から得られる基本周波数変化量に応じて基本周波数変換処理を行うことにより、時間軸加工処理において生ずる聴感上の印象の変化を軽減する。 (もっと読む)


【課題】シーンに応じて、元の映像コンテンツ中の音声信号を効果的に残しながら他の音声信号を付加すること。
【解決手段】記録再生装置100は、映像コンテンツの画像信号から顔画像領域を検出して顔評価値Tfを算出し、音声信号から声を検出して声評価値Tvを算出する。記録再生装置100は、顔評価値が閾値Tfs以上であり、かつ声評価値Tvが閾値Tvs以上である場合には、BGM音声の重み係数kを極力小さいk1に設定し、顔評価値が閾値Tfs未満であり、かつ声評価値Tvが閾値Tvs未満である場合には、重み係数kを極力大きいk2に設定し、顔評価値及び声評価値のいずれかが各閾値以上である場合には、顔評価値及び声評価値に応じて重み係数k及びmを設定する。 (もっと読む)


本発明の一つ以上の実施形態は、信号の符号化方式の決定方法及び装置に係り、現在フレームが黙音に該当するかどうかと、音声または音楽が存在する可能性の履歴とを用いて信号の符号化方式を決定または変更する。
(もっと読む)


【課題】再生時に所望の録音箇所を探し易い録音方式とした録音装置10を提供する。
【解決手段】録音開始に伴い、新規録音ファイルをオープンして、それにマイクロホン11a又は11bからのオーディオ信号のオーディオデータを格納する(S42,S44,S45)。オーディオ信号を出力している方のマイクロホンが入れ替わったか否かを監視し(S50)、入れ替わりがあれば、それまでオーディオデータを格納していた録音ファイルをクローズして、新規の録音ファイルをオープンし(S52→S53)、新規の録音ファイルへマイクロホン11a又は11bからのオーディオ信号のオーディオデータを格納する(S54〜S56)。結果、各発言者の各発言ごとに、録音ファイルが生成される。 (もっと読む)


【課題】テレビ会議システム等における音響系の接続状態を自動で検出して、誤接続を的確に知らせることができる技術を提供すること。
【解決手段】本発明は、音声を取り込むマイク入力端子T1と、相手方から送られてきた音声を出力するスピーカ出力端子T2と、マイク入力端子T1で取り込んだ音声および相手方から送られてきた音声の合成を出力する録音用出力端子T3と、スピーカ出力端子T2に第1の波形から成る音声を送り、録音用出力端子T3に第1の波形とは異なる第2の波形から成る音声を送り、マイク入力端子T1で取り込んだ音声の波形から、マイク入力端子T1およびスピーカ出力端子T2ならびに録音用出力端子T3に対する機器の接続状態を判断する信号処理部10とを有する音声処理装置である。 (もっと読む)


【課題】周期的な雑音下においても音声区間を正しく検出できる音声区間検出装置および音声区間検出方法を提供する。
【解決手段】音を音入力回路2によって音の信号に変換し、連続した音の信号をフレーム分割回路3によって所定時間間隔のフレームに分割する。分割された各フレームごとに、パワー情報抽出回路4が音の信号に含まれるパワー情報を抽出し、調波情報抽出回路5が音の信号に含まれる調波情報を抽出する。音声区間決定回路6は、抽出されたパワー情報と、調波情報とに基づいて、音声区間を決定し、音声認識回路7が音声区間の音声を認識する。 (もっと読む)


音声処理システムにおいて、当該システムが、(a)検出時間に第1マイクロホンによって検出される第1入力信号と、検出時間に第2マイクロホンによって検出される第2入力信号と、検出時間に骨導マイクロホンによって検出される第3入力信号とを処理し、第1、第2、および第3入力信号に応答する訂正信号を生成するよう構成されたプロセッサと、(b)外部システムに前記訂正信号を提供するように構成された通信インタフェースとを具える。 (もっと読む)


51 - 60 / 242