説明

国際特許分類[G10L21/04]の内容

国際特許分類[G10L21/04]に分類される特許

81 - 90 / 666


【課題】音声信号のピッチを変更する技術において、出力される音声信号のレベルの変動を軽減することのできる技術を提供する。
【解決手段】音声処理装置のDSP19は、波形メモリ18からの2系統の出力信号を交互にクロスフェードして出力する。相関度計測部23は、入力される音声データの自己相関値を算出する。周期性判定部24は、算出された自己相関値を予め定められた閾値と比較し、両者の差分に応じて音声データが周期性を有するか否かを判定する。制御部22は、周期性判定部24の判定結果に応じてクロスフェードの態様を切り替えるようにクロスフェードゲイン計算部26を制御する。 (もっと読む)


【課題】音声信号のピッチを変換する技術において、音質と演算負荷のバランスを調整することのできる技術を提供する。
【解決手段】音声処理装置のDSP19は、波形メモリ18からの音声データの読出速度を変更することによって音声データのピッチを変換する。補間部24は、波形メモリ18から読み出された音声データを、演算負荷の異なる複数の補間処理アルゴリズムのいずれかを用いて補間を行う。DSP負荷計測部23は、DSP19の処理負荷を計測する。制御部22は、DSP負荷計測部23の計測結果に応じて補間部24が行う補間処理を切り替える。 (もっと読む)


【課題】 入力音声信号のピッチを検出することが困難な区間においても、ユーザに不自然なノイズ感を生じさせることの少ないハーモニー音声信号を生成する。
【解決手段】 入力音声信号のピッチを検出できた場合には該検出したピッチを保持すると共に該ピッチに基づいて入力音高(音名に対応した音高)を特定する一方で、ピッチを検出できない場合には直前に保持されたピッチに基づいて入力音高を特定する。直前に保持されたピッチに基づいて入力音高を特定することによって、ピッチシフトする元の音高を明確にすると共にピッチシフト量を算出することができるようになる。こうすると、特別なデータを用意せずとも、入力音声信号のピッチを検出できない区間について、相前後する母音区間におけるピッチとの不連続性が小さくまた音色の連続性を保持してなり、ユーザに不自然なノイズ感を生じさせることの少ないハーモニー音声信号を生成することができるようになる。 (もっと読む)


【課題】演算量が少なく、エイリアシングのない高調波を生成できる、簡易な構成をした高調波生成方法、高調波生成装置、及び、プログラムを提供する。
【解決手段】高調波生成回路100は、LPF10と、乗算器20,40と、減算器30と、から構成されている。高調波生成回路100にディジタルオーディオ信号が入力されると、LPF10は入力されたディジタルオーディオ信号をこのディジタルオーディオ信号のサンプリング周波数の1/4以下の周波数に帯域制限する。乗算器20は、この帯域制限されたディジタルオーディオ信号を2乗する。減算器30は、2乗されたディジタルオーディオ信号から直流成分を減算する。乗算器40は直流成分を除かれたディジタルオーディオ信号の振幅を調整する。 (もっと読む)


【課題】姿勢に応じて、違和感のない自然な音声を出力する。
【解決手段】ロボット4は、基体(基体41)に可動連結した可動部(例えば、頭部42)の駆動を制御する駆動制御手段(制御部100)と、音声を生成する音声生成手段(音声生成部110)と、前記音声生成手段において生成された音声を出力する音声出力手段(音声出力部140L、140R)とを有し、前記音声生成手段は、前記駆動制御手段によって制御される前記可動部の前記基体に対する姿勢に基づいて、生成する音声を補正する。 (もっと読む)


【課題】取得したデジタル音声信号に応じて適切に高周波数成分を付加することで、より原音に近いデジタル音声信号を生成する。
【解決手段】本発明の音声処理装置100は、所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断する信号分析部124と、信号分析部がデジタル音声信号に高周波数成分が含まれていると判断したか否かに応じて異なる係数に基づき、デジタル音声信号の振幅を拡大するような補正値を生成する補正値生成部130と、デジタル音声信号に補正値を加算する加算部134と、を備える。 (もっと読む)


【課題】 マイクロフォン等が収録した音に含まれる声のうち、注意深く聞くと発声内容を識別できてしまう声を、聞き取り難くすることが困難であった。
【解決手段】 本発明の情報処理装置は、第1の収録装置から収録された第1の音と、前記第1の収録装置と異なる第2の収録装置から収録された第2の音とを取得し、前記前記第1の音を周波数分析して、声を示す周波数帯域を決定し、前記第2の音を示す周波数成分のうち、前記周波数帯域の周波数成分を変更し、前記周波数帯域の周波数成分が変更された前記第2の音を出力する。 (もっと読む)


【課題】ICカード化された運転免許証に記憶された生年月日から正確に年齢を判別し、ユーザの実際の年齢に好適な音声信号を出力する。
【解決手段】本発明では、ナビゲーション装置1などに代表される音響装置において、制御部10が運転免許証読み取り部15を制御して運転免許証2からその保有者の生年月日を取得し、正確に年齢を判別する。そして、制御部10は、取得した運転手の生年月日に基づいて、音声信号を出力するときの音域や音量などの伝達特性を決定する。そして、決定した音域や音量などの伝達特性に基づいて音声補正部18を設定し、スピーカ17にて音声を出力する。 (もっと読む)


オーディオ信号変更装置は、エンベロープ形状決定部、フィルターバンク処理部、信号処理部、結合部及びエンベロープ成形部を含む。エンベロープ形状決定部は、時間領域入力オーディオ信号を表す周波数領域オーディオ信号に基づきエンベロープ形状係数を決定し、フィルターバンク処理部は、周波数領域オーディオ信号に基づき、複数のバンドパス信号をサブバンド領域で生成する。さらに、複数のサブバンド領域バンドパス信号のうちの一つのサブバンド領域バンドパス信号を所定の変更目標に基づき変更する。結合部は、時間領域オーディオ信号を得るために、変更後のサブバンド領域バンドパス信号を含むサブバンド領域バンドパス信号の少なくとも一部を結合する。さらに、エンベロープ成形部は、成形されたオーディオ信号を得るために、時間領域オーディオ信号のエンベロープをエンベロープ形状係数に基づき成形するか、変更後のサブバンド領域バンドパス信号を含む複数のサブバンド領域バンドパス信号のエンベロープをエンベロープ形状係数に基づき成形するか、または、サブバンド領域バンドパス信号が信号処理部によって変更される前に、複数のサブバンド領域バンドパス信号のエンベロープをエンベロープ形状係数に基づき成形する。 (もっと読む)


【課題】 フォルマント強調より効果的に明瞭度を向上できる音声強調装置を提供する。
【解決手段】 本発明は、音声の明瞭度を向上させる音声強調装置に関する。そして、入力された音声信号の音高を推定する音高推定手段と、推定された音高から音高の調整量を決定する音高調整量決定手段と、音高調整量に基づき、入力された音声信号の音高を変化させる音高変更手段とを有することを特徴とする。音高操作は、人間の聴覚は、約4kHz付近が最も敏感に聞き取ることができ、この周波数から離れるほど鈍感になるという特性に合致し、より効果的に明瞭度を向上させることができる。 (もっと読む)


81 - 90 / 666