説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

101 - 110 / 242


【課題】ユーザが音声の内容の切り換えを手動で行う必要が無く、通話相手先に目的の音声を高いSN比で伝達することができる放収音システムを提供する。
【解決手段】演算回路63は、ライン入力端子8から入力された音声信号からマイク2に収音される成分(擬似収音信号)を生成する。減算回路61は、マイク2から入力された収音信号から上記擬似収音信号を除去する。音声検出部62は、特定の音声(会話音声、家電の報知音)を認識し、音声抽出情報を切換部65に出力する。切換部65は、音声抽出情報を入力した場合、マイク2の収音信号をエコーキャンセラ4に出力し、音声抽出情報を入力しない場合、ライン入力端子8から入力された信号をエコーキャンセラ4に出力する。 (もっと読む)


【課題】複数の通話端末装置間で行われる通話の通話区間を正確に推定する。
【解決手段】音声入力部11に、何れかの上記通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力され、音声検出部12が、送話側チャネルの音声信号と受話側チャネルの音声信号とを用い、チャネル毎の音声区間と非音声区間とを検出し、通話区間推定部13が、検出された複数チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する。 (もっと読む)


【課題】精度の高い音声判別を実現することを課題とする。
【解決手段】音声を判別する音声判別装置と各種操作を実行するカーナビとがネットワークなどを介して相互に通信可能に接続されている。また、音声判別装置は、各種音声を受け付けるマイクを備えている。このような構成において、音声判別装置は、入力された音声信号のパワーから発話された区間を示す発話区間を特定し、特定された発話区間における音声信号のパワーとピッチとから音声信号の特徴を示す音響特徴量を算出し、特定された発話区間の前の区間および/または後ろの区間を特定し、特定した区間における音声信号のパワーとピッチとから音響特徴量を算出し、算出された発話区間の音響特徴量と、算出された発話区間の前後の区間の音響特徴量とから、入力された音声信号が、接続される各種処理を実行する処理装置に対して処理の実行を要求するシステム要求であるか否かを判別する。 (もっと読む)


【課題】破裂音や促音に異聴が生じないように話速を変換する。
【解決手段】本話速変換方法は、音声データにおいて、促音及び破裂音の前の無音区間を含む閉鎖を除き、文と文の間の無音区間を含むポーズを特定する特定ステップと、音声データにおいて、ポーズに当該ポーズ以外の区間より加重的に速度変換処理を施すステップとを含む。このようにポーズと閉鎖を区別して特定することによって、ポーズ以外の区間に大きな負担を掛けずに話速変換を行うことができるようになり、破裂音や促音の異聴が生じなくなる。 (もっと読む)


【課題】コーパスベース音声合成方式において、母音と無音の接続部分に起因する音質劣化を低減する。
【解決手段】音声素片を格納した音声コーパス200を用いて音声合成を行う方法であって、合成する音声の音素列を受け取る入力ステップと、音素列に対応した音声素片、音素環境を音声コーパス200から選択する選択ステップと、入力ステップで受け取った音素列の中から、母音素片であって直後に無音が続く箇所で、選択ステップで選択した音声素片、音素環境を抽出する抽出ステップと、抽出ステップで抽出した母音素片の終端部分に音量フェードアウト処理を施す音量調節ステップと、を有する。 (もっと読む)


【課題】 入力信号のレベルの変動に依存せずに入力信号の特有な状態を検出でき、又は、特有な状態の検出時間を短縮できるようにする。
【解決手段】 本発明の信号状態検出装置は、主信号及び不要信号を含む不要信号消去対象信号と、不要信号消去対象信号から不要信号を消去するために、適応フィルタを用いて形成された擬似不要信号との相関度合を表す値を算出する相関算出手段と、算出された相関度合を表す値の変化傾向を算出する変化傾向算出手段と、相関算出手段への入力信号レベルに応じて、閾値を変化させる閾値可変手段と、算出された変化傾向と変化された閾値とに基づいて、第1の状態か第2の状態かを判定する状態検出手段とを有する。 (もっと読む)


【課題】簡単かつ高速に、雑音/非雑音区間の判別、あるいは音楽区間と音声区間と雑音区間に分類することを可能とするオーディオ情報分類装置を提供することにある。
【解決手段】有音判定部4はエネルギー分散演算部3で求められた値σが閾値より大きい時有音と判定する。有音と判定されると、メモリ5に格納されていたオーディオ情報が読み出されて、全サブバンドエネルギー重心演算部11に入力される。該演算部11ではサブバンドエネルギー重心Giが求められ、エネルギー重心平均・分散演算部12ではエネルギー重心平均Eg と分散σが求められる。雑音識別部13では、周波数軸上のエネルギー重心の分布により雑音区間か否かを判別する。 (もっと読む)


【課題】複数チャンネルで入力される音声データを台詞毎にチャンネル単位で交互に繰り返し再生できる音声再生装置を提供する。
【解決手段】音声再生装置(As)において、無音検出器(4)は入力された2チャンネルの音声信号(Ss1、Ss2)を所定時間長さを有する音声フレーム(Sf)単位で有音か無音かを判定し、字幕デコーダ(5)は入力された字幕信号(Sb)をデコードして字幕表示タイミングを検出し、台詞部判定器(8)は前記音声フレーム(Sf)が台詞部であるか否かを判断し、音声バッファ切替器(7)は前記音声信号(Ss1、Ss2)を音声フレーム単位で一時的に保存すると共に、当該音声信号(Ss1、Ss2)を音声フレーム単位(Sf、F、Sd)で任意に再生し、制御器(6)は出力させる音声フレーム(Sf、F)と当該音声フレーム(Sf)の再生位置を前記音声バッファ切替器(7)に指示(Sc)する。 (もっと読む)


【課題】近傍音源からの音響信号を高精度に特定する音響判定方法、音響判定装置及びコンピュータプログラムの提供。
【解決手段】音響判定装置1は、複数の音響受付部にて、夫々音響信号を受け付け(S101)、所定時間長のフレームを生成する(S103)。音響判定装置1は、フレーム単位の音響信号をFFT処理して周波数軸上の信号である位相スペクトル及び振幅スペクトルに変換し(S104)、各音響信号間の周波数毎の位相スペクトルの差を位相差として算出し(S106)、処理の対象とする周波数を選択する(S107)。音響判定装置1は、選択した周波数の位相差の絶対値が、第1閾値以上である周波数の割合を算出し(S111)、算出した割合が第2閾値以下である場合(S112:YES)、当該フレームに最近傍の音源からの音響信号を含むと判定する(S113)。 (もっと読む)


【課題】雑音環境下においても音声区間をより精度よく検出できる音声区間検出装置および音声区間検出方法を提供する。
【解決手段】現在の区間におけるしきい値Q(τ)を算出し、パワースペクトルの平均値P(τ)が所定の区間連続してしきい値Q(τ)以下であれば、新たなしきい値Q(τ)として直前の区間までの所定の区間におけるPの平均値のα倍を用い、そうでなければ、新たなしきい値として直前の区間の値Q(τ−1)を用い(SP2〜SP4)、現在の区間における平均値Pを算出して(SP5)、変数c,c,cをセットし(SP6〜SP11)、音声区間フラグの状態と変数の値とに基づいて音声区間フラグをセットまたはクリアし(SP12〜SP17)、τを+1して次のフレームにおける平均値P(τ)に基づいて音声区間を判別する(SP18)。 (もっと読む)


101 - 110 / 242