説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

31 - 40 / 242


【課題】複数の通話端末装置間で行われる通話の通話区間を簡易な構成で正確に検出できるようにする。
【解決手段】何れかの通話端末装置を基準とした送話側チャネルと受話側チャネルの音声信号が入力される音声入力部11と、チャネル毎の音声区間と非音声区間を検出する音声検出部12と、複数チャネルの音声区間と非音声区間の情報より通話区間を検出する通話区間検出部13と、通話の開始を推測できるイベント音の存在を検出するマッチング部14と、通話区間修正部15とを備える。通話区間修正部15はイベント音が検出された時、その検出時刻で通話区間を分割し、さらに通話確定時刻が最初に検出されたイベント音の検出時刻より前で、分割により生成された一番目の通話区間と直前通話の通話区間の時間差が一定時間T1以内の時に、それら両通話区間を結合する。 (もっと読む)


【課題】室外の音声を確実に除外し、室内音源のみを検出すること。
【解決手段】互いに離間して配置された複数のマイクロフォン112A,112Bと、マイクロフォン112A,112Bで収音された音声情報の位相差に基づいて、マイクロフォンへの音声の入射角θを算出する音方向情報算出部132と、入射角θに基づいて、音源から発せられた音声の方向性を判別する音方向性判別部134と、マイクロフォン112A,112Bで収音された音声情報から、方向性が確定していると判断される音声情報のみを検出する音声検出部120と、を備える。 (もっと読む)


【課題】違和感の少ない短縮された音声信号を作る。
【解決手段】音声データを一区切り毎にブロック化して音声固まりを作り、その音声信号が有声音か無声音か無音かを識別して、音声が始まった位置を始端点とする。有声音の場合には終端に近い複数の音声波形のピーク値から推定近似線を用いて時間軸上にみなし終端点を決定し、無声音の場合にはレベル検出により終端点を決定することにより、有声音に含まれる無音部分と、無声音に含まれる聴感上では短縮できる無声部分と無音部分、音声データが存在しない無音とをカットし、再び音声信号をつなぎ合わせる。 (もっと読む)


【課題】利便性を向上できる音声記録再生装置を提供する。
【解決手段】マイク6により捉えた音声データを記録媒体5に記録して録音を行い、記録媒体5から音声データを取り出して再生を行う音声記録再生装置1において、人の音声と人の音声以外とを判別する判別手段21、22、23、24を備え、録音時に判別手段21、22、23、24によって判別した人の音声の開始位置及び終了位置を記録するとともに、再生時に前記開始位置とこれに続く前記終了位置との間を抽出して出力する。 (もっと読む)


聴覚イベント境界検出器は、入力デジタルオーディオ信号を、アンチエイリアスフィルタを用いることなくダウンサンプリングする方法を用いて、より狭い帯域の中間信号が、エイリアシングが発生している状態で得られるようにしている。イベント境界を示す当該中間信号のスペクトル変化は、適応フィルタを使用して、当該中間信号のサンプルの線形予測モデルを追跡することにより検出することができる。フィルタエラーのマグニチュードまたはパワーの変化は、入力オーディオ信号のスペクトルの変化に対応する。適応フィルタは、聴覚イベントの継続時間と一致する速度で収束するので、フィルタエラーのマグニチュードまたはパワーの変化は、イベント境界を示す。検出器は、時間−周波数変換をオーディオ信号の全帯域に用いる方法よりも複雑でない。
(もっと読む)


【課題】本発明は、マイクロホンや増幅器の品質依存性および設置場所の騒音環境に対する依存性を少なくしつつ、設置場所でのキャリブレーション作業を不要とした発声検出装置の実現を目的とする。
【解決手段】
2つの集音器にて取得した音響信号から所定方向の発声を検出する発声検出装置であって、音響信号の低周波数域成分をカットし、そのカットされた低周波数域成分に人工信号を付加した上で、両集音器からの音響信号について相互相関を計算し、所定方向での発声を検出する発声検出装置を提供する。 (もっと読む)


【課題】入力音声に騒音が重畳する場合においても適切に話速変換する。
【解決手段】話速変換処理判定部3は、音声区間判別部1が非音声区間と判別している場合であっても騒音レベル判定部4で判定される騒音レベルがしきい値以上であるときには伸長圧縮処理部2に圧縮処理を行わせない。つまり、騒音レベルがしきい値以上である場合、音声区間判別部1が音声区間を非音声区間と誤判別してしまう可能性が高くなるので、このような場合に伸長圧縮処理部2に圧縮処理を行わせないことにより、入力音声が誤って圧縮されることによって出力音声が途切れるのを防ぐことができる。 (もっと読む)


【課題】参加者の発話が、いずれの参加者の発話を聞いた後になされたものかを明確にし、参加者全体の中の話し手と聞き手との関係を正確に把握することを可能とする。
【解決手段】本発明の対話関係導出装置は、各参加者の音声データと行動データとを、参加者ごとに記憶し、記憶手段に記憶された音声データに基づいて、参加者の発話開始時刻をそれぞれ検出する。そして、発話開始時刻と、行動データとに基づいて、参加者が発話を開始する前に、他の参加者の発話が終わるのを待つ発話準備期間を検出する。これにより、ある参加者の発話期間に他の参加者がどのような状態にあるかという対話関係が明確になる。 (もっと読む)


【課題】紙雑音などのマイクロホン近傍の雑音を抑圧する雑音抑圧装置を提供する。
【解決手段】雑音抑圧装置110は、マイク素子120の収音信号から低周波数帯域の信号xl(n)と高周波数帯域の信号xh(n)とを抽出する第1および第2の帯域分割部111,112と、信号xh(n)の振幅のピーク値を検出するピーク検出部114と、信号xl(n)の単位時間あたりの平均パワを算出する平均パワ算出部113と、収音信号に含まれる入力信号x(n)の特徴を示す特徴量を、その平均パワに対するピーク値の大きさとして算出する特徴量算出部115と、特徴量の大きさに応じて、入力信号x(n)が雑音を示すか音声を示すかを判別する判別部116と、雑音を示すと判別された場合に、入力信号x(n)を抑圧する雑音抑圧部117とを備える。 (もっと読む)


【課題】音声モードを変更し、マルチモードの可変ビットレートのコード化技術の最大の性能を可能にするためのロバストな分類のための音声分類技術を提供する。
【解決手段】音声分類器は、高い割合で音声セグメントを正確に分類し、最低ビットレートでコード化し、より低いビットレートの要件を満たす。高精度の音声分類により、平均のコード化ビットレートはより低くなり、デコードされた音声の品質はより高くなる。音声分類器は、各音声フレーム毎に最大数のパラメータを検討し、各フレーム毎に多数の正確な音声モード分類を生成する。音声分類器は、変化する環境条件下で、多数の音声モードを正確に分類する。音声分類器は、外部の構成要素から分類パラメータを入力し、入力パラメータから内部分類パラメータを生成し、正規化された自己相関係数の関数の閾値を設定し、信号環境に従ってパラメータ解析器を選択し、パラメータを解析し、音声モードを分類する。 (もっと読む)


31 - 40 / 242