説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

141 - 150 / 1,456


【課題】会議で行われた会話情報を記録して、記録した会話情報からコミュニケーション状態を把握して、会議の記録結果を人間の行動様式に近い自然な方法で情報を検索できるような会議支援装置を安価に提供する。
【解決手段】会議に参加したユーザによる発話を集音し、集音した音声情報を記録し、集音したユーザによる発話の発話方向を検出し、記録した発話情報の群から会話状況を推測し、会議の資料情報を表示し、表示した資料情報と推定した会話状況情報とを関連付けて記録する。 (もっと読む)


【課題】ユーザに提示する情報を、ユーザにとって適切な音声で提示することができる音声情報提示装置を提供する。
【解決手段】
ユーザの音声を取得する取得手段120と、取得されたユーザの音声を保持する保持手段130と、ユーザの音声の基本周波数を検出する基本周波数検出手段120と、音声に係るユーザの性別を識別する識別手段120と、ユーザが女性であると識別された場合に、ユーザの音声において、基本周波数を男性の一般的な基本周波数の周波数帯域にシフトさせることにより、ユーザの音声を変更して情報提示用音声を生成する第1生成手段120と、ユーザが男性であると識別された場合に、ユーザの音声において、基本周波数を女性の一般的な基本周波数の周波数帯域にシフトさせることにより、ユーザの音声を変更して情報提示用音声を生成する第2生成手段120と、情報提示用音声を、ユーザに提示する提示手段140とを有することを特徴とする音声情報提示装置。 (もっと読む)


【課題】 和音信号や、音声信号の周波数変化をより適切に解析することが可能な音響信号の符号化方法および装置を提供する。
【解決手段】 時系列のJ個のサンプル列により構成されるデジタル音響信号に対して、T(T<J)個のサンプルで構成される単位区間を、固定間隔でずらしながら全区間に渡って設定し、各単位区間に対して離散フーリエ変換による解析を行う。そして、解析結果を直前の単位区間と比較し、所定の条件を満たす場合に、その単位区間を選出単位区間として選出し、一般化調和解析を実行する。この解析結果に基づいて、選出単位区間において所定数の符号コードを作成する。 (もっと読む)


【課題】音声信号に含まれる位相情報を利用して、SN比が極めて低い条件下における音声認識の精度を高めることが可能な雑音に強い特徴量を抽出する。
【解決手段】音声特徴量を出力する音声信号処理システムは、入力された音声信号を、隣接するフレームのペアが音声信号の1周期以上のフレーム・シフト幅を有しかつ一定以上のオーバーラップ部分を有するように、フレーム単位に分割し、フレーム毎に離散フーリエ変換を行い、上記ペアのCSP係数を算出し、上記ペア毎に、音声の波が一周期以上ずれるような所定の探索範囲内でCSP係数の最大値を取得し、フレーム順に並べたCSP係数の最大値の時系列データを、音声特徴量として生成する。 (もっと読む)


【課題】状況に応じてエコー抑圧ゲインの大きさを変更し、十分にエコー抑圧をしながら、音声歪を同時に少なくする反響消去技術を提供する。
【解決手段】本発明に係る反響消去技術は、収音信号に基づいて得られる信号D(f,k)及び受話信号X(f,k)を用いて、エコー抑圧ゲインGb^(f,k)を求め、信号D(f,k)からエコー成分を取り除いた信号D’(f,k)を用いて、抑圧対象の信号が母音であるか子音であるかを判定し、抑圧対象の信号が母音であると判定された場合にはγを緩和係数β(k)とし、それ以外の場合にはγ(<γ)を緩和係数β(k)とし、信号D(f,k)とエコー抑圧ゲインGb^(f,k)と緩和係数β(k)との積から信号D(f,k)と緩和係数β(k)との積を減算しD(f,k)に加算した結果が得られるような処理を行う。 (もっと読む)


【課題】マイクロホンを入力操作に用い、かつ簡易な音声信号処理で継続的な入力操作を検知する。
【解決手段】マイクロホンによって集音された音声信号についての摺動操作によって生ずる摺動音声信号成分のエネルギーレベルを監視する。そして、エネルギーレベルが第1のレベル以上となっている時間が第1の時間以上継続した場合に、摺動操作の開始と判定する。また摺動音声信号成分のエネルギーレベルが第2のレベル未満となっている時間が第2の時間継続した場合に、摺動操作の終了と判定する。これらの摺動操作の判定に応じて、所定の制御処理を行う。 (もっと読む)


【課題】音質劣化の改善されたノイズ低減処理を実現する。
【解決手段】複数のマイクロホンによって得られた複数チャンネルの音声信号について、第1〜第nの帯域毎に、それぞれ音源方向を判定する。そして第1〜第nの帯域についての音声信号の強調又は減衰を行う第1〜第nのフィルタ58,59,60を直列接続する。第1〜第nのフィルタのそれぞれは、第1〜第nの帯域の音源方向に基づいて強調又は減衰を行う。フィルタの直列接続により、並列処理の際の位相の不整合による音質劣化をなくす。 (もっと読む)


【課題】音響信号などの信号から高精度に特徴を抽出する信号特徴抽出装置および信号特徴抽出方法を提供すること。
【解決手段】信号特徴抽出装置は、所定期間だけサンプリングされたデジタル入力信号を周波数軸に変換する複素フーリエ変換手段、複素フーリエ変換手段において変換されたデータから高次局所相関特徴データを抽出する特徴抽出手段を備える。特徴抽出手段の後あるいは前に所定の帯域毎にデータを加算するフィルター手段を備えてもよい。音声、音響信号あるいはその他の時系列信号から高精度に特徴を抽出することができ、位相に特徴がある信号の識別精度が向上する。 (もっと読む)


【課題】本発明は、主観評価実験を行うことなく、客観的な臨場感を推定できる臨場感推定装置を提供する。
【解決手段】臨場感推定装置1は、再生音場音響信号Bを音響分析して再生音場音響分析値を算出する音響信号分析手段10と、音響分析の結果が心理効果に寄与する度合いを予め学習した寄与率を記憶するコンテンツデータベース30と、再生音場音響分析値に寄与率を乗じて、心理効果ごとの再生音場における心理効果推定値を算出すると共に、心理効果ごとの心理効果推定値を総和することで、再生音場音響信号を再生した音から受ける心理効果の影響度である心理効果影響度を算出する心理効果影響度算出手段41と、心理効果影響度算出手段41が算出した再生音場における心理効果影響度を臨場感の推定結果として提示する心理効果影響度提示手段43とを備える。 (もっと読む)


【課題】非定常雑音を含む入力音信号でも、入力信号のパワーに対する閾値を設定したり、複雑な演算処理を行ったりしなくても、正確に音信号区間を抽出する。
【解決手段】音によって発生する振動のアナログ音信号が入力すると、サンプリングして量子化することでデジタル音信号に変換し(ステップ101)、ステップ101で取得したデジタル音信号に基づき振幅値を時系列でグラフ化した2次元画像を作成して2値画像データとし(ステップ102)、ステップ102で作成した2値画像データに、予め定められた数の周辺画素の値に0が1つ以上あると注目画素の値を1から0に変換する収縮処理を施して、当該2値画像データに存在している雑音区間を削除して塊化された領域となる音信号区間を抽出し(ステップ103)、ステップ103で抽出した音信号区間を特定するために、2値画像データにおける塊化された領域の起点と終点とを時系列で検出する(ステップ106)。 (もっと読む)


141 - 150 / 1,456