説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

1 - 10 / 242


【課題】通信網を介して加入者端末機に送信されるオーディオ信号の出力改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置を提供する。
【解決手段】本発明は、通信網を介して加入者端末機に送信されるオーディオ信号を処理してオーディオ信号を符号化するコーデックモジュールでオーディオ信号を音声信号として判断できるようにすることで、加入者端末機に送信されるオーディオ信号の音質低下を防ぐオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置に関する。本発明によれば、通信網を介して送信されるオーディオ信号を音声コーデックを用いて前処理することで、通信網を介して該当するオーディオ信号が送信されるときに、コーデックモジュールで該当するオーディオ信号を音声として判断する確率を高めることができる。 (もっと読む)


【課題】雑音環境下における対象音の音区間を検出可能とする音認識方法及び装置の提供。
【解決手段】雑音環境下における周期定常性を持つ対象音の音区間を検出可能とする音認識方法であって、音入力手段によりアナログ音響信号を採取し、フレームによって構成されるデジタル波形信号に変換する第1ステップと、デジタル波形信号をフレーム単位で解析して自己相関関数及び2次自己相関関数を算出する第2ステップと、各フレームについて算出した2次自己相関関数の差分絶対値の和が予め設定した閾値を超える範囲を音区間と判定する第3ステップと、を有することを特徴とする音認識方法およびその装置。 (もっと読む)


【課題】入力信号の音声区間と非音声区間との判定精度を向上する。
【解決手段】音声区間判定装置100は、入力信号をフレーム単位に分割するフレーム分割部101と、上記フレーム分割部により分割されたフレームについて分析長毎のパワースペクトルを算出するパワースペクトル算出部102と、上記パワースペクトル算出部により算出されたパワースペクトルの強度を増加させるパワースペクトル操作部103と、上記パワースペクトル操作部により強度が増加されたパワースペクトルを用いてスペクトルエントロピーを算出するスペクトルエントロピー算出部104と、上記スペクトルエントロピー算出部により算出されたスペクトルエントロピーの値に基づいて、上記入力信号が音声区間であるか否かを判定する判定部105と、を有する。 (もっと読む)


【課題】録音中に代表的な静止画像を自動的に撮影及び記録する。
【解決手段】スクリーン上の映像が撮影領域内に収まるように、撮像部を備えた録音装置を録音現場に設置し、音声信号の記録を開始する。周期的に撮像部に撮影を行わせ、得られたテンポラリ画像を一時的に保存する。撮像部の出力に基づき、撮影領域内において映像(スライドショー用の映像)が表示されているスライド領域を検出すると共に、スライドタイトルが表示されているタイトル領域を検出する。その後、タイトル領域内における文字の変化を監視し、文字の変化が認められた場合、変化の直前に得られたテンポラリ画像を対象静止画像として取得する。対象静止画像の画像信号は、文字の変化タイミングを基準とした区間の音声信号に関連付けられて記録媒体に記録される。 (もっと読む)


【課題】より簡易に会話スタイルを分析すること。
【解決手段】分析装置10は、取得部14aと、第1の検出部14bと、第2の検出部14cと、抽出部14eと、分析部14fとを有する。取得部14aは、音声データを取得する。第1の検出部14bは、取得された音声データから、第1の確率モデルを用いて、有声音領域および無声音領域を検出する。第2の検出部14cは、検出された有声音領域および無声音領域に基づいて、第2の確率モデルを用いて、音声データにおける発話領域および沈黙領域を検出する。抽出部14eは、検出された発話領域および沈黙領域の会話特性を抽出する。分析部14fは、抽出された会話特性に基づいて、会話スタイルを分析する。 (もっと読む)


【課題】音声等の目的音の劣化を招くことなく、ノイズを適切に低減することができる撮像装置及び撮像装置のノイズ低減方法を提供する。
【解決手段】本発明の撮像装置は、集音装置131と、前記集音装置131により集音された音情報から音声区間を検出する音声区間検出部134と、前記音声区間検出部134の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部133と、を備えること、を特徴とする。 (もっと読む)


【課題】人物や動物等の音声の劣化を最小限にして動画の記録を行うことが可能なカメラ、プログラム、記録媒体、およびノイズ除去方法を提供すること。
【解決手段】動画の撮像を行う動画撮像手段16と、動画の撮像中に発生する音Bを音信号Mに変換する信号変換手段43と、特定の被写体を予測または認識する被写体判断手段44,51と、動画の撮像中に発生する音に含まれるノイズNを検出するノイズ検出手段53と、音信号Mから、ノイズ信号を除去するノイズ除去手段54と、音信号Mから、非ノイズ信号を検出する音声検出手段52と、被写体判断手段44,51が、特定の被写体を予測または認識している場合に、ノイズ除去手段54によるノイズ信号の除去性能を小さくするノイズ除去性能変更手段55とを有する。 (もっと読む)


【課題】入力信号におけるノイズ成分と音声成分とを識別する。
【解決手段】音声処理装置110は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部120と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部122と、スペクトルパターンから、ピークを有するピークスペクトルを検出するピーク検出部124と、ピークスペクトルのうち、基音と倍音の関係となる倍音構造である倍音スペクトルを判定する倍音判定部126と、を備える。 (もっと読む)


【課題】ノイズレベルに拘らず、入力信号の音声区間を検出する。
【解決手段】音声判定装置100は、入力信号をフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部120と、フレーム化入力信号を変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部122と、スペクトルパターンの各スペクトルのエネルギーと、分割周波数帯域のうちスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比が第1閾値を超えるか否かを判定するピーク検出部132と、判定結果に基づいて、フレーム化入力信号が音声であるか否かを判定する音声判定部134と、スペクトルパターンの各分割周波数帯域におけるスペクトルの周波数方向の平均エネルギーを導出する周波数平均部126と、分割周波数帯域毎に、平均エネルギーの時間方向の平均である帯域別エネルギーを導出する時間平均部130とを備える。 (もっと読む)


【課題】使用者に入力音声のレベルを変えるなどの処置を強要することなく、一時的な音に対しても簡単な構成で誤動作を軽減することができるようにしたVOX機能付き無線端末を提供する。
【解決手段】第2ホルマントに対応する周波数帯域から消防車における警鐘の周波数帯域を削除した特定周波数帯域を通過する帯域通過フィルタ5を使用し、マイク4からの入力音のうち消防車のモーターサイレン音、警鐘音、救急車のサイレン音をほぼカットして第2ホルマントに対応する特定の周波数帯域の入力信号の有無を検出部6で検出し、この検出部6での検出があったときに、帯域通過型フィルタ5を通過した音声信号のレベルと、基準閾値レベル管理部8で予め設定した基準閾値レベルとを比較し、入力信号のレベルが基準閾値レベルを超えたときPTTスイッチ7をON状態にしVOX機能部を作動させる。 (もっと読む)


1 - 10 / 242