説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

81 - 90 / 242


【課題】種々の雑音に対して頑健な音声信号区間推定を行う。
【解決手段】入力信号13の音響特徴量からその音声状態確率・非音声状態確率を求める第1音響信号分析部14と、入力信号13の基本周波数に含まれる周期性成分および非周期性成分からその音声状態確率・非音声状態確率を求める第2音響信号分析部15と、これらを用いてこれらに適用する重みを求める重み算出部16と、この重みを用いて両音声状態確率を合成した音声状態合成確率と両非音声状態確率を合成した非音声状態合成確率と、音声状態と非音声状態との間の状態遷移モデルとに基づき、音声状態に属する確率(音声状態尤度)と非音声状態に属する確率(非音声状態尤度)を求める音声状態確率/非音声状態確率算出部17と、音声状態尤度と非音声状態尤度から、音声信号区間であるか否かを判定する音声信号区間推定部18とを備える。 (もっと読む)


本明細書では、スライドショーイベントを音声と同期させるための技術を説明する。1つまたは複数の動画イベント、スライドの遷移、または視覚効果を定義するデータと、該定義されたイベントの実行中に再生されるべき音声ファイルとを受信する。音声ファイルを処理して、該音声ファイル中に含まれる音声イベントを識別する。音声ファイル内の音声イベントが識別されると、該音声イベントをどのように動画イベントに同期させるべきかを定義するデータを含む音声同期スキームを使用して、定義された動画イベントを、識別された音声イベントに同期させる。プレゼンテーションに適用される音声同期スキームをユーザが選択することを可能にするユーザインタフェースを提供することができる。ユーザが、ある動画イベントを音声ファイル内の識別された任意の音声イベントに視覚的に関連付けることを可能にする、ユーザインタフェースも提供することができる。
(もっと読む)


【課題】玄関子機と居室親機との間、玄関子機と汎用ネットワークを経由してIP電話との間の通話時、通話音声とは異なる住戸内の周囲環境音又はIP電話の周囲環境音の玄関子機からの出力を防止する。
【解決手段】居室親機マイクに入力された親機入力信号又は汎用ネットワークを経由してIP電話から当該居室親機に伝送されてくるデータ信号の特定の周波数のパワースペクトラムをGOERTZELアルゴリズムにより演算し、演算結果をもとに所定の閾値を超えた周波数スペクトラムの本数に応じて、親機入力信号及びデータ信号の種類がそれぞれ、無音信号又は音声信号であることを判別する。また、居室親機のCPUは、無音信号が判別されたときには通話路切替部を制御して、親機マイクから玄関子機の子機スピーカへの信号伝送ライン、又はIP電話から汎用ネットワーク、居室親機を経由して玄関子機の子機スピーカへの信号伝送ラインを遮断する。 (もっと読む)


【課題】BGMと再生時間および雰囲気が一致する画像をスライドショーとしてユーザに提供することができるようにする。
【解決手段】BGMとなる音声データについて、先頭無音区間検出部253は先頭無音区間を検出し、末尾無音区間検出部254は末尾無音区間を検出し、末尾フェードアウト区間検出部255は末尾フェードアウト区間を検出する。演奏区間特定部256は、その音声データの先頭および末尾の無音区間以外の演奏区間を特定し、画像コンテンツ割り当て部260は、その演奏区間に対してフォトアルバム情報とエフェクトデータを割り当て、ベクタデータを生成する。さらに、フェードアウト処理設定部262は末尾フェードアウト区間の画像にフェードアウト処理が施されるようにベクタデータを更新する。本発明は、静止画を扱うことのできるパーソナルコンピュータなどの機器に適用することができる。 (もっと読む)


【課題】音響信号を再生所要時間内に再生する上で最適な再生速度を決定する。
【解決手段】所望の移動体の第1位置情報と目的地の第2位置情報とを取得する取得手段102と、第1位置情報と第2位置情報とから、現在地から目的地までの所要時間を推定する推定手段102と、音響信号データベース101から所望の音響信号のデータ長を取得する取得手段103と、所要時間とデータ長とから音響信号の再生が所要時間内に終了するように音響信号を再生する再生速度を決定する決定手段103と、再生速度に応じて音響信号を再生する再生手段104と、を具備する。 (もっと読む)


【課題】効果的に目的信号を抽出する。
【解決手段】複数の信号源から発せられた信号の混合信号をB個(B≧2)のセンサで観測して得られたBチャネルの観測信号R(p)から、特定の信号源から発せられた目的信号を抽出するものであり、観測信号R(p)に含まれる雑音信号N(p)を検出し(120、S4)、雑音信号N(p)と観測信号R(p)とから白色化フィルタ係数w(p)を計算し(112、S6)、Bチャネルの観測信号にそれぞれ含まれる雑音信号N(p)のチャネル間相関関数である雑音相関関数を計算し(130、S14)、Bチャネルの観測信号のチャネル間相関関数である観測相関関数を計算し(4、S10)、観測相関関数と雑音相関関数とを用いて、逆フィルタ係数c(p)を求め(140、S16)、逆フィルタ係数を観測信号R(p)に畳み込んで加算する(3、S20)。 (もっと読む)


【課題】nチャネルの入力信号について少なくとも一つのチャネルで音声区間が存在した場合に、これをチャネル全体としての音声区間であるとして検出する。
【解決手段】nチャネルの各入力信号をフレーム化してメモリに記憶する。そして、各チャネルにつき、メモリに記憶された信号サンプルについて、この信号サンプルが音声区間のものであるか非音声区間のものであるかを判定した結果(VADフラグ)とこのVADフラグが決定された時刻(VADフラグ決定時刻)とを出力する。各VADフラグ決定時刻のうち最も早い時刻のVADフラグ決定時刻(先頭時刻)を探索すると共に、各VADフラグについて、一つでも音声区間であることを示すものが存在すれば統合検出結果を音声区間であることを示すものとし、全て非音声区間であることを示すものであれば統合検出結果を非音声区間であることを示すものとし、先頭時刻と統合検出結果を出力する。 (もっと読む)


本発明は、音声が有用な信号として理解される、音声区間の検出、背景雑音の推定、および音声信号の分類に関する。本発明は、対応する音声区間検出器、背景雑音推定器、および音声信号分類器にも関する。音声信号の音調を推定する装置および方法は、音声信号の現在の剰余スペクトルを計算するステップと、現在の剰余スペクトルのピークを検出するステップと、検出された各ピークについて、現在の剰余スペクトルと前の剰余スペクトルとの相関マップを計算するステップと、計算された相関マップに基づいて長期相関マップを計算するステップであって、長期相関マップは、音声信号の音調を示すステップとを含む。
(もっと読む)


【課題】オーディオ信号の記録方式に対してプライバシーを保護する仕組みを導入する。
【解決手段】オーディオ信号記録装置は、入力された元オーディオ信号の全区間から人の音声の信号成分を含む音声区間を検出して、前記音声区間における信号に対して暗号化処理を施すことにより、前記元オーディオ信号から暗号化オーディオ信号を生成する。そして、前記暗号化オーディオ信号と、前記暗号化オーディオ信号を復号するための復号用情報と、前記復号用情報に従った前記暗号化オーディオ信号の復号及び前記元オーディオ信号の再生出力に対する許可/禁止を再生装置側で切替制御させるための権限管理情報と、を互いに関連付けて電子ファイルに格納する。 (もっと読む)


【課題】聴感上、自然な雑音抑圧を行うことが可能なノイズサプレス装置を提供する。
【解決手段】時間−周波数変換部381は、AD変換器37で得られたディジタル音声信号を、所定の時間幅ずつ振幅スペクトルと位相スペクトルに変換する。帯域パワー計算部388は、振幅スペクトルを周波数帯域ごとに平均パワーを計算する。変動幅制限部387は、振幅スペクトルの変動方向に応じて、その変動幅を制限した振幅スペクトルを求める。雑音推定部382は、変動幅が制限された振幅スペクトルに基づいて、雑音成分を推定する。SNR計算部383は、雑音成分と、変動幅が制限された振幅スペクトルから、SNRを求める。雑音抑圧係数計算部384は、SNRから雑音を抑圧するための雑音抑圧係数を求める。雑音抑圧係数加重部385は、雑音抑圧係数を用いて、時間−周波数変換部381で求めた振幅スペクトルの雑音成分を抑圧するようにしたものである。 (もっと読む)


81 - 90 / 242