説明

国際特許分類[G10L19/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 冗長を減らすための音声または音響信号の分析合成技術,例.ボコーダーにおける;音声または音響信号のコード化またはデコード化,例.圧縮,拡張,ソースフィルターモデルまたは心理音響分析のためのもの (3,650)

国際特許分類[G10L19/00]の下位に属する分類

国際特許分類[G10L19/00]に分類される特許

71 - 80 / 2,383


【課題】録音中に代表的な静止画像を自動的に撮影及び記録する。
【解決手段】スクリーン上の映像が撮影領域内に収まるように、撮像部を備えた録音装置を録音現場に設置し、音声信号の記録を開始する。周期的に撮像部に撮影を行わせ、得られたテンポラリ画像を一時的に保存する。撮像部の出力に基づき、撮影領域内において映像(スライドショー用の映像)が表示されているスライド領域を検出すると共に、スライドタイトルが表示されているタイトル領域を検出する。その後、タイトル領域内における文字の変化を監視し、文字の変化が認められた場合、変化の直前に得られたテンポラリ画像を対象静止画像として取得する。対象静止画像の画像信号は、文字の変化タイミングを基準とした区間の音声信号に関連付けられて記録媒体に記録される。 (もっと読む)


【課題】特定の話者の音声データが存在する区間における音データを記憶する。
【解決手段】本発明の録音装置は、周囲の音を集音し、音データとして出力する取得部と、前記取得部から出力された音データに音声データが含まれているか否かを判定し、前記音声データが含まれている場合には、声紋に応じて音声データを分類するとともに、分類した各音声データを示す分類情報を出力する話者解析部と、前記分類情報をユーザに通知する通知部と、前記分類情報の通知に基づく音声データの指定を受け取る入力部と、前記取得した音データから、前記指定された音声データが存在する区間における音データを抽出する録音制御部と、を有する。 (もっと読む)


【課題】 オーディオ信号, スピーチ信号あるいはオーディオ信号とスピーチ信号とが混合された信号に対して一つのデバイスで一定な復元音質を維持しつつ、符号化あるいは復号化を可能にするシステムにおいて、低周波数バンド信号を用いて、高周波数バンド信号を符号化/復号化する方法及び装置を提供すること。
【解決手段】 オーディオ信号またはスピーチ信号に該当する低周波数バンド信号を利用し、高周波数バンド信号を符号化及び復号化する方法及び装置に係り、低周波数バンド信号を利用し、高周波数バンド信号を符号化/復号化することによって、小さいデータサイズを利用して符号化及び復号化を行うと同時に、音質を低下さない。 (もっと読む)


【課題】本発明はオーディオ符号化および復号化方法とその装置に関するもので、より一層詳細にマルチオブジェクトオーディオ符号化および復号化方法とその装置に関するものである。
【解決手段】本発明によるマルチオブジェクトオーディオ符号化方法は主オーディオオブジェクトと副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号(residual signal)を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含む。 (もっと読む)


【課題】DMA転送を用いるオーディオ再生装置に対して、消費電力を抑制すると共に、通常再生と特殊再生の切り替え時に誤再生を回避する。
【解決手段】DMA転送部104は、DMA転送フレーム番号レジスタ115、DMA転送フレームサイズレジスタ114、DMA転送中アドレスレジスタ111、DMA転送停止アドレスレジスタ112を備える。プロセッサAにより電源のオン/オフが制御されるプロセッサBは、DMA転送中に、通常再生とは異なる特殊再生が要求されたときに、メモリ101に格納されたフレームのうちの、該フレームの転送が完了すると、メモリ101に格納されたデコード後データの転送を停止する停止フレームの終端アドレスをDMA転送停止アドレスレジスタ112に設定する。 (もっと読む)


【課題】画像を記録すると共に周囲音を録音し、画像に処理を施す場合に、鑑賞時の情緒性や娯楽性を損なうことのない音声処理装置を提供する。
【解決手段】画像を撮像する撮像素子と、音声を入力するマイク141と、撮像素子によって撮像して得た画像データを、複数の加工処理の中から処理したい加工処理を選択する画像アート指示部123Aと、マイク141によって入力した音声データを、複数の音声処理の中から音声処理を選択し、この選択結果に応じて、音声処理の選択を指示する音処理選択部153Aと、音処理選択部153Aによって指示された音声処理によって処理された音声データを、画像データに関連付けして出力するフィルタ157Aおよび合成器159Aを具備する。 (もっと読む)


【課題】音声信号に含まれる雑音を低減する処理を、動作時に雑音を発生するコンポーネントの種類、及び動作の期間の長さに基づいて選択する技術を提供する。
【解決手段】動作時に雑音を発生する複数のコンポーネントの動作を制御可能な音声信号処理装置であって、前記音声信号処理装置の周囲の音声を集音することにより音声信号を取得する取得手段と、前記複数のコンポーネントのいずれかが動作している期間に取得された前記音声信号に対して、当該動作により発生する雑音に対応する周波数の信号を低減するフィルタ処理、又は、当該動作の期間の前後少なくとも一方の期間に取得された前記音声信号に基づいて生成される音声信号により当該動作の期間に取得された前記音声信号を置換する予測処理を適用することにより、前記音声信号に含まれる雑音を低減する低減手段と、を備え、前記低減手段は、前記動作に係るコンポーネントの種類、及び前記動作の期間の長さに基づいて、前記フィルタ処理又は前記予測処理を選択することを特徴とする音声信号処理装置を提供する。 (もっと読む)


【課題】 音声の再生速度変更によって生じる音声品質の劣化を抑制することが可能な音声データ処理装置を得ることを目的とする。
【解決手段】 揺らぎ吸収バッファに蓄積されている音声データ量に基づいて、上記音声データの再生速度を決定する再生速度決定部と、上記音声データの再生速度と、上記揺らぎ吸収バッファに蓄積されている音声データの無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する無音区間再生速度決定部と、上記音声データの再生速度と、上記揺らぎ吸収バッファに蓄積されている音声データの有音区間の区間長と、上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する有音区間再生速度決定部と、上記無音区間の再生速度と、上記有音区間の再生速度とに基づいて、上記音声データを再生する音声再生部とを備えたものである。 (もっと読む)


【課題】重要周波数成分を有するオーディオ信号を抽出する方法及びその装置、低ビット率オーディオ信号の符号化/復号化方法及び重要周波数成分を抽出する装置を提供する。
【解決手段】オーディオ信号の重要周波数成分の抽出方法は、周波数領域でのオーディオ信号に対し、心理音響モデルによるSMR値のような信号の知覚的重要度を計算する段階と、知覚的重要度により、マスキング・スレショルド値が周波数領域のオーディオ信号より小さい周波数の信号を、少なくとも一つ以上の第1重要周波数成分として選択する段階と、少なくとも一つ以上の第1重要周波数成分として選択されたオーディオ信号のうち、所定の重み付け値を考慮してスペクトルピークを抽出し、周波数領域のオーディオ信号を符号化するのに使われる少なくとも一つ以上の第2重要周波数成分として選択する段階により、知覚的に重要な周波数成分を符号化し、低ビット率で高音質を提供できる。 (もっと読む)


【課題】本発明は、内蔵又は標準FEC処理を持たないスピーチコーダにおいてパケットロス又はフレーム消去の隠蔽を実行する方法及び装置に関する。
【解決手段】復号器を備えた受信器が、圧縮されたスピーチ情報の符号化されたフレームを受信する。受信器の遺失フレーム検出器が、符号化されたフレームが、送信中に失われた又は破損されたかどうか又は消去されたかどうかを判断する。符号化されたフレームが消去されていなければ、符号化されたフレームは復号器によって復号される。所定の遅延期間が追加された後、音声フレームが出力される。遺失フレーム検出器が、符号化されたフレームが消去されたと判断した場合、FECモジュールが、信号にフレーム隠蔽処理を施す。FEC処理は、消去されたフレームに対して、自然に聞こえる合成スピーチを生成する。 (もっと読む)


71 - 80 / 2,383