説明

国際特許分類[G10L21/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚 (2,017) | 音声から不可聴表現への変換,例.音声の可視化または触覚の補助のための音声処理 (94)

国際特許分類[G10L21/06]に分類される特許

51 - 60 / 94


【課題】採譜において周波数解析精度を向上させるようにする。
【解決手段】 波形データ記憶部32に記憶されたWAVEデータに対して、離散ウェブレット変換を行うことにより、異なる目的周波数帯をもつ少なくとも2レベルのウェブレット係数群を取得するWT処理部34と、ウェブレット係数群のそれぞれに対して、より低い目的周波数帯を持つ高レベルのウェブレット係数群に対する周波数分解能が、より高い目的周波数帯を持つ低レベルのウェブレット係数群に対する周波数分解能よりも高くなるように、短期間フーリエ変換を行って、どの時間位置に、どの周波数成分が存在するかを示す周波数情報を取得するSTFT処理部35と、周波数情報に基づいて音譜情報を生成する音譜情報生成部39とを有するように構成する。 (もっと読む)


【課題】LED制御パターン生成回路を削減して回路規模を小さくし、かつ再生オーディオ信号の音の強弱や無音状態をLEDの点灯/点滅で表現できる、最適な音連動光源駆動方法を提供する。
【解決手段】Audio/MIDIデジタル音源1のデジタル信号からオーディオ帯域信号と低周波帯域信号とを生成し、PWMジェネレータ8によってオーディオ帯域信号と低周波帯域信号に応じた正のパルス幅のA信号と負のパルス幅のB信号とをそれぞれ生成する。低周波帯域信号に対応するA信号とB信号とを論理回路10を介して、複数のドライバ7−a〜7−cに与え、これらのドライバ7−a〜7−cによりLED6−a〜6−cをそれぞれ発光させる。論理回路10はLED6−a〜6−cがオーディオ信号に連動しかつ低周波帯域の音の強弱や無音状態に応じて光を変化するようにドライバ7−a〜7−cを制御する。 (もっと読む)


【課題】アクセント結合の誤りを容易に修正する中間言語編集装置を提供する。
【解決手段】文書内で連続する単語を含む語句と、語句のアクセント情報を含む中間言語とを対応づけて記憶する中間言語記憶部122と、中間言語に含まれるアクセント情報の修正の指示を受付ける修正受付部103と、連続する単語を含む語句のアクセントを決定する予め定められた規則に基づいて、修正の指示を受付けたアクセント情報に代わるアクセント情報の候補を生成する候補生成部104と、生成した候補をユーザに提示する候補提示部105と、提示した候補の中からユーザにより選択された候補を受付ける選択受付部106と、中間言語記憶部122に記憶された中間言語に含まれるアクセント情報のうち、修正の指示を受付けたアクセント情報を、受付けた候補で置換する置換部107と、を備えた。 (もっと読む)


【課題】様々な性質の音声に適応させることができる声質変換モデルを生成するのに好適な声質変換モデル生成装置、及び前記生成した声質変換モデルと所定の適応手法とを用いて、任意の元話者の声質の音声を任意の目標話者の声質の音声に変換するのに好適な声質変換システムを提供する。
【解決手段】声質変換モデル生成装置1において、N人の元話者及びM人の目標話者の少なくとも一方の音声データを学習データとして学習(通常学習又は適応学習)を行い、N人の元話者及びM人の目標話者の少なくとも一方に共通な1つ又は2つのモデルから構成される声質変換モデルを生成する。そして、声質変換システムにおいては、所定の適応手法を用いて、前記生成した声質変換モデルを任意の元話者及び任意の目標話者の少なくとも一方の音声に適応させて、任意又は特定の元話者の音声を特定又は任意の目標話者の声質の音声に変換する。 (もっと読む)


【課題】車載オーディオ装置のデザイン性及び興趣性の向上を図る。
【解決手段】音声信号を出力する車載オーディオ装置1において、本体の前面パネル2に、車載オーディオ装置1の操作子として機能する発光ボタン部17a〜k、及び、発光部19a〜gを並べて配設した構成として、これら発光ボタン部17a〜k及び発光部19a〜gの発光状態を、出力中の音声信号に基づいて変化させる。 (もっと読む)


【課題】MSステレオ符号化されたデータを復号化して再生する時であってスペクトルを表示したりビープ音を加えたりする時に、多数の加算を行う必要がなく、処理量が少ないオーディオ処理装置、オーディオ処理方法、プログラムおよび集積回路を提供する。
【解決手段】本発明のオーディオ処理装置では、MSステレオ符号化されたデータをビットストリーム分解し、逆量子化を行った後、逆MDCTなどで周波数軸から時間軸への変換を行い、その後、MSステレオ復号化を行う前の和信号を使ってスペクトルを表示させるように構成することで、従来のオーディオ処理装置に比べて、処理量が少なくてスペクトルを表示させることが出来る。 (もっと読む)


【課題】歌唱力評価に適した信頼性の高い音程変化量抽出方法、ピッチの信頼性算出方法、信頼性の高いビブラート検出方法を提供すること。また、それらを応用した歌唱訓練プログラム及び高精度な歌唱力評価機能を持つカラオケ装置を提供すること。
【解決手段】
入力音声信号よりスペクトルを算出する。スペクトルのずらしマッチングにより信頼性の高いピッチ変化量Δfsを算出する(142)。同時に音声信号より抽出されたピッチf(t)の差分としてピッチ変化量Δfpを算出する(141)。ΔfsとΔfpを比較することで、Δfpを算出する基になったピッチf(t)の信頼性を逆算する。さらに、信頼性の高いピッチ変化量Δfsをビブラート検出に利用することにより、信頼性の高いビブラート検出を実現する。このようにして算出した音程変化量、ピッチの信頼性、ビブラート情報を歌唱訓練プログラムやカラオケ装置に利用する。 (もっと読む)


【課題】歌唱力評価に適した周波数分解能の高いピッチ抽出方法を提供すること。また、そのピッチ抽出方法を応用した人間の主観に近い歌唱力評価方法、歌唱者の歌の上達を補助する歌唱訓練プログラム、及びカラオケ装置を提供すること。
【解決手段】入力音声信号より、自己相関関数を算出する。次に自己相関関数を複数の周波数帯域毎の部分相関関数に分割して、各帯域の部分相関関数を重ね合わせ合成することで、高音域の周波数分解能を低音域の周波数分解能で補った合成相関関数を算出する。合成相関関数に極大値を与える周波数をピッチとして検出することで、4[oct]以上ある人間の歌声の全音域を精度良く分析することが可能となる。このようにして抽出したピッチを歌唱力評価装置や歌唱訓練プログラムに利用する。 (もっと読む)


視覚的に音声信号を提示する方法は、提示する音声信号を受信するステップと、音声信号から所定数の離散的な周波数成分を生成するステップと、周波数成分のそれぞれに図形オブジェクトを割り当てるステップであって、当該図形オブジェクトのそれぞれは、幾何学的形状、位置情報及びサイズ情報によって特定されるステップと、全ての周波数成分に関連付けられた図形オブジェクトの全ては、グラフィックディスプレイに同時に表示されるステップと、を含む。本発明に係るシステムは、音声信号を生成するマイク(110)と、音声信号をサンプリングし、デジタル信号に変換する音声インターフェース部(120)と、デジタル信号を所定数の離散的な周波数成分に変換し、離散的な周波数成分のそれぞれに図形オブジェクトを割り当てる処理部(130)と、図形オブジェクトに基づいて映像信号を生成する映像インターフェース部(150)と、映像信号に基づいて図形オブジェクトから成るソノグラムを表示するグラフィックディスプレイ(160)と、を含む。
(もっと読む)


【課題】 音声やメールの着信通知音が会議などで周囲に迷惑をかける状況を改善した携帯電話機を提供する。
【解決手段】 携帯電話のマイクロフォン、操作キーからの文字入力、メモリに保存された文字データ、カメラによるQRコード撮影、非接触ICカード、IrDA受信機からの受信データなどの音声/文字データを、携帯電話機本体あるいはネットワーク接続した劣化雑音音声信号生成サーバの劣化雑音音声信号変換機能を使って劣化雑音音声信号に変換し、これを携帯電話機の受信通知音として使うことにより、他人に与える不快感を軽減する一方、確実に着信通知音のメッセージを受け取ることが出来る。 (もっと読む)


51 - 60 / 94