説明

国際特許分類[G10L21/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚 (2,017) | 音声から不可聴表現への変換,例.音声の可視化または触覚の補助のための音声処理 (94)

国際特許分類[G10L21/06]に分類される特許

11 - 20 / 94


【課題】より効果的に、ユーザに対して環境音を視覚的に提示する。
【解決手段】解析部24は、コンテンツを構成する音声の音声データにブラインド音源分離処理を行い、各音源の音声の音声データを抽出するとともに、各音源の音声の音声データに基づいて、音源の方向を示す方向データを生成する。また、解析部24は各音源の音声が、人の発話ではない環境音であるか否かを判別し、環境音をテキスト化する。視覚情報生成部25は、テキスト化された環境音に基づいて、環境音を視覚的に提示するエフェクト画像を生成する。画像合成部26は、コンテンツを構成するコンテンツ画像上の方向データにより定まる位置に、エフェクト画像をオーバーレイする。本発明は、ビデオ再生機器に適用することができる。 (もっと読む)


【課題】2チャネル分の音声信号に対し、任意に指定された方向の音像のみを分離・増圧することが可能な音声信号処理装置を提供する。
【解決手段】音声信号処理装置(音声信号処理部20で例示)は、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部(信号分離抽出部23で例示)と、信号分離部で分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる相関信号増加部(相関信号処理部24及びゲイン調整部25bで例示)とを備え、複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する。 (もっと読む)


【課題】2チャネル分の音声信号に対し、任意に指定された方向の音像のみを分離・抑圧することが可能な音声信号処理装置を提供する。
【解決手段】音声信号処理装置(音声信号処理部20で例示)は、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部(信号分離抽出部23で例示)と、信号分離部で分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を減少させる相関信号減少部(相関信号処理部24及びゲイン調整部25bで例示)とを備え、複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを抑圧する。 (もっと読む)


【課題】学習者がネイティブ・スピーカーと同じ数の単音を知覚できるようにすることにより、外国語の発音を改善させるための発音学習装置を提供する。
【解決手段】この発音学習装置は、音声データ005を取得する音声データ取得手段016と、該音声データ取得手段によって取得された前記音声データ005を呈示する音声呈示手段007とを有し、前記音声データは、目標言語特有変数が互いに異なる複数の音声データ015からなる音声バリエーション014を構成する音声データであることを特徴とする。 (もっと読む)


【課題】映像コンテンツを同期させる楽曲の開始から終了までの音楽データが入力されていなくても、大規模な動きデータベースを利用して楽曲に合わせた映像コンテンツを生成することができる。
【解決手段】モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築装置10と、映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された音楽データから音楽特徴量を取得する音楽解析部22と、モーショングラフ上で、所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部24と、探索したパスに応じた動きデータと音楽データとを対応付ける同期情報を生成する同期部25と、同期情報に基づいて映像データを生成する映像データ生成部27とを備える。 (もっと読む)


【課題】 入力波形に対して、カオス理論で用いられるアトラクタを利用して、別の波形を印加して、共振や減衰を伴う新たな波形を発生させる。
【解決手段】 ターケンス・プロット処理により得られたアトラクタデータに基づくアトラクタ軌道を含む画像が表示部30の画面上に表示され、ユーザは入力部10を操作することで、画像中に所望の波形識別領域を配置する。CPU50は、波形識別領域に含まれるアトラクタ軌道の部分の座標値を、波形識別領域に属する座標値として取得するとともに、当該座標値に相当する時間情報を、識別時刻情報として取得する。CPU50は、第1の波形データの出力する際に、第1の波形データの時刻が、識別時刻情報に含まれる場合には、第1の波形データの波高値と、予め定められた付加波形である第2の波形データの対応する時刻の波高値とを加算した合成波形データを生成してサウンドシステム80に出力する。 (もっと読む)


【課題】音声の到来方位および時間を直感的に把握することができる音声可視化装置を提供する。
【解決手段】所定方位毎に指向性を形成した音声データを生成し、各音声データの音量から音源の方位を判定する。この音源方位の判定結果に基づいて、音声を収音したタイミングと、音声の到来方位を示す円画像を表示する。円画像は、時間経過に応じて中心に向かって移動させる。また、各音声データの音量に応じて円画像の大きさを変更する。 (もっと読む)


【課題】音に関連させた3次元表示を実現できるようにする。
【解決手段】中央制御部1は、コンテンツ記憶部CTから再生対象のコンテンツを読み出し、このコンテンツ内の画像に対応付けられている音からその音の情報(振幅、周波数、チャンネル数など)を検出取得すると共に、この取得した音の情報に応じて3D表示に関する表示制御方法を決定し、この表示方法に応じた表示処理を実行して3D対応表示部8に表示させるようにしている。例えば、音の振幅が大きい程、3D表示の飛び出し量が大きくなるように制御したり、音のチャンネル数が多い程、3D表示の飛び出し量が大きくなるように制御したりする。 (もっと読む)


【課題】個人学習に適した発音評価システムおよび発音評価プログラムを提供する。
【解決手段】本実施形態に係る発音評価システムによると、音声データ取得プログラムにより取得した評価対象の音声データから、フォルマント周波数F1〜F3をフォルマント抽出プログラムによって抽出する。そして、イメージデータ生成プログラムにより、フォルマント周波数F1に対応する緑軸J1とフォルマント周波数F2に対応する赤軸J2とからなる二次元座標イメージの各軸J1,J2にフォルマント周波数F1,F2を割り付けて定まる座標を中心に円形イメージを生成するとともに、二次元座標イメージによる座標平面に対し垂直方向の遠近感をフォルマント周波数F3に基づいて円形イメージに与え、イメージデータ出力プログラムにより二次元仮想座標イメージおよび円形イメージをディスプレイに出力する。 (もっと読む)


【課題】スペクトログラム行列の次元を削減するためのシステム及び方法を提供する。
【解決手段】中間時間基底行列311及び中間周波数基底行列315を構成し、終了条件320に達するまで、これらの中間時間基底行列及び中間周波数基底行列に非負値行列因子分解(NMF)を反復的に適用する。NMFは、独立正則化項に対する制約317を受け、この制約は、その項の勾配の形態である。 (もっと読む)


11 - 20 / 94