説明

国際特許分類[G10L21/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚 (2,017) | 音声から不可聴表現への変換,例.音声の可視化または触覚の補助のための音声処理 (94)

国際特許分類[G10L21/06]に分類される特許

1 - 10 / 94


【課題】視聴者が違和感を覚えないように動画像を編集可能な動画編集装置及び撮影装置を提供すること。
【解決手段】ユーザが編集画面上で編集の開始位置及び編集の終了位置をそれぞれ指定すると、編集の開始位置及び編集の終了位置の音声レベルがそれぞれ検出される。その後、編集の開始位置の音声レベルと編集の終了位置の音声レベルとが比較され、比較の結果、編集の開始位置の音声レベルと編集の終了位置の音声レベルとの差が所定範囲を超える場合に、編集によって音声の接続が悪くなる旨がユーザに対して告知される。 (もっと読む)


【課題】語学学習において、学習者の音声の抑揚を、お手本の音声の抑揚に近づけられるようにする。
【解決手段】語学学習装置は、表示した例文の一つが選択されると、例文を発話した時の模範音声を再生する。そして、模範音声のピッチの時間的変化を示す第1ピッチ曲線を生成し、第1ピッチ曲線の道程を算出する。語学学習装置は模範音声の再生が終了すると、例文の発話を学習者に促す。語学学習装置1は、学習者の音声が入力されると入力された音声を記憶する。語学学習装置1は、記憶した学習者の音声の時間的変化を示す第2ピッチ曲線を生成し、第2ピッチ曲線の道程を算出する。この後、語学学習装置は、第1ピッチ曲線の道程と、第2ピッチ曲線の道程とを比較し、その道程の差に応じて、模範音声のピッチと学習者音声のピッチとの相違点を学習者へ出力する。 (もっと読む)


【課題】複数のチャンネル間の周波数に依存する特徴量の関係のうち、特定の関係をもつ音を、これとは異なる関係をもつ音に変化させるように、オーディオ信号に対して信号処理を行うこと。
【解決手段】本発明の実施形態における端末の信号処理部100は、取得した複数チャンネルのオーディオ信号を周波数スペクトルに変換し、各周波数に対応した音像位置を算出して、周波数および音像位置の座標軸をもつ座標系を用いて表示画面に表示する。利用者によって指定された座標系における一部領域が指定領域として設定され、また周波数値と関係値との対応関係を、異なる対応関係に変化させるための変化態様が設定されることにより、信号処理部100は、各チャンネルの第1周波数スペクトルを、設定された変化態様に基づいて第2周波数スペクトルに変化させてオーディオ信号に変換して出力する。 (もっと読む)


【課題】聴覚臨場感を客観的に評価することが可能な聴覚臨場感評価装置を提供する。
【解決手段】聴覚臨場感評価装置40は、計測された二つの音響信号を周波数帯域ごとに分割する音響信号分割部41と、分割された二つの音響信号を用いて、二つの前記音響信号に関する相互相関関数を周波数帯域ごとに算出する相互相関関数算出部42と、相互相関関数を、二つの音響信号のラグと、周波数帯域と、をフレームの座標軸とする二次元動画像の輝度、色相及び彩度のいずれかに変換することによって動画像を生成する動画像生成部44と、動画像の複数のフレームを用いて動画像の移動ベクトルを算出することによって、音像の移動ベクトルを算出する音像移動ベクトル算出部45と、音像の移動ベクトルに基づいて、音像の移動ベクトルが大きいほど聴覚臨場感評価値が大きくなるように当該聴覚臨場感評価値を算出する聴覚臨場感評価値算出部46と、を備える。 (もっと読む)


【課題】発言者の音声レベルを会議出席者の顔の上方(頭上)に画像表示するビデオ会議用カメラマイク装置を提供する。
【解決手段】本発明のカメラ・マイクユニット50は、カメラ3により撮影された画像を処理して会議出席者の顔を検出する顔検出手段15と、複数のマイク5によって音声の到来方向を検出する音声到来方向検出手段16と、ずれ時間情報22に基づいて音声を収音する方向を変更する音声収音方向変更手段17と、音声収音方向変更手段17により収音した音声レベルを算出する音声レベル算出手段18と、顔検出手段15により検出した顔検出情報20、音声到来方向検出手段16により検出した音声到来方向情報21、及び音声レベル算出手段18により算出した音声レベル情報24に基づいて、会議室画像の会議出席者の発言者の頭上に音声レベルを画像表示する画像信号25を生成する音声レベル表示合成手段19と、を備えて構成されている。 (もっと読む)


【課題】少ない繰り返し発声で高画質のMRI発話動画を作成可能とする。
【解決手段】時系列信号観測部は、或る文章の発話時における口腔内の発話器官の位置情報を、所定のサンプリング間隔で時系列的に観測する。時間関数・発話駆動時点抽出部は、前記位置情報の時系列信号から、空間行列と時間関数と複数の発話駆動時点を抽出する。MRI画像撮像部は、前記文章と同一の文章の発話時における発話器官のMRI画像を、前記発話駆動時点ごとに撮像する。MRI発話動画作成部は、前記時間関数と前記MRI画像とを組み合わせることにより、MRI発話動画を作成する。 (もっと読む)


【課題】英語発音の学習方法について一定の基準を広く提示し、学習者が取得しにくかった口腔内の舌の動き、息の出し方等について、3Dアニメーション映像を駆使し、ネイティブの発音を身につけることを、容易かつ効率的に学習をすることができる、音声分析機能を持つ言語発音学習装置及びそのシステムを提供する。
【解決手段】マスターすべき主なフォルマント(F1〜F3)を抽出表示し、学習者はビジュアルで自分の発話結果と模範者の発話との相違点を視覚で把握できることを備え、学習者の発話結果の相違点を改善するための考察について、文字及び3Dアニメーションで提示する。 (もっと読む)


【課題】 伴奏音に合せて被験者が歌うときの発声音を周波数解析し腹式呼吸の習熟度を数量化して判定することにより、誤嚥性肺炎を予防するために最適なシステムを構築する
【解決手段】 被験者の発声音から腹式呼吸の差異を捉える特定周波数帯の信号でかつ音圧が高まるべき注目区間の周波数成分情報を抽出し、それを演算することによって一回の測定結果の傾向を単一の数値で提示し、時間経過を分析して腹式呼吸の習熟度を判定可能とした。 (もっと読む)


【課題】音源を識別することなく、音の特徴に応じたオブジェクトを表示することができる携帯型表示装置及び表示制御プログラムを提供する。
【解決手段】表示部と、マイクロフォンと、このマイクロフォンに入力された音の周波数成分から最大音圧の周波数fmaxを決定する音処理部と、複数の帯域に分割された音の周波数の各帯域に割り付けられた互いに異なるオブジェクトを記憶するオブジェクト記憶部と、音処理部により決定された最大音圧の周波数fmaxを含む帯域Bmaxに割り付けられたオブジェクトをオブジェクト記憶部から読み出して前記表示部に表示させる表示制御部と、を備える。 (もっと読む)


【課題】音声信号を入力し、その内容情報を取得する際に、あらかじめ記録する文を作成するという使用者にかかる負担が大きいこと、を解決することが可能な音声記録装置、そのデータ処理方法、およびプログラムを提供する。
【解決手段】音声記録装置100は、音声信号を記憶する音声記憶部104と、編集指示に従って、音声記憶部104に記憶された音声信号を編集する音声編集部110と、音声編集部110により編集された音声信号を音声認識し、当該音声信号が表す語句を示す認識結果情報を出力する音声認識部112と、を備える。 (もっと読む)


1 - 10 / 94