説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

1,041 - 1,050 / 1,456


【課題】体内伝導通常音声の音質を改善する。
【解決手段】耳介の下方部の、頭蓋骨の乳様突起直下の、胸鎖乳頭筋上の皮膚表面から採取される、体内軟部組織を伝導する体内伝導通常音声について線形予測分析を行う。また、気伝導音について線形予測分析を行う。これらの分析結果に基づいてGMM学習手段13により、混合正規分布モデルを学習し、GMM記憶用メモリ14に記憶する。GMM記憶用メモリ14に記憶された学習結果を用いて、体内伝導通常音声について擬似気伝導音への変換を行う。このような構成によれば、騒音が大きい環境においても、快適に気伝導音に近い音質で音声通話することが可能となる。 (もっと読む)


【課題】従来の音声情報処理装置においては、アクセント位置の判断の精度が低い、という課題があった。
【解決手段】単語または文章の音声情報であり、1以上の音節の集合である音声情報を受け付ける音声情報受付部と、前記受け付けた音声情報から基本周波数を取得する基本周波数取得部と、前記受け付けた音声情報から当該音声情報の強さを示す情報であるパワー情報を取得するパワー情報取得部と、前記基本周波数取得部が取得した基本周波数と、前記パワー情報取得部が取得したパワー情報を用いて、第一アクセントの位置またはアクセントの順位を決定するアクセント決定部と、前記アクセント決定部が決定した第一アクセントの位置またはアクセントの順位に応じた処理を行う処理部を具備する音声情報処理装置により、第一アクセントの位置またはアクセントの順位が精度高く判断できる。 (もっと読む)


【課題】時系列の複素周波数間の距離を求めることによって類似度を評価する方法を提供する。
【解決手段】本発明の一実施例によれば、入力部100にて時系列s(t),s(t)を取得し、所定の時間間隔Δtでサンプルする。次に、極解析部102でサンプルされた時系列を所定のモデルに従って極解析を行う。そして、複素周波数算出部104で極解析の結果から複素周波数を得る。この複素周波数間の距離を距離計算部106で計算し、この距離に基づいてスコアリング部108で時系列の類似度を評価する。出力部110は、評価結果を所定のフォーマットで出力する。複素周波数を算出する方法としては、全極モデルや零・極モデルを用いる方法、線形予測を用いる方法などがある。このように複素周波数間の距離によって時系列の類似度を評価することにより、位相変動やレベル変動に強い特徴抽出が可能となる。 (もっと読む)


【課題】発音時刻及びF0推定処理に依存しない新規な楽器音認識方法を提供する。
【解決手段】不特定楽器存在確率を求めるステップと、条件付き楽器存在確率を求めるステップと、両者の積を算出するステップとを備えることを特徴とする。本発明に係る楽器音認識方法は、楽器音認識を単音ごとに行うのではなく、楽器存在確率を求めるため、従来よりも認識精度が高い。また、各楽器ごとに、時間t−周波数f平面上にインストログラムとして可視化することも容易であり、これを用いて楽器アノテーションを行ったり或いは楽曲構成に基づく類似楽曲検索を行うなど、様々な用途が考えられる。 (もっと読む)


【課題】異なるカラオケルームにわたる利用者グループ間での遠隔採点の結果が不快なものになりにくく、カラオケルーム間で利用者が遠隔採点を楽しむことができるようにすること。
【解決手段】カラオケシステム100は、楽曲データに基づいてカラオケ演奏を行う複数のカラオケ装置1とサーバ8とを備え、複数のカラオケ装置1とサーバ8との間でデータ通信可能に構成されている。サーバ8が、各カラオケ装置1の演奏履歴を分析してその傾向が似た一つ以上のカラオケ装置1からなるグループリスト(カラオケ装置グループ)を生成し、その生成されたグループリストに登録されたカラオケ装置1が、そのグループリスト内にて採点要請および採点結果の送受信を行う。このことにより、異なるカラオケルームにわたる利用者グループ間での遠隔採点の結果が不快なものになりにくく、カラオケルーム間で利用者が遠隔採点を楽しむことができる。 (もっと読む)


【課題】一定の評価基準に偏ることなく、練習者の歌唱や演奏を総合的に評価する。
【解決手段】 カラオケ装置1の記憶部14には、伴奏・歌詞データ記憶領域14aと、模範音声データ記憶領域14bと、楽譜音データ記憶領域14cと、練習者音声データ記憶領域14dとが設けられている。カラオケ装置1のCPU11は、楽譜に規定された内容と練習者の歌唱を比較する機械比較と、模範となる歌唱者の歌唱と練習者の歌唱とを比較する情感比較とを行い、これら双方の比較結果の関係から、練習者の歌唱を評価する。よって、一定の評価基準に偏ることなく、練習者の歌唱を総合的に評価することが可能となる。 (もっと読む)


【課題】歌唱練習や演奏練習を行うための楽曲練習装置において、曲中のどの箇所がどのように悪いのかを歌唱者に指摘することのできる技術を提供する。
【解決手段】楽曲練習装置1の記憶部14にはコメント文が複数記憶されている。楽曲練習装置1のCPU11は、記憶部14に記憶された模範音声データと生成された練習者音声データとを比較し、練習者音声データが模範音声データに対して所定量以上の隔たりがある場合は、練習者音声データの当該箇所を修正領域として特定する。CPU11は、特定した箇所における練習者音声データの模範データに対する隔たりの態様に応じて、記憶部14に記憶されたコメントテーブルからコメント文を選択して読み出し、記憶部14に記憶された歌詞データを読み出して表示部16に表示させるとともに、表示部16に表示されている歌詞データにおいて修正領域に該当する部分に、読み出したコメント文を表示させる。 (もっと読む)


【課題】練習者の歌唱(または演奏)とお手本の歌唱(または演奏)との違いを練習者が把握できる技術を提供する。
【解決手段】カラオケ装置1のCPU11は、模範音声データに対して音声分析処理を行って、ピッチ、パワー、スペクトルを音声データから算出する。そして、CPU11は、伴奏データと模範音声データとの対応関係を検出し、この対応関係とピッチ、パワー、スペクトルに基づいて、その音声データにおいて歌唱技法が用いられている区間を検出し、検出した区間を示す区間情報とその歌唱技法を示す種別情報とを対応付けた模範技法データを生成して記憶部14に記憶する。また、CPU11は、練習者の音声データに対しても同様の処理を行って練習者音声データを生成する。CPU11は、模範技法データと練習者技法データとを比較して、その相違箇所を表示させることによって練習者に報知する。 (もっと読む)


【課題】波動の伝播特性を忠実に模擬しつつ、その変化する伝播特性に容易に対応することが可能な波動合成装置を提供する。
【解決手段】波動を表すパルス列を生成するパルス列生成部と、波動が伝播する媒体を電子回路により近似的に模擬し、パルス列が入力され、媒体の 波動伝播特性に応じたパルス列を出力する波動伝播特性シミュレーション回路とを有する。媒体を波動が伝播する伝播時間と電子回路の入出力間のパル ス信号列の伝達時間とが関連付けられるように、電子回路が構成される。 (もっと読む)


【課題】背景騒音が重畳した場合の音声品質を精度よく推定する。
【解決手段】音声品質客観評価装置2は、コーデック種別毎に符号化歪量Ie及びパケット損失耐性Bplを保持するパラメータDB200と、コーデック種別情報に基づいてパラメータDB200を参照することにより、符号化歪量Ie及びパケット損失耐性Bplを決定するパラメータ決定部201と、想定する背景騒音の特性毎に補正値を保持する補正値DB202と、騒音情報に基づいて補正値DB202を参照することにより、補正値を決定して符号化歪量Ie及びパケット損失耐性Bplを補正するパラメータ補正部203と、補正された符号化歪量Ie及びパケット損失耐性Bplから音質劣化量Ie−effを算出する音質劣化量算出部204とからなる。 (もっと読む)


1,041 - 1,050 / 1,456