説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

1,021 - 1,030 / 1,456


【課題】サンプリング音声データに生じやすいピーク検出誤差に影響されずに、正確にテンポの抽出を可能にする。
【解決手段】任意の楽曲のサンプリング音声データから複数のピークを検出する(ステップS14)。この検出した複数のピークのピーク発生時間で並んだ移動前の第1のピーク列と、前記第1のピーク列のピーク発生時間を所定の時間(t)移動させた移動後の第2のピーク列とに基づいて、前記第1のピーク列と第2のピーク列との間でそれぞれ最も近いピーク間の時間の総和である、前記時間(t)の関数となるピーク間距離関数を算出する(ステップS16)。このピーク間距離関数は、前記第1のピーク列の間隔の周期性に対応して周期的に変化するため、ピーク間距離関数の周期に基づいて前記任意の楽曲のテンポを算出することができる(ステップS18)。 (もっと読む)


【課題】粗い間隔で探索信号を入力信号から切出し、少数の探索信号で蓄積信号DB(データベース)から探索信号の類似信号を選び、これを集めたDBにて密な間隔で入力信号から切出した探索信号で類似信号を探索し、高速に信号検出する信号検出装置を提供する。
【解決手段】本発明の信号検出装置は、蓄積信号を登録した蓄積信号DBと、上位探索信号を入力信号の複数箇所から切出す上位探索信号切出部と、上位探索信号に類似区間を含む蓄積信号を、蓄積信号DBから探索し、探索された蓄積信号を出力する上位探索部と、直前の探索での蓄積信号を集めた下位蓄積信号DBを作成する下位蓄積信号DB作成部と、下位検索キー信号を入力信号から複数箇所から切出す下位探索信号切出部と、下位探索信号に類似区間を含む蓄積信号を、下位蓄積信号DBから探索する下位探索部を備え、段階数に応じた探索を行う。 (もっと読む)


【課題】複数の拠点同士で音声データの送受信を行って音声会議を行う際に、拠点Aから伝送された入力音声が、拠点Bにおいて期待する明瞭な音声品質で再生されているか否かを確認する。
【解決手段】拠点Bにおいて、ネットワークを介して他の拠点Aと音声信号を送受信する通信部11Bと、通信部11Bにおいて受信された音声信号VAabを再生して出力する音声出力部13Bと、音源より発生した音声VBbと音声出力部13Bから出力された音声であるエコーVAbとを集音して入力する音声入力部14Bと、音声入力部14Bに入力された音声信号VAba+VBbaから、エコーの音声信号VAbaと音源より発生した音声の音声信号VBbaとを分離して抽出する所望音声抽出部12Bと、所望音声抽出部12Bにより抽出されたエコーの音声信号VAbaと音源より発生した音声の音声信号VBbaとを選択するスイッチ16Bと、を有しており、スイッチ16Bにより選択されたエコーの音声信号VAba又は音源より発生した音声の音声信号VBbaを通信部11Bにより、拠点Aへ送信可能に構成する。 (もっと読む)


【課題】利用者を飽きさせない対話型インターフェイスを実現する対話型インターフェイス制御システムを提供する。
【解決手段】マイクロフォン68から入力された音声から音特徴情報を抽出する音特徴抽出手段172と、その音特徴抽出手段172により抽出された音特徴情報に基づいて特徴定義情報を作成する特徴定義手段182と、その特徴定義手段182により作成された特徴定義情報を記憶する特徴定義データベース44と、その特徴定義データベース44からの読み出しを管理する読出管理手段192と、その特徴定義情報に基づいて映像表示装置60に表示される人型映像を制御する人型映像制御手段164とを、有することから、対話を重ねるうちに対話型インターフェイスが利用者の音声を反映したものに変化してゆくことに加え、特徴定義情報の読み出しを適宜管理することで、多様な利用形態を実現できる。 (もっと読む)


【課題】聴取者の主観的な評価の基準を歌唱者に示す。
【解決手段】歌唱者音声の特徴と模範音声の特徴との差分(特徴差分データ)と、その歌唱者音声に対する評価データとを対応付けて記憶しておく。そして、高い評価を表す評価データに対応付けられて記憶されている特徴差分データによって表される特徴と、低い評価を表す評価データに対応付けられて記憶されている特徴差分データによって表される特徴とを分析し、その特徴と評価との関係を求めて出力する。このような歌唱者音声の特徴とその歌唱者音声に対する評価との関係を歌唱者に示すことによって、歌唱者は聴取者の評価基準を認識することができる。 (もっと読む)


【課題】スポーツイベントのオーディオ信号からハイライトを抽出する方法を提供する。オーディオ信号はスポーツビデオの一部でもよい。
【解決手段】まず、特徴のセットがオーディオ信号から抽出される。特徴のセットは、音声分類として音楽と音楽付き音声とを含み、この音声分類に従って分類される。全く同じように分類された特徴の隣接する特徴のセットがグループ化される。特徴のセットが音楽と音楽付き音声とのいずれかに分類された場合は、この音声分類に対応するセグメントを非ハイライトとしてフィルタにより除去する。 (もっと読む)


【課題】 会場内に配置された音源から流される音楽によって来場者が携帯する端末装置で所定のアプリケーションを起動実行させる。
【解決手段】 来場者が携行するモバイル装置10では,音源Aから出力される音楽Aの範囲35に入ると,音楽Aを検出し,対応するアプリAを起動する。音楽Aの範囲35から外れると,実行中のアプリAを終了する。次に,音楽Bの可聴範囲36に入って音楽Bを検出すると,音楽Bに対応するアプリBが新たに起動される。音楽Bの範囲36から音楽Cの範囲37に移動すると,アプリBを終了し,新たに検出された音楽Cに対応するアプリCを起動する。また,音楽Bの範囲36にいる間にイベント切替が発生し,音源C33からの出力が音楽Cから音楽Eに変わると,アプリCを終了し,音楽Eに対応するアプリEを起動する。 (もっと読む)


【課題】カラオケ演奏を楽しみつつ無理なく子弟の学習能力を向上させるカラオケ装置を提供する。
【解決手段】演奏曲の出力に際してマイクロフォン40から入力される音声に基づいて演奏の内容を評価する演奏評価手段122と、予め定められた複数のドリル問題から選択される所定のドリル問題を出題する出題手段124と、その出題手段124により出題されたドリル問題に応じて電子早見本装置22やリモコン装置28等の入力装置により入力される回答を評価する回答評価手段126と、前記演奏評価手段122による評価結果及び前記回答評価手段126による評価結果に基づく双六ゲームを実行させるゲーム実行手段120とを、有するものであることから、カラオケ演奏と教育サービスとを相互に関連させた面白く且つ教育に寄与するゲームを実行することができる。 (もっと読む)


【課題】 CMとCMの間に番組宣伝等の短いCMが挿入された場合でも正確にCMが検出でき、また安価に実行できるCM検出方法を提供する。
【解決手段】 CMが切り替わる時点を検出し、隣接するCM切替時点の時間間隔が15秒や30秒等の1つのCMの放送時間に相当する場合にCM候補区間として選定するとともに、上記時間間隔が例えば5秒の番組宣伝等の別の種類のCM放送時間に相当する場合には準CM候補区間として選定し、CM候補区間と準CM候補区間の双方により形成されるブロックの長さが例えば60秒を超える場合には、そのブロックをCM区間と判定することにより、CMとCMの間に番組宣伝等のより時間の短い別種類のCMが挿入された場合でも、正確にCMの区間を検出することができる。 (もっと読む)


【課題】音声中の非発話音声を確実に検出して、音声信号を処理する音声中の非発話声音の判別処理方法を提供する。
【解決手段】音声中の非発話音声の判別処理方法において、音声を収集する工程と、収集した音声信号を予め設定された処理単位に区切る工程と、予め設定された処理単位内での音声のフラクタル次元数を計算する工程と、計算されたフラクタル次元数に基づいて、発話音声か非発話音声かを判別する工程とを施す。 (もっと読む)


1,021 - 1,030 / 1,456