説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

1,391 - 1,400 / 1,456


【課題】利用者自らの基準で、可搬型記録媒体へ書き込める程度に客観的に上手く歌唱できた録音音声を、任意の書き込み装置にて、利用者が何時何処でも満足行く書き込みができるカラオケ録音システムの提供。
【解決手段】各利用者が所定のカラオケ楽曲の歌唱力に対し、可搬型記録媒体へ書き込める程度に客観的に上手く歌唱したかどうかの基準採点値を予め自らカラオケホスト装置に登録し、任意のカラオケ演奏端末において、利用者IDが認識された利用者に対し、特別なプロセスに従うことなく通常のカラオケ利用において、当該利用者が所定のカラオケ楽曲を歌唱した際、その利用者ID、楽曲コード、採点結果および録音音声データを転送し、その採点結果が基準採点値を越えた場合、その録音音声データを任意の書き込み装置にて可搬型記録媒体に書き込みできるように、カラオケホスト装置に記録するシステムを構築した。 (もっと読む)


【課題】カラオケ演奏端末が付帯する歌唱力の採点手段を有効に活用し、他の利用者のカラオケ利用に支障を生じさせることなく、また、利用者が歌唱時にプレッシャーを受けることなく本来の力が発揮できると共に、利用者自らの基準で、可搬型記録媒体へ書き込める程度に客観的に上手く歌唱したことを知らしめ、利用者が何処でも満足行く書き込みができるカラオケ録音システムの提供。
【解決手段】利用者は基準採点値を予め自らカラオケホスト装置に登録し、このカラオケホスト装置とネットワーク接続された任意のカラオケ演奏端末において、利用者IDが認識された利用者に対しては、特別なプロセスに従うことなく通常のカラオケ利用において、当該利用者が所定のカラオケ楽曲を歌唱した際、その採点結果が基準採点値を越えた場合、その録音音声に対する所定の可搬型記録媒体への書き込み指示を促すメッセージを表示するシステムを構築した。 (もっと読む)


マルチメディア信号、特に音声信号から指数情報を取り出す方法及び装置であって当該音声信号の速度変化に無関係なものが開示されている。このため、本方法は、マルチメディア信号、例えば音声信号のパワースペクトルから強力な知覚的特徴のセットを抽出すること(12,13)を含む。フーリエ・メリン変換(15)によって、そのパワースペクトルを、音声再生速度が変化した場合にのみ位相変化を受けるフーリエ係数に変換する。これらの大きさ又は位相差(16)は、速度変化に不変な指紋情報を構成する。閾値動作(19)によって、指紋情報を少数ビットによって表すことができる。 (もっと読む)


【課題】 音声の内容に同期してキャラクタ映像を表示できるキャラクタ映像表示機能付き電話を提供する。
【解決手段】 キャラクタ映像表示機能付き電話110は、音声情報を受信する電話受信部11と、電話受信部111に入力された音声情報に基づいてキャラクタ映像を作成する映像生成部113と、電話受信部111に入力された音声情報を出力する音声情報出力部112と、映像生成部113にて生成されたキャラクタ映像を、音声情報に合わせて出力する映像出力部114とを備える。映像生成部113は、音声情報から音素を抽出する音素抽出部と、音素抽出部にて順次抽出される音素に合った唇の画像を含むキャラクタ映像を生成する画像選択部を有する。 (もっと読む)


【課題】 より多くの視聴者を参加させることが可能なカラオケ情報配信システム等を提供すること。
【解決手段】 ユーザーを歌唱者または視聴者として所望のカラオケステージに参加させるためのステージ選択画像を端末装置が表示するためのステージ選択画像情報と、カラオケステージを示すステージ画像を端末装置が表示するためのステージ画像情報とを生成する情報生成部112と、端末装置から送信されるカラオケステージの選択を示す選択情報に基づき、ユーザーによる選択内容を判定する判定部114と、選択情報に基づき、各カラオケステージにおける視聴者の人数を示す人数集計情報を生成する集計部117と、端末装置から選択情報を受信し、端末装置へ向けステージ選択画像情報と、ステージ画像情報を送信する送受信部190とを含んでサーバー100を構成する。 (もっと読む)


【課題】本方法は、未知の多次元データ内のパターンを発見するものである。
【解決手段】多次元データの時系列が生成され、時系列の自己相関をとることにより、点横断距離マトリクスが構成される。複数の時間分解能において、点横断距離マトリクス内の全ての最小コスト経路が見つけられる。そして、未知の多次元データ内の高レベルのパターンを発見するために、最小コスト経路が、多次元データ内の時間的な部分列に関連付けられる。
(もっと読む)


【課題】 リアルタイムにアドバイス文言を表示し、かつ、異なる評価の得点を複数種類表示するカラオケ装置を提供する。
【解決手段】 カラオケを歌唱すると、採点機能が動作して、歌唱の音高・音量・リズムを点数化する。この点数に基づいて3人の審査員が採点する。3人の審査員はそれぞれ異なる重み付けで音高・音量・リズムのポイントを加重平均する。これにより、ことなる側面からの評価を表示することができ、各審査員を演歌やポップスなどの異なるジャンルに対応させておけば、自分がどのジャンルの歌唱に向いているかを点数から判断することも可能になる。 (もっと読む)


【課題】 複数曲のサンプルデータを符号化し、その後、符号化データの復号および再生を行う場合において、無音期間を生じさせることなく複数曲の連続再生を行うことを可能にし、かつ、複数曲のうちの特定の曲からの再生も可能にする。
【解決手段】 符号化装置100は、複数曲の全サンプルデータ列を符号化してMP3フレームを生成するとともに、全サンプルデータ列における曲間の区切り位置を示す区切り位置データを生成する。サーバ200は、複数曲における特定曲が要求された場合には、指示された曲に関連した区切り位置データとMP3フレームをクライアント300に送り、クライアント300ではMP3フレームを復号し、得られるサンプルデータ列のうち、指定された曲に属するサンプルデータを区切り位置データに基づいて選択して音声として出力する。 (もっと読む)


【課題】高精度に子音部の音声認識を行なう。
【解決手段】入力された音声の音声波形信号から所定時間間隔で複数の音声区間の特徴量を抽出し、音節別状態遷移モデルと抽出した特徴量とを用いて、入力された音声の段を判定し、段別状態遷移モデルと判定された段とを用いて、判定された段に対応する段別状態遷移モデルの前半部分の状態に割り当てられた音声区間に対し、子音認識に最適な分析条件で子音部分の特徴量を抽出し、音節別子音状態遷移モデルと抽出した子音部分の特徴量とを用いて子音部を判定することにより、音節音声を判定する。 (もっと読む)


【課題】従来普及している語学の音声教材を利用し、簡略な構成で発音の善し悪しを採点できる発音評価装置を提供する。
【解決手段】教材の音声をMDプレーヤ2から入力し、これをスピーカ11から出力するとともにDSP13でストレスアクセント、トニックアクセント、イントネーションなどを分析する。分析結果はメモリ14に記憶する。次にマイク3から学習者の練習の音声を入力し、上記教材の音声と同様にDSP13でそのストレスアクセント、トニックアクセント、イントネーションなどの発音情報を分析する。学習者の音声の発音情報が教材のものと同じであれば正しく発音していると考えられるため、両発音情報を比較し、その類似度に基づく採点結果をディスプレイ22に表示する。これにより、採点のための情報を持たない従来の音声教材を用いて学習者の発音を採点することが可能になる。 (もっと読む)


1,391 - 1,400 / 1,456