説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

71 - 80 / 1,893


【課題】異なる端末間のコンテンツ連携を実現し、特に希望するコンテンツを迅速に表示する。
【解決手段】本発明によるサービス提供装置1は、第1サービス提供部10と、第2サービス提供部20とを備え、第1サービス提供部10は、音声認識機能部12を備え、第1利用者端末100より第2コンテンツの変更要求を受信した場合、音声認識機能部12が第1利用者端末100からの音声から取得した文字情報に基づき、コンテンツ配信表32より変更後の第2コンテンツを選択し、第2サービス提供部20は、第1サービス提供部10が選択した変更後の第2コンテンツを第2利用者端末200に提供する。 (もっと読む)


【課題】用件に対する話者間の対話時の音声信号から用件に係る必要情報を精度よく抽出することができる技術を提供する。
【解決手段】音声認識手段13は、話者間の対話時の音声信号を音声認識情報に変換する。会話単位分割手段14は、音声認識情報を会話単位に分割する。必要情報手掛かり情報付与手段16は、会話単位に含まれている必要情報手掛かり情報を会話単位に付与する。用件判別手段15は、音声認識情報に基づいて話者間の対話の用件を判別する。対話状態遷移判別手段17は、用件に対応する必要情報を抽出するための手掛かりとなる必要情報手掛かり情報が含まれている会話単位を選択する。そして、選択した会話単位と、用件に対応して対話状態判別情報データベース25に記憶されている対話状態判別情報に基づいて、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することにより必要情報を抽出する。 (もっと読む)


【課題】大幅に送信データ量を増やすことなくサーバ端末から音声認識用の音声特徴量と元の音声の発言内容を書き起こすための情報とを送信することができ、かつ、サーバ端末で元の音声の発言内容を示すテキストと音声認識用の音声特徴量を収集することができる技術を提供する。
【解決手段】クライアント端末の音声圧縮部が、入力音声信号を低ビットレートコーデックにより圧縮し圧縮音声信号を生成し、音声特徴量変換部が、入力音声信号を音声特徴量に変換し、送信データ結合部が、圧縮音声信号と音声特徴量とを結合し送信データを生成する。サーバ端末の送信データ分割部が、受信した送信データを圧縮音声信号と音声特徴量とに分割し、音声認識部が、音声特徴量を用いて音声認識を行い、認識結果を求め、音声復元部が、低ビットレートコーデックにより圧縮音声信号を低品質の音声に復元する。 (もっと読む)


【課題】ユーザの想定に近い音素材が検索結果として得られるようにすること。
【解決手段】本発明の実施形態における楽音処理装置は、楽音波形信号を示す楽音データと当該楽音波形信号の複数種類の特徴量を示す特徴量データとを対応付けて登録された音素材データベースを用いて、ユーザから指定される検索条件に基づいて検索し、検索結果を表示する。このとき、ユーザの想定に近い音素材が検索結果として得られるように、ユーザによって指定された検索アルゴリズムにより検索が行われる。 (もっと読む)


【課題】少量の音素ラベリングデータから新音素体系の大量の音素ラベリングデータを精度良く生成する音素ラベリングデータ音素継続時間長変換装置を提供する。
【解決手段】音素継続時間長分布推定部は、変換対象話者の新音素体系における少数の音素ラベリングデータである参照ラベリングデータと、複数話者のある音素体系における音素種別の音素継続時間長の平均値・分散値を、統計的に信頼できる値として得ることが可能な数の複数話者ラベリングデータを入力として、参照ラベリングデータを複数話者ラベリングデータで直線回帰し、複数話者ラベリングデータの全ての音素種別に対応する変換対象話者の音素継続時間長の平均値と分散値である音素継続時間長分布を求め、1個の音素継続時間長に対して複数の音素情報を持つ音素ラベリングデータを、音素情報毎に時間長を分割して新音素ラベリングデータとして出力する。 (もっと読む)


【課題】従来よりも性能の高い評価関数を導出する対話評価技術を提供する。
【解決手段】対話データ記憶部1には、複数のユーザのそれぞれについての各対話の対話データが記憶されている。統計量抽出部2は、対話データから各複数のユーザの対話の所定の発言の数の平均値及び対話の長さの平均値を計算し、また、対話データから評価関数の説明変数となる統計量を抽出する。クラスタリング部3は、計算された対話の所定の発言の数の平均値及び対話の長さの平均値に基づいて複数のユーザをクラスタリングする。評価関数導出部4は、各クラスタに対応する評価関数を、その各クラスタに含まれるユーザについての統計量を説明変数としユーザ評定値を応答変数とする重回帰分析により導出する。 (もっと読む)


【課題】ユーザが電子ブックのテキストを声を出して読んでいる間にユーザのリーディング技術を評価するシステムおよび方法を提供する。
【解決手段】自動リーディングシステム100は、ユーザが読んでいるときにユーザ音声の言語内容の推定を項目スコアに変換して評価し、スコアに応じて操作可能な評価電子ブックのテキストを調整して当該電子ブックの困難レベルプロフィールを増減する。自動リーディングシステムは、リーディング推薦、フィードバックおよびマーケティングデータも与える。 (もっと読む)


【課題】置換コマンドを持つ音声認識方法を提供する。
【解決手段】第二のテキスト情報にて認識される四語の音声入力コマンドを伴う第一のテキスト情報内の誤認識したテキスト情報の要素を編集する音声認識方法において、第一のテキスト情報及び第二のテキスト情報を認識するステップと、第二のテキスト情報の第一の位置の単語が四語の音声入力コマンドのうちの第一の音声入力コマンドの要素との一致をチェックし、第二のテキスト情報の第三の位置又は他の位置の単語が四語の音声入力コマンドのうちの第三の音声入力コマンドの要素との一致をチェックし、四語の音声入力コマンドのうちの第四の音声入力コマンドの要素として第二のテキスト情報が含んでいる新たなテキスト情報の要素に、第一のテキスト情報で誤認識されたテキスト情報の要素を置換するステップとを有する。 (もっと読む)


【課題】単語レベルの変換候補生成に基づく音声認識システム及び方法が開示される。
【解決手段】音声認識システムは、音声認識の結果として、単語列及び単語列に含まれた単語のうち少なくとも1つの単語に対する変換候補単語が提供される場合、単語列及び変換候補単語を確認する音声認識結果確認部及び単語列を表示装置を介して表示するが、変換候補単語が存在する少なくとも1つの単語を単語列の残りの単語と区分して表示する単語列表示部を備え、単語列表示部は区分して表示された単語がユーザによって選択される場合、区分して表示された単語を変換候補単語に変更して表示する。 (もっと読む)


【課題】基準変換手段を伴なう音声認識装置及び方法を提供する。
【解決手段】第1の受信チャネル21と第2の受信チャネル25とを含む複数の受信チャネルを介して受信可能な音声を認識するための音声認識装置8であって、音声認識装置は複数の基準話者による単語の発音を特徴とする話者に独立の基準情報を蓄積するための蓄積手段41〜43であって、前記蓄積手段は、前記第1の受信チャネルに対応する基準情報を、前記第2の受信チャネルに対応する基準情報に変換して第1の変換を更に蓄積する蓄積手段と、第1の適応された基準情報を取得するように、前記第1の受信チャネルを介して話すユーザの音声の特徴に従って、話者に独立した基準情報に適応するために第1の受信チャネルを介して前記ユーザから得られた音声情報を用い、前記第1の変換を用いて前記第1の適応された基準情報を、前記第2の受信チャネルに適応するためのユーザ適応手段37とを有する。 (もっと読む)


71 - 80 / 1,893