説明

国際特許分類[G10L21/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚 (2,017) | 音声から不可聴表現への変換,例.音声の可視化または触覚の補助のための音声処理 (94)

国際特許分類[G10L21/06]に分類される特許

31 - 40 / 94


【課題】音声信号の特徴量の時系列を編集する利用者の負担を軽減する。
【解決手段】抽出値取得部42は、音声の韻律に関連する特徴量の抽出値Aの時系列を取得する。相対値制御部54は、抽出値Aを基準とした相対値Cの時系列を設定する。編集値算定部56は、抽出値Aを相対値Cに応じて変化させた編集値Bの時系列を算定する。表示制御部46は、相対値Cの時系列を表す相対値画像GCを表示装置24に表示させる。制御点設定部52は、相対値画像GCのうち相対値Cの数値軸の方向における制御点PCの位置を利用者からの指示に応じて可変に設定する。相対値制御部54は、制御点PCの近傍の複数の時点の各々の相対値Cを、数値軸の方向における当該制御点PCの位置に応じて設定する。 (もっと読む)


【課題】音声の話速が変更された度合を利用者に直感的に把握させる。
【解決手段】話速変換部34は、音声信号S1に話速変換を実行することで音声信号S2を生成する。表示制御部32は、音声信号S1と音声信号S2とが対比的に配置された波形確認画像40を表示装置24に表示させる。波形確認画像40は、話速変換前の音声信号S1の波形W1をX方向の時間軸に沿って配置した領域A1と、話速変換後の音声信号S2の波形W2をX方向の時間軸に沿って配置した領域A2とをY方向に並置した画像である。表示制御部32は、音声信号S1に指定された対象区間T1と、話速変換後の音声信号S2のうち当該対象区間T1に対応する変換区間T2とについて、両区間の始点同士を連結する直線LAと終点同士を連結する直線LBとを、領域A1と領域A2との間の領域A3に配置する。 (もっと読む)


【課題】 音声の特徴自体によって直接的に制御を行うことを可能とした音声制御装置を提供する。
【手段】 音声取得部2は、音声を取得し電気信号に変換する。特徴量算出手段4は、音声電気信号を周波数解析し、特徴量を算出する。母音判定手段6は、算出した特徴量に基づいて、予め登録された母音との類似度に基づいて母音の判定を行う。制御手段8は、各母音を異なる方向に対応づけた平面または空間において、母音判定手段6によって判定された母音に対応する方向に、その類似度に対応する大きさのベクトルを想定する。制御手段8は、このようにして想定したベクトルに基づいて制御信号を出力する。このようにして、音声に基づいた制御を行うことができる。 (もっと読む)


【課題】音声ガイドメッセージを発話させるために必要十分な音声データファイルを効率よく編集、生成する。
【解決手段】フレーズの音声データとフレーズのテキストデータを含むフレーズデータが記憶されたフレーズデータ記憶部172と、センテンスの編集処理を行うセンテンス編集処理部120と、センテンスを構成するフレーズを特定するフレーズ特定情報とフレーズの再生順序に関するシーケンス情報を含むセンテンス情報の生成を行うセンテンス情報生成処理部122としてコンピュータを機能させる。センテンス情報生成処理部122は、前記センテンスのテキストデータを受け付け、受け付けたセンテンスのテキストデータを複数のフレーズに分割するセンテンス分割処理を行い、分割されたセンテンスを構成するフレーズのフレーズ特定情報とシーケンス情報を含むセンテンス情報の生成を行う。 (もっと読む)


【課題】音声認識性能に影響を与えるユーザ音声の物理量の改善を支援する音声診断装置及びユーザ音声診断方法を提供する。
【解決手段】ユーザ音声診断装置10の音声信号入力部101は、ユーザの発声による音声信号を入力し、物理量算出部102は、入力された音声信号に基づいて母音間距離と話者固有度の両方を含む物理量を算出する。物理量提示部103は、算出された物理量をユーザに提示する。 (もっと読む)


【課題】音声認識システムを提供する。
【解決手段】音声認識システムは、少なくとも1つの音声認識エンジンおよび表示装置を含み、且つ該表示装置上に信号インジケータインターフェイスおよび文字出力インターフェイスを設けてなる。そのうち、該信号インジケータインターフェイスは、波形によって使用者が入力した音声信号を表し、録音状態、音声認識進行中状態または音声認識完成状態を表示する。該文字出力インターフェイスは、音声認識した文字結果を表示することに用い、且つ該文字結果は少なくとも1つのワードユニットを含む。また、表示するワードユニットおよび対応する波形ユニットがそれぞれ1つのフィードバック調整選択項目組と連結する;そのフィードバック調整選択項目組は、少なくとも1つのフィードバック調整選択項目を含み、使用者にコマンドを選択させ、音声認識エラーを更正するか、または音声認識システムをフィードバック調整する。 (もっと読む)


【課題】複数の楽曲から違和感のない楽曲を生成する。
【解決手段】記憶装置30は、楽曲を区分した各素片Pの楽音データAと各素片Pの音響的な特徴量Fとを複数の楽曲の各々について記憶する。類否算定部12は、主楽曲の各主素片Pmについて、当該主素片Pm以外の副素片Psとの特徴量Fの類否の指標となる類否指標値Rを副素片Ps毎に算定する。選択部14は、類否指標値Rが類似を示す副素片Psを各主素片Pmについて選択する。加工部16は、各主素片Pmの楽音データAを、選択部14が当該主素片Pmについて選択した副素片Psの楽音データAに基づいて順次に加工する。表示制御部18は、主楽曲の複数の主素片Pmの各々について、当該主素片Pmと各楽曲の副素片Psとの類否指標値Rを楽曲毎に示す図表を表示装置44に表示する。 (もっと読む)


【課題】複数の素片の反復的な再生を利用者に直感的に認識させる。
【解決手段】記憶装置20は、楽音の波形を表す素片データAと楽音の特徴量Fとを、楽曲を区分した複数の素片Pの各々について記憶する。表示制御部12は、複数の単位図柄GUを円環状に配置した素片環Cを表示装置34に表示する。素片割当部14は、各単位図柄GUに素片Pを割り当てる。素片Pが割り当てられた単位図柄GUは、当該素片Pの特徴量Fに応じた態様(色相)で表示される。再生部16は、各単位図柄GUに割り当てられた素片Pの素片データAを、素片環Cにおける複数の単位図柄GUの配列の順番に再生する。 (もっと読む)


【課題】
会議中の複数の参加者の音声を取得して,刻々と変わる参加者の会話状況をリアルタイムに表示することで,より積極的な議論を誘発するような会議可視化システムを提供する。
【解決手段】
複数の会議参加者に対応した複数の音声収集部から収集した音声データを音声処理サーバ40で処理し、発話情報を抽出する。この発話情報を集計処理サーバ200に順次入力する。処理サーバ200のストリームデータ処理部で、この発話情報に対して、クエリ処理を施すことにより会議参加者の会議における発言回数累積値などのアクティビティデータを生成する。表示処理部203は、このアクティビティデータに基づき、会議参加者の対話状況を円の大きさや線の太さなどを用いて可視化して表示する。 (もっと読む)


【課題】各種装置等に音声信号を入力する際、ユーザに対して入力音声信号の大きさだけでなく、品質情報についても提示し、その提示情報に応じてユーザ自らが入力環境を適切に改善できるようにする。
【解決手段】音声信号入力部101から入力された音声信号のゲインを入力ゲイン調整部102で適正レベルに調整し、A/D変換部103でディジタル信号に変換し、このディジタル信号について一定時間ごとに切り出したフレームごとに、第1信号レベル計算部104で第1信号レベルを計算するとともに、音声尤度計算部107でスペクトル特徴量計算部105において求めた上記ディジタル信号の特徴量とクリーン音声信号の確率モデル(GMM)パラメータとから音声尤度値を計算する。そして、同一フレームの上記第1信号レベルと上記音声尤度値とを表示部108に表示する。 (もっと読む)


31 - 40 / 94