説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

101 - 110 / 1,893


【課題】誤りのない確実なオーディオデータの照合を実現することのできるオーディオデータ照合システムを提供する。
【解決手段】本発明のオーディオデータ照合システム1は、既知のオーディオデータから特徴データを抽出するオーディオデータ特徴抽出装置2と、既知のオーディオデータから生成された特徴データに識別情報を登録してデータベース31に格納する特徴データ格納サーバ3と、未知のオーディオデータから特徴データを生成し、データベース31に格納されている特徴データと比較して照合するオーディオデータ照合装置4とを備えていることを特徴とする。 (もっと読む)


【課題】 音声認識で操作するテレビジョン装置において、音声認識中に出力音声をミュートする機会を必要最小限に抑える。
【解決手段】 ユーザによる音声認識開始の指示の入力を受けてから、音声認識処理が終わるまでの間、出力音量の設定値を一時的に閾値以下の値に変更する。 (もっと読む)


【課題】韻律に関する適切なパラメータを用いた制御を行うことによって、入力される音声の韻律を変換し、聞き取り易い音声を出力する。
【解決手段】韻律変換装置は、音声の韻律データを記憶する韻律データ記憶部と、前記韻律データに関する基準値をパラメータとして記憶するパラメータ記憶部と、韻律変換処理のための係数を設定値として記憶する設定部と、入力音声を分析し前記入力音声の韻律データを前記韻律データ記憶部に書き込むとともに、前記韻律データに関する基準値を求めて前記パラメータ記憶部に書き込む音声分析部と、前記設定部から読み出した前記設定値を用いて前記パラメータ記憶部に記憶された前記基準値からの韻律の変位量を変化させることによって前記韻律データ記憶部に記憶された前記韻律データを変換し、変換後の韻律データを用いて前記入力音声の韻律を変化させて出力する韻律変換部を具備する。 (もっと読む)


【課題】対話システムで、コミュニケーションギャップをリアルタイムに解決し、持続的かつ自然なコミュニケーションを行う。
【解決手段】インタラクション状態量算出部12は、ユーザPの発話における話者交替潜時、発話区間のピッチ、パワーまたはモーラを含むインタラクション状態量を検出する。コミュニケーション同調制御部13は、ユーザPとロボットシステム10とのコミュニケーション同調ずれ量を算出し、同調モデルを表す状態方程式による連続的な引き込み制御によりコミュニケーション同調ずれ量を最小化すると同時に、インタラクションルールによる離散的な引き込み制御により、ユーザPのインタラクション状態量をロボットシステム10のそれに近づけていく、または、ロボットシステム10のインタラクション状態量をユーザPのインタラクション状態量に近づけつつユーザPのインタラクション状態量をロボットシステム10のそれに近づけていく。 (もっと読む)


【課題】入力される音声を逐次テキスト化して表示する際、利用者にとって読みやすく理解しやすい字幕を生成できるテキスト表示時間決定装置、テキスト表示システム、テキスト表示時間決定方法、およびテキスト表示時間決定プログラムを提供する。
【解決手段】テキスト表示装置は、認識結果作成手段81と、表示時間決定手段82とを備えている。認識結果作成手段81は、入力される音声を逐次認識してテキスト化した認識結果を作成する。表示時間決定手段82は、音声の発話時間に基づいて、認識結果に含まれる文章ごとに表示時間を決定する。 (もっと読む)


【課題】 コンテンツを閲覧した複数のユーザの好みを考慮したアルバムやダイジェストを自動で作成する。
【解決手段】 再生された複数のコンテンツを閲覧した複数のユーザの反応を取得(S304、S306)し、この取得された複数のユーザの反応に基づき、前記再生された複数のコンテンツの優先度を決定し(S308)、決定された優先度に基づいてアルバムを作成する(S309)。 (もっと読む)


【課題】通話で送信されてきた音声信号に基づいた情報を容易に得る。
【解決手段】通信装置100−1が、通信装置100−2から送信されてきた音声信号から音声を認識し、認識した音声を示す音声情報をサーバ200へ送信し、サーバ200が、送信されてきた音声情報に基づいて表示情報を、音声情報と表示情報とをあらかじめ対応付けて記憶する記憶部から検索し、検索した表示情報を通信装置100−1へ送信し、通信装置100−1が、サーバ200から送信されてきた表示情報を表示する。 (もっと読む)


【課題】操作者が器具を咥えながら喋った単語を正しい単語に変換して送信する通信装置を提供する。
【解決手段】通信装置の補償回路7において、単語変換部72は、A/D変換器6から受けたデジタル信号に基づいて単語を認識し、その認識した単語を判定部73へ出力する。また、単語変換部72は、単語が誤っていることを示す信号ICORを判定部73から受けると、内蔵している電子辞書721を用いて正しい単語の候補単語を抽出して判定部73へ出力する。判定部73は、単語変換部72から受けた単語をスピーカ2を介して潜水者に提示し、その提示した単語が正しい単語であることを示す信号CORを操作ボタン11から受けると、単語変換部72から受けた単語を正しいと判定してモデム8へ出力する。一方、判定部73は、信号CORを受けないとき、信号ICORを単語変換部72へ出力する。 (もっと読む)


【課題】周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供すること。
【解決手段】実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。 (もっと読む)


【課題】本発明は、通話内容を把握することが容易な通信機器及び表示システムを提供する。
【解決手段】通信機器は、表示部21と、音声が入力され、入力された音声を音声データに変換して出力するマイク12と、外部通信機器との間での通話に利用され、その外部通信機器から音声データが入力される通信部32と、特定の単語に対応する登録単語データを記憶する記憶部33と、マイク12から出力された音声データと通信部32に入力された音声データとの少なくとも一方と、記憶部33に記憶された登録単語データとに基づいて、各音声データに基づく音声の中に含まれる特定の単語を抽出する抽出部41と、抽出部41によって抽出された特定の単語或いは当該特定の単語を含む文節又は文を表示部21に表示させる表示制御部42と、を備える。 (もっと読む)


101 - 110 / 1,893