説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

81 - 90 / 119


【課題】一般公衆もしくは個人向けに主として映像によって情報を提供する場合に、その映像を見ることができる場所にいるユーザが、その映像を注視しているかどうかを検知したい。また、ユーザの興味や属性を知ることにより、効率の良い情報提供を行ないたい。
【解決手段】音声入力部によって取得された音声データと、現在提供している映像データおよび映像データに付加された情報とを比較し、その類似度から対象者の注視度を推定する。また、言語識別装置により対象者の使用言語を推定し、その言語を用いて情報提供を行なう。 (もっと読む)


【課題】所定の入力装置から入力されるユーザの所望の音声が、既設音声と対応しているか否かを判定することにより正確な音声登録が可能な音声案内装置、音声案内装置の制御方法及び制御プログラムを提供する。
【解決手段】 変更受付部41は、ユーザからの既設音声の変更要求を受け付ける手段である。信号処理部42は、入力されるアナログ音声信号をデジタルの信号へ変換処理する手段である。音声認識部43は、音声データを解析し、発話者が何を言ったかを認識する手段である。キーワード判定部44は、変更対象の既設音声に該当するキーワードをキーワードテンプレートから読み取り、当該キーワードが、入力音声データに含まれるか否かのパターンマッチングを行う手段である。音声登録部45は、既設音声に代えて、入力音声を案内音声として、音声案内データベースに記録する手段である。 (もっと読む)


【課題】利用者の意図に沿った適切な情報検索を実現すること。
【解決手段】情報検索装置100において、入力された音声データに音声認識処理を施して、検索要求のための検索式に指定する単語の候補を出力する音声認識部105と、入力された音声データに基づいて音声の属性に関する情報である非言語情報を求める非言語情報分析部106と、非言語情報に基づいて出力された単語の候補から単語ごとの検索の優先度を求め、単語ごとに優先度を設定して検索式を生成する検索式生成部107と、インターネット130上の情報検索サーバ120に対し検索式を指定して検索要求を送信し検索結果を受信する検索要求部108と、検索結果を出力する出力処理部109とを備えた。 (もっと読む)


【課題】視聴者が希望する番組を正確に録画できる予約番組記録装置を実現する。
【解決手段】放送受信装置10は、放送番組の信号より放送番組情報を取得する放送番組受信部101と、記録する放送番組の音声情報を取得し音声情報一時記録媒体102に一時的に保存する音声情報一時記憶部103と、音声キー記録媒体104に記録されている音声キー情報と一時保存された音声情報とを照合する音声照合部105と、音声照合結果を元に番組予約制御方法を決定する番組予約制御部106と、放送番組記録媒体107に予約番組の記録を行なう放送番組記録部108とから構成されている。 (もっと読む)


【課題】 ユーザが歌ったメロディからユーザ所望の楽曲を的確に選択することができるようにする。
【解決手段】 音楽再生装置1は、音楽の一部または全部のメロディを示すメロディデータ22に関連付けてその音楽の音楽データ21を記憶した楽曲データ記憶部11と、ユーザ音声の音声入力信号からメロディを抽出するメロディ抽出部14と、メロディ抽出部14により抽出されたメロディのキーを所定のキーへ変換するとともに、楽曲データ記憶部11を検索し、キー変換したメロディを有する音楽データを検出する検索部16と、検索部16により検出された音楽データ21から音楽信号を再生する再生部12とを備える。 (もっと読む)


【課題】 たとえばスライドが提示されない状況においても、発話記録を容易に検索することができる情報処理装置を提供することを目的とする。
【解決手段】 情報処理装置1は、入力された音声信号に基づいて発話の開示時刻と終了時刻を少なくとも含む発話データを抽出する発話データ抽出部71と、所定の時間間隔でランドマークデータを生成するランドマークジェネレータ9と、ランドマークジェネレータ94が生成したランドマークを出力するランドマーク出力部94と、発話データに対してランドマークデータを索引として付与するインデックス統合処理部11と、発話の開始時刻と終了時刻を用いて発話をセグメント化した発話セグメントを視覚化した発話チャートにランドマークを対応させて表示する生成部12とを備える。 (もっと読む)


【課題】ユーザ適応型の音声認識方法及び音声認識装置を提供する。
【解決手段】ユーザから入力された音声の認識結果による認識候補の信頼度を計算する信頼度計算部130と、前記認識候補についてユーザに確認した結果と前記計算した認識候補の信頼度とを利用して、ユーザに適応した新たな閾値を設定する閾値設定部140と、前記計算した認識候補の信頼度が前記設定した新たな閾値以上であれば、前記認識候補を音声認識結果として出力する制御部150と、を含むユーザ適応型の音声認識装置。これにより、音声認識結果に対するユーザの確認過程を減らしつつ音声認識の成功率を高めることができる。 (もっと読む)


【課題】 音声会議システムにおいて参加者の負担を増加させることなく、会議の活性化および議事進行の改善を可能とする手段を提供する。
【解決手段】 サーバ装置14の音声信号受信部141は、端末装置11の各々からユーザ19の音声信号を受信する。サーバ装置14の応答音声信号選択部1455は、応答条件DB1444に含まれる条件が充たされるか否かを判定し、当該条件が充たされる場合には、当該条件に対応付けられた応答音声信号を応答音声信号群1445から読み出して応答音声信号ミキシング部1457に引き渡す。応答音声信号ミキシング部1457は、発言音声信号ミキシング部1456によりミキシングされた各々のユーザ19の発言を示す音声信号と、応答音声信号選択部1455から引き渡された応答音声信号をミキシングした後、各々の端末装置11に送信する。 (もっと読む)


【課題】 音声認識を用いたデータ検索における検索精度を高める。
【解決手段】 検索対象の各データに関連付けられた音声データに対し音声認識を行い、サブワード表現形式で認識結果を出力する(S302)。入力されたキーワードもサブワード表現形式に変換する(S305)。次に、上記音声認識結果とサブワード表現形式のキーワードとに基づき、当該キーワードと各データに関連付けられた音声データとの類似度を計算する(S306)。その後、その類似度に基づき選択されるデータについて、そのデータに関連付けられた音声データを入力とし、サブワード表現形式に変換されたキーワードを認識対象語とする音声認識を行う(S308)。そして、その認識スコアに基づいて検索スコアを計算し(S309)、その検索スコアに基づいて選択されるデータを検索結果としてユーザに提示する(S310)。 (もっと読む)


【課題】認識されたキーワードの信頼度にフレーム間での影響の相違を反映させ得る音声認識方法を提供する。
【解決手段】受信された音声信号からフレーム別に特徴ベクトルが抽出される。各フレームの特徴ベクトルに対してキーワードモデルの尤度とフィラーモデルの尤度とが算出される。算出された二種類の尤度の比からフレーム別の信頼度点数(c1,…,cn)が算出される。各フレームの信頼度点数に基づき、各フレームの特徴ベクトルの属するクラスターが選択される。クラスター別に異なる変換関数(fcluster1,…,fclusterM)を用いてフレーム別の信頼度点数が変換される(C'1,…,C'n)。変換されたフレーム別の信頼度点数の平均値としてキーワードモデルの信頼度が算出される。 (もっと読む)


81 - 90 / 119