説明

国際特許分類[G10L15/10]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | 未知音声と標準パタンとの距離または歪みを用いるもの (838)

国際特許分類[G10L15/10]に分類される特許

31 - 40 / 838


【課題】コンピュータ端末を利用して行なわれる説明を支援するための説明支援システム、説明支援方法及び説明支援プログラムを提供する。
【解決手段】タブレット端末20の制御部21は、説明義務リストを特定し、キーワード抽出処理を実行する。説明義務項目と判定した場合、制御部21は、説明義務リストの消込処理を実行する。更に、制御部21は、説明義務リストの消込状況を取得する。通知判定基準時間を超過しても、未消込の項目が残っている場合、制御部21は、注意喚起処理を実行する。また、NGワードと判定した場合、制御部21は、注意喚起を出力し、対応済みと判定した場合には、注意喚起の消去処理を実行する。そして、制御部21は、バックヤード通知処理を実行する。 (もっと読む)


【課題】作業効率を向上させることが可能な書き起こし支援システムおよび書き起こし支援方法を提供する。
【解決手段】実施形態の書き起こし支援システムは、第1記憶部と、再生部と、第2記憶部と、テキスト作成部と、設定部とを備える。第1記憶部は音声データを記憶する。再生部は音声データを再生する。第2記憶部は、音声データに対して音声認識処理を実行することにより得られる音声テキストデータを構成する複数の文字列の各々と、音声データの位置を示す音声位置情報とが対応付けられた音声インデックスを記憶する。テキスト作成部は、ユーザーの操作入力に応じてテキストを作成する。推定部は、音声インデックスに基づいて、音声データのうち、テキストの作成が完了した位置を示す作成済み音声位置情報を推定する。設定部は、作成済み音声位置情報に基づいて、再生を開始する位置を示す再生開始位置に設定する。 (もっと読む)


【課題】雑音抑圧性能を向上させる音響処理装置、音響処理方法、及び音響処理プログラムを提供する。
【解決手段】記憶部は機器の動作を表す動作データと前記動作における音響特徴量とを対応付けて記憶し、雑音推定部は入力された音響信号の音響特徴量に基づいて雑音成分の音響特徴量を推定し、音響特徴量処理部は前記入力された音響信号の音響特徴量と、前記雑音推定部が推定した前記雑音成分の音響特徴量に基づいて前記雑音成分を除去した目標音響特徴量を算出し、更新部は入力された動作データと前記雑音推定部が推定した前記雑音成分の音響特徴量に基づいて、前記記憶部に記憶された音響特徴量を更新する。 (もっと読む)


【課題】複数の情報供給源が有っても、ユーザが所望する情報を正確に提供できる対話制御装置を提供する。
【解決手段】対話制御装置1は、サービス識別子と情報識別子の複数の組と各組に関連するキーワード及び重み係数とを記憶する記憶部32と、各キーワードについて入力された音声信号から検出された認識候補単語との類似度を重み係数が大きいほど大きくなるように算出し、類似度が最大となるキーワードを検出するキーワード決定部34と、検出されたキーワードと関連するサービス識別子と情報識別子の組により特定される提示情報を取得する提示情報取得部35と、現在の提示情報の供給源を表す第1のサービス識別子が以前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて第1のサービス識別子と関連するキーワードの重み係数及び第2のサービス識別子と関連するキーワードの重み係数を更新する重み更新部39とを有する。 (もっと読む)


【課題】 精度良く音を検出する音検出装置及びその制御方法、プログラムを提供する。
【解決手段】 音を検出するための閾値を用いて、音入力部から入力した音から特定の音を検出する。撮像部が撮像した画像を記録する。記録した画像と撮像部が撮像した現在の画像との差分をとり、現在の画像から、動体のある箇所を検出する。撮像部が撮像する画像中の特定位置を示す情報とその特定位置で起こり得る音を示す情報との対応を管理する。動体が検出された場合には、位置・音対応情報管理部で管理される音を検出するための閾値を変更し、その変更した閾値を用いて、該位置・音対応情報管理部で管理される対応を参照して、音入力部から入力した音から特定の音を検出する。 (もっと読む)


【課題】話者の異常状態の検出を高い検出精度で行えるようにする。
【解決手段】第一算出部12は、話者の発話を表している発話データ2から、発話の特徴を表している特徴パラメータの統計量を算出する。擬似発話データ作成部13は、このうちの少なくとも1つの統計量が基準発話データ3のものと一致する擬似発話データ4を、発話データ2と基準発話データ3との特徴パラメータの統計量に基づき作成する。基準発話データ3は平常状態下の発話を表している。第二算出部14は、擬似発話データ4と発話データ2の特徴パラメータの統計量とに基づき、擬似発話データ4を発話データ2が入力された分だけ置き換えて得られる合成発話データ5の特徴パラメータの統計量を算出する。検出部15は、合成発話データ5と基準発話データ3とでの特徴パラメータの統計量の違いに基づいて、発話データ2が表している発話の話者の異常状態を検出する。 (もっと読む)


【課題】オーディオデータ(例えば、オーディオブック)における位置とテキストデータ(例えば、電子書籍)における対応する位置とを対応付けるマッピングを作成する技術を提供する。
【解決手段】テキストバージョンが存在する作品の可聴バージョンを反映するオーディオデータを受信する工程、前記オーディオデータの部分に対するテキストを生成するために前記オーディオデータの音声ーテキスト解析を実行する工程、前記オーディオデータの前記部分に対して生成された前記テキストに基づいて、前記オーディオデータにおける複数のオーディオ位置と前記作品の前記テキストバージョンに対応する複数のテキスト位置との間をマッピングする。 (もっと読む)


【課題】受聴者が発話状況を容易に把握できる情報処理装置、情報処理システム、情報処理方法又は情報処理プログラムを提供する
【解決手段】表示データ生成部は、発話の内容を表す文字と、当該文字を囲んで一方向を示す標識を表す表示データを生成し、画像合成部は、前記発話に係る音源を表す画像の表示位置に基づいて、前記音声が放射される放射方向に前記一方向を向けて前記表示データを合成する。 (もっと読む)


【課題】話者の通話内容に基づいて実行されたタスクの誤りの訂正に対応しやすいサービスサーバ装置を提供する。
【解決手段】音声通信に係るアプリケーションによって実行されるタスクとは別の別タスクを実行する指示を受付けるサービス起動部250、複数の音声通信端末装置間の音声通信中の、話者の音声を録音する電話/呼制御イネーブラ201、録音された音声に基づいてタスクを実行し、実行された結果を示すテキストデータと実行された結果を示す音声データとを含むタスクデータを作成する音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202によってサービスサーバ装置を構成する。このサービスサーバ装置によって、複数の音声通信端末装置、または音声通信端末装置に対応付けられた他の通信端末装置の少なくとも一方にタスクデータを提供する。 (もっと読む)


【課題】発言する出席者に対する評価ばかりでなく、会議に参加する他の出席者の態度をも含めて評価することで、会議全体の評価を可能とし、他の出席者の態度を評価数を少なくして簡便にしながら、評価精度を高くして、出席者が評価されていることを意識せずに、時々刻々に会議の品質を評価でき、以って出席者の適正化提案を可能とする。
【解決手段】品質評価手段が、回転方向姿勢から、発言者以外の出席者の回転方向姿勢をうつ伏せ、仰向け及び直立不動の3状態のいずれにあることの姿勢状態決定を行い、発言状態検出手段で検出された発言状態から、予め定められた発言評価テーブルを参照して会議の品質評価の1項目とする発言評価結果を形成し、決定された姿勢状態から、予め定められた姿勢評価テーブルを参照して会議の品質評価の他項目とする姿勢評価結果を形成し、発言品質評価値及び姿勢評価値に基づいて品質評価時の会議の品質評価を演算する。 (もっと読む)


31 - 40 / 838