説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

61 - 70 / 1,893


【課題】受聴者が発話状況を容易に把握できる情報処理装置、情報処理システム、情報処理方法又は情報処理プログラムを提供する
【解決手段】表示データ生成部は、発話の内容を表す文字と、当該文字を囲んで一方向を示す標識を表す表示データを生成し、画像合成部は、前記発話に係る音源を表す画像の表示位置に基づいて、前記音声が放射される放射方向に前記一方向を向けて前記表示データを合成する。 (もっと読む)


【課題】撮影者が意図する対象に合焦された撮影画像を、容易に取得することができる撮像装置を提供する。
【解決手段】
光学系による画像を取得する画像取得部(13)と、前記画像に含まれる顔画像である第1顔画像(68)を認識する顔画像認識部(56)と、周囲環境の音声の特徴に関する第1音声情報(80)を取得する音声取得部(28)と、特定の顔画像の特徴に関する第2顔情報(72〜78)と、特定の音声の特徴に関する第2音声情報(82〜88)とを、予め互いに関連付けて記憶する記憶部(32)と、前記音声取得部で取得された前記第1音声情報と、前記記憶部に記憶された前記第2音声情報との類似性に基づき、前記第1音声情報と前記第2音声情報とを関連付ける音声判定部(54)と、前記音声判定部による関連付けの結果と、前記顔画像認識部による認識の結果とを用いて、前記光学系の合焦位置を制御する合焦位置制御部(52)と、を有する撮像装置。 (もっと読む)


【課題】話者の通話内容に基づいて実行されたタスクの誤りの訂正に対応しやすいサービスサーバ装置を提供する。
【解決手段】音声通信に係るアプリケーションによって実行されるタスクとは別の別タスクを実行する指示を受付けるサービス起動部250、複数の音声通信端末装置間の音声通信中の、話者の音声を録音する電話/呼制御イネーブラ201、録音された音声に基づいてタスクを実行し、実行された結果を示すテキストデータと実行された結果を示す音声データとを含むタスクデータを作成する音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202によってサービスサーバ装置を構成する。このサービスサーバ装置によって、複数の音声通信端末装置、または音声通信端末装置に対応付けられた他の通信端末装置の少なくとも一方にタスクデータを提供する。 (もっと読む)


【課題】発言する出席者に対する評価ばかりでなく、会議に参加する他の出席者の態度をも含めて評価することで、会議全体の評価を可能とし、他の出席者の態度を評価数を少なくして簡便にしながら、評価精度を高くして、出席者が評価されていることを意識せずに、時々刻々に会議の品質を評価でき、以って出席者の適正化提案を可能とする。
【解決手段】品質評価手段が、回転方向姿勢から、発言者以外の出席者の回転方向姿勢をうつ伏せ、仰向け及び直立不動の3状態のいずれにあることの姿勢状態決定を行い、発言状態検出手段で検出された発言状態から、予め定められた発言評価テーブルを参照して会議の品質評価の1項目とする発言評価結果を形成し、決定された姿勢状態から、予め定められた姿勢評価テーブルを参照して会議の品質評価の他項目とする姿勢評価結果を形成し、発言品質評価値及び姿勢評価値に基づいて品質評価時の会議の品質評価を演算する。 (もっと読む)


【課題】サーバーの処理負荷をより軽減させた情報処理システムを提供する。
【解決手段】被写体を撮像して画像データを取得する撮像部11を備えた端末10と、撮像部11による撮像により取得された画像データに基づいて被写体を識別するサーバー110とを備える情報処理システム1であって、端末10は、画像データに対して所定のフィルター処理を施すフィルター処理部14と、所定のフィルター処理が施された画像データをサーバー110に送信する通信部15と、を備え、サーバー110は、送信された画像データを受信する通信部111と、受信された画像データと被写体の識別のための照合用データとの照合の結果に基づいて被写体を識別する制御部112と、を備える。 (もっと読む)


【課題】話者間の影響度を適切に推定する。
【解決手段】単語分布推定部30で、t番目の単語w及びその話者sからなる会話データを読み込み、各時点tにおける各話者の単語の使用頻度を示す単語分布を推定する。影響度推定部40の確率推定部43で、t番目の単語が話者mの影響に依る確率P(m|t)を計算し、影響度推定部44で、確率P(m|t)を用いて、話者nへの話者mの影響度λnmを推定する。尤度計算部45で、影響度λnmの会話データに対する尤もらしさを示す尤度を計算し、判定部46で尤度が収束したと判定されるまで、確率推定部43、影響度推定部44、及び尤度計算部45の処理を繰り返し、尤度が収束したときの影響度集合Λを出力する。 (もっと読む)


【課題】 本発明の目的とするところは、ユーザの発した音声の誤認識を防止し、より正確な音声認識ができるようにするディスプレイ装置およびそのリンク実行方法、並びに、音声認識方法を提供することにある。
【解決手段】 ディスプレイ装置およびそのリンク実行方法、並びに、音声認識方法を提供する。本ディスプレイ装置の音声認識方法は、ディスプレイアイテムに対応する第1テキストを決定し、第1テキストを別のテキストと区別できるようにディスプレイアイテムをディスプレイし、ユーザの発した音声を認識し、認識された音声と前記第1テキストとが対応すると、ディスプレイアイテムに該当する画面をディスプレイする。それにより、ユーザの発した音声の誤認識の危険性が減り、ユーザはより正確な音声認識を用いてディスプレイ装置を制御することができるようになる。 (もっと読む)


【課題】プレゼンターがプレゼンテーションを実施している場合に、プレゼンターをリアルタイムで支援することが可能なプレゼンテーションコーチシステムを提供する。
【解決手段】プレゼンテーション資料を表示する表示手段と、プレゼンターの発声する音声を認識する音声認識手段と、音声認識手段からの認識結果に基づいて、プレゼンターが話した内容の論旨を取得する第1の構文解析手段と、プレゼンテーション資料に含まれる内容の論旨を取得する第2の構文解析手段と、第1の構文解析手段によって逐次取得されるプレゼンターが話した内容の論旨と、第2の構文解析手段によって取得されているプレゼンテーション資料の論旨の対応する部分とを逐次比較する論旨比較手段と、比較された論旨の間に相違が生じていると論旨比較手段が判断することに応答して、プレゼンターに通知を行なう通知手段とを含む。 (もっと読む)


【課題】 音声認識を行う遠隔のサーバシステムに接続する場合に、通信状況が悪化してサーバからの応答が得られない場合に、即時にユーザにその旨を通知する「移動体における音声認識装置および方法」を提供する。
【解決手段】 本発明の音声認識装置は、ユーザの発話をサーバシステム260に送信してその解析を依頼する手段302と、移動体の通信環境に関する情報を取得する手段312と、サーバシステムからの解析結果を一定時間待ち受ける手段304と、待ち受け時間内に解析結果を受信した場合に、これをユーザに通知する手段308と、取得した通信環境に関する情報に基づいて、前記待ち受け時間内における通信状況を予測する手段314と、待ち受け時間内における通信状況が良好でないと判断される場合に、前記解析結果の待ち受けを中止し、その旨をユーザに通知する手段308とを有する。 (もっと読む)


【課題】異なる端末間のコンテンツ連携を実現し、特に希望するコンテンツを迅速に表示する。
【解決手段】本発明によるサービス提供装置1は、第1サービス提供部10と、第2サービス提供部20とを備え、第1サービス提供部10は、音声認識機能部12を備え、第1利用者端末100より第2コンテンツの変更要求を受信した場合、音声認識機能部12が第1利用者端末100からの音声から取得した文字情報に基づき、コンテンツ配信表32より変更後の第2コンテンツを選択し、第2サービス提供部20は、第1サービス提供部10が選択した変更後の第2コンテンツを第2利用者端末200に提供する。 (もっと読む)


61 - 70 / 1,893