説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

1 - 10 / 925



Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285

【課題】撮影者の意図を反映させた音を用いて、撮影時の背景や感情を強く共有することができる画像情報を生成することが可能な画像編集装置を提供する。
【解決手段】撮影した画像情報11に含まれる撮像対象情報に関連付けられた音情報を該画像情報11に付与する画像編集装置であって、撮影した画像情報11から撮像対象情報と構図情報とを撮像対象判別手段12により抽出し、前記撮像対象情報を基にして該撮像対象情報に関連付けられる音情報を音情報取得手段13により取得した後、音情報編集手段14により、撮像対象判別手段12からの前記構図情報に基づき、音情報取得手段13からの前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力し、撮像・音情報統合手段15によって、前記画像情報と前記調整後音情報とを統合して画像・音統合情報16として出力する。 (もっと読む)


【課題】ユーザとより自然な対話を行うこと。
【解決手段】対話装置は、ユーザの音声を認識する音声認識手段を備え、音声認識手段により認識された音声情報に基づいて、ユーザと対話を行う。また、対話装置は、音声認識手段により認識された音声情報に基づいて、自立語を抽出する自立語抽出手段と、自立語に対応付けられた演出内容を複数記憶する第1記憶手段と、第1記憶手段に記憶された複数の演出内容の中から、自立語抽出手段により抽出された自立語に基づいて、実行する演出内容を決定する演出決定手段と、ユーザとの対話中に、演出決定手段により決定された演出内容を実行する演出実行手段と、を備える。 (もっと読む)


【構成】 コミュニケーションシステム10は、ロボット12およびサーバ20を含み、ロボットはユーザに指示された物品を特定し、サーバは、ロボットからの要求に応じて、特定した物品を確認するための指差し動作および発話内容を生成する。発話内容を生成する際には、特定した物品の複数の属性についてのべき集合を生成し、当該特定した物品の近傍に存在する他の物品の複数の属性についてのべき集合を当該他の物品毎に生成する。サーバは、特定した物品についてのべき集合の要素から、他の物品のそれぞれについてのべき集合と共通する要素を削除する。サーバは、残った要素のうち、単語数が最も少ない要素を選択し、さらに、選択した要素のうち、特定した物品の近傍に存在する他の物品の複数の属性の文字列との非類似度が最も高い要素を選択して、発話内容を生成する。
【効果】 確認行動における発話内容を簡単に生成することができる。 (もっと読む)


【課題】発話支援装置などの生体信号を用いた識別装置において、生体信号の検出精度が十分に高くないという課題がある。
【解決手段】被支援者Aは、生体信号を検出する生体信号センサ部1を装着している。波形整形部2は、その信号に対して、雑音除去処理などを行った解析信号を分割加工部13に出力する。取得部5は、生体信号センサ1と波形整形部2で構成される。分割加工部13は、解析信号を受けて特徴抽出を行い、特徴抽出を経た信号と特徴抽出を経ない信号を選択識別部に出力する。選択識別部は特徴抽出を経た信号と特徴抽出を経ない信号を受けて、これらの信号から、識別のために有効な信号を選択的に用いて、もしくは有効な信号に高い重み付け(ウェイト)をかけて識別に用い、識別結果を出力部6に出力する。出力部は、スピーカー、表示部、ネットワーク接続器(例えば、コンピューター)、無線通信器などの出力装置で、識別結果に応じた出力をする。 (もっと読む)


【課題】効率的に表形式データ全体の内容を把握したり、目的の情報を取得する。
【解決手段】画面上に表示された表形式データの項目をユーザの操作に対応させて音声出力する表形式データ出力制御装置において、前記ユーザにより所定の操作手段に対して操作された内容を認識する操作内容認識手段と、操作内容に対応させて、前記表形式データに含まれる複数のセルのうち、2以上のセル数からなるブロック領域を設定するブロック領域設定手段と、ブロック領域に対応させて読み上げるデータの対象を設定する読上対象設定手段と、前記読上対象設定手段により得られる設定情報に基づいて前記ブロック領域に対応するテキストデータを抽出するテキスト抽出手段と、前記テキスト抽出手段により抽出されたテキスト情報に基づいて音声データを生成する音声生成手段と、前記音声生成手段により生成された音声データを出力する音声出力手段とを有する。 (もっと読む)


【課題】案内音声を確実に聞くことができる音声出力システムを提供する。
【解決手段】音声出力システムは、音声出力制御部2を備えており、音声出力システムの周辺部として、音声生成部3、音声出力処理部4、音声出力装置5−1,5−2,5−3,・・・を備える。また、音声出力制御部2は、音声種別判定部6、音声出力装置検知部7及び音声出力判定部8を備えており、音声生成部3は、案内音声生成部9を備える。出力対象の音声データの種別がナビゲーション機能の案内音声であると判定されると、音声出力が可能な全ての音声出力装置5−1,5−2,5−3,・・・を検知し、検知した音声出力が可能な全ての音声出力装置5−1,5−2,5−3,・・・で出力対象の音声データの案内音声を出力する。 (もっと読む)


【課題】音声合成データに対して実行可能な編集処理を多様化する。
【解決手段】編集処理部34は、合成対象音を指定する音声合成データDBを編集プログラムPAにより生成および編集する。記憶装置14は、編集処理部34が生成した音声合成データDBを記憶する。選択処理部32は、音声合成データDBが指定する合成対象音の処理対象範囲Bを利用者からの指示に応じて選択する。拡張編集部36は、相異なる編集処理に対応する複数の拡張プログラムQのうち利用者が選択した拡張プログラムQにより実現され、記憶装置14に記憶された音声合成データDBのうち選択処理部32が選択した処理対象範囲Bを編集する。 (もっと読む)


【課題】ゲスト及びホストの音声に基づき、ゲストに提供しようとする不動産物件情報をより正確に検索できるようにする。
【解決手段】H/G判別部41は、異なる位置に着座するホストとゲストの音声を、集音方向を調整自在な指向性マイク22〜25による検出音の強度に基づき識別する。キーワードテーブル45には、質問キーワードと1つ以上の質問キーワードで分類される質問の種類毎の回答キーワードとが登録されている。キーワード判別部44は、識別されたホストの音声に、登録された質問キーワードのどれが含まれているか及び該質問キーワードに基づく質問の種類を判別し、識別されたゲストの音声に、直近の質問の種類に対応した、登録された回答キーワードのどれが含まれているかを判別し、判別した回答キーワードを該質問の種類と対応させて検索用キーワード記憶部46に記憶させる。 (もっと読む)


【課題】特にステレオ又は3Dオーディオを使用して、SMS及びe−メールのようなテキストアプリケーションをより面白い且つ楽しいものにする方法を提供する。
【解決手段】テキスト専用のアプリケーションのためのオーディオを発生する方法は、発生されたオーディオにサウンド効果を追加するのに使用できるタグを入力テキストに追加し、このタグを処理して、オーディオを発生するためのインストラクションを形成し、テキストが提示される間にこのインストラクションに基づいて前記サウンド効果を伴うオーディオを発生するステップを含む。本発明は、テキストアプリケーションに娯楽価値を追加し、従来のマルチメディアに比して非常にコンパクトなフォーマットを提供し、又、娯楽サウンドを使用して、SMS及びe−メールのようなテキスト専用アプリケーションをより面白い且つ楽しいものにする。 (もっと読む)


1 - 10 / 925