説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

1,101 - 1,110 / 1,893


【課題】カラオケ装置において、利用者が気軽に楽しめるアミューズメントや利用者が操作しなくてもよい自動制御機能を提供する。
【解決手段】歌唱者の歌唱音声からフォルマントを抽出し、このフォルマントに基づいて歌唱者の声がどの程度男性らしいかどの程度女性らしいかの性別度やどの位の年齢の声に聞こえるかの推定年齢などの情報を割り出す。割り出した性別度や推定年齢を用いて種々の情報を表示したりカラオケ演奏を制御したりする。たとえば、年齢と性別で決定される運勢を表示したり、性別度や推定年齢の声質の歌唱が最も映えるような伴奏となるようにカラオケ演奏を制御するなどである。 (もっと読む)


【課題】コールセンタのオペレータと顧客との会話の中からキーワードを抽出し、そのキーワードに関連した文書をデータベースから検索し、文書から顧客の問い合わせに応答する内容をオペレータに提供する文書検索装置において、会話が不調であっても効率よく文書を検索できる文書検索装置を提供する。
【解決手段】オペレータと顧客との間の会話から音声認識によりキーワードを抽出し、そのキーワードから文書を検索する文書検索装置において、音声認識に誤りが発生した場合であってもキーワードの組み合わせを変更するとか、キーワードの一部を同義語に変換する等して検索条件を自動的に更新し、オペレータの手をわずらわせることのなく、得られたキーワードを有効に活用して効率よく文書を検索する。 (もっと読む)


【課題】モバイル装置に適用可能な、大容量のメモリや電力消費を必要としない、音声メッセージのテキスト表示をモバイル装置へ提供する方法及びシステムを提供する。
【解決手段】通信ステーションは、ユーザが通信装置によりコールを発し、コールを受けた通信装置がサイレントモードで作動していることを検出した場合、コールを発した通信装置のユーザにボイスメッセージを入力するように促す。通信ステーションは入力されたボイスメッセージは音素に変換することによりボイスメッセージのテキスト表示を生成し、それを前記コールを受けた通信装置へ送信する。前記ボイスメッセージのテキスト表示は音素に基づいたキャラクターを含む。 (もっと読む)


【課題】利用者の操作作業を介在させずに、複数の音声入力手段が搭載された車両において、音声認識の感度を従来技術よりも向上させる。
【解決手段】車両における複数箇所にそれぞれ搭載される複数の音声入力手段1,2と、音声信号に対する言語情報について保持する音声辞書部7と、音声入力手段1,2を通じて入力された音声信号についての音声認識を、該音声辞書部を参照することにより行なう音声認識部6と、上記車両内における乗員又は該車両外部の人員の状態、又は上記車両の状態について検出する状態検出部4と、状態検出部4における検出結果に応じて、複数の音声入力手段1,2の動作状態および音声辞書部7における認識候補の設定状態のうちのいずれか一方又は双方を切り替える切り替え制御部5と、をそなえる。 (もっと読む)


【課題】発話者が発言するときの感情を反映した感情表現文書を容易に生成する感情表現文書情報生成システムの提供
【解決手段】文脈・感情情報取得装置23は、カメラ25及びマイクロフォン27から映像情報、音声情報を取得すると、文脈情報「今日は良い天気だね」、感情ベクトル(笑い、怒り、悲しみ)を取得する。メディア表現文書情報生成装置21は、文脈情報から主単語を「天気」に決定する。また、感情ベクトルから感情方向ベクトル(θ、φ)、感情の強さを取得する。さらに、対応する感情反映パラメータ及び感情反映ロジックを取得する。さらに、取得したメディア表現に対して、感情方向ベクトル(θ、φ)、感情の強さ、及び設定パラメータIDを用いて、感情反映ロジックに対するメディア表現情報の調整を行う。そして、調整したメディア表現、文脈情報「今日は良い天気だね」、及び主単語情報「天気」に基づいてメディア表現文書を生成する。
(もっと読む)


【課題】ICA法に基づくBSS方式による音源分離処理を行うに当たり、音響空間に存在する音源の数に増減があった場合でも、高い音源分離性能を維持できること。
【解決手段】n個の指向性マイク111〜11nが、0個〜n個の音源が存在し得る音響空間において各々異なる指向方向で配置され、パワー検出・信号選択部25が入力音声信号xi各々のパワーPiを検出するとともに、そのパワーPiに基づいて、入力音声信号xiの中から、指向性マイク111〜11nが配置される音響空間に存在する1又は複数の音源に対応する1又は複数の採用入力音声信号xj(チャンネル)を選択し、これにより複数の採用入力信号xjが選択された場合、ICA部20が、その複数の採用入力音声信号xjに対し、独立成分分析法に基づくブラインド音源分離方式の音源分離処理を施すことによって採用入力音声信号xjの数と同数の分離信号yjを生成する。 (もっと読む)


【課題】入力された音声データを、容易かつ正確に文章データとして記録することができる音声入力レポートシステムを提供する。
【解決手段】音声認識装置11に「音声を入力しました。」という音声を入力すると、入力者の選択により確定した文章データとともに、「1.お_ん_せい_を」、「2.おん_せい_を」、「3.おんせい_を」等の音声データの文節区切り候補、および「1.音声」、「2.音性」、「3.音勢」等の同音異義語の候補群など、音声をテキストに変換する際の中間データである変換候補データも保存する。PC12で変換修正作業を行なう場合に、音声認識装置11に保存されている音声データの文節区切り候補、および同音異義語の候補群等の変換候補データを参照して、文章データを修正しレポートとして確定することができる。 (もっと読む)


【課題】映像や音声と、テキストデータとを、人手を介さず対応付けるとともに、テキストデータの編集に連動して、映像や音声を編集するための編集データを生成することが可能なノンリニア編集装置を提供する。
【解決手段】ノンリニア編集装置1は、音声を音声認識して、時間情報に対応付けたテキストデータを生成するテキスト対応付け手段32と、時間情報に対応付けてテキストデータと映像とを表示する表示手段50と、テキストデータを編集するテキスト編集手段41と、編集されたテキストデータに対応する時間情報に基づいて、編集データを生成する編集データ生成手段44と、を備えることを特徴とする。 (もっと読む)


【課題】介護医療テストのため、(パ)(タ)(カ)の単位時間内の発音回数の測定を手動で行つて居るが、より正確に、より簡単に自動計測をするための手段として、全て自動的に回数計算を行い、その結果を即刻、数字として表示する。
【解決手段】人によつて異る音声を個人別にサンプルとして収録し、音声比較をしながら回数を計算する。これらは全てマイコンの領域内でデジタルに変換されたテ−タ−として高速処理される。2桁の数字は表示器に表され、必要に応じてデ−タ−を保存して拡大利用のシステムとして活用できることを特徴とする。 (もっと読む)


【課題】現実世界の多種多様な音または音声を使ってキャラクタを探索し、捕獲し、収集するというゲーム内容を実現するゲーム装置を提供する。
【解決手段】ゲーム装置10は、複数の音または音声に関する特徴情報からなる情報群に含まれる個々の音または音声に関する複数の特徴情報を、複数のキャラクタの個々の識別情報と対応付けて、かつ音または音声とキャラクタとの対応関係を予めプレイヤーに明示することなく記憶させた音データベースを備える。ゲームプレイ中に音探索モードを選択し起動させると入力される音または音声の特徴が解析され、その解析結果が予め記憶された特徴情報と照合される。第1の照合処理において複数の特徴情報のうちの一部が照合され、キャラクタが識別される。第1の照合処理によりキャラクタが識別されないとき第2の照合処理が実行され、第1の照合処理による照合に用いていない他の特徴情報が照合され、キャラクタが識別される。 (もっと読む)


1,101 - 1,110 / 1,893