説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

41 - 50 / 1,893


【課題】より適切なダイジェストを生成する。
【解決手段】情報処理装置において、所定時間撮影された1又は複数の被写体を含む映像情報及び音声情報を蓄積する蓄積部と、前記蓄積部に蓄積された映像情報及び音声情報を用いて、予め設定された1又は複数の要素に基づき、前記所定時間の時系列における所定の単位時間毎の変化量を評価し、評価された結果に基づいて1又は複数のダイジェスト候補を抽出するダイジェスト生成部と、を有し、前記ダイジェスト生成部は、前記ダイジェスト候補に対応する映像情報及び音声情報に含まれる被写体の状況又は特徴をパターン認識し、認識された結果に基づいて前記ダイジェスト候補からダイジェストを生成するパターン認識部を有する。 (もっと読む)


【課題】問題対話の選別を効率的かつ高精度におこなうことにより、モニタリングの作業効率の向上を図ること。
【解決手段】録音音声データを取得し、抽出部401により韻律情報抽出処理を実行する。つぎに、検出部402により発話区間検出処理を実行する。取得部405により音声認識結果情報を取得する。このあと、基本対話分析部403による基本対話分析処理、対話構造分析部404による対話構造分析処理、発話内容分析部406による発話内容分析処理を実行する。このあと、決定部407により決定処理を実行し、出力部408により出力処理を実行する。 (もっと読む)


【課題】端末装置の所持者に手間をかけさせることを必須とすることなく、端末装置の現在位置を正確に特定する。
【解決手段】自装置の位置情報を取得し、当該位置情報を通話の際に送信する端末装置300と、端末装置300と通話を行う通話手段400と、端末装置300と通話手段400との通話にて取得される音声を解析し、当該音声から端末装置300の位置を特定可能な情報を抽出する情報抽出部100と、通話の際に端末装置300から送信されてきた端末装置300の位置情報と、情報抽出部100にて抽出された情報とに基づいて、端末装置300の現在位置を特定する位置特定部200とを有する。 (もっと読む)


【課題】発話に含まれる言語的な特徴を利用して、音響的な特徴による誤分類を検出する話者分類装置を提供することである。
【解決手段】実施形態の話者分類装置は、音響分類手段と、言語特徴抽出手段と、誤分類検出手段とを備える。音響分類手段は、入力された音響信号に含まれる発話を、前記音響信号から抽出した音響的な特徴を利用して話者毎に分類し分類結果を取得する。言語特徴抽出手段は、前記発話の内容を表す文字列を取得し、この文字列を利用して前記分類結果に含まれる話者の言語的な特徴を抽出する。誤分類検出手段は、前記発話の内容を表す文字列が、前記分類結果においてこの発話が分類された話者の前記言語的な特徴に適合するか否かを判別し、適合しない場合は、この発話は前記音響分類手段によって誤分類された発話であると判別する。 (もっと読む)


【課題】音声データのうち書き起こしが完了した位置を特定可能な書き起こし支援システムを提供する。
【解決手段】実施形態の書き起こし支援システムは、音声データをテキスト化する書き起こし作業を支援する書き起こし支援システムであって、第1記憶部と、再生部と、第2記憶部と、テキスト作成部と、推定部とを備える。第1記憶部は、音声データを記憶する。再生部は、音声データを再生する。第2記憶部は、音声データに対して音声認識処理を実行することにより得られる音声テキストデータを構成する複数の文字列の各々と、音声データの位置を示す音声位置情報とを対応付けた音声インデックスを記憶する。テキスト作成部は、ユーザーの操作入力に応じてテキストを作成する。推定部は、音声インデックスに基づいて、前記音声データのうち、前記テキストの作成が完了した位置を示す作成済み音声位置情報を推定する。 (もっと読む)


【課題】通話中に言語選択を行う際、言語の選択操作の開始時に通話状態を保留状態に迅速に移行し、通話相手との通話に対応する翻訳先の言語にて通話を再開する旨を明確に伝え、円滑なコミュニケーションを促進する。
【解決手段】他の携帯通信端末30,40と通話する携帯通信端末1であって、他の携帯通信端末30,40との通話時に、入力された音声データを他の携帯通信端末30,40との通話に対応する翻訳先の言語の選択操作の入力を受け付ける入力部11と、翻訳先の言語の選択操作の入力の開始時に、他の携帯通信端末30,40との通話の通話状態を保留状態に移行する制御部10とを備える。 (もっと読む)


【課題】作業効率を向上させることが可能な書き起こし支援システムおよび書き起こし支援方法を提供する。
【解決手段】実施形態の書き起こし支援システムは、第1記憶部と、再生部と、第2記憶部と、テキスト作成部と、設定部とを備える。第1記憶部は音声データを記憶する。再生部は音声データを再生する。第2記憶部は、音声データに対して音声認識処理を実行することにより得られる音声テキストデータを構成する複数の文字列の各々と、音声データの位置を示す音声位置情報とが対応付けられた音声インデックスを記憶する。テキスト作成部は、ユーザーの操作入力に応じてテキストを作成する。推定部は、音声インデックスに基づいて、音声データのうち、テキストの作成が完了した位置を示す作成済み音声位置情報を推定する。設定部は、作成済み音声位置情報に基づいて、再生を開始する位置を示す再生開始位置に設定する。 (もっと読む)


【課題】音声入力ワープロにおいて、音声認識エンジンが音声認識困難な単語、文章の入力を可能とする。
また、音声のみによる音声ワープロを可能にする。
【解決手段】(1)あらかじめ、音声認識が容易な単語、文章と音声認識困難な単語、文章は、対で登録しておく。
(2)音声入力者は、音声認識困難な単語、文章のかわりに、よく使用される音声認識が容易な単語、文章を連想文言として発声する。
(3)音声認識エンジンは、音声認識が容易な単語、文章のため、認識結果群を返却し、それらが音声認識が容易な単語、文章と一致する確率が高くなる。
(4)ひとつでも一致した場合、音声認識困難な単語、文章を表示させ、選択候補とする。これにより、音声認識エンジンでは、認識困難な語彙の入力が可能になる。
(5)選択候補のキー(番号など)を音声により、発声し、その認識結果が選択候補のキーと一致した場合、選択確定とする。
これにより、音声の発声のみによる音声ワープロが可能となる。 (もっと読む)


【課題】運転者に対して同乗者がいるような感覚を与えることができ、これにより運転者に対して緊張とリラックスをバランス良く与えることができ、特に高齢者ドライバーの交通事故の削減に高い効果を発揮することが可能である運転支援システムの提供。
【解決手段】運転者の音声を認識するための音声認識手段と、運転者に対して音声を出力するための音声出力手段と、前記音声出力手段から出力される音声の元になる音声データを記憶する音声データ記憶手段と、前記音声認識手段により認識された音声に応じて、前記音声データ記憶手段に記憶された音声データの中から適当な音声データを読み出して、前記音声出力手段から音声出力を行わせる音声制御手段と、を備えており、前記音声データは、運転者に注意を喚起する文言からなる第一音声データと、運転者を褒める文言からなる第二音声データとを含んでいることを特徴とする運転支援システムである。 (もっと読む)


【課題】 複数の人物に対してそれぞれが所望する画像を容易に分配することができる画像処理装置を提供する。
【解決手段】 集音された音声を入力する音声入力部22と、前記音声入力部から入力された音声の人物特定要素を抽出する音声処理部24と、特定の人物の声が有する固有のパターンを記録する音声記録部26と、前記人物特定要素と前記パターンとの特徴を比較することにより話者を特定する話者特定部4と、画像データを取得する画像取得部4と、前記画像データに基づく画像を出力する画像出力部20と、前記画像出力部により前記画像を出力している間に前記話者特定部により特定された前記話者を示す情報と前記画像データとを関連付けた分類データを作成する画像分類部4とを備える。 (もっと読む)


41 - 50 / 1,893