説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

991 - 1,000 / 1,893


【課題】使用者の発話が曖昧な場合にも、使用者の発話を精度良く認識することができる音声認識装置、音声認識方法及び音声認識プログラムを提供する。
【解決手段】音声認識装置1は、入力された音声についての認識結果に基づいて操作対象の操作内容を決定するため、音声についての認識結果を、予め定めた操作対象及び操作内容の種類に分類することにより、操作対象及び操作内容を特定する特定処理を行う操作特定手段31と、音声についての認識結果から、操作特定手段31で分類し得ない曖昧語を検出する曖昧語検出手段32と、ここで検出された曖昧語により特定される可能性のある操作対象を操作対象候補として抽出する候補抽出手段33とを備える。操作特定手段31は、操作内容の特定は可能で操作対象の特定ができない場合、曖昧語検出手段32で検出された曖昧語を候補抽出手段33で抽出された候補に置換して、当該操作特定手段31で上記特定処理を行う。 (もっと読む)


【課題】ユーザが音声源とその音声に基づき生成される字幕との対応関係を確実かつ容易に認識することができる字幕生成装置、字幕生成方法および字幕生成プログラムを提供する。
【解決手段】字幕生成装置200において、映像認識部3aにより、入力される映像信号V1の映像認識処理が行われる。これにより、映像上の動作物体が識別される。また、音声認識部3bにより、入力される音声信号A1の音声認識処理が行われる。これにより、音声源の位置が推定される。制御部4は、映像認識処理により識別された動作物体の情報と、音声認識処理により推定された音声源の位置情報とを比較することにより紐付け処理を行う。それにより、音声信号A1に基づいて生成された字幕の位置が、映像上の動作物体の近傍に設定される。 (もっと読む)


【課題】文末記号の付されていないテキストデータに適切な文末記号を補う。
【解決手段】本発明の文末記号補正装置3は、形態素解析結果バッファ26に格納されている、テキストデータの語句の配列を示す形態素解析結果データと、形態素解析結果データと照合するための判定規則と文末記号とを対応付けた文末記号補正規則データ13とに基づいて上記テキストデータに文末記号を補う文末記号補正部11を備えているので、文末記号の付されていないテキストデータに適切な文末記号を補うことができる。 (もっと読む)


【課題】使用者の自由な発話を認識する場合でも、キーワードを適切に把握して該発話の認識精度を向上することができる音声認識装置、音声認識方法、及び音声認識プログラムを提供する。
【解決手段】音声認識装置1は、入力音声を認識してテキストに変換するテキスト変換手段11と、単語列スコアを用いて該テキストを解析する処理の結果を第1の音声候補群としてスコアと共に出力する第1の構文解析手段31と、単語スコアを用いて該テキストを解析する処理の結果を第2の音声候補群としてスコアと共に出力する第2の構文解析手段32と、第1の音声候補と第2の音声候補からスコアに基づいて最終的な音声候補群を決定する音声候補群決定手段33とを備える。比較判断手段34により最も高いスコアをとる第1の音声候補と、最も高いスコアをとる第2の音声候補とが一致しないと判断された場合には、当該第2の音声候補の最も高いスコアを所定値増やす。 (もっと読む)


【課題】音声入力されたイベント情報を、コストを増大させることなく、音声認識によりメタデータに変換できるコンテンツ撮影装置を提供する。
【解決手段】記録モードまたは記録スタンバイモードである時に、音声入力手段より入力される解説音声をフィルタリング手段でフィルタリングした後、出力のレベルを検出し、出力レベルが、事前に設定した出力期間以上の期間に渡って、事前に設定した出力レベル以上である場合、解説音声の入力が始まった時刻情報を含む音声タグを生成し、時刻情報を含む前記音声タグを前記解説音声の時刻情報と関連付け、前記音声タグをメタデータとして前記情報記憶媒体に記録する。 (もっと読む)


【課題】リアルタイムの音声認識コマンドおよびコントロールシステムを備えたオーディオデータ、ビジュアルデータ、およびデバイスデータの取り込みシステムを提供する。
【解決手段】オーディオデータを記録するためのオーディオレコーダと、ビジュアルデータを記録するための少なくとも1つのビジュアルレコーダと、このシステムと通信状態にある少なくとも1つのデバイスからデバイスデータを受信するための少なくとも1つのデバイスデータレコーダと、オーディオデータを解釈するための音声認識モジュールと、解釈されたオーディオデータから転写データを生成するための転写モジュールと、オーディオデータ、転写データ、ビジュアルデータ、およびデバイスデータのそれぞれの少なくとも一部を含むデータレコードを生成するためのデータ取り込みモジュールと、データレコードを保存するための少なくとも1つのストレージデバイスとを含むシステム。 (もっと読む)


【課題】操作者を限定せずに、広く一般的な使用を可能とする電動車椅子搭載用音声入力装置を提供すること。
【解決手段】電動車椅子搭載用音声入力装置は、それぞれマイクロフォン11を複数個離間してマイクロフォンアレイ12として設けたマイクロフォン取付体10a、10bを、電動車椅子の肘掛の先端部分に前記マイクロフォンが位置するように取付け、前記車両に設けた制御手段により前記両マイクロフォンから取り込んだ信号に対して音源位置推定または音声認識をすることにより操作者の指示を特定する。 (もっと読む)


【課題】 現実空間で発生した音響で複合現実空間へのイベント入力を行えるようにして、比較的簡単なシステム構成で種々のイベント入力を実現する。
【解決手段】 操作者Uが装着した表示部11に現実空間と仮想空間を重畳してリアルタイムで表示する複合現実感システム1において、現実空間における操作者Uの位置及び方向を検出し、現実空間で発生した音響を検出し、所定の音源方向からの操作者Uによる操作指示を示す音響に基づいて仮想空間に対する処理を起動する。 (もっと読む)


【課題】地点が属する都道府県が誤入力された際にも地点を効率的に探索することができる「地点探索装置及びナビゲーション装置」を提供する。
【解決手段】都道府県毎に対応するカテゴリ情報を設け、各カテゴリ情報に、当該カテゴリ情報に対応する都道府県に隣接する都道府県と、当該カテゴリ情報に対応する都道府県内の地点のデータを登録する。ユーザから、都道府県の指定と、地点の名称の指定が入力されたならば、指定された都道府県に対応するカテゴリ情報に登録された地点のデータ中から、指定された地点名称の地点を探索しユーザに提示する。そして、ユーザから再探索を指示されたならば、指定された都道府県に対応するカテゴリ情報に登録された該カテゴリ情報に対応する都道府県に隣接する各都道府県に対応するカテゴリ情報に登録された全ての地点のデータ中から、指定された地点名称の地点を探索しユーザに提示する。 (もっと読む)


【課題】検査員の現在位置を検出するための地上設備を配置せずに、鉄道設備の検査記録の省力化を実現すること。
【解決手段】GPS装置8による現在位置の測位精度に基づいて、測位された現在位置を中心とする所定の範囲が設備検出範囲として可変に決定される。そして、当該設備検出範囲に設置位置が含まれる検査設備を対象として、検査工程に基づく検査設備の絞り込みがなされる。そして、マイク7aから入力された発話音声に該当する検査設備が、絞り込まれた検査設備に対応する音声データに基づいて音声認識処理されて特定される。そして、マイク7aから入力された発話音声が音声認識処理されて検査結果データがPDA2に入力され、特定された検査設備に対する検査結果として記録される。 (もっと読む)


991 - 1,000 / 1,893