説明

Fターム[5D015LL04]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 後処理 (238) | 誤認識の訂正のためのもの (115)

Fターム[5D015LL04]に分類される特許

1 - 20 / 115



【課題】ライブストリーミングのように一時停止ができない動画コンテンツまたは音声コンテンツ中の音声を、不特定多数のユーザが協調してリアルタイムに書き起こすことが可能な音声データ書き起こし用WEBサイトシステムを提供する。
【解決手段】判定部22は、断片テキストデータの入力時刻から所定の時間間隔T遡った所定の時間期間T内に配信された期間音声データPADを音声データ記憶部14から取得して、期間音声データPADの中に断片音声パターンPAPと音響的に適合する音声パターンとなる音声データ部分があるか否かを判定する。データ置換部23は、判定部22が音響的に適合すると判定した音声パターンとなる部分に対応する音声認識結果記憶部15に記憶されているテキストデータの該当テキストデータ部分を断片テキストデータまたは単語断片テキストデータで置き換える。 (もっと読む)


【課題】入力した音声のうちの一部分が誤認識された場合に、音声の再入力にかかるユーザの手間を軽減する技術を提供する。
【解決手段】ナビゲーション装置100は、複数の選択ボタンを備え、複数の構成要素に分割可能であって階層構造を有する言語系列を格納する記憶部と、音声を入力する音声入力部と、記憶部に格納されている言語系列の中から、音声入力部から入力された音声に対応する言語系列の候補を特定する音声認識部と、音声認識部によって特定された言語系列の候補を、選択ボタン数の構成要素に分割して表示する表示部と、を備える。音声認識部は、表示された言語系列に含まれる1つの構成要素が選択ボタンを用いて選択されると、選択された構成要素と、当該構成要素より下位の構成要素と、について変更した言語系列の候補を再度特定する。 (もっと読む)


【課題】音声認識結果における認識の誤りがある区間の認識及び修正を容易にする。
【解決手段】音声認識装置1は、音声認識処理結果における区間ごとに保留指定の入力を受け付ける指定受付部16と、保留指定された保留区間をその他の区間と識別可能に表示する保留区間表示部18とを有するので、音声認識処理結果において修正を要する区間の認識が容易となる。そして、音声認識装置1は、保留区間の語句を編集可能に制御する編集制御部19と、当該保留区間に対する文字列の入力を受け付ける修正入力受付部20とを更に備えるので、保留区間の語句の修正が実施される。従って、保留区間の修正が容易となる。 (もっと読む)


【課題】操作者が器具を咥えながら喋った単語を正しい単語に変換して送信する通信装置を提供する。
【解決手段】通信装置の補償回路7において、単語変換部72は、A/D変換器6から受けたデジタル信号に基づいて単語を認識し、その認識した単語を判定部73へ出力する。また、単語変換部72は、単語が誤っていることを示す信号ICORを判定部73から受けると、内蔵している電子辞書721を用いて正しい単語の候補単語を抽出して判定部73へ出力する。判定部73は、単語変換部72から受けた単語をスピーカ2を介して潜水者に提示し、その提示した単語が正しい単語であることを示す信号CORを操作ボタン11から受けると、単語変換部72から受けた単語を正しいと判定してモデム8へ出力する。一方、判定部73は、信号CORを受けないとき、信号ICORを単語変換部72へ出力する。 (もっと読む)


【課題】音声認識結果を用いながら発話単位等の長さに依らない所定の限られた遅延時間で、認識結果を修正してテキストとして逐次出力するテキスト修正装置を提供する。
【解決手段】テキスト区間推定部は、認識結果単語列データ記憶部に書き込まれた認識結果単語列データの長さが予め定められた所定値N以上であるか否かを判定するとともに、当該長さがN以上であると判定されると、テキスト単語列データ記憶部に記憶されている前記テキスト単語列データと認識結果単語列データとのマッチング処理を行ってテキスト単語列データと認識結果単語列データとの間の類似度を算出し、算出された類似度に基づいてテキスト単語列データを修正候補として選択する。誤り修正部は、テキスト区間推定部によって選択されたテキスト単語列データとの間の不一致区間について、テキスト区間推定部によって選択されたテキスト単語列データに基づく修正を行う。 (もっと読む)


【課題】簡単な構成で利便性をより高めることのできる操作装置を提供する。
【解決手段】音声認識部11で認識された音声情報が発話情報と一致するかどうかを判定する発話情報判定部16と、発話情報と一致すると判定された情報を使用情報として決定する使用情報決定部14とを設け、入力された音声情報の少なくとも一部が発話情報と一致しない判定された場合は、この発話情報と一致しない判定された情報の入力源を直接入力部に切り替え、直接入力部により入力された情報と発話情報と一致すると判定された情報とで構成された情報を、制御に用いる使用情報として決定する。 (もっと読む)


【課題】従来の音声認識エンジンが誤認識する箇所を、前後の単語繋がりに則した単語に変換することのできる音声入力支援システムなどを提供する。
【解決手段】音声入力支援システムは、入力された音声を、音声認識処理によりテキストに変換して出力する音声認識エンジンと、出力されたテキスト内の単語の中に信頼度の低い単語がある場合、テキストに含まれる信頼度の高い一以上の単語からなる文字列に基づく予測変換により、テキストの修正を行い、修正後のテキストを出力する予測変換モジュールと、を備える。 (もっと読む)


【課題】 本発明は、大語彙且つ高精度の音声認識処理と、言語モデルまたは音響モデルのユーザごとのカスタマイズを両立する音声認識処理を実現することが可能な端末装置および音声認識処理方法を提供することを目的とする。
【解決手段】 マイク102から入力された音声データを、通信部101が音声認識を行う音声認識サーバ200に送信する。音声認識サーバ200において、一の音響モデルおよび一の言語モデルを用いて音声認識処理を行い、その結果を音声認識結果として端末装置100に送信する。端末装置100では、音声認識サーバ200から音声認識結果を受信して、この受信された音声認識結果を、仮説再評価部106が、入力された音声データ、ならびに端末装置100に備えられている音響モデルおよび言語モデルを利用して評価する。 (もっと読む)


【課題】ユーザの意図した文字列を効率よく抽出してユーザの入力操作を軽減すること。
【解決手段】この携帯電話端末1は、音声認識処理によって生成される認識結果文字列、及び認識結果文字列の読みの文字数を取得する音声認識部11と、予め複数の登録文字列を、登録文字列の読みと対応して格納する辞書データ格納部14と、音声認識部11によって取得された認識結果文字列及び文字数に基づいて、認識結果文字列のうちの誤認識部分、及び誤認識部分の読みの文字数を特定する誤認識部分特定部12と、誤認識部分特定部12によって特定された読みの文字数に基づいて、辞書データ格納部14から、読みの文字数が一致する登録文字列を誤認識部分に対する訂正候補として抽出する訂正候補抽出部13と、訂正候補抽出部13によって抽出された訂正候補を出力する訂正結果出力部15とを備える。 (もっと読む)


【課題】音声認識装置の認識結果の正誤・誤り原因の推定精度を向上させる。
【解決手段】正誤・誤り原因推定部は、モデルパラメータ記録部と正誤・誤り原因条件付確率計算部と正誤・誤り原因条件付確率周辺化部で構成され、モデルパラメータ記録部は、発話特徴量ベクトルと正誤・誤り原因ラベルベクトルとの関係を表す識別モデルに基づく条件付確率を計算するのに必要なモデルパラメータを記録する。正誤・誤り原因条件付確率計算部は、各単語の発話特徴量ベクトルを入力として、予め設定された正誤・誤り原因ラベルベクトルの取り得る状態毎に、識別モデルに基づく条件付確率をモデルパラメータを用いて計算する。そして、正誤・誤り原因条件付確率周辺化部は、識別モデルに基づく条件付確率から正誤ラベルと各誤り原因ラベルの周辺化条件付確率を計算する。 (もっと読む)


【課題】ユーザが音声認識を利用してデータベースから特定の情報を絞り込む際に、効率的に検索結果を絞り込むことのできる音声検索インタフェース装置を得る。
【解決手段】検索手段105は、音声認識結果の単語または単語列に対して検索用データベース104を検索してその検索結果と検索候補数を出力する。修正候補生成手段111は、修正対象単語選択手段109で修正対象単語が選択された場合、その修正対象単語と、読み・音節記憶手段110の単語とのマッチングを行い、単語単位の修正候補を生成し、かつ、修正候補に対する検索候補数を取得する。修正候補表示手段112は、修正候補生成手段111で得られた修正候補と検索候補数とを表示する。 (もっと読む)


【課題】 音声認識等の出力である誤りの含まれる認識文に対して、誤認識箇所の推定・補正候補提示を効率よく実行するとともに、重要な誤りに対して優先的に補正処理を行う装置を提供する。
【解決手段】 認識文に対して、特徴語抽出処理によって特徴語の集合である特徴語リストを抽出し、認識文中の単語のうち、特徴語リストに含まれない単語は、この文脈に即さない単語(以下、特異語と呼ぶ)であると判断し、誤りの可能性があると判断する。特異語と判断された各単語に対して、特徴語リストに含まれる単語ひとつひとつと、類似度を比較し、類似度が高いと判断された単語を、特異語に対する修正候補とする。このようにあらかじめ特徴語を抽出する。 (もっと読む)


【課題】ユーザが音声認識における誤認識結果を修正する際、ユーザによる明示的な区間の修正を行うことなく、正しい修正候補を提示することのできる音声入力インタフェース装置を得る。
【解決手段】音声認識手段103は、音声入力に対する認識結果の単語列を出力する。連結修正候補生成手段109は、音声認識手段103から出力された全ての単語を連結した語句と、複数の単語を連結した語句の情報が登録された連結読み・音節記憶手段108の語句とのマッチングを行い、語句単位の修正候補を生成する。差分抽出手段110は、マッチング結果の差分を抽出する。修正候補表示手段111は、差分抽出手段110で抽出された差分を修正候補として表示する。 (もっと読む)


【課題】音声認識処理で間違って認識された文字列に対する変換候補を、上記音声認識処理とは異なる根拠に従って決定すること。
【解決手段】音声認識装置は、音声データを取得する音声データ取得部と、音響モデルおよび第1言語モデルを参照して、音声データに対する音声認識処理をおこない、その認識結果を示す認識文字列を生成する音声認識部と、認識文字列に含まれる一部の文字列を、変換対象文字列として決定する変換対象文字列決定部と、認識文字列において、決定された変換対象文字列の前または後に接続された文字列を、参照文字列として決定する参照文字列決定部と、第2言語モデルを参照して、決定された参照文字列との接続関係が示されている文字列を、変換対象文字列を変換する候補の変換候補文字列として決定する変換候補文字列決定部と、決定された変換候補文字列を出力する出力部とを備える。 (もっと読む)


【課題】音声認識により、利用者の意図する語彙に、より一致する語彙を検出し、提示することができる。
【解決手段】 利用者から受け付けた音声データおよび該音声データに基づいて検出された語彙が、誤認識データに記憶されている音声データおよび該音声データに対応付けられた語彙である場合、検出手段が検出した他の語彙を高順位で利用者に提示する。 (もっと読む)


【課題】選出したコマンドがユーザの所望のコマンドでなかった場合に行う修正作業である画面操作に伴う労力を軽減するコマンド処理装置を提供する。
【解決手段】音声認識処理部2がユーザによって入力される入力データに対して語彙認識を行って算出した認識結果について、音響モデルや言語モデルに従って結果が出現する場合に逆に入力データから見て音響モデルや言語モデルを推測する尤もらしさである尤度を算出し、当該尤度に基づき確からしいコマンド候補である中間コマンドを選出するコマンド選出部3と、ユーザが操作を誤った際の操作を操作コストと定義し、コマンド間の操作に伴う操作コストを記憶する操作コストデータベースメモリ7と、操作コストに基づいて算出される評価値を最小化するコマンドを中間コマンドから選択する尤度補正部4を備える。 (もっと読む)


【課題】音声認識の正解精度を向上させる。
【解決手段】入力音声に対する音声認識結果と誤り修正結果とを用いて音声認識を行う音声認識装置において、前記入力音声の音響特徴量を抽出する音響分析手段と、予め設定された音響モデル、言語モデル、及び発音辞書を用いて、候補単語のネットワークからなる単語ラティスを生成する単語ラティス生成手段と、前記単語ラティス生成手段により得られる前記単語ラティスから最尤単語列を選択する最尤単語列選択手段と、前記最尤単語列に対して修正された単語列を用いて前記音響モデルを学習させる音響モデル識別学習手段と、前記音響モデル識別学習手段により学習された音響モデルを用いて、前記修正された単語列に対する単語ラティスを再構成する単語ラティス再構成手段とを有することにより、上記課題を解決する。 (もっと読む)


【課題】未登録語を登録する際、ユーザが音声のみを用いて認識した音韻を訂正することができる音声認識装置、音声認識方法、及び音声認識ロボットを提供する。
【解決手段】音声入力部は音声を入力し、音韻認識部は入力された音声の音韻を認識して訂正発話を示す第1の音韻列を生成し、マッチング部は第1の音韻列と元発話を示す第2の音韻列とをマッチングを行い、音韻訂正部はマッチングを行った結果に基づき第2の音韻列の音韻を訂正する。 (もっと読む)


【課題】音声認識結果の訂正をより効率的に行う。
【解決手段】訂正は、(1)誤認識箇所の特定という作業と、(2)特定された誤認識箇所の訂正という作業の2つの作業からなる。2つの作業のうち(1)誤認識箇所の特定を、(2)特定された誤認識箇所の訂正を行う訂正者以外のものに行わせることにより、訂正者の負担を減らす。例えば、聴覚障害者に誤認識箇所の特定をさせる。信頼度、親密度を用いて、自動的に誤認識箇所を特定してもよい。また、誤認識箇所の特定を行う際に、誤認識箇所の優先順位を決定し、訂正者が優先順位が高い誤認識箇所から訂正を行うことができるようにする。 (もっと読む)


1 - 20 / 115