説明

Fターム[5D015LL08]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 他の情報入力装置の援用 (113) | キー入力装置 (26)

Fターム[5D015LL08]に分類される特許

1 - 20 / 26


【課題】周囲の雑音や会話等の影響を受け難い上、発話の内容に類似したものが多かったり促音や撥音を含むことが多かったりする場合でも音声を利用して確実にデータを入力できるようにする。
【解決手段】音声入力の開始と終了を検出し、その検出された音声入力開始から終了までの区間内に入力された音声を認識する。認識された音声データで記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出し、抽出された複数の対象毎の対象名音声データにそれぞれ対応する対象コード及び対象名を記憶手段から取得する。得られた複数の対象名を出力し、出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに記憶手段から読み出した対象コードを入力データとして処理する。 (もっと読む)


多重モード調音統合システムは、音声信号を受信する音声信号モダリティ、及び、ユーザーから入力を受信し、音声情報に直接的に対応される所定の入力から選ばれた入力から制御信号を生成する制御信号モダリティを含む。双方向音声基盤音声入力システムは、音声信号及び制御信号を受信して統合する多重モード統合システムをさらに含む。多重モード統合システムは、制御信号を用いて音声フレームに前処理して離散化することにより音声信号の発話のコンテクストの範囲を決定する。音声認識器は制御信号と統合された音声信号を分析して音声認識結果を出力する。このような新しいパラダイムはモバイルデバイスにインターフェイシングする時に発見される制約を克服するのに役立つ。コンテクスト情報はアプリケーション環境でコマンドの処理を容易にする。
(もっと読む)


【課題】音声入力による操作が可能なメニューがどのメニューであるかをユーザに容易に認識してもらうことができる車載情報端末の提供。
【解決手段】本発明による車載情報端末1は、複数配置される操作ボタンと、前記操作ボタンによる手動操作が可能な複数のメニューが表示されるディスプレイと、前記ディスプレイの表示を制御する表示制御手段と、音声入力手段とを備え、前記操作ボタンによる手動操作が可能な複数のメニューは、前記音声入力手段による音声操作も可能な第1類のメニューと、前記音声入力手段による音声操作が不能な第2類のメニューとを含み、前記表示制御手段は、前記第1類のメニューを前記第2類のメニューと識別可能な異なる態様で前記ディスプレイ上に同時に表示することを特徴とする。 (もっと読む)


【課題】本発明は、従来と比して簡易な操作で、かつ音声認識率を上げながら使い勝手を向上する。
【解決手段】本発明は、モニター3に表示した初期メニュー画面MW1上のメニューアイコンMIの中からロータリコマンダ4の回転操作子21を介して例えば場所アイコンMI1が選択されたことを認識したときから、場所アイコンMI1に関連した単語及び単語列からなる複数の言語モデルが登録された場所辞書14AをRAM13上に読み出し、場所アイコンMI1を認識したとき以降、当該認識している間だけ音声を入力し、その音声信号と、RAM13上に読み出した言語モデルとを比較し、当該音声信号と最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果に対応した目的地検索処理を行うことでき、かくして簡易な操作で、かつ音声認識率を上げながら使い勝手を向上することができる。 (もっと読む)


【課題】発話音声を音声認識すること。
【解決手段】CPU1034aは、使用者の発話内容を拘束する拘束性のレベルが異なる複数の言語モデルで表される語彙を、音声認識実行時の認識対象語彙として記憶し、使用者による発話音声を入力し、記憶した認識対象語彙と、入力した発話音声との一致度を演算し、一致度の演算結果に基づいて、認識対象語彙から認識結果候補を抽出し、抽出したそれぞれの認識結果候補の一致度、およびその認識結果候補を含む言語モデルの拘束性のレベルの少なくともいずれか一方に基づいて、認識結果候補の中から認識結果を特定する。 (もっと読む)


【課題】プッシュ釦式電話端末からの信号をネットワークを介して受信するデータ受信装置により、プッシュ釦の操作と音声との組み合わせにより簡易な取扱いでデータ取得ができるデータ受信システムおよびデータ受信方法を得ること。
【解決手段】データ受信システム20は、プッシュ釦式電話端末13から送信されるプッシュ釦13aの操作に基づく音データsを受信するデータ受信装置12を備えたデータ受信システム11であって、データ受信装置12は、CTI15aを有するCPU15および表示装置16を備え、プッシュ釦式電話端末13のプッシュ釦13aの音データsを受信することにより、CTIによる音−文字変換機能により音データsを文字データrに変換して表示装置16に表示させる。 (もっと読む)


【課題】音声認識結果に対応するコマンドを実行することができない場合にも、効率よくコマンドを入力できるようにする。
【解決手段】音声認識装置24から入力された音声認識結果に基づいて、コマンド実行頻度メモリ28に記憶されているコマンドの検索を行い、コマンドを実行すると共に、実行したコマンドの実行頻度を更新する。音声認識結果に対応するコマンドを実行することができない場合は、コマンド実行頻度メモリ28から実行頻度が高い順に複数のコマンドを読み出し、読み出したコマンドを入力するためのボタンをディスプレイ30に表示する。ディスプレイ30に表示されたボタンの操作により、コマンドが入力されると、入力されたコマンドを実行する。 (もっと読む)


【課題】文字ボタン(キー)による文字入力を主とする文字入力方式における小文字変換、符号や長音の付加に要するボタン(キー)操作量の低減。
【解決手段】携帯電話端末は、文字ボタンの押下と併せて、入力された音声を認識し、該音声認識結果に従って、入力文字候補として表示中の文字を(A)小文字変換(例:「ヤ」→「ャ」)、(B)濁音変換(例:「キ」→「ギ」)、(C)半濁音変換(例:「フ」→「プ」)(D)長音付加(例:「カ」→「カー」)を実行する。 (もっと読む)


【課題】発話内容を支援する仕組みを構築することにより、一層の操作性と利便性の向上をはかる。
【解決手段】音声入力支援方法は、発話内容を取得し、単語に対応した音響モデルが格納される第2の辞書(音響モデルDB14)を検索して音声認識を行う第1のステップ(ST23)と、前記音声認識に失敗した場合に入力され取得される前記単語の文字列から第1の辞書(単語辞書DB13)を検索して音声認識可能な単語を出力する第2のステップ(ST31)と、を有する。 (もっと読む)


【課題】車載機器の指示入力等に用いる音声認識の技術において、操作性と認識率を改善し、あわせて運転の安全性も向上すること。
【解決手段】辞書限定部14の受付部がタッチパッド部6で入力を受け付け、判定部が、操作パタン記憶部12を参照することにより、前記受付部の受け付けた入力の該当する操作パタンを判定し、その操作パタンに対応する前記操作階層を特定する。限定部が、関連記憶部13に記憶された属性又はインデックスを参照することにより、前記判定部の特定した操作階層に関連付けられた各特徴データを、入力音声との照合対象範囲として限定する。音声認識部15は、マイク部7を含む前記音声入力部が入力を受け付けた入力音声を、前記照合対象範囲の各特徴データと照合することにより、発話された単語を認識する。 (もっと読む)


【課題】音声区間の終端を的確に検出することにより、安定して音声区間の抽出を行い、音声認識の精度を向上させる。
【解決手段】プッシュボタンがONされたことを検知すると(ST103でYES)、音声認識を行なうための認識単語算出処理が行なわれる(ST107)。このように認識単語算出処理が行なわれているときにプッシュボタンがOFFされたことを検知すると(ST108でYES)、音声認識の実行が停止される(ST109)。 (もっと読む)


【課題】周囲の雑音や会話等の影響を受け難い上、発話の内容に類似したものが多かったり促音や撥音を含むことが多かったりする場合でも音声を利用して確実にデータを入力できるようにする。
【解決手段】音声入力の開始と終了を検出し、その検出された音声入力開始から終了までの区間内に入力された音声を認識する。認識された音声データで記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出し、抽出された複数の対象毎の対象名音声データにそれぞれ対応する対象コード及び対象名を記憶手段から取得する。得られた複数の対象名を出力し、出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに記憶手段から読み出した対象コードを入力データとして処理する。 (もっと読む)


【課題】 複数のパターン認識候補の中から正解を選択しやすくする。
【解決手段】 認識対象となる文字又は文字列を順に並べて表示させ、表示された文字又は文字列を選択状態にし、認識対象語と入力されたデータの類似度を取得し、該類似度の高い文字又は文字列をN個取得し、選択状態にある文字又は文字列から、上位N個の認識候補に含まれる他の文字又は文字列に選択状態を変更する第1の変更手段と、選択状態にある文字又は文字列から、他の文字又は文字列に選択状態を変更する第2の変更手段とを備える。 (もっと読む)


【課題】簡便なボタン操作で音声認識の候補の範囲を狭く絞り込み,入力を効率化する携帯情報処理装置を提供する。
【解決手段】音声認識装置が認識した認識入力データに一致する索引データに対応する一致入力データを,縦横の行列状に配置された操作ボタンのうち押下された操作ボタンが位置する行と列に基づき認識入力データの属性と処理の種別を判断し,認識入力データの属性に対応する分類の前記辞書データから当該認識入力データと一致する索引データに対応する一致入力データを抽出する一致入力データ抽出手段と,前記判断された認識入力データに基づく処理の種別が出力である場合は,前記データベースにおいて前記認識入力データの属性に対応する属性データから一致入力データと等しい属性データを検索し,検索された属性データと関係付けられた別の属性の属性データを抽出し出力する属性データ出力手段とを有する携帯情報処理装置。 (もっと読む)


【課題】テキストの複合語または複合文字(すなわち、いくつかの構成要素を含む語または文字)の音声認識によって支援された自動補完を提供すること。
【解決手段】ユーザ入力が、語または文字の構成要素を指定したことに応答して、候補の語または文字のリストが生成される。ユーザが、所望の語または文字を発話したことに応答して、所望の語または文字が、選択されること、または候補の語または文字のリストが、絞られることが可能である。その結果、いくつかの字、ストローク、または語の形状から形成された語または文字の入力が、所望される語または文字の構成要素の指定と、所望される語または文字の発音に相当する音声との組み合わせを含むユーザ入力によって円滑にされる。 (もっと読む)


【課題】 音声認識を用いた対話処理で、認識対象語彙を削減する。
【解決手段】 表示画面に表示されていない項目を検知し、検知した項目に対応した音声認識文法を用いて、受信した音声情報を認識し、認識した結果を用いて、前記項目にデータを設定する。 (もっと読む)


【課題】音声認識による操作の容易さを保ちつつ、さらに容易にユーザの意図に沿った操作指示の入力が可能な入力装置等を提供する。
【解決手段】ユーザが発話した「しゅくしゃく」という音声を認識し、認識語彙「しゅくしゃく」に対応する機能としてスイッチ30aに対して縮尺を広域に変更する機能、スイッチ30bに対して縮尺を詳細に変更する機能を割り当てる。ここで、スイッチ30a、30b、30c、30dの4つの入力部に対し、機能(縮尺と詳細の2つ)の数が少ない場合に、スイッチ30cに対してもスイッチ30aと同じ縮尺を広域に変更する機能を割り当て、スイッチ30dに対してもスイッチ30bと同じ縮尺を詳細に変更する機能を割り当てる。 (もっと読む)


【課題】 簡単な構成によって高い認識率で目的とする語彙を認識させることができる音声認識装置を提供する。
【解決手段】 音声を認識するための複数の認識辞書#1〜#4と、音声認識を開始させる認識開始ボタン15と、認識開始ボタンが操作された回数に応じて複数の認識辞書の1つを有効に設定する制御手段4と、制御手段により有効に設定された認識辞書を用いて音声認識を行う音声認識手段3とを備えている。 (もっと読む)


【課題】 機器の音声操作に好適な音声コマンドをユーザに提示できる操作性に優れた音声認識装置を提供する。
【解決手段】 音声を入力する音声入力手段7と、入力された音声を音声コマンドとして認識する音声認識手段16と、手動操作により入力を行う手動入力手段6と、手動操作により生じた状態が所期の目的が達成された目的達成状態であるかどうかを記憶した状態管理テーブル10と、手動操作により生じた状態と音声コマンドとの対応関係を記憶した音声コマンド対応表と、手動操作により順次生じた状態を状態管理テーブルの内容と照合して目的達成状態になったことを判断した時に、手動操作により生じた目的達成状態に対応する音声コマンドが音声コマンド対応表に存在すれば、該音声コマンドによって手動操作に対応する機能を実現できる旨を表すメッセージを生成する制御手段8と、生成されたメッセージを出力する出力手段14、5、15、4とを備えている。 (もっと読む)


【課題】
音声対話プログラムのデバッグ時における作業効率を向上させる。
【解決手段】
対話プログラムのデバッグ処理方法は、音声入力を受け付け、当該音声入力に係る発話内容データを記憶装置に格納するステップと、予めブレーク条件リストに登録され且つブレーク条件となる発話内容と記憶装置に格納された発話内容データとを比較する比較ステップと、比較ステップにおいて一致すると判断された場合には、対話プログラムのデバッグ実行を中断させるステップとを含む。これによりブレーク条件として発話内容を指定することができるため、いずれの状態においても特定の発話がなされればブレークが発生する。よって、デバッグ効率が向上する。 (もっと読む)


1 - 20 / 26