説明

Fターム[5D015KK01]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 他機器の動作機能の制御 (465)

Fターム[5D015KK01]に分類される特許

121 - 140 / 465


【課題】宅内の音響機器が音を出力している環境下でも、誤った音声認識による誤制御を防ぐことができる音声コントローラを提供することにある。
【解決手段】音声コントローラ1は、集音部10で集音した音に含まれる宅内の音響機器の3出力音に対してエコーキャンセル処理部11でエコーキャンセル処理を施した上で、更にエコーキャンセル処理部11の出力信号に雑音信号を重畳させて出力信号を平滑化し、この平滑化した信号と、音声認識モデルとを比較して出力信号に含まれる音声を認識するのである。 (もっと読む)


【課題】 機器の開閉状態によって押せるボタンの種類に合わせて音声認識語彙を変更することができ、閉じた状態では押せないボタンの機能を音声で呼び出すことができ、開いた状態では、主要な音声コマンドの認識率を高めるようにする。
【解決手段】 閉じた状態と開いた状態を有し、複数の操作ボタンを備えていて、開閉状態によって押下できる操作ボタンが異なる構造をしている音声情報処理装置であって、音声情報を取得し、閉じた状態か開いた状態かを検知し、閉じた状態であると検知した場合は閉じた状態に対応する音声認識文法を選択し、開いた状態であると検知した場合は開いた状態に対応する音声認識文法を選択し、選択した音声認識文法を用いて、取得した音声情報を音声認識する。 (もっと読む)


【課題】 音声入力を開始を指定するボタンには、押しながら話す方式(PWT)と押して放して話す方式(PTT)の二通りがあり、どちらで使えるのかユーザが分からずに誤用する可能性がある。
【解決手段】 ボタン押下の時間とユーザの発声の有無を検知することで、誤用であるか判断し、正しい使用方法をガイダンスする。PWTでは、ボタン押下の時間が短くかつその後にユーザの発声がある場合、PTTと誤用されているとする。PTTでは、ボタン押下の時間が長くかつその間にユーザの発声がある場合、押しながら話す方式と誤用されているとする。 (もっと読む)


【課題】ユーザが意図した時に確実に音声認識処理を実行できる車載音声認識システムを提供すること。
【解決手段】音声操作したい車載機器を選択するための機器選択スイッチ21〜26を設けるとともに、それとは別に、音声認識処理を開始させるための音認スイッチ29を設ける。これにより、ユーザは、音声認識処理を開始させるためにスイッチを長押しする必要がなくなる。そのため、押下時間不足により音声認識処理動作が開始されていないという状態がなくなるので、ユーザが意図した時に確実に音声認識処理が実行される。 (もっと読む)


【課題】システムが過去に出力した音声案内に対する応答を適時にやり直すことができるようにすることで自然な対話を継続させることができる対話制御装置を提供すること。
【解決手段】音声案内データと音声案内データの出力を開始させるためのユーザ発話を定める音声認識対象語とを有するノードから構成されるシナリオに沿ってユーザとの対話を制御する対話制御装置100は、ユーザ発話をテキストデータとして認識する音声認識手段10と、出力した音声案内データを有するノードを記録するノード記録手段12と、ノード記録手段12が記録したノードに関する音声認識対象語を取得する音声認識対象語取得手段13と、音声認識手段10が認識したテキストデータと音声認識対象語取得手段13が取得した音声認識対象語とに基づいて次に出力させる音声案内データを決定する次出力決定手段14と、を備える。 (もっと読む)


【構成】 警告システム10はサーバ12を含み、サーバ12はネットワーク14を介してセンサユニット20と通信可能に接続される。センサユニット20は、これを装着する看護師の音声を収集して、サーバ12に送信する。サーバ12は、看護師が会話するときの音声を単語に分解する。分解した結果、会話に、病院や科特有の語が含まれるとき、会話している看護師が病院や科に慣れているかどうかを判断する。看護師が病院や科に慣れていない場合には、その特有の語についての確認が有るかどうかを判断する。そして、そのような特有の語についての確認がない場合には、看護師にコミュニケーションエラーの発生や特有の語を確認すべきことの警告(アラーム)を与える。
【効果】 コミュニケーションエラーに起因する事故やミスを未然に防止することができる。 (もっと読む)


【課題】音声認識ロボットの音声取得部のチューニングを効率良く行う。
【解決手段】音声認識ロボット100は、音声取得部として機能するマイクロホンアレー180と、音声出力部として機能するスピーカ170と、スピーカ170が装着されるロボットアーム160と、マイクロホンアレー180に対してチューニングを行うチューニング部を備える。チューニング部は、チューニングに際し、スピーカ170に基準音声を出力させるチューニング制御部と、基準音声に対する音声取得部の応答を用いてチューニングを実行するチューニング実行部とを有する。 (もっと読む)


【課題】音声認識装置において、ドライバーの運転活動を極力妨げずに認識率を向上させること。
【解決手段】音声認識開始スイッチが押下されていると判断された場合には、音声入力手段を介して入力された音声をA/D変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析(特徴パラメータ等を抽出)する(S110)。続いて、分析したデジタル信号を、外部データ入力器を外部記憶媒体から取得した音節の特徴パラメータ等と比較して、候補音節をそのスコアに応じて候補順を付けて複数選択する(S120)。そして、選択された候補音節を表示部に表示させる(S130)。報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行する(S150)。 (もっと読む)


【課題】 プレゼンテーションの内容に沿ってプレゼンテーション画像データの切り替えを行うことができる画像出力装置及び画像出力方法を提供する。
【解決手段】 プレゼンテーション装置110は、第1ページのプレゼンテーション画像データ201を出力している際に、プレゼンテーションの説明者により入力された音声の認識結果が第1ページのプレゼンテーション文書データに含まれるページ切り替えのための文字列と一致した場合に、投影装置107へ出力する画像データを、第1ページのプレゼンテーション画像データから第2ページのプレゼンテーション画像データに切り替える。 (もっと読む)


【課題】音声認識の処理を行って所定のコマンドを実行する映像信号の再生装置において、簡易な構成でありながら、ユーザの使い勝手を向上させる。
【解決手段】
入力部12、符号化部13、記録/読取部14、制御部2等を備える。制御部2内のROM3には、音声認識プログラム41、認識文字表示プログラム42が記録されている。表示装置110には、制御部2が処理できる所定のコマンドを文字で表示したものがOSD表示され、制御部2は、音声認識プログラム41により音声信号の待機状態として、このコマンドに対応する音声がマイク101から収音されると、これとのパターン認識を行い、もっとも類似度の高いものを選択する。そしてこの類似度が所定の閾値以上であれば、制御部2は、このコマンドに対応する再生位置の制御を行う。 (もっと読む)


【課題】 高齢者と好適なコミュニケーション(雑談型対話)ができるロボット制御装置を提供する。
【解決手段】 話題選択手段202が話題に適した時系列上の時点と現在の日時との関係を加味して発話記憶手段301に記憶された各話題毎の評価値を算出し、この評価値の大小に基いて話題選択手段202が発話記憶手段301から適切な話題を選択し、話題に対応した文章を発話記憶手段301から読み出して出力手段401に音声出力する。 (もっと読む)


【課題】
雑音信号区間の判別精度の向上を図ることを可能とする端末装置及び判別方法を提供する。
【解決手段】
ネットワークを介して音声認識サーバ200に接続された端末装置100が、音声信号区間と雑音信号区間とを判別する音声/雑音判別部130と、音声信号区間に対応する音声信号に基づいて音声信号情報を抽出する音声特徴量抽出部140と、雑音信号区間に対応する雑音信号に基づいて雑音信号情報を抽出する雑音特徴量抽出部150と、音声信号情報及び雑音信号情報を音声認識サーバ200に送信する送信部160とを備え、音声/雑音判別部130が、音声認識を開始する条件である開始条件が満たされるまでの所定区間を雑音信号区間として判別する。 (もっと読む)


【課題】現在位置近傍の情報を詳細且つリアルタイムに得る。
【解決手段】移動体に搭載され、経路を探索して誘導するナビゲーション装置100は、音声情報を取得する取得部101と、道路情報を取得するための特定のワードが設定される設定部102と、取得部101が取得した音声情報のうち、設定部102に設定された特定のワードを含む音声情報を認識する音声認識部103と、音声認識部103により認識された特定のワードを含む音声情報に基づいて、経路を作成する経路作成部106と、経路作成部106により作成された経路の案内をおこなう案内部107と、を備える。 (もっと読む)


【課題】音声信号に対する信号処理の負担が増えることで通話に支障を来すことを防止する。
【解決手段】各音声端末装置1が具備する第1信号処理部11において拡声通話のための音声スイッチに関する信号処理を行うので、個々の音声端末装置1における信号処理の負担を軽減することができる。しかも、音声スイッチ以外の信号処理、例えば、エコー抑圧処理や圧縮伸長処理、音声照合処理、音声周波数変換処理、話速変換処理などを行う第2信号処理部16を各音声端末装置1に具備しているので、音声スイッチ以外の機能が容易に実装できるとともに、当該機能の追加に伴って第1信号処理部11の負担が増えることも防げる。 (もっと読む)


【課題】 ユーザが特定のオブジェクトに音声を登録し、その音声を発声することでオブジェクトを呼び出すことができる音声操作において、前記オブジェクトが表現しにくい概念(操作マクロ、検索クエリ等)であった場合を考える。登録したオブジェクトを発声で呼び出した際には、呼び出したオブジェクトがユーザが求める内容であるかどうかを効果的に確認する手段がない。
【解決手段】 オブジェクトへの音声登録時に、識別情報データベースから識別情報を選択する。そして、オブジェクト、登録音声、選択された識別情報からなる登録情報を登録データベースに格納する。音声呼び出し時は、呼び出された登録情報に含まれる識別情報をユーザに提示する。 (もっと読む)


【課題】 音声認識の認識対象である認識コマンドを次々と容易に切り換えて実行する補助手段を提供する。
【解決手段】 コマンドを音声で入力するための認識コマンドを複数記憶する記憶手段を参照し、入力された音声を認識してコマンドを選択する第1選択手段と、前記記憶手段に記憶された複数の認識コマンドに対応するコマンドのいずれかを所定の順序に従って選択する第2選択手段と、所定の操作部に対する操作に基づいて、前記第1選択手段、前記第2選択手段のいずれかを選択する処理決定手段と、前記処理決定手段で選択された選択手段によって選択されたコマンドを実行する実行手段とを有することを特徴とする。 (もっと読む)


【課題】音声識別するのに際して、視線情報を用いず、判別が困難な発話に対しても、正確に音声を識別することを課題とする。
【解決手段】音声識別装置は、利用者が発話した音声を受け付けるマイクを備え、カーナビゲーションシステム(カーナビ)が接続されている。また、カーナビも音声識別装置と同様に、マイクを備えて構成されている。このような構成において、音声識別装置は、接続されるカーナビに対して処理の実行を要求するシステム要求であるまたはシステム要求でないと予想を促す特徴のある複数の特徴語に対応付けて、特徴語の重要度を示す重要度を記憶し、入力された音声信号がシステム要求か否かを識別する識別器を保持し、音声信号が入力された場合に、保持される識別器に識別された識別結果に基づいて、音声信号がシステム要求であるか否かを判定する。そして、音声識別装置は、識別結果をカーナビに出力する。 (もっと読む)


【課題】ユーザにとって語句を発声する負担を軽減すると共に、ユーザが音声認識させたい語句を速やかに音声認識することを可能とする。
【解決手段】音声認識装置10は、ユーザがステアリング16を握っている位置を検出し、複数の音声辞書15a〜15cのうちから握り位置に対応する音声辞書を使用辞書として切替え、ユーザが発した音声を入力すると、その入力した音声の音声波形と使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する。ユーザが複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えるための語句を発声する必要がなくなり、ユーザが音声認識させたい語句のみを発声すれば良くなる。 (もっと読む)


【課題】音声処理装置のコストを増大することなく、自然な合成音声を生成し、複数の言い方で発話した場合であっても、この発話を認識することができる音声処理装置、端末装置、音声情報管理装置、および、プログラムを提供する。
【解決手段】ユーザデータを格納する端末装置2と通信可能な通信処理部31と、合成音声を生成する音声合成部38、および、入力音声を認識する音声認識部37の少なくとも1つとを備えた音声処理装置3において、通信処理部31は、ユーザデータの少なくとも1項目の項目値の韻律情報を含む読み情報、および、ユーザデータの少なくとも1項目の項目値の1または複数の認識文法を示す文法情報の少なくとも1つの情報を、端末装置2から取得し、音声合成部38は、通信処理部31が取得した読み情報を用いて、合成音声を生成し、音声認識部37は、通信処理部31が取得した文法情報を用いて、入力音声を認識する。 (もっと読む)


【課題】 インターネットなどの動画サイト上に登録された大量の動画に対するキーワード検索について、時間の経過等による検索キーワードの陳腐化を防ぎ、時代に即したキーワードを用いて動画を検索することを可能にする。
【解決手段】 インターネットなどの動画サイト上に登録された大量の動画の検索について、読み仮名を入力する動画登録インタフェースと、該読み仮名から生成された音素列を基に動画データベース上の動画ファイルについて音声認識を行う音声認識部と、音声認識結果から得られた新たな語彙を追加するインデックスデータベースと各データベースへSQL文を発行することなどによりシステム全体を制御するデータ処理部とを有する構成である。 (もっと読む)


121 - 140 / 465