説明

Fターム[5D015KK01]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 他機器の動作機能の制御 (465)

Fターム[5D015KK01]に分類される特許

101 - 120 / 465


【課題】使用者の設定条件に応じた音声操作語句の提示を行う提示装置を提供する。
【解決手段】提示装置は、キー入力操作が受け付けられた場合に、音声操作語句を常に提示する提示モード1、所定の手動入力操作が為された場合に限り音声操作語句を提示する提示モード2、及び音声操作語句の提示を停止する提示モード3の内から使用者によって指定された提示モードに基づいて、当該キー入力操作の操作コードに対応する音声操作語句を提示するか否かを判定し、提示すると判定した場合に当該音声操作語句を提示する。 (もっと読む)


【課題】音声データからユーザの発話対象を判別すること。
【解決手段】音声入力処理ユニット2は、マイク31が集音した音声データを分析処理部12aによって分析し、単音素に対応する波形を抽出する。音素照合部12bは、単音素に対応する波形の照合に際し、ユーザが音声入力を行なう場合の音声に生ずる音素を記憶するコマンド音素辞書14とユーザが同乗者と会話する際の音声に生ずる音素を記憶する会話音素辞書15を用いてそれぞれ照合を行なう。コマンド判定部12cは、2つの辞書内音素に対する適合度合いを比較することで、音声データが車載装置1に対して発声されたコマンドであるか否かを判定する。 (もっと読む)


【課題】操作端末と装置で構成された操作システムにおいて、音声認識した操作命令の内容をユーザが確実に確認できるようにする。
【解決手段】操作端末から入力した音声の操作命令で装置を動作させる操作システムにおいて、前記入力した音声を認識し、認識した音声が予め定めた操作命令に該当するか否かを識別する音声認識手段と、前記音声認識手段が予め定めた操作命令に該当すると識別した場合に、前記入力した音声に対応する操作命令の内容を示した命令実行確認画面を表示する表示制御手段とを備え、操作命令の実行前にユーザが視覚で確認できるようにした。 (もっと読む)


【課題】受聴者が指定した話者の音声だけを、使用者が最も好ましく感じる変換率で自動的に話速を変換することができる話速変換装置、通話装置および話速変換方法を得ること。
【解決手段】通話に参加する個々の話者の音声特徴を抽出する音声特徴抽出部101と、受聴者によって指定された話者について抽出された音声特徴を記憶する音声特徴記憶部102と、現在の発話者の音声特徴を音声特徴記憶部102に記憶された音声特徴と比較することによって発話者が、受聴者によって指定された話者の一人であるか否かを判定する話者判定部103と、話者判定部103で受聴者によって指定された話者であると判定された場合に、発話者の受話音声の話速を変換する話速変換部104と、を備える。 (もっと読む)


【課題】音声認識の精度を継続的に向上させながら、積極的に対話内容を充実させる音声対話装置を提供すること。
【解決手段】複数の音声認識辞書30を参照対象として用いユーザの発話を認識しながらユーザとの間の対話を制御する音声対話装置100は、ユーザの発話履歴を主題毎に記録する発話履歴記録手段11と、発話履歴記録手段11が主題毎に記録した発話履歴に基づいて各主題における対話の新たなシナリオを決定する対話シナリオ決定手段13と、対話シナリオ決定手段13が決定した対話の新たなシナリオに基づいて参照対象とする音声認識辞書30を決定する参照辞書決定手段14と、を備える。 (もっと読む)


目標物の位置探索を実行する画像収集装置を制御するためのシステムを提供する。システムは、受け取られた可聴音信号に基づいて位置探索を実行し可聴音音源の位置をアプリケーション層手順ユニットに伝送する可聴音音源位置特定ユニットと、保存された可聴音信号との認識及び照合プロセスを受け取られた可聴音信号に基づいて実行し音声認識結果をアプリケーション層手順ユニットに伝送する音声認識ユニットと、可聴音音源の位置及び音声認識結果に基づいて画像収集装置の予測される焦点位置を判定するアプリケーション層手順ユニットと、アプリケーション層手順ユニットから獲得された画像収集装置の予測される焦点位置を現在の焦点位置と比較し画像収集装置を制御する画像収集制御ユニットとを備える。システムは、可聴音音源の位置及び音声認識の結果に基づいて自動的に目標物の位置探索を実行するように画像収集装置を制御し、操作の保守性を向上させる。
(もっと読む)


【課題】認識可能語彙をユーザが記憶する負担を軽減した音声認識機能付き操作器を提供する。
【解決手段】操作器1は、照明器具20を操作するための手動操作部7と、ユーザの発話した音声が入力されるマイク5と、照明器具20を操作するための複数の操作語彙の音響モデルを記憶した音響モデル記憶部8と、マイク5に入力された音声と音響モデル記憶部8に記憶された音響モデルとを比較することによって音声認識を行う音声認識部9と、手動操作部7による操作入力または音声認識部9による認識結果の何れかに基づいて照明器具20を制御する制御部30とを備え、制御部30は、音声認識により操作可能な操作が手動操作部7により行われると、当該操作が音声認識により行えることを報知するための音声ガイダンスを音声生成部12により音声合成させてスピーカ6から出力させる。 (もっと読む)


【課題】音声操作語彙をユーザが記憶する負担を軽減した音声認識機能付き操作器を提供することにある。
【解決手段】操作器1は、マイク5により入力されたユーザの音声を音響モデル記憶部8に記憶された音声パターンと比較することによって音声認識を行う音声認識部9と、照明器具20を操作するために用いられる複数の音声操作語彙が登録されたデータベース10と、音声認識部9による認識結果がデータベース10に登録された音声操作語彙に一致すると、当該音声操作語彙に基づき照明制御部19を用いて照明器具20に所望の動作を行わせる対話制御部13とを備える。対話制御部13は、音声認識部9の認識結果をもとにデータベース10から関連する操作を表す音声操作語彙を抽出し、抽出した音声操作語彙の音声を音声生成部12により生成してスピーカ6から出力させるとともに、表示制御部14を用いてLCD4に文字で表示させる。 (もっと読む)


【課題】資料説明者の意図を正確にユーザに伝えることが可能な身振りを行うことができるプレゼンター動作再現ロボット、プレゼンター動作再現ロボットの制御方法及び制御プログラムを得ることを目的とする。
【解決手段】動作パターン記憶部9に記憶されているロボットの動作パターンの中から、動作解析部3により解析されたプレゼンターの動作に対応し、かつ、キーワード検出部8により検出されたキーワードに対応する動作パターンを検索する動作パターン検索部10を設け、身体制御部12が動作パターン検索部10により検索された動作パターンにしたがって身体を制御する。 (もっと読む)


【課題】浴室における寛いだ状態を阻害されることなく、ユーザが音声認識結果を確認することが可能な音声認識装置を提供すること。
【解決手段】ユーザにより発せられた音声指令に基づいて浴室10の電気機器70を制御する音声式浴室電気機器制御システム12に適用される音声認識装置20であって、ユーザにより発せられた音声が入力され、当該入力された音声を認識する音声認識部30と、音声認識部30の認識結果に基づく情報を表示する情報表示部50と、音声認識部30の認識結果に基づく信号を、少なくとも情報表示部50に出力する出力部40とを備え、情報表示部50は、表示の明度、輝度及び色の少なくとも一つを変化させることにより音声認識部30の認識結果を表示する (もっと読む)


【課題】発話対象を高精度に認識し、車載装置に対する発話に対して選択的に音声認識を行なうことで音声認識精度を向上すること。
【解決手段】座席に設置した圧力センサ45の出力を用いて同乗者検知部26が同乗者の存在を検知した場合に、運転者が同乗者と会話中である状態での音声、画像、運転席の振動を取得し、プロファイルデータとしてデータベース24に格納する。そして音声入力検知部25が運転者によるトークスイッチ44の操作を検知した後、運転者の状態をプロファイルデータと比較することで、運転者の発声が同乗者に向けた会話であるか車載システムに向けた音声入力であるかを判定し、車載システムに向けた音声入力について選択的に音声認識する。 (もっと読む)


【課題】非定常的な雑音の多い環境であっても観測音から目的の環境音を高精度に認識するとともに、監視システムの監視効率を向上させる。
【解決手段】複数のマイク2a,2bによって周囲の音を観測することにより、複数の音源9a,9bから発せられた音が混合された観測音を表現する信号x1(t),x2(t)を取得する。そして、信号処理回路3に、信号x1(t),x2(t)を入力して音源9a,9bごとの分離信号を生成し、雑音除去回路4を経て、音認識回路5によって、音源9a,9bごとの分離信号によって表現される音が目的の環境音であるか否かを判定する。目的の環境音であると認識された場合、機器制御部6は、信号処理回路3から得られる当該音の音源方向に基づいて、カメラ80、マイク81およびスピーカ82を制御する。 (もっと読む)


【課題】少ない発話で、一連の複雑な処理を行わせることができ、操作の簡略化を図ることが可能な音声認識処理装置及びその制御方法を提供する。
【解決手段】発話された音声を入力するマイク9、マイクから入力された音声を認識する音声認識部10、音声認識部10により認識された内容に応じて処理を実行するナビゲーション処理部41、AV処理部42、音声認識部10に認識させる認識語句を記憶する認識語句記憶手段と、認識語句に対応付けられた処理を記憶する処理記憶手段とをメモリに構成し、処理記憶手段に、複数の異なる機能に対応する複数の処理を、認識語句に対応付けて記憶させる処理設定部44を有する。 (もっと読む)


【課題】本発明は、音声選曲機能を備える車載用カラオケシステムに関し、マイクからの選曲に際して選曲者を特定することを可能とし、楽曲演奏中であっても選曲のための音声信号を音響出力させずに選曲可能として利便性の向上を図ることを目的とする。
【解決手段】車内で使用されているマイク15A,15Bのマイク入力端子14に接続されることによるマイク特定情報(入力端子の情報)から座席IDを特定し、入力される音声信号の当該マイク特定情報に対応する座席IDが、予約管理手段27で管理される予約待ち行列の演奏中における歌唱者の座席IDの場合には当該音声信号を歌唱音声信号とし、当該歌唱者以外の座席IDの場合には当該音声信号を選曲音声信号として出力を切り替え、選曲音声信号のときに音声認識したデータにより選曲して予約待ち行列に座席IDを関連付けて登録させる構成とする。
(もっと読む)


【課題】機器とユーザとの仲立ちとなる使いやすい音声インタフェースを提供する。
【解決手段】機器操作を検出する操作検出部と、機器又は機器周辺の状況の状況変化又は状況継続を検出する状況検出部と、前記機器操作の検出結果と前記状況変化又は状況継続の検出結果とを対応させて蓄積する操作履歴蓄積部と、新たに検出された状況変化又は状況継続の検出結果を、蓄積されている状況変化又は状況継続の検出結果と照合し、新たに検出された状況変化又は状況継続の検出結果に対応する機器操作を選択する操作履歴照合部と、選択された機器操作に対応する語句を音声化して発話する発話部とを備えることを特徴とするインタフェース装置。 (もっと読む)


【課題】本発明の目的は、コンテンツ選択の個人化を可能にし、一方でコンテンツの管理および選択を簡略化するスキームを備えることである。
【解決手段】本発明は、サマリ音楽識別値を格納するストレージデバイスと、該サマリ音楽識別値を受信し、該サマリ音楽識別値に基づいてコンテンツをアセンブルする該格納デバイスと通信する、プロセッサと、ユーザに該アセンブルされたコンテンツを提示するために該プロセッサと通信する再生デバイスとを備えているシステムを提供する。 (もっと読む)


【課題】音声認識をおこない機器制御する装置では、不特定多数の利用者がおこなう場合、利用者を特定するために登録し、使用毎に特定する必要があり、特定した利用者の使用頻度を高め、音声認識精度を向上する必要があるという複雑な仕組みや手間がかかるという課題があった。
【解決手段】感度調整機能を有する音声を入力する音声入力手段2と、第一無線装置201および第二無線装置101からの受信信号レベルから機器200および発話者100の位置を把握する位置検出手段4とを備え、設置された周辺環境によるノイズや利用者および機器の位置を無線通信により把握することで、使用環境下に最適な音声感度を調整し、音声認識精度向上と誤認識を防止する。 (もっと読む)


【課題】簡単に構図の良い写真を撮ることができるデジタルカメラを提供する。
【解決手段】デジタルカメラ1に、人物抽出手段41と非人物抽出手段42と構図判定手段44と構図提案手段45を設ける。人物抽出手段41は、画像データを解析することにより、人物を表す画像領域を抽出する。非人物抽出手段42は、人物抽出手段41により抽出された画像領域以外の画像領域を解析することにより、人物以外の主要被写体を抽出する。構図判定手段44は、抽出結果に基づいて、人物と人物以外の主要被写体の配置を評価し、構図の良否を判定する。構図提案手段45は、人物と主要被写体の前記所定の条件を満たす配置を決定する。撮像手段の動作は、決定された配置で人物および主要被写体が配置された画像データが生成されるように制御される。または、人物と主要被写体の配置が決定された配置となるように、画像データに対し画像処理が施される。 (もっと読む)


【課題】 音声認識により選曲を行うと共に、他者の歌唱時であっても選曲を行うことができるようにして、円滑なカラオケ演奏を楽しむ。
【解決手段】 選曲手段14では、音声認識手段13の音声認識結果に基づき楽曲を選択すると共に、当該楽曲に対して、声紋識別手段12により識別された声紋データを関連付けて予約待ち行列に登録する。入力音声処理手段15では、楽曲の演奏が行われているか否か、及び入力された音声データに基づき識別した声紋データと現に歌唱中の楽曲に関連付けられた声紋データとの一致を判断する。両者が不一致の場合には、音声認識による選曲を行う共に、当該音声データを歌唱音声として出力しない。両者が一致する場合には、音声認識による選曲を行わずに、当該音声データを歌唱音声として出力する。 (もっと読む)


【課題】制御環境に応じて照合状態を可変して誤認識のリスクを軽減しつつ、かつ音声操作の操作性を向上させる。
【解決手段】音声情報処理部22は、音声出力I/F部14に対して出力する音声データを生成する音声合成エンジン部31と、音声入力I/F部13からの音声入力情報を認識する音声認識エンジン部32とを備えて構成される。音声認識エンジン部32は、可変フィルタ部41、照合部42、コマンド変換部43、フィルタ係数格納部44、照合パターンテーブル格納部45、パターン切替部46、の各部を有している。 (もっと読む)


101 - 120 / 465