説明

Fターム[5D015KK01]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 他機器の動作機能の制御 (465)

Fターム[5D015KK01]に分類される特許

201 - 220 / 465


【課題】ユーザが煩わしい操作をしなくとも、認識性能を向上することができる音声認識装置および音声認識プログラムを提供する。
【解決手段】複数の語彙を予め格納した語彙辞書記憶部11と、認識対象語彙を抽出する語彙辞書管理部12と、受け付けた音声に基づいて、認識対象語彙との一致度を算出する照合部13と、一致度の算出結果から最もスコアの良かった語彙を認識結果として出力する結果出力部14と、監視制御部15の監視結果に応じて、抽出基準情報を変更する抽出基準情報管理部12cとを備え、語彙辞書記憶部11は、更に、認識対象語彙を抽出する際の尺度となる尺度情報20を格納した尺度情報記憶部と、認識対象語彙を抽出する際の認識対象語彙20の基準を示す抽出基準情報24を格納した抽出基準情報記憶部とを含み、抽出基準情報24が変更されることにより、語彙辞書管理部12は、認識対象語彙の数を増減する。 (もっと読む)


【課題】介護医療テストのため、(パ)(タ)(カ)の単位時間内の発音回数の測定を手動で行つて居るが、より正確に、より簡単に自動計測をするための手段として、全て自動的に回数計算を行い、その結果を即刻、数字として表示する。
【解決手段】人によつて異る音声を個人別にサンプルとして収録し、音声比較をしながら回数を計算する。これらは全てマイコンの領域内でデジタルに変換されたテ−タ−として高速処理される。2桁の数字は表示器に表され、必要に応じてデ−タ−を保存して拡大利用のシステムとして活用できることを特徴とする。 (もっと読む)


【課題】現実世界の多種多様な音または音声を使ってキャラクタを探索し、捕獲し、収集するというゲーム内容を実現するゲーム装置を提供する。
【解決手段】ゲーム装置10は、複数の音または音声に関する特徴情報からなる情報群に含まれる個々の音または音声に関する複数の特徴情報を、複数のキャラクタの個々の識別情報と対応付けて、かつ音または音声とキャラクタとの対応関係を予めプレイヤーに明示することなく記憶させた音データベースを備える。ゲームプレイ中に音探索モードを選択し起動させると入力される音または音声の特徴が解析され、その解析結果が予め記憶された特徴情報と照合される。第1の照合処理において複数の特徴情報のうちの一部が照合され、キャラクタが識別される。第1の照合処理によりキャラクタが識別されないとき第2の照合処理が実行され、第1の照合処理による照合に用いていない他の特徴情報が照合され、キャラクタが識別される。 (もっと読む)


【課題】ユーザの会話の内容と関連のある画像を検索するのに用いられるメタデータを、容易に、画像に付加することができるようにする。
【解決手段】テレビジョン放送受信装置1−1のユーザとテレビジョン放送受信装置1−2のユーザにより行われている会話がテレビジョン放送受信装置1−1により認識され、認識結果であるテキストデータからキーワードが抽出される。抽出されたキーワードは、キーワードの抽出元となる会話が行われていたときに双方のテレビジョン放送受信装置において注目されていた画像のメタデータとして付加される。付加されたメタデータは、ユーザ間で行われている会話の内容と関連のある画像を検索するために用いられる。本発明は、他の機器と通信を行いながら画像を表示する機器に適用することができる。 (もっと読む)


【課題】処理の負担を軽減する。
【解決手段】SOMの一種である入力ネットワークnet11は、空間的な配置構造が与えられた複数のノードから構成され、各ノードは、時系列パターンを表現する時系列パターンモデルを有している。時系列データである入力データの学習時において、時刻tのフレームの入力データに対する勝者ノードNtの決定後、次のフレームである、時刻t+1のフレームの入力データに対する勝者ノードNt+1の決定は、その時刻t+1のフレームの入力データの直前の時刻tのフレームの入力データに対する勝者ノードNtとの距離が所定の距離以内のノードだけを対象にして行われる。本発明は、例えば、ロボットなどに適用できる。 (もっと読む)


【課題】 多数のアプリケーション機能を搭載した携帯電話機では、アプリケーションプログラムを起動するためにアプリケーションをメニュー表示して、ユーザに選択させることにより起動させているが、メニュー階層が複雑になり、希望のアプリケーションプログラムを起動する操作が困難であった。
【解決手段】 待受画面11で機能キーを長押操作すると音声入力画面13になり、音声入力モードになる。この状態でアプリケーションに対応付けた呼び出しワードを発声すると、対応するアプリケーションプログラムが起動され、ユーザが希望するGPSナビ画面が画面表示される。 (もっと読む)


【課題】オペレータを呼び出すか否かをシステムの利用開始時の最初の発話の入力から容易に判断することができ、誤応答を低減することができる音声操作システムを提供する。
【解決手段】音声操作システム10を、利用者の発話による音声を入力する音声入力部12と、該入力された音声を認識してテキスト変換する音声認識部14と、該入力された音声及び前記変換されたテキストの少なくとも一方に基づいて、システムが正しい応答情報を生成できるか否かを判定する発話判定部18と、正しい応答情報を生成できると判定されたときに、発話の内容に適した応答情報を生成して応答するシステム応答部20と、正しい応答情報を生成できないと判定されたときに、オペレータを呼び出すオペレータ呼出部と、を含めて構成する。 (もっと読む)


【課題】音源物体の検出成功率を向上させるとともに安定させること。
【解決手段】ロボット装置100において、画像入力部112によって入力された画像と、音源情報の適用視覚情報とに基づいて画像処理手順を実行して音源物体102の視覚特徴を検出し、音源物体102の少なくとも方位を示す視覚定位情報を出力する視覚特徴検出定位部114と、音声入力部113によって入力された音声と、音源情報の適用聴覚情報とに基づいて音声処理手順を実行して音源物体102の聴覚特徴を検出し、音源物体102の少なくとも方位を示す聴覚定位情報を出力する聴覚特徴検出定位部115と、検出戦略情報に基づいて、視覚特徴検出定位部114または聴覚特徴検出定位部115を制御し視覚定位情報または聴覚定位情報から音源物体102の存在する位置を検出する音源物体検出部116とを備えた。 (もっと読む)


【課題】誤動作の発生を低減する音声処理装置を提供する。
【解決手段】操作者または操作者以外の者の発声を含む音声を入力するマイク104と、入力された音声のうち音声処理の対象とする区間として操作者により指定された指定区間の入力を受付ける指定区間受付部204と、入力された音声から発声が存在する区間である発声区間を検出する発声区間検出部202と、入力された音声に基づいて、操作者または操作者以外の者のいずれが発声の発話者であるかを判断する話者判断部203と、指定区間受付部204が受付けた指定区間と発声区間検出部202が検出した発声区間とが重複する部分を検出し、重複する部分が検出された場合であって、話者判断部203により話者は操作者以外の者であると判断された場合に、重複する部分が含まれる発声区間を処理区間として決定する処理内容判断部205と、を備えた。 (もっと読む)


【課題】浴室外にいる人が音声による操作を実際に行いながら、浴室内にいる入浴者に操作方法を教えることができる浴室装置及び音声操作システムを提供する。
【解決手段】浴室装置Aは、複数の浴室機器Eと、浴室外部に設けた浴室外通話装置Fとの間で通話を行う浴室内通話装置Cと、所定の音声命令の音響的特徴を表す音響モデルを記憶する音響モデル記憶部13、浴室内通話装置CのマイクMC1を介して入力される話者の音声信号と音響モデル記憶部13に記憶された音響モデルとのパターンマッチングを行うことで音声命令の内容を認識する音声認識部14、および音声認識部14の認識結果にしたがって対応する浴室機器Eを操作する音声操作部15を具備した音声操作装置Dとで構成される。そして音声操作装置Dには、浴室外通話装置Fから浴室内通話装置Cへ入力される送話信号を音声認識部14側へ入力させる外部音声入力用スイッチ16を設けてある。 (もっと読む)


【課題】長文や区切り情報や範囲指定情報のような特別な情報がないテキストデータでも、そのの取得範囲を決定することができる音声データ再生装置を提供する。
【解決手段】テキストデータを格納するテキストデータ記憶部と、テキストデータに対応する音声データを格納する音声データ記憶部を備える。音声データを再生し、出力した音声の再確認箇所を指示させ、その指示に基づいてテキストデータの取得範囲を決定する。取得された範囲中のテキストデータから単語を抽出し、その単語を表示する。 (もっと読む)


【課題】入力音声の言語に対応する言語辞書に速やかに切り替えることができる音声認識装置、及びナビゲーションシステムを提供する。
【解決手段】言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの各々が記憶する切り替えコマンドを集約した言語切り替え用辞書30dを用いて、この言語切り替え用辞書30dに記憶された切り替え用コマンドと入力音声との一致を判定する。そして、音声入力によってナビゲーションシステム1を操作する際に設定する言語辞書として、デフォルト設定された(現在設定された)言語辞書から、一致すると判定された切り替えコマンドに対応する言語辞書に切り替える。 (もっと読む)


【課題】テレビの出演者を声紋で特定するシステムを提供する。
【解決手段】1または複数の検索対象の声紋データが格納された声紋データ記憶部15と、不特定な人物の音声データが入力するごとに前記音声データから声紋データを作成する声紋データ作成部13と、声紋データ作成部13が作成した声紋データを声紋データ記憶部15に格納された1または複数の検索対象の声紋データと順次照合して一致する声紋データを検出する声紋データ解析部14と、声紋データ解析部14が一致する声紋データを検出したことを契機として予め指定された動作を実行する制御部16〜18,20とを備えている。多数の人間の中から特定の人物を声紋によって探し出すことができ、また、探し出したことを契機に、所定の動作を実行することができる。 (もっと読む)


【課題】車載機器の指示入力等に用いる音声認識の技術において、操作性と認識率を改善し、あわせて運転の安全性も向上すること。
【解決手段】辞書限定部14の受付部がタッチパッド部6で入力を受け付け、判定部が、操作パタン記憶部12を参照することにより、前記受付部の受け付けた入力の該当する操作パタンを判定し、その操作パタンに対応する前記操作階層を特定する。限定部が、関連記憶部13に記憶された属性又はインデックスを参照することにより、前記判定部の特定した操作階層に関連付けられた各特徴データを、入力音声との照合対象範囲として限定する。音声認識部15は、マイク部7を含む前記音声入力部が入力を受け付けた入力音声を、前記照合対象範囲の各特徴データと照合することにより、発話された単語を認識する。 (もっと読む)


【課題】安全にデジタル放送を視聴できる安価な放送受信システムを提供する。
【解決手段】放送受信システムは、放送受信装置1と放送受信装置制御端末2を備え、放送受信装置1は、放送を受信する放送受信部11〜13と、端末2からの制御IDに応じた周波数の放送を放送受信部で受信して得られた番組情報を端末2に送信する制御部17を備え、放送受信装置制御端末2は、発話された音声を音声情報に変換する音声入力部21と、音声情報と認識語彙との対応が記述された音声認識辞書を格納する音声認識辞書部22と、音声入力部からの音声情報に対応する認識語彙を音声認識辞書から検索する音声認識処理部23と、装置1から受信された番組情報を蓄積する番組情報蓄積部24と、音声認識処理部からの認識語彙に対応する情報を番組情報蓄積部内の番組情報から検索し、検索された情報に対応する制御IDを装置1に送信する番組検索処理部25を備えている。 (もっと読む)


【課題】ユーザが所望する複数の機器夫々に対して正確な遠隔制御を確実に行える遠隔制御装置を提供する。
【解決手段】マイク12を介して入力された音声を音声認識部13で認識し、制御対象の電化製品を特定し、特定した電化製品に対応する位置情報を情報記憶部22から読み出す。読み出した位置情報に基づいて、赤外線送出部16からの赤外線信号の送出方向がその特定した電化製品に向くように遠隔制御装置1は移動/回転し、制御コマンドを表す赤外線信号を、制御対象の電化製品に向けて送出する。また、撮像部19にて、制御対象の電化製品が存在することを確認した後に、制御対象の電化製品に向けて赤外線信号を送出する。 (もっと読む)


【課題】音声認識率を向上させる。
【解決手段】ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあるか否かを判定し(S108)、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定(S108でYESと判定)した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除する(S112)。 (もっと読む)


【課題】 音声入力による楽曲検索における使い勝手と検索精度との向上を図ること。
【解決手段】 音声処理部50は、マイクMから入力されたハナ歌をMIDIデータであるハナ歌データ84に変換する。エージェント処理部10は、ユーザに旋律幅83の音声入力を依頼し、入力された旋律幅83に基づいてハナ歌データ84が有する旋律の速さ及び音程を補正する。そして、その補正後のハナ歌データ84の旋律を含むMIDIファイルを検索する。そして、その検索結果86が複数あった場合は、別フレーズのハナ歌の音声入力をユーザに促し、複数の検索結果86の中から更に入力されたハナ歌データ84の旋律を含む楽曲を絞り込み検索する。 (もっと読む)


【課題】 医用画像に関する特定処理の指示命令を行うコマンド名の音声入力を、確実且つ迅速に行えるようにすること。
【解決手段】 CPUは、マイクから音声入力された音声の音声データがA/D変換器から出力されると、その音声データの音声認識を行って文字情報に変換して入力文字列240として記憶部24に記憶する。そして、音声入力モードとして裏モードが選択されている場合は、コマンドテーブル242に記憶された標準コマンド名よりも字数の短い裏コマンド名と入力文字列240とを比較する。CPUは、コマンドテーブル242の裏コマンド名のうち、一致した裏コマンド名に対応付けられた標準コマンド名の指示命令を実行する。 (もっと読む)


【課題】 入力される音声情報を極めて高い音声認識率で認識して、使用者の操作を必要とすることなく自動的に文字情報に変換する。
【解決手段】 制御部1は、webページ取得部10によって、ネットワークから得られるwebページに含まれている画像情報をHTML解析部11および画像データ解析部12によって解析し、画像情報から抽出した文字列をキーワードリスト保存部13に登録する。そして、音声入力部5から入力された音声がキーワードリスト保存部13に登録されているいずれかの文字列と一致するか否かを音声認識部6によって判断して、一致すると判断した場合には、文字描画部7によって文字列をビットマップの文字画像に変換し、認識された音声に対応する映像と文字画像とを文字合成部8によって合成して新たな画像情報を生成する。 (もっと読む)


201 - 220 / 465