説明

Fターム[5D015KK01]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 他機器の動作機能の制御 (465)

Fターム[5D015KK01]に分類される特許

161 - 180 / 465


【課題】音声入力されたイベント情報を、コストを増大させることなく、音声認識によりメタデータに変換できるコンテンツ撮影装置を提供する。
【解決手段】記録モードまたは記録スタンバイモードである時に、音声入力手段より入力される解説音声をフィルタリング手段でフィルタリングした後、出力のレベルを検出し、出力レベルが、事前に設定した出力期間以上の期間に渡って、事前に設定した出力レベル以上である場合、解説音声の入力が始まった時刻情報を含む音声タグを生成し、時刻情報を含む前記音声タグを前記解説音声の時刻情報と関連付け、前記音声タグをメタデータとして前記情報記憶媒体に記録する。 (もっと読む)


【課題】話者である自分の音声と相手の音声がどれくらい似ているかを定量的に測定並びに表示すること。
【解決手段】話者が音声類似度判断クライアント装置と音声類似度判断サーバ装置を使って、自分の入力した音声と対象となる相手の音声とがどれくらい似ているか、音声認証技術を用いて定量的に測定し、その結果を音声類似度判断クライアント装置に接続する表示装置に表示することにより、本課題を解決することが可能となる。 (もっと読む)


【課題】使用者から入力された音声に基づいて認識対象を適切に限定して、該入力された音声を精度良く認識することができる音声認識装置、音声認識方法、及び音声認識プログラムを提供する。
【解決手段】音声認識装置1は、入力された音声に対して算出される音響スコアと言語スコアとに、第1の比率の重み付けをし、得られた各スコアを用いて該音声を認識する処理を実行し、該処理の結果に基づいて制御対象を表すドメインの種類を決定する第1の音声認識手段11,12と、決定された種類のドメインを認識対象として、入力された音声に対して算出される音響スコアと言語スコアとに、音響スコアに対する重み付けが第1の比率よりも大きい第2の比率で重み付けをし、得られた各スコアを用いて該音声を認識する処理を実行し、該処理の結果に基づいて該制御対象の制御内容を決定する第2の音声認識手段11,12とを備える。 (もっと読む)


【課題】使用者の発話が曖昧な場合にも、使用者の発話を精度良く認識することができる音声認識装置、音声認識方法、及び音声認識プログラムを提供する。
【解決手段】音声認識装置1は、入力された音声についての認識結果に基づいて制御対象の制御内容を決定する。制御内容を表すタスクの種類を所定の決定入力に基づいて決定するタスク種類決定手段23と、タスク種類決定手段23により決定された種類のタスクを認識対象として、入力された音声を認識する音声認識手段11とを備える。 (もっと読む)


【課題】 現実空間で発生した音響で複合現実空間へのイベント入力を行えるようにして、比較的簡単なシステム構成で種々のイベント入力を実現する。
【解決手段】 操作者Uが装着した表示部11に現実空間と仮想空間を重畳してリアルタイムで表示する複合現実感システム1において、現実空間における操作者Uの位置及び方向を検出し、現実空間で発生した音響を検出し、所定の音源方向からの操作者Uによる操作指示を示す音響に基づいて仮想空間に対する処理を起動する。 (もっと読む)


【課題】簡素化されたコマーシャル検出方法を提供する。
【解決手段】方法は、テレビ放送の主音声番組を受信し、副音声番組を受信し、主音声番組と副音声番組を主音声チャンネルと副音声チャンネルに変換し、主音声チャンネルと副音声チャンネルの類似値を候補期間内に計算し、算出された類似値に基づいて候補期間が番組逸脱時間であるか否かを判断するステップからなる。 (もっと読む)


【課題】複数系列の情報を予め同期させた状態で記録させる際の利便性を向上できる情報処理装置を提供する。
【解決手段】時系列に順次提示されるべき複数の文書情報と、この文書情報と関係して、時系列に変化する、音声を含んだ動的情報とを取得し、文書情報のうち一つを注目情報として、当該注目情報に含まれる文字列のうち、検索の対象となる文字列を少なくとも一つ、選択的に抽出し、動的情報に含まれる音声において、上記抽出された、検索の対象となる少なくとも一つの文字列を発話している部分を特定する部分情報を選択して出力する。 (もっと読む)


【課題】機器とユーザとの仲立ちとなる使い易い音声インタフェースを提供する。
【解決手段】ユーザからの音声指示に応じて機器操作を実行するインタフェース装置であって、機器又は機器周辺の状態の状態変化又は状態継続を検出し、検出された状態変化又は状態継続の意味を音声でユーザに問い掛け、問い掛けに応じてユーザが発した教示音声を音声認識手段に認識させ、教示音声の認識結果と状態変化又は状態継続の検出結果とを対応させ、教示音声の認識結果と状態変化又は状態継続の検出結果との対応関係を蓄積し、機器操作のためにユーザが発した指示音声を音声認識手段に認識させ、指示音声の認識結果を、蓄積されている教示音声の認識結果と状態変化又は状態継続の検出結果との対応関係と照合し、指示音声の認識結果に対応する機器操作を選定し、指示音声の認識結果に対応する機器操作を実行するインタフェース装置。 (もっと読む)


【課題】音声によって操作を行おうとするユーザが発話できない発話不能状態を回避すると共に、高い音声認識率を確保することが可能な音声入力装置等を提供する。
【解決手段】発話可能なコマンド等を周期的に変更して表示部900に提示する表示形態制御部800と、周期的に提示されるコマンド等に対応する語句を参照辞書格納部400に連動して格納する発話候補特定部600、参照辞書格納部400に格納されている語句を参照しながら、ユーザによって発話された内容について音声認識を行う音声認識部300、及び音声認識された結果に基づいて操作を実行する操作実行部700を備える。 (もっと読む)


【課題】音声会議の進行中であっても、並行して会議内容を参照することが可能で、利用者が必要とする発話箇所を効率的に特定でき、使い勝手の良い音声検索装置および音声配信システムの提供を図る。
【解決手段】 音声検索装置101は、音声会議装置102で取得している音声から発話の有無を検知する。また、発話取得位置から話者名を検知する。また音声波形から発話された単語を検知する。発話の有無が変化するたび、音声を区分して音声ファイルを生成し、各音声ファイルをネットワーク記憶装置103に分散させて記憶させる。音声検索装置101は各音声ファイルの索引として話者名と発話された単語を記録する。この索引に基づいて検索された音声ファイルを時系列に並べたリストをクライアント104に表示させ、リストから選択された音声ファイルをネットワーク記憶装置103から並行してネットワーク配信する。 (もっと読む)


【課題】 音声入力において、走行中等に見かけたポイントの名称等が正確には判らない場合でも、そのポイントを特定することのできる技術を提供する。
【解決手段】 車両に搭載され、音声認識機能を有する車載装置であって、看板に示されている看板情報と、指示代名詞とを記憶装置に記憶している。音声入力装置から入力された音声に、指示代名詞が含まれており、かつ、看板に示されている情報のうち少なくとも一部が含まれている場合、その看板に示されている情報に応じた応答を決定し、決定した応答を出力装置から出力する。 (もっと読む)


本発明はデジタル装置(4、13、14)のリアルタイム音声制御方法に関する。この方法は、音声解析モジュール(3)の入力側に供給される音声信号から子音および母音(ak、tki)を可能な限り短い待ち時間かつ小さい計算能力で抽出する手段(6)を含む音声解析モジュール(3)を使用する。デジタル装置は、特に、検出された子音の種類(A1−A3)、検出された母音の音色(tki)、ならびにピッチおよびインテンシティに応じて、制御信号(25)を生成する。本発明は特に声の表現性を取り込みテレビゲームを制御するのにきわめて有利に応用される。 (もっと読む)


【課題】従来からの、入力された音声データを文字に変換する技術については、音声データからテキストデータへ変換されたデータと、元からテキスト形態にて入力されたデータとが混在する状態では、元のデータが何であったかを出力されたデータから区別することは困難であった。
【解決手段】本発明は、データの表現形態を他の表現形態に変換可能であり、変換された、又は変換されなかったデータを、その旨や、表示形態を示す識別情報に関連付けて出力する情報処理装置を提案するものである。このとき、所定表現形態で取得されたデータを、その表現形態で出力することが適切な出力環境か判断するための条件と、出力環境情報とを比較することもできる。 (もっと読む)


【課題】ユーザにとって使い勝手のよい音声認識処理を行う。
【解決手段】ユーザへの問い掛けに応じて、音声信号取得手段から非言語が入力された場合には、この非言語が入力された際の状況に応じて、非言語の入力の有効性を判断し、有効性の判断結果に応じて、作業内容の確認、作業内容の保留、および、作業内容の実行のいずれかを判断する。 (もっと読む)


【課題】双方向通信を利用した試験用装置とその補助装置に関し、特に複数参加可能な双方向通信システムから、複数の装置に対して同時制御可能とする試験用装置及びその補助装置を提供する。
【解決手段】複数の試験用装置が参加可能な双方向通信システムに接続された試験用装置であって、前記双方向通信システムから作業者の制御指示コマンドを受信する指示受信部と、受信した制御指示コマンドを解析する指示解析部と、解析した指示に従って処理実行を行う実行制御部と、実行結果情報を前記双方向通信システム上へ出力する結果送信部と、を有し、前記双方向通信システムを介して前記複数の試験用装置の各々が同時に制御されるようにする。 (もっと読む)


【課題】 複数の種類の音声制御を受ける音声インターフェースの設計を支援するための装置、プログラム、方法を提供する。
【解決手段】 装置は、複数の種類の音声制御のうちのいずれかと関連付けられた発話サンプルを記録するデータベースと、第1の音声制御に関連付けられた発話サンプルの第1の集合と、第2の音声制御に関連付けられた発話サンプルの第2の集合の間の類似度を計算する類似度計算部と、第1の集合と第2の集合の間の類似度を表示する表示部を備える。表示部は、類似度が表現されるように、複数の種類の音声制御のそれぞれに対応する点をプロットしたグラフを表示することが好ましい。 (もっと読む)


【課題】ユーザの言葉を確実に音声認識することができる車載表示装置を提供する。
【解決手段】マイク19に設けられたPTT( Press to Talk )スイッチ19aを押下すると、目的地ボタンと経由地ボタンとが表示モニタ16に表示される。目的ボタンを押圧すると、音声認識部110で音声認識するときに使用する辞書の範囲が、目的地を設定するときや変更するときに発せられる言葉など、目的地に関する言葉の範囲に限定される。そして、押圧を止めると限定が解除される。経由地ボタンを押圧すると、音声認識部110で音声認識するときに使用する辞書の範囲が、経由地を設定するときや削除するときに発せられる言葉など、経由地に関する言葉の範囲に限定される。そして、押圧を止めると限定が解除される。 (もっと読む)


【課題】ディスプレイのない環境でも、音声評価の結果をユーザが把握しやすい技術を提供する。
【解決手段】音声評価装置1の制御部11は、お手本音声データの特徴と練習者音声データの特徴とを比較し、該比較結果に基づいて指摘区間を特定する。次いで、制御部11は、お手本音声データにおいて、特定した指摘区間に対応するお手本音声データを時間軸方向に伸長し、また、指摘区間に対応するお手本音声の音量が大きくなるように、指摘区間に対応するお手本音声データのパワーを変更する。更に、制御部11は、指摘区間の直前と直後に無音区間を挿入する。スピーカ17からは、加工されたお手本音声データの表すお手本音声が放音される。 (もっと読む)


【課題】予め決められた識別情報をユーザが記憶する必要がなく、容易に外部記憶端末に記憶されているデータの呼出を可能にする。
【解決手段】複数のデータのうち、再生装置によって再生中のデータに付随したタグを取得するタグ取得部10と、ユーザからのボイスタグの登録要求を検出する登録要求検出部13と、登録要求検出部13により登録要求が検出された場合に、タグを構成する複数のカテゴリのうち、ボイスタグを登録するカテゴリを判定するカテゴリ判定部14と、カテゴリ判定部14で判定されたカテゴリの識別情報に対して音声認識部12で認識されたボイスタグを対応付けて登録するボイスタグ登録部15と、ボイスタグ登録部15によって登録したボイスタグと当該ボイスタグが対応付けされたカテゴリの識別情報とを記憶する記憶部18とを具備することを特徴とする。 (もっと読む)


【課題】本発明は、台詞が対応付けられた一連の静止画像が順次切り替えられて表示される静止画像表示システムに関し、エンターテイメント性の向上、観覧意欲の喚起を図ることを目的とする。
【解決手段】一連で構成される静止画像毎に関連する所定の台詞に対応する効果音データを効果音DB38に記憶しおき、音声処理部21の音声認識手段31で入力した台詞音声を解析した音声データと、照合テーブル33の現に表示されている静止画像に対応する台詞キーワードとを音声照合手段32が照合し、一致したときの当該台詞キーワードで特定される照合個別信号に基づいて効果音制御手段35が対応する効果音データを効果音DB38より抽出して効果音出力部23に送出して出力させる構成とする。
(もっと読む)


161 - 180 / 465