説明

Fターム[5D015LL07]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 他の情報入力装置の援用 (113)

Fターム[5D015LL07]の下位に属するFターム

Fターム[5D015LL07]に分類される特許

61 - 80 / 87


【課題】 発話者の無声音声と発声時の口唇の動画情報を利用して、通常の有声音を含む発話時に想定される音声を合成する音声通話装置および音声通話システムを提供することを目的とする。
【解決手段】 音声通話装置は固定電話や携帯電話等であり、マイクロフォン100と音声信号分析器101、カメラ102、映像信号分析器103、音声信号合成器104、辞書情報データベース105から構成されている。マイクロフォン100は、音声を入力するためのものであり、マイクロフォン100から入力された音声(ここでは、無声音)が音声信号分析器101へ送信される。音声信号分析器101は、マイクロフォン100から入力された無声音で主に子音に関する情報が抽出される。 (もっと読む)


【課題】発言音声やプロジェクタ投影画像などのメディア情報を用いて会議の議事録を自動作成する議事録作成装置であって、処理能力の余り高くない携帯型電子機器などにあっても、処理負荷が大き過ぎることなく、容易に円滑な議事録作成処理を行う。
【解決手段】プロジェクタによる投影プレゼン画像をカメラ部16により撮影し、この撮影画像から文字認識テキスト化処理を行うと共に、そのテキストデータに含まれる語句の全てまたは多数を有する分野別の音声認識辞書データ14anを選択設定し、この設定分野別辞書データ14anを用いて音声入力部17による入力発言音声を認識してテキスト化処理を行い、前記撮影画像からの文字認識テキスト化データと1ファイルにした議事録データを作成する。議事録を容易に自動作成できるだけでなく分野別の音声認識辞書データ14anを選択設定して大きな処理負荷を要さず発言音声を適切に認識テキスト化処理する。 (もっと読む)


【課題】複数種類の生体情報を使用した利用者識別を高精度に行う。
【解決手段】マイクロホンと、全天カメラから取得した第1の生体情報から利用者を識別する話者識別部104と、利用者の識別情報と利用者が存在する方向と対応付けた第1の生体識別情報を生成し、全天カメラによって出力された生体情報から利用者を識別し、利用者の識別情報と利用者が存在する方向と対応付けた第2の生体識別情報を生成する顔識別部105と、第1の生体識別情報が示す方向の画像の画像特徴領域の近似領域を新たな入力画像から検出して画像特徴領域に設定し検出方向を求める領域追跡部106と、画像特徴領域の検出方向と第1の生体識別情報より後に取得した第2の生体識別情報の方向の差が所定の閾値以下の場合に第1の生体識別情報による利用者と第2の生体識別情報による利用者が同一であると判断する同一性検証部110とを備えた。 (もっと読む)


【課題】 筋電信号と音声信号を用いて雑音に頑強な音声認識を実現すること。
【解決手段】 本発明の一実施形態による音声認識装置は、筋電信号を検出する筋電信号検出部と、音声信号を検出する音声信号検出部とを備える。一般に、筋電信号は音声信号に先行して発生するので、筋電信号から音声に先行する非発話区間を特定することができる。この非発話区間で音声信号検出部により周囲の雑音を検出する。この周囲雑音に関する情報により音声認識の精度を向上することができる。一般に、音声信号による音声認識は周囲の雑音の影響を受けやすいが、筋電信号による音声認識は周囲の雑音の影響を受けにくい。そのため、例えば、周囲の雑音レベルに応じて、音声信号による音声認識と筋電信号による音声認識の重みを変えることで、雑音環境下で音声認識の精度を向上することができる。 (もっと読む)


【課題】ロボットにおいて、音声情報と画像情報を用いて対話相手を正確に検出し、対話する。
【解決手段】話者から話された会話の始まりを意味する特定の音声を認識し、音源方向推定により話者の方向を検出し、検出した話者方向に移動し、移動後にカメラから入力された画像から人物の顔を検出し、顔が検出された場合には対話処理を行う。対話処理においては、検出された顔の方向を優先し、顔方向に音声認識の指向性を限定して音声認識を行う。 (もっと読む)


【課題】 発声者が収音器の近くにおらず低精度の音声認識が行われることを抑制すること。
【解決手段】 収音する収音器16と、収音器16に対し音声を発する発声者の画像を撮影する撮影機18と、前記収音される音声に基づく音声認識を行う音声認識機能部132と、前記撮影される画像に前記発声者の少なくとも一部を示す発声者画像が含まれていない場合に、音声認識機能部132が音声認識を行うことを制限する認識・学習判定部142と、を含むことを特徴とする発声内容認識装置10。 (もっと読む)


【課題】移動体の状態が変化する状況下でも頑健な音声認識を可能としかつ処理効率を向上できる音声認識システムを提供する。
【解決手段】音声認識システム10は、マイク20から入力される音声データを認識するための第1〜第4文法辞書62a〜62d及び言語辞書64を有する。これらの文法辞書62a〜62d及び言語辞書64は、車速センサ42からの車速V、GPS装置44からの現在位置P、ヨーレートセンサ46からのヨーレートY、心拍数センサ34からの心拍数Hに基づいて選択される。このため、車両12の状態に応じた適切な文法辞書62a〜62d又は言語辞書64が選択可能となり、頑健な音声認識を実現しつつ、音声認識の処理効率を向上させることができる。 (もっと読む)


【課題】ユーザにとって使い勝手の良い音声対話、また、走行中の安全性を維持しながら音声対話を行う音声対話装置を提供する。
【解決手段】ユーザの意図するドライブ行程と所定の対話規則を考慮して、対話開始条件を満たす情報をドライブ行程上に配置し、ユーザが対話開始条件を満たす情報を配置した地点に到達した時点で情報をプッシュして、その情報に関する音声対話を行う。 (もっと読む)


【課題】 話者が発する言葉をより正確な文字情報や音声情報に変換し、聴覚障害者同士や聴覚障害者と健聴者との間の正確なコミュニケーションを実現すること。
【解決手段】 携帯電話機200のカメラ201とセンサ202とマイク203が話者の各種データを収集する。データ解析部204において、画像照合部205が、カメラ201の撮像した話者の口の形の画像とメモリに登録されているパターンとを比較・照合し、吐息解析部206が、センサ202の検知した吐息感知データに基づいて吐息の量やスピードを計測し、動作解析部207がカメラ201の撮像した動作データに基づいて口とその周辺の筋肉、舌、顎、喉などの動きを計測する。文字データ生成部208が計測データを使用して文字データに変換する。誤変換修正部210が、辞書データ部209のデータを参照して誤変換の修正を行い、修正された文字データを表示部214に表示する。
(もっと読む)


【課題】危険が検知されたときには必ず動作し、効果的かつ効率的に使用される音声認識装置を提供すること。
【解決手段】音声を入力する音声入力手段10と、音声入力手段10によって入力された音声を情報信号に変換する音声認識手段20と、危険を検知する検知手段30と、検知手段30によって危険が検知されたときに音声認識手段20の動作を開始させるスイッチ手段40とを有し、音声入力手段10によって入力された音声を操作信号R100として操作対象機器に送り出すことを特徴とする音声認識装置を構成する。 (もっと読む)


【課題】 非接触IDを組み合わせることによって利便性、経済性の高い音声認識装置を提供する。
【解決手段】 音声認識パラメータ(27)を含むIDデータ(25)を無線送信する携帯ユニット(200)から、IDデータ(25)を受信する。次に、受信したIDデータ(25)から音声認識パラメータ(27)を抽出する。その後、抽出された音声認識パラメータ(27)を用いて音声認識処理の設定をチューニングする。そして、チューニングされた設定に従い、入力音声に対し音声認識を行う。 (もっと読む)


【課題】 ユーザが現在の感情に至った原因を推定し、推定した原因に応じてユーザとのコミュニケーションを図るための技術を提供すること。
【解決手段】 状況解析部1302は画像、音声、生体情報に基づくユーザの周囲環境、ユーザの心理状態を推定し、原因推定部1303は推定した心理状態が所定の状態である場合には、生体情報に基づいてユーザの体調が不良であるのか否かを推定し、推定した心理状態が所定の状態である場合には上記周囲環境に基づいてユーザの心理状態の原因を推定する。 (もっと読む)


【課題】 人間関係の融和に寄与するような効果を生むことができる視聴コンテンツを提供する。
【解決手段】 対象空間1内のサーモカメラ2により得られた温度分布パターン30と、マイク3により得られた音声信号に基づく音声解析データ31とを取得する。これら温度分布パターン30と音声解析データ31とに基づき、視聴者位置推定部6で視聴者の位置・人数を取得する。温度分布パターン30と音声解析データ31と位置・人数情報32とに基づき、視聴者推定部7で視聴者の年齢・性別情報33を取得する。関係推定部8は、音声解析データ31に基づき、DB12を参照し、年齢・性別情報33を加味して関係情報34を取得する。コンテンツ選択部9は、年齢・性別情報33と関係情報34とに基づき、属性インデックス10を用いてDB11に格納された視聴コンテンツを絞り込み、視聴者に対して最適な視聴コンテンツを選択し、空間1内に提供する。 (もっと読む)


【課題】操作者にとって利便性が高く確実性が高い画像形成装置を提供する。
【解決手段】画像形成装置10は、スキャナ11が原稿画像を読み取って画像データから、画面情報生成部134が仕上がり予想画面情報を生成し、表示パネル15cが仕上がり予想画面を表示する。操作者によるタッチパネル15bからの接触と発話によって、空間項目識別部131が空間指示項目を選択し、言語項目識別部132が言語指示項目を識別する。処理項目設定部133が空間項目識別部131によって選択された空間指示項目および言語項目識別部132によって選択された言語指示項目の組合せによって画像形成のための処理項目を設定する。 (もっと読む)


【課題】 認証のための個人性情報の取得を開始するタイミングを適正化し、個人認証処理における無駄な演算を減らし、電力消費を低減させる。
【解決手段】 加速度センサの出力を取り込むことで当該機器の姿勢を検知し(S2)、当該機器の姿勢が当該機器を使用する姿勢として予め設定されている姿勢に一致する状態、即ち、正に当該機器の使用を開始しようとしている姿勢状態になったと判定された時点で(S3のY)、個人性情報の取得を開始させ(S4,S5)、個人認証処理(S6,S7)に移行させることで、認証のための個人性情報の取得を開始するタイミングが明確かつタイムラグの少ない適正なものとなり、よって、個人認証処理における無駄な演算を減らすことができ、電力消費を低減させることもできるようにした。 (もっと読む)


【課題】 簡単かつ迅速に、データを処理できるようにする。
【解決手段】 CCDビデオカメラ31で、本41のカラーコード42を取り込み、カラーコード識別部61でこれを識別する。音声認識部62は、マイクロホン32で取り込んだ音声を認識する際、識別されたカラーコード42に対応する分野の辞書を選択し、参照する。視覚メッセージ発生部67は、音声認識部62で認知された結果に基づく視覚メッセージを発生する。スーパインポーズ部68は、ビデオ信号に視覚メッセージをスーパインポーズし、テレビジョン受像機33のディスプレイに供給し、表示される。本発明は、音声認識システムに適用できる。 (もっと読む)


【課題】実使用時に入力される音声や雑音などの音に合わせて音響モデルを適応化させることで認識精度を向上させた音声認識機能付制御装置を提供する。
【解決手段】音声認識機能付制御装置Aは、特徴量抽出部2によって抽出された音声信号の特徴量と音響モデル保存部3に保存された音響モデルとを比較することで入力音を認識する認識部4と、認識結果に応じた制御信号を照明装置Bに出力する制御部6と、入力音声保存制御部7に保存された音声信号と対応する認識結果とを用いて音響モデルを再学習し、音響モデル保存部3の音響モデルを更新する音響モデル学習部8とを備え、認識結果の出力時より所定の限時時間が経過するまでの間に認識結果とは制御内容の異なる制御信号がスイッチ5から出力されると、入力音声保存制御部7は認識結果を修正し、修正した認識結果と対応する音声信号を用いて音響モデル学習部8に音響モデルを再学習させる。 (もっと読む)


【課題】 話者の発話区間を精緻かつ効率的に検出可能な発話判別装置を実現する。
【解決手段】 発振部12はマイクロ波を発振して、送受信部14に供給する。送受信部14は、話者の唇に向けてマイクロ波を送出し、その反射波を受信する。混合部15は、発振部12が発振したマイクロ波と受信した反射波とを周波数混合し、混合波を生成する。発話判定部17は、混合波から、送出波と反射波との間の周波数の違いに相当する成分を検出し、その周波数成分が所定の閾値よりも大きいか否かを判別する。閾値よりも大きいと判別すると、話者が発話していると判定して、発話判定部17は所定レベルの信号を音声切替部18に供給する。音声切替部18は、信号の供給を受けて、音声出力のON/OFFを切り替える。 (もっと読む)


【課題】ノイズとユーザが発した音声とを弁別することにより、音声認識するロボットの動作を自然な動作とする。
【解決手段】 音声認識部101Aは、マイクロホン82−1乃至82−Nから入力される音声信号の音声認識処理を行う。制御部101aは、音声認識処理結果に対して、正解確信度を計算し、その正解確信度が所定の閾値より大きいと判定した場合、音声認識結果を行動決定機構部103に出力する。行動決定機構部103は、ロボットが認識処理結果に対応する動作を行うように制御する。本発明は、例えば、音声認識を行うロボットに適用できる。 (もっと読む)


【課題】車室内の音声を、ノイズが低減された状態で取得することができる音声入力装置を提供すること。
【解決手段】車室内部を撮像する撮像部101と、撮像部101から得られる映像を解析し、ノイズ特徴を判定する解析判定部102と、入力音を取得する音声入力部105と、該入力音に含まれるノイズを低減するフィルタを複数記憶するフィルタバンク104と、解析判定部102により判定されたノイズ特徴に基づいて、該入力音に含まれるノイズ成分を低減し、音声成分を強調して抽出するためのフィルタをフィルタバンク104から少なくとも一つ選択して適用するフィルタ選択部103と、フィルタ選択部103によって選択されたフィルタを用いて入力音をフィルタリングするフィルタ部106とを有することを特徴とする音声入力装置を構成する。 (もっと読む)


61 - 80 / 87