説明

Fターム[5L096BA16]の内容

イメージ分析 (61,341) | 入力画像・用途の種類 (5,501) | 特定画像 (1,491) | 音声 (62)

Fターム[5L096BA16]に分類される特許

61 - 62 / 62


音声および映像を、分離および評価する方法、システム、および装置が提供される。音声および映像はキャプチャされ、1人以上の話し手の発言を検出することを目的として映像が評価される。視覚的特徴は、発言する話し手に関連付けられる。音声および映像は分離され、各話し手に関連する音声を分離すること、および、音声に関連するノイズを除去することを目的として、対応する音声の一部が視覚的特徴にマッチングされる。
(もっと読む)


本発明は、問い合わせデータオブジェクトを候補データオブジェクトのマッチングを、両データオブジェクトのフィンガープリントを抽出して比較することによって行うための方法および装置に関する。本発明のある実施形態では、フィンガープリント抽出モジュール(110)、フィンガープリントマッチングモジュール(210)、統計モジュール(120)および識別モジュールを有する装置が提供される。フィンガープリント抽出モジュール(110)は、問い合わせオブジェクトの一部をなしていて問い合わせフィンガープリントを構築する情報信号を受信する。フィンガープリントマッチングモジュール(210)は、前記問い合わせフィンガープリントを少なくとも一つの潜在的な最良一致候補を見出すためにデータベース(215)中に保存されている候補と比較する。一方、統計モジュールは、前記問い合わせフィンガープリントの統計的モデルを決定して、それによりたとえば、前記問い合わせフィンガープリントの内部におけるある種の情報の統計分布を決定する。閾値決定器(120)は、前記問い合わせフィンガープリントの分布に基づいて、前記問い合わせフィンガープリントとある潜在的最良一致候補とが識別モジュール(130)によって同様であると宣言されうる範囲の適応的閾値距離Tを導出するよう構成される。閾値を問い合わせおよび/または候補フィンガープリントから導出される統計的データに依存しうるよう設定することによって、他人受入率FARの改善が達成されうる。 (もっと読む)


61 - 62 / 62