説明

Fターム[5B075QM08]の内容

検索装置 (67,127) | 一致検出処理 (2,566) | 曖昧一致 (2,188) | 類似度/一致度 (1,166)

Fターム[5B075QM08]に分類される特許

141 - 160 / 1,166


【課題】 インターネット上の文書から、正当な引用を行なっている文書を含めたオリジナルな文書の抽出を可能にする。
【解決手段】 複数の文書に含まれる文字列から、この文字列の一部をなす部分文字列を文書毎に生成する部分文字列生成手段と、前記部分文字列生成手段により生成された前記部分文字列の内、自らが生成された文書以外の文書に含まれない部分文字列を一意部分文字列として判定する一意部分文字列判定手段と、文書毎の総部分文字列数と前記一意部分文字列判定手段により判定された前記一意部分文字列数との比が所定の範囲にある文書を不要文書として検出する不要文書検出手段とを備える。 (もっと読む)


【課題】検索対象画像内でテンプレート画像と類似している画像領域を検索する場合に、検索対象画像内でテンプレート画像と類似している画像領域を高速に検索することができる画像検索装置を提供する。
【解決手段】画像検索装置が、テンプレート画像の各画素に対して複雑さを示す指標値を算出する指標値算出部と、テンプレート画像を複数の画像領域に分割した場合に、当該分割された複数の画像領域における指標値の合計値がそれぞれ等しくなるように、算出された指標値に基づいてテンプレート画像を複数の画像領域に分割する画像分割部と、画像分割部で分割したテンプレート画像の複数の画像領域と当該複数の画像領域それぞれに対応する検索対象画像内の画像領域とに基づいた類似尺度により、検索対象画像内でテンプレート画像と類似している画像領域を検索する画像検索部と、を備えている。 (もっと読む)


【課題】大量のショートリードの中から、高速に、編集距離が所定の範囲内にあるショートリードのペアを探索することができる配列解析装置を提供する。
【解決手段】配列解析装置10は、複数の塩基配列を入力する配列入力部11と、編集距離dとブロック分割数を決定する数値nまたは分割数(d+n)を入力する条件入力部12と、複数の塩基配列の各々を(d+n)個に分割してブロックを生成し、その中から選んだn個のすべてのブロックについて、読み出した部分配列、または、前記編集距離dによって定まる最大オフセットの範囲内で、読出し範囲を特定する窓枠を当該ブロックからオフセットさせて読み出した部分配列が一致する条件を満たす塩基配列の集合を等価クラスとする等価クラス生成部13と、等価クラス生成部から、塩基配列のペアについて、編集距離を計算し、編集距離d以内であると計算されたペアを示すデータを出力する類似判定部14とを備えた。 (もっと読む)


【課題】画像中のメインの被写体である代表文字列領域に対して、代表文字列領域以外の文字列情報を欠落させずに再利用する。
【解決手段】代表文字列領域抽出手段が、入力された画像から当該画像の中央に位置し、所定の大きさを有する文字領域である代表文字列領域を抽出する代表文字列領域抽出工程と、非代表文字列領域抽出手段が、入力された前記画像において、前記代表文字列領域の外にある文字領域である非代表文字列領域を抽出する非代表文字列領域抽出工程と、関連付け手段が、前記非代表文字列領域抽出工程において抽出された前記非代表文字列領域それぞれを、前記非代表文字列領域と前記代表文字列領域のそれぞれの消失点の位置関係に基づいて、前記代表文字列領域に関連付ける関連付け工程と、保持手段が、前記関連付け工程において関連付けられた前記代表文字列領域と前記非代表文字列領域の情報を保持する保持工程とを有する。 (もっと読む)


【課題】世の中で注目されている人物や事象を含む番組を優先的に検索し、提示することのできる番組検索装置および番組検索プログラムを提供する。
【解決手段】番組検索装置は、事典データの更新頻度を表す更新頻度データを事典データの見出し語に対応付けて取得する更新頻度データ取得部を備える。特徴量抽出部は、更新頻度データ取得部が取得した更新頻度データのうちの当該番組の番組情報に含まれる表現に対応付けられた更新頻度データに基づき、番組ごとの特徴量を計算する。そして、関連度計算部は、番組の特徴量と、指定された他の番組に関して計算された特徴量とに基づき、前記番組と前記他の番組との間の関連度を計算する。このようにして計算された関連度に基づき、得られる結果を検索結果として提示する。 (もっと読む)


【課題】放送されている番組に関連する情報を含む適切なコンテンツを選択する情報選択装置を提供する。
【解決手段】情報選択装置は、番組とともに放送されている該番組の内容を表す字幕情報を受信し、受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索し、複数の検索条件ごとに、検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、複数の検索条件からいずれか一つの検索条件を選択し、選択した検索条件を用いて検索されたコンテンツが記憶されている領域を示す位置情報を出力する。 (もっと読む)


【課題】
利用者の意図や嗜好に沿った適切な情報を話題に応じて迅速に提供する。
【解決手段】
抽出手段720が、利用者が発話した語句の中からキーワード記憶手段710に記憶されている語句を抽出し、話題語句グループ生成手段730、嗜好リスト生成手段740、拡大嗜好リスト生成手段750及び提示手段790へ送る。話題語句グループ生成手段730では、抽出語句が意図キーワード、対象キーワード及び属性キーワードのいずれかである場合に、話題語句グループを作成する。検索手段770は、話題語句グループの対象キーワードが特定されたときに話題関連情報の検索処理を行うとともに、属性キーワードが追加されて更新されたときに話題関連情報の検索処理を行う。そして、提示手段790が、抽出語句が検索指示キーワードである場合に、話題関連情報から提示すべき情報を選択し、情報を利用者に提示する。 (もっと読む)


【課題】顔が類似する別々の被写体がそれぞれに含まれる各々の画像のデータを別々のグループに精度良く分類すること。
【解決手段】顔検出部61は、対象画像内の顔領域を検出する。年齢認識部62は、顔領域に基づいて、対象画像内の被写体の年齢を認識する。類似画像検索部63は、複数の既存画像のデータの中から、検出された顔領域に類似する顔領域を有する既存画像のデータを、類似画像のデータとして検索する。年齢確認部64は、被写体の年齢が、第1範囲内であるか否かを確認する。日付比較部65は、被写体の年齢が第1範囲内であると確認された場合に、対象画像のデータの撮像日付と類似画像のデータの撮像日付との差分時間を求め、当該差分時間と第2範囲とを比較する。分類手段は、日付比較部65により比較された結果、差分時間が第2範囲内である場合、対象画像のデータを、類似画像のデータが属するグループと同一グループに分類する。 (もっと読む)


【課題】ユーザの操作に対応して、ユーザの操作を適切に予測して、予測した操作をユーザにより一層分かりやすい形で提示するユーザ・インターフェース装置の実現。
【解決手段】入力された操作情報が所定の操作条件を満たした時に、操作情報に関連する情報を抽出し、操作履歴として記憶する操作履歴抽出部11と、操作履歴からキーワードを抽出して操作キーワードとして記憶する操作キーワード抽出部12と、操作履歴を、所定のグループ化条件に基づいて操作履歴グループとしてグループ化し、操作履歴グループごとに操作キーワードに基づいてインデックスを生成する操作インデックス生成部13と、最新の操作情報を含む操作履歴に関連するインデックスとを比較することにより、最新の操作情報に関連する操作履歴グループを検出する操作検索部14と、検出された操作履歴グループを表示する操作表示部15と、を有する情報処理装置。 (もっと読む)


【課題】特定の遺伝子配列上の改変に基づくのではなく、より汎用的にゲノムの構造を解析して、染色体再編成の変遷及び不安定領域を推定することが可能な、情報処理装置、情報処理方法及びプログラムを提供すること。
【解決手段】本発明に係る情報処理装置は、一つ以上の文字からなる文字列を表す文字列データを取得するデータ取得部と、前記データ取得部によって取得された前記文字列データを解析して、当該文字列データが表す文字列内における相同する文字列断片を抽出し、抽出した相同する文字列断片の存在位置及び相同関係に応じて系統解析を行う系統解析部と、を備える。 (もっと読む)


【課題】音響データが独自性を有するか否かを示すデータベースを生成するシステムを提供する。
【解決手段】音響データと当該音響データを使用する使用者の独自性との関係を示す音響−独自性データベースを生成する音響−独自性データベース生成システムにおいて、音響−使用者データベースに基づいて、音響区間を使用する使用者の数を特定し、特定された使用者の数が所定値よりも小さければ、当該音響区間に独自性が有ると判定し、当該判定結果を前記音響−独自性データベースに登録する音響−独自性データベース生成システム。 (もっと読む)


【課題】様々な形式で記述された日時表現に対して文書の内容に関連する重要な日時表現か否かを判定可能とする。
【解決手段】入力された電子文書を文に分割し(S201)、分割された各文を単語に分割する(S202)。日時表現に該当する単語列のパターンが記述された日時表現辞書を参照して、入力された電子文書を構成する各文の単語列パターンから日時表現を特定する(S203)。日時表現の表記パターン、該日時表現の前後に出現する単語、該日時表現の文書中での出現位置に基づき該日時表現の文脈中の用いられ方を表す日時表現文脈ベクトルを求める(S204)。日時表現文脈ベクトルを、事前の学習で作成した日時表現の重要・不要を判定するための重要日時表現判定モデルに応じて分類し、日時表現が重要か否かを判定する(S205)。 (もっと読む)


【課題】文書間の類似性を文書に含まれる話題の重要度を加味して判定することより、従来より信頼性に優れた類似文書検索を可能とする。
【解決手段】1以上の参照文書から複数の話題カテゴリを抽出し、各参照文書における話題カテゴリの共起関係から各話題カテゴリの重みを求めた上で、重み付けられた話題カテゴリごとの標本文書と参照文書との類似度を求め、これを全ての話題カテゴリについて足し合わせることにより、標本文書と参照文書との類似度を得る。 (もっと読む)


【課題】 インターネット回線を利用した映像配信サービスにおいて、適切に番組等の作品を推薦する。
【解決手段】 本発明は、作品情報及びWWW上の百科事典を取得し、作品情報中の作品のタイトルに基づいて、WWW上の百科事典中に該当する項目を取得し、作品情報中の全ての2つの作品の組合せについて該WWW上の百科事典中に該当する項目の類似度から作品間の類似度を算出し、作品に対する各ユーザの視聴履歴を取得し、取得した視聴履歴からユーザと、作品情報記憶手段中に情報が格納されているすべての作品とについて、該ユーザの視聴履歴と、作品類似度とを用いて、該ユーザに対する該作品の推薦スコアを算出し、各作品に対して、推薦スコア記憶手段に格納されている推薦スコアを取得し、推薦スコアの上位N件の作品の識別子を推薦作品として選択する。 (もっと読む)


【課題】絞り込みクエリを含まないメインクエリのみが入力される検索ログも分析対象として関連する情報を抽出し、ユーザ端末から受け付けた検索クエリに対してユーザの意図を適切に反映した情報を自動的に提供すること。
【解決手段】クエリサジェスチョン提供装置(1)は、検索クエリ及び再検索クエリを含む一連の検索操作を示す検索ログを参照して、一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出する。このとき、クエリサジェスチョン提供装置(1)は、一連の検索操作のうちの最終クエリと、他の検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出する。そして、クエリサジェスチョン提供装置(1)は、その後、ユーザ端末(30)から検索クエリを受け付けると、当該検索クエリとの間のスコアの高い検索クエリをユーザ端末(30)に提供する。 (もっと読む)


【課題】所定の部位が類似するワークの形状データを精度よく効率的に検索することができる形状データ検索システム及び形状データ検索方法を提供すること。
【解決手段】形状データ検索システム1は、第1抽出部15により、形状DB11に記憶されている既存ワークWの形状データから、選択部13により選択された基準点Ps、及び範囲指定部14により範囲指定された空間Rsに基づいて、既存ワークWの部分形状データを抽出し、第2抽出部16により、新規ワークWの形状データから、基準点Ps、及び空間Rsに基づいて、新規ワークWの部分形状データを抽出し、第3抽出部17により、抽出された既存ワークWの部分形状データ及び抽出された新規ワークWの部分形状データを比較し、新規ワークWの部分形状データに類似する既存ワークWの部分形状データを抽出する。 (もっと読む)


【課題】 関連するドキュメントに類似するドキュメントを検索する。
【解決手段】
ドキュメント・セットの複数の擬似ドキュメントを生成し、擬似ドキュメントの各々は、ドキュメント・セットへの基本クエリの各々の実行に応じて検索されて取り出されるドキュメント・セットの少なくとも一つのドキュメントの代表情報を含み、ドキュメント・セットの複数のドキュメントの各々について該ドキュメントの各々の代表情報を含む擬似ドキュメントの索引を生成し、ドキュメント・セットの第1のドキュメントの代表情報を含む第1のドキュメント・クエリを受信し、第1のドキュメントと所定の関係を有する少なくとも一つのドキュメントの代表情報を含む少なくとも一つの擬似ドキュメントの第1のセットを識別し、少なくとも一つの擬似ドキュメントの第1のセットにもとづいて結果を生成する。 (もっと読む)


【課題】談話データの構造を解析した結果に基づいて、各業務におけるトークスクリプトの利用状況を算出するトークスクリプト利用状況算出システムを提供する。
【解決手段】談話データ101および談話セマンティクス200を入力とし、トークスクリプトの利用状況300を出力するトークスクリプト利用状況算出システム1であって、談話セマンティクス200は簡約情報61を含み、簡約された談話データ101におけるブロックと各トークスクリプトとの間の類似度を算出し、最も類似するトークスクリプトを類似度情報71として出力する類似度算出部70と、トークスクリプト毎に、簡約された談話データ101における各ブロックのうち、最も類似するものが当該トークスクリプトでありかつ類似度が所定の閾値より高いブロックの数を算出し、対象の応対業務が行われた数に対する利用頻度を算出して利用状況300として出力する利用状況算出部80とを有する。 (もっと読む)


【課題】 適切な鋼種を選択が可能な情報を提供する鋼材設計支援システム、鋼材設計支援方法、及びコンピュータプログラムを提供する。
【解決手段】
鋼材設計支援システム1のサーバ装置2は、クライアント装置3から与えられた要求仕様と一部が一致する要求仕様を含む過去事例を過去事例データベースから検索し、検索した過去事例において適用された鋼種と同一グループに属する鋼種を検索し、検索した鋼種が要求仕様を満足するか否かを判定する。当該判定結果はサーバ装置2からクライアント装置3へ送信され、クライアント装置3が判定結果を表示する。 (もっと読む)


【課題】類似画像画面と非類似画像が含まれる画面との切換えが容易に行うことのできる画像表示装置、画像表示方法、およびプログラムを提供する。
【解決手段】基準画像に類似する画像を検索する類似画像検索部11aと、検索された類似画像を示す類似画像画面を表示させる第1の表示制御部11bと、類似画像画面に示された類似画像85とこの類似画像に所定の順番で連続する非類似画像87とを含み、かつ類似画像85と非類似画像87とを区別して示す拡張類似画像画面を表示させる第2の表示制御部11cと、第1の表示制御部11bおよび第2の表示制御部11cを少なくとも制御して、類似画像画面から拡張類似画像画面に切換える制御部11を備える。 (もっと読む)


141 - 160 / 1,166