説明

Fターム[5B075NS10]の内容

検索装置 (67,127) | 二次情報作成 (1,342) | その他 (842)

Fターム[5B075NS10]に分類される特許

101 - 120 / 842


【課題】文字列に対する複数のWebサイトの評価を出力可能な文字列評価装置、文字列評価方法及び文字列評価プログラムを提供すること。
【解決手段】文字列評価装置1は、複数の評価先Webサイトの指定を受け付ける評価先指定部12と、文字列受付部11が受け付けた文字列を形態素分割部13により複数の形態素に分割し、複数の形態素から処理対象の形態素を抽出する形態素抽出部14と、抽出された形態素に対して、評価先指定部12により指定された複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出部15と、検索API呼出部15により呼び出された複数の検索APIの各々を実行して、形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出部16と、スコア算出部16により算出されたスコアと、形態素と、スコアを算出した検索APIとを対応付けて出力するスコア出力部18と、を備える。 (もっと読む)


【課題】従来、関連するウェブページ相互を精度よく特定する技術は存在しない。
【解決手段】ウェブページ関係評価装置30は、複数の判断対象のウェブページそれぞれの作成時刻を検出する作成時刻検出部2と、判断対象のウェブページと他の判断対象のウェブページとの類似度を算出する類似度算出部3と、算出された複数の類似度のうちの基準値以上である類似度それぞれについて、その類似度を算出する際に用いられた2個の判断対象のウェブページを、相互に関連しているウェブページであると特定する関連ウェブページ特定部5とを有する。 (もっと読む)


【課題】商品またはサービスに関連する者から寄せられた見解に代表されるテキスト情報から、商品またはサービスに対する問題点等の予兆を自動検出できる。
【解決手段】記憶手段は、商品等に関連する者による商品等に対する見解に代表されるテキスト情報であって、当該テキストの受付時刻と、当該テキスト64とを含むデータブロックを複数記憶する。テキスト解析手段は、テキスト解析によって、複数のデータブロック65のそれぞれのテキスト同士を比較して、互いの類似度を算出する。グループ生成手段は、テキスト解析手段によって算出された類似度102に基づいて、複数のデータブロックをグループ化により新規グループを生成する。時系列分析手段11は、グループ手段により生成された新規グループ内の複数のデータブロックの受付日を基準として、所定の抽出期間における時系列分析を行う。 (もっと読む)


【課題】ユーザが試行錯誤することなく、効率的に属性の粒度を変更することができるデータマイニングシステムを提供すること。
【解決手段】複数の属性と属性値とを含むデータから属性を選択し、予め記憶する属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した属性の属性値をグループ化するグループ化手段102と、グループ化した属性値と分析対象の属性との関連性の強さを示す検定量を算出する検定量算出手段103と、算出した検定量に基づいて、グループ化した属性値が分析対象の属性との関係において特徴的であるか否かを判定する判定手段104とを含み、グループ化手段102は、判定手段104が特徴的でないと判定すると、分類階層のうち、前回のグループ化で用いた階層よりも上位の階層の分類に基づいてグループ化処理を再度実行することを特徴とする。 (もっと読む)


【課題】個々のデータとそのデータ間の関係を示すグラフにおいて、他データに影響を与える特徴的なプロパティを解析できるグラフ解析装置を提供する。
【解決手段】関連プロパティ特定手段91は、特異性を定量化した値である特異度が付与された1つ以上のプロパティを有するノードと、供給関係を有するノード間を供給元のノードから供給先のノード方向へ向けて接続される少なくとも1組以上のエッジを含むグラフをもとに、エッジに関連するプロパティである関連プロパティを特定する。エッジ評価手段92は、エッジの関連プロパティが他のノードに影響を与えるか否かを評価することによりその関連プロパティを特定する。このとき、関連プロパティ特定手段91は、エッジに接続された両ノードが有するプロパティの共通性とそのプロパティに付与された特異度の大きさとに基づいて関連プロパティを特定する。 (もっと読む)


【課題】
全ての映像コンテンツのジャンルを対象としてリアルタイム編集可能な映像コンテンツのシーンのアノテーション情報付与システムの提供
【解決方法】
映像コンテンツの全てのジャンルのシーンに共通な見出し用語と、これに関連するジャンル別の用語を階層別の辞書とし、この辞書を表示し選択するためのグラフィックユーザーインターフェース部を設け、
これをリモコンの操作ボタン操作により辞書から適切な用語を選択して、文字情報等を付与するとともに、更に高速な操作をするために限定された用語の音声認識機能を持たせ、音声認識で辞書から適切な用語を選択して、文字情報等を付与することを可能にする。 (もっと読む)


【課題】一般の多次元データ分析において、次元の重要度を定義することにより、重要な次元を選択的に提示する。
【解決手段】次元重要度算出部102は、次元データ記録部101に記憶されたn次元のデータから、m(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を処理装置により分析する。次元選択部104は、次元重要度算出部102により算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択する。データ提示部105は、次元選択部104により選択された組み合わせを構成するm次元のデータを出力装置により出力する。 (もっと読む)


【課題】電子データである文書の集合を用いた調査業務等において、ユーザによる文書の閲覧時に、関連する文書を適切に表示することを課題とする。
【解決手段】本発明の関連文書表示システム1000は、文書の集合における過去の文書の作成に基づく関連する文書同士を有効な関連リンクとして関連リンク記憶部(関連リンク管理情報530)に記憶する関連学習制御部223と、その後、ユーザによって文書の集合におけるいずれかの文書が閲覧された場合、関連リンク記憶部を参照して、閲覧された文書と有効な関連リンクを有する文書を抽出し、当該抽出した文書を、閲覧された文書に関連する文書として表示部に表示するレコメンド制御部(proxy部228)と、を有する。 (もっと読む)


【課題】 入力画像文書中のオブジェクトにメタデータを付与する際に、全てのオブジェクトを個別に管理すると、付与するメタデータが増えてしまうことからファイルサイズの増加を招き、検索時に該当する候補が増えてしまうことから検索効率の低下につながる。
【解決手段】 入力文書を領域に分割する領域分割部と、属性情報を付与する属性情報付与部と、文字情報を得るための文字認識部と、オブジェクトをグループ化する際の階層化レベルを算出する階層化レベル算出部と、前記オブジェクトを、同一のキャプションをもつグループで統合し、該グループごとに個別の識別子を生成するオブジェクト用識別子生成部と、付随するキャプションを前記入力文書より検出することで、該オブジェクトに関連するメタデータを抽出し、オブジェクト用識別子とメタデータを関連付けして記憶領域に記憶するメタデータ抽出部を備える。 (もっと読む)


【課題】同じ複数の評価項目についてそれぞれ評価値を有する2つのデータに関する適合度をより精度良く算出できるようにする。
【解決手段】同じ複数の評価項目毎に評価値を有する第1のデータおよび第2のデータからそれぞれレーダーチャートを生成し、第1のレーダーチャートにより表わされる図形の面積をx、第2のレーダーチャートにより表わされる図形の面積をy、両図形が重なる部分の面積をzとして、A=(y/x)×(z/x)なる演算によって第1のデータと第2のデータとのマッチング値Aを算出することにより、評価項目毎の評価値そのものを演算して求めた指標に基づいて2つのデータの適合度を評価していた従来技術と異なり、2つのデータについての適合度をデータの全体像を捉えて的確に評価できるようにする。 (もっと読む)


【課題】管理された複数文書及び版が持つ属性情報及び要約に基づいて、トレンド推移を表示する技術を提供する。
【解決手段】文書変遷抽出装置は、登録対象の文書及びその属性情報を登録する入力手段1と、入力手段1によって登録された複数文書及び版が持つ属性情報及び要約を利用して文書変遷情報の抽出を行う文書変遷抽出手段2と、文書の変遷経緯のトレンド推移をグラフ表示する出力手段3と、を備える。文書変遷抽出装置は、キーワードの登場回数及びスコアを抽出し、文書変遷として蓄積、管理することで、文書や版が持つ時系列情報とあわせて表示し、文書や版の変遷、キーワードのトレンドの可視化を行う。 (もっと読む)


【課題】複数のユーザからネットワークを通じて提供され、ウィキペデイア等の集合知データベースシステム内に登録されている項目に関する情報を処理する際、項目の編集の要否を正確に判定しユーザに通知する。
【解決手段】集合知データベースシステム内の複数の項目について、各項目に関する情報の中から、文章中の用語とリンク先情報を項目の属性として抽出する。抽出された各項目の属性を用いて、2つの項目同士の類似度を算出する。算出した類似度に応じて前記2つの項目に関する情報の統合を促すように通知する。項目の分割については、1つの項目について、項目に関する情報である文章を段落毎に分割し、段落毎の類似度を属性を用いて計算し、この類似度を用いて段落のクラスタ分析を行う。クラスタ数が1より大きい場合、項目のクラスタ単位の分割を促すように通知する。 (もっと読む)


【課題】ウェブサイトに掲載される広告データを配信する際に、ユーザーのサイト閲覧履歴データからユーザーの興味のあるカテゴリーを的確に推定し、ユーザーの興味の高いカテゴリーに関連した広告を配信することで、限られた広告領域を有効活用することのできる広告配信システム、広告配信サーバー、広告配信方法および広告配信プログラムを提供する。
【解決手段】ユーザー興味データ推定部は、ユーザーのサイト閲覧履歴データに基づいてユーザーの興味があるカテゴリーやキーワードを、確度と共に推定する。配信内容選択部は、推定された確度のうち最も高い確度が基準値以上であれば、その確度に対応するユーザー興味データに関する広告データを配信する。また、確度が基準値未満であっても、ユーザーが希望するカテゴリーやキーワードを直接選択させ、そのユーザー興味があるカテゴリーやキーワードに関連した広告データを配信する。 (もっと読む)


【課題】階層的にクラスタリングされたデータ集合に対して、各クラスタを代表するデータを適切に定めることができない。
【解決手段】本発明によるデータ分類装置は、データ集合に含まれる各データを階層的にクラスタリングした階層的クラスタ構造において最下層に属する各クラスタについて、各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定手段3と、最下層代表データ決定手段3が決定した各データのうち、各クラスタ間において中心性の高いクラスタを代表するデータを、最下層より1つ上位の階層に属するクラスタを代表するデータと決定し、さらに、最上層に至るまで、処理対象の階層に属する中心性の高いクラスタを代表するデータを、処理対象の階層より1つ上位の階層に属するクラスタを代表するデータと決定する処理を繰り返し実行する階層的代表データ決定手段4とを備えたことを特徴とする。 (もっと読む)


【課題】作業とその作業が行われる時期とを示す少なくとも1つの情報から特定される、作業とその作業が行われる時期との関係についての特徴のバリエーションの幅を従来よりも広げることができる情報処理装置及びプログラムを提供する。
【解決手段】作業構造情報生成部26が、少なくとも1つの作業情報に基づいて、少なくとも1つの作業要素と、それぞれが作業要素のうちの少なくとも1つに関連付けられている、作業が行われる時期を示す少なくとも1つの時期要素と、それぞれが時期要素のうちの少なくとも1つに関連付けられている、関連付けられている各時期要素に対応する時期を代表する時期を示す少なくとも1つの代表時期要素と、を含む作業構造情報を生成する。特徴情報出力部32が、少なくとも1つの作業構造情報に基づいて生成される、作業とその作業が行われる時期との関係の特徴を表す特徴情報を出力する。 (もっと読む)


【課題】ブログなどのテキストにおいて、そこで記述されている内容を特徴付ける文字列を迅速に抽出する。
【解決手段】テキストが含まれているファイルを記憶するブログデータ記憶部15と、ファイル内のテキストから抽出された文字列を記憶する抽出文字列記憶部19と、ブログデータ記憶部15に記憶されているファイル内のテキストにおいて、少なくとも句読点と、すべてのひらがなまたは所定の除外文字以外のすべてのひらがなとを含む消去文字を空白に置換する置換処理を行う消去文字列処理部173と、消去文字列処理部173によって置換処理が行われた置換処理済みテキストから、空白で挟まれている文字列を抽出し、抽出された文字列を抽出文字列記憶部19に格納する切出し処理部177と、を備える。 (もっと読む)


【課題】クラスタに属する文書群の分類に利用することができる当該文書群の内容を適切に表す代表文を抽出することを可能とする。
【解決手段】特徴文抽出部32は、ユーザによって指定されたクラスタに付与された特徴語を含む特徴文を当該クラスタに属する複数の文書から抽出する。代表文候補抽出部34は、特徴文の構文解析結果および予め定められた抽出ルールに基づいて、当該抽出ルールによって表される複数の自立語間の関係に合致する代表文候補を当該特徴文から抽出する。代表度算出部36は、ユーザによって指定されたクラスタに属する複数の文書における代表文候補抽出部34によって抽出された代表文候補を含む文書の数に基づいて代表度を算出する。代表文決定部37は、代表度算出部36によって算出された代表度に基づいて、代表文候補抽出部34によって抽出された代表文候補を代表文として決定する。 (もっと読む)


【課題】語句に対する世論を反映した印象を容易かつ効率的に収集することができる評価情報入力支援装置、評価情報入力支援方法およびその方法を実行させるプログラムを提供すること。
【解決手段】画像検索装置100は、画像検索機能を備えるとともに、この画像検索機能を利用して、入力されたキーワードに対する印象を表す評価情報を収集するものである。画像検索装置100は、記憶手段として、画像情報データベース101と、印象情報データベース102と、を備え、演算処理手段として、画像を検索して表示させる画像処理部110と、キーワードに対する印象を表す評価情報を収集する印象情報収集部120と、収集した印象ログに基づいて対象コンテンツの印象度を判定する印象度判定部130と、を備えている。 (もっと読む)


【課題】透かし入りコンテンツに対するネットワークサーチを改善する方法及びシステムを提供する。
【解決手段】キーワードサーチを使用して、URL候補の領域を狭め、得られたURLリストを、デジタル透かしを求めてサーチする。顧客は、キーワード又はネットワークの位置を入力する。キーワード又はネットワークの位置情報は、透かしを使用可能なウェブブラウザに提供され、ブラウザが、それらキーワード又はネットワークの位置に関連した位置にアクセスする。この際、複数の分散された透かし使用可能なウェブブラウザを使用する。これらにより、デスクトップサーチ、並びに、自動メタデータ収集及び生成を促進する方法及びシステムを提供する。 (もっと読む)


【課題】指定された位置に対応する情報と同等の概念を有する情報を効率よく抽出可能な抽出規則を作成できる抽出規則作成システムを提供する。
【解決手段】組合せ位置情報作成手段81は、タグ付きテキストと、文字列またはタグの位置を示す3個以上の位置情報と、キー情報とをもとに組合せ位置情報を作成する。単語タグ文字列作成手段82は、その組合せ位置情報に含まれる位置情報が示す位置の単語またはタグを組み合わせた単語タグ文字列をその組合せ位置情報ごとに作成する。単語タグ文字列選択手段83は、評価値を算出して単語タグ文字列を選択する。付属文字列抽出手段84は、タグ付きテキストを文節ごとに分割した単語のうち、位置情報が示す位置の文字列を含む文節分割単語を抽出し、その文節分割単語から、位置情報が示す位置に含まれない付属文字列を抽出する。抽出規則作成手段85は、単語タグ文字列と付属文字列とをもとに抽出規則を作成する。 (もっと読む)


101 - 120 / 842