説明

Fターム[5B075UU06]の内容

検索装置 (67,127) | 用途 (6,943) | 文書管理装置(ワープロなど) (1,105) | 文書ファイル (854)

Fターム[5B075UU06]に分類される特許

841 - 854 / 854


【課題】正解データを用いた機械学習によって得られる情報抽出規則に基づいてテキストから情報を抽出する情報抽出装置で、正解データの作成負担を軽減し、情報抽出精度を向上すること。
【解決手段】拡張対象選択部120が正解データ記憶部110から拡張する正解データを選択し、正解拡張部130が正解データを拡張して拡張データを生成し、妥当性判定部140が規則学習部150に拡張データと正解データを学習させ、抽出部170にテストデータを使って情報抽出を実行させて結果を評価し、評価結果が拡張データの追加前に比べて良くなった場合には、拡張データを正解データとするよう構成する。 (もっと読む)


【課題】認識語彙数が少ない環境においても検索が可能なように、テキスト文書からキーワードを適切に抽出する。
【解決手段】形態素解析が行われたテキスト文書から名詞を抽出する名詞抽出部33と、抽出された名詞に基づいて複合名詞を抽出する複合名詞抽出部34と、抽出された名詞に基づいてカタカナ語を抽出するカタカナ語抽出部35と、複合名詞を複数の名詞に分割する複合名詞分割部36と、連体化助詞「の」が名詞要素で挟まれている場合にこれらの名詞要素を連体化助詞「の」で接続する連体連結部37と、連体連結部37までの処理で得られた各キーワードに関して、特定の条件を満足するものを除去するキーワード絞り込み部38と、キーワード絞り込み部38で絞り込まれた後のキーワードに対し、出現頻度を考慮してさらに絞り込みを行うキーワード相関絞り込み部39と、を設ける。 (もっと読む)


【課題】 カテゴリー分類された文書間の関係を分かり易く表現することを目的とする。
【解決手段】 可視化装置10は、カテゴリー分類された文書群についての文書生成モデルをもとに、文書群に含まれている各文書について、登録済みのカテゴリーに属する確率と、登録済みのカテゴリーに属さない確率とをベクトルで表した事後確率ベクトルを推定する。また、可視化装置10は、推定した事後確率ベクトルで表された各確率に従って、可視化空間上に、各文書と前記各カテゴリーとの関係を配置する。さらに、可視化装置10は、配置した可視化空間を利用者用端末30に送信する。 (もっと読む)


一般的な情報や、特にインターネット情報の出現は、実際に多くの人々にとって利用可能な情報が増え続けるということを助長しており、その利用者のうちの多くは情報の専門家ではない。情報を組織化し、検索の実行を容易にするための新しくよりよいメカニズムが必要である。本技術は、例えば目的や概念や考えや専門用語やその他というような、一連の登録の組織化の一種を紹介するものである。これは分類の概念化と検索の実行を容易にする。特に、本技術は、情報を組織化するためにさまざまな基準が存在する体系的なカテゴリー化を容易にし、利用者によるその点検や利用を容易にする。
(もっと読む)


【課題】 通信ネットワークを介して中央処理装置に接続された端末装置からの要求により、前記中央処理装置に記録された掲示情報、キーワード又は該キーワードに関するキーワード情報を、前記端末装置に迅速に表示させることができる情報表示方法、中央処理装置及びコンピュータプログラムを提供する。
【解決手段】 中央処理装置10は、端末装置20、20…から送信された日記ページから、日記ページを作成したユーザ名、作成した日付、及び日記ページに含まれるキーワードを関連付けた関連データベース10cを作成し記録する。一方、一の端末装置20からの要求により、中央処理装置10は、関連データベース10cからキーワードを抽出し、前記キーワードに関するキーワードページへのリンクを生成して、要求された日記ページを前記一の端末装置20に表示させる。 (もっと読む)


法律リサーチを促進するために、Thomson Westのような会社は、購読ベースのオンライン情報引き出しシステムを提供する。これらのおよび関連するIRシステムの改善に努め、本発明者は、リサーチャが、彼らにとって有用である得る法律百科事典、および条約等の一部のタイプのドキュメントをしばし、見逃していることを認めた。従って、本発明者は、ユーザクエリによって特別にはターゲットとはされていない他のタイプのドキュメントの自動的な検索を行うシステム、方法、およびソフトウェアを考案した。一例示的なシステムは、法律上の判決理由に対するユーザクエリを、第1および第2のデータベースに自動的に提出する。ここにおいて、第1のデータベースは法律上の判決理由を格納しており、第2のデータベースは、判決理由でないドキュメントを格納している。
(もっと読む)


少なくとも1つのデータ構造を少なくとも1つのデータソースから構築する方法が開示される。そのデータソース及びそのデータソースの少なくとも1つのプレビアスビューの表現が構築される(たとえば、23000)。次いで、この表現から、少なくとも1つの義務的エンティティ(たとえば、「支社」(branch))が識別される。これは、一般に、ユーザ選択によって行うことができる。次いで、この方法では、義務的エンティティと1つまたは複数のコンテキスト・エンティティとを含むデータ構造(たとえば、25000、26000)が構築され、ここで、コンテキスト・エンティティは、その表現とプレビアスビューから得られたコンテキスト・データとから得られる。通常、データソースは階層的であり、データ構造は階層的である。
(もっと読む)


調査対象文書d及び比較対象文書群Pを入力する入力手段1と、調査対象文書d内の索引語を抽出する索引語抽出手段120と、前記抽出された索引語の、比較対象文書群Pにおける出現頻度の関数値IDF(P)を算出する第1出現頻度算出手段142と、調査対象文書dのデータに基づき、比較対象文書群Pの中から調査対象文書dに類似する類似文書群Sを選出する類似文書群選出手段160と、前記抽出された索引語の、類似文書群Sにおける出現頻度の関数値IDF(S)を算出する第2出現頻度算出手段171と、各索引語についての、前記算出された比較対象文書群及び類似文書群における各出現頻度の関数値の組合せに基づき、各索引語とその位置づけデータとを出力する出力手段4と、を備える。これにより、調査対象文書の性格の的確な把握を可能にする。
(もっと読む)


【課題】ユーザーのサーチクエリに応答して、検索エンジンによりもっとも関連性の高い検索結果すなわち品質の高い検索結果をユーザーへ提供すること。
【解決手段】本発明においては、ドキュメントを特定し且つドキュメントに関連付けられた一つ以上のヒストリデータを獲得し、一つ以上のヒストリデータの少なくとも一部に基づいてドキュメントについてのスコアを生成することを特徴とするシステム(125)および方法が提供される。 (もっと読む)


【課題】特許出願又は特許に係る明細書(以下、特許明細書という)を分析する特許明細書分析システムに関し、明細書に含まれる語句を抽出し、その頻度を視覚的に表示し、利用者による明細書の内容把握を容易にすることを課題とする。
【解決手段】語句抽出部5は、明細書文書データ取得部1で取得した特許明細書の文書データ中から、記載されている欄と対応付けて語句を抽出し、語句出現頻度算出部3は、記載欄の重み付けに従って、1以上の欄からなるグループ毎の出現頻度を算出し、出現頻度出力部4により、語句毎の出現頻度をグループ毎に積み上げたグラフとして表示する。 (もっと読む)


【課題】 所望の内部文書がどの文書ファイル内に存在するかを容易に特定する内部文書情報の検索方法などを提供する。
【解決手段】 文書管理手段が、複数の内部文書群を生成し、内部文書群に文書管理ファイルを関連付け、文書データベースに文書管理ファイルのファイル書誌情報と該文書管理ファイルの内部文書の文書書誌情報と本文テキスト情報とを記憶し、ファイル管理手段が、検索条件の入力を受け付け、中継手段が、検索条件を文書管理手段へと転送し、文書管理手段が、検索条件に基づいて文書管理ファイルのファイル書誌情報と内部文書の文書書誌情報と本文テキスト情報とを検索し、合致する文書管理ファイルを検出し、検出文書管理ファイルのファイル書誌情報と検索結果データとをファイル管理手段へと送信し、ファイル管理手段が、受信したファイル書誌情報と検索結果データとを出力する。 (もっと読む)


【課題】 文書検索の処理速度向上を図った文書検索処理装置を提供する。
【解決手段】 CPU101により、文書を特徴付ける文書ベクトルを生成し、文書ベクトル間から文書間の文書類似度を生成し、文書と独立して存在する複数の基準ベクトルと文書ベクトルとの類似度を生成し、前記文書ベクトルを用いて前記文書類似度によって類似文書を検索すると共に前記基準類似度をも用いて検索を行うように制御する。 (もっと読む)


【課題】ユーザが任意に作成可能な情報ノードを用いて文書を管理し、情報ノードに文書をリンクさせ、ユーザの意図する文書を自由自在に捜し出せる機能を提供する。
【解決手段】分類観点である情報ノードを階層的に構成600し、文書とリンクする。これら情報ノードの階層から情報ノードを選択し、文書を絞り込みユーザの必要な文書を自由自在に捜し出す。捜し出した文書に対して情報ノードの管理するデータに従いAPを起動させたり、また属性検索や全文検索を実行することが可能である。 (もっと読む)


【課題】自然言語検索機能を有しない既存のデータベースに対する自然言語検索を実現する自然言語検索支援システムを提供する。
【解決手段】登録部11は、自然言語検索機能を有しない既存データベースAのデータの中から抽出スキーマファイル14で定義された部分のみを抽出し、既存データベースAにおける参照先であるURLとともに自然言語解析部12に引き渡す。自然言語解析部12は、そのデータを自然言語解析し、その解析結果とURLとを対応づけてインデックスデータベース15に格納する。その後、ブラウザBを介して自然言語による検索文が入力されると、自然言語解析部12は、この検索文を自然言語解析し、その解析結果を基にインデックスデータベース15から対応するURLを取得する。そして、ブラウザBは、自然言語解析部12により取得されたURLを用いて既存データベースAのデータを参照する。 (もっと読む)


841 - 854 / 854