説明

Fターム[5B075UU06]の内容

検索装置 (67,127) | 用途 (6,943) | 文書管理装置(ワープロなど) (1,105) | 文書ファイル (854)

Fターム[5B075UU06]に分類される特許

161 - 180 / 854


【課題】同一の文書ファイルの重複登録を防止して、記憶容量を節約し、かつ改版のあった文書ファイルをその関連性とともに記憶装置に記憶させることによって、改版の有無、類似性の度合いを容易に確認可能な文書管理装置を提供する。
【解決手段】文書管理装置は、文書ファイル記憶部と、登録要求受付部と、判定基準情報を記憶する判定基準記憶部と、登録対象ファイルと同一である同一文書ファイルまたは類似する類似文書ファイルが文書ファイル記憶部に存在するか否かを判定する判定部と、登録対象ファイルを類似文書ファイルとの関連情報とともに文書ファイル記憶部に記憶させる登録処理部とを備える。 (もっと読む)


【課題】互いに内容が類似しているファイルの組をより適確に検出できるようにする。
【解決手段】各ファイルを所定数の構成セグメントに均等サイズに分ける切り分け位置を仮定し、仮の切り分け位置から前方または後方に連続するデータを読んで特定のパターンを検出した箇所を正式な切り分け位置として決定するとともに、その切り分け位置でファイルを切り分けてなる各構成セグメントのハッシュ値をそれぞれ算出する。一のファイルと他のファイルとの類否判断を行うにあたっては、一のファイルに係る構成セグメントの固有値と、他のファイルに係る構成セグメントの固有値とを各セグメント毎に順次比較し、固有値が一致する構成セグメントの個数または割合を計数する。固有値が一致する個数または割合が高いほど、類似の度合いが高いということになる。 (もっと読む)


【課題】検索の漏れをなくしつつ、適切な検索結果を与えることのできる検索技術を提供する。
【解決手段】検索に使用する索引を構築する際に、1つの文書を形態素解析とNグラム方式の2つの方式によってトークン分割し、複数のトークン分割結果より全トークンの境界を計算し、各トークンの出現位置情報と次に続くトークンの出現位置情報を計算し、索引付けを行う。次に、コンピュータ・システムは、元文書の復元およびヒット位置の強調表示のために、複数のトークン分割結果から算出した全トークン境界からなるトークン列を保管する。この時、各トークンの開始位置番号、終了位置番号と共に保管する。検索にあたっては、ユーザーが入力した検索語をそれぞれのトークン分割方法によって分割し、出来上がったトークン列をORで結合して検索を行う。これによってどちらかのトークン列が一致した場合には検索結果に含まれるため、検索漏れを防ぐことができる。 (もっと読む)


【課題】 類似性が高い他の利用者の文書検索状況および閲覧状況を検索結果に反映し、利用者が最近必要としている情報を効率的に検索することができる文書検索システムを提供する。
【解決手段】 文書検索サーバ100により、利用者がキーワードを入力して文書のキーワード検索を行う際、利用者の認証情報から利用者の所属グループを特定し、利用者から入力されたキーワードによる文書の検索結果を、利用者の所属グループおよび前記所属グループの類似グループ内における、キーワードの使用回数と、キーワードの使用時期と、キーワードの使用グループと利用者の所属グループとの類似度と、文書の閲覧回数と、文書の閲覧時期と、文書の閲覧グループと利用者の所属グループとの類似度と、に基づいて算出された重み付け値に基づいて並び替える。 (もっと読む)


【課題】企業のファイルサーバ中の文書数増加を軽減するファイルサーバ運用支援技術を提供する。
【解決手段】ファイルサーバ運用支援装置中の運用支援サーバ104は、利用者の指示でファイルサーバから削除した文書を一時的に保管しておく削除文書格納領域217を備える。検索サーバ105は、ファイルサーバ中の文書を検索可能とするために文書のメタデータを記録するメタデータDB106と、文書ファイルのテキストデータである検索インデックスを記録するインデックスDB107と、を備える。運用支援サーバ104は、その中に、検索画面表示部201と、メタデータ編集画面表示部202と、保管期間判定部203と、類似文書判定部204と、検索クエリ作成部205と、検索結果表示部206と、文書リスト出力部207と、検索結果のファイルを削除するための文書操作部208と、を有して構成される。 (もっと読む)


【課題】従来の情報処理システムにおいては、クライアント装置−サーバ装置間の通信の際に機密情報が漏洩する可能性があるという課題があった。
【解決手段】サーバ装置と1以上のクライアント装置を備える情報処理システムであって、サーバ装置は、クライアント装置からのリクエスト情報に含まれるキーワードに対応付けられた定型文情報を検索し、その結果であるレスポンス情報をクライアント装置に送信し、クライアント装置は、サーバ装置にキーワードを含むリクエスト情報を送信し、そのリクエスト情報に対するレスポンス情報を受信することで説明文情報を取得し、その説明文情報を含む特許出願に関する情報である特許出願文書を作成する情報処理システムにより、クライアント装置において蓄積している最低限の情報のみをサーバ装置に送信することで、機密情報の漏洩を防ぐことができる。 (もっと読む)


【課題】優先度の高い第1の特徴量による類否判断の結果を優先するが、類似度が最高である画像とそれ以外の画像との間に明らかな差異が生じた場合にその特徴量による結果を採用する。
【解決手段】類似度算出部140は、新規スタンプ画像から抽出された特徴量と、複数の登録スタンプ画像の各々から抽出された特徴量との類似度を、特徴量の種類毎に算出する。判断部150は、閾値以上となる類似度が算出された特徴量のうち、優先度が最も高いものについて閾値以上の類似度が2以上算出されると、その中で最高の類似度とそれ以外の類似度との差異が決められた大きさを超えるか否かを判断する。出力部160は、或る優先度が設定された特徴量について閾値以上となる類似度が1つだけ算出されたか又は判断部150の判断が肯定的であればその特徴量を採用し、判断が否定的であれば、それよりも優先度の低い特徴量を採用して、類似度順に登録スタンプ画像を表示する。 (もっと読む)


【課題】高い信頼性で未知文字列から単語を特定する技術を提供する。
【解決手段】形態素解析用辞書を具備する形態素解析装置1は、文章に係る文章データを含む学習データを用いて、文章から1以上の文字から構成される文字列を抽出し、文章内において文字列の前後に出現する1以上の文字から構成される文字列の分布を集計した文字集計データを生成する文字列集計部110と、文字列集計部110によって生成された文字列集計データに基づいて、未知の文字列である未知文字列を2以上の単語に分割する際の境界を推定するとともに、境界にて未知文字列を分割した各単語を抽出する単語境界推定部20と、単語境界推定部20によって抽出された各単語の品詞を推定し、品詞属性を有する品詞付単語を生成する品詞推定部20と、品詞推定部20によって生成された品詞付単語を形態素解析用辞書に登録する辞書登録部30とを備える (もっと読む)


【課題】ユーザの操作にかかる負荷を減少させると共に、ユーザが所望する文書情報を容易に得ることを支援可能な情報検索技術を提供する。
【解決手段】固有表現抽出部202は検索文から抽出したキーワードの属する固有表現クラスを取得し、検索文解析部203は検索文からキーワード及び手がかり表現を取得する。固有表現知識格納部204は固有表現クラス及び手がかり表現を固有表現クラス拡張知識蓄積部205に記憶させる。検索部206は固有表現クラス、キーワード及び手がかり表現を用いて、内部文書データベース209を検索し、該当する番組情報が存在しない場合、キーワード及び共起語探索部208が検索した共起語を用いて、内部文書データベース209を検索する。固有表現クラス拡張部207は固有表現クラスを拡張し、共起語探索部208は、キーワード及び拡張された固有表現クラスとの共起語を内部文書データベース209において検索する。 (もっと読む)


【課題】データベースを構成する情報のうち、提供元情報と意味的に合致する情報を出力する処理を、手作業によるデータ作成作業なしに行うことができる、意味的対応付け装置を提供する。
【解決手段】提供元情報が示す情報要素キーワードと、比較対象情報が示す情報要素定義の合致率を算出し、該合致率が定義情報合致率の閾値以上であるかを判定する。そして、意味的対応付け装置1は、提供元情報が示す情報要素キーワードと、比較対象情報が示す情報要素定義の合致率が定義情報合致率の閾値以上である場合には、それら合致率の算出に用いた提供元情報と比較対象情報との組を抽出する。そして、意味的対応付け装置1は、提供元情報と組で抽出された指定された比較対象情報を、提供元情報に意味的に対応する情報として出力する。 (もっと読む)


【課題】情報の更新時に再インデックス化に要する時間を短縮できる情報検索システム、再インデックス化処理方法およびプログラムを得ること。
【解決手段】特定項目抽出手段15は、特定項目更新有無判別手段14で検索の対象となる情報の属性における特定項目のみの更新が行われたと判別したときその特定項目についてインデックス情報抽出手段11を用いてインデックスを抽出する。検索インデックス更新手段16は、抽出した特定項目についてのインデックス情報のみを検索インデックスにおける記憶領域の配置関係を固定した状態で更新する。 (もっと読む)


【課題】目的文書と強い関連性を有する電子文書を抽出する類似文書検索システム、方法及びプログラムを提供すること。
【解決手段】入力された検索語との関連性に基づいて電子文書を検索する電子文書検索システムは、検索語の入力を受け付ける検索語受付手段と、複数の電子文書を蓄積する電子文書蓄積手段と、複数のキーワードを記憶するキーワード記憶手段と、電子文書蓄積手段に蓄積された電子文書から複数のキーワードを検索するキーワード検索手段と、複数のキーワードのうち所定の二つのキーワードが一つの電子文書内に同時に出現する関連度を算出する関連度算出手段と、関連度算出手段により算出された関連度を記憶する関連度記憶手段と、関連度記憶手段に記憶された関連度に基づいて検索語に対応するキーワードを決定し、決定したキーワードを含む電子文書を検索する関連電子文書検索手段と、を備える。 (もっと読む)


【課題】ユーザの統合操作から当該ユーザの意図を推定することで、ユーザの意図に沿ったカテゴリ構造を作成し、統合カテゴリに属する文書を再分類することを可能とする。
【解決手段】カテゴリ統合部32は、ユーザによって指定された複数のカテゴリを1つの統合カテゴリに統合する。ユーザ意図推定部321は、ユーザによって指定された複数のカテゴリのカテゴリ名に含まれる単語毎に、ユーザによって指定された複数のカテゴリのカテゴリ名のうち当該単語を含むカテゴリ名の数に基づいて注目度を算出する。ユーザ意図推定部321は、算出された注目度が高い単語を注目語として推定する。子カテゴリ分類部322は、推定された単語と統合カテゴリに属する文書に含まれる単語との共起頻度を算出する。子カテゴリ分類部322は、算出された共起頻度に基づいて、統合カテゴリに属する文書を当該統合カテゴリの下位に位置する子カテゴリに分類する。 (もっと読む)


【課題】 強力なセキュリティとプライバシ保護をもたらし、簡単かつ手軽に更新を実行できる多レベル索引を生成して使用するための方法と装置を提供する。
【解決手段】 本発明は、暗号文の索引付けと検索の方法および装置を提供する。暗号化ファイルに関して、複数レベルの索引が生成される。主索引の各項目は、主索引項目識別子と、関連するファイルの主索引付け情報の暗号文とを含む。各主索引付け情報は、関連する副索引項目識別子の識別子と、対応する復号情報とを含む。副索引の各項目は、副索引項目識別子と、副索引付け情報の暗号文とを含む。ファイルの取得に必要な情報は、対応する副索引付け情報に含められる。復号された主索引付け情報に含まれる副索引付け情報の復号情報を使用して、関連する副索引付け情報の暗号文が復号され、ファイルの復号キー等の情報が取得される。 (もっと読む)


【課題】複数の文書間における類似状況の確認を支援する。
【解決手段】本発明の一実施の形態である文書比較装置30は、被験文書を取得する被験文書取得部32と、その被験文書と関連する基礎文書を取得する基礎文書取得部34と、被験文書からそのテーマとの関係において特徴的な文字列を特徴文字列として取得する特徴文字列取得部40と、特徴文字列を基礎文書の中で検出する特徴文字列検出部42と、特徴文字列の検出結果に応じて、被験文書と基礎文書とが類似するか否かを判定する類似判定部44と、その判定結果をユーザに通知する判定結果通知部46とを備える。 (もっと読む)


【課題】検索文の内容を適切に反映して文書データを検索すると共に、順次追加される文書データから適切に問題発生を検出する。
【解決手段】複数の文書データから、検索文の内容を含む文書データを検索する検索システムであって、複数の文書データを記憶する文書データベースと、階層構造により複数の概念を記憶する概念データベースと、それぞれの文書データに含まれるキーワードに基づいて、当該文書データに対応する文書概念を抽出する文書データ概念抽出部と、検索文に含まれるキーワードに基づいて検索文概念を抽出する検索文概念抽出部と、複数の文書データのそれぞれのうち、検索文概念が文書概念の上位階層又は下位階層の概念となる文書データを検索する概念検索部と、概念検索部により検索された文書データを、検索文により指定される内容を含む文書データとして出力する検索結果出力部とを備える検索システムを提供する。 (もっと読む)


【課題】利用者が真に必要とする検索結果文書のスコアを高くし、不適合文書のスコアを低くすることができるようにし、労力及び維持コストの軽減化を達成でき、かつ、記憶装置及び計算装置資源の削減化も図る。
【解決手段】提供される検索結果文書のスコアリングシステムは、利用者の今回の検索要求に対する応答として、文書検索部1から提供される検索結果に列挙された各文書について、利用者の過去の文書選択履歴3からそれぞれ生成された、第1の統計情報としての、利用者による当該文書選択の発生確率5と、第2の統計情報としての、当該文書を選択する際の今回の利用者又はその検索要求が持つ、少なくとも一の属性情報の条件付発生確率6Aとに基づいて、利用者の今回の検索要求に適合する蓋然性の程度を推定し、スコアとして数値化するスコア算出部8Aを備えている。 (もっと読む)


【課題】 オブジェクトをキーワード検索可能な電子文書の生成において、検索時にユーザが識別しやすい強調表現が可能となる電子文書データを作成できるようにする。
【解決手段】 本発明によれば、入力画像から、文字・写真・線画・表などのオブジェクト領域を得て、当該オブジェクトに関連付けるべきメタデータを取得する。透明なグラフィックス記述を生成するように設定されている属性のオブジェクト領域に関して、透明なグラフィックス記述を生成し、透明なグラフィックス記述と対応するメタデータとを関連付けた電子文書を生成する。透明なグラフィックス記述は任意形状の図形の記述を用いることも可能となる。 (もっと読む)


【課題】検索対象を適切に絞り込み処理を高速化する。
【解決手段】本方法は、記憶装置に格納されている入力テキストから自立語を抽出するステップと、抽出された自立語を条件として入力テキストとの類似度が、記憶装置に格納されている類似度閾値以上となる、既存テキスト中の自立語語数の範囲を特定する範囲特定ステップと、自立語語数が自立語語数の範囲内である既存テキストに限定して、記憶装置に格納されている、当該既存テキスト中の自立語と抽出された自立語とを用いて当該既存テキストと入力テキストの類似度を算出し、記憶装置に格納する類似度算出ステップと、記憶装置に格納された類似度が類似度閾値以上となる既存テキストを特定するステップとを含む。 (もっと読む)


【課題】コンピュータシステムおいて、フォルダの無駄な増加を抑える。
【解決手段】記憶媒体に記憶されているファイルを1つまたは複数ごとにフォルダに所属させる。同一類似フォルダ検索部61は、第一のフォルダと、第一のフォルダに所属するファイルと同一のファイルがすべて所属しかつ第一のフォルダには所属しないファイルが所属する第二のフォルダとを、検出する。整理処理実行部64は、そのような第一のフォルダおよび第二のフォルダが検出された場合に、第一のフォルダを削除する処理、第一のフォルダを第二のフォルダの下位に移動させる処理、および第二のフォルダを第一のフォルダの下位に移動させる処理のうちのいずれかを実行する。 (もっと読む)


161 - 180 / 854