説明

Fターム[5B075UU06]の内容

検索装置 (67,127) | 用途 (6,943) | 文書管理装置(ワープロなど) (1,105) | 文書ファイル (854)

Fターム[5B075UU06]に分類される特許

121 - 140 / 854


【課題】文書管理装置と情報処理装置とがネットワークを介してデータ通信可能に接続された文書管理システムにおいて、情報処理装置が保持する文書データを更新する際に、更新の必要性の有無を判断するために行われる文書データの同一性判別処理を効率よく行うことで、文書管理システムのパフォーマンスの低下を回避する。
【解決手段】情報処理装置11とネットワークを介してデータ通信可能に接続され、複数の文書構成要素からなる文書データを共有して管理する文書管理装置1は、送信対象の文書構成要素の内容に対応したハッシュ値を生成し、更にハッシュ値を統合して統合ハッシュ値を生成し、情報処理装置11で保持される文書データが利用される際に、これらハッシュ値・統合ハッシュ値の比較によって文書データの同一性判別を行う構成である。 (もっと読む)


【課題】自由回答形式の記事(ドキュメント)を解析する。
【解決手段】文書解析装置10では、コンピュータ14が、昇順の累積特異値ΣD(i,ord,asc)および降順の累積特異値ΣD(i,ord,dsc)の相加平均、つまり平均累積特異値aveΣDを計算する。平均累積特異値は、代表キーワード値ということもでき、この代表キーワード値が自由回答形式の記述(記事:単位ドキュメント)の評価の1つの指標となる。さらに、特定上位の昇順累積特異値総和ΣΣD(j,ord,asc,rank)および降順累積特異値総和ΣΣD(j,ord,dsc,rank)を採用した上で、その記事(自由回答記述)がどの程度代表的な記事かを示す平均累積特異値総和aveΣΣD(j,ord,rank)および/または、その記事がどの程度特異的な記事かを示す差分累積特異値総和diffΣΣD(j,ord,rank)を求める。 (もっと読む)


【課題】不要語辞書を効率的に作成し、かつ、抽出もれの少ない強化語リストを作成する。
【解決手段】対象トピック観点と、テキストの中で対象トピック観点について記述されている範囲とから、対象トピック観点に対応する具体表現辞書に登録する可能性のある候補のリストである「候補語リスト」を作成する。具体表現辞書と係り受けルールとを使って、具体表現辞書に登録されている単語を含む2単語の係り受け関係を抽出し、係り受け関係を基に不要語を抽出するためのルールを作成し、具体表現辞書に登録されていない単語を不要語として抽出し、不要語辞書に格納する。対応する候補語リストと、対応する不要語辞書とをつきあわせ、候補語リストから、不要語辞書に登録されている単語を削除し、削除されなかった単語は強化語リストに追加する。対象トピック観点に対応する強化語リストを対応する具体表現辞書に追加する。 (もっと読む)


【課題】精度のよい検索を実現する。
【解決手段】検索条件を受け付ける受付部と、少なくとも一つの記憶装置に格納されたコンテンツに含まれるエモチコンを抽出し、抽出されたエモチコンと自然言語との対応関係を解析する解析部と、解析部の解析結果に基づき、抽出されたエモチコンが対応する自然言語を有する場合には抽出されたエモチコンを対応する自然言語と認識し、抽出されたエモチコンが対応する自然言語を有しない場合には抽出されたエモチコンが装飾目的で用いられていると認識し、抽出されたエモチコンが検索条件に適合すると判断した場合に、コンテンツを検索結果として出力する検索部とを備える。 (もっと読む)


【課題】適切なクエリを効率よく生成する情報処理装置、そのデータ処理方法、およびプログラム、ならびに、文書検索システム、コールセンターオペレータ支援システム、および会議支援システムを提供する。
【解決手段】情報処理装置は、文書検索に用いるクエリを蓄積するクエリ蓄積部104と、随時入力される文章データを受け付ける受付部110と、受け付けた文章データに、所定のキーワードが含まれているとき、そのキーワードを抽出する抽出部112と、抽出部112でキーワードが抽出される毎に、クエリ蓄積部104を参照し、いずれのクエリにキーワードを追加するか否かを所定の判断基準で判断し、キーワードを追加するクエリを選択またはキーワードを含む新たなクエリを生成する生成部114と、キーワードを追加したクエリまたは生成された新たなクエリを、クエリ蓄積部104に蓄積する更新部116と、を備える。 (もっと読む)


【課題】テキストデータに誤認識文字が含まれている場合であっても、検索漏れを少なくして所望の検索結果を得る。
【解決手段】予め各文字について、誤認識される可能性の高い文字が誤認識文字として記憶された誤認識用データベース23がメモリ16に設けられている。入力部13を通じて検索語が入力されると、CPU11は、その検索語の各文字をデータベース23に記憶された誤認識文字と入れ替えることにより、前記検索語に前記文字入れ替え後の検索語を加えてテキスト検索を行う。これにより、テキストデータに誤認識文字が含まれていても、検索漏れを少なくして所望の検索結果を得ることができる。 (もっと読む)


【課題】 検索したい会議の議事録を効率良く見つけ出すことができる装置を提供する。
【解決手段】 この装置は、新規作成中または編集中の文書データに関するメタデータを、所定のタイミングでログとして記録するデータ記録部11と、データ記録部11に記録された複数の文書データのうちの1つが選択されたことに応答して、当該1つの文書データの指定された時点におけるログに含まれる文字列と、当該1つの文書データ以外の他の文書データの当該指定された時点におけるログに含まれる文字列とを照合し、文字がどの程度異なっているかを表す距離を求め、最も距離が短い文書データを当該1つの文書データに関連する文書データとして検索する検索部10とを含む。 (もっと読む)


【課題】電子化文書をユーザが容易に、かつ、確実に検索することを目的とする。
【解決手段】電子化文書から認識文字列と、認識文字列に関連する文字列画像と、を対応付けて抽出し、記憶装置に記憶する抽出手段と、抽出手段で抽出された複数の文字列画像を提示する提示手段と、提示手段で提示された複数の文字列画像からユーザの選択操作に応じて選択された文字列画像に対応する認識文字列を記憶装置から取得する取得手段と、取得手段で取得された認識文字列を検索クエリとして電子化文書を検索する検索手段と、を有することによって課題を解決する。 (もっと読む)


【課題】受け付けた文書を文書群内の版文書とすることができないという問題を解決するようにした画像処理装置を提供する。
【解決手段】画像処理装置の文書群記憶手段は、原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶し、文書群検索手段は、受け付けた文書に対応する文書群を前記文書群記憶手段から検索し、版判定手段は、前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定し、文書群更新手段は、前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群を更新する。 (もっと読む)


【課題】電子文書にその電子文書に関連する情報を検索する検索条件を対応づけ、その検索条件は指定された語と情報毎に関与するユーザに基づいて生成したものとする。
【解決手段】文書管理装置10の文書DB100、タスクDB102、及びWikiDB104は、それぞれ、文書に関連する関連情報の候補となる文書、タスク、及びWikiを記憶する。文書管理部130の検索式生成部132は、キーワードを用いて文書DB100、タスクDB102及びWikiDB104を検索した結果として得られた文書、タスク、及びWikiの内容に関与するユーザの中から、予め定められた規則に従って、処理対象の文書の関係者を選択する。さらに、検索式生成部132は、キーワード及び関係者に基づく条件を含む検索式を生成し、生成した検索式を処理対象の文書に対応づけて文書管理情報DB110に登録する。 (もっと読む)


【課題】各受信者が所望の情報に容易にアクセスすることが可能な技術を提供する。
【解決手段】MFP(送信装置)は、しおり項目の表示欄を有する電子文書ファイルDMを、送信指示対象のデータファイルとして取得する。そして、当該MFPは、電子文書ファイルDMに変更を加えて各送信先RVi(RV1、RV2、RV3)への送信用電子文書ファイルDSi(DS1、DS2、DS3)を作成し、当該送信用電子文書ファイルDSiを各送信先RViに送信する。当該MFPは、送信先RViに関連するキーワード情報が規定された関連性情報に基づいて、送信先RViとしおり表示欄GDの各しおり項目との関連性をそれぞれ判定するとともに、当該関連性に関する各判定結果に基づいて各しおり項目の表示属性情報をそれぞれ決定することによって、送信用電子文書ファイルDSiを作成する。 (もっと読む)


【課題】利用者が自身のファイルへのアクセス時期についての記憶を利用して目的のファイルを見つけることができるようにする検索装置、検索方法、及びプログラムを提供する。
【解決手段】検索装置1は、利用者が対象ファイルにアクセスしたアクセス時刻及び格納場所をアクセス履歴として収集する履歴収集部2と、対象ファイルからを抽出したキーワードの対象ファイルでの出現頻度を求め、キーワード及び出現頻度を含み、これらが抽出元の対象ファイルに紐付けられたキーワードデータを作成するキーワード抽出部3と、アクセス履歴とキーワードデータとを用いて、キーワードに、対象ファイルのアクセス時刻及び当該キーワードの出現頻度によって値が変動する重みを付加し、キーワード及び重みを含むインデックスデータを作成するインデックス作成部4と、検索を実行し、検索結果に、インデックスデータの内容を反映させる検索実行部5とを備えている。 (もっと読む)


【課題】電子文書を用いてあらかじめ定めた順序に沿って各作業を実行する場合において、そのうちのある作業を実行した際に電子文書の内容が変更されたときに、変更された電子文書と派生関係にある電子文書を用いる作業を矛盾なく実行することができる作業状態管理プログラム及び情報処理装置を提供する。
【解決手段】ワークフロー管理サーバ装置1は、第1の電子文書を用いて各作業を実行することで派生した複数の第2の電子文書間の関係が派生関係にあるか否かを判断する関連作業判断手段10Eと、複数の第2の電子文書に含まれる第3の電子文書の内容が変更されたとき、関連作業判断手段10Eにより第3の電子文書と派生関係にあると判断された第4の電子文書の内容を第3の電子文書の変更内容に基づいて変更する電子文書変更手段102Bと、第3の電子文書及び第4の電子文書を用いる作業の実行状態を変更する作業実行状態変更手段102Cとを有する。 (もっと読む)


【課題】テキストから感性表現と感性空間上の極表現との特定の共起パタンを抽出することにより、数百〜数千の感性表現に対する感性情報の付与を可能とすること。
【解決手段】テキスト解析部1において、入力されたテキストに対してテキスト解析を行い、テキスト解析情報を出力し、感性共起パタン抽出部2において、前記テキスト解析情報と、感性表現を表す単語列の情報を登録した感性表現辞書4と、感性表現と感性空間上の感性軸の極を表す極表現とが特定の関係をもって共起する場合の単語列の正規表現からなる共起パタンを登録した共起パタン抽出ルール5とを用いて、極表現と特定の関係をもって共起した感性表現およびその出現数に関する情報である極単位共起感性表現情報を抽出し、感性特徴量付与部3において、極単位共起感性表現情報を用いて、各感性表現の感性ベクトルからなる感性情報を出力する。 (もっと読む)


【課題】検索システムのシステム構成が変更された場合に、収集済みの文書を効率よく再収集することができるようにする。
【解決手段】本発明に従う文書収集システムは、検索システムのシステム構成情報を格納する第1格納部と、文書収集時における、収集文書の属性情報および第1格納部に格納されているシステム構成情報を文書毎に格納する第2格納部と、検索システムのシステム構成が変更されたことにより文書の強制再収集を実行するときに、収集対象文書の属性情報および第1格納部に格納されているシステム構成情報と、第2格納部に格納されている属性情報およびシステム構成情報とをそれぞれ比較する比較部と、通常は所定のスケジュールに従って文書を収集し、強制再収集の場合には比較部で不一致が検出された文書のみを再収集する文書収集部とを含んでいる。 (もっと読む)


【課題】文書を検索する際にシステム負荷を低減しつつ検索精度を維持することができる装置及び方法を提供すること。
【解決手段】検索装置10は、少なくとも一の文節を含むクエリの入力を受け付け、受け付けたクエリに含まれる単語及び文節を抽出し、抽出した単語により、少なくとも一の文節を含む文書を記憶する文書DB31から、当該単語との関連度が高い文書を抽出し、抽出した文書について、抽出した文節により、当該文節との関連度の高い文書がより上位にリストされるように文書の順位を調整する。 (もっと読む)


【課題】キーワードと関連性の高い文字を含む画像を当該キーワードとの関連性の高い順に並べて出力する。
【解決手段】(1)画像中の文字ごとに当該文字との類似度の高い方から順に所定数の文字候補が類似度の高い順に整列されている文字候補群を記憶している。例えば、画像100中の文字番号1の文字に対する文字候補群は「眼」,「限」,「眠」,…である。(2)文字番号が連続する文字候補群中にキーワードの構成文字が1文字ずつ同順で含まれることを選出条件として、当該選出条件を満たす画像ごとに、各文字候補群中における各構成文字の順位の合計スコアを算出する。例えば、キーワード「眼精疲労」,「疲れ目」,「眼病予防」との関係で、画像100の合計スコアはそれぞれ4,4,7となる。(3)各画像がキーワードに対する合計スコアの昇順に配置されるように検索結果ページを生成する。 (もっと読む)


【課題】キーワードと関連性の高い文字を含む画像を当該キーワードとの関連性の高い順に並べて出力する。
【解決手段】(1)画像内で一定の範囲を占める領域中の文字ごとに当該文字との類似度の高い方から順に所定数の文字候補が類似度の高い順に整列されている文字候補群を記憶している。例えば、領域110の1番目の文字に対する文字候補群は「眼」,「限」,「眠」,…である。(2)連続する文字候補群中にキーワードの構成文字が1文字ずつ同順で含まれることを選出条件として、当該選出条件を満たす領域ごとに、各文字候補群中における各構成文字の順位の合計スコアを算出する。例えば、キーワード「眼精疲労」,「疲れ目」,「眼病予防」との関係で、領域110,120,130の合計スコアはそれぞれ4,4,7となる。(3)各領域に対応する画像がキーワードに対する合計スコアの昇順に配置されるように検索結果ページを生成する。 (もっと読む)


【課題】対象とする文書内で構文が類似していない文にまで類似している文を有する文書を検索してしまうことを抑制するようにした情報処理装置を提供する。
【解決手段】情報処理装置の文書記憶手段は、文書を記憶し、文抽出手段は、対象とする文書から文を抽出し、文集合生成手段は、前記文抽出手段によって抽出された文の構文に基づいて、該文の集合を生成し、類似文検索手段は、前記文集合生成手段によって生成された文の集合内の第1の文と類似する第2の文を前記文書記憶手段に記憶されている文書内の文から検索し、関連文書検索手段は、前記類似文検索手段によって検索された第2の文に基づいて、前記対象とする文書に関連する文書を前記文書記憶手段から検索する。 (もっと読む)


【課題】文書検索装置において、データ量を減少させると共に、文書修正時のインデックスの再作成時間を減少させる。
【解決手段】文書データを入力するためのデータ入力部1と、文書データから転置インデックスを作成するインデックス作成部2と、転置インデックスを記憶する転置データ蓄積部3と、検索のためのキーワードを入力するための検索キーワード入力部4と、入力されたキーワードを転置インデックスと照合し、キーワードと一致する文字列を検出する検索部5と、文字列を含む文書データの情報を出力する検索結果出力部6と、文書データの修正要求を受付けるデータ修正入力部7と、修正要求に基づいて、転置インデックスを修正するデータ修正反映部8とを備え、転置インデックスは、インデックスキーと各々のインデックスキーに対応する転置データを含み、転置データは、チェーン型のポインタリストになっている。 (もっと読む)


121 - 140 / 854