説明

Fターム[5B075NK21]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の付与 (670)

Fターム[5B075NK21]の下位に属するFターム

一括付与 (51)
逐次付与 (301)

Fターム[5B075NK21]に分類される特許

21 - 40 / 318


【課題】MapReduce処理システムにおける性能を向上し、通信コストを下げること。
【解決手段】データ処理システム1の統合計画部14は、キー抽出部10を構成するための計算機環境に応じて定義されるキー統合処理の実行粒度についての構成要素ごとにキー統合処理を行うか否かという組み合わせにより実行計画の候補を作成し、作成した各候補を評価して高評価の候補を実行計画として採用し、計画指示部15は、統合計画部14が採用した実行計画について、その実行計画の実行粒度が小さい順に統合処理部13へと適用する。キー統合処理の実行粒度は、例えば、結果出力部12ごと、抽出プロセス41ごと、抽出マシン42ごとである。 (もっと読む)


【課題】電子文書中に出現する単語のうち、その内容を特徴的に表し、特定の性質に関連する単語または単語の組み合わせを、その電子文書中に出現する他の単語との関連性を考慮して検出することを図る。
【解決手段】特定の性質に関係する正解文書の集合と該性質に関係しない不正解文書の集合が記憶される電子文書記憶部110と、該性質に関係する文書を判定するための辞書登録候補である第1の語と第2の語が入力される入力部176と、第1の語と第2の語の組み合わせ毎に第1から第8の文書数を算出する文書数算出部175と、第1から第8の文書数に基づいて第1から第3の情報量基準量を算出する情報量基準量算出部177と、第1から第3の情報量基準量を比較して第1の語と第2の語と第1の語および第2の語の組み合わせとのうち該性質に関係する度合いが最大であるものを登録語に選択する登録語選択部178と、を備える。 (もっと読む)


【課題】メタデータが付与されている写真との画像特徴量的な類似度を利用して写真にメタデータを付与する際に、画像を代表する適切なメタデータを付与できるようにする。
【解決手段】メタデータが付与されているコンテンツを蓄積する手段と、メタデータを付与するコンテンツから、第1のメタデータのメタデータ値を取得する手段と、第1のメタデータ値を検索条件として、蓄積しているコンテンツから第1のメタデータで第1の検索を行う手段、第1の検索の結果集合に含まれるコンテンツから、第1のメタデータとは異なる第2のメタデータのメタデータ値を取得する手段と、第2のメタデータ値を検索条件として、蓄積しているコンテンツから第2のメタデータで第2の検索を行う手段と、第1の検索の結果集合と、第2の検索の結果集合との間の類似度を比較して、前記類似度に応じて、第2のメタデータ値を、コンテンツのメタデータとして付与する手段とを有する。 (もっと読む)


【課題】画像データの特徴情報を抽出して特徴情報が一致する画像データの位置情報をサーバから取得し表示するシステムにおいて、特徴情報が少ない画像データに対しては位置情報を取得できない。
【解決手段】第1の画像データから特徴情報を抽出するステップと、抽出された特徴情報が第2の画像データの特徴情報と近似する第2の画像データの位置情報及び近似値を受信し、近似値が所定の閾値よりも小さい場合、第1の画像データを時系列に並べ、近似値が所定の閾値よりも小さい画像データの前後に存在する近似値が所定の閾値よりも大きい画像データの位置情報に基づき、近似値が所定の閾値よりも小さい画像データの位置情報を算出するステップと、を備える。 (もっと読む)


【課題】文書原稿をスキャンして生成した任意の画像データに対し、文書の内容を推測し易いデータ名を生成することができるデータ処理装置、データ名生成方法及びコンピュータプログラムを提供する。
【解決手段】データ処理装置1は、文字列を含む領域の画像中での位置が、タイトル等の文書の内容を表す語句が文書中で配置されている位置を示す位置条件に該当するか否かを判定し、位置条件に該当する領域に含まれる文字列が意味する語句を抽出し、抽出した語句を含むデータ名を生成する。またデータ処理装置1は、文書の形態素解析を行い、文書中のキーワードに連接した文字列、又は文書中で使用頻度の低い形態素を含む文字列が、文字列が名詞句であるための条件を定めた文字列条件に該当する場合に、該当する文字列が意味する語句を抽出し、抽出した語句を含むデータ名を生成する。 (もっと読む)


【課題】内容が同一である又は類似しているコンテンツファイルの利用に好適なコンテンツファイル情報管理装置を提供する。
【解決手段】コンテンツファイル情報管理装置30は、コンテンツファイル情報を取得するコンテンツファイル情報取得部31と、内容が同一である又は類似しているコンテンツファイルに対して同一のコンテンツ識別情報を付与し、コンテンツ識別情報及びコンテンツファイル情報を管理するコンテンツファイル情報管理部32と、コンテンツ識別情報を含むコンテンツファイル利用要求を取得するコンテンツファイル利用要求取得部33と、コンテンツファイル利用要求に含まれるコンテンツ識別情報と同一のコンテンツ識別情報が付与されたコンテンツファイルの中から、送信すべきコンテンツファイルを選択するコンテンツファイル選択部34と、選択結果をコンテンツファイル保持装置へ送信する選択結果送信部35と、を備える。 (もっと読む)


【課題】関連する電子書類を複数企業間で一元的に管理可能な情報処理装置、方法、プログラムおよび記録媒体を提供すること。
【解決手段】本発明の情報処理装置は、電子書類の登録、更新、表示または関連付けを指示するユーザ・インタフェースを、ネットワークを介して接続されたクライアントPCに提供するユーザ・インタフェース提供手段と、電子書類データおよび電子書類データのメタデータが登録されるデータベース手段と、ユーザ・インタフェースで指定された電子書類データのメタデータとして、当該電子書類データの電子書類識別情報をデータベース手段に登録することにより、当該電子書類データを関連付ける関連付け処理手段と、当該関連付けられた電子書類データをユーザ・インタフェースに表示させる関連書類表示処理手段とを含む。 (もっと読む)


【課題】入力された文の属する分類が不明な場合であっても、複数の単語からなる表現において分類に応じた適切な文字列の切り出し範囲を決定することを可能とする。
【解決手段】形態素解析部32は、入力文に含まれる第1の文字列を構成する複数の単語を抽出する。表現切り出し部33は、形態素解析部32によって抽出された複数の単語に基づいて複数の第2の文字列を取得する。文字列保持部24は、複数の第2の文字列を保持する。分類評価値算出部35は、文字列保持部24に保持されている第2の文字列のインデックスを分類別文書DB22から検索する。分類評価値算出部35は、検索されたインデックスに基づいて、文字列保持部24に保持されている第2の文字列の各々の評価値を分類毎に算出する。文字列決定部36は、分類評価値算出部35によって算出された評価値が条件を満たす第2の文字列を入力文から切り出される文字列として決定する。 (もっと読む)


【課題】FP及びFNが既存のルールよりも小さく、かつ通信先のホスト情報を外部に漏洩することなく効率的にスパムメールであるか否かを判定する迷惑メール判定装置及び迷惑メール判定方法及び迷惑メール判定プログラムを提供すること。
【解決手段】電子メールを受信する受信部11と、セッションの過程で受信部11により受信したヘッダ情報を解析する解析部12と、解析部12により解析された結果に基づいて電子メールの特徴を示す特徴ベクトルを生成する第1の特徴ベクトル生成部13と、特徴ベクトルとラベルとを関連付けて迷惑メールの分類器を生成する分類器作成部14と、特徴ベクトルを分類器に入力し、特徴ベクトルに付与されているラベルを判定する第1の判定部15と、特徴ベクトルに付与されているラベルが迷惑メールの場合には、当該特徴ベクトルに対応する電子メールの本文を受信しないように受信部11を制御する制御部16とを備える。 (もっと読む)


【課題】XML対応ラベル、XBRL対応ラベルのようなラベルをデータに付加する方法を提供する。
【解決手段】電子的に表されたファイル内のデータを識別し(102)、ラベルをテキストストリングに関連付けさせるためのリストに基づいて、前記識別されたデータ内のテキストストリングに相当するラベルを選択し(104)、かつ、選択されたラベルを前記ファイル内に付加して前記テキストストリングに関連付けされた前記識別されたデータ内のテキストストリングと要素にラベル付けする(114)。ラベルはデータに関する情報を含み、1又は2以上の分類で定義される。前記リストがラベルをテキストストリングに関連付けさせないとき、ユーザは、識別されたデータ内のテキストストリングに相当するラベルを選択するようにプロンプトが与えられる。ユーザの選択によって指示される結合はラベルをテキストストリングに関連付けるためのリストに加えられる。 (もっと読む)


【課題】装置にかかる負担の増大と、利用者にとって無駄な検索結果が出力されてしまう事態の発生とを抑制し得る、文書管理システム、文書管理方法、及びプログラムを提供する。
【解決手段】文書管理装置1は、暗号鍵で暗号化した文書を登録する文書登録部11と、復号鍵の使用権限を有する利用者の指示で復号化された文書の本文情報及び利用者の識別子を取得する復号化文書管理部12とを備える。検索装置2は、索引情報を作成する索引情報作成部21と、索引情報を用いて検索を行う検索実行部22とを備える。索引情報作成部21は、復号化文書に、使用権限を有する利用者の識別子を紐づけ、復号化文書の本文情報が含む単語を用いて索引情報を更新する。検索実行部22は、検索結果に復号化文書が含まれる場合は、検索を指示した利用者の識別子が、検索結果に含まれる文書に紐付けられた利用者の識別子と一致すると、復号化文書を含む検索の結果を送信する。 (もっと読む)


【課題】イメージ化された文字についてのみ検索用の文字コードを、透明色で埋め込み、イメージ化されていない文字については、埋め込まない、ことにより検索が効率化され、OCRを行うための画像データの取得が不要となる文書生成装置、文書生成アプリケーションおよびプリンタドライバを提供する。
【解決手段】文字がイメージ化されるかを判定し、イメージ化される場合には、透明色でイメージ化された文字と同じ描画位置に文字描画を行う。 (もっと読む)


【課題】 メタデータを推論するために予め用意されているデータの性質に関わらず、適切なメタデータを精度よく決定可能にする技術を提供する。
【解決手段】 情報処理装置は、対象データに予め付与されている付与済みメタデータの値を取得し、互いに対応づけられた複数種類の推論用メタデータの値からそれぞれ構成される複数のセットを取得し、付与済みメタデータと同じ種類の推論用メタデータに対応する、他の種類の推論用メタデータの値の分布状況を分析し、分布状況に基づいて、対象データに新たに付与するメタデータを推論するために用いる推論手法を決定し、決定した推論手法を用いて、付与済みメタデータの値と複数の推論用メタデータの値のセットとに基づいて、対象データに新たに付与するメタデータの値を推論し、推論したメタデータの値を対象データに付与する。 (もっと読む)


【課題】メタデータを付与する手間を利用者にかけさせることなく、クエリコンテンツ中の区間あるいは領域のメタデータ生成することができるようにする。
【解決手段】コンテンツ対応関係取得部101は、クエリコンテンツのクエリコンテンツIDおよび当該クエリコンテンツの区間あるいは領域と、当該区間あるいは領域のクエリコンテンツの信号に類似する信号の蓄積コンテンツの区間あるいは領域および当該蓄積コンテンツIDとからなる対応関係を複数取得する。結合対応関係生成部102は、これら複数の対応関係を結合して結合対応関係を生成する。クエリメタデータ生成部103は、この結合対応関係を用いて、クエリコンテンツの時間区間ごとにメタデータを生成する。これにより、基準時刻を管理することなし、クエリコンテンツの区間あるいは領域についてのメタデータを生成できる。 (もっと読む)


【課題】1つまたは複数個のボリューム属性をデータベースに格納するための方法、システム、およびコンピュータ・プログラムを提供する。
【解決手段】システムが、ボリュームに関連しているボリューム属性を受け取る。そのボリューム属性に検索語が割り当てられる。ボリュームおよびボリューム属性が、ボリュームのロケーションに動的に関連付けられる。システムが、検索語、ボリューム属性、およびボリュームのロケーションをデータベースに割り当てる。データベースは、ローカル・データベースおよび/または外部データベースに格納されている。ボリュームに関する問い合わせ時にボリューム属性のうちの1つまたは複数個が識別されるとき、それらのボリュームが、ローカル・データベースおよび/または外部データベースのうちの動的に検索される。 (もっと読む)


【課題】会議等で発生した多種多様な情報を、発言者やワード、フレーズなどに連携させて時刻情報と共に記録し、後日に所定の検索キーを利用して所望の情報を検索できるようにする。
【解決手段】会議室100、会議室への入退室を管理する入退室コントロールユニット200、ディスプレイユニット300、映像/音声蒐集ユニット400、記録ユニット500、情報統合ユニット600、統括制御ユニット700、および時計800で構成され、
記録ユニット500に記録された会議情報を入出力インタフェース900から入力するキーワードあるいはキーフレーズ等により検索する。 (もっと読む)


【課題】語句に対する世論を反映した印象を容易かつ効率的に収集することができる評価情報入力支援装置、評価情報入力支援方法およびその方法を実行させるプログラムを提供すること。
【解決手段】画像検索装置100は、画像検索機能を備えるとともに、この画像検索機能を利用して、入力されたキーワードに対する印象を表す評価情報を収集するものである。画像検索装置100は、記憶手段として、画像情報データベース101と、印象情報データベース102と、を備え、演算処理手段として、画像を検索して表示させる画像処理部110と、キーワードに対する印象を表す評価情報を収集する印象情報収集部120と、収集した印象ログに基づいて対象コンテンツの印象度を判定する印象度判定部130と、を備えている。 (もっと読む)


【課題】各単語の重要度を考慮した文書署名生成装置を提供する。
【解決手段】文書集合データベース100に保存された文書に含まれる各単語の重要度wtを求め、該重要度wtを単語重要度データベース300に保存する単語統計情報計算手段200と、文書集合データベース100に保存された各文書に含まれる各単語の出現位置に応じた重要度wpを求めるとともに、該重要度wpと単語重要度データベース300に保存された重要度wtに基づいて、文書集合に含まれる各文書について文書署名を計算する文書署名計算手段400と、文書署名計算手段400により求められた各文書に対する文書署名を保存する文書署名データベース500とを備える。 (もっと読む)


【課題】不正行為を迅速に検知し、セキュリティを高めることが可能な文書管理システムを提供すること。
【解決手段】複数のブックエンドアンテナ22を順次切り替えながらRFIDタグ210のみの読み取りを行い、読み取られなかったRFIDタグ210の識別子を検知することで、持ち出された文書を検知する。読み取られたRFIDタグ210の識別子をもとに返却された文書が検知された場合に、該RFIDタグ210の識別子を読み取ったブックエンドアンテナ22によりRFID積層タグ220を読み取り、当該文書のRFID積層タグ220の識別子が全て読み取られたかを検知することで、ページの抜き取り行為を検知する。 (もっと読む)


【課題】
電子ファイルの使用においては、使用者の瑕疵によるトラブル発生の危険性が高く、その回復には多大な労力とコストを強いられており、これらを回避することは利用者の個人的な責任に委ねられており、情報システムの使用上大きな負担となっている。。
【解決手段】
カテゴリー設定手段と、カテゴリー毎に設定されたタイトルに合わせて情報設定する手段と、設定されたタイトルのカテゴリーを任意に選択し順位付けが可能な手段を備え、キーワード設定手段と、設定されたキーワードに合わせた情報設定をする手段と、設定されたキーワードを任意に選択し順位付けが可能な手段を備え、選択されたカテゴリー情報と、選択されたキーワード情報と、文字列を乱数的に自動生成し付与する手段により、これら情報をファイル名称として保存し、ファイル検索においては単なる文字列検索ではなく、カテゴリーのタイトルとキーワードの組合せにより、作成者の意図を尊重した語句の組合せでの検索を可能とすることを特徴とする。 (もっと読む)


21 - 40 / 318