説明

Fターム[5B075NR05]の内容

検索装置 (67,127) | データ整理 (4,076) | 整理対象 (1,823) | 検索キー情報 (720)

Fターム[5B075NR05]の下位に属するFターム

Fターム[5B075NR05]に分類される特許

81 - 100 / 492


【課題】固有表現抽出モデル更新のための学習効果の高い正解データを低コストで作成すること。
【解決手段】タグ信頼度付与処理部12により、形態素解析済の大規模形態素解析済テキストから固有表現抽出モデルを用いて各形態素がとり得る固有表現タグ毎の信頼度を算出し、各形態素に該固有表現タグとその信頼度を付与してタグ信頼度付テキストを生成し、タググラフ展開処理部22により、タグ信頼度付テキストに対し、形態素毎に信頼度が上位N個の固有表現タグをグラフ構造に展開し、タググラフ付テキストを生成し、コンテキスト抽出処理部24により、タググラフ付テキストに対し、前記タググラフ付テキスト内で構成される固有表現状態および表記の組が固有表現リストに存在する場合は、その組を構成する固有表現タグを含むタグ列に形態素列を対応付けて自動タグ修正済テキストを生成する。 (もっと読む)


【課題】異なるデータ形式を有する複数の表データが存在する場合、項目ゆらぎを熟練を要することなく容易に補正することができ、新たなデータベースを生成することができるデータベース生成装置、データベース生成方法及びコンピュータプログラムを提供する。
【解決手段】一又は複数の電子文書ファイルを取得し、取得した一又は複数の電子文書ファイルから、データベース項目とデータ列との組み合わせデータをデータベース項目ごとに抽出する。抽出した一のデータベース項目を他のデータベース項目へ集約する指示を受け付け、一のデータベース項目のデータ列と他のデータベース項目のデータ列との間で重複してデータが存在する行が有るか否かを判断する。重複してデータが存在する行が無いと判断した場合、一のデータベース項目のデータ列と他のデータベース項目のデータ列とを他のデータベース項目へ集約して新たなデータベース項目とする。 (もっと読む)


【課題】表示画面を有効に利用して楽曲の傾向を容易に把握することができるデータ分類装置、データ分類方法、データ分類プログラムを提供する。
【解決手段】メタデータグループ作成部は、複数の楽曲データを分類したメタデータグループとそのメタデータグループをさらに分類したメタデータグループとを作成する。座標データ算出部は、それぞれのメタデータグループのメタデータグループ領域の座標データを楽曲データ数が多いメタデータグループ領域ほど、領域の大きさが大きくなるように算出する。メタデータ表示画面作成部は、座標データ算出部が算出したメタデータグループ領域の座標データに基づいて、メタデータ表示画面を拡大させるほど、表示階層の数を多くして、表示部に表示させる。 (もっと読む)


【課題】 個人用ビデオ録画のための入手可能な記憶媒体容量は絶え間なく増大している。記録の編成、コンテンツの検索および特定記録へのアクセスのためにメタデータを用いることができる。マルチメディア・コンテンツの範囲内に埋め込まれたメタデータの場合、能率が悪くて時間がかかる検索となる。
【解決手段】 本発明に従ったメタデータ情報は集められ、分析され、メタデータ実体を形成するために処理される。またコンテンツへの参照により補正される。結果として生じるメタデータ実体とコンテンツ参照との対から記述子ストリーム(DS)が形成され、マルチメディア・コンテンツを含むファイルとは別個に記憶される。このようにして、MPEG-2トランスポート・ストリームのデータのために、全てのストリームの解析の必要性なしにメタデータにアクセスすることができる。 (もっと読む)


【課題】文章内に複数種類の項目を含む文書を視覚化する対象の文書とし、1つの項目が文書内の一箇所にまとめて記述されている点を有効利用して文書中の有用情報の発見をより良好に支援できるようにする。
【解決手段】不具合事例を文書読込部12で読込んでテキストを抽出して、そのテキスト中における2単語のペアの重要度(関連度)をペア重要度算出部14により算出して、そのペア重要度の高い単語同士をリンクで結合してノード集合のグラフをグラフ生成部16により生成し、そのグラフについてユーザが削除あるいは不具合事象として選択操作し、その選択結果である分類結果を分類結果DB18に格納する。ペア重要度算出部14によるペア重要度の算出において、現象、原因、対策等の複数項目ごとに構造化されている不具合事例文書について、2単語の距離の集合が小さい距離が多くなるほど重要度が高くなる評価関数を用いてペア重要度を算出する。 (もっと読む)


【課題】コンテンツグループを代表するコンテンツのサムネイルを効果的に表示し、所望のコンテンツを素早く検索できる装置を提供する。
【解決手段】コンテンツブラウズ装置は、複数のコンテンツを複数のグループに分けて管理し、これら複数のグループの各々について、グループを示すアイコンとして、グループに属する複数のコンテンツのうちの1または複数の選択されたコンテンツに対応するアイコンを表示内容として有するグループアイコンを生成し、それらグループアイコンを表示する。操作入力に応じて、グループアイコンの表示内容を更新するか否かを判定し、更新すると判定された場合には、更新されるべきグループアイコンが示すグループに属する複数のコンテンツのうち、それまでに選択されていないコンテンツを優先して選択してグループアイコンを生成させることにより、グループアイコンが更新される。 (もっと読む)


【課題】電子メールを利用して検索対象について関連性の高い人物を検索し、提示する。
【解決手段】検索支援装置1は、電子メールのヘッダの情報から取得した、関連する他の電子メールのメッセージIDがメールテーブルに登録されていない場合はスレッドIDを新たに生成し、登録されている場合はメールテーブルからスレッドIDを取得する。そして、ヘッダ情報から取得したメッセージID、送信者及び受信者と、スレッドIDとを設定したレコードをメールテーブルに追加し、電子メールの件名を形態素解析して得たキーワードとスレッドIDとを対応づけてスレッドテーブルに書き込む。検索条件を受けると、キーワードテーブルから一致するキーワードのスレッドIDを取得し、そのスレッドIDで特定されるメールテーブルのレコードから送信者又は受信者として設定されているユーザと、その設定数とを取得し、設定数が多いユーザをスレッドID毎に出力する。 (もっと読む)


【課題】不要語であるか否かを決定するための閾値を用いることなく、不要語を決定することができるようにする。
【解決手段】パラメータ学習部14によって、学習用文書データに対する尤度を最大にする、学習用文書データに含まれる単語群の各単語のトピック毎の出現確率を学習して探索する。単語分類部16によって、単語群の各単語を、出現確率が最も高くなるトピックに分類する。不要語決定部20によって、全てのトピックに対する出現確率の各々が予め定められた範囲内となり一様に分布する単語が分類されたトピックの単語群を、不要語として決定する。 (もっと読む)


【課題】文書に対する分類区分の付与漏れを少なくし、信頼性が高い分類区分を付与することを可能とする文書分類付与装置、文書分類方法およびプログラムを提供する。
【解決手段】特徴量抽出部12は文書入力部11から入力された特許公報からIPCを抽出する。文書特徴量ベクトル生成部13は主特徴量辞書14を参照して特徴量抽出部12で得られたIPCの中から筆頭IPCを抽出し、筆頭IPCに重み付けをした上で前記IPCを要素とした文書ベクトルを生成する。文書間距離計算部15は文書ベクトルを用いて特許公報間の距離を計算する。2次元座標マッピング処理部16は、特許公報間の距離の関係が表れるように各特許公報に対応する座標点を2次元座標上に配置する。分類未付与部分集合選択部17は筆頭IPCをもつ分類付与特許公報が含まれる円形領域を2次元座標上に設定し、円形領域内の分類未付与特許公報に対応する座標点の集合を選択する。 (もっと読む)


【課題】Web文書に含まれるタグに基づいて、項目、属性及び属性値の関係を有する情報を抽出することにより、項目に関する情報をWeb文書から自動的に収集する。
【解決手段】情報収集装置1は、通信ネットワークNを介してアクセス可能なWeb文書から、Web文書に含まれるタグに基づいて表形式あるいはデータベース形式の情報を抽出する情報群抽出手段12と、抽出した表形式あるいはデータベース形式の情報から、前記タグが示す各情報間の従属関係に基づいて、所定の項目に対して従属する関係にある属性及び前記属性の内容を示す属性値の関係を有する情報を抽出し、抽出した前記項目、属性及び属性値の関係を有する情報を関連付けて記憶手段に記憶する属性関係抽出手段13と、を備える。 (もっと読む)


【課題】付加情報データの編集の有無に関わらず、それぞれのドキュメントにおいて、同一のオブジェクトに付加する付加情報データの内容に偏りを生じることを防ぐことができる情報処理装置を提供する。
【解決手段】ドキュメント内のオブジェクトに付加情報として付加されるメタデータを生成する生成手段と、生成されたメタデータがユーザにより編集された場合に、該メタデータが付加されるオブジェクトと同一なオブジェクトを含む他のドキュメントを検索する検索手段と、検索された他のドキュメント内のオブジェクトに付加されているメタデータに、ユーザにより編集された内容を反映する反映手段とを備える。 (もっと読む)


【課題】大容量のメモリを必要とすることなく、より多くの文字コード体系に係るファイル識別情報のファイルに対して、確実にアクセスできるようにする。
【解決手段】外部コードを内部コードに変換するコード変換テーブルに登録されていない文字コードでファイル/ディレクトリ名が記述されている場合には、不登録のファイル/ディレクトリ名を内部コードによる代替のファイル/ディレクトリ名に変換する。その代替のファイル/ディレクトリ名は、オリジナルのファイル/ディレクトリ名と対応付けて、マップテーブルに一時的に登録する。当該ファイルにアクセスする場合は、マップテーブルからオリジナルのファイル/ディレクトリ名を取得する。当該ファイルに対するアクセス、印刷等の所定の処理が終了した場合には、マップテーブルを削除する。 (もっと読む)


【課題】プレゼンテーションの場で提示された情報及びそれに関する情報をなるべく欠落させずに記録する。
【解決手段】音声画像記録装置10は、表示された画像、及び音声を取得し、取得した画像及び音声を時間に関連づけて記憶し、記録された時間が関連づけられたデータを取得し、取得されたデータを、当該データに関連づけられた時間に基づいて特定した画像及び音声に関連づけて登録する。音声画像再生装置20は、音声画像記録装置10に記憶された画像及び音声を関連づけられた時間に基づいて同期して再生する際に、記憶された画像及び音声に関連づけて記憶されたデータのうち少なくとも一部を、画像及び音声とともに再生する。 (もっと読む)


【課題】情報検索などを行う場合に、キーワードの入力を簡便に行えるようにする。
【解決手段】テキストデータを含む構成要素を複数有する文書を取得する文書取得部101と、構成要素のうちテキストデータの文字数が多い構成要素を文書の中心的な内容が表された主要素として選択する主要素選択部102と、主要素に含まれるテキストデータを形態素解析し、この形態素解析されたテキストデータの各語に意味属性を付与する形態素解析部103と、意味属性を付与された各語から所定の意味属性または品詞を持つ語を固有表現として抽出する固有表現抽出部105と、固有表現を対応する意味属性と共に記憶する固有表現記憶部107と、固有表現記憶部107から固有表現を意味属性に基づいて固有表現をキーワード候補として分類するキーワード候補分類部108と、キーワード候補をユーザに提示するキーワード候補提示選択部110とを備える。 (もっと読む)


【課題】電子筆記具による手書きの筆跡を電子化した画像データ以外の情報を、電子文書の部分に関連付ける。
【解決手段】画像処理部71aでは、画像取得部711が、媒体から画像を取得し、ドット配列生成部712が、画像からドット配列を生成する。また、データ処理部71bでは、符号配列生成部713が、ドット配列から符号配列を生成し、識別情報取得部714が、符号配列から識別情報を取得し、位置情報取得部715が、符号配列から位置情報を取得し、表示情報取得部717が、表示画面に表示すべき表示情報を取得し、操作受付部718が、表示情報を電子文書の部分に関連付ける操作を受け付け、出力部719が、識別情報と位置情報と表示情報とを、識別情報で特定される電子文書上の位置情報で特定される部分に対する表示情報の関連付けの指示として出力する。 (もっと読む)


【課題】タグを含むクエリによる検索を高速に行うことができる検索装置を提供する。
【解決手段】文書番号記憶手段91は、文書の文書番号のリストを、そのリストを示すポインタと関連付けて記憶する。タグ位置管理手段92は、文書中の単語の属性を示すタグと、そのタグに該当する単語の文書中での位置を示す位置情報と、そのタグに該当する単語を含む文書の文書番号のリストへのポインタと、その文書番号のリストのうち少なくとも最小文書番号および最大文書番号を含む複数の文書番号をリストにおける文書番号の順位とともに記述した文書番号サンプルデータとを記憶する。問い合わせ情報生成手段94は、クエリに該当する文字列の文書中での位置と、クエリ中の各タグに関する検索対象とを含む情報である問い合わせ情報を生成し、検索実行手段95は、問い合わせ情報で定められた各タグ毎の検索対象の積集合を求める。 (もっと読む)


【課題】検索カテゴリー毎に検索するナビゲーション装置であって、それまでの検索結果を利用して別の検索カテゴリーによりさらに絞り込み検索することができるデータ検索装置等を提供すること。
【解決手段】音声認識により検出した検索用単語を用いて検索カテゴリー毎にデータを検索するデータ検索装置50において、検索用単語の検索カテゴリーを判別する検索カテゴリー判別手段22と、発声された時系列に、検索用単語毎に検索カテゴリーを対応づけて記憶する検索単語記憶手段23と、検索用単語に対応づけられた検索カテゴリーのデータを該検索用単語を用いて検索し、その検索結果であって、かつ、次に記憶された検索用単語に対応づけられた検索カテゴリーのデータを、該検索用単語を用いて検索する検索手段22と、を有することを特徴とする。 (もっと読む)


【課題】 通常のアクセス制御方式では、アクセス判断の際における処理効率が悪いと云う欠点がある。
【解決手段】 コンテンツ本体と当該コンテンツ本体の属性をあらわすメタデータを個別に、コンテンツ管理システムにより管理することにより、直接、コンテンツ本体に利用者によってアクセスされるのを防止する。コンテンツ本体をロケーションではなく、コンテンツ名で識別すると共に、ロケーションをメタデータとして管理することにより、利用者はコンテンツのロケーションを意識することなく、アクセスできる。 (もっと読む)


【課題】検索での文書のヒット率を向上し、利便性を向上させる。
【解決手段】文字認識部において画像に含まれる文字認識を行い、その文字認識結果を検索用データとして登録する。文字認識部は、二文字の連結の文字遷移確率テーブルを有し、認識結果を遷移確率によって補正する手段と、ユーザが入力した検索用の文字列から二文字の連結の組み合わせを取り出し、遷移確率テーブルに学習させる手段とを有する。 (もっと読む)


【課題】検索者を支援するために、他人が別の検索において使用して検索に成功した検索キーワードを利用できるようにする検索方法を実現する。
【解決手段】第1のユーザによる検索キーワードを使用した検索要求に応じ第1の検索を行うステップと、この検索結果が満足である旨の提示を第1のユーザがしたことに応答して前記検索キーワードを当該検索結果に関連付けて登録するステップと、第1の検索の後、第2のユーザによる検索要求に応じて第2の検索を行うステップと、第2の検索により前記同一の検索結果が得られた場合、第2のユーザの要求に応じて、前記検索キーワードの一部または全部を第2のユーザに提示するステップとを有する検索方法等を提供する。 (もっと読む)


81 - 100 / 492