説明

Fターム[5B075NK31]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の自動抽出 (2,419)

Fターム[5B075NK31]の下位に属するFターム

Fターム[5B075NK31]に分類される特許

241 - 260 / 566


【課題】画像に対して、その画像に適した文章を関連付けることができる情報処理装置およびプログラムを提供する。
【解決手段】画像記憶部10は画像データを記憶する。単語記憶部11は単語を記憶する。文章記憶部12は文章を記憶する。キーワード付与部3は、画像データと単語とを関連付ける処理を実行する。単語付与部4は、文章と単語とを関連付ける処理を実行する。照合部5は、画像データに関連付けられた単語と、文章に関連付けられた単語とを照合する。文章選択部6は、照合部5による照合の結果に応じて、画像データと文章とを関連付ける処理を実行する。 (もっと読む)


【課題】Webページ中に記事に並んで掲載されるバナー広告等の簡易広告について有効な検索を行うことのできる広告検索装置、広告検索制御方法、および、広告検索制御プログラムを提供する。
【解決手段】ネットワーク上に存在する情報を収集する情報収集手段と、収集した情報から広告ページへのリンクを含む簡易広告を抽出する広告抽出手段と、抽出した簡易広告からリンク先のページを解析し、広告検索用のインデックスを生成するインデックス生成手段と、検索要求に応じ、上記インデックスに基づいて簡易広告の検索を行い、検索結果を応答する検索手段とを備える。 (もっと読む)


【課題】デジタルコンテンツにおいて注目パートの開始位置に自動的にマーキングを付与することを目的とする。
【解決手段】字幕キーワード抽出部13は、字幕の文字列から名詞を抜き出す。キーワード記録部14は、抜き出した名詞をキーワードとして記録する。マッチング部15は、同一のキーワードが所定回数以上記録されているか否かを判断する。所定回数以上記録されている場合、マーキング付与部16はコンテンツ記録部17を介して、記憶部18に保存されているデジタルコンテンツにおける当該キーワードの表示が始まる位置にマーキングを付与する。 (もっと読む)


【課題】画像ベースの書類パッチ認識用のインビジブルジャンクションを用いるシステムと共に、従来技術の欠点を克服する。
【解決手段】電子書類のページ毎に固有のローカル特徴群であるインビジブルジャンクションを使用し、捕捉した画像を電子書類の一部と照合する。画像捕捉装置、特徴抽出及び認識システム、及びデータベースを含む。電子書類が印刷される場合、特徴抽出及び認識システムは、書類ページの画像を捕捉する。捕捉した画像中の特徴は、抽出され、索引付けされ、データベースに格納される。所与の問い合わせ画像に関し、問い合わせ画像中の特徴が抽出され、データベースに格納済みの画像と比較され、その問い合わせ画像を確認する。本発明は有利なことに幾何学的推定を使って、問い合わせ結果を唯1つの又は数個の合致する候補に減らす。一実施例では、2つの別々の幾何学的推定を使用して、ランク付けを行い、合致する候補を確認する。 (もっと読む)


【課題】学習データを必要としないテキストセグメンテーション方法、その装置、プログラム、および記憶媒体を提供することを目的とする。
【解決手段】入力したテキストを、文単位に分解するテキスト分解部と、上記テキスト分解部が分解した文を形態素解析し、解析された形態素のうちで、名詞を検索語として抽出する検索語抽出部と、上記検索語抽出部が抽出した検索語によってウェブ検索し、検索されたテキストを形態素解析し、この解析された形態素のうちで、名詞を関連語として取得する関連語取得部と、上記検索語と上記関連語との組み合わせであるキーワード集合を用いて、上記入力したテキストを分解した複数の上記文同士の連結性を判定し、連結性が所定の閾値よりも高い文同士である意味段落を抽出することによって、上記入力したテキストを分割する連結性判定部とを有することを特徴とするテキストセグメンテーション装置である。 (もっと読む)


【課題】 コンテンツの部分とリアルタイムコミュニケーションにおける発言とを関連付け、コンテンツ参照時に表示した部分の関連発言を提示できるようにし、発言再生時に再生した発言の関連コンテンツ部分を提示できるようにする。
【解決手段】 リアルタイムコミュニケーション履歴を蓄積し、リアルタイムコミュニケーションにおける有効な発言を抽出して発言データと発言履歴を蓄積し、コンテンツ参照における有効なコンテンツ部分の参照状態を判定してコンテンツ部分参照履歴を蓄積する。これらの履歴をもとに、リアルタイムコミュニケーションで発言すると同時に参照していたコンテンツの部分という関連を導出し、関連発言または関連コンテンツ部分として提示する。 (もっと読む)


【課題】話題をサブ話題に細分化し、サブ話題を代表するキーワードを抽出して提示する。
【解決手段】指定期間に入力された複数の文書の各々に含まれるキーワードを解析することにより、各文書が表す単語ベクトルを求めるキーワード解析手段と、前記複数の文書における文書の組において同じ話題に属する話題クラスタを抽出する話題クラスタ抽出手段と、前記話題クラスタから出現頻度の高い順に所定個数のキーワードを特徴的なキーワード群として抽出するキーワード抽出手段と、文書の数、文書に含まれる日付の分散、文書に含まれるキーワードのC−valueの値のいずれかの判定基準によって前記話題クラスタをサブ話題の話題クラスタに分割することにより、話題を構造化可能であるかを判定する話題構造化判定手段と、前記サブ話題クラスタにおいて前記特徴的なキーワード群を日時情報に基づいて並べて提示するキーワード提示手段と、を備える。 (もっと読む)


【課題】ユーザが指定したキーワードに応じたマルチメディアデータと、そのマルチメディアデータに関連するマルチメディアデータとを検索することができるようにする。
【解決手段】検索サーバ20は、ユーザ端末10から検索文字列の入力を受け付け、検索文字列に対応する複数の画像を検索し、検索した画像を出力し、出力した画像のうちの少なくとも1つの指定を受け付け、指定された画像に対応する関連キーワードを取得し、関連キーワードを検索文字列に加えた絞込文字列に対応する画像を検索する。 (もっと読む)


【課題】データ放送を利用して、おすすめ番組などの放送予定番組の録画予約をその場で行う。
【解決手段】BMLデータのヘッダに記述されたおすすめ番組情報に基づき、予約番組候補の情報が抽出され、抽出された情報に基づき、放送局とそれぞれの放送局毎のおすすめ番組の放送日時および番組名とが一覧表示されたおすすめ番組リスト画面100が表示部21に表示される。操作部31を操作して放送局と録画予約したい番組とが選択されると、おすすめ番組の詳細を示す番組情報201、録画設定を示す設定情報202、録画予約を行う予約ボタン203、録画予約を中止する中止ボタン204が設けられた番組予約画面200が表示される。操作部31を操作して予約ボタン203が選択されると、設定情報202の内容に従い、番組情報201に表示された番組のおすすめ番組情報に基づき録画予約が行われる。 (もっと読む)


【課題】検索に使用される頻度が高いクエリである単語を含むページに、その単語に応じた広告を表示させる。
【解決手段】生成コスト演算部91は、ページを検索するためのクエリが検索に用いられた頻度から、そのクエリの文章における出現しやすさを示す値として設定される設定値を算出する。辞書マージ部92は、単語毎の普遍的な出現しやすさを示す値を含む標準辞書に、設定値が算出されたクエリの集合をマージすることにより、クエリ反映辞書を生成する。解析部94は、クエリ反映辞書を用いて、ページの文章から特徴語を抽出する。広告作成部96は、ページの文章から抽出された特徴語で示される特徴と同様の特徴を有する商品または役務の広告を取得する。本発明は、いわゆるアフィリエイトのサービスを提供するアフィリエイトサーバに適用できる。 (もっと読む)


【課題】EPGデータに含まれるコンテンツに関する情報から、ニュース性や話題性のある出来事を表す文章を抽出することができるようにする。
【解決手段】ある日に放送されるニュース番組について、放送日の当日に配信されたEPGデータに含まれる番組詳細情報に含まれるテキストデータから抽出された候補となるテキストデータと、前日に配信されたEPGデータに含まれる番組詳細情報に含まれるテキストデータから抽出された候補となるテキストデータの差分が求められ、放送日の当日に配信されたEPGデータにおいて新たに追加されるなどして更新されたテキストデータが、ニュース性や話題性のある出来事を表すテキストデータとして決定される。本発明は、EPGデータを取得可能なデジタル録画機器に適用することができる。 (もっと読む)


【課題】文書データ中の数値情報の正当性の確認を効率よく支援する。
【解決手段】文書データ処理装置1の重要表現抽出部16は、記憶装置12の辞書情報記憶部13から重要表現抽出・メッセージ作成ルール辞書を読み出し、当該辞書の抽出パターンと入力文とが適合した場合には、当該入力文中の抽出パターンとの適合表現をもとに重要表現を抽出する。確信度計算部17は、重要表現抽出処理結果の内容が入力文中の重要表現としてどれほど信頼できるかを示す確信度を計算する。メッセージ作成部18は、抽出済みの重要表現をユーザに提示するためのメッセージを重要表現抽出・メッセージ作成ルール辞書から参照する。メッセージ作成部18は、参照したメッセージの変数部分に抽出済み重要表現を代入し、重要表現をユーザに提示するためのメッセージの文言を作成し、計算済みの確信度をもとにメッセージの強調色を決定する。 (もっと読む)


【課題】機械的に用語の表記ゆれを抽出するかな混在表記抽出システムを提供すること。
【解決手段】かな混在表記抽出装置10は、辞書に登録された用語の文字列を分解して、分割された文字毎によみがなを当てはめて記憶する。そして、文字とよみがなのすべての組み合わせを行い表記候補を生成し、表記候補を検索キーワードとして検索を行う。検索結果に基づいて表記候補から表記ゆれを抽出して、用語と表記ゆれを関連付けて記憶する。 (もっと読む)


【課題】 ジョブ実行データを蓄積し、追跡可能とする情報漏えい抑止システムにおいて、画像特徴量の抽出は、画像領域情報を抽出してから行なうが、領域情報の抽出は、一般的に文書画像のレイアウトや印刷条件に左右される。例えば、2つの画像が重なって配置されている場合などは、1つの大きな画像領域として認識される可能性がある。このような領域情報の誤認識の結果、画像特徴量の抽出および、類似画像検索の精度が低下するという問題があった。
【解決手段】 クライアントPC上のプリンタドライバにおいて収集、生成する文書画像や印刷実行環境情報に加え、文書データに含まれる画像領域情報を抽出し、合わせてサーバーへ送信する。サーバーではブロックセレクションなどの領域情報抽出処理を行なわず、プリンタドライバで抽出された領域情報を利用して特徴量抽出を行なう。 (もっと読む)


【課題】ユーザが指定した代表語に対する同義語の候補に、他の代表語に対する同義語の候補を追加する際、追加しようとする単語を代表語とする同義語についても同時に同義語の候補に追加することができる同義語辞書作成支援システム等を提供する。
【解決手段】抽出規則記憶手段と、抽出規則記憶手段から、同義語候補抽出手段と、同義語候補記憶手段と、同義語候補表示編集手段と、同義語候補表示編集手段で表示する同義語候補へ、ユーザが新たな同義語候補を追加する操作を受けて、同義語候補記憶手段に格納されている同義関係にある単語の組を参照して、新たな同義語候補とある一定の閾値以下の数の単語を介して同義関係となる単語を抽出し、表示する追加同義語候補表示手段とを備えた。 (もっと読む)


【課題】代表語と直接的な同義関係がある単語および間接的な同義関係がある単語の双方を、その代表語の同義語の候補とする場合に、ユーザがすべての候補を同時に表示して比較しながら確認・修正できる同義語辞書作成支援システム等を提供する。
【解決手段】抽出規則記憶手段と、同義語候補抽出手段と、同義語候補抽出手段で抽出する同義関係にある単語の組を格納する同義語候補記憶手段と、同義語候補抽出手段で抽出する同義関係にある単語の組を、同一のグループに属する単語どうしが互いに直接的または間接的な同義関係を持ち、かつ、同一の単語が複数の異なるグループに属さないような、グループに分割する同義語候補グループ分割手段と、分割されたグループの内容を表示する同義語候補グループ表示編集手段とを備えた。 (もっと読む)


【課題】ユーザの嗜好と類似性が低いためユーザにとって意外性が高く,ユーザにとって有用なアイテムを推薦する。
【解決手段】アイテムを推薦するためのキーワードの集合を変更するルールをランダムに適用し,ユーザが嗜好しないキーワードの追加と嗜好するキーワードの除去を行い,その推薦結果と変更前のキーワードの集合による推薦結果を混合してユーザに提示するとともに,推薦アイテムへのユーザの評価に基づきルールの適用確率を学習する。 (もっと読む)


【課題】関連するメタデータを有する情報アイテム群を参照することにより、現在の情報アイテムについてメタデータを生成する。
【解決手段】メタデータは、当該メタデータに関する信頼度を表す、対応する指示データを有する。現在の情報アイテムの所定の特性を検出する検出部と、前記情報アイテム群から、前記現在の情報アイテムの特性に最も類似した所定の特性を有する情報アイテムのサブセットを検出する検出部と、前記現在の情報アイテムを、前記情報アイテムのサブセットのうちの1つ又は複数からのメタデータと関連付けて、前記現在の情報アイテムと関連付けられた前記メタデータに、当該メタデータと当該現在の情報アイテムとの関連において低い信頼度を表す指示データを割り当てる。情報アイテム及びそれに関連するメタデータに関するユーザと前記情報処理装置との対話に応じ、前記メタデータに関連する指示データを変更する検出部とを具備する。 (もっと読む)


【課題】
分類を用いた従来の類似文書検索結果フィルタリング方式では所望の文書まで除去されてしまうことがあるというリスクを回避することによって、全体としての検索精度を向上させる。
【解決手段】
利用者によって入力された文章に対応する分類と、文書データベース中の各文書に対応する分類を照合し、検索スコア補正部15が、分類の共通性に応じて、類似度の補正方法を定義した補正定義テーブルを参照して類似度の値を補正する。 (もっと読む)


【課題】番組情報から抽出したキーワードから所望のものを選択して登録することができるようにする。
【解決手段】アンテナを介してデジタルテレビ放送受信部2によって受信されたデジタルテレビ放送の受信信号は、デマルチプレクサ3によって映像データ、音声データに分離される。EPGデータ抽出部7によって映像データに重畳されたEPGデータが抽出され、EPGデータ記憶部8に記憶される。ユーザインタフェース管理部11は、リモコン受信部13を介して受信されたリモコン200からの制御データに基づいて、EPGデータに含まれる番組情報から抽出したキーワードを表示し、所望のキーワードを選択するための表示データを生成し、OSD描画部12に供給する。OSD描画部12は、表示データに対応するOSDデータを生成し、映像/OSD信号合成部6に供給し、映像表示部16にキーワードが表示される。 (もっと読む)


241 - 260 / 566