説明

Fターム[5B075NK32]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の自動抽出 (2,419) | 自然言語解析による検索キーの抽出 (1,229)

Fターム[5B075NK32]の下位に属するFターム

Fターム[5B075NK32]に分類される特許

61 - 80 / 794


【課題】利用者が、必要とするコンテンツを容易に探索することを可能とする。
【解決手段】第1の知識情報と、第1の知識情報に関連付けられた第2の知識情報とを入力する。第2の知識情報に対して第1の知識情報が有する関係を示す第1の関係情報を、データベースから取得する。第2の知識情報に対して、第1の関係情報によって示される関係を有する知識情報を、データベースから取得する。取得した知識情報を、ユーザに対して提示される、第1の知識情報に類似する知識情報として出力する。 (もっと読む)


【課題】異なる複数の文章に含まれる単語を用いて同義語を検出することが可能であって、汎用性を有し、幅広く同義語を定義することが可能な同義語辞書生成装置等を提供する。
【解決手段】文書解析システム100は、入力インターフェース110を介して取得した各アンケートデータに対して、評価表現を示す評価表現テキストと当該評価テキストが修飾する被修飾語テキストのセットをテキストセットとして抽出しつつ、評価表現テキスト、カテゴリ情報及び被修飾語テキストの出現頻度数に基づいて同義語を定義するようになっている。 (もっと読む)


【課題】ユーザーの負担を軽減しつつ、血糖値変化を精度よく予測することが可能な血糖値予測技術を提供する。
【解決手段】血糖値予測装置10は、文字列入力手段11、情報記憶手段12、データベースが格納されたデータベース記憶手段13、構文解析手段14、体調推定手段15、および血糖値出力手段17を有しており、ユーザーが、電子記録として日常的に作成している日記などの生活情報を用いて血糖値の予測を行う。 (もっと読む)


【課題】発信者が発信するコンテンツに挿入する最適なタグを提案すること。
【解決手段】本発明の最適タグ提案装置は、特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。 (もっと読む)


【課題】名詞間関係及び動詞/形容詞間関係を一括して語間関係として扱い、獲得したい語間関係を予め定義することなく、意味的に類似している語対を二項関係に分類することができる二項関係分類プログラム等を提供する。
【解決手段】文章集合蓄積部から所定閾値以上で共起しやすい複数の語対を抽出し、文章集合蓄積部から語対の語毎に共起する係り受け語集合を抽出する。次に、第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する。更に、係り受け語毎に、語と共起する文書集合中の出現頻度とを計数し、ベクトルを導出し、ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する。 (もっと読む)


【課題】対訳辞書の自動生成を実現する。
【解決手段】ある言語のページ内の画像と類似する画像を含む他の言語のページを類似画像検索で抽出し、双方のページがヒットする検索キーワードをウェブ検索等のログから取得することにより、相互に似た画像を指す異なる言語の単語やフレーズが対応付けできるので、対訳辞書の自動生成が可能となる。一つの基準ページに対して所定数の前記類似画像ページ(例えば、日本語ページの画像を基に類似度1位から10位までの中国語ページを抽出するなど)を抽出して検索キーワードを取得することにより、抽出結果のばらつきを抑制して普遍性ある単語同士を対応付けできるので、高精度な対訳辞書を生成可能となる。 (もっと読む)


【課題】検索キーワードによって違法・有害なカテゴリに属するか否かを判定する際に、検索キーワードに対する係り受けキーワードを自動的に拡張することによって、判定可能な文章の範囲を広げることができる文章分類プログラム等を提供する。
【解決手段】検索キーワードに対する係り受けキーワードを抽出する学習係り受け解析手段と、係り受けキーワードに対応するノードから、少なくとも1階層上の上位概念のノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する係り受け関連キーワード抽出手段と、係り受け関連キーワード毎に不当割合を算出する不当割合算出手段と、不当割合に概念辞書の下位概念となる全てのノードにおける不当割合を重み付けることによって補正する不当割合補正手段と、不当割合が所定閾値以上となる係り受け関連キーワードを検索キーワードに対応付けて登録する係り受けキーワード辞書手段とを有する。 (もっと読む)


【課題】 直販サイトの検索用インデックスを生成することができる検索用インデックス生成システム及び方法、並びにその検索用インデックスを用いて情報検索を行うことができる情報検索システム及び方法を提供する。
【解決手段】
インデックス生成装置10は、インターネット上のショッピングサイトからウェブページ情報を収集し、その収集したウェブページ情報に基づいて、当該ウェブページ情報に係るショッピングサイトが直販サイトであるか否かを判定する。そして、インデックス生成装置10は、そのショッピングサイトが直販サイトであると判定した場合、当該ショッピングサイトに係るウェブページ情報を用いて、当該ウェブページ情報を検索するための検索用インデックスを生成する。 (もっと読む)


【課題】検索者の検索意図に合った効果的な検索連動広告を実現する。
【解決手段】指定された検索クエリからアクションの候補を提示して検索意図に合うものを指定させるアクション提案型の検索において、検索で指定されたアクションに基づく検索用文字列と、広告ごとに表示したいアクションを予め対応付けたアクション文字列と、の適合性判断を基に広告を選定することにより、検索者の検索意図に合った効果的な検索連動広告が実現できCTRも改善する。 (もっと読む)


【課題】ユーザと対話を行う対話装置が文を出力するために必要な重みベクトルを構築するために多大な労力が必要であった。
【解決手段】対話装置から対話文情報を受け付け、対話文情報が有する手法識別子と対話確率情報とを用いて、ユーザ文種類を決定し、対話文情報が有する1以上の決定要因または1以上のスポットのうちの1以上の情報とを用いて1以上の決定要因または1以上のスポットを取得し、ユーザ文種類識別子と1以上の決定要因または1以上のスポットのうちの1以上の情報とを有するユーザ入力情報を対話装置に送付し、ユーザ嗜好ベクトルと、ユーザ入力情報に含まれるスポットの1以上の評価値との合致度を用いて算出した報酬を用いて、対話装置の手法識別子に対応する重みベクトルを更新する学習方法により、ユーザと対話を行う対話装置が文を出力するために必要な重みベクトルを自動的に構築できる。 (もっと読む)


【課題】ネットワーク上に接続された機器同士で提供サービスを補完しあう分散システムにおいて、他装置で作成され自装置が扱えない文書データであってもこれを処理する画像処理装置及び画像処理システムをより簡単な構成で提供する。
【解決手段】本発明における会議キーワード抽出装置は、会議文書からキーワードを抽出する会議キーワード抽出装置であって、相関連する関連会議文書を取得する取得手段と、取得された関連会議文書毎に、関連会議文書内の各フレーズの重要度を算出する算出手段と、各フレーズの中から、重要度に基づき所定数のフレーズをキーワードとして抽出する抽出手段とを有し、算出手段は、各フレーズの重要度を算出するに際し、関連会議文書内の重要度算出対象フレーズが、取得手段により取得された全ての関連会議文書内のフレーズに対して該関連会議文書内に頻出する度合いである逆頻出度を用いる。 (もっと読む)


【課題】ソーシャルメディアから、所定の言語で記述された情報を収集すること。
【解決手段】複数の言語に対応するソーシャルメディアに書き込まれた書き込み情報の中から、所定の言語の書き込み情報を収集する書き込み情報収集システムは、所定の言語の文に含まれ、文中の他の語との関係を示す単語群が設定された設定ファイルを読み込む読み込み部30と、単語群の各単語に基づいて、ソーシャルメディアから書き込み情報を収集する収集部50と、収集した書き込み情報を記憶する書き込み情報記憶部42と、を備える。 (もっと読む)


【課題】再生対象のコンテンツデータの内容把握を容易にすることのできる映像再生装置及び映像再生方法を提供する。
【解決手段】映像再生装置は、分離手段と、キーワード抽出手段と、再生手段と、表示制御手段と、再生位置変更手段とを備える。分離手段は、コンテンツデータから映像情報と字幕情報とを分離する。キーワード抽出手段は、字幕情報からキーワードを抽出し、該キーワードを含む字幕の表示時刻と共に順次記憶媒体に記録する。再生手段は、映像情報から映像を復号し、表示画面に表示させる。表示制御手段は、記憶媒体に記録した1以上の前記キーワードを、表示時刻順に並べて表示画面上に表示する。表示位置変更手段は、表示画面上に表示された1以上のキーワードのうち、選択されたキーワードの表示時刻に、再生手段による再生位置を変更する。 (もっと読む)


【課題】任意の記号列から属性情報を精度良く推定する手段を提供すること。
【解決手段】複数の記号列、及び各記号列から抽出したい属性情報を入力する入力部と、記号列を数値に変換する関数を含む所定の関数群から複数の関数を選択し、当該複数の関数を組み合わせて、記号列から特徴量を出力する複数の特徴量関数を生成する特徴量関数生成部と、各特徴量関数に各記号列を入力し、当該各記号列に対応する特徴量を算出する特徴量算出部と、各記号列に対応する属性情報と、当該各記号列に対応する特徴量とを用いて機械学習を実行し、特徴量から属性情報を推定する推定関数を生成する推定関数生成部と、特徴量関数生成部により生成された特徴量関数、及び推定関数生成部により生成された推定関数を出力する出力部と、を備える、情報処理装置が提供される。 (もっと読む)


【課題】
利用者の意図や嗜好に沿った適切な情報を話題に応じて迅速に提供する。
【解決手段】
抽出手段720が、利用者が発話した語句の中からキーワード記憶手段710に記憶されている語句を抽出し、話題語句グループ生成手段730、嗜好リスト生成手段740、拡大嗜好リスト生成手段750及び提示手段790へ送る。話題語句グループ生成手段730では、抽出語句が意図キーワード、対象キーワード及び属性キーワードのいずれかである場合に、話題語句グループを作成する。検索手段770は、話題語句グループの対象キーワードが特定されたときに話題関連情報の検索処理を行うとともに、属性キーワードが追加されて更新されたときに話題関連情報の検索処理を行う。そして、提示手段790が、抽出語句が検索指示キーワードである場合に、話題関連情報から提示すべき情報を選択し、情報を利用者に提示する。 (もっと読む)


【課題】期間毎の主題語句と主題語句間の関連度を同時に算出することで、話題の関連と推移の確認を可能にする。
【解決手段】方法は、文書集合を期間別に分割し、文書を語句の集合に分解し、各期間の文書のタイトル中に出現する語句の統計情報を集計し、各期間の文書の全文中に出現する語句の統計情報を集計し、タイトル中語句統計情報の集計結果と全文中語句統計情報の集計結果を基に、期間毎に主題を表す語句を複数抽出する。また、各主題語句が含まれる文書を収集し、収集結果を基に、2つの主題語句間の関連度を計算する。 (もっと読む)


【課題】リンク先のWebページ及びリンク元のWebページに含まれるテキスト情報を当該Webページのインデックスに効率的かつ効果的に反映することができるインデックス更新装置及びその方法を提供すること。
【解決手段】インデックス更新装置1は、リンクDB21に基づいて、インデックスの更新の対象となる更新対象Webページのリンク先URL又は更新対象Webページのリンク元URLを抽出するURL抽出部11と、抽出したリンク先又はリンク元のURLに基づいて、インデックスDB22を参照し、リンク先又は当該リンク元のテキスト情報を補充用テキスト情報として抽出する補充用テキスト情報抽出部12と、抽出された補充用テキスト情報に基づいて、更新対象WebページのURLに対応するインデックスを生成し、当該生成したインデックスを補充してインデックスDB22を更新する第2インデックス更新部14と、を備える。 (もっと読む)


【課題】評価を表す表現について関連性の高い表現の候補を正確に特定する。
【解決手段】情報処理装置10が備える評価表現辞書114は、評価対象を評価するための評価項目を表す語と当該評価項目に対する評価値を表す語とを含む評価表現と、当該評価表現が肯定的な表現であるか否かを表す極性と、を関連付けて記憶する。評価表現抽出部130は、評価表現辞書114を参照し、処理対象の文字列に含まれる評価表現を処理対象の文字列から抽出し、抽出した評価表現それぞれの極性を特定する。評価表現分類部140は、抽出された評価表現の間で評価対象および極性が共通するか否かに基づいて、前記抽出された評価表現を1以上のグループに分類する。出力処理部170は、同一のグループに分類された評価表現が複数ある場合に、これら複数の評価表現を互いに関連付けて関連表現記憶部180に対して出力する。 (もっと読む)


【課題】自然文からユーザの価値判断が示されている表現を抽出する際に参照する感性辞書を効率的に編集できるように支援する技術の実現。
【解決手段】事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す極性との組合せを格納しておく感性辞書記憶部18と、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶部34と、起点語が入力された場合に、この起点語をキーに類義語辞書記憶部34を検索して起点語の類義語を抽出し、各類義語をキーに類義語辞書記憶部34を検索して各類義語の類義語を抽出し、抽出された用語のリストを含む感性用語登録画面80を生成してクライアント端末58に送信し、この画面80を介してリスト中の1または複数の用語を選択する情報と、各用語の極性を指定する情報が入力された場合に、選択された用語を指定された極性に関連付けて感性辞書記憶部18に格納する辞書編集支援部38を備えた。 (もっと読む)


【課題】 どのような非文字領域が存在するか既知でない書籍内の部分領域を撮影した画像が、文字領域かどうか判定する
【解決手段】 本発明は、入力された判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された未知語の数及び該領域に含まれる文字数の割合に基づいて文字領域か非文字領域かを判定する。また、判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された単語の長さ及び該領域に含まれる文字数の割合に基づいて文字領域か非文字領域かを判定する。 (もっと読む)


61 - 80 / 794