説明

Fターム[5B075NK32]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の自動抽出 (2,419) | 自然言語解析による検索キーの抽出 (1,229)

Fターム[5B075NK32]の下位に属するFターム

Fターム[5B075NK32]に分類される特許

121 - 140 / 794


【課題】先見知識を用いずにシリーズを識別する識別名を抽出することのできる情報処理装置を提供する。
【解決手段】情報処理装置100は、タイトル文字列を取得するタイトル取得部102と、タイトル文字列を解析して複数のトークンに分割するタイトル解析部104と、複数のトークンの文字列長に基づき、タイトル文字列中の該トークンの位置に応じて重みづけされた評価値を算出する評価値算出部106と、序数の値と評価値とにより位置が示されるトークン点を座標平面上にマッピングするマッピング部108と、トークン点の座標に基づいて、識別名を抽出するための基準点の座標と該基準点に基づいた抽出基準とを決定する抽出基準決定部110と、トークン点のうち抽出基準に適合するトークン点を抽出する抽出部112と、識別名を生成する識別名生成部114とを有する。 (もっと読む)


【課題】単語や文字が持つ意味の極性に関する情報を別途定量化して類似度計算に反映させることが可能な類似度計算装置を提供する。
【解決手段】文書を入力する文書入力部1と、入力された文書を形態素解析して単語に分割し、文法情報等を付与する形態素解析部2と、前記形態素解析結果に対して極性を付与する極性付与部3と、前記形態素解析結果と前記極性付与結果をもとに、入力文書の概念情報を抽出する概念情報抽出部4と、前記抽出された概念情報と、あらかじめ用意された文書データベース8中の文書に関する概念情報をもとに、入力文書と文書データベース8中の文書との類似度を計算し、類似度の高い文書を前記文書データベース8から取得する類似度計算部5と、前記計算された類似度に従って、前記文書データベース8から取得された文書を順序付けて出力する計算結果出力部6と、を備える。 (もっと読む)


【課題】評判分析の精度と計算処理速度の向上を図ること。
【解決手段】評判分析装置1は、分析対象が所属するカテゴリが概念的な上下関係に基づく木構造の階層の各層に配されこの各層のカテゴリに評判情報を示す仮説がその評価情報を伴って付与されてなる仮説群を予め格納した階層型仮説オントロジ2と、入力された分析対象所属カテゴリに合致したカテゴリとその仮説及び評価情報を階層型仮説オントロジ2から抽出する評判仮説作成部3と、前記抽出されたカテゴリとその仮説及び評価情報を格納する仮説テーブル4と、入力された分析対象記事に対し、仮説テーブル4に格納された仮説が含意しているか否かの判定を行い、前記含意していると判定された仮説とその評価情報を仮説テーブル4から引き出し、この仮説と評価情報に基づく評価分析結果に入力された分析対象キーワードを付したものを評判分析結果として出力する記事合意認識部5を備える。 (もっと読む)


【課題】文書の特徴量の抽出や類似性の判定を極めて高速に行う。
【解決手段】処理対象となる文書データを入力するためのデータ入力部101と、文書を形態素に分割する形態素解析部102と、文書内での各々の形態素の出現頻度を取得する統計データ解析部103と、各々の形態素を周波数に対応させ、形態素の出現頻度を強度に対応させることにより、文書データに対応する周波数スペクトルデータを作成する波形変換部104と、周波数スペクトルデータを波形データに変換するDA変換部105と、波形データを特定の処理でフィルタリングするパスフィルタ部106と、フィルタリング後の複数の波形データの中から類似する波形データを抽出する共鳴フィルタ部107と、を備える。 (もっと読む)


【課題】URL内のテキストの検索を効率的に行い端末側のレスポンスを考慮した有害文書判定方法及び装置を提供する。
【解決手段】有害文書判定装置1は、文書を解析して文書が有害であるか否かを判定する文書有害判定手段13と、文書にURLが記載されている場合にURLが有害URLデータベースに登録されていることを条件に、文書有害判定手段13において有害ではないと判定した場合においても、文書が有害であると判定する有害URL判定手段15と、URLが登録されていないと判定したことに応じて判定したURLが示す文書について有害であるか否かをさらに判定し、URLが示す文書が有害である場合に文書が有害であると判定する総合判定手段18とを備える。 (もっと読む)


【課題】口語的な「くだけた表現」で記述された文章情報であっても、適切なカテゴリに分類することができる文章分類プログラム、方法及び文章解析サーバを提供する。
【解決手段】複数の基準文章情報を、複数のカテゴリに分類して記憶した基準文章記憶手段と、未知語を含む分類対象の対象文章情報を形態素に分割し、未知語を抽出する未知語抽出手段と、未知語と、その前方及び後方の隣接形態素とからなる検索キーを生成する検索キー生成手段と、基準文章情報のカテゴリ毎に、検索キーを用いて、未知語に近似する1つ以上の修正ルール候補を検索する修正ルール検索手段と、基準文章情報のカテゴリ毎に、文章構成指標に基づいて1つの修正ルール候補を選択する修正ルール候補選択手段と、当該修正ルールの文章構成指標に基づくスコアが最も高いカテゴリを選択するカテゴリ選択手段と、選択されたカテゴリに、対象文章情報を分類する文章分類手段とを有する。 (もっと読む)


【課題】 今話題となっているキーワードや百科事典等で調べられやすいキーワードの自動判別が可能で、特定の分野に特化したキーワードを抽出する。
【解決手段】 本発明は、知識獲得サイト及びシステムとそのページビュー数を抽出して知識キーワード候補として知識キーワード候補辞書記憶手段に格納し、知識獲得サイトの前記ページビュー数の順位を用いて該知識獲得サイトの知識キーワード毎に第1の重要度を算出し、該知識キーワードと該第1の重要度を組にして知識キーワード重要度記憶手段に格納し、文書が入力されると、知識キーワード候補辞書記憶手段を参照して形態素解析した結果から知識キーワード候補を抽出し、抽出された知識キーワード候補に基づいて、知識キーワード重要度記憶手段を検索し、第1の重要度の高い順に知識キーワードを抽出し、出力する。 (もっと読む)


【課題】種々の形式の通信システムに接続された遠隔端末へ、位置に基づくサービスを提供するための方法及びシステムを提供する。
【解決手段】あつらえた情報要求が遠隔端末で発生される。遠隔端末に関連した地理的インジケータも発生される。上記あつらえた情報要求及び地理的インジケータは、位置に基づくアプリケーションサーバーへ送信される。そのあつらえた情報要求に対する構造化された応答が、位置に基づくアプリケーションサーバーで発生され、この構造化された応答は、遠隔端末の地理的インジケータに基づくものである。この構造化された応答は、多数の異なる形式の通信プロトコル及び/又は媒体の1つを使用して遠隔端末へ送信される。 (もっと読む)


【課題】
医用診断レポートの作成を支援し、質の高い且つ統一性のある医用診断レポートを作成できる医用診断レポートシステムを提供する。
【解決手段】
医用診断レポートシステムにおいて、医用診断レポートの所見を単語単位に分割した読影箇所を特定する単語を、或いは、入力または選択した単語204を、読影チェック項目として抽出する単語抽出部と、分類条件ごとに、それぞれの読影チェック項目に含まれる単語を対応付ける読影チェックリストを作成しデータベースに格納する読影チェックリスト作成部と、前記格納された読影チェックリストに従って、前記単語抽出部で抽出した入力または選択した単語204に続く次の単語を検索する単語検索部と、検索された単語を候補単語205として表示する単語表示部とを備える。 (もっと読む)


【課題】ユーザーの希望する情報に近接した検索結果を提供する検索サービス。
【解決手段】サーバーにおいて実行される仕分け検索サービス提供方法であって、質疑語に基づく情報検索が要請される段階と、ウェブロボットによって収集された複数のウェブページのウェブデータのHTMLタグを分析してHTMLテンプレートを抽出し、抽出されたHTMLテンプレートに基づきそれぞれの前記ウェブデータを複数個の情報ブロックに区分する段階と、前記区分された情報ブロック別の索引語を生成する段階と、前記質疑語と前記索引語とを情報ブロック別に比較し、前記質疑語と前記索引語との間の関連性に基づき前記キーワードに対する仕分け検索結果情報を生成して提供する段階と、を含むことを特徴とする仕分け検索サービス提供方法。 (もっと読む)


【課題】Webコミュニティサービスでの活動内容からユーザプロファイリングを行い、特定の目的に最適なユーザを抽出する。
【解決手段】コミュニティサービス内での閲覧履歴、発言履歴をデータベースに蓄積しておく。蓄積された履歴情報を分析し、ユーザの行動力、情報発信力、趣味・嗜好についてのプロファイリングを行い、特定の目的に最適なユーザを抽出する。また、抽出結果に対するフィードバックを行うことで、次回以降の抽出アルゴリズムにおける各種パラメータの最適化を行う。 (もっと読む)


【課題】高精度な株価予測を行う技術を提供する。
【解決手段】株価予測装置は、単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出する手段と、これに応じて株式銘柄を示す企業名とこの企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体との関連性の高さを示す関連度をそれぞれ取得する手段と、この関連度と上記企業名又は上記関連語の印象を示す値とが反映される評価値を算出する手段と、当該企業名又は当該関連語を含むコンテンツが提供されてから所定期間後の株価変動値を取得し、これと企業名又はその関連語に対応する評価値とを用いてそのコンテンツ提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出する手段と、当該企業名に関する、上記予測係数と上記評価値とを用いて、当該企業名で示される株式銘柄の株価を予測する手段と、を備える。 (もっと読む)


【課題】単語の羅列による検索クエリであっても、その単語の意味を推定することができる意味属性推定装置、方法及びプログラムを提供すること。
【解決手段】検索クエリ取得手段(111)が端末から検索クエリを取得すると、助詞挿入手段(112)が検索クエリに助詞を挿入した複数の仮文を作成する。そして、作成された複数の仮文それぞれについて検索手段(113)が検索すると、最大頻度語句抽出手段(114)は、その検索結果から最も一致した数の多い仮文を抽出する。一致した数の多い仮文は、使用される頻度が高いといえるので、意味属性情報取得手段(115)は、その仮文に含まれる単語の意味属性情報を取得する。これにより、意味属性推定装置(10)は、検索クエリに使用された単語の意味属性情報を出力することができる。 (もっと読む)


【課題】話し言葉やノイズといった談話データの特性に強く、談話データの構造を解析して、多様な用途に利用可能な談話構造のセマンティクスを生成する談話構造解析システムを提供する。
【解決手段】談話データ100を入力とし、談話セマンティクス200を出力する談話構造解析システム1であって、各ステートメントのフローの情報を判断するためのフロー表現と、フロー表現にマッチする表現を有するステートメントに対して設定するフローを指定したフロー定義からなるフロー解析ルール22と、各ステートメントに対してフロー解析ルール22における各フロー表現とのマッチングを行い、マッチした前記フロー表現における対応するフロー定義にて指定されたフローを設定し、各ステートメントとフローとの対応からなるフロー情報21を出力するフロー解析部20とを有し、フロー情報21を談話セマンティクス200として出力する。 (もっと読む)


【課題】ショートテキスト通信のトピックを正確に識別する。
【解決手段】ショートテキスト通信からトークンを抽出するステップと、抽出されたトークンを使用してクエリを生成し、クエリを1組のドキュメントに適用するステップと、1組のドキュメントのうちのクエリと一致するドキュメントを検索結果として識別するステップと、検索結果のそれぞれと関連付けられた顕著用語を識別し、識別された顕著用語にしきい値を適用するステップと、しきい値を満たす顕著用語を、ショートテキスト通信のトピックとして選択するステップとを含む。 (もっと読む)


【課題】大量の文書を分類設定語により分類する前に、適切な分類設定語を設定する。
【解決手段】文書分類装置1は、分類設定語決定部300が、実行中分類アクション情報記憶部201内の実行中分類アクション情報と分類アクション情報記憶部310内の既存分類アクション情報から分類者間ベース類似度、文書ベース類似度及び分類回数ベース類似度を算出すると共に、各ベース類似度に基づく分類アクション類似度を算出して分類設定語毎にスコアを算出し、このスコアに基づいて分類設定語を分類処理部120に設定する。これにより、実行中分類アクションと既存分類アクションとの間における分類者間ベースの類似度、文書ベースの類似度、分類回数ベースの類似度に基づく文書内用語を分類設定語として設定できるので、大量の文書を分類設定語に基づいて分類する前に、適切な分類設定語を設定できる。 (もっと読む)


【課題】ユーザによって指定された文書に応じて、サービスを自動的に起動することを可能とする。
【解決手段】テキスト文書入力部311は、ユーザの操作に応じて文書を入力する。論理構造抽出処理部312、形態素解析部314および意味クラス解析部316は、テキスト文書入力部311によって入力された文書を解析する。該当サービス抽出部323は、文書の解析結果に基づいて、当該文書に含まれる文字列がルール格納部321に格納されているルール情報に含まれる条件に合致するかを判定する。サービス起動部326は、該当サービス抽出部323によって条件に合致すると判定された文書に含まれる文字列に基づいて、当該条件を含むルール情報に対応するサービスを起動する。サービス処理結果出力部328は、サービス起動部326によってサービスが起動された結果を出力する。 (もっと読む)


【課題】ローカル検索システムは、特定の地域内の関連性のあるウェブページおよび/またはビジネスリストを返すことを試みる。ビジネスがウェブページにおいて言及されるとき、既存のローカル検索システムは、そのビジネスを職業別電話帳データと突合わせることにより、対応するビジネスリストを特定してもよい。この技術は、しかしながら、職業別電話帳データが存在しないか、または職業別電話帳データがビジネスに対して不正確であるときには、実行可能ではない。
【解決手段】あるシステムは、住所を含む文書を特定し、その文書においてビジネス情報を見つけ出す。このシステムは信頼度スコアをそのビジネス情報に割当てるが、その信頼度スコアはビジネス情報が住所に関連付けられる確率に関している。このシステムはその割当てられた信頼度スコアに基づいてビジネス情報を住所に関連付けるかどうかを判断する。 (もっと読む)


【課題】テキストを装飾するテキストボックスを含む文書ファイル(ドキュメント)の分析を行い、各々のテキストボックスの因果関係を管理し、データの再利用性を向上させるドキュメント分類システムを提供する。
【解決手段】クライアント端末100からドキュメント分類システム1へ登録される、複数のテキストボックスを含んだドキュメントをドキュメント記憶領域5に蓄積し、情報整理機能32によってテキストボックスの配置パタン、テキストの内容から因果関係を有するテキストボックス同士を判定し、当該テキストボックスの座標、テキストの内容、特性KEY、文節ルール、因果関係等をデータベース5に仮登録データとして蓄積する。ユーザの評価を集計し、閾値を超えたものを本登録とし、以降新たなドキュメントが登録された際、分析ルールとして用いることで、ドキュメントの再利用性を向上させる。 (もっと読む)


【課題】現在の会話の中心となっている観点を特定し、その観点に関して近く、他の観点では遠いような話題を提供することができる話題推薦装置、話題推薦装方法およびプログラムを提供する。
【解決手段】話題推薦装置100は、話題を表す情報と、複数の話題に共通する異なる2以上の観点の話題の内容を表すキーワードとを、関連づけて記憶する記憶部1の話題データベース11と、ユーザの会話から抽出した語句にもとづいて、観点ごとの重みを算出する観点判定部2と、直近にユーザに提示した話題と話題データベースの話題とについて、キーワードにもとづいて所定の類似度を算出する類似度算出部3と、話題データベースの中から、重みの大きい観点における類似度に所定の正数を乗じた値と重みの小さい観点における類似度に所定の負数を乗じた値、の和が最も大きい話題を検索する話題検索部4と、その話題をユーザに提示する提示部5と、を備える。 (もっと読む)


121 - 140 / 794