説明

Fターム[5B075NK32]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の自動抽出 (2,419) | 自然言語解析による検索キーの抽出 (1,229)

Fターム[5B075NK32]の下位に属するFターム

Fターム[5B075NK32]に分類される特許

41 - 60 / 794


【課題】ユーザが予定している行動に関するメッセージを閲覧するときに、その予定している行動を支援する情報を提供する。
【解決手段】ユーザ端末から受信したメッセージに含まれている、ユーザが予定している行動を特定する語句である行動特定語を抽出し、この行動特定語に基づいて、ユーザが予定している行動を支援する情報である行動支援情報を取得する。そして、取得した行動支援情報に対応するアイコンデータを、受信したメッセージを記述した文書データに埋め込み、行動支援メッセージデータとして、受信ユーザのユーザ端末に対して送信する。 (もっと読む)


【課題】精度の高い関連語を登録できる関連語登録装置等を提供する。
【解決手段】ユーザが入力した検索ワードを含む検索クエリを取得し(S4)、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し(S5)、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し(S6)、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し(S7)、抽出した検索クエリから、取得時刻に基づき候補検索クエリを特定し(S8)、抽出した特徴ワードと、特定された候補検索クエリに含まれる検索ワードとを、関連語として関連語DBに登録する(S9)。 (もっと読む)


【課題】ユーザが文書を登録する際に誤って広すぎる開示範囲を指定する事態を事前に防止すること。
【解決手段】登録された文書情報の漏洩を防止する文書処理装置であって、文書情報を登録する文書情報登録手段と、前記文書情報登録手段に登録された文書情報について、該文書情報の登録者と、該文書情報に含まれる単語と、前記登録者が指定した該文書情報の開示範囲とに基づいて、開示範囲が限定されている文書情報のなかに所定閾値より高い頻度で出現する単語を要注意語として抽出する要注意語抽出手段と、前記文書情報の登録者と前記要注意語抽出手段により抽出された前記要注意語とを対応付けて格納する要注意語格納手段と、前記登録者が新たに登録する文書情報に対し、前記要注意語格納手段を参照して前記登録者に対応付けられた要注意語を含むか否かを検査する文書検査手段と、を備えることを特徴とする。 (もっと読む)


【課題】 より分類精度の高い文書分類を可能にする。
【解決手段】 本発明は、正解文書から処理対象となる全ての対象単語に関して、制限無単語クラス間関連度を算出する。正解文書から処理対象となるいくつかの対象単語について、条件単語制限付単語クラス間関連度を算出する(事前処理)。処理対象となる文書が入力されると、入力文書に含まれる単語群の各単語について、該単語群と制限無単語クラス間関連度と条件単語制限付単語クラス間関連度とから、単語クラス間関連度を算出し、入力文書に含まれる単語群の各単語の出現頻度と該単語の重要度との積、あるいは、頻度と重要度に関して単調増加な演算結果である重みと、該入力文書に関する単語クラス間関連度とから、文書クラス間関連度を算出し、文書クラス間関連度と事前確率を用いて、入力文書が属するクラスを決定する(分類処理)。 (もっと読む)


【課題】字幕データの有無に拘わらず、番組や番組内の所定シーンを適切に検索する。
【解決手段】番組検索装置420は、番組ストリームに含まれる字幕データまたは番組情報を抽出し、形態素に分割して、その形態素を許可ワードテーブルに登録するテーブル更新部180と、番組保持部464と、番組に関するテキストデータを取得すると共に、取得日時情報を関連付けるデータ取得部482と、テキストデータを形態素に分割し、分割した形態素が許可ワードテーブルに登録されていなければ、形態素を、予め定められた記号に置換するデータ加工部184と、保持された番組ストリームに、置換されたテキストデータと、取得日時情報との組をインデックスデータとして付与するインデックス付与部492と、キーワードとインデックスデータとに基づいて番組または番組内の所定シーンを抽出する番組抽出部494とを備える。 (もっと読む)


【課題】 キーワードと日時表現が同一の文に出現しない場合でもキーワードに関する指定した日時の範囲内の内容を表す文書を提示する。
【解決手段】 本発明は、入力されたキーワードを含み、入力された日時の範囲内の日時表現を含む文書及び文書の適合性スコアを取得し、取得した文書に含まれるキーワード及び日時表現をもとに、日時表現の有効範囲を考慮して文書内でキーワードと日時とがどの程度関連しているかを表す日時スコアを算出し、文書の適合性スコア及び日時スコア記憶手段の日時スコアをもとに、文書スコアを算出し、文書スコアをもとに、文書を並び替える。 (もっと読む)


【課題】どのようなキーワードで検索すればよいのか分からない場合であっても、所望の文書を効率よく検索することができる技術を提供する。
【解決手段】画像形成装置は、ボックス部に各文書データ(文書A,文書B,文書C)を記憶する際に、各文書データに含まれる単語を抽出し、抽出した単語のうち各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択し、そのキーワードを各文書データに関連付けて記憶しておく。文書データを検索する際には、全ての文書データ(文書A,文書B,文書C)における出現頻度の高い上位数個のキーワードを表示する(単語B;16回、単語A;14回、単語C;8回)。表示されたキーワードのいずれかをユーザが選択することにより、選択されたキーワードに関連付けられた文書データが検索される。これらの表示処理、選択処理、検索処理を繰り返すことにより、文書データの絞り込み検索が行えるようになる。 (もっと読む)


【課題】 経験を行うに至った要因の観点から記事を分類する際に、表現のあいまい性が高い記事に対し、人々の経験と要因との関係の強さを算出する。
【解決手段】 本発明は、経験記事集合を読み込み、経験記事集合の各経験記事の各単語に対して、それが要因を表す文脈で用いられている度合いを表す単語要因文脈スコアを経験記事の単語毎に付与し、単語要因文脈スコア付与済みの各経験記事の各単語に対して、要因属性記憶手段を参照して、各記事に記された経験が何の要因に基づいたものであるかを表す経験記事要因スコアを付与し、経験記事要因スコア及び経験属性が含まれる経験記事集合を取得し、経験記事要因スコアを取得し、経験記事の各経験属性毎に経験属性記憶手段を参照して、各経験と各要因との間の関係の強さを示す全経験要因関係スコアを出力する。 (もっと読む)


【課題】検索者が本当に望む文書データを検索結果の上位にランキングさせる。
【解決手段】メールデータ取得部11は、メールサーバ4から送信済の電子メールを当該電子メールの通信履歴と併せて取得する。専門度算出部12は、各送信者の送信済の電子メールの転送経路をメールデータ取得部11により取得された通信履歴から特定し、特定した転送経路に基づいて、各送信者が電子メールで使用した各単語について、各送信者の専門性を示す専門度を算出する。スコア値算出部13は、文書データの作成者が送信者に該当する場合、作成者の各文書データに含まれる各単語の頻度を、作成者の対応する単語の専門度に応じて増大させることでスコア値を算出する。 (もっと読む)


【課題】幅広い分野の自然言語文による質問に対して、精度よく、自動的に回答文を生成できる質問応答システムを提供する。
【解決手段】質問回答装置は、質問文に対する回答文のテンプレートを記憶するテンプレート集合記憶部46と、質問文を受けると、当該質問文と所定の関係を持つテンプレートを推定するテンプレート推定部48と、推定されたテンプレートに対し、単語クラス、及びテンプレート拡張規則を適用し単語又は文の構造が修正された拡張テンプレートを生成するパターン拡張処理部52と、拡張テンプレートとWebコーパス32の文とをマッチングし、質問に対する回答候補を出力するマッチング部60と、これら候補に対し質問文に対する回答としての適格性を示すスコアを算出し、スコアの高いものの順に出力するスコアリング・選択部68とを含む。拡張テンプレートは、2つの変数を持ち、各変数には単語が持つべき単語クラスが指定されている。 (もっと読む)


【課題】 利用者が与える任意の指定文字列に関連するか否かをにより入力テキスト(マイクロブログテキスト)を分類する。
【解決手段】 本発明は、入力テキストに指定文字列が含まれるか否かを判定し、指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと入力テキストを連結したテキストと、比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを連結テキスト記憶手段に出力し、連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求め、これを基に、入力テキストの、指定文字列への関連スコアを求めスコア出力手段の関連スコアに基づいて、入力テキストを指定文字列に関連するか否かを分類する。 (もっと読む)


【課題】ユーザの実体験に基づいて、ユーザの嗜好に合致する商品または店舗を推薦することが可能なデータ生成装置などを提供すること。
【解決手段】データ生成用サーバ装置400は、販売商品毎または店舗サービス毎にユーザによってデータベース300に登録されて記憶されたテキストデータの形式をレビューデータに基づいて、販売商品毎または店舗サービス毎に、類似商品または類似サービスをリストアップし、端末装置100を操作してWebページデータを介して一の販売商品または一の店舗サービスの情報における閲覧要求がされた場合に、当該閲覧要求された販売商品に類似する類似商品または当該閲覧要求された店舗サービスに類似する類似サービスの情報を関連情報としてWebページデータに組み込むための関連情報提供用パーツデータを生成するようになっている。 (もっと読む)


【課題】電子文書集合からキーワードを抽出し、クラスタリングして提示する。
【解決手段】実施形態に係るキーワード提示装置は、文書集合から、所定の汎用概念辞書に規定されている形態素列を基本用語候補として抽出する抽出部101と、文書集合から、汎用概念辞書に規定されていない形態素列を専門用語として抽出する抽出部104とを含む。このキーワード提示装置は、基本用語候補の各々と専門用語との間の関連性を評価し、関連性の高い基本用語候補を優先的に基本用語として選定する選定部106を含む。このキーワード提示装置は、文書集合に基づく基本用語間の統計的な相関度と汎用概念辞書に基づく基本用語間の概念的な相関度との重み付き和を計算し、重み付き和に基づいて基本用語をクラスタリングするクラスタリング部107を含む。 (もっと読む)


【課題】受信したメール本文に対する最適な検索範囲を設定し、返信文候補の抽出精度を上げることで、メール機能の利便性を高める。
【解決手段】電子メール作成機能を備えた情報処理装置であって、受信したメール本文を分割機能部(8)で複数の部分文字列に分割する。1又は連続する複数の部分文字列の全てに対して、記憶部(12)を参照し、一致し又は最も類似する受信文候補を受信文として選択する。記憶部は、1又は連続する複数の部分文字列に対応する受信文候補と、受信文候補に関連付けた返信文情報を記憶する。そして、分割した全ての部分文字列が連続し、且つ、前記メール本文に対して最も類似する受信文の組み合わせを検索範囲に設定し、この検索範囲に基づいて、記憶部に記憶した受信文に対応する返信文情報を抽出する。 (もっと読む)


【課題】多くのユーザに閲覧されている電子書籍を、テーマ(キーワード)ごとに抽出することの可能な電子書籍管理装置及び方法を提供すること。
【解決手段】電子書籍管理装置(1)の閲覧時間集計手段(11)は、電子書籍のページごとの閲覧時間をユーザごとに集計し、スコア算出手段(13)は、集計したページごとの閲覧時間から、電子書籍の特徴度スコアを算出する。このとき、スコア算出手段(13)は、ページごとの閲覧時間に加え、ページごとのキーワードの出現頻度スコアも加味した上で特徴度スコアを算出するため、特定のキーワードについて多くのユーザに閲覧されている電子書籍が抽出可能になる。 (もっと読む)


【課題】インターネット上の文字列検索の際に、利用者の入力する文字列に加え、利用者の端末装置に既に記憶されている文書情報などから文字列を自動的に抽出し、表示の優先順位を変更することで、目的とする情報を効率的に検索するシステムを提供する。
【解決手段】インターネット上の情報をサーバから取得する情報処理装置PC100であって、前記情報処理装置は、文書ファイルを記憶する記憶装置5と、前記文書ファイルから頻出文字列を抽出する関連文字列抽出処理部2を有し、前記インターネット上の情報検索により取得した前記情報を、前記頻出文字列を用いて表示する。 (もっと読む)


【課題】本発明の実施形態は、処理時間の短縮と信頼性の向上とを図ることができる情報監視システムおよび情報監視方法を提供する。
【解決手段】実施形態によれば、製品に関する情報を格納する製品情報格納部と、前記製品に関する情報から形態素に関する情報を抽出する解析部と、前記形態素に関する辞書情報を格納する辞書部と、前記抽出された形態素に関する情報と、前記辞書情報とに基づいて統計処理情報を作成する統計処理部と、前記統計処理情報に基づいて異常の発生を監視する監視部と、を備えた情報監視システムであって、前記監視の目的に応じて必要となる情報を前記製品情報格納部に格納された製品に関する情報の中から選別し、前記解析部に提供する情報選別部を備えたことを特徴とする情報監視システムが提供される。 (もっと読む)


【課題】制御負荷を抑えつつブログ本文の特定を可能なブログ本文特定装置及びブログ本文特定方法を提供すること。
【解決手段】ブログ本文特定装置(1)の第1起点特定部(2)は、同一ユーザに対応付けられた複数のブログページを解析して、当該複数のブログページの夫々について、ソースコードに含まれるタグの当該ソースコード内でのパスを示す外部パス情報を生成し、この外部パス情報からタグを一意に特定でき(共通パス)、かつ、本文を含んでいるパス(本文包含パス)であっても最も深いパスを、ブログ本文を含む起点パスとして特定する。そして、ブログ本文特定装置(1)のブログ本文抽出手段(5)は、この起点パスに基づいて、当該ユーザのブログページの本文を抽出する。 (もっと読む)


【課題】ユーザにとって必ずしも最良でないアプリケーションを、ユーザが使用し続けてしまうおそれを少なくとも軽減すること。
【解決手段】ユーザにアプリケーションを推薦する配信サーバは、ユーザが所有しているアプリケーションの情報を含む通知信号を、そのユーザから受信する受信部と、同一の又は類似する機能を有するアプリケーション同士を関連付けるアプリ機能情報を格納する格納部と、ユーザが所有しているアプリケーションと同一の又は類似する機能を有するアプリケーションを、アプリ機能情報を用いて特定し、特定されたアプリケーションの中から前記ユーザに推薦するアプリケーションを選択する選択部と、選択部が選択したアプリケーションを示すレコメンド信号を、ユーザに送信する送信部とを有する。 (もっと読む)


【課題】商標の総合的な登録性の判断材料を与えることが可能な情報処理装置を提供する。
【解決手段】商標の文字列である商標文字列を受け付ける受付部101と、商標文字列を検索キーとしてWEB検索を行う検索部102と、商標文字列の称呼の情報である1以上の称呼情報を取得する称呼取得部103と、称呼取得部103が取得した各称呼情報を用いて類似検索を行う類似検索部106と、商標文字列のWEB上での使用件数を含む検索部102の検索結果と、称呼情報ごとの類似検索の結果とを出力する出力部109と、を備えた。 (もっと読む)


41 - 60 / 794