説明

Fターム[5B075NK32]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の自動抽出 (2,419) | 自然言語解析による検索キーの抽出 (1,229)

Fターム[5B075NK32]の下位に属するFターム

Fターム[5B075NK32]に分類される特許

81 - 100 / 794


【課題】ユーザの好みに合った番組を推薦することができる番組推薦装置及び番組推薦プログラムを提供すること。
【解決手段】所定のSNSにおいて自身のページを保有しており、推薦希望ユーザを当該ページの情報とともに登録する登録部10と、登録されているページの情報に基づいて所定のSNSにより管理されているページを閲覧し、推薦希望ユーザが発言を追従しているユーザの発言を所定の方法で解析する解析部11と、解析結果に基づいて、推薦希望ユーザが発言を追従しているユーザの中から、影響力を有するユーザを関連ユーザとして特定し、当該関連ユーザが視聴していた放送番組を推定する番組推定部12と、推定された放送番組の特徴から推薦番組を決定する推薦番組決定部13と、決定された推薦番組の情報を推薦希望ユーザが保有するページに送信する送信部14を備える。 (もっと読む)


【課題】 ごく僅かな文書にしか出現しない非重要語を抽出することなく、重要語を抽出する。
【解決手段】 本発明は、「タイトル」「本文」「コメント」などの、文書において異なる役割を持つ文章群を「セクション」として定義し、複数のセクションから構成される訓練文書の集合を基に、入力文書から、前記入力文書中に語句が出現するセクション数と、前記訓練集合と前記入力文書から算出する残差逆文書頻度を用いて、前記入力文書の重要な語句を抽出する。 (もっと読む)


【課題】入力文中へ絵文字等の記号を挿入する際に、文の内容を考慮した記号を決定し、実際の使用方法に沿った役割と位置を考慮した記号の挿入を、自動的に行う。
【解決手段】記号入力支援装置において、学習用の文中の各記号について、共起する単語との出現頻度を表す共起単語情報と、コンテクスト情報と、当該記号と記号ごとに与えられた所定の辞書中の語との共起情報とを算出し、算出結果を学習結果として学習結果格納手段に格納する記号出現頻度学習手段と、入力文中における記号挿入位置候補の位置ごとに、挿入対象である各記号について、前記学習結果格納手段に格納された前記学習結果を用いて、前記記号挿入位置候補の各位置に記号を挿入した場合における文特徴量を算出し、当該文特徴量に基づき、挿入に最も適した記号と挿入位置を特定し、当該記号と挿入位置とを変換候補記号格納手段に格納する挿入記号選定手段と、を備えて構成する。 (もっと読む)


【課題】情報列の区切りをより精度よく判定することができる情報分類装置を提供すること。
【解決手段】複数の情報が並べられた情報列を格納する情報列格納部11と、各情報の特徴を表すキーワードの集合であるキーワード集合を抽出する特徴抽出部12と、情報列を仮の区切りで分割し、分割した仮の区切り前の情報群および仮の区切り後の情報群の間で、キーワード集合の変化の大きさを表す値が閾値より大きい箇所を実際の区切りとして判定する区切判定部13と、を備える。 (もっと読む)


【課題】対話テキストから、テキスト文書集合記憶部を用いずに重要語を抽出する重要語抽出装置を提供する。
【解決手段】この発明の重要語抽出装置は、発話分割部と、共通出現単語抽出部と、単語近傍度算出部と、単語重要度算出部と、を具備し、発話分割部は、複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割し、共通出現単語抽出部は、その発話単位に共通して出現する共通出現単語を抽出し、単語近傍度算出部は、共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、当該発話距離数の逆数を単語近傍度として算出する。そして、単語重要度算出部は、共通出現単語の単語近傍度を入力として、単語近傍度が高く、その回数の多い共通出現単語ほど大きな値となる重要度を算出する。 (もっと読む)


【課題】コンテンツに対する評価を予測する場合の予測精度を向上させる。
【解決手段】評価情報抽出部114は、ユーザにより言語で表現された情報である言語表現から評価対象および評価対象への評価を含む評価情報を抽出する。タイプ識別部115は、評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別する。評価予測部121は、注目ユーザによる第1のタイプの評価情報、および、注目ユーザによる第2のタイプの評価情報における他のユーザによる評価情報に基づいて、注目ユーザのコンテンツに対する評価を予測する。本発明は、例えば、ユーザにコンテンツを推薦するシステムに適用できる。 (もっと読む)


【課題】ユーザの嗜好に合ったコンテンツを記録し、さらに、そのコンテンツをユーザの活動に応じたタイミングでユーザの活動に応じて利用すること。
【解決手段】ビデオレコーダ100は、コンテンツを記録し、記録されたコンテンツに関する名所キーワードを取得して記録する。ビデオレコーダ100とインターネット10を通じて接続可能な携帯情報端末200は、携帯情報端末200の現在位置に対応する地名情報を取得して蓄積し、ビデオレコーダ100から名所キーワードを取得し、地名情報の中から名所候補を絞り込み、絞り込まれた地名情報と一致する名所キーワードを判定し、判定された名所キーワードに関するコンテンツが記録されていることを報知する。 (もっと読む)


【課題】意味表現として適切な文字列ベクトルを生成することを課題とする。
【解決手段】文字列ベクトルデータベース1と、テキストとを入力とし、前記文字列ベクトルデータベース1の複製である文字列ベクトルデータベース2を生成した後、前記テキスト中の、連続する有限個の単語の列である所定の範囲に存在する、前記文字列ベクトルデータベース1中の文字列A、Bの任意の対に対し、当該文字列Aの前記文字列ベクトルデータベース2中のベクトルに、前記文字列Bの前記文字列ベクトルデータベース1中のベクトルv(B)をスカラー倍したものを加算し、前記文字列Bの前記文字列ベクトルデータベース2中のベクトルに、前記文字列Aの前記文字列ベクトルデータベース1中のベクトルv(A)をスカラー倍したものを加算することを、前記テキスト中の全ての前記所定の範囲にわたって繰り返し、その結果得られた文字列ベクトルデータベース2を出力する。 (もっと読む)


【課題】内容網羅性及び可読性の高い要約を生成することができるテキスト要約技術を提供する。
【解決手段】2つの素性要素の順序を考慮した組合せである素性に対する重みパラメタと、文を構成する文要素に対する文要素スコアを予め記憶しておき、入力文を変換し、各入力文に対し1以上の変換文を生成し、変換文から素性要素を抽出し、各変換文に含まれる文要素に対する文要素スコアを用いて、各変換文の内容性スコアを求め、素性要素抽出部で抽出した素性要素と重みパラメタを用いて、変換文の連接スコアを求め、内容性スコアと連接スコアの和が、最大値となる、または、最大値の近似値となる変換文の順列を探索する。 (もっと読む)


【課題】単語集合の中から重要単語を判別する際に、記憶容量の増大を抑制するとともに、パケットの到着に応じてTFIDFを更新する技術を提供する。
【解決手段】HTTPデータ組立部22は、パケット受信部21が端末10から受信したパケットに格納されているHTTPの断片化したデータを連結して元のHTTPデータに戻す。キーワード抽出部23は、元のHTTPデータに形態素解析等を適用し、単語を抽出する。演算部24は、受信した単語ごとに、キーワードパラメータDB25から演算処理に必要なパラメータを取得して単語の重要度を算出する。単語の重要度は、1つ前の過去の値を用いて演算できる漸化式の形式で表現されるので、記憶容量の増大を抑制し、リアルタイムで演算可能である。重要単語転送部26は、算出した単語の重要度または単語の重要度の値の大きい重要単語をパケット化して、サービス機器40へ送信する。 (もっと読む)


【課題】ユーザから入力された単語に関連する情報であって、当該単語が入力された時以降に更新された情報を、以後の単語入力や検索実行命令を要せずに、ユーザが任意の時点で得られ、ユーザが入力した単語に限定することなく幅を持たせた情報をユーザに提供することができる情報提供システムを提供する。
【解決手段】情報提供サーバ1にネットワークを介して接続されたユーザ端末10により登録された単語の蓄積後、一定期間毎に、前記単語を検索単語として、所定サイト内から検索単語を含む単語を検索する情報提供システムとする。 (もっと読む)


【課題】他の文書からの引用を含み、他の文書に対する所感が書かれている文書から所感部分だけを抽出する。
【解決手段】原典文書DB15と、引用終端表現辞書DB16と、入力文書と原典文書DB15に蓄積されている原典文書とを照合し、原典文書からの引用を含む入力文書を検出して、その検出した入力文書と、その検出した入力文書中の引用開始位置及び引用終了位置とを出力する引用検出部12と、引用検出部12が出力する入力文書、引用開始位置及び引用終了位置を取得し、引用開始位置及び引用終了位置を基に入力文書から引用部分以外の文字列を抽出し、その抽出した文字列と引用終端表現辞書DB16に格納されている引用終端表現辞書とを照合し、抽出した文字列に引用終端表現が含まれている場合にはその引用終端表現より後の文字列を所感文章として抽出する所感抽出部13とを具備する。 (もっと読む)


【課題】ユーザの現在位置やユーザの状況に合わせて適切な文を検索し、ユーザに提示することが可能な情報処理装置、テキスト選択方法及びプログラムを提供すること。
【解決手段】本発明に係る情報処理装置に、ユーザの動きを検知するセンサ及び現在位置を表す情報を取得するセンサから出力されたセンサ情報を取得するセンサ情報取得部と、前記ユーザの動きを検知するセンサからのセンサ情報を解析して、ユーザが比較的短時間に行う行動を分類した複数の行動パターンの中から、取得したセンサ情報に対応する行動パターンを検出する行動パターン検出部と、前記現在位置を表すセンサ情報に基づいて、前記現在位置を表す情報を現在位置に関係する1又は複数のキーワードへと変換するキーワード変換部と、前記行動パターン及び前記1又は複数のキーワードに基づいて、複数のテキストの中からユーザに提示するテキストを抽出するテキスト抽出部と、を設けた。 (もっと読む)


【課題】使用者の利便性を高める文字変換装置、文字変換システム、文字変換方法およびプログラムを提供する。
【解決手段】文字変換装置は、所定の単語と、その所定の単語の類義語と、を互いに関連付けて記憶する記憶部と、文書を受け付けると、文書に含まれる構成単語を検出する検出部と、検出手段にて検出された構成単語が、記憶部内の類義語と一致する場合には、その構成単語を、所定の単語に変換する変換部と、を含む。 (もっと読む)


【課題】文書インデックスの更新を効率的に行うことができるようにする。
【解決手段】データ処理装置30は、所定の更新タイミングにおいて、単語重み値の再計算処理を行う。この際、全文書数Nの増減率Npが所定の閾値を上回るか否かを判定し(ステップS11)、増減率Npが閾値を上回る場合、抽出されている単語の全てについて、単語重み値を一括して再計算する(ステップS12)。これに対し、増減率Npが閾値を下回る場合(ステップS11でNO)、単語重み値の一括再計算は実行されない。この場合、個々の単語ごとに、単語重み値の再計算が必要であるか否かが判定される(ステップS13)。ある単語について文書頻度dfの増減率が所定の閾値を上回る場合は、その単語重み値の再計算が実行される。一方、文書頻度dfの増減率が所定の閾値を下回る場合、その単語重み値の再計算は実行されない(ステップS14)。 (もっと読む)


【課題】フレーズレベルの同義又は類義関係の認識を容易にするために、フレーズの特徴量の有意性を維持又は向上させながら特徴量の次元を圧縮すること。
【解決手段】複数の文を有する文集合、及び上記文集合に含まれる複数のフレーズを取得するデータ取得部と、上記データ取得部により取得される各フレーズの特徴を表すフレーズ特徴量を決定するフレーズ特徴量決定部と、上記文集合の特徴を表す集合特徴量を決定する集合特徴量決定部と、上記フレーズ特徴量よりも次元の低い圧縮フレーズ特徴量であって、上記データ取得部により取得される各フレーズの特徴を表す上記圧縮フレーズ特徴量を、上記フレーズ特徴量と上記集合特徴量とを用いて生成する圧縮部と、を備える情報処理装置を提供する。 (もっと読む)


【課題】入力文書に適した画像を付与する画像選定装置を提供する。
【解決手段】入力文書よりキーワード抽出部2でキーワードを抽出し、属性判別部3で入力文書の属性を判別する。重み付与部4は単語重みDB5を検索して各キーワードと属性とに対する単語重みを算出する。画像検索部6は単語・画像DB7内の各画像を検索して各キーワードと属性に対応する候補画像の関連度を求め、各候補画像に対して単語重みと関連度とから画像選択スコアを算出し、該スコアに基づいて候補画像の中から入力文書に対して付与すべき画像を選定する。 (もっと読む)


【課題】ユーザの検索意図に合致したWebページを効率的に提示する。
【解決手段】検索キーワードを検索サーバ28に送信して検索を依頼する手段と、送信された検索結果リストをクライアント端末24に送信し、基準Webページの選択を促す手段と、この基準Webページ中のテキストを形態素単位に分解し、名詞をキーワードとして抽出する手段と、各抽出キーワードと検索キーワードを検索サーバ28に送信して検索を依頼する手段と、検索結果リストの中から、それぞれページランク順に上位20件のWebページを類似候補ページとして抽出する手段と、各検索式に係る類似候補ページ間における類似度を算出する手段と、類似度の高い方から20件の検索式に係る抽出キーワードを重要語と認定する手段と、全類似候補ページ中で重要語を3種以上含むものを類似ページと認定する手段と、類似ページリスト画面をクライアント端末24に送信する手段を備える。 (もっと読む)


【課題】 文末表現のパターンマッチでは抽出できない表現であっても、特許文献から効果表現を高精度に抽出する。
【解決手段】 プロセッサと、前記プロセッサに接続されるメモリと、を備え、入力された特許文献の文の中から効果表現を抽出する文書分析装置は、効果要素判定制御部と、尺度要素判定制御部と、対象要素判定制御部と、効果表現特定部と、構成要素判定結果記憶部と、を備え、前記特許文献中の文の中から、前記効果要素判定制御部は、効果要素である単語を特定し、前記尺度要素判定制御部は、前記効果要素の判定結果を用いて、尺度要素である単語を特定し、前記対象要素判定制御部は、前記効果要素と、前記尺度要素の判定結果と、を用いて、対象要素である単語を特定し、前記効果表現特定部は、前記与えられた特許文献の文の中から効果表現を特定する。 (もっと読む)


【課題】テキストコンテンツに対してより簡便に臨場感を付与することが可能な、情報処理装置、情報処理方法及びプログラムを提供すること。
【解決手段】本発明に係る情報処理装置は、テキストコンテンツの少なくとも一部の特徴を表す特徴キーワードを認識する認識部と、認識された前記特徴キーワードに応じて、前記テキストコンテンツの外部から当該テキストコンテンツに関連する付加情報を取得する付加情報取得部と、前記付加情報取得部が取得した前記付加情報が前記テキストコンテンツの一部と共に出力されるように制御する制御部と、を備える。 (もっと読む)


81 - 100 / 794