説明

データ先読みシステムとその装置と方法とプログラム

【課題】RSSリーダーで知り得た更新されたWebページデータを、ユーザの操作を全く必要としないで効率的にデータ先読み装置に提供するデータ先読みシステムの提供。
【解決手段】ユーザがRSS更新情報を更新する時に、先読み単語テーブル生成部が、タイトルと要約文を構成するタイトル単語と要約文単語を抽出し、タイトル単語の重みを重くして各単語の単語ポイントを計算すると共にRSS更新情報のユーザの閲覧回数をドメインポイントとして計数し、単語ポイントとドメインポイントの和を、各単語のキーワードポイントとして計算してリンク先のURLのドメイン名と対応付けた先読み単語テーブルを生成する。そして、先読み決定部は、RSS更新情報受信時に上記先読み単語テーブルを参照して、上記キーワードポイントが所定値以上の単語をRSS更新情報のタイトルに含むそのRSS更新情報のリンク先からWebページデータをダウンロードする。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、RSSリーダーを備えたWebページを先読みするデータ先読みシステムとその装置と方法と、プログラムに関する。
【背景技術】
【0002】
RSSリーダーとは、検索対象となるWebサイトの情報が新しく更新されているかどうかについて、RSS(RDF Summary/ Rich Site Summary/ Really Simple Syndication/等の略)等の形式の新着情報を受信して、リンク一覧の形式で表示するソフトウェアである。また、RSSとは、XML(eXtensible Markup Language)ベースの言語書式の一種で、Webサイトの新着情報を記述するのに用いられる。
【0003】
RSSで記述された文書には、Webサイトの各ページのタイトル、その情報へのURL、更新日時、要約が含まれる。このRSS文書を用いることで、多数のWebサイトの新着情報を統一的な方法で効率的に把握することが可能である。
【0004】
ユーザは、その新着情報によって更新されたWebサイトのページのタイトルと要約を知り、必要があればそのWebサイトにアクセスして更新されたページを閲覧する。ここで、そもそもRSSリーダーは、ユーザが関心のあるWebページのURL(Uniform Resource Locator)を登録して置き、その更新されたWebページの最新記事を即座に知る目的で用いられる。ここで、更新された最新記事をユーザが操作しないで先読みが行えれば、ユーザは即座(通信時間が0)に記事が閲覧出来て便利である。
【0005】
しかし、RSSリーダーで収集した更新記事の全部をユーザが指示する前にWebサイトからダウンロードする(先読みする)と、端末側のメモリを圧迫してしまう課題がある。したがって、全てのRSS更新情報にアクセスすることは出来ない。そこで、RSSリーダーと組み合わせて効率的にWebページを先読みするシステム/装置/方法が求められている。
【0006】
従来、Webページを先読みするシステムとして、例えば特許文献1に開示されたシステムが知られている。図10にそのシステムの構成を示して簡単に説明する。システムは、計算機1002と、計算機(ユーザ端末)1004と、通信路1000とで構成される。計算機1004は、先読みデータ判定基準1108、ユーザ定義キーワード及び重み1110、先読みデータ決定手段1012、データ先読み手段1202、他を備える。
【0007】
先読みデータ決定手段1012は、ユーザ定義キーワード及び重み1110と、先読みデータ判定基準1108とから先読みする読み出し順序を決定する。データ先読み手段1202は、その順序に従って計算機1002からデータを読み出してキャッシュデータ1112に書き込む。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開平11−120069号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
従来の先読み方法は、キーワード、そのキーワードの重み、また、判定基準、をユーザ自身で入力しなければならなかった。そもそもRSSリーダーを設定するのにURLの登録は必要であるが、その登録は、ブラウザのサブメニュー表示等をユーザが操作することで簡単に行える。しかし、その後の先読み過程において、キーワードと、更にその重みや、判定基準を入力するのは手間であり、ユーザに負担をかける。また、端末の操作も複雑にしてしまう。
【0010】
また、人の関心の対象は日々変化するものである。その変化は、ある対象を中心としてその周辺の対象に変化して行く場合が多い。従って、その都度、キーワードを入力し直すのも手間である。
【0011】
この発明は、このような課題に鑑みてなされたものであり、RSSリーダーで知り得た更新されたWebページデータを、ユーザの操作を全く必要としないで効率的に提供するデータ先読みシステムとその装置と方法と、プログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
この発明のデータ先読みシステムは、複数のRSS配信装置と複数のWebサーバとデータ先読み装置とを備える。データ先読み装置は、RSSリーダー処理部と、先読み単語テーブル生成部と、先読み決定部と、キャッシュデータ記憶部と、を具備する。RSSリーダー処理部は、RSS配信装置に対応するURLを登録したURLリスト内の所望のRSS配信装置からRSS更新情報を受信し、そのRSS更新情報からリンク先のURLとタイトルと要約文とを抽出する。先読み単語テーブル生成部は、RSS更新情報を閲覧する時にタイトルと要約文を構成するタイトル単語と要約文単語を抽出し、タイトル単語の重みを重くして各単語の単語ポイントを計算すると共にRSS更新情報のユーザの閲覧回数をドメインポイントとして計数し、上記単語ポイントと上記ドメインポイントの和を、上記各単語のキーワードポイントとして計算してその値を各単語に対応付けた先読み単語テーブルを生成する。先読み決定部は、RSS更新情報受信時に上記先読み単語テーブルを参照して、上記キーワードポイントが所定値以上の単語をRSS更新情報のタイトルに含むそのRSS更新情報のリンク先からWebページデータをダウンロードする。キャッシュデータ記憶部は、先読み決定部がダウンロードしたWebページデータを記憶する。
【0013】
また、URL提供サーバを備えたこの発明のデータ先読みシステムのデータ先読み装置は、更に、先読み単語候補記録部と、追加URL問い合わせ部と、追加URL抽出部と、を有する。先読み単語候補記録部は、先読み決定部が決定したリンク先に対応する単語をキーワードポイントと共に先読み単語候補として記録する。追加URL問い合わせ部は、先読み単語候補記録部内のキーワードポイントが所定値以上の複数の単語を、所定時間間隔で単語リストとして抽出し、その単語リストをURL提供サーバに送信して追加URLを問い合わせる。追加URL抽出部は、URL提供サーバから受信した追加URL情報から追加URLを抽出してRSSリーダー処理部のURLリストに追加登録する。
【発明の効果】
【0014】
この発明のデータ先読みシステムは、ユーザがRSS更新情報を閲覧する時に、先読み単語テーブルを生成する。そして、RSS更新情報の更新時に、その先読み単語テーブルを参照して、RSS更新情報のタイトルに先読み単語テーブルの上位に位置付けられた単語が含まれる場合に、そのRSS更新情報のリンク先からWebページをダウンロードする。つまり、ユーザの関心の高い単語をタイトルに含むWebページの先読みが自動的に行われる。この時に、キーワード等の入力が不要である。
【0015】
また、URL提供サーバを備えたこの発明のデータ先読みシステムのデータ先読み装置は、先読み決定部が選択したURLに対応する複数の単語の単語リストを、URL提供サーバに所定の時間間隔を空けて送信して、その単語リストに対応するWebページのURLの検索を要求する。そして、URL提供サーバから送られて来た追加URLをRSSリーダー処理部に新たに登録する。単語リストに含まれる単語は、ユーザの関心対象の変遷に連動して変化するものである。よって、ユーザの関心対象の変化に自動的に追従させてRSS配信装置のURLを追加することが出来る。
【図面の簡単な説明】
【0016】
【図1】この発明のデータ先読みシステムの機能構成例を示す図。
【図2】この発明のデータ先読みシステムの動作シーケンスを示す図。
【図3】この発明のデータ先読み装置100の機能構成例を示す図。
【図4】キーワード生成過程の動作フローを示す図。
【図5】RSS更新情報(アイテム)の一例を示す図。
【図6】RSS更新情報と単語ポイントの例を示す図であり、図6(a)はRSS更新情報1の例、図6(b)はRSS更新情報2の例、図6(c)は単語ポイントの例を示す図である。
【図7】この発明のデータ先読み装置200の機能構成例を示す図。
【図8】URL提供サーバを備えたこの発明のデータ先読みシステムの動作シーケンスを示す図。
【図9】この発明のURL提供サーバ300の機能構成例を示す図。
【図10】特許文献1に開示されたデータ先読みシステムの機能構成を示す図。
【発明を実施するための形態】
【0017】
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
【実施例1】
【0018】
図1に、この発明のデータ先読みシステムの機能構成例を示す。データ先読みシステムは、データ先読み装置100と、複数のRSS配信装置と、複数のWebサーバとを備える。各装置はインターネット20にそれぞれ接続される。図1では、RSS配信装置30とWebサーバ40のみを表記している。
【0019】
RSS配信装置30は、定められたWebサーバのWebページデータが更新されたことを表すタイトルと要約文とそのWebサーバのURLを含むRSS更新情報を、その配信要求の有ったデータ先読み装置100に送信するものである。Webサーバ40は、特定の運営管理者によってWebページデータが更新管理され、情報を提供するサーバである。
【0020】
図2に示す動作シーケンス図も参照してデータ先読みシステムを説明する。
【0021】
データ先読み装置100は、RSSリーダー処理部111と、先読み決定部113と、キャッシュデータ記憶部114と、先読み単語テーブル生成部115と、を有する。データ先読み装置100は、携帯電話等の携帯端末であっても良いし、パーソナルコンピュータでも良い。
【0022】
RSSリーダー処理部111は、ユーザのRSS更新要求に応じて(ステップS120のYes)、複数のRSS配信装置それぞれに対応するURLを登録したURLリスト内の所望のRSS配信装置から、RSS更新情報(アイテム)を受信し、そのRSS更新情報からリンク先のURLとタイトルと要約分を抽出する(ステップS111)。なお、URLリストには予め複数のURLが登録済みである前提で説明する。URLリストへのURLの登録は、上記したようにブラウザのサブメニュー表示等の操作で簡単に行える。また、RSS更新要求でない閲覧要求の場合(ステップS120のNo)は、ステップS115に遷移する。このステップS120の処理は、後述する制御手段120が行う。
【0023】
先読み決定部113は、RSS更新情報受信時に先読み単語テーブルを参照して、キーワードポイントが所定値以上の単語をRSS更新情報のタイトルに含むそのRSS更新情報のリンク先からWebページデータをダウンロードする(ステップS113のYes)。先読み単語テーブルに所定値以上のキーワードポイントを持つ単語が登録されていない場合は、Webページのダウンロードは行われない(ステップS113のNo)。
【0024】
キャッシュデータ記憶部114は、先読み決定部113がダウンロードしたWebページデータを記憶する(ステップS114)。
【0025】
先読み単語テーブル生成部115は、ユーザがRSS更新情報を閲覧する時に、RSS更新情報のタイトルと要約文を構成するタイトル単語と要約文単語を抽出し、タイトル単語の重みを重くして各単語の単語ポイントを計算すると共にRSS更新情報のユーザの閲覧回数をドメインポイントとして計数し、単語ポイントとドメインポイントの和を、各単語のキーワードポイントとして計算してリンク先のURLのドメイン名と対応付けた先読み単語テーブルを生成する(ステップS115)。
【0026】
このように、RSS更新情報のタイトルに含まれる単語の重みを重くして、単語ポイントを求め、その単語ポイントにドメインポイントを加えて単語のキーワードポイントとして生成する。そして、そのキーワードポイントの値が所定値以上の単語が、RSS更新情報のタイトルに含まれる場合に、そのRSS更新情報に含まれるリンク先から自動的にWebページデータがダウンロードされるので、ユーザがキーワード等を入力する必要が無い。
【0027】
次に、この発明のデータ先読みシステムを構成するデータ先読み装置200の機能構成例をより具体的に示して更に詳しく説明する。
【0028】
〔データ先読み装置〕
図3に、データ先読み装置100の機能構成例を示す。その動作フローを図4に示す。
データ先読み装置100は、プログラムが記憶されたROM(Read Only Memory)と、プログラムやデータを記憶する記憶装置と、これらプログラムを実行するCPUと、CPUが用いるデータ等を記憶するRAMとから成る制御手段120が、機能ブロック110を構成する各機能部の動作手順及び動作タイミングを制御してその機能を実現するものである。通信インターフェース130は、RSS配信装置30、Webサーバ40と通信するものである。これらの制御手段と機能ブロックと通信インターフェースの構成は、装置も同様に備える。
【0029】
データ先読み装置100の機能ブロック110は、RSSリーダー処理部111と、自動更新部112と、先読み決定部113と、キャッシュデータ記憶部114と、先読み単語テーブル生成部115と、を備える。なお、機能ブロック110においては、説明に不要な機能部である例えば表示部やキーボード等の入力部等は省略している。
【0030】
RSSリーダー処理部111は、URL抽出手段1111と、タイトル抽出手段1112と、要約文抽出手段1113と、アイテム更新手段1114と、URLリスト1115と、を備える。
【0031】
URLリストは、RSS配信情報を得たいRSS配信装置のURLのリストである。アイテム更新手段1114は、ユーザからRSS更新情報の更新要求が有った場合(ステップS1201)にURLリスト内の所望のURLのRSS配信装置にアクセスしてRSS更新情報(アイテム)を更新する(ステップS1114)。また、自動更新部112からの制御信号によって、URLリスト内の全てのURLのRSS配信装置にアクセスして自動的にアイテムを更新させても良い(ステップS1114′)。自動更新部112は、例えば24時間に1回といった頻度で制御信号を発生させる。なお、自動更新部112は無くても構わない。ユーザからRSS更新情報の閲覧要求があった時は、先読み単語テーブル生成過程(ステップS115)に遷移する(ステップS1201のNo)。
【0032】
図5に、アイテムの一例を示す。2行目はタイトルであり、3行目はリンク先のURLである。要約文は省略している。<item>〜</item>の範囲が、1個のRSS更新情報(アイテム)である。図5の例では2個のRSS更新情報を表している。
【0033】
URL抽出手段1111は、アイテムからリンク先のURLを抽出する(ステップS1111)。タイトル抽出手段1112は、アイテムからタイトル文を抽出する(ステップS1112)。要約文抽出部1113は、アイテムから要約文を抽出する。このRSSリーダー処理部111の動作は従来技術の範疇である。
【0034】
先読み決定部113は、キーワードポイントが所定値以上の単語をタイトルに含むRSS更新情報のリンク先からWebページデータをダウンロードする(ステップS113)。例えば、キーワードポイントの上位10位内の単語がタイトルに存在する場合にWebページを先読みする。
【0035】
先読み決定部113がダウンロードしたWebページデータは、キャッシュデータ記憶部114に記憶される(ステップS114)。ユーザは、キャッシュデータ記憶部114にダウンロードされたWebページデータを、Webサーバにアクセスすること無く閲覧することが出来る。
【0036】
先読み単語テーブル生成部115は、ドメインポイント計数手段1151と、タイトル単語テーブル1152と、タイトル単語抽出手段1153と、要約文単語抽出手段1154と、単語ポイント計算手段1155と、キーワードポイント計算手段1156と、先読み単語テーブル作成手段1157と、を備える。
【0037】
ドメインポイント計数手段1151は、RSS更新情報のユーザの閲覧回数をドメインポイントとして計数する(ステップS1151)。ここでドメインとは、図5に示したアイテムのリンク先のURLの最初のスラッシュ(/)で囲まれた部分のことである。図5の例では「example.com」がドメイン名である。
【0038】
RSS配信装置30が配信するWebサーバAのドメインを「www.a.com」、WebサーバBのドメインを「www.b.com」とした場合に、ユーザがドメイン「www.a.com」を例えば1回閲覧すると1点、ドメイン「www.b.com」を例えば3回閲覧すると3点と、なるポントがドメインポイントである。
【0039】
タイトル単語抽出手段1153は、RSSリーダー処理部111が抽出したタイトル文からタイトルを構成する単語を抽出する(ステップS1153)。抽出したタイトル単語はタイトル単語テーブル1152に記録される。要約文単語抽出手段1154は、RSSリーダー処理部111が抽出した要約文から要約を構成する単語を抽出する(ステップS1154)。
【0040】
単語ポイント計算手段1155は、タイトル単語テーブル1152を参照して、タイトル単語の重みを重くしてタイトル単語と要約文単語の各単語の単語ポイントを計算する(ステップS1155)。図6(a)と図6(b)にRSS更新情報1,2の例を示す。タイトル単語は、タイトルを構成する名詞のことである。この例では、「韓国」、「大型電気店」、「ソウルマート」、「ケータイショップ」である。要約文単語も同様である。
【0041】
図6(c)に単語ポイントの例を示す。「韓国」は、タイトル単語であり且つ要約文の中にも1回出現するので、その単語ポイントは6点ということになる。「大型電気店」はタイトル文に1回出現するのみで要約文には出現しないので5ということになる。このように単語ポイントは、タイトル単語の重みを重くしてその出現頻度によって増加するものである。
【0042】
キーワードポイント生成手段1156は、ドメインポイント計数手段1151が計数したドメインポイントと、単語ポイント計数手段1135が計算した単語ポイントの和をキーワードポイントとして生成する(ステップS1156)。図6(c)に例示する単語「韓国」の場合、そのキーワードポイントは単語ポイントの6点にアクセス回数の2点を加算した8点となる。
【0043】
このようにキーワードポイントは、単語ポイントが大きくて、ドメインポイントが多いと増加するポイントである。一般的に重要な用語は、繰り返し用いられるのでその出現頻度は高くなる。また、ユーザのRSS更新情報の閲覧回数はユーザの関心の高さを表す直接的な指標である。したがって、この2つを合わせたキーワードポイントが高い単語は、ユーザが関心を寄せている単語と考えることができる。
【0044】
先読み単語テーブル作成手段1157は、各単語のキーワードポイントをその単語と対応付けた先読み単語テーブルを作成する(ステップS1157)。
【0045】
上記した先読み決定部113は、RSS更新情報が更新された際に、この先読み単語テーブルを参照してキーワードポイントが所定値以上の単語をタイトルに含むRSS更新情報のリンク先からWebページデータをダウンロードする(ステップS113)。
【0046】
このように、この発明のデータ先読みシステムのデータ先読み装置は、キーワードの入力を必要としない。次に、ユーザの関心の対象の変化に応じて新たなRSS配信装置を自動的にRSSリーダー処理部に追加するデータ先読み装置200を説明する。
【実施例2】
【0047】
図7に、データ先読み装置200の機能構成例を示す。データ先読み装置200は、図1に破線で示したURL提供サーバ300がインターネットに接続されたデータ先読みシステムで用いられる。
【0048】
データ先読み装置200は、データ先読み装置100に対して、先読み単語候補記録部211と、URL問い合わせ部212と、追加URL抽出部213と、を備える点が異なる。なお、自動更新部112は省略している。
【0049】
図8の動作シーケンスも参照してその動作を説明する。データ先読み装置200のステップS115までの処理は、上記したデータ先読み装置100と同じである。
【0050】
先読み単語候補記録部211は、先読み決定部113が決定したリンク先に対応する単語をキーワードポイントと共に先読み単語候補として記録する(ステップS211)。URL問い合わせ部212は、先読み単語候補記録部211内のキーワードポイントが所定値以上の複数の単語を、所定時間間隔で単語リストとして抽出し、その単語リストをURL提供サーバ300に送信して追加URLを問い合わせる(ステップS212)。
【0051】
追加URL抽出部213は、URL提供サーバから受信した追加URL情報から追加URLを抽出してRSSリーダー処理部111のURLリスト1114に追加登録する(ステップS213)。
【0052】
URL問い合わせ部212が抽出する単語リストに含まれる単語は、ユーザの関心対象の変遷に連動して変化するものである。それらの複数の単語から成る単語リストを、URL提供サーバ300に送って、その単語リストに関連するRSS配信装置のURLを追加URL情報として入手し、RSSリーダー処理部111のURLリストに追加することで、ユーザの関心対象の変化に自動的に追従させてRSS配信装置のURLを追加することが出来る。
【0053】
このようにデータ先読み装置200とURL提供サーバ300を備えるデータ先読みシステムは、ユーザが特別な操作をすること無く、新たな関心対象に関する情報を配信するRSS配信装置のURLを追加することが可能である。
【0054】
〔URL提供サーバ〕
図9に、URL提供サーバ300の機能構成例を示す。URL提供サーバ300は、URL検索部311と、URLデータベース312と、追加URL送信部313と、を具備する。URL検索部311は、データ先読み装置200から受信した単語リストから関連するRSS配信装置のURLを追加URLとしてURLデータベースから検索する(ステップS311)。
【0055】
URLデータベース312には、単語とRSS配信装置のURLとが関連付けられて記憶されている。追加URL送信部313は、追加URLを含む追加URL情報をデータ先読み装置200に送信する。
【0056】
以上のように動作するURL提供サーバは、ユーザの関心対象の変遷に追従した新たなRSS配信装置のURLを、データ先読み装置に提供することができる。
上記した各装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
【0057】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
【0058】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0059】
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項1】
複数のRSS配信装置と複数のWebサイトとデータ先読み装置と、を備えたデータ先読みシステムであって、
上記データ先読み装置は、
複数のRSS配信装置それぞれに対応するURLを登録したURLリスト内の所望のRSS配信装置から、RSS更新情報を受信し、そのRSS更新情報からリンク先のURLとタイトルと要約文とを抽出するRSSリーダー処理部と、
RSS更新情報受信時に先読み単語テーブルを参照して、キーワードポイントが所定値以上の単語をRSS更新情報のタイトルに含むそのRSS更新情報のリンク先からWebページデータをダウンロードする先読み決定部と、
上記先読み決定部がダウンロードしたWebページデータを記憶するキャッシュデータ記憶部と、
上記RSS更新情報を閲覧する時に上記タイトルと要約文を構成するタイトル単語と要約文単語を抽出し、上記タイトル単語の重みを重くして各単語の単語ポイントを計算すると共に上記RSS更新情報のユーザの閲覧回数をドメインポイントとして計数し、上記単語ポイントと上記ドメインポイントの和を、上記各単語のキーワードポイントとして計算してその値を各単語に対応付けた先読み単語テーブルを生成する先読み単語テーブル生成部と、
を有することを特徴とするデータ先読みシステム。
【請求項2】
請求項1に記載したデータ先読みシステムにおいて、
更に、URL提供サーバを供え、
上記データ先読み装置は更に、
上記先読み決定部が決定したリンク先に対応する単語をキーワードポイントと共に先読み単語候補として記録する先読み単語候補記録部と、
上記先読み単語候補記録部内のキーワードポイントが所定値以上の複数の単語を、所定時間間隔で単語リストとして抽出し、その単語リストをURL提供サーバに送信して追加URLを問い合わせる追加URL問い合わせ部と、
上記URL提供サーバから受信した追加URL情報から追加URLを抽出して上記RSSリーダー処理部のURLリストに追加登録する追加URL抽出部と、
を有することを特徴とするデータ先読みシステム。
【請求項3】
複数のRSS配信装置と複数のWebサイトとデータ先読み装置と、を備えたデータ先読み方法であって、
複数のRSS配信装置それぞれに対応するURLを登録したURLリスト内の所望のRSS配信装置から、RSS更新情報を受信しそのRSS更新情報からリンク先のURLとタイトルと要約文とを抽出するRSSリーダー処理過程と、
RSS更新情報受信時に上記先読み単語テーブルを参照して、上記キーワードポイントが所定値以上の単語をRSS更新情報のタイトルに含むそのRSS更新情報のリンク先からWebページデータをダウンロードする先読み決定過程と、
上記先読み決定部がダウンロードしたWebページデータを記憶するキャッシュデータ記憶過程と、
上記RSS更新情報を閲覧する時に上記タイトルと要約文を構成するタイトル単語と要約文単語を抽出し、上記タイトル単語の重みを重くして各単語の単語ポイントを計算すると共に上記RSS更新情報のユーザの閲覧回数をドメインポイントとして計数し、上記単語ポイントと上記ドメインポイントの和を、上記各単語のキーワードポイントとして計算してその値を各単語に対応付けた先読み単語テーブルを生成する先読み単語テーブル生成過程と、
を含むことを特徴とするデータ先読み方法。
【請求項4】
請求項3に記載したデータ先読み方法において、
更に、URL提供サーバを供え、
上記データ先読み方法は更に、
上記先読み決定過程で決定されたリンク先に対応する単語を先読み単語候補として記録する先読み単語候補記録過程と、
上記先読み単語候補記録部内の単語キーワードポイントが所定値以上の複数の単語を、所定時間間隔で単語リストとして抽出し、その単語リストをURL提供サーバに送信して追加URLを問い合わせる追加URL問い合わせ過程と、
上記URL提供サーバから受信した追加URL情報から追加URLを抽出して上記RSSリーダー処理部のURLリストに追加登録する追加URL抽出過程と、
を含むことを特徴とするデータ先読み方法。
【請求項5】
請求項3又は4に記載したデータ先読み方法において、
上記先読み単語テーブル生成過程は、
ユーザのRSS更新情報の閲覧回数をドメインポイントとして計数するドメインポイント計数ステップと、
上記RSSリーダー処理過程で抽出した上記タイトルから当該タイトルを構成するタイトル単語を抽出するタイトル単語抽出ステップと、
上記RSSリーダー処理過程で抽出した上記要約文から当該要約文を構成する要約文単語を抽出する要約文単語抽出ステップと、
タイトル単語を記録したタイトル単語テーブルを参照し、タイトル単語の重みを重くして上記各単語の単語ポイントを計算する単語ポイント計算ステップと、
上記アクセス回数と上記ドメインポイントの和をキーワードポイントとして計算するキーワードポイント計算ステップと、
単語のキーワードポイントと各単語とを対応付けた先読み単語テーブルを作成する先読み単語テーブル作成ステップと、
を含むことを特徴とするデータ先読み方法。
【請求項6】
複数のRSS配信装置それぞれに対応するURLを登録したURLリスト内の所望のRSS配信装置から、RSS更新情報を受信しそのRSS更新情報からリンク先のURLとタイトルと要約文とを抽出するRSSリーダー処理部と、
RSS更新情報受信時に上記先読み単語テーブルを参照して、上記キーワードポイントが所定値以上の単語をRSS更新情報のタイトルに含むそのRSS更新情報のリンク先からWebページデータをダウンロードする先読み決定部と、
上記先読み決定部がダウンロードデータしたWebページデータを記憶するキャッシュデータ記憶部と、
上記RSS更新情報を閲覧する時に上記タイトルと要約文を構成するタイトル単語と要約文単語を抽出し、上記タイトル単語の重みを重くして各単語の単語ポイントを計算すると共に上記RSS更新情報のユーザの閲覧回数をドメインポイントとして計数し、上記単語ポイントと上記ドメインポイントの和を、上記各単語のキーワードポイントとして計算してその値を各単語に対応付けた先読み単語テーブルを生成する先読み単語テーブル生成部と、
を具備するデータ先読み装置。
【請求項7】
請求項6に記載したデータ先読み装置において、
更に、
上記先読み決定部が決定したリンク先に対応する単語を先読み単語候補として記録する先読み単語候補記録部と、
上記先読み単語候補記録部内のキーワードポイントが所定値以上の複数の単語を、所定時間間隔で単語リストとして抽出し、その単語リストをURL提供サーバに送信して追加URLを問い合わせる追加URL問い合わせ部と、
上記URL提供サーバから受信した追加URL情報から追加URLを抽出して上記RSSリーダー処理部のURLリストに追加登録する追加URL抽出部と、
を具備することを特徴とするデータ先読み装置。
【請求項8】
請求項6又は7に記載したデータ先読み装置において、
上記先読み単語テーブル生成部は、
ユーザのRSS更新情報の閲覧回数をドメインポイントとして計数するドメインポイント計数手段と、
上記RSSリーダー処理部が抽出した上記タイトルから当該タイトルを構成するタイトル単語を抽出するタイトル単語抽出手段と、
上記タイトル単語を記録するタイトル単語テーブルと、
上記RSSリーダー処理部が抽出した上記要約文から当該要約文を構成する要約文単語を抽出する要約文単語抽出手段と、
上記タイトル単語テーブルを参照し、タイトル単語の重みを重くして上記各単語の単語ポイントを計算する単語ポイント計算手段と、
上記アクセス回数と上記ドメインポイントの和をキーワードポイントとして計算するキーワードポイント計算手段と、
単語のキーワードポイントと各単語とを対応付けた単語テーブルを作成する先読み単語テーブル作成手段と、
を備えることを特徴とするデータ先読み装置。
【請求項9】
WebページのURLを記憶したURLデータベースと、
データ先読み装置から受信した単語リストから関連するRSS配信装置のURLを追加URLとしてURLデータベースから検索するURL検索部と、
上記追加URLを含む追加URL情報を上記データ先読み装置に送信する追加URL送信部と、
を具備するURL提供サーバ。
【請求項10】
請求項6乃至9の何れかに記載したデータ先読み装置又はURL提供サーバとしてコンピュータを機能させるためのプログラム。


【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図1】
image rotate


【公開番号】特開2012−113658(P2012−113658A)
【公開日】平成24年6月14日(2012.6.14)
【国際特許分類】
【出願番号】特願2010−264330(P2010−264330)
【出願日】平成22年11月26日(2010.11.26)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】