説明

カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法

【課題】検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリごとに共通する付加情報を付加することができるカテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法を提供すること。
【解決手段】カテゴリ別共通付加情報追加装置1は、付加情報抽出部142により、アーカイブDB131に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、共通語DB132に記憶されている共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを付加情報DB133に記憶させる。カテゴリ別共通付加情報追加装置1は、付加情報追加部145により、付加情報DB133に記憶されているWebページを示すURLが検索結果ページに含まれている場合、当該URLに対応する共通語及び付加情報を検索結果ページに追加する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法に関する。
【背景技術】
【0002】
インターネット上には、Webページを検索できる検索サイトが存在している。検索サイトでは、検索クエリを受け付けたことに応じて、検索結果ページを出力する。この検索結果ページには、Webページのタイトル、URL及びWebページの一部の情報を示すスニペットが含まれている(例えば、特許文献1参照)。このスニペットは、Webページにおいて検索クエリが含まれている文章や当該文章の前後の文章とされることが多い。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−234290号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、Webページには、当該Webページの属するカテゴリごとに共通の付加情報が含まれている場合が多い。具体的には、例えば、レシピのカテゴリに属するWebページには「調理時間」や「カロリー」といった共通の付加情報が含まれている。そして、当該カテゴリごとに共通の付加情報は、当該カテゴリに属するWebページ同士を対比するうえで有効な情報であると考えられる。したがって、検索要求を送信したユーザに対して、所定のカテゴリに属するWebページに含まれている共通の付加情報を、検索結果を示すスニペットにおいて閲覧することができれば好適である。
【0005】
しかしながら、従来の技術において、スニペットは、Webページにおいて検索クエリが含まれている文章及び当該文章の前後の文章に基づいて構成することが多いため、当該付加情報が検索クエリに含まれている場合以外は、当該スニペットに当該Webページの属するカテゴリごとに共通の付加情報が含まれるとは限らない。
【0006】
そこで、本発明は、検索結果ページに、Webページのカテゴリごとに共通の付加情報を付加することができるカテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
(1)ユーザ端末に通信可能に接続され、Webページが属するカテゴリごとに共通の付加情報を検索結果ページに追加するカテゴリ別共通付加情報追加装置であって、Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段と、前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出手段と、前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出手段によって記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出手段と、前記ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加手段と、前記付加情報追加手段により前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信手段と、を備えるカテゴリ別共通付加情報追加装置。
【0008】
(1)のカテゴリ別共通付加情報追加装置は、共通語抽出手段により、カテゴリごとに、Webページ記憶手段に記憶されているWebページに所定の頻度で出現する共通語を抽出し、当該カテゴリと抽出した共通語とを関連付けて記憶し、付加情報抽出手段により、Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、共通語抽出手段によって記憶された共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる。そして、(1)のカテゴリ別共通付加情報追加装置は、付加情報追加手段により、ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに付加情報記憶手段に記憶されているWebページを示すURLが含まれている場合、当該Webページを示すURLに対応する共通語及び付加情報を、付加情報記憶手段から抽出して当該検索結果ページに追加し、送信手段により、付加情報追加手段により付加情報が付加された検索結果ページを前記ユーザ端末に送信する。
【0009】
よって、(1)のカテゴリ別共通付加情報追加装置は、検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリに対応する共通語及び当該共通語に係る付加情報を付加して、検索結果ページをリッチ化することができる。また、共通語及び付加情報が検索結果ページのスニペットに含まれていない場合であっても、検索結果ページに共通語及び付加情報を表示させるので、ユーザが当該共通語及び付加情報を必要としている場合において、利便性を高めることができる。
【0010】
(2)前記共通語抽出手段は、前記カテゴリごとに、当該カテゴリに属するWebページに含まれる語のうち、DF(Document Frequency)が相対的に高い語を前記共通語として抽出する、(1)に記載のカテゴリ別共通付加情報追加装置。カテゴリ別共通付加情報追加装置。
【0011】
このようにすることで、(2)のカテゴリ別共通付加情報追加装置は、DFという尺度を用いてWebページに所定の頻度で出現する共通語を抽出することができる。
【0012】
(3)検索結果ページにWebページが属するカテゴリごとに共通の付加情報を追加するカテゴリ別共通付加情報追加装置が実行するカテゴリ別共通付加情報追加方法であって、前記カテゴリ別共通付加情報追加装置は、前記Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段を備え、前記カテゴリ別共通付加情報追加方法は、前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出ステップと、前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出ステップにおいて記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出ステップと、ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加ステップと、前記付加情報追加ステップにおいて前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信ステップと、を含むカテゴリ別共通付加情報追加方法。
【0013】
この方法によれば、(1)に係る発明と同様の効果を奏する。
【発明の効果】
【0014】
本発明によれば、検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリごとに共通付加情報を付加することができるカテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法を提供することができる。
【図面の簡単な説明】
【0015】
【図1】本実施形態に係るカテゴリ別共通付加情報追加装置の機能概要を示す図である。
【図2】本実施形態に係るアーカイブDBを示す図である。
【図3】本実施形態に係る共通語DBを示す図である。
【図4】本実施形態に係る付加情報DBを示す図である。
【図5】本実施形態に係るインデックスDBを示す図である。
【図6】本実施形態に係る検索結果ページに共通語及び付加情報が表示された例を示す図である。
【図7】本実施形態に係るカテゴリ別共通付加情報追加装置において、アーカイブDBから共通語を抽出してから、付加情報DBに付加情報を記憶させるまでの処理の流れを示すフローチャートである。
【図8】本実施形態に係るカテゴリ別共通付加情報追加装置において、ユーザ端末から検索要求を受け付けてから検索結果ページをユーザ端末に送信するまでの処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について図を参照しながら説明する。
【0017】
[機能構成]
図1は、本実施形態に係るカテゴリ別共通付加情報追加装置1の機能概要を示す図である。カテゴリ別共通付加情報追加装置1は、Webページが属するカテゴリごとの共通付加情報を検索結果ページに追加することができるサーバである。
【0018】
本実施形態は、コンピュータ(カテゴリ別共通付加情報追加装置1)及びその周辺装置に適用される。本実施形態における各部は、コンピュータ及びその周辺装置が備えるハードウェア並びに当該ハードウェアを制御するソフトウェアによって構成される。
【0019】
上記ハードウェアには、制御部としてのCPU(Central Processing Unit)の他、記憶部、通信装置、表示装置及び入力装置が含まれる。記憶部としては、例えば、メモリ(RAM:Random Access Memory、ROM:Read Only Memory等)、ハードディスクドライブ(HDD:Hard Disk Drive)及び光ディスク(CD:Compact Disk、DVD:Digital Versatile Disk等)ドライブが挙げられる。通信装置としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示装置としては、例えば、液晶ディスプレイやプラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置としては、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)が挙げられる。
【0020】
上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶部により記憶され、制御部により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布されることも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布されることも可能である。
【0021】
カテゴリ別共通付加情報追加装置1は、操作者から直接的な入力を受け付ける操作部11と、このカテゴリ別共通付加情報追加装置1の機能に関する情報を表示する表示部12と、本実施形態に係る機能を実行するプログラム(図示省略)等を記憶する記憶部13と、カテゴリ別共通付加情報追加装置1に係る各機能を統括的に制御する制御部14と、を備える。
【0022】
操作部11は、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)により実装される。
表示部12は、例えば、液晶ディスプレイやプラズマディスプレイ等の各種ディスプレイにより実装される。
【0023】
記憶部13は、上述の各種プログラムの他に、Webページ記憶手段としてのアーカイブDB131と、共通語記憶手段としての共通語DB132と、付加情報記憶手段としての付加情報DB133と、インデックスDB134と、を備える。
【0024】
制御部14は、共通語抽出手段としての共通語抽出部141と、付加情報抽出手段としての付加情報抽出部142と、検索要求受付部143と、検索部144と、付加情報追加手段としての付加情報追加部145と、送信手段としての検索結果ページ送信部146と、を備える。
【0025】
共通語抽出部141は、Webページの属するカテゴリごとに、アーカイブDB131に記憶されているWebページに所定の頻度で出現する共通語を抽出する。具体的には、共通語抽出部141は、カテゴリごとに、当該カテゴリに属するWebページの形態素解析を行い、当該Webページに含まれる語を特定する。そして、共通語抽出部141は、当該Webページに含まれる語のうち、DF(Document Frequency)が相対的に高い語を共通語として抽出する。ここで、DFとは、語が含まれている文書(Webページ)の数をいう。例えば、所定の語WのDFとは、所定の語Wが少なくとも1つ含まれているWebページの数をいう。
【0026】
続いて、共通語抽出部141は、カテゴリと抽出した共通語とを関連付けて共通語DB132に記憶させる。
ここで、共通語抽出部141は、DFが相対的に高い語が複数抽出された場合に、これら複数の語を共通語候補として表示部12に表示させて、操作部11を介して、これら複数の語のうち、共通語とする語の選択を受け付けるようにしてもよい。
【0027】
図2は、本実施形態に係るアーカイブDB131を示す図である。
アーカイブDB131は、カテゴリごとに、Webページと、当該Webページを示すURLとを関連付けて記憶する。このアーカイブDB131には、クローラにより取得されたWebページや、RSSリーダにより取得されたRSSの更新情報や、コンテンツプロバイダ等から受信するデータフィード等が含まれる。
【0028】
なお、本実施形態では、図2において、アーカイブDB131を1つのみ備えていることとしたが、これに限らず、複数のアーカイブDBを備えるようにしてもよい。この場合、複数のアーカイブDBそれぞれは、異なる種類のクローラ等により取得されたWebページを記憶するようにしてもよい。そして、複数のアーカイブDBにおいて、同一のWebページが複数の異なるURLで示されている場合に、このURLを調整するようにしてもよい。
【0029】
例えば、一方のアーカイブDBにおいて、あるWebページを示すURLが「www.???.com/%E6%A4%9C%E7%B4%A2/1234567」であり、他方のアーカイブDBにおいて、同一のWebページを示すURLが「www.???.com/検索/1234567」である場合に、2つのWebページのいずれか一方のみ共通語抽出部141及び付加情報抽出部142において参照するようにしてもよい。例えば、共通語抽出部141及び付加情報抽出部142は、URLの末尾の所定数の文字列が一致する場合に、同一のWebページであると判定するようにしてもよい。
【0030】
図3は、本実施形態に係る共通語DB132を示す図である。
共通語DB132は、カテゴリと、当該カテゴリに属する複数のWebページの共通語とを関連付けて記憶する。
【0031】
図4は、本実施形態に係る付加情報DB133を示す図である。
付加情報DB133は、Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる共通語に係る付加情報とを関連付けて記憶する。
【0032】
図1に説明を戻す。付加情報抽出部142は、アーカイブDB131に記憶されているWebページごとに、当該Webページが属するカテゴリに対応する共通語を、共通語DB132を参照することによって特定する。続いて、付加情報抽出部142は、当該Webページから、特定した共通語に係る付加情報を抽出する。
【0033】
例えば、付加情報抽出部142は、Webページのタグ情報を参照し、共通語の近傍の文字列を抽出する。ここで、付加情報抽出部142は、共通語の近傍の文字列が複数存在する場合、これら複数の文字列を付加情報の候補として表示部12に表示させてもよい。そして、付加情報抽出部142は、操作部11を介して、これら複数の文字列のうち、付加情報とする文字列の選択を受け付けるようにしてもよい。また、複数のWebページが同一のドメインに属している場合において、一のWebページについて、操作部11を介して、付加情報とする文字列の選択を受け付けたとき、付加情報抽出部142は、他のWebページについて、操作部11を介して選択された付加情報と同じ位置の情報を付加情報として抽出するようにしてもよい。
【0034】
続いて、付加情報抽出部142は、Webページを示すURLと、当該Webページに含まれる共通語と、当該Webページに含まれる共通語に係る付加情報とを関連付けて付加情報DB133に記憶させる。
【0035】
検索要求受付部143は、ユーザ端末2から、検索クエリを受け付けることにより、検索要求を受け付ける。
【0036】
検索部144は、検索要求受付部143により検索要求を受け付けたことに応じて、インデックスDB134を参照して、検索要求受付部143により受け付けられた検索クエリに対応するURLと、当該URLに対応するスニペットとを含む検索結果ページを生成する。
【0037】
図5は、本実施形態に係るインデックスDB134を示す図である。インデックスDB134は、Webページを示すアドレス(URL)と、当該Webページのインデックスとしてのテキスト情報と、スニペットとを関連付けて記憶する。
【0038】
図1に説明を戻す。付加情報追加部145は、ユーザ端末2から検索要求を受け付けたことに応じて検索部144において生成された検索結果ページに、付加情報DB133に記憶されているWebページを示すURLが含まれているか否かを判定する。付加情報追加部145は、検索結果ページに、付加情報DB133に記憶されているWebページを示すURLが含まれている場合、付加情報DB133から、当該Webページに含まれる共通語及び付加情報を抽出する。
【0039】
続いて、付加情報追加部145は、検索結果ページの所定位置に、抽出した共通語及び付加情報を追加する。ここで、所定位置は、抽出した共通語及び付加情報に対応するWebページのスニペット及びURLの近傍である。
【0040】
図6は、本実施形態に係る検索結果ページPに共通語及び付加情報P1が表示された例を示す図である。
検索結果ページPに掲載されているURL「http://www.gourmet.***.jp/123.htm」が、図4に示すように付加情報DB133に含まれているとすると、付加情報追加部145によって、付加情報DB133から、共通語及び付加情報として「カロリー」、「123kcal」、「調理時間」及び「15分」が抽出され、図6に示すように共通語及び付加情報P1として検索結果ページに追加される。
【0041】
検索結果ページ送信部146は、付加情報追加部145により付加情報が付加された検索結果ページをユーザ端末2に送信する。なお、検索結果ページ送信部146は、付加情報追加部145により付加情報が付加されなかった場合、検索部144によって生成された検索結果ページをユーザ端末2に送信する。
【0042】
[フローチャート]
続いて、カテゴリ別共通付加情報追加装置1における処理の流れについて説明する。
図7は、本実施形態に係るカテゴリ別共通付加情報追加装置1において、アーカイブDB131から共通語を抽出してから、付加情報DB133に付加情報を記憶させるまでの処理の流れを示すフローチャートである。
【0043】
ステップS1において、制御部14(共通語抽出部141)は、カテゴリごとに、当該カテゴリに属するWebページの形態素解析を行い、当該Webページに含まれる語を特定する。
ステップS2において、制御部14(共通語抽出部141)は、DFが相対的に高い語を共通語として抽出する。
ステップS3において、制御部14(共通語抽出部141)は、カテゴリと、当該カテゴリに対応する共通語を共通語DB132に記憶させる。
【0044】
ステップS4において、制御部14(付加情報抽出部142)は、アーカイブDB131に記憶されているWebページごとに、共通語DB132を参照して、当該Webページが属するカテゴリに対応する共通語を特定する。
ステップS5において、制御部14(付加情報抽出部142)は、ステップS4において特定した共通語に係る付加情報をWebページから抽出する。
【0045】
ステップS6において、制御部14(付加情報抽出部142)は、Webページを示すURLと、ステップS4において特定した共通語と、ステップS5において抽出された付加情報とを付加情報DB133に記憶させる。
【0046】
図8は、本実施形態に係るカテゴリ別共通付加情報追加装置1において、ユーザ端末2から検索要求を受け付けてから検索結果ページをユーザ端末2に送信するまでの処理の流れを示すフローチャートである。なお、本実施形態では、図7に示す処理が行われる前に、付加情報DB133に、Webページを示すURLと、共通語と、付加情報とが関連付けられて記憶されているものとする。
【0047】
ステップS11において、制御部14(検索要求受付部143)は、ユーザ端末2から、検索クエリを受け付けることにより、検索要求を受け付ける。
ステップS12において、制御部14(検索部144)は、ステップS11において検索要求を受け付けたことに応じて、インデックスDB134を参照して、ステップS11において受け付けられた検索クエリに対応するURLと、当該URLに対応するスニペットとを含む検索結果ページを生成する。
【0048】
ステップS13において、制御部14(付加情報追加部145)は、ステップS2において生成された検索結果ページに、付加情報DB133に記憶されているWebページを示すURLが含まれているか否かを判定する。制御部14(付加情報追加部145)は、この判定がYESの場合、ステップS14に処理を移し、この判定がNOの場合、ステップS16に処理を移す。
【0049】
ステップS14において、制御部14(付加情報追加部145)は、付加情報DB133に記憶されているWebページのうち、検索結果ページに掲載されているWebページに含まれる共通語及び付加情報を付加情報DB133から抽出する。
ステップS15において、制御部14(付加情報追加部145)は、ステップS14において抽出された共通語及び付加情報を、検索結果ページに掲載されている、当該共通語及び付加情報に対応するWebページの近傍に追加する。
【0050】
ステップS16において、制御部14(検索結果ページ送信部146)は、ステップS15において共通語及び付加情報が付加された検索結果ページ又はステップS12において生成された検索結果ページをユーザ端末2に送信する。
【0051】
以上、本実施形態によれば、カテゴリ別共通付加情報追加装置1は、共通語抽出部141により、カテゴリごとに、アーカイブDB131に記憶されているWebページに所定の頻度で出現する共通語を抽出し、当該カテゴリと抽出した共通語とを関連付けて共通語DB132に記憶させ、付加情報抽出部142により、アーカイブDB131に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、共通語DB132に記憶されている共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを付加情報DB133に記憶させる。そして、カテゴリ別共通付加情報追加装置1は、付加情報追加部145により、ユーザ端末2から検索要求を受け付けたことに応じて生成された検索結果ページに付加情報DB133に記憶されているWebページを示すURLが含まれている場合、当該Webページを示すURLに対応する共通語及び付加情報を、付加情報DB133から抽出して当該検索結果ページに追加し、検索結果ページ送信部146により、付加情報追加部145により付加情報が付加された検索結果ページをユーザ端末2に送信する。
【0052】
よって、カテゴリ別共通付加情報追加装置1は、検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリに対応する共通語及び当該共通語に係る付加情報を付加して、検索結果ページをリッチ化することができる。また、カテゴリ別共通付加情報追加装置1は、共通語及び付加情報が検索結果ページのスニペットに含まれていない場合であっても、検索結果ページに共通語及び付加情報を表示させるので、ユーザが当該共通語及び付加情報を必要としている場合において、利便性を高めることができる。
【0053】
また、カテゴリ別共通付加情報追加装置1は、共通語抽出部141により、カテゴリごとに、当該カテゴリに属するWebページに含まれる語のうち、DFが相対的に高い語を共通語として抽出するので、DFという尺度を用いてWebページに所定の頻度で出現する共通語を抽出することができる。
【0054】
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
【0055】
本実施形態では、カテゴリ別共通付加情報追加装置1というコンピュータを例にとって説明したが、本発明はコンピュータに限られるものではなく、コンピュータが各種機能を実行する方法、コンピュータに各種機能を実行させるためのプログラム及びこのプログラムを記憶した記憶媒体にも適用可能である。
【符号の説明】
【0056】
1 カテゴリ別共通付加情報追加装置
2 ユーザ端末
11 操作部
12 表示部
13 記憶部
14 制御部
131 アーカイブDB
132 共通語DB
133 付加情報DB
134 インデックスDB
141 共通語抽出部
142 付加情報抽出部
143 検索要求受付部
144 検索部
145 付加情報追加部
146 検索結果ページ送信部

【特許請求の範囲】
【請求項1】
ユーザ端末に通信可能に接続され、Webページが属するカテゴリごとに共通の付加情報を検索結果ページに追加するカテゴリ別共通付加情報追加装置であって、
Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段と、
前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出手段と、
前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出手段によって記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出手段と、
前記ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加手段と、
前記付加情報追加手段により前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信手段と、
を備えるカテゴリ別共通付加情報追加装置。
【請求項2】
前記共通語抽出手段は、前記カテゴリごとに、当該カテゴリに属するWebページに含まれる語のうち、DF(Document Frequency)が相対的に高い語を前記共通語として抽出する、
請求項1に記載のカテゴリ別共通付加情報追加装置。
【請求項3】
検索結果ページにWebページが属するカテゴリごとに共通の付加情報を追加するカテゴリ別共通付加情報追加装置が実行するカテゴリ別共通付加情報追加方法であって、
前記カテゴリ別共通付加情報追加装置は、
前記Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段を備え、
前記カテゴリ別共通付加情報追加方法は、前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出ステップと、
前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出ステップにおいて記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出ステップと、
ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加ステップと、
前記付加情報追加ステップにおいて前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信ステップと、を含むカテゴリ別共通付加情報追加方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−215966(P2012−215966A)
【公開日】平成24年11月8日(2012.11.8)
【国際特許分類】
【出願番号】特願2011−79328(P2011−79328)
【出願日】平成23年3月31日(2011.3.31)
【出願人】(500257300)ヤフー株式会社 (1,128)