ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
【課題】 ユーザの識別を必要とせずに、ユーザを管理者の意図するウェブページに誘導することができないでいた。
【解決手段】 クライアント端末からのページ取得要求に応じて、該当するウェブページをクライアント端末の画面に表示するためのデータを送信するウェブサーバに接続して使用するリンク生成装置を提供する。リンク生成装置は、予めウェブページ毎に設定される重要キーワードが格納される記憶部を有し、検索サイトを経由するアクセスに使用される検索語句を抽出する。一のウェブページへのアクセスに使用された検索語句が、他のウェブページの重要キーワードである場合、リンク生成装置は、一のウェブページに対応する、マークアップ言語で記述されるウェブページファイルに、他のウェブページへのハイパーリンクを追加する。
【解決手段】 クライアント端末からのページ取得要求に応じて、該当するウェブページをクライアント端末の画面に表示するためのデータを送信するウェブサーバに接続して使用するリンク生成装置を提供する。リンク生成装置は、予めウェブページ毎に設定される重要キーワードが格納される記憶部を有し、検索サイトを経由するアクセスに使用される検索語句を抽出する。一のウェブページへのアクセスに使用された検索語句が、他のウェブページの重要キーワードである場合、リンク生成装置は、一のウェブページに対応する、マークアップ言語で記述されるウェブページファイルに、他のウェブページへのハイパーリンクを追加する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、HTML(Hyper Text Markup Language)、SGML(Standard Generalized Markup Language)、XML(eXtensible Markup Language)、CHTML(Compact HTML)等マークアップ言語で記述されるウェブページ表示用のファイルに、ハイパーリンクを追加するハイパーリンク生成装置に関し、特に、ユーザを適切なページに誘導するためのハイパーリンクを生成するハイパーリンク生成装置に関する。
【背景技術】
【0002】
現在、個人、企業を問わず、インターネットを介して公開される各種ウェブページが作成され、様々な情報が発信されている。通常ウェブページは、あるテーマに沿って複数のウェブページから構築されるウェブサイトの一部であり、HTML等のマークアップ言語で記述される、少なくとも1つのウェブページファイルにより構成される。
【0003】
各ウェブサイトは、管理者により管理され、管理者が、ウェブページファイルの内容を更新してサーバにアップロードすることにより、ウェブページの内容が更新され、ウェブサイトが更新される。サーバは、ネットワークを介して接続されるクライアント端末(PC(Personal Computer)、PDA(Personal Digital Assistance)、携帯電話等の情報端末)からのページ取得要求に応じて、該当ページのデータを送信するウェブサーバプログラムがインストールされた情報端末、あるいは上記ウェブサーバプログラムの機能をハードウェアで実現する専用端末等で実現される。
【0004】
これらのウェブページにより伝達される情報は膨大であるため、ユーザは、自分にとって有益な情報を取得するため、一般的に検索サイトと呼ばれるウェブサイトを利用することが多い。検索サイトでは、検索語句を与えることによりその検索語句に対応するウェブページへのハイパーリンクがリスト表示され、ユーザが、興味のあるハイパーリンクをクリックすることで該当ウェブページが表示される。通常、ユーザは、ウェブサイトの入口から目的のウェブページへのハイパーリンクを辿り、ウェブページ間を移動する(言い換えると、ウェブページの表示を切り替える)が、検索サイトを使用すれば、直接目的のウェブページにアクセスすることができる。
【0005】
また、膨大な情報から選択された情報をユーザに提示するために、ユーザを所定のウェブページに誘導する技術が、例えば、下記特許文献1〜3に提案されている。こうした従来例においては、ユーザを誘導する際、あるウェブサイトを閲覧するユーザを識別し、そのユーザの閲覧履歴(アクセスログ)に基づき、ユーザのサイト内での行動が分析される。その分析結果を参照して、ユーザの閲覧状態や嗜好等のユーザプロファイルを導き出し、それらに応じて適切なウェブページが表示されるというものである。
【特許文献1】特開2003−256470号公報
【特許文献2】特開2002−24270号公報
【特許文献3】特開2003−91477号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、従来例においては、ユーザの閲覧状態や嗜好等のユーザプロファイルに基づきユーザが誘導されるものの、そこにウェブサイト管理者の意図は反映されていない。例えば、検索サイトにてある検索語句を入力した検索結果として表示されるリストに含まれる、ある管理者が管理するウェブページと、その管理者がその検索語句が入力されるときユーザに提示したいウェブページとが一致しない場合がある。一般に、検索サイトにリスト表示されるウェブページを制御する方法(例えば、自分のウェブページをリストの上位に表示させ、よりクリックさせやすくする等の方法)は公開されていないため、そのノウハウを持たない管理者は、検索サイトを利用するユーザを管理者の意図するウェブページへ誘導できないことになる。
【0007】
つまり、検索サイトを利用する結果、管理者にとって閲覧して欲しいメインページより比重の低いサブページが上位に表示されるなどして、サブページばかりがユーザによって最初に閲覧されるページとなる。ユーザは、最初のページ内のハイパーリンクをクリックし、別のページへ移動する(即ち、別のページへと表示を切り替える)が、最初のページを概観し興味がわかないと、そのウェブサイトから離れて別のウェブサイトを閲覧することが多く、管理者にとって比重の大きな(メインページに記載された)情報がユーザの目に触れることなく埋没してしまうことがある。
【0008】
また、従来例においては、ユーザを目的のページへ誘導する前提として、ユーザの識別を必要とするため、そもそもユーザを適切に識別できない場合、誤ったユーザプロファイルが導かれ、不特定ユーザの誘導が困難である。ユーザを適切に識別できない場合には、例えば、アクセスログに含まれるアクセス元の情報端末を特定するIP(Internet Protocol)アドレスだけでユーザを特定する場合がある。
【0009】
これは、ユーザが、プロキシサーバ(proxy server)を使用する場合に起こる。プロキシサーバが使用されると、本来ユーザが使用する情報端末のIPアドレスがウェブサーバに伝達されず、複数の情報端末からのアクセスが同一のIPアドレス(プロキシサーバのもの)からのアクセスに集約されてしまう。すると、アクセスログに記録された同一IPアドレスからのアクセスであっても、ユーザが同一人とは限らず、ユーザを適切に識別することができない。また、1台の情報端末を複数人のユーザが共有して使用する場合や、情報端末にIPアドレスが動的に割り当てられる場合にも、やはりアクセスログに記録された同一IPアドレスからのアクセスであっても、ユーザが同一人とは限らないことになる。
【0010】
こうした場合、更に、アカウント名やパスワード等に基づく認証を行えば、ユーザを適切に識別することが可能であるが、事前にユーザ登録を必要とするためユーザの処理が煩雑になることを避ける管理者やアクセス制限をする必要が特に無いウェブサイトの管理者は、認証の仕組みを導入しないことも多く、結局不特定ユーザを管理者の意図するウェブページへ誘導できないことになる。
【0011】
そこで本発明の目的は、あるウェブサイトを訪れたユーザを、他のウェブページへ誘導するためのハイパーリンクを、ウェブサイトにアクセスするユーザを識別することなく生成するハイパーリンク生成装置を提供することにある。
【課題を解決するための手段】
【0012】
上記目的は、本発明の第一の側面によれば、利用者が求める情報のリンク先を生成するリンク生成装置において、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とするリンク生成装置を提供することにより達成される。
【0013】
上記発明の側面においてより好ましい態様によれば、前記検索情報抽出部は、前記検索情報の履歴を記憶し、前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行う。また、上記発明の側面においてより好ましい態様によれば、前記検索情報抽出部は、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いる。
【0014】
上記発明の側面においてより好ましい態様によれば、前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行ってもよい。また、上記発明の側面においてより好ましい態様によれば、前記検索操作情報とは、検索装置が生成するアクセスログである。
【0015】
また、上記目的は、本発明の第二の側面によれば、利用者が指定した情報を生成する情報生成装置において、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とする情報生成装置を提供することにより達成される。
【0016】
上記第二の側面においてより好ましい態様によれば、情報生成装置は、通信網と接続する通信部を有し、通信網を経由して通信する。
【0017】
また、上記目的は、本発明の第三の側面によれば、利用者が求める情報のリンク先を生成するリンク生成方法において、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを有することを特徴とするリンク生成方法を提供することにより達成される。
【0018】
また、上記目的は、コンピュータに、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを実行させることを特徴とするプログラムを提供することによっても達成される。
【発明の効果】
【0019】
本実施形態によれば、ウェブページに設定された重要キーワードと異なる検索語句によるアクセスが頻繁に発生するウェブページに、ウェブサイト管理者が本来その検索語句が入力されるときユーザに閲覧して欲しいウェブページへのハイパーリンクが追加されることによって、ウェブサイトにアクセスするユーザを認証処理等によって識別することなく、ウェブサイト管理者の意図するウェブページへと誘導することができる。ユーザを識別する必要がないことから、ウェブサーバが保有するログ記録機能をそのまま利用することができ、リンク生成装置の導入が簡単に行える。リンク生成装置の機能は、プログラムとして実現することもできるため、ウェブサーバにインストールして1台の装置にまとめることができ、コスト、管理の手間を削減することにもなる。
【発明を実施するための最良の形態】
【0020】
以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態に限定されるものではなく、特許請求の範囲に記載された発明とその均等物にまで及ぶものである。
【0021】
図1は、本発明の実施形態における情報システムの構成図である。ネットワーク5を介して、複数のクライアント端末101〜104、クライアント端末にウェブページを提供するウェブサーバ1、ウェブページの検索に使用される検索サイトサーバ3、そしてリンク生成装置2が接続される。本発明の実施形態においては、リンク生成装置2において、ウェブサーバ1が提供するウェブページに、検索サイトサーバ3を経由してユーザがアクセスする場合、どのような検索語句が入力された結果アクセスされるかをウェブページ毎に解析し、解析結果に応じてウェブページに適宜他のウェブページへのハイパーリンクを追加することによって、ユーザがウェブサイト管理者の意図が反映されたウェブページへ誘導される。
【0022】
ウェブサーバ1には、複数のウェブページによって、ウェブサイトが形成され、そのウェブサイトは、ユーザがクライアント端末101〜104にインストールされるウェブページ閲覧用ソフト(ウェブブラウザ)にURL(Uniform Resource Locator)を指定することでアクセスされる。各URLは、ウェブページファイルの格納先を特定するアドレス情報である。
【0023】
ウェブページファイルは、HTML(Hyper Text Markup Language)等のマークアップ言語で記述される書式データ、内容となるテキストデータ等を含む。また、このウェブページファイルには、ハイパーリンクと呼ばれる、そのウェブページファイルの格納先と異なる格納先の画像データ、音声データ、テキストデータ、他のウェブページファイル等を取得するためのリンクを記述することができる。ハイパーリンクがウェブブラウザを介して表示されるとき、ユーザは、表示されるハイパーリンクをクリックするだけで、リンク先のデータを取得することができる。
【0024】
ネットワーク5を介してウェブサーバ1に接続されるクライアント端末101〜104は、ユーザが、クライアント端末にインストールされたウェブブラウザを起動し、ウェブサーバ1のURLを指定すると、ウェブサーバ1にページ取得要求を送信してアクセスする。ウェブサーバ1は、指定されたURLに対応するデータを、ページ取得要求を送信したクライアント端末に送信すると共に、そのクライアント端末のIPアドレスや、指定されたURL(取得先のアドレス情報)、ページ取得要求直前に閲覧されたウェブページのURL(取得元のアドレス情報)等、アクセスに関するデータをアクセスログとして記憶する。
【0025】
クライアント端末に送信されるデータは、それがウェブページファイルであれば、ウェブブラウザにより、ウェブページファイルに記述されたマークアップ言語により指定される書式へと整形処理され、クライアント端末に備えられた液晶画面等の表示部に表示される。送信されるデータが音声データや画像データであれば、ウェブブラウザのプラグインソフトにより、ウェブブラウザ内で再生されるか、ウェブブラウザにより呼び出される再生ソフトにより再生されるか、そのままクライアント端末に格納される。ユーザはこのようにして、ウェブページを閲覧し、各種データを取得する。
【0026】
なお、クライアント端末には、ノートブックPC101、PDA102、携帯電話103、デスクトップPC104等の情報端末が含まれる。他にも、ウェブコンテンツのブラウズが可能な情報端末がクライアント端末として利用できる。ネットワーク5は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット等である。
【0027】
ネットワーク5を介して複数のウェブサーバ1が存在する場合、ユーザがすべてのウェブサイトのURLや、すべてのウェブサイトに記載される内容を把握することは難しい。そこで、ユーザは、自分に必要な情報を取得するために、検索語句を与えるとその検索語句に関連するウェブサイトの情報を出力する検索サイトサーバ3を利用して、所望のウェブページを検索することが多い。
【0028】
検索サイトサーバ3は、ユーザがクライアント端末101〜104に入力する検索語句をネットワーク5を介して受信し、入力された検索語句に関連するウェブサイトのURLとそのウェブページのタイトル、簡単な内容説明等を、予め構築された独自のデータベースに基づき、又は、独自のアルゴリズムにより収集してリストアップし、クライアント端末に送信する。このとき、リストに含まれるURLあるいはタイトルは、ハイパーリンクになっており、ユーザは、クライアント端末に表示されるハイパーリンクをクリックするだけで所望のウェブページを表示させることができる。
【0029】
リンク生成装置2には、予め、ウェブサーバ1に格納されるウェブページ毎にウェブサイト管理者が設定する重要キーワードが対応付けられる重要キーワードデータベース(重要キーワードDB)が格納される。各ウェブページの重要キーワードは、検索サイトサーバ3にその重要キーワードが入力される場合、ウェブサイト管理者がユーザに閲覧して欲しいウェブページに対応付けられるように決定される。例えば、検索サイトにて検索語句として「テレビ」が入力されるとき、ウェブサイトの管理者がユーザに閲覧して欲しいウェブページがあれば、そのウェブページの重要キーワードが「テレビ」に決定される。
【0030】
そして、リンク生成装置2は、ウェブサーバ1に記憶されるアクセスログを所定のタイミングで取得し、前回取得時から見て追加された情報(差分のアクセスログ)を解析する。ユーザが検索サイトサーバ3を利用して、ウェブサーバ1にアクセスする場合、ページ取得要求直前に閲覧されたウェブページは検索サイトのものであり、アクセスログに含まれる取得元アドレス情報には、検索サイトサーバ3のURLが格納される。そして、そのURLには、入力された検索語句も含まれる。また、アクセスログに含まれる取得先アドレス情報は、アクセスのあったウェブページを特定する。
【0031】
従って、重要キーワードとアクセスに使用された検索語句を比較することで、ウェブサイト管理者の意図に沿ったアクセスがなされるかを判定することができる。つまり、ウェブページへのアクセスに使用された検索語句が重要キーワードと一致していれば、ウェブサイト管理者の意図が反映されており、そうでない場合には、ウェブサイト管理者の意図が反映されていないことになる。例えば、検索サイトにて検索語句「テレビ」で検索を行った結果、検索サイトで使用されるアルゴリズムにより、重要キーワードが「テレビ」であるウェブページより、重要キーワードが「DVD」であるウェブページが上位にランクされ、ユーザが「DVD」のウェブページが閲覧されてしまう場合などは、管理者の意図に沿ったアクセスが行われていないことになる。
【0032】
そこで、リンク生成装置2は、あるウェブページへのアクセスに使用された検索語句が、他のウェブページの重要キーワードである場合、そのあるウェブページに他のウェブページへのハイパーリンクを追加する。これにより、ユーザをウェブサイト管理者の意図を反映したウェブページへ誘導することができる。
【0033】
続いて、本発明の実施形態において使用するウェブサイトについて説明する。
【0034】
図2は、ウェブサーバ1に構築されるウェブサイトの一例であり、その構造をクライアント端末に表示される画面例によって説明する図である。本実施形態では、ウェブサーバ1に構築されるウェブサイト名をサイトAとし、そのURLがhttp://sitea.aaa/であるとする。また、サイトAは、PCの製品紹介サイトであり、その仕様や、機能が記載されるものとする。
【0035】
サイトAのトップページ(http://sitea.aaa/index.html)には、2つのハイパーリンクが埋め込まれ、1つは、機能を説明する目次ページ(http://sitea.aaa/usage/special/index.html)へのリンクであり、もう一つは、仕様を説明するページ(http://sitea.aaa/products/spec.html)へのリンクとなっている。更に、機能を説明する目次ページ(http://sitea.aaa/usage/special/index.html)には、DVD作成機能を説明するページ(http://sitea.aaa/usage/special/dvd.html)へのリンクと、テレビ録画機能を説明するページ(http://sitea.aaa/usage/special/tv.html)へのリンクが埋め込まれている。
【0036】
ユーザが各ハイパーリンクをクリックすると、クライアント端末は、リンクに対応するURLのページ取得要求をウェブサーバ1に送信し、ウェブサーバ1が対応するウェブページファイルを送信し、クライアント端末がそれを表示する。こうして、ユーザは、ウェブサーバ1に構築される階層的なウェブサイト内のウェブページを、ハイパーリンクをクリックすることで、次々に表示させることができる。
【0037】
図3は、本実施形態におけるクライアント端末101〜104、ウェブサーバ1、リンク生成措置2、検索サイトサーバ3の構成ブロック図である。図3は、クライアント端末の一例として、図1のノートブックPC101を説明するものである。
【0038】
ノートブックPC101は、バス20を介して互いに接続される制御部11、RAM(Random Access Memory)12、記憶部13、ネットワークインタフェース(I/F)14、周辺機器接続用インタフェース(I/F)15、入力部16、表示部17を含む。
【0039】
制御部11は、図示省略されたCPU(Central Processing Unit)を含み、RAMに読み出されるプログラムを実行し、ノートブックPC101に含まれる各部を制御する。RAM12は、ノートブックPC101の処理における演算結果やプログラムが一時的に格納される記憶手段である。記憶部13は、ハードディスク、光ディスク、磁気ディスク、フラッシュメモリ等の不揮発性記憶手段であり、各種データやRAMへ読み出される前のOS(Operating System)等のプログラムが格納される。
【0040】
周辺機器I/F15は、ノートブックPC101に周辺機器を接続するためのインタフェースであり、USB(Universal Serial Bus)ポートや、PCIカードスロット等である。周辺機器は、プリンタ、TVチューナ、SCSI(Small Computer System Interface)機器、オーディオ機器、メモリカードリーダライタ、ネットワークカード、無線LANカード、モデムカードなど多岐に渡る。その他、周辺機器には、周辺機器I/F15を介して外部接続されるUSBマウス、プレゼンテーション用に外部接続されるプロジェクタ、外部モニタなども含まれる。
【0041】
ネットワークI/F14には、ネットワーク5を介して送受信する信号またはデータが入出力される。ネットワークI/F14は、上述した周辺機器I/F15を介して外部接続されるネットワークカード、無線LANカード、モデムカード等の通信カードがあれば、省略されてもよい。
【0042】
入力部16は、キーボード、マウス、タッチパネル、ボタン等ユーザからの指示(コマンド)の入力信号をノートブックPC101に入力する入力装置であり、表示部17は、液晶画面、CRT(Cathode Ray Tube)等ユーザに対する情報を表示するための表示装置である。
【0043】
図3に説明したノートブックPC101の他、PDA102、携帯電話103であれば、図3同様入力部16、表示部17が本体に備えられているが、他のクライアント端末(例えば、デスクトップPC104)、ウェブサーバ1、リンク生成装置2、検索サイトサーバ3においては、キーボード等の入力部16、液晶ディスプレイ、CRT等の表示部17が、周辺機器I/F15を介して外部接続されていてもよい。
【0044】
図4は、本発明の実施形態におけるリンク生成装置2とウェブサーバ1を説明する機能ブロック図である。図4の各機能部は、それぞれの装置の制御部に備えられる図示省略されたCPUで実行されるプログラムとして実現することも、ハードウェアにより実現することも可能である。
【0045】
ウェブサーバ1は、リクエスト処理部41、リンク生成情報送信部42、更新部43、そして記憶部を含む。ウェブサーバ1の記憶部には、複数のウェブページファイル61、アクセスログデータベース(アクセスログDB)62が格納される。
【0046】
リクエスト処理部41は、クライアント端末から送信されるページ取得要求を受信すると、そのページ取得要求によって指定されるURLに対応するウェブページファイル61を記憶部から読み出して、ページ取得要求を送信したクライアント端末に送信する。このとき、リクエスト処理部41は、所定の情報をアクセスログとしてアクセスログDB62に格納する。
【0047】
図5は、本実施形態におけるアクセスログDB62に格納されるアクセスログのデータ構成例である。アクセスログDB62には、図5に示されるアクセスログが複数格納され、1行のデータが1つのアクセスに対応する。
【0048】
図5のアクセスログに含まれる所定の情報としては、ページ取得要求を送信したクライアント端末のIPアドレス621、ウェブサーバ1がページ取得要求を処理し終えた時刻623、クライアント端末からの要求内容624、ウェブサーバ1がクライアント端末に返すステータスコード625、クライアント端末に送信されたデータの応答ヘッダを除いたサイズ626、リファラ(referer)と呼ばれる、クライアント端末が報告してくる取得元のアドレス情報627、クライアント端末のウェブブラウザに関する情報628が含まれる。図5におけるハイフン記号622は、要求された情報が入手できなかったということを意味しており、入手できれば、クライアント端末の識別子と、ページ取得要求を行ったユーザのユーザIDが記憶される。また、IPアドレス621の一部は、*により伏せてあるが、実際には、1桁の数字が使用される。
【0049】
取得元アドレス情報627のドメイン名(図5でいうwww.searchengine1.aaa)を解析すれば、ウェブサーバ1へのアクセス直前にユーザが閲覧していたウェブサイトを特定することができ、特にそれが検索サイトである場合、この取得元アドレス情報には、検索に使用された検索語句も含まれる。また、クライアント端末からの要求内容624には、取得先のウェブページのアドレス情報が含まれている。従って、図5のアクセスログを解析すれば、ウェブサーバ1のウェブページが、どのような検索語句によってアクセスされたのかを把握することが可能である。
【0050】
なお、ここでは、ページ取得要求だけを説明したが、リクエスト処理部41が処理する、ウェブサーバ1に対する要求はこれだけではない。ウェブサーバ1にクライアント端末から何らかの要求がある度に、図5同様アクセスログが記憶される。
【0051】
図4に戻り、リンク生成装置2は、定期的にアクセスログを解析するので、ウェブサーバ1は、リンク生成装置2から定期的にアクセスログ取得要求を受信する(M91)。すると、ウェブサーバ1のリンク生成情報送信部42は、リンク生成装置2からのアクセスログ取得要求に応じて、前回のアクセスログ取得要求から今回のアクセスログ取得要求の間にアクセスログDB62に格納されたアクセスログ(差分データ)を送信する(M91)。
【0052】
また、リンク生成装置2は、誘導リンクを追加する必要があると判定したウェブページに誘導リンクを追加するので、ウェブサーバ1は、リンク生成装置2からファイル取得要求を受信する(M92)。すると、ウェブサーバ1のリンク生成情報送信部42は、リンク生成装置2からのファイル取得要求に応じて、ファイル取得要求にて指定されたウェブページに対応するウェブページファイルを送信する(M92)。
【0053】
更新部43は、リンク生成装置2より誘導リンクが追加されたウェブパージファイルを受信し(M93)、ウェブサーバ1の記憶部に格納して、対応するウェブページを更新する。
【0054】
一方のリンク生成装置2は、検索情報抽出部51、誘導リンク生成判定部52、リンク生成部53、そして記憶部を含む。リンク生成装置2の記憶部には、重要キーワードデータベース(重要キーワードDB)71、語句抽出情報72、集計結果データベース(集計結果DB)73、頻出語句データベース(頻出語句DB)74が格納される。
【0055】
検索情報抽出部51は、定期的にウェブサーバ1にアクセスログ取得要求を送信しアクセスログを取得する。そして、アクセスログに含まれる取得元アドレス情報627に基づき、語句抽出情報72を参照して、ウェブサーバ1へのアクセスが検索サイトサーバ3を経由してのアクセスかを特定し、検索サイトサーバ3を経由してのアクセスである場合、使用された検索語句を抽出する。
【0056】
図6は、本実施形態における語句抽出情報72のデータ構成例である。語句抽出情報72は、予め、検索サイト毎に作成されリンク生成装置2の記憶部に格納される。語句抽出情報は、アクセスログに含まれる取得元アドレス情報627に基づき、ウェブサーバ1へのアクセスが検索サイトサーバ3を経由してのアクセスかを特定し、検索サイトサーバ3を経由してのアクセスである場合、使用された検索語句を抽出するために必要な情報である。新たな検索サイトが追加される場合、追加される検索サイトに関する語句抽出情報72も追加される。
【0057】
図6の語句抽出情報72には、「検索サイト名」、「サイトアドレス」、「検索語句箇所」というデータ項目が含まれる。「検索サイト名」は、検索サイトを識別するための名前であり、「サイトアドレス」は、検索サイトを特定するサーバ名、ドメイン名、またはサーバ名とドメイン名の組合せのいずれかである。アクセスログに含まれる取得元アドレス情報627に、「サイトアドレス」で使用される文字列が含まれていれば、そのアクセスログに対応するアクセスは、検索サイト経由のアクセスであると識別できる。
【0058】
「検索語句箇所」は、アクセスログに含まれる取得元アドレス情報627から検索サイトに入力された検索語句を抽出するための情報である。例えば、図5に示される取得元アドレス情報627を例にとって説明すれば、図6の1行目の「サイトアドレス」で使用される文字列を含むことから、このアクセスは、検索サイト「Aのモーニング検索」を経由したものであることが分かる。そして、図6の1行目の「検索語句箇所」を参照すれば、「search」というCGI(Common Gateway Interface)に渡される引数の名前「q」の値が検索語句であることがわかり、図5の例の場合、「DVD%E3%80%80%E3%83%86%E3%83%AC%E3%83%93」である。これは、URLエンコードされた文字列であり、URLデコードすれば、「DVD テレビ」が抽出できる。つまり、検索語句としてユーザが検索サイトに入力したのは、「DVD」「テレビ」の2語であることが判明する。
【0059】
取得元アドレス情報627に含まれる検索語句の抽出の仕方は検索サイト毎に異なるが、図6の「検索語句箇所」を参照することによって、適切に検索語句を抽出することができる。こうして、検索情報抽出部51は、アクセスログに含まれる取得元アドレス情報627から、検索サイトを経由するアクセスを特定し、使用された検索語句を抽出する。
【0060】
また検索情報抽出部51は、検索サイトサーバ3を経由するアクセスにより取得されたウェブページのアドレス情報を取得する。これは、クライアント端末からの要求内容624に含まれる取得先のアドレス情報を参照することで得られる。図5の例の場合、クライアント端末からの要求内容624を空白で区切ったとき、GETコマンドに続く一塊(/usage/special/dvd.html)が取得先のアドレス情報である。そして、検索情報抽出部51は、ウェブページ毎に、そのウェブページへのアクセスに使用された検索語句やその登場回数を含む結果を集計して、集計結果DB73に格納する。
【0061】
図7は、本実施形態における集計結果DB73のデータ構成例である。図7の集計結果DB73は、「ページID」、「パス」、「検索語句/回数」というデータ項目を含む。「ページID」は、各ウェブページを一意に特定する識別子であり、文字、数字、記号が使用される。「パス」は、各ウェブページに対応するウェブページファイルのウェブサーバ1での格納先を示すアドレス情報である。図7では、サイトアドレス(sitea.aaa)の表記が省略されている。
【0062】
「検索語句/回数」は、検索サイトを経由してウェブページへアクセスされる場合に検索語句として使用された用語とその回数を対応付けたものである。例えば、図7のページIDがAであるウェブページ(/usage/special/dvd.html)は、その回数順に多いほうから「DVD、テレビ、録画、作成」という語句が検索サイトに入力された結果閲覧されたことがわかる。こうして、図7の集計結果DB73により、ウェブページ毎に、どのような検索語句によってアクセスされるのか、その傾向が明らかになる。
【0063】
図4に戻り、検索情報抽出部51により集計結果DB73が更新されると、その旨が誘導リンク生成判定部52へ通知され、誘導リンク生成判定部52は、ウェブページ毎に重要キーワードが対応付けられる重要キーワードDB71と、集計結果DB73を基に、ユーザを誘導するためのハイパーリンクである誘導リンクを生成すべきかを判定する。
【0064】
誘導リンク生成判定部52は、ページIDにより特定されるウェブページ毎に、重要キーワードDBの「重要キーワード」(図8にて後述)と、集計結果DBの「検索語句/回数」(図7参照)とを比較し、そのウェブページの重要キーワード以外の語句で回数が多い上位2語を抽出する。次に、抽出された2語が他のウェブページの重要キーワードに設定されているか、重要キーワードDBを参照して判定し、他のウェブページの重要キーワードに設定されている語句を、ウェブページファイルに対応付けて頻出語句DB74に格納する。
【0065】
なお、誘導リンク生成判定部52が判定に使用する語句は、上位2語でなくともよい。集計結果DB73の「検索語句」に含まれるすべての語句を判定の対象としてもよい。また、登場回数が所定の閾値(例えば、500回)を超える検索語句だけを判定に用いることも可能である。
【0066】
図8は、本実施形態におけるウェブページ毎に重要キーワードが対応付けられる重要キーワードDB71のデータ構成例である。重要キーワードは、ウェブページ毎に設定され、予め、リンク生成装置2に格納される。図8の重要キーワードDBは、「ページID」、「パス」、「重要キーワード」、「タイトル」というデータ項目を含む。
【0067】
「ページID」は、各ウェブページ一意に特定する識別子であり、文字、数字、記号が使用される。「パス」は、各ウェブページに対応するウェブページファイルの格納先を示すアドレス情報である。「タイトル」は、各ウェブページの内容を簡単に説明する見出しである。
【0068】
「重要キーワード」は、各ウェブページの重要キーワードである。重要キーワードは、ウェブページに記述される内容を特徴付ける語句であり、その語句が検索サイトで検索語句として入力されるときにウェブサイトの管理者がユーザに閲覧して欲しいウェブページに対応付けられる。例えば、図8のページIDがAのウェブページであれば、検索サイトにてユーザが「DVD」と入力したとき、ウェブサイトの管理者が閲覧して欲しいウェブページであることを意味する。
【0069】
図9は、本実施形態における頻出語句DB74のデータ構成例である。図9の頻出語句DBは、「ページID」、「パス」、「頻出語句」というデータ項目を含む。「ページID」は、各ウェブページを一意に特定する識別子であり、文字、数字、記号が使用される。「パス」は、各ウェブページに対応するウェブページファイルの格納先を示すアドレス情報である。
【0070】
「頻出語句」は、上述したように、各ウェブページへのアクセスに使用された検索語句のうち、自ページの重要キーワード以外の語句で所定の条件を満たし(例えば、登場回数の上位2つ等)、かつ、他のウェブページの重要キーワードとして設定されているものである。
【0071】
例えば、図7、図8に示される例において、ページIDがAであるウェブページファイル(/usage/special/dvd.html)は、その重要キーワードが「DVD」であるが(図8「重要キーワード」参照)、検索サイトを経由するアクセスにおいては、「DVD」の他、「テレビ、録画、作成」という語句が使用される(図7「検索語句/回数」参照)。
【0072】
そして、重要キーワードである「DVD」を除く登場回数の上位2語のうち、「テレビ」はページIDがBであるウェブページファイル(/usage/special/tv.html)の重要キーワードとして使用されており(図8参照)、ウェブサイト管理者としては、「テレビ」という語句が検索語句に含まれるとき、ページIDがBであるウェブページファイルをユーザには閲覧して欲しいことになる。従って、この場合、ページIDがAであるウェブページファイル内に、ページIDがBであるウェブページファイルへのハイパーリンクを追加すればよい。
【0073】
図4に戻り、誘導リンク生成判定部52により頻出語句DB74が更新されると、その旨がリンク生成部53へ通知され、リンク生成部53は、頻出語句DB74と、重要キーワードDB71を基に、ウェブサーバ1からユーザを誘導するための誘導リンクを追加するウェブページを構成するウェブページファイルを取得し、誘導リンクを追加したウェブページファイルをウェブサーバ1に送信する。
【0074】
リンク生成部53は、頻出語句DB74の「頻出語句」を参照し、そこに格納される語句が重要キーワードとして設定されるウェブページのパスを重要キーワードDB71(図8)を参照して取得する。例えば、図9の場合、ページIDがAであるウェブページファイルの「頻出語句」である「テレビ」は、図8を参照すれば、ページIDがBであるウェブページファイル重要キーワードであることがわかり、図8の「パス」を参照して/usage/special/tv.htmlが得られる。そして、リンク生成部53は、誘導リンクを追加するページIDがAであるウェブページファイルのファイル取得要求をウェブサーバ1に送信し、そのウェブページファイル(/usage/special/dvd.html)に、ページIDがBであるウェブページファイル(/usage/special/tv.html)へのハイパーリンクを追加する。
【0075】
図10は、本実施形態におけるリンク追加前とリンク追加後のウェブページファイル例を示す図である。図10Aは、リンク追加前のウェブページファイルである。本実施形態においては、追加される誘導リンクを配置する領域の区切りを表す印として、<!-- guide_link_area -->と<!-- /guide_link_area -->という、ウェブブラウザに対するコメントタグが用意されている。
【0076】
図10Bは、リンク追加後のウェブページファイルであり、<!-- guide_link_area -->から<!-- /guide_link_area -->で囲まれる誘導リンクが配置される領域に、ページIDがBであるウェブページファイル(/usage/special/tv.html)へのハイパーリンクが<a href>タグによって追加されることがわかる。リンクタイトル(ハイパーリンクがウェブブラウザにより表示されるときの見出し)は、重要キーワードDB71の「タイトル」を参照して得られる文字列が使用され、<a>から</a>の間に埋め込まれている。
【0077】
つまり、リンク生成部53は、追加するハイパーリンクのパスとタイトルを基に、<a href>タグのハイパーリンクを生成した後、取得したウェブページファイルを解析し、<!-- guide_link_area -->と<!-- /guide_link_area -->により囲まれる領域に追加する誘導リンクを配置することで、誘導リンクが追加されたウェブページファイルを生成する。
【0078】
そして、リンク生成部53は、誘導リンクが追加されたウェブページファイルをウェブサーバ1に送信し、ウェブサーバ1が、送信されたウェブページをウェブサーバ1の記憶部に格納してウェブページを更新することで、次回からのアクセスに対して、ユーザには誘導リンクが追加されたウェブページが表示されることになる。
【0079】
図11は、本実施形態におけるリンク生成装置2の動作を説明するフローチャートである。予め、重要キーワードDB71と、語句抽出情報72がリンク生成装置2の記憶部に格納されている。
【0080】
まず、リンク生成装置2は、ウェブサーバ1のアクセスログを取得する(S1)。これは、リンク生成装置2の検索情報抽出部51がウェブサーバ1にアクセスログ取得要求を送信し、ウェブサーバ1のリンク生成情報送信部42が、アクセスログDBに格納されるアクセスログをリンク生成装置2に送信することで行われる。
【0081】
次に、リンク生成装置2は、取得したアクセスログに基づき、検索サイトサーバ3経由のアクセスを特定し、更に、ウェブページ毎に使用された検索語句を抽出する(S2)。これは、リンク生成装置2の検索情報抽出部51が、アクセスログの取得元アドレス情報627に、語句抽出情報72の「サイトアドレス」が含まれるアクセスログを検索し、含まれるアクセスログがあれば、語句抽出情報72の「検索語句箇所」に基づき、検索語句を抽出するものである。
【0082】
そして、リンク生成装置2は、ウェブページファイル毎にアクセスに用いられた検索語句を集計し、集計結果DB73を更新する(S3)。これは、リンク生成装置2の検索情報抽出部51がステップS2で抽出された検索語句とその登場回数をウェブページ毎に集計して、集計結果DB73に格納するものである。
【0083】
そして、リンク生成装置2は、ウェブページ毎に、検索語句に他のウェブページの重要キーワードに設定された語句が含まれるかを判定する(S4)。これは、誘導リンク生成判定部52が、ウェブページ毎に、集計結果DB73に格納される「検索語句」と、重要キーワードDB71に格納される「重要キーワード」とを比較することで行われる。
【0084】
誘導リンク生成判定部52は、ウェブページ毎に、比較元のウェブページの「検索語句」に、他のウェブページの「重要キーワード」が含まれていれば(S4Yes)、比較元のウェブページにその「重要キーワード」を対応付けて頻出語句DB74を更新する(S5)。なお、ステップS5では集計結果の登場回数に基づき、上位数個の語句だけを判定に用いてもよい。また、登場回数が所定の閾値(例えば、500回)を超える検索語句だけを判定に用いることも可能である。
【0085】
すべてのウェブページにおいて、比較元のウェブページの「検索語句」に、他のウェブページの「重要キーワード」が含まれていなければ(S4No)、各ウェブページへのアクセスは、ユーザが検索サイトで重要キーワードを入力することによって行われており、ウェブサイト管理者の意図に沿ったアクセスがなされていると判定され、リンク生成装置2は誘導リンクを生成することなく処理を終了する。
【0086】
ステップS5の頻出語句DB74の更新が完了すると、リンク生成装置2は、比較元のウェブページファイルに、頻出語句に対応するウェブページへの誘導リンクを追加する(S6)。まず、リンク生成装置1のリンク生成部53が、頻出語句DBの「パス」に対応するウェブページファイルのファイル取得要求をウェブサーバ1に送信し、ウェブサーバ1のリンク生成情報送信部42により送信される「パス」に対応するウェブページファイルを取得する。
【0087】
次に、リンク生成部53は、頻出語句DB74の「頻出語句」が重要キーワードに設定されているウェブページの「パス」を重要キーワードDB71から取得し、そのパスへのハイパーリンク(誘導リンク)を先ほど取得したウェブページファイルに追加する。誘導リンクの追加は、図10で説明した通りである。
【0088】
最後に、リンク生成装置2のリンク生成部53は、誘導リンクが追加されたウェブページファイルをウェブサーバに送信し、処理を終了する(S7)。ウェブサーバ1の更新部43は、受信したウェブページファイルをウェブサーバ1の記憶部に格納し、ウェブページを更新する。
【0089】
図12は、本実施形態において、ユーザが検索サイトサーバ3を利用して、ウェブサーバ1に構築されたサイトAを閲覧する様子をクライアント端末に表示される画面例で説明する図である。図12においては、検索サイトサーバ3は、「Aのモーニング検索」であり、そのサイトアドレスは、www.searchengine1.aaaであるとする。
【0090】
まず、ユーザは、検索サイトサーバに検索語句を入力してウェブサイトの検索を行う(画面111)。画面111では、「Aのモーニング検索」(www.searchengine1.aaa)にてユーザが、「テレビ」に関する情報を得ようと検索を行う様子が描かれる。
【0091】
ユーザは、フォーム欄81に検索語句を入力し、検索ボタン82をクリックして検索を実行する。すると、検索結果として、複数のウェブページへのハイパーリンクが表示される(画面112)。ここでは、一番上に表示される「サイトAのウェブページ」のハイパーリンクがクリックされるとする。
【0092】
そして、サイトAのウェブページ(http://sitea.aaa/usage/special/dvd.html)が表示される(画面113)。このページの重要キーワードに設定されているのは、「テレビ」ではなく、「DVD」であるため(図8参照)、ウェブサイト管理者の立場から言えば本来閲覧して欲しいウェブページではない。しかし、本実施形態により、検索語句「テレビ」に対して閲覧して欲しいウェブページ(http://sitea.aaa/usage/special/tv.html)へのハイパーリンク(パソコンでテレビを楽しむ)が追加されているため、重要キーワードが「テレビ」であるウェブページへとユーザを適切に誘導することができる。ユーザが、誘導リンク83をクリックすれば、http://sitea.aaa/usage/special/tv.htmlが表示される(画面114)。
【0093】
なお、本実施形態においては、リンク生成装置2とウェブサーバ1が、別々の装置として、ネットワーク5を介して接続されているが、ウェブサーバとリンク生成装置は、パラレルケーブル、シリアルケーブル、USB等の信号線により直接接続されても構わない。
【0094】
また、リンク生成装置2とウェブサーバ1を1つの装置(リンク生成機能を有するウェブサーバあるいはウェブサーバ機能を有するリンク生成装置)として実現することも可能である。その場合、検索情報抽出部51、リンク生成部53は、ネットワーク5を介さずに、ウェブページファイルやアクセスログにアクセスできるので、図4の機能ブロック図において、リンク生成情報送信部42、更新部43を省略可能である。
【0095】
また、本実施形態においては、重要キーワードは、ウェブサイトの管理者あるいは、リンク生成装置2の操作者によって、ウェブページの内容を反映して設定される必要があるが、リンク生成装置2が自動化することも可能である。例えば、<meta>タグを使用する方法が挙げられる。自動化のためのルールとして、重要キーワードは、<meta>タグのname="Keywords"に対応するcontentの値である、というようにすればよい。
【0096】
リンク生成装置2は、定期的にウェブサーバ1のウェブページを取得し、そのウェブページファイルに対して、上記ルールに則った解析を行えば、重要キーワードの抽出は容易である。同様にして、図8の重要キーワードDBのデータ項目である「タイトル」は、<meta>タグのname="Description"に対応するcontentの値である、というルールを適用すれば、簡単に重要キーワードDB71の構築が可能になる。実際の使用例は、図10Aに見ることができる。
【0097】
以上に説明したように、本実施形態によれば、ウェブページに設定された重要キーワードと異なる検索語句によるアクセスが頻繁に発生するウェブページに、ウェブサイト管理者が本来その検索語句が入力されるときユーザに閲覧して欲しいウェブページへのハイパーリンクが追加されることによって、ウェブサイトにアクセスするユーザを認証処理等によって識別することなく、ウェブサイト管理者の意図するウェブページへと誘導することができる。ユーザを識別する必要がないことから、ウェブサーバが保有するログ記録機能をそのまま利用することができ、リンク生成装置2の導入が簡単に行える。リンク生成装置2の機能は、プログラムとして実現することもできるため、ウェブサーバ1にインストールして1台の装置にまとめることができ、コスト、管理の手間を削減することにもなる。
【0098】
以上まとめると付記のようになる。
【0099】
(付記1) :ウェブサーバと共に用いるリンク生成装置
利用者が求める情報のリンク先を生成するリンク生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とするリンク生成装置。
【0100】
(付記2)
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とする 付記1記載のリンク生成装置。
【0101】
(付記3)
前記検索情報抽出部は、前記ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とする付記1記載のリンク生成装置。
【0102】
(付記4)
前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記1記載のリンク生成装置。
【0103】
(付記5)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記1記載のリンク生成装置。
【0104】
(付記6) :リンク生成装置を内蔵したウェブサーバ
利用者が指定した情報を生成する情報生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とする情報生成装置。
【0105】
(付記7)
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とする付記6記載の情報生成装置。
【0106】
(付記8)
前記検索情報抽出部は、情報生成装置に対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とする付記6記載の情報生成装置。
【0107】
(付記9)
前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記6記載の情報生成装置。
【0108】
(付記10)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記6記載の情報生成装置。
【0109】
(付記11) :ウェブサーバ
通信網と接続する通信部を有し、
通信網を経由して通信することを特徴とする付記6記載の情報生成装置。
【0110】
(付記12)
コンピュータに、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを実行させることを特徴とするプログラム。
【0111】
(付記13)
前記検索情報抽出手順において、前記検索情報の履歴が記憶され、
前記誘導リンク生成判定手順において、前記検索情報の履歴を基に前記判定が行われることを特徴とする付記12記載のプログラム。
【0112】
(付記14)
前記検索情報抽出手順において、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数が記憶され、
前記誘導リンク生成判定手順において、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報が前記判定に用いられることを特徴とする付記12記載のプログラム。
【0113】
(付記15)
前記誘導リンク生成判定手順において、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記12記載のプログラム。
【0114】
(付記16)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記12記載のプログラム。
【0115】
(付記17)
利用者が求める情報のリンク先を生成するリンク生成方法において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを有することを特徴とするリンク生成方法。
【0116】
(付記18)
前記検索情報抽出手順において、前記検索情報の履歴が記憶され、
前記誘導リンク生成判定手順において、前記検索情報の履歴を基に前記判定が行われることを特徴とする付記17記載のリンク生成方法。
【0117】
(付記19)
前記検索情報抽出手順において、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数が記憶され、
前記誘導リンク生成判定手順において、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報が前記判定に用いられることを特徴とする付記17記載のリンク生成方法。
【0118】
(付記20)
前記誘導リンク生成判定手順において、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記17記載のリンク生成方法。
【0119】
(付記21)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記17記載のリンク生成方法。
【図面の簡単な説明】
【0120】
【図1】本発明の実施形態における情報システムの構成図である。
【図2】ウェブサーバに構築されるウェブサイトの一例であり、その構造をクライアント端末に表示される画面例によって説明する図である。
【図3】本実施形態におけるクライアント端末、ウェブサーバ、リンク生成措置、検索サイトサーバの構成ブロック図である。
【図4】本発明の実施形態におけるリンク生成装置とウェブサーバを説明する機能ブロック図である。
【図5】本実施形態におけるアクセスログDBに格納されるアクセスログのデータ構成例である。
【図6】本実施形態における語句抽出情報のデータ構成例である。
【図7】本実施形態における集計結果DBのデータ構成例である。
【図8】本実施形態におけるウェブページ毎に重要キーワードが対応付けられる重要キーワードDBのデータ構成例である。
【図9】本実施形態における頻出語句DBのデータ構成例である。
【図10】Aは、本実施形態におけるリンク追加前のウェブページファイル例を示す図であり、Bは、リンク追加後のウェブページファイル例を示す図である。
【図11】本実施形態におけるリンク生成装置の動作を説明するフローチャートである。
【図12】本実施形態において、ユーザがウェブサーバに構築されたサイトAを閲覧する様子をクライアント端末に表示される画面例で説明する図である。
【符号の説明】
【0121】
1 ウェブサーバ、2 リンク生成装置、3 検索サイトサーバ、5 ネットワーク、11 制御部、12 RAM、13 記憶部、14 ネットワークI/F、15 周辺機器I/F、16 入力部、17 表示部、20 バス、41 リクエスト処理部、42 リンク生成情報送信部、43 更新部、51 検索情報抽出部、52 誘導リンク生成判定部、53 リンク生成部、61 ウェブページファイル、62 アクセスログ、71 重要キーワードDB、72 語句抽出情報、73 集計結果DB、74 頻出語句DB、101 クライアント端末(ノートブックPC)、102 クライアント端末(PDA)、103 クライアント端末(携帯電話)、104 クライアント端末(デスクトップPC)
【技術分野】
【0001】
本発明は、HTML(Hyper Text Markup Language)、SGML(Standard Generalized Markup Language)、XML(eXtensible Markup Language)、CHTML(Compact HTML)等マークアップ言語で記述されるウェブページ表示用のファイルに、ハイパーリンクを追加するハイパーリンク生成装置に関し、特に、ユーザを適切なページに誘導するためのハイパーリンクを生成するハイパーリンク生成装置に関する。
【背景技術】
【0002】
現在、個人、企業を問わず、インターネットを介して公開される各種ウェブページが作成され、様々な情報が発信されている。通常ウェブページは、あるテーマに沿って複数のウェブページから構築されるウェブサイトの一部であり、HTML等のマークアップ言語で記述される、少なくとも1つのウェブページファイルにより構成される。
【0003】
各ウェブサイトは、管理者により管理され、管理者が、ウェブページファイルの内容を更新してサーバにアップロードすることにより、ウェブページの内容が更新され、ウェブサイトが更新される。サーバは、ネットワークを介して接続されるクライアント端末(PC(Personal Computer)、PDA(Personal Digital Assistance)、携帯電話等の情報端末)からのページ取得要求に応じて、該当ページのデータを送信するウェブサーバプログラムがインストールされた情報端末、あるいは上記ウェブサーバプログラムの機能をハードウェアで実現する専用端末等で実現される。
【0004】
これらのウェブページにより伝達される情報は膨大であるため、ユーザは、自分にとって有益な情報を取得するため、一般的に検索サイトと呼ばれるウェブサイトを利用することが多い。検索サイトでは、検索語句を与えることによりその検索語句に対応するウェブページへのハイパーリンクがリスト表示され、ユーザが、興味のあるハイパーリンクをクリックすることで該当ウェブページが表示される。通常、ユーザは、ウェブサイトの入口から目的のウェブページへのハイパーリンクを辿り、ウェブページ間を移動する(言い換えると、ウェブページの表示を切り替える)が、検索サイトを使用すれば、直接目的のウェブページにアクセスすることができる。
【0005】
また、膨大な情報から選択された情報をユーザに提示するために、ユーザを所定のウェブページに誘導する技術が、例えば、下記特許文献1〜3に提案されている。こうした従来例においては、ユーザを誘導する際、あるウェブサイトを閲覧するユーザを識別し、そのユーザの閲覧履歴(アクセスログ)に基づき、ユーザのサイト内での行動が分析される。その分析結果を参照して、ユーザの閲覧状態や嗜好等のユーザプロファイルを導き出し、それらに応じて適切なウェブページが表示されるというものである。
【特許文献1】特開2003−256470号公報
【特許文献2】特開2002−24270号公報
【特許文献3】特開2003−91477号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、従来例においては、ユーザの閲覧状態や嗜好等のユーザプロファイルに基づきユーザが誘導されるものの、そこにウェブサイト管理者の意図は反映されていない。例えば、検索サイトにてある検索語句を入力した検索結果として表示されるリストに含まれる、ある管理者が管理するウェブページと、その管理者がその検索語句が入力されるときユーザに提示したいウェブページとが一致しない場合がある。一般に、検索サイトにリスト表示されるウェブページを制御する方法(例えば、自分のウェブページをリストの上位に表示させ、よりクリックさせやすくする等の方法)は公開されていないため、そのノウハウを持たない管理者は、検索サイトを利用するユーザを管理者の意図するウェブページへ誘導できないことになる。
【0007】
つまり、検索サイトを利用する結果、管理者にとって閲覧して欲しいメインページより比重の低いサブページが上位に表示されるなどして、サブページばかりがユーザによって最初に閲覧されるページとなる。ユーザは、最初のページ内のハイパーリンクをクリックし、別のページへ移動する(即ち、別のページへと表示を切り替える)が、最初のページを概観し興味がわかないと、そのウェブサイトから離れて別のウェブサイトを閲覧することが多く、管理者にとって比重の大きな(メインページに記載された)情報がユーザの目に触れることなく埋没してしまうことがある。
【0008】
また、従来例においては、ユーザを目的のページへ誘導する前提として、ユーザの識別を必要とするため、そもそもユーザを適切に識別できない場合、誤ったユーザプロファイルが導かれ、不特定ユーザの誘導が困難である。ユーザを適切に識別できない場合には、例えば、アクセスログに含まれるアクセス元の情報端末を特定するIP(Internet Protocol)アドレスだけでユーザを特定する場合がある。
【0009】
これは、ユーザが、プロキシサーバ(proxy server)を使用する場合に起こる。プロキシサーバが使用されると、本来ユーザが使用する情報端末のIPアドレスがウェブサーバに伝達されず、複数の情報端末からのアクセスが同一のIPアドレス(プロキシサーバのもの)からのアクセスに集約されてしまう。すると、アクセスログに記録された同一IPアドレスからのアクセスであっても、ユーザが同一人とは限らず、ユーザを適切に識別することができない。また、1台の情報端末を複数人のユーザが共有して使用する場合や、情報端末にIPアドレスが動的に割り当てられる場合にも、やはりアクセスログに記録された同一IPアドレスからのアクセスであっても、ユーザが同一人とは限らないことになる。
【0010】
こうした場合、更に、アカウント名やパスワード等に基づく認証を行えば、ユーザを適切に識別することが可能であるが、事前にユーザ登録を必要とするためユーザの処理が煩雑になることを避ける管理者やアクセス制限をする必要が特に無いウェブサイトの管理者は、認証の仕組みを導入しないことも多く、結局不特定ユーザを管理者の意図するウェブページへ誘導できないことになる。
【0011】
そこで本発明の目的は、あるウェブサイトを訪れたユーザを、他のウェブページへ誘導するためのハイパーリンクを、ウェブサイトにアクセスするユーザを識別することなく生成するハイパーリンク生成装置を提供することにある。
【課題を解決するための手段】
【0012】
上記目的は、本発明の第一の側面によれば、利用者が求める情報のリンク先を生成するリンク生成装置において、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とするリンク生成装置を提供することにより達成される。
【0013】
上記発明の側面においてより好ましい態様によれば、前記検索情報抽出部は、前記検索情報の履歴を記憶し、前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行う。また、上記発明の側面においてより好ましい態様によれば、前記検索情報抽出部は、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いる。
【0014】
上記発明の側面においてより好ましい態様によれば、前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行ってもよい。また、上記発明の側面においてより好ましい態様によれば、前記検索操作情報とは、検索装置が生成するアクセスログである。
【0015】
また、上記目的は、本発明の第二の側面によれば、利用者が指定した情報を生成する情報生成装置において、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とする情報生成装置を提供することにより達成される。
【0016】
上記第二の側面においてより好ましい態様によれば、情報生成装置は、通信網と接続する通信部を有し、通信網を経由して通信する。
【0017】
また、上記目的は、本発明の第三の側面によれば、利用者が求める情報のリンク先を生成するリンク生成方法において、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを有することを特徴とするリンク生成方法を提供することにより達成される。
【0018】
また、上記目的は、コンピュータに、利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを実行させることを特徴とするプログラムを提供することによっても達成される。
【発明の効果】
【0019】
本実施形態によれば、ウェブページに設定された重要キーワードと異なる検索語句によるアクセスが頻繁に発生するウェブページに、ウェブサイト管理者が本来その検索語句が入力されるときユーザに閲覧して欲しいウェブページへのハイパーリンクが追加されることによって、ウェブサイトにアクセスするユーザを認証処理等によって識別することなく、ウェブサイト管理者の意図するウェブページへと誘導することができる。ユーザを識別する必要がないことから、ウェブサーバが保有するログ記録機能をそのまま利用することができ、リンク生成装置の導入が簡単に行える。リンク生成装置の機能は、プログラムとして実現することもできるため、ウェブサーバにインストールして1台の装置にまとめることができ、コスト、管理の手間を削減することにもなる。
【発明を実施するための最良の形態】
【0020】
以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態に限定されるものではなく、特許請求の範囲に記載された発明とその均等物にまで及ぶものである。
【0021】
図1は、本発明の実施形態における情報システムの構成図である。ネットワーク5を介して、複数のクライアント端末101〜104、クライアント端末にウェブページを提供するウェブサーバ1、ウェブページの検索に使用される検索サイトサーバ3、そしてリンク生成装置2が接続される。本発明の実施形態においては、リンク生成装置2において、ウェブサーバ1が提供するウェブページに、検索サイトサーバ3を経由してユーザがアクセスする場合、どのような検索語句が入力された結果アクセスされるかをウェブページ毎に解析し、解析結果に応じてウェブページに適宜他のウェブページへのハイパーリンクを追加することによって、ユーザがウェブサイト管理者の意図が反映されたウェブページへ誘導される。
【0022】
ウェブサーバ1には、複数のウェブページによって、ウェブサイトが形成され、そのウェブサイトは、ユーザがクライアント端末101〜104にインストールされるウェブページ閲覧用ソフト(ウェブブラウザ)にURL(Uniform Resource Locator)を指定することでアクセスされる。各URLは、ウェブページファイルの格納先を特定するアドレス情報である。
【0023】
ウェブページファイルは、HTML(Hyper Text Markup Language)等のマークアップ言語で記述される書式データ、内容となるテキストデータ等を含む。また、このウェブページファイルには、ハイパーリンクと呼ばれる、そのウェブページファイルの格納先と異なる格納先の画像データ、音声データ、テキストデータ、他のウェブページファイル等を取得するためのリンクを記述することができる。ハイパーリンクがウェブブラウザを介して表示されるとき、ユーザは、表示されるハイパーリンクをクリックするだけで、リンク先のデータを取得することができる。
【0024】
ネットワーク5を介してウェブサーバ1に接続されるクライアント端末101〜104は、ユーザが、クライアント端末にインストールされたウェブブラウザを起動し、ウェブサーバ1のURLを指定すると、ウェブサーバ1にページ取得要求を送信してアクセスする。ウェブサーバ1は、指定されたURLに対応するデータを、ページ取得要求を送信したクライアント端末に送信すると共に、そのクライアント端末のIPアドレスや、指定されたURL(取得先のアドレス情報)、ページ取得要求直前に閲覧されたウェブページのURL(取得元のアドレス情報)等、アクセスに関するデータをアクセスログとして記憶する。
【0025】
クライアント端末に送信されるデータは、それがウェブページファイルであれば、ウェブブラウザにより、ウェブページファイルに記述されたマークアップ言語により指定される書式へと整形処理され、クライアント端末に備えられた液晶画面等の表示部に表示される。送信されるデータが音声データや画像データであれば、ウェブブラウザのプラグインソフトにより、ウェブブラウザ内で再生されるか、ウェブブラウザにより呼び出される再生ソフトにより再生されるか、そのままクライアント端末に格納される。ユーザはこのようにして、ウェブページを閲覧し、各種データを取得する。
【0026】
なお、クライアント端末には、ノートブックPC101、PDA102、携帯電話103、デスクトップPC104等の情報端末が含まれる。他にも、ウェブコンテンツのブラウズが可能な情報端末がクライアント端末として利用できる。ネットワーク5は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット等である。
【0027】
ネットワーク5を介して複数のウェブサーバ1が存在する場合、ユーザがすべてのウェブサイトのURLや、すべてのウェブサイトに記載される内容を把握することは難しい。そこで、ユーザは、自分に必要な情報を取得するために、検索語句を与えるとその検索語句に関連するウェブサイトの情報を出力する検索サイトサーバ3を利用して、所望のウェブページを検索することが多い。
【0028】
検索サイトサーバ3は、ユーザがクライアント端末101〜104に入力する検索語句をネットワーク5を介して受信し、入力された検索語句に関連するウェブサイトのURLとそのウェブページのタイトル、簡単な内容説明等を、予め構築された独自のデータベースに基づき、又は、独自のアルゴリズムにより収集してリストアップし、クライアント端末に送信する。このとき、リストに含まれるURLあるいはタイトルは、ハイパーリンクになっており、ユーザは、クライアント端末に表示されるハイパーリンクをクリックするだけで所望のウェブページを表示させることができる。
【0029】
リンク生成装置2には、予め、ウェブサーバ1に格納されるウェブページ毎にウェブサイト管理者が設定する重要キーワードが対応付けられる重要キーワードデータベース(重要キーワードDB)が格納される。各ウェブページの重要キーワードは、検索サイトサーバ3にその重要キーワードが入力される場合、ウェブサイト管理者がユーザに閲覧して欲しいウェブページに対応付けられるように決定される。例えば、検索サイトにて検索語句として「テレビ」が入力されるとき、ウェブサイトの管理者がユーザに閲覧して欲しいウェブページがあれば、そのウェブページの重要キーワードが「テレビ」に決定される。
【0030】
そして、リンク生成装置2は、ウェブサーバ1に記憶されるアクセスログを所定のタイミングで取得し、前回取得時から見て追加された情報(差分のアクセスログ)を解析する。ユーザが検索サイトサーバ3を利用して、ウェブサーバ1にアクセスする場合、ページ取得要求直前に閲覧されたウェブページは検索サイトのものであり、アクセスログに含まれる取得元アドレス情報には、検索サイトサーバ3のURLが格納される。そして、そのURLには、入力された検索語句も含まれる。また、アクセスログに含まれる取得先アドレス情報は、アクセスのあったウェブページを特定する。
【0031】
従って、重要キーワードとアクセスに使用された検索語句を比較することで、ウェブサイト管理者の意図に沿ったアクセスがなされるかを判定することができる。つまり、ウェブページへのアクセスに使用された検索語句が重要キーワードと一致していれば、ウェブサイト管理者の意図が反映されており、そうでない場合には、ウェブサイト管理者の意図が反映されていないことになる。例えば、検索サイトにて検索語句「テレビ」で検索を行った結果、検索サイトで使用されるアルゴリズムにより、重要キーワードが「テレビ」であるウェブページより、重要キーワードが「DVD」であるウェブページが上位にランクされ、ユーザが「DVD」のウェブページが閲覧されてしまう場合などは、管理者の意図に沿ったアクセスが行われていないことになる。
【0032】
そこで、リンク生成装置2は、あるウェブページへのアクセスに使用された検索語句が、他のウェブページの重要キーワードである場合、そのあるウェブページに他のウェブページへのハイパーリンクを追加する。これにより、ユーザをウェブサイト管理者の意図を反映したウェブページへ誘導することができる。
【0033】
続いて、本発明の実施形態において使用するウェブサイトについて説明する。
【0034】
図2は、ウェブサーバ1に構築されるウェブサイトの一例であり、その構造をクライアント端末に表示される画面例によって説明する図である。本実施形態では、ウェブサーバ1に構築されるウェブサイト名をサイトAとし、そのURLがhttp://sitea.aaa/であるとする。また、サイトAは、PCの製品紹介サイトであり、その仕様や、機能が記載されるものとする。
【0035】
サイトAのトップページ(http://sitea.aaa/index.html)には、2つのハイパーリンクが埋め込まれ、1つは、機能を説明する目次ページ(http://sitea.aaa/usage/special/index.html)へのリンクであり、もう一つは、仕様を説明するページ(http://sitea.aaa/products/spec.html)へのリンクとなっている。更に、機能を説明する目次ページ(http://sitea.aaa/usage/special/index.html)には、DVD作成機能を説明するページ(http://sitea.aaa/usage/special/dvd.html)へのリンクと、テレビ録画機能を説明するページ(http://sitea.aaa/usage/special/tv.html)へのリンクが埋め込まれている。
【0036】
ユーザが各ハイパーリンクをクリックすると、クライアント端末は、リンクに対応するURLのページ取得要求をウェブサーバ1に送信し、ウェブサーバ1が対応するウェブページファイルを送信し、クライアント端末がそれを表示する。こうして、ユーザは、ウェブサーバ1に構築される階層的なウェブサイト内のウェブページを、ハイパーリンクをクリックすることで、次々に表示させることができる。
【0037】
図3は、本実施形態におけるクライアント端末101〜104、ウェブサーバ1、リンク生成措置2、検索サイトサーバ3の構成ブロック図である。図3は、クライアント端末の一例として、図1のノートブックPC101を説明するものである。
【0038】
ノートブックPC101は、バス20を介して互いに接続される制御部11、RAM(Random Access Memory)12、記憶部13、ネットワークインタフェース(I/F)14、周辺機器接続用インタフェース(I/F)15、入力部16、表示部17を含む。
【0039】
制御部11は、図示省略されたCPU(Central Processing Unit)を含み、RAMに読み出されるプログラムを実行し、ノートブックPC101に含まれる各部を制御する。RAM12は、ノートブックPC101の処理における演算結果やプログラムが一時的に格納される記憶手段である。記憶部13は、ハードディスク、光ディスク、磁気ディスク、フラッシュメモリ等の不揮発性記憶手段であり、各種データやRAMへ読み出される前のOS(Operating System)等のプログラムが格納される。
【0040】
周辺機器I/F15は、ノートブックPC101に周辺機器を接続するためのインタフェースであり、USB(Universal Serial Bus)ポートや、PCIカードスロット等である。周辺機器は、プリンタ、TVチューナ、SCSI(Small Computer System Interface)機器、オーディオ機器、メモリカードリーダライタ、ネットワークカード、無線LANカード、モデムカードなど多岐に渡る。その他、周辺機器には、周辺機器I/F15を介して外部接続されるUSBマウス、プレゼンテーション用に外部接続されるプロジェクタ、外部モニタなども含まれる。
【0041】
ネットワークI/F14には、ネットワーク5を介して送受信する信号またはデータが入出力される。ネットワークI/F14は、上述した周辺機器I/F15を介して外部接続されるネットワークカード、無線LANカード、モデムカード等の通信カードがあれば、省略されてもよい。
【0042】
入力部16は、キーボード、マウス、タッチパネル、ボタン等ユーザからの指示(コマンド)の入力信号をノートブックPC101に入力する入力装置であり、表示部17は、液晶画面、CRT(Cathode Ray Tube)等ユーザに対する情報を表示するための表示装置である。
【0043】
図3に説明したノートブックPC101の他、PDA102、携帯電話103であれば、図3同様入力部16、表示部17が本体に備えられているが、他のクライアント端末(例えば、デスクトップPC104)、ウェブサーバ1、リンク生成装置2、検索サイトサーバ3においては、キーボード等の入力部16、液晶ディスプレイ、CRT等の表示部17が、周辺機器I/F15を介して外部接続されていてもよい。
【0044】
図4は、本発明の実施形態におけるリンク生成装置2とウェブサーバ1を説明する機能ブロック図である。図4の各機能部は、それぞれの装置の制御部に備えられる図示省略されたCPUで実行されるプログラムとして実現することも、ハードウェアにより実現することも可能である。
【0045】
ウェブサーバ1は、リクエスト処理部41、リンク生成情報送信部42、更新部43、そして記憶部を含む。ウェブサーバ1の記憶部には、複数のウェブページファイル61、アクセスログデータベース(アクセスログDB)62が格納される。
【0046】
リクエスト処理部41は、クライアント端末から送信されるページ取得要求を受信すると、そのページ取得要求によって指定されるURLに対応するウェブページファイル61を記憶部から読み出して、ページ取得要求を送信したクライアント端末に送信する。このとき、リクエスト処理部41は、所定の情報をアクセスログとしてアクセスログDB62に格納する。
【0047】
図5は、本実施形態におけるアクセスログDB62に格納されるアクセスログのデータ構成例である。アクセスログDB62には、図5に示されるアクセスログが複数格納され、1行のデータが1つのアクセスに対応する。
【0048】
図5のアクセスログに含まれる所定の情報としては、ページ取得要求を送信したクライアント端末のIPアドレス621、ウェブサーバ1がページ取得要求を処理し終えた時刻623、クライアント端末からの要求内容624、ウェブサーバ1がクライアント端末に返すステータスコード625、クライアント端末に送信されたデータの応答ヘッダを除いたサイズ626、リファラ(referer)と呼ばれる、クライアント端末が報告してくる取得元のアドレス情報627、クライアント端末のウェブブラウザに関する情報628が含まれる。図5におけるハイフン記号622は、要求された情報が入手できなかったということを意味しており、入手できれば、クライアント端末の識別子と、ページ取得要求を行ったユーザのユーザIDが記憶される。また、IPアドレス621の一部は、*により伏せてあるが、実際には、1桁の数字が使用される。
【0049】
取得元アドレス情報627のドメイン名(図5でいうwww.searchengine1.aaa)を解析すれば、ウェブサーバ1へのアクセス直前にユーザが閲覧していたウェブサイトを特定することができ、特にそれが検索サイトである場合、この取得元アドレス情報には、検索に使用された検索語句も含まれる。また、クライアント端末からの要求内容624には、取得先のウェブページのアドレス情報が含まれている。従って、図5のアクセスログを解析すれば、ウェブサーバ1のウェブページが、どのような検索語句によってアクセスされたのかを把握することが可能である。
【0050】
なお、ここでは、ページ取得要求だけを説明したが、リクエスト処理部41が処理する、ウェブサーバ1に対する要求はこれだけではない。ウェブサーバ1にクライアント端末から何らかの要求がある度に、図5同様アクセスログが記憶される。
【0051】
図4に戻り、リンク生成装置2は、定期的にアクセスログを解析するので、ウェブサーバ1は、リンク生成装置2から定期的にアクセスログ取得要求を受信する(M91)。すると、ウェブサーバ1のリンク生成情報送信部42は、リンク生成装置2からのアクセスログ取得要求に応じて、前回のアクセスログ取得要求から今回のアクセスログ取得要求の間にアクセスログDB62に格納されたアクセスログ(差分データ)を送信する(M91)。
【0052】
また、リンク生成装置2は、誘導リンクを追加する必要があると判定したウェブページに誘導リンクを追加するので、ウェブサーバ1は、リンク生成装置2からファイル取得要求を受信する(M92)。すると、ウェブサーバ1のリンク生成情報送信部42は、リンク生成装置2からのファイル取得要求に応じて、ファイル取得要求にて指定されたウェブページに対応するウェブページファイルを送信する(M92)。
【0053】
更新部43は、リンク生成装置2より誘導リンクが追加されたウェブパージファイルを受信し(M93)、ウェブサーバ1の記憶部に格納して、対応するウェブページを更新する。
【0054】
一方のリンク生成装置2は、検索情報抽出部51、誘導リンク生成判定部52、リンク生成部53、そして記憶部を含む。リンク生成装置2の記憶部には、重要キーワードデータベース(重要キーワードDB)71、語句抽出情報72、集計結果データベース(集計結果DB)73、頻出語句データベース(頻出語句DB)74が格納される。
【0055】
検索情報抽出部51は、定期的にウェブサーバ1にアクセスログ取得要求を送信しアクセスログを取得する。そして、アクセスログに含まれる取得元アドレス情報627に基づき、語句抽出情報72を参照して、ウェブサーバ1へのアクセスが検索サイトサーバ3を経由してのアクセスかを特定し、検索サイトサーバ3を経由してのアクセスである場合、使用された検索語句を抽出する。
【0056】
図6は、本実施形態における語句抽出情報72のデータ構成例である。語句抽出情報72は、予め、検索サイト毎に作成されリンク生成装置2の記憶部に格納される。語句抽出情報は、アクセスログに含まれる取得元アドレス情報627に基づき、ウェブサーバ1へのアクセスが検索サイトサーバ3を経由してのアクセスかを特定し、検索サイトサーバ3を経由してのアクセスである場合、使用された検索語句を抽出するために必要な情報である。新たな検索サイトが追加される場合、追加される検索サイトに関する語句抽出情報72も追加される。
【0057】
図6の語句抽出情報72には、「検索サイト名」、「サイトアドレス」、「検索語句箇所」というデータ項目が含まれる。「検索サイト名」は、検索サイトを識別するための名前であり、「サイトアドレス」は、検索サイトを特定するサーバ名、ドメイン名、またはサーバ名とドメイン名の組合せのいずれかである。アクセスログに含まれる取得元アドレス情報627に、「サイトアドレス」で使用される文字列が含まれていれば、そのアクセスログに対応するアクセスは、検索サイト経由のアクセスであると識別できる。
【0058】
「検索語句箇所」は、アクセスログに含まれる取得元アドレス情報627から検索サイトに入力された検索語句を抽出するための情報である。例えば、図5に示される取得元アドレス情報627を例にとって説明すれば、図6の1行目の「サイトアドレス」で使用される文字列を含むことから、このアクセスは、検索サイト「Aのモーニング検索」を経由したものであることが分かる。そして、図6の1行目の「検索語句箇所」を参照すれば、「search」というCGI(Common Gateway Interface)に渡される引数の名前「q」の値が検索語句であることがわかり、図5の例の場合、「DVD%E3%80%80%E3%83%86%E3%83%AC%E3%83%93」である。これは、URLエンコードされた文字列であり、URLデコードすれば、「DVD テレビ」が抽出できる。つまり、検索語句としてユーザが検索サイトに入力したのは、「DVD」「テレビ」の2語であることが判明する。
【0059】
取得元アドレス情報627に含まれる検索語句の抽出の仕方は検索サイト毎に異なるが、図6の「検索語句箇所」を参照することによって、適切に検索語句を抽出することができる。こうして、検索情報抽出部51は、アクセスログに含まれる取得元アドレス情報627から、検索サイトを経由するアクセスを特定し、使用された検索語句を抽出する。
【0060】
また検索情報抽出部51は、検索サイトサーバ3を経由するアクセスにより取得されたウェブページのアドレス情報を取得する。これは、クライアント端末からの要求内容624に含まれる取得先のアドレス情報を参照することで得られる。図5の例の場合、クライアント端末からの要求内容624を空白で区切ったとき、GETコマンドに続く一塊(/usage/special/dvd.html)が取得先のアドレス情報である。そして、検索情報抽出部51は、ウェブページ毎に、そのウェブページへのアクセスに使用された検索語句やその登場回数を含む結果を集計して、集計結果DB73に格納する。
【0061】
図7は、本実施形態における集計結果DB73のデータ構成例である。図7の集計結果DB73は、「ページID」、「パス」、「検索語句/回数」というデータ項目を含む。「ページID」は、各ウェブページを一意に特定する識別子であり、文字、数字、記号が使用される。「パス」は、各ウェブページに対応するウェブページファイルのウェブサーバ1での格納先を示すアドレス情報である。図7では、サイトアドレス(sitea.aaa)の表記が省略されている。
【0062】
「検索語句/回数」は、検索サイトを経由してウェブページへアクセスされる場合に検索語句として使用された用語とその回数を対応付けたものである。例えば、図7のページIDがAであるウェブページ(/usage/special/dvd.html)は、その回数順に多いほうから「DVD、テレビ、録画、作成」という語句が検索サイトに入力された結果閲覧されたことがわかる。こうして、図7の集計結果DB73により、ウェブページ毎に、どのような検索語句によってアクセスされるのか、その傾向が明らかになる。
【0063】
図4に戻り、検索情報抽出部51により集計結果DB73が更新されると、その旨が誘導リンク生成判定部52へ通知され、誘導リンク生成判定部52は、ウェブページ毎に重要キーワードが対応付けられる重要キーワードDB71と、集計結果DB73を基に、ユーザを誘導するためのハイパーリンクである誘導リンクを生成すべきかを判定する。
【0064】
誘導リンク生成判定部52は、ページIDにより特定されるウェブページ毎に、重要キーワードDBの「重要キーワード」(図8にて後述)と、集計結果DBの「検索語句/回数」(図7参照)とを比較し、そのウェブページの重要キーワード以外の語句で回数が多い上位2語を抽出する。次に、抽出された2語が他のウェブページの重要キーワードに設定されているか、重要キーワードDBを参照して判定し、他のウェブページの重要キーワードに設定されている語句を、ウェブページファイルに対応付けて頻出語句DB74に格納する。
【0065】
なお、誘導リンク生成判定部52が判定に使用する語句は、上位2語でなくともよい。集計結果DB73の「検索語句」に含まれるすべての語句を判定の対象としてもよい。また、登場回数が所定の閾値(例えば、500回)を超える検索語句だけを判定に用いることも可能である。
【0066】
図8は、本実施形態におけるウェブページ毎に重要キーワードが対応付けられる重要キーワードDB71のデータ構成例である。重要キーワードは、ウェブページ毎に設定され、予め、リンク生成装置2に格納される。図8の重要キーワードDBは、「ページID」、「パス」、「重要キーワード」、「タイトル」というデータ項目を含む。
【0067】
「ページID」は、各ウェブページ一意に特定する識別子であり、文字、数字、記号が使用される。「パス」は、各ウェブページに対応するウェブページファイルの格納先を示すアドレス情報である。「タイトル」は、各ウェブページの内容を簡単に説明する見出しである。
【0068】
「重要キーワード」は、各ウェブページの重要キーワードである。重要キーワードは、ウェブページに記述される内容を特徴付ける語句であり、その語句が検索サイトで検索語句として入力されるときにウェブサイトの管理者がユーザに閲覧して欲しいウェブページに対応付けられる。例えば、図8のページIDがAのウェブページであれば、検索サイトにてユーザが「DVD」と入力したとき、ウェブサイトの管理者が閲覧して欲しいウェブページであることを意味する。
【0069】
図9は、本実施形態における頻出語句DB74のデータ構成例である。図9の頻出語句DBは、「ページID」、「パス」、「頻出語句」というデータ項目を含む。「ページID」は、各ウェブページを一意に特定する識別子であり、文字、数字、記号が使用される。「パス」は、各ウェブページに対応するウェブページファイルの格納先を示すアドレス情報である。
【0070】
「頻出語句」は、上述したように、各ウェブページへのアクセスに使用された検索語句のうち、自ページの重要キーワード以外の語句で所定の条件を満たし(例えば、登場回数の上位2つ等)、かつ、他のウェブページの重要キーワードとして設定されているものである。
【0071】
例えば、図7、図8に示される例において、ページIDがAであるウェブページファイル(/usage/special/dvd.html)は、その重要キーワードが「DVD」であるが(図8「重要キーワード」参照)、検索サイトを経由するアクセスにおいては、「DVD」の他、「テレビ、録画、作成」という語句が使用される(図7「検索語句/回数」参照)。
【0072】
そして、重要キーワードである「DVD」を除く登場回数の上位2語のうち、「テレビ」はページIDがBであるウェブページファイル(/usage/special/tv.html)の重要キーワードとして使用されており(図8参照)、ウェブサイト管理者としては、「テレビ」という語句が検索語句に含まれるとき、ページIDがBであるウェブページファイルをユーザには閲覧して欲しいことになる。従って、この場合、ページIDがAであるウェブページファイル内に、ページIDがBであるウェブページファイルへのハイパーリンクを追加すればよい。
【0073】
図4に戻り、誘導リンク生成判定部52により頻出語句DB74が更新されると、その旨がリンク生成部53へ通知され、リンク生成部53は、頻出語句DB74と、重要キーワードDB71を基に、ウェブサーバ1からユーザを誘導するための誘導リンクを追加するウェブページを構成するウェブページファイルを取得し、誘導リンクを追加したウェブページファイルをウェブサーバ1に送信する。
【0074】
リンク生成部53は、頻出語句DB74の「頻出語句」を参照し、そこに格納される語句が重要キーワードとして設定されるウェブページのパスを重要キーワードDB71(図8)を参照して取得する。例えば、図9の場合、ページIDがAであるウェブページファイルの「頻出語句」である「テレビ」は、図8を参照すれば、ページIDがBであるウェブページファイル重要キーワードであることがわかり、図8の「パス」を参照して/usage/special/tv.htmlが得られる。そして、リンク生成部53は、誘導リンクを追加するページIDがAであるウェブページファイルのファイル取得要求をウェブサーバ1に送信し、そのウェブページファイル(/usage/special/dvd.html)に、ページIDがBであるウェブページファイル(/usage/special/tv.html)へのハイパーリンクを追加する。
【0075】
図10は、本実施形態におけるリンク追加前とリンク追加後のウェブページファイル例を示す図である。図10Aは、リンク追加前のウェブページファイルである。本実施形態においては、追加される誘導リンクを配置する領域の区切りを表す印として、<!-- guide_link_area -->と<!-- /guide_link_area -->という、ウェブブラウザに対するコメントタグが用意されている。
【0076】
図10Bは、リンク追加後のウェブページファイルであり、<!-- guide_link_area -->から<!-- /guide_link_area -->で囲まれる誘導リンクが配置される領域に、ページIDがBであるウェブページファイル(/usage/special/tv.html)へのハイパーリンクが<a href>タグによって追加されることがわかる。リンクタイトル(ハイパーリンクがウェブブラウザにより表示されるときの見出し)は、重要キーワードDB71の「タイトル」を参照して得られる文字列が使用され、<a>から</a>の間に埋め込まれている。
【0077】
つまり、リンク生成部53は、追加するハイパーリンクのパスとタイトルを基に、<a href>タグのハイパーリンクを生成した後、取得したウェブページファイルを解析し、<!-- guide_link_area -->と<!-- /guide_link_area -->により囲まれる領域に追加する誘導リンクを配置することで、誘導リンクが追加されたウェブページファイルを生成する。
【0078】
そして、リンク生成部53は、誘導リンクが追加されたウェブページファイルをウェブサーバ1に送信し、ウェブサーバ1が、送信されたウェブページをウェブサーバ1の記憶部に格納してウェブページを更新することで、次回からのアクセスに対して、ユーザには誘導リンクが追加されたウェブページが表示されることになる。
【0079】
図11は、本実施形態におけるリンク生成装置2の動作を説明するフローチャートである。予め、重要キーワードDB71と、語句抽出情報72がリンク生成装置2の記憶部に格納されている。
【0080】
まず、リンク生成装置2は、ウェブサーバ1のアクセスログを取得する(S1)。これは、リンク生成装置2の検索情報抽出部51がウェブサーバ1にアクセスログ取得要求を送信し、ウェブサーバ1のリンク生成情報送信部42が、アクセスログDBに格納されるアクセスログをリンク生成装置2に送信することで行われる。
【0081】
次に、リンク生成装置2は、取得したアクセスログに基づき、検索サイトサーバ3経由のアクセスを特定し、更に、ウェブページ毎に使用された検索語句を抽出する(S2)。これは、リンク生成装置2の検索情報抽出部51が、アクセスログの取得元アドレス情報627に、語句抽出情報72の「サイトアドレス」が含まれるアクセスログを検索し、含まれるアクセスログがあれば、語句抽出情報72の「検索語句箇所」に基づき、検索語句を抽出するものである。
【0082】
そして、リンク生成装置2は、ウェブページファイル毎にアクセスに用いられた検索語句を集計し、集計結果DB73を更新する(S3)。これは、リンク生成装置2の検索情報抽出部51がステップS2で抽出された検索語句とその登場回数をウェブページ毎に集計して、集計結果DB73に格納するものである。
【0083】
そして、リンク生成装置2は、ウェブページ毎に、検索語句に他のウェブページの重要キーワードに設定された語句が含まれるかを判定する(S4)。これは、誘導リンク生成判定部52が、ウェブページ毎に、集計結果DB73に格納される「検索語句」と、重要キーワードDB71に格納される「重要キーワード」とを比較することで行われる。
【0084】
誘導リンク生成判定部52は、ウェブページ毎に、比較元のウェブページの「検索語句」に、他のウェブページの「重要キーワード」が含まれていれば(S4Yes)、比較元のウェブページにその「重要キーワード」を対応付けて頻出語句DB74を更新する(S5)。なお、ステップS5では集計結果の登場回数に基づき、上位数個の語句だけを判定に用いてもよい。また、登場回数が所定の閾値(例えば、500回)を超える検索語句だけを判定に用いることも可能である。
【0085】
すべてのウェブページにおいて、比較元のウェブページの「検索語句」に、他のウェブページの「重要キーワード」が含まれていなければ(S4No)、各ウェブページへのアクセスは、ユーザが検索サイトで重要キーワードを入力することによって行われており、ウェブサイト管理者の意図に沿ったアクセスがなされていると判定され、リンク生成装置2は誘導リンクを生成することなく処理を終了する。
【0086】
ステップS5の頻出語句DB74の更新が完了すると、リンク生成装置2は、比較元のウェブページファイルに、頻出語句に対応するウェブページへの誘導リンクを追加する(S6)。まず、リンク生成装置1のリンク生成部53が、頻出語句DBの「パス」に対応するウェブページファイルのファイル取得要求をウェブサーバ1に送信し、ウェブサーバ1のリンク生成情報送信部42により送信される「パス」に対応するウェブページファイルを取得する。
【0087】
次に、リンク生成部53は、頻出語句DB74の「頻出語句」が重要キーワードに設定されているウェブページの「パス」を重要キーワードDB71から取得し、そのパスへのハイパーリンク(誘導リンク)を先ほど取得したウェブページファイルに追加する。誘導リンクの追加は、図10で説明した通りである。
【0088】
最後に、リンク生成装置2のリンク生成部53は、誘導リンクが追加されたウェブページファイルをウェブサーバに送信し、処理を終了する(S7)。ウェブサーバ1の更新部43は、受信したウェブページファイルをウェブサーバ1の記憶部に格納し、ウェブページを更新する。
【0089】
図12は、本実施形態において、ユーザが検索サイトサーバ3を利用して、ウェブサーバ1に構築されたサイトAを閲覧する様子をクライアント端末に表示される画面例で説明する図である。図12においては、検索サイトサーバ3は、「Aのモーニング検索」であり、そのサイトアドレスは、www.searchengine1.aaaであるとする。
【0090】
まず、ユーザは、検索サイトサーバに検索語句を入力してウェブサイトの検索を行う(画面111)。画面111では、「Aのモーニング検索」(www.searchengine1.aaa)にてユーザが、「テレビ」に関する情報を得ようと検索を行う様子が描かれる。
【0091】
ユーザは、フォーム欄81に検索語句を入力し、検索ボタン82をクリックして検索を実行する。すると、検索結果として、複数のウェブページへのハイパーリンクが表示される(画面112)。ここでは、一番上に表示される「サイトAのウェブページ」のハイパーリンクがクリックされるとする。
【0092】
そして、サイトAのウェブページ(http://sitea.aaa/usage/special/dvd.html)が表示される(画面113)。このページの重要キーワードに設定されているのは、「テレビ」ではなく、「DVD」であるため(図8参照)、ウェブサイト管理者の立場から言えば本来閲覧して欲しいウェブページではない。しかし、本実施形態により、検索語句「テレビ」に対して閲覧して欲しいウェブページ(http://sitea.aaa/usage/special/tv.html)へのハイパーリンク(パソコンでテレビを楽しむ)が追加されているため、重要キーワードが「テレビ」であるウェブページへとユーザを適切に誘導することができる。ユーザが、誘導リンク83をクリックすれば、http://sitea.aaa/usage/special/tv.htmlが表示される(画面114)。
【0093】
なお、本実施形態においては、リンク生成装置2とウェブサーバ1が、別々の装置として、ネットワーク5を介して接続されているが、ウェブサーバとリンク生成装置は、パラレルケーブル、シリアルケーブル、USB等の信号線により直接接続されても構わない。
【0094】
また、リンク生成装置2とウェブサーバ1を1つの装置(リンク生成機能を有するウェブサーバあるいはウェブサーバ機能を有するリンク生成装置)として実現することも可能である。その場合、検索情報抽出部51、リンク生成部53は、ネットワーク5を介さずに、ウェブページファイルやアクセスログにアクセスできるので、図4の機能ブロック図において、リンク生成情報送信部42、更新部43を省略可能である。
【0095】
また、本実施形態においては、重要キーワードは、ウェブサイトの管理者あるいは、リンク生成装置2の操作者によって、ウェブページの内容を反映して設定される必要があるが、リンク生成装置2が自動化することも可能である。例えば、<meta>タグを使用する方法が挙げられる。自動化のためのルールとして、重要キーワードは、<meta>タグのname="Keywords"に対応するcontentの値である、というようにすればよい。
【0096】
リンク生成装置2は、定期的にウェブサーバ1のウェブページを取得し、そのウェブページファイルに対して、上記ルールに則った解析を行えば、重要キーワードの抽出は容易である。同様にして、図8の重要キーワードDBのデータ項目である「タイトル」は、<meta>タグのname="Description"に対応するcontentの値である、というルールを適用すれば、簡単に重要キーワードDB71の構築が可能になる。実際の使用例は、図10Aに見ることができる。
【0097】
以上に説明したように、本実施形態によれば、ウェブページに設定された重要キーワードと異なる検索語句によるアクセスが頻繁に発生するウェブページに、ウェブサイト管理者が本来その検索語句が入力されるときユーザに閲覧して欲しいウェブページへのハイパーリンクが追加されることによって、ウェブサイトにアクセスするユーザを認証処理等によって識別することなく、ウェブサイト管理者の意図するウェブページへと誘導することができる。ユーザを識別する必要がないことから、ウェブサーバが保有するログ記録機能をそのまま利用することができ、リンク生成装置2の導入が簡単に行える。リンク生成装置2の機能は、プログラムとして実現することもできるため、ウェブサーバ1にインストールして1台の装置にまとめることができ、コスト、管理の手間を削減することにもなる。
【0098】
以上まとめると付記のようになる。
【0099】
(付記1) :ウェブサーバと共に用いるリンク生成装置
利用者が求める情報のリンク先を生成するリンク生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とするリンク生成装置。
【0100】
(付記2)
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とする 付記1記載のリンク生成装置。
【0101】
(付記3)
前記検索情報抽出部は、前記ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とする付記1記載のリンク生成装置。
【0102】
(付記4)
前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記1記載のリンク生成装置。
【0103】
(付記5)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記1記載のリンク生成装置。
【0104】
(付記6) :リンク生成装置を内蔵したウェブサーバ
利用者が指定した情報を生成する情報生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とする情報生成装置。
【0105】
(付記7)
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とする付記6記載の情報生成装置。
【0106】
(付記8)
前記検索情報抽出部は、情報生成装置に対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とする付記6記載の情報生成装置。
【0107】
(付記9)
前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記6記載の情報生成装置。
【0108】
(付記10)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記6記載の情報生成装置。
【0109】
(付記11) :ウェブサーバ
通信網と接続する通信部を有し、
通信網を経由して通信することを特徴とする付記6記載の情報生成装置。
【0110】
(付記12)
コンピュータに、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを実行させることを特徴とするプログラム。
【0111】
(付記13)
前記検索情報抽出手順において、前記検索情報の履歴が記憶され、
前記誘導リンク生成判定手順において、前記検索情報の履歴を基に前記判定が行われることを特徴とする付記12記載のプログラム。
【0112】
(付記14)
前記検索情報抽出手順において、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数が記憶され、
前記誘導リンク生成判定手順において、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報が前記判定に用いられることを特徴とする付記12記載のプログラム。
【0113】
(付記15)
前記誘導リンク生成判定手順において、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記12記載のプログラム。
【0114】
(付記16)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記12記載のプログラム。
【0115】
(付記17)
利用者が求める情報のリンク先を生成するリンク生成方法において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを有することを特徴とするリンク生成方法。
【0116】
(付記18)
前記検索情報抽出手順において、前記検索情報の履歴が記憶され、
前記誘導リンク生成判定手順において、前記検索情報の履歴を基に前記判定が行われることを特徴とする付記17記載のリンク生成方法。
【0117】
(付記19)
前記検索情報抽出手順において、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数が記憶され、
前記誘導リンク生成判定手順において、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報が前記判定に用いられることを特徴とする付記17記載のリンク生成方法。
【0118】
(付記20)
前記誘導リンク生成判定手順において、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とする付記17記載のリンク生成方法。
【0119】
(付記21)
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とする付記17記載のリンク生成方法。
【図面の簡単な説明】
【0120】
【図1】本発明の実施形態における情報システムの構成図である。
【図2】ウェブサーバに構築されるウェブサイトの一例であり、その構造をクライアント端末に表示される画面例によって説明する図である。
【図3】本実施形態におけるクライアント端末、ウェブサーバ、リンク生成措置、検索サイトサーバの構成ブロック図である。
【図4】本発明の実施形態におけるリンク生成装置とウェブサーバを説明する機能ブロック図である。
【図5】本実施形態におけるアクセスログDBに格納されるアクセスログのデータ構成例である。
【図6】本実施形態における語句抽出情報のデータ構成例である。
【図7】本実施形態における集計結果DBのデータ構成例である。
【図8】本実施形態におけるウェブページ毎に重要キーワードが対応付けられる重要キーワードDBのデータ構成例である。
【図9】本実施形態における頻出語句DBのデータ構成例である。
【図10】Aは、本実施形態におけるリンク追加前のウェブページファイル例を示す図であり、Bは、リンク追加後のウェブページファイル例を示す図である。
【図11】本実施形態におけるリンク生成装置の動作を説明するフローチャートである。
【図12】本実施形態において、ユーザがウェブサーバに構築されたサイトAを閲覧する様子をクライアント端末に表示される画面例で説明する図である。
【符号の説明】
【0121】
1 ウェブサーバ、2 リンク生成装置、3 検索サイトサーバ、5 ネットワーク、11 制御部、12 RAM、13 記憶部、14 ネットワークI/F、15 周辺機器I/F、16 入力部、17 表示部、20 バス、41 リクエスト処理部、42 リンク生成情報送信部、43 更新部、51 検索情報抽出部、52 誘導リンク生成判定部、53 リンク生成部、61 ウェブページファイル、62 アクセスログ、71 重要キーワードDB、72 語句抽出情報、73 集計結果DB、74 頻出語句DB、101 クライアント端末(ノートブックPC)、102 クライアント端末(PDA)、103 クライアント端末(携帯電話)、104 クライアント端末(デスクトップPC)
【特許請求の範囲】
【請求項1】
利用者が求める情報のリンク先を生成するリンク生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とするリンク生成装置。
【請求項2】
請求項1において、
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とするリンク生成装置。
【請求項3】
請求項1において、
前記検索情報抽出部は、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とするリンク生成装置。
【請求項4】
請求項1において、
前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とするリンク生成装置。
【請求項5】
請求項1において、
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とするリンク生成装置。
【請求項6】
利用者が指定した情報を生成する情報生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とする情報生成装置。
【請求項7】
請求項6において、
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とする情報生成装置。
【請求項8】
請求項6において、
前記検索情報抽出部は、前記情報生成装置に対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とする情報生成装置。
【請求項9】
請求項6において、
通信網と接続する通信部を有し、
通信網を経由して通信することを特徴とする情報生成装置。
【請求項10】
利用者が求める情報のリンク先を生成するリンク生成方法において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを有することを特徴とするリンク生成方法。
【請求項1】
利用者が求める情報のリンク先を生成するリンク生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とするリンク生成装置。
【請求項2】
請求項1において、
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とするリンク生成装置。
【請求項3】
請求項1において、
前記検索情報抽出部は、ウェブサーバに対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とするリンク生成装置。
【請求項4】
請求項1において、
前記誘導リンク生成判定部は、リンク先の格納された情報内に埋め込まれたタグを基に前記判定を行うことを特徴とするリンク生成装置。
【請求項5】
請求項1において、
前記検索操作情報とは、検索装置が生成するアクセスログであることを特徴とするリンク生成装置。
【請求項6】
利用者が指定した情報を生成する情報生成装置において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出部と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定部と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成部とを有することを特徴とする情報生成装置。
【請求項7】
請求項6において、
前記検索情報抽出部は、前記検索情報の履歴を記憶し、
前記誘導リンク生成判定部は、前記検索情報の履歴を基に前記判定を行うことを特徴とする情報生成装置。
【請求項8】
請求項6において、
前記検索情報抽出部は、前記情報生成装置に対するページ取得要求と共に受信する前記検索情報の登場回数を記憶し、
前記誘導リンク生成判定部は、前記検索情報のうち、前記登場回数が所定の閾値を超える検索情報を前記判定に用いることを特徴とする情報生成装置。
【請求項9】
請求項6において、
通信網と接続する通信部を有し、
通信網を経由して通信することを特徴とする情報生成装置。
【請求項10】
利用者が求める情報のリンク先を生成するリンク生成方法において、
利用者が行った検索操作を記録した検索操作情報から、検索情報を抽出する検索情報抽出手順と、
前記検索情報を基に、新たなリンク先を生成できるかを判定する誘導リンク生成判定手順と、
前記誘導リンク生成判定部によって新たなリンク先が生成できると判定できた場合に、新たなリンク先を生成するリンク生成手順とを有することを特徴とするリンク生成方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2006−65395(P2006−65395A)
【公開日】平成18年3月9日(2006.3.9)
【国際特許分類】
【出願番号】特願2004−243979(P2004−243979)
【出願日】平成16年8月24日(2004.8.24)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成18年3月9日(2006.3.9)
【国際特許分類】
【出願日】平成16年8月24日(2004.8.24)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]