説明

情報検索システム及び情報検索方法

【課題】検索結果に今現在の人気を反映させることが可能であり、必要な情報へ到達することが容易であり、目的の情報の理解が容易である検索システム及び情報検索方法を提供することである。
【解決手段】複数のクライアント端末で同時に情報検索システム使用し、いずれかのクライアント端末で検索が実行された際に、検索結果に該当する各Webページを同時に閲覧しているクライアント端末の総和や、該クライアント端末の過去のWebページの閲覧履歴や使用履歴に基づいて、検索結果のWebページを、知識の深いユーザや検索の上手いユーザが多く閲覧している順に並び替えて検索結果を表示することができる情報検索システムを提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、WWW(World Wide Web)の情報検索システムにおいて、目的の情報を効率良く容易に取得するための技術に関する。
【背景技術】
【0002】
ユーザがWWWの膨大な情報の中から目的の情報を得ようとする場合に、通常検索システムを利用する。検索システムは、ユーザが入力した検索キーワードに対して、該当するWebページを特定して集める。しかし、このような場合において、多数のWebページが集められることにより、ユーザにとってどのWebページが本当に必要な情報を提供するWebページであるのかが容易に判断することができない。
そこで、集められたWebページに重要度を付けて重要度の高いものから順に提示することが通例である。
【0003】
ユーザはこの重要度を参考にWebページを参照するので、Webページの重要度の付け方は検索システムの性能を左右する。そのため、従来、Webページの重要度の付け方に関するさまざまな技術が提案されている。このようなWebページの重要度を判断する技術が特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−215674号公報
【0005】
ここで、特許文献1に開示されている発明は、各クラスタに分類されたWebページに関して、そのクラスタ内で類似度に基づいてリンクの再構成を行うと共にリンクの順序を定め、入力された検索語に対して、再構成されたリンクの順序にWebページのURLを並べ直して、各Webページの推奨される巡回順序として提示するものである。
したがって、ユーザは提示される巡回順序に従って集められたWebページを順に閲覧することにより、必要な情報へ到達するための労力を削減することができる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1に開示されている発明のような従来の検索方法では、Webページにおける名詞の出現数やリンク構造等を基準にページのランク付けを行っている。そのため、必ずしも今現在において、必要な情報が掲載されているWebページが上位に反映されないという問題点があった。
さらに、ユーザが検索用語を上手く選定できない場合、目的とする情報に辿りつけないという問題点があった。さらにまた、目的とする情報が難解であった場合、ユーザが深い理解を得られないことになるという問題点があった。
【0007】
そこで本発明は、このような課題を解決するために、今現在において閲覧者の多い(人気のある)Webページを反映させることが可能であり、必要な情報へ到達することが容易であり、目的の情報の理解が容易である検索システム及び情報検索方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するための本発明の一態様は、複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索システムであって、検索実行時に、検索対象となるWebページを出力している端末に係る情報である端末情報を取得する情報取得手段を有しており、前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化する情報序列化手段を有することを特徴とする情報検索システムである。
【0009】
本発明の一態様では、検索実行時に、検索対象となるWebページを出力している端末に係る情報である端末情報を取得する情報取得手段を有しており、前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化する情報序列化手段を有する。そのため、Webページ内のキーワードに関連する名詞の数や、検索対象のWebページのリンク構造等だけでなく、人気や話題性、記載内容の精度等を基に検索対象のWebページの中から閲覧対象のWebページを選ぶことができる。
具体的に説明すると、例えば、検索対象のWebページをどのような人が見ているのか、どれだけの人が見ているのか、何を目的に見ているのか等々の情報を検索結果に反映させる。そのことにより、検索実行時に価値の高い情報を効率よく取得することが可能であり、目的の情報への到達が容易になる。
【0010】
本発明の第二の態様は、複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索システムであって、規定された時間内に検索対象となるWebページを出力した端末に係る情報である端末情報を取得する情報取得手段を有しており、前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化する情報序列化手段を有することを特徴する情報検索システムである。
【0011】
本発明の第二の態様では、検索対象となるWebページを、任意に設定された時間内に出力した端末から端末情報を取得する。換言すると、検索実行時の様な「瞬間」でなく「期間」でユーザを検出する。たまたまその時間に閲覧者が減ってしまうことにより、人気の高いWebページが検索結果に反映されないといった問題を回避しやすくなる。そのため、現在人気の高いWebページがより正確に把握できる。
【0012】
本発明の第三の態様は、前記端末情報が、検索実行時において、検索対象のWebページを出力している端末の数に関する情報を含むことを特徴とする請求項1又は2に記載の情報検索システムである。
【0013】
本発明の第三の態様では、端末情報が検索実行時に検索対象のWebページを表示している端末の数に関する情報を含んでいる。そのため、検索実行時に閲覧者の多いWebページを検索結果の上位に表示することができる。そのことにより、ユーザが検索実行時に必要性の高い情報を容易に取得することができる。ここで、「検索実行時に必要性の高い情報」とは時事的要因などにより一時的に価値が高まっている情報や、何らかの原因で急に価値が高まった情報等である。
具体的に説明すると、「建設会社」というキーワードで検索を実行した場合において、従来の情報検索方法では、特定の大手建設会社が常に上位に表示されるが、本発明の情報検索システムでは、前日に株価が急騰した建設会社あった場合、その会社が上位に表示される。
【0014】
本発明の第四の態様は、前記端末情報が、検索実行時において、検索対象のWebページを出力している端末の、システムの利用履歴に関する情報を含むことを特徴とする請求項1乃至3のいずれかに記載の情報検索システムである。
【0015】
本発明の第四の態様では、端末情報が検索実行時に検索対象のWebページを表示している端末のシステムの利用履歴に関する情報を含んでいる。そのため、知識の深いユーザや検索の得意なユーザ等の、より価値の高い情報を取得する可能性の高いユーザが閲覧しているWebページを検索結果の上位に表示することができる。
具体的に説明すると、「C言語」と「掲示板」というキーワードで検索を実行した場合において、従来の情報検索方法では、特定のBBS(Bulletin Board System)が上位に表示される。しかし、本発明の情報検索システムでは、プログラマ等の専門家がそのとき閲覧しているBBSが上位に表示されるので、目的とする情報を取得できる可能性が高くなる。
【0016】
本発明の第五の態様は、前記端末情報を取得している複数の端末間で情報を交換することができる情報交換手段を有することを特徴とする請求項1乃至4のいずれかに記載の情報検索システムである。
【0017】
本発明の第五の態様では、情報検索システムが端末情報を取得している複数の端末間で情報を交換することができる情報交換手段を有しており、同じWebページを閲覧しているユーザ間で情報をやり取りすることができる。そのため、検索結果が目的の情報を記載していない場合や、検索結果の内容が難解だった場合において、検索の方法や内容に関する質問を他のユーザに対して行うことで、検索を実行したユーザはより深い理解を得ることができる。
【0018】
本発明の第六の態様は、前記情報序列化手段によって、序列化されたWebページの少なくとも1つを、いずれかの端末において出力した後に、該端末で出力されたWebページを同時に出力している端末及び/または、該端末で出力されたWebページに関連付けられたWebページを出力している端末に係る前記端末情報に基づく情報を、いずれかの端末にて出力可能な閲覧情報出力手段を有することを特徴とする請求項1乃至5のいずれかに記載の情報検索システムである。
【0019】
本発明の第六の態様では、ユーザが検索結果からを閲覧するリソース(Webページ)を選択し、表示している時に、同時に同じリソースを閲覧している他のユーザに係る情報が表示される。そのため、ユーザは閲覧している検索結果のリソースの、リンク構造や記載内容によらない重要度を把握することができる(例えば、専門家が多く閲覧するWebページは内容が充実している可能性が高いといった情報)。
また、前記したように、ユーザ間で情報のやり取りを行う場合において、興味の似ているユーザや、検索内容に精通しているユーザを発見することができる。
さらに、検索結果のリソースに関連付けられた、別リソースの情報を表示することで、リンクを実行する前に、表示するリソースの重要度を把握することができる。そのため、ユーザはWWWの効率のよい巡回が可能になるため、目的の情報を効率良く取得できる。
なお、上記した「リンクを実行する」とはリソースのハイパーリンクに基づいて、別のリソース(Webページ等)をブラウザで表示させることである。
【0020】
本発明の第七の態様は、複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索方法であって、検索実行時に、検索対象となるWebページを出力している端末に係る情報である端末情報を取得し、前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化することを特徴する情報検索方法である。
【0021】
本発明の第八の態様は、複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索方法であって、規定された時間内に検索対象となるWebページを出力した端末に係る情報である端末情報を取得し、前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化することを特徴する情報検索方法である。
【0022】
本発明の第七の態様及び第八の態様では、検索実行時において人気の高い情報を有するWebページや、ものごとに対する興味が似ているユーザ、検索目的の分野に精通しているユーザ等が閲覧するWebページ等が検索結果の上位に表示される。そのため、必要性が高い情報や質の高い情報を取得し易い。
【発明の効果】
【0023】
本発明は、検索結果に今現在の人気を反映させることが可能であり、必要な情報へ到達することが容易であり、目的の情報の理解が容易である検索システム及び情報検索方法を提供することができる。
【図面の簡単な説明】
【0024】
【図1】本発明の第1の実施形態に係る情報検索システムの構成を示す概念図である。
【図2】図1のクライアント端末の表示装置部の拡大図である。
【図3】本発明の第1の実施形態に係る情報検索システムで蓄積される端末情報の一例を示す図である。
【図4】本発明の第1の実施形態に係る情報検索システムの機能ブロックの一例を示す図である。
【図5】本発明の第1の実施形態に係る情報検索システムのハードウェア構成の一例を示す図である。
【図6】本発明の第1の実施形態に係る情報検索システムのツールバー装置の処理の流れの一例を表わす図である。
【図7】本発明の第1の実施形態に係る情報検索システムの検索装置の処理の流れの一例を表わす図である。
【図8】本発明の第2の実施形態に係る情報検索システムの検索装置の処理の流れの一例を表わす図である。
【発明を実施するための形態】
【0025】
本発明の一実施形態に係る情報検索システム、並びに情報検索方法の提供方法についてそれぞれ図面を参照しながら詳細に説明する。
【0026】
図1は、第1の実施形態の情報検索システム1の構成の概略を示す概念図である。図1に示す様に、情報検索システム1は、検索装置2とクライアント端末4(図1では符号4a〜4c及び・・・で示す)で構成されており、それぞれ電気通信網を介して接続されている。クライアント端末4にて、それぞれブラウザ5(図1では符号5a〜5c及び・・・で示す)が起動されている。また、このブラウザ5には各々ツールバー装置7が組み込まれており、ブラウザ5の起動に合わせてツールバー装置7もブラウザ5上の所定領域101に表示されている(図2)。
【0027】
第1の実施形態の情報検索システム1では、ユーザがブラウザ5やツールバー装置7、及び閲覧したWebページに入力した検索キーワードやURL(Uniform Resource Locator)等の入力情報をツールバー装置7のプログラムによって、検索装置2に自動送信する。そのことで、検索装置2は端末情報として収集することができる。加えて、ブラウザのWebページの表示開始時間、表示終了時間、及び移動先や移動元などWebページの遷移経路を示す情報等の使用情報も、同様に端末情報として、必要に応じてツールバー装置7のプログラムによって自動送信することができる。このようにして、ネットワーク上の各クライアント端末4(4a〜4c,・・・)で収集された端末情報が検索装置2に送信され、検索用データベース3に格納される(図4)。
検索装置2では、取得した端末情報を利用することでユーザランク値を各ユーザに付与する。本明細書における、「ユーザランク値」とは、各ユーザの特定項目に対する知識の深さや、検索スキル等を基に決定される、ユーザの重要度を数値化した値を示す。算出したユーザランク値は検索用データベース3に端末情報として格納される。
【0028】
ここで、図3は、クライアント端末4のツールバー装置7で取得され、さらに検索装置2に自動送信される、検索装置2の検索用データベース3に収集される端末情報の一例を表わす図である。この図にある様に、ユーザIDや、ブラウザにてアクセスしたWebページのURL、そのWebページの閲覧を開始した時刻(アクセス時刻)、閲覧を終了した時刻、そのWebページに今現在アクセスしているかどうかを示すフラグ、あるいは図示していない移動先URLや移動元URLで表わされる遷移経路を示す情報等の適宜な情報が端末情報として検索装置2に収集される。これらの情報は、ツールバー装置7でブラウザから取得、又は、ツールバー装置7で取得した情報を基に検索装置2で演算を実施することにより入手する。
なお、ここで言う演算とは、閲覧を終了した時刻から閲覧を開始した時刻を引くことで閲覧時間(リソースを閲覧していた時間)を算出したり、後述する方法でユーザランク値を算出するなど、直接取得した情報を基に必要な情報を作成することである。
【0029】
また、ユーザランク値の決定方法は、例えば、システムのインストール時等に、ユーザの職業や趣味等の個人情報を取得し、職業や趣味等が関連する項目のユーザランク値を上げるという方法が考えられる。
またさらに、ユーザが、BBS等で特定の項目と関連する質問に対して回答を行った際に、該BBS(特定のWebページ)からデータを取得し、他ユーザから高い評価をされたユーザは、その項目のユーザランク値を上げ、他ユーザから低い評価をされたユーザはその項目のユーザランク値を下げるという方法が考えられる。
加えて、検索キーワード、検索後に閲覧したWebページ、及び検索後にWebページを閲覧した時間、検索後のWebページからリンクしたページ等を解析することにより、ユーザの検索スキル判定し、それを基にユーザランク値を付与するという方法が考えられる。
このような、検索内容に対する知識の深さや、検索スキル等を基にユーザを評価する方法から、適宜なものを少なくとも一つ選択し、検索装置2において解析処理を実行することで、ユーザランク値を決定する。
【0030】
情報検索システム1は、いずれかのクライアント端末4で検索が実行されると、入力された検索キーワードより、検索クエリを作成し検索サーバ2に送信する。
検索装置2は、まず、従来の検索システムと同様に検索クエリを含むリソースを、インデックスファイルデータベースに格納された、検索用のインデックスファイルの中から抽出する。そして、抽出されたリソースをリスト化し、検索結果を生成する。ここで、リスト化にあたって、Webページ内のキーワードに関連する記載や、Webページのリンク構造を基に作成した、ランク値に基づいてリソースの並び替えを実行する。なお、該ランク値はHITSアルゴリズムやPageRank等の従来周知のWebページのランキング方法(Webページの重要度の決定方法)によって作成される。
【0031】
続いて、検索装置2は、検索結果の各リソースを閲覧しているユーザの数及び、ユーザの検索キーワードに関連する項目のユーザランク値に基づいて、更なる並び替えを実行する。即ち、前記リスト化された各リソースの並び替え実行時において、各リソースを閲覧している情報検索システム1のユーザ(リソースを表示している各クライアント端末4)を特定する。
そして、ユーザID等を利用して、各リソースを閲覧しているそれぞれのユーザに対してユーザランク値(重要度の値)を照合する。
リソースを閲覧している全ユーザのユーザランク値の合計値が、そのリソースの持つ新たなランク値となり、新たなランク値に基づいて検索結果のリソースを並べ替える。
【0032】
そして、上記したように検索結果のリソースをユーザランク値(数値化した検索項目に対するユーザの重要度)で、再び並び替えることにより、検索実行時に人気の高いWebページ、また、知識の深いユーザが多く閲覧するWebページ、検索スキルの高いユーザ多く閲覧するWebページ等を検索結果の上位に表示させることができる。
したがって、ユーザはそれらを参照することにより、より質の高い情報、即ち、精度が高かったり、検索時において話題性を持つ情報に到達し易くなる。
【0033】
次に、第1の実施形態の機能的構成について説明する。
なお、以下に記載する第1の実施形態の各機能ブロックは、ハードウェア、ソフトウェア、又はハードウェア及びソフトウェアの両方として実現され得る。具体的には、コンピュータを利用するものであれば、CPUや主メモリ、バス、あるいは不揮発性メモリや、所謂外部記憶装置(ハードディスクやフロッピーディスク(登録商標)、MO、CD、DVD,磁気テープ等々の記憶装置、及びそれらメディアの読み取り装置)、印刷機器、表示装置、その他外部周辺装置等のハードウェア構成部、またその外部周辺装置用のI/Oポート、それらハードウェアを制御するためのドライバプログラムやその他アプリケーションプログラム、情報入力に利用されるユーザーインターフェース等が挙げられる。
【0034】
そして主メモリ上に展開したプログラムに従ったCPUの演算処理によって、インターフェースを介して入力され、各種メモリやハードディスク上に保持されているデータなどが加工、蓄積されたり、上記各ハードウェアやソフトウェアを制御するための命令が生成されたりする。また、本発明はシステムとして実現できるのみでなく、方法としても実現可能である。また、本発明の一部をソフトウェアとして構成することができる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品、及び同製品を記録媒体に固定した記録媒体も、当然に本発明の技術的な範囲に含まれる(本明細書の全体を通じて同様である)。
【0035】
図4は、本実施形態の情報検索システム1における機能ブロックの一例を示す図である。この図にあるように、本実施形態の検索システム1は、ツールバー装置7と検索装置2からなる。
【0036】
まず、ツールバー装置7の機能的構成について以下に説明する。
【0037】
ツールバー装置7は、ブラウザの機能を補助、拡張、代替などを行うため、ブラウザとともに動作するよう構成されたアプリケーションが組み込まれた装置(プログラム)である。
ツールバー装置7は、検索窓に入力されたキーワードによるWeb上のリソースの検索機能、RSS文書データの収集や表示機能、ショートカットアイコンによるランチャ機能等の、所謂一般的なツールバー装置の機能を有している。また、それに加えて、後述する端末情報取得部10や端末情報送信部11等の本発明を実施するための機能を有している。これらの構成により、ブラウザで閲覧されたWebページのURLや、閲覧開始時刻等を含む端末情報を取得、送信することができる。
なお、上記したRSSとは「Rdf Site Summary」や「Rich Site Summary」、及び「Really Simple Syndication」等であり、一般的に、Webサイトの見出しや要約などのメタデータを構造化して記述するXMLベースのフォーマットである。
【0038】
端末情報取得部10は、クライアント端末4のブラウザから、少なくとも閲覧URLを含む、端末情報を取得する機能を有する。ここで閲覧URLとは、ブラウザを介して表示された(クライアント端末4でユーザが閲覧していた)リソースのWeb上での所在を示す情報であり、例えば、「http://・・・/ABC.jpg」のように記述される情報である。
ここで、ブラウザから端末情報を取得する手段は、特に限定されるものでなく、適宜の方法を用いてよい。これらの方法は、例えば、API(Application Program Interface)やDDE(Dynamic Data Exchange)、OLE(Object Linking and Embedding)やファイルシステム等が挙げられる。
【0039】
ここで、端末情報には、閲覧URL以外にもブラウザでのリソースの閲覧に関する各種情報が含まれてよい。これらの情報には、例えば、システム利用者のユーザID、ブラウザID、ツールバーID、リソースの閲覧開始時刻、リソースの閲覧終了時刻、あるいはWeb上の2以上のリソースを連続して閲覧した際の「移動元リソース」や「移動先リソース」などの遷移情報などが挙げられる。
さらに、端末情報には、特定のWebページにおいて、ユーザが入力した検索キーワードやアンケート等の入力情報や、他のユーザが行ったユーザの評価等の他人の入力から取得できる情報が含まれてよい。
【0040】
ユーザIDとはユーザを識別するための情報を示し、例えば、クライアント端末4へのログイン時のIDや、サービス単位又はソフトウェア単位で割り当てられるIDなどが挙げられる。ブラウザIDやツールバーIDも同様に、当該ブラウザやツールバーを識別するための情報であり、例えば、これらの情報は予めブラウザプログラムやツールバープログラムに記録されている製品IDなどを利用することで取得することができる。
そして、これら識別情報を利用することでクライアント端末4を識別することができるので、クライアント端末4(ユーザ)単位での閲覧情報の管理、分析を行うことができる。なお、これらID情報の保持は、例えば、ツールバー装置7自身が保持する方法や、ブラウザが有するcookie機能を利用する方法等、適宜な方法で行われる。
【0041】
閲覧開始時刻とは、ブラウザにてWeb上のリソースにアクセスした時刻、あるいはそのアクセスによってブラウザにリソースが取得された時刻や、表示された時刻などをいう。具体的に説明すると、当該時間は、例えば、ブラウザにてリクエストを行ったリソースのロード完了を検出した時刻や、WebサーバがHTTPステータスコードの「200:OK」等の信号を応答した時刻等が挙げられる。
【0042】
閲覧終了時刻とは、ブラウザにてWeb上のリソースの表示を終了した時刻をいい、例えば、ブラウザのUIウィンドウがクローズした時刻や、当該ウィンドウがアクティブでなくなった時刻、ウィンドウ領域内からマウスポインタが検出されなくなった時刻(マウスポインタがウィンドウ領域外へ移動した時刻)等が挙げられる。また、一定時間の操作がないためクライアント端末4のOSが自動的にログオフ処理を行ったり、スクリーンセーバ等が起動したりした場合には、閲覧終了時刻としてもよいし、閲覧を継続しているものとして判断してもよい。
【0043】
遷移情報とは、Web上の2以上のリソースを連続で閲覧した際の「移動元リソース」と「移動先リソース」を示す情報のことであり、例えば、ハイパーリンクのクリックによる遷移の他、ブラウザやツールバーのURL入力欄に連続で入力された2以上のURLを「移動先」、「移動元」とする遷移情報などが挙げられる。
【0044】
端末情報送信部11は、取得した端末情報を所定の検索装置2に送信する機能を有する。具体的には、上記した端末情報を、クライアント端末の通信I/Fを使用し通信回線等を介して、所定の検索装置2(サーバ装置)に自動送信する機能を有する。
なお、端末情報の送信先となる所定の検索装置2の送信先アドレスは、例えばツールバー装置7のプログラム内に予め記述されることで特定する方法などが挙げられる。
また、この端末情報送信部11から端末情報が送信されるタイミングは、適宜のタイミングに設定可能である。例えば、ブラウザにて表示されているリソースが切換わるごとに送信するといったタイミングや、一定の時間、又は時刻が到来した際にバッチ処理で送信するタイミング、あるいはツールバー起動時または終了時に送信するタイミングなどが挙げられる。
【0045】
そして、このように各クライアント端末4上のブラウザ5でのリソースの閲覧に応じて、ツールバー装置7にて取得された端末情報が検索装置2に送信される。そして後述するように、検索装置2にて当該端末情報が収集されることで、検索装置2ではクライアント端末4の閲覧リソースの特定などブラウジング(閲覧)履歴を容易に把握することができる、また、特定項目に対する各ユーザの検索スキルや知識の深さを把握できるという具合である。
【0046】
次に検索装置2の機能的構成を説明する。
【0047】
検索装置2は、サーバ装置であって、プログラムによって収集されたWeb上のリソースの情報を利用して、所定の検索エンジンの処理によってインデックス情報を生成、蓄積することができる(インデックスファイルデータベース12及び、第1次検索実行部13によって実現できる)。さらに、第2次検索実行部,検索用データベース3,検索結果表示部15等の本発明を実施するための機能を有している。
【0048】
インデックスファイルデータベース12及び、第1次検索実行部13は、従来周知の検索エンジンが有する機能と同様である。詳細には、WWW上を巡回し、リソースに関する情報を取得し、まとめて、インデックファイルを生成、保持する。そして、検索の際に、保持しているインデックスファイルから、ユーザからの検索キーワード等に応じて、インデックスファイルを参照して検索を実行する。
【0049】
検索用データベース3は、クライアント端末4から送信される端末情報を受信、管理、蓄積する機能を有するデータベースである。
【0050】
第2次検索実行部14は、検索用データベース3(または、ツールバー装置7)から取得した情報により、いずれかのクライアント端末4で検索が実行された時に、検索対象となるリソースを同時に閲覧している、全てのクライアント端末4を、洩れなく検出することができる機能を有する。加えて、検索用データベース3等の各ユーザから取得した端末情報と検出したユーザを照合して、同じリソースを閲覧しているクライアント端末の総数、及び各クライアントの情報を用いて検索結果となるリソースの並び替えを実行することができる。
具体的には、前述の方法で算出したユーザランク値を、各リソースを閲覧しているユーザに照合し、それぞれのリソース毎に、同時に閲覧しているユーザのユーザランク値の総和を算出する、そして、リソースをユーザランク値の総和の大きい順に並び替える。
【0051】
検索結果表示部15は、データベースから抽出し並び替えを実行した検索結果をクライアント端末4のブラウザ5に表示する機能を有する。具体的には、クライアント端末の送信先アドレスを、検索クエリと同時に受信したり、ユーザIDとあらかじめ登録しておいたIPアドレスを照合するなど適宜の方法で取得する。そして、ツールバー装置7を介して、特定したクライアント端末4のブラウザ5上で検索結果画面を表示する。
【0052】
さらに、この検索装置2では端末情報を利用して、例えばユーザのWebブラウジング行動を解析したり、その解析結果から、特定の分野におけるユーザの検索スキルや、知識の深さを判定する(数値化する)ことができる。さらに、特定のWebページにアクセスしているユーザを集計することで、人気の高いサイトなどを迅速に把握することができる。
【0053】
次に、本実施形態における、情報検索システム1のハードウェア的構成について説明する。
図5は上記した機能的な各構成要件を、ハードウェアとして実現した際の、情報検索システム1における構成の一例を表わす概略図である。この図を利用して、本実施形態の検索システム1におけるそれぞれのハードウェア構成の働きについて説明する。この図5にあるように、本実施形態の情報検索システム1のハードウェア構成は、クライアント端末4に組み込まれたツールバー装置7と、サーバ装置としてネットワーク上に配置されている検索装置2により構成される。
【0054】
ツールバー装置7と検索装置2は電気通信回線を介して相互に接続され、情報の送受信を行う。なお、電気通信回線はインターネットを含む。
【0055】
またツールバー装置7においては、端末情報取得部10を実現し、またその他各種演算処理を行うCPU(中央演算装置)とRAMや、端末情報送信部11である通信I/Fを備える。またキーボード、マウス等の入力装置であるUI(User Interface)や、ブラウザプログラムにて処理されたリソースを表示するためのVRAMや、ディスプレイなどの表示装置も備える。そしてそれらがシステムバスなどのデータ通信経路によって相互に接続され、情報の送受信や処理を行う。
【0056】
ツールバー装置7のRAM上には、ブラウザプログラムと、ツールバープログラムとが格納されており、これらプログラムに従い端末情報の取得や送信処理やその他処理に係るCPUの各種演算処理が実行される。また上記ツールバープログラムによって、RAM上の所定のアドレスには閲覧URLやユーザID等の端末情報を格納する領域が確保されている。
【0057】
一方、検索装置2においては、各種演算処理を行うCPUと、RAMと、通信I/Fと、大量の閲覧情報などを蓄積するためのハードディスクなどの外部記憶装置とを有している。そしてそれらがシステムバスなどのデータ通信経路によって相互に接続され、情報の送受信や処理を行う。
【0058】
また検索装置2のRAM上には、第1検索実行部や第2次検索実行部、検索結果出力部の各機能を実現するプログラムやデータベース管理プログラム(図示せず)の等の情報検索システム1の機能を実現する各プログラムが格納されており、当該プログラムに従い端末情報の管理処理やその他処理に係るCPUの各種演算処理が実行される。
【0059】
ここで、ツールバー装置7においてユーザのUIを介した操作入力を受け付け、RAM上のブラウザプログラムおよびツールバープログラムに従い以下のような処理が実行される。
【0060】
例えば、UIを介したブラウザ操作によってWeb上のリソースへのアクセス指示が入力されると、そのアクセス指示で指定されたリソースのURLがRAMの所定アドレスに格納される。するとブラウザプログラムに従い指定されたURLに対してHTTPリクエストがクライアント端末4から検索装置2へ送信される。そしてそのHTTPリクエストに対するレスポンスをアクセスリソースのコンテンツとして通信I/Fにて該クライアント端末4が受信する。つづいてクライアント端末4が受信したコンテンツに含まれるHTMLファイル、イメージファイルなどを、ブラウザ5が有するHTMLレンダリングエンジンなどに従ったCPUの演算処理よってレンダリング処理する。そしてその処理結果がVRAMに転送され表示装置上にWebコンテンツが表示される。そしてユーザは表示された当該WWW上のWebページなどのリソースを閲覧する。
【0061】
また、それとともに前記ブラウザでのアクセス指示入力に応じてツールバープログラムは次の処理を実行する。即ち、RAMの所定アドレスに格納されたURLを端末情報として、前述のような所定の各タイミングで通信I/Fから検索装置2に自動送信する、という具合である。
【0062】
そして、検索装置2では、通信I/Fにて各クライアント端末4のツールバー装置7から送信されてきた端末情報を受信し、RAMの所定アドレス等に格納する。そして、検索装置2のプログラムにしたがって、例えば、端末情報に含まれるURLやユーザIDなどをパラメータとして、CPUの演算処理によって検索用データベース3を生成又は、作成されている検索用データベース3に追記し、HDD等の外部記憶装置に格納する、という具合である。
【0063】
また、UIを介したブラウザ操作によって、検索用Webページにアクセスし、検索クエリの入力、送信を行なった場合や、ツールバーに検索クエリの入力、送信を行った場合のように、クライアント端末4にて検索が実行された場合について説明する。その際、検索装置2は通信I/Fにて該検索クエリを含むHTTPリクエストを受信し、RAMの所定アドレスに格納する。すると、検索装置2では検索サーバプログラムに従い以下の処理を実行する。即ち、RAMに格納されている検索クエリをキーとして、外部記憶装置に保持されている、インデックスファイルデータベースの中から、検索クエリを含むリソースを抽出する。その際、予めリソースの内容及びリンク構造から算出しておいた、リソースの重要度を示す値も取得し、CPUの比較演算処理によって、リソースを重要度の高い順に並び替える。
【0064】
続いて、検索時に抽出した各リソースを閲覧している、クライアント端末4のユーザID等を、検索装置2が検出する。そして、外部記憶装置によって保持されている検索用データベース3のデータの中から、ユーザランク値(重要度の値)を取得する。そして、CPUの演算処理によって、検索結果の各リソースにアクセスしている、それぞれのクライアント端末のユーザランク値の合計を算出し、CPUの比較演算処理によって、リソースをランク値の高い順に並び替える。そして、検索装置2は、リソースを並べて箇条形式とした検索結果をCPUの演算処理によって生成し、通信I/Fにより検索クエリの送信元のクライアント端末4のツールバー装置7に対して送信する、と言う具合である。
【0065】
次に、第1の実施形態の情報検索システム1の処理の流れについて説明する。
図6,7は、それぞれ本実施形態のツールバー装置7、検索装置2の処理の流れの一例を表すフローチャートである。なお、以下に示すステップは、媒体に記録され計算機を制御するためのプログラムを構成する処理ステップであっても構わない。
【0066】
ここで、ツールバー装置7にて、本実施形態の情報検索システム1の使用が開始されると、まず、URLを含む自己の端末情報を取得し(ステップ201)、検索装置2に送信する(ステップ202)。これらの端末情報を取得及び送信は、ユーザがWebページ等のリソースの閲覧時において、検索を実行したり、別のリソースへリンクしたりすること等により、閲覧しているリソースを変更した場合(表示しているWebページのURLが変更された場合)にも実行される。
【0067】
また、ツールバー装置7では、端末情報の送信後、閲覧の終了前か否かの判断がなされる(ステップ203)。もし、システムの終了ボタンがクリックされたり、ブラウザが終了される等して、閲覧の終了の直前であると判断されると、そのまま処理は終了する。
【0068】
一方、検索装置2では、ツールバー装置7から送信された端末情報を受信(ステップ301)すると、RAMの所定アドレスに格納する。そして、必要に応じて端末情報の形式を変更し、検索用データベース3に蓄積する(ステップ302)。
【0069】
また、検索装置2では、クライアント端末4から検索クエリを受信する(ステップ303)と、検索用データベース3から、検索クエリをキーワードにして該当するインデックスファイル(ステップ304)を検索する。そして、検索クエリを含むリソースを抽出し、検索結果として取得する(ステップ305)。
続いて、検索装置2は検索結果の各リソースを閲覧しているユーザの数を検出し(ステップ306)、検出したユーザに対して、ユーザランク値(検索キーワードが属する分野におけるユーザランク値)を照合し、集計する(ステップ307)。そして、各リソースを、そのリソースを閲覧しているユーザ数及び、該ユーザのユーザランク値で検索結果を並び替える(ステップ308)。
そして、並び替えた検索結果を、検索クエリの送信元のクライアント端末へ返信する(ステップ309)。検索装置2はこれらの処理をシステム終了時まで繰り返す。
【0070】
ここで、第1の実施形態では、図4に示すように、検索用データベース3及び端末情報を受信、管理する機能が検索装置2に含まれる構成を例に挙げているが、本発明の検索システム1はこれに限定されるものではない。例えば、検索用データベース3をネットワーク上の別途のサーバ装置に設けておき、検索装置2が検索を実行する際に、該サーバの検索用データベース3から端末情報を取得するという構成でもよい。同様にインデックスファイルデータベース12及び第1検索実行部13等も別サーバに設けてよい。即ち、システム全体で機能を実現できればよく、設置するサーバの数及び各機能(プログラム)、データベースの配置は、サーバの能力等により適宜変更可能である。
【0071】
なお、第1の実施形態において、算出したユーザランク値を端末情報と共に検索用データベース3に蓄積する構成としたが、本発明の情報検索システムでは、ユーザランク値のデータの管理方法は任意である。例えば、検索用データベースでない、別のデータベースで管理してもよい。また、検索の実行毎にランク値を算出してもよい。つまり、検索キーワードが該当する分類のユーザランク値が、検索実行時に取得できればよい。
ここで、分類の範囲の設定方法は任意であり、例えば、「スポーツ、経済、・・・」の様な分類でもよいし、「野球、サッカー、・・・企業、株、為替・・・」のように細分化してもよい。つまり、分類した項目ごとに、ユーザにユーザランク値を付与することにより、検索結果のリソースにアクセスしているユーザが、その分野の造詣が深いか否かを把握可能であればよい。
【0072】
第1の実施形態において、検索実行時に検索結果の各リソースを閲覧しているユーザの数、及び該ユーザのユーザランク値を検出しているが、本発明の情報検索システムでは、検出するユーザの条件はこれに限るものではない。例えば、規定時間(5分前や10分前等)から検索実行時までの間に閲覧を行ったユーザを検出してもよいし、規定時間内(検索実行時の15分前から5分前まで等)に閲覧を行ったユーザを検出してもよい。またさらに、検索結果を出力した後に、各リソースに閲覧しているユーザが変化した場合、検索結果を変更して表示してよい。
つまり、リソースを閲覧しているユーザを検出することによって、検索実行時に人気の高いリソースをより正確に把握できればよい。
【0073】
さらに、第1の実施形態において、検索実行時に検出する「検索結果のリソースを閲覧しているユーザ」には、検索を行った自分自身を含めていないが、本発明の情報検索システムでは、検出するユーザはこれに限るものではない。即ち、自分自身を「検索結果のリソースを閲覧しているユーザ」に含めてもよいし、含めなくてもよい。また、1つのクライアント端末4でブラウザを複数起動した場合において、検出時にアクティブなブラウザのみを「検索結果のリソースを閲覧しているユーザ」として検出してもよいし、起動したブラウザ全てを「検索結果のリソースを閲覧しているユーザ」として検出してもよい。これらはシステムの運用上適宜変更してよい。
【0074】
加えて、本発明の情報検索システムでは、システムを使用するユーザ、即ち、検索を実行したユーザ又は、その他のユーザはそれぞれ、検索結果に自分の端末情報を反映させるか否かを選択可能にしてもよい。また、端末情報をサーバに送信するか否かを選択可能にしてもよい。このように、クライアント端末4で、検索装置2(サーバ)に送信する情報に制限をかけることを可能にすることで、ユーザのインターネット使用上の秘匿性を担保することができる。
【0075】
以下では第2の実施形態から第4の実施形態を説明するが、特に説明がない限り、第1の実施形態における情報検索システム1と同様の部分については、同様の符号を付して重複する説明を省略する。
【0076】
第2の実施形態では、検索結果の各リソースを、そのリンク構成及び内容で並び替えた後に、各リソースにアクセスしているユーザの数を基準に再度並び替えを実行することを特徴とする。
即ち、本発明の情報検索システムでは、第1の実施形態のようにユーザランク値を検索結果の並び替えに用いることが望ましいが、必ずしもユーザランク値を検索結果の並び替えに用いることは必須ではない。本実施形態の様に、各リソースを同時に閲覧しているクライアント端末4の総数で検索結果の並び替えを行ってもよい。
【0077】
第2の実施形態の情報検索システム20は、第1の実施形態と同様に、検索装置2、各クライアント端末4、そして、各クライアント端末4で動作するブラウザ5及びツールバー装置7によって構成されている(図1)。
【0078】
情報検索システム20は、いずれかのクライアント端末4で検索が実行されると、第1の実施形態と同様に、入力された検索キーワードより、検索クエリを作成し検索サーバ2に送信する。そして、検索装置2は、検索クエリを含むリソースを、インデックスファイルの中から抽出する。そして、抽出されたリソースをリスト化し、並び替えを行って検索結果を生成する。
【0079】
続いて、検索装置2は、検索結果の各リソースを閲覧しているユーザの数を検出し、リソース毎に集計する。さらに、検索装置2は、検索結果のリソースを閲覧しているユーザの多い順に並び替え、検索結果をクライアント端末4に送信を行う。そして、クライアント端末4にて検索結果が表示される。
【0080】
次に第2の実施形態の機能的構成を説明する。
第2次検索実行部14は、検索用データベース3(または、ツールバー装置7)から取得した情報により、検索実行時に検索対象となるリソースを閲覧しているクライアント端末4を、検出することができる機能を有する。加えて、リソースを閲覧しているクライアント端末の数によって検索結果となるリソースの並び替えを実行することができる。
【0081】
また、第2の実施形態におけるハードウェア構成は、第1の実施形態と同様であるため、説明を省略する。
【0082】
次に、第2の実施形態の情報検索システム20の処理の流れについて説明する。
図8は、本実施形態の検索装置2の処理の流れの一例を示すフローチャートである。なお、以下に示すステップは、媒体に記録され計算機を制御するためのプログラムを構成する処理ステップであっても構わない。
【0083】
検索装置2がクライアント端末4からの検索クエリを受信する(ステップ401)と、検索用データベース3(又は、各クライアント端末4のツールバー装置7)から、検索クエリをキーワードにして該当するインデックスファイル(ステップ40)を検索する。そして、検索クエリを含むリソースを抽出し、検索結果として取得する(ステップ403)。続いて、検索装置2は検索結果の各リソースにアクセスしているユーザの数を検出し(ステップ404)、閲覧しているユーザが多い順にリソースを並べ替える(ステップ405)。
そして、並び替えた検索結果を、検索クエリの送信元のクライアント端末へ返信する(ステップ407)。検索装置2はこれらの処理をシステム終了時まで繰り返す。
【0084】
第3の実施形態では、検索結果から閲覧するリソースを選択して、リンクを実行し、閲覧するリソースを表示させた際、同時に該リソースを閲覧しているユーザとコミュニケーションを取ることを可能としたことを特徴とする。
【0085】
具体的には、検索結果表示画面からリソースを選択して、ブラウザ5に選択したリソースを表示させた際に、ツールバー装置7に現在同じリソースを閲覧している他のユーザの数を表示させる。
そして、他のユーザが一人以上検出された場合、ツールバー装置7のボタンをクリックすることで、ブラウザの別ウィンドウやシステムによるウィンドウ画面が起動して従来周知のチャットを行うこと等の方法が考えられる。
【0086】
本発明の情報検索システムでは、上記した様に、知識の深いユーザや検索スキルの高いユーザ多く集まるリソースを検索結果の上位に表示させることができるので、そのようなユーザとコミュニケーションを可能にすることにより、必要な情報の取得が容易になる。つまり、閲覧しているWebページが難解である場合や、検索キーワードの選択ミス等の理由により、必要な情報に到達できなかった場合において、他のユーザから検索内容や検索方法について教えてもらうことができる。そのことで、ユーザは、検索内容についての深い理解が得られたり、必要な情報へたどり着くための方法が即座に解ったりすることができる。
【0087】
本実施形態において、コミュニケーション手段はチャットとしたが、WEBカメラを用いたビデオチャットの様に、音声や動画を伴うコミュニケーション手段を用いてよい。また、音声ファイルや画像ファイル、動画ファイル等の情報をやり取りする手段を設けてもよい。そのような手段を設けることにより、ユーザ間のコミュニケーションによる意志の疎通が容易になるという効果がある。
【0088】
第4の実施形態では、ユーザが検索結果から閲覧するリソースを選択して、リンクを実行し、閲覧するリソースを表示させた後で、選択されたリソース及びそのリソースに関連付けられたリソースを閲覧している時に、同時に同じリソースを閲覧している他ユーザに係る情報を表示することを特徴とする。
【0089】
具体的には、ユーザが検索結果表示画面からリソースを選択して、リンクを実行し、ブラウザでリソースを表示した際に、ユーザが表示しているリソースを同時に閲覧している他ユーザの数や職業、趣味等の、該リソースの他の閲覧者に係る情報を表示する。
そのことにより、ユーザは、閲覧しているリソースについて、どのような人が見ているのか、どれくらいの人数がみているのか等のリソースのリンク構造や記述内容から推測できないリソースの信頼性に係る情報を得ることができる。
さらに、前述したコミュニケーション手段により、他ユーザとコミュニケーションを取る場合において、興味が似ている、或いは閲覧しているリソースの内容に精通しているユーザを発見できるという利点がある。
【0090】
さらに、ブラウザ上で表示したリソースに埋め込まれたハイパーリンク(クリックすると他のリソースの表示を実行する部分)にマウスカーソル移動された際、表示する予定のリソースを、その時閲覧している他ユーザに係る情報を表示する。そのことにより、ユーザは、リンク先のリソースの、前記した信頼性に係る情報をリンク前に取得することができる。したがって、ユーザはリンク先の決定に該情報を判断の材料にできるので、優良なリソースを選択できる可能性が高くなる。
したがって、このような表示をリンクした先々のリソースにて実行することにより、ユーザはインターネット上のリソースの効率のよい巡回が可能になる。
【0091】
なお、上記した各実施形態のプログラム、及びシステムは、CD−ROM等の光学ディスク、磁気ディスク、半導体メモリなどの各種の記録媒体を通じて、又は電気通信網などを介してダウンロードすることにより、コンピュータにインストール又はロードすることができる。
【0092】
上記した各実施形態において、ツールバーのプログラムは閲覧した、又は閲覧中のWebページ(リソース)のWeb上での格納場所をURL形式で取得しているが、取得するリソースの格納場所の記述方法はこれに限るものではない。URLに限らずURI(Uniform Resource Identifier)でもよいし、他の記述方式でもよい。
【0093】
また、上記した各実施形態において、クライアント端末からサーバへ端末情報を送信するタイミングをシステム開始時、システム終了時、閲覧リソースのURL変更時としたが、本発明の情報検索システムが、サーバへ端末情報を送信するタイミングは、これに限るものではなく、必要に応じて適宜変更してよい。例えば、ブラウザ終了時にツールバーに記録しておいた端末情報を一括で送信したり、規定時間ごとに端末情報を送信してもよい。要は、サーバに端末情報が蓄積できればよい。
【符号の説明】
【0094】
1 情報検索システム
10 端末情報取得部(情報取得手段)
14 第2次検索実行部(情報序列化手段)

【特許請求の範囲】
【請求項1】
複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索システムであって、
検索実行時に、検索対象となるWebページを出力している端末に係る情報である端末情報を取得する情報取得手段を有しており、
前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化する情報序列化手段を有することを特徴する情報検索システム。
【請求項2】
複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索システムであって、
規定された時間内に検索対象となるWebページを出力した端末に係る情報である端末情報を取得する情報取得手段を有しており、
前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化する情報序列化手段を有することを特徴する情報検索システム。
【請求項3】
前記端末情報が、検索実行時において、検索対象のWebページを出力している端末の数に関する情報を含むことを特徴とする請求項1又は2に記載の情報検索システム。
【請求項4】
前記端末情報が、検索実行時において、検索対象のWebページを出力している端末の、システムの利用履歴に関する情報を含むことを特徴とする請求項1乃至3のいずれかに記載の情報検索システム。
【請求項5】
前記端末情報を取得している複数の端末間で情報を交換することができる情報交換手段を有することを特徴とする請求項1乃至4のいずれかに記載の情報検索システム。
【請求項6】
前記情報序列化手段によって、序列化されたWebページの少なくとも1つを、いずれかの端末において出力した後に、
該端末で出力されたWebページを同時に出力している端末及び/または、該端末で出力されたWebページに関連付けられたWebページを出力している端末に係る前記端末情報に基づく情報を、いずれかの端末にて出力可能な閲覧情報出力手段を有することを特徴とする請求項1乃至5のいずれかに記載の情報検索システム。
【請求項7】
複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索方法であって、
検索実行時に、検索対象となるWebページを出力している端末に係る情報である端末情報を取得し、
前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化することを特徴する情報検索方法。
【請求項8】
複数の端末で同時に使用可能であり、端末から入力されたキーワードに基づきデータベースの検索を行なうと共に、その検索結果を前記端末に出力して表示させるための情報検索方法であって、
規定された時間内に検索対象となるWebページを出力した端末に係る情報である端末情報を取得し、
前記情報取得手段が取得した端末情報に基づいて、検索対象となるWebページを序列化することを特徴する情報検索方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−39625(P2011−39625A)
【公開日】平成23年2月24日(2011.2.24)
【国際特許分類】
【出願番号】特願2009−184125(P2009−184125)
【出願日】平成21年8月7日(2009.8.7)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 社団法人電子情報通信学会発行「電子情報通信学会 第二種研究会資料〔Webインテリジェンスとインタラクション〕」(平成21年7月4日発行)
【出願人】(504322611)学校法人 京都産業大学 (27)
【Fターム(参考)】