インターネット検索エンジンにおける無効クリック検出方法および装置
本発明は、インターネット検索エンジンサーバに関するものであって、より詳細には、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置に関する。本発明は、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記生成されたウェブページに対応するページ識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含むインターネット検索エンジンにおける無効クリック検出方法を提供する。本発明によると、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置を提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネット検索エンジンサーバに関するものであって、より詳細には、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置に関する。また、本発明は、不当に検索結果に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置に関する。
【背景技術】
【0002】
インターネットが広く普及する中、インターネットを介してアクセスすることができるウェブページなどの情報源(information source)の数は、幾何級数的に増加している。また、このように無数の情報源の中から検索者が必要とする情報を探すため、検索者は、ネイバー、ヤフー(商標登録)、ライコスなどのインターネット検索エンジンサーバにアクセスして検索を要請(要求)する。インターネット検索サービス提供者は、検索者から入力された検索語と関連した情報を含んでいる検索項目を含んだ検索結果ウェブページを生成して提供者に提供する。例えば、検索者がネイバー検索エンジンサーバに接続して“Digital Camera”という検索語を入力した場合の検索結果ウェブページが図2に示されている。検索結果ウェブページに含まれた各項目は、URL(Uniform Resource Location)と関連する。
【0003】
しかし、1つの検索語と関連する検索項目は無数であるため、このように多くの検索項目をどのような順で検索結果ウェブページに表示するのかは、インターネット検索サービス提供者にとって非常に重要な問題である。インターネット検索サービス提供者は、様々な基準を組み合わせて検索項目の羅列順序を決定するが、この中で多く用いられる基準の1つは、使用者(利用者)の検索項目に対するクリック数である。例えば、検索項目に対する使用者のクリック数が多ければ、相対的に検索結果ウェブページの上位に表示される。インターネット検索サービス提供者が、複数のパラメータを組み合わせて検索項目の羅列順序を決定する場合にも、前記パラメータの中の1つが使用者のクリック数である場合には、クリック数が多い検索項目は相対的に検索結果ウェブページの上位に表示される。
【0004】
また、インターネット検索サーバによって生成される検索結果ウェブページの上位に表示される程、使用者がクリックして訪問する可能性が高くなるため、ウェブサーバネットワーク情報提供者は、自身と関連した検索項目が検索結果ウェブページで上位に表示されることを所望する。このようなネットワーク情報提供者の中には、自身のウェブページに対する検索項目が検索結果ウェブページで上位に表示されるようにするため、意図的にインターネット検索サーバにアクセスして自身のウェブページに対する検索項目を何度もクリックする場合がある。また、ある場合は、プログラムを作成して、自身のウェブページに対する検索項目が継続してクリックされるような効果を出すようにしたりもする。しかし、このような検索項目に対する不当なクリックは、使用者全体の自然な検索結果を反映するものではないため、インターネット検索サービス提供者は、このような無効クリック(invalid click)を検出する必要がある。
【0005】
従来技術の中には、検索結果ウェブページにおいて、ある検索項目がどれ程多くクリックされたかによって、前記検索項目と関連したネットワーク情報提供者に課金するサービスを提供する場合もある。米国のインターネット検索サービス提供者であるオーバーチュア社は、ネットワーク情報提供者からクリック当りいくら支払うという入力を受けた後、検索結果ウェブページで前記ネットワーク情報提供者と関連した検索項目がクリックされると、前記ネットワーク情報提供者にクリック当りの課金を遂行する。この場合、ある検索者が人為的に特定した検索項目に対して複数のクリックを行うと、前記ネットワーク情報提供者は、不当に多くの費用を支払うことになる。従って、この場合にも、実際に検索の意図を有しておらず、単にクリック数を増加させるという意図からなる無効クリックを検出する必要がある。
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は、前記のような従来技術を改善するために案出されたものであって、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置を提供することを目的とする。
【0007】
また 、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置を提供することを他の目的とする。
【0008】
また、無効クリックを検出するために提供される様々な識別子の偽造および変造がし難い無効クリック検出方法および装置を提供することを他の目的とする。
【課題を解決するための手段】
【0009】
前記の目的を解決し、従来技術の問題点を解決するために、本発明は、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記生成されたウェブページに対応するページ識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含むインターネット検索エンジンにおける無効クリック検出方法を提供する。
【0010】
また、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。
【0011】
また、検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記検索者の端末機に対応するクライアントIPアドレスを獲得するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。
【0012】
また、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記検索者の端末機に対応する端末機識別子を獲得するステップと、前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者の端末機に保存するようにするステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。
【0013】
また、検索者がインターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目をクリックした場合、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報を受信し、前記受信した情報に基づき、所定の基準に従って前記クリックの無効可否を判断することを特徴とする無効クリック検出装置が提供される。
【0014】
また、(1)インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対する検索者のクリックに応答し、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存するログ保存部と、(2)前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターンを保存する無効クリックパターン保存部と、(3)前記ログ保存部に保存された前記ログおよび前記無効クリックパターン保存部に保存された無効クリックパターンに基づき、前記検索者のクリックが無効クリックであるかを判断する無効クリック判断部とを含む無効クリック検出装置が提供される。
【0015】
また、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段とを含む無効クリック検出装置が提供される。
【0016】
また、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段を含む無効クリック検出装置が提供される。
【0017】
無効クリック(invalid click)は正確に定義するのが難しく、各実施例および応用例によって、その範囲が異なって定められなければならない。ただ、一般的に無効クリックとは、実際に検索の意図を有さず、単にクリック数を増加させる意図からなるクリックとして説明される。
【発明の効果】
【0018】
本発明によると、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置が提供される。
【0019】
また、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置が提供される。すなわち、新たなパターンの不当なクリック試図が発見された場合、前記パターンまたは規則を本発明による無効クリックパターン保存部に保存することによって、前記新たなパターンの不当なクリック試図に対して即時に対処することができる。
【0020】
また、無効クリックを検出するために提供される様々な識別子の偽造または変造がし難い無効クリック検出方法および装置を提供する。
【発明を実施するための最良の形態】
【0021】
以下、添付された図面を参照して、本発明の実施例を詳細に説明する。
【0022】
図1は、本発明による無効クリック検出装置を含んだインターネット検索サーバとクライアント端末機とのネットワーク接続を示した図である。
【0023】
検索者(searcher)または不当なクリックを試図する不当クリック試図者(cheater)は、インターネット103と接続されたクライアントクライアント端末機101を介してインターネット検索サーバ104に接続する。不当クリック試図者は、インターネット検索サーバ104によって提供された検索結果ウェブページの中で、クリック数を高めようとする検索項目を複数回クリックするなどの方法を用いて、クリック数を高めようと試図する。例えば、図2において、検索項目202がhttp://www.invalidclick.comと関連した検索項目であり、不当クリック試図者は、検索項目202が検索結果ウェブページで上位に表示されるようにするため、前記検索項目202を継続してクリックする場合を想定することができる。
【0024】
クッキーファイル(cookie file)102は、クライアント端末機101が検索エンジンサーバ104または他のウェブサイトに接続した場合、前記検索エンジンサーバ104または他のウェブサイトをクライアント端末機101のハードディスクに保存しておく特別なテキストファイルである。ウェブサイトの接続に用いられるHTTPプロトコルでウェブページに対するそれぞれの要求は、他の要求とはすべて独立(independent)している。従って、ウェブサーバは、クライアント端末機101に、以前にどのようなページを送ったか、または以前にどのような作業を共に遂行したかに関するいかなる情報をも有することができない。従って、このように独立的に処理されるそれぞれの要求との関連を結ぶためにクッキーファイルが提供され、このようなクッキーファイルは、ウェブサーバに使用者に関する情報を使用者のコンピュータに保存することができるようにする役割をする。本発明においても、無効クリックを検出するために様々なクッキーファイルを用いる。これに関しては、後で詳細に説明する。
【0025】
ログファイル(log file)105は、使用者のクリックに関連した様々なログ(log)を保存するファイルである。本発明においては、無効クリックを検出するために様々なパラメータを用い、各クリックと関連したパラメータをログファイルに保存した後、所定の規則およびパターンを用いて入力されたクリックが無効であるかを判断する。図5、図7および図10に、本発明の実施例によるログファイルの例が示されている。
【0026】
図3は、本発明の一実施例による無効クリック検出装置を示したブロック図である。
【0027】
本発明の一実施例による無効クリック検出装置301は、パラメータ入力部304、ログ保存部305、無効クリックパターン保存部306、無効クリック検証部307、無効クリック報告部308、無効クリック判断部309とを含む。
【0028】
インターネット検索エンジンによって提供された検索結果ウェブページの中に含まれた検索項目に対して検索者がクリックした場合、前記クリックと関連した様々なパラメータ302がパラメータ入力部304に入力される。前記パラメータは、無効クリックを判断するための基礎情報であって、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報などである。
【0029】
検索者がインターネット検索エンジンサーバ104に検索要請(要求)をする場合、検索要請パケットがクライアント端末機101からインターネット検索エンジンサーバ104に送信される。前記検索要請パケットは、HTTPプロトコルによるパケット構成をしており、またインターネットプロトコル(IP:Internet Protocol)パケットが含まれて構成される。しかし、前記インターネットプロトコルパケットの構成にはソースIPアドレス(Source IP address)フィールドが含まれているため、インターネット検索エンジンサーバ104は、クリックを要請した検索要請パケットからソースIPアドレスを抽出することによって、検索者の端末機のIPアドレスを抽出する。
【0030】
ソースIPアドレスの中で前の部分は、検索者の端末機が属するネットワークのアドレスである。IPアドレスは4バイトで構成され、この中で前部分は検索者の端末機が属するネットワークを識別するためのネットワークアドレスであり、残りの部分が前記ネットワーク内で検索者の端末機を識別するためのアドレスとなる。
【0031】
従って、前記ソースIPアドレスの中からネットワークアドレスを抽出する。本発明の一実施例によると、前の3バイトをネットワークアドレスと見なしてソースIPアドレスからネットワークアドレスを得る。例えば、ソースIPアドレスが123.45.67.89であれば、ネットワークアドレスとして123.45.67を抽出する。
【0032】
前記検索結果ウェブページと関連した検索語は、検索者がインターネット検索サーバ104に入力した値である。
【0033】
検索者のウェブブラウザに対する情報は、検索者のクライアント端末機101に設置され、検索者がインターネット検索サーバ104にアクセスするために用いられたウェブブラウザに関する情報である。前記ウェブブラウザに対する情報には、ウェブブラウザの種類、ウェブブラウザのバージョン(version)およびウェブブラウザの製品ID(Product ID)などが含まれる。特に、ウェブブラウザの製品IDは、複数の検索者が同一な種類および同一なバージョンのウェブブラウザを設置した場合でも互いに異なるため、検索者の端末機を識別することができる優れた情報となる。
【0034】
ウェブ接続に用いられるHTTPプロトコルによると、クライアントの環境変数の中の一部がHTTPパケットに含まれてウェブサーバに送信される。ウェブサーバのプログラム(検索エンジンプログラム)は、前記環境変数を受信し、これを無効クリック検出に用いることができる。
【0035】
このような環境変数としては、下記のような情報が含まれる。
REMOTE_HOST:接続した人のドメインネーム
REMOTE_ADDR:接続したクライアントホストのIPアドレス
REMOTE_USER:接続した人の名前(ユーザー認証が設定されたウェブサーバである場合に示される)
REMOTE_IDENT:接続した人のID(ユーザー認証が設定されたウェブサーバである場合に示される)
HTTP_USER_AGENT:接続した人が動作させているプログラムの登録情報、一般的にはブラウザの名前
HTTP_ACCEPT_LANGUAGE:接続した人が使用している言語
HTTP_REFERER:該当するCGIプログラムを呼び出した文章の名前
REQUEST_METHOD:サーバにデータを伝送する方法(GET、POST)
QUERY_STRING:GET方式でデータを伝送した場合、伝送されたデータが保存される変数
CONTENT_LENGTH:POST方式でデータを伝送した場合、伝送されたデータの全体長さ数(バイト数)
CONTENT_TYPE:POST方式でデータを伝送した場合、伝送されるMIME型
AUTH_TYPE:使用者の使用権限を確認するための変数
SERVER_NAME:現在サーバのドメインネーム
SERVER_SOFTWARE:現在サーバに設置されたウェブサーバプログラムの名前
SERVER_PROTOCOL:現在サーバが使用するウェブプロトコルの名前およびバージョン
SERVER_PORT:現在サーバが使用するポート番号(HTTPである場合、一般的に80)
PATH_INFO:呼び出されたCGIプログラムの現在経路の情報
PATH_TRANSLATED:ウェブサーバでウェブが必要な資源(リソース)の経路の情報
SCRIPT_NAME:現在呼び出されるCGIプログラムの名前
HTTP_ACCEPT:現在HTTPで受け取ることができる資源(リソース)の形態
【0036】
検索者のクリックと関連したクリック時間は、検索者からクリック入力を受信した時間を用いる。本発明のさらに他の実施例によると、前記検索者のクリック時間と関連した他の時間を用いることもできる。例えば、検索者がクライアントでクリックを実際に入力した時間を用いることもできる。
【0037】
検索者の端末機に保存されたクッキーファイル情報は、インターネット検索サーバ104がクライアント端末機101に保存されたクッキーファイル102にアクセスして得る。本発明において、クッキーファイル102は、様々な用途で使用されることができるが、これに関しては他の実施例を通して詳細に説明する。
【0038】
検索者がクリックした検索項目と関連したURL情報は、検索エンジンサーバ104と関連した検索データベース(図示省略)に保存されているため、前記検索データベースを参照することによって得ることができる。前記URL情報は、ウェブサーバのドメインネームであったり、またはドメインネーム、ディレクトリおよびファイル名を含んだ情報であったりする。例えば、“http://www.naver.com”と“http://www.naver.com/download”をドメインネームだけで見ると、すべてwww.naver.comと同一であるが、URL全体で見ると互いに異なる。本発明においては、説明の便宜のため、ドメインネームまでのURLを用いた実施例を説明するが、本発明は、ドメインネーム、ディレクトリおよびファイル名をすべて含み、ドメインネームが同じであってもディレクトリなどが異なれば互いに異なる検索項目と見なされる実施例の場合もすべて含まれる。また、本発明において、URL情報は、本記載に従い、前記実施例すべてを含むものと解釈されなければならない。
【0039】
また、前記で説明したパラメータ以外の無効クリックの検出に有用な他のパラメータも、本発明の技術的思想の範囲内で、無効クリックの検出のために用いることができる。
【0040】
前記のような多様なパラメータ302はパラメータ入力部304に入力され、前記パラメータは再びログ保存部305に保存される。本発明によるログ保存部に保存されたログ(log)の例が、図5、図7および図10に示されている。前記図では、それぞれの説明の便宜のため、一部のパラメータのみを含んだログが示されている。しかし、本発明のさらに他の実施例によると、前記パラメータ302の全部または一部を含んだログがログ保存部305に保存される。
【0041】
本発明の一実施例によると、ログ保存部305は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存する。本発明の好ましい実施例によると、ログ保存部305は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報に関するログを保存する。
【0042】
無効クリックパターン保存部306は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターン(pattern)または規則(rule)を保存する。例えば、“10分間のクリック入力中、検索者の端末機のIPアドレスおよび検索項目と関連したURL情報がすべて一致する場合”という規則またはパターンを保存する。このように無効クリックを判断するための規則などを保存する無効クリックパターン保存部306には、所定の規則によって定められた言語(language)を用いてファイルの形態で保存されたり、または前記のような規則またはパターンに該当する場合は無効クリックと判断するようにするプログラムの形態で保存されたりする。
【0043】
無効クリック判断部309は、ログ保存部305に保存されたログおよび無効クリックパターン保存部306に保存された無効クリックパターンに基づき、検索者のクリックが無効クリックであるかを判断する。
【0044】
無効クリック報告部308は、無効クリック判断部309によって無効と判断されたクリックの中で、所定の基準によるクリックをインターネット検索エンジンの管理者303に報告する。本発明の一実施例によると、無効クリック報告部308は、無効クリック判断部309によって無効と判断されたクリックのすべてをインターネット検索エンジンの管理者に報告する。この場合、前記所定の基準は、無効クリック報告部308が無効クリック判断部309によって無効と判断されたクリックすべてとなる。本発明のさらに他の実施例によると、無効クリックパターン保存部306に保存された規則またはパターンはそれぞれ、前記規則またはパターンに該当する場合は管理者303に報告するべきかに関するフィールドを含んで保存される。この場合には、管理者303に報告すべき規則に該当した場合、無効クリック報告部308が管理者303に報告する。
【0045】
無効クリック検証部307は、無効クリック判断部309によって無効クリックとして検出されたクリックを管理者303の入力によって有効クリックに変更する。無効クリック検証部307によって、間違って無効クリックと判断されたクリックを有効クリックに変更することができるため、無効クリックの判断がより正確になる。
【0046】
図4は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0047】
ステップ401で、インターネット検索サーバ104は、検索者から検索要請を受信する。検索者がインターネット検索サーバ104に接続して検索語を入力すると、前記検索語が検索要請パケットとしてインターネット検索サーバ104に送信される。
【0048】
ステップ402で、インターネット検索サーバ104は、前記検索要請に応答して検索結果ウェブページを生成する。例えば、図2に示されたように、検索者の検索語入力に対して複数の検索項目を含んだ検索結果ウェブページを前記検索者に提供する。
【0049】
ステップ403で、前記生成された検索結果ウェブページに対応するページ識別子を獲得する。ページ識別子(Page Identifier)は、検索結果ウェブページが生成されるたびに生成され、前記検索結果ウェブページを識別する識別子である。従って、同一な検索者がインターネット検索サーバ104の検索ウィンドウで同一な検索語を反復して入力することで検索を要請する場合には、その都度新たなページ識別子が割り当てられる。同様に、検索者が検索結果ウェブページを表示しているウェブブラウザで“更新(reload)”項目をクリックすると、クライアント端末機101からインターネット検索サーバ104に検索要請パケットが送信されるため、インターネット検索サーバ104は検索結果ウェブページに対する新たなページ識別子を割り当てる。一見、同一に見える検索結果ウェブページに対して互いに異なるページ識別子が割り当てられるものと思われるが、クライアント端末機101から新たな検索要請を受信する場合、その時に新たに検索結果ウェブページを生成するため、以前の検索結果ウェブページとは異なる検索結果ウェブページが提供される。
【0050】
ステップ404で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。クリックを受信した場合、前記検索項目に対するハイパーリンクが先ず前記インターネット検索サーバ104にアクセスするようにし、その後、インターネット検索サーバ104が必要な処理をした後、前記検索項目に対応するウェブサイトにクライアント端末機が接続することができるようにする。例えば、“http://www.invalidclick.com/”に対応する検索項目のハイパーリンクとして“http://www.naver.com/abc/*http://www.invalidclick.com/”が用意されており、前記検索項目をクリックした場合、“http://www.naver.com”という検索サーバに先ず接続され、前記検索サーバは前記ハイパーリンクの後にあるURLに従って、前記http://www.invalidclick.comにクライアント端末機が接続するようにする。
【0051】
ステップ405で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子(site identifier)を獲得する。サイト識別子は検索項目を識別する識別子であり、検索項目に対応するURL情報に基づいて生成される。本発明のさらに他の実施例によると、サイト識別子としては検索項目に対応するURL情報をそのまま使用する。前記サイト識別子を生成するための基礎情報として使用されるURL情報は、ウェブサーバのドメインネームであったり、またはドメインネーム、ディレクトリおよびファイル名を含む情報であったりする。例えば、“http://www.naver.com/download”と“http://www.naver.com”をドメインネームだけで見ると、両者ともwww.naver.comと同一であるが、URL全体で見ると互いに異なる。本発明においては、説明の便宜のため、ドメインネームまでのURLを用いた実施例を説明したが、本発明は、ドメインネーム、ディレクトリおよびファイル名をすべて含み、ドメインネームが同じであってもディレクトリなどが異なると、互いに異なる検索項目と見なされる実施例の場合もすべて含む。また、本発明において、サイト識別子は、本記載にに従い、前記実施例のすべてを含むものと解釈されなければならない。
【0052】
ステップ406で、無効クリック検出装置は、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断する。
【0053】
図5は、本発明の一実施例によるログファイルの一例を示した図である。図4の実施例を、図5を参照して説明する。
【0054】
本発明は、使用者から検索項目に対するクリックを入力されるたびごとに、ページ識別子509およびサイト識別子510をログファイル500に保存する。図面符号501乃至図面符号508は、それぞれのクリック入力に対して保存されたログである。
【0055】
不当クリック試図者は、インターネット検索サーバ104に接続して検索要請を行う。そうすると、インターネット検索サーバ104は、検索結果ウェブページを生成し、前記検索結果ウェブページに対応するページ識別子、“nCe249sisn0”を生成する。不当クリック試図者は、前記検索結果ウェブページに含まれた特定の検索項目を継続してクリックする。一度生成された検索結果ウェブページで特定の検索項目を継続してクリックしてもページ識別子は新たに生成されないため、ページ識別子は継続して同一な値を有するようになる。
【0056】
従って、所定時間入力されたクリックに対するログの中で、ページ識別子およびサイト識別子が一致するログ501、ログ502およびログ504は無効クリックと判断される。本発明の一実施例によると、前記一致するログの中で、1つは有効クリックと判断され、残りは無効クリックと判断される。
【0057】
不当クリック試図者は、自身のウェブブラウザで“更新”をクリックすることによって、検索結果ウェブページを更新する。この場合、ページ識別子も新たに割り当てられ、これに関するログがログ505である。その後、不当クリック試図者が再び同一な検索項目に対してクリックした場合がログ506である。
【0058】
従って、本実施例によると、不当クリック試図者が“更新”を行った後、同一の検索項目に対してクリックした場合(ログ506の場合)は無効クリックとして検出されない。このように“更新”を行った場合も、無効クリックとして検出することができる方法が、図6aおよび図6bを参照した以下の実施例において説明されている。
【0059】
図6aおよび図6bは、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0060】
ステップ601で、インターネット検索サーバ104は、検索者から検索要請を受信し、ステップ602で、インターネット検索サーバ104は、前記検索要請に応答して検索結果ウェブページを生成する。
【0061】
ステップ603で、無効クリック判断装置は、検索要請を行ったクライアント端末機101にセッションクッキーファイル(session cookie file)が保存されているかを判断する。ステップ603からステップ611までは、セッション識別子(session identifier)を得る過程を説明するためのものである。
【0062】
万一、クライアント端末機101にセッションクッキーファイルが保存されていなければ、ステップ604で、無効クリック判断装置は新たなセッション識別子(session identifier )を生成する。そして、ステップ605で、前記セッション識別子を含むセッションクッキーファイルをクライアント端末機101に保存する。前記セッションクッキーファイルにはセッション識別子の更新時間も保存されるが、ステップ609で、更新時間をセッションクッキーファイルに保存する。
【0063】
万一、ステップ603での判断の結果、クライアント端末機101にセッションクッキーファイルが保存されていれば、ステップ606で、前記セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内であるかを判断する。
【0064】
ステップ606での判断の結果、セッションクッキーファイルに保存されたセッション識別子の最終更新時間が所定時間以内であれば、ステップ607で、前記セッションクッキーファイルに含まれたセッション識別子を抽出する。
【0065】
ステップ606での判断の結果、セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内でなければ、ステップ608で、新たなセッション識別子を生成する。ステップ610で、セッションクッキーファイルに含まれたセッション識別子を前記新たに生成されたセッション識別子に更新する。ステップ611では、前記セッション識別子の更新時間を前記セッションクッキーファイルに保存する。
【0066】
ステップ612で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。
【0067】
ステップ613で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子(site identifier)を獲得する。
【0068】
ステップ614で、無効クリック検出装置は、前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致した場合、前記クリックを無効と判断する。
【0069】
図7は、本発明の一実施例によるログファイルの一例を示した図である。
【0070】
本実施例は、使用者から検索項目に対するクリックを入力されるたびごとに、クリック時間710、セッション識別子の更新時間711、セッション識別子712およびサイト識別子713をログファイル700に保存する。図面符号701乃至図面符号708は、それぞれのクリック入力に対して保存されたログである。
【0071】
不当クリック試図者はインターネット検索サーバ104に接続して検索要請を行い、インターネット検索サーバ104は検索結果ウェブページを生成する。インターネット検索サーバ104は、前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。
【0072】
インターネット検索サーバ104は、クライアント端末機101にセッションクッキーファイルが保存されているかを確認する。セッションクッキーファイルが保存されていなければ新たなセッション識別子を生成し、その更新時間および前記セッション識別子を含むセッションクッキーファイルをクライアント端末機101に保存する。本実施例では、セッション識別子“xigw9492”および更新時間“10:50:14”が記録されている。また、ログファイル700にクリック時間、更新時間、セッション識別子および検索項目に対応するサイト識別子をログ701で保存する。セッションクッキーファイルを初めに生成する場合は、クリック時にセッションクッキーファイルが生成され、またその時にセッション識別子が生成されるため、クリック時間およびセッション識別子の更新時間が同一である。
【0073】
不当クリック試図者は同一の検索結果ページで、同一の検索項目に対してクリックする。インターネット検索サーバ104は、クライアント端末機101にセッションクッキーファイルが保存されているかを確認する。前記で生成したセッションクッキーファイルがすでにクライアント端末機101に保存されているため、インターネット検索サーバ104は、クライアント端末機101に保存されたセッションクッキーファイルにアクセスする。前記セッションクッキーファイルには、セッション識別子および前記セッション識別子の最終更新時間が保存されている。本実施例では、セッション識別子“xigw9492”および更新時間“10:50:14”がセッションクッキーファイルに保存されている。
【0074】
インターネット検索サーバ104は、検索者からの検索項目に対するクリック時間が、前記セッション識別子と関連した最終更新時間から所定時間以内であるかを判断する。本実施例で、2度目クリックのクリック時間は“10:50:18”である。所定時間を5分とした場合、前記クリック時間“10:50:18”は、最終更新時間“10:50:14”から所定時間以内である。従って、この場合には、セッションクッキーファイルに保存されているセッション識別子を現在のセッション識別子として、セッションクッキーファイルのセッション識別子を更新しない。従って、この場合には、ログ702のように記録される。
【0075】
ログ702は、ログ701とセッション識別子およびサイト識別子が同一であるため、無効クリックと判断される。
【0076】
ログ704は、不当クリック試図者が“更新”要請を行った場合に関するものである。不当クリック試図者が“更新”要請を行った場合にも同様に、クライアント端末機101に保存されたセッションクッキーファイルを参照し、前記セッションクッキーファイルに保存された最終更新時間が一定時間内であるため、セッション識別子を更新しない。従って、ログ704のように記録され、ログ704はログ701と同一であるため無効クリックと判断される。すなわち、本実施例によると、不当クリック試図者が短時間内に“更新”を行った後、同一の検索項目をクリックした場合を検出することができる。
【0077】
ログ705は、ログ701、ログ702およびログ704とは異なる検索者から同一の検索項目に対するクリックを受信した場合に関するものである。この場合は、新たなセッション識別子が割り当てられるため、無効クリックと判断されない。
【0078】
ログ709は、ログ701と同一の検索者が相当に長い時間の後に同一の検索項目をクリックした場合に関するものである。この場合は、相当に長い時間の後にクリックを受信したものであるため、無効クリックと判断されない。
【0079】
本実施例によると、セッション識別子が生成された後、一定時間、同一の検索項目をクリックした場合は、無効クリックと判断される。
【0080】
これと類似して、本発明のさらに他の実施例によると、無効クリック判断の基準として、同一の検索項目に対する最終クリック時間から一定時間以内である場合を無効クリックと判断することができるが、これに関して簡単に説明する。
【0081】
検索者からクリックを受信した場合、前記端末機に前記セッションクッキーファイルが保存されているかを判断する。前記端末機に前記セッションクッキーファイルが保存されている場合、前記検索者からの前記検索項目に対するクリック時間が前記セッション識別子と関連した最終クリック時間から所定時間以内であるかを判断する。
【0082】
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得し、前記最終クリック時間を前記検索項目に対するクリック時間に更新する。
【0083】
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内でない場合、新たなセッション識別子を生成し、前記セッションクッキーファイルに含まれたセッション識別子を更新する。また、前記最終クリック時間を前記検索項目に対するクリック時間に更新する。
【0084】
例えば、図7において、同一のクライアント端末機から同一の検索項目に対して複数のクリックがある場合、最終クリックから5秒経過した場合は有効であると判断すると、ログ704と関連したクリックは、それ以前の最終クリック時間“10:50:18”よりも13秒後である“10:50:13”にクリックされたため有効と判断される。本発明の好ましい実施例によると、前記時間の基準は、無効クリックを検出する目的に従って決定される。
【0085】
図8は、本発明の一実施例によってセッション識別子を生成する方法の順序を示した流れ図である。
【0086】
セッション識別子は、他のセッション識別子と区別されるように単独的に割り当てられなければならず、同時に偽造または変造がし難いようにしなければならない。なぜなら、単に単独的に割り当てられる場合には、不当クリック試図者がセッション識別子を架空で生成してセッションクッキーに保存したり、またはプログラムを介して継続してセッション識別子を変更したりしながらクリックを行うプログラムを準備して、不当にクリック数を高めることができるためである。
【0087】
ソースデータ801は、セッション識別子805を生成するための基礎データであって、現在の時間情報、検索語、検索者のウェブブラウザの製品IDなど、様々である。また、無作為で選択された数字でもある。このようなソースデータ801を、ハッシング関数(hashing function)802を適用してエンコーディング(暗号化)されたストリング(文字列)803を生成する。その後、エンコーディングされたストリング803にチェックサム(checksum)を追加してセッション識別子805を生成する。前記チェックサムを用いることによって、不当クリック試図者がセッション識別子を偽造することを防止する。
【0088】
本実施例によるセッション識別子の生成方法は、ページ識別子、サイト識別子および前で説明した実施例の端末機識別子などを生成するのにも適用される。
【0089】
図9は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0090】
ステップ901で、インターネット検索サーバ104は、検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信する。ステップ902で、インターネット検索サーバ104は、検索者の端末機101に対応するクライアントIPアドレスを獲得する。クライアントIPアドレスは、受信したIPパケットのソースIPアドレスフィールドから抽出することができる。
【0091】
ステップ903で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子を獲得する。
【0092】
ステップ904で、無効クリック検出装置は、前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断する。
【0093】
図10は、本発明の一実施例によるログファイルの一例を示した図である。
【0094】
本実施例は、使用者から検索項目に対するクリックを入力されるたびごとに、クリック時間1010、クライアントIPアドレス1011およびサイト識別子1012をログファイル1000に保存する。図面符号1001乃至図面符号1009は、それぞれのクリック入力に対して保存されたログである。
【0095】
同一なクライアント端末機の使用者が継続して同一の検索項目をクリックする場合、前記クリックが一定時間内に反復されると、前記クリックは無効クリックである可能性が高い。しかし、相当な長い時間の後に同一のクライアント端末機の使用者が同一の検索項目をクリックした場合は様々である。すなわち、使用者は関心の高いウェブサイトには頻繁に訪問する傾向があるためである。しかし、短い一定期間内に継続して訪問することは、正常的なクリックであると判断するのが困難であるため、このような場合は無効クリックと判断する。例えば、前記時間の基準を5分とした場合、ログ1001と同一のクライアントIPアドレスおよびサイト識別子を有するログ1002、ログ1004、ログ1005は無効クリックと判断され、約20分後にクリックされたログ1009と関連したクリックは有効と判断される。
【0096】
但し、クライアントIPアドレスを基準として無効クリックを判断する場合は注意すべき点がある。クライアント端末機がプロキシサーバ(proxy server)またはIP共有機を用いる場合には、実際には別のクライアント端末機から同一の検索項目に対してクリックがなされたにもかかわらず無効クリックと判断される危険があるためである。従って、好ましくは、本実施例はセッション識別子など、他のパラメータを用いる実施例と組み合わせて構成することが好ましい。
【0097】
反対に、同一の検索項目に対するクリック要請を行うクライアント端末機のクライアントIPアドレスは異なるが、ネットワークアドレスが同一な場合がある。例えば、何人かが一箇所に集って継続して不当なクリックを試図したり、またはプログラムを用いてソースIPアドレスを変えたりしながらクリック要請をする場合がある。この場合は、同一の検索項目に対してクリック要請を行ったクライアント端末機のネットワークアドレスが同一であり、その他の違う条件(例えば、前記検索項目が属するディレクトリ内の平均クリック数よりも極めてクリック数が多いなどの条件)を満たす場合、無効クリックと判断することができる。
【0098】
図11は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0099】
ステップ1101で、インターネット検索サーバ104は検索者からの検索要請を受信し、ステップ1102で、検索結果ウェブページを生成する。
【0100】
ステップ1103で、インターネット検索サーバ104は、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されているかを判断する。
【0101】
ステップ1103の判断の結果、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されていなければ、ステップ1104で端末機識別子を生成し、ステップ1105で、インターネット検索サーバ104は、前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者端末機に保存する。
【0102】
ステップ1103の判断の結果、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されていれば、ステップ1106で、使用者クッキーファイルから前記端末機識別子を抽出する。
【0103】
ステップ1107で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信し、ステップ1108で、前記クリックされた検索項目に対応するサイト識別子を獲得する。
【0104】
最後に、ステップ1109で、無効クリック判断装置は、前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断する。
【0105】
本実施例によると、クライアント端末機がプロキシサーバ(proxy server)またはIP共有機を用いる場合にも、クライアント端末機を端末機識別子で区分することができるため、互いに異なるクライアント端末機がプロキシサーバまたはIP共有機を使用する場合にも、適切に前記互いに異なるクライアントからのクリックを識別することができる。
【0106】
本発明のさらに他の実施例は、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数が前記検索項目が属するカテゴリに属する検索項目の平均クリック数よりも極めて大きい場合は、無効クリックと疑って管理者に報告する。
【0107】
本実施例による無効クリック検出装置は、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段、前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段、および前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段を含む。前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合には、無効クリック報告部308を介して管理者に報告する。
【0108】
本発明のさらに他の実施例によると、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数を、前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数と比較する。例えば、特定検索項目に対するクリック数と前記特定検索項目のすぐ上に位置した検索項目2つおよび前記特定検索項目のすぐ下に位置した検索項目2つに対する同一な期間のクリック数を比較する。前記比較した結果、前記特定検索項目に対するクリック数が周囲の他の検索項目に対するクリック数より例えば5倍以上多ければ、これは無効クリックの可能性が高いと判断され、管理者に報告する。
【0109】
以上、無効クリックを判断するための多様な方法を記載したが、前記無効クリック判断方法は独自的に用いることも、また他の無効クリック判断方法と組み合わせて用いることもできる。例えば、無効クリックパターン保存部306で、クライアントIPアドレス、ページ識別子および検索項目に対応するサイト識別子が、前記検索項目に対する最終クリックから5分内に反復された場合は無効とする規則を保存することができる。
【0110】
本発明において、インターネット検索サーバと無効クリック検出装置は1つの装置として混用されて説明されたが、本発明のさらに他の実施例によると、前記インターネット検索サーバと無効クリック検出装置は、その機能に従って分離されて実装され、また、異なる管理者によって管理される。
【0111】
本発明において、別個の構成要素で図示されて説明された構成要素は、物理的に1つのシステムから構成されたり、または物理的に別個のシステムから構成されたりしてもよい。
【0112】
また、本発明において、様々な実施例が説明されたが、本発明の技術的思想の範囲内で前記複数の実施例の中で説明された技術的思想の一部を組み合わせたり除外したりした構成も、やはり本発明が属する技術分野において通常の知識を有する者には、本発明の技術範囲内であるということは明らかである。
【0113】
また、本発明の実施例は、多様なコンピュータで実現される動作を遂行するためのプログラム命令を含むコンピュータ読み取り可能媒体を含む。前記コンピュータ読み取り可能媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含む。前記媒体におけるプログラム命令は本発明のために特別に設計されて構成されたものであったり、コンピュータソフトウェアの当業者に公知されて使用可能なものであったりする。コンピュータ読み取り可能記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスクおよび磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フレキシブルディスク(floptical disk)のような光磁気媒体(magneto−optical media)、およびロム(ROM)、ラム(RAM)、フラッシュメモリなどのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置が含まれる。前記媒体は、プログラム命令、データ構造などを保存する信号を伝送する搬送波を含む光または金属線、導波管などの伝送媒体である。プログラム命令の例としては、コンパイラによって生成されたもののような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。
【0114】
図12は、本発明による検索エンジンサーバおよび無効クリック検出装置を構成するのに採用される汎用コンピュータシステムの内部ブロック図である。
【0115】
コンピュータシステム1200は、ラム(RAM:Random Access Memory)1202とロム(ROM:Read Only Memory)1203を含む主記憶装置と接続される1つ以上のプロセッサ1201を含む。プロセッサ1201は、中央処理装置(CPU)ともいう。本技術分野において広く知られているように、ロム1203はデータ(data)と命令(instruction)を単方向性でCPUに伝達する役割をし、ラム1202は通常、データと命令を両方向性で伝達するのに用いられる。ラム1202およびロム1203は、コンピュータ読み取り可能媒体のいかなる適切な形態をも含む。大容量記憶装置(Mass Storage)1204は、両方向性でプロセッサ1201と接続されて追加的なデータ保存能力を提供し、前記コンピュータ読み取り可能記録媒体の中のいかなるものにも該当する。大容量記憶装置1204は、プログラム、データなどを保存するのに用いられ、通常、主記憶装置よりも速度が遅いハードディスクのような補助記憶装置である。CDロム1206のような特定大容量記憶装置が用いられることもある。プロセッサ1201は、ビデオモニター、トラックボール、マウス、キーボード、マイクロフォン、タッチスクリーン型ディスプレイ、カード読み取り機、磁気または紙テープ読み取り機、音声または手書き文字認識機、ジョイスティック、またはその他の公のコンピュータ入出力装置のような1つ以上の入出力インターフェイス1205と接続される。最後に、プロセッサ1201は、ネットワークインターフェイス1207を介して有線または無線通信ネットワークに接続される。このようなネットワーク接続を介して前記された方法の手順を遂行する。前記された装置または道具は、コンピュータハードウェアおよびソフトウェア技術分野の当業者に広く知られている。
【0116】
前記されたハードウェア装置は、本発明の動作を遂行するために1つ以上のソフトウェアモジュールとして作動するように構成される。
【0117】
以上のように、本発明は限定された実施例と図面によって説明されているが、本発明は実施例に限定されるものではなく、本発明が属する分野にて通常の知識を有する者であれば、このような記載から多様な修正および変形が可能である。従って、本発明の思想は特許請求の範囲によって解釈されるべきであり、この均等または等価的変形は本発明の思想の範囲に属することは言うまでもない。
【図面の簡単な説明】
【0118】
【図1】本発明による無効クリック検出装置を含むインターネット検索サーバとクライアント端末機とのネットワーク接続を示した図である。
【図2】インターネット検索エンジンサーバによって生成された検索結果ウェブページの一例を示した図である。
【図3】本発明の一実施例による無効クリック検出装置を示したブロック図である。
【図4】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図5】本発明の一実施例によるログファイルの一例を示した図である。
【図6a】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図6b】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図7】本発明の一実施例によるログファイルの一例を示した図である。
【図8】本発明の一実施例によってセッション識別子を生成する方法の順序を示した流れ図である。
【図9】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図10】本発明の一実施例によるログファイルの一例を示した図である。
【図11】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図12】本発明による検索エンジンサーバおよび無効クリック検出装置を構成するのに採用される汎用コンピュータシステムの内部ブロック図である。
【技術分野】
【0001】
本発明は、インターネット検索エンジンサーバに関するものであって、より詳細には、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置に関する。また、本発明は、不当に検索結果に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置に関する。
【背景技術】
【0002】
インターネットが広く普及する中、インターネットを介してアクセスすることができるウェブページなどの情報源(information source)の数は、幾何級数的に増加している。また、このように無数の情報源の中から検索者が必要とする情報を探すため、検索者は、ネイバー、ヤフー(商標登録)、ライコスなどのインターネット検索エンジンサーバにアクセスして検索を要請(要求)する。インターネット検索サービス提供者は、検索者から入力された検索語と関連した情報を含んでいる検索項目を含んだ検索結果ウェブページを生成して提供者に提供する。例えば、検索者がネイバー検索エンジンサーバに接続して“Digital Camera”という検索語を入力した場合の検索結果ウェブページが図2に示されている。検索結果ウェブページに含まれた各項目は、URL(Uniform Resource Location)と関連する。
【0003】
しかし、1つの検索語と関連する検索項目は無数であるため、このように多くの検索項目をどのような順で検索結果ウェブページに表示するのかは、インターネット検索サービス提供者にとって非常に重要な問題である。インターネット検索サービス提供者は、様々な基準を組み合わせて検索項目の羅列順序を決定するが、この中で多く用いられる基準の1つは、使用者(利用者)の検索項目に対するクリック数である。例えば、検索項目に対する使用者のクリック数が多ければ、相対的に検索結果ウェブページの上位に表示される。インターネット検索サービス提供者が、複数のパラメータを組み合わせて検索項目の羅列順序を決定する場合にも、前記パラメータの中の1つが使用者のクリック数である場合には、クリック数が多い検索項目は相対的に検索結果ウェブページの上位に表示される。
【0004】
また、インターネット検索サーバによって生成される検索結果ウェブページの上位に表示される程、使用者がクリックして訪問する可能性が高くなるため、ウェブサーバネットワーク情報提供者は、自身と関連した検索項目が検索結果ウェブページで上位に表示されることを所望する。このようなネットワーク情報提供者の中には、自身のウェブページに対する検索項目が検索結果ウェブページで上位に表示されるようにするため、意図的にインターネット検索サーバにアクセスして自身のウェブページに対する検索項目を何度もクリックする場合がある。また、ある場合は、プログラムを作成して、自身のウェブページに対する検索項目が継続してクリックされるような効果を出すようにしたりもする。しかし、このような検索項目に対する不当なクリックは、使用者全体の自然な検索結果を反映するものではないため、インターネット検索サービス提供者は、このような無効クリック(invalid click)を検出する必要がある。
【0005】
従来技術の中には、検索結果ウェブページにおいて、ある検索項目がどれ程多くクリックされたかによって、前記検索項目と関連したネットワーク情報提供者に課金するサービスを提供する場合もある。米国のインターネット検索サービス提供者であるオーバーチュア社は、ネットワーク情報提供者からクリック当りいくら支払うという入力を受けた後、検索結果ウェブページで前記ネットワーク情報提供者と関連した検索項目がクリックされると、前記ネットワーク情報提供者にクリック当りの課金を遂行する。この場合、ある検索者が人為的に特定した検索項目に対して複数のクリックを行うと、前記ネットワーク情報提供者は、不当に多くの費用を支払うことになる。従って、この場合にも、実際に検索の意図を有しておらず、単にクリック数を増加させるという意図からなる無効クリックを検出する必要がある。
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は、前記のような従来技術を改善するために案出されたものであって、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置を提供することを目的とする。
【0007】
また 、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置を提供することを他の目的とする。
【0008】
また、無効クリックを検出するために提供される様々な識別子の偽造および変造がし難い無効クリック検出方法および装置を提供することを他の目的とする。
【課題を解決するための手段】
【0009】
前記の目的を解決し、従来技術の問題点を解決するために、本発明は、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記生成されたウェブページに対応するページ識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含むインターネット検索エンジンにおける無効クリック検出方法を提供する。
【0010】
また、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。
【0011】
また、検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記検索者の端末機に対応するクライアントIPアドレスを獲得するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。
【0012】
また、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記検索者の端末機に対応する端末機識別子を獲得するステップと、前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者の端末機に保存するようにするステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。
【0013】
また、検索者がインターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目をクリックした場合、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報を受信し、前記受信した情報に基づき、所定の基準に従って前記クリックの無効可否を判断することを特徴とする無効クリック検出装置が提供される。
【0014】
また、(1)インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対する検索者のクリックに応答し、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存するログ保存部と、(2)前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターンを保存する無効クリックパターン保存部と、(3)前記ログ保存部に保存された前記ログおよび前記無効クリックパターン保存部に保存された無効クリックパターンに基づき、前記検索者のクリックが無効クリックであるかを判断する無効クリック判断部とを含む無効クリック検出装置が提供される。
【0015】
また、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段とを含む無効クリック検出装置が提供される。
【0016】
また、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段を含む無効クリック検出装置が提供される。
【0017】
無効クリック(invalid click)は正確に定義するのが難しく、各実施例および応用例によって、その範囲が異なって定められなければならない。ただ、一般的に無効クリックとは、実際に検索の意図を有さず、単にクリック数を増加させる意図からなるクリックとして説明される。
【発明の効果】
【0018】
本発明によると、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置が提供される。
【0019】
また、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置が提供される。すなわち、新たなパターンの不当なクリック試図が発見された場合、前記パターンまたは規則を本発明による無効クリックパターン保存部に保存することによって、前記新たなパターンの不当なクリック試図に対して即時に対処することができる。
【0020】
また、無効クリックを検出するために提供される様々な識別子の偽造または変造がし難い無効クリック検出方法および装置を提供する。
【発明を実施するための最良の形態】
【0021】
以下、添付された図面を参照して、本発明の実施例を詳細に説明する。
【0022】
図1は、本発明による無効クリック検出装置を含んだインターネット検索サーバとクライアント端末機とのネットワーク接続を示した図である。
【0023】
検索者(searcher)または不当なクリックを試図する不当クリック試図者(cheater)は、インターネット103と接続されたクライアントクライアント端末機101を介してインターネット検索サーバ104に接続する。不当クリック試図者は、インターネット検索サーバ104によって提供された検索結果ウェブページの中で、クリック数を高めようとする検索項目を複数回クリックするなどの方法を用いて、クリック数を高めようと試図する。例えば、図2において、検索項目202がhttp://www.invalidclick.comと関連した検索項目であり、不当クリック試図者は、検索項目202が検索結果ウェブページで上位に表示されるようにするため、前記検索項目202を継続してクリックする場合を想定することができる。
【0024】
クッキーファイル(cookie file)102は、クライアント端末機101が検索エンジンサーバ104または他のウェブサイトに接続した場合、前記検索エンジンサーバ104または他のウェブサイトをクライアント端末機101のハードディスクに保存しておく特別なテキストファイルである。ウェブサイトの接続に用いられるHTTPプロトコルでウェブページに対するそれぞれの要求は、他の要求とはすべて独立(independent)している。従って、ウェブサーバは、クライアント端末機101に、以前にどのようなページを送ったか、または以前にどのような作業を共に遂行したかに関するいかなる情報をも有することができない。従って、このように独立的に処理されるそれぞれの要求との関連を結ぶためにクッキーファイルが提供され、このようなクッキーファイルは、ウェブサーバに使用者に関する情報を使用者のコンピュータに保存することができるようにする役割をする。本発明においても、無効クリックを検出するために様々なクッキーファイルを用いる。これに関しては、後で詳細に説明する。
【0025】
ログファイル(log file)105は、使用者のクリックに関連した様々なログ(log)を保存するファイルである。本発明においては、無効クリックを検出するために様々なパラメータを用い、各クリックと関連したパラメータをログファイルに保存した後、所定の規則およびパターンを用いて入力されたクリックが無効であるかを判断する。図5、図7および図10に、本発明の実施例によるログファイルの例が示されている。
【0026】
図3は、本発明の一実施例による無効クリック検出装置を示したブロック図である。
【0027】
本発明の一実施例による無効クリック検出装置301は、パラメータ入力部304、ログ保存部305、無効クリックパターン保存部306、無効クリック検証部307、無効クリック報告部308、無効クリック判断部309とを含む。
【0028】
インターネット検索エンジンによって提供された検索結果ウェブページの中に含まれた検索項目に対して検索者がクリックした場合、前記クリックと関連した様々なパラメータ302がパラメータ入力部304に入力される。前記パラメータは、無効クリックを判断するための基礎情報であって、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報などである。
【0029】
検索者がインターネット検索エンジンサーバ104に検索要請(要求)をする場合、検索要請パケットがクライアント端末機101からインターネット検索エンジンサーバ104に送信される。前記検索要請パケットは、HTTPプロトコルによるパケット構成をしており、またインターネットプロトコル(IP:Internet Protocol)パケットが含まれて構成される。しかし、前記インターネットプロトコルパケットの構成にはソースIPアドレス(Source IP address)フィールドが含まれているため、インターネット検索エンジンサーバ104は、クリックを要請した検索要請パケットからソースIPアドレスを抽出することによって、検索者の端末機のIPアドレスを抽出する。
【0030】
ソースIPアドレスの中で前の部分は、検索者の端末機が属するネットワークのアドレスである。IPアドレスは4バイトで構成され、この中で前部分は検索者の端末機が属するネットワークを識別するためのネットワークアドレスであり、残りの部分が前記ネットワーク内で検索者の端末機を識別するためのアドレスとなる。
【0031】
従って、前記ソースIPアドレスの中からネットワークアドレスを抽出する。本発明の一実施例によると、前の3バイトをネットワークアドレスと見なしてソースIPアドレスからネットワークアドレスを得る。例えば、ソースIPアドレスが123.45.67.89であれば、ネットワークアドレスとして123.45.67を抽出する。
【0032】
前記検索結果ウェブページと関連した検索語は、検索者がインターネット検索サーバ104に入力した値である。
【0033】
検索者のウェブブラウザに対する情報は、検索者のクライアント端末機101に設置され、検索者がインターネット検索サーバ104にアクセスするために用いられたウェブブラウザに関する情報である。前記ウェブブラウザに対する情報には、ウェブブラウザの種類、ウェブブラウザのバージョン(version)およびウェブブラウザの製品ID(Product ID)などが含まれる。特に、ウェブブラウザの製品IDは、複数の検索者が同一な種類および同一なバージョンのウェブブラウザを設置した場合でも互いに異なるため、検索者の端末機を識別することができる優れた情報となる。
【0034】
ウェブ接続に用いられるHTTPプロトコルによると、クライアントの環境変数の中の一部がHTTPパケットに含まれてウェブサーバに送信される。ウェブサーバのプログラム(検索エンジンプログラム)は、前記環境変数を受信し、これを無効クリック検出に用いることができる。
【0035】
このような環境変数としては、下記のような情報が含まれる。
REMOTE_HOST:接続した人のドメインネーム
REMOTE_ADDR:接続したクライアントホストのIPアドレス
REMOTE_USER:接続した人の名前(ユーザー認証が設定されたウェブサーバである場合に示される)
REMOTE_IDENT:接続した人のID(ユーザー認証が設定されたウェブサーバである場合に示される)
HTTP_USER_AGENT:接続した人が動作させているプログラムの登録情報、一般的にはブラウザの名前
HTTP_ACCEPT_LANGUAGE:接続した人が使用している言語
HTTP_REFERER:該当するCGIプログラムを呼び出した文章の名前
REQUEST_METHOD:サーバにデータを伝送する方法(GET、POST)
QUERY_STRING:GET方式でデータを伝送した場合、伝送されたデータが保存される変数
CONTENT_LENGTH:POST方式でデータを伝送した場合、伝送されたデータの全体長さ数(バイト数)
CONTENT_TYPE:POST方式でデータを伝送した場合、伝送されるMIME型
AUTH_TYPE:使用者の使用権限を確認するための変数
SERVER_NAME:現在サーバのドメインネーム
SERVER_SOFTWARE:現在サーバに設置されたウェブサーバプログラムの名前
SERVER_PROTOCOL:現在サーバが使用するウェブプロトコルの名前およびバージョン
SERVER_PORT:現在サーバが使用するポート番号(HTTPである場合、一般的に80)
PATH_INFO:呼び出されたCGIプログラムの現在経路の情報
PATH_TRANSLATED:ウェブサーバでウェブが必要な資源(リソース)の経路の情報
SCRIPT_NAME:現在呼び出されるCGIプログラムの名前
HTTP_ACCEPT:現在HTTPで受け取ることができる資源(リソース)の形態
【0036】
検索者のクリックと関連したクリック時間は、検索者からクリック入力を受信した時間を用いる。本発明のさらに他の実施例によると、前記検索者のクリック時間と関連した他の時間を用いることもできる。例えば、検索者がクライアントでクリックを実際に入力した時間を用いることもできる。
【0037】
検索者の端末機に保存されたクッキーファイル情報は、インターネット検索サーバ104がクライアント端末機101に保存されたクッキーファイル102にアクセスして得る。本発明において、クッキーファイル102は、様々な用途で使用されることができるが、これに関しては他の実施例を通して詳細に説明する。
【0038】
検索者がクリックした検索項目と関連したURL情報は、検索エンジンサーバ104と関連した検索データベース(図示省略)に保存されているため、前記検索データベースを参照することによって得ることができる。前記URL情報は、ウェブサーバのドメインネームであったり、またはドメインネーム、ディレクトリおよびファイル名を含んだ情報であったりする。例えば、“http://www.naver.com”と“http://www.naver.com/download”をドメインネームだけで見ると、すべてwww.naver.comと同一であるが、URL全体で見ると互いに異なる。本発明においては、説明の便宜のため、ドメインネームまでのURLを用いた実施例を説明するが、本発明は、ドメインネーム、ディレクトリおよびファイル名をすべて含み、ドメインネームが同じであってもディレクトリなどが異なれば互いに異なる検索項目と見なされる実施例の場合もすべて含まれる。また、本発明において、URL情報は、本記載に従い、前記実施例すべてを含むものと解釈されなければならない。
【0039】
また、前記で説明したパラメータ以外の無効クリックの検出に有用な他のパラメータも、本発明の技術的思想の範囲内で、無効クリックの検出のために用いることができる。
【0040】
前記のような多様なパラメータ302はパラメータ入力部304に入力され、前記パラメータは再びログ保存部305に保存される。本発明によるログ保存部に保存されたログ(log)の例が、図5、図7および図10に示されている。前記図では、それぞれの説明の便宜のため、一部のパラメータのみを含んだログが示されている。しかし、本発明のさらに他の実施例によると、前記パラメータ302の全部または一部を含んだログがログ保存部305に保存される。
【0041】
本発明の一実施例によると、ログ保存部305は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存する。本発明の好ましい実施例によると、ログ保存部305は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報に関するログを保存する。
【0042】
無効クリックパターン保存部306は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターン(pattern)または規則(rule)を保存する。例えば、“10分間のクリック入力中、検索者の端末機のIPアドレスおよび検索項目と関連したURL情報がすべて一致する場合”という規則またはパターンを保存する。このように無効クリックを判断するための規則などを保存する無効クリックパターン保存部306には、所定の規則によって定められた言語(language)を用いてファイルの形態で保存されたり、または前記のような規則またはパターンに該当する場合は無効クリックと判断するようにするプログラムの形態で保存されたりする。
【0043】
無効クリック判断部309は、ログ保存部305に保存されたログおよび無効クリックパターン保存部306に保存された無効クリックパターンに基づき、検索者のクリックが無効クリックであるかを判断する。
【0044】
無効クリック報告部308は、無効クリック判断部309によって無効と判断されたクリックの中で、所定の基準によるクリックをインターネット検索エンジンの管理者303に報告する。本発明の一実施例によると、無効クリック報告部308は、無効クリック判断部309によって無効と判断されたクリックのすべてをインターネット検索エンジンの管理者に報告する。この場合、前記所定の基準は、無効クリック報告部308が無効クリック判断部309によって無効と判断されたクリックすべてとなる。本発明のさらに他の実施例によると、無効クリックパターン保存部306に保存された規則またはパターンはそれぞれ、前記規則またはパターンに該当する場合は管理者303に報告するべきかに関するフィールドを含んで保存される。この場合には、管理者303に報告すべき規則に該当した場合、無効クリック報告部308が管理者303に報告する。
【0045】
無効クリック検証部307は、無効クリック判断部309によって無効クリックとして検出されたクリックを管理者303の入力によって有効クリックに変更する。無効クリック検証部307によって、間違って無効クリックと判断されたクリックを有効クリックに変更することができるため、無効クリックの判断がより正確になる。
【0046】
図4は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0047】
ステップ401で、インターネット検索サーバ104は、検索者から検索要請を受信する。検索者がインターネット検索サーバ104に接続して検索語を入力すると、前記検索語が検索要請パケットとしてインターネット検索サーバ104に送信される。
【0048】
ステップ402で、インターネット検索サーバ104は、前記検索要請に応答して検索結果ウェブページを生成する。例えば、図2に示されたように、検索者の検索語入力に対して複数の検索項目を含んだ検索結果ウェブページを前記検索者に提供する。
【0049】
ステップ403で、前記生成された検索結果ウェブページに対応するページ識別子を獲得する。ページ識別子(Page Identifier)は、検索結果ウェブページが生成されるたびに生成され、前記検索結果ウェブページを識別する識別子である。従って、同一な検索者がインターネット検索サーバ104の検索ウィンドウで同一な検索語を反復して入力することで検索を要請する場合には、その都度新たなページ識別子が割り当てられる。同様に、検索者が検索結果ウェブページを表示しているウェブブラウザで“更新(reload)”項目をクリックすると、クライアント端末機101からインターネット検索サーバ104に検索要請パケットが送信されるため、インターネット検索サーバ104は検索結果ウェブページに対する新たなページ識別子を割り当てる。一見、同一に見える検索結果ウェブページに対して互いに異なるページ識別子が割り当てられるものと思われるが、クライアント端末機101から新たな検索要請を受信する場合、その時に新たに検索結果ウェブページを生成するため、以前の検索結果ウェブページとは異なる検索結果ウェブページが提供される。
【0050】
ステップ404で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。クリックを受信した場合、前記検索項目に対するハイパーリンクが先ず前記インターネット検索サーバ104にアクセスするようにし、その後、インターネット検索サーバ104が必要な処理をした後、前記検索項目に対応するウェブサイトにクライアント端末機が接続することができるようにする。例えば、“http://www.invalidclick.com/”に対応する検索項目のハイパーリンクとして“http://www.naver.com/abc/*http://www.invalidclick.com/”が用意されており、前記検索項目をクリックした場合、“http://www.naver.com”という検索サーバに先ず接続され、前記検索サーバは前記ハイパーリンクの後にあるURLに従って、前記http://www.invalidclick.comにクライアント端末機が接続するようにする。
【0051】
ステップ405で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子(site identifier)を獲得する。サイト識別子は検索項目を識別する識別子であり、検索項目に対応するURL情報に基づいて生成される。本発明のさらに他の実施例によると、サイト識別子としては検索項目に対応するURL情報をそのまま使用する。前記サイト識別子を生成するための基礎情報として使用されるURL情報は、ウェブサーバのドメインネームであったり、またはドメインネーム、ディレクトリおよびファイル名を含む情報であったりする。例えば、“http://www.naver.com/download”と“http://www.naver.com”をドメインネームだけで見ると、両者ともwww.naver.comと同一であるが、URL全体で見ると互いに異なる。本発明においては、説明の便宜のため、ドメインネームまでのURLを用いた実施例を説明したが、本発明は、ドメインネーム、ディレクトリおよびファイル名をすべて含み、ドメインネームが同じであってもディレクトリなどが異なると、互いに異なる検索項目と見なされる実施例の場合もすべて含む。また、本発明において、サイト識別子は、本記載にに従い、前記実施例のすべてを含むものと解釈されなければならない。
【0052】
ステップ406で、無効クリック検出装置は、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断する。
【0053】
図5は、本発明の一実施例によるログファイルの一例を示した図である。図4の実施例を、図5を参照して説明する。
【0054】
本発明は、使用者から検索項目に対するクリックを入力されるたびごとに、ページ識別子509およびサイト識別子510をログファイル500に保存する。図面符号501乃至図面符号508は、それぞれのクリック入力に対して保存されたログである。
【0055】
不当クリック試図者は、インターネット検索サーバ104に接続して検索要請を行う。そうすると、インターネット検索サーバ104は、検索結果ウェブページを生成し、前記検索結果ウェブページに対応するページ識別子、“nCe249sisn0”を生成する。不当クリック試図者は、前記検索結果ウェブページに含まれた特定の検索項目を継続してクリックする。一度生成された検索結果ウェブページで特定の検索項目を継続してクリックしてもページ識別子は新たに生成されないため、ページ識別子は継続して同一な値を有するようになる。
【0056】
従って、所定時間入力されたクリックに対するログの中で、ページ識別子およびサイト識別子が一致するログ501、ログ502およびログ504は無効クリックと判断される。本発明の一実施例によると、前記一致するログの中で、1つは有効クリックと判断され、残りは無効クリックと判断される。
【0057】
不当クリック試図者は、自身のウェブブラウザで“更新”をクリックすることによって、検索結果ウェブページを更新する。この場合、ページ識別子も新たに割り当てられ、これに関するログがログ505である。その後、不当クリック試図者が再び同一な検索項目に対してクリックした場合がログ506である。
【0058】
従って、本実施例によると、不当クリック試図者が“更新”を行った後、同一の検索項目に対してクリックした場合(ログ506の場合)は無効クリックとして検出されない。このように“更新”を行った場合も、無効クリックとして検出することができる方法が、図6aおよび図6bを参照した以下の実施例において説明されている。
【0059】
図6aおよび図6bは、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0060】
ステップ601で、インターネット検索サーバ104は、検索者から検索要請を受信し、ステップ602で、インターネット検索サーバ104は、前記検索要請に応答して検索結果ウェブページを生成する。
【0061】
ステップ603で、無効クリック判断装置は、検索要請を行ったクライアント端末機101にセッションクッキーファイル(session cookie file)が保存されているかを判断する。ステップ603からステップ611までは、セッション識別子(session identifier)を得る過程を説明するためのものである。
【0062】
万一、クライアント端末機101にセッションクッキーファイルが保存されていなければ、ステップ604で、無効クリック判断装置は新たなセッション識別子(session identifier )を生成する。そして、ステップ605で、前記セッション識別子を含むセッションクッキーファイルをクライアント端末機101に保存する。前記セッションクッキーファイルにはセッション識別子の更新時間も保存されるが、ステップ609で、更新時間をセッションクッキーファイルに保存する。
【0063】
万一、ステップ603での判断の結果、クライアント端末機101にセッションクッキーファイルが保存されていれば、ステップ606で、前記セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内であるかを判断する。
【0064】
ステップ606での判断の結果、セッションクッキーファイルに保存されたセッション識別子の最終更新時間が所定時間以内であれば、ステップ607で、前記セッションクッキーファイルに含まれたセッション識別子を抽出する。
【0065】
ステップ606での判断の結果、セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内でなければ、ステップ608で、新たなセッション識別子を生成する。ステップ610で、セッションクッキーファイルに含まれたセッション識別子を前記新たに生成されたセッション識別子に更新する。ステップ611では、前記セッション識別子の更新時間を前記セッションクッキーファイルに保存する。
【0066】
ステップ612で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。
【0067】
ステップ613で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子(site identifier)を獲得する。
【0068】
ステップ614で、無効クリック検出装置は、前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致した場合、前記クリックを無効と判断する。
【0069】
図7は、本発明の一実施例によるログファイルの一例を示した図である。
【0070】
本実施例は、使用者から検索項目に対するクリックを入力されるたびごとに、クリック時間710、セッション識別子の更新時間711、セッション識別子712およびサイト識別子713をログファイル700に保存する。図面符号701乃至図面符号708は、それぞれのクリック入力に対して保存されたログである。
【0071】
不当クリック試図者はインターネット検索サーバ104に接続して検索要請を行い、インターネット検索サーバ104は検索結果ウェブページを生成する。インターネット検索サーバ104は、前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。
【0072】
インターネット検索サーバ104は、クライアント端末機101にセッションクッキーファイルが保存されているかを確認する。セッションクッキーファイルが保存されていなければ新たなセッション識別子を生成し、その更新時間および前記セッション識別子を含むセッションクッキーファイルをクライアント端末機101に保存する。本実施例では、セッション識別子“xigw9492”および更新時間“10:50:14”が記録されている。また、ログファイル700にクリック時間、更新時間、セッション識別子および検索項目に対応するサイト識別子をログ701で保存する。セッションクッキーファイルを初めに生成する場合は、クリック時にセッションクッキーファイルが生成され、またその時にセッション識別子が生成されるため、クリック時間およびセッション識別子の更新時間が同一である。
【0073】
不当クリック試図者は同一の検索結果ページで、同一の検索項目に対してクリックする。インターネット検索サーバ104は、クライアント端末機101にセッションクッキーファイルが保存されているかを確認する。前記で生成したセッションクッキーファイルがすでにクライアント端末機101に保存されているため、インターネット検索サーバ104は、クライアント端末機101に保存されたセッションクッキーファイルにアクセスする。前記セッションクッキーファイルには、セッション識別子および前記セッション識別子の最終更新時間が保存されている。本実施例では、セッション識別子“xigw9492”および更新時間“10:50:14”がセッションクッキーファイルに保存されている。
【0074】
インターネット検索サーバ104は、検索者からの検索項目に対するクリック時間が、前記セッション識別子と関連した最終更新時間から所定時間以内であるかを判断する。本実施例で、2度目クリックのクリック時間は“10:50:18”である。所定時間を5分とした場合、前記クリック時間“10:50:18”は、最終更新時間“10:50:14”から所定時間以内である。従って、この場合には、セッションクッキーファイルに保存されているセッション識別子を現在のセッション識別子として、セッションクッキーファイルのセッション識別子を更新しない。従って、この場合には、ログ702のように記録される。
【0075】
ログ702は、ログ701とセッション識別子およびサイト識別子が同一であるため、無効クリックと判断される。
【0076】
ログ704は、不当クリック試図者が“更新”要請を行った場合に関するものである。不当クリック試図者が“更新”要請を行った場合にも同様に、クライアント端末機101に保存されたセッションクッキーファイルを参照し、前記セッションクッキーファイルに保存された最終更新時間が一定時間内であるため、セッション識別子を更新しない。従って、ログ704のように記録され、ログ704はログ701と同一であるため無効クリックと判断される。すなわち、本実施例によると、不当クリック試図者が短時間内に“更新”を行った後、同一の検索項目をクリックした場合を検出することができる。
【0077】
ログ705は、ログ701、ログ702およびログ704とは異なる検索者から同一の検索項目に対するクリックを受信した場合に関するものである。この場合は、新たなセッション識別子が割り当てられるため、無効クリックと判断されない。
【0078】
ログ709は、ログ701と同一の検索者が相当に長い時間の後に同一の検索項目をクリックした場合に関するものである。この場合は、相当に長い時間の後にクリックを受信したものであるため、無効クリックと判断されない。
【0079】
本実施例によると、セッション識別子が生成された後、一定時間、同一の検索項目をクリックした場合は、無効クリックと判断される。
【0080】
これと類似して、本発明のさらに他の実施例によると、無効クリック判断の基準として、同一の検索項目に対する最終クリック時間から一定時間以内である場合を無効クリックと判断することができるが、これに関して簡単に説明する。
【0081】
検索者からクリックを受信した場合、前記端末機に前記セッションクッキーファイルが保存されているかを判断する。前記端末機に前記セッションクッキーファイルが保存されている場合、前記検索者からの前記検索項目に対するクリック時間が前記セッション識別子と関連した最終クリック時間から所定時間以内であるかを判断する。
【0082】
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得し、前記最終クリック時間を前記検索項目に対するクリック時間に更新する。
【0083】
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内でない場合、新たなセッション識別子を生成し、前記セッションクッキーファイルに含まれたセッション識別子を更新する。また、前記最終クリック時間を前記検索項目に対するクリック時間に更新する。
【0084】
例えば、図7において、同一のクライアント端末機から同一の検索項目に対して複数のクリックがある場合、最終クリックから5秒経過した場合は有効であると判断すると、ログ704と関連したクリックは、それ以前の最終クリック時間“10:50:18”よりも13秒後である“10:50:13”にクリックされたため有効と判断される。本発明の好ましい実施例によると、前記時間の基準は、無効クリックを検出する目的に従って決定される。
【0085】
図8は、本発明の一実施例によってセッション識別子を生成する方法の順序を示した流れ図である。
【0086】
セッション識別子は、他のセッション識別子と区別されるように単独的に割り当てられなければならず、同時に偽造または変造がし難いようにしなければならない。なぜなら、単に単独的に割り当てられる場合には、不当クリック試図者がセッション識別子を架空で生成してセッションクッキーに保存したり、またはプログラムを介して継続してセッション識別子を変更したりしながらクリックを行うプログラムを準備して、不当にクリック数を高めることができるためである。
【0087】
ソースデータ801は、セッション識別子805を生成するための基礎データであって、現在の時間情報、検索語、検索者のウェブブラウザの製品IDなど、様々である。また、無作為で選択された数字でもある。このようなソースデータ801を、ハッシング関数(hashing function)802を適用してエンコーディング(暗号化)されたストリング(文字列)803を生成する。その後、エンコーディングされたストリング803にチェックサム(checksum)を追加してセッション識別子805を生成する。前記チェックサムを用いることによって、不当クリック試図者がセッション識別子を偽造することを防止する。
【0088】
本実施例によるセッション識別子の生成方法は、ページ識別子、サイト識別子および前で説明した実施例の端末機識別子などを生成するのにも適用される。
【0089】
図9は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0090】
ステップ901で、インターネット検索サーバ104は、検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信する。ステップ902で、インターネット検索サーバ104は、検索者の端末機101に対応するクライアントIPアドレスを獲得する。クライアントIPアドレスは、受信したIPパケットのソースIPアドレスフィールドから抽出することができる。
【0091】
ステップ903で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子を獲得する。
【0092】
ステップ904で、無効クリック検出装置は、前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断する。
【0093】
図10は、本発明の一実施例によるログファイルの一例を示した図である。
【0094】
本実施例は、使用者から検索項目に対するクリックを入力されるたびごとに、クリック時間1010、クライアントIPアドレス1011およびサイト識別子1012をログファイル1000に保存する。図面符号1001乃至図面符号1009は、それぞれのクリック入力に対して保存されたログである。
【0095】
同一なクライアント端末機の使用者が継続して同一の検索項目をクリックする場合、前記クリックが一定時間内に反復されると、前記クリックは無効クリックである可能性が高い。しかし、相当な長い時間の後に同一のクライアント端末機の使用者が同一の検索項目をクリックした場合は様々である。すなわち、使用者は関心の高いウェブサイトには頻繁に訪問する傾向があるためである。しかし、短い一定期間内に継続して訪問することは、正常的なクリックであると判断するのが困難であるため、このような場合は無効クリックと判断する。例えば、前記時間の基準を5分とした場合、ログ1001と同一のクライアントIPアドレスおよびサイト識別子を有するログ1002、ログ1004、ログ1005は無効クリックと判断され、約20分後にクリックされたログ1009と関連したクリックは有効と判断される。
【0096】
但し、クライアントIPアドレスを基準として無効クリックを判断する場合は注意すべき点がある。クライアント端末機がプロキシサーバ(proxy server)またはIP共有機を用いる場合には、実際には別のクライアント端末機から同一の検索項目に対してクリックがなされたにもかかわらず無効クリックと判断される危険があるためである。従って、好ましくは、本実施例はセッション識別子など、他のパラメータを用いる実施例と組み合わせて構成することが好ましい。
【0097】
反対に、同一の検索項目に対するクリック要請を行うクライアント端末機のクライアントIPアドレスは異なるが、ネットワークアドレスが同一な場合がある。例えば、何人かが一箇所に集って継続して不当なクリックを試図したり、またはプログラムを用いてソースIPアドレスを変えたりしながらクリック要請をする場合がある。この場合は、同一の検索項目に対してクリック要請を行ったクライアント端末機のネットワークアドレスが同一であり、その他の違う条件(例えば、前記検索項目が属するディレクトリ内の平均クリック数よりも極めてクリック数が多いなどの条件)を満たす場合、無効クリックと判断することができる。
【0098】
図11は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【0099】
ステップ1101で、インターネット検索サーバ104は検索者からの検索要請を受信し、ステップ1102で、検索結果ウェブページを生成する。
【0100】
ステップ1103で、インターネット検索サーバ104は、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されているかを判断する。
【0101】
ステップ1103の判断の結果、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されていなければ、ステップ1104で端末機識別子を生成し、ステップ1105で、インターネット検索サーバ104は、前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者端末機に保存する。
【0102】
ステップ1103の判断の結果、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されていれば、ステップ1106で、使用者クッキーファイルから前記端末機識別子を抽出する。
【0103】
ステップ1107で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信し、ステップ1108で、前記クリックされた検索項目に対応するサイト識別子を獲得する。
【0104】
最後に、ステップ1109で、無効クリック判断装置は、前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断する。
【0105】
本実施例によると、クライアント端末機がプロキシサーバ(proxy server)またはIP共有機を用いる場合にも、クライアント端末機を端末機識別子で区分することができるため、互いに異なるクライアント端末機がプロキシサーバまたはIP共有機を使用する場合にも、適切に前記互いに異なるクライアントからのクリックを識別することができる。
【0106】
本発明のさらに他の実施例は、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数が前記検索項目が属するカテゴリに属する検索項目の平均クリック数よりも極めて大きい場合は、無効クリックと疑って管理者に報告する。
【0107】
本実施例による無効クリック検出装置は、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段、前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段、および前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段を含む。前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合には、無効クリック報告部308を介して管理者に報告する。
【0108】
本発明のさらに他の実施例によると、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数を、前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数と比較する。例えば、特定検索項目に対するクリック数と前記特定検索項目のすぐ上に位置した検索項目2つおよび前記特定検索項目のすぐ下に位置した検索項目2つに対する同一な期間のクリック数を比較する。前記比較した結果、前記特定検索項目に対するクリック数が周囲の他の検索項目に対するクリック数より例えば5倍以上多ければ、これは無効クリックの可能性が高いと判断され、管理者に報告する。
【0109】
以上、無効クリックを判断するための多様な方法を記載したが、前記無効クリック判断方法は独自的に用いることも、また他の無効クリック判断方法と組み合わせて用いることもできる。例えば、無効クリックパターン保存部306で、クライアントIPアドレス、ページ識別子および検索項目に対応するサイト識別子が、前記検索項目に対する最終クリックから5分内に反復された場合は無効とする規則を保存することができる。
【0110】
本発明において、インターネット検索サーバと無効クリック検出装置は1つの装置として混用されて説明されたが、本発明のさらに他の実施例によると、前記インターネット検索サーバと無効クリック検出装置は、その機能に従って分離されて実装され、また、異なる管理者によって管理される。
【0111】
本発明において、別個の構成要素で図示されて説明された構成要素は、物理的に1つのシステムから構成されたり、または物理的に別個のシステムから構成されたりしてもよい。
【0112】
また、本発明において、様々な実施例が説明されたが、本発明の技術的思想の範囲内で前記複数の実施例の中で説明された技術的思想の一部を組み合わせたり除外したりした構成も、やはり本発明が属する技術分野において通常の知識を有する者には、本発明の技術範囲内であるということは明らかである。
【0113】
また、本発明の実施例は、多様なコンピュータで実現される動作を遂行するためのプログラム命令を含むコンピュータ読み取り可能媒体を含む。前記コンピュータ読み取り可能媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含む。前記媒体におけるプログラム命令は本発明のために特別に設計されて構成されたものであったり、コンピュータソフトウェアの当業者に公知されて使用可能なものであったりする。コンピュータ読み取り可能記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスクおよび磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フレキシブルディスク(floptical disk)のような光磁気媒体(magneto−optical media)、およびロム(ROM)、ラム(RAM)、フラッシュメモリなどのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置が含まれる。前記媒体は、プログラム命令、データ構造などを保存する信号を伝送する搬送波を含む光または金属線、導波管などの伝送媒体である。プログラム命令の例としては、コンパイラによって生成されたもののような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。
【0114】
図12は、本発明による検索エンジンサーバおよび無効クリック検出装置を構成するのに採用される汎用コンピュータシステムの内部ブロック図である。
【0115】
コンピュータシステム1200は、ラム(RAM:Random Access Memory)1202とロム(ROM:Read Only Memory)1203を含む主記憶装置と接続される1つ以上のプロセッサ1201を含む。プロセッサ1201は、中央処理装置(CPU)ともいう。本技術分野において広く知られているように、ロム1203はデータ(data)と命令(instruction)を単方向性でCPUに伝達する役割をし、ラム1202は通常、データと命令を両方向性で伝達するのに用いられる。ラム1202およびロム1203は、コンピュータ読み取り可能媒体のいかなる適切な形態をも含む。大容量記憶装置(Mass Storage)1204は、両方向性でプロセッサ1201と接続されて追加的なデータ保存能力を提供し、前記コンピュータ読み取り可能記録媒体の中のいかなるものにも該当する。大容量記憶装置1204は、プログラム、データなどを保存するのに用いられ、通常、主記憶装置よりも速度が遅いハードディスクのような補助記憶装置である。CDロム1206のような特定大容量記憶装置が用いられることもある。プロセッサ1201は、ビデオモニター、トラックボール、マウス、キーボード、マイクロフォン、タッチスクリーン型ディスプレイ、カード読み取り機、磁気または紙テープ読み取り機、音声または手書き文字認識機、ジョイスティック、またはその他の公のコンピュータ入出力装置のような1つ以上の入出力インターフェイス1205と接続される。最後に、プロセッサ1201は、ネットワークインターフェイス1207を介して有線または無線通信ネットワークに接続される。このようなネットワーク接続を介して前記された方法の手順を遂行する。前記された装置または道具は、コンピュータハードウェアおよびソフトウェア技術分野の当業者に広く知られている。
【0116】
前記されたハードウェア装置は、本発明の動作を遂行するために1つ以上のソフトウェアモジュールとして作動するように構成される。
【0117】
以上のように、本発明は限定された実施例と図面によって説明されているが、本発明は実施例に限定されるものではなく、本発明が属する分野にて通常の知識を有する者であれば、このような記載から多様な修正および変形が可能である。従って、本発明の思想は特許請求の範囲によって解釈されるべきであり、この均等または等価的変形は本発明の思想の範囲に属することは言うまでもない。
【図面の簡単な説明】
【0118】
【図1】本発明による無効クリック検出装置を含むインターネット検索サーバとクライアント端末機とのネットワーク接続を示した図である。
【図2】インターネット検索エンジンサーバによって生成された検索結果ウェブページの一例を示した図である。
【図3】本発明の一実施例による無効クリック検出装置を示したブロック図である。
【図4】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図5】本発明の一実施例によるログファイルの一例を示した図である。
【図6a】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図6b】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図7】本発明の一実施例によるログファイルの一例を示した図である。
【図8】本発明の一実施例によってセッション識別子を生成する方法の順序を示した流れ図である。
【図9】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図10】本発明の一実施例によるログファイルの一例を示した図である。
【図11】本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。
【図12】本発明による検索エンジンサーバおよび無効クリック検出装置を構成するのに採用される汎用コンピュータシステムの内部ブロック図である。
【特許請求の範囲】
【請求項1】
検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、
前記生成されたウェブページに対応するページ識別子を獲得するステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項2】
前記ページ識別子および前記サイト識別子は、チェックサムを含んで構成されることを特徴とする請求項1に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項3】
検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、
前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項4】
前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップは、
前記端末機に前記セッションクッキーファイルが保存されているかを判断するステップと、
前記端末機に前記セッションクッキーファイルが保存されていない場合、新たなセッション識別子を生成し、前記生成されたセッション識別子を含むセッションクッキーファイルを前記端末機に保存するステップと
を含むことを特徴とする請求項3に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項5】
前記端末機に前記セッションクッキーファイルが保存されている場合、前記セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内であるかを判断するステップと、
前記最終更新時間が前記所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得するステップと
をさらに含むことを特徴とする請求項4に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項6】
前記最終更新時間が前記所定時間以内でない場合、新たなセッション識別子を生成して前記セッションクッキーファイルに含まれたセッション識別子を更新するステップと、
前記セッション識別子の更新時間を前記セッションクッキーファイルに保存するステップと
をさらに含むことを特徴とする請求項5に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項7】
前記端末機に前記セッションクッキーファイルが保存されている場合、前記検索者からの前記検索項目に対するクリック時間が前記セッション識別子と関連した最終クリック時間から所定時間以内であるかを判断するステップと、
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得するステップと、
前記最終クリック時間を前記検索項目に対するクリック時間に更新するステップと
を含むことを特徴とする請求項4に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項8】
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内でない場合、新たなセッション識別子を生成して前記セッションクッキーファイルに含まれたセッション識別子を更新するステップと、
前記最終クリック時間を前記検索項目に対するクリック時間に更新するステップと
をさらに含むことを特徴とする請求項7に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項9】
前記セッション識別子および前記サイト識別子は、チェックサムを含んで構成されることを特徴とする請求項3乃至8のいずれか1項に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項10】
検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記検索者の端末機に対応するクライアントIPアドレスを獲得するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項11】
前記サイト識別子は、チェックサムを含んで生成されることを特徴とする請求項10に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項12】
検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、
前記検索者の端末機に対応する端末機識別子を獲得するステップと、
前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者の端末機に保存するようにするステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項13】
前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されているかを判断するステップと、
前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されている場合、前記使用者クッキーファイルから前記端末機識別子を受信するステップと
をさらに含むことを特徴とする請求項12に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項14】
前記端末機識別子および前記サイト識別子は、チェックサムを含んで構成されることを特徴とする請求項12または13に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項15】
請求項1乃至8、請求項10乃至13のいずれか1項の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項16】
検索者がインターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目をクリックした場合、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報を受信し、前記受信した情報に基づき、所定の基準に従って前記クリックの無効可否を判断することを特徴とする無効クリック検出装置。
【請求項17】
インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対する検索者のクリックに応答し、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存するログ保存部と、
前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターンを保存する無効クリックパターン保存部と、
前記ログ保存部に保存された前記ログおよび前記無効クリックパターン保存部に保存された無効クリックパターンに基づき、前記検索者のクリックが無効クリックであるかを判断する無効クリック判断部と
を含むことを特徴とする無効クリック検出装置。
【請求項18】
前記無効と判断されたクリックのうち、所定の基準によるクリックを前記インターネット検索エンジンの管理者に報告する無効クリック報告部をさらに含むことを特徴とする請求項17に記載の無効クリック検出装置。
【請求項19】
前記管理者の入力によって前記無効クリックを有効クリックに変更する無効クリック検証部をさらに含むことを特徴とする請求項18に記載の無効クリック検出装置。
【請求項20】
インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定時間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、
前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、
前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段と
を含むことを特徴とする無効クリック検出装置。
【請求項21】
インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定時間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、
前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、
前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段と
を含むことを特徴とする無効クリック検出装置。
【請求項1】
検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、
前記生成されたウェブページに対応するページ識別子を獲得するステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項2】
前記ページ識別子および前記サイト識別子は、チェックサムを含んで構成されることを特徴とする請求項1に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項3】
検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、
前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項4】
前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップは、
前記端末機に前記セッションクッキーファイルが保存されているかを判断するステップと、
前記端末機に前記セッションクッキーファイルが保存されていない場合、新たなセッション識別子を生成し、前記生成されたセッション識別子を含むセッションクッキーファイルを前記端末機に保存するステップと
を含むことを特徴とする請求項3に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項5】
前記端末機に前記セッションクッキーファイルが保存されている場合、前記セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内であるかを判断するステップと、
前記最終更新時間が前記所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得するステップと
をさらに含むことを特徴とする請求項4に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項6】
前記最終更新時間が前記所定時間以内でない場合、新たなセッション識別子を生成して前記セッションクッキーファイルに含まれたセッション識別子を更新するステップと、
前記セッション識別子の更新時間を前記セッションクッキーファイルに保存するステップと
をさらに含むことを特徴とする請求項5に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項7】
前記端末機に前記セッションクッキーファイルが保存されている場合、前記検索者からの前記検索項目に対するクリック時間が前記セッション識別子と関連した最終クリック時間から所定時間以内であるかを判断するステップと、
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得するステップと、
前記最終クリック時間を前記検索項目に対するクリック時間に更新するステップと
を含むことを特徴とする請求項4に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項8】
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内でない場合、新たなセッション識別子を生成して前記セッションクッキーファイルに含まれたセッション識別子を更新するステップと、
前記最終クリック時間を前記検索項目に対するクリック時間に更新するステップと
をさらに含むことを特徴とする請求項7に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項9】
前記セッション識別子および前記サイト識別子は、チェックサムを含んで構成されることを特徴とする請求項3乃至8のいずれか1項に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項10】
検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記検索者の端末機に対応するクライアントIPアドレスを獲得するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項11】
前記サイト識別子は、チェックサムを含んで生成されることを特徴とする請求項10に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項12】
検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、
前記検索者の端末機に対応する端末機識別子を獲得するステップと、
前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者の端末機に保存するようにするステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。
【請求項13】
前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されているかを判断するステップと、
前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されている場合、前記使用者クッキーファイルから前記端末機識別子を受信するステップと
をさらに含むことを特徴とする請求項12に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項14】
前記端末機識別子および前記サイト識別子は、チェックサムを含んで構成されることを特徴とする請求項12または13に記載のインターネット検索エンジンにおける無効クリック検出方法。
【請求項15】
請求項1乃至8、請求項10乃至13のいずれか1項の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項16】
検索者がインターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目をクリックした場合、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報を受信し、前記受信した情報に基づき、所定の基準に従って前記クリックの無効可否を判断することを特徴とする無効クリック検出装置。
【請求項17】
インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対する検索者のクリックに応答し、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存するログ保存部と、
前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターンを保存する無効クリックパターン保存部と、
前記ログ保存部に保存された前記ログおよび前記無効クリックパターン保存部に保存された無効クリックパターンに基づき、前記検索者のクリックが無効クリックであるかを判断する無効クリック判断部と
を含むことを特徴とする無効クリック検出装置。
【請求項18】
前記無効と判断されたクリックのうち、所定の基準によるクリックを前記インターネット検索エンジンの管理者に報告する無効クリック報告部をさらに含むことを特徴とする請求項17に記載の無効クリック検出装置。
【請求項19】
前記管理者の入力によって前記無効クリックを有効クリックに変更する無効クリック検証部をさらに含むことを特徴とする請求項18に記載の無効クリック検出装置。
【請求項20】
インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定時間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、
前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、
前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段と
を含むことを特徴とする無効クリック検出装置。
【請求項21】
インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定時間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、
前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、
前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段と
を含むことを特徴とする無効クリック検出装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6a】
【図6b】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6a】
【図6b】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公表番号】特表2006−520940(P2006−520940A)
【公表日】平成18年9月14日(2006.9.14)
【国際特許分類】
【出願番号】特願2005−518761(P2005−518761)
【出願日】平成16年2月27日(2004.2.27)
【国際出願番号】PCT/KR2004/000416
【国際公開番号】WO2004/084097
【国際公開日】平成16年9月30日(2004.9.30)
【出願人】(505205812)エヌエイチエヌ コーポレーション (408)
【Fターム(参考)】
【公表日】平成18年9月14日(2006.9.14)
【国際特許分類】
【出願日】平成16年2月27日(2004.2.27)
【国際出願番号】PCT/KR2004/000416
【国際公開番号】WO2004/084097
【国際公開日】平成16年9月30日(2004.9.30)
【出願人】(505205812)エヌエイチエヌ コーポレーション (408)
【Fターム(参考)】
[ Back to top ]