検索結果順位付け方法および検索結果順位付けシステム
【課題】ユーザの嗜好を反映した検索結果順位付けを行う。
【解決手段】検索装置20に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、当該スコアを用いて順位付けを行い、検索結果を当該順位順で表示させる検索結果表示ステップと、を備える。また、評価値を集計するために、検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、ユーザが検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップ(ステップS116)と、ユーザ別再訪数集計ステップにて集計されたユーザ別再訪数を元に、評価値を集計する評価値集計ステップ(ステップS118)と、を更に備える。
【解決手段】検索装置20に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、当該スコアを用いて順位付けを行い、検索結果を当該順位順で表示させる検索結果表示ステップと、を備える。また、評価値を集計するために、検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、ユーザが検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップ(ステップS116)と、ユーザ別再訪数集計ステップにて集計されたユーザ別再訪数を元に、評価値を集計する評価値集計ステップ(ステップS118)と、を更に備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索結果順位付け方法および検索結果順位付けシステムに関するものである。
【背景技術】
【0002】
検索ウェブページに検索結果として表示するURLの表示順の順位付け(ランキング)は、様々な指標を用いスコア化され行われている。その指標としては、ページ内に検索ワードが出現する回数やウェブ空間におけるページ間のリンク関係から算出したスコアなど、ページそのものの持つ特徴を利用するものがよく知られている。また、それ以外の指標として、検索エンジンが出力する検索結果に対するユーザのクリックログ(以下、「検索クリックログ」や「検索ログ情報」とも記す。)を利用することができる。本指標は、検索結果へのユーザフィードバック情報として有益であるが、結果の並び順など検索結果の適合性と直接関係ない要因により影響を受けるので、検索クリックログから検索結果の適合性を表す有効な指標を適切に抽出することが重要である。
【0003】
特許文献1には、検索クリックログを利用して検索結果を改善する技術が開示されている。検索クリックログから抽出できる指標として、検索ページのクリックスルー率(検索結果が表示される回数に対する結果がクリックされる回数の割合)が記されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第6493702号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、検索結果はユーザにより適合性が十分精査されてクリックされているとも限らず、また、上位に表示されるほどクリックされやすい性質があることから、クリックスルー率は検索クエリーに対する適合性を適切に表現する指標として十分でない場合がある。
【0006】
本発明は、このような問題を解決するためになされたものであり、検索クリックログから検索クエリーに対する適合性を表す指標を抽出し、ページの順位付けを適切に行うことができる検索結果順位付け方法および検索結果順位付けシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の検索結果順位付け方法は、検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、を備え、前記評価値を集計するために、前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、を更に備えることを特徴とする。
【0008】
また、本発明の検索結果順位付けシステムは、ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、を備え、前記評価値集計モジュールは、前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、を備えることを特徴とする。
【0009】
また、本発明の検索結果順位付け方法は、検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、を備え、前記評価値を集計するために、前記検索ログ情報をフィルタリングする検索ログ情報フィルタリングステップと、当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、を更に備えることを特徴とする。
【0010】
また、本発明の検索結果順位付けシステムは、ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、を備え、前記評価値集計モジュールは、前記検索ログ情報をフィルタリングする検索ログ情報フィルタリング手段と、当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、を備えることを特徴とする。
【0011】
このような本発明の検索結果順位付け方法および検索結果順位付けシステムによれば、検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、ユーザが検索結果に再訪した回数であるユーザ別再訪数を集計することで、検索結果の中からユーザが満足し、または少なくとも気になって複数回閲覧したページへの再訪数を特定することができる。この方法により集計したユーザ別再訪数および評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0012】
また、本発明において、前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、ことが好ましい。
【0013】
この発明によれば、検索セッションを特定することによりユーザの一連の検索行動を特定できる。また、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0014】
また、本発明において、前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、前記検索セッション特定ステップでは、前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、ことが好ましい。
【0015】
この発明によれば、検索セッションを特定することによりユーザの一連の検索行動を特定できる。また、重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。
【0016】
また、本発明において、前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、且つ前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、ことが好ましい。
【0017】
この発明によれば、検索セッションを特定することによりユーザの一連の検索行動を特定できる。また、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。また、重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。
【0018】
また、本発明において、前記検索ログ情報フィルタリングステップは、前記検索セッション特定ステップによる当該検索セッション特定処理の後に、各検索セッションの間に所定の時間間隔が存在するように、前記検索セッションをフィルタリングする検索セッションフィルタリングステップを更に備える、ことが好ましい。
【0019】
この発明によれば、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動(検索セッション)として特定することができる。なお、「各検索セッションの間」とは、例えば、前の検索セッションの最終レコードのアクセス時刻と、後の検索セッションの先頭レコードのアクセス時刻の間をいう。
【0020】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連の前記レコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、ことが好ましい。
【0021】
この発明によれば、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置に検索語を投入したことを始まりとし、検索装置により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0022】
また、本発明において、前記検索ログ情報フィルタリングステップは、特定のジャンルに属する前記レコードを抽出する第1レコードフィルタリングステップを更に備える、ことが好ましい。
【0023】
この発明によれば、特定のジャンルに属するレコードのみを抽出することにより、後続処理の計算量を抑え、処理の効率を高めることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本発明における評価値を与えることが可能になる。
【0024】
また、本発明において、前記検索ログ情報フィルタリングステップは、前記同一のユーザ識別子および集計キーを持つ前記レコード間の時間間隔が一定以上となるように、前記レコードをフィルタリングする第2レコードフィルタリングステップを更に備える、ことが好ましい。
【0025】
この発明によれば、ユーザの再訪に一定の時間間隔を置くことにより、ユーザ別再訪数集計処理の信頼性を高めることができる。
【0026】
また、本発明において、前記集計キーは、検索語および前記検索結果の属性情報のうち何れか一方または両方である、ことが好ましい。
【0027】
この発明によれば、集計キーとして用いられる情報の具体的な一例が提供される。
【0028】
また、本発明において、前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索語および前記検索結果の前記属性情報をキーに、前記評価値を集計する、ことが好ましい。
【0029】
この発明によれば、ユーザ別再訪数に対して検索語および検索結果の属性情報をキーに集計した評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0030】
また、本発明において、前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索結果の前記属性情報をキーに、前記評価値を集計する、ことが好ましい。
【0031】
この発明によれば、ユーザ別再訪数に対して検索結果の属性情報をキーに集計した評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0032】
また、本発明において、前記評価値集計ステップにおいては、前記キーに対する前記ユーザ別再訪数の平均値を前記評価値として集計する、ことが好ましい。
【0033】
この発明によれば、検索結果への平均再訪数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0034】
また、本発明において、前記評価値集計ステップにおいては、前記検索結果へ再訪した前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0035】
この発明によれば、検索結果へ再訪したユーザの数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0036】
また、本発明において、前記評価値集計ステップにおいては、前記ユーザ別再訪数が一定値以上の場合に、当該集計を行う、ことが好ましい。
【0037】
この発明によれば、集計された評価値の信頼性を高めることができる。
【0038】
また、本発明において、前記評価値集計ステップにおいては、当該集計した前記評価値を前記キーに対するユニークユーザ数で割った値を最終的な評価値として集計する、ことが好ましい。
【0039】
この発明によれば、評価値を0〜1の正規化された値として取得できる。
【発明の効果】
【0040】
本発明によれば、ユーザの嗜好を反映した検索結果順位付けが可能な検索結果順位付け方法および検索結果順位付けシステムを提供することができる。
【図面の簡単な説明】
【0041】
【図1】本発明の実施形態に係る検索結果順位付けシステム1の構成概要図である。
【図2】検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20のハードウェア構成図である。
【図3】検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【図4】図3のステップS130にて蓄積された検索ログ情報の例を示す図である。
【図5】図3のステップS150にて出力される検索結果の例を示す図である。
【図6】図3のステップS170にて蓄積された検索ログ情報の例を示す図である。
【図7】図3のステップS100〜ステップS180の手順を例えば複数回通じて検索ログ情報蓄積部26に蓄積された検索ログ情報の例を示す図である。
【図8】図3のステップS110の評価値集計処理を詳細に示すフローチャートである。
【図9】図8に示した評価値集計処理の手順に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図10】図8のステップS116にて抽出した再訪レコードの例を示す図である。
【図11】図8のステップS118で集計された評価値の一例として、再訪クリック数を示す図である。
【図12】図8のステップS118で集計された評価値の一例として、平均再訪クリック数および再訪ユニックユーザ数を示す図である。
【発明を実施するための形態】
【0042】
以下、添付図面を参照して本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの好適な実施形態を詳細に説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。
【0043】
(検索結果順位付けシステム1の構成)
図1は、本発明の実施形態に係る検索結果順位付けシステム1の構成を示す図である。この検索結果順位付けシステム1は、クライアント端末30からの要求に応じ、検索ウェブページに検索結果として表示されるURLの表示順の順位付けを行うと共に、当該検索結果を検索ウェブページに反映させてクライアント端末30へ出力し表示させる機能を有している。クライアント端末30はWWW(World Wide Web)などの通信ネットワーク40に対し、HTTPなどのプロトコルによりコンテンツリクエストを行い、コンテンツを閲覧することが可能である。図1に示すように、検索結果順位付けシステム1は、評価値集計装置10(特許請求の範囲における「評価値集計モジュール」に相当)および検索装置20を備えて構成されており、クライアント端末30とは通信ネットワーク40を通じて通信可能に接続されている。なお、図1では、評価値集計装置10および検索装置20が別々の装置として図示されているが、これに限られることはなく、評価値集計装置10および検索装置20が一つの装置(図示せず)として構成されていても良い。
【0044】
図2は検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20(または一つの装置になっている場合にはその装置)のハードウェア構成図である。図2に示すように、評価値集計装置10や検索装置20等は、物理的には、CPU、ROM及びRAM等の主記憶装置、キーボード及びマウス等の入力デバイス、ディスプレイ等の出力デバイス、クライアント端末30等の他の装置との間でデータの送受信を行うためのネットワークカード等の通信モジュール、ハードディスク等の補助記憶装置などを含む通常のコンピュータシステムとして構成される。後述する評価値集計装置10や検索装置20等の各機能は、CPU、ROM、RAM等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPUの制御の元で入力デバイス、出力デバイス、通信モジュールを動作させると共に、主記憶装置や補助記憶装置におけるデータの読み出し及び書き込みを行うことで実現される。
【0045】
図1に戻り、評価値集計装置10は、検索装置20の検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)に蓄積された検索ログ情報より評価値を集計するものである。本実施形態における評価値は検索結果の表示順位付け用のスコアを計算する際に利用されるものであり、後述する再訪クリック数を含む。評価値集計装置10は、図1に示すように、検索ログ情報フィルタリング部11(特許請求の範囲における「検索ログ情報フィルタリング手段」に相当)、再訪クリック集計部12(特許請求の範囲における「ユーザ別再訪数集計手段」および「評価値集計手段」に相当)、および集計結果格納部13を備えて構成されている。
【0046】
検索ログ情報フィルタリング部11は、検索ログ情報蓄積部26に蓄積された検索ログ情報をフィルタリングするものであり、検索セッション特定部111を含む。検索セッション特定部111は、ユーザの一連の検索行動を表すものであって、検索装置20の検索ログ情報蓄積部26に蓄積された検索ログ情報(例えば後述する図7を参照)に含まれる複数の検索セッションを特定する機能を有している。この複数の検索セッションは、それぞれ同一のクライアント端末30によってアクセスされた、検索リクエストから検索行動終了までの一連のレコードからなる。具体的には、検索ログ情報をユーザ、時間順にソートした後、同一ユーザ、同一検索クエリーによる検索リクエストや検索結果クリックを示すレコードを抽出することで、検索セッションを特定できる。検索ログ情報フィルタリング部11によるフィルタリング処理の詳細や、検索セッション特定部111による検索セッション特定手順の詳細については後述する。
【0047】
再訪クリック集計部12は、検索ログ情報フィルタリング部11によりフィルタリングされた検索ログ情報を元に、同一のユーザ識別子および集計キー(例えば検索語および検索結果の属性情報のうち何れか一方または両方)が出現した回数に基づき、ユーザが検索語に関連して検索結果に再訪した回数であるユーザ別再訪数を集計し、当該集計したユーザ別再訪数を元に、評価値を集計するものである。具体的には、再訪クリック集計部12は、検索セッション特定部111が特定した各検索セッションを構成するレコードのうち、ユーザが検索結果に複数回アクセスしたことを示すレコードである再訪レコード(以下、「再訪クリック」ともいう。)を抽出し、当該抽出した再訪レコードを元に、評価値を集計する。言い換えれば、再訪クリック集計部12は、各検索セッションから複数回の検索結果クリック(再訪クリック)のみを抽出した後に、URL毎にクリック数やユニークユーザ数を評価値として集計する。集計する評価値の種類については後述する。
【0048】
集計結果格納部13は、再訪クリック集計部12による集計データをスコア計算用データ格納部27に格納する機能を有している。
【0049】
検索装置20は、クライアント端末30から要求される検索クエリーに対して、それに適合するページへのリンク集合を結果として返すものである。検索装置20は、転送部21、検索結果出力部22(特許請求の範囲における「検索結果表示手段」に相当)、検索受付部23、検索ログ情報記録部24、スコア計算部25(特許請求の範囲における「スコア計算手段」に相当)、検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)、およびスコア計算用データ格納部27を備えて構成されている。
【0050】
検索受付部23は、クライアント端末30から要求される検索クエリーを受付け、スコア計算部25に検索クエリーを転送する機能と、クライアント端末30からの受付け情報を検索ログ情報記録部24に転送する機能を有する。
【0051】
スコア計算用データ格納部27は、検索の順位を決めるために用いるスコア計算用データ(評価値)を格納する機能、およびスコア計算部25へ評価値を出力する機能を有している。
【0052】
スコア計算部25は、検索クエリーに対して適合するコンテンツを判定するために、スコア計算用データ格納部27に格納された評価値を利用し、クライアント端末30の検索結果表示用画面(図示せず)に表示される検索結果の表示順の順位付けに用いられるスコアを計算する機能を有している。通常、スコア計算部25は、複数の評価指標を用いて、検索クエリーに対する文書の適合度をスコア化する。本発明の再訪クリック数は評価指標の一つとなるものである。スコア計算部25が行うことのできる簡単なスコア計算例としては、検索クエリーが含まれる文書への再訪クリック数をスコアとして計算することが挙げられる。スコア計算部25は、計算したスコアを検索結果出力部22へ出力する機能を有している。
【0053】
検索結果出力部22は、検索結果に対してスコアを用いて順位付けを行い、且つ検索結果をクライアント端末30の検索結果表示用画面に当該順位順で表示させるものである。すなわち、検索結果出力部22は、クライアント端末30に対してコンテンツ(URL)へのリンク集合を検索結果として出力するときに、スコア計算部25で計算したスコアに基づいて、スコアの高い順にコンテンツを並べて出力する機能を有している。尚、検索結果は、結果ページのURLが直接リンクとして記述されているのでなく、転送部21へのアクセスURLのパラメータとして記述されている。ユーザが結果をクリックすると、一旦、クライアント端末30から転送部21へアクセスが行われる。次に、転送部21はアクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をし、最後に、クライアント端末30は結果ページにアクセスする仕組みとなっている。
【0054】
転送部21は、クライアント端末30からのアクセスがあると、アクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をすると共に、検索ログ情報記録部24に、検索結果クリック情報(ユーザが当該URLへアクセスしたことを表す情報)を出力する機能を有する。
【0055】
検索ログ情報記録部24は、検索受付部23からの検索クエリーや転送部21からの検索結果クリック情報をユーザの検索ログ情報として検索ログ情報蓄積部26に記録する機能を有している。
【0056】
検索ログ情報蓄積部26は、 クライアント端末30による検索クエリーや検索結果へのクリック情報をユーザの検索ログ情報として蓄積している。検索ログ情報蓄積部26に蓄積された検索ログ情報を評価値集計装置10にて解析することにより、本発明における再訪クリック数を集計する。
【0057】
(検索結果順位付けシステム1の動作)
引き続き、図3〜図12を参照して、本発明の実施形態に係る検索結果順位付けシステム1による検索結果順位付け方法について説明する。
【0058】
(全体動作)
まず、検索結果順位付けシステム1による動作の全体的な流れを説明する。図3は、本発明の実施形態に係る検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【0059】
検索結果順位付けシステム1においては、前処理として、検索装置20の検索ログ情報蓄積部26にてあらかじめ収集・蓄積されたユーザの検索ログ情報を評価値集計装置10が取得し(ステップS100)、当該取得した検索ログ情報より評価値を集計後、検索装置20のスコア計算用データ格納部27に当該集計後の評価値を格納している(ステップS110)。評価値集計方法の詳細については、以下のステップS120〜ステップS180に示す検索ログ情報の収集・蓄積方法を述べた後、詳しく説明する。
【0060】
クライアント端末30は、検索装置20に対して検索要求を行う(ステップS120)。検索装置20の検索受付部23では、本検索要求を検索ログ情報記録部24に転送し、検索ログ情報記録部24は検索ログ情報蓄積部26に検索ログ情報として蓄積する(ステップS130)。本蓄積データの例を図4に示す。この例では、ユーザID、タイムスタンプ、種別、検索語、遷移先URLの項目がある。ユーザIDは、ブラウザのクッキー、インターネットプロバイダなどにより検索装置20に通知されるユーザID、検索装置20にアクセスした際に検索装置20により発行されるIDなど、何らかの方法で異なるユーザを識別するものである。タイムスタンプはクライアント端末30より検索装置20にアクセスのあった日付と時刻、種別はクライアント端末30による行動種別、検索語はユーザにより入力され検索装置20に検索要求された語、遷移先URLは検索装置20により出力した検索結果をクリックしてアクセスされたページのURL(ここでは検索要求があっただけなので空欄となっている)をそれぞれ示す。
【0061】
次に、図3に戻り、検索装置20のスコア計算部25では、ステップS120で要求があった検索語とページの適合度をスコアとして算出する(ステップS140、特許請求の範囲における「スコア計算ステップ」に相当)。スコアは、前述したように、クライアント端末30の検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるものである。スコア計算に際しては、本発明における再訪クリック数が利用される(その他の指標も利用可能である)。
【0062】
次に、検索結果出力部22がステップS140にて計算されたスコアを用いて検索結果の順位付けを行い、当該検索結果をクライアント端末30に出力し、クライアント端末30の検索結果表示用画面に当該順位順で当該検索結果を表示させる(ステップS150、特許請求の範囲における「検索結果表示ステップ」に相当)。検索結果の例を図5に示す。各結果(「aa」、「aaa」等)はユーザがクリック可能なリンクとなっている。リンク先のアドレスは検索装置20の転送部21を示しており、パラメータとして検索語や結果ページのURLが含まれる。例えば、転送部21のルートアドレスが「www.docomo.co.jp」で、検索語が「AAA」、結果ページのアドレスが「http://www.AAA.ne.jp/aaa.htm」とすると、「http://www.docomo.co.jp/index.html?word=AAA&result=http://www.AAA.ne.jp/aaa.htm」などと表される。このように、検索語や遷移先アドレスはURLエンコードされる。
【0063】
次に、図3に戻り、ユーザが検索結果をクリックすると、クライアント端末30から検索装置20の転送部21にアクセスが行われ、ユーザが検索結果をクリックしたという情報とともに、上記パラメータとしてURLエンコードされている情報が転送部21から検索ログ情報記録部24に伝えられる(ステップS160)。
【0064】
次に、検索ログ情報記録部24では、このクリック情報を検索ログ情報として収集・蓄積する(ステップS170)。図6には、この時点での検索ログ情報の例を示す。
【0065】
同時に、転送部21では、クライアント端末30に対して結果ページへアクセスするように転送要求を行う(ステップS180)。クライアント端末30では、その指示に従い、結果ページへアクセスする。ユーザは結果ページにアクセスした後、続けて検索結果に戻りその他の結果を閲覧することが可能である。
【0066】
以上で述べたステップS100〜ステップS180の手順により、検索要求から検索結果の閲覧にわたる一連の検索ログ情報が検索ログ情報蓄積部26に残される。収集された検索ログ情報の例を図7に示す。
【0067】
(評価値集計処理の詳細)
引き続き、検索ログ情報蓄積部26に蓄積された検索ログ情報を解析して、再訪クリック数を含む評価値を集計する評価値集計処理(ステップS110)について詳しく述べる。図8は、評価値集計処理のフローチャートである。
【0068】
図8に示すように、最初に、評価値集計装置10の検索ログ情報フィルタリング部11が検索ログ情報蓄積部26より検索ログ情報を取得する(ステップS112)。
【0069】
次に、検索ログ情報フィルタリング部11がステップS112にて取得した検索ログ情報をフィルタリングする(ステップS114、特許請求の範囲における「検索ログ情報フィルタリングステップ」に相当)。
【0070】
具体的には、検索ログ情報フィルタリング部11に属する検索セッション特定部111がステップS112にて取得した検索ログ情報より検索セッションを特定する(特許請求の範囲における「検索セッション特定ステップ」に相当)。検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0071】
すなわち、検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、次に現れた検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図9に示す。なお、図9において検索要求レコードは種別=「検索要求」のレコードであって、上から1番目、4番目等のレコードである。
【0072】
次に、ステップS114にて特定された検索セッションを元に、同一のユーザ識別子(図9の例においては、例えば「ユーザID」)、検索語(図9の例においては、例えば「検索語」)、および検索結果の属性情報(図9の例においては、例えば「遷移先URL」)が出現した回数に基づき、ユーザが検索語に関連して検索結果に再訪した回数であるユーザ別再訪数を集計する(ステップS116、特許請求の範囲における「ユーザ別再訪数集計ステップ」に相当)。具体的には、再訪クリック集計部12が、検索セッション特定部111が特定した各検索セッションを構成するレコードのうち、ユーザが検索結果に複数回アクセスしたことを示すレコードである再訪レコードを抽出し、当該抽出した再訪レコードを元に、ユーザ別再訪数を集計する。
【0073】
最後に、ステップS116にて集計されたユーザ別再訪数を元に、評価値を集計する(ステップS118、特許請求の範囲における「評価値集計ステップ」に相当)。
【0074】
以上で説明した処理の具体例として、図10は、ステップS116にて再訪クリック集計部12が抽出した再訪レコードの例を示す。この例において、ユーザID=1000のユーザは検索語「AAA」でページ「http://www.AAA.ne.jp/aaa.htm」に2回の検索セッションにわたって訪問している。したがって再訪クリック数は1となる。アクセスの全数から1(初回のアクセス)を引いた値である。同様に、ユーザID=1001のユーザは「AAA」でページ「http://www.AAA.ne.jp/aaa.htm」に3回の検索セッションにわたって訪問しており、再訪クリック数は2となる。再訪クリック数の集計結果を図11に示す。
【0075】
また、ステップS118では、ステップS116において集計されたユーザ別再訪数に対して、検索語および検索結果の属性情報の両方または何れか一方をキーに、評価値を集計する。ステップS118で集計される評価値の一つとして、平均再訪クリック数(特許請求の範囲における「ユーザ別再訪数の平均値」に相当)がある。集計された平均再訪クリック数の一例を図12に示す。図12の例示では、図10において、検索語「AAA」に対するページ「http://www.AAA.ne.jp/aaa.htm」の再訪クリック数は1および2であったため、平均再訪クリック数は1.5である。
【0076】
また、ステップS118で行われる動作の一つとして、評価値の一つとして再訪ユニックユーザ数(再訪UU数)が集計される。再訪ユニックユーザ数は、検索結果へ再訪したユーザの数である。再訪ユニックユーザ数は、検索語および検索結果URL毎に集計される。図10において、検索語「AAA」に対してページ「http://www.AAA.ne.jp/aaa.htm」に再訪したユーザは、ID=1000のユーザと、ID=1001のユーザであったため、再訪ユニックユーザ数は2である。再訪ユニックユーザ数の集計結果を図12に示す。
【0077】
また、ステップS118においては、評価値として再訪ユニークユーザ数を集計キーによるユニークユーザ数により割った数としても良い。これにより、評価値を0〜1の正規化された値として取得できる。例えば、図10の例において、検索語と遷移先URLをキーとしたユニークユーザ数は2となる。したがって、再訪ユニークユーザ数をユニークユーザ数で割った値として1.0を得る。
【0078】
以上の方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0079】
以上のように集計した評価値は、集計結果格納部13によりスコア計算用データ格納部27に格納される。なお、ステップS118においては、検索結果への再訪クリック数が一定値以上の場合のみに当該集計処理を行うようにしても良い。これにより、集計された評価値の信頼性を高めることができる。例えば、再訪クリック数を2以上とすると、図11の例において、ユーザID=1000の再訪クリック数は1であるので、集計処理から除外される。したがって、平均再訪クリック数は2となり、再訪ユニックユーザ数は1となり、図12の例示とは異なる集計結果となる。
【0080】
続いて、本実施形態にかかる検索結果順位付けシステム1の作用及び効果について説明する。本実施形態の検索結果順位付けシステム1によれば、検索ログ情報を元に、同一のユーザ識別子および集計キー(例えば検索語および検索結果の属性情報)が出現した回数に基づき、ユーザが検索語に関連して検索結果に再訪した回数であるユーザ別再訪数を集計することで、検索結果の中からユーザが満足し、または少なくとも気になって複数回閲覧したページへの再訪数を特定することができる。この方法により集計したユーザ別再訪数および評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0081】
また、複数の検索セッションにわたり同じ検索語で検索し、同じページに遷移するパターンを抽出することができる。これにより検索語に対して適合度の高いページを特定し、その集計値にて適合の度合いを表現し、検索ランキングに利用することが可能である。
【0082】
また、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置20に検索語を投入したことを始まりとし、検索装置20により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0083】
(変形例)
以上、本発明の好適な実施形態について説明したが、本発明が上記実施形態に限定されないことは言うまでもない。以下に本実施形態の他の態様を例示する。
【0084】
(変形例、その1)
例えば、検索セッションを特定するステップS114では、検索セッションが検索結果にアクセスしたことを示すレコードを一定数以下含むように、検索セッションを特定しても良い。例えば、図9の例示は、検索セッションが「結果クリック」のレコードを2つ以下含むように、検索セッションを特定したとも言える。この場合には、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0085】
(変形例、その2)
また、例えば、検索セッションを特定するステップS114では、例えば検索結果の属性情報などの集計キーが重複するレコードを除外するように、検索セッションを特定しても良い。この場合には、重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。なお、この場合における「検索結果の属性情報」とは、例えば、前述した遷移先URL(検索結果のURL)を含め、遷移先URLの構造から分解された一部分(例えばURLのホスト部やURLからパラメータ部を除いた部分など)や、遷移先URLが属するカテゴリなどが挙げられる。カテゴリの具体的な一例としては、例えばiモード(登録商標)の場合は、URLが属するメニューIDが挙げられる。また、人手で分類された特定のジャンル(検索ポータルのディレクトリ)、またはジャンル判定ソフトにより付与された特定のジャンルが含まれる。
【0086】
(変形例、その3)
また、例えば、検索セッションを特定するステップS114で、上記二つの変形例を併せ持つように、検索セッションを特定しても良い。すなわち、ステップS114で、検索セッションが検索結果にアクセスしたことを示すレコードを一定数以下含むように、且つ例えば検索結果の属性情報などの集計キーが重複するレコードを除外するように、検索セッションを特定しても良い。この場合には、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができ、且つ重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。
【0087】
(変形例、その4)
また、例えば、検索ログ情報をフィルタリングするステップS114が、検索セッション特定処理の後に、各検索セッションの間に所定の時間間隔が存在するように、検索セッションをフィルタリングするステップ(特許請求の範囲における「検索セッションフィルタリングステップ」に相当)更に備えても良い。この場合には、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動(検索セッション)として特定することができる。なお、「各検索セッションの間」とは、例えば、前の検索セッションの最終レコードのアクセス時刻と、後の検索セッションの先頭レコードのアクセス時刻の間をいう。例えば、図9の例示において、各検索セッションの間を例えば10分とした場合には、ID2のセッションとID3のセッションとの間には約6分しか時間間隔がないので、ID3のセッションは図9のテーブルにおいて除外されることとなる。
【0088】
(変形例、その5)
また、例えば、検索ログ情報をフィルタリングするステップS114が、特定のジャンルに属するレコードを抽出するステップ(特許請求の範囲における「第1レコードフィルタリングステップ」に相当)を更に備えても良い。この場合には、特定のジャンルに属するレコードのみを抽出することにより、後続処理の計算量を抑え、処理の効率を高めることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本発明における評価値を与えることが可能になる。なお、ここでいう「特定のジャンル」とは、例えば、検索ソースの種別などが挙げられる。検索結果には、通常の結果に加え、画像、ニュース、ブログなどの複数の情報ソースからの検索結果が並んでいることが多い。クリック順やクリック数に相関のないジャンルを取り除きたい場合やクリックログからの評価値が特に有用なジャンルのみ得たい場合は、特定ジャンルのみの評価値を算出する。ただし、セッション特定にはすべてのクリックログが必要であるので、セッションを特定した後に、該当ジャンルに属する再訪クリックを抽出する。
【0089】
(変形例、その6)
また、例えば、検索ログ情報をフィルタリングするステップS114が、同一のユーザ識別子および集計キーを持つレコード間の時間間隔が一定以上となるように、レコードをフィルタリングするステップ(特許請求の範囲における「第2レコードフィルタリングステップ」に相当)を更に備えても良い。この場合には、ユーザの再訪に一定の時間間隔を置くことにより、ユーザ別再訪数集計処理の信頼性を高めることができる。
【0090】
具体的には、集計の対象となるレコードが、そのレコードより前に同一のユーザID、検索語、遷移先URLを持つレコードのアクセス時刻(タイムスタンプ)から一定時間以上経過しているものとなるように、レコードをフィルタリングする。例えば、20分以上経過していることが集計対象となることの条件であるとすれば、図10の例において、ユーザID=1000のレコードでは、検索セッションID=1、検索語「AAA」、ページ「http://www.AAA.ne.jp/aaa.htm」のレコードから、検索セッションID=2、検索語「AAA」、ページ「http://www.AAA.ne.jp/aaa.htm」のレコードまでの時間間隔が20分以下であるため、後者のレコードは集計対象とならない。
【0091】
(変形例、その7)
また、評価値集計装置10の検索セッション特定部111による検索セッションの特定方法は上記に限られない。例えば、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、始点以降に現れる種別=「検索要求」のレコードであって、その検索語が始点の検索語の部分文字列でないレコード、あるいは始点の検索語がその検索語の部分文字列ではないレコードの一つ前か、あるいは、最終レコードを終点として判断する。
【0092】
すなわち、変形例7における検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、当該始点における検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。
【0093】
(変形例、その8)
また、評価値集計装置10の検索セッション特定部111が、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。
【0094】
(変形例、その9)
また、評価値集計装置10の検索セッション特定部111が、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。ただし、種別=「検索要求」を持つレコードを始点とし、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0095】
すなわち、変形例9における検索セッションは、同一端末による検索行動における一連のレコードであって、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードからなり、且つ検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードのうち何れか(所定時間以上の時間間隔となっているレコードの一つ前か、または検索ログ情報全体における最終のレコード)を終点とする。
【0096】
(変形例、その10)
また、評価値集計装置10の検索セッション特定部111が、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
手順3:手順2にて順次特定された当該検索セッションから検索要求レコードを除外する。
手順4:手順3にて検索要求レコードの除外後の複数の検索セッション間の時間間隔が一定時間以下である場合に、当該複数の検索セッションを一つの検索セッションとして統合する。
【符号の説明】
【0097】
1…検索結果順位付けシステム、10…評価値集計装置、111…検索セッション特定部、12…再訪クリック集計部、13…集計結果格納部、20…検索装置、21…転送部、22…検索結果出力部、23…検索受付部、24…検索ログ情報記録部、25…スコア計算部、26…検索ログ情報蓄積部、27…スコア計算用データ格納部、30…クライアント端末、40…通信ネットワーク。
【技術分野】
【0001】
本発明は、検索結果順位付け方法および検索結果順位付けシステムに関するものである。
【背景技術】
【0002】
検索ウェブページに検索結果として表示するURLの表示順の順位付け(ランキング)は、様々な指標を用いスコア化され行われている。その指標としては、ページ内に検索ワードが出現する回数やウェブ空間におけるページ間のリンク関係から算出したスコアなど、ページそのものの持つ特徴を利用するものがよく知られている。また、それ以外の指標として、検索エンジンが出力する検索結果に対するユーザのクリックログ(以下、「検索クリックログ」や「検索ログ情報」とも記す。)を利用することができる。本指標は、検索結果へのユーザフィードバック情報として有益であるが、結果の並び順など検索結果の適合性と直接関係ない要因により影響を受けるので、検索クリックログから検索結果の適合性を表す有効な指標を適切に抽出することが重要である。
【0003】
特許文献1には、検索クリックログを利用して検索結果を改善する技術が開示されている。検索クリックログから抽出できる指標として、検索ページのクリックスルー率(検索結果が表示される回数に対する結果がクリックされる回数の割合)が記されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第6493702号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、検索結果はユーザにより適合性が十分精査されてクリックされているとも限らず、また、上位に表示されるほどクリックされやすい性質があることから、クリックスルー率は検索クエリーに対する適合性を適切に表現する指標として十分でない場合がある。
【0006】
本発明は、このような問題を解決するためになされたものであり、検索クリックログから検索クエリーに対する適合性を表す指標を抽出し、ページの順位付けを適切に行うことができる検索結果順位付け方法および検索結果順位付けシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の検索結果順位付け方法は、検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、を備え、前記評価値を集計するために、前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、を更に備えることを特徴とする。
【0008】
また、本発明の検索結果順位付けシステムは、ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、を備え、前記評価値集計モジュールは、前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、を備えることを特徴とする。
【0009】
また、本発明の検索結果順位付け方法は、検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、を備え、前記評価値を集計するために、前記検索ログ情報をフィルタリングする検索ログ情報フィルタリングステップと、当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、を更に備えることを特徴とする。
【0010】
また、本発明の検索結果順位付けシステムは、ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、を備え、前記評価値集計モジュールは、前記検索ログ情報をフィルタリングする検索ログ情報フィルタリング手段と、当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、を備えることを特徴とする。
【0011】
このような本発明の検索結果順位付け方法および検索結果順位付けシステムによれば、検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、ユーザが検索結果に再訪した回数であるユーザ別再訪数を集計することで、検索結果の中からユーザが満足し、または少なくとも気になって複数回閲覧したページへの再訪数を特定することができる。この方法により集計したユーザ別再訪数および評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0012】
また、本発明において、前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、ことが好ましい。
【0013】
この発明によれば、検索セッションを特定することによりユーザの一連の検索行動を特定できる。また、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0014】
また、本発明において、前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、前記検索セッション特定ステップでは、前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、ことが好ましい。
【0015】
この発明によれば、検索セッションを特定することによりユーザの一連の検索行動を特定できる。また、重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。
【0016】
また、本発明において、前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、且つ前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、ことが好ましい。
【0017】
この発明によれば、検索セッションを特定することによりユーザの一連の検索行動を特定できる。また、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。また、重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。
【0018】
また、本発明において、前記検索ログ情報フィルタリングステップは、前記検索セッション特定ステップによる当該検索セッション特定処理の後に、各検索セッションの間に所定の時間間隔が存在するように、前記検索セッションをフィルタリングする検索セッションフィルタリングステップを更に備える、ことが好ましい。
【0019】
この発明によれば、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動(検索セッション)として特定することができる。なお、「各検索セッションの間」とは、例えば、前の検索セッションの最終レコードのアクセス時刻と、後の検索セッションの先頭レコードのアクセス時刻の間をいう。
【0020】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連の前記レコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、ことが好ましい。
【0021】
この発明によれば、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置に検索語を投入したことを始まりとし、検索装置により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0022】
また、本発明において、前記検索ログ情報フィルタリングステップは、特定のジャンルに属する前記レコードを抽出する第1レコードフィルタリングステップを更に備える、ことが好ましい。
【0023】
この発明によれば、特定のジャンルに属するレコードのみを抽出することにより、後続処理の計算量を抑え、処理の効率を高めることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本発明における評価値を与えることが可能になる。
【0024】
また、本発明において、前記検索ログ情報フィルタリングステップは、前記同一のユーザ識別子および集計キーを持つ前記レコード間の時間間隔が一定以上となるように、前記レコードをフィルタリングする第2レコードフィルタリングステップを更に備える、ことが好ましい。
【0025】
この発明によれば、ユーザの再訪に一定の時間間隔を置くことにより、ユーザ別再訪数集計処理の信頼性を高めることができる。
【0026】
また、本発明において、前記集計キーは、検索語および前記検索結果の属性情報のうち何れか一方または両方である、ことが好ましい。
【0027】
この発明によれば、集計キーとして用いられる情報の具体的な一例が提供される。
【0028】
また、本発明において、前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索語および前記検索結果の前記属性情報をキーに、前記評価値を集計する、ことが好ましい。
【0029】
この発明によれば、ユーザ別再訪数に対して検索語および検索結果の属性情報をキーに集計した評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0030】
また、本発明において、前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索結果の前記属性情報をキーに、前記評価値を集計する、ことが好ましい。
【0031】
この発明によれば、ユーザ別再訪数に対して検索結果の属性情報をキーに集計した評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0032】
また、本発明において、前記評価値集計ステップにおいては、前記キーに対する前記ユーザ別再訪数の平均値を前記評価値として集計する、ことが好ましい。
【0033】
この発明によれば、検索結果への平均再訪数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0034】
また、本発明において、前記評価値集計ステップにおいては、前記検索結果へ再訪した前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0035】
この発明によれば、検索結果へ再訪したユーザの数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0036】
また、本発明において、前記評価値集計ステップにおいては、前記ユーザ別再訪数が一定値以上の場合に、当該集計を行う、ことが好ましい。
【0037】
この発明によれば、集計された評価値の信頼性を高めることができる。
【0038】
また、本発明において、前記評価値集計ステップにおいては、当該集計した前記評価値を前記キーに対するユニークユーザ数で割った値を最終的な評価値として集計する、ことが好ましい。
【0039】
この発明によれば、評価値を0〜1の正規化された値として取得できる。
【発明の効果】
【0040】
本発明によれば、ユーザの嗜好を反映した検索結果順位付けが可能な検索結果順位付け方法および検索結果順位付けシステムを提供することができる。
【図面の簡単な説明】
【0041】
【図1】本発明の実施形態に係る検索結果順位付けシステム1の構成概要図である。
【図2】検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20のハードウェア構成図である。
【図3】検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【図4】図3のステップS130にて蓄積された検索ログ情報の例を示す図である。
【図5】図3のステップS150にて出力される検索結果の例を示す図である。
【図6】図3のステップS170にて蓄積された検索ログ情報の例を示す図である。
【図7】図3のステップS100〜ステップS180の手順を例えば複数回通じて検索ログ情報蓄積部26に蓄積された検索ログ情報の例を示す図である。
【図8】図3のステップS110の評価値集計処理を詳細に示すフローチャートである。
【図9】図8に示した評価値集計処理の手順に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図10】図8のステップS116にて抽出した再訪レコードの例を示す図である。
【図11】図8のステップS118で集計された評価値の一例として、再訪クリック数を示す図である。
【図12】図8のステップS118で集計された評価値の一例として、平均再訪クリック数および再訪ユニックユーザ数を示す図である。
【発明を実施するための形態】
【0042】
以下、添付図面を参照して本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの好適な実施形態を詳細に説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。
【0043】
(検索結果順位付けシステム1の構成)
図1は、本発明の実施形態に係る検索結果順位付けシステム1の構成を示す図である。この検索結果順位付けシステム1は、クライアント端末30からの要求に応じ、検索ウェブページに検索結果として表示されるURLの表示順の順位付けを行うと共に、当該検索結果を検索ウェブページに反映させてクライアント端末30へ出力し表示させる機能を有している。クライアント端末30はWWW(World Wide Web)などの通信ネットワーク40に対し、HTTPなどのプロトコルによりコンテンツリクエストを行い、コンテンツを閲覧することが可能である。図1に示すように、検索結果順位付けシステム1は、評価値集計装置10(特許請求の範囲における「評価値集計モジュール」に相当)および検索装置20を備えて構成されており、クライアント端末30とは通信ネットワーク40を通じて通信可能に接続されている。なお、図1では、評価値集計装置10および検索装置20が別々の装置として図示されているが、これに限られることはなく、評価値集計装置10および検索装置20が一つの装置(図示せず)として構成されていても良い。
【0044】
図2は検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20(または一つの装置になっている場合にはその装置)のハードウェア構成図である。図2に示すように、評価値集計装置10や検索装置20等は、物理的には、CPU、ROM及びRAM等の主記憶装置、キーボード及びマウス等の入力デバイス、ディスプレイ等の出力デバイス、クライアント端末30等の他の装置との間でデータの送受信を行うためのネットワークカード等の通信モジュール、ハードディスク等の補助記憶装置などを含む通常のコンピュータシステムとして構成される。後述する評価値集計装置10や検索装置20等の各機能は、CPU、ROM、RAM等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPUの制御の元で入力デバイス、出力デバイス、通信モジュールを動作させると共に、主記憶装置や補助記憶装置におけるデータの読み出し及び書き込みを行うことで実現される。
【0045】
図1に戻り、評価値集計装置10は、検索装置20の検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)に蓄積された検索ログ情報より評価値を集計するものである。本実施形態における評価値は検索結果の表示順位付け用のスコアを計算する際に利用されるものであり、後述する再訪クリック数を含む。評価値集計装置10は、図1に示すように、検索ログ情報フィルタリング部11(特許請求の範囲における「検索ログ情報フィルタリング手段」に相当)、再訪クリック集計部12(特許請求の範囲における「ユーザ別再訪数集計手段」および「評価値集計手段」に相当)、および集計結果格納部13を備えて構成されている。
【0046】
検索ログ情報フィルタリング部11は、検索ログ情報蓄積部26に蓄積された検索ログ情報をフィルタリングするものであり、検索セッション特定部111を含む。検索セッション特定部111は、ユーザの一連の検索行動を表すものであって、検索装置20の検索ログ情報蓄積部26に蓄積された検索ログ情報(例えば後述する図7を参照)に含まれる複数の検索セッションを特定する機能を有している。この複数の検索セッションは、それぞれ同一のクライアント端末30によってアクセスされた、検索リクエストから検索行動終了までの一連のレコードからなる。具体的には、検索ログ情報をユーザ、時間順にソートした後、同一ユーザ、同一検索クエリーによる検索リクエストや検索結果クリックを示すレコードを抽出することで、検索セッションを特定できる。検索ログ情報フィルタリング部11によるフィルタリング処理の詳細や、検索セッション特定部111による検索セッション特定手順の詳細については後述する。
【0047】
再訪クリック集計部12は、検索ログ情報フィルタリング部11によりフィルタリングされた検索ログ情報を元に、同一のユーザ識別子および集計キー(例えば検索語および検索結果の属性情報のうち何れか一方または両方)が出現した回数に基づき、ユーザが検索語に関連して検索結果に再訪した回数であるユーザ別再訪数を集計し、当該集計したユーザ別再訪数を元に、評価値を集計するものである。具体的には、再訪クリック集計部12は、検索セッション特定部111が特定した各検索セッションを構成するレコードのうち、ユーザが検索結果に複数回アクセスしたことを示すレコードである再訪レコード(以下、「再訪クリック」ともいう。)を抽出し、当該抽出した再訪レコードを元に、評価値を集計する。言い換えれば、再訪クリック集計部12は、各検索セッションから複数回の検索結果クリック(再訪クリック)のみを抽出した後に、URL毎にクリック数やユニークユーザ数を評価値として集計する。集計する評価値の種類については後述する。
【0048】
集計結果格納部13は、再訪クリック集計部12による集計データをスコア計算用データ格納部27に格納する機能を有している。
【0049】
検索装置20は、クライアント端末30から要求される検索クエリーに対して、それに適合するページへのリンク集合を結果として返すものである。検索装置20は、転送部21、検索結果出力部22(特許請求の範囲における「検索結果表示手段」に相当)、検索受付部23、検索ログ情報記録部24、スコア計算部25(特許請求の範囲における「スコア計算手段」に相当)、検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)、およびスコア計算用データ格納部27を備えて構成されている。
【0050】
検索受付部23は、クライアント端末30から要求される検索クエリーを受付け、スコア計算部25に検索クエリーを転送する機能と、クライアント端末30からの受付け情報を検索ログ情報記録部24に転送する機能を有する。
【0051】
スコア計算用データ格納部27は、検索の順位を決めるために用いるスコア計算用データ(評価値)を格納する機能、およびスコア計算部25へ評価値を出力する機能を有している。
【0052】
スコア計算部25は、検索クエリーに対して適合するコンテンツを判定するために、スコア計算用データ格納部27に格納された評価値を利用し、クライアント端末30の検索結果表示用画面(図示せず)に表示される検索結果の表示順の順位付けに用いられるスコアを計算する機能を有している。通常、スコア計算部25は、複数の評価指標を用いて、検索クエリーに対する文書の適合度をスコア化する。本発明の再訪クリック数は評価指標の一つとなるものである。スコア計算部25が行うことのできる簡単なスコア計算例としては、検索クエリーが含まれる文書への再訪クリック数をスコアとして計算することが挙げられる。スコア計算部25は、計算したスコアを検索結果出力部22へ出力する機能を有している。
【0053】
検索結果出力部22は、検索結果に対してスコアを用いて順位付けを行い、且つ検索結果をクライアント端末30の検索結果表示用画面に当該順位順で表示させるものである。すなわち、検索結果出力部22は、クライアント端末30に対してコンテンツ(URL)へのリンク集合を検索結果として出力するときに、スコア計算部25で計算したスコアに基づいて、スコアの高い順にコンテンツを並べて出力する機能を有している。尚、検索結果は、結果ページのURLが直接リンクとして記述されているのでなく、転送部21へのアクセスURLのパラメータとして記述されている。ユーザが結果をクリックすると、一旦、クライアント端末30から転送部21へアクセスが行われる。次に、転送部21はアクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をし、最後に、クライアント端末30は結果ページにアクセスする仕組みとなっている。
【0054】
転送部21は、クライアント端末30からのアクセスがあると、アクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をすると共に、検索ログ情報記録部24に、検索結果クリック情報(ユーザが当該URLへアクセスしたことを表す情報)を出力する機能を有する。
【0055】
検索ログ情報記録部24は、検索受付部23からの検索クエリーや転送部21からの検索結果クリック情報をユーザの検索ログ情報として検索ログ情報蓄積部26に記録する機能を有している。
【0056】
検索ログ情報蓄積部26は、 クライアント端末30による検索クエリーや検索結果へのクリック情報をユーザの検索ログ情報として蓄積している。検索ログ情報蓄積部26に蓄積された検索ログ情報を評価値集計装置10にて解析することにより、本発明における再訪クリック数を集計する。
【0057】
(検索結果順位付けシステム1の動作)
引き続き、図3〜図12を参照して、本発明の実施形態に係る検索結果順位付けシステム1による検索結果順位付け方法について説明する。
【0058】
(全体動作)
まず、検索結果順位付けシステム1による動作の全体的な流れを説明する。図3は、本発明の実施形態に係る検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【0059】
検索結果順位付けシステム1においては、前処理として、検索装置20の検索ログ情報蓄積部26にてあらかじめ収集・蓄積されたユーザの検索ログ情報を評価値集計装置10が取得し(ステップS100)、当該取得した検索ログ情報より評価値を集計後、検索装置20のスコア計算用データ格納部27に当該集計後の評価値を格納している(ステップS110)。評価値集計方法の詳細については、以下のステップS120〜ステップS180に示す検索ログ情報の収集・蓄積方法を述べた後、詳しく説明する。
【0060】
クライアント端末30は、検索装置20に対して検索要求を行う(ステップS120)。検索装置20の検索受付部23では、本検索要求を検索ログ情報記録部24に転送し、検索ログ情報記録部24は検索ログ情報蓄積部26に検索ログ情報として蓄積する(ステップS130)。本蓄積データの例を図4に示す。この例では、ユーザID、タイムスタンプ、種別、検索語、遷移先URLの項目がある。ユーザIDは、ブラウザのクッキー、インターネットプロバイダなどにより検索装置20に通知されるユーザID、検索装置20にアクセスした際に検索装置20により発行されるIDなど、何らかの方法で異なるユーザを識別するものである。タイムスタンプはクライアント端末30より検索装置20にアクセスのあった日付と時刻、種別はクライアント端末30による行動種別、検索語はユーザにより入力され検索装置20に検索要求された語、遷移先URLは検索装置20により出力した検索結果をクリックしてアクセスされたページのURL(ここでは検索要求があっただけなので空欄となっている)をそれぞれ示す。
【0061】
次に、図3に戻り、検索装置20のスコア計算部25では、ステップS120で要求があった検索語とページの適合度をスコアとして算出する(ステップS140、特許請求の範囲における「スコア計算ステップ」に相当)。スコアは、前述したように、クライアント端末30の検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるものである。スコア計算に際しては、本発明における再訪クリック数が利用される(その他の指標も利用可能である)。
【0062】
次に、検索結果出力部22がステップS140にて計算されたスコアを用いて検索結果の順位付けを行い、当該検索結果をクライアント端末30に出力し、クライアント端末30の検索結果表示用画面に当該順位順で当該検索結果を表示させる(ステップS150、特許請求の範囲における「検索結果表示ステップ」に相当)。検索結果の例を図5に示す。各結果(「aa」、「aaa」等)はユーザがクリック可能なリンクとなっている。リンク先のアドレスは検索装置20の転送部21を示しており、パラメータとして検索語や結果ページのURLが含まれる。例えば、転送部21のルートアドレスが「www.docomo.co.jp」で、検索語が「AAA」、結果ページのアドレスが「http://www.AAA.ne.jp/aaa.htm」とすると、「http://www.docomo.co.jp/index.html?word=AAA&result=http://www.AAA.ne.jp/aaa.htm」などと表される。このように、検索語や遷移先アドレスはURLエンコードされる。
【0063】
次に、図3に戻り、ユーザが検索結果をクリックすると、クライアント端末30から検索装置20の転送部21にアクセスが行われ、ユーザが検索結果をクリックしたという情報とともに、上記パラメータとしてURLエンコードされている情報が転送部21から検索ログ情報記録部24に伝えられる(ステップS160)。
【0064】
次に、検索ログ情報記録部24では、このクリック情報を検索ログ情報として収集・蓄積する(ステップS170)。図6には、この時点での検索ログ情報の例を示す。
【0065】
同時に、転送部21では、クライアント端末30に対して結果ページへアクセスするように転送要求を行う(ステップS180)。クライアント端末30では、その指示に従い、結果ページへアクセスする。ユーザは結果ページにアクセスした後、続けて検索結果に戻りその他の結果を閲覧することが可能である。
【0066】
以上で述べたステップS100〜ステップS180の手順により、検索要求から検索結果の閲覧にわたる一連の検索ログ情報が検索ログ情報蓄積部26に残される。収集された検索ログ情報の例を図7に示す。
【0067】
(評価値集計処理の詳細)
引き続き、検索ログ情報蓄積部26に蓄積された検索ログ情報を解析して、再訪クリック数を含む評価値を集計する評価値集計処理(ステップS110)について詳しく述べる。図8は、評価値集計処理のフローチャートである。
【0068】
図8に示すように、最初に、評価値集計装置10の検索ログ情報フィルタリング部11が検索ログ情報蓄積部26より検索ログ情報を取得する(ステップS112)。
【0069】
次に、検索ログ情報フィルタリング部11がステップS112にて取得した検索ログ情報をフィルタリングする(ステップS114、特許請求の範囲における「検索ログ情報フィルタリングステップ」に相当)。
【0070】
具体的には、検索ログ情報フィルタリング部11に属する検索セッション特定部111がステップS112にて取得した検索ログ情報より検索セッションを特定する(特許請求の範囲における「検索セッション特定ステップ」に相当)。検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0071】
すなわち、検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、次に現れた検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図9に示す。なお、図9において検索要求レコードは種別=「検索要求」のレコードであって、上から1番目、4番目等のレコードである。
【0072】
次に、ステップS114にて特定された検索セッションを元に、同一のユーザ識別子(図9の例においては、例えば「ユーザID」)、検索語(図9の例においては、例えば「検索語」)、および検索結果の属性情報(図9の例においては、例えば「遷移先URL」)が出現した回数に基づき、ユーザが検索語に関連して検索結果に再訪した回数であるユーザ別再訪数を集計する(ステップS116、特許請求の範囲における「ユーザ別再訪数集計ステップ」に相当)。具体的には、再訪クリック集計部12が、検索セッション特定部111が特定した各検索セッションを構成するレコードのうち、ユーザが検索結果に複数回アクセスしたことを示すレコードである再訪レコードを抽出し、当該抽出した再訪レコードを元に、ユーザ別再訪数を集計する。
【0073】
最後に、ステップS116にて集計されたユーザ別再訪数を元に、評価値を集計する(ステップS118、特許請求の範囲における「評価値集計ステップ」に相当)。
【0074】
以上で説明した処理の具体例として、図10は、ステップS116にて再訪クリック集計部12が抽出した再訪レコードの例を示す。この例において、ユーザID=1000のユーザは検索語「AAA」でページ「http://www.AAA.ne.jp/aaa.htm」に2回の検索セッションにわたって訪問している。したがって再訪クリック数は1となる。アクセスの全数から1(初回のアクセス)を引いた値である。同様に、ユーザID=1001のユーザは「AAA」でページ「http://www.AAA.ne.jp/aaa.htm」に3回の検索セッションにわたって訪問しており、再訪クリック数は2となる。再訪クリック数の集計結果を図11に示す。
【0075】
また、ステップS118では、ステップS116において集計されたユーザ別再訪数に対して、検索語および検索結果の属性情報の両方または何れか一方をキーに、評価値を集計する。ステップS118で集計される評価値の一つとして、平均再訪クリック数(特許請求の範囲における「ユーザ別再訪数の平均値」に相当)がある。集計された平均再訪クリック数の一例を図12に示す。図12の例示では、図10において、検索語「AAA」に対するページ「http://www.AAA.ne.jp/aaa.htm」の再訪クリック数は1および2であったため、平均再訪クリック数は1.5である。
【0076】
また、ステップS118で行われる動作の一つとして、評価値の一つとして再訪ユニックユーザ数(再訪UU数)が集計される。再訪ユニックユーザ数は、検索結果へ再訪したユーザの数である。再訪ユニックユーザ数は、検索語および検索結果URL毎に集計される。図10において、検索語「AAA」に対してページ「http://www.AAA.ne.jp/aaa.htm」に再訪したユーザは、ID=1000のユーザと、ID=1001のユーザであったため、再訪ユニックユーザ数は2である。再訪ユニックユーザ数の集計結果を図12に示す。
【0077】
また、ステップS118においては、評価値として再訪ユニークユーザ数を集計キーによるユニークユーザ数により割った数としても良い。これにより、評価値を0〜1の正規化された値として取得できる。例えば、図10の例において、検索語と遷移先URLをキーとしたユニークユーザ数は2となる。したがって、再訪ユニークユーザ数をユニークユーザ数で割った値として1.0を得る。
【0078】
以上の方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0079】
以上のように集計した評価値は、集計結果格納部13によりスコア計算用データ格納部27に格納される。なお、ステップS118においては、検索結果への再訪クリック数が一定値以上の場合のみに当該集計処理を行うようにしても良い。これにより、集計された評価値の信頼性を高めることができる。例えば、再訪クリック数を2以上とすると、図11の例において、ユーザID=1000の再訪クリック数は1であるので、集計処理から除外される。したがって、平均再訪クリック数は2となり、再訪ユニックユーザ数は1となり、図12の例示とは異なる集計結果となる。
【0080】
続いて、本実施形態にかかる検索結果順位付けシステム1の作用及び効果について説明する。本実施形態の検索結果順位付けシステム1によれば、検索ログ情報を元に、同一のユーザ識別子および集計キー(例えば検索語および検索結果の属性情報)が出現した回数に基づき、ユーザが検索語に関連して検索結果に再訪した回数であるユーザ別再訪数を集計することで、検索結果の中からユーザが満足し、または少なくとも気になって複数回閲覧したページへの再訪数を特定することができる。この方法により集計したユーザ別再訪数および評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0081】
また、複数の検索セッションにわたり同じ検索語で検索し、同じページに遷移するパターンを抽出することができる。これにより検索語に対して適合度の高いページを特定し、その集計値にて適合の度合いを表現し、検索ランキングに利用することが可能である。
【0082】
また、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置20に検索語を投入したことを始まりとし、検索装置20により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0083】
(変形例)
以上、本発明の好適な実施形態について説明したが、本発明が上記実施形態に限定されないことは言うまでもない。以下に本実施形態の他の態様を例示する。
【0084】
(変形例、その1)
例えば、検索セッションを特定するステップS114では、検索セッションが検索結果にアクセスしたことを示すレコードを一定数以下含むように、検索セッションを特定しても良い。例えば、図9の例示は、検索セッションが「結果クリック」のレコードを2つ以下含むように、検索セッションを特定したとも言える。この場合には、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0085】
(変形例、その2)
また、例えば、検索セッションを特定するステップS114では、例えば検索結果の属性情報などの集計キーが重複するレコードを除外するように、検索セッションを特定しても良い。この場合には、重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。なお、この場合における「検索結果の属性情報」とは、例えば、前述した遷移先URL(検索結果のURL)を含め、遷移先URLの構造から分解された一部分(例えばURLのホスト部やURLからパラメータ部を除いた部分など)や、遷移先URLが属するカテゴリなどが挙げられる。カテゴリの具体的な一例としては、例えばiモード(登録商標)の場合は、URLが属するメニューIDが挙げられる。また、人手で分類された特定のジャンル(検索ポータルのディレクトリ)、またはジャンル判定ソフトにより付与された特定のジャンルが含まれる。
【0086】
(変形例、その3)
また、例えば、検索セッションを特定するステップS114で、上記二つの変形例を併せ持つように、検索セッションを特定しても良い。すなわち、ステップS114で、検索セッションが検索結果にアクセスしたことを示すレコードを一定数以下含むように、且つ例えば検索結果の属性情報などの集計キーが重複するレコードを除外するように、検索セッションを特定しても良い。この場合には、検索セッションに含まれるレコードの数を一定数以下に制限することで、検索結果に数多くアクセスしている例外的な検索行動を除外することができ、且つ重複データの除外により、後続処理の計算量を抑え、処理の効率を高めることができる。
【0087】
(変形例、その4)
また、例えば、検索ログ情報をフィルタリングするステップS114が、検索セッション特定処理の後に、各検索セッションの間に所定の時間間隔が存在するように、検索セッションをフィルタリングするステップ(特許請求の範囲における「検索セッションフィルタリングステップ」に相当)更に備えても良い。この場合には、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動(検索セッション)として特定することができる。なお、「各検索セッションの間」とは、例えば、前の検索セッションの最終レコードのアクセス時刻と、後の検索セッションの先頭レコードのアクセス時刻の間をいう。例えば、図9の例示において、各検索セッションの間を例えば10分とした場合には、ID2のセッションとID3のセッションとの間には約6分しか時間間隔がないので、ID3のセッションは図9のテーブルにおいて除外されることとなる。
【0088】
(変形例、その5)
また、例えば、検索ログ情報をフィルタリングするステップS114が、特定のジャンルに属するレコードを抽出するステップ(特許請求の範囲における「第1レコードフィルタリングステップ」に相当)を更に備えても良い。この場合には、特定のジャンルに属するレコードのみを抽出することにより、後続処理の計算量を抑え、処理の効率を高めることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本発明における評価値を与えることが可能になる。なお、ここでいう「特定のジャンル」とは、例えば、検索ソースの種別などが挙げられる。検索結果には、通常の結果に加え、画像、ニュース、ブログなどの複数の情報ソースからの検索結果が並んでいることが多い。クリック順やクリック数に相関のないジャンルを取り除きたい場合やクリックログからの評価値が特に有用なジャンルのみ得たい場合は、特定ジャンルのみの評価値を算出する。ただし、セッション特定にはすべてのクリックログが必要であるので、セッションを特定した後に、該当ジャンルに属する再訪クリックを抽出する。
【0089】
(変形例、その6)
また、例えば、検索ログ情報をフィルタリングするステップS114が、同一のユーザ識別子および集計キーを持つレコード間の時間間隔が一定以上となるように、レコードをフィルタリングするステップ(特許請求の範囲における「第2レコードフィルタリングステップ」に相当)を更に備えても良い。この場合には、ユーザの再訪に一定の時間間隔を置くことにより、ユーザ別再訪数集計処理の信頼性を高めることができる。
【0090】
具体的には、集計の対象となるレコードが、そのレコードより前に同一のユーザID、検索語、遷移先URLを持つレコードのアクセス時刻(タイムスタンプ)から一定時間以上経過しているものとなるように、レコードをフィルタリングする。例えば、20分以上経過していることが集計対象となることの条件であるとすれば、図10の例において、ユーザID=1000のレコードでは、検索セッションID=1、検索語「AAA」、ページ「http://www.AAA.ne.jp/aaa.htm」のレコードから、検索セッションID=2、検索語「AAA」、ページ「http://www.AAA.ne.jp/aaa.htm」のレコードまでの時間間隔が20分以下であるため、後者のレコードは集計対象とならない。
【0091】
(変形例、その7)
また、評価値集計装置10の検索セッション特定部111による検索セッションの特定方法は上記に限られない。例えば、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、始点以降に現れる種別=「検索要求」のレコードであって、その検索語が始点の検索語の部分文字列でないレコード、あるいは始点の検索語がその検索語の部分文字列ではないレコードの一つ前か、あるいは、最終レコードを終点として判断する。
【0092】
すなわち、変形例7における検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、当該始点における検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。
【0093】
(変形例、その8)
また、評価値集計装置10の検索セッション特定部111が、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。
【0094】
(変形例、その9)
また、評価値集計装置10の検索セッション特定部111が、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。ただし、種別=「検索要求」を持つレコードを始点とし、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0095】
すなわち、変形例9における検索セッションは、同一端末による検索行動における一連のレコードであって、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードからなり、且つ検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードのうち何れか(所定時間以上の時間間隔となっているレコードの一つ前か、または検索ログ情報全体における最終のレコード)を終点とする。
【0096】
(変形例、その10)
また、評価値集計装置10の検索セッション特定部111が、以下の手順により、検索セッションを特定することができる。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
手順3:手順2にて順次特定された当該検索セッションから検索要求レコードを除外する。
手順4:手順3にて検索要求レコードの除外後の複数の検索セッション間の時間間隔が一定時間以下である場合に、当該複数の検索セッションを一つの検索セッションとして統合する。
【符号の説明】
【0097】
1…検索結果順位付けシステム、10…評価値集計装置、111…検索セッション特定部、12…再訪クリック集計部、13…集計結果格納部、20…検索装置、21…転送部、22…検索結果出力部、23…検索受付部、24…検索ログ情報記録部、25…スコア計算部、26…検索ログ情報蓄積部、27…スコア計算用データ格納部、30…クライアント端末、40…通信ネットワーク。
【特許請求の範囲】
【請求項1】
検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、
を備え、
前記評価値を集計するために、
前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、
前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、
を更に備えることを特徴とする検索結果順位付け方法。
【請求項2】
検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、
を備え、
前記評価値を集計するために、
前記検索ログ情報をフィルタリングする検索ログ情報フィルタリングステップと、
当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、
前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、
を更に備えることを特徴とする検索結果順位付け方法。
【請求項3】
前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、
前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、
ことを特徴する、請求項2に記載の検索結果順位付け方法。
【請求項4】
前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、
前記検索セッション特定ステップでは、前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、
ことを特徴する、請求項2に記載の検索結果順位付け方法。
【請求項5】
前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、
前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、且つ前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、
ことを特徴する、請求項2に記載の検索結果順位付け方法。
【請求項6】
前記検索ログ情報フィルタリングステップは、
前記検索セッション特定ステップによる当該検索セッション特定処理の後に、各検索セッションの間に所定の時間間隔が存在するように、前記検索セッションをフィルタリングする検索セッションフィルタリングステップを更に備える、
ことを特徴とする、請求項2〜5の何れか1項に記載の検索結果順位付け方法。
【請求項7】
前記検索セッションは、
同一端末による前記検索行動における一連の前記レコードであって、
前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、
次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、
ことを特徴とする、請求項3〜6の何れか1項に記載の検索結果順位付け方法。
【請求項8】
前記検索ログ情報フィルタリングステップは、
特定のジャンルに属する前記レコードを抽出する第1レコードフィルタリングステップを更に備える、
ことを特徴とする、請求項2〜7の何れか1項に記載の検索結果順位付け方法。
【請求項9】
前記検索ログ情報フィルタリングステップは、
前記同一のユーザ識別子および集計キーを持つ前記レコード間の時間間隔が一定以上となるように、前記レコードをフィルタリングする第2レコードフィルタリングステップを更に備える、
ことを特徴とする、請求項2〜8の何れか1項に記載の検索結果順位付け方法。
【請求項10】
前記集計キーは、検索語および前記検索結果の属性情報のうち何れか一方または両方である、
ことを特徴とする、請求項1〜9の何れか1項に記載の検索結果順位付け方法。
【請求項11】
前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索語および前記検索結果の前記属性情報をキーに、前記評価値を集計する、
ことを特徴とする請求項10に記載の検索結果順位付け方法。
【請求項12】
前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索結果の前記属性情報をキーに、前記評価値を集計する、
ことを特徴とする請求項10に記載の検索結果順位付け方法。
【請求項13】
前記評価値集計ステップにおいては、前記キーに対する前記ユーザ別再訪数の平均値を前記評価値として集計する、
ことを特徴とする請求項11または12に記載の検索結果順位付け方法。
【請求項14】
前記評価値集計ステップにおいては、前記検索結果へ再訪した前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜13の何れか1項に記載の検索結果順位付け方法。
【請求項15】
前記評価値集計ステップにおいては、前記ユーザ別再訪数が一定値以上の場合に、当該集計を行うことを特徴とする請求項1〜14の何れか1項に記載の検索結果順位付け方法。
【請求項16】
前記評価値集計ステップにおいては、当該集計した前記評価値を前記キーに対するユニークユーザ数で割った値を最終的な評価値として集計することを特徴とする請求項14〜15の何れか1項に記載の検索結果順位付け方法。
【請求項17】
ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、
前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、
前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、
を備え、
前記評価値集計モジュールは、
前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、
前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、
を備えることを特徴とする検索結果順位付けシステム。
【請求項18】
ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、
前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、
前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、
を備え、
前記評価値集計モジュールは、
前記検索ログ情報をフィルタリングする検索ログ情報フィルタリング手段と、
当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、
前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、
を備えることを特徴とする検索結果順位付けシステム。
【請求項1】
検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、
を備え、
前記評価値を集計するために、
前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、
前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、
を更に備えることを特徴とする検索結果順位付け方法。
【請求項2】
検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、
を備え、
前記評価値を集計するために、
前記検索ログ情報をフィルタリングする検索ログ情報フィルタリングステップと、
当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計ステップと、
前記ユーザ別再訪数集計ステップにて集計された前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計ステップと、
を更に備えることを特徴とする検索結果順位付け方法。
【請求項3】
前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、
前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、
ことを特徴する、請求項2に記載の検索結果順位付け方法。
【請求項4】
前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、
前記検索セッション特定ステップでは、前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、
ことを特徴する、請求項2に記載の検索結果順位付け方法。
【請求項5】
前記検索ログ情報フィルタリングステップが、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップを含み、
前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、且つ前記集計キーが重複するレコードを除外するように、前記検索セッションを特定する、
ことを特徴する、請求項2に記載の検索結果順位付け方法。
【請求項6】
前記検索ログ情報フィルタリングステップは、
前記検索セッション特定ステップによる当該検索セッション特定処理の後に、各検索セッションの間に所定の時間間隔が存在するように、前記検索セッションをフィルタリングする検索セッションフィルタリングステップを更に備える、
ことを特徴とする、請求項2〜5の何れか1項に記載の検索結果順位付け方法。
【請求項7】
前記検索セッションは、
同一端末による前記検索行動における一連の前記レコードであって、
前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、
次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、
ことを特徴とする、請求項3〜6の何れか1項に記載の検索結果順位付け方法。
【請求項8】
前記検索ログ情報フィルタリングステップは、
特定のジャンルに属する前記レコードを抽出する第1レコードフィルタリングステップを更に備える、
ことを特徴とする、請求項2〜7の何れか1項に記載の検索結果順位付け方法。
【請求項9】
前記検索ログ情報フィルタリングステップは、
前記同一のユーザ識別子および集計キーを持つ前記レコード間の時間間隔が一定以上となるように、前記レコードをフィルタリングする第2レコードフィルタリングステップを更に備える、
ことを特徴とする、請求項2〜8の何れか1項に記載の検索結果順位付け方法。
【請求項10】
前記集計キーは、検索語および前記検索結果の属性情報のうち何れか一方または両方である、
ことを特徴とする、請求項1〜9の何れか1項に記載の検索結果順位付け方法。
【請求項11】
前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索語および前記検索結果の前記属性情報をキーに、前記評価値を集計する、
ことを特徴とする請求項10に記載の検索結果順位付け方法。
【請求項12】
前記評価値集計ステップにおいては、前記ユーザ別再訪数集計ステップにおいて集計された前記ユーザ別再訪数に対して、前記検索結果の前記属性情報をキーに、前記評価値を集計する、
ことを特徴とする請求項10に記載の検索結果順位付け方法。
【請求項13】
前記評価値集計ステップにおいては、前記キーに対する前記ユーザ別再訪数の平均値を前記評価値として集計する、
ことを特徴とする請求項11または12に記載の検索結果順位付け方法。
【請求項14】
前記評価値集計ステップにおいては、前記検索結果へ再訪した前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜13の何れか1項に記載の検索結果順位付け方法。
【請求項15】
前記評価値集計ステップにおいては、前記ユーザ別再訪数が一定値以上の場合に、当該集計を行うことを特徴とする請求項1〜14の何れか1項に記載の検索結果順位付け方法。
【請求項16】
前記評価値集計ステップにおいては、当該集計した前記評価値を前記キーに対するユニークユーザ数で割った値を最終的な評価値として集計することを特徴とする請求項14〜15の何れか1項に記載の検索結果順位付け方法。
【請求項17】
ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、
前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、
前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、
を備え、
前記評価値集計モジュールは、
前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、
前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、
を備えることを特徴とする検索結果順位付けシステム。
【請求項18】
ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、
前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、
前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、
を備え、
前記評価値集計モジュールは、
前記検索ログ情報をフィルタリングする検索ログ情報フィルタリング手段と、
当該フィルタリングされた前記検索ログ情報を元に、同一のユーザ識別子および集計キーが出現した回数に基づき、前記ユーザが前記検索結果に再訪した回数であるユーザ別再訪数を集計するユーザ別再訪数集計手段と、
前記ユーザ別再訪数集計手段が集計した前記ユーザ別再訪数を元に、前記評価値を集計する評価値集計手段と、
を備えることを特徴とする検索結果順位付けシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−154466(P2011−154466A)
【公開日】平成23年8月11日(2011.8.11)
【国際特許分類】
【出願番号】特願2010−14577(P2010−14577)
【出願日】平成22年1月26日(2010.1.26)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【出願人】(504126835)エヌ・ティ・ティ レゾナント株式会社 (60)
【Fターム(参考)】
【公開日】平成23年8月11日(2011.8.11)
【国際特許分類】
【出願日】平成22年1月26日(2010.1.26)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【出願人】(504126835)エヌ・ティ・ティ レゾナント株式会社 (60)
【Fターム(参考)】
[ Back to top ]