検索結果順位付け方法および検索結果順位付けシステム
【課題】ユーザの嗜好を反映した検索結果順位付けを行う。
【解決手段】検索装置20に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、当該スコアを用いて順位付けを行い、検索結果を当該順位順で表示させる検索結果表示ステップと、を備える。また、評価値を集計するために、検索ログ情報より、ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップ(ステップS114)と、検索セッション特定ステップにて特定された検索セッションを構成するレコードのうち最終レコードを抽出する最終レコード抽出ステップ(ステップS116)と、最終レコード抽出ステップにて抽出された最終レコードを元に、評価値を集計する評価値集計ステップ(ステップS118)と、を更に備える。
【解決手段】検索装置20に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、当該スコアを用いて順位付けを行い、検索結果を当該順位順で表示させる検索結果表示ステップと、を備える。また、評価値を集計するために、検索ログ情報より、ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップ(ステップS114)と、検索セッション特定ステップにて特定された検索セッションを構成するレコードのうち最終レコードを抽出する最終レコード抽出ステップ(ステップS116)と、最終レコード抽出ステップにて抽出された最終レコードを元に、評価値を集計する評価値集計ステップ(ステップS118)と、を更に備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索結果順位付け方法および検索結果順位付けシステムに関するものである。
【背景技術】
【0002】
検索ウェブページに検索結果として表示するURLの表示順の順位付け(ランキング)は、様々な指標を用いスコア化され行われている。その指標としては、ページ内に検索ワードが出現する回数やウェブ空間におけるページ間のリンク関係から算出したスコアなど、ページそのものの持つ特徴を利用するものがよく知られている。また、それ以外の指標として、検索エンジンが出力する検索結果に対するユーザのクリックログ(以下、「検索クリックログ」や「検索ログ情報」とも記す。)を利用することができる。本指標は、検索結果へのユーザフィードバック情報として有益であるが、結果の並び順など検索結果の適合性と直接関係ない要因により影響を受けるので、検索クリックログから検索結果の適合性を表す有効な指標を適切に抽出することが重要である。
【0003】
特許文献1には、検索クリックログを利用して検索結果を改善する技術が開示されている。検索クリックログから抽出できる指標として、検索ページのクリックスルー率(検索結果が表示される回数に対する結果がクリックされる回数の割合)が記されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第6493702号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、検索結果はユーザにより適合性が十分精査されてクリックされているとも限らず、また、上位に表示されるほどクリックされやすい性質があることから、クリックスルー率は検索クエリーに対する適合性を適切に表現する指標として十分でない場合がある。
【0006】
本発明は、このような問題を解決するためになされたものであり、検索クリックログから検索クエリーに対する適合性を表す指標を抽出し、ページの順位付けを適切に行うことができる検索結果順位付け方法および検索結果順位付けシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の検索結果順位付け方法は、検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、を備え、前記評価値を集計するために、前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップと、前記検索セッション特定ステップにて特定された前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出ステップと、前記最終レコード抽出ステップにて抽出された前記最終レコードを元に、前記評価値を集計する評価値集計ステップと、を更に備えることを特徴とする。
【0008】
また、本発明の検索結果順位付けシステムは、ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、を備え、前記評価値集計モジュールは、前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定手段と、前記検索セッション特定手段が特定した前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出手段と、前記最終レコード抽出手段が抽出した前記最終レコードを元に、前記評価値を集計する評価値集計手段と、を備えることを特徴とする。
【0009】
このような本発明の検索結果順位付け方法および検索結果順位付けシステムによれば、ユーザの一連の検索行動を示す検索セッションにおける最後のレコードを抽出することで、検索結果の中からユーザが満足したページ(ユーザが満足したため検索行動を終了したページ)を特定・抽出することができる。この方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0010】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、ことが好ましい。
【0011】
この発明によれば、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置に検索語を投入したことを始まりとし、検索装置により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0012】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、当該始点における前記検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、ことが好ましい。
【0013】
この発明によれば、部分一致する複数の検索語による一連の検索行動をまとめて一つの検索行動として特定することができる。具体的には、ユーザが検索装置に検索語を投入したことを始まりとし、検索装置による検索結果を閲覧した結果を元に、当初の検索語を変更して再度検索語を投入して得た検索結果の閲覧行動をまとめて同一の検索行動として特定することが可能となる。
【0014】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連のレコードであって、それぞれ所定時間以下の時間間隔をおいて順次記録された前記一連のレコードからなる、ことが好ましい。
【0015】
この発明によれば、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動として特定することができる。
【0016】
また、本発明において、前記検索セッションは、前記検索行動における検索要求を示すレコードを始点とし、前記検索結果にアクセスしたことを示すレコードを終点とする、ことが好ましい。
【0017】
この発明によれば、検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードを終点とすることで、所定の時間間隔以内のユーザの検索行動をまとめて一つの検索セッションとして特定した場合に、検索要求を始点としない検索セッションはユーザの一連の検索行動を示すのに不適切なものとして除外することができる。
【0018】
また、本発明において、前記検索セッション特定ステップは、同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、前記検索セッションを順次特定する第1ステップと、前記第1ステップにて順次特定された当該検索セッションから前記検索要求レコードを除外する第2ステップと、前記第2ステップにて前記検索要求レコードの除外後の複数の前記検索セッション間の時間間隔が一定時間以下である場合に、前記複数の検索セッションを一つの検索セッションとして統合する第3ステップと、を備えることが好ましい。
【0019】
この発明によれば、別個の検索要求ではあるが、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動として特定することができる。
【0020】
また、本発明において、前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、ことが好ましい。
【0021】
この発明によれば、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0022】
また、本発明において、前記最終レコード抽出ステップでは、前記最終時刻におけるレコードのうち、特定のジャンルに属するレコードのみを前記最終レコードとして抽出する、ことが好ましい。
【0023】
この発明によれば、データの絞り込みにより評価値集計ステップの計算量を抑えることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本評価値を与えることが可能になる。
【0024】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、ことが好ましい。
【0025】
この発明によれば、検索語に関連してユーザが検索結果のURLへアクセスした回数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0026】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、ことが好ましい。
【0027】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。
【0028】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、ことが好ましい。
【0029】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLの属するカテゴリのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。また、検索語、URLが違うレコードであってもカテゴリが一致すれば本評価値を利用可能となる。
【0030】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記URLへアクセスした前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0031】
この発明によれば、検索語に関連して検索結果のURLへアクセスしたユーザの数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0032】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0033】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。
【0034】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0035】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLの属するカテゴリのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。また、検索語、URLが違うレコードであってもカテゴリが一致すれば本評価値を利用可能となる。
【0036】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語が前記検索要求された回数を割った値を前記評価値として集計する、ことが好ましい。
【0037】
この発明によれば、検索語に関連してユーザが検索結果のURLへアクセスした回数から当該検索語が検索要求された回数を割った値を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0038】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語を前記検索要求した前記ユーザの数を割った値を前記評価値として集計する、ことが好ましい。
【0039】
この発明によれば、検索語に関連してユーザが検索結果のURLへアクセスした回数から当該検索語を検索要求したユーザの数を割った値を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0040】
また、本発明において、前記評価値集計ステップにおいては、前記検索語が前記検索要求された回数が一定値以上の場合に当該集計を行うことが好ましい。
【0041】
この発明によれば、集計された評価値の信頼性を高めることができる。
【0042】
また、本発明において、前記評価値集計ステップにおいては、前記検索語で前記検索要求を行った前記ユーザの数が一定値以上の場合に当該集計を行うことが好ましい。
【0043】
この発明によれば、集計された評価値の信頼性を高めることができる。
【発明の効果】
【0044】
本発明によれば、ユーザの嗜好を反映した検索結果順位付けが可能な検索結果順位付け方法および検索結果順位付けシステムを提供することができる。
【図面の簡単な説明】
【0045】
【図1】本発明の第1実施形態に係る検索結果順位付けシステム1の構成概要図である。
【図2】検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20のハードウェア構成図である。
【図3】検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【図4】図3のステップS130にて蓄積された検索ログ情報の例を示す図である。
【図5】図3のステップS150にて出力される検索結果の例を示す図である。
【図6】図3のステップS170にて蓄積された検索ログ情報の例を示す図である。
【図7】図3のステップS100〜ステップS180の手順を例えば複数回通じて検索ログ情報蓄積部26に蓄積された検索ログ情報の例を示す図である。
【図8】図3のステップS110の評価値集計処理を詳細に示すフローチャートである。
【図9】図8に示した評価値集計処理の手順に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図10】図8のステップS116にて抽出した最終レコードの例を示す図である。
【図11】図8のステップS118で集計された評価値の一例として、PV数とUU数を示す図である。
【図12】第2実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図13】第3実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図14】第4実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図15】第5実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である(手順3)。
【図16】第5実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である(手順4)。
【図17】第1実施形態において、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良いことを説明するための図である。
【図18】第1実施形態において、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良いことを説明するための図である。
【図19】第1実施形態において、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良いことを説明するための図である。
【発明を実施するための形態】
【0046】
以下、添付図面を参照して本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの好適な実施形態を詳細に説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。
【0047】
[第1実施形態]
(検索結果順位付けシステム1の構成)
図1は、本発明の第1実施形態に係る検索結果順位付けシステム1の構成を示す図である。この検索結果順位付けシステム1は、クライアント端末30(特許請求の範囲における「端末」に相当)からの要求に応じ、検索ウェブページに検索結果として表示されるURLの表示順の順位付けを行うと共に、当該検索結果を検索ウェブページに反映させてクライアント端末30へ出力し表示させる機能を有している。クライアント端末30はWWW(World Wide Web)などの通信ネットワーク40に対し、HTTPなどのプロトコルによりコンテンツリクエストを行い、コンテンツを閲覧することが可能である。図1に示すように、検索結果順位付けシステム1は、評価値集計装置10(特許請求の範囲における「評価値集計モジュール」に相当)および検索装置20を備えて構成されており、クライアント端末30とは通信ネットワーク40を通じて通信可能に接続されている。なお、図1では、評価値集計装置10および検索装置20が別々の装置として図示されているが、これに限られることはなく、評価値集計装置10および検索装置20が一つの装置(図示せず)として構成されていても良い。
【0048】
図2は検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20(または一つの装置になっている場合にはその装置)のハードウェア構成図である。図2に示すように、評価値集計装置10や検索装置20等は、物理的には、CPU、ROM及びRAM等の主記憶装置、キーボード及びマウス等の入力デバイス、ディスプレイ等の出力デバイス、クライアント端末30等の他の装置との間でデータの送受信を行うためのネットワークカード等の通信モジュール、ハードディスク等の補助記憶装置などを含む通常のコンピュータシステムとして構成される。後述する評価値集計装置10や検索装置20等の各機能は、CPU、ROM、RAM等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPUの制御の元で入力デバイス、出力デバイス、通信モジュールを動作させると共に、主記憶装置や補助記憶装置におけるデータの読み出し及び書き込みを行うことで実現される。
【0049】
図1に戻り、評価値集計装置10は、検索装置20の検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)に蓄積された検索ログ情報より評価値を集計するものである。本実施形態における評価値は検索結果の表示順位付け用のスコアを計算する際に利用されるものであり、後述する最終クリック数を含む。評価値集計装置10は、図1に示すように、検索セッション特定部11(特許請求の範囲における「検索セッション特定手段」に相当)、最終クリック集計部12(特許請求の範囲における「最終レコード抽出手段」および「評価値集計手段」に相当)、および集計結果格納部13を備えて構成されている。
【0050】
検索セッション特定部11は、ユーザの一連の検索行動を表すものであって、検索装置20の検索ログ情報蓄積部26に蓄積された検索ログ情報(例えば後述する図7を参照)に含まれる複数の検索セッションを特定する機能を有している。この複数の検索セッションは、それぞれ同一のクライアント端末30によってアクセスされた、検索リクエストから検索行動終了までの一連のレコードからなる。具体的には、検索ログ情報をユーザ、時間順にソートした後、同一ユーザ、同一検索クエリーによる検索リクエストや検索結果クリックを示すレコードを抽出することで、検索セッションを特定できる。検索セッション特定手順の詳細については後述する。
【0051】
最終クリック集計部12は、検索セッション特定部11が特定した各検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコード(以下、「最終クリック」ともいう。)を抽出し、当該抽出した最終レコードを元に、評価値を集計するものである。具体的には、各検索セッションから最後の検索結果クリック(最終クリック)のみを抽出した後に、URL毎にクリック数やユニークユーザ数を評価値として集計する。集計する評価値の種類については後述する。
【0052】
集計結果格納部13は、最終クリック集計部12による集計データをスコア計算用データ格納部27に格納する機能を有している。
【0053】
検索装置20は、クライアント端末30から要求される検索クエリーに対して、それに適合するページへのリンク集合を結果として返すものである。検索装置20は、転送部21、検索結果出力部22(特許請求の範囲における「検索結果表示手段」に相当)、検索受付部23、検索ログ情報記録部24、スコア計算部25(特許請求の範囲における「スコア計算手段」に相当)、検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)、およびスコア計算用データ格納部27を備えて構成されている。
【0054】
検索受付部23は、クライアント端末30から要求される検索クエリーを受付け、スコア計算部25に検索クエリーを転送する機能と、クライアント端末30からの受付け情報を検索ログ情報記録部24に転送する機能を有する。
【0055】
スコア計算用データ格納部27は、検索の順位を決めるために用いるスコア計算用データ(評価値)を格納する機能、およびスコア計算部25へ評価値を出力する機能を有している。
【0056】
スコア計算部25は、検索クエリーに対して適合するコンテンツを判定するために、スコア計算用データ格納部27に格納された評価値を利用し、クライアント端末30の検索結果表示用画面(図示せず)に表示される検索結果の表示順の順位付けに用いられるスコアを計算する機能を有している。通常、スコア計算部25は、複数の評価指標を用いて、検索クエリーに対する文書の適合度をスコア化する。本発明の最終クリック数は評価指標の一つとなるものである。スコア計算部25が行うことのできる簡単なスコア計算例としては、検索クエリーが含まれる文書への最終クリック数をスコアとして計算することが挙げられる。スコア計算部25は、計算したスコアを検索結果出力部22へ出力する機能を有している。
【0057】
検索結果出力部22は、検索結果に対してスコアを用いて順位付けを行い、且つ検索結果をクライアント端末30の検索結果表示用画面に当該順位順で表示させるものである。すなわち、検索結果出力部22は、クライアント端末30に対してコンテンツ(URL)へのリンク集合を検索結果として出力するときに、スコア計算部25で計算したスコアに基づいて、スコアの高い順にコンテンツを並べて出力する機能を有している。尚、検索結果は、結果ページのURLが直接リンクとして記述されているのでなく、転送部21へのアクセスURLのパラメータとして記述されている。ユーザが結果をクリックすると、一旦、クライアント端末30から転送部21へアクセスが行われる。次に、転送部21はアクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をし、最後に、クライアント端末30は結果ページにアクセスする仕組みとなっている。
【0058】
転送部21は、クライアント端末30からのアクセスがあると、アクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をすると共に、検索ログ情報記録部24に、検索結果クリック情報(ユーザが当該URLへアクセスしたことを表す情報)を出力する機能を有する。
【0059】
検索ログ情報記録部24は、検索受付部23からの検索クエリーや転送部21からの検索結果クリック情報をユーザの検索ログ情報として検索ログ情報蓄積部26に記録する機能を有している。
【0060】
検索ログ情報蓄積部26は、 クライアント端末30による検索クエリーや検索結果へのクリック情報をユーザの検索ログ情報として蓄積している。検索ログ情報蓄積部26に蓄積された検索ログ情報を評価値集計装置10にて解析することにより、本発明における最終クリック数を集計する。
【0061】
(検索結果順位付けシステム1の動作)
引き続き、図3〜図11を参照して、本発明の第1実施形態に係る検索結果順位付けシステム1による検索結果順位付け方法について説明する。
【0062】
(全体動作)
まず、検索結果順位付けシステム1による動作の全体的な流れを説明する。図3は、本発明の第1実施形態に係る検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【0063】
検索結果順位付けシステム1においては、前処理として、検索装置20の検索ログ情報蓄積部26にてあらかじめ収集・蓄積されたユーザの検索ログ情報を評価値集計装置10が取得し(ステップS100)、当該取得した検索ログ情報より評価値を集計後、検索装置20のスコア計算用データ格納部27に当該集計後の評価値を格納している(ステップS110)。評価値集計方法の詳細については、以下のステップS120〜ステップS180に示す検索ログ情報の収集・蓄積方法を述べた後、詳しく説明する。
【0064】
クライアント端末30は、検索装置20に対して検索要求を行う(ステップS120)。検索装置20の検索受付部23では、本検索要求を検索ログ情報記録部24に転送し、検索ログ情報記録部24は検索ログ情報蓄積部26に検索ログ情報として蓄積する(ステップS130)。本蓄積データの例を図4に示す。この例では、ユーザID、タイムスタンプ、種別、検索語、遷移先URLの項目がある。ユーザIDは、ブラウザのクッキー、インターネットプロバイダなどにより検索装置20に通知されるユーザID、検索装置20にアクセスした際に検索装置20により発行されるIDなど、何らかの方法で異なるユーザを識別するものである。タイムスタンプはクライアント端末30より検索装置20にアクセスのあった日付と時刻、種別はクライアント端末30による行動種別、検索語はユーザにより入力され検索装置20に検索要求された語、遷移先URLは検索装置20により出力した検索結果をクリックしてアクセスされたページのURL(ここでは検索要求があっただけなので空欄となっている)をそれぞれ示す。
【0065】
次に、図3に戻り、検索装置20のスコア計算部25では、ステップS120で要求があった検索語とページの適合度をスコアとして算出する(ステップS140、特許請求の範囲における「スコア計算ステップ」に相当)。スコアは、前述したように、クライアント端末30の検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるものである。スコア計算に際しては、本発明における最終クリック数が利用される(その他の指標も利用可能である)。
【0066】
次に、検索結果出力部22がステップS140にて計算されたスコアを用いて検索結果の順位付けを行い、当該検索結果をクライアント端末30に出力し、クライアント端末30の検索結果表示用画面に当該順位順で当該検索結果を表示させる(ステップS150、特許請求の範囲における「検索結果表示ステップ」に相当)。検索結果の例を図5に示す。各結果(「aa」、「aaa」等)はユーザがクリック可能なリンクとなっている。リンク先のアドレスは検索装置20の転送部21を示しており、パラメータとして検索語や結果ページのURLが含まれる。例えば、転送部21のルートアドレスが「www.docomo.co.jp」で、検索語が「AAA」、結果ページのアドレスが「http://www.AAA.ne.jp/aaa.htm」とすると、「http://www.docomo.co.jp/index.html?word=AAA&result=http://www.AAA.ne.jp/aaa.htm」などと表される。このように、検索語や遷移先アドレスはURLエンコードされる。
【0067】
次に、図3に戻り、ユーザが検索結果をクリックすると、クライアント端末30から検索装置20の転送部21にアクセスが行われ、ユーザが検索結果をクリックしたという情報とともに、上記パラメータとしてURLエンコードされている情報が転送部21から検索ログ情報記録部24に伝えられる(ステップS160)。
【0068】
次に、検索ログ情報記録部24では、このクリック情報を検索ログ情報として収集・蓄積する(ステップS170)。図6には、この時点での検索ログ情報の例を示す。
【0069】
同時に、転送部21では、クライアント端末30に対して結果ページへアクセスするように転送要求を行う(ステップS180)。クライアント端末30では、その指示に従い、結果ページへアクセスする。ユーザは結果ページにアクセスした後、続けて検索結果に戻りその他の結果を閲覧することが可能である。
【0070】
以上で述べたステップS100〜ステップS180の手順により、検索要求から検索結果の閲覧にわたる一連の検索ログ情報が検索ログ情報蓄積部26に残される。収集された検索ログ情報の例を図7に示す。
【0071】
(評価値集計処理の詳細)
引き続き、検索ログ情報蓄積部26に蓄積された検索ログ情報を解析して、最終クリック数を含む評価値を集計する評価値集計処理(ステップS110)について詳しく述べる。図8は、評価値集計処理のフローチャートである。
【0072】
図8に示すように、最初に、評価値集計装置10の検索セッション特定部11が検索ログ情報蓄積部26より検索ログ情報を取得する(ステップS112)。
【0073】
次に、検索セッション特定部11がステップS112にて取得した検索ログ情報より検索セッションを特定する(ステップS114、特許請求の範囲における「検索セッション特定ステップ」に相当)。検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0074】
すなわち、検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、次に現れた検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図9に示す。なお、図9において検索要求レコードは種別=「検索要求」のレコードであって、上から1番目、4番目等のレコードである。
【0075】
次に、ステップS114にて特定された検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する(ステップS116、特許請求の範囲における「最終レコード抽出ステップ」に相当)。抽出した最終レコードの例を図10に示す。最終レコードにおける種別は「結果クリック」である。これは、ユーザの一連の検索行動は検索要求から始まり、検索結果の閲覧(種別=「結果クリック」)で終了するからである。
【0076】
最後に、ステップS116にて抽出された最終レコードを元に、評価値を集計する(ステップS118、特許請求の範囲における「評価値集計ステップ」に相当)。
【0077】
ステップS118で行われる動作の一つとして、評価値の一つとしてページビュー数(PV数)が集計される。PV数は、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連してユーザが当該URLへアクセスした回数である。このPV数は、ステップS116にて抽出された最終レコードを元に集計されるものなので、ユーザが一連の検索行動を終える場合に最終にクリックしてページビューした回数(最終クリック数)を表す。
【0078】
ステップS118で行われる動作の一つとして、評価値の一つとしてユニークユーザ数(UU数)が集計される。UU数は、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連して当該URLへアクセスしたユーザの数である。このUU数は、ステップS116にて抽出された最終レコードを元に集計されるものなので、一連の検索行動を終える場合に最終にクリックしてページビューしたユーザの数を表す。
【0079】
ステップS118で行われる動作の一つとして、評価値の一つとしてCTR(Click Through Rate)が集計される。CTRは、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連してユーザが当該URLへアクセスした回数から、当該検索語が検索要求された回数を割った値である。このCTRは、ステップS116にて抽出された最終レコードを元に集計されるものなので、最終クリック数と関連付けられた値である。
【0080】
ステップS118で行われる動作の一つとして、評価値の一つとしてUCTR(User Click Through Rate)が集計される。UCTRは、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連してユーザが当該URLへアクセスした回数から、当該検索語を検索要求したユーザの数を割った値である。このUCTRは、ステップS116にて抽出された最終レコードを元に集計されるものなので、最終クリック数と関連付けられた値である。
【0081】
以上の方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0082】
ステップS118で集計された評価値の一例として、図11はPV数とUU数を示す。以上のように集計した評価値は、集計結果格納部13によりスコア計算用データ格納部27に格納される。なお、ステップS118においては、検索語が検索要求された回数が一定値以上の場合に当該集計処理を行うようにしても良い。また、検索語で検索要求を行ったユーザの数が一定値以上の場合に当該集計処理を行うようにしても良い。これにより、集計された評価値の信頼性を高めることができる。
【0083】
なお、上記の説明においては、当該集計(PV数、UU数、CTR、UCTR等の集計)が、検索行動における検索要求で入力された検索語、および当該検索要求に対し検索装置により返された検索結果よりユーザがアクセスしたURLに基づき、行われたが、本実施形態はこれに限られない。
【0084】
例えば、PV数やUU数の集計が、検索語に依らず、検索装置により返された検索結果よりユーザがアクセスしたURLのみに基づき、行われても良い。この場合は、検索語に依らず、ユーザがアクセスしたURLのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本実施形態における評価値により検索結果順位付けが可能となる。
【0085】
また、例えば、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良い。この場合は、検索語に依らず、ユーザがアクセスしたURLの属するカテゴリのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本実施形態における評価値により検索結果順位付けが可能となる。また、検索語やURLが違うレコードであってもカテゴリが一致すれば本評価値を利用可能となる。なお、ここでいう「URLの属するカテゴリ」は、例えば,URLの構造からカテゴリを抽出することができる。図17は各セッションの最終クリックを集めたデータである。ここでは、カテゴリとしてURLのホスト名を抽出している。図18はカテゴリを元にPV数やUU数を集計した結果となっている。最終的に、図18の結果を各URLに紐付け評価値とする(図19)。集約の単位とするカテゴリにはここで示したホスト名だけでなく、パラメータ部(URLの「?」以降の文字列)を除いたものや、ホスト名の中の一部の文字列(例えば、www.AAA.ne.jpならば「AAA」など)を利用することもできる。また、URL構造を利用しないものとしては各ページが属するカテゴリを利用することもできる。例えば、検索ポータルにおける人手で仕分けられたカテゴリや判別プログラムによる自動付与されるカテゴリなどが挙げられる。
【0086】
[第2実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第2実施形態について説明する。第2実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0087】
第2実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、始点以降に現れる種別=「検索要求」のレコードであって、その検索語が始点の検索語の部分文字列でないレコード、あるいは始点の検索語がその検索語の部分文字列ではないレコードの一つ前か、あるいは、最終レコードを終点として判断する。
【0088】
すなわち、第2実施形における検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、当該始点における検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。
【0089】
以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図12に示す。同一ユーザにより、検索語「AAA」と検索語「AAA BBB」が検索要求されているが、検索語「AAA BBB」は検索語「AAA」を部分文字列として含んでいるので、検索セッションIDとしては、検索語「AAA」の検索要求で始まる検索セッションと検索語「AAA BBB」の検索要求に始まる検索セッションとが統合され、ID「1」となっている。
【0090】
[第3実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第3実施形態について説明する。第3実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1および第2実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0091】
第3実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。
【0092】
以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図13に示す。図13は時間間隔を10分と設定した場合の例であり、上から7番目までのレコードが一つの検索セッションID「1」となっており、上から8番目のレコードが一つの検索セッションID「2」となっており、上から9番目のレコードから最後のレコードまでが一つの検索セッションID「3」となっている。第1および第2実施形態とは異なり、検索語でなくタイムスタンプを元に検索セッションが特定されるので、検索語に類似性がなくてもユーザの一連の検索行動を特定できる。
【0093】
[第4実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第4実施形態について説明する。第4実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1〜第3実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0094】
第4実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。ただし、種別=「検索要求」を持つレコードを始点とし、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0095】
すなわち、第4実施形態における検索セッションは、同一端末による検索行動における一連のレコードであって、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードからなり、且つ検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードのうち何れか(所定時間以上の時間間隔となっているレコードの一つ前か、または検索ログ情報全体における最終のレコード)を終点とする。
【0096】
以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図14に示す。図14は図13の例と同様に時間間隔を10分と設定した場合の例であり、上から7番目までのレコードが一つの検索セッションID「1」となっていることは図13の場合と同様である。しかし、第4実施形態では検索要求を示すレコードを始点とするため、図13で上から8番目のレコードからなるID「2」の検索セッションは検索セッションとして認められない。したがって、図14に示すように、上から8番目のレコードには検索セッションIDが付与されない。
【0097】
[第5実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第5実施形態について説明する。第5実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1〜第4実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0098】
第5実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する(特許請求の範囲における「第1ステップ」に相当)。
手順3:手順2にて順次特定された当該検索セッションから検索要求レコードを除外する(特許請求の範囲における「第2ステップ」に相当)。
手順4:手順3にて検索要求レコードの除外後の複数の検索セッション間の時間間隔が一定時間以下である場合に、当該複数の検索セッションを一つの検索セッションとして統合する(特許請求の範囲における「第3ステップ」に相当)。
【0099】
図9、図15、および図16は、以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を示すための図である。図9は上記の手順2が終了した時の様子を示す。実際、手順2までは第1実施形態と同様である。図15は上記の手順3が終了した時の様子を示す。種別=「検索要求」のレコードが削除されている。図16は上記の手順4が終了した時の様子を示す。図15におけるID「2」と「3」の検索セッションは時間間隔が約8分なので、手順4にて一つの検索セッションとして統合される。なお、図16は時間間隔を10分と設定した場合の例である。
【0100】
続いて、本実施形態にかかる検索結果順位付けシステム1の作用及び効果について説明する。本実施形態の検索結果順位付けシステム1によれば、ユーザの一連の検索行動を示す検索セッションにおける最後のレコードを抽出することで、検索結果の中からユーザが満足したページ(ユーザが満足したため検索行動を終了したページ)を特定・抽出することができる。この方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0101】
また、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置20に検索語を投入したことを始まりとし、検索装置20により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0102】
特に本発明の第2実施形態によれば、部分一致する複数の検索語による一連の検索行動をまとめて一つの検索行動として特定することができる。具体的には、ユーザが検索装置20に検索語を投入したことを始まりとし、検索装置20による検索結果を閲覧した結果を元に、当初の検索語を変更して再度検索語を投入して得た検索結果の閲覧行動をまとめて同一の検索行動として特定することが可能となる。
【0103】
特に本発明の第3実施形態によれば、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動として特定することができる。
【0104】
特に本発明の第4実施形態によれば、検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードを終点とすることで、所定の時間間隔以内のユーザの検索行動をまとめて一つの検索セッションとして特定した場合に、検索要求を始点としない検索セッションはユーザの一連の検索行動を示すのに不適切なものとして除外することができる。
【0105】
特に本発明の第5実施形態によれば、複数の検索語の投入を含む連続して行った検索を一連の検索行動としてまとめることが可能である。また、第3実施形態と同様に、検索結果クリックから始まるという動作を一連の検索行動として不適切なものと判断し、検索セッションに含ませないというメリットがある。
【0106】
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限定されないことは言うまでもない。
【0107】
例えば、検索セッションを特定するステップS114では、検索セッションが、検索結果にアクセスしたことを示すレコードを一定数以下含むように、当該検索セッションを特定するようにしても良い。この場合には、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0108】
また、最終レコードを抽出するステップS116では、最終時刻におけるレコードのうち、特定のジャンルに属するレコードのみを最終レコードとして抽出するようにしても良い。この場合には、データの絞り込みにより評価値集計ステップS118の計算量を抑えることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本評価値を与えることが可能になる。なお、ここでいう「特定のジャンル」とは、例えば、検索ソースの種別などが挙げられる。検索結果には、通常の結果に加え、画像、ニュース、ブログなどの複数の情報ソースからの検索結果が並んでいることが多い。クリック順やクリック数に相関のないジャンルを取り除きたい場合やクリックログからの評価値が特に有用なジャンルのみ得たい場合は、特定ジャンルのみの評価値を算出する。ただし、セッション特定にはすべてのクリックログが必要であるので、セッションを特定した後に、該当ジャンルに属する最終クリックを抽出する。
【符号の説明】
【0109】
1…検索結果順位付けシステム、10…評価値集計装置、11…検索セッション特定部、12…最終クリック集計部、13…集計結果格納部、20…検索装置、21…転送部、22…検索結果出力部、23…検索受付部、24…検索ログ情報記録部、25…スコア計算部、26…検索ログ情報蓄積部、27…スコア計算用データ格納部、30…クライアント端末、40…通信ネットワーク。
【技術分野】
【0001】
本発明は、検索結果順位付け方法および検索結果順位付けシステムに関するものである。
【背景技術】
【0002】
検索ウェブページに検索結果として表示するURLの表示順の順位付け(ランキング)は、様々な指標を用いスコア化され行われている。その指標としては、ページ内に検索ワードが出現する回数やウェブ空間におけるページ間のリンク関係から算出したスコアなど、ページそのものの持つ特徴を利用するものがよく知られている。また、それ以外の指標として、検索エンジンが出力する検索結果に対するユーザのクリックログ(以下、「検索クリックログ」や「検索ログ情報」とも記す。)を利用することができる。本指標は、検索結果へのユーザフィードバック情報として有益であるが、結果の並び順など検索結果の適合性と直接関係ない要因により影響を受けるので、検索クリックログから検索結果の適合性を表す有効な指標を適切に抽出することが重要である。
【0003】
特許文献1には、検索クリックログを利用して検索結果を改善する技術が開示されている。検索クリックログから抽出できる指標として、検索ページのクリックスルー率(検索結果が表示される回数に対する結果がクリックされる回数の割合)が記されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第6493702号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、検索結果はユーザにより適合性が十分精査されてクリックされているとも限らず、また、上位に表示されるほどクリックされやすい性質があることから、クリックスルー率は検索クエリーに対する適合性を適切に表現する指標として十分でない場合がある。
【0006】
本発明は、このような問題を解決するためになされたものであり、検索クリックログから検索クエリーに対する適合性を表す指標を抽出し、ページの順位付けを適切に行うことができる検索結果順位付け方法および検索結果順位付けシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の検索結果順位付け方法は、検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、を備え、前記評価値を集計するために、前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップと、前記検索セッション特定ステップにて特定された前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出ステップと、前記最終レコード抽出ステップにて抽出された前記最終レコードを元に、前記評価値を集計する評価値集計ステップと、を更に備えることを特徴とする。
【0008】
また、本発明の検索結果順位付けシステムは、ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、を備え、前記評価値集計モジュールは、前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定手段と、前記検索セッション特定手段が特定した前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出手段と、前記最終レコード抽出手段が抽出した前記最終レコードを元に、前記評価値を集計する評価値集計手段と、を備えることを特徴とする。
【0009】
このような本発明の検索結果順位付け方法および検索結果順位付けシステムによれば、ユーザの一連の検索行動を示す検索セッションにおける最後のレコードを抽出することで、検索結果の中からユーザが満足したページ(ユーザが満足したため検索行動を終了したページ)を特定・抽出することができる。この方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0010】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、ことが好ましい。
【0011】
この発明によれば、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置に検索語を投入したことを始まりとし、検索装置により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0012】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、当該始点における前記検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、ことが好ましい。
【0013】
この発明によれば、部分一致する複数の検索語による一連の検索行動をまとめて一つの検索行動として特定することができる。具体的には、ユーザが検索装置に検索語を投入したことを始まりとし、検索装置による検索結果を閲覧した結果を元に、当初の検索語を変更して再度検索語を投入して得た検索結果の閲覧行動をまとめて同一の検索行動として特定することが可能となる。
【0014】
また、本発明において、前記検索セッションは、同一端末による前記検索行動における一連のレコードであって、それぞれ所定時間以下の時間間隔をおいて順次記録された前記一連のレコードからなる、ことが好ましい。
【0015】
この発明によれば、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動として特定することができる。
【0016】
また、本発明において、前記検索セッションは、前記検索行動における検索要求を示すレコードを始点とし、前記検索結果にアクセスしたことを示すレコードを終点とする、ことが好ましい。
【0017】
この発明によれば、検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードを終点とすることで、所定の時間間隔以内のユーザの検索行動をまとめて一つの検索セッションとして特定した場合に、検索要求を始点としない検索セッションはユーザの一連の検索行動を示すのに不適切なものとして除外することができる。
【0018】
また、本発明において、前記検索セッション特定ステップは、同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、前記検索セッションを順次特定する第1ステップと、前記第1ステップにて順次特定された当該検索セッションから前記検索要求レコードを除外する第2ステップと、前記第2ステップにて前記検索要求レコードの除外後の複数の前記検索セッション間の時間間隔が一定時間以下である場合に、前記複数の検索セッションを一つの検索セッションとして統合する第3ステップと、を備えることが好ましい。
【0019】
この発明によれば、別個の検索要求ではあるが、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動として特定することができる。
【0020】
また、本発明において、前記検索セッション特定ステップでは、前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、ことが好ましい。
【0021】
この発明によれば、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0022】
また、本発明において、前記最終レコード抽出ステップでは、前記最終時刻におけるレコードのうち、特定のジャンルに属するレコードのみを前記最終レコードとして抽出する、ことが好ましい。
【0023】
この発明によれば、データの絞り込みにより評価値集計ステップの計算量を抑えることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本評価値を与えることが可能になる。
【0024】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、ことが好ましい。
【0025】
この発明によれば、検索語に関連してユーザが検索結果のURLへアクセスした回数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0026】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、ことが好ましい。
【0027】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。
【0028】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、ことが好ましい。
【0029】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLの属するカテゴリのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。また、検索語、URLが違うレコードであってもカテゴリが一致すれば本評価値を利用可能となる。
【0030】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記URLへアクセスした前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0031】
この発明によれば、検索語に関連して検索結果のURLへアクセスしたユーザの数を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0032】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0033】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。
【0034】
また、本発明において、前記評価値集計ステップにおいては、前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、ことが好ましい。
【0035】
この発明によれば、検索語に依らず、ユーザがアクセスしたURLの属するカテゴリのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本発明における評価値により検索結果順位付けが可能となる。また、検索語、URLが違うレコードであってもカテゴリが一致すれば本評価値を利用可能となる。
【0036】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語が前記検索要求された回数を割った値を前記評価値として集計する、ことが好ましい。
【0037】
この発明によれば、検索語に関連してユーザが検索結果のURLへアクセスした回数から当該検索語が検索要求された回数を割った値を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0038】
また、本発明において、前記評価値集計ステップにおいては、前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語を前記検索要求した前記ユーザの数を割った値を前記評価値として集計する、ことが好ましい。
【0039】
この発明によれば、検索語に関連してユーザが検索結果のURLへアクセスした回数から当該検索語を検索要求したユーザの数を割った値を評価値として用いて、各ページのスコアを演算し、そのスコアを検索結果のURLの順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0040】
また、本発明において、前記評価値集計ステップにおいては、前記検索語が前記検索要求された回数が一定値以上の場合に当該集計を行うことが好ましい。
【0041】
この発明によれば、集計された評価値の信頼性を高めることができる。
【0042】
また、本発明において、前記評価値集計ステップにおいては、前記検索語で前記検索要求を行った前記ユーザの数が一定値以上の場合に当該集計を行うことが好ましい。
【0043】
この発明によれば、集計された評価値の信頼性を高めることができる。
【発明の効果】
【0044】
本発明によれば、ユーザの嗜好を反映した検索結果順位付けが可能な検索結果順位付け方法および検索結果順位付けシステムを提供することができる。
【図面の簡単な説明】
【0045】
【図1】本発明の第1実施形態に係る検索結果順位付けシステム1の構成概要図である。
【図2】検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20のハードウェア構成図である。
【図3】検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【図4】図3のステップS130にて蓄積された検索ログ情報の例を示す図である。
【図5】図3のステップS150にて出力される検索結果の例を示す図である。
【図6】図3のステップS170にて蓄積された検索ログ情報の例を示す図である。
【図7】図3のステップS100〜ステップS180の手順を例えば複数回通じて検索ログ情報蓄積部26に蓄積された検索ログ情報の例を示す図である。
【図8】図3のステップS110の評価値集計処理を詳細に示すフローチャートである。
【図9】図8に示した評価値集計処理の手順に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図10】図8のステップS116にて抽出した最終レコードの例を示す図である。
【図11】図8のステップS118で集計された評価値の一例として、PV数とUU数を示す図である。
【図12】第2実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図13】第3実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図14】第4実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である。
【図15】第5実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である(手順3)。
【図16】第5実施形態に従い図7の検索ログ情報に対して付与した検索セッションIDの例を示す図である(手順4)。
【図17】第1実施形態において、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良いことを説明するための図である。
【図18】第1実施形態において、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良いことを説明するための図である。
【図19】第1実施形態において、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良いことを説明するための図である。
【発明を実施するための形態】
【0046】
以下、添付図面を参照して本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの好適な実施形態を詳細に説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。
【0047】
[第1実施形態]
(検索結果順位付けシステム1の構成)
図1は、本発明の第1実施形態に係る検索結果順位付けシステム1の構成を示す図である。この検索結果順位付けシステム1は、クライアント端末30(特許請求の範囲における「端末」に相当)からの要求に応じ、検索ウェブページに検索結果として表示されるURLの表示順の順位付けを行うと共に、当該検索結果を検索ウェブページに反映させてクライアント端末30へ出力し表示させる機能を有している。クライアント端末30はWWW(World Wide Web)などの通信ネットワーク40に対し、HTTPなどのプロトコルによりコンテンツリクエストを行い、コンテンツを閲覧することが可能である。図1に示すように、検索結果順位付けシステム1は、評価値集計装置10(特許請求の範囲における「評価値集計モジュール」に相当)および検索装置20を備えて構成されており、クライアント端末30とは通信ネットワーク40を通じて通信可能に接続されている。なお、図1では、評価値集計装置10および検索装置20が別々の装置として図示されているが、これに限られることはなく、評価値集計装置10および検索装置20が一つの装置(図示せず)として構成されていても良い。
【0048】
図2は検索結果順位付けシステム1を構成する評価値集計装置10や検索装置20(または一つの装置になっている場合にはその装置)のハードウェア構成図である。図2に示すように、評価値集計装置10や検索装置20等は、物理的には、CPU、ROM及びRAM等の主記憶装置、キーボード及びマウス等の入力デバイス、ディスプレイ等の出力デバイス、クライアント端末30等の他の装置との間でデータの送受信を行うためのネットワークカード等の通信モジュール、ハードディスク等の補助記憶装置などを含む通常のコンピュータシステムとして構成される。後述する評価値集計装置10や検索装置20等の各機能は、CPU、ROM、RAM等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPUの制御の元で入力デバイス、出力デバイス、通信モジュールを動作させると共に、主記憶装置や補助記憶装置におけるデータの読み出し及び書き込みを行うことで実現される。
【0049】
図1に戻り、評価値集計装置10は、検索装置20の検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)に蓄積された検索ログ情報より評価値を集計するものである。本実施形態における評価値は検索結果の表示順位付け用のスコアを計算する際に利用されるものであり、後述する最終クリック数を含む。評価値集計装置10は、図1に示すように、検索セッション特定部11(特許請求の範囲における「検索セッション特定手段」に相当)、最終クリック集計部12(特許請求の範囲における「最終レコード抽出手段」および「評価値集計手段」に相当)、および集計結果格納部13を備えて構成されている。
【0050】
検索セッション特定部11は、ユーザの一連の検索行動を表すものであって、検索装置20の検索ログ情報蓄積部26に蓄積された検索ログ情報(例えば後述する図7を参照)に含まれる複数の検索セッションを特定する機能を有している。この複数の検索セッションは、それぞれ同一のクライアント端末30によってアクセスされた、検索リクエストから検索行動終了までの一連のレコードからなる。具体的には、検索ログ情報をユーザ、時間順にソートした後、同一ユーザ、同一検索クエリーによる検索リクエストや検索結果クリックを示すレコードを抽出することで、検索セッションを特定できる。検索セッション特定手順の詳細については後述する。
【0051】
最終クリック集計部12は、検索セッション特定部11が特定した各検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコード(以下、「最終クリック」ともいう。)を抽出し、当該抽出した最終レコードを元に、評価値を集計するものである。具体的には、各検索セッションから最後の検索結果クリック(最終クリック)のみを抽出した後に、URL毎にクリック数やユニークユーザ数を評価値として集計する。集計する評価値の種類については後述する。
【0052】
集計結果格納部13は、最終クリック集計部12による集計データをスコア計算用データ格納部27に格納する機能を有している。
【0053】
検索装置20は、クライアント端末30から要求される検索クエリーに対して、それに適合するページへのリンク集合を結果として返すものである。検索装置20は、転送部21、検索結果出力部22(特許請求の範囲における「検索結果表示手段」に相当)、検索受付部23、検索ログ情報記録部24、スコア計算部25(特許請求の範囲における「スコア計算手段」に相当)、検索ログ情報蓄積部26(特許請求の範囲における「検索ログ情報蓄積手段」に相当)、およびスコア計算用データ格納部27を備えて構成されている。
【0054】
検索受付部23は、クライアント端末30から要求される検索クエリーを受付け、スコア計算部25に検索クエリーを転送する機能と、クライアント端末30からの受付け情報を検索ログ情報記録部24に転送する機能を有する。
【0055】
スコア計算用データ格納部27は、検索の順位を決めるために用いるスコア計算用データ(評価値)を格納する機能、およびスコア計算部25へ評価値を出力する機能を有している。
【0056】
スコア計算部25は、検索クエリーに対して適合するコンテンツを判定するために、スコア計算用データ格納部27に格納された評価値を利用し、クライアント端末30の検索結果表示用画面(図示せず)に表示される検索結果の表示順の順位付けに用いられるスコアを計算する機能を有している。通常、スコア計算部25は、複数の評価指標を用いて、検索クエリーに対する文書の適合度をスコア化する。本発明の最終クリック数は評価指標の一つとなるものである。スコア計算部25が行うことのできる簡単なスコア計算例としては、検索クエリーが含まれる文書への最終クリック数をスコアとして計算することが挙げられる。スコア計算部25は、計算したスコアを検索結果出力部22へ出力する機能を有している。
【0057】
検索結果出力部22は、検索結果に対してスコアを用いて順位付けを行い、且つ検索結果をクライアント端末30の検索結果表示用画面に当該順位順で表示させるものである。すなわち、検索結果出力部22は、クライアント端末30に対してコンテンツ(URL)へのリンク集合を検索結果として出力するときに、スコア計算部25で計算したスコアに基づいて、スコアの高い順にコンテンツを並べて出力する機能を有している。尚、検索結果は、結果ページのURLが直接リンクとして記述されているのでなく、転送部21へのアクセスURLのパラメータとして記述されている。ユーザが結果をクリックすると、一旦、クライアント端末30から転送部21へアクセスが行われる。次に、転送部21はアクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をし、最後に、クライアント端末30は結果ページにアクセスする仕組みとなっている。
【0058】
転送部21は、クライアント端末30からのアクセスがあると、アクセスURLに含まれるパラメータを参照してクライアント端末30へ結果ページへの転送要求をすると共に、検索ログ情報記録部24に、検索結果クリック情報(ユーザが当該URLへアクセスしたことを表す情報)を出力する機能を有する。
【0059】
検索ログ情報記録部24は、検索受付部23からの検索クエリーや転送部21からの検索結果クリック情報をユーザの検索ログ情報として検索ログ情報蓄積部26に記録する機能を有している。
【0060】
検索ログ情報蓄積部26は、 クライアント端末30による検索クエリーや検索結果へのクリック情報をユーザの検索ログ情報として蓄積している。検索ログ情報蓄積部26に蓄積された検索ログ情報を評価値集計装置10にて解析することにより、本発明における最終クリック数を集計する。
【0061】
(検索結果順位付けシステム1の動作)
引き続き、図3〜図11を参照して、本発明の第1実施形態に係る検索結果順位付けシステム1による検索結果順位付け方法について説明する。
【0062】
(全体動作)
まず、検索結果順位付けシステム1による動作の全体的な流れを説明する。図3は、本発明の第1実施形態に係る検索結果順位付けシステム1の制御処理の全体流れを説明するためのシーケンス図である。
【0063】
検索結果順位付けシステム1においては、前処理として、検索装置20の検索ログ情報蓄積部26にてあらかじめ収集・蓄積されたユーザの検索ログ情報を評価値集計装置10が取得し(ステップS100)、当該取得した検索ログ情報より評価値を集計後、検索装置20のスコア計算用データ格納部27に当該集計後の評価値を格納している(ステップS110)。評価値集計方法の詳細については、以下のステップS120〜ステップS180に示す検索ログ情報の収集・蓄積方法を述べた後、詳しく説明する。
【0064】
クライアント端末30は、検索装置20に対して検索要求を行う(ステップS120)。検索装置20の検索受付部23では、本検索要求を検索ログ情報記録部24に転送し、検索ログ情報記録部24は検索ログ情報蓄積部26に検索ログ情報として蓄積する(ステップS130)。本蓄積データの例を図4に示す。この例では、ユーザID、タイムスタンプ、種別、検索語、遷移先URLの項目がある。ユーザIDは、ブラウザのクッキー、インターネットプロバイダなどにより検索装置20に通知されるユーザID、検索装置20にアクセスした際に検索装置20により発行されるIDなど、何らかの方法で異なるユーザを識別するものである。タイムスタンプはクライアント端末30より検索装置20にアクセスのあった日付と時刻、種別はクライアント端末30による行動種別、検索語はユーザにより入力され検索装置20に検索要求された語、遷移先URLは検索装置20により出力した検索結果をクリックしてアクセスされたページのURL(ここでは検索要求があっただけなので空欄となっている)をそれぞれ示す。
【0065】
次に、図3に戻り、検索装置20のスコア計算部25では、ステップS120で要求があった検索語とページの適合度をスコアとして算出する(ステップS140、特許請求の範囲における「スコア計算ステップ」に相当)。スコアは、前述したように、クライアント端末30の検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるものである。スコア計算に際しては、本発明における最終クリック数が利用される(その他の指標も利用可能である)。
【0066】
次に、検索結果出力部22がステップS140にて計算されたスコアを用いて検索結果の順位付けを行い、当該検索結果をクライアント端末30に出力し、クライアント端末30の検索結果表示用画面に当該順位順で当該検索結果を表示させる(ステップS150、特許請求の範囲における「検索結果表示ステップ」に相当)。検索結果の例を図5に示す。各結果(「aa」、「aaa」等)はユーザがクリック可能なリンクとなっている。リンク先のアドレスは検索装置20の転送部21を示しており、パラメータとして検索語や結果ページのURLが含まれる。例えば、転送部21のルートアドレスが「www.docomo.co.jp」で、検索語が「AAA」、結果ページのアドレスが「http://www.AAA.ne.jp/aaa.htm」とすると、「http://www.docomo.co.jp/index.html?word=AAA&result=http://www.AAA.ne.jp/aaa.htm」などと表される。このように、検索語や遷移先アドレスはURLエンコードされる。
【0067】
次に、図3に戻り、ユーザが検索結果をクリックすると、クライアント端末30から検索装置20の転送部21にアクセスが行われ、ユーザが検索結果をクリックしたという情報とともに、上記パラメータとしてURLエンコードされている情報が転送部21から検索ログ情報記録部24に伝えられる(ステップS160)。
【0068】
次に、検索ログ情報記録部24では、このクリック情報を検索ログ情報として収集・蓄積する(ステップS170)。図6には、この時点での検索ログ情報の例を示す。
【0069】
同時に、転送部21では、クライアント端末30に対して結果ページへアクセスするように転送要求を行う(ステップS180)。クライアント端末30では、その指示に従い、結果ページへアクセスする。ユーザは結果ページにアクセスした後、続けて検索結果に戻りその他の結果を閲覧することが可能である。
【0070】
以上で述べたステップS100〜ステップS180の手順により、検索要求から検索結果の閲覧にわたる一連の検索ログ情報が検索ログ情報蓄積部26に残される。収集された検索ログ情報の例を図7に示す。
【0071】
(評価値集計処理の詳細)
引き続き、検索ログ情報蓄積部26に蓄積された検索ログ情報を解析して、最終クリック数を含む評価値を集計する評価値集計処理(ステップS110)について詳しく述べる。図8は、評価値集計処理のフローチャートである。
【0072】
図8に示すように、最初に、評価値集計装置10の検索セッション特定部11が検索ログ情報蓄積部26より検索ログ情報を取得する(ステップS112)。
【0073】
次に、検索セッション特定部11がステップS112にて取得した検索ログ情報より検索セッションを特定する(ステップS114、特許請求の範囲における「検索セッション特定ステップ」に相当)。検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0074】
すなわち、検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、次に現れた検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図9に示す。なお、図9において検索要求レコードは種別=「検索要求」のレコードであって、上から1番目、4番目等のレコードである。
【0075】
次に、ステップS114にて特定された検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する(ステップS116、特許請求の範囲における「最終レコード抽出ステップ」に相当)。抽出した最終レコードの例を図10に示す。最終レコードにおける種別は「結果クリック」である。これは、ユーザの一連の検索行動は検索要求から始まり、検索結果の閲覧(種別=「結果クリック」)で終了するからである。
【0076】
最後に、ステップS116にて抽出された最終レコードを元に、評価値を集計する(ステップS118、特許請求の範囲における「評価値集計ステップ」に相当)。
【0077】
ステップS118で行われる動作の一つとして、評価値の一つとしてページビュー数(PV数)が集計される。PV数は、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連してユーザが当該URLへアクセスした回数である。このPV数は、ステップS116にて抽出された最終レコードを元に集計されるものなので、ユーザが一連の検索行動を終える場合に最終にクリックしてページビューした回数(最終クリック数)を表す。
【0078】
ステップS118で行われる動作の一つとして、評価値の一つとしてユニークユーザ数(UU数)が集計される。UU数は、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連して当該URLへアクセスしたユーザの数である。このUU数は、ステップS116にて抽出された最終レコードを元に集計されるものなので、一連の検索行動を終える場合に最終にクリックしてページビューしたユーザの数を表す。
【0079】
ステップS118で行われる動作の一つとして、評価値の一つとしてCTR(Click Through Rate)が集計される。CTRは、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連してユーザが当該URLへアクセスした回数から、当該検索語が検索要求された回数を割った値である。このCTRは、ステップS116にて抽出された最終レコードを元に集計されるものなので、最終クリック数と関連付けられた値である。
【0080】
ステップS118で行われる動作の一つとして、評価値の一つとしてUCTR(User Click Through Rate)が集計される。UCTRは、検索要求で入力された検索語、および当該検索要求に対し検索装置20により返された検索結果よりユーザがアクセスしたURLに基づき、当該検索語に関連してユーザが当該URLへアクセスした回数から、当該検索語を検索要求したユーザの数を割った値である。このUCTRは、ステップS116にて抽出された最終レコードを元に集計されるものなので、最終クリック数と関連付けられた値である。
【0081】
以上の方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0082】
ステップS118で集計された評価値の一例として、図11はPV数とUU数を示す。以上のように集計した評価値は、集計結果格納部13によりスコア計算用データ格納部27に格納される。なお、ステップS118においては、検索語が検索要求された回数が一定値以上の場合に当該集計処理を行うようにしても良い。また、検索語で検索要求を行ったユーザの数が一定値以上の場合に当該集計処理を行うようにしても良い。これにより、集計された評価値の信頼性を高めることができる。
【0083】
なお、上記の説明においては、当該集計(PV数、UU数、CTR、UCTR等の集計)が、検索行動における検索要求で入力された検索語、および当該検索要求に対し検索装置により返された検索結果よりユーザがアクセスしたURLに基づき、行われたが、本実施形態はこれに限られない。
【0084】
例えば、PV数やUU数の集計が、検索語に依らず、検索装置により返された検索結果よりユーザがアクセスしたURLのみに基づき、行われても良い。この場合は、検索語に依らず、ユーザがアクセスしたURLのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本実施形態における評価値により検索結果順位付けが可能となる。
【0085】
また、例えば、PV数やUU数の集計が、検索装置により返された検索結果よりユーザがアクセスしたURLの属するカテゴリに基づき、行われても良い。この場合は、検索語に依らず、ユーザがアクセスしたURLの属するカテゴリのみに対する集計を行うことができ、検索ログにない検索語で検索された場合でも、本実施形態における評価値により検索結果順位付けが可能となる。また、検索語やURLが違うレコードであってもカテゴリが一致すれば本評価値を利用可能となる。なお、ここでいう「URLの属するカテゴリ」は、例えば,URLの構造からカテゴリを抽出することができる。図17は各セッションの最終クリックを集めたデータである。ここでは、カテゴリとしてURLのホスト名を抽出している。図18はカテゴリを元にPV数やUU数を集計した結果となっている。最終的に、図18の結果を各URLに紐付け評価値とする(図19)。集約の単位とするカテゴリにはここで示したホスト名だけでなく、パラメータ部(URLの「?」以降の文字列)を除いたものや、ホスト名の中の一部の文字列(例えば、www.AAA.ne.jpならば「AAA」など)を利用することもできる。また、URL構造を利用しないものとしては各ページが属するカテゴリを利用することもできる。例えば、検索ポータルにおける人手で仕分けられたカテゴリや判別プログラムによる自動付与されるカテゴリなどが挙げられる。
【0086】
[第2実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第2実施形態について説明する。第2実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0087】
第2実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、始点以降に現れる種別=「検索要求」のレコードであって、その検索語が始点の検索語の部分文字列でないレコード、あるいは始点の検索語がその検索語の部分文字列ではないレコードの一つ前か、あるいは、最終レコードを終点として判断する。
【0088】
すなわち、第2実施形における検索セッションは、同一端末による検索行動における一連のレコードであって、検索要求を示すレコードである検索要求レコードを始点とし、当該始点における検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または検索ログ情報全体における最終のレコードを終点とする。
【0089】
以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図12に示す。同一ユーザにより、検索語「AAA」と検索語「AAA BBB」が検索要求されているが、検索語「AAA BBB」は検索語「AAA」を部分文字列として含んでいるので、検索セッションIDとしては、検索語「AAA」の検索要求で始まる検索セッションと検索語「AAA BBB」の検索要求に始まる検索セッションとが統合され、ID「1」となっている。
【0090】
[第3実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第3実施形態について説明する。第3実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1および第2実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0091】
第3実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。
【0092】
以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図13に示す。図13は時間間隔を10分と設定した場合の例であり、上から7番目までのレコードが一つの検索セッションID「1」となっており、上から8番目のレコードが一つの検索セッションID「2」となっており、上から9番目のレコードから最後のレコードまでが一つの検索セッションID「3」となっている。第1および第2実施形態とは異なり、検索語でなくタイムスタンプを元に検索セッションが特定されるので、検索語に類似性がなくてもユーザの一連の検索行動を特定できる。
【0093】
[第4実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第4実施形態について説明する。第4実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1〜第3実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0094】
第4実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:同一のユーザIDを持つレコードのうち、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードを同一の検索セッションとする。ただし、種別=「検索要求」を持つレコードを始点とし、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する。
【0095】
すなわち、第4実施形態における検索セッションは、同一端末による検索行動における一連のレコードであって、それぞれ所定時間以下の時間間隔をおいて順次記録された一連のレコードからなり、且つ検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードのうち何れか(所定時間以上の時間間隔となっているレコードの一つ前か、または検索ログ情報全体における最終のレコード)を終点とする。
【0096】
以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を図14に示す。図14は図13の例と同様に時間間隔を10分と設定した場合の例であり、上から7番目までのレコードが一つの検索セッションID「1」となっていることは図13の場合と同様である。しかし、第4実施形態では検索要求を示すレコードを始点とするため、図13で上から8番目のレコードからなるID「2」の検索セッションは検索セッションとして認められない。したがって、図14に示すように、上から8番目のレコードには検索セッションIDが付与されない。
【0097】
[第5実施形態]
引き続き、本発明にかかる検索結果順位付け方法および検索結果順位付けシステムの第5実施形態について説明する。第5実施形態の検索結果順位付けシステム1では、評価値集計装置10の検索セッション特定部11による検索セッションの特定方法が、第1〜第4実施形態と主に相違している。以下ではこの相違点を中心に説明する。
【0098】
第5実施形態において検索セッションを特定する手順を以下に示す。
手順1:ユーザID、タイムスタンプにより検索ログ情報をソートする。
手順2:種別=「検索要求」を持つレコードを始点として、始点と同一ユーザIDを持つレコードのうち、終点となるレコードまでを同一検索セッションIDとして特定する。終点としては、次に現れる種別=「検索要求」のレコードの一つ前か、あるいは最終レコードを終点として判断する(特許請求の範囲における「第1ステップ」に相当)。
手順3:手順2にて順次特定された当該検索セッションから検索要求レコードを除外する(特許請求の範囲における「第2ステップ」に相当)。
手順4:手順3にて検索要求レコードの除外後の複数の検索セッション間の時間間隔が一定時間以下である場合に、当該複数の検索セッションを一つの検索セッションとして統合する(特許請求の範囲における「第3ステップ」に相当)。
【0099】
図9、図15、および図16は、以上の手順に従い図7の検索ログ情報に対して付与された検索セッションIDの例を示すための図である。図9は上記の手順2が終了した時の様子を示す。実際、手順2までは第1実施形態と同様である。図15は上記の手順3が終了した時の様子を示す。種別=「検索要求」のレコードが削除されている。図16は上記の手順4が終了した時の様子を示す。図15におけるID「2」と「3」の検索セッションは時間間隔が約8分なので、手順4にて一つの検索セッションとして統合される。なお、図16は時間間隔を10分と設定した場合の例である。
【0100】
続いて、本実施形態にかかる検索結果順位付けシステム1の作用及び効果について説明する。本実施形態の検索結果順位付けシステム1によれば、ユーザの一連の検索行動を示す検索セッションにおける最後のレコードを抽出することで、検索結果の中からユーザが満足したページ(ユーザが満足したため検索行動を終了したページ)を特定・抽出することができる。この方法により集計した評価値を用いて各ページのスコアを演算し、そのスコアを検索結果の順位付けに利用することにより、よりユーザの嗜好を反映した検索結果順位付けが可能となる。
【0101】
また、検索要求から始まるユーザの一連の検索行動を一つの検索行動として特定することができる。具体的には、ユーザが検索装置20に検索語を投入したことを始まりとし、検索装置20により返されたその検索語に係る検索結果を閲覧した一連の行動を特定することができる。
【0102】
特に本発明の第2実施形態によれば、部分一致する複数の検索語による一連の検索行動をまとめて一つの検索行動として特定することができる。具体的には、ユーザが検索装置20に検索語を投入したことを始まりとし、検索装置20による検索結果を閲覧した結果を元に、当初の検索語を変更して再度検索語を投入して得た検索結果の閲覧行動をまとめて同一の検索行動として特定することが可能となる。
【0103】
特に本発明の第3実施形態によれば、所定の時間間隔以内で連続して行われた一連の検索行動をまとめて一つの検索行動として特定することができる。
【0104】
特に本発明の第4実施形態によれば、検索要求を示すレコードを始点とし、検索結果にアクセスしたことを示すレコードを終点とすることで、所定の時間間隔以内のユーザの検索行動をまとめて一つの検索セッションとして特定した場合に、検索要求を始点としない検索セッションはユーザの一連の検索行動を示すのに不適切なものとして除外することができる。
【0105】
特に本発明の第5実施形態によれば、複数の検索語の投入を含む連続して行った検索を一連の検索行動としてまとめることが可能である。また、第3実施形態と同様に、検索結果クリックから始まるという動作を一連の検索行動として不適切なものと判断し、検索セッションに含ませないというメリットがある。
【0106】
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限定されないことは言うまでもない。
【0107】
例えば、検索セッションを特定するステップS114では、検索セッションが、検索結果にアクセスしたことを示すレコードを一定数以下含むように、当該検索セッションを特定するようにしても良い。この場合には、検索結果に数多くアクセスしている例外的な検索行動を除外することができる。
【0108】
また、最終レコードを抽出するステップS116では、最終時刻におけるレコードのうち、特定のジャンルに属するレコードのみを最終レコードとして抽出するようにしても良い。この場合には、データの絞り込みにより評価値集計ステップS118の計算量を抑えることができる。また、検索結果順位付けに効果のあるジャンルにのみ、本評価値を与えることが可能になる。なお、ここでいう「特定のジャンル」とは、例えば、検索ソースの種別などが挙げられる。検索結果には、通常の結果に加え、画像、ニュース、ブログなどの複数の情報ソースからの検索結果が並んでいることが多い。クリック順やクリック数に相関のないジャンルを取り除きたい場合やクリックログからの評価値が特に有用なジャンルのみ得たい場合は、特定ジャンルのみの評価値を算出する。ただし、セッション特定にはすべてのクリックログが必要であるので、セッションを特定した後に、該当ジャンルに属する最終クリックを抽出する。
【符号の説明】
【0109】
1…検索結果順位付けシステム、10…評価値集計装置、11…検索セッション特定部、12…最終クリック集計部、13…集計結果格納部、20…検索装置、21…転送部、22…検索結果出力部、23…検索受付部、24…検索ログ情報記録部、25…スコア計算部、26…検索ログ情報蓄積部、27…スコア計算用データ格納部、30…クライアント端末、40…通信ネットワーク。
【特許請求の範囲】
【請求項1】
検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、
を備え、
前記評価値を集計するために、
前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップと、
前記検索セッション特定ステップにて特定された前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出ステップと、
前記最終レコード抽出ステップにて抽出された前記最終レコードを元に、前記評価値を集計する評価値集計ステップと、
を更に備えることを特徴とする検索結果順位付け方法。
【請求項2】
前記検索セッションは、
同一端末による前記検索行動における一連のレコードであって、
前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、
次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、
ことを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項3】
前記検索セッションは、
同一端末による前記検索行動における一連のレコードであって、
前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、
当該始点における前記検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、
ことを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項4】
前記検索セッションは、
同一端末による前記検索行動における一連のレコードであって、
それぞれ所定時間以下の時間間隔をおいて順次記録された前記一連のレコードからなる、
ことを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項5】
前記検索セッションは、
前記検索行動における検索要求を示すレコードを始点とし、
前記検索結果にアクセスしたことを示すレコードを終点とする、
ことを特徴とする請求項4に記載の検索結果順位付け方法。
【請求項6】
前記検索セッション特定ステップは、
同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、前記検索セッションを順次特定する第1ステップと、
前記第1ステップにて順次特定された当該検索セッションから前記検索要求レコードを除外する第2ステップと、
前記第2ステップにて前記検索要求レコードの除外後の複数の前記検索セッション間の時間間隔が一定時間以下である場合に、前記複数の検索セッションを一つの検索セッションとして統合する第3ステップと、
を備えることを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項7】
前記検索セッション特定ステップでは、
前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、
ことを特徴とする請求項1〜6の何れか1項に記載の検索結果順位付け方法。
【請求項8】
前記最終レコード抽出ステップでは、
前記最終時刻におけるレコードのうち、特定のジャンルに属するレコードのみを前記最終レコードとして抽出する、
ことを特徴とする請求項1〜7の何れか1項に記載の検索結果順位付け方法。
【請求項9】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項10】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項11】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項12】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記URLへアクセスした前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項13】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項14】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項15】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語が前記検索要求された回数を割った値を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項16】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語を前記検索要求した前記ユーザの数を割った値を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項17】
前記評価値集計ステップにおいては、
前記検索語が前記検索要求された回数が一定値以上の場合に、当該集計を行う、
ことを特徴とする請求項9〜16の何れか1項に記載の検索結果順位付け方法。
【請求項18】
前記評価値集計ステップにおいては、
前記検索語で前記検索要求を行った前記ユーザの数が一定値以上の場合に、当該集計を行う、
ことを特徴とする請求項9〜16の何れか1項に記載の検索結果順位付け方法。
【請求項19】
ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、
前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、
前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、
を備え、
前記評価値集計モジュールは、
前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定手段と、
前記検索セッション特定手段が特定した前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出手段と、
前記最終レコード抽出手段が抽出した前記最終レコードを元に、前記評価値を集計する評価値集計手段と、
を備えることを特徴とする検索結果順位付けシステム。
【請求項1】
検索装置に蓄積されたユーザの検索ログ情報より集計された評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算ステップと、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示ステップと、
を備え、
前記評価値を集計するために、
前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定ステップと、
前記検索セッション特定ステップにて特定された前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出ステップと、
前記最終レコード抽出ステップにて抽出された前記最終レコードを元に、前記評価値を集計する評価値集計ステップと、
を更に備えることを特徴とする検索結果順位付け方法。
【請求項2】
前記検索セッションは、
同一端末による前記検索行動における一連のレコードであって、
前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、
次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、
ことを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項3】
前記検索セッションは、
同一端末による前記検索行動における一連のレコードであって、
前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、
当該始点における前記検索要求で入力された検索語と部分文字列の関係でない検索語による別の検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、
ことを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項4】
前記検索セッションは、
同一端末による前記検索行動における一連のレコードであって、
それぞれ所定時間以下の時間間隔をおいて順次記録された前記一連のレコードからなる、
ことを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項5】
前記検索セッションは、
前記検索行動における検索要求を示すレコードを始点とし、
前記検索結果にアクセスしたことを示すレコードを終点とする、
ことを特徴とする請求項4に記載の検索結果順位付け方法。
【請求項6】
前記検索セッション特定ステップは、
同一端末による前記検索行動における一連のレコードであって、前記検索行動における検索要求を示すレコードである検索要求レコードを始点とし、次に現れた前記検索要求レコードの一つ前のレコードか、または前記検索ログ情報全体における最終のレコードを終点とする、前記検索セッションを順次特定する第1ステップと、
前記第1ステップにて順次特定された当該検索セッションから前記検索要求レコードを除外する第2ステップと、
前記第2ステップにて前記検索要求レコードの除外後の複数の前記検索セッション間の時間間隔が一定時間以下である場合に、前記複数の検索セッションを一つの検索セッションとして統合する第3ステップと、
を備えることを特徴とする請求項1に記載の検索結果順位付け方法。
【請求項7】
前記検索セッション特定ステップでは、
前記検索セッションが前記検索結果にアクセスしたことを示すレコードを一定数以下含むように、前記検索セッションを特定する、
ことを特徴とする請求項1〜6の何れか1項に記載の検索結果順位付け方法。
【請求項8】
前記最終レコード抽出ステップでは、
前記最終時刻におけるレコードのうち、特定のジャンルに属するレコードのみを前記最終レコードとして抽出する、
ことを特徴とする請求項1〜7の何れか1項に記載の検索結果順位付け方法。
【請求項9】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項10】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項11】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記ユーザが前記URLへアクセスした回数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項12】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記URLへアクセスした前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項13】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項14】
前記評価値集計ステップにおいては、
前記検索装置からの前記検索結果より前記ユーザがアクセスしたURLの属するカテゴリに基づき、前記URLへアクセスした前記ユーザの数を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項15】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語が前記検索要求された回数を割った値を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項16】
前記評価値集計ステップにおいては、
前記検索行動における検索要求で入力された検索語、および当該検索要求に対し前記検索装置により返された前記検索結果より前記ユーザがアクセスしたURLに基づき、前記検索語に関連して前記ユーザが前記URLへアクセスした回数から、前記検索語を前記検索要求した前記ユーザの数を割った値を前記評価値として集計する、
ことを特徴とする請求項1〜8の何れか1項に記載の検索結果順位付け方法。
【請求項17】
前記評価値集計ステップにおいては、
前記検索語が前記検索要求された回数が一定値以上の場合に、当該集計を行う、
ことを特徴とする請求項9〜16の何れか1項に記載の検索結果順位付け方法。
【請求項18】
前記評価値集計ステップにおいては、
前記検索語で前記検索要求を行った前記ユーザの数が一定値以上の場合に、当該集計を行う、
ことを特徴とする請求項9〜16の何れか1項に記載の検索結果順位付け方法。
【請求項19】
ユーザの検索ログ情報を蓄積する検索ログ情報蓄積手段と、
前記検索ログ情報蓄積手段に蓄積された前記検索ログ情報より評価値を集計する評価値集計モジュールと、
前記評価値集計モジュールが集計した評価値を利用し、検索結果表示用画面に表示される検索結果の表示順の順位付けに用いられるスコアを計算するスコア計算手段と、
前記スコアを用いて前記順位付けを行い、前記検索結果を前記検索結果表示用画面に当該順位順で表示させる検索結果表示手段と、
を備え、
前記評価値集計モジュールは、
前記検索ログ情報より、前記ユーザの一連の検索行動を表す検索セッションを特定する検索セッション特定手段と、
前記検索セッション特定手段が特定した前記検索セッションを構成するレコードのうち最終時刻におけるレコードである最終レコードを抽出する最終レコード抽出手段と、
前記最終レコード抽出手段が抽出した前記最終レコードを元に、前記評価値を集計する評価値集計手段と、
を備えることを特徴とする検索結果順位付けシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2011−154467(P2011−154467A)
【公開日】平成23年8月11日(2011.8.11)
【国際特許分類】
【出願番号】特願2010−14581(P2010−14581)
【出願日】平成22年1月26日(2010.1.26)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【出願人】(504126835)エヌ・ティ・ティ レゾナント株式会社 (60)
【Fターム(参考)】
【公開日】平成23年8月11日(2011.8.11)
【国際特許分類】
【出願日】平成22年1月26日(2010.1.26)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【出願人】(504126835)エヌ・ティ・ティ レゾナント株式会社 (60)
【Fターム(参考)】
[ Back to top ]