説明

検索ランキング生成装置及び方法

【課題】ユーザが購入する可能性の高い商品を取り扱う商品紹介ページを検索結果の上位にランキングすること。
【解決手段】検索ランキング生成装置(1)は、ユーザ端末から受け付けた検索クエリを記憶する検索クエリログデータベース(21)と、ユーザ端末から受け付けたWebページの遷移操作(例えば、リンクのクリック操作)を記憶するクリックログデータベース(22)と、購入操作を受け付けた商品の商品属性を記憶する購入情報ログデータベース(23)と、を備え、各データベースを操作履歴を示す操作履歴情報により結び付ける。そして、検索ランキング生成装置(1)は、検索操作から始まる一連の操作に基づき購入された商品の商品属性を参照して、ユーザが購入する可能性の高い商品属性を評価するスコアを検索クエリ毎に算出し、検索クエリ毎に検索結果のランキングを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネット上のWebページを検索するWebページ検索システムのランキングを生成する検索ランキング生成装置及び方法に関する。
【背景技術】
【0002】
従来、通信ネットワークを介してウェブサーバと接続可能な端末装置を用いて買い物を行うネットショッピングやネットオークションに関する技術が知られている(特許文献1)。このようなネットショッピングやネットオークションを行うWebサイト(以下「商品販売サイト」とする)のそれぞれでは、取り扱う商品が多岐にわたるため、商品の購入を希望するユーザは、まず検索システムにおいて当該商品に関連する検索クエリ(例えば、商品名)に基づく検索を行うことが一般的である。
【0003】
この点、従来における検索システムでは、閲覧回数(クリック数)が高い検索結果を一般的に興味が高い情報と推定して優先的に表示したり(例えば、特許文献2参照)、ユーザから入力された検索クエリとWebページとの関係性に基づいて検索結果として表示する順位を決定している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平11−219389号公報
【特許文献2】特開2005−190065号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来における検索システムでは、ユーザがクリックする可能性の高いWebページを上位にランキングした検索結果を提示できるものの、クリックした先のWebページにおいてユーザが実際に商品の購入をする可能性とは必ずしも相関していなかった。
【0006】
そこで、本発明は、ユーザが購入する可能性の高い商品を取り扱うWebページを検索結果の上位にランキング可能な検索ランキング生成装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
(1) インターネット上のWebページを検索するWebページ検索システムのランキングを生成する検索ランキング生成装置であって、ユーザ端末から商品の検索クエリの入力を受け付けたことに応じて、当該検索クエリに対応付けてユーザ識別情報及びタイムスタンプを含む前記ユーザ端末の操作履歴を示す操作履歴情報を記憶する検索クエリログデータベースと、ユーザ端末からWebページへの遷移操作を受け付けたことに応じて、遷移先のWebページに対応付けて前記操作履歴情報を記憶するクリックログデータベースと、ユーザ端末から商品の購入操作を受け付けたことに応じて、商品を購入したWebページに対応付けて前記操作履歴情報及び当該商品の商品属性を記憶する購入情報ログデータベースと、前記検索クエリログデータベース、前記クリックログデータベース及び前記購入情報ログデータベースに記憶された前記操作履歴情報及び前記商品属性に基づいて、検索クエリに対応付けて購入操作を受け付ける可能性の高さを示すスコアを商品の商品属性毎に算出するスコア算出手段と、前記スコア算出手段が算出した前記スコア及び前記商品を購入したWebページに含まれる商品属性に基づいて、検索クエリに対するWebページのランキングを生成するランキング生成手段と、を備える検索ランキング生成装置。
【0008】
(1)の検索ランキング生成装置によれば、購入実績を記憶する購入情報ログデータベースに記憶された情報を参照してスコアを算出しランキングを生成するため、ユーザが購入操作を実行する可能性の高い商品を取り扱うWebページを検索結果の上位にランキングすることができる。
【0009】
ここで、検索ランキング生成装置では、購入情報ログデータベースに加え、ユーザ端末から受け付けた検索クエリを記憶する検索クエリログデータベースと、ユーザ端末から受け付けたWebページの遷移操作(例えば、リンクのクリック操作)を記憶するクリックログデータベースと、を備え、各データベースをユーザ端末の操作履歴を示す操作履歴情報により結び付ける。これにより、ユーザの操作履歴を特定することができ、ユーザにより購入された商品が、検索操作から始まる一連の操作に基づくものであるか、一連の操作以外の操作に基づくものであるか判別することができる。そして、検索ランキング生成装置は、検索操作から始まる一連の操作に基づき購入された商品の商品属性を参照して、ユーザが購入する可能性の高い商品属性の商品を販売するWebページを評価するスコアを検索クエリ毎に算出する。
これにより、検索ランキング生成装置によれば、購入実績を参照して検索ランキングを生成するだけでなく、検索クエリ毎に、どのような商品属性がユーザの購入意欲に寄与するものであるか特定することができ、ユーザが購入する可能性の高い商品を取り扱うWebページを検索結果の上位にランキングすることができる。
【0010】
なお、「商品属性」とは、商品種別、商品名、商品メーカー、出品者、出品数、出品者の評価、入札数、残り入札時間、発送日時、価格などの商品に付随する様々な情報を含み、本発明の検索ランキング生成装置の管理者が任意に設定する。
【0011】
(2) 前記スコア算出手段は、前記検索クエリログデータベース、前記クリックログデータベース及び前記購入情報ログデータベースに記憶された前記操作履歴情報に基づいて、検索クエリと操作履歴とを関連付け、トレーニングデータとして提供するログ解析手段と、提供された前記トレーニングデータをフィードとして機械学習を行い、検索クエリ毎に前記スコアを算出する学習手段と、を備える(1)に記載の検索ランキング生成装置。
【0012】
(2)の検索ランキング生成装置によれば、学習手段は、ログ解析手段により関連付けられた情報をトレーニングデータとして機械学習し、検索クエリ毎に有意な商品属性のスコアを算出する。これにより、検索クエリ毎に有意な商品属性を自動的に特定することができ、ユーザが購入する可能性の高い商品を取り扱うWebページを検索結果の上位にランキングすることができる。
【0013】
(3) コンピュータが実行する、インターネット上のWebページを検索するWebページ検索システムのランキングを生成する方法であって、ユーザ端末から商品の検索クエリの入力を受け付けたことに応じて、当該検索クエリに対応付けてユーザ識別情報及びタイムスタンプを含む前記ユーザ端末の操作履歴を示す操作履歴情報を検索クエリログデータベースに記憶するステップと、ユーザ端末からWebページへの遷移操作を受け付けたことに応じて、遷移先のWebページに対応付けて前記操作履歴情報をクリックログデータベースに記憶するステップと、ユーザ端末から商品の購入操作を受け付けたことに応じて、商品を購入したWebページに対応付けて前記操作履歴情報及び当該商品の商品属性を購入情報ログデータベースに記憶するステップと、前記検索クエリログデータベース、前記クリックログデータベース及び前記購入情報ログデータベースに記憶された前記操作履歴情報及び前記商品属性に基づいて、検索クエリに対応付けて購入操作を受け付ける可能性の高さを示すスコアを商品の商品属性毎に算出するステップと、算出した前記スコア及び前記商品を購入したWebページに含まれる商品属性に基づいて、検索クエリに対するWebページのランキングを生成するステップと、を含む方法。
【0014】
(3)の方法によれば、(1)の検索ランキング生成装置と同様の効果を奏する。
【発明の効果】
【0015】
本発明によれば、ユーザが購入する可能性の高い商品を取り扱うWebページを検索結果の上位にランキングすることができる。
【図面の簡単な説明】
【0016】
【図1】本発明の検索ランキング生成装置の機能構成を示すブロック図である。
【図2】検索クエリログデータベースを示す図である。
【図3】クリックログデータベースを示す図である。
【図4】購入情報ログデータベースを示す図である。
【図5】関連付けデータベースを示す図である。
【図6】スコア管理データベースを示す図である。
【図7】検索操作を契機とする一連の操作の例を示す図である。
【図8】ランキング生成処理を示すフローチャートである。
【図9】別実施形態の検索ランキング生成装置の機能構成を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、本発明の検索ランキング生成装置1の実施形態について図面を参照して説明する。本発明の検索ランキング生成装置1は、検索システムにおいて、Webページ(商品紹介ページ)が取り扱う商品の商品属性に基づいて重み付けしたランキングを決定、すなわち、ユーザの購入意欲に寄与する商品属性の商品を取り扱うWebページに一定の優位性を持たせたランキングを決定する。
【0018】
[検索ランキング生成装置1の構成]
図1を参照して、本発明の検索ランキング生成装置1の構成について説明する。
検索ランキング生成装置1は、ユーザ端末30と通信可能に接続され、検索クエリ受付手段11と、クリック受付手段12と、購入要求受付手段13と、スコア算出手段14と、ランキング生成手段15と、検索クエリログデータベース21と、クリックログデータベース22と、購入情報ログデータベース23と、スコア管理データベース24と、商品ページデータベース25と、を含んで構成される。
【0019】
検索クエリ受付手段11は、ユーザ端末30から検索クエリの入力を受け付け、受け付けた検索クエリを検索クエリログデータベース21に記憶する。ここで、検索クエリ受付手段11は、ユーザ(詳細にはユーザ端末30)を識別するユーザ識別情報(bcookie)や検索クエリの入力を受け付けた日時を示すタイムスタンプなどを検索クエリと併せて受信し、検索クエリログデータベース21に記憶する。
【0020】
検索クエリログデータベース21は、図2に示すように、検索クエリ受付手段11が受け付けた検索クエリに対応付けて、ユーザ識別情報及びタイムスタンプなどを記憶する。ここで、ユーザ識別情報及びタイムスタンプなどは、後述するように検索操作を契機とするユーザ端末30の一連の操作を特定するために用いられる情報であり、以下では「操作履歴情報」と称する。なお、「操作履歴情報」は、ユーザ識別情報及びタイムスタンプのみに限られず、ユーザ端末30の一連の操作を特定するのに必要な他の情報を用いることとしてもよい。
【0021】
クリック受付手段12は、ユーザ端末30からWebページの遷移操作を受け付ける。ここで、「遷移操作」とは、リンクが設定されたアンカーテキストに対するクリック操作やリンク先のURLをアドレスバーに入力する操作などをいう。クリック受付手段12は、ユーザ端末30から遷移操作を受け付けると、ユーザ識別情報、タイムスタンプ、及びリンク元のWebページ(現在のWebページ)の情報を示すリファラ情報などの操作履歴情報を、遷移先のWebページのURLに対応付けてクリックログデータベース22に記憶する。
【0022】
クリックログデータベース22は、図3に示すようにクリック受付手段12が受け付けた遷移操作の遷移先のWebページのURLに対応付けて、操作履歴情報を記憶する。ここで、クリックログデータベース22には、操作履歴情報としてリファラ情報が記憶され、検索操作を契機とするユーザ端末30の一連の操作を特定するために用いられる。すなわち、例えば、リファラ情報が検索結果画面を示す情報である場合には、検索結果として提示されたWebページに対する遷移操作であり、検索操作を契機とするユーザ端末30の一連の操作であることを特定できる。
【0023】
購入要求受付手段13は、ユーザ端末30から商品販売サイト内における商品の購入操作を受け付け、操作履歴情報及び購入された商品の商品属性を、購入された商品を紹介する商品紹介ページのURLに対応付けて購入情報ログデータベース23に記憶する。ここで、本実施形態における購入操作とは、購入ボタンをクリックする操作に加え、入札ボタンをクリックする操作を含む。すなわち、本実施形態の商品販売サイトには、ネットショッピングサイトやネットオークションサイトが含まれるが、ネットショッピングサイトである場合には、購入ボタンのクリックが購入操作に該当し、ネットオークションサイトである場合には、入札ボタンのクリックが購入操作に該当する。
【0024】
購入情報ログデータベース23は、図4に示すように購入要求受付手段13が受け付けた購入操作により購入された商品を紹介する商品紹介ページのURLに対応付けて、操作履歴情報及び購入された商品の商品属性を記憶する。ここで、「商品属性」とは、商品種別、商品名、商品メーカー、出品者、出品数、出品者の評価、入札数、残り入札時間、発送日時、価格などの商品を特定するための様々な情報を含み、本発明の検索ランキング生成装置1の管理者が設定した任意の情報を用いることができる。
購入情報ログデータベース23には、操作履歴情報としてリファラ情報が記憶され、検索操作を契機とするユーザ端末30の一連の操作を特定するために用いられる。
【0025】
スコア算出手段14は、検索クエリログデータベース21、クリックログデータベース22及び購入情報ログデータベース23に記憶された操作履歴情報及び商品属性に基づいて、検索クエリに対応付けて購入操作の受け付け易さを示すスコアを商品の商品属性毎に算出する。すなわち、スコア算出手段14は、ユーザの購入意欲に寄与する商品属性を評価するためのスコアを検索クエリ毎に算出する。
このようなスコアを算出するため、スコア算出手段14は、ログ解析手段141と、関連付けデータベース142と、学習手段143と、を含んで構成される。
【0026】
ログ解析手段141は、検索クエリログデータベース21、クリックログデータベース22及び購入情報ログデータベース23に記憶された操作履歴情報を解析し、検索操作を契機とする一連の操作履歴を特定する。より具体的には、ログ解析手段141は、検索を契機として商品が購入されたか否かを特定する。
一例として、ログ解析手段141は、ユーザ識別情報を同一とする操作履歴情報のリファラ情報やタイムスタンプを参照し、ユーザ端末30の一連の操作履歴を特定し、検索を契機として商品が購入されたか否かを特定する。
【0027】
検索操作を契機とする操作履歴の範囲については、任意に設定することができ、図7を参照して具体的に説明する。
図7(1)は検索結果ページ100であり、図7(2)は商品紹介ページ200であり、図7(3)は商品紹介ページ300である。
【0028】
検索結果ページ100は、検索システムにおいて検索クエリ「自転車」に基づく検索結果を提示する検索結果ページであり、図7(1)では、検索結果として「自転車A」「自転車B」「自転車C」「電動自転車A」などを提示している。
商品紹介ページ200は、「自転車A」を紹介/販売する商品紹介ページであり、「自転車A」の商品属性や「自転車A」の入札ボタンに加え、「自転車A」に関連するおススメ商品を提示する。図7(2)の商品紹介ページ200では、「自転車A」に関連するおススめ商品として「自転車B」「自転車C」「自転車D」などを提示している。
商品紹介ページ300は、「自転車B」を紹介/販売する商品紹介ページであり、「自転車B」の商品属性や「自転車B」の入札ボタンに加え、「自転車B」に関連するおススメ商品を提示する。
【0029】
図7では、ユーザ端末30から購入操作A又は購入操作Bを受け付けている。これら購入操作A及び購入操作Bを参照して、検索操作を契機とする操作履歴の範囲について説明する。
【0030】
購入操作Aは、検索結果ページ100において提示された検索結果「自転車A」がクリックされたことにより遷移した商品紹介ページ200における入札ボタンのクリックによる、「自転車A」に対する購入操作である。すなわち、購入操作Aは、検索操作による検索結果ページ100から直接的に遷移した商品紹介ページ200における購入操作であり、検索操作を契機とする操作履歴に含まれる。
【0031】
購入操作Bは、検索結果ページ100において提示された検索結果「自転車A」がクリックされたことにより遷移した商品紹介ページ200において、おススメ商品「自転車B」がクリックされたことにより更に遷移した商品紹介ページ300における入札ボタンのクリックによる、「自転車B」に対する購入操作である。すなわち、購入操作Bは、検索操作による検索結果ページ100から商品紹介ページ200を介して間接的に遷移した商品紹介ページ300における購入操作である。
このような、検索結果ページから間接的に遷移した商品紹介ページにおける購入操作は、検索操作を契機とする操作履歴として含むこととしてもよく、含まないこととしてもよい。
例えば、検索結果ページから購入操作を受け付けた商品紹介ページまでのページ遷移数(リファラ情報から判定)が所定数以内である場合に検索操作を契機とする操作履歴に含めることとしてもよく、所定数より大きい場合に検索操作を契機とする操作履歴に含まないこととしてもよい。また、検索操作を受け付けてから購入操作を受け付けるまでの時間(タイムスタンプから判定)が所定時間以内である場合に検索操作を契機とする操作履歴に含めることとしてもよく、所定時間より大きい場合に検索操作を契機とする操作履歴に含まないこととしてもよい。
また、検索クエリと商品紹介ページの商品との関連性に基づいて、検索操作を契機とする操作履歴として含むこととしてもよく、含まないこととしてもよい。例えば、図7の購入操作Bにより入札された商品は「自転車B」であり、検索クエリ「自転車」と一定以上の関連性を有しているため、検索操作を契機とする操作履歴として含むこととする。これに対して、検索クエリ「自転車」による検索結果ページからページ遷移を重ね「乾電池Z」に対する購入操作Cが行われた場合には、商品「乾電池Z」と検索クエリ「自転車」とには一定以上の関連性がないため、購入操作Cを検索操作を契機とする操作履歴に含まないこととしてもよい。
【0032】
ログ解析手段141は、検索操作を契機とする操作履歴を特定すると、検索クエリ毎に特定した操作履歴及び当該操作履歴に含まれる商品紹介ページにおいて紹介/販売する商品の商品属性などを対応付けて、関連付けデータベース142に記憶する。
【0033】
関連付けデータベース142は、図5に示すように検索クエリ毎に操作履歴及び商品属性などを対応付けて記憶する。
ここで、「操作履歴」は、商品紹介ページ毎に特定され、当該商品紹介ページへの遷移の有無(すなわち、当該商品紹介ページへのリンクがクリックされたか否か)と当該商品紹介ページにおける購入操作の有無を少なくとも含む。すなわち、「操作履歴」には、当該商品紹介ページに遷移しなかった情報や当該商品紹介ページでは商品が購入(入札)されなかった情報が含まれる。例えば、図7の購入操作Bを参照して、購入操作Bでは、検索クエリ「自転車」に対して、「自転車A」「自転車B」がクリックされ、「自転車C」「自転車D」「電動自転車A」はクリックされていない。そのため、関連付けデータベース142では、「自転車A」「自転車B」を紹介する商品紹介ページに対してクリックの有無が「○」になり、「自転車C」「自転車D」「電動自転車A」を紹介する商品紹介ページに対してクリックの有無が「×」になる。また、購入操作Bでは、「自転車B」に対する入札が行われたが、「自転車A」に対する入札は行われていない。そのため、「自転車B」を紹介する商品紹介ページに対して購入の有無が「○」になり、「自転車A」を紹介する商品紹介ページに対して購入の有無が「×」になる。
【0034】
なお、関連付けデータベース142は、実際に購入(入札)された商品の商品属性だけでなく、購入(入札)されなかった商品の商品属性についても検索クエリに対応付けて記憶することが好ましい。ユーザが購入(入札)することのなかった商品属性もユーザの購入意欲に寄与する商品属性の特定に用いることができるためである。一例としては、価格「9000円」の時には購入(入札)された商品が価格「10000円」の時には購入(入札)されなかったとすると、当該商品は、価格「10000円未満」である場合に購入され易い商品であると特定することができる。
【0035】
学習手段143は、関連付けデータベース142に記憶された情報をトレーニングデータとして受け取り、検索クエリ毎にユーザの購入意欲に寄与する商品属性を評価するためのスコアを算出する。学習手段143が算出した検索クエリ毎のスコアは、スコア管理データベース24に記憶される。
【0036】
スコア管理データベース24は、図6に示すように、検索クエリ毎にユーザの購入意欲に寄与する商品属性を評価するためのスコアを記憶する。図6を参照して、スコア管理データベース24に記憶されるスコアの一例について説明する。
例えば、検索クエリ「自転車」である場合には、商品属性「価格」が大きな影響を与え、商品属性「商品種別(自転車、電動自転車など)」は中程度の影響を与えるなどといったスコアが記憶される。また、検索クエリ「骨董品」である場合には、商品属性「出品者」や「評価数」が大きな影響を与え、商品属性「価格」はほとんど影響を与えないなどといったスコアが記憶される。また、検索クエリ「単三電池」である場合には、商品属性「商品種別(単三電池、単一電池など)」「価格」が大きな影響を与え、商品属性「商品名」「商品メーカ」などはほとんど影響を与えないなどといったスコアが記憶される。
なお、図6に示すスコア管理データベース24は、説明の理解を容易にするためのものであり、実際には、検索クエリ毎にスコアを算出するための所定の計算式が記憶される。例えば、検索クエリ「単三電池」に対して、商品種別が「単三電池」である場合にスコア「100」が加算され「単一電池」である場合にスコア「0」が加算され、価格「0〜100円」である場合にスコア「100」が加算され「101〜200円」である場合にスコア「50」が加算され「201〜999円」である場合にスコア「10」が加算されるなどといった図6に示す影響度を反映した計算式が、検索クエリ毎に記憶される。
【0037】
ランキング生成手段15は、スコア管理データベース24及び商品ページデータベース25を参照して、検索結果として提示するWebページのランキングを検索クエリ毎に生成する。ここで、商品ページデータベース25(図示せず)は、商品販売サイト内の商品紹介ページ毎に当該商品紹介ページで紹介/販売する商品の商品属性を記憶する。
ランキング生成手段15は、商品ページデータベース25に記憶された商品属性に対して、スコア管理データベース24に記憶されたスコア(計算式)に基づく所定の計算を行い、検索クエリ毎にWebページのランキングを生成する。
なお、ランキング生成手段15が生成したランキングは、商品販売サイト内の検索システムのみに適用することとしてもよく、ネットワーク全体に用いられる検索システムに適用することとしてもよい。
【0038】
[検索ランキング生成装置1のハードウェア構成]
以上説明した検索ランキング生成装置1のハードウェアは、1又は複数の一般的なコンピュータによって構成することができる。一般的なコンピュータは、例えば、制御部として、中央処理装置(CPU)を備える他、記憶部として、メモリ(RAM、ROM)、ハードディスク(HDD)及び光ディスク(CD、DVDなど)を、ネットワーク通信装置として、各種有線及び無線LAN装置を、表示装置として、例えば、液晶ディスプレイ、プラズマディスプレイなどの各種ディスプレイを、入力装置として、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボールなど)を適宜備え、これらは、バスラインにより接続されている。このような一般的なコンピュータにおいて、CPUは、検索ランキング生成装置1を統括的に制御し、各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
【0039】
[検索ランキング生成装置1の処理]
続いて、図8を参照して、検索ランキング生成装置1のランキング生成処理について説明する。検索ランキング生成装置1は、予め定められた所定のタイミングでランキング生成処理を実行する。
【0040】
S1:初めに、スコア算出手段14(ログ解析手段141)は、ネットワーク上における各種ログをリアルタイムに記憶する検索クエリログデータベース21、クリックログデータベース22及び購入情報ログデータベース23から検索クエリや操作履歴情報などの各種情報を抽出する。
S2:続いて、スコア算出手段14(ログ解析手段141)は、操作履歴情報に基づいて検索操作を契機とする一連の操作履歴を特定し、検索クエリと関連付け、関連付けデータベース142に記憶する。このとき、スコア算出手段14(ログ解析手段141)は、操作履歴に含まれる商品紹介ページで紹介/販売する商品の商品属性も検索クエリと関連付けて関連付けデータベース142に記憶する。
【0041】
S3:続いて、スコア算出手段14(学習手段143)は、関連付けデータベース142に記憶された情報をトレーニングデータとして機械学習を行い、検索クエリ毎にユーザの購入意欲に寄与する商品属性の影響度を算出し、スコア管理データベース24に記憶する。
S4:続いて、ランキング生成手段15は、スコア管理データベース24及び商品ページデータベース25を参照して、検索クエリ毎に検索結果として提示するWebページのランキングを生成する。
【0042】
[検索ランキング生成装置1の効果]
以上のような検索ランキング生成装置1によれば、購入情報ログデータベース23に記憶された購入情報ログ(購入実績)を参照してランキングを生成するため、検索システムにおいてユーザが購入する傾向の強い商品を紹介する商品紹介ページを上位にランキングすることができる。
【0043】
このとき、検索ランキング生成装置1では、購入実績だけでなく購入された(又はされない)商品の商品属性を参照し、検索クエリ毎にどのような商品属性がユーザの購入意欲に寄与するものであるか特定した上でランキングを生成する。これにより、検索ランキング生成装置1では、購入実績のある商品を紹介/販売する商品紹介ページを単に上位にランキングするのではなく、ユーザに購入されると予測される商品属性の商品を紹介/販売する商品紹介ページを上位にランキングすることができ、販売実績のない商品であっても、適切に検索結果の上位にランキングすることができる。
その結果、検索ランキング生成装置1では、検索システムにおいて、ユーザが所望する商品を紹介/販売する商品販売サイトを上位に適切に表示することができ、ユーザの利便性を高めることができる。
【0044】
なお、ランキングを生成するための検索操作を契機とする操作履歴は、商品販売サイト内の検索システムにおける検索操作を契機とする操作履歴のみであってもよく、ネットワーク全体に用いられる検索システムにおける検索操作を契機とする操作履歴全体であってもよい。
このとき、ネットワーク全体に用いられる検索システムにおける検索操作を契機とする操作履歴全体を用いる場合には、検索操作を契機として商品が購入された割合や、検索操作を契機として商品販売サイトまで遷移した割合など考慮して検索クエリ毎にスコアを算出することが好ましい。これにより、検索クエリ毎にユーザの検索意図(すなわち、商品購入の意図を持っているのか、単なる情報検索のためであるのか)を反映したスコアを算出することができる。その結果、商品購入の可能性の高い検索クエリである場合には、商品属性による重み付けを大きくしたランキングを生成でき、商品購入の可能性の低い検索クエリである場合には、商品属性による重み付けを小さくしたランキングを生成することができる。
【0045】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
【0046】
上記実施形態では、検索クエリ毎のスコアの算出をログ解析手段141が解析した情報をトレーニングデータとする機械学習により行うこととしているが、検索クエリ毎のスコアの算出は機械学習に限られるものではない。例えば、検索クエリ毎のスコアの算出を、ルールベースの判定で行うこととしてもよい。このようなルールベースの判定により検索クエリ毎のスコアを算出する別実施形態の検索ランキング生成装置1Aの機能構成を示すブロック図を図9に示す。
別実施形態の検索ランキング生成装置1Aでは、学習手段143に代えてルール判定手段143Aを備える。ルール判定手段143Aは、予め定められたルールに従い、ログ解析手段141が解析し関連付けデータベース142に記憶された情報(操作履歴及び商品属性)に基づいて、検索クエリ毎のスコアを算出する。一例としては、商品名毎の購入件数(購入の有無)を抽出し、購入件数上位所定数の商品の購入件数が当該商品名を含む商品紹介ページの表示件数(クリック件数)全体の8割を超えていれば、当該検索クエリに対して商品名が大きな影響を与えるといったスコアを算出し、購入件数上位所定数の商品の購入件数が当該商品名を含む商品紹介ページの表示件数(クリック件数)全体の4割に満たない場合には、当該検索クエリに対して商品名が小さな影響を与えるといったスコアを算出する。
また、ルール判定手段143Aは、商品名毎の購入件数(購入の有無)を抽出し、非購入件数上位所定数の商品の非購入件数が、当該商品名を含む商品紹介ページの表示件数(クリック件数)全体の8割を超えている場合にも、当該検索クエリに対して商品名が大きな影響(否定的な影響)を与えるといったスコアを算出する。
このように、関連付けデータベース142に記憶された情報に対して予め定められたルールに従いスコアを算出しても、上記実施形態の検索ランキング生成装置1Aと同様に、図6に示すスコア管理データベース24を生成することができる。
【0047】
また、本発明は、検索クエリ毎にユーザの購入意欲に寄与する商品属性を評価するためのスコアを算出しランキングを生成するものであり、上記実施形態で参照していた情報(例えば、検索ログ、操作履歴情報、商品属性)以外の情報を参照して当該スコアを算出することとしてもよい。例えば、検索結果として表示されていたランキングも併せて参照して当該スコアを算出することとしてもよい。すなわち、ランキングが高いにも関わらず購入操作を受け付けなかった商品の商品属性やランキングが低いにも関わらず購入操作を受け付けた商品の商品属性などは、ユーザの購入意欲により強く寄与する特性を有している可能性があり、購入操作を受け付けた(又は受け付けない)商品紹介ページの検索結果のランキングに基づいて所定の重み付けをした上でスコアを算出することとしてもよい。
【符号の説明】
【0048】
1 検索ランキング生成装置
11 検索クエリ受付手段
12 クリック受付手段
13 購入要求受付手段
14 スコア算出手段
141 ログ解析手段
142 関連付けデータベース
143 学習手段
15 ランキング生成手段
21 検索クエリログデータベース
22 クリックログデータベース
23 購入情報ログデータベース
24 スコア管理データベース
25 商品ページデータベース
30 ユーザ端末

【特許請求の範囲】
【請求項1】
インターネット上のWebページを検索するWebページ検索システムのランキングを生成する検索ランキング生成装置であって、
ユーザ端末から商品の検索クエリの入力を受け付けたことに応じて、当該検索クエリに対応付けてユーザ識別情報及びタイムスタンプを含む前記ユーザ端末の操作履歴を示す操作履歴情報を記憶する検索クエリログデータベースと、
ユーザ端末からWebページへの遷移操作を受け付けたことに応じて、遷移先のWebページに対応付けて前記操作履歴情報を記憶するクリックログデータベースと、
ユーザ端末から商品の購入操作を受け付けたことに応じて、商品を購入したWebページに対応付けて前記操作履歴情報及び当該商品の商品属性を記憶する購入情報ログデータベースと、
前記検索クエリログデータベース、前記クリックログデータベース及び前記購入情報ログデータベースに記憶された前記操作履歴情報及び前記商品属性に基づいて、検索クエリに対応付けて購入操作を受け付ける可能性の高さを示すスコアを商品の商品属性毎に算出するスコア算出手段と、
前記スコア算出手段が算出した前記スコア及び前記商品を購入したWebページに含まれる商品属性に基づいて、検索クエリに対するWebページのランキングを生成するランキング生成手段と、
を備える検索ランキング生成装置。
【請求項2】
前記スコア算出手段は、
前記検索クエリログデータベース、前記クリックログデータベース及び前記購入情報ログデータベースに記憶された前記操作履歴情報に基づいて、検索クエリと操作履歴とを関連付け、トレーニングデータとして提供するログ解析手段と、
提供された前記トレーニングデータをフィードとして機械学習を行い、検索クエリ毎に前記スコアを算出する学習手段と、
を備える請求項1に記載の検索ランキング生成装置。
【請求項3】
コンピュータが実行する、インターネット上のWebページを検索するWebページ検索システムのランキングを生成する方法であって、
ユーザ端末から商品の検索クエリの入力を受け付けたことに応じて、当該検索クエリに対応付けてユーザ識別情報及びタイムスタンプを含む前記ユーザ端末の操作履歴を示す操作履歴情報を検索クエリログデータベースに記憶するステップと、
ユーザ端末からWebページへの遷移操作を受け付けたことに応じて、遷移先のWebページに対応付けて前記操作履歴情報をクリックログデータベースに記憶するステップと、
ユーザ端末から商品の購入操作を受け付けたことに応じて、商品を購入したWebページに対応付けて前記操作履歴情報及び当該商品の商品属性を購入情報ログデータベースに記憶するステップと、
前記検索クエリログデータベース、前記クリックログデータベース及び前記購入情報ログデータベースに記憶された前記操作履歴情報及び前記商品属性に基づいて、検索クエリに対応付けて購入操作を受け付ける可能性の高さを示すスコアを商品の商品属性毎に算出するステップと、
算出した前記スコア及び前記商品を購入したWebページに含まれる商品属性に基づいて、検索クエリに対するWebページのランキングを生成するステップと、
を含む方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−203821(P2012−203821A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−70206(P2011−70206)
【出願日】平成23年3月28日(2011.3.28)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】