説明

情報処理装置および方法、プログラム、並びに記録媒体

【課題】簡単に、かつ迅速に、広告を表示させる権利が販売されるキーワードであって、有用なキーワードを取得する。
【解決手段】特徴語抽出部103は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出する。サーチキーワード集合更新部105は、抽出された特徴語を、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する。本発明は、サーバに適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報処理装置および方法、プログラム、並びに記録媒体に関し、特に、販売するキーワードを記録できるようにした情報処理装置および方法、プログラム、並びに記録媒体に関する。
【背景技術】
【0002】
ある単語をクエリとして、Webページ(以下、単にページと称する)を検索すると、その結果が表示されるページに広告が表示されることがある。
【0003】
従来、所定の単語をクエリとして検索した結果が表示されるページに広告を表示させる権利を販売することが行われている。
【0004】
広告を表示させる権利が販売される単語は、キーワードなどと称される。
【0005】
従来、広告が、クエリに関連して特定され、特定された広告が、プロダクト及びサービスの少なくとも1つに関連する特徴を記述し、広告が、特定された広告の特徴及びクエリとの間の合致に従ってスコア付けされ、広告の少なくともいくつかが、ウェブベースコンテンツとして提供されるようにしているものもある(例えば、特許文献1参照)。
【0006】
【特許文献1】特表2007−524925号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、広告を表示させる権利が販売されるキーワードの選択には、大変な手間が必要とされた。特に、広告を表示させる権利が販売されるキーワードとしてその単語が有用であるか否か、すなわち、世間が関心をもっている単語であるか否かを判断することは難しかった。
【0008】
さらに、人手でキーワードを選択すると、キーワードに抜けや漏れが生じやすい。さらにまた、新たな商品名やサービス名が日々作られており、消費者が注目する商品名やサービス名を迅速に、広告を表示させる権利が販売されるキーワードとすることは難しかった。
【0009】
本発明は、このような状況に鑑みてなされたものであり、簡単に、かつ迅速に、広告を表示させる権利が販売されるキーワードであって、有用なキーワードを取得することができるようにするものである。
【課題を解決するための手段】
【0010】
本発明の第1の側面の情報処理装置は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出する抽出手段と、抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する記録制御手段とを備える。
【0011】
このようにすることで、簡単に、かつ迅速に、有用なキーワードを取得することができるようになる。
【0012】
前記記録制御手段には、その前記特徴語をクエリとしてページを検索した結果が表示されるページに広告を表示させる権利が販売される前記キーワードとして、抽出された前記特徴語を記録するように、記録を制御させることができる。
【0013】
前記記録制御手段には、その前記特徴語と同じ単語が特徴語として抽出されたページに広告を表示させる権利が販売される前記キーワードとして、抽出された前記特徴語を記録するように、記録を制御させることができる。
【0014】
前記記録制御手段には、抽出された前記特徴語の組み合わせを、前記キーワードとして記録するように、記録を制御させることができる。
【0015】
前記記録制御手段には、抽出された前記特徴語のうち、予め決められた数の複数の前記特徴語であって、前記生起コストの大きい順の前記特徴語の組み合わせを、前記キーワードとして記録するように、記録を制御させることができる。
【0016】
この場合、簡単に、かつ迅速に、有用なキーワードとして、複数の単語の組み合わせを得ることができる。
【0017】
前記記録制御手段には、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、前記特徴語が抽出された回数を記録するように、記録を制御させることができる。
【0018】
このようにすることで、キーワードと共に、そのキーワードの有用性の指標を得ることができる。
【0019】
前記記録制御手段には、その前記キーワードに関係付けて、予め定めた長さの期間のそれぞれにおいて前記特徴語が抽出された回数を記録するように、記録を制御させることができる。
【0020】
この場合、キーワードと共に、そのキーワードに対する世間の関心の程度の時間的な変化を知る指標を得ることができる。
【0021】
前記記録制御手段には、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、広告を表示させる権利の販売の価格を記録するように、記録を制御させることができる。
【0022】
前記記録制御手段には、前記キーワードとして記録されている前記特徴語が抽出された場合、その前記キーワードに関係付けられている、広告を表示させる権利の販売の価格を更新するように、記録を制御させることができる。
【0023】
このようにすることで、世間の関心の程度に応じて、キーワードについての価格を変更することができる。
【0024】
前記記録制御手段には、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、その前記特徴語をクエリとしてページが検索された回数を記録するように、記録を制御させることができる。
【0025】
前記記録制御手段には、前記キーワードとして記録されている前記特徴語をクエリとしてページが検索された場合、その前記キーワードに関係付けられている、広告を表示させる権利の販売の価格を更新するように、記録を制御させることができる。
【0026】
このようにすることで、世間の関心の程度に応じて、キーワードについての価格を変更することができる。
【0027】
前記記録制御手段には、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、表示させる広告を特定する特定情報を記録するように、記録を制御させることができる。
【0028】
前記キーワードとして記録されている前記特徴語が配置されるページが表示される場合、前記特定情報によって特定される広告を読み出す読み出し手段を更に設けることができる。
【0029】
本発明の第1の側面の情報処理方法は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出し、抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御するステップを含む。
【0030】
このようにすることで、簡単に、かつ迅速に、有用なキーワードを取得することができるようになる。
【0031】
本発明の第1の側面のプログラムは、コンピュータに、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出し、抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御するステップを含む処理を行わせる。
【0032】
このようにすることで、簡単に、かつ迅速に、有用なキーワードを取得することができるようになる。
【0033】
本発明の第2の側面の記録媒体には、単語毎の普遍的な出現しやすさを示す正規コストを用いて、ページの文章から抽出された特徴語が、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録されている。
【0034】
このようにすることで、有用なキーワードを、簡単に、かつ迅速に読み出すことができるようになる。
【0035】
前記特徴語を、その前記特徴語をクエリとしてページを検索した結果が表示されるページに広告を表示させる権利が販売される前記キーワードとして記録させることができる。
【0036】
前記特徴語を、その前記特徴語と同じ単語が特徴語として抽出されたページに広告を表示させる権利が販売される前記キーワードとして記録させることができる。
【0037】
抽出された前記特徴語の組み合わせを、前記キーワードとして記録させることができる。
【0038】
この場合、複数の単語の組み合わせを、有用なキーワードとして、簡単に、かつ迅速に読み出すことができるようになる。
【0039】
前記特徴語を前記キーワードとして記録させると共に、その前記キーワードに関係付けて、前記特徴語を抽出した回数を記録させることができる。
【0040】
このようにすることで、キーワードと共に、そのキーワードの有用性の指標を読み出すことができる。
【0041】
前記特徴語を前記キーワードとして記録させると共に、その前記キーワードに関係付けて、予め定めた長さの期間のそれぞれにおいて前記特徴語を抽出した回数を記録させることができる。
【0042】
この場合、キーワードと共に、そのキーワードに対する世間の関心の程度の時間的な変化を知る指標を読み出すことができる。
【0043】
本発明の第1の側面においては、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語が抽出され、抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録が制御される。
【0044】
本発明の第2の側面においては、単語毎の普遍的な出現しやすさを示す正規コストを用いて、ページの文章から抽出された特徴語が、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録されている。
【発明の効果】
【0045】
以上のように、本発明の第1の側面によれば、キーワードを取得することができる。
【0046】
また、本発明の第1の側面によれば、簡単に、かつ迅速に、有用なキーワードを取得することができる。
【0047】
本発明の第2の側面によれば、キーワードを読み出すことができる。
【0048】
また、本発明の第2の側面によれば、有用なキーワードを、簡単に、かつ迅速に読み出すことができる。
【発明を実施するための最良の形態】
【0049】
以下に本発明の実施の形態を説明するが、本発明の構成要件と、発明の詳細な説明に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、発明の詳細な説明に記載されていることを確認するためのものである。従って、発明の詳細な説明中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【0050】
本発明の第1の側面の情報処理装置は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出する抽出手段(例えば、図5の特徴語抽出部103)と、抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する記録制御手段(例えば、図5のサーチキーワード集合更新部105)とを備える。
【0051】
前記キーワードとして記録されている前記特徴語が配置されるページが表示される場合、前記特定情報によって特定される広告を読み出す読み出し手段(例えば、図5の広告読み出し処理部108)を更に設けることができる。
【0052】
本発明の第1の側面の情報処理方法またはプログラムがコンピュータに行わせる処理は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出し(例えば、図9のステップS12およびステップS13)、抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する(例えば、図12のステップS33)ステップを含む。
【0053】
本発明の第2の側面の記録媒体(例えば、図4の記憶部58)は、単語毎の普遍的な出現しやすさを示す正規コストを用いて、ページの文章から抽出された特徴語が、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録されている。
【0054】
図1は、本発明の一実施の形態の情報処理システムの構成を示す図である。
【0055】
市場提供業者は、商品を販売する法人または個人(自然人)である店舗からの委託により、商品を販売するページをユーザに提供するサービスを店舗に提供する。
【0056】
市場提供業者は、業者サーバ11、商品データベース(DB)12、および広告データベース(DB)13を備える。
【0057】
業者サーバ11は、例えば、Apache HTTP Serverまたは米マイクロソフト社製のInternet Information Servicesなどの、いわゆるWebサーバプログラムを実行し、HTTP(Hypertext Transfer Protocol)に規定される手順に基づいて、テキストまたは画像などの各種のオブジェクトが含まれるHTML(Hypertext Markup Language)方式またはXML(Extensible Markup Language)方式などのドキュメントを提供する。例えば、ドキュメントは、Webページのデータである。
【0058】
業者サーバ11は、店舗から委託された、商品を販売するページまたは役務(サービス)の提供の申込を受け付けるページのデータをユーザに提供する。多数の店舗からの委託により、業者サーバ11によって、多数の商品のそれぞれを販売するページおよび多数の役務のそれぞれの提供の申込を受け付けるページからなる仮想的な市場がユーザに提供される。
【0059】
また、業者サーバ11は、いわゆるアフィリエイトのサービスを提供する。すなわち、業者サーバ11は、商品を販売するページまたは役務の提供の申込を受け付けるページにリンクするオブジェクトであって、そのページにアクセスするためのオブジェクトをユーザのページに配置させ、このページを閲覧する他のユーザがこのリンクを経由して商品を販売するページで商品を購入するかまたは役務の提供の申込をすると、自己のページにオブジェクトを配置したユーザに報酬が支払われるサービスを提供する。
【0060】
以下、自己のページにオブジェクトを配置し、報酬を得るユーザをアフィリエータとも称する。
【0061】
業者サーバ11は、アフィリエイトのサービスを提供するためのスクリプトを発行する。業者サーバ11は、発行したスクリプトを、アフィリエータの装置に提供する。このスクリプトの実行によって、そのページのコンテンツにマッチした商品または役務の広告が提供される。
【0062】
商品または役務の広告が配置されるページのコンテンツにマッチした広告とは、すなわち、商品または役務の広告が配置されるページの特徴と同様の特徴を有する商品または役務の広告である。ここで、同様の特徴とは、同じ特徴、類似する特徴、または近似している特徴をいう。
【0063】
例えば、商品または役務の広告には、商品を販売するページまたは役務の提供の申込を受け付けるページにアクセスするためのオブジェクトが含まれている。すなわち、例えば、広告は、商品の画像、商品の名前を示すテキスト、商品を販売するページにアクセスするためのボタンであるオブジェクトなどを含む。
【0064】
以下、商品または役務の広告が配置されるページのコンテンツにマッチした広告をコンテンツマッチ広告と称する。
【0065】
業者サーバ11は、アフィリエータによって提供される、広告が配置されているページを閲覧するユーザの装置であって、そのページに配置されているスクリプトを実行する装置からの要求に応じて、広告を提供する。
【0066】
以下、アフィリエイトのサービスを利用して、商品を販売するページまたは役務の提供の申込の受付を行うページにアクセスするためのオブジェクトが配置されているページを、アフィリエイトページと称する。
【0067】
さらに、業者サーバ11は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出する。業者サーバ11は、抽出された特徴語を、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録する。言い換えれば、業者サーバ11は、抽出された特徴語を、所定の価格で、その特徴語が配置されるページに広告を表示させるサービスが提供されるキーワードとして記録する。
【0068】
商品データベース12は、商品または役務に関する情報を格納する。例えば、商品データベース12は、店舗からの依頼により、ユーザに提供するページで販売される商品およびそのページで提供の申込を受け付ける役務に関する情報を格納する。
【0069】
例えば、商品データベース12は、業者サーバ11を介した店舗からの、その店舗が販売する商品または提供する役務に関する情報の登録、編集、追加などの指令を受け付け、商品または役務に関する情報を新たに格納したり、格納している情報を更新したりする。
【0070】
図2は、商品データベース12に格納されている商品のデータ(レコード)の例を示す図である。商品データベース12には、1または複数の商品または役務のそれぞれについて、商品の名前または役務の名前を示すデータである商品名、商品を販売している店舗または役務を提供している店舗を特定するデータである店舗ID、商品または役務を特定するデータである商品ID、および商品の価格または役務の料金(対価)を示すデータである商品価格、および商品または役務を説明する文のデータである商品説明文が格納される。
【0071】
また、商品データベース12には、商品を販売するページまたは役務の提供の申込を受け付けるページのアドレスを示すデータである商品ページアドレス、商品の画像または役務を象徴する画像の有り無しを示す商品画像有り無しフラグ、および商品の画像または役務を象徴する画像が有る場合に商品または役務の画像が掲載されているページのアドレスを示すデータである商品画像ページアドレスが格納される。
【0072】
さらに、商品データベース12には、店舗に商品の在庫があるか否か(商品が販売できるか否か)、または即座に役務の提供ができるか否かを示す販売可能フラグが格納される。
【0073】
また、商品データベース12には、いわゆる内税か外税かを示す消費税フラグ、送料が別途必要か否かを示す送料フラグ、およびクレジットカードを利用して支払いができるか否かを示すクレジットカード利用可能フラグが格納される。
【0074】
さらにまた、商品データベース12には、商品を販売する店舗または役務を提供する店舗が優良な店舗として表彰されたか否かを示すショップオブザイヤーフラグ、アフィリエイトを利用する場合の商品の価格または役務の料金に対する報酬の利率を示すデータであるアフィリエイト利用利率、商品の販売または役務の提供の申込の受付を開始する時刻を示すデータである販売開始時刻、商品の販売または役務の提供の申込の受付を終了する時刻を示すデータである販売終了時刻、評論家または商品を購入した若しくは役務の提供を受けたユーザによる商品または役務の評価の件数を示すデータであるレビュー件数、およびその評価の平均を示すデータであるレビュー平均などが格納されている。
【0075】
このように、おなじ商品IDで特定される商品または役務が、異なる店舗IDで特定される複数の店舗でそれぞれ取り扱われている場合、異なる店舗で取り扱われている商品または役務が、異なるものとされ、それぞれの商品または役務のデータが管理される。
【0076】
なお、商品データベース12は、1つの店舗を特定する1つの店舗IDに対して、その店舗で取り扱う複数の商品のそれぞれの、商品名、商品ID、商品価格、および商品説明などを格納するようにしてもよい。
【0077】
広告データベース13は、広告のデータを格納する。すなわち、広告データベース13は、店舗または店舗以外の法人若しくは個人との契約により、市場提供業者が提供するページまたはアフィリエイトページに表示させる広告のデータが格納されている。
【0078】
図3は、広告データベース13に格納されている広告のデータ(レコード)の例を示す図である。例えば、広告データベース13は、1または複数の広告のそれぞれについて、商品を販売している店舗または役務を提供している店舗を特定するデータである店舗ID、広告を特定するデータである広告ID、広告の見出しのテキストデータであるタイトル、広告の商品または役務を説明する文章のテキストデータである説明文、広告の商品または役務のページのアドレスを示すデータであるアドレス、および広告(の商品または役務)の特徴を示すテキストデータであるキーワードなどを格納する。
【0079】
より具体的には、例えば、タイトルは、店舗が販売する商品または店舗が提供する役務の名称を示すか、商品または役務のキャッチコピーなどを示す。
【0080】
また、例えば、広告データベース13は、その商品の画像またはその役務を象徴する画像を表示させるデータ、または、商品を販売するか役務を提供する者のページにアクセスするためのオブジェクトを表示させるデータなどを格納する。
【0081】
図1に戻り、業者サーバ11、商品データベース12、および広告データベース13は、LAN(Local Area Network)14によって相互に接続されている。
【0082】
LAN14には、ルータ15がさらに接続され、業者サーバ11は、LAN14およびルータ15を介して、ネットワーク16に接続される。
【0083】
ネットワーク16は、有線または無線の汎用回線または専用回線などからなるネットワークであり、例えば、インターネット、LAN、またはWAN(Wide Area Network)などである。
【0084】
なお、商品データベース12および広告データベース13への、ネットワーク16を介した直接のアクセスは、原則として禁止される。
【0085】
より詳細には、業者サーバ11は、ネットワーク16を介したアクセスに応答するように、LAN14に接続され、商品データベース12および広告データベース13は、ファイアーウォールによって、ネットワーク16を介して直接アクセスできないように、LAN14に接続されている。但し、業者サーバ11、商品データベース12、および広告データベース13は、相互に直接アクセスできるように、LAN14に接続されている。
【0086】
また、商品データベース12または広告データベース13を業者サーバ11に構築するようにしてもよい。
【0087】
商品を販売するかまたは役務を提供する法人または個人である店舗は、それぞれ、端末装置17−1または端末装置17−2を備える。端末装置17−1または端末装置17−2は、それぞれ、例えば、パーソナルコンピュータであり、ネットワーク16を介して、登録されている会員ID(図示せず)およびパスワード(図示せず)による認証を経て、店舗から販売される商品のページまたは店舗から提供される役務のページを更新したり、商品データベース12に格納されている、自己の商品または役務のデータを更新したりする。
【0088】
ユーザは、それぞれ、ユーザ端末装置18−1またはユーザ端末装置18−2を使用し操作する。
【0089】
ユーザ端末装置18−1またはユーザ端末装置18−2は、それぞれ、例えば、据え置き型若しくはいわゆるノート型のパーソナルコンピュータ、携帯電話機、または専用端末装置などであり、他のユーザのユーザサーバ19−1若しくはユーザサーバ19−2、または業者サーバ11にアクセスして、ユーザサーバ19−1若しくはユーザサーバ19−2、または業者サーバ11から提供されるページのデータを受信して、そのページを表示させる。
【0090】
例えば、ユーザは、ユーザ端末装置18−1を操作して、市場の会員を特定する会員IDおよびパスワードを業者サーバ11に送信させることにより、多数の商品のそれぞれを販売するページおよび多数の役務のそれぞれの提供の申込を受け付けるページからなる仮想的な市場にログインして、市場に出店している店舗のページから、商品を購入するか、または役務の提供を申し込む。
【0091】
ユーザサーバ19−1またはユーザサーバ19−2は、例えば、Apache HTTP Serverまたは米マイクロソフト社製のInternet Information Servicesなどの、いわゆるWebサーバプログラムを実行し、HTTPに規定される手順に基づいて、画像などの各種のオブジェクトが含まれるHTML方式またはXML方式などのドキュメントを提供する。
【0092】
ユーザサーバ19−1またはユーザサーバ19−2は、例えば、インターネット接続サービスプロバイダのサーバ、ブログのサービスを提供するサーバ、またはいわゆるレンタルサーバなどとすることができる。
【0093】
なお、市場提供業者とは別の業者(以下、アフィリエイトサービス提供業者)が、アフィリエイトのサービスを、単独で提供するか、または、市場提供業者に代行して、アフィリエイトのサービスを提供するようにしてもよい。アフィリエイトサービス提供業者が、市場提供業者によるアフィリエイトのサービスの提供を代行する場合、アフィリエイトサービス提供業者と市場提供業者とは、専用回線で接続されるか、またはVPN(Virtual Private Network)などにより接続される。
【0094】
以下、ユーザ端末装置18−1またはユーザ端末装置18−2を個々に区別する必要がないとき、単に、ユーザ端末装置18と称する。また、ユーザサーバ19−1またはユーザサーバ19−2を個々に区別する必要がないとき、単に、ユーザサーバ19と称する。
【0095】
図4は、業者サーバ11のハードウェアの構成の例を示すブロック図である。
【0096】
業者サーバ11において、CPU(Central Processing Unit)51,ROM(Read Only Memory)52,RAM(Random Access Memory)53は、バス54により相互に接続されている。
【0097】
バス54には、さらに、入出力インタフェース55が接続されている。入出力インタフェース55には、キーボード、マウス、マイクロホンなどよりなる入力部56、ディスプレイ、スピーカなどよりなる出力部57、ハードディスクや不揮発性のメモリなどよりなる記憶部58、ネットワークインタフェースなどよりなる通信部59、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア61を駆動するドライブ60が接続されている。
【0098】
以上のように構成される業者サーバ11では、CPU51が、例えば、記憶部58に記憶されているプログラムを、入出力インタフェース55及びバス54を介して、RAM53にロードして実行することにより、上述した一連の処理が行われる。
【0099】
業者サーバ11(CPU51)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア61に記録して、あるいは、ネットワーク16など、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0100】
そして、プログラムは、リムーバブルメディア61をドライブ60に装着することにより、入出力インタフェース55を介して、記憶部58に記憶することで、業者サーバ11にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部59で受信し、記憶部58に記憶することで、業者サーバ11にインストールすることができる。その他、プログラムは、ROM52や記憶部58にあらかじめ記憶しておくことで、業者サーバ11にあらかじめインストールしておくことができる。
【0101】
端末装置17、ユーザ端末装置18、およびユーザサーバ19のそれぞれのハードウェアの構成は、業者サーバ11のハードウェアの構成と同様なので、その説明は省略する。
【0102】
次に、図5を参照して、プログラムを実行する業者サーバ11によって実現される機能の構成を説明する。
【0103】
ハードウェアである業者サーバ11がプログラムを実行することによって、Webサーバ機能101、アフィリエイトサーバ機能102、特徴語抽出部103、標準辞書格納部104、サーチキーワード集合更新部105、サーチキーワード集合格納部106、サーチキーワード販売処理部107、広告読み出し処理部108、およびサイト検索処理部109である機能が実現される。
【0104】
Webサーバ機能101は、業者サーバ11によるWebサーバプログラムの実行によって実現され、ネットワーク16を介して、HTTPに規定される手順に基づいて、ユーザ端末装置18に、HTML方式またはXML方式などのドキュメントを提供する。
【0105】
アフィリエイトサーバ機能102は、アフィリエイトのサービスを提供するためのスクリプトを発行し、このスクリプトを実行するユーザ端末装置18からの要求に応じて、ネットワーク16を介して、スクリプトが配置されているページのコンテンツにマッチした広告を提供する。
【0106】
すなわち、アフィリエイトサーバ機能102は、コンテンツマッチ広告のアフィリエイトのサービスを提供するためのスクリプトを発行する。発行されたスクリプトは、アフィリエイトのサービスを利用するユーザであるアフィリエータであって、商品を販売するページにアクセスするためのオブジェクトを含む広告をアフィリエイトページに配置したいアフィリエータのユーザサーバ19にユーザ端末装置18を介して提供される。
【0107】
ユーザサーバ19に提供されたスクリプトは、そのスクリプトを配置したページがアクセスされるとアクセスしてきたユーザ端末装置18によって実行され、スクリプトの実行によって、アフィリエイトサーバ機能102に広告が要求される。
【0108】
アフィリエイトサーバ機能102は、スクリプトの実行によるユーザサーバ19からの広告の要求に応じて、広告を提供する。
【0109】
特徴語抽出部103は、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出する。すなわち、特徴語抽出部103は、形態素である単語のそれぞれの生起コストであって、標準辞書格納部104に記憶されている標準辞書に含まれる生起コストを用いて、業者サーバ11が提供するページの文章またはユーザサーバ19が提供するページの文章から特徴語を抽出する。
【0110】
より具体的には、例えば、特徴語抽出部103は、広告を配置したいページのアドレスのHTMLソース(HTMLの方式で記述されたドキュメント)をユーザサーバ19から取得し、取得したHTMLソースから、主要な文である本文などの文章を抽出することにより、所定のページの文章を取得する。
【0111】
そして、例えば、特徴語抽出部103は、標準辞書格納部104に記憶されている標準辞書を用いて、取得された文章を解析し、文章を単語に分解する。すなわち、例えば、特徴語抽出部103は、標準辞書を用いた形態素解析により、文章を単語に分解する。
【0112】
さらに、例えば、特徴語抽出部103は、分解された単語のうちから、文章を特徴付ける特徴語を決定する。すなわち、特徴語抽出部103は、分解された単語のうちから、生起コストの大きい順に所定の数の単語を特徴語とする。
【0113】
標準辞書格納部104は、記憶部58の記憶領域のうちの所定の領域を管理し、その領域に形態素である単語毎の普遍的な出現しやすさを示す値を含む標準辞書を格納する。より正確には、標準辞書格納部104は、標準辞書を記憶部58に記憶させているが、標準辞書格納部104(としての記憶部58の記憶領域)が標準辞書を記憶しているとも表現できる。
【0114】
図6は、標準辞書格納部104によって記憶部58に格納(記憶)されている、標準辞書の例を示す図である。標準辞書には、複数の単語のそれぞれについて、単語、その単語の出現のしやすさを示す値である生起コスト、その単語の品詞、その単語の読み、およびその単語の発音などが含まれている。
【0115】
図5に戻り、サーチキーワード集合更新部105は、抽出された特徴語を、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に、特徴語抽出部103において抽出された特徴語を、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録させる。
【0116】
サーチキーワード集合格納部106は、記憶部58の記憶領域のうちの所定の領域を管理し、広告を表示させる権利が販売されるキーワードおよびキーワードに関係するデータなどからなるサーチキーワード集合をその領域に格納する。より正確には、サーチキーワード集合格納部106は、サーチキーワード集合を記憶部58に記憶させているが、サーチキーワード集合格納部106(としての記憶部58の記憶領域)がサーチキーワード集合を記憶しているとも表現できる。
【0117】
図7は、サーチキーワード集合格納部106に格納されている、サーチキーワード集合の例を示す図である。サーチキーワード集合は、1または複数のキーワードと、それぞれのキーワードについての、価格、店舗ID、広告ID、検索回数、今月の検索回数、先月の検索回数、2ヶ月前の月の検索回数乃至11ヶ月前の月の検索回数、抽出回数、今月の抽出回数、先月の抽出回数、および2ヶ月前の月の抽出回数乃至11ヶ月前の月の抽出回数とからなる。
【0118】
キーワードは、そのキーワードが配置されるページに広告を表示させる権利が販売される(広告を表示させる有料のサービスが提供される)単語である。キーワードは、1つの単語であるか、または複数の単語の組み合わせとされる。
【0119】
図7の例において、1つの単語であるαααααは、1つのキーワードである。また、図7の例において、βββββおよびβ'β'β'β'β'の2つの単語の組み合わせは、1つのキーワードである。さらにまた、図7の例において、γγγγγ、γ'γ'γ'γ'γ'、およびγ''γ''γ''γ''γ''の3つの単語の組み合わせは、1つのキーワードである。
【0120】
それぞれのキーワードに関係付けられている価格は、そのキーワードについての、広告を表示させる権利の価格を示す。なお、広告を表示させる権利の価格は、広告を表示させるサービスの価格と言い換えることができる。この価格は、期間を指定した価格(例えば、1ヶ月間広告を表示させる権利の価格)であってもよいし、表示回数を指定した価格(例えば、1回表示される毎の権利の価格や、所定回数表示される毎の権利の価格)であってもよい。
【0121】
なお、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、それぞれのキーワードに関係付けられている価格は、これから権利を販売するキーワードに対する、これから購入する場合の価格(金額)を示す。すなわち、サーチキーワード集合における価格が変更されることによって、既に購入された権利についての支払いの金額が変わることはない。
【0122】
図7の例において、αααααであるキーワードの価格は、カカカカカである。また、図7の例において、βββββおよびβ'β'β'β'β'の組み合わせであるキーワードの価格は、キキキキキである。さらにまた、図7の例において、γγγγγ、γ'γ'γ'γ'γ'、およびγ''γ''γ''γ''γ''の組み合わせであるキーワードの価格は、クククククである。
【0123】
それぞれのキーワードに関係付けられている店舗IDは、そのキーワードについての、広告を表示させる権利を購入した店舗を特定する。それぞれのキーワードに関係付けられている広告IDは、表示させる広告を特定する。すなわち、例えば、広告IDは、そのキーワードがクエリとして用いられた場合、またはそのキーワードが特徴語として抽出された場合、表示させる広告を特定する。
【0124】
それぞれのキーワードに関係付けられている検索回数は、そのキーワードがページを検索するクエリとして用いられた回数(総数)を示す。すなわち、検索回数は、検索されたページの数ではなく、結果にかかわらず検索の処理が実行された回数である。より詳しく説明すれば、検索回数は、そのキーワードをクエリとして、業者サーバ11が提供するページに対して検索の処理がこれまでに実行された回数を示す。
【0125】
なお、検索回数が、そのキーワードをクエリとして、ユーザサーバ19が提供するページに対して検索の処理がこれまでに実行された回数を示すようにしてもよい。
【0126】
それぞれのキーワードに関係付けられている今月の検索回数は、今月(今現在のその月に)、そのキーワードがページを検索するクエリとして用いられた回数を示す。例えば、今現在が3月である場合、今月の検索回数は、3月中に、そのキーワードがページを検索するクエリとして用いられた回数を示す。
【0127】
それぞれのキーワードに関係付けられている先月の検索回数は、先月(今現在の月の1つ前の月に)、そのキーワードがページを検索するクエリとして用いられた回数を示す。同様に、それぞれのキーワードに関係付けられている2ヶ月前の月の検索回数乃至11ヶ月前の月の検索回数のそれぞれは、2ヶ月前の月乃至11ヶ月前の月のそれぞれにおいて、そのキーワードがページを検索するクエリとして用いられた回数を示す。
【0128】
それぞれのキーワードに関係付けられている今月の検索回数乃至11ヶ月前の月の検索回数は、そのキーワードの検索のトレンドを示している。すなわち、今月の検索回数乃至11ヶ月前の月の検索回数は、そのキーワードに対する世間の関心の程度の時間的な変化を知る指標であると言える。
【0129】
それぞれのキーワードに関係付けられている抽出回数は、そのキーワードがページから特徴語として抽出された回数(総数)を示す。すなわち、抽出回数は、ページに配置されている特徴語と同じ単語の数ではなく、特徴語とされた回数である。より詳しく説明すれば、抽出回数は、業者サーバ11またはユーザサーバ19が提供するページからそのキーワードが特徴語としてこれまでに抽出された回数(特徴語とされた回数)を示す。
【0130】
それぞれのキーワードに関係付けられている今月の抽出回数は、今月(今現在のその月に)、そのキーワードがページから特徴語として抽出された回数を示す。例えば、今現在が7月である場合、今月の抽出回数は、7月中に、そのキーワードがページから特徴語として抽出された回数を示す。
【0131】
それぞれのキーワードに関係付けられている先月の抽出回数は、先月(今現在の月の1つ前の月に)、そのキーワードがページから特徴語として抽出された回数を示す。同様に、それぞれのキーワードに関係付けられている2ヶ月前の月の抽出回数乃至11ヶ月前の月の抽出回数のそれぞれは、2ヶ月前の月乃至11ヶ月前の月のそれぞれにおいて、そのキーワードがページから特徴語として抽出された回数を示す。
【0132】
それぞれのキーワードに関係付けられている今月の抽出回数乃至11ヶ月前の月の抽出回数は、そのキーワードの抽出のトレンドを示している。すなわち、今月の抽出回数乃至11ヶ月前の月の抽出回数は、そのキーワードに対する世間の関心の程度の時間的な変化を知る指標であると言える。
【0133】
このように、サーチキーワード集合格納部106(記憶部58)には、単語毎の普遍的な出現しやすさを示す正規コストを用いて、ページの文章から抽出された特徴語が、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録されている。このようにすることで、有用なキーワードを、簡単に、かつ迅速に読み出すことができるようになる。
【0134】
例えば、特徴語は、その特徴語をクエリとしてページを検索した結果が表示されるページに広告を表示させる権利が販売されるキーワードとして記録される。例えば、特徴語は、その特徴語と同じ単語が特徴語として抽出されたページに広告を表示させる権利が販売されるキーワードとして記録される。
【0135】
また、サーチキーワード集合格納部106(記憶部58)には、抽出された特徴語の組み合わせが、キーワードとして記録(記憶)される。この場合、複数の単語の組み合わせを、有用なキーワードとして、簡単に、かつ迅速に読み出すことができるようになる。
【0136】
さらに、サーチキーワード集合格納部106(記憶部58)には、キーワードに関係付けて、特徴語を抽出した回数が記録(記憶)される。このようにすることで、キーワードと共に、そのキーワードの有用性の指標を読み出すことができるようになる。
【0137】
さらにまた、サーチキーワード集合格納部106(記憶部58)には、キーワードに関係付けて、予め定めた長さの期間のそれぞれにおいて特徴語を抽出した回数が記録される。この場合、キーワードと共に、そのキーワードに対する世間の関心の程度の時間的な変化を知る指標を読み出すことができるようになる。
【0138】
図5に戻り、サーチキーワード販売処理部107は、サーチキーワード集合格納部106に格納されているサーチキーワード集合に含まれるそれぞれのキーワードについて、広告を表示させる権利を店舗に販売する処理を実行する。
【0139】
広告読み出し処理部108は、広告を表示させる権利が店舗に販売された所定のキーワードが配置されるページに広告を表示させる場合、広告データベース13から、広告を表示させる権利を購入した店舗によって表示が指示されている広告を読み出す。
【0140】
より具体的には、広告読み出し処理部108は、所定のキーワードについて、広告を表示させる権利が店舗に販売された場合、そのキーワードがページを検索するクエリとして用いられたとき、またはそのキーワードと同じ特徴語がアフィリエイトページから抽出されたとき、まず、サーチキーワード集合格納部106によって記憶部58に格納(記憶)されているサーチキーワード集合から、そのキーワードに関係付けられている店舗IDおよび広告IDを読み出す。そして、広告読み出し処理部108は、広告データベース13から、店舗IDおよび広告IDで特定される広告を読み出す。
【0141】
サイト検索処理部109は、所定の単語をクエリとして、業者サーバ11またはユーザサーバ19が提供するページの中から、そのクエリを含むページを検索する。
【0142】
図8は、業者サーバ11がユーザ端末装置18にページのデータを提供する場合に実行される、サーチワードの記録と広告の表示を説明する図である。サーチワードを記録し、広告を表示する場合、まず、業者サーバ11は、ユーザ端末装置18に表示されるページの文章Xを取得する。業者サーバ11は、標準辞書格納部104に格納されている標準辞書に含まれる生起コストを用いて、文章Xに対して、形態素解析を実行する。すなわち、業者サーバ11は、文章Xに形態素解析の処理を適用する。
【0143】
業者サーバ11は、形態素解析の処理の結果として、文章Xの特徴語Fを取得する。業者サーバ11は、特徴語Fを、サーチキーワード集合格納部106に格納されているサーチキーワード集合に追加する。
【0144】
一方、業者サーバ11は、広告データベース13から、文章Xにマッチする広告を取得する。
【0145】
より詳細には、業者サーバ11は、特徴語Fと同じキーワードを、サーチキーワード集合格納部106のサーチキーワード集合から検索し、特徴語Fと同じキーワードがサーチキーワード集合に含まれている場合、そのキーワードに関係付けられている店舗IDおよび広告IDをサーチキーワード集合格納部106から読み出す。
【0146】
そして、業者サーバ11は、店舗IDおよび広告IDで特定される広告のデータを、広告データベース13から読み出す。また、業者サーバ11は、特徴語Fをキーワードとして、広告データベース13に格納されている広告のデータを検索することで、文章Xにマッチする広告のデータを取得する。
【0147】
広告データベース13から、文章Xにマッチする広告のデータが取得できなかった場合、業者サーバ11は、特徴語Fをキーワードとして、商品データベース12に格納されている商品のデータを検索して、商品データベース12から、文章Xにマッチする商品または役務のデータを広告のデータとして取得する。
【0148】
なお、この場合、業者サーバ11は、文章Xと広告との類似度として、文章Xから抽出され特徴語Fと、広告から抽出された特徴語との重複する確率を求めて、予め定めた所定の閾値より大きい類似度の商品または役務の広告を、文章Xから抽出された特徴語Fにマッチする広告とするようにしてもよい。
【0149】
業者サーバ11は、文章Xにマッチする広告のデータを、ユーザ端末装置18に提供するページのデータに配置して、広告のデータを含むページのデータをユーザ端末装置18に提供することによって、文章Xにマッチする広告をユーザ端末装置18に表示させる。
【0150】
または、ユーザ端末装置18がアフィリエイトページを表示させる場合、業者サーバ11は、文章Xにマッチする広告のデータをユーザ端末装置18に提供し、ユーザ端末装置18に、アフィリエイトページのデータに広告のデータを埋め込ませて、その広告が配置されているアフィリエイトページを表示させる。
【0151】
次に、図9のフローチャートを参照して、標準辞書を参照して実行される、特徴語の抽出の処理を説明する。ステップS11において、特徴語抽出部103は、対象となる文章を取得する。
【0152】
例えば、ステップS11において、まず、特徴語抽出部103は、所定のページのHTMLソースをユーザサーバ19から取得する。より具体的には、例えば、特徴語抽出部103は、アフィリエイトページのHTMLソースをユーザサーバ19から取得する。
【0153】
また、例えば、特徴語抽出部103は、業者サーバ11が提供するページであって、広告を配置したいページのHTMLソースを取得する。
【0154】
そして、ステップS11において、特徴語抽出部103は、取得したHTMLソースから、主要な文である本文などの文章を抽出することにより、所定のページの文章を取得する。
【0155】
ステップS12において、特徴語抽出部103は、標準辞書格納部104によって格納されている標準辞書を用いた形態素解析(Morphological Analysis)の処理を、ステップS11で取得した文章に適用する。標準辞書を用いた形態素解析の処理が適用された文章は、単語に分解される。
【0156】
形態素解析においては、対象言語である日本語の文法のルールの集合と、品詞等の情報が付されている単語リストである辞書とが用いられ、自然言語で書かれた文章が、形態素、すなわち、言語で意味を持つ最小単位である単語の列に分割され、それぞれの形態素の品詞が判別される。
【0157】
ステップS12の形態素解析においては、正しい日本語の文例集のコーパスなどに基づいて作成され、機械学習された標準辞書が用いられる。
【0158】
形態素解析において、文章の単語の分かち書きが行われ、活用語の語尾が処理され、単語の品詞が同定される。その結果得られた品詞の並びから文法的に正しい並びであるものが正解とされる。
【0159】
文章の単語の分かち書き、すなわち、単語の境界の判別においては、規則による方式や、確率的言語モデルを用いる方式などが採用される。具体的には、例えば、最小コスト法または隠れマルコフモデル(HMM, Hidden Markov Model)による統計的な方式が採用できる。
【0160】
形態素解析は、コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつである。形態素解析においては、対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)が情報源として用いられ、自然言語で書かれた文が形態素(Morpheme、おおまかにいえば、言語で意味を持つ最小単位)の列に分割され、それぞれの形態素の品詞が判別される。
【0161】
大まかに言えば文から切り出した単語が属する品詞が辞書を用いて調べられていき、結果得られた品詞の並びから文法的に正しい並びであるものを正解であるとするという方法が取られる。一般的に多くの自然言語には品詞の接続に制限が存在する(例えば、日本語では動詞のあとに格助詞がくることはできない。「ドアを開けるを」などは日本語として不自然である)。この性質を利用することによって単語の境界の判別が行われる。具体的にこの性質を利用する方法には、第1に、規則による方法、第2に、確率的言語モデルを用いる方法の2つがある。
【0162】
標準辞書には、各形態素に対して、それぞれの形態素の出現のしやすさを示す値である生起コストがあらかじめ定義され、さらに、2つの形態素の並びに対して、2つの形態素のつながりやすさを示す連接コストがあらかじめ定義されている。形態素解析を行うに際して、曖昧性を排除するために、形態素解析を実行する形態素解析エンジンにおいては、連接コストと生成コストの和が最小になる解を選択するという「最少コスト法」というアルゴリズムがよく用いられる。
【0163】
図10は、形態素解析の対象となる文章である解析対象文とその形態素解析の結果の例を示す図である。
【0164】
例えば、”今年の「父の日特集2007」のテーマは、「楽楽市場」における50代以上の男性の購買動向を受けて「健康とねぎらい」です。”という文である解析対象文に形態素解析の処理が適用されると、副詞可能の名詞である品詞と判別された”今年”、連体化の助詞である品詞と判定された”の”、括弧開の記号である品詞と判定された”「”、一般名詞の名詞である品詞と判定された”父”、連体化の助詞である品詞と判定された”の”、副詞可能の非自立の名詞である品詞と判別された”日”、サ変接続の名詞である品詞と判定された”特集”、未知語である品詞と判定された”2007”、および括弧閉の記号である品詞と判定された”」”、などのように、形態素の列に分割され、それぞれの形態素の品詞が判別される。
【0165】
例えば、いわゆるブログのページの本文に形態素解析を適用することにより、そのページの特徴語を抽出する場合、図11に示されるように、”今日は母の日。奥さまのお母さんとその友達と・・・・シャンパーニュ地方のシャンパンをシェフに出してもらい・・・代々木上原の花屋で購入した花をプレゼント・・。”の本文に形態素解析の処理が適用されると、生起コストが3069である、副詞可能の名詞である品詞と判定された”今日”、生起コストが980である、係助詞の助詞である品詞と判定された”は”、生起コストが2944である、一般名詞の名詞である品詞と判定された”母”、生起コストが712である、連体化の助詞である品詞と判定された”の”、生起コストが2150である、非自立の副詞可能の名詞である品詞と判定された”日”、および生起コストが1297である、句点の記号である品詞と判定された”。”などのように、形態素の列に分割され、それぞれの形態素の生起コストが得られるとともに、それぞれの形態素の品詞が判別される。
【0166】
図11の右側に示されるように、標準辞書に予め定義されている生起コストは、ある単語の出現のしやすさを示している。生起コストの大きい単語は、一般的に、めったに出現しない単語である。従って、生起コストの大きい単語は、文を特徴付ける特徴語であると言える。
【0167】
図11に示される例から抽出された形態素のうち、生起コストの大きい名詞である形態素、すなわち特徴語は、”シャンパーニュ”、”シェフ”、”シャンパン”、”代々木上原”、および”花屋”である。
【0168】
図9に戻り、ステップS13において、特徴語抽出部103は、生起コストの大きい順に、所定の数の名詞または未知語を特徴語に決定して、特徴語の抽出の処理は終了する。すなわち、ステップS13において、特徴語抽出部103は、ステップS12の形態素解析の処理によって出力される特徴語の中から、後段の処理で用いる最終的な特徴語を決定する。
【0169】
このように、広告を配置したいページなどに配置されている文章から、そのページの特徴を示す特徴語が抽出される。
【0170】
次に、図9を参照して説明した特徴語の抽出の処理により特徴語が抽出されると実行される、サーチキーワード集合格納部106に格納されているサーチキーワード集合の更新の処理について説明する。
【0171】
図12は、1つの特徴語からなるキーワードについての、サーチキーワード集合の更新の処理を説明するフローチャートである。ステップS31において、サーチキーワード集合更新部105は、特徴語の抽出の処理により抽出された特徴語の中から、最初の特徴語を選択する。すなわち、例えば、ステップS31において、サーチキーワード集合更新部105は、抽出された特徴語のうち、生起コストの最も大きい特徴語を選択する。
【0172】
ステップS32において、サーチキーワード集合更新部105は、選択されている特徴語を、サーチキーワード集合格納部106に格納されているサーチキーワード集合から検索し、その結果から、選択されている特徴語がサーチキーワード集合に属しているか否かを判定する。
【0173】
ステップS32において、選択されている特徴語がサーチキーワード集合に属していないと判定された場合、選択されている特徴語と同じキーワードがサーチキーワード集合にまだ属していないので、手続きはステップS33に進み、サーチキーワード集合更新部105は、選択されている特徴語をサーチキーワード集合に追加する。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に、選択されている特徴語を、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録させる。
【0174】
ステップS34において、サーチキーワード集合更新部105は、ステップS33においてサーチキーワード集合に追加したキーワードに関係付けられている抽出回数に1を書き込む。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、追加したキーワードに関係付けられている抽出回数に1を書き込む。
【0175】
これにより、サーチキーワード集合に新たに追加されたキーワードの抽出回数は、1とされる。
【0176】
なお、サーチキーワード集合更新部105は、追加したキーワードに関係付けられている価格に、予め定められている所定の額を書き込む。また、サーチキーワード集合更新部105は、ステップS33においてサーチキーワード集合に追加したキーワードに関係付けられている今月の抽出回数に1を書き込む。
【0177】
ステップS34の後、手続きは、ステップS35に進む。
【0178】
ステップS35において、サーチキーワード集合更新部105は、特徴語の抽出の処理により抽出された特徴語の中に、まだ特徴語があるか否か、言い換えれば、抽出された特徴語に、選択されていないものが未だ残っているか否かを判定する。ステップS35において、まだ特徴語がある、すなわち、選択されていない特徴語があると判定された場合、手続きは、ステップS36に進む。
【0179】
ステップS36において、サーチキーワード集合更新部105は、次の特徴語を選択して、手続きはステップS32に戻り、上述した処理を繰り返す。より詳細には、例えば、ステップS36において、サーチキーワード集合更新部105は、1つ前に選択された特徴語の生起コストの次に大きい生起コストの特徴語を選択する。
【0180】
一方、ステップS32において、選択されている特徴語がサーチキーワード集合に属していると判定された場合、すなわち、選択されている特徴語と同じキーワードがサーチキーワード集合に既に属しているので、手続きはステップS37に進み、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、選択されている特徴語の価格を上げる。すなわち、ステップS37において、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、選択されている特徴語と同じキーワードに関係付けられている価格を、所定の額だけ上げる。
【0181】
例えば、ステップS37において、サーチキーワード集合更新部105は、選択されている特徴語と同じキーワードに関係付けられている価格を、予め定めた額だけ上げる。または、例えば、ステップS37において、サーチキーワード集合更新部105は、選択されている特徴語と同じキーワードに関係付けられている価格を、抽出回数に所定の関数を適用することによって得られた額とすることにより、選択されている特徴語と同じキーワードの価格を上げる。
【0182】
このように、特徴語が抽出されるたびに同じキーワードに関連付けられている価格、すなわち、より抽出されやすいキーワードの価格を上げることで、サーチキーワードの価格を適正(抽出されやすいものを高く、抽出されにくいものを安く)に設定することができる。
【0183】
なお、キーワードの抽出回数を1だけインクリメントしてから、抽出回数に所定の関数を適用することによって得られた額を、キーワードに関係付けられている価格とするようにしてもよい。
【0184】
ステップS38において、サーチキーワード集合更新部105は、選択されている特徴語と同じキーワードに関係付けられている抽出回数を1だけインクリメントする。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、選択されている特徴語と同じキーワードに関係付けられている抽出回数に1を加算する。
【0185】
また、サーチキーワード集合更新部105は、選択されている特徴語と同じキーワードに関係付けられている今月の抽出回数に1を書き込む。
【0186】
ステップS38の後、手続きは、ステップS35に進む。
【0187】
ステップS35において、特徴語がないと判定された、すなわち、全ての特徴語について上述した処理が実行されたと判定された場合、サーチキーワード集合の更新の処理は終了する。
【0188】
さらに、サーチキーワード集合の更新は、複数の特徴語の組み合わせについても行われる。
【0189】
図13は、複数の単語の組み合わせであるキーワードについての、サーチキーワード集合の更新の処理を説明するフローチャートである。
【0190】
ステップS51において、サーチキーワード集合更新部105は、最初の2個の特徴語の組み合わせを、サーチキーワード集合格納部106に格納されているサーチキーワード集合から検索し、その結果から、最初の2個の特徴語の組み合わせがサーチキーワード集合に属しているか否かを判定する。
【0191】
より詳細には、例えば、ステップS51において、サーチキーワード集合更新部105は、特徴語の抽出の処理により抽出された特徴語のうち、生起コストの最も大きい特徴語と2番目に生起コストの大きい特徴語との組み合わせがキーワードとしてサーチキーワード集合に属しているか否かを判定する。
【0192】
ステップS51において、最初の2個の特徴語の組み合わせがサーチキーワード集合に属していないと判定された場合、手続きはステップS52に進み、サーチキーワード集合更新部105は、最初の2個の特徴語の組み合わせをサーチキーワード集合に追加する。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に、最初の2個の特徴語の組み合わせを、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録させる。
【0193】
ステップS53において、サーチキーワード集合更新部105は、ステップS52においてサーチキーワード集合に追加したキーワードに関係付けられている抽出回数に1を書き込む。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、追加したキーワードであって、2個の特徴語の組み合わせであるキーワードに関係付けられている抽出回数に1を書き込む。
【0194】
これにより、サーチキーワード集合に新たに追加された、2個の特徴語の組み合わせであるキーワードの抽出回数は、1とされる。
【0195】
なお、サーチキーワード集合更新部105は、追加したキーワードであって、2個の特徴語の組み合わせであるキーワードに関係付けられている価格に、予め定められている所定の額を書き込む。また、サーチキーワード集合更新部105は、追加したキーワードであって、2個の特徴語の組み合わせであるキーワードに関係付けられている今月の抽出回数に1を書き込む。
【0196】
ステップS53の後、手続きは、ステップS54に進む。
【0197】
ステップS54において、サーチキーワード集合更新部105は、最初の3個の特徴語の組み合わせを、サーチキーワード集合格納部106に格納されているサーチキーワード集合から検索し、その結果から、最初の3個の特徴語の組み合わせがサーチキーワード集合に属しているか否かを判定する。
【0198】
すなわち、例えば、ステップS54において、サーチキーワード集合更新部105は、特徴語の抽出の処理により抽出された特徴語のうち、生起コストの最も大きい特徴語と2番目に生起コストの大きい特徴語と3番目に生起コストの大きい特徴語との組み合わせがキーワードとしてサーチキーワード集合に属しているか否かを判定する。
【0199】
ステップS54において、最初の3個の特徴語の組み合わせがサーチキーワード集合に属していないと判定された場合、手続きはステップS55に進み、サーチキーワード集合更新部105は、最初の3個の特徴語の組み合わせをサーチキーワード集合に追加する。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に、最初の3個の特徴語の組み合わせを、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録させる。
【0200】
ステップS56において、サーチキーワード集合更新部105は、ステップS55においてサーチキーワード集合に追加したキーワードに関係付けられている抽出回数に1を書き込む。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、追加したキーワードであって、3個の特徴語の組み合わせであるキーワードに関係付けられている抽出回数に1を書き込む。
【0201】
これにより、サーチキーワード集合に新たに追加された、3個の特徴語の組み合わせであるキーワードの抽出回数は、1とされる。
【0202】
なお、サーチキーワード集合更新部105は、追加したキーワードであって、3個の特徴語の組み合わせであるキーワードに関係付けられている価格に、予め定められている所定の額を書き込む。また、サーチキーワード集合更新部105は、追加したキーワードであって、3個の特徴語の組み合わせであるキーワードに関係付けられている今月の抽出回数に1を書き込む。
【0203】
ステップS56の後、サーチキーワード集合の更新の処理は終了する。
【0204】
一方、ステップS51において、最初の2個の特徴語の組み合わせがサーチキーワード集合に属していると判定された場合、手続きはステップS57に進み、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、最初の2個の特徴語の組み合わせの価格を上げる。すなわち、ステップS57において、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、最初の2個の特徴語の組み合わせと同じキーワードに関係付けられている価格を、所定の額だけ上げる。
【0205】
例えば、ステップS57において、サーチキーワード集合更新部105は、最初の2個の特徴語の組み合わせと同じキーワードに関係付けられている価格を、予め定めた額だけ上げる。また、例えば、ステップS57において、サーチキーワード集合更新部105は、最初の2個の特徴語の組み合わせと同じキーワードに関係付けられている価格を、抽出回数に所定の関数を適用することによって得られた額とすることにより、最初の2個の特徴語の組み合わせと同じキーワードの価格を上げる。
【0206】
ステップS58において、サーチキーワード集合更新部105は、最初の2個の特徴語の組み合わせと同じキーワードに関係付けられている抽出回数を1だけインクリメントする。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、最初の2個の特徴語の組み合わせと同じキーワードに関係付けられている抽出回数に1を加算する。
【0207】
また、サーチキーワード集合更新部105は、サーチキーワード集合における、最初の2個の特徴語の組み合わせと同じキーワードに関係付けられている今月の抽出回数に1を書き込む。
【0208】
ステップS58の後、手続きは、ステップS54に進む。
【0209】
また、ステップS54において、最初の3個の特徴語の組み合わせがサーチキーワード集合に属していると判定された場合、手続きはステップS59に進み、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、最初の3個の特徴語の組み合わせの価格を上げる。すなわち、ステップS59において、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、最初の3個の特徴語の組み合わせと同じキーワードに関係付けられている価格を、所定の額だけ上げる。
【0210】
例えば、ステップS59において、サーチキーワード集合更新部105は、最初の3個の特徴語の組み合わせと同じキーワードに関係付けられている価格を、予め定めた額だけ上げる。また、例えば、ステップS59において、サーチキーワード集合更新部105は、最初の3個の特徴語の組み合わせと同じキーワードに関係付けられている価格を、抽出回数に所定の関数を適用することによって得られた額とすることにより、最初の3個の特徴語の組み合わせと同じキーワードの価格を上げる。
【0211】
ステップS60において、サーチキーワード集合更新部105は、最初の3個の特徴語の組み合わせと同じキーワードに関係付けられている抽出回数を1だけインクリメントして、サーチキーワード集合の更新の処理は終了する。すなわち、サーチキーワード集合更新部105は、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、最初の3個の特徴語の組み合わせと同じキーワードに関係付けられている抽出回数に1を加算する。
【0212】
また、サーチキーワード集合更新部105は、サーチキーワード集合における、最初の3個の特徴語の組み合わせと同じキーワードに関係付けられている今月の抽出回数に1を書き込む。
【0213】
このように、複数の特徴語の組み合わせであるキーワードについて、サーチキーワード集合が更新される。
【0214】
なお、特徴語の組み合わせは、2個の特徴語の組み合わせまたは3個の特徴語の組み合わせであると説明したが、上述した処理と同様の処理で、任意の個数の特徴語の組み合わせとすることができる。
【0215】
また、生起コストの最も大きい特徴語と2番目に生起コストの大きい特徴語との組み合わせ、または生起コストの最も大きい特徴語と2番目に生起コストの大きい特徴語と3番目に生起コストの大きい特徴語との組み合わせに限らず、抽出された特徴語のうちの、任意の特徴語の組み合わせをキーワードとするようにしてもよい。
【0216】
なお、日付のうちの月が変わった場合、サーチキーワード集合更新部105は、図7に示されるように、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、今月の抽出回数乃至11ヶ月前の月の抽出回数を更新する。すなわち、サーチキーワード集合更新部105は、日付のうちの月が変わった場合、10ヶ月前の月の抽出回数を11ヶ月前の月の抽出回数に設定して、9ヶ月前の月の抽出回数を10ヶ月前の月の抽出回数に設定して、8ヶ月前の月の抽出回数を9ヶ月前の月の抽出回数に設定するように、今月の抽出回数乃至11ヶ月前の月の抽出回数をシフトさせて、今月の抽出回数を0とすることで、今月の抽出回数乃至11ヶ月前の月の抽出回数を更新する。
【0217】
さらにまた、サーチキーワード集合更新部105は、図7に示されるように、サーチキーワード集合格納部106に格納されているサーチキーワード集合における、検索回数および今月の検索回数を更新する。
【0218】
例えば、業者サーバ11は、検索のCGI(Common Gateway Interface)アプリケーションを実行し、検索のログとしてクエリを記憶している。サーチキーワード集合更新部105は、検索のログとしてのクエリを読み出して、サーチキーワード集合における、検索回数および今月の検索回数を更新する。
【0219】
そしてまた、サーチキーワード集合更新部105は、日付のうちの月が変わった場合、今月の検索回数乃至11ヶ月前の月の検索回数を更新する。すなわち、サーチキーワード集合更新部105は、日付のうちの月が変わった場合、10ヶ月前の月の検索回数を11ヶ月前の月の検索回数に設定して、9ヶ月前の月の検索回数を10ヶ月前の月の検索回数に設定して、8ヶ月前の月の検索回数を9ヶ月前の月の検索回数に設定するように、今月の検索回数乃至11ヶ月前の月の検索回数をシフトさせて、今月の検索回数を0とすることで、今月の検索回数乃至11ヶ月前の月の検索回数を更新する。
【0220】
このように、簡単に、かつ迅速に、広告を表示させる権利が販売されるキーワードであって、有用なキーワードを取得することができる。
【0221】
以上のように、例えば、サーチキーワード集合更新部105は、その特徴語をクエリとしてページを検索した結果が表示されるページに広告を表示させる権利が販売されるキーワードとして、抽出された特徴語を記録するように、サーチキーワード集合格納部106への記録を制御する。または、サーチキーワード集合更新部105は、その特徴語と同じ単語が特徴語として抽出されたページに広告を表示させる権利が販売されるキーワードとして、抽出された特徴語を記録するように、サーチキーワード集合格納部106への記録を制御する。
【0222】
さらに、例えば、サーチキーワード集合更新部105は、抽出された特徴語の組み合わせを、キーワードとして記録するように、サーチキーワード集合格納部106への記録を制御する。より具体的には、サーチキーワード集合更新部105には、抽出された特徴語のうち、予め決められた数の複数の特徴語であって、生起コストの大きい順の特徴語の組み合わせを、キーワードとして記録するように、サーチキーワード集合格納部106への記録を制御させることができる。
【0223】
このようにすることで、簡単に、かつ迅速に、有用なキーワードとして、複数の単語の組み合わせを得ることができる。
【0224】
また、例えば、サーチキーワード集合更新部105は、抽出された特徴語をキーワードとして記録すると共に、そのキーワードに関係付けて、特徴語が抽出された回数を記録するように、サーチキーワード集合格納部106への記録を制御する。このようにすることで、キーワードと共に、特徴語が抽出された回数である、そのキーワードの有用性の指標を得ることができる。
【0225】
この場合、サーチキーワード集合更新部105には、そのキーワードに関係付けて、予め定めた長さの期間のそれぞれにおいて特徴語が抽出された回数を記録するように、サーチキーワード集合格納部106への記録を制御させることができる。このようにすることで、キーワードと共に、予め定めた長さの期間のそれぞれにおいて特徴語が抽出された回数である、そのキーワードに対する世間の関心の程度の時間的な変化を知る指標を得ることができる。
【0226】
また、上述のように、サーチキーワード集合更新部105は、抽出された特徴語をキーワードとして記録すると共に、そのキーワードに関係付けて、広告を表示させる権利の販売の価格を記録するように、サーチキーワード集合格納部106への記録を制御する。より具体的には、サーチキーワード集合更新部105は、キーワードとして記録されている特徴語が抽出された場合、そのキーワードに関係付けられている、広告を表示させる権利の販売の価格を更新するように、サーチキーワード集合格納部106への記録を制御する。
【0227】
このようにすることで、世間の関心の程度に応じて、キーワードについての価格を変更することができる。
【0228】
さらに、サーチキーワード集合更新部105には、抽出された特徴語をキーワードとして記録すると共に、そのキーワードに関係付けて、その特徴語をクエリとしてページが検索された回数を記録するように、サーチキーワード集合格納部106への記録を制御させることができる。より詳細には、サーチキーワード集合更新部105には、キーワードとして記録されている特徴語をクエリとしてページが検索された場合、そのキーワードに関係付けられている、広告を表示させる権利の販売の価格を更新するように、サーチキーワード集合格納部106への記録を制御させることができる。
【0229】
これにより、世間の関心の程度に応じて、キーワードについての価格を変更することができるようになる。
【0230】
以上のように更新されたサーチキーワード集合に含まれるキーワードが店舗に販売される。
【0231】
なお、特徴語またはその組み合わせが抽出される毎に、価格を更新したり、サーチキーワード集合に、新たに抽出された特徴語またはその組み合わせのレコードを追加したり、抽出回数をインクリメントしたりすることに限らず、販売の価格とは別に、キーワードの販売の参考価格を示すレコードを設けて、その参考価格を更新したり、新たに抽出された特徴語またはその組み合わせについて、参考価格を示すレコードを追加したり、参考価格を示すレコードにおいて抽出回数などをインクリメントしたりするようにして、例えば、月に1度など定期的に、担当者が、キーワードの販売の参考価格を示すレコードを閲覧して、サーチキーワード集合にキーワードを追加したり、その価格を更新したりするようにしてもよい。
【0232】
図14は、店舗からキーワードの購入を申し込む場合に実行される、キーワードの販売の処理を説明するフローチャートである。ステップS81において、サーチキーワード販売処理部107は、サーチキーワード集合格納部106からサーチキーワード集合を読み出して、サーチキーワード集合に含まれる、それぞれのキーワード、キーワードのそれぞれの価格、キーワードのそれぞれの検索回数、今月の検索回数乃至11ヶ月前の月の検索回数、キーワードのそれぞれの抽出回数、および今月の抽出回数乃至11ヶ月前の月の抽出回数を表示させるデータを、ネットワーク16を介して、店舗、すなわち、店舗の端末装置17に送信する。
【0233】
キーワードのそれぞれについての、検索回数(総数)と今月の検索回数乃至11ヶ月前の月の検索回数とが、店舗の端末装置17に送信されるので、店舗において、キーワードについての検索回数の変化の傾向を示す検索トレンドを知ることができる。
【0234】
また、キーワードのそれぞれについての、抽出回数(総数)と今月の抽出回数乃至11ヶ月前の月の抽出回数とが、店舗の端末装置17に送信されるので、店舗において、キーワードについての抽出回数の変化の傾向を示す抽出トレンドを知ることができる。
【0235】
端末装置17は、業者サーバ11から送信されてきたデータを受信して、それぞれのキーワード、キーワードのそれぞれの価格、キーワードのそれぞれの検索回数、今月の検索回数乃至11ヶ月前の月の検索回数、キーワードのそれぞれの抽出回数、および今月の抽出回数乃至11ヶ月前の月の抽出回数を表示させる。
【0236】
図15は、端末装置17において表示されるページであって、キーワード、キーワードの価格、キーワードの検索トレンド、およびキーワードの抽出トレンドを表示させるためのページ(以下、キーワード販売ページと称する)の例を示す図である。
【0237】
例えば、キーワード販売ページの左上に配置されているフィールドに、購入しようとするキーワードを検索するためのクエリが入力されて、”キーワード検索”と表示されたボタンがクリックされると、端末装置17は、フィールドに入力されたクエリをネットワーク16を介して業者サーバ11に送信する。
【0238】
例えば、業者サーバ11が、端末装置17から送信されてきたクエリを受信すると、ステップS81において、サーチキーワード販売処理部107は、サーチキーワード集合格納部106から、サーチキーワード集合のうちの、そのクエリを含むキーワードからなる部分集合を読み出す。サーチキーワード販売処理部107は、読み出したキーワードの部分集合に含まれる、それぞれのキーワード、キーワードのそれぞれの価格、キーワードのそれぞれの今月の検索回数乃至11ヶ月前の月の検索回数、およびキーワードのそれぞれの今月の抽出回数乃至11ヶ月前の月の抽出回数を表示させるデータを、通信部59に、ネットワーク16を介して、店舗の端末装置17に送信させる。
【0239】
より具体的には、”米”であるクエリが、端末装置17から業者サーバ11に送信されると、”米”、”精米機”、”新米”、”無洗米”、”お米”、”米沢牛”、”有機栽培 米”、または”一四代 中取り純米吟醸”などのキーワードと、そのキーワードの価格、今月の検索回数乃至11ヶ月前の月の検索回数、および今月の抽出回数乃至11ヶ月前の月の抽出回数とが業者サーバ11から端末装置17に送信される。
【0240】
端末装置17は、業者サーバ11から送信されてきた、”米”、”精米機”、”新米”、”無洗米”、”お米”、”米沢牛”、”有機栽培 米”、または”一四代 中取り純米吟醸”などのキーワードと、そのキーワードの価格、今月の検索回数乃至11ヶ月前の月の検索回数、および今月の抽出回数乃至11ヶ月前の月の抽出回数とを受信すると、図15に示されるように、”米”、”精米機”、”新米”、”無洗米”、”お米”、”米沢牛”、”有機栽培 米”、”一四代 中取り純米吟醸”などのキーワードと、そのキーワードの価格、検索トレンドとしての今月の検索回数乃至11ヶ月前の月の検索回数のグラフ、および抽出トレンドとしての今月の抽出回数乃至11ヶ月前の月の抽出回数のグラフとが配置されているキーワード販売ページを表示させる。
【0241】
なお、図15に示される例においては、検索トレンドとしての今月の検索回数乃至11ヶ月前の月の検索回数、および抽出トレンドとしての今月の抽出回数乃至11ヶ月前の月の抽出回数は、それぞれチャート(グラフ)として表示されているが、数値で表示するようにしてもよい。
【0242】
店舗の担当者は、キーワード販売ページに表示されている、キーワード、キーワードの価格、キーワードの検索トレンド、およびキーワードの抽出トレンドを参照して、店舗の端末装置17を操作することで、所定のキーワードの購入の申込を指示する。
【0243】
すると、端末装置17は、ネットワーク16を介して、購入するキーワード、キーワードを購入する店舗を特定する店舗ID、およびキーワードがページに配置されている場合に表示される広告を特定する広告IDを業者サーバ11に送信してくるので、ステップS82において、サーチキーワード販売処理部107は、通信部59に、店舗から送信されてくる、購入されるキーワード、キーワードを購入する店舗を特定する店舗ID、およびキーワードがページに配置されている場合に表示される広告を特定する広告IDを受信させる。
【0244】
ステップS83において、サーチキーワード販売処理部107は、サーチキーワード集合更新部105に、購入されたキーワードに関係付けて店舗IDおよび広告IDを、サーチキーワード集合格納部106のサーチキーワード集合に格納させて、キーワードの販売の処理は終了する。
【0245】
すなわち、サーチキーワード集合更新部105は、キーワードに関係付けて、表示させる広告を特定する特定情報を記録するように、サーチキーワード集合格納部106への記録を制御する。
【0246】
このように、キーワードが購入されると、キーワードを購入した店舗を特定する店舗ID、およびキーワードがページに配置されている場合に表示される広告を特定する広告IDが、購入されたキーワードに関係付けてサーチキーワード集合に配置されることになる。
【0247】
次に、業者サーバ11によって提供されているページにおいて、所定のクエリを含むページが検索された場合に実行される広告の表示の処理を説明する。
【0248】
すなわち、ユーザ端末装置18が、業者サーバ11のWebサーバ機能101が提供するページを表示し、そのページから所定のクエリを含むページが検索されると、ユーザ端末装置18が、ネットワーク16を介して、そのクエリをWebサーバ機能101に送信してくるので、業者サーバ11のサイト検索処理部109は、業者サーバ11またはユーザサーバ19が提供するページの中から、そのクエリを含むページを検索する。
【0249】
Webサーバ機能101は、ネットワーク16を介して、そのクエリを含むページを検索した結果が示されるページ(以下、検索結果ページ)を表示させるためのデータをユーザ端末装置18に送信する。ユーザ端末装置18は、検索結果ページのデータを受信すると、検索結果ページを表示させる。
【0250】
図16は、検索結果ページに広告を表示させるための、広告の表示の処理を説明するフローチャートである。ステップS101において、広告読み出し処理部108は、サイト検索処理部109から、サイトの検索に用いられるクエリを取得する。ステップS102において、広告読み出し処理部108は、サーチキーワード集合格納部106に格納されているサーチキーワード集合から、検索に用いられるクエリを検索する。
【0251】
ステップS103において、広告読み出し処理部108は、クエリに関係付けられている店舗IDおよび広告IDをサーチキーワード集合から読み出す。
【0252】
ステップS104において、広告読み出し処理部108は、店舗IDおよび広告IDで特定される広告を広告データベース13から読み出す。広告読み出し処理部108は、読み出した広告をWebサーバ機能101に供給する。
【0253】
ステップS105において、Webサーバ機能101は、読み出した広告を検索結果ページのデータに配置して、ネットワーク16を介して、広告が配置された検索結果ページのデータをユーザ端末装置18に送信して、広告の表示の処理は終了する。
【0254】
ユーザ端末装置18は、広告が配置されている検索結果ページのデータを受信すると、その広告が配置されている検索結果ページを表示させる。
【0255】
このように、広告を表示させる権利が店舗に販売された所定のキーワードをクエリとして、ページが検索されると、その検索の結果を示す検索結果ページに、広告を表示させる権利を購入した店舗の広告が表示されることになる。
【0256】
所定のクエリによってページを検索した結果が示される検索結果ページに、そのクエリに関係する商品または役務の広告が表示されるので、ユーザ端末装置18のユーザの関心を引く可能性が高い。
【0257】
次に、アフィリエイトページへの広告の表示の処理を説明する。アフィリエイトページには、予め、コンテンツマッチ広告のアフィリエイトのサービスを提供するためのスクリプトが配置されている。例えば、コンテンツマッチ広告のアフィリエイトのサービスを提供するためのスクリプトは、Javascript(Javaは登録商標)とされる。
【0258】
図17は、アフィリエイトページへの広告の表示の処理を説明するフローチャートである。
【0259】
ステップS1001において、ユーザ端末装置18は、アフィリエイトページのデータを要求する。すなわち、ステップS1001において、ユーザ端末装置18は、ネットワーク16を介して、アフィリエイトページのアクセスリクエストをユーザサーバ19宛に送信する。
【0260】
ステップS2001において、ユーザサーバ19は、ユーザ端末装置18からの、アフィリエイトページのデータの要求を受け付ける。言い換えれば、ステップS2001において、ユーザサーバ19は、ユーザ端末装置18からネットワーク16を介して送信されてくる、アフィリエイトページのアクセスリクエストを受信し、そのアクセスリクエストに応じて、要求されたアフィリエイトページのデータを読み出す。
【0261】
ステップS2002において、ユーザサーバ19は、要求されたアフィリエイトページのデータをネットワーク16を介してユーザ端末装置18に送信する。
【0262】
ステップS1002において、ユーザ端末装置18は、ネットワーク16を介してユーザサーバ19から送信されてくる、要求したアフィリエイトページのデータを受信する。
【0263】
ステップS1003において、ユーザ端末装置18は、アフィリエイトページに記述されているJavascriptを実行し、その実行しているJavascriptの処理によって、業者サーバ11に、アフィリエイトページのアドレスとアフィリエータを特定するアフィリエイトID(Javascriptに埋め込まれている)とを送信すると共に、広告を要求する。言い換えれば、ステップS1003において、ユーザ端末装置18は、アフィリエイトページのアドレスとアフィリエイトIDを付して、業者サーバ11に広告を要求する。
【0264】
すなわち、ユーザ端末装置18は、Javascriptの実行によって、アフィリエイトページのアドレスおよびアフィリエイトIDをネットワーク16を介して業者サーバ11に送信すると共に、ネットワーク16を介して業者サーバ11に、アフィリエイトページの特徴と同様の特徴の広告を要求する。
【0265】
ステップS3001において、広告読み出し処理部108は、ユーザ端末装置18からの要求を受け付ける。すなわち、より詳細には、広告読み出し処理部108は、ネットワークインタフェースである通信部59に、ネットワーク16、ルータ15、およびLAN14を介してユーザ端末装置18から送信されてきた、アフィリエイトページのアドレスおよびアフィリエイトIDと、広告の要求とを受信させる。広告読み出し処理部108は、特徴語抽出部103に、アフィリエイトページのアドレスを供給し、特徴語の抽出を指示する。
【0266】
ステップS3002において、特徴語抽出部103は、アフィリエイトページのアドレスで特定されるページの文章を取得する。
【0267】
例えば、ステップS3002において、まず、特徴語抽出部103は、アフィリエイトページのアドレスで特定されるページのHTMLソースをユーザサーバ19から取得する。そして、ステップS3002において、特徴語抽出部103は、取得したHTMLソースから、主要な文である本文などの文章を抽出することにより、所定のページの文章を取得する。
【0268】
ステップS3003において、特徴語抽出部103は、ステップS12と同様に、標準辞書格納部104に格納(記憶)されている標準辞書を用いた形態素解析の処理を、ステップS3002で取得した文章に適用する。
【0269】
ステップS3004において、特徴語抽出部103は、ステップS13と同様に、生起コストの大きい順に、所定の数の名詞または未知語を特徴語に決定する。特徴語抽出部103は、特徴語とその生起コストとを広告読み出し処理部108に供給する。
【0270】
ステップS3005において、広告読み出し処理部108は、サーチキーワード集合格納部106に格納されているサーチキーワード集合から、特徴語を検索する。すなわち、広告読み出し処理部108は、サーチキーワード集合に含まれるキーワードから、特徴語を検索する。
【0271】
ステップS3006において、広告読み出し処理部108は、特徴語に関係付けられている店舗IDおよび広告IDをサーチキーワード集合から読み出す。ステップS3007において、広告読み出し処理部108は、店舗IDおよび広告IDで特定される広告を広告データベース13から読み出す。
【0272】
なお、ステップS3007において、広告読み出し処理部108は、取得した広告に含まれるリンクに、ステップS3001で受信したアフィリエイトIDを埋め込む。
【0273】
ステップS3008において、広告読み出し処理部108は、アフィリエイトサーバ機能102に、読み出した広告を送信させる。広告読み出し処理部108から広告の送信が指示されたアフィリエイトサーバ機能102は、ネットワークインタフェースである通信部59に、LAN14、ルータ15、およびネットワーク16を介して、ユーザサーバ19にアフィリエイトページのデータを要求してきたユーザ端末装置18宛に、広告を送信させる。
【0274】
ステップS1004において、ユーザ端末装置18は、ネットワーク16を介して業者サーバ11から送信されてくる、広告を受信する。ステップS1005において、ユーザ端末装置18は、ステップS1004で受信した広告を、ステップS1002で受信したアフィリエイトページに埋め込む。
【0275】
ステップS1006において、ユーザ端末装置18は、広告が埋め込まれたアフィリエイトページのデータによって、広告が配置されたアフィリエイトページを表示して、アフィリエイトページへの広告の表示の処理は終了する。
【0276】
ユーザ端末装置18は、ユーザサーバ19から供給されたアフィリエイトページに、スクリプトの実行によって要求した広告であって、業者サーバ11から送信されてきた広告を埋め込んで、広告が配置されたアフィリエイトページの全体を表示する。
【0277】
このように、ユーザ端末装置18は、アフィリエイトページに、そのアフィリエイトページから抽出された特徴語と同じキーワードについて広告を表示させる権利を購入した法人または個人である店舗の広告を表示させる。
【0278】
ユーザ端末装置18のユーザは、自分が関心を持っていることが記載されているアフィリエイトページを閲覧するので、その特徴と同様の特徴を有する商品または役務は、ユーザ端末装置18のユーザの関心を引く可能性が高い。従って、そのアフィリエイトページの特徴と同様の特徴を有する商品または役務の広告が、ユーザに見られて、その広告から、商品を販売するページまたは役務の提供の申込を受け付けるページにアクセスされる可能性が高まる。
【0279】
広告が配置されて、表示されるページがアフィリエイトページである場合、アフィリエイトページを提供するアフィリエータからすれば、自分のアフィリエイトページに、報酬を得る可能性がより高い広告を配置させることができる。
【0280】
店舗からすれば、商品を販売するページまたは役務の提供の申込を受け付けるページにアクセスする可能性が高いアフィリエイトページ(商品の販売または役務の提供に結びつく可能性の高いアフィリエイトページ)に、自己の商品または役務の広告を表示させることができる。
【0281】
このように、所定のキーワードについて広告を表示させる権利を購入した法人または個人である店舗の広告は、確実に、そのキーワードである特徴語が抽出されたアフィリエイトページに表示されるか、またはキーワードがページを検索するクエリとして用いられた場合に表示される検索結果ページに表示される。
【0282】
なお、広告が配置されて、表示されるページは、アフィリエイトページまたは検索結果ページに限らず、市場提供業者が店舗から委託された、商品を販売するページまたは役務の提供の申込を受け付けるページ、または市場提供業者がユーザまたは店舗に提供するページなどとすることができる。
【0283】
以上のように、簡単に、かつ迅速に、広告を表示させる権利が販売されるキーワードであって、有用なキーワードを取得することができるようになる。
【0284】
このように、ページの文章から特徴語を抽出するようにした場合には、ページの特徴を知ることができる。また、単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出し、抽出された特徴語を、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御するようにした場合には、簡単に、かつ迅速に、広告を表示させる権利が販売されるキーワードであって、有用なキーワードを取得することができる。
【0285】
また、単語毎の普遍的な出現しやすさを示す正規コストを用いて、ページの文章から抽出された特徴語が、その特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録されるようにした場合には、有用なキーワードを、簡単に、かつ迅速に読み出すことができる。
【0286】
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0287】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0288】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0289】
【図1】本発明の一実施の形態の情報処理システムの構成を示す図である。
【図2】商品データベース12に格納されている商品のデータ(レコード)の例を示す図である。
【図3】広告データベース13に格納されている広告のデータ(レコード)の例を示す図である。
【図4】業者サーバ11のハードウェアの構成の例を示すブロック図である。
【図5】プログラムを実行する業者サーバ11によって実現される機能の構成を示すブロック図である。
【図6】標準辞書の例を示す図である。
【図7】サーチキーワード集合の例を示す図である。
【図8】サーチワードの記録と広告の表示を説明する図である。
【図9】特徴語の抽出の処理を説明するフローチャートである。
【図10】解析対象文とその形態素解析の結果の例を示す図である。
【図11】解析対象文とその形態素解析の結果の例を示す図である。
【図12】1つの特徴語からなるキーワードについての、サーチキーワード集合の更新の処理を説明するフローチャートである。
【図13】複数の単語の組み合わせであるキーワードについての、サーチキーワード集合の更新の処理を説明するフローチャートである。
【図14】キーワードの販売の処理を説明するフローチャートである。
【図15】キーワード販売ページの例を示す図である。
【図16】検索結果ページに広告を表示させるための、広告の表示の処理を説明するフローチャートである。
【図17】アフィリエイトページに広告を表示させるための、広告の表示の処理を説明するフローチャートである。
【符号の説明】
【0290】
11 業者サーバ, 12 商品データベース, 13 広告データベース, 14 LAN, 15 ルータ, 16 ネットワーク, 17−1,17−2,または17 端末装置, 18−1,18−2,または18 ユーザ端末装置, 19−1,19−2,または19 ユーザサーバ, 51 CPU, 52 ROM, 53 RAM, 58 記憶部, 59 通信部, 61 リムーバブルメディア, 101 Webサーバ機能, 102 アフィリエイトサーバ機能, 103 特徴語抽出部, 104 標準辞書格納部, 105 サーチキーワード集合更新部, 106 サーチキーワード集合格納部, 107 サーチキーワード販売処理部, 108 広告読み出し処理部, 109 サイト検索処理部

【特許請求の範囲】
【請求項1】
単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出する抽出手段と、
抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する記録制御手段と
を備える情報処理装置。
【請求項2】
請求項1に記載の情報処理装置において、
前記記録制御手段は、その前記特徴語をクエリとしてページを検索した結果が表示されるページに広告を表示させる権利が販売される前記キーワードとして、抽出された前記特徴語を記録するように、記録を制御する
情報処理装置。
【請求項3】
請求項1に記載の情報処理装置において、
前記記録制御手段は、その前記特徴語と同じ単語が特徴語として抽出されたページに広告を表示させる権利が販売される前記キーワードとして、抽出された前記特徴語を記録するように、記録を制御する
情報処理装置。
【請求項4】
請求項1に記載の情報処理装置において、
前記記録制御手段は、抽出された前記特徴語の組み合わせを、前記キーワードとして記録するように、記録を制御する
情報処理装置。
【請求項5】
請求項4に記載の情報処理装置において、
前記記録制御手段は、抽出された前記特徴語のうち、予め決められた数の複数の前記特徴語であって、前記生起コストの大きい順の前記特徴語の組み合わせを、前記キーワードとして記録するように、記録を制御する
情報処理装置。
【請求項6】
請求項1に記載の情報処理装置において、
前記記録制御手段は、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、前記特徴語が抽出された回数を記録するように、記録を制御する
情報処理装置。
【請求項7】
請求項6に記載の情報処理装置において、
前記記録制御手段は、その前記キーワードに関係付けて、予め定めた長さの期間のそれぞれにおいて前記特徴語が抽出された回数を記録するように、記録を制御する
情報処理装置。
【請求項8】
請求項1に記載の情報処理装置において、
前記記録制御手段は、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、広告を表示させる権利の販売の価格を記録するように、記録を制御する
情報処理装置。
【請求項9】
請求項8に記載の情報処理装置において、
前記記録制御手段は、前記キーワードとして記録されている前記特徴語が抽出された場合、その前記キーワードに関係付けられている、広告を表示させる権利の販売の価格を更新するように、記録を制御する
情報処理装置。
【請求項10】
請求項1に記載の情報処理装置において、
前記記録制御手段は、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、その前記特徴語をクエリとしてページが検索された回数を記録するように、記録を制御する
情報処理装置。
【請求項11】
請求項8に記載の情報処理装置において、
前記記録制御手段は、前記キーワードとして記録されている前記特徴語をクエリとしてページが検索された場合、その前記キーワードに関係付けられている、広告を表示させる権利の販売の価格を更新するように、記録を制御する
情報処理装置。
【請求項12】
請求項1に記載の情報処理装置において、
前記記録制御手段は、抽出された前記特徴語を前記キーワードとして記録すると共に、その前記キーワードに関係付けて、表示させる広告を特定する特定情報を記録するように、記録を制御する
情報処理装置。
【請求項13】
請求項12に記載の情報処理装置において、
前記キーワードとして記録されている前記特徴語が配置されるページが表示される場合、前記特定情報によって特定される広告を読み出す読み出し手段を更に備える
情報処理装置。
【請求項14】
単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出し、
抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する
ステップを含む情報処理方法。
【請求項15】
単語毎の普遍的な出現しやすさを示す生起コストを用いて、ページの文章から特徴語を抽出し、
抽出された前記特徴語を、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録するように、記録を制御する
ステップを含む処理をコンピュータに行わせるプログラム。
【請求項16】
単語毎の普遍的な出現しやすさを示す正規コストを用いて、ページの文章から抽出された特徴語が、その前記特徴語が配置されるページに広告を表示させる権利が販売されるキーワードとして記録されている記録媒体。
【請求項17】
請求項16に記載の記録媒体において、
前記特徴語が、その前記特徴語をクエリとしてページを検索した結果が表示されるページに広告を表示させる権利が販売される前記キーワードとして記録されている記録媒体。
【請求項18】
請求項16に記載の記録媒体において、
前記特徴語が、その前記特徴語と同じ単語が特徴語として抽出されたページに広告を表示させる権利が販売される前記キーワードとして記録されている記録媒体。
【請求項19】
請求項16に記載の記録媒体において、
抽出された前記特徴語の組み合わせが、前記キーワードとして記録されている記録媒体。
【請求項20】
請求項16に記載の記録媒体において、
前記特徴語が前記キーワードとして記録されていると共に、その前記キーワードに関係付けて、前記特徴語を抽出した回数が記録されている記録媒体。
【請求項21】
請求項20に記載の記録媒体において、
前記特徴語が前記キーワードとして記録されていると共に、その前記キーワードに関係付けて、予め定めた長さの期間のそれぞれにおいて前記特徴語を抽出した回数が記録されている記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate