対象とされる広告で使用するためのユーザ情報の生成
【課題】ユーザプロファイルにより適合した広告を提供する。
【解決手段】ユーザプロファイル情報は、(a)初期ユーザプロファイル情報を決定し、(b)ユーザプロファイル情報を推測し、(c)該初期ユーザプロファイル情報と該推測されたユーザプロファイル情報の両方を使用して、決定される。初期ユーザプロファイル情報は、ユーザによって提出された過去の検索クエリーを使用して決定される。ユーザプロファィルの推測は、(a)多くの文書とユーザのそれぞれにノードを定義し、(b)グラフを定義するためにノード間の関連がある場合にはノード間にエッジを追加し、(c)グラフのトポロジーを使用することによって行われる。
【解決手段】ユーザプロファイル情報は、(a)初期ユーザプロファイル情報を決定し、(b)ユーザプロファイル情報を推測し、(c)該初期ユーザプロファイル情報と該推測されたユーザプロファイル情報の両方を使用して、決定される。初期ユーザプロファイル情報は、ユーザによって提出された過去の検索クエリーを使用して決定される。ユーザプロファィルの推測は、(a)多くの文書とユーザのそれぞれにノードを定義し、(b)グラフを定義するためにノード間の関連がある場合にはノード間にエッジを追加し、(c)グラフのトポロジーを使用することによって行われる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は広告に関する。特に、本発明は、例えば検索クエリー又は文書要求等のユーザの要求に役立つための、特に関連性のある広告又は広告クリエーティブ(creatives)を決定することに関する。
【背景技術】
【0002】
テレビ、ラジオ、新聞及び雑誌等の、従来の媒体を使用する広告は周知である。残念なことに、人口学的な研究及び多様な報道発信源の典型的な視聴者についてのまったく妥当な前提で準備していても、広告主は自分の広告予算の大半が単に無駄にされていることを認識している。さらに、このような無駄を特定し、排除することは非常に困難である。
【0003】
最近では、より双方向性の媒体での広告が一般的になってきた。例えば、インターネットを使用する人の数が爆発的に伸びるにつれ、広告主はインターネット上で提供される媒体とサービスを、広告を行うための潜在的に強力な方法として捉えるようになった。
【0004】
広告主は、このような広告の価値を最大限にする目的で複数の戦略を作成してきた。1つの戦略では、広告主は、(一般性を失うことなく本明細書中で「ウェブサイト」と呼ばれる)双方向性の媒体又はサービスを提供するための一般的な存在又は手段を、多数の消費者へのパイプとして使用する。この第1の手法を使用して、広告主は、例えばニューヨークタイムズのウェブサイト(New York Times Website)又はUSAトゥデイのウェブサイト(USA Today Website)のホームページ上に、広告を掲載してよい。別の戦略では、広告主はより狭いニッチ視聴者をその広告の対象とし、それにより視聴者の前向きの反応の尤度を高めようと試みる可能性がある。例えば、コスタリカの熱帯雨林での観光を奨励している官庁は、ヤフー(登録商標)ウェブサイト(Yahoo Website)のエコツーリズム−旅行のサブディレクトリに広告を掲載する可能性がある。広告主は通常はこのような対象の設定を手作業で決定する。
【0005】
戦略に関係なく、ウェブベースの広告(「ウェブ広告」とも呼ばれる)は、通常、「バナー広告」−つまり、グラフィック要素を含む矩形のボックス−の形で、その広告視聴者に提示される。広告視聴者の一員(一般性を失うことなく本明細書中では「視聴者」又は「ユーザ」と呼ばれる)が、これらのバナー広告のうち1つをクリックすることにより選択すると、通常、埋め込まれているハイパーテキストリンクが視聴者を広告主のウェブサイトに案内する。視聴者が広告を選択するこのプロセスが、一般的に「クリックスルー」(「クリックスルー」は、任意のユーザの選択をカバーすることを目的としている)と呼ばれている。広告のインプレッション数(つまり広告が表示される回数)に対するクリックスルー数の割合が、一般的に広告の「クリックスルー率」と呼ばれる。
【0006】
ユーザが過去に供給された広告に関連したトランザクションを完了すると、「コンバージョン」が発生すると言われている。コンバージョンを構成している内容は場合によって異なり、種々の方法で決定できる。それは例えば、ユーザが広告主のウェブページと呼ばれる広告をクリックし、そのウェブページを離れる前にそこで購入を完了すると、コンバージョンが発生するケースである可能性がある。代わりに、コンバージョンは、ユーザが広告を見てから、所定の時間(例えば7日間)内に広告主のウェブページで購入することとして定義される場合がある。さらに別の代替策では、コンバージョンは、例えばホワイトペーパーをダウンロードする、ウェブサイトの少なくとも既定の深部まで進む、少なくとも特定数のウェブページを表示する、ウェブサイト又はウェブページで少なくとも所定の時間量を費やす、ウェブサイトで登録する等の、測定可能/観察可能なユーザアクションであるとして、広告主に定義されてよい。コンバージョンを構成するユーザアクションはこれに限られていないが、多くの場合、ユーザアクションが購入の完了を示さない場合、それらが販売の手がかりを示すことがある。実際に、何がコンバージョンを構成するのかについて、他の多くの定義が考えられる。広告インプレッション数(つまり広告が表示される回数)に対するコンバージョン数の割合は、一般にはコンバージョン率と呼ばれる。コンバージョンが広告が供給されてから所定の時間内に発生し得ると定義される場合、コンバージョン率の1つの考えられる定義が、過去の所定の時間より多く供給された広告を考慮するにすぎない可能性がある。
【0007】
ウェブサイトベースの広告の当初の展望にも関わらず、既存の手法にはいくつかの問題が残されている。広告主は大きな客層に到達できるが、しばしば自分の広告投資からの収益に満足していない。
【0008】
同様に、(「ウェブサイトホスト」、又は「広告消費者」と呼ばれる)広告が提示されるウェブサイトホストは、ユーザの経験を損なうことなく広告収入を最大限にするという課題を抱えている。ユーザの利益を超えて広告収入を位置づけるウェブサイトホストもいる。このような1つのウェブサイトが、ユーザのクエリーに応えて「検索結果」を装う広告を返すいわゆる「検索エンジン」サービスを主催する「Overture.com」である。Overture.comウェブサイトは、広告主が金を支払って、検索結果と称するもののリストの上の方に自分のウェブサイト(又は対象のウェブサイト)の広告を配置できるようにしている。ユーザが広告をクリックした場合にだけ広告主が支払いをする(つまりコストパークリック)ような方式が実現されている場合、対象設定がうまく行われていない広告はクリックされず、したがって支払いを必要としないために、広告主は自らの広告の対象を効果的に設定する意欲をなくしてしまう。その結果、高いコストパークリックの広告がトップの近くに、又はトップに表示されるが、視聴者はそれらをクリックしないため、必ずしも広告発行元にとっての本当の収入にはならない。さらに、視聴者がクリックするであろう広告は、リストのさらに下のほうにある、あるいはリストには載っていないために、広告の関連性は損なわれる。
【0009】
例えばグーグル(登録商標)(Google(登録商標))等の検索エンジンは、広告主が自らの広告が検索結果のページとともに表示されるように、及びそれらが検索結果ページを表示するように指示したクエリーにおそらく関連性があるように、広告の対象を設定できるようにした。e−メール情報に基づいて広告の対象を設定するもの(例えば、2003年6月2日に出願された、Jeffrey A.Dean、Georges R.Harik及びPaul Bucheitを発明者として示す「Eメールに関連した情報を使用して広告を提供すること(SERVING ADVERTISEMENTS USING INFORMATION ASSOCIATED WITH E−MAIL)」と題される(参照してここに組み込まれる)米国特許出願第10/452,830号に説明されているシステム)、あるいはコンテンツに基づいたターゲット広告(2003年2月26日に出願された、Darrel Anderson、Paul Bucheit、Alex Carobus、Claire Cui、Jeffrey A.Dean、Georges R.Harik、Deepak Jindal及びNarayanan Shivakumarを発明者として示す「コンテンツに基づいて広告を供給すること(SERVING ADVERTISEMENTS BASED ON CONTENT)」と題される(参照してここに組み込まれる)米国特許出願第10/375,900号を参照されたい)等の、他の対象が設定された広告システムも、同様の課題を抱えている可能性がある。すなわち、広告システムは、ユーザ要求情報に概して関連性のある、特に現在のユーザの関心に関係する広告を提示しようとする。
【0010】
前記から理解できるように、キーワード対象設定(keyword−targeted)広告又はコンテンツ対象設定(content−targeted)広告等の対象設定広告システムは、非常に有用な形式の広告を提供する。ただし、通常、関連性のある広告を供給できるオンライン広告システムも、多くの場合、特定のユーザに最も適した関連性のある広告を選択することはできない。
【0011】
したがって、オンライン広告の性能を改善する必要性がある。さらに具体的には、要求を提出したユーザに対する、例えば検索クエリー又は文書要求等の、何らかのユーザ要求のために供給される広告の関連性を高める必要性がある。
【発明の概要】
【0012】
本発明は、広告を採点するために使用される一致を決定するための方法及び装置を説明する。このような方法及び装置は、(a)(i)広告の広告待ち受けページのユーザプロファイル情報及び/又は広告の対象を設定するために使用されるユーザプロファイル情報、及び(ii)広告が表現される先のユーザのユーザプロファイル情報を使用して、第1の一致値を求めてよく、(b)(i)広告の待ち受けページのユーザプロファイル情報及び/又は広告の対象を設定するために使用されるユーザプロファイル情報、及び(ii)広告が供給される文書のユーザプロファイル情報を使用して、第2の一致値を求めてよく、(c)第1の一致値と第2の一致値を使用して広告を採点するために使用される一致を決定してよい。
【0013】
本発明は、前記のような方法及び装置において、あるいはユーザプロファイル情報を使用して広告の対象を設定するための他の方法及び装置において、広告の広告待ち受けページのユーザプロファイル情報の少なくとも一部、広告の対象設定に使用されるユーザプロファイル情報の少なくとも一部、ユーザのユーザプロファイル情報の少なくとも一部、及び/又は文書のユーザプロファイル情報の少なくとも一部が、推測されてよいことも教示する。
【0014】
本発明の一実施形態では、ユーザのためのユーザプロファイル情報は、(a)ユーザのために初期ユーザプロファイル情報を決定すること、(b)ユーザのためにユーザプロファイル情報を推測すること、及び(c)初期ユーザプロファイル情報と推測されたユーザプロファイル情報の両方を使用して、ユーザのためのユーザプロファイル情報を決定することによって、決定されてよい。ユーザのための初期ユーザプロファイル情報は、ユーザによって提出された過去の検索クエリー、及び/又はユーザによる過去の文書の選択を使用して決定されてよい。
【0015】
本発明の一実施形態では、ユーザのためのユーザプロファイル情報は、(a)多くの文書のそれぞれとユーザのためのノードを定義すること、(b)グラフを定義するためにノード間に関連がある場合にノード間でエッジを追加すること、及び(c)グラフのトポロジー及び他の文書のユーザプロファイル情報を使用してユーザのためのユーザプロファイル情報を推測することによって、推測されてよい。
【0016】
本発明の一実施形態では、文書のためのユーザプロファイル情報は、(a)文書のための初期ユーザプロファイル情報を決定すること、(b)文書のためのユーザプロファイル情報を推測すること、及び(c)初期ユーザプロファイル情報と推測されたユーザプロファイル情報の両方を使用して、文書のためのユーザプロファイル情報を決定することによって、決定されてよい。文書のための初期ユーザプロファイル情報は、文書からのコンテンツ情報、及び/又は文書メタ情報を使用して決定されてよい。
【0017】
本発明の一実施形態では、文書のためのユーザプロファイル情報は、(a)多くの文書のそれぞれのための、及び多くのユーザのそれぞれのためのノードを定義すること、(b)グラフを定義するためにノード間に関連がある場合にノード間にエッジを追加すること、(c)グラフのトポロジー、及びユーザの、及び他の文書のユーザプロファイル情報を使用して文書のためのユーザプロファイル情報を推測することによって、推測されてよい。
【図面の簡単な説明】
【0018】
【図1】広告システムと対話できる関係者又はエンティティを示す高水準図である。
【図2】本発明が中で又は用いて動作してよい、例示的な広告環境のバブルチャートである。
【図3】図2に示されたようなオンライン広告環境の中で、あるいは図2に示されたようなオンライン広告環境を用いて使用されてよい、本発明にしたがった動作のバブルチャートである。
【図4】本発明にしたがった方法で生成され、更新され、及び/又は使用されてよい、ユーザプロファイル情報を記憶するための、例示的なデータ構造を示す。
【図5】広告スコア(sore)の係数であってよい全体的な一致値の考えられる成分を示す。
【図6】本発明にしたがった方法で文書UPIを決定するために使用されてよい、例示的な方法600のフロー図である。
【図7】本発明にしたがった方法でユーザUPIを決定するために使用されてよい、例示的な方法700のフロー図である。
【図8】本発明にしたがった方法で初期のUPI又はベースライン文書UPIを決定するために使用されてよい、例示的な方法800のフロー図である。
【図9】本発明にしたがった方法で初期のUPI又はベースラインユーザUPIを決定するために使用されてよい、例示的な方法900のフロー図である。
【図10】ユーザと文書がどのように関連付けられるのかを示す。
【図11】本発明にしたがった方法でユーザ及び/又は文書を関連付けるために使用されてよい、例示的な方法1100のフロー図である。
【図12】実行されてよい多様な動作の少なくともいくつかを達成するために、及び本発明にしたがった方法で使用及び/又は生成されてよい情報を記憶するために、使用されてよい装置のブロック図である。
【発明を実施するための形態】
【0019】
本発明は、ユーザプロファイル情報を決定し、このような決定されたユーザプロファイル情報を広告供給のために使用するための、新規の方法、装置、メッセージフォーマット、及び/又はデータ構造を含んでよい。以下の説明は、当業者が本発明を作り、使用できるようにするために提示され、特定の応用例及びそれらの要件との関連で提供される。開示される実施形態に対する多様な変形は当業者に明らかとなり、以下に述べられる一般的な原則は他の実施形態及び応用例に適用されてよい。したがって、本発明は示されている実施形態に制限されることを意図せず、発明者は自らの発明を、説明されている任意の特許性がある主題と見なす。
【0020】
広告対象設定を改善するための1つの考えられる方法は、広告対象設定システムがユーザプロファイルを取得し、使用することである。例えば、ユーザプロファイルは、(例えばユーザがサービスに加入しているとき等)ユーザが自発的に与える情報を使用して決定されてよい。このユーザ属性情報は、次に広告の広告主指定属性(例えば対象設定基準)と突き合わされてよい。残念なことに、多くのウェブサイト(例えば検索エンジン)は加入又はユーザ登録を必要としないため、ユーザプロファイル情報は必ずしもいつも入手できない。さらに、たとえ入手できるときも、ユーザプロファイルは不完全である場合がある(例えば、加入時に与えられる情報は、プライバシーの考慮等のためにサービスに必要とされるものに限定され、したがって包括的ではない可能性があるからである)。さらに、広告主はユーザプロファイル対象設定情報を手作業で設定する必要がある場合がある。さらに、ユーザプロファイル情報が入手できる場合でも、広告主が効果的に広告の対象を設定するためにこの情報を使用できない可能性がある。
【0021】
以下では、本発明が中で動作してよい環境、又は本発明が用いて動作してよい環境が第4.1項に説明される。本発明の例示的な実施形態は第4.2項に説明される。いくつかの代替策及び改良版は第4.3項に説明される。最後に、本発明に関するいくつかの結論は第4.4項に述べられている。
【0022】
第4.1項 本発明が中で動作してよい、又は本発明が用いて動作してよい環境
第4.1.1項 例示的な広告環境
図1は、広告環境の高水準図である。該環境は広告入力保持及び配信システム120を含んでよい。広告主110は、システム120に広告情報を直接的に又は間接的に入力、保持、及び追跡調査してよい。広告は、いわゆるバナー広告等のグラフィック広告、テキストのみの広告、画像広告、音声広告、ビデオ広告、このような構成要素のうち1つ以上(one of more)を組み合わせた広告の形をとってよい。広告は、リンク等の埋め込まれた情報、及び/又は機械実行可能な命令を含んでもよい。広告消費者130は、彼らの要求に応える広告をシステム120から受け入れ、システム120に使用情報を提供するために、広告に対する要求を提出してよい。図示されていないが、他のエンティティは、システム120に(広告と関連したコンバージョン又はクリックスルーが発生したかどうか等の)使用情報を提供してよい。この使用情報は、供給された広告に関連した、測定された又は観察されたユーザ動作を含んでよい。
【0023】
広告消費者130の1つの例は、コンテンツ(例えば、記事、議論スレッド、音楽、ビデオ、グラフィックス、検索結果、ウェブページのリスト等)に対する要求を受信し、要求に応えて要求されたコンテンツを取り出す、あるいはそれ以外の場合提供する、一般コンテンツサーバである。コンテンツサーバは、システム120に広告に対する要求を提出してよい。このような広告要求は、所望される多くの広告を含んでよい。広告要求はまた、コンテンツ要求情報を含んでよい。この情報は、コンテンツ自体(例えばページ)、コンテンツ又はコンテンツ要求に対応するカテゴリ(例えば、アート、ビジネス、コンピュータ、アート−映画、アート−音楽等)、コンテンツ要求の一部又はすべて、コンテンツ寿命、コンテンツタイプ(例えば、テキスト、グラフィックス、ビデオ、音声、混合媒体等)、ジオロケーション情報等を含んでよい。
【0024】
コンテンツサーバは、システム120によって提供される広告の1つ以上と、要求されたコンテンツを組み合わせてよい。コンテンツと広告(複数の場合がある)を含むこの組み合わされた情報は、次に、ユーザに提示するために、コンテンツを要求したエンドユーザに向かって転送される。最後に、コンテンツサーバは広告に関する情報、及びどのようにして、いつ、及び/又はどこで広告を表示しなければならないのか(例えば、場所、クリックスルーか否か、インプレッション時間、インプレッション日付、サイズ、コンバージョンか否か等)についての情報を、システム120に送り返してよい。代わりに、又はさらに、このような情報は何らかの手段によってシステム120に提供し直されてよい。
【0025】
広告消費者130の別の例が検索エンジンである。検索エンジンは検索結果のためのクエリーを受け取ってよい。それに応じて、検索エンジンは関連する検索結果を(例えばウェブページのインデックスから)取り出してよい。例示的な検索エンジンは、S.Brin及びL.Pageの記事、「大規模ハイパーテキスト検索エンジンの解剖(The Anatomy of a Large−Scale Hypertextual Search Engine)」、第7回国際ワールドワイドウェブ会議(Seventh International World Wide Web Conference)、オーストラリア、ブリスベン(Brisbane,Australia)及び米国特許第6,285,999号(ともに参照してここに組み込まれる)に説明されている。このような検索結果は、例えばウェブページのタイトルリスト、それらのウェブページから抽出されたテキストの抜粋、及びそれらのウェブページへのハイパーテキストリンクを含んでよく、所定数の(例えば10の)検索結果に分類されてよい。
【0026】
検索エンジンは、システム120に広告に対する要求を提出してよい。要求は所望される多数の広告を含んでよい。この数は、検索結果、検索結果によって占められる画面又はページ空間の量、広告の大きさと形状等に依存してよい。一実施形態では、所望される広告の数は1から10、好ましくは3から5となるであろう。広告に対する要求は(入力又は構文分析されたとおりの)クエリー、(クエリーが関係者及びこのような関係者の識別子からきたのかに関係なく、ジオロケーション情報等の)クエリーに基づいた情報、及び/又は検索結果と関連付けられた又は検索結果に基づいた情報を含んでもよい。このような情報は、例えば検索結果に関連した識別子(例えば文書識別子、つまり「docID」)、検索結果に関連したスコア(例えば、クエリー及び文書、ページランクスコア、及び/又はIRスコアとページランクスコアの組み合わせに対応する特徴ベクトルのドット積のような情報検索(「IR」)スコア)、特定された文書から抽出されるテキストの抜粋(例えばウェブページ)、特定された文書の全文、特定された文書の特徴ベクトル等を含んでよい。
【0027】
検索エンジンは、システム120によって提供される広告の1つ以上と検索結果を結合してよい。検索結果と広告(複数の場合がある)を含むこの結合された情報は、次にユーザに提示するために、コンテンツを要求したユーザに向かって転送される。好ましくは、検索結果は、有料広告とおそらくは中立の検索結果の間でユーザを惑わせないように、広告と区別して保持される。
【0028】
最後に検索エンジンは、広告に関する情報、及び広告がいつ、どこで、及び/又はどのようにして表示されるべきであったのか(例えば、位置、クリックスルーか否か、インプレッション時間、インプレッション日付、コンバージョンか否か等)についての情報を、システム120に送り返してよい。代わりに、又はさらに、このような情報は何らかの手段によってシステム120に提供し直されてよい。
【0029】
第4.12章 例示的な広告入力保持および配信環境
図2は、本発明が中で使用されてよい、あるいは本発明がともに使用されてよい、例示的な広告システム120’を示す。例示的な広告システム120’は在庫システム210を含んでよく、広告情報205と使用情報245を記憶してよい。例示的なシステム120’は、広告情報入力管理動作215、キャンペーン(例えば対象設定)支援動作220、会計及び請求書作成発行動作225、広告供給動作230、関連性決定動作235、最適化動作240、相対提示属性割り当て(例えば、位置順序付け)動作250、不正検出動作255、及び結果インタフェース動作260を支援してよい。
【0030】
広告主110は、インタフェース216によって示されるように、広告情報入力管理動作215を介してシステム120’と接続してよい。広告消費者130は、インタフェース231によって示されるように広告供給動作230を介してシステム120’と接続してよい。広告消費者130及び/又は他のエンティティ(図示せず)は、インタフェース261によって示されるように結果インタフェース動作260を介してシステム120’と接続してもよい。
【0031】
広告プログラムは、アカウント、キャンペーン、クリエーティブ、対象設定等に関する情報を含んでよい。用語「アカウント」は、既定の広告主についての情報(例えば、一意のeメールアドレス、パスワード、請求書作成発行情報等)に関する。「キャンペーン」又は「広告キャンペーン」は、1つ以上の広告のうちの1つ以上のグループに関し、開始日、終了日、予約情報、ジオターゲティング情報、シンジケート情報等を含んでよい。例えば、ホンダ(登録商標)(Honda)は、その自動車取扱商品のための1つの広告キャンペーンと、そのオートバイ取扱商品のための別個の広告キャンペーンを有してよい。その自動車取扱商品のためのキャンペーンは、それぞれが1つ以上の広告を含む1つ以上の広告グループを有してよい。各広告グループは、キーワードの集合、及び最大費用付け値(bid)(クリックスルーあたり費用、コンバージョンあたり費用等)を含んでよい。代わりに、あるいは加えて、各広告グループは平均費用付け値(例えば、クリックスルーあたり平均費用、コンバージョンあたり平均費用等)を含んでよい。したがって、単一の最大費用付け値及び/又は単一の平均費用付け値は1つ以上のキーワードと関連付けられてよい。このように、各広告グループは1つ以上の広告つまり「クリエーティブ」(すなわち、最終的にエンドユーザに表示される広告コンテンツ)を有してよい。当然、広告情報205は多かれ少なかれ情報を有してよく、多くの異なる方法で編成されてよい。
【0032】
広告情報205は、該広告情報入力管理動作215を介して入力、管理できる。キャンペーン(例えば対象設定)支援動作220は、広告主110が効果的な広告キャンペーンを作成するのを手助けするために利用できる。例えば、キャンペーン支援動作220は、検索エンジンとともに使用するための広告の関連で、すべての考えられる広告インプレッション、すでに予約されている広告インプレッション、及び既定のキーワードについて利用可能な広告インプレッションを追跡調査してよい、在庫システム210によって提供される情報を使用できる。
【0033】
広告供給動作230は、広告消費者130からの広告に対する要求を果たしてよい。広告供給動作230は、既定の要求のための候補広告を決定するために関連性決定動作235を使用してよい。広告供給動作230は、次に候補広告のうち1つ以上の最終的な集合を選択するために最適化動作240を使用してよい。広告供給動作230は、次に返される広告の提示を順序付けるために、相対提示属性割り当て動作250を使用してよい。会計及び請求書作成発行動作225は、広告の供給に関連する料金を追跡調査するため、及び広告主に請求書を送るために使用されてよい。不正検出動作255は、盗まれたクレジットカードの使用による等、広告システムの(例えば広告主による)不正な使用を削減するために使用できる。最後に、結果インタフェース動作260は、クリックスルーが発生したかどうか、コンバージョンが発生したかどうか(例えば、広告された商品又はサービスの販売が開始されたか、あるいは広告の表示から所定の時間内に完了されたか)等の、実際に供給された広告について(消費者130又は他の何らかのエンティティからの)結果情報を受け入れるために使用されてよい。このような結果情報はインタフェース261に受け入れられ、関連付けられた結果だけではなく、広告及び広告が供給された時刻を特定するための情報も含んでよい。
【0034】
本発明の多様な態様は、関連性決定動作235、相対的な提示属性順序付け動作250、及び/又は広告供給動作230とともに使用されてよい。
【0035】
第4.1.3項 例示的なネットワーク環境
図3は、本発明が使用されてよい例示的なネットワーク環境300を示す。例示的なネットワーク環境300は、それぞれがブラウザ320(又は何らかの他の情報要求表示手段)を有する、1台以上のクライアントデバイス310を含んでよい。クライアントデバイス310は、1台以上のコンテンツサーバ320によって供給される文書335を要求し、1つ以上の検索エンジン340を使用してそれらの又は他の文書に含まれるコンテンツを検索できる。広告サーバ350は、1つ以上の広告355を供給できる。供給された該1つ以上の広告355は、コンテンツサーバ330によって供給される文書(及び/又はこのような文書に対する要求)に関連性があってよい、及び/又は検索エンジン340によって生じる検索結果(及び/又は検索クエリー)に関連性があってよい。(例えば、1台以上のクライアントデバイス310と関連付けられる個々のユーザ又はユーザのグループについての)ユーザ情報365は、1台以上の情報サーバ360に記憶されてよい。代わりに、又は加えて、ユーザ情報(図示せず)は、1台以上のコンテンツサーバ330、1つ以上の検索エンジン340、及び/又は1つ以上の広告サーバ350に記憶されてよい。1台以上のクライアントデバイス310、コンテンツサーバ330、検索エンジン340、広告サーバ350、及び/又はユーザ情報サーバ360は、1つ以上のネットワーク370を介して互いと情報を交換してよい。該1つ以上のネットワーク370はインターネット及びサーバであってよく、検索エンジンはコンピュータであってよい。ユーザ情報(例えば、ユーザプロファイルデータベース)、情報インデックス、及び広告インデックスは、別のレポジトリである必要はない。それらは、単一のレポジトリに記憶されてよい。さらに、データのこれらの形式はインタリーブ化されてよい(例えば、広告データベースは、いくつかの部分集合だけが特定のタイプのユーザのために取り出されるように、広告上に「ユーザ特徴タグ」を含んでよい)。
【0036】
第4.1.4項 定義
図1、図2、図3を参照して前述された例示的なシステム及び任意の他のシステムで使用されるようなオンライン広告は、多様な固有の特徴を有してよい。このような特徴は、アプリケーション及び/又は広告主によって指定されてよい。これらの特徴は以下で「広告特徴」と呼ばれている。例えば、テキスト広告のケースでは、広告特徴は、タイトル行、広告テキスト、及び埋め込まれているリンクを含んでよい。画像広告のケースでは、広告特徴は、画像、実行可能なコード、及び埋め込まれているリンクを含んでよい。オンライン広告のタイプに応じて、広告特徴は、テキスト、リンク、音声ファイル、ビデオファイル、画像ファイル、実行可能コード、埋め込まれている情報等のうち、1つ以上を含んでよい。
【0037】
オンライン広告が供給されるときには、該広告がどのようにして、いつ、及び/又はどこで供給されたのかを説明するために、1つ以上のパラメータが使用されてよい。これらのパラメータは以下で「供給パラメータ」と呼ばれる。供給パラメータは、例えば、広告が供給されたページ(上の情報を含む)の特徴、広告の供給と関連付けられた検索クエリー又は検索結果、ユーザ特性(例えば、彼らのジオロケーション、ユーザにより使用されている言語、使用されているブラウザのタイプ、過去のページ表示、過去の動作)、要求を開始したホスト又は関係者のサイト(例えば、アメリカオンライン(America Online)、グーグル(Google)、ヤフー(Yahoo))、広告が供給されていたページにおける広告の絶対位置、他の供給される広告を基準にした広告の位置(空間的又は時間的)、広告の絶対サイズ、他の広告を基準にした広告のサイズ、広告の色、他の供給される広告の数、供給される他の広告のタイプ、供給される時刻、広告される曜日(time of week)、広告される季節(time of year)等のうち1つ以上を含んでよい。当然ながら、本発明に関連して使用されてよい、他の供給パラメータもある。
【0038】
供給パラメータは広告特徴にとって付帯的であってよいが、それらは供給条件又は制約として広告と関連付けられてよい。供給条件又は制約として使用されるとき、このような供給パラメータは単に「供給制約」(つまり「対象設定基準」)と呼ばれる。例えば、いくつかのシステムでは、広告主は、それが平日だけに、特定の位置より下ではなく、特定のジオロケーションのユーザに対してだけ供給されなければならない等を指定することによって、その広告の供給の対象を設定できてよい。別の例として、いくつかのシステムでは、広告主は、ページ又は検索クエリーが特定のキーワード又は句を含む場合にだけ、その広告が供給されなければならないと指定してよい。さらに別の例として、いくつかのシステムでは、広告主が、供給されている文書が特定のトピック又は概念を含む、あるいは特定の1つ以上のクラスタ、又は何らかの他の1つ以上の分類に該当する場合にだけ、その広告が供給されなければならないと指定してよい。「ジオロケーション」情報は、1つ以上の国、1つ以上の(国間の)地方、1つ以上の州、1つ以上の首都圏、1つ以上の都市、1つ以上の町、1つ以上の区、共通の郵便番号が付いた1つ以上の地域、共通の電話局番の付いた1つ以上の地域、共通のケーブル電波中継局により供給される1つ以上の地域、共通ネットワークアクセスポイント又はノードによって供給される1つ以上の領域等のうち1つ以上を指定する情報を含んでよい。それは緯度及び/又は経度、あるいはこれらの範囲を含んでよい。それはユーザの位置が推定できるIPアドレス等の情報を含んでよい。
【0039】
「広告情報」は、このような情報の拡張部(例えば、広告関連情報から引き出された情報)だけではなく、広告特徴、広告供給制約、(「広告導出情報」と呼ばれる)広告特徴又は広告供給制約から引き出すことができる情報、及び/又は(「広告関連情報」と呼ばれる)広告に関連した情報の任意の組み合わせも含んでよい。
【0040】
「文書」は、コンピュータが解読できる、又はコンピュータが記憶できる任意の作業生産物を含むように広義に解釈されるべきである。文書は、ファイル、ファイルの組み合わせ、他のファイルに対する埋め込みリンクのある1つ以上のファイル等であってよい。ファイルは、テキスト、音声、画像、ビデオ等の任意のタイプであってよい。エンドユーザに表示される文書の部分を、文書の「コンテンツ」と見なすことができる。文書は、コンテンツ(ワード、ピクチャ等)及びそのコンテンツの意味の何らかの表示(例えば、eメールフィールド及び関連付けられたデータ、HTMLタグ及び関連データ等)の両方を含む、「構造化データ」を含んでよい。文書中の広告スポットは、埋め込まれた情報又は命令によって定義されてよい。インターネットの関連では、共通の文書はウェブページである。ウェブページは多くの場合、コンテンツを含み、(メタ情報、ハイパーリンク等の)埋め込まれた情報、及び/又は(Java(登録商標)script等の)埋め込まれた命令を含んでよい。多くのケースでは、文書は一意の、アドレス指定可能な記憶位置を有し、したがってこのアドレス指定可能な位置によって一意に識別できる。ユニバーサルリソースロケータ(URL)は、インターネット上で情報にアクセスするために使用される一意のアドレスである。
【0041】
「文書情報」は、(例えば、関連情報から引き出される情報等の)このような情報の拡張だけではなく、文書に含まれる任意の情報、(「文書導出情報」と呼ばれる)文書に含まれる情報から引き出すことのできる情報、及び/又は(「文書関連情報」と呼ばれる)文書に関連する情報も含んでよい。文書導出情報の例は、文書のテキストコンテンツに基づいた分類である。文書関連情報の例は、当該の文書がリンクする他の文書からの文書情報だけではなく、当該の文書へのリンクのある他の文書からの文書情報も含む。
【0042】
「eメール情報」は、(例えば、関連情報から引き出される情報等の)このような情報の拡張部だけではなく、(「内部eメール情報」と呼ばれることもある)eメールに含まれる任意の情報、eメール情報に含まれる情報から引き出すことのできる情報、及び/又はeメールに関連する情報も含んでよい。eメール情報から引き出される情報の例は、eメールの件名の行から抽出される用語から構成される検索クエリーに応えて返される検索結果から、抽出される、あるいはそれ以外の場合引き出される情報である。eメール情報に関連する情報の例は、既定のeメールの同じ送信者によって送信される1つ以上の他のeメールについてのeメール情報、又はeメール受取人についてのユーザ情報を含む。eメール情報から引き出される、あるいはeメール情報に関連する情報は、「外部eメール情報」と呼ばれてよい。
【0043】
文書からのコンテンツは、「コンテンツレンダリングアプリケーション又はデバイス」で表示されてよい。コンテンツレンダリングアプリケーションの例は、インターネットブラウザ(例えば、エクスプローラ(Explorer)又はネットスケープ(Netscape)、メディアプレーヤ(例えば、MP3プレーヤ、リアルネットワークス(Realnetworks)ストリーミング音声ファイルプレーヤ等)、ビューワ(例えば、アドビアクロバット(Adobe(登録商標) Acrobat)pdfリーダ)等を含む。
【0044】
「コンテンツオーナ」とは、文書のコンテンツに何らかの所有権を有する人物又はエンティティである。コンテンツオーナはコンテンツの作者であってよい。加えて、又は代わりに、コンテンツオーナは、コンテンツを複製する権利、コンテンツの派生著作物を作成する権利、コンテンツを公に表示する又は実行する権利、及び/又はコンテンツの他の所定の権利を有してよい。コンテンツサーバが、それが供給する文書のコンテンツにおいてコンテンツオーナである可能性があるが、これは必須ではない。
【0045】
(「UPI」とも呼ばれる)「ユーザプロファイル情報」は、個人ユーザ又はユーザのグループについての任意の情報を含んでよい。このような情報は、ユーザによって提供されてよく、ユーザ情報を公開することを許可されているサードパーティによって提供されてよく、及び/又はユーザアクションから引き出されてよい。特定のユーザ情報は、同じユーザの他のユーザ情報及び/又は他のユーザのユーザ情報を使用して演繹又は推測できる。UPIは多様なエンティティと関連付けられてよい。「ユーザUPI」は特定のユーザ又はユーザのグループと関連付けられるユーザプロファイル情報である。「文書UPI」は、文書と関連付けられるユーザプロファイル情報である。例えば、文書UPIは、文書を要求した又は文書にアクセスしたユーザの多様なユーザUPIの複合表現であってよい。「広告待ち受けページUPI」は特定のタイプの文書UPIであり、おそらく彼らが広告を選択した(例えばクリックした)ことに応じて、ある特定のウェブページにアクセスした、あるいはある特定のウェブページで購入を完了した多様なユーザの複合表現であってよい。「対象設定UPI」は、ユーザプロファイル供給制約を含んでよい。例えば、前立腺がん検診のための広告は、属性「男性」及び「年齢45歳以上」を有するユーザプロファイルに限定される可能性がある。
【0046】
本発明の多様な例示的な実施形態は、ここで第4.2項に説明される。
【0047】
第4.2項 例示的な実施形態
第4.2.1項 例示的なユーザ情報
図4は、本発明にしたがった方法でユーザプロファイル情報(UPI)を記憶するために使用されてよい、例示的なデータ構造400である。図示されていないが、そのデータ構造400は識別子を含んでよい。このような識別子は、ある特定のユーザ、ユーザのグループ、文書、広告、広告待ち受けページ等と、UPIとを関連付けるために使用されてよい。UPIは、1つ以上のUPI属性420に関連する情報410の1つ以上の集合体を含んでよい。各属性420は、関連付けられた値430とスコア440を有してよい。
【0048】
UPI属性420は、例えば、地理情報、年齢又は年齢層、関心のある話題、読書レベル、収入、及び広告の対象を設定するために適した他の人口統計データ等の、ユーザの背景及び関心に関する情報を含んでよい。UPI属性420と関連付けられた値430は、量的(離散値又は連続値、例えば年齢=58歳、年収=55,000ドル、居住都市=サンフランシスコ、カリフォルニア州(San Francisco,CA)又は質的(集合の中、又は集合の中ではない、例えば、給料が$50,000−$100,000?=イエス;米国在住か?=イエス)であってよい。各UPI属性420及び値430は、属性の値が正しい確率に関連する関連スコア440を有してよい。UPI属性の例は以下の1つ以上を含んでよい。
【0049】
−ユーザがアクセスした(又は特定の期間内にアクセスした)ウェブサイトのコンテンツ(例えば、ワード、Anchortext等)
−人口学的情報、
−地理情報、
−心理情報、
−ユーザが行った過去のクエリー(及び/又は関連情報)、
−ユーザに表示され、選択した、及び/又は見た後に購入した、過去の広告についての情報、
−ユーザによって表示された/要求された及び/又は編集された文書(例えばワードプロセッサ)についての情報、
−ユーザの関心、
−ユーザからの個人的な結果に関する、明示的又は暗示的なフィードバック(例えば、結果を選択する、結果を選択しない、結果に関して費やされる時間の量等)、
−ブラウジング活動、及び、
−過去の購入動作。
【0050】
このような情報は、個人単位で記憶されてよい(プライバシーの問題から個人識別可能な情報を含まない可能性がある)、あるいは個人の多様な集団の中で種々の方法で集められてよい。このような情報は複合プロファイルを得るために結合されてよい。
【0051】
第4.2.2項 UPIを使用するための例示的なアプリケーション
ユーザプロファイル情報(UPI)を使用するための多くのアプリケーションがある。3つの例示的なアプリケーション−強化広告対象設定、広告クリエーティブ選択と生成、及びクエリー両義性解決−が後述される。
【0052】
第4.2.2.1項 UPIを使用する広告採点
広告の対象設定されたUPI(及び/又は広告の待ち受けページのUPI)が文書UPIに一致する(例えば、文書を要求したユーザの平均的なUPI)に一致するホストサイト又はページに広告を掲載すること、及び/又はUPIが広告(及び/又は広告の待ち受けページのUPI)のターゲットUPIに一致するユーザに広告を供給することが望ましい場合がある。
【0053】
UPIを使用する強化広告対象を用いると、複数の広告のそれぞれのスコアは、ユーザのUPI、文書のUPI、広告待ち受けページのUPI、及び/又は広告対象設定UPIの少なくともいくつかを使用して決定されてよい。少なくとも1つの広告は順位で順序付けられ、フィルタリングされ、及び/又は少なくとも決定されたスコアを使用して複数の広告から選択されてよい。
【0054】
例えば、広告スコアはUPI一致値の関数であってよい。図5を参照すると、このようなUPI一致値は、(i)ユーザ(又はユーザグループ)512と関連付けられたUPI情報514と、ユーザ512によって要求される(又はアクセスされる)文書(例えば、ウェブページ)と関連付けられたUPI情報514との一致値(一致値1)、(ii)ユーザ(又はユーザグループ)512と関連付けられたUPI情報514と、検討中の広告の待ち受けページ532と関連付けられたUPI情報534との一致値(一致値2)、(iii)ユーザによって要求される(又はアクセスされる)文書522と関連付けられたUPI情報524と、検討中の待ち受けページ532と関連付けられるUPI情報534との一致値(一致値3)、(iv)ユーザ(又はユーザグループ)512と関連付けられたUPI情報514と、検討中の広告542と関連付けられたUPI広告対象設定情報544との一致値(一致値4)、及び(v)ユーザによって要求される又はアクセスされている文書522と関連付けられたUPI情報524と、検討中の広告542と関連付けられたUPI広告対象設定情報544の一致値(一致値5)のうち、1つ以上の関数であってよい。
【0055】
このようにして、本発明の一実施形態では、全体的な一致は以下のように定義されてよい。
【0056】
UPI一致=a*一致値1+b*一致値2+c*一致値3+d*一致値4+e*一致値5
ここで、a、b、c、d及びeは定数である(例えば、a=0.025、b=0.275、c=0.3、d=0.2、及びe=0.2)。ユーザUPIと文書UPIの間の一致は、広告にどれか1つがどれほどよく一致するのかには関係ない可能性があるため、「a」がゼロに設定されてよいことに留意されたい。多項式又は指数関数を含む他の関数が代わりに使用されてよい。
【0057】
一般的には、優れた一致のためには、ユーザのUPIはホストページUPIに一致し、おそらくさらに重要なことには、広告待ち受けページのUPIにも一致しなければならない。2つのプロファイルの一致は、ベクトル空間一致等の2つの用語のベクトルを一致させるための標準的な情報検索技法を使用して計算できる(例えば、記事、G.Salton及びC.Buckley、「自動テキスト検索における用語加重手法(Term−Weighting Approaches in Automatic Text Retrieval)」、情報処理及び管理(Information Processing and Management)、24(5)、513−523ページ(1988年)、及びGerard Salton、A.Wong、C.S.Yang、「自動索引付けのためのベクトル空間モデル(A Vector Space Model for Automatic Indexing)」、ACMの通信(Communications of the ACM)、18(11)、613−620ページ(1975年)を参照されたい)。
【0058】
地形、話題、ユーザ年齢範囲、言語等の幅広い属性は、例えば機械学習分類子を使用して文書とユーザについて計算できる。また、このような幅広い属性は、マッチングにおいて単語と句のようなより狭い属性とも一緒に使用できる。
【0059】
当然、広告のスコアは、例えば、検索クエリーに、又は文書のコンテンツに対するその関連性、既定の結果(例えば、インプレッション、選択、コンバージョン等)について広告主が支払う、あるいは支払う用意がある金額、広告の性能の測度(例えば、クリックスルー率、コンバージョン率、ユーザ定格等)、広告主の品質の測度等の、UPI一致に加えて他の要因の関数である場合がある。さらに、異なる中間広告スコアは異なる目的で(例えば、関連性、位置、相対的なレンダリング属性等)使用されてよい。
【0060】
第4.2.2.2項 UPIを使用する広告クリエーティブ選択
UPIを使用する広告クリエーティブ選択及び/又は生成を用いると、広告クリエーティブは(例えば、ユーザ、文書等の)UPIに合わせて調整されてよい。
【0061】
第4.2.2.3項 UPIを使用するクエリー両義性解決
適切な広告つまり広告クリエーティブを選択することに加えて、UPIは不明瞭な検索用語を含む検索クエリーを明確にするために使用されてよい。例えば、検索クエリー「ジャガー」を提出するユーザは、(A)車ジャガー(Jaguar)についての情報、(B)動物についての情報、(C)アップルジャガー(Apple Jaguar)オペレーティングシステムについての情報、又は(D)ジャクソンビルジャガー(Jacksonville Jaguar)NFLフットボールチームについての情報のどれかを必要とする可能性がある。ユーザのUPIは、「ジャガー」検索用語を明確にするために使用できるであろう。この例では、ユーザの以前のブラウジング活動からの情報が、曖昧なクエリー「ジャガー」を明確にするのに役立つ、あるいはユーザにとってほとんど又はまったく重要ではない広告が表示されないようにしてよい。例えば、ユーザが最近「アップルコンピュータ」と「オペレーティングシステム」についてクエリーを行っており、その後検索クエリー「ジャガー」を提出した場合、ユーザの以前のクエリー履歴は、クエリーがアップル(Apple)コンピュータ用のオペレーティングシステムを参照しており、車、動物又はNFLチームを参照していない可能性が高かった。その結果、広告はこのような情報を利用することによってユーザに対象を設定できるであろう。
【0062】
他だけではなく、UPIを使用するためのこれらの前記アプリケーションは、UPIが入手可能であると仮定する。しかしながら、これが当てはまらない場合、このようなUPIが生成及び/又は更新される必要がある。UPIを決定する、及び/又は更新するための例示的な方法は、以下の第4.2.3項に説明される。
【0063】
第4.2.3項 UPIを決定する、及び/又は更新すること
ユーザプロファイル情報(UPI)が、サービスに加入するときにユーザが提供した情報を使用して決定できることを想起されたい。しかしながら、多くのケースでは、ユーザは自らについての情報を進んで開示しない(volunteer)、あるいは単にこのような情報を進んで開示しないように頼まれる。さらにユーザがたとえこのような情報を進んで開示しても、(例えば、加入の時点で与えられた情報がサービスに必要とされていることに限定されてよく、したがって包括的ではないために)それは不完全である可能性がある、それは意図的に又は無意図的に不正確である可能性がある、それは陳腐になる可能性がある等である。
【0064】
同様に、UPI情報はユーザが要求した、あるいはアクセスしている文書について入手できない可能性がある。
【0065】
広告は、広告主にUPI情報を供給させることができるが、このようにすることは広告主にとっては重荷となる可能性がある。
【0066】
後述されるように、ユーザ、文書等のUPIは、明示的な情報がシステムに与えられていなくても決定できる(あるいは更新できる、あるいは拡張できる)。以下では、初期の(又はベースライン)UPIが、ブートストラップ段階の間に決定されてよい。このような初期UPIは、ユーザ又は文書に、あるいはUPIが関連付けられる広告に固有の情報を使用してよい。初期UPIは、明示的に入力された何らかのUPI情報を含んでもよいし、含まなくてもよい。
【0067】
広告採点、広告クリエーティブ選択、クエリー両義性解決等の応用例に、このような初期UPI又はベースラインUPIを使用するだけで十分な場合がある。しかしながら、拡大及び/又は強化段階の間に、初期UPI又はベースラインUPIを補足することが所望されてよい。例えば図4を参照し直すと、(例えばユーザの、又は文書の、又は広告の、又は広告待ち受けページの)UPI410は、過去に存在しなかった、又は値を有していなかったかのいずれかである属性420に値430を追加することによって拡大されてよい。代わりに、又は加えて、UPI410の属性420の値430の440のスコアは、修正又は強化されてよい。したがって、例えば、値=男性を有する属性=性別の確率は、規定の追加情報を増加又は減少してよい。初期UPIを拡大又は補足するために使用される情報は、推測された情報と見なされてよい。
【0068】
図6は、本発明にしたがった方法で文書UPIを決定するために使用されてよい例示的な方法600のフロー図である。文書のための初期UPIが決定される。(ブロック610)これは、文書コンテンツ等の文書に固有の情報を使用して行われてよい。この行為を実行するための例示的な方法は図8に関して後述される。文書のための追加UPI情報が推測される。(ブロック620)これは、アクセスしているユーザ、リンクされている文書等から推測される情報を使用して行われてよい。次に、新しい(例えば、拡大された及び/又は強化された)文書UPIは、初期文書UPI及び推測された文書UPIを使用して決定される。(ブロック630)行為620と630は、方法600が終了される前に一回以上実行されてよい。(ノード640)。行為620と630が、仮想分岐戻り線によって示されるように繰り返される場合、新しい文書UPIは、以前の文書UPI及びさらに多くの推測文書UPIを使用して決定されてよい。
【0069】
図7は、本発明にしたがった方法で(個人又はグループとしての)ユーザUPIを決定するために使用されてよい、例示的な方法700のフロー図である。ユーザのための初期UPIが決定される。(ブロック710)これはユーザによって提出される過去の検索クエリー等のユーザに固有な情報を使用して行われてよい。この行為を実行するための例示的な方法は図9を参照して後述される。ユーザのための追加のUPI情報が推測される。(ブロック720)これは検索結果、選択された検索結果等から推測される情報を使用して実行されてよい。次に、新しい(例えば、拡大された、及び/又は強化された)ユーザUPIは、初期ユーザUPI及び推測されたユーザUPIを使用して決定される。(ブロック730)行為720と730は、方法700が終了される前に一回以上実行されてよい。(ノード740)。行為720と730が、仮想分岐戻り線によって示されるように、繰り返される場合、新しいユーザUPIは、以前のユーザUPIとさらに多くの推測されたユーザUPIを使用して決定されてよい。
【0070】
図6のブロック610から、初期文書UPIが決定されてよいことを想起されたい。図8は、本発明にしたがった方法で初期UPI又はベースライン文書UPIを決定するために使用されてよい、例示的な方法800のフロー図である。示されているように、文書UPI属性値は(例えば、文書のコンテンツ、文書のメタ情報等を使用して)投入されてよい。(ブロック810)
図7のブロック710から、初期ユーザUPIが決定されてよいことを想起されたい。図9は、本発明にしたがった方法で初期UPI又はベースラインユーザUPIを決定するために使用されてよい、例示的な方法900のフロー図である。図示されるように、ユーザUPI属性値は(例えば、ユーザの過去のクエリー情報、ユーザによって明示的に入力される情報等を使用して)投入されてよい(ブロック910)。
【0071】
第4.2.4項 ユーザ情報がどのようにして取得されるのかの例
ユーザ情報を取得する多くの代替方法がある。例えば、属性420と値430のスコア440は、以前に実施されたクエリーの単語を使用して、プロファイルの中のUPI属性420の値430を予測する機械学習分類子を用いて決定できる。例えば、以前の検索クエリーの中の「女性の健康」に関連するキーワードを考えると、分類子はユーザが0.8という確率で女性であると推測してよい。さらに、以前の検索クエリーで日本語の単語が使用されたことを考えると、分類子はユーザが0.9の確率で日本人であると推測してよい等である。2つのUPIのスコア440は、それらが一致するかどうかに影響を及ぼす可能性がある。属性420は、1つのUPIでは「サンフランシスコ」で、もう1つでは「サンホセ」である場合がある。これらの未処理の属性は一致しないが、機械学習分類子は両方のケースで地理的なカテゴリ=「カリフォルニア」を割り当ててよく、一般化されるプロファイル属性は一致するであろう。したがって、機械学習分類子は、ユーザと文書を、地理、話題、民族性、又は読書レベルに関する幅広いカテゴリに分類するために使用されてよい。
【0072】
UPI情報が推測されてよいことを、図6のブロック620と図7の720の両方から想起されたい。ユーザUPIは、何らかの方法でユーザと関連付けられる他のユーザ及び/又は文書のUPIから推測されてよい。同様に、文書UPIは他の文書のUPIから推測されてよい、及び/又はユーザは、文書と何らかの方法で関連付けられてよい。図10は、ユーザと文書がどのようにして関連付けられるのかを示す。
【0073】
図10に示されるように、ユーザ/文書関連動作1010は、一人以上のユーザのユーザ情報1020、1つ以上の文書の文書情報1030、文書リンク(例えば、ウェブトポロジー)情報1040、(代わりにユーザ情報1020として提供されてよい)ユーザクエリー1050の検索結果、及び(代わりにユーザ情報1030として提供されてよい)ユーザ文書選択1060のうち1つ以上を使用して、ユーザ及び/又は文書(ユーザ対ユーザ、ユーザ対文書、文書対文書、及び/又は(示されているもののような無向グラフでのユーザ対文書の関連と同じであってよい)文書対ユーザ)を関連付ける、情報1070を生成してよい。
【0074】
本発明の例示的な一実施形態では、関連情報1070は、ユーザと文書がそれぞれノード1072と1076として表されるグラフであってよい。図11は、本発明にしたがった方法でユーザ及び/又は文書を関連付けるために使用されてよい、例示的な方法1100のフロー図である。図示されるように、ノードは各ユーザと文書に定められてよい。(ブロック1110)ユーザノード1072のそれぞれに、ユーザが提出した検索クエリーに応えて検索エンジンによって戻された一番上のウェブページのために、(関連を示す)エッジ1074がユーザノードと文書ノードの間に描画されてよい。(変形では、エッジ1074は、ユーザが選択した(例えばクリックした)ウェブページだけで描画できるであろう)。さらに、エッジ1078がそれらの間にリンク(例えばハイパーリンク)を有する文書の組の間に描画されてよい。(ブロック1120)図示されていないが、ユーザ対ユーザの関連も生成されてよい。例えば、エッジは同じ文書の1つ以上にアクセスしたユーザ間で追加されてよい。
【0075】
図7を参照し直すと、このグラフ1070を考えると、ユーザのための新しいUPIが、その初期のUPI、及び推測されたユーザUPIとして、ユーザノード1072がリンクされるノード1076に対応する文書のUPIを使用して、決定されてよい。同様に、図6を参照し直すと、文書の新しいUPIは、このグラフ1070を考えて、その初期のUPI、及び推測される文書UPIとして、文書ノード1076がリンクされる、それぞれノード1072と1076に対応するユーザUPIと文書のUPIを使用して、決定されてよい。
【0076】
本発明の一実施形態において、それぞれ図6と図7のブロック630と730を参照し直すと、
updated_UPI=initial_UPI*alpha+neighborhood_UPI*beta
であり、アルファとベータは定数(例えば、アルファ=0.7、ベータ=0.3)であり、neighborhood_UPIはグラフ内の近傍のノードのUPIの平均である。UPIを更新するための他の関数が考えられる。このプロセスは反復を多数回(例えば、50)繰り返されてよい。
【0077】
平均UPIを決定するために、個々の属性420の値430が平均され、場合によってはスコア440で加重されてよい。
【0078】
さらに多くの離れたノード(例えば、2エッジ以上離れた)も検討されてよいが、より少なく加重されなければならない。
【0079】
ユーザUPIと文書UPIの両方とも更新されてよいが、一方又は他方だけを更新することが可能である。
【0080】
代替実施形態では、ユーザノード1072は、ユーザの集団を表してよい。同様に文書ノード1076は(例えば、多くのウェブページを含むウェブサイト等)文書の集合体を表してよい。
【0081】
代替実施形態では、グラフエッジには関連重みが割り当てられる。したがって、例えば、文書がユーザ検索クエリーに応えて返された検索結果リストに単に含まれていた場合より、ユーザが検索結果リストから文書を選択した場合には、ユーザノード1072から文書ノード1076へのエッジ1074には、より大きな重みが与えられてよい。
【0082】
第4.2.5項 例示的な装置
図12は、前述された動作の1つ以上を達成してよい機械1200の高水準ブロック図である(例えば、エンドユーザシステム又はクライアントデバイスによって実行される動作、コンテンツサーバによって実行される動作、検索エンジンによって実行される動作、あるいは広告サーバによって実行される動作)。機械1200は、基本的に、1台以上のプロセッサ1210、1台以上の入力/出力インタフェース装置1230、1台以上の記憶装置1220、結合された要素の間の情報の通信を容易にするための1つ以上のシステムバス及び/又はネットワーク1240を含む。1台以上の入力装置1232及び1台以上の出力装置1234は、1つ以上の入力/出力インタフェース1230と結合されてよい。
【0083】
該1台以上のプロセッサ1210は、本発明の1つ以上の態様を達成するために機械実行可能な命令(例えば、カリフォルニア州パロアルト(Palo Alto,California)のサンマイクロシステムズ社(Sun Microsystems Inc.)から入手可能なソラリス(Solaris)オペレーティングシステム、あるいはノースカロライナ州ダーハム(Durham,North Carolina)のレッドハット社(Red Hat,Inc.)等の多くのベンダから広範囲に入手可能なリナックス(登録商標)(Linux(登録商標))オペレーティングシステムで実行する、C又はC++)を実行してよい。機械実行可能命令の少なくとも一部は、該1台以上の記憶装置1220上に(一時的に、又はより恒久的に)記憶されてよい、及び/又は1台以上の入力インタフェース装置1230を介して外部ソースから受け取られてよい。
【0084】
一実施形態では、機械1200は1台以上の従来のパーソナルコンピュータであってよい。このケースでは、該処理装置1210は1台以上のマイクロプロセッサであってよい。該バス1240はシステムバスを含んでよい。該記憶装置1220は、読み取り専用メモリ(ROM)及び/又はランダムアクセスメモリ(RAM)等のシステムメモリを含んでよい。記憶装置1220は、ハードディスクに読み書きするためのハードディスクドライブ、(例えばリムーバブル)磁気ディスクに読み書きするための磁気ディスクドライブ、及びコンパクトディスク又は他の(磁気)光学媒体等のリムーバブル(磁気)光学ディスクに読み書きするための光学ディスクドライブを含んでよい。
【0085】
ユーザは、例えば、キーボードとポインティングデバイス(例えばマウス)等の入力装置1232を通して、パーソナルコンピュータにコマンドと情報を入力してよい。マイク、ジョイスティック、ゲームパッド、パラボラアンテナ、スキャナ等の他の入力装置もまた、(あるいは代わりに)含まれてよい。これらの及び他の入力装置は多くの場合、システムバス1240に結合されている適切なインタフェース1230を通して処理装置(複数の場合がある)1210に接続されている。出力装置1234は、適切なインタフェースを介してシステムバス1240にも接続されてよいモニタ、又は他のタイプのディスプレイ装置を含んでよい。モニタに加えて(あるいは代わりに)パーソナルコンピュータは、例えばスピーカ及びプリンタ等の他の(周辺)出力装置(図示せず)を含んでよい。
【0086】
第4.3項 改良版及び代替策
第4.3.1項 決定技法
マッチング(つまり類似性)決定は、多くの方法で実行できる。例えば、以下の類似性決定技法の1つ以上が使用されてよい。(a)(例えば後述されるような)ベクトルベース、(b)(例えば後述されるような)規則ベース、(c)一致の確率又は尤度を推測するための確率的推論、及び(d)ファジー論理マッチングである。他の類似性技法は、本発明の元でも使用されてよい。
【0087】
上で触れたように、類似性を決定する1つの方法はUPIベクトルを形成することである。複数の広告のそれぞれは代表的な対象設定UPIベクトルを有してもよい。このようなUPIベクトルは、履歴データから決定される追加情報も含んでよいことに留意されたい。例えば、どの人口グループがある広告をクリックする傾向があるかについての推論は、データマイニング技法を使用して決定されてよい。この(例えばオフラインの)分析の結果は、次に広告のUPI対象設定ベクトルの1つ以上の属性として使用されてよい。UPIベクトルは、ベクトル間のコサイン距離、ハミング距離、及び/又は種々の他のベクトル距離基準等の採点関数を使用して一致できる。次に広告は、このような関数により生じるスコアを使用して(例えばスコアに従って)ランクを付けることができる。
【0088】
また前記に示されたように、UPIをマッチさせるための別の技法は、ユーザUPI、文書UPI、広告UPI、及び広告待ち受けページUPIの1つ以上の組の類似性を定める規則及び/又は関数の集合を適用することを含む。このような規則及び/又は式をベースにしたシステムは、加重スコアを出すために(例えば、加重して)論理規則の任意の組み合わせを使用できる。
【0089】
このように、ベクトルベースの技法及び規則及び/又は公式ベースの技法は、一致決定を生成するためにいっせいに使用されてよい。
【0090】
本発明の一実施形態では、属性頻度−反転文書(又はユーザ)頻度積(attribute frequency−inverse document(or user)frequency product)(TF−IDF)基準は、類似性スコアを生じさせるためにUPIを使用して決定される。
【0091】
第4.3.1.1項 類似性決定技法の改良版
UPIを一致させるプロセスを効率的に保つために、属性選択、属性汎用化及び/又は属性集約の技法が、比較されているベクトルのサイズを縮小するために使用されてよい。例えば、属性選択は、UPIの間の一致プロセスの一部として使用される属性の数及び/又はサイズを削減するために使用されてよい。このような属性選択技法は、(絶対項及び/又は相対項の中で)高いスコア(例えば、確率又は重要性重み)を有する何らかの数の属性だけを、UPIのベクトル表現で保つことを含んでよい。別の属性選択技法は、うまく機能する(例えばクリックされる)可能性が高い1つ以上の一致を生成するために、他よりどの属性がより指標となるかを決定するために、「相互情報」、カイ二乗適合(Chi−squared fit)、又は例えば相関等の、統計基準を使用することを含んでよい。さらに別の属性選択技法は、最も有用であると考えられるそれらの属性を単に手作業で選択することである。これらの又は他の属性選択技法の2つ以上がいっせいに使用されてよい。
【0092】
同様に、UPIベクトルは、残っている広告UPIベクトルの小さい部分集合だけがユーザUPIと文書UPIに関してランク付けされる必要があるように、(例えば、特定の特徴を正確に一致させる等の)何らかの初期基準の集合を使用して、前置フィルタにかけられてよい。この技法は、結合された規則ベースの類似性決定技法と、ベクトル距離類似性決定技法を示している。この技法を使用すると、UPI間の全体的な一致プロセスの効率を高めるのに役立つという追加の利点がある。
【0093】
例えば、ユーザ及び/又は文書に関連性のある1つ以上の広告の第1の集合が先に決定されてよい。1つ以上の広告の第1の集合は広告の最終的な集合を決定するためにUPI情報動作をさらに使用して処理されてよい(例えば、UPIを使用して決定される第2の類似性スコアに基づいて順序付けられる、及び/又はフィルタリングされる)。このような実施形態は、UPI(の一部)がクライアントに記憶されるときに有用であり得る。例えば、広告サーバは、ユーザ要求(例えば検索クエリー又は文書要求)のために上位Nの(例えばN=100)の広告をクライアントに送信してよい。クライアントは、次にこれらの供給された広告に、ローカルユーザ情報に基づいて順序を付け直すことができる。
【0094】
第4.3.2項 どのように及びどこにUPIが記憶されるのかの例
本発明の一実施形態では、UPIは、関連付けられたソース(例えば、nグラムは表示されるウェブページ、クエリー等からである)、URL、又は異なる種類の情報(例えば、ユーザは特定のウェブブラウザを使用している、あるいはユーザは特定の緯度と軽度に位置している等)の特定の値が付いた、nグラム(長さ1からほぼ最大、例えば3までの単語のシーケンス)として記憶される。
【0095】
UPIの記憶及び使用は、(a)(例えば、ブラウザクッキー、ローカルファイル、非表示形式フィールド、又はURL符号化等の形をとる)クライアント側記憶装置、(b)(例えば、プロファイル/動作情報を記憶し、検索するための記録のデータベース、フラットファイル、又は独自仕様の構造等の)サーバ側記憶装置、及び/又は(c)サードパーティの記憶装置を含む、多様な異なる形式を取ってよい。このようにして、UPIはサーバ側のレポジトリに常駐する必要はないが、実際にはクライアント及び/又はサードパーティで記憶され、ユーザの要求とともに情報サーバに送信されてよい(例えば、検索クエリー又は文書要求)。UPIは例えば、ウェブブラウザクッキーで送信できる。
【0096】
図3の例示的なネットワーク環境を参照し直すと、UPIは、1台以上のクライアントデバイス320、1台以上のコンテンツサーバ330、1つ以上の検索エンジン340、1台以上の広告サーバ350、及び/又は1台以上のユーザ情報サーバ360に記憶されてよい。いずれにせよ、ユーザ情報は、何らかのデータ管理方式(例えば、データベース、フラットファイル、独自仕様データ管理システム、ウェブブラウザクッキー等)を使用することにより保持されてよい。ユーザ情報のさまざまな項目(例えば異なるユーザ特徴)がさまざまなデバイスに記憶されてよい。
【0097】
第4.3.2.1項 情報記憶に対する改良版
実践的なシステムを達成するために、対象設定広告で使用されるUPIの量を削減する、及び/又はUPIを順序付けることが所望されるようになる、又は必要になる。本発明は、情報と精度の最小限の損失でこのような削減を可能にする。さらに、広告の供給における、ひいてはUPIの検索における待ち時間を制約することが、望ましい又は必要である可能性があるので、広告サーバは限られたUPIで、あるいはUPIなしで動作する必要がある場合もある。本発明にしたがった方法で優先順位を設定することにより、広告サーバは対象設定プロセス中に使用可能な貴重な(例えば最も貴重な)情報に焦点を当てることができる。データ削減及び処理優先順位の設定のための例示的な技法が後述される。
【0098】
本発明の一実施形態では、少なくともいくつかのUPI属性のそれぞれが、関連付けられたスコア(重要性重み、確率等)を有する。複数のUPI属性の重要性重みは、何らかの方法でともに分類されるあるいは集約されてよい。
【0099】
当初、UPI属性に割り当てられる重要性重みは、おそらく特に一種の情報を使用して決定されてよい。例えば、検索クエリーは、ユーザが表示したウェブページから抽出されるnグラムより高い初期重みを有してよい。
【0100】
UPI属性の重要性重みは、特定のユーザの、又はユーザのグループのアクションに基づいて更新されてよい。例えば、(参照してここに組み込まれ、「第791号出願」と呼ばれる)2003年6月2日に出願された、Steve Lawrence、Mehran Sahami及びAmit Singhalを発明者として示す「ユーザ要求情報とユーザ情報を使用して広告を供給すること(SERVING ADVERTISEMENTS USING USER REQUEST INFORMATION AND USER INFORMATION)」と題される米国特許出願第10/452,791号の図9は、本発明にしたがった方法で広告UPI又はユーザUPIを管理するために使用されてよい例示的な方法を示す。例えば、その例示的な方法では、ユーザが広告を選択すると、推奨されているこの広告につながったユーザUPI属性の重要性重みが増加してよい。重要性重み(複数の場合がある)が増す量(絶対又は相対)は、各UPI属性が広告推奨スコアにどの程度貢献したのかに少なくとも部分的に依存してよい。同様に、関連性のあるUPI属性の重要性重みは、ユーザが広告を選択しないときには削減されてよい。本発明の一実施形態では、重み削減係数は重み増加係数より小さい。
【0101】
本発明の一実施形態では、重要性重みは随意的に、UPI属性が全ユーザ全体で(絶対的及び/又は相対的に)どの程度頻繁に優れた推奨策を生じさせたのかに基づいて大局的な重みを使用して(例えば結合されて)調整されてよい。代わりに、又は加えて、重要性重みは、UPI属性が随意的に(例えばすべての類似した)ユーザのグループ全体で(絶対的に及び/又は相対的に)どの程度頻繁に優れた推奨策を生じさせたのかに基づいて、同一性重みを使用して(例えば結合されて)調整されてよい。
【0102】
本発明の一実施形態では、UPIは特定のサイズに達すると、それは少なくとも重要性重みを使用して情報のあまり重要でない項目を削除することによって削減されてよい。UPI属性の記憶要件も検討されてよい。このようにして、多くの記憶域を必要とするが、低い重要性重みを有するUPI属性は削除の第一の候補となるであろう。
【0103】
本発明の一実施形態は、個々のUPI属性をその重要性重みを使用して順序付けることが(そして記憶することも)できる。このような実施形態では、既定のユーザUPIに対する要求は(重要性重みという点で)最も重要な属性だけを含む不完全なUPIを供給されることがある、あるいは十分な情報が取得されるまで、及び/又は追加の処理が望ましくない又は可能ではなくなるまで断片的に供給されてよい。したがって、例えば、UPI属性を使用して処理することは、その重要性重みの順序で行われてよい。これにより、(例えば、効率のために、何らかの待ち時間制約を満たし、処理が特定の期限内に完了されることを確実にするために等)処理を早期に終了することができる。
【0104】
新しいUPI属性が追加されるにつれ、既存の属性の重要性重みが変更される可能性がある。その結果、(例えば既定のユーザの)UPI属性の順序は重要性重み順序と異なる可能性がある。したがって、本発明は、それぞれの重要性重みを使用して(例えば、これに従って)UPI属性を周期的に順序付けし直すために使用されてよい。
【0105】
いくつかのケースでは、UPIの転送又は処理は、(例えば既定のユーザの)UPIが重要性重みを使用して(例えば、これに従って)順序付け直される前に概算の順序で実行されてよい。少なくともいくつかの例及び/又はいくつかの実施形態では、その順序で効率的に転送及び/又は処理されるこのような情報のそれぞれの重要性重みの順序で、UPI属性を物理的に記憶することが必要ではない可能性があることに留意されたい。実際に、少なくともいくつかの例及び/又はいくつかの実施形態では、重要性順序でUPI属性を転送する及び/又は処理することが必要ではない可能性がある。例えば、条件によっては、すべての情報は転送される、及び/又は処理されてよい。
【0106】
第4.4項 結論
前記開示から理解できるように、本発明はキーワード対象設定広告システムだけではなく、コンテンツ対象設定広告システムも改善するために使用できる。ユーザ、文書、広告及び/又は広告待ち受けページのユーザプロファイル情報は、受け入れることができる、及び/又は推測できる。
【技術分野】
【0001】
本発明は広告に関する。特に、本発明は、例えば検索クエリー又は文書要求等のユーザの要求に役立つための、特に関連性のある広告又は広告クリエーティブ(creatives)を決定することに関する。
【背景技術】
【0002】
テレビ、ラジオ、新聞及び雑誌等の、従来の媒体を使用する広告は周知である。残念なことに、人口学的な研究及び多様な報道発信源の典型的な視聴者についてのまったく妥当な前提で準備していても、広告主は自分の広告予算の大半が単に無駄にされていることを認識している。さらに、このような無駄を特定し、排除することは非常に困難である。
【0003】
最近では、より双方向性の媒体での広告が一般的になってきた。例えば、インターネットを使用する人の数が爆発的に伸びるにつれ、広告主はインターネット上で提供される媒体とサービスを、広告を行うための潜在的に強力な方法として捉えるようになった。
【0004】
広告主は、このような広告の価値を最大限にする目的で複数の戦略を作成してきた。1つの戦略では、広告主は、(一般性を失うことなく本明細書中で「ウェブサイト」と呼ばれる)双方向性の媒体又はサービスを提供するための一般的な存在又は手段を、多数の消費者へのパイプとして使用する。この第1の手法を使用して、広告主は、例えばニューヨークタイムズのウェブサイト(New York Times Website)又はUSAトゥデイのウェブサイト(USA Today Website)のホームページ上に、広告を掲載してよい。別の戦略では、広告主はより狭いニッチ視聴者をその広告の対象とし、それにより視聴者の前向きの反応の尤度を高めようと試みる可能性がある。例えば、コスタリカの熱帯雨林での観光を奨励している官庁は、ヤフー(登録商標)ウェブサイト(Yahoo Website)のエコツーリズム−旅行のサブディレクトリに広告を掲載する可能性がある。広告主は通常はこのような対象の設定を手作業で決定する。
【0005】
戦略に関係なく、ウェブベースの広告(「ウェブ広告」とも呼ばれる)は、通常、「バナー広告」−つまり、グラフィック要素を含む矩形のボックス−の形で、その広告視聴者に提示される。広告視聴者の一員(一般性を失うことなく本明細書中では「視聴者」又は「ユーザ」と呼ばれる)が、これらのバナー広告のうち1つをクリックすることにより選択すると、通常、埋め込まれているハイパーテキストリンクが視聴者を広告主のウェブサイトに案内する。視聴者が広告を選択するこのプロセスが、一般的に「クリックスルー」(「クリックスルー」は、任意のユーザの選択をカバーすることを目的としている)と呼ばれている。広告のインプレッション数(つまり広告が表示される回数)に対するクリックスルー数の割合が、一般的に広告の「クリックスルー率」と呼ばれる。
【0006】
ユーザが過去に供給された広告に関連したトランザクションを完了すると、「コンバージョン」が発生すると言われている。コンバージョンを構成している内容は場合によって異なり、種々の方法で決定できる。それは例えば、ユーザが広告主のウェブページと呼ばれる広告をクリックし、そのウェブページを離れる前にそこで購入を完了すると、コンバージョンが発生するケースである可能性がある。代わりに、コンバージョンは、ユーザが広告を見てから、所定の時間(例えば7日間)内に広告主のウェブページで購入することとして定義される場合がある。さらに別の代替策では、コンバージョンは、例えばホワイトペーパーをダウンロードする、ウェブサイトの少なくとも既定の深部まで進む、少なくとも特定数のウェブページを表示する、ウェブサイト又はウェブページで少なくとも所定の時間量を費やす、ウェブサイトで登録する等の、測定可能/観察可能なユーザアクションであるとして、広告主に定義されてよい。コンバージョンを構成するユーザアクションはこれに限られていないが、多くの場合、ユーザアクションが購入の完了を示さない場合、それらが販売の手がかりを示すことがある。実際に、何がコンバージョンを構成するのかについて、他の多くの定義が考えられる。広告インプレッション数(つまり広告が表示される回数)に対するコンバージョン数の割合は、一般にはコンバージョン率と呼ばれる。コンバージョンが広告が供給されてから所定の時間内に発生し得ると定義される場合、コンバージョン率の1つの考えられる定義が、過去の所定の時間より多く供給された広告を考慮するにすぎない可能性がある。
【0007】
ウェブサイトベースの広告の当初の展望にも関わらず、既存の手法にはいくつかの問題が残されている。広告主は大きな客層に到達できるが、しばしば自分の広告投資からの収益に満足していない。
【0008】
同様に、(「ウェブサイトホスト」、又は「広告消費者」と呼ばれる)広告が提示されるウェブサイトホストは、ユーザの経験を損なうことなく広告収入を最大限にするという課題を抱えている。ユーザの利益を超えて広告収入を位置づけるウェブサイトホストもいる。このような1つのウェブサイトが、ユーザのクエリーに応えて「検索結果」を装う広告を返すいわゆる「検索エンジン」サービスを主催する「Overture.com」である。Overture.comウェブサイトは、広告主が金を支払って、検索結果と称するもののリストの上の方に自分のウェブサイト(又は対象のウェブサイト)の広告を配置できるようにしている。ユーザが広告をクリックした場合にだけ広告主が支払いをする(つまりコストパークリック)ような方式が実現されている場合、対象設定がうまく行われていない広告はクリックされず、したがって支払いを必要としないために、広告主は自らの広告の対象を効果的に設定する意欲をなくしてしまう。その結果、高いコストパークリックの広告がトップの近くに、又はトップに表示されるが、視聴者はそれらをクリックしないため、必ずしも広告発行元にとっての本当の収入にはならない。さらに、視聴者がクリックするであろう広告は、リストのさらに下のほうにある、あるいはリストには載っていないために、広告の関連性は損なわれる。
【0009】
例えばグーグル(登録商標)(Google(登録商標))等の検索エンジンは、広告主が自らの広告が検索結果のページとともに表示されるように、及びそれらが検索結果ページを表示するように指示したクエリーにおそらく関連性があるように、広告の対象を設定できるようにした。e−メール情報に基づいて広告の対象を設定するもの(例えば、2003年6月2日に出願された、Jeffrey A.Dean、Georges R.Harik及びPaul Bucheitを発明者として示す「Eメールに関連した情報を使用して広告を提供すること(SERVING ADVERTISEMENTS USING INFORMATION ASSOCIATED WITH E−MAIL)」と題される(参照してここに組み込まれる)米国特許出願第10/452,830号に説明されているシステム)、あるいはコンテンツに基づいたターゲット広告(2003年2月26日に出願された、Darrel Anderson、Paul Bucheit、Alex Carobus、Claire Cui、Jeffrey A.Dean、Georges R.Harik、Deepak Jindal及びNarayanan Shivakumarを発明者として示す「コンテンツに基づいて広告を供給すること(SERVING ADVERTISEMENTS BASED ON CONTENT)」と題される(参照してここに組み込まれる)米国特許出願第10/375,900号を参照されたい)等の、他の対象が設定された広告システムも、同様の課題を抱えている可能性がある。すなわち、広告システムは、ユーザ要求情報に概して関連性のある、特に現在のユーザの関心に関係する広告を提示しようとする。
【0010】
前記から理解できるように、キーワード対象設定(keyword−targeted)広告又はコンテンツ対象設定(content−targeted)広告等の対象設定広告システムは、非常に有用な形式の広告を提供する。ただし、通常、関連性のある広告を供給できるオンライン広告システムも、多くの場合、特定のユーザに最も適した関連性のある広告を選択することはできない。
【0011】
したがって、オンライン広告の性能を改善する必要性がある。さらに具体的には、要求を提出したユーザに対する、例えば検索クエリー又は文書要求等の、何らかのユーザ要求のために供給される広告の関連性を高める必要性がある。
【発明の概要】
【0012】
本発明は、広告を採点するために使用される一致を決定するための方法及び装置を説明する。このような方法及び装置は、(a)(i)広告の広告待ち受けページのユーザプロファイル情報及び/又は広告の対象を設定するために使用されるユーザプロファイル情報、及び(ii)広告が表現される先のユーザのユーザプロファイル情報を使用して、第1の一致値を求めてよく、(b)(i)広告の待ち受けページのユーザプロファイル情報及び/又は広告の対象を設定するために使用されるユーザプロファイル情報、及び(ii)広告が供給される文書のユーザプロファイル情報を使用して、第2の一致値を求めてよく、(c)第1の一致値と第2の一致値を使用して広告を採点するために使用される一致を決定してよい。
【0013】
本発明は、前記のような方法及び装置において、あるいはユーザプロファイル情報を使用して広告の対象を設定するための他の方法及び装置において、広告の広告待ち受けページのユーザプロファイル情報の少なくとも一部、広告の対象設定に使用されるユーザプロファイル情報の少なくとも一部、ユーザのユーザプロファイル情報の少なくとも一部、及び/又は文書のユーザプロファイル情報の少なくとも一部が、推測されてよいことも教示する。
【0014】
本発明の一実施形態では、ユーザのためのユーザプロファイル情報は、(a)ユーザのために初期ユーザプロファイル情報を決定すること、(b)ユーザのためにユーザプロファイル情報を推測すること、及び(c)初期ユーザプロファイル情報と推測されたユーザプロファイル情報の両方を使用して、ユーザのためのユーザプロファイル情報を決定することによって、決定されてよい。ユーザのための初期ユーザプロファイル情報は、ユーザによって提出された過去の検索クエリー、及び/又はユーザによる過去の文書の選択を使用して決定されてよい。
【0015】
本発明の一実施形態では、ユーザのためのユーザプロファイル情報は、(a)多くの文書のそれぞれとユーザのためのノードを定義すること、(b)グラフを定義するためにノード間に関連がある場合にノード間でエッジを追加すること、及び(c)グラフのトポロジー及び他の文書のユーザプロファイル情報を使用してユーザのためのユーザプロファイル情報を推測することによって、推測されてよい。
【0016】
本発明の一実施形態では、文書のためのユーザプロファイル情報は、(a)文書のための初期ユーザプロファイル情報を決定すること、(b)文書のためのユーザプロファイル情報を推測すること、及び(c)初期ユーザプロファイル情報と推測されたユーザプロファイル情報の両方を使用して、文書のためのユーザプロファイル情報を決定することによって、決定されてよい。文書のための初期ユーザプロファイル情報は、文書からのコンテンツ情報、及び/又は文書メタ情報を使用して決定されてよい。
【0017】
本発明の一実施形態では、文書のためのユーザプロファイル情報は、(a)多くの文書のそれぞれのための、及び多くのユーザのそれぞれのためのノードを定義すること、(b)グラフを定義するためにノード間に関連がある場合にノード間にエッジを追加すること、(c)グラフのトポロジー、及びユーザの、及び他の文書のユーザプロファイル情報を使用して文書のためのユーザプロファイル情報を推測することによって、推測されてよい。
【図面の簡単な説明】
【0018】
【図1】広告システムと対話できる関係者又はエンティティを示す高水準図である。
【図2】本発明が中で又は用いて動作してよい、例示的な広告環境のバブルチャートである。
【図3】図2に示されたようなオンライン広告環境の中で、あるいは図2に示されたようなオンライン広告環境を用いて使用されてよい、本発明にしたがった動作のバブルチャートである。
【図4】本発明にしたがった方法で生成され、更新され、及び/又は使用されてよい、ユーザプロファイル情報を記憶するための、例示的なデータ構造を示す。
【図5】広告スコア(sore)の係数であってよい全体的な一致値の考えられる成分を示す。
【図6】本発明にしたがった方法で文書UPIを決定するために使用されてよい、例示的な方法600のフロー図である。
【図7】本発明にしたがった方法でユーザUPIを決定するために使用されてよい、例示的な方法700のフロー図である。
【図8】本発明にしたがった方法で初期のUPI又はベースライン文書UPIを決定するために使用されてよい、例示的な方法800のフロー図である。
【図9】本発明にしたがった方法で初期のUPI又はベースラインユーザUPIを決定するために使用されてよい、例示的な方法900のフロー図である。
【図10】ユーザと文書がどのように関連付けられるのかを示す。
【図11】本発明にしたがった方法でユーザ及び/又は文書を関連付けるために使用されてよい、例示的な方法1100のフロー図である。
【図12】実行されてよい多様な動作の少なくともいくつかを達成するために、及び本発明にしたがった方法で使用及び/又は生成されてよい情報を記憶するために、使用されてよい装置のブロック図である。
【発明を実施するための形態】
【0019】
本発明は、ユーザプロファイル情報を決定し、このような決定されたユーザプロファイル情報を広告供給のために使用するための、新規の方法、装置、メッセージフォーマット、及び/又はデータ構造を含んでよい。以下の説明は、当業者が本発明を作り、使用できるようにするために提示され、特定の応用例及びそれらの要件との関連で提供される。開示される実施形態に対する多様な変形は当業者に明らかとなり、以下に述べられる一般的な原則は他の実施形態及び応用例に適用されてよい。したがって、本発明は示されている実施形態に制限されることを意図せず、発明者は自らの発明を、説明されている任意の特許性がある主題と見なす。
【0020】
広告対象設定を改善するための1つの考えられる方法は、広告対象設定システムがユーザプロファイルを取得し、使用することである。例えば、ユーザプロファイルは、(例えばユーザがサービスに加入しているとき等)ユーザが自発的に与える情報を使用して決定されてよい。このユーザ属性情報は、次に広告の広告主指定属性(例えば対象設定基準)と突き合わされてよい。残念なことに、多くのウェブサイト(例えば検索エンジン)は加入又はユーザ登録を必要としないため、ユーザプロファイル情報は必ずしもいつも入手できない。さらに、たとえ入手できるときも、ユーザプロファイルは不完全である場合がある(例えば、加入時に与えられる情報は、プライバシーの考慮等のためにサービスに必要とされるものに限定され、したがって包括的ではない可能性があるからである)。さらに、広告主はユーザプロファイル対象設定情報を手作業で設定する必要がある場合がある。さらに、ユーザプロファイル情報が入手できる場合でも、広告主が効果的に広告の対象を設定するためにこの情報を使用できない可能性がある。
【0021】
以下では、本発明が中で動作してよい環境、又は本発明が用いて動作してよい環境が第4.1項に説明される。本発明の例示的な実施形態は第4.2項に説明される。いくつかの代替策及び改良版は第4.3項に説明される。最後に、本発明に関するいくつかの結論は第4.4項に述べられている。
【0022】
第4.1項 本発明が中で動作してよい、又は本発明が用いて動作してよい環境
第4.1.1項 例示的な広告環境
図1は、広告環境の高水準図である。該環境は広告入力保持及び配信システム120を含んでよい。広告主110は、システム120に広告情報を直接的に又は間接的に入力、保持、及び追跡調査してよい。広告は、いわゆるバナー広告等のグラフィック広告、テキストのみの広告、画像広告、音声広告、ビデオ広告、このような構成要素のうち1つ以上(one of more)を組み合わせた広告の形をとってよい。広告は、リンク等の埋め込まれた情報、及び/又は機械実行可能な命令を含んでもよい。広告消費者130は、彼らの要求に応える広告をシステム120から受け入れ、システム120に使用情報を提供するために、広告に対する要求を提出してよい。図示されていないが、他のエンティティは、システム120に(広告と関連したコンバージョン又はクリックスルーが発生したかどうか等の)使用情報を提供してよい。この使用情報は、供給された広告に関連した、測定された又は観察されたユーザ動作を含んでよい。
【0023】
広告消費者130の1つの例は、コンテンツ(例えば、記事、議論スレッド、音楽、ビデオ、グラフィックス、検索結果、ウェブページのリスト等)に対する要求を受信し、要求に応えて要求されたコンテンツを取り出す、あるいはそれ以外の場合提供する、一般コンテンツサーバである。コンテンツサーバは、システム120に広告に対する要求を提出してよい。このような広告要求は、所望される多くの広告を含んでよい。広告要求はまた、コンテンツ要求情報を含んでよい。この情報は、コンテンツ自体(例えばページ)、コンテンツ又はコンテンツ要求に対応するカテゴリ(例えば、アート、ビジネス、コンピュータ、アート−映画、アート−音楽等)、コンテンツ要求の一部又はすべて、コンテンツ寿命、コンテンツタイプ(例えば、テキスト、グラフィックス、ビデオ、音声、混合媒体等)、ジオロケーション情報等を含んでよい。
【0024】
コンテンツサーバは、システム120によって提供される広告の1つ以上と、要求されたコンテンツを組み合わせてよい。コンテンツと広告(複数の場合がある)を含むこの組み合わされた情報は、次に、ユーザに提示するために、コンテンツを要求したエンドユーザに向かって転送される。最後に、コンテンツサーバは広告に関する情報、及びどのようにして、いつ、及び/又はどこで広告を表示しなければならないのか(例えば、場所、クリックスルーか否か、インプレッション時間、インプレッション日付、サイズ、コンバージョンか否か等)についての情報を、システム120に送り返してよい。代わりに、又はさらに、このような情報は何らかの手段によってシステム120に提供し直されてよい。
【0025】
広告消費者130の別の例が検索エンジンである。検索エンジンは検索結果のためのクエリーを受け取ってよい。それに応じて、検索エンジンは関連する検索結果を(例えばウェブページのインデックスから)取り出してよい。例示的な検索エンジンは、S.Brin及びL.Pageの記事、「大規模ハイパーテキスト検索エンジンの解剖(The Anatomy of a Large−Scale Hypertextual Search Engine)」、第7回国際ワールドワイドウェブ会議(Seventh International World Wide Web Conference)、オーストラリア、ブリスベン(Brisbane,Australia)及び米国特許第6,285,999号(ともに参照してここに組み込まれる)に説明されている。このような検索結果は、例えばウェブページのタイトルリスト、それらのウェブページから抽出されたテキストの抜粋、及びそれらのウェブページへのハイパーテキストリンクを含んでよく、所定数の(例えば10の)検索結果に分類されてよい。
【0026】
検索エンジンは、システム120に広告に対する要求を提出してよい。要求は所望される多数の広告を含んでよい。この数は、検索結果、検索結果によって占められる画面又はページ空間の量、広告の大きさと形状等に依存してよい。一実施形態では、所望される広告の数は1から10、好ましくは3から5となるであろう。広告に対する要求は(入力又は構文分析されたとおりの)クエリー、(クエリーが関係者及びこのような関係者の識別子からきたのかに関係なく、ジオロケーション情報等の)クエリーに基づいた情報、及び/又は検索結果と関連付けられた又は検索結果に基づいた情報を含んでもよい。このような情報は、例えば検索結果に関連した識別子(例えば文書識別子、つまり「docID」)、検索結果に関連したスコア(例えば、クエリー及び文書、ページランクスコア、及び/又はIRスコアとページランクスコアの組み合わせに対応する特徴ベクトルのドット積のような情報検索(「IR」)スコア)、特定された文書から抽出されるテキストの抜粋(例えばウェブページ)、特定された文書の全文、特定された文書の特徴ベクトル等を含んでよい。
【0027】
検索エンジンは、システム120によって提供される広告の1つ以上と検索結果を結合してよい。検索結果と広告(複数の場合がある)を含むこの結合された情報は、次にユーザに提示するために、コンテンツを要求したユーザに向かって転送される。好ましくは、検索結果は、有料広告とおそらくは中立の検索結果の間でユーザを惑わせないように、広告と区別して保持される。
【0028】
最後に検索エンジンは、広告に関する情報、及び広告がいつ、どこで、及び/又はどのようにして表示されるべきであったのか(例えば、位置、クリックスルーか否か、インプレッション時間、インプレッション日付、コンバージョンか否か等)についての情報を、システム120に送り返してよい。代わりに、又はさらに、このような情報は何らかの手段によってシステム120に提供し直されてよい。
【0029】
第4.12章 例示的な広告入力保持および配信環境
図2は、本発明が中で使用されてよい、あるいは本発明がともに使用されてよい、例示的な広告システム120’を示す。例示的な広告システム120’は在庫システム210を含んでよく、広告情報205と使用情報245を記憶してよい。例示的なシステム120’は、広告情報入力管理動作215、キャンペーン(例えば対象設定)支援動作220、会計及び請求書作成発行動作225、広告供給動作230、関連性決定動作235、最適化動作240、相対提示属性割り当て(例えば、位置順序付け)動作250、不正検出動作255、及び結果インタフェース動作260を支援してよい。
【0030】
広告主110は、インタフェース216によって示されるように、広告情報入力管理動作215を介してシステム120’と接続してよい。広告消費者130は、インタフェース231によって示されるように広告供給動作230を介してシステム120’と接続してよい。広告消費者130及び/又は他のエンティティ(図示せず)は、インタフェース261によって示されるように結果インタフェース動作260を介してシステム120’と接続してもよい。
【0031】
広告プログラムは、アカウント、キャンペーン、クリエーティブ、対象設定等に関する情報を含んでよい。用語「アカウント」は、既定の広告主についての情報(例えば、一意のeメールアドレス、パスワード、請求書作成発行情報等)に関する。「キャンペーン」又は「広告キャンペーン」は、1つ以上の広告のうちの1つ以上のグループに関し、開始日、終了日、予約情報、ジオターゲティング情報、シンジケート情報等を含んでよい。例えば、ホンダ(登録商標)(Honda)は、その自動車取扱商品のための1つの広告キャンペーンと、そのオートバイ取扱商品のための別個の広告キャンペーンを有してよい。その自動車取扱商品のためのキャンペーンは、それぞれが1つ以上の広告を含む1つ以上の広告グループを有してよい。各広告グループは、キーワードの集合、及び最大費用付け値(bid)(クリックスルーあたり費用、コンバージョンあたり費用等)を含んでよい。代わりに、あるいは加えて、各広告グループは平均費用付け値(例えば、クリックスルーあたり平均費用、コンバージョンあたり平均費用等)を含んでよい。したがって、単一の最大費用付け値及び/又は単一の平均費用付け値は1つ以上のキーワードと関連付けられてよい。このように、各広告グループは1つ以上の広告つまり「クリエーティブ」(すなわち、最終的にエンドユーザに表示される広告コンテンツ)を有してよい。当然、広告情報205は多かれ少なかれ情報を有してよく、多くの異なる方法で編成されてよい。
【0032】
広告情報205は、該広告情報入力管理動作215を介して入力、管理できる。キャンペーン(例えば対象設定)支援動作220は、広告主110が効果的な広告キャンペーンを作成するのを手助けするために利用できる。例えば、キャンペーン支援動作220は、検索エンジンとともに使用するための広告の関連で、すべての考えられる広告インプレッション、すでに予約されている広告インプレッション、及び既定のキーワードについて利用可能な広告インプレッションを追跡調査してよい、在庫システム210によって提供される情報を使用できる。
【0033】
広告供給動作230は、広告消費者130からの広告に対する要求を果たしてよい。広告供給動作230は、既定の要求のための候補広告を決定するために関連性決定動作235を使用してよい。広告供給動作230は、次に候補広告のうち1つ以上の最終的な集合を選択するために最適化動作240を使用してよい。広告供給動作230は、次に返される広告の提示を順序付けるために、相対提示属性割り当て動作250を使用してよい。会計及び請求書作成発行動作225は、広告の供給に関連する料金を追跡調査するため、及び広告主に請求書を送るために使用されてよい。不正検出動作255は、盗まれたクレジットカードの使用による等、広告システムの(例えば広告主による)不正な使用を削減するために使用できる。最後に、結果インタフェース動作260は、クリックスルーが発生したかどうか、コンバージョンが発生したかどうか(例えば、広告された商品又はサービスの販売が開始されたか、あるいは広告の表示から所定の時間内に完了されたか)等の、実際に供給された広告について(消費者130又は他の何らかのエンティティからの)結果情報を受け入れるために使用されてよい。このような結果情報はインタフェース261に受け入れられ、関連付けられた結果だけではなく、広告及び広告が供給された時刻を特定するための情報も含んでよい。
【0034】
本発明の多様な態様は、関連性決定動作235、相対的な提示属性順序付け動作250、及び/又は広告供給動作230とともに使用されてよい。
【0035】
第4.1.3項 例示的なネットワーク環境
図3は、本発明が使用されてよい例示的なネットワーク環境300を示す。例示的なネットワーク環境300は、それぞれがブラウザ320(又は何らかの他の情報要求表示手段)を有する、1台以上のクライアントデバイス310を含んでよい。クライアントデバイス310は、1台以上のコンテンツサーバ320によって供給される文書335を要求し、1つ以上の検索エンジン340を使用してそれらの又は他の文書に含まれるコンテンツを検索できる。広告サーバ350は、1つ以上の広告355を供給できる。供給された該1つ以上の広告355は、コンテンツサーバ330によって供給される文書(及び/又はこのような文書に対する要求)に関連性があってよい、及び/又は検索エンジン340によって生じる検索結果(及び/又は検索クエリー)に関連性があってよい。(例えば、1台以上のクライアントデバイス310と関連付けられる個々のユーザ又はユーザのグループについての)ユーザ情報365は、1台以上の情報サーバ360に記憶されてよい。代わりに、又は加えて、ユーザ情報(図示せず)は、1台以上のコンテンツサーバ330、1つ以上の検索エンジン340、及び/又は1つ以上の広告サーバ350に記憶されてよい。1台以上のクライアントデバイス310、コンテンツサーバ330、検索エンジン340、広告サーバ350、及び/又はユーザ情報サーバ360は、1つ以上のネットワーク370を介して互いと情報を交換してよい。該1つ以上のネットワーク370はインターネット及びサーバであってよく、検索エンジンはコンピュータであってよい。ユーザ情報(例えば、ユーザプロファイルデータベース)、情報インデックス、及び広告インデックスは、別のレポジトリである必要はない。それらは、単一のレポジトリに記憶されてよい。さらに、データのこれらの形式はインタリーブ化されてよい(例えば、広告データベースは、いくつかの部分集合だけが特定のタイプのユーザのために取り出されるように、広告上に「ユーザ特徴タグ」を含んでよい)。
【0036】
第4.1.4項 定義
図1、図2、図3を参照して前述された例示的なシステム及び任意の他のシステムで使用されるようなオンライン広告は、多様な固有の特徴を有してよい。このような特徴は、アプリケーション及び/又は広告主によって指定されてよい。これらの特徴は以下で「広告特徴」と呼ばれている。例えば、テキスト広告のケースでは、広告特徴は、タイトル行、広告テキスト、及び埋め込まれているリンクを含んでよい。画像広告のケースでは、広告特徴は、画像、実行可能なコード、及び埋め込まれているリンクを含んでよい。オンライン広告のタイプに応じて、広告特徴は、テキスト、リンク、音声ファイル、ビデオファイル、画像ファイル、実行可能コード、埋め込まれている情報等のうち、1つ以上を含んでよい。
【0037】
オンライン広告が供給されるときには、該広告がどのようにして、いつ、及び/又はどこで供給されたのかを説明するために、1つ以上のパラメータが使用されてよい。これらのパラメータは以下で「供給パラメータ」と呼ばれる。供給パラメータは、例えば、広告が供給されたページ(上の情報を含む)の特徴、広告の供給と関連付けられた検索クエリー又は検索結果、ユーザ特性(例えば、彼らのジオロケーション、ユーザにより使用されている言語、使用されているブラウザのタイプ、過去のページ表示、過去の動作)、要求を開始したホスト又は関係者のサイト(例えば、アメリカオンライン(America Online)、グーグル(Google)、ヤフー(Yahoo))、広告が供給されていたページにおける広告の絶対位置、他の供給される広告を基準にした広告の位置(空間的又は時間的)、広告の絶対サイズ、他の広告を基準にした広告のサイズ、広告の色、他の供給される広告の数、供給される他の広告のタイプ、供給される時刻、広告される曜日(time of week)、広告される季節(time of year)等のうち1つ以上を含んでよい。当然ながら、本発明に関連して使用されてよい、他の供給パラメータもある。
【0038】
供給パラメータは広告特徴にとって付帯的であってよいが、それらは供給条件又は制約として広告と関連付けられてよい。供給条件又は制約として使用されるとき、このような供給パラメータは単に「供給制約」(つまり「対象設定基準」)と呼ばれる。例えば、いくつかのシステムでは、広告主は、それが平日だけに、特定の位置より下ではなく、特定のジオロケーションのユーザに対してだけ供給されなければならない等を指定することによって、その広告の供給の対象を設定できてよい。別の例として、いくつかのシステムでは、広告主は、ページ又は検索クエリーが特定のキーワード又は句を含む場合にだけ、その広告が供給されなければならないと指定してよい。さらに別の例として、いくつかのシステムでは、広告主が、供給されている文書が特定のトピック又は概念を含む、あるいは特定の1つ以上のクラスタ、又は何らかの他の1つ以上の分類に該当する場合にだけ、その広告が供給されなければならないと指定してよい。「ジオロケーション」情報は、1つ以上の国、1つ以上の(国間の)地方、1つ以上の州、1つ以上の首都圏、1つ以上の都市、1つ以上の町、1つ以上の区、共通の郵便番号が付いた1つ以上の地域、共通の電話局番の付いた1つ以上の地域、共通のケーブル電波中継局により供給される1つ以上の地域、共通ネットワークアクセスポイント又はノードによって供給される1つ以上の領域等のうち1つ以上を指定する情報を含んでよい。それは緯度及び/又は経度、あるいはこれらの範囲を含んでよい。それはユーザの位置が推定できるIPアドレス等の情報を含んでよい。
【0039】
「広告情報」は、このような情報の拡張部(例えば、広告関連情報から引き出された情報)だけではなく、広告特徴、広告供給制約、(「広告導出情報」と呼ばれる)広告特徴又は広告供給制約から引き出すことができる情報、及び/又は(「広告関連情報」と呼ばれる)広告に関連した情報の任意の組み合わせも含んでよい。
【0040】
「文書」は、コンピュータが解読できる、又はコンピュータが記憶できる任意の作業生産物を含むように広義に解釈されるべきである。文書は、ファイル、ファイルの組み合わせ、他のファイルに対する埋め込みリンクのある1つ以上のファイル等であってよい。ファイルは、テキスト、音声、画像、ビデオ等の任意のタイプであってよい。エンドユーザに表示される文書の部分を、文書の「コンテンツ」と見なすことができる。文書は、コンテンツ(ワード、ピクチャ等)及びそのコンテンツの意味の何らかの表示(例えば、eメールフィールド及び関連付けられたデータ、HTMLタグ及び関連データ等)の両方を含む、「構造化データ」を含んでよい。文書中の広告スポットは、埋め込まれた情報又は命令によって定義されてよい。インターネットの関連では、共通の文書はウェブページである。ウェブページは多くの場合、コンテンツを含み、(メタ情報、ハイパーリンク等の)埋め込まれた情報、及び/又は(Java(登録商標)script等の)埋め込まれた命令を含んでよい。多くのケースでは、文書は一意の、アドレス指定可能な記憶位置を有し、したがってこのアドレス指定可能な位置によって一意に識別できる。ユニバーサルリソースロケータ(URL)は、インターネット上で情報にアクセスするために使用される一意のアドレスである。
【0041】
「文書情報」は、(例えば、関連情報から引き出される情報等の)このような情報の拡張だけではなく、文書に含まれる任意の情報、(「文書導出情報」と呼ばれる)文書に含まれる情報から引き出すことのできる情報、及び/又は(「文書関連情報」と呼ばれる)文書に関連する情報も含んでよい。文書導出情報の例は、文書のテキストコンテンツに基づいた分類である。文書関連情報の例は、当該の文書がリンクする他の文書からの文書情報だけではなく、当該の文書へのリンクのある他の文書からの文書情報も含む。
【0042】
「eメール情報」は、(例えば、関連情報から引き出される情報等の)このような情報の拡張部だけではなく、(「内部eメール情報」と呼ばれることもある)eメールに含まれる任意の情報、eメール情報に含まれる情報から引き出すことのできる情報、及び/又はeメールに関連する情報も含んでよい。eメール情報から引き出される情報の例は、eメールの件名の行から抽出される用語から構成される検索クエリーに応えて返される検索結果から、抽出される、あるいはそれ以外の場合引き出される情報である。eメール情報に関連する情報の例は、既定のeメールの同じ送信者によって送信される1つ以上の他のeメールについてのeメール情報、又はeメール受取人についてのユーザ情報を含む。eメール情報から引き出される、あるいはeメール情報に関連する情報は、「外部eメール情報」と呼ばれてよい。
【0043】
文書からのコンテンツは、「コンテンツレンダリングアプリケーション又はデバイス」で表示されてよい。コンテンツレンダリングアプリケーションの例は、インターネットブラウザ(例えば、エクスプローラ(Explorer)又はネットスケープ(Netscape)、メディアプレーヤ(例えば、MP3プレーヤ、リアルネットワークス(Realnetworks)ストリーミング音声ファイルプレーヤ等)、ビューワ(例えば、アドビアクロバット(Adobe(登録商標) Acrobat)pdfリーダ)等を含む。
【0044】
「コンテンツオーナ」とは、文書のコンテンツに何らかの所有権を有する人物又はエンティティである。コンテンツオーナはコンテンツの作者であってよい。加えて、又は代わりに、コンテンツオーナは、コンテンツを複製する権利、コンテンツの派生著作物を作成する権利、コンテンツを公に表示する又は実行する権利、及び/又はコンテンツの他の所定の権利を有してよい。コンテンツサーバが、それが供給する文書のコンテンツにおいてコンテンツオーナである可能性があるが、これは必須ではない。
【0045】
(「UPI」とも呼ばれる)「ユーザプロファイル情報」は、個人ユーザ又はユーザのグループについての任意の情報を含んでよい。このような情報は、ユーザによって提供されてよく、ユーザ情報を公開することを許可されているサードパーティによって提供されてよく、及び/又はユーザアクションから引き出されてよい。特定のユーザ情報は、同じユーザの他のユーザ情報及び/又は他のユーザのユーザ情報を使用して演繹又は推測できる。UPIは多様なエンティティと関連付けられてよい。「ユーザUPI」は特定のユーザ又はユーザのグループと関連付けられるユーザプロファイル情報である。「文書UPI」は、文書と関連付けられるユーザプロファイル情報である。例えば、文書UPIは、文書を要求した又は文書にアクセスしたユーザの多様なユーザUPIの複合表現であってよい。「広告待ち受けページUPI」は特定のタイプの文書UPIであり、おそらく彼らが広告を選択した(例えばクリックした)ことに応じて、ある特定のウェブページにアクセスした、あるいはある特定のウェブページで購入を完了した多様なユーザの複合表現であってよい。「対象設定UPI」は、ユーザプロファイル供給制約を含んでよい。例えば、前立腺がん検診のための広告は、属性「男性」及び「年齢45歳以上」を有するユーザプロファイルに限定される可能性がある。
【0046】
本発明の多様な例示的な実施形態は、ここで第4.2項に説明される。
【0047】
第4.2項 例示的な実施形態
第4.2.1項 例示的なユーザ情報
図4は、本発明にしたがった方法でユーザプロファイル情報(UPI)を記憶するために使用されてよい、例示的なデータ構造400である。図示されていないが、そのデータ構造400は識別子を含んでよい。このような識別子は、ある特定のユーザ、ユーザのグループ、文書、広告、広告待ち受けページ等と、UPIとを関連付けるために使用されてよい。UPIは、1つ以上のUPI属性420に関連する情報410の1つ以上の集合体を含んでよい。各属性420は、関連付けられた値430とスコア440を有してよい。
【0048】
UPI属性420は、例えば、地理情報、年齢又は年齢層、関心のある話題、読書レベル、収入、及び広告の対象を設定するために適した他の人口統計データ等の、ユーザの背景及び関心に関する情報を含んでよい。UPI属性420と関連付けられた値430は、量的(離散値又は連続値、例えば年齢=58歳、年収=55,000ドル、居住都市=サンフランシスコ、カリフォルニア州(San Francisco,CA)又は質的(集合の中、又は集合の中ではない、例えば、給料が$50,000−$100,000?=イエス;米国在住か?=イエス)であってよい。各UPI属性420及び値430は、属性の値が正しい確率に関連する関連スコア440を有してよい。UPI属性の例は以下の1つ以上を含んでよい。
【0049】
−ユーザがアクセスした(又は特定の期間内にアクセスした)ウェブサイトのコンテンツ(例えば、ワード、Anchortext等)
−人口学的情報、
−地理情報、
−心理情報、
−ユーザが行った過去のクエリー(及び/又は関連情報)、
−ユーザに表示され、選択した、及び/又は見た後に購入した、過去の広告についての情報、
−ユーザによって表示された/要求された及び/又は編集された文書(例えばワードプロセッサ)についての情報、
−ユーザの関心、
−ユーザからの個人的な結果に関する、明示的又は暗示的なフィードバック(例えば、結果を選択する、結果を選択しない、結果に関して費やされる時間の量等)、
−ブラウジング活動、及び、
−過去の購入動作。
【0050】
このような情報は、個人単位で記憶されてよい(プライバシーの問題から個人識別可能な情報を含まない可能性がある)、あるいは個人の多様な集団の中で種々の方法で集められてよい。このような情報は複合プロファイルを得るために結合されてよい。
【0051】
第4.2.2項 UPIを使用するための例示的なアプリケーション
ユーザプロファイル情報(UPI)を使用するための多くのアプリケーションがある。3つの例示的なアプリケーション−強化広告対象設定、広告クリエーティブ選択と生成、及びクエリー両義性解決−が後述される。
【0052】
第4.2.2.1項 UPIを使用する広告採点
広告の対象設定されたUPI(及び/又は広告の待ち受けページのUPI)が文書UPIに一致する(例えば、文書を要求したユーザの平均的なUPI)に一致するホストサイト又はページに広告を掲載すること、及び/又はUPIが広告(及び/又は広告の待ち受けページのUPI)のターゲットUPIに一致するユーザに広告を供給することが望ましい場合がある。
【0053】
UPIを使用する強化広告対象を用いると、複数の広告のそれぞれのスコアは、ユーザのUPI、文書のUPI、広告待ち受けページのUPI、及び/又は広告対象設定UPIの少なくともいくつかを使用して決定されてよい。少なくとも1つの広告は順位で順序付けられ、フィルタリングされ、及び/又は少なくとも決定されたスコアを使用して複数の広告から選択されてよい。
【0054】
例えば、広告スコアはUPI一致値の関数であってよい。図5を参照すると、このようなUPI一致値は、(i)ユーザ(又はユーザグループ)512と関連付けられたUPI情報514と、ユーザ512によって要求される(又はアクセスされる)文書(例えば、ウェブページ)と関連付けられたUPI情報514との一致値(一致値1)、(ii)ユーザ(又はユーザグループ)512と関連付けられたUPI情報514と、検討中の広告の待ち受けページ532と関連付けられたUPI情報534との一致値(一致値2)、(iii)ユーザによって要求される(又はアクセスされる)文書522と関連付けられたUPI情報524と、検討中の待ち受けページ532と関連付けられるUPI情報534との一致値(一致値3)、(iv)ユーザ(又はユーザグループ)512と関連付けられたUPI情報514と、検討中の広告542と関連付けられたUPI広告対象設定情報544との一致値(一致値4)、及び(v)ユーザによって要求される又はアクセスされている文書522と関連付けられたUPI情報524と、検討中の広告542と関連付けられたUPI広告対象設定情報544の一致値(一致値5)のうち、1つ以上の関数であってよい。
【0055】
このようにして、本発明の一実施形態では、全体的な一致は以下のように定義されてよい。
【0056】
UPI一致=a*一致値1+b*一致値2+c*一致値3+d*一致値4+e*一致値5
ここで、a、b、c、d及びeは定数である(例えば、a=0.025、b=0.275、c=0.3、d=0.2、及びe=0.2)。ユーザUPIと文書UPIの間の一致は、広告にどれか1つがどれほどよく一致するのかには関係ない可能性があるため、「a」がゼロに設定されてよいことに留意されたい。多項式又は指数関数を含む他の関数が代わりに使用されてよい。
【0057】
一般的には、優れた一致のためには、ユーザのUPIはホストページUPIに一致し、おそらくさらに重要なことには、広告待ち受けページのUPIにも一致しなければならない。2つのプロファイルの一致は、ベクトル空間一致等の2つの用語のベクトルを一致させるための標準的な情報検索技法を使用して計算できる(例えば、記事、G.Salton及びC.Buckley、「自動テキスト検索における用語加重手法(Term−Weighting Approaches in Automatic Text Retrieval)」、情報処理及び管理(Information Processing and Management)、24(5)、513−523ページ(1988年)、及びGerard Salton、A.Wong、C.S.Yang、「自動索引付けのためのベクトル空間モデル(A Vector Space Model for Automatic Indexing)」、ACMの通信(Communications of the ACM)、18(11)、613−620ページ(1975年)を参照されたい)。
【0058】
地形、話題、ユーザ年齢範囲、言語等の幅広い属性は、例えば機械学習分類子を使用して文書とユーザについて計算できる。また、このような幅広い属性は、マッチングにおいて単語と句のようなより狭い属性とも一緒に使用できる。
【0059】
当然、広告のスコアは、例えば、検索クエリーに、又は文書のコンテンツに対するその関連性、既定の結果(例えば、インプレッション、選択、コンバージョン等)について広告主が支払う、あるいは支払う用意がある金額、広告の性能の測度(例えば、クリックスルー率、コンバージョン率、ユーザ定格等)、広告主の品質の測度等の、UPI一致に加えて他の要因の関数である場合がある。さらに、異なる中間広告スコアは異なる目的で(例えば、関連性、位置、相対的なレンダリング属性等)使用されてよい。
【0060】
第4.2.2.2項 UPIを使用する広告クリエーティブ選択
UPIを使用する広告クリエーティブ選択及び/又は生成を用いると、広告クリエーティブは(例えば、ユーザ、文書等の)UPIに合わせて調整されてよい。
【0061】
第4.2.2.3項 UPIを使用するクエリー両義性解決
適切な広告つまり広告クリエーティブを選択することに加えて、UPIは不明瞭な検索用語を含む検索クエリーを明確にするために使用されてよい。例えば、検索クエリー「ジャガー」を提出するユーザは、(A)車ジャガー(Jaguar)についての情報、(B)動物についての情報、(C)アップルジャガー(Apple Jaguar)オペレーティングシステムについての情報、又は(D)ジャクソンビルジャガー(Jacksonville Jaguar)NFLフットボールチームについての情報のどれかを必要とする可能性がある。ユーザのUPIは、「ジャガー」検索用語を明確にするために使用できるであろう。この例では、ユーザの以前のブラウジング活動からの情報が、曖昧なクエリー「ジャガー」を明確にするのに役立つ、あるいはユーザにとってほとんど又はまったく重要ではない広告が表示されないようにしてよい。例えば、ユーザが最近「アップルコンピュータ」と「オペレーティングシステム」についてクエリーを行っており、その後検索クエリー「ジャガー」を提出した場合、ユーザの以前のクエリー履歴は、クエリーがアップル(Apple)コンピュータ用のオペレーティングシステムを参照しており、車、動物又はNFLチームを参照していない可能性が高かった。その結果、広告はこのような情報を利用することによってユーザに対象を設定できるであろう。
【0062】
他だけではなく、UPIを使用するためのこれらの前記アプリケーションは、UPIが入手可能であると仮定する。しかしながら、これが当てはまらない場合、このようなUPIが生成及び/又は更新される必要がある。UPIを決定する、及び/又は更新するための例示的な方法は、以下の第4.2.3項に説明される。
【0063】
第4.2.3項 UPIを決定する、及び/又は更新すること
ユーザプロファイル情報(UPI)が、サービスに加入するときにユーザが提供した情報を使用して決定できることを想起されたい。しかしながら、多くのケースでは、ユーザは自らについての情報を進んで開示しない(volunteer)、あるいは単にこのような情報を進んで開示しないように頼まれる。さらにユーザがたとえこのような情報を進んで開示しても、(例えば、加入の時点で与えられた情報がサービスに必要とされていることに限定されてよく、したがって包括的ではないために)それは不完全である可能性がある、それは意図的に又は無意図的に不正確である可能性がある、それは陳腐になる可能性がある等である。
【0064】
同様に、UPI情報はユーザが要求した、あるいはアクセスしている文書について入手できない可能性がある。
【0065】
広告は、広告主にUPI情報を供給させることができるが、このようにすることは広告主にとっては重荷となる可能性がある。
【0066】
後述されるように、ユーザ、文書等のUPIは、明示的な情報がシステムに与えられていなくても決定できる(あるいは更新できる、あるいは拡張できる)。以下では、初期の(又はベースライン)UPIが、ブートストラップ段階の間に決定されてよい。このような初期UPIは、ユーザ又は文書に、あるいはUPIが関連付けられる広告に固有の情報を使用してよい。初期UPIは、明示的に入力された何らかのUPI情報を含んでもよいし、含まなくてもよい。
【0067】
広告採点、広告クリエーティブ選択、クエリー両義性解決等の応用例に、このような初期UPI又はベースラインUPIを使用するだけで十分な場合がある。しかしながら、拡大及び/又は強化段階の間に、初期UPI又はベースラインUPIを補足することが所望されてよい。例えば図4を参照し直すと、(例えばユーザの、又は文書の、又は広告の、又は広告待ち受けページの)UPI410は、過去に存在しなかった、又は値を有していなかったかのいずれかである属性420に値430を追加することによって拡大されてよい。代わりに、又は加えて、UPI410の属性420の値430の440のスコアは、修正又は強化されてよい。したがって、例えば、値=男性を有する属性=性別の確率は、規定の追加情報を増加又は減少してよい。初期UPIを拡大又は補足するために使用される情報は、推測された情報と見なされてよい。
【0068】
図6は、本発明にしたがった方法で文書UPIを決定するために使用されてよい例示的な方法600のフロー図である。文書のための初期UPIが決定される。(ブロック610)これは、文書コンテンツ等の文書に固有の情報を使用して行われてよい。この行為を実行するための例示的な方法は図8に関して後述される。文書のための追加UPI情報が推測される。(ブロック620)これは、アクセスしているユーザ、リンクされている文書等から推測される情報を使用して行われてよい。次に、新しい(例えば、拡大された及び/又は強化された)文書UPIは、初期文書UPI及び推測された文書UPIを使用して決定される。(ブロック630)行為620と630は、方法600が終了される前に一回以上実行されてよい。(ノード640)。行為620と630が、仮想分岐戻り線によって示されるように繰り返される場合、新しい文書UPIは、以前の文書UPI及びさらに多くの推測文書UPIを使用して決定されてよい。
【0069】
図7は、本発明にしたがった方法で(個人又はグループとしての)ユーザUPIを決定するために使用されてよい、例示的な方法700のフロー図である。ユーザのための初期UPIが決定される。(ブロック710)これはユーザによって提出される過去の検索クエリー等のユーザに固有な情報を使用して行われてよい。この行為を実行するための例示的な方法は図9を参照して後述される。ユーザのための追加のUPI情報が推測される。(ブロック720)これは検索結果、選択された検索結果等から推測される情報を使用して実行されてよい。次に、新しい(例えば、拡大された、及び/又は強化された)ユーザUPIは、初期ユーザUPI及び推測されたユーザUPIを使用して決定される。(ブロック730)行為720と730は、方法700が終了される前に一回以上実行されてよい。(ノード740)。行為720と730が、仮想分岐戻り線によって示されるように、繰り返される場合、新しいユーザUPIは、以前のユーザUPIとさらに多くの推測されたユーザUPIを使用して決定されてよい。
【0070】
図6のブロック610から、初期文書UPIが決定されてよいことを想起されたい。図8は、本発明にしたがった方法で初期UPI又はベースライン文書UPIを決定するために使用されてよい、例示的な方法800のフロー図である。示されているように、文書UPI属性値は(例えば、文書のコンテンツ、文書のメタ情報等を使用して)投入されてよい。(ブロック810)
図7のブロック710から、初期ユーザUPIが決定されてよいことを想起されたい。図9は、本発明にしたがった方法で初期UPI又はベースラインユーザUPIを決定するために使用されてよい、例示的な方法900のフロー図である。図示されるように、ユーザUPI属性値は(例えば、ユーザの過去のクエリー情報、ユーザによって明示的に入力される情報等を使用して)投入されてよい(ブロック910)。
【0071】
第4.2.4項 ユーザ情報がどのようにして取得されるのかの例
ユーザ情報を取得する多くの代替方法がある。例えば、属性420と値430のスコア440は、以前に実施されたクエリーの単語を使用して、プロファイルの中のUPI属性420の値430を予測する機械学習分類子を用いて決定できる。例えば、以前の検索クエリーの中の「女性の健康」に関連するキーワードを考えると、分類子はユーザが0.8という確率で女性であると推測してよい。さらに、以前の検索クエリーで日本語の単語が使用されたことを考えると、分類子はユーザが0.9の確率で日本人であると推測してよい等である。2つのUPIのスコア440は、それらが一致するかどうかに影響を及ぼす可能性がある。属性420は、1つのUPIでは「サンフランシスコ」で、もう1つでは「サンホセ」である場合がある。これらの未処理の属性は一致しないが、機械学習分類子は両方のケースで地理的なカテゴリ=「カリフォルニア」を割り当ててよく、一般化されるプロファイル属性は一致するであろう。したがって、機械学習分類子は、ユーザと文書を、地理、話題、民族性、又は読書レベルに関する幅広いカテゴリに分類するために使用されてよい。
【0072】
UPI情報が推測されてよいことを、図6のブロック620と図7の720の両方から想起されたい。ユーザUPIは、何らかの方法でユーザと関連付けられる他のユーザ及び/又は文書のUPIから推測されてよい。同様に、文書UPIは他の文書のUPIから推測されてよい、及び/又はユーザは、文書と何らかの方法で関連付けられてよい。図10は、ユーザと文書がどのようにして関連付けられるのかを示す。
【0073】
図10に示されるように、ユーザ/文書関連動作1010は、一人以上のユーザのユーザ情報1020、1つ以上の文書の文書情報1030、文書リンク(例えば、ウェブトポロジー)情報1040、(代わりにユーザ情報1020として提供されてよい)ユーザクエリー1050の検索結果、及び(代わりにユーザ情報1030として提供されてよい)ユーザ文書選択1060のうち1つ以上を使用して、ユーザ及び/又は文書(ユーザ対ユーザ、ユーザ対文書、文書対文書、及び/又は(示されているもののような無向グラフでのユーザ対文書の関連と同じであってよい)文書対ユーザ)を関連付ける、情報1070を生成してよい。
【0074】
本発明の例示的な一実施形態では、関連情報1070は、ユーザと文書がそれぞれノード1072と1076として表されるグラフであってよい。図11は、本発明にしたがった方法でユーザ及び/又は文書を関連付けるために使用されてよい、例示的な方法1100のフロー図である。図示されるように、ノードは各ユーザと文書に定められてよい。(ブロック1110)ユーザノード1072のそれぞれに、ユーザが提出した検索クエリーに応えて検索エンジンによって戻された一番上のウェブページのために、(関連を示す)エッジ1074がユーザノードと文書ノードの間に描画されてよい。(変形では、エッジ1074は、ユーザが選択した(例えばクリックした)ウェブページだけで描画できるであろう)。さらに、エッジ1078がそれらの間にリンク(例えばハイパーリンク)を有する文書の組の間に描画されてよい。(ブロック1120)図示されていないが、ユーザ対ユーザの関連も生成されてよい。例えば、エッジは同じ文書の1つ以上にアクセスしたユーザ間で追加されてよい。
【0075】
図7を参照し直すと、このグラフ1070を考えると、ユーザのための新しいUPIが、その初期のUPI、及び推測されたユーザUPIとして、ユーザノード1072がリンクされるノード1076に対応する文書のUPIを使用して、決定されてよい。同様に、図6を参照し直すと、文書の新しいUPIは、このグラフ1070を考えて、その初期のUPI、及び推測される文書UPIとして、文書ノード1076がリンクされる、それぞれノード1072と1076に対応するユーザUPIと文書のUPIを使用して、決定されてよい。
【0076】
本発明の一実施形態において、それぞれ図6と図7のブロック630と730を参照し直すと、
updated_UPI=initial_UPI*alpha+neighborhood_UPI*beta
であり、アルファとベータは定数(例えば、アルファ=0.7、ベータ=0.3)であり、neighborhood_UPIはグラフ内の近傍のノードのUPIの平均である。UPIを更新するための他の関数が考えられる。このプロセスは反復を多数回(例えば、50)繰り返されてよい。
【0077】
平均UPIを決定するために、個々の属性420の値430が平均され、場合によってはスコア440で加重されてよい。
【0078】
さらに多くの離れたノード(例えば、2エッジ以上離れた)も検討されてよいが、より少なく加重されなければならない。
【0079】
ユーザUPIと文書UPIの両方とも更新されてよいが、一方又は他方だけを更新することが可能である。
【0080】
代替実施形態では、ユーザノード1072は、ユーザの集団を表してよい。同様に文書ノード1076は(例えば、多くのウェブページを含むウェブサイト等)文書の集合体を表してよい。
【0081】
代替実施形態では、グラフエッジには関連重みが割り当てられる。したがって、例えば、文書がユーザ検索クエリーに応えて返された検索結果リストに単に含まれていた場合より、ユーザが検索結果リストから文書を選択した場合には、ユーザノード1072から文書ノード1076へのエッジ1074には、より大きな重みが与えられてよい。
【0082】
第4.2.5項 例示的な装置
図12は、前述された動作の1つ以上を達成してよい機械1200の高水準ブロック図である(例えば、エンドユーザシステム又はクライアントデバイスによって実行される動作、コンテンツサーバによって実行される動作、検索エンジンによって実行される動作、あるいは広告サーバによって実行される動作)。機械1200は、基本的に、1台以上のプロセッサ1210、1台以上の入力/出力インタフェース装置1230、1台以上の記憶装置1220、結合された要素の間の情報の通信を容易にするための1つ以上のシステムバス及び/又はネットワーク1240を含む。1台以上の入力装置1232及び1台以上の出力装置1234は、1つ以上の入力/出力インタフェース1230と結合されてよい。
【0083】
該1台以上のプロセッサ1210は、本発明の1つ以上の態様を達成するために機械実行可能な命令(例えば、カリフォルニア州パロアルト(Palo Alto,California)のサンマイクロシステムズ社(Sun Microsystems Inc.)から入手可能なソラリス(Solaris)オペレーティングシステム、あるいはノースカロライナ州ダーハム(Durham,North Carolina)のレッドハット社(Red Hat,Inc.)等の多くのベンダから広範囲に入手可能なリナックス(登録商標)(Linux(登録商標))オペレーティングシステムで実行する、C又はC++)を実行してよい。機械実行可能命令の少なくとも一部は、該1台以上の記憶装置1220上に(一時的に、又はより恒久的に)記憶されてよい、及び/又は1台以上の入力インタフェース装置1230を介して外部ソースから受け取られてよい。
【0084】
一実施形態では、機械1200は1台以上の従来のパーソナルコンピュータであってよい。このケースでは、該処理装置1210は1台以上のマイクロプロセッサであってよい。該バス1240はシステムバスを含んでよい。該記憶装置1220は、読み取り専用メモリ(ROM)及び/又はランダムアクセスメモリ(RAM)等のシステムメモリを含んでよい。記憶装置1220は、ハードディスクに読み書きするためのハードディスクドライブ、(例えばリムーバブル)磁気ディスクに読み書きするための磁気ディスクドライブ、及びコンパクトディスク又は他の(磁気)光学媒体等のリムーバブル(磁気)光学ディスクに読み書きするための光学ディスクドライブを含んでよい。
【0085】
ユーザは、例えば、キーボードとポインティングデバイス(例えばマウス)等の入力装置1232を通して、パーソナルコンピュータにコマンドと情報を入力してよい。マイク、ジョイスティック、ゲームパッド、パラボラアンテナ、スキャナ等の他の入力装置もまた、(あるいは代わりに)含まれてよい。これらの及び他の入力装置は多くの場合、システムバス1240に結合されている適切なインタフェース1230を通して処理装置(複数の場合がある)1210に接続されている。出力装置1234は、適切なインタフェースを介してシステムバス1240にも接続されてよいモニタ、又は他のタイプのディスプレイ装置を含んでよい。モニタに加えて(あるいは代わりに)パーソナルコンピュータは、例えばスピーカ及びプリンタ等の他の(周辺)出力装置(図示せず)を含んでよい。
【0086】
第4.3項 改良版及び代替策
第4.3.1項 決定技法
マッチング(つまり類似性)決定は、多くの方法で実行できる。例えば、以下の類似性決定技法の1つ以上が使用されてよい。(a)(例えば後述されるような)ベクトルベース、(b)(例えば後述されるような)規則ベース、(c)一致の確率又は尤度を推測するための確率的推論、及び(d)ファジー論理マッチングである。他の類似性技法は、本発明の元でも使用されてよい。
【0087】
上で触れたように、類似性を決定する1つの方法はUPIベクトルを形成することである。複数の広告のそれぞれは代表的な対象設定UPIベクトルを有してもよい。このようなUPIベクトルは、履歴データから決定される追加情報も含んでよいことに留意されたい。例えば、どの人口グループがある広告をクリックする傾向があるかについての推論は、データマイニング技法を使用して決定されてよい。この(例えばオフラインの)分析の結果は、次に広告のUPI対象設定ベクトルの1つ以上の属性として使用されてよい。UPIベクトルは、ベクトル間のコサイン距離、ハミング距離、及び/又は種々の他のベクトル距離基準等の採点関数を使用して一致できる。次に広告は、このような関数により生じるスコアを使用して(例えばスコアに従って)ランクを付けることができる。
【0088】
また前記に示されたように、UPIをマッチさせるための別の技法は、ユーザUPI、文書UPI、広告UPI、及び広告待ち受けページUPIの1つ以上の組の類似性を定める規則及び/又は関数の集合を適用することを含む。このような規則及び/又は式をベースにしたシステムは、加重スコアを出すために(例えば、加重して)論理規則の任意の組み合わせを使用できる。
【0089】
このように、ベクトルベースの技法及び規則及び/又は公式ベースの技法は、一致決定を生成するためにいっせいに使用されてよい。
【0090】
本発明の一実施形態では、属性頻度−反転文書(又はユーザ)頻度積(attribute frequency−inverse document(or user)frequency product)(TF−IDF)基準は、類似性スコアを生じさせるためにUPIを使用して決定される。
【0091】
第4.3.1.1項 類似性決定技法の改良版
UPIを一致させるプロセスを効率的に保つために、属性選択、属性汎用化及び/又は属性集約の技法が、比較されているベクトルのサイズを縮小するために使用されてよい。例えば、属性選択は、UPIの間の一致プロセスの一部として使用される属性の数及び/又はサイズを削減するために使用されてよい。このような属性選択技法は、(絶対項及び/又は相対項の中で)高いスコア(例えば、確率又は重要性重み)を有する何らかの数の属性だけを、UPIのベクトル表現で保つことを含んでよい。別の属性選択技法は、うまく機能する(例えばクリックされる)可能性が高い1つ以上の一致を生成するために、他よりどの属性がより指標となるかを決定するために、「相互情報」、カイ二乗適合(Chi−squared fit)、又は例えば相関等の、統計基準を使用することを含んでよい。さらに別の属性選択技法は、最も有用であると考えられるそれらの属性を単に手作業で選択することである。これらの又は他の属性選択技法の2つ以上がいっせいに使用されてよい。
【0092】
同様に、UPIベクトルは、残っている広告UPIベクトルの小さい部分集合だけがユーザUPIと文書UPIに関してランク付けされる必要があるように、(例えば、特定の特徴を正確に一致させる等の)何らかの初期基準の集合を使用して、前置フィルタにかけられてよい。この技法は、結合された規則ベースの類似性決定技法と、ベクトル距離類似性決定技法を示している。この技法を使用すると、UPI間の全体的な一致プロセスの効率を高めるのに役立つという追加の利点がある。
【0093】
例えば、ユーザ及び/又は文書に関連性のある1つ以上の広告の第1の集合が先に決定されてよい。1つ以上の広告の第1の集合は広告の最終的な集合を決定するためにUPI情報動作をさらに使用して処理されてよい(例えば、UPIを使用して決定される第2の類似性スコアに基づいて順序付けられる、及び/又はフィルタリングされる)。このような実施形態は、UPI(の一部)がクライアントに記憶されるときに有用であり得る。例えば、広告サーバは、ユーザ要求(例えば検索クエリー又は文書要求)のために上位Nの(例えばN=100)の広告をクライアントに送信してよい。クライアントは、次にこれらの供給された広告に、ローカルユーザ情報に基づいて順序を付け直すことができる。
【0094】
第4.3.2項 どのように及びどこにUPIが記憶されるのかの例
本発明の一実施形態では、UPIは、関連付けられたソース(例えば、nグラムは表示されるウェブページ、クエリー等からである)、URL、又は異なる種類の情報(例えば、ユーザは特定のウェブブラウザを使用している、あるいはユーザは特定の緯度と軽度に位置している等)の特定の値が付いた、nグラム(長さ1からほぼ最大、例えば3までの単語のシーケンス)として記憶される。
【0095】
UPIの記憶及び使用は、(a)(例えば、ブラウザクッキー、ローカルファイル、非表示形式フィールド、又はURL符号化等の形をとる)クライアント側記憶装置、(b)(例えば、プロファイル/動作情報を記憶し、検索するための記録のデータベース、フラットファイル、又は独自仕様の構造等の)サーバ側記憶装置、及び/又は(c)サードパーティの記憶装置を含む、多様な異なる形式を取ってよい。このようにして、UPIはサーバ側のレポジトリに常駐する必要はないが、実際にはクライアント及び/又はサードパーティで記憶され、ユーザの要求とともに情報サーバに送信されてよい(例えば、検索クエリー又は文書要求)。UPIは例えば、ウェブブラウザクッキーで送信できる。
【0096】
図3の例示的なネットワーク環境を参照し直すと、UPIは、1台以上のクライアントデバイス320、1台以上のコンテンツサーバ330、1つ以上の検索エンジン340、1台以上の広告サーバ350、及び/又は1台以上のユーザ情報サーバ360に記憶されてよい。いずれにせよ、ユーザ情報は、何らかのデータ管理方式(例えば、データベース、フラットファイル、独自仕様データ管理システム、ウェブブラウザクッキー等)を使用することにより保持されてよい。ユーザ情報のさまざまな項目(例えば異なるユーザ特徴)がさまざまなデバイスに記憶されてよい。
【0097】
第4.3.2.1項 情報記憶に対する改良版
実践的なシステムを達成するために、対象設定広告で使用されるUPIの量を削減する、及び/又はUPIを順序付けることが所望されるようになる、又は必要になる。本発明は、情報と精度の最小限の損失でこのような削減を可能にする。さらに、広告の供給における、ひいてはUPIの検索における待ち時間を制約することが、望ましい又は必要である可能性があるので、広告サーバは限られたUPIで、あるいはUPIなしで動作する必要がある場合もある。本発明にしたがった方法で優先順位を設定することにより、広告サーバは対象設定プロセス中に使用可能な貴重な(例えば最も貴重な)情報に焦点を当てることができる。データ削減及び処理優先順位の設定のための例示的な技法が後述される。
【0098】
本発明の一実施形態では、少なくともいくつかのUPI属性のそれぞれが、関連付けられたスコア(重要性重み、確率等)を有する。複数のUPI属性の重要性重みは、何らかの方法でともに分類されるあるいは集約されてよい。
【0099】
当初、UPI属性に割り当てられる重要性重みは、おそらく特に一種の情報を使用して決定されてよい。例えば、検索クエリーは、ユーザが表示したウェブページから抽出されるnグラムより高い初期重みを有してよい。
【0100】
UPI属性の重要性重みは、特定のユーザの、又はユーザのグループのアクションに基づいて更新されてよい。例えば、(参照してここに組み込まれ、「第791号出願」と呼ばれる)2003年6月2日に出願された、Steve Lawrence、Mehran Sahami及びAmit Singhalを発明者として示す「ユーザ要求情報とユーザ情報を使用して広告を供給すること(SERVING ADVERTISEMENTS USING USER REQUEST INFORMATION AND USER INFORMATION)」と題される米国特許出願第10/452,791号の図9は、本発明にしたがった方法で広告UPI又はユーザUPIを管理するために使用されてよい例示的な方法を示す。例えば、その例示的な方法では、ユーザが広告を選択すると、推奨されているこの広告につながったユーザUPI属性の重要性重みが増加してよい。重要性重み(複数の場合がある)が増す量(絶対又は相対)は、各UPI属性が広告推奨スコアにどの程度貢献したのかに少なくとも部分的に依存してよい。同様に、関連性のあるUPI属性の重要性重みは、ユーザが広告を選択しないときには削減されてよい。本発明の一実施形態では、重み削減係数は重み増加係数より小さい。
【0101】
本発明の一実施形態では、重要性重みは随意的に、UPI属性が全ユーザ全体で(絶対的及び/又は相対的に)どの程度頻繁に優れた推奨策を生じさせたのかに基づいて大局的な重みを使用して(例えば結合されて)調整されてよい。代わりに、又は加えて、重要性重みは、UPI属性が随意的に(例えばすべての類似した)ユーザのグループ全体で(絶対的に及び/又は相対的に)どの程度頻繁に優れた推奨策を生じさせたのかに基づいて、同一性重みを使用して(例えば結合されて)調整されてよい。
【0102】
本発明の一実施形態では、UPIは特定のサイズに達すると、それは少なくとも重要性重みを使用して情報のあまり重要でない項目を削除することによって削減されてよい。UPI属性の記憶要件も検討されてよい。このようにして、多くの記憶域を必要とするが、低い重要性重みを有するUPI属性は削除の第一の候補となるであろう。
【0103】
本発明の一実施形態は、個々のUPI属性をその重要性重みを使用して順序付けることが(そして記憶することも)できる。このような実施形態では、既定のユーザUPIに対する要求は(重要性重みという点で)最も重要な属性だけを含む不完全なUPIを供給されることがある、あるいは十分な情報が取得されるまで、及び/又は追加の処理が望ましくない又は可能ではなくなるまで断片的に供給されてよい。したがって、例えば、UPI属性を使用して処理することは、その重要性重みの順序で行われてよい。これにより、(例えば、効率のために、何らかの待ち時間制約を満たし、処理が特定の期限内に完了されることを確実にするために等)処理を早期に終了することができる。
【0104】
新しいUPI属性が追加されるにつれ、既存の属性の重要性重みが変更される可能性がある。その結果、(例えば既定のユーザの)UPI属性の順序は重要性重み順序と異なる可能性がある。したがって、本発明は、それぞれの重要性重みを使用して(例えば、これに従って)UPI属性を周期的に順序付けし直すために使用されてよい。
【0105】
いくつかのケースでは、UPIの転送又は処理は、(例えば既定のユーザの)UPIが重要性重みを使用して(例えば、これに従って)順序付け直される前に概算の順序で実行されてよい。少なくともいくつかの例及び/又はいくつかの実施形態では、その順序で効率的に転送及び/又は処理されるこのような情報のそれぞれの重要性重みの順序で、UPI属性を物理的に記憶することが必要ではない可能性があることに留意されたい。実際に、少なくともいくつかの例及び/又はいくつかの実施形態では、重要性順序でUPI属性を転送する及び/又は処理することが必要ではない可能性がある。例えば、条件によっては、すべての情報は転送される、及び/又は処理されてよい。
【0106】
第4.4項 結論
前記開示から理解できるように、本発明はキーワード対象設定広告システムだけではなく、コンテンツ対象設定広告システムも改善するために使用できる。ユーザ、文書、広告及び/又は広告待ち受けページのユーザプロファイル情報は、受け入れることができる、及び/又は推測できる。
【特許請求の範囲】
【請求項1】
ユーザのためのユーザプロファイル情報を決定するための方法であって、
a)前記ユーザのための初期ユーザプロファイル情報を決定することと、
b)前記ユーザのためのユーザプロファイル情報を推測することと、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記ユーザのための前記ユーザプロファイル情報を決定することと、
を備える、方法。
【請求項2】
前記ユーザのための初期ユーザプロファイル情報を決定する前記行為は、前記ユーザにより提出される過去の検索クエリーを使用する、請求項1に記載の方法。
【請求項3】
前記ユーザのための初期ユーザプロファイル情報を決定する前記行為は、前記ユーザによる過去の文書選択を使用する、請求項1に記載の方法。
【請求項4】
前記ユーザのための初期ユーザプロファイル情報を決定する前記行為は、(i)前記ユーザによって提出された過去の検索クエリーと、(ii)前記ユーザによる過去の文書選択を使用する、請求項1に記載の方法。
【請求項5】
前記初期ユーザプロファイルは複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項1に記載の方法。
【請求項6】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項5に記載の方法。
【請求項7】
前記ユーザのためのユーザプロファイル情報を推測する前記行為は、
i)多くの文書と前記ユーザのそれぞれにノードを定義することと、
ii)グラフを定義するためにノード間に関連がある場合に、ノード間でエッジを追加することと、
iii)前記グラフのトポロジーを使用する前記ユーザのためのユーザプロファイル情報、及び他の文書のユーザプロファイル情報を推測することと、
を含む、請求項1に記載の方法。
【請求項8】
第1のノードに対応する文書が第2のノードに対応する前記ユーザからの検索クエリーに対して検索結果ページで返された場合に、前記第1のノードと前記第2のノードの間にエッジが加えられる、請求項7に記載の方法。
【請求項9】
第1のノードに対応する文書が第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項10】
第1のノードに対応する文書が第2のノードに対応する文書とリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項11】
第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことのあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項12】
第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされる1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項13】
前記グラフのトポロジーを使用して前記ユーザのためのユーザプロファイル情報を推測する前記行為は、
i)第1の積を生成するために、第1の値で前記ユーザの前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を加算することと、
を含む、請求項7に記載の方法。
【請求項14】
文書のユーザプロファイル情報を決定する方法であって、
a)前記文書のための初期ユーザプロファイル情報を決定することと、
b)前記文書のためのユーザプロファイル情報を推測することと、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記文書のための前記ユーザプロファイル情報を決定することと、
を備える、方法。
【請求項15】
前記文書のための初期ユーザプロファイル情報を決定する前記行為は、前記文書からのコンテンツ情報を使用する、請求項14に記載の方法。
【請求項16】
前記文書のための初期ユーザプロファイル情報を決定する前記行為は、文書メタ情報を使用する、請求項14に記載の方法。
【請求項17】
前記文書のための初期ユーザプロファイル情報を決定する前記行為は、(i)前記文書からのコンテンツ情報、及び(ii)文書メタ情報を使用する、請求項14に記載の方法。
【請求項18】
前記初期ユーザプロファイル情報は複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項14に記載の方法。
【請求項19】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項18に記載の方法。
【請求項20】
前記文書のためのユーザプロファイル情報を推測する前記行為は、
i)多くの文書のそれぞれに、及び多くのユーザのそれぞれにノードを定義することと、
ii)グラフを定義するために前記ノード間に関連がある場合に、ノード間にエッジを追加することと、
iii)前記グラフのトポロジーを使用する前記文書のためのユーザプロファイル情報、及びユーザの、及び他の文書のユーザプロファイル情報を推測することと、
を含む、請求項14に記載の方法。
【請求項21】
第1のノードに対応する文書が、第2のノードに対応する前記ユーザからの検索クエリーに対する検索結果ページに戻された場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項22】
第1のノードに対応する文書が、第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項23】
第1のノードに対応する文書が、第2のノードに対応する文書とリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項24】
第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことのあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項25】
第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされた1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項26】
前記グラフのトポロジーを使用して前記文書のためのユーザプロファイル情報を推測する前記行為が、
i)第1の積を生成するために、第1の値で前記文書の前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を加算することと、
を含む、請求項20に記載の方法。
【請求項27】
広告を採点するために使用される一致を決定するための方法であって、
a)前記広告の広告待ち受けページのユーザプロファイル情報と、前記広告の対象を設定するために使用されるユーザプロファイル情報の少なくとも1つ、及び(B)前記広告が表示されるユーザのユーザプロファイル情報を使用して、第1の一致値を求めることと、
b)(A)広告の広告待ち受けページのユーザプロファイル情報と、広告の対象を設定するために使用されるユーザプロファイル情報の少なくとも1つ、及び(B)前記広告が供給される文書のユーザプロファイル情報を使用して、第2の一致値を求めることと、
c)前記第1の一致値と前記第2の一致値を使用して、前記広告を採点するために使用される前記一致を決定することと、
を備える、方法。
【請求項28】
前記広告の前記広告待ち受けページの前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項29】
前記広告の対象設定に使用される前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項30】
前記ユーザの前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項31】
前記文書の前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項32】
前記ユーザプロファイル情報は、
−(A)地理的地域、(B)話題、(C)ユーザ年齢範囲、(D)言語を含む幅広い属性の集合から選択される、少なくとも1つの幅広い属性と、
−(A)単語と(B)句を含む狭い属性の集合から選択される少なくとも1つの狭い属性と、
を含む、請求項27に記載の方法。
【請求項33】
ユーザのためのユーザプロファイル情報を決定するための装置であって、
a)前記ユーザのための初期ユーザプロファイル情報を決定するための手段と、
b)前記ユーザのためのユーザプロファイル情報を推測するための手段と、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記ユーザの前記ユーザプロファイル情報を決定するための手段と、
を備える、装置。
【請求項34】
前記ユーザのための初期ユーザプロファイル情報を決定するための前記手段は、前記ユーザによって提出された過去の検索クエリーを使用する、請求項33に記載の装置。
【請求項35】
前記ユーザのための初期ユーザプロファイル情報を決定するための手段が、前記ユーザによる過去の文書選択を使用する、請求項33に記載の装置。
【請求項36】
前記ユーザのための初期ユーザプロファイル情報を決定するための前記手段は、(i)前記ユーザによって提出された過去の検索クエリーと、(ii)前記ユーザによる過去の文書選択とを使用する、請求項33に記載の装置。
【請求項37】
前記初期ユーザプロファイルは複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項33に記載の装置。
【請求項38】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項37に記載の装置。
【請求項39】
前記ユーザのためのユーザプロファイル情報を推測するための前記手段は、
i)多くの文書と前記ユーザのそれぞれにノードを定義することと、
ii)グラフを定義するために前記ノード間に関連がある場合に、ノード間にエッジを追加することと、
iii)前記グラフのトポロジーと他の文書のユーザプロファイル情報を使用する、前記ユーザのユーザプロファイル情報を推測することと、
のための手段を含む、請求項37に記載の装置。
【請求項40】
エッジを追加するための手段は、第1のノードに対応する文書が第2のノードに対応する前記ユーザからの検索クエリーに対して検索結果ページで返された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項41】
エッジを追加するための前記手段は、第1のノードに対応する文書が第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項42】
エッジを追加するための前記手段は、第1のノードに対応する文書が第2のノードに対応する文書とリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項43】
エッジを追加するための前記手段は、第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことがあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項44】
エッジを追加するための前記手段は、第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされる1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項45】
前記グラフのトポロジーを使用する、前記ユーザのためのユーザプロファイル情報を推測するための手段が、
i)第1の積を生成するために、第1の値で前記ユーザの前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を追加すること、
のための手段を含む、請求項39に記載の方法。
【請求項46】
文書のためのユーザプロファイル情報を決定するための装置であって、
a)前記文書のための初期ユーザプロファイル情報を決定するための手段と、
b)前記文書のためのユーザプロファイル情報を推測するための手段と、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記文書のためのユーザプロファイル情報を決定するための手段と、
を備える、装置。
【請求項47】
前記文書のための初期ユーザプロファイル情報を決定するための前記手段は、前記文書からコンテンツ情報を使用する、請求項46に記載の装置。
【請求項48】
前記文書のための初期ユーザプロファイル情報を決定するための前記手段は、文書メタ情報を使用する、請求項46に記載の装置。
【請求項49】
前記文書のための初期ユーザプロファイル情報を決定するための前記手段は、(i)前記文書からのコンテンツ情報と、(ii)文書メタ情報を使用する、請求項46に記載の装置。
【請求項50】
前記初期ユーザプロファイル情報は複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項46に記載の装置。
【請求項51】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項50に記載の装置。
【請求項52】
前記文書のためのユーザプロファイル情報を推測するための前記手段は、
i)多くの文書のそれぞれに対し、及び多くのユーザのそれぞれに対してノードを定義することと、
ii)グラフを定義するためにノード間に関連がある場合に、ノード間にエッジを追加することと、
iii)前記グラフのトポロジーと、ユーザ及び他の文書のユーザプロファイル情報を使用して、前記文書のためのユーザプロファイル情報を推測すること、
のための手段を含む、請求項46に記載の装置。
【請求項53】
エッジを追加するための前記手段は、第1のノードに対応する文書が、第2のノードに対応する前記ユーザからの検索クエリーに検索結果ページで返された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項54】
エッジを追加するための前記手段は、第1のノードに対応する文書が第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項55】
エッジを追加する前記手段は、第1のノードに対応する文書が第2のノードに対応する文書にリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項56】
エッジを追加する前記手段は、第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことのあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項57】
エッジを追加するための前記手段は、第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされた1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項58】
前記グラフのトポロジーを使用する前記文書のためのユーザプロファイル情報を推測する前記手段は、
i)第1の積を生成するために、第1の値で前記文書の前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を加算すること、
のための手段を含む、請求項52に記載の装置。
【請求項59】
広告を採点するために使用される一致を決定するための装置であって、
a)(A)前記広告の広告待ち受けページのユーザプロファイル情報と、前記ユーザの対象設定のために使用されるユーザプロファイル情報のうち少なくとも1つと、(B)前記広告が表示されるユーザのユーザプロファイル情報とを使用して、第1の一致値を求めるための手段と、
b)前記広告の広告待ち受けページのユーザプロファイル情報と、前記広告の対象設定のために使用されるユーザプロファイル情報の少なくとも1つと、(B)前記広告が供給される文書のユーザプロファイル情報を使用して、第2の一致値を求めるための手段と、
c)前記第1の一致値と前記第2の一致値を使用して広告を採点するために使用される前記一致を決定するための手段と、
を備える、装置。
【請求項60】
前記広告の前記広告待ち受けページの前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項61】
前記広告の対象設定のために使用される、前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項62】
前記ユーザのための前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項63】
前記文書の前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項64】
前記ユーザプロファイル情報は、
−(A)地理的地域、(B)話題、(C)ユーザ年齢範囲、(D)言語を含む幅広い属性の集合から選択される、少なくとも1つの幅広い属性と、
−(A)単語と(B)句を含む狭い属性の集合から選択される、少なくとも1つの狭い属性と、
を含む、請求項59に記載の方法。
【請求項1】
ユーザのためのユーザプロファイル情報を決定するための方法であって、
a)前記ユーザのための初期ユーザプロファイル情報を決定することと、
b)前記ユーザのためのユーザプロファイル情報を推測することと、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記ユーザのための前記ユーザプロファイル情報を決定することと、
を備える、方法。
【請求項2】
前記ユーザのための初期ユーザプロファイル情報を決定する前記行為は、前記ユーザにより提出される過去の検索クエリーを使用する、請求項1に記載の方法。
【請求項3】
前記ユーザのための初期ユーザプロファイル情報を決定する前記行為は、前記ユーザによる過去の文書選択を使用する、請求項1に記載の方法。
【請求項4】
前記ユーザのための初期ユーザプロファイル情報を決定する前記行為は、(i)前記ユーザによって提出された過去の検索クエリーと、(ii)前記ユーザによる過去の文書選択を使用する、請求項1に記載の方法。
【請求項5】
前記初期ユーザプロファイルは複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項1に記載の方法。
【請求項6】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項5に記載の方法。
【請求項7】
前記ユーザのためのユーザプロファイル情報を推測する前記行為は、
i)多くの文書と前記ユーザのそれぞれにノードを定義することと、
ii)グラフを定義するためにノード間に関連がある場合に、ノード間でエッジを追加することと、
iii)前記グラフのトポロジーを使用する前記ユーザのためのユーザプロファイル情報、及び他の文書のユーザプロファイル情報を推測することと、
を含む、請求項1に記載の方法。
【請求項8】
第1のノードに対応する文書が第2のノードに対応する前記ユーザからの検索クエリーに対して検索結果ページで返された場合に、前記第1のノードと前記第2のノードの間にエッジが加えられる、請求項7に記載の方法。
【請求項9】
第1のノードに対応する文書が第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項10】
第1のノードに対応する文書が第2のノードに対応する文書とリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項11】
第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことのあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項12】
第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされる1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項7に記載の方法。
【請求項13】
前記グラフのトポロジーを使用して前記ユーザのためのユーザプロファイル情報を推測する前記行為は、
i)第1の積を生成するために、第1の値で前記ユーザの前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を加算することと、
を含む、請求項7に記載の方法。
【請求項14】
文書のユーザプロファイル情報を決定する方法であって、
a)前記文書のための初期ユーザプロファイル情報を決定することと、
b)前記文書のためのユーザプロファイル情報を推測することと、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記文書のための前記ユーザプロファイル情報を決定することと、
を備える、方法。
【請求項15】
前記文書のための初期ユーザプロファイル情報を決定する前記行為は、前記文書からのコンテンツ情報を使用する、請求項14に記載の方法。
【請求項16】
前記文書のための初期ユーザプロファイル情報を決定する前記行為は、文書メタ情報を使用する、請求項14に記載の方法。
【請求項17】
前記文書のための初期ユーザプロファイル情報を決定する前記行為は、(i)前記文書からのコンテンツ情報、及び(ii)文書メタ情報を使用する、請求項14に記載の方法。
【請求項18】
前記初期ユーザプロファイル情報は複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項14に記載の方法。
【請求項19】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項18に記載の方法。
【請求項20】
前記文書のためのユーザプロファイル情報を推測する前記行為は、
i)多くの文書のそれぞれに、及び多くのユーザのそれぞれにノードを定義することと、
ii)グラフを定義するために前記ノード間に関連がある場合に、ノード間にエッジを追加することと、
iii)前記グラフのトポロジーを使用する前記文書のためのユーザプロファイル情報、及びユーザの、及び他の文書のユーザプロファイル情報を推測することと、
を含む、請求項14に記載の方法。
【請求項21】
第1のノードに対応する文書が、第2のノードに対応する前記ユーザからの検索クエリーに対する検索結果ページに戻された場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項22】
第1のノードに対応する文書が、第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項23】
第1のノードに対応する文書が、第2のノードに対応する文書とリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項24】
第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことのあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項25】
第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされた1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジが追加される、請求項20に記載の方法。
【請求項26】
前記グラフのトポロジーを使用して前記文書のためのユーザプロファイル情報を推測する前記行為が、
i)第1の積を生成するために、第1の値で前記文書の前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を加算することと、
を含む、請求項20に記載の方法。
【請求項27】
広告を採点するために使用される一致を決定するための方法であって、
a)前記広告の広告待ち受けページのユーザプロファイル情報と、前記広告の対象を設定するために使用されるユーザプロファイル情報の少なくとも1つ、及び(B)前記広告が表示されるユーザのユーザプロファイル情報を使用して、第1の一致値を求めることと、
b)(A)広告の広告待ち受けページのユーザプロファイル情報と、広告の対象を設定するために使用されるユーザプロファイル情報の少なくとも1つ、及び(B)前記広告が供給される文書のユーザプロファイル情報を使用して、第2の一致値を求めることと、
c)前記第1の一致値と前記第2の一致値を使用して、前記広告を採点するために使用される前記一致を決定することと、
を備える、方法。
【請求項28】
前記広告の前記広告待ち受けページの前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項29】
前記広告の対象設定に使用される前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項30】
前記ユーザの前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項31】
前記文書の前記ユーザプロファイル情報の少なくとも一部が推測された、請求項27に記載の方法。
【請求項32】
前記ユーザプロファイル情報は、
−(A)地理的地域、(B)話題、(C)ユーザ年齢範囲、(D)言語を含む幅広い属性の集合から選択される、少なくとも1つの幅広い属性と、
−(A)単語と(B)句を含む狭い属性の集合から選択される少なくとも1つの狭い属性と、
を含む、請求項27に記載の方法。
【請求項33】
ユーザのためのユーザプロファイル情報を決定するための装置であって、
a)前記ユーザのための初期ユーザプロファイル情報を決定するための手段と、
b)前記ユーザのためのユーザプロファイル情報を推測するための手段と、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記ユーザの前記ユーザプロファイル情報を決定するための手段と、
を備える、装置。
【請求項34】
前記ユーザのための初期ユーザプロファイル情報を決定するための前記手段は、前記ユーザによって提出された過去の検索クエリーを使用する、請求項33に記載の装置。
【請求項35】
前記ユーザのための初期ユーザプロファイル情報を決定するための手段が、前記ユーザによる過去の文書選択を使用する、請求項33に記載の装置。
【請求項36】
前記ユーザのための初期ユーザプロファイル情報を決定するための前記手段は、(i)前記ユーザによって提出された過去の検索クエリーと、(ii)前記ユーザによる過去の文書選択とを使用する、請求項33に記載の装置。
【請求項37】
前記初期ユーザプロファイルは複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項33に記載の装置。
【請求項38】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項37に記載の装置。
【請求項39】
前記ユーザのためのユーザプロファイル情報を推測するための前記手段は、
i)多くの文書と前記ユーザのそれぞれにノードを定義することと、
ii)グラフを定義するために前記ノード間に関連がある場合に、ノード間にエッジを追加することと、
iii)前記グラフのトポロジーと他の文書のユーザプロファイル情報を使用する、前記ユーザのユーザプロファイル情報を推測することと、
のための手段を含む、請求項37に記載の装置。
【請求項40】
エッジを追加するための手段は、第1のノードに対応する文書が第2のノードに対応する前記ユーザからの検索クエリーに対して検索結果ページで返された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項41】
エッジを追加するための前記手段は、第1のノードに対応する文書が第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項42】
エッジを追加するための前記手段は、第1のノードに対応する文書が第2のノードに対応する文書とリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項43】
エッジを追加するための前記手段は、第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことがあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項44】
エッジを追加するための前記手段は、第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされる1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項39に記載の装置。
【請求項45】
前記グラフのトポロジーを使用する、前記ユーザのためのユーザプロファイル情報を推測するための手段が、
i)第1の積を生成するために、第1の値で前記ユーザの前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を追加すること、
のための手段を含む、請求項39に記載の方法。
【請求項46】
文書のためのユーザプロファイル情報を決定するための装置であって、
a)前記文書のための初期ユーザプロファイル情報を決定するための手段と、
b)前記文書のためのユーザプロファイル情報を推測するための手段と、
c)前記初期ユーザプロファイル情報と前記推測されたユーザプロファイル情報の両方を使用して、前記文書のためのユーザプロファイル情報を決定するための手段と、
を備える、装置。
【請求項47】
前記文書のための初期ユーザプロファイル情報を決定するための前記手段は、前記文書からコンテンツ情報を使用する、請求項46に記載の装置。
【請求項48】
前記文書のための初期ユーザプロファイル情報を決定するための前記手段は、文書メタ情報を使用する、請求項46に記載の装置。
【請求項49】
前記文書のための初期ユーザプロファイル情報を決定するための前記手段は、(i)前記文書からのコンテンツ情報と、(ii)文書メタ情報を使用する、請求項46に記載の装置。
【請求項50】
前記初期ユーザプロファイル情報は複数の属性を含み、前記複数の属性のそれぞれが値及びスコアを有する、請求項46に記載の装置。
【請求項51】
前記スコアは、前記属性の前記値が正しい尤度を示す、請求項50に記載の装置。
【請求項52】
前記文書のためのユーザプロファイル情報を推測するための前記手段は、
i)多くの文書のそれぞれに対し、及び多くのユーザのそれぞれに対してノードを定義することと、
ii)グラフを定義するためにノード間に関連がある場合に、ノード間にエッジを追加することと、
iii)前記グラフのトポロジーと、ユーザ及び他の文書のユーザプロファイル情報を使用して、前記文書のためのユーザプロファイル情報を推測すること、
のための手段を含む、請求項46に記載の装置。
【請求項53】
エッジを追加するための前記手段は、第1のノードに対応する文書が、第2のノードに対応する前記ユーザからの検索クエリーに検索結果ページで返された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項54】
エッジを追加するための前記手段は、第1のノードに対応する文書が第2のノードに対応する前記ユーザによって選択された場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項55】
エッジを追加する前記手段は、第1のノードに対応する文書が第2のノードに対応する文書にリンクされる場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項56】
エッジを追加する前記手段は、第1のノードに対応する文書が、第2のノードに対応する別の文書にアクセスしたことのあるユーザの集合によってアクセスされた場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項57】
エッジを追加するための前記手段は、第1のノードに対応するユーザが、第2のノードに対応する別のユーザによってもアクセスされた1つ以上の文書の集合にアクセスした場合に、前記第1のノードと前記第2のノードの間にエッジを追加する、請求項52に記載の装置。
【請求項58】
前記グラフのトポロジーを使用する前記文書のためのユーザプロファイル情報を推測する前記手段は、
i)第1の積を生成するために、第1の値で前記文書の前記初期ユーザプロファイル情報を乗算することと、
ii)第2の積を生成するために、第2の値で近接するグラフノードのユーザプロファイル情報を乗算することと、
iii)前記第1の積と前記第2の積を加算すること、
のための手段を含む、請求項52に記載の装置。
【請求項59】
広告を採点するために使用される一致を決定するための装置であって、
a)(A)前記広告の広告待ち受けページのユーザプロファイル情報と、前記ユーザの対象設定のために使用されるユーザプロファイル情報のうち少なくとも1つと、(B)前記広告が表示されるユーザのユーザプロファイル情報とを使用して、第1の一致値を求めるための手段と、
b)前記広告の広告待ち受けページのユーザプロファイル情報と、前記広告の対象設定のために使用されるユーザプロファイル情報の少なくとも1つと、(B)前記広告が供給される文書のユーザプロファイル情報を使用して、第2の一致値を求めるための手段と、
c)前記第1の一致値と前記第2の一致値を使用して広告を採点するために使用される前記一致を決定するための手段と、
を備える、装置。
【請求項60】
前記広告の前記広告待ち受けページの前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項61】
前記広告の対象設定のために使用される、前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項62】
前記ユーザのための前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項63】
前記文書の前記ユーザプロファイル情報の少なくとも一部が推測された、請求項59に記載の装置。
【請求項64】
前記ユーザプロファイル情報は、
−(A)地理的地域、(B)話題、(C)ユーザ年齢範囲、(D)言語を含む幅広い属性の集合から選択される、少なくとも1つの幅広い属性と、
−(A)単語と(B)句を含む狭い属性の集合から選択される、少なくとも1つの狭い属性と、
を含む、請求項59に記載の方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2010−176675(P2010−176675A)
【公開日】平成22年8月12日(2010.8.12)
【国際特許分類】
【外国語出願】
【出願番号】特願2010−18774(P2010−18774)
【出願日】平成22年1月29日(2010.1.29)
【分割の表示】特願2006−547257(P2006−547257)の分割
【原出願日】平成16年12月21日(2004.12.21)
【出願人】(502208397)グーグル インコーポレイテッド (161)
【Fターム(参考)】
【公開日】平成22年8月12日(2010.8.12)
【国際特許分類】
【出願番号】特願2010−18774(P2010−18774)
【出願日】平成22年1月29日(2010.1.29)
【分割の表示】特願2006−547257(P2006−547257)の分割
【原出願日】平成16年12月21日(2004.12.21)
【出願人】(502208397)グーグル インコーポレイテッド (161)
【Fターム(参考)】
[ Back to top ]