从所观察的用户行为估计广告质量的制作方法

文档序号:6570601阅读:153来源:国知局
专利名称:从所观察的用户行为估计广告质量的制作方法
技术领域
在此所描述的实现一般涉及在线广告,更具体地,涉及使用所观 察的用户行为来估计在线广告的质量。
背景技术
在线广告系统托管(host)可以对各种服务和/或产品做广告的广 告。这样的广告可以被呈现给访问由广告系统所托管的文档的用户。 广告可以包括"创意(creative)",其包括与被广告的服务和/或产品 相关的文本、图形和/或图像。该广告还可以包括连至包含关于被广告 服务和或产品的细节的广告"定着(landing)文档"的链接。当特定 创意引起用户的兴趣时,该用户可以选择(或点击)该创意,并且该 相关链接使得用户的网页浏览器访问与该创意以及链接相关联的"定 着文档"。在下文中,将用户对广告创意以及相关链接的选择称为"点 击"。
在线广告系统通常为了记帐以及其他目的而跟踪广告点击。跟踪 广告点击的一个非计帐目的是试图确定广告质量。该点进率(CRT)是 用于确定广告质量的度量。CRT表示当将广告创意呈现给用户时该给 定的广告获得"被点击"的次数的分数。但是,广告的CRT是对广告 质量的有缺陷的度量,因为它只关注于广告创意而不是广告对象,即 定着文档。为了确定广告是好还是坏,用户需要点击广告,因此发生/ 不发生点击不足以确定广告的质量。 一些广告由于它们具有很好的创 意而接收到许多点击,但是定着文档对于用户来说却是完全无法令人 满意的或者不相关的。其他广告接收到非常少的点击(例如,由于该 广告创意差),但是每个点击都让用户满意。因而,现有的确定与在 线广告相关的CRT提供了对广告质量的有缺陷的度量。

发明内容
根据一个方面, 一种方法可包括获得与由一个或多个服务器所托 管的第一组广告相关联的评级(rating),其中所述评级指示所述第一 组广告的质量。所述方法可进一步包括观察与所述第一组广告中的广 告的用户选择相关联的多个不同的第一用户动作,并且使用所观察的 第一用户动作和所获得的评级推导统计模型。所述方法还可包括观察 与由所述一个或多个服务器所托管的第二广告的用户选择相关联的第 二用户动作,并且使用所述统计模型和所述第二用户动作来估计所述 第二广告的质量。
根据另一方面, 一种方法可包括观察与由服务器所托管的第一广 告的用户选择相关联的第一用户行为,其中所观察的第一用户行为包 括不同于点进率(CTR)或除点进率之外的用户行为,所述方法可进一 步包括基于所观察的第一用户行为来估计所述第一广告的质量。
根据再一方面, 一种方法可包括观察与由一个或多个服务器所托 管的第一广告的用户选择相关联的多个可测量的用户动作,并且利用 所述多个可测量的用户动作中的特定用户动作使得与所述第一广告相 关联的已知的质量相互关联。所述方法可进一步包括观察与第二广告 的用户选择相关联的多个可测量的用户动作中的特定用户动作的出 现,并且基于所述多个可测量的用户动作中的特定用户动作的出现来 估计所述第二广告的质量。
根据其它方面, 一种方法可包括记录(logging)与一组广告的用 户选择相关联的用户动作,其中该组广告与质量评级相关联,并且其 中所述用户动作包括不同于点进率(CTR)或除点进率之外的用户动作。
所述方法可进一步包括使用所记录的用户动作和所述质量评级生成统 计模型,并且使用所述统计模型来估计不包括于该组广告中的广告的 质量。


合并于本说明书并构成本说明书一部分的附图示出了本发明的一 个或多个实施例,并且与文字描述一起用于解释本发明。在附图中,
图1是实现的总体示例图,在该实现中,使用所观测的用户行为 和与一组广告相关联的已知的质量等级来构建可被用于估计广告质量 的统计模型;
图2是网络的示例图,在该网络中可以实现符合本发明原理的系 统和方法;
图3是依照符合本发明原理的实现的图2的客户端或服务器的示
例图4是依照符合本发明原理的实现的用于构建与对多个在线广告 的选择相关联的用户行为模型的示范性过程的流程图5-12示出了相应于所观测的用户动作的各种示范性会话特征,
它们可被用于构建用于估计广告质量的统计模型;
图13是依照符合本发明原理的实现的用于估计用户所选择的广告
的质量的示范性过程的流程图;以及
图14是用图形示出了符合本发明的一个方面的图13的示范性过 程的图。
具体实施例方式
下面参照附图来对本发明进行详细说明。在不同的附图中,相同 的参考数字可以表示相同或类似的元件。而且,下面的详细说明不限 制本发明。
与本发明的各方面一致的系统和方法可以使用与在线广告的用户 选择相关联的用户行为的多个观察(例如,实时观察或者来自记录用 户的日志的观察),以与传统的仅基于CTR的确定相比更准确地估计 广告质量。可以使用与已知评级(rated)的广告相关联的质量评级、 以及与这些已知评级的广告的选择(例如,"点击")相关联的相应
的所测量的观测到的用户行为来构造统计模型。随后,可以使用该统 计模型来根据与对未评级广告的选择相关联的所观测的用户行为来估 计与该未评级广告相关联的质量。因而,给定了对于与对广告的选择 相关联的用户行为的一组观察,该统计模型可以估计用户对所选择的 广告满意的可能性。
如在此所使用的术语"文档"应被广泛地解释为包括任何机器可 读以及机器可存储的工作成果。文档可以包括例如电子邮件、网页或 网站、企业收录、文件、文件的组合、嵌有到其他文件的的链接的一 个或多个文件、新闻组贴子、博客、在线广告等。文档通常包括文本 信息,并且可以包括嵌入式信息(例如元信息、图像、超链接等)禾口/
或嵌入式指令(例如Javascript等)。如在此所使用的术语"链接"应 被广泛地解释为包括从/到一个文档到/从另一个文档或者该相同文档 另一部分的任意指涉。
概述
图1示出了实现的示范性概要图,在该实现中,使用所观测的用 户行为来估计在线广告的质量。如图1所示,多个评级的广告100-1 至100-N (在此共同地称作广告100)中的每一个可以与相应的文档 105-1至105-N (在此共同地称作文档105)相关联。除了评级的广告 100外,每个文档105可以包括一组搜索结果(该结果是基于用户提供 的搜索查询而由搜索引擎执行搜索获得的),并且还可以包括一个或 多个广告。每个广告IOO可以与评级数据120相关联,该评级数据120 是由已对每个评级的广告100的质量进行了评级的评级人提供的。每 个文档105可以由网络中的服务器托管,并且当用户访问每个文档105 时,可以自动地将相关联的广告IOO提供给用户(例如,弹出广告), 或可以将广告IOO包括在所访问的文档105中。每个广告100可以对 各种产品或服务做广告。
响应于广告100的接收,接收用户可以基于广告上显示的"创意"
来选择110广告(例如,使用鼠标在显示的广告上进行"点击")。 在广告选择110之后,使用嵌入在广告100中的链接通过托管该广告
的服务器将广告定着文档115提供给选择用户。该广告定着文档115 可以提供在相应广告100中做广告的产品和/或服务的细节。
在用户进行每个广告选择110之前、期间和/或之后,可以实时测 量在"会话"期间与每个广告选择110相关联的会话特征125或者将 其记录在存储器中。会话可以包括在长于一个特定时间段内无中断地 发生的一组用户动作(例如,在长于三小时的时间段内无中断地发生 的一组用户动作)。
所测量的会话特征125可以包括任何类型的所观察的用户行为或 动作。例如,会话特征125可以包括广告选择110的持续时间(例如, 在广告100上"点击"的持续时间)、在给定的广告选择之前和/或之 后其他广告的选择的数量、在给定的广告选择之前和/或之后搜索结果 的选择的数量、在给定的广告选择之前和/或之后对其他类型结果(例 如,图像、新闻、产品等)的选择的数量、在给定的广告选择之前和/ 或之后文档阅览(例如,页面阅览)的数量(例如,在广告选择之前 和/或之后搜索结果的页面阅览)、在给定的广告选择之前和/或之后搜 索査询的数量、与用户会话相关联的显示广告的查询的数量、对同一 给定广告进行重复选择的数量或者给定的广告选择是否为会话中的最 后选择、会话中的最后广告选择、对于给定的搜索査询的最后选择或 对于给定的搜索査询的最后广告选择的指示。与本发明的各方面一致, 可以使用上面没有描述的其他类型的与广告选择相关联的所观察的用 户行为。
利用与相应评级的广告100的每个广告选择100相关联的所测量 的会话特征125以及广告评级数据120,可以构造统计模型130 (如下 面进一步描述的)。该统计模型可以包括利用现有的统计技术推导的 概率模型。这样的技术可以包括例如逻辑回归(logistic regression)、
回归树、提级的枝端(boosted stumps)或者任何其他现有的统计建模 技术。统计模型130可以确定给定的广告100是与广告100的用户选 择相关联的好的或坏的给定所测会话特征的可能性(例如,P(good ad|ad selection) =/g (session feaures))。
在构建统计模型130之后,可以估计由用户选择的未评级广告的 广告质量。与文档140相关联的未评级广告135可以由网络中的服务 器托管,并且可以将其提供给访问用户。与未评级广告135的用户选 择145相关联的会话特征155可以被测量,并且该测量可以被提供为 统计模型130的输入。给定所测量的会话特征,统计模型130可以确 定未评级广告135是好广告的可能性,并且可以生成未评级广告135 的估计质量160。未评级广告135的估计质量160可以用于各种目的, 诸如对多个广告彼此进行排名、确定呈现或提升(例如不同地改变在 给定文档上的广告放置)哪些广告等。
示范性网络结构
图2是其中可以实现与本发明的原理一致的系统和方法的网络 200的示范图。网络200可以包括经由网络240连接到一个或多个服务 器220-230的多个客户端210。为了简便起见,示出了两个客户端210 以及两个服务器220-230连接到网络240。实际上,可以有更多或更少 的客户端和服务器。而且,在一些实例中,客户端可以执行服务器的 某些功能,并且服务器可以执行客户端的某些功能。
客户端210可以包括客户端实体。实体可以被定义为装置,诸如 个人计算机、无线电话、个人数字助理(PDA)、膝上型电脑、或者 另一类型的计算或通信装置、在这些装置之一上运行的线程或进程、 和/或者可以由这些装置之一执行的对象。 一个或多个用户可以与每个 客户端210相关联。服务器220和230可以包括以与本发明的原理一
致的方式来访问、取得、聚合、处理、搜索和/或保持文档的服务器实 体。客户端210和服务器220及230可以经由有线、无线、和/或光连
接来连接到网络240。
在与本发明的原理一致的实现中,服务器220可以包括搜索引擎 系统225,其可由客户端210的用户使用。服务器220可以通过抓取文 档集(例如,Web文档)对该文档进行索引以及将与该文档相关联的 信息存储文档库中来实现数据聚合服务。也可以以其他方式来实现该 数据聚合服务,诸如与数据服务器230的操作者协定以经由数据聚合 服务来分发它们所托管的文档。在一些实现中,服务器220可以托管 可以被提供给在客户端210的用户的广告(例如,创意、广告定着文 档)。搜索引擎系统225可以执行从在客户端210的用户接收的对存 储在文档库中的文档集的查询,并且可以将与所执行的查询相关的一 组搜索结果提供给该用户。除了该组搜索结果以外,服务器220还可 以将与所执行的搜索的结果相关联的一个或多个广告创意提供给在客 户端210的用户。
服务器230可以存储或保持可以是由服务器220所抓取的文档。 这样的文档可以包括与出版的新闻故事、产品、图像、用户组、地理 区域相关的数据或者任何其他类型的数据。例如,服务器230可以存 储或保持来自任何类型的新闻资源(诸如例如华盛顿邮报、纽约泰晤 士报、泰晤士杂质或者新闻周刊的新闻故事)。作为另一例子,服务 器230可以存储或保持与特定产品相关的数据,诸如由一个或多个产 品制造商提供的产品数据。作为还一个例子,服务器230可以存储或 保持与其他类型的Web文档(例如网站的页面)的数据。服务器230 还可以托管广告,诸如广告创意以及广告定着文档。
网络240可以包括任何类型的一个或多个网络,包括局域网 (LAN)、广域网(WAN)、城域网(MAN)、诸如公共开关电话网 络(PSTN)或公共陆地移动网络(PLMN)的电话网、内联网、因特 网、存储器装置或者网络的组合。该PLMN可以进一步包括分组交换 子网,诸如例如通用分组无线服务(GPRS)、蜂窝数字分组数据(CDPD)
或移动IP子网。
虽然服务器220-230被示为单独的实体,但是也可能是服务器 220-230中的一个执行该服务器220-230中的另一个的一个或多个功 能。例如,可以将服务器220和230实现为单个服务器。也可以将服 务器220和230中的单个服务器实现为两个或更多个单独(可能分布 式的)的装置。
示范性客户端/服务器体系结构
图3是根据与本发明的原理一致的实现的客户端或服务器实体(下 文中称为"客户端/服务器实体")(客户端或服务器实体可以对应于 一个或多个客户端210和/或服务器220-230)的示范图。该客户端/服 务器实体可以包括总线310、处理器320、主存储器330、只读存储器 (ROM) 340、存储装置350、输入装置360、输出装置370以及通信 接口 380。总线310可以包括允许在客户端/服务器实体的元件之间进 行通信的路径。
处理器320可以包括常规处理器、微处理器、或者可以解释和执 行指令的处理逻辑。主存储器330可以包括随机存取存储器(RAM) 或者另一个类型的动态存储装置,其可以存储信息以及由处理器320 执行的指令。ROM 340可以包括常规ROM装置以及另一种类型的静 态存储装置,其可以存储静态信息以及供处理器320所使用的指令。 存储装置350可以包括磁和/或光记录介质及其相应驱动。
输入装置360可以包括用于允许操作者将信息输入到客户端/服务 器实体的常规机构,诸如键盘、鼠标、笔、语音识别和/或生物机制等。 输出装置370可以包括用于将信息输出给操作者的常规机构,包括显 示器、打印机、扬声器等。通信接口 380可以包括任何类似于收发器 的机构,其使得该客户端/服务器实体能够与其他装置和/或系统进行通 信。例如,通信接口 380可以包括用于经由诸如网络240的网络与另
一个装置或系统进行通信的机构。
与本发明的原理一致的客户端/服务器实体可以执行某些操作或 进程,如将在下面将详细描述的。该客户端/服务器实体可以响应于处
理器320执行包含在诸如存储器330的计算机可读介质中的软件指令
而执行这些操作。计算机可读介质可以被定义为物理或逻辑存储器装 置和/或载波。
可以从例如数据存储装置350的另一计算机可读介质,或者经由 通信接口 380从另一装置,将软件指令读入到存储器330中。包含在 存储器330中的软件指令可以使处理器320执行随后将详细描述的操 作或处理。替代地,可以用硬线电路来替换软件指令或者与软件指令 组合来实现与本发明的原理一致的处理。因而,与本发明的原理一致 的实现不限于硬件电路和软件的任意特定组合。
用于构造与广告选择相关联的用户行为的统计模型的示范性过程 图4是用于构造与多个在线广告的选择相关联的用户行为的统计 模型的示范性过程的流程图。本领域技术人员可以理解的是,图4中 所示范的过程可以适当地以软件实现并被存储在计算机可读存储器 中,诸如主存储器330、 ROM 340或者服务器220、 230或客户端210 的存储装置350。
该示范性过程可以以获得与评级的广告相关联的评级数据开始 (框400)。该评级数据可以包括对每个评级的广告的质量进行评级(例 如,相对于所发出的查询)的人工生成数据。然后,可以获得与所评 级的广告的每个选择相关联的会话特征(框410)。可以通过在给定的 用户会话期间观察实际的用户行为来实时地获得会话特征(其在将每 个广告闪现(impression)显示给用户之前、期间以及之后发生),或 者可以在将每个广告闪现显示给用户之前、期间以及之后从存储在数 据库中的会话特征(即,用户行为和动作)的记录日志中获得。所获 得的会话特征125可以包括任何类型的观察的用户行为。每个会话特 征125可以对应于用户对于给定广告的满意度的间接测量。会话特征
125中的某些会话特征可以是确定不同用户对于会话特征125中的其他 会话特征如何具有不同值的因素(例如,具有拨号连接的用户可以比 具有高速因特网连接的用户具有更长的广告选择持续时间)。
会话特征125可以包括,但不限于,广告选择的持续时间(例如, 在广告上"点击"的持续时间)、在给定的广告选择之前和/或之后的 其他广告的选择的数量、在给定的广告选择之前和/或之后的搜索结果 的选择的数量、在给定的广告选择之前和/或之后的其他结果的选择的 数量、在给定的广告选择之前和/或之后的文档浏览(例如,页面浏览) 的数量、在给定的广告选择之前和/或之后的搜索査询的数量、与用户 会话相关联的显示广告的搜索査询的数量、对相同同一给定广告的重 复选择的数量或者给定的广告选择是否是会话中的最后选择、会话中 的最后广告选择、对于给定搜索査询的最后选择或者对于给定搜索査 询的最后广告选择的表示。图5-12在下面描述了与本发明的各方面一 致的可以作为会话特征而被测量的各种示范性类型的用户行为。
图5示出了广告选择的持续时间的测量作为会话特征500。如图5 中所示,可以将与文档510相关联的广告505提供给用户。响应于接 收到广告505,该用户可以选择515广告505,并且可以将该广告定着 文档520提供给用户。可以测量广告选择的持续时间525 (例如,从选 择广告的时间直到下一用户动作的时间段)作为会话特征500。
图6示出了在具体广告选择之前和/或之后的对其他广告选择的数 量的测量作为会话特征600。给定了广告N610的具体选择605,以及 响应于该广告选择605而提供广告定着文档615,则可以测量与提供以 前广告定着文档630对应的广告N-x 625中的一个或多个以前广告选择 620的数量。另外,或者作为选择,给定了广告N610的具体选择605, 可以测量与提供下一广告定着文档645对应的广告N+x 640中的一个
或多个下一广告选择635的数量。可以测量在具体的广告选择之前和/
或之后的其他广告选择的数量,作为会话特征600。
图7示出了在具体的广告选择之前和/或之后的对搜索结果选择的 数量的测量作为会话特征700。给定了广告N710的具体选择705,以 及响应于该广告选择705而提供广告定着文件715,可以测量在该广告 选择705之前用户浏览的搜索结果文档720的数量作为会话特征700。 可以使用用户发出的搜索査询基于搜索的执行来将搜索结果文档提供 给用户。另外,或者作为选择,可以测量在广告选择705之后由该用 户浏览的搜索结果文档725的数量作为会话特征700。
图8示出了在具体的广告选择之前和/或之后的对用户浏览的文档 的数量的测量作为会话特征800。给定了广告810的具体选择805,并 且响应于该广告选择805而提供广告定着文档815,可以测量在广告选 择805之前用户浏览的文档820 (例如,页面浏览)的数量作为会话特 征800。另外,或者作为选择,可以测量在广告选择805之后用户浏览 的文档825 (例如,页面浏览)的数量作为会话特征800。
图9示出了在具体广告选择之前和/或之后的对用户发出的搜索査 询的数量的测量作为会话特征900。给定了广告910的具体选择905, 并且响应于该广告选择905而提供广告定着文档915,可以测量在广告 选择905之前用户发出的搜索査询920的数量作为会话特征900。另外, 或者作为选择,可以测量在广告选择905之后用户发出的搜索査询925 的数量作为会话特征900。
图IO示出了在包括具体广告选择的会话中的对搜索査询(其导致 了对广告进行显示)的数量的测量作为会话特征1000。给定了包括预 定广告选择的会话,可以测量搜索査询1005的数量,其导致对相应广 告1010-1至1010-N进行显示。可以测量搜索査询的数量作为会话特征 1000。导致对广告进行显示的搜索査询1005的数量可以表示给定用户
会话的商业性质。
图ll示出了用户对相同广告的重复选择的数量的测量作为会话特
征1100。如图11中所示,可以将可以与多个文档1110-1至1110-N相 关联的广告1105提供给用户一次或者多次。响应于每次接收到广告 1105,用户可以选择1115广告1105,并且可以对于每次重复的用户选 择将广告定着文档1120提供给用户。可以测量用户对相同广告的重复 选择的数量作为会话特征1100。
图12示出了确定广告选择是否是对于给定的搜索査询的最后广告 选择,或者该广告选择是否是对于用户会话的最后广告选择,作为会 话特征1200。如图12中所示,用户可以在给定的会话1210期间发出 搜索查询1205,并且可以在发出搜索查询1205之后将一个或多个广告 1215提供给用户。响应于每次接收到广告1215,用户可以选择1220 广告1215,并且可以将广告定着文档1225提供给用户。可以做出该广 告选择1220是否是对于搜索查询1205的最后广告选择的确定。因而, 如果发出搜索査询1205的用户选择了多个广告,则可以识别对于搜索 査询1205的仅仅最后广告选择。还可以做出该广告选择1220是否是 对于会话1210的最后广告选择的确定。因此,如果在给定的会话期间 用户已经做出多个广告选择,则可以识别对于该会话的仅仅最后广告 选择。
在图5-12中未示出的其他类型的用户行为也可以被用作与本发明 的原理一致的会话特征。下面列出了其他示范性会话特征的多个例子
1) 代替广告选择持续时间,可以将给定的广告选择持续时间相对 于用于给定用户的平均广告选择持续时间的比值用作会话特征。给定 用户可以读取得比其他用户快,因而可以在给定的广告上停留与其他 用户不同的时间量。
2) 给定的广告选择持续时间相对于平均广告选择持续时间的比值 允许识别特定用户在哪些广告上停留得比正常时间长;
3) 给定的广告选择持续时间相对于用户的所有选择(例如,搜索 结果选择或者广告选择)的比值。
4) 用户在给定的会话中选择给定广告的次数。用户可以访问给定 的广告、发现它有趣、继续访问其它广告和/或搜索结果、然后因为给 定的广告最有趣而返回该给定的广告。
5) 从广告结果选择直到用户发出另一搜索査询的持续时间。持续 时间越短,用户对由选择所得到的广告结果不满意的可能性越大(即, 用户感觉需要马上改进査询)。
6) 从给定的广告结果选择直到用户发出另一搜索査询为止的时间 相对于从广告结果选择直到用户发出另一搜索査询为止的所有其他时 间的比值。
7) 对于给定的广告结果选择,花费在浏览搜索査询的其他结果而 不是在给定的广告结果上的时间。该会话特征提供了结果对于该査询 有多么全面的表示。
8) 给定的广告选择持续时间相对于所有其它广告选择持续时间的
比值。如果相对于在其它广告上平均花费的时间,用户在给定广告上 花费了更长时间,则该用户可能对该广告更满意。
9) 在给定的搜索结果或广告选择之前在给定会话中发生多少搜索
(即唯一发出的搜索査询)。
10) 在给定的搜索结果或广告选择之后在给定会话中发生多少搜
索。在给定查询之后的搜索越多,用户对给定选择的结果满意的可能 性越低。
11) 除了搜索,在该选择之后对于给定的搜索査询发生多少搜索 结果页面浏览。这可以在查询内(即,仅仅对于唯一査询)或对于整 个会话进行计算。
12) 除了搜索,在该选择之后对于给定的搜索查询发生了多少结 果页面浏览。这能够在查询中进行计算(即,仅对于唯一査询而言), 或者对整个会话进行计算。在选择之后有较多页面浏览可表示不满意。
13) 在该会话中发生的页面浏览的总数;
14) 在会话中的显示广告的页面浏览的数量。这给出了所述会话
的商业性方面的一些认识。会话越具商业性,用户将更可能对结果满 超、;
15) 在会话中的显示广告的页面浏览的数量相对于该会话中发生 的页面浏览的总数的比值。高比值表示用户所提交的查询是高度商业 性的;
16) 在会话中显示的广告闪现的总数。这是该会话的商业性的另 一个度量;
17) 每个显示广告的查询所显示的广告的平均数,该会话的商业 性的另一个度量;
18) 查询扫描时间一一从用户看到查询结果到用户做其他事情(点 击广告、搜索结果、下一页面、新查询等)时用多长时间。该时间长 度可表示页面整体有多好一一越长,则页面越不好(用户必须阅读页 面的更多内容来找到值得点击的事物);
19) 在给定查询扫描时间与所有其他査询扫描时间之间的比值;
20) 在给定搜索中发生的选择(例如,点击)的总数。这些选择 包括所有类型的选择(例如,搜索、onebox、广告),而不是仅仅广告 选择;
21) 在给定的广告选择之前在搜索中发生的选择的总数;
22) 在给定的广告选择之后在搜索中发生的选择的总数;
23) 在搜索中发生的广告选择的总数。可能需要用页面上的广告 数量来规范化;
24) 在给定的广告选择之前在搜索中发生的广告选择的总数;
25) 在给定的广告选择之后在搜索中发生的广告选择的总数;
26) 在搜索中发生的、其在文档上的广告位置位于文档上的给定 广告位置之上的广告选择的总数;
27) 在搜索中发生的、其在文档上的广告位置位于文档上的给定 广告位置之下的广告选择的总数;
28) 在搜索中发生的不是对给定广告的广告选择的总数;
29) 在搜索中发生的搜索结果选择的总数
30) 在给定的广告选择之前在搜索中发生的搜索选择的总数;
31) 在给定的广告选择之后在搜索中发生的搜索结果选择的总数;
32) 在会话中发生的长持续时间的搜索结果选择的总数;
33) 在会话中发生的短持续时间的搜索结果选择的总数;
34) 在会话中最后发生的搜索结果选择的总数。给定用户可以通 过点击搜索结果来结束会话,而不需要后续动作,或者用户可以以其 他方式(例如,广告结果点击、发出查询以及不点击等)来结束会话;
35) 在搜索中发生的非搜索结果以及非广告选择的总数;
36) 是否存在来自该广告选择的转换的表示;
37) 用户的连接速度的表示(例如,拨号、线缆、DSL);
38) 用户位于哪个国家的表示。不同的文化有可能导致用户对相 同的广告有不同反应,或者具有不同文化反应,或者不同地停在网站 上;
39) 用户位于世界上的那个区域(例如,APAC二z亚太区)的表
示;
40) 对于给定广告的关键字是否与搜索查询精确匹配(即,具有 与査询完全相同的术语),或者是否缺失一个词、多于一个词、或者 具有重写术语。通常,广告的质量可能变化(匹配越精确,质量越高), 并且关键字匹配可能是分割广告的合理方式,并且预测广告对于不同
的匹配类型来说分别是好还是坏;
41) 对于给定广告的估计点进率(CTR)的表示;
42) 广告商为给定的广告选择支付多少每次点击成本(CPC) 广告很好的可能性可以取决于广告商支付了多少(越多质量越高);
43) 广告商愿意支付多少CPC 在广告拍卖中,可以使用广告商 出价来设置广告排名,并且排名低于给定广告/广告商的广告/广告商设 置实际上将由下一个较高排名的广告/广告商支付的价格;
44) 有效CPC巧页测的CTR;或者
45) 出价CPC"页观U的CTR。
上面描述了可以用于统计模型的会话特征的多个例子。但是,本 领域技术人员应认识到可以使用其他的会话特征,作为选择,或者
与任意上述会话特征结合。
返回至图4,然后可以推导出统计模型,用于确定每个所选广告是 给定与广告选择相关联的所测会话特征的好质量广告的概率(框420)。 可以使用现有的统计技术(例如逻辑回归)来推导出与本发明的原理
相一致的统计模型。回归包括发现用于将结果变量(因变量y)与一个
或多个预测器(自变量Xi, x2,等)相关的函数。简单的线性回归假设 如下形式的函数
等式(1)
并且发现Co, Cl, C2等的值(Co被称为"截距"或"常数项")。 在本发明的上下文中,每个预测器变量&, X2, X3等对应于广告选择期 间测得的不同会话特征。逻辑回归是普通回归的变形,当观测到的结 果限定为两个值时是很有用的,其通常表示某个结果事件的发生或未 发生,(通常分别被编码为1或0),诸如在本发明的上下文中的好广 告或差广告。
逻辑回归产生作为独立预测变量的函数对发生的概率进行预测的 公式。逻辑回归通过采取线性回归(上述等式(1))(其将生成位于
正无穷大与负无穷大之间的任意y值)并用下面的函数对其进行变换
来符合特定S形曲线
/^exp(力/(l + exp(力) 等式(2)
其中产生位于O(当y达到负无穷大时)和1(当y达到正无穷大 时)之间的P值。将等式(1)代入等式(2),这样,好广告的概率 变为如下
1 + e(CgO +Cgl *X1 +Cg2 *X2十…)
等式3
其中Cg。为等式的常数,Cgn为会话特征预测变量Xn的系数。类似 地,可以通过下面的等式(4)来确定差广告的概率<formula>formula see original document page 24</formula>等式4
其中CbO为等式的常数,Cbn为会话特征预测变量Xn的系数。
可以测试统计模型的符合(fit),以确定哪个会话特征与好或差 质量广告相关。如果使用逻辑回归技术来确定统计模型,则该逻辑回 归的目的是要通过使用最节俭的模型来正确预测各个情况的结果。为
了实现这一目的,创建一个模型,其中包括在预测因变量y的结果时
有用的所有预测器变量(例如会话特征)。为了构建统计模型,逻辑 回归可以在每个系数(Cn)被增加或删除后测试模型的符合,被称为逐 步回归。例如,可以使用反向逐步回归,其中模型构造从完整或饱和 模型开始,并且在迭代过程中从模型中消除预测器变量以及它们的系 数。在消除每个变量之后测试该模型的符合,以确保该模型仍旧足够 与数据符合。当无法再从模型中消除预测器变量时,该模型的构造就 完成了。留在模型中的预测器变量(每一个对应于所测的会话特征) 识别与好或差广告相关的会话特征。因而,逻辑回归能够提供不同预 测器变量之间的关系和强度的了解。为了了解从模型包括或消除的重 要性而测试系数以及它们相应的预测器变量的过程可以包括几个不同
的已知技术。这样的技术可以包括Wald测试,相似性比率测试或者 Hosmer-Lemshow Goodness of Fit测试。这些系数测试技术在本领域内 是已知的,并且这里将不再进一步描述。在其他实现中,可以使用现 有的交叉确认和单独训练技术,来代替如上所述的分类估计以及测试 回归系数的技术。
代替或除了逻辑回归,可以使用其他现有的统计技术来推导与本 发明的原理相一致的统计模型。例如,使用"提级"技术的"枝端" 模型可以被用来推导统计模型。本领域技术人员可以认识到的是,"提 级"是一种机器学习技术,用于通过连续地改进其他弱的统计模型来
建立统计模型。其基本思想是向整个训练数据集合重复地应用相同的 算法,但是在每个阶段对训练数据进行不同地加权。该加权使得通过 阶段k与模型很好符合的情况在阶段k+l接收相对小的权重,而通过 阶段k与模型不太符合的情况在阶段k+l接收相对大的权重。
枝端是在每个阶段都能够应用的弱统计模型。枝端是2叶分类树, 其由根节点和二进制规则构成,其将情况分为两个相互排斥的子集
(即,叶节点)。规则可以釆取形式"点击持续时间(ClickDuration) < 120秒",并且点击持续时间满足该规则的所有情况进入一个叶节点, 而不满足该规则的情况进入另一个叶节点。另一规则可以采取形式"广 告选择是最后广告选择",并且广告选择满足该规则的所有情况进入 一个叶节点,而不满足该规则的情况进入另一个叶节点。
可以使用各种算法来符合"提级的枝端"模型,包括例如基于梯 度的方法。这样的算法可以如下进行给定一组权重,从所有可能的 二进制判定规则中(从将该情况分为两个叶子的会话特征中推到的) 选择一个将与该算法相关的(加权)损耗函数最小化的规则。损耗函 数的一些例子是与最大相似法对应的"伯努里式(Bernoulli)损耗"以 及与周知的ADABoost方法对应的"指数损耗"。在该阶段选择最佳 二进制判定规则之后,可以重新计算该权重,并可以重复该过程,借 此选择将新(加权)损耗函数最小化的最佳二进制规则。该过程可以 被重复许多次(例如,几百至几千)并且可以使用重采样法(例如, 交叉确认)来定义停止规则,以便于防止过符合。
提级的枝端已经被显示为近似附加逻辑回归模型,因此每个特征 都对符合模型作出附加的非线性贡献(关于逻辑等级)。该枝端的序 列定义会话特征与广告被定级为"好"的概率之间的关系。该序列可 以用如下的统计模型表示-
e(c0 + C|*BlW + c2*B2(x)+...) 幼4
P(goorf刈應.o" 一脚x) = 1 + e(c。+C|*Blw+C2,+...) 4式(5)
其中如果会话特征x满足第k个二进制规则则Bk (x) =1,或者
如果会话特征X不满足第k个二进制规则则Bk (X) =0。该系数Ck, k=l,...,是算法的副产品并且与在第k个二进制规则的好广告的可能 性相关。实际上,给定会话特征x,就可以估计每个二进制规则,并且
相应的系数被累计,以获得好广告的预测概率。
虽然上面已经描述了逻辑回归和提级的枝端作为构造统计模型的 示范性技术,但是本领域技术人员应认识到也可以使用其他现有的统 计方法(例如回归树)来推导与本发明的原理一致的统计模型。
示范性广告质量评估过程
图13是根据与本发明的原理相一致的实现的对用户所选择的广告
的质量进行估计的示范性过程的流程图。本领域技术人员应理解,图
13所示例的过程可以适当地以软件实现并且可以被存储在诸如主存储 器330、 ROM 340或者服务器220或230或客户端210的存储设备350的计
算机可读存储器上。
所述示范性过程以获得与未评级广告的选择相关联的会话特征开 始(框1300)。所述会话特征可以在用户的广告选择期间实时测量或者
从与广告选择相关联的用户行为的日志中获得。未评级广告可能不具 有与其相关联的任何人工生成的质量评级,诸如以上图4中所使用的广
告评级。如图14所示,用户可选择1400与文档1410 (例如,搜索结果 文档)相关联的未评级广告1405。可响应于对未评级广告1405的选择 向用户提供广告定着文档1415。所获得的会话特征可包括与广告选择 相关联的任意类型的用户行为,诸如以上关于框410 (图4)所描述的 那些用户行为。如图14所示,可测量与未评级广告1405的选择1400相 关联的会话特征1420。可以使用在以上的框420所推导的统计模型和所 测量的会话特征来确定与所述未评级广告相关联的分值(框1310)。在 以上的框410和420所推导的统计模型可以提供表示给定与用户的该广
告选择相关联的所测量会话特征的情况下的好广告概率的概率函数 (例如,以上的等式(3)或(5))。因此,可以将所测量的会话特征
值输入到等式(3)或(5)来获得所选择的广告是好广告的概率值。 例如,可以将会话特征Xp^,A和x,的值输入到等式(3)或(5),以获 得概率值尸(good fl^^^o"/ea加M x,,X2,;c3,x4) =0.4。然后可以将所述概 率值P等同于质量分值。例如,可使用概率值的线性函数将所述概率值 等同于质量分值。如一个示例,可将质量分值设置为等于概率值P,或 者等于概率值P的若干倍(例如,概率值P的10倍)。然而,本领域技术
人员将意识到,可以使用其它函数关系来将概率值转换为与所选择的 广告相关联的质量分值。如图14所示,可以将所测量的会话特征1420 输入到统计模型1425中,并且统计模型1425可输出未评级广告1405的
质量分值。
然后可基于所确定的分值来估计所选择的广告的质量(框1320)。 例如,可以使用质量分值的范围来评估所选择的广告的质量,诸如在 值0至X之间的质量分值可表示低质量分值,而在X和X+Y之问的质量分
值可表示高质量分值。可使用与本发明的原理一致的其它方法基于所 确定的质量分值来估计所选择的广告的质量。
如在与本申请相同日期提交的名称为"Predicting Ad Quality"的 共同未决美国申请No.ll/321,046(代理人案巻号No.0026-0156)(在此 通过引用而将其全部内容合并于本文中)中所描述的,对于多个用户 进行的多个广告选择,可在数据结构中聚合在框1310中确定的质量分 值。在与本申请相同日期提交的名称为"Using Estimated Ad Qualities for Ad Filtering, Ranking and Promotion "的共同未决美国申i青 No.11/321,064 (Attorney Docket No.0026-0158)(在此通过引用而将其 全部内容合并于本文中)中所描述的,从所聚合的质量分值所得出的 质量预测可被用于例如对广告进行过滤、排名和/或提升。
结论
以上对本发明的优选实施例的描述提供了例证和说明,但并非意 在穷举本发明或者将本发明限制在所披露的精确形式。可以按照上面
的教导或者从本发明的实践中获得对本发明的某些更改和变化。例如, 虽然已经参照图4和13描述了一系列动作,但是在与本发明原理相一 致的其他实现中可以修改这些动作的顺序。此外,互不依赖的动作可 以被并行执行。
除了上述会话特征之外,在一些实现中可以可选地使用转换跟踪 来推导预测值与用户满意度之间的直接标度。当对广告的选择直接导 致了广告主认为有价值的用户行为(例如,用户购买)时,就发生了 转换。广告主或者为广告主托管广告的服务可以跟踪对于每个广告选 择是否都发生了转换。例如,如果用户选择了广告主的广告,并且随 后在线购买了在响应于广告选择而提供给用户的广告定着文档上显示 的产品,则广告主或者托管广告的服务可以记录关于该广告选择的转 换。该转换跟踪数据可以与所识别的广告选择相关联。可以使用统计 技术,例如,逻辑回归、回归树、提级的枝端等来推导在预测值与通 过转换测得的用户满意度之间的直接标度。
对于本领域内的普通技术人员来说,在图中所示的实现中可以使 用软件、固件以及硬件的许多不同的形式来实现本发明如上所述的各 个方面。用于实现与本发明原理相一致的各个方面的实际软件代码或 专用控制硬件不会限制本发明。这样,没有参照特定软件代码来描述 各个方面的操作和行为,然而,可以理解的是,基于这里的描述,本 领域内的普通技术人员将能够设计软件和控制硬件来实现这些方面。
本发明申请中使用的元件、动作或指令等不应被构造为对本发明 来说是关键的或必不可少的,除非明确描述的确如此。而且,正如这 里所使用的,词"一"意在包括一个或多个项目。在意图仅表示一个 项目的地方,使用术语"一个"或类似用语。进一步,短语"基于" 意在表示"至少部分基于",除非已明确地表示并非如此。
权利要求
1. 一种方法,包括获得与由一个或多个服务器所托管的第一组广告相关联的评级,其中所述评级表示所述第一组广告的质量;观察与所述第一组广告中的广告的用户选择相关联的多个不同的第一用户动作;使用所观察到的第一用户动作和所获得的评级推导统计模型;观察与由所述一个或多个服务器所托管的第二广告的用户选择相关联的第二用户动作;以及使用所述统计模型和所述第二用户动作对所述第二广告的质量进行估计。
2. 如权利要求l所述的方法,其中观察所述多个不同的第一用户 动作包括记录所述多个不同的第一用户动作。
3. 如权利要求l所述的方法,其中所述多个不同的第一用户动作 包括不同于点进率(CTR)或除点进率之外的用户动作。
4. 如权利要求l所述的方法,其中推导所述统计模型包括-使用逻辑回归、回归树或提级的枝端中的至少一个生成所述统计模型。
5. 如权利要求l所述的方法,其中推导所述统计模型包括 测试所述统计模型的符合,以确定哪些所观察的第一用户动作与好或差的广告相关。
6. 如权利要求l所述的方法,其中使用所述统计模型和所述第二用户动作包括给定所述第二用户动作,使用所述统计模型来确定所述第二广告 是好广告的概率;以及基于所确定的概率对所述第二广告的质量进行估计。
7. 如权利要求6所述的方法,其中使用所述统计模型和所述第二用户动作包括使用所述第二广告是好广告的所述概率来确定与所述第二广告相 关联的分值;以及基于所确定的分值对所述第二广告的质量进行估计。
8. 如权利要求7所述的方法,其中确定与所述第二广告相关联的 分值包括向所述第二广告是好广告的概率应用函数,以确定所述分值。
9. 如权利要求l所述的方法,其中所述多个不同的第一用户动作包括以下的至少一个广告选择的持续时间;在给定的广告选择之前和/或之后对其它广告的选择的数目; 在给定的广告选择之前和/或之后对搜索结果的选择的数目; 在给定的广告选择之前和/或之后对其它类型的结果的选择的数百;在给定的广告选择之前和/或之后文档浏览的数目; 在给定的广告选择之前和/或之后搜索査询的数目; 与用户会话相关联的显示广告的搜索査询的数目; 重复选择同一给定广告的数目;或给定的广告选择是否是给定查询的最后广告选择或用户会话中的 最后选择的表示。
10. —种方法,包括观察与由服务器所托管的第一广告的用户选择相关联的第一用户行为,其中所观察的第一用户行为包括不同于点进率(CTR)或除点进 率之外的用户行为;并且基于所观察的第一用户行为对所述第一广告的质量进行估计。
11. 如权利要求10所述的方法,其中所观察的用户行为包括以下的所观察的用户行为中的至少一个 广告选择的持续时间;在给定的广告选择之前和/或之后对其它广告的选择的数目; 在给定的广告选择之前和/或之后对搜索结果的选择的数目; 在给定的广告选择之前和/或之后对其它类型的结果的选择的数百;在给定的广告选择之前和/或之后文档浏览的数目; 在给定的广告选择之前和/或之后搜索查询的数目; 与用户会话相关联的显示广告的搜索査询的数目; 重复选择同一给定广告的数目;或给定的广告选择是否是给定査询的最后广告选择或用户会话中的 最后选择的表示。
12. 如权利要求10所述的方法,进一步包括获得与一组广告相关联的评级,其中所述评级指示该组广告中的 每个广告的质量;观察与该组广告中的广告的用户选择相关联的第二用户行为;以及使用所述评级和所观察的第二用户行为构造统计模型; 其中对所述第一广告的质量进行估计包括使用所述统计模型和所观察的第一用户行为来对所述第一广告的 质量进行估计。
13. 如权利要求12所述的方法,其中构造所述统计模型包括 使用逻辑回归、回归树或提级的枝端中的至少一个生成所述统计模型。
14. 如权利要求12所述的方法,其中使用所述统计模型和所观察 的第一用户行为包括给定所观察的第一用户行为,使用所述统计模型来确定所述第一 广告是好广告的概率;以及基于所确定的概率来确定与所述第一广告相关联的分值。
15. 如权利要求14所述的方法,其中使用所述统计模型和所观察的第一用户行为包括基于所确定的分值对所述第一广告的质量进行估计。
16. —种存储计算机可执行指令的计算机可读介质,包括 用于识别与由服务器所托管的第一广告的用户选择相关联的用户行为的指令,其中所观察的用户行为包括不同于点进率(CTR)或除点 进率之外的用户行为;以及用于基于所述用户行为对所述第一广告的质量进行估计的指令。
17. —种方法,包括观察与由一个或多个服务器所托管的第一广告的用户选择相关联的多个用户动作;将与所述第一广告相关联的已知的质量与所述多个用户动作中的 特定用户动作相关联;观察与第二广告的用户选择相关联的所述多个用户动作中的所述 特定用户动作的出现;以及基于所述多个用户动作中的所述特定用户动作的出现来对所述第 二广告的质量进行估计。
18. 如权利要求17所述的方法,其中所述多个用户动作包括不同 于点进率(CTR)或除点进率之外的用户动作。
19. 如权利要求17所述的方法,其中观察所述多个用户动作包括: 记录与由一个或多个服务器所托管的所述第一广告的用户选择相关联的所述多个用户动作。
20. 如权利要求17所述的方法,其中所述多个用户动作包括以下 的至少一个广告选择的持续时间;在给定的广告选择之前和/或之后对其它广告选择的数目;在给定的广告选择之前和/或之后对搜索结果的选择的数目;在给定的广告选择之前和/或之后对其它类型的结果的选择的数目;在给定的广告选择之前和/或之后文档浏览的数目; 在给定的广告选择之前和/或之后搜索查询的数目; 与用户会话相关联的显示广告的搜索査询的数目; 重复选择同一给定广告的数目;或给定广告选择是否是给定査询的最后广告选择或用户会话中的最 后选择的表示。
21. 如权利要求17所述的方法,其中将与所述第一广告相关联的 已知的质量与所述多个用户动作中的特定用户动作相关联包括使用逻辑回归、回归树或提级的枝端中的至少一个来关联所述已 知的质量。
22. 如权利要求21所述的方法,其中关联与所述第一广告相关联 的已知的质量包括构造统计模型,所述统计模型确定给定多个用户动作的情况下广 告是好广告的概率;以及其中确定所述第二广告的质量包括使用所述统计模型和所述多个用户动作中的所述特定用户动作的出现对所述第二广告的质量进行估计。
23. 如权利要求22所述的方法,其中关联与所述第一广告相关联的已知的质量包括测试所述统计模型的符合,以确定所述多个用户动作中的所述特 定用户动作与好广告相关联。
24. —种系统,包括用于获得与由一个或多个服务器所托管的第一组广告相关联的评 级的装置,其中所述评级表示所述第一组广告的质量;用于识别与所述第一组广告中的广告的用户选择相关联的多个不同的第一用户动作的装置;用于基于所述第一用户动作和所获得的评级推导统计模型的装置;用于识别与由所述一个或多个服务器所托管的第二广告的用户选 择相关联的第二用户动作的装置;和用于基于所述统计模型和所述第二用户动作对所述第二广告的质 量进行估计的装置。
25. —种方法,包括记录与一组广告的用户选择相关联的用户动作,其中该组广告与 质量评级相关联,并且其中所述用户动作包括不同于点进率(CTR)或 除点进率之外的用户动作;使用所记录的用户动作和所述质量评级来生成统计模型;以及 使用所述统计模型对不包括在该组广告中的广告的质量进行估计。
全文摘要
一种系统,获得与由一个或多个服务器所托管的第一组广告相关联的评级,其中所述评级表示所述第一组广告的质量。所述系统观察与对所述第一组广告中的广告的用户选择相关联的多个不同的第一用户动作,并且使用所观察的第一用户动作和所获得的评级推导统计模型。所述系统进一步观察与对由一个或多个服务器所托管的第二广告的用户选择相关联的第二用户动作,并且使用所述统计模型和所述第二用户动作来对所述第二广告的质量进行估计。
文档编号G06Q30/00GK101390119SQ200680053573
公开日2009年3月18日 申请日期2006年12月29日 优先权日2005年12月30日
发明者丹尼尔·赖特, 达利尔·普雷格波恩, 黛安娜·唐 申请人:谷歌公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1