预测广告质量的制作方法

文档序号:6570589阅读:242来源:国知局
专利名称:预测广告质量的制作方法
技术领域
这里所描述的实现一般地涉及在线广告,更特别地涉及提供对在 线广告质量的预测性估计。
背景技术
在线广告系统寄放(host)可以对各种服务和/或产品做广告的广 告。这样的广告可以被呈现给访问由广告系统所寄放的文档的用户, 或者呈现给发出用于搜索文档集的搜索查询的用户。广告可以包括"创
意(creative)",其包括与被广告的服务和/或产品相关的文本、图形 和/或图像。该广告还可以包括连至包含关于被广告服务和或产品的细 节的广告"定着(landing)文档"的链接。当特定创意引起用户的兴 趣时,该用户可以选择(或点击)该创意,并且该相关链接使得用户 的网页浏览器访问与该创意相关的"定着文档"及相关链接。在下文 中,将用户对广告创意以及相关链接的选择称为"点击"。
在线广告系统通常为了记帐以及其他目的而跟踪广告点击。跟踪 广告点击的一个非计帐目的是试图确定广告质量。该点进率(CRT)是 用于确定广告质量的度量。CRT表示当将给定的广告创意呈现给用户 时该给定的广告获得"被点击"的次数的分数。但是,广告的CRT是 对广告质量的有缺陷的度量,因为它只关注于广告创意而不是广告对 象,即定着文档。为了确定广告是好还是坏,用户需要点击广告,因 此发生/不发生点击不足以确定广告的质量。 一些广告由于它们具有很 好的创意而接收到许多点击,但是定着文档对于用户来说却是完全无 法令人满意的或者不相关的。其他广告接收到非常少的点击(例如, 由于该广告创意差),但是每个点击都让用户满意。因而,现有的确 定与在线广告相关的CRT提供了对广告质量的有缺陷的度量。
此外,在现有的在线广告系统中,显示给用户的广告以及广告显 示给用户的次序完全基于广告的CRT以及广告商愿意为显示其广告而
支付的最大"每次点击成本"(cost per click, CPC)。该CPC是广告 商愿意支付给广告发布者的数额,并且其基于该特定广告接收到的选 择(例如,点击)的数量。就CTR被用作广告质量的替身来说,其由 于已经阐述的原因而是不充分的。因而,现有的用于确定显示哪个广 告以及对广告进行分级的机制使用了一种对广告质量的有缺陷的度 量,其可能不向用户提供最高质量的广告。

发明内容
依照一个方面, 一种方法可以包括确定与对多个广告的选择相关 联的质量值,其中每个质量值估计广告为好广告的可能性。该方法可 以进一步包括聚合质量值并使用所聚合的质量值来预测广告为好广告 的将来的可能性。
依照另一个方面, 一种方法可以包括响应于搜索查询向用户提 供一个或多个广告;以及记录与用户对一个或多个广告的选择相关联 的用户行为。该方法可以进一步包括记录与一个或多个广告中被选 择的广告相关联、或者与搜索査询相关联的特征;以及使用统计模型 和所记录的用户行为来估计与所选择的广告相关联的质量分值。该方 法也可以包括聚合所估计的质量分值并使用所聚合的质量分值来预测 一个或多个广告中的广告的质量。
依照其它的方面, 一种方法可以包括从用户接收搜索查询,并基 于该搜索査询向用户提供一组广告。该方法可以进一步包括从用户接 收对于从一组广告中选择广告的指示,并记录与搜索査询或者所选择 的广告相关联的特征。该方法也可以包括使用所记录的特征从存储器 中检索以往的质量分值,并根据所检索的以往的质量分值来预测所选 择的广告的将来的质量。


合并于本说明书并构成本说明书一部分的附图示出了本发明的一 个或多个实施例,并且与文字描述一起用于解释本发明。在附图中,
图1和2是实现的总体示例图,在该实现中,使用所观测的用户 行为和与一组广告相关联的已知质量等级来构建可被用于预测广告质 量的统计模型;
图3是网络的示例图,在该网络中可以实现符合本发明原理的系 统和方法;
图4是依照符合本发明原理的实现的图3的客户端或服务器的示
例图 ,
图5是依照符合本发明原理的实现的用于构建与对多个在线广告 的选择相关联的用户行为模型的示范性过程的流程图6-13示出了相应于所观测或所记录的用户动作的各种示范性会 话特征,它们可被用于构建用于预测广告质量的统计模型;
图14是依照符合本发明原理的实现的用于确定涉及广告质量的 预测值的示范性过程的流程图15是用图形表示符合本发明一个方面的图14的示范性过程的
视图16是用于存储在图14中所确定的预测值的示范性数据结构的
视图17是依照符合本发明原理的实现的用于预测广告质量的示范 性过程的流程图18是用图形表示符合本发明一个方面的图17的示范性过程的
视图19是依照符合本发明原理的实现的用于预测广告质量的示范 性过程的流程图;以及
图20是用图形表示符合本发明一个方面的图19的示范性过程的 视图。
具体实施例方式
下面参照附图来对本发明进行详细说明。在不同的附图中,相同 的参考数字可以表示相同或类似的元件。而且,下面的详细说明不限 制本发明。
与本发明的各方面一致的系统和方法可以使用与在线广告的用户 选择相关联的用户行为的多个观察(例如,实时观察或者来自记录用 户的日志的观察),以与传统的仅基于CTR的质量确定相比更准确地 估计广告质量。可以使用与已知评级(rate)的广告相关联的质量分值、 以及与这些已知评级的广告的选择(例如,"点击")相关联的相应 测量的所观测的用户行为来构造统计模型。随后,可以使用该统计模 型来根据与未评级广告选择相关联的所观测的用户行为来估计与该未 评级广告相关联的质量。
如在此所使用的术语"文档"应被广泛地解释为包括任何机器可 读以及机器可存储的工作成果。文档可以包括例如电子邮件、网页或 网站、商务列表、文件、文件的组合、嵌有到其他文件的的连接的一 个或多个文件、新闻组贴子、博客、在线广告等。文档通常包括文本 信息,并且可以包括嵌入式信息(例如元信息、图像、超链接等)禾口/ 或嵌入式指令(例如Javascript等)。如在此所使用的术语"链接"应 被广泛地解释为包括从/到一个文档到/从另一个文档或者该相同文档 另一部分的任意参考。
概述
图1和图2示出了实现的示范性概要图,在该实现中,使用统计 模型和所观测的与对广告的选择相关联的用户行为来估计预测值,进 一步聚合该预测值以提供对于广告质量的将来的预测。该对于广告质 量的将来的预测可被用于对广告过滤、排名或提升(promotion)。
如图1所示,多个评级的广告100-1至100-N (在此共同地称作广
告100)中的每一个可以与相应的文档105-1至105-N (在此共同地称 作文档105)相关联。除了评级的广告100外,每个文档105可以包括 一组搜索结果(该结果是基于用户提供的搜索査询而由搜索引擎执行 搜索获得的),并且还可以包括一个或多个广告。每个广告100可以 与评级数据120相关联,该评级数据120是由已对每个评级的广告100 的质量进行了评级的评级人提供的。每个广告100可以对各种产品或 服务做广告。
响应于接收到广告100,接收用户可以基于广告上显示的"创意" 来选择IIO广告(例如,例如使用鼠标在显示的广告上进行"点击")。 在广告选择110之后,使用嵌入在广告100中的链接通过寄放该广告 的服务器将广告定着文档115提供给选择用户。该广告定着文档115 可以提供在相应广告100中做广告的产品和/或服务的细节。
在用户进行每个广告选择IIO之前、期间和/或之后,可以实时测 量在"会话"期间与每个广告选择110相关联的会话特征125或者将 其记录在存储器中或磁盘上。会话可以包括在长于一个特定时间段内 无中断地发生的一组用户动作(例如,在长于三小时的时间段内无中 断地发生的一组用户动作)。
所测量的会话特征125可以包括任何类型的所观察的用户行为或 动作。例如,会话特征125可以包括广告选择110的持续时间(例如, 在广告100上"点击"的持续时间)、在给定的广告选择之前和/或之 后其他广告的选择的数量、在给定的广告选择之前和/或之后搜索结果 的选择的数量、在给定的广告选择之前和/或之后对其他类型结果(例 如,图像、新闻、产品等)的选择的数量、在给定的广告选择之前和/ 或之后文档阅览(例如,页面阅览)的数量(例如,在广告选择之前 和/或之后搜索结果的页面阅览)、在给定的广告选择之前和/或之后搜 索査询的数量、与显示广告的用户会话相关联的查询的数量、对同一 给定广告进行重复选择的数量或者给定的广告选择是否为会话中的最
后选择、会话中的最后广告选择、对于给定的搜索查询的最后选择或 对于给定的搜索查询的最后广告选择的指示。与本发明的各方面一致, 可以使用上面没有描述的其他类型的与广告选择相关联的所观察的用 户行为。
利用与相应评级的广告100的每个广告选择110相关联的所测量 的会话特征125以及广告评级数据120,可以构造统计模型130 (如下 面进一步描述的)。该统计模型可以包括利用统计技术推导的概率模 型。这样的技术可以包括例如逻辑回归(logistic regression)、回归树、 提级的枝端(boosted stumps)或者任何其他统计建模技术。统计模型 130可以提供一个预测值,该预测值估计给定的广告100是与广告100 的用户选择相关联的好的给定所测会话特征的可能性(例如,P (good ad|ad selection) =/g (session feaures))。
在构建统计模型130之后,可以估计由一个或多个用户选择的未 评级广告的广告质量。可以把与文档140相关联且寄放于网络中的服 务器上的未评级广告135提供给访问用户。与未评级广告135的用户 选择145相关联的会话特征155可以被测量或记录在存储器中或磁盘 上,并且该测量可以被提供为统计模型130的输入。给定所测量的会 话特征,统计模型130可以确定未评级广告135是好广告的可能性, 并且可以为生成关于未评级广告135的预测值160。
与未评级广告135的选择相关联的广告/査询特征165也可以被观 测并记录。广告/查询特征165可以包括与广告135或者寄放或产生广 告的广告主相关联的不同特征,或者包括与导致显示广告135的由用 户发出的查询相关联的特征。例如,广告/查询特征165可以包括与广 告135的广告主相关联的标识符(例如,广告主的可视的统一资源定 位符(URL))、广告135定向的关键字、由用户发出的查询中广告 135没有定向的词、和/或由用户发出的查询中广告135没有定向但与 广告135定向的词类似的词。在符合本发明原理的条件下,也可以使
用上面未描述的其它类型的广告或査询特征。依照相关联的广告/查询
特征165,可以将所估计的预测值160存储在数据结构170中,下面将
对此作进一步详细描述。
尽管图1描述了估计与单个未评级广告135相关联的预测质量值, 但是可以针对一个时间跨度内由一个或多个用户选择的每个未评级广 告135来估计预测值160,从而产生多个广告预测值160,其中每个预 测值160与一个或多个广告/查询特征(或多个特征)165相关联。可 以将该多个广告预测值160聚合在数据结构170中,以产生聚合的预 测值200,如在图2中所示。下面参考图14对预测值的聚合进行描述。 如在图2中进一步所示,可以对数据结构170中的每个广告/查询特征 估计210可能性。所估计的可能性可以预测给定特定广告/查询特征的 广告的质量。下面将参考图17和图18描述可能性估计的进一步的示 范性细节。可以将针对每个广告/查询特征所估计的可能性存储在数据 结构170中。
随后可以获得220与广告220的选择相关联的广告/查询特征。当 用户从文档(例如,搜索结果文档)中选择广告时,与该选择相关联 的广告/査询特征将被记录。可以从数据结构170中检索230针对就广 告的选择而获得的每个广告/查询特征的所估计的可能性。然后,通过 使用所检索的针对与广告选择相关联的每个广告/査询特征的所估计的 可能性,可以预测240总体的广告质量。下面将参考图19描述预测总
体广告质量的进一步的示范性细节。 示范性网络结构
图3是其中可以实现与本发明的原理一致的系统和方法的网络 300的示范图。网络300可以包括经由网络340连接到一个或多个服务 器320-330的多个客户端310。为了简便起见,示出了两个客户端310 以及两个服务器320-330连接到网络340。实际上,可以有更多或更少 的客户端和服务器。而且,在一些实例中,客户端可以执行服务器的 功能,并且服务器可以执行客户端的功能。
客户端310可以包括客户端实体。实体可以被定义为装置,诸如 个人计算机、无线电话、个人数字助理(PDA)、膝上型电脑、或者 另一类型的计算或通信装置、在这些装置之一上运行的线程或进程、 和/或者可以由这些装置之一执行的对象。 一个或多个用户可以与每个
客户端310相关联。服务器320和330可以包括以与本发明的原理一 致的方式来访问、取得、聚合、处理、搜索和/或保持文档的服务器实 体。客户端310和服务器320及330可以经由有线、无线、和/或光连 接来连接到网络340。
在与本发明的原理一致的实现中,服务器320可以包括搜索引擎 系统325,其可由客户端310的用户使用。服务器320可以通过抓取文 档集(例如,Web文档)对该文档进行索引以及将与该文档相关联的 信息存储文档库中来实现数据聚合服务。也可以以其他方式来实现该 数据聚合服务,诸如与数据服务器330的操作者协定以经由数据聚合 服务来分发它们所寄放的文档。在一些实现中,服务器320可以寄放 可以被提供给在客户端310的用户的广告(例如,创意、广告定着文 档)。搜索引擎系统325可以执行从在客户端310的用户接收的对存 储在文档库中的文档集的査询,并且可以将与所执行的査询相关的一 组搜索结果提供给该用户。除了该组搜索结果以外,服务器320还可 以将与所执行的搜索的结果相关联的一个或多个广告创意提供给在客 户端310的用户。
服务器330可以存储或保持可以是由服务器320所抓取的文档。 这样的文档可以包括与出版的新闻故事、产品、图像、用户组、地理 区域相关的数据或者任何其他类型的数据。例如,服务器330可以存 储或保持来自任何类型的新闻资源(诸如例如华盛顿邮报、纽约泰晤 士报、泰晤士杂质或者新闻周刊的新闻故事)。作为另一例子,服务 器330可以存储或保持与特定产品相关的数据,诸如由一个或多个产
品制造商提供的产品数据。作为还一个例子,服务器330可以存储或
保持与其他类型的Web文档(例如网站的页面)的数据。服务器330
还可以寄放广告,诸如广告创意以及广告定着文档。
网络340可以包括任何类型的一个或多个网络,包括局域网 (LAN)、广域网(WAN)、城域网(MAN)、诸如公共开关电话网 络(PSTN)或公共陆地移动网络(PLMN)的电话网、内联网、因特 网、存储器装置或者网络的组合。该PLMN可以进一步包括分组交换 子网,诸如例如通用分组无线服务(GPRS)、蜂窝数字分组数据(CDPD) 或移动IP子网。
虽然服务器320-330被示为单独的实体,但是也可能是服务器 320-330中的一个执行该服务器320-330中的另一个的一个或多个功 能。例如,可以将服务器320和330实现为单个服务器。也可以将服 务器320和330中的单个服务器实现为两个或更多个单独(可能分布 式的)的装置。
示范性客户端/服务器体系结构
图4是根据与本发明的原理一致的实现的客户端或服务器实体 (下文中称为"客户端/服务器实体")(客户端或服务器实体可以对应 于一个或多个客户端310和/或服务器320-330)的示范图。该客户端/ 服务器实体可以包括总线410、处理器420、主存储器430、只读存储 器(ROM) 440、存储装置450、输入装置460、输出装置470以及通 信接口 480。总线410可以包括允许在客户端/服务器实体的元件之间 进行通信的路径。
处理器420可以包括处理器、微处理器、或者可以解释和执行指 令的处理逻辑。主存储器430可以包括随机存取存储器(RAM)或者 另一个类型的动态存储装置,其可以存储信息以及由处理器420执行 的指令。ROM 440可以包括ROM装置以及另一种类型的静态存储装
置,其可以存储静态信息以及供处理器420所使用的指令。存储装置
450可以包括磁和/或光记录介质及其相应驱动。
输入装置460可以包括用于允许操作者将信息输入到客户端/服务
器实体的机构,诸如键盘、鼠标、笔、语音识别和/或生物机制等。输
出装置470可以包括用于将信息输出给操作者的机构,包括显示器、 打印机、扬声器等。通信接口 480可以包括任何类似于收发器的机构, 其使得该客户端/服务器实体能够与其他装置和/或系统进行通信。例 如,通信接口 480可以包括用于经由诸如网络340的网络与另一个装 置或系统进行通信的机构。
与本发明的原理一致的客户端/服务器实体可以执行某些操作或 进程,如将在下面将详细描述的。该客户端/服务器实体可以响应于处 理器420执行包含在诸如存储器430的计算机可读介质中的软件指令 而执行这些操作。计算机可读介质可以被定义为物理或逻辑存储器装 置和/或载波。
可以从例如数据存储装置450的另一计算机可读介质,或者经由 通信接口 480从另一装置,将软件指令读入到存储器430中。包含在 存储器430中的软件指令可以使处理器420执行随后将详细描述的操 作或处理。替代地,可以用硬线电路来替换软件指令或者与软件指令 组合来实现与本发明的原理一致的处理。因而,与本发明的原理一致 的实现不限于硬件电路和软件的任意特定组合。
用于构造与广告选择相关联的用户行为的统计模型的示范性过程 图5是用于构造与多个在线广告的选择相关联的用户行为的统计 模型的示范性过程的流程图。本领域技术人员可以理解的是,图5中 所示范的过程可以适当地以软件实现并被存储在计算机可读存储器 中,诸如主存储器430、 ROM440或者服务器320、服务器330或客户 端310的存储装置450。
该示范性过程可以以获取与评级的广告相关联的评级数据开始 (框500)。该评级数据可以包括对每个评级的广告的质量进行评级(例 如,对广告进行评级的一种方式是对该广告相对于所发出的查询的相 关程度进行评级)的人生成数据。然后,可以获得与所评级的广告的 每个选择相关联的会话特征(框510)。可以通过在给定的用户会话期 间观察实际的用户行为来实时地获得会话特征(其在将每个广告闪现 (impression)显示给用户之前、期间以及之后发生),或者可以在将每 个广告闪现显示给用户之前、期间以及之后从存储在数据结构中的会 话特征(即,用户行为和动作)的记录日志中获得。所获得的会话特 征125可以包括任何类型的观察的用户行为。每个会话特征125可以 对应于用户对于给定广告的满意度的间接测量。会话特征125中的某 些会话特征可以是确定不同用户对于会话特征125中的其他会话特征 如何具有不同值的因素(例如,具有拨号连接的用户可以比具有高速
因特网连接的用户具有更长的广告选择持续时间)。
会话特征125可以包括,但不限于,广告选择的持续时间(例如, 在广告上"点击"的持续时间)、在给定的广告选择之前和/或之后的 其他广告的选择的数量、在给定的广告选择之前和/或之后的搜索结果 的选择的数量、在给定的广告选择之前和/或之后的其他结果的选择的 数量、在给定的广告选择之前和/或之后的文档浏览(例如,页面浏览) 的数量、在给定的广告选择之前和/或之后的搜索査询的数量、与显示 广告的用户会话相关联的搜索查询的数量、对相同同一给定广告的重 复选择的数量或者给定的广告选择是否是会话中的最后选择、会话中 的最后广告选择、对于给定搜索查询的最后选择或者对于给定搜索查 询的最后广告选择的表示。图6-13在下面描述了与本发明的各方面一 致的可以作为会话特征而被测量的各种示范性类型的用户行为。
图6示出了广告选择的持续时间的测量作为会话特征600。如图6 中所示,可以将与文档610相关联的广告605提供给用户。响应于接
收到广告605,该用户可以选择615广告605,并且可以将该广告定着 文档620提供给用户。可以测量广告选择的持续时间625 (例如,从选 择广告的时间直到用户的下一动作(诸如点击另一个广告、输入新査 询等)的时间段)作为会话特征600。
图7示出了在具体广告选择之前和/或之后的对其他广告选择的数 量的测量作为会话特征700。假设广告N710的具体选择705,以及响 应于该广告选择705而提供广告定着文档715,则可以测量与提供以前 广告定着文档730对应的广告N-x 725中的一个或多个以前广告选择 720的数量。另外,或者作为选择,假设广告N710的具体选择705, 可以测量与提供下一广告定着文档745对应的广告N+x 740中的一个 或多个下一广告选择735的数量。可以测量在具体的广告选择之前和/ 或之后的其他广告选择的数量,作为会话特征700。
图8示出了在具体的广告选择之前和/或之后的对搜索结果选择的 数量的测量作为会话特征800。假设广告N810的具体选择805,以及 响应于该广告选择805而提供广告定着文件815,可以测量在该广告选 择805之前用户浏览的搜索结果文档820的数量作为会话特征800。可 以使用用户发出的搜索查询基于搜索的执行来将搜索结果文档提供给 用户。另外,或者作为选择,可以测量在广告选择805之后由该用户 浏览的搜索结果文档825的数量作为会话特征800。
图9示出了在具体的广告选择之前和/或之后的对用户浏览的文档 的数量的测量作为会话特征卯O。假设广告910的具体选择卯5,并且 响应于该广告选择905而提供广告定着文档915,可以测量在广告选择 905之前用户浏览的文档920 (例如,页面浏览)的数量作为会话特征 900。另外,或者作为选择,可以测量在广告选择905之后用户浏览的 文档925 (例如,页面浏览)的数量作为会话特征900。
图10示出了在具体广告选择之前和/或之后的对用户发出的搜索
査询的数量的测量作为会话特征1000。假设广告1010的具体选择
1005,并且响应于该广告选择1005而提供广告定着文档1015,可以测 量在广告选择1005之前用户发出的搜索査询1020的数量作为会话特 征IOOO。另外,或者作为选择,可以测量在广告选择1005之后用户发 出的搜索査询1025的数量作为会话特征1000。
图11示出了在包括具体广告选择的会话中的对搜索查询(其导致 了对广告进行显示)的数量的测量作为会话特征1100。假设包括预定 广告选择的会话,可以测量搜索查询1105的数量,其导致对相应广告 1110-1至1110-N进行显示。可以测量搜索查询的数量作为会话特征 1100。导致对广告进行显示的搜索查询1105的数量可以表示给定用户 会话的商业性质。
图12示出了用户对相同广告的重复选择的数量的测量作为会话 特征1200。如图12中所示,可以将可以与多个文档1210-1至1210-N 相关联的广告1205提供给用户一次或者多次。响应于每次接收到广告 1205,用户可以选择1215广告1205,并且可以对于每次重复的用户选 择将广告定着文档1220提供给用户。可以测量用户对相同广告的重复 选择的数量作为会话特征1200。
图13示出了确定广告选择是否是对于给定的搜索查询的最后广 告选择,或者该广告选择是否是对于用户会话的最后广告选择,作为 会话特征1300。如图13中所示,用户可以在给定的会话1310期间发 出搜索查询1305,并且可以在发出搜索查询1305之后将一个或多个广 告1315提供给用户。响应于每次接收到广告1315,用户可以选择1320 广告1315,并且可以将广告定着文档1325提供给用户。可以做出该广 告选择1320是否是对于搜索查询1305的最后广告选择的确定。因而, 如果发出搜索査询1305的用户选择了多个广告,则可以识别对于搜索 査询1305的仅仅最后广告选择。还可以做出该广告选择1320是否是 对于会话1310的最后广告选择的确定。因此,如果在给定的会话期间
用户已经做出多个广告选择,则可以识别对于该会话的仅仅最后广告 选择。
在图6-13中未示出的其他类型的用户行为也可以被用作与本发明 的原理一致的会话特征。下面列出了其他示范性会话特征的多个例子
1) 代替广告选择持续时间,可以将给定的广告选择持续时间相对 于用于给定用户的平均广告选择持续时间的比值用作会话特征。
2) 给定的广告选择持续时间相对于所有选择(例如,搜索结果选 择或者广告选择)的比值。
3) 用户在给定的会话中选择给定广告的次数。
4) 从广告结果选择直到用户发出另一搜索査询的持续时间。这可 以包括在给定广告点击之后花费在(经由搜索结果点击或广告点击达 到的)其他页面的时间。
5) 从给定的广告结果选择直到用户发出另一搜索査询为止的时间
相对于从广告结果选择直到用户发出另一搜索查询为止的所有其他时 间的比值。
6) 对于给定的广告结果选择,花费在浏览搜索査询的其他结果而
不是在给定的广告结果上的时间。
7) 上述6)中花费的时间(花费在其他结果上而不是在点击持续 时间上的时间)相对于经过所有查询在6)中花费的平均时间的比值。
8) 在给定的搜索结果或广告选择之前在给定会话中发生多少个搜 索(即,唯一发出的搜索查询)。
9) 在给定的搜索结果或广告选择之后在给定会话中发生多少搜索。
10) 除了搜索,在给定选择之前对于给定搜索查询发生多少结果 页面浏览。这可以在査询内(即,仅仅对于唯一查询)或对于整个会 话进行计算。
11) 除了搜索,在该选择之后对于给定的搜索查询发生多少搜索 结果页面浏览。这可以在査询内(即,仅仅对于唯一查询)或对于整 个会话进行计算。12) 在该会话中发生的页面浏览的总数;
13) 在显示广告的会话中页面浏览的数量;
14) 在显示广告的会话中页面浏览的数量相对于该会话中发生的 页面浏览的总数的比值;
15) 在会话中显示的广告闪现的总数;
16) 每个显示广告的査询所显示的广告的平均数,该会话的另一 个商业化测量;
17) 查询扫描时间——从用户看到査询结果到用户做其他事情(点 击广告、搜索结果、下一页面、新査询等)时用多长时间
18) 在给定査询扫描时间与所有其他查询扫描时间之间的比值;
19) 在给定搜索中发生的选择(例如,点击)的总数。这些选择 包括所有类型的选择(例如,搜索、onebox、广告),而不是仅仅广告 选择;
20) 在给定的广告选择之前在搜索中发生的选择的总数;
21) 在给定的广告选择之后在搜索中发生的选择的总数;
22) 在搜索中发生的广告选择的总数。可能需要用页面上的广告 数量来规范化;
23) 在给定的广告选择之前在搜索中发生的广告选择的总数;
24) 在给定的广告选择之后在搜索中发生的广告选择的总数;
25) 在搜索中发生的、其在文档上的广告位置位于文档上的给定 广告位置之上的广告选择的总数;
26) 在搜索中发生的、其在文档上的广告位置位于文档上的给定 广告位置之下的广告选择的总数;
27) 在搜索中发生的不是对给定广告的广告选择的总数;
28) 在搜索中发生的搜索结果选择的总数
29) 在给定的广告选择之前在搜索中发生的搜索选择的总数;
30) 在给定的广告选择之后在搜索中发生的搜索结果选择的总数;
31) 在会话中发生的长持续时间的搜索结果选择的总数;
32) 在会话中发生的短持续时间的搜索结果选择的总数;
33) 在会话中最后发生的搜索结果选择的总数。给定用户可以通
过点击搜索结果来结束会话,而不需要后续动作,或者用户可以以其 他方式(例如,广告结果点击、发出查询以及不点击等)来结束会话;
34) 在搜索中发生的非搜索结果以及非广告选择的总数;
35) 是否存在来自该广告选择的转换的表示;
36) 用户的连接速度的表示(例如,拨号、线缆、DSL);
37) 用户位于哪个国家的表示。不同的文化有可能导致用户对相 同的广告有不同反应,或者具有不同文化反应,或者不同地停在网站 上;
38) 用户位于世界上的那个区域(例如,APAC二亚太区)的表示;
39) 对于给定广告的关键字是否与搜索査询精确匹配(即,具有 与查询完全相同的术语),或者是否缺失一个词、多于一个词、或者 具有重写术语。通常,广告的质量可能变化(匹配越精确,质量越高), 并且关键字匹配可能是分割广告的合理方式,并且预测广告对于不同 的匹配类型来说分别是好还是坏;
40) 对于给定广告的估计点进率(CTR)的表示;
41) 广告商为给定的广告选择支付多少每次点击成本(CPC) 广告很好的可能性可以取决于广告商支付了多少(越多质量越高);
42) 广告商愿意支付多少CPC 在广告拍卖中,可以使用广告商 出价来设置广告排名,并且排名低于给定广告/广告商的广告/广告商设 置实际上将由下一个较高排名的广告/广告商支付的价格;
43) 有效CPC"页测的CTR;或者
44) 出价CPC^预测的CTR。
上面描述了可以用于统计模型的会话特征的多个例子。但是,本
领域技术人员应认识到可以使用其他的会话特征,作为选择,或者
与任意上述会话特征结合。
返回至图5,然后可以推导出统计模型,用于确定每个所选广告 是给定与广告选择相关联的所测会话特征的好质量广告的概率(框 250)。可以使用现有的统计技术(例如逻辑回归)来推导出与本发明
的原理相一致的统计模型。回归包括发现用于将结果变量(因变量y)与一个或多个预测器(自变量&, X2,等)相关的函数。简单的线性回 归假设如下形式的函数
<formula>formula see original document page 22</formula> 等式(1)并且发现co, Cl, C2等的值(ce被称为"截距"或"常数项)。在本发明的上下文中,每个预测器变量Xp X2, X3等对应于广告选择期间测得的不同会话特征。逻辑回归是普通回归的变形,当观测到的结 果限定为两个值时是很有用的,其通常表示某个结果事件的发生或未发生,(通常分别被编码为l或0),诸如在本发明的上下文中的好广告或差广告。
逻辑回归产生作为独立预测变量的函数对发生的概率进行预测的 公式。逻辑回归通过采取线性回归(上述等式(1))(其将生成位于正无穷大与负无穷大之间的任意y值)并用下面的函数对其进行变换来符合特定S形曲线
<formula>formula see original document page 22</formula> 等式(2)
其中产生位于0 (当y达到负无穷大时)和1 (当y达到正无穷大 时)之间的P值。将等式(1)代入等式(2),这样,好广告的概率 变为如下
<formula>formula see original document page 22</formula>
等式3
其中Cgo为等式的常数,Cgn为会话特征预测变量Xn的系数。类似 地,可以通过下面的等式(4)来确定差广告的概率
<formula>formula see original document page 22</formula>
等式4
其中CbO为等式的常数,Cbn为会话特征预测变量Xn的系数。
可以测试统计模型的符合,以确定哪个会话特征与好或差质量广
告相关。如果使用逻辑回归技术来确定统计模型,则该逻辑回归的目 的是要通过使用最节俭的模型来正确预测各个情况的结果。为了实现 这一目的,创建一个模型,其中包括在预测因变量y的结果时有用的 所有预测器变量(例如会话特征)。为了构建统计模型,逻辑回归可 以在每个系数(C。)被增加或删除后测试模型的符合,被称为逐步回归。
例如,可以使用反向逐步回归,其中模型构造从完整或饱和模型开始, 并且在迭代过程中从模型中消除预测器变量以及它们的系数。在消除 每个变量之后测试该模型的符合,以确保该模型仍旧足够与数据符合。 当无法再从模型中消除预测器变量时,该模型的构造就完成了。留在 模型中的预测器变量(每一个对应于所测的会话特征)识别与好或差 广告相关的会话特征。因而,逻辑回归能够提供不同预测器变量之间 的关系和强度的了解。为了了解从模型包括或消除的重要性而测试系 数以及它们相应的预测器变量的过程可以包括几个不同的已知技术。
这样的技术可以包括Wald测试,相似性比率测试或者 Hosmer-Lemshow Goodness of Fit领!)试。这些系数测试技术在本领域内 是已知的,并且这里将不再进一步描述。在其他实现中,可以使用现 有的交叉确认和单独训练技术,来代替如上所述的分类估计以及测试 回归系数的技术。
代替或除了逻辑回归,可以使用其他现有的统计技术来推导与本 发明的原理相一致的统计模型。例如,使用"提级(boosting)"技术 的"枝端"模型可以被用来推导统计模型。本领域技术人员可以认识 到的是,"提级"是一种机器学习技术,用于通过连续地改进其他弱 的统计模型来建立统计模型。其基本思想是向整个训练数据集合重复 地应用相同的算法,但是在每个阶段对训练数据进行不同地加权。该 加权使得通过阶段k与模型很好符合的情况在阶段k+ 1接收相对小的 权重,而通过阶段k与模型不太符合的情况在阶段k+l接收相对大的 权重。
枝端是在每个阶段都能够应用的弱统计模型。枝端是2叶分类树,
其由根节点和二进制规则构成,其将情况分为两个相互排斥的子集
(即,叶节点)。规则可以采取形式"点击持续时间(ClickDuration) < 120秒",并且点击持续时间满足该规则的所有情况进入一个叶节点, 而不满足该规则的情况进入另一个叶节点。另一规则可以采取形式"广 告选择是最后广告选择",并且广告选择满足该规则的所有情况进入 一个叶节点,而不满足该规则的情况进入另一个叶节点。
可以使用各种算法来符合"提级枝端"模型,包括例如基于梯度 的方法。这样的算法可以如下进行给定一组权重,从所有可能的二
进制判定规则中(从将该情况分为两个叶子的会话特征中推到的)选 择一个将与该算法相关的(加权)损耗函数最小化的规则。损耗函数
的一些例子是与最大相似法对应的"伯努里式(Bernoulli)损耗"以及 与周知的ADABoost方法对应的"指数损耗"。在该阶段选择最佳二 进制判定规则之后,可以重新计算该权重,并可以重复该过程,借此 选择将新(加权)损耗函数最小化的最佳二进制规则。该过程可以被 重复许多次(例如,几百至几千)并且可以使用重采样法(例如,交 叉确认)来定义停止规则,以便于防止过符合。
提级枝端已经被显示为近似附加逻辑回归模型,因此每个特征都 对符合模型作出附加的非线性贡献(关于逻辑等级)。该枝端的序列 定义会话特征与广告被定级为"好"的概率之间的关系。该序列可以 用如下的统计模型表示
e(c0+c,*B(x) + c2'B2(x)+...)
1 + ,。",*BIW+C2'B2W+...) 等式(5)
其中如果会话特征x满足第k个二进制规则则Bk (x) =1,或者 如果会话特征x不满足第k个二进制规则则Bk (x) =0。该系数ck, k=l,...,是算法的副产品并且与在第k个二进制规则的好广告的可能 性相关。实际上,给定会话特征x,就可以估计每个二进制规则,并且 相应的系数被累计,以获得好广告的预测概率。可以类似地推导出与 上面的等式(5)类似的统计模型,其定义了会话特征与广告被定级为
"差"的概率之间的关系。
虽然上面已经描述了逻辑回归和提级枝端作为构造统计模型的示 范性技术,但是本领域技术人员应认识到也可以使用其他现有的统计 方法(例如回归树)来推导与本发明的原理一致的统计模型。
用于确定与广告质量相关的预测值的示范性过程 图14是根据与本发明的原理一致的实现的示范性过程的流程图, 用于确定与广告的质量相关的预测值。本领域技术人员可以理解,图 14中举例说明的过程可以被适当地以软件来实现并被存储在计算机可
读存储器中,诸如主存储器430、 ROM 440或服务器320或330或客 户端310的存储装置450。
该示范性过程可以从接收搜索査询开始(框1400)。用户可以向 服务器320发出搜索查询,用于由搜索引擎系统325执行。通过搜索 引擎系统325可以获得与所接收的搜索查询相匹配的一组广告(框 1405)。搜索引擎系统325可以根据所接收的搜索查询来执行搜索, 以确定该组广告,以及与该搜索査询匹配的其他文档。搜索引擎系统 325可以将该组广告集合以及其他文档的列表提供给发出该搜索请求 的用户。
可以获得与从该组广告中选择广告相关联的会话特征(框1410)。 可以在用户广告选择期间实时地测量会话特征,或者可以从与广告选 择相关联的已记录用户行为的日志中获得会话特征。如图15中所示, 用户可以选择1500与文档1510 (例如,包含搜索结果和相关广告的文 档)相关联的广告1505。可以响应于广告选择1505而将广告定着文档 1515提供给用户。如图15中所示,可以测量与广告1505的选择1500 相关联的会话特征1520。所测量的会话特征可以包括与广告选择相关 联的任意类型的用户行为,诸如上面关于框510所述(图5)。
上面的框520中推导出的统计模型以及所获得的会话特征可以被 用来确定表示该广告是好广告和/或差广告的预测值(框1415)。该预
测值可以包括概率值(例如,使用上面的等式(3)或(5)取得的), 表示具有与该广告的用户选择相关联的给定会话特征是好广告的概 率。该预测值还可以包括概率值(上面的等式(4)),表示具有与该 广告的用户选择相关联的给定测得会话特征是差广告的概率。因此, 可以将会话特征值输入到等式(3) 、 (4)和/或(5),以获得该所选 择的广告是好或差广告的预测值。例如,可以将用于会话特征x,, x2, X3和X4的值输入到等式(3),以获得P (good ad|session feature x,, x2, x3, x4)的概率值。如图15所示,可以将该所测量的会话特征1520 输入到统计模型130,并且该统计模型130可以输出对于广告1505的 预测值1530。
可以获得与广告选择相关联的广告/査询特征(框1420)。如图 15所示,可以获得与广告1505的选择1500相关联的广告/查询特征 1535。该广告/查询特征1535可以包括与广告1505的广告商相关联的 标识符(例如,广告商的可视统一资源定位符(URL))、广告1505 定向的关键字、用户发出的搜索查询中广告1505没有定向的词和/或用 户发出的搜索査询中广告没有定向但是与广告1505定向的词类似的 词。可以使用与本发明的原理一致的上面没有描述的其他类型的广告 或査询特征。例如,可以将组合(例如,两个对象/査询特征对)中观 査的任意上述广告/查询特征都用作单个广告查询/特征。
对于每个所获得的广告/查询特征(即,在上面框1420中获得的), 可以将所确定的预测值与对应于广告/査询特征的存储值求和(框 1425)。可以将所确定的预测值与存储在数据结构(诸如例如图16中 所示数据结构1600中)的值求和。如图16所示,数据结构1600可以 包括多个广告/査询特征1610-1至1610-N,其中"广告选择的总数" 1620、总"好的"预测值1630以及总"差的"预测值1640与每个广 告/査询特征1610相关联。可以将框1405中确定的每个预测值与存储
在条目1630或1640中、对应于每个广告/査询特征1610的当前值求和, 该广告/查询特征1610进一步与广告以及发布的查询相关联。作为例 子,假设响应于搜索查询"flowers formother,s day (母亲节的鲜花)" 而将"1800flowers.com"的广告提供给用户。与该广告选择相关联的 会话特征返回概率P (good ad|ad selection)为0.9。三个广告/查询特征 与该广告和査询相关联查询长度(査询中术语的数量)、广告的可 视URL以及在查询中但是不在与该广告相关联的关键字中的词的数 量。对于这三个广告/查询特征中的每一个,条目1620中相应的"广告 选择总数"值加1,并且将0.9加到存储在与每个广告/查询特征对应的 总好预测值1630中的每个值。
如图15中所示,可以将每个所确定的预测值1530与数据结构1600 中的当前值求和。 一个或多个用户可以选择地对广告的每个选择重复 框1400至1425,以利用与一个或多个广告/查询特征相关联的多个求 和后的预测值来扩充该数据结构1600。
示范性可能性估计过程
图17和18为示范性过程的流程图,用于通过使用在图14的框 1425中确定的总预测值1630或1640来估计与广告相关联的好或差质 量的可能性。本领域技术人员应理解,图17和18中所示范的过程可 以适当地以软件来实现并且可以存储在计算机可读存储器中,诸如主 存储器430、 ROM 440或服务器320或330或客户端310的存储装置 450上。
给定广告是好或差的所估计的可能性是该给定广告是好或差的在 先可能性以及与和给定广告选择相关联的广告/查询特征相关联的一个 或多个模型参数的函数。可以使用迭代过程来计算该模型参数,其中 该迭代过程试图解决用于产生好或差广告的预测可能性与训练所用的 实际历史数据的最佳拟合的参数值。
与每个广告/查询特征相关联的模型特征可以由单个参数构成,诸 如关于好广告或差广告的概率或可能性的放大系数。可替代地,每个 广告/査询特征可以具有与其相关联的多个模型参数,该多个模型参数 可以以更复杂的方式来影响好或差广告的预测概率。
在下面的说明书中,使用了各种可能性和概率。事件发生的可能 性以及事件发生的概率通过下面等式被关联起来概率=可能性/ (可 能性+l)。例如,如果事件发生的可能性为1/2 (即,按照经常所写 的方式,可能性为1: 2),则事件发生的相应概率为1/3。根据该约定, 可以认为可能性和概率是可以相互转换的。因为可能性可以取任何非 负值,而概率必须位于0和1之间,所以用可能性而不是概率来表达 计算是方便的。但是,应理解,仅需对下面的说明进行最小的改变, 即可以唯一使用概率、或者使用例如对数(可能性)的某种其他类似 的表示来执行如下的实现。
图17是示出了预测模型的一个实现的流程图,其中该预测模型用 于基于与该广告选择相关联的广告/查询特征来生成对于给定广告是好 还是差的可能性估计。根据本发明的原理的一个实现,可以通过将好 广告或差广告的预先可能性(qo)乘以与每个广告/查询特征(ki)相关 联的模型参数(nO来计算好或差广告的可能性,此后被称为可能性 乘法器。这样的方案可以被表示为
<formula>formula see original document page 28</formula>
本质上,对于每个广告/查询特征k的可能性乘法器m可以是在确 定广告是好还是差期间该广告/査询特征的预测能力的统计表示。
在与本发明的原理一致的一个实现中,可以不断地对上述模型参 数进行修改,以反映每个广告/査询特征k对于广告是好或差的估计可 能性的相关影响。可以通过如下方式来进行这样的修改,即将具有该 查询/广告特征的广告是好或坏的平均预测可能性(将给定广告/査询特 征忽略不计)与具有该广告/查询特征的广告的历史质量的估计进行比
较。通过这种方式,可以识别以及提炼出所分析的广告/查询特征k的 相关值。
具体地返回到图17,对于每个所选择的广告/查询特征(ki),可 以初始计算或识别平均自排除概率(P,)(动作1700)。在一个实现 中,该自排除概率(Pi)是表示所选择的广告/査询特征的相关性的值, 并且可以测量当从所估计的可能性计算中除去所选择的广告/查询特征 的模型参数(mi)时广告是好或差的结果可能性。例如,对于广告/査 询特征3,这可以表示为
尸3n +((《0-附|.附2,'"气)/附3《((《0.附r附2'附3…'附"V附3 + U
在一个实施例中,每个广告/查询特征的自排除概率可以被保持为 移动平均,以确保所识别的自排除概率在识别用于每个所选广告/查询
特征的模型参数之后更快的收敛。这样移动平均可以表示为 ^ (,)=《"一d (呵)+ (1 -《
其中a为统计定义变量,其非常接近于1 (例如,0.999)并被用 于控制移动平均的半衰期。如上面表达式所示,通过如在以前广告选 择(例如,n-l)确定的P,值对用于广告选择的当前数(n)(例如, 用于广告/査询特征ki的"广告选择总数"1620的当前值)的Pi值加权 和平均。
然后,可以将平均自排除概率(Pi (avg))与涉及所观测的广告 选择的数量以及用于所观测的选择而观测的好或差广告的可能性的历
史信息进行比较(动作1710)。然后,可以基于动作nio的比较来生
成或修改与所选择的广告/査询特征ki相关联的模型参数mi(动作1720) (如将在下面参照图18中的框1820和1830进一步描述的)。
图18是示出了图17的框1710-1720的一个示范性实现的流程图。 初始地,可以确定与好广告或差广告的可能性相关的置信区间(动作 1800)。使用置信区间技术使得在使用具有更少量历史数据的广告/査
询特征k时能够更准确和稳定地估计。在一个实现中,该置信区间包 括较低值Li和较高值Ui,并且基于广告选择的数量(ni)(例如,用
于广告/查询特征k,的数据结构1600中的"广告选择的总数"1620中 的当前值)以及对所选广告/査询特征观测的总好/差(ji)(例如,在 用于广告/査询特征k,的数据结构1600中的当前总"好"预测值1630 或总"差"预测值1640)。例如,该置信区间可以是80X置信区间[Li, U,],其是基于广告选择的数量(例如,在用于广告/查询特征ki的数据 结构1600中的"广告选择的总数"1620中的当前值)以及所观测的 总好或差(例如,用于广告虔询特征ki的数据结构1600中的当前总"好" 预测值1630或总"差"预测值1640)以常规方式计算的。在计算置信 区间之后,然后可以确定该平均自排除概率(Pi (avg))是否落在该 区间中(动作1810)。如果落在区间中,则可以确定所选择的广告/査 询特征(ki)对于好广告或差广告的可能性没有影响,并且可以将它的 模型参数(mi)设置为1,这非常有效地将其从所估计的可能性计算中 除去(动作1820)。但是,如果确定该Pi (avg)落在置信区间之外, 则可以将用于所选择的广告/查询特征kj的模型参数(mi)设置为将该 自排除概率(Pi(avg))置于置信区间中所必要的最小调整(动作1830)。 该计算可以算术地表示为
<formula>formula see original document page 30</formula>
现在返回到图17,在计算了用于所选择的广告/查询特征ki的模型 参数后,可以确定附加的广告/查询特征(例如,图16中的广告/查询 特征1610-1至1610-N的)是否还要被处理(即,ki是否小于km,其 中m等于在数据结构1600中的广告/查询特征的总数)。如果仍需要 处理附加的广告/查询特征,则可以增加计数器变量i,并且该过程可以 返回至动作1700,以处理下一广告/查询特征kj。在用于所有广告/査询 特征的模型参数都己经被计算或修改后,可以使用等式q-q。.m,.m2. !113....111111来估计好广告或差广告的可能性(动作1750)。可以将所估 计的好广告可能性(例如,ODDS (good ad|ad /query feature))存储 在与该广告/查询特征1610对应的数据结构1600的"好"广告可能性
条目1650中。可以将所估计的差广告可能性(例如,ODDS (badad|ad /query feature))存储在与该广告/査询特征1610对应的数据结构1600 的"差"广告可能性条目1660中。
在与本发明的原理一致的一个实现中,可以通过当日志数据到达 时对其进行处理并对上述统计进行累计(例如,广告选择、总好或差、 自包括概率等)来训练可能性预测模型。当附加的广告选择发生时, 与每个广告/査询特征相关联的置信区间可以收縮,并且该参数估计可
以变得更准确。在附加的实现中,通过重新处理旧的日志数据,可以 加速训练。在对日志数据进行重新处理时,可以通过使用最新的参数 或可能性乘数值来重新计算好广告或差广告的估计可能性。这允许预 测模型更快地收敛。
示范性广告质量预测过程
图19是根据与本发明的原理一致的实现的用于预测广告质量的 示范性过程的流程图。本领域技术人员应理解,图19中所示的过程可 以适当地以软件来实现并存储在计算机可读存储器中,诸如主存储器 430、 ROM 440或服务器320或330或客户端310的存储装置450中。
该示范性过程可以以从用户接收搜索查询开始(框1900)。用户 可以向服务器320发出搜索查询,以由搜索引擎系统325来执行。搜 索引擎系统325可以获得与所接收的搜索査询相匹配的一组广告(框 1910)。搜索引擎系统325可以基于所接收的搜索查询来执行搜索, 以确认该组广告以及与该搜索查询匹配的其他文档。对于该组广告中 的每个广告,可以确定与所接收的搜索査询以及广告对应的每个广告/ 查询特征(框1920)。用于每个搜索査询和广告对的广告/查询特征可 以包括与登广告商相关联的标识符(例如,广告商的可视统一资源定 位符(URL))、广告定向的关键字、用户发出的搜索查询中的没有 定向的词和/或用户发出的搜索查询中没有定向但是与广告定向的词类 似的词。也可以使用与本发明的原理一致的上面没有描述的其他类型
的广告或查询特征。例如,可以将组合(例如,两个广告/査询特征的 对)中观测的任意上述广告/查询特征用作单一广告査询/特征。
对于该组广告中的每一个广告,可以从数据结构1600中检索用于
所确定的广告/査询特征i的所存储的ODDS;(例如,ODDS (good adjad /query feature ) 1650, ODDS (bad ad|ad/query feature )1660)(框1930)。 如图20中所示,数据结构1600可以以广告/查询特征2000为索引,其 中该广告/査询特征2000对应于搜索查询和广告,以检索与每个广告/ 查询特征相关联的一个或多个ODDSi2010。例如,如图16中所示,可 以检索与每个广告/查询特征1610对应的"好"广告可能性值1650。 在另一个例子中,如图16所示,可以检索与每个广告/查询特征1610 对应的"差"广告可能性值1660。
对于该组广告中的每一个广告,可以将用于每个广告/查询特征i 的所检索的ODDSj相乘(框1940),以生成总ODDS值(ODDSt): ODDSt二ODDSJODDS^ODDS3… 等式(6)
例如,可以将对于每个广告/査询特征的"好"广告可能性值1650
相乘,以生成总好广告可能性值ODDSt—goodad。作为另一个例子,可
以将对于每个广告/查询特征的"差"广告可能性值1660相乘,以生成 总差广告可能性值ODDS^adad。如图20所示,可以将从数据结构1600 中检索的ODDS 2010相乘,以生成总可能性值ODDSt2020。
对于该组广告中的每个广告,可以通过如下等式来确定可以包括 该广告是好的概率(Pgoodad)和/或该广告是差的概率(Pbadad)的质 量参数(框1950):
Pgood ad = ODDSt—good ad/ (l+ODDSt—GooD ad) 等式(7)
Pbad ad = ODDStBAD AD/ (l+ODDStBADAD) 等式(8)
如在图20中所示,可以使用总的可能性值ODDSt 1820和等式(7)
或(8)来推导质量参数(P) 2030。推导出的质量参数P之后可以被
用于、例如,过滤、排名和/或提升,如在与本申请同一天提交、发明
名禾尔为"Using Estimated Ad Qualities for Ad Filtering, Ranking and Promotion"的同时待审的美国申请No.l 1/321,064中所描述的,通过引 用而将该申请全部合并于此。
结论
以上对本发明的优选实施例的描述提供了例证和说明,但并不意 欲穷举本发明或者将本发明限制为所披露的精确形式。可以按照上面
的教导或者从本发明的实践中获得对本发明的某些更改和变化。例如, 虽然己经参照图5、 14、和17-19描述了一系列动作,但是在与本发明 原理相一致的其他实现中可以修改这些动作的顺序。此外,互不依赖 的动作可以被并行执行。
除了上面参照图5描述的会话特征之外,在一些实现中可以可选 地使用转换跟踪来推导预测值与用户满意度之间的直接标度。当对广 告的选择直接导致了广告商认为有价值的用户行为(例如,用户购买) 时,就发生了转换。广告商或者为广告商寄放广告的服务可以跟踪对 于每个广告选择是否都发生了转换。例如,如果用户选择了广告商的 广告,并且随后在线购买了在响应于广告选择而提供给用户的广告定 着文档上显示的产品,则广告主或者寄放广告的服务可以记录关于该 广告选择的转换。该转换跟踪数据可以与所识别的广告选择相关联。 可以使用统计技术,例如,逻辑回归、回归树、提级枝端等来推导在 预测值与通过转换测得的用户满意度之间的直接标度。
对于本领域内的普通技术人员来说,在图中所示的实现中可以使 用软件、固件以及硬件的许多不同的形式来实现本发明如上所述的各 个方面。用于实现与本发明原理相一致的各个方面的实际软件代码或 专用控制硬件不会限制本发明。这样,没有参照特定软件代码来描述 各个方面的操作和行为,然而,可以理解的是,基于这里的描述,本
领域内的普通技术人员将能够设计软件和控制硬件来实现这些方面。
本发明申请中使用的元件、动作或指令等不应被构造为对本发明 来说是关键的或必不可少的,除非明确描述的确如此。而且,正如这 里所使用的,冠词"一"意欲包括一个或多个项目。在意图仅表示一 个项目的地方,使甩术语"一个"或类似用语。进一步,短语"基于" 意欲表示"至少部分基于",除非已明确地表示并非如此。
权利要求
1. 一种方法,包括确定与对多个广告的选择相关联的质量值,该质量值估计所述多个广告是好广告的可能性;聚合所述质量值;以及使用所聚合的质量值来预测另一个广告是好广告的将来的可能性。
2. 根据权利要求l所述的方法,其中,查询与对所述多个广告的 每个选择相关联。
3. 根据权利要求2所述的方法,进一步包括基于与对所述多个广告的选择相关联的一个或多个广告或查询特 征来聚合所述质量值。
4. 根据权利要求3所述的方法,其中,所述一个或多个广告或查 询特征中的每个包括与所述多个广告的每个广告的广告主相关联的标 识符、所述多个广告中的每个广告所定向的关键字、所述查询中所述 多个广告中的每个广告没有定向的词、或者所述査询中所述多个广告 中的每个广告没有定向但与所述多个广告中的每个广告所定向的词类似的词。
5. 根据权利要求3所述的方法,其中,聚合所述质量值包括 基于所述一个或多个广告或査询特征来索引数据结构,以存储所述质量值。
6.根据权利要求5所述的方法,进一步包括: 接收查询;获得与所述査询相关的一组广告;接收对所述一组广告中另一个广告的选择;并且 观测与对所述另一个广告的选择相关联的一个或多个第二广告或 查询特征。
7. 根据权利要求6所述的方法,其中,所述一个或多个第二广告 或査询特征包括以下各项中的至少一项与所述另一个广告的广告主 相关联的标识符、所述另一个广告所定向的关键字、所述查询中所述 另一个广告没有定向的词、或者所述査询中所述另一个广告没有定向 但与所述另一个广告所定向的词类似的词。
8. 根据权利要求6所述的方法,其中,使用所聚合的质量值来预 测另一个广告是好广告的将来的可能性包括基于所述一个或多个第二广告或査询特征从所述数据结构中检索 所聚合的质量值中的至少一些。
9. 一种方法,包括响应于搜索查询向用户提供一个或多个广告; 记录与对所述一个或多个广告的用户选择相关联的用户行为; 记录与所述一个或多个广告中被选择的广告相关联、或者与所述搜索查询相关联的特征;使用统计模型和所记录的用户行为来估计与所选择的广告相关联的质量分值;聚合所估计的质量分值;以及使用所聚合的质量分值来预测另一个广告的质量。
10. 根据权利要求9所述的方法,其中,在存储器中聚合所估计 的质量分值包括基于所记录的特征来索引数据结构,以存储所估计的质量分值。
11. 根据权利要求9所述的方法,其中,所记录的特征中的每一个包括以下各项中的至少一项与所述一个或多个广告中相应的广告 相关联的标识符、所述一个或多个广告中相应的广告所定向的关键字、 在所述搜索査询的査询中所述一个或多个广告中的每个广告没有定向 的词、以及所述搜索查询中所述一个或多个广告中的每个广告没有定 向但与所述一个或多个广告中的每个广告所定向的词类似的词。
12. —种方法,包括从用户接收搜索査询;基于所述搜索查询向用户提供一组广告;从所述用户接收从所述一组广告中选择广告的指示;记录与所述搜索査询或者与所选择的广告相关联的特征;使用所记录的特征从存储器中检索以往的质量分值;以及基于所检索的以往的质量分值来预测所选择的广告的将来的质
13.根据权利要求12所述的方法,其中,所记录的特征的每一个 包括以下各项中的至少一项与所选择的广告相关联的标识符、所述 所选择的广告所定向的关键字、在所述搜索查询中所述所选择的广告 没有定向的词、以及所述搜索查询中所述所选择的广告没有定向但与 所述所选择的广告所定向的词类似的词。
14.根据权利要求12所述的方法,其中,从存储器中检索以往的 质量分值包括-.使用所记录的特征来索引所述存储器中的数据结构,以检索以往 的质量分值。
15.根据权利要求12所述的方法,其中,根据所检索的以往的质 量分值来预测所选择的广告的将来的质量包括-将算法应用到所检索的以往的质量分值,以提供预测所述广告的 将来的质量的值。
16. —种系统,包括用于基于用户发出的搜索査询向所述用户提供多个广告的装置; 用于从所述用户接收从所述多个广告中选择广告的指示的装置; 用于记录与所述搜索査询或者与所选择的广告相关联的特征的装置;用于使用所记录的特征从数据结构中检索以往的质量分值的装 置;以及用于基于所检索的以往的质量分值来预测所选择的广告的质量的 装置。
17. —种存储计算机可执行指令的计算机可读介质,包括 用于确定与对广告的多个选择相关联的质量值的指令,其中每个质量值估计在第一环境下所述广告是好广告的可能性; 用于存储所述质量值的指令;以及使用所存储的质量值来预测在第二环境下所述广告是好广告的将 来的可能性,其中所述第二环境不同于所述第一环境。
全文摘要
一种系统,响应于搜索查询向用户提供一个或多个广告,并记录与用户对该一个或多个广告的选择相关联的用户行为。该系统也记录与该一个或多个广告中所选择的广告、或者与该搜索查询相关联的特征。该系统进一步使用统计模型和所记录的用户行为来估计与所选择的广告相关联的质量分值,并且聚合所估计的质量分值。该系统使用所聚合的质量分值来预测另一个广告的质量。
文档编号G06Q30/00GK101390118SQ200680053448
公开日2009年3月18日 申请日期2006年12月29日 优先权日2005年12月30日
发明者丹尼尔·赖特, 达利尔·普雷格波恩, 黛安娜·唐 申请人:谷歌公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1