使用广告商Web信息搜索对广告进行服务的制作方法

文档序号:6491733阅读:213来源:国知局
专利名称:使用广告商Web信息搜索对广告进行服务的制作方法
技术领域
本发明涉及做广告。本发明尤其涉及作为目标的广告服务。
1.2相关技术使用例如电视,无线广播,报纸和杂志的传统媒体的广告是众所周知的。不幸的是,即使准备有关于各种媒体销路的典型受众的人口统计研究和完全合理的假设,广告商仍认识到其大量广告预算仅仅是一种浪费。此外,难以识别和排除这种浪费。
最近,通过更加交互式的媒体进行的广告越来越普及。例如,随着使用因特网的人数迅速增长,广告商开始看好通过因特网提供的媒体和服务成为做广告的潜在有力方式。
广告商开发了若干策略以求这种广告的价值最大化。在一个策略中,广告商使用流行出场(popular presence)或提供交互式媒体或服务(在说明书中被称作″Web站点″而不失一般性)的手段作为获得大量受众的渠道。使用这个第一方案,广告商可以在例如纽约时报Web站点或今日美国Web站点的主页上放置广告。在另一策略中,广告商可以尝试把其广告作为更窄范围的观众的目标,从而增加受众的积极响应的可能性。例如,宣传Costa Rican雨林观光的代理可以在Yahoo Web站点的生态旅游(ecotourism-travel)子目录上放置广告。广告商通常人工确定这种目标。
另外,最近″搜索引擎优化″的行业已经出现,其中通常被称作搜索引擎优化者(″SEO″)的各方提供其服务,以帮助在线内容的所有者(包含在线广告商)使其Web站点在因特网搜索引擎返回的搜索结果中更加明显或突出。
基于Web站点的广告(也被称作″Web广告″)通常以″网页横幅广告(banner ads)″(即,包含图形成分的矩形框)的形式呈现给其广告观众。当广告受众的成员(在说明书中被称作″观看者″或″用户″而不失一般性)通过点击该广告来选择这些网页横幅广告中的一个时,嵌入式超文本链接通常将观看者指引到广告商的Web站点。这个其中观看者选择广告的过程通常被称作″点击(click-through)″(″点击″被用来涵盖任何用户选择。)。广告的点击数量与版面数量(即,显示广告次数)的比值通常被称作广告的″点击率″。在用户完成涉及先前服务的广告的事务处理时,就称发生了″转换(conversion)″。构成转换的内容可以因情况的不同而不同,并且可以以各种方式确定。例如,可以是这样的情况,其中在用户点击被称作广告商的Web页面的广告,并且在离开那个Web页面之前在那里完成购买时,发生转换。可选地,转换可以被定义为正为用户显示广告,并且用户在预定时间内(例如,7天)在广告商的Web页面上进行购买。在另一个候选中,广告商可以定义转换为任何可测量的/可观察的用户操作,例如,下载白皮书,至少浏览Web站点的指定深度,至少观看一定数量的Web页面,在一个Web站点或Web页面上至少花费预定数量的时间等等。通常,如果用户操作不指示已完成的购买,则尽管构成转换的用户操作不限于此,但是其可以指示销售线索(sales lead)。实际上,可以有许多其它有关构成转换的内容的定义。广告的转换数量与版面数量(即,显示广告次数)的比值通常被称作转换率。如果转换被定义为能够在自从广告服务开始的预定时间内发生,则转换率的一个可能定义可以只考虑在过去其服务已超过预定时间的广告。
不管基于Web站点的广告的前提条件如何,现有方案仍有若干问题。尽管广告商能够触及大量受众,但是他们经常不满意于其广告投资的回报。
类似地,在其上呈现广告的Web站点的主机(被称作″Web站点主机″或″广告客户″)面对最大化广告收入而不损害其用户体验的挑战。某些Web站点主机选择广告收入优先于用户利益。一个这种Web站点是″Overture.com″,其驻留返回化装为响应用户查询的″搜索结果″的广告的所谓″搜索引擎″服务。Overture.com Web站点允许广告商为其Web站点的广告在声称的搜索结果列表上位置更靠前而付费。如果实现广告商只在用户点击广告(即,每次点击费用)的情况下付费的模式,则由于目标性不佳的广告不会被点击并因此不需要付费,所以广告商缺少有效地将其广告作为目标的诱因。因此,每次点击的费用较高的广告显示在接近顶端或顶端,但是由于观看者不点击它们,所以不一定转换成广告发布者的真实收入。此外,观看者会点击的广告在列表更下方,或根本不在列表上,并且因而破坏广告的关联。
某些搜索引擎试图通过向Web站点所有者提供″付费置入″来增加收入。通过付费置入,Web站点可以向搜索引擎付费以保证Web站点被包含在响应用户查询而由搜索引擎索引/探查/返回的站点/属性的列表中(和/或增加搜索引擎探查/爬行(crawl)Web站点的频率)。通常,搜索引擎包含/混合根据付费置入确定的Web站点与它们确定的独立于付费置入的Web站点。然而,由于针对用户搜索或查询返回的搜索结果可能不包含最相关搜索结果和/或按照最相关顺序,所以这会降低最终用户(搜索者)的搜索体验。
某些搜索引擎,例如Google,已经允许广告商将其广告定为目标,使得它们与搜索结果页面一起呈现,并且使得它们可能与提示搜索结果页面的查询相关。尽管搜索结果页面为广告商提供很大的机会以把其广告作为更善于接受的受众的目标,他们通常需要广告商输入例如关键字目标确定信息的目标确定信息。某些广告商可能发现输入和/或维护关键字目标确定信息很困难,或至少很麻烦。例如,如果广告商销售许多不同产品,并且其产品报价频繁变化,则他们可能发现输入和维护关键字目标确定信息非常耗时。此外,某些广告商可能有选择正确关键字以最大化其广告性能的麻烦。其它作为目标的广告系统,例如那些基于电子邮件信息将广告作为目标的广告系统(参见,例如,2003年6月2日提交的标题为″SERVING ADVERTISEMENTS USINGINFORMATION ASSOCIATED WITH E-MAIL″并列出Jeffrey A.Dean,Georges R.Harik和Paul Bucheit的美国专利申请No.10/452,830(这里参考引用了该专利申请)描述的系统);或那些基于内容将广告作为目标的系统(参见,例如,2003年2月26日提交的标题为″SERVING ADVERTISEMENTS BASED ON CONTENT″并列出Darrell Anderson,Paul Bucheit,Alex Carobus,Claire Cui,JeffreyA.Dean,Georges R.Harik,Deepak Jindal及Narayanan Shivakumar的美国专利申请No.10/375,900(这里参考引用了该专利申请))可能有类似挑战。
因而,允许Web内容的所有者把广告作为目标和/或为其产品和服务做广告,但无需其输入和/或保持例如关键字的某些目标确定信息,这将是有用的。
2.发明内容本发明允许广告商把作为目标的广告放置在例如搜索结果页面、Web页面、电子邮件等等的各种内容上,或结合各种内容服务于广告,而无需广告商输入和/或维护例如关键字目标确定的某些目标确定信息。本发明可通过使用可用广告商信息(例如,从广告商的Web站点提取的项和/或短语)的可搜索数据结构(例如反向索引)来达到此目的。尤其是,本发明可以接受或产生搜索查询,并且使用搜索查询搜索匹配的广告商Web页面,并因此搜索匹配广告。在一个实施例中,搜索查询可用于搜索包含从广告商Web站点提取的字和/或短语的反向索引。广告商Web站点或Web页面的URL,或某个其它标识符,可以被用作搜索相关广告的关键字。尽管本发明不需要显式输入关键字目标确定信息,但是它可以忽略或结合这种信息来使用(如果存在)。
3.


图1是示出可以与广告系统交互的各方或实体的高层框图。
图2是示例性广告环境的泡式图,在该环境中本发明可以操作,或本发明可结合该环境来操作。
图3图解其中广告商能够把其广告作为搜索引擎产生的搜索结果页面、内容服务器服务的文档和/或电子邮件上的目标的环境。
图4是可以以符合本发明的方式执行的操作,以及产生、使用和/或存储的信息的泡式图。
图5是可以以符合本发明的方式用于生成广告商Web信息的可搜索数据结构的示例性方法的流程图。
图6是可以以符合本发明的方式至少使用广告商Web信息的可搜索数据结构来服务于广告的示例性方法的流程图。
图7是根据本发明的设备的高层模块图,该设备可以被用来执行可以使用的各种操作中的至少一些,并且存储可以使用和/或生成的信息中的至少一些信息。
图8是图解以符合本发明的方式使用至少广告商Web信息的可搜索数据结构来服务于广告的一种方式的消息框图。
4.具体实施方式
本发明可能涉及新颖的方法、设备、消息格式和/或数据结构,其允许广告商把作为目标的广告放置在(例如搜索结果页面,Web页面,电子邮件,等等)的各种内容上,或结合各种内容为广告服务,而无需广告商输入和/或维护例如关键字目标确定的某些目标确定信息。提供下列描述以允许本领域的技术人员实施和使用本发明,并且在特定应用及其需求的上下文中提供。对公开的实施例的各种修改对本领域的技术人员是明显的,并且下面提出的一般原则可被应用于其它实施例及应用。因而,本发明不限于示出的实施例,并且发明人将其发明视为所描述的任何可以取得专利的主题。
在下文中,在4.1节中描述了其中本发明可以操作的环境或本发明可结合操作的环境。接着,在4.2节中描述了本发明的示例性实施例。在4.3节中提供操作的例子。最后,在4.4节中提出涉及本发明的某些结论。
4.1其中本发明可以操作的环境或本发明可结合操作的环境4.1.1示例性广告环境图1是广告环境的高层图例。环境可以包含广告输入、维护及传送系统120。广告商110可以直接或间接地输入、维护及跟踪系统120中的广告信息。广告可以具有例如所谓网页横幅广告的图形广告、纯文本广告、图像广告、音频广告、视频广告、组合任何这种成分的一个或多个的广告的形式。广告也可以包含嵌入式信息,例如链接和/或机器可执行指令。广告客户130可以提交广告请求到系统120,接受来自系统120的响应该请求的广告,并且提供使用信息给系统120。除了广告客户130之外的实体可以发起广告请求。尽管未示出,其它实体可以向系统120提供使用信息(例如,是否发生涉及广告的转换或点击)。这个使用信息可以包含测量或观察的、涉及已经服务的广告的用户行为。
广告客户130的一个例子是一般内容服务器,其接收对文档(例如,文章,讨论线索,音乐,视频,图形,搜索结果,Web页面列表等等)的请求,并且响应请求或服务而检索所请求的文档。内容服务器可以向系统120提交广告请求。这种广告请求可以包含期望广告的数量。广告请求也可以包含文档请求信息。这个信息可以包含文档本身(例如页面),对应于文档或文档请求的内容的类别(例如,艺术,商业,计算机,艺术-电影,艺术-音乐等等),部分或所有文档请求,内容年代,内容类型(例如,文本,图形,视频,音频,混合媒体等等),地理定位信息等等。
内容服务器可以组合所请求的文档与通过系统120提供的一或多个广告。包含文档内容和广告的这个组合信息被接着传递到请求文档的最终用户以呈现给用户。最后,内容服务器可以把关于广告及广告将怎样、何时和/或在哪里呈现(例如,位置,点击或不点击,版面时间,版面日期,大小,转换或不转换等等)的信息发送回到系统120。可选或另外地,这种信息可以通过某些其它手段提供回到系统120。
广告客户130的另一个例子是搜索引擎。搜索引擎可以接收对搜索结果的查询。作为响应,搜索引擎可以检索相关搜索结果(例如,从Web页面的索引中检索)。在澳大利亚,布里斯班的第七届国际环球网会议上S.Brin和L.Page的文章″The Anatomy of a Large-ScaleHypertextual Search Engine″,及美国专利No.6,285,999(这里参考引用了两者)中描述了示例性搜索引擎。这种搜索结果可以包含例如Web页面标题的列表,从那些Web页面提取的文本摘录,及到那些Web页面的超文本链接,并且可以分组成预定数量(例如10)的搜索结果。
搜索引擎可以向系统120提交广告请求。请求可以包含一定数量的期望广告。这个数量可以取决于搜索结果,搜索结果占用的屏幕或页面空间的量,广告的大小和形状等等。在一个实施例中,期望广告的数量是从一到十个,并且最好是三到五个。广告请求也可以包含查询(所输入或分析的),基于查询的信息(例如地理定位信息,查询是否来自分支机构,及这种分支机构的标识符),和/或与搜索结果相关或基于搜索结果的信息。这种信息可以包含例如涉及搜索结果的标识符(例如,文档标识符或″文档ID″),涉及搜索结果的得分(例如,诸如对应于查询和文档的特征向量的点积的信息检索(″IR″)得分,页面排名得分,和/或IR得分和页面排名得分的组合),从所识别文档(例如,Web页面)提取的文本的摘录,所识别文档的全部文本,所识别文档的特征向量等等。
搜索引擎可以组合搜索结果与通过系统120提供的一或多个广告。包含搜索结果和广告的这个组合信息被接着传递到提交搜索的用户,以呈现给用户。优选地,保持搜索结果区别于广告,以便不使用户混淆付费广告和可能中性的搜索结果。例如,广告可以具有与其搜索结果不同的格式(例如形状,样式,字体,大小等等)。可选或另外地,搜索结果可以呈现在文档的第一连续部分,同时广告可以呈现在文档的第二连续部分(其中第一和第二部分不重叠)。
最后,搜索引擎可以把关于广告及广告将何时、在哪里和/或怎样呈现(例如,位置,点击或不点击,版面时间,版面日期,大小,转换或不转换等等)的信息发送回到系统120。可选或另外地,这种信息可以通过某些其它手段提供回到系统120。
根据上述可以理解,广告输入、维护和传送系统120可以服务于例如内容服务器和搜索引擎的广告客户130。如上面1.2节所述,对作为搜索引擎生成的搜索结果页面的目标的广告的服务是已知的。如在2003年2月26日提交的并且列出Darrell Anderson,Paul Bucheit,AlexCarobus,Claire Cui,Jeffrey A.Dean,Georges R.Harik,DeepakJindal和Narayanan Shivakumar为发明人的标题为″SERVINGADVERTISEMENTS BASED ON CONTENT″的美国专利申请No.10/375,900中所讨论的,也可以为作为通过内容服务器提供服务的文档的目标的广告提供服务。例如,参考图3的示例性环境,网络或互联网络360可以包含广告服务器320,其响应来自具有待售广告位的搜索引擎332的请求而为作为目标的广告提供服务。假定互联网络350是Web。搜索引擎332爬行更多或所有内容350。这个内容350的某些334会包含可用广告位(也被称作″库存″)。更具体地,一或多个内容服务器336可以包含一或多个文档340。即使文档不包含显式定义的可用广告位,可以确定在文档中,或结合文档(例如,在文档前景部分的窗口(被称作″弹出式窗口″)中,在文档背景部分的窗口(被称作″下弹式窗口″)中,等等)对广告提供服务。广告可以部分或全部地遮盖文档,与文档共享屏幕空间,从文档得到屏幕空间,被文档部分或全部地遮盖,等等。
仍然参考图3,电子邮件服务器392(例如,MicrosoftNetwork(MSN)HotMail,Yahoo Mail等等)可以通常考虑作为内容服务器,其中服务的文档简单为电子邮件390a。此外,电子邮件应用程序394(例如,Microsoft Outlook)可以被用来发送和/或接收电子邮件390b。因此,参考图1和3,电子邮件服务器392或应用程序394可以考虑作为广告客户130。因而,电子邮件390可以考虑作为文档,并且可以结合这种文档对作为目标的广告提供服务。例如,可以在电子邮件中,在电子邮件下,在电子邮件上,或结合电子邮件对一或多个广告提供服务。尽管某些电子邮件服务器,例如Yahoo邮件服务器,在电子邮件中对广告提供服务,但是这些广告是未作为目标的,因此也不会作为被确定为目标的广告来执行(例如,根据用户选择)。
4.1.2示例性广告输入、维护和传送环境图2图解了本发明可用于的示例性广告系统120′。示例性广告系统120’可以包含库存系统210,并且可以存储广告信息205及使用信息245。示例性系统120’可以支持广告信息输入和管理操作215,活动(例如,确定目标)支持操作220,帐户和开帐单操作225,广告服务器操作230,关联确定结果操作235,优化操作240,相对呈现属性分配(例如,位置定序)操作250,欺诈检测操作255,及结果接口操作260。
广告商110可以通过如接口216所示的广告信息输入和管理操作215与系统120′接口。广告客户130可以通过如接口231所示的广告服务器操作230与系统120′接口。广告客户130和/或其它实体(未示出)也可以通过如接口261所示的结果接口操作260与系统120′接口。
广告节目可以包含涉及帐户,活动,创意,目标确定等等的信息。术语″帐户″表示指定广告商的信息(例如,唯一电子邮件地址,口令,记帐信息等等)。″活动″或″广告活动″表示一或多个广告的一或多个组,并且可包含开始日期,结束日期,预算信息,地理目标确定信息,企业联合组织信息等等。例如,Honda可以为其汽车产品线做一个广告活动,并且单独为其摩托车产品线做广告活动。其汽车产品线的活动具有一或多个广告组,每个组包含一或多个广告。每个广告组可以包含目标确定信息(例如,一组关键字),和最大成本(每次点击费用,每次转换费用),尽管如以上所指出的,本发明避免了广告商输入目标确定关键字的需要。可选或另外地,每个广告组可以包含平均成本(例如,每次点击的平均成本,每次转换的平均成本,等等)。因此,单个最大成本和/或单个平均成本可与一或多个关键字相关。如上所述,每个广告组可以具有一或多个广告或″创意″(即,最终呈现给最终用户的广告内容)。每个广告也可以包含到URL的链接(例如,登陆Web页面,例如广告商的主页,或与特定产品或服务相关的Web页面)。自然地,广告信息205可以包含或多或少的信息,并且可以用若干不同方式组织。
广告信息205可以通过广告信息输入和管理操作215输入和管理。活动(例如,目标确定)支持操作220可以被用来帮助广告商110产生有效广告活动。例如,活动支持操作220可以使用通过库存系统210提供的信息,该系统在用于搜索引擎的广告环境中可以跟踪所有可能广告版面,已经预订的广告版面,及可用于指定关键字的广告版面。广告服务操作230可以服务于来自广告客户130的广告请求。广告服务操作230可以使用关联确定操作235以确定指定请求的候选广告。广告服务操作230可以接着使用优化操作240以选择一或多个候选广告的最终集合。广告服务操作230可以接着使用相对呈现属性分配操作250以排序要返回的广告的呈现。会计/开帐单操作225可以被用于跟踪涉及广告服务的计费,并且对广告商的开帐单。欺诈检测操作255可用于降低(例如,广告商)对广告系统的欺诈使用,例如通过使用盗窃的信用卡。最后,结果接口操作260可以被用于接受关于实际服务的广告的结果信息(来广告客户130或某些其它实体),例如点击是否发生,转换是否发生(例如,做广告的项目或服务的销售是否在从广告呈现开始的预定时间内被发起或完成),等等。这种结果信息可以在接口261处被接受,并且可以包含标识广告和服务广告的时间的信息,以及相关结果。
4.1.3定义例如在参照图1和2描述的示例性系统或任何其他系统中使用的那些广告的在线广告可以具有各种固有特征。这种特征可以被应用程序和/或广告商指定。在下面这些特征被称作″广告特征″。例如,在文本广告的情况下,广告特征可以包含标题行,广告文本及嵌入式链接。在图像广告的情况下,广告特征可以包含图像,可执行代码及嵌入式链接。根据在线广告的类型,广告特征可以包含一或多个以下特征文本,链接,音频文件,视频文件,图像文件,可执行代码,嵌入式信息等等。
当在线广告被服务时,一或多个参数可以被用于描述广告怎样,何时和/或在哪里服务。在下面这些参数被称作″服务参数″。服务参数可以包含例如一或多个以下特征在其上对广告提供服务的页面(包含其上信息)的特征,与广告的服务相关的搜索查询或搜索结果,用户特征(例如,其地理位置,用户使用的语言,使用的浏览器类型,前面的页面视图,以前行为),发起请求的驻留或分支机构站点(例如AmericaOnline,Google,Yahoo),广告在对其提供服务的页面上的绝对位置,广告相对于所服务的其它广告的位置(空间或时间),广告的绝对大小,广告相对于其它广告的大小,广告的色彩,所服务的其它广告的数量,所服务的其它广告的类型,每天服务的时间,每星期服务的时间,每年服务的时间等等。自然,存在可以在本发明的环境中使用的其它服务参数。
尽管服务参数可以是广告特征的非本征特征,但是它们可以作为服务条件或约束与广告相关。当用作服务条件或约束时,这种服务参数被简单称作″服务约束″(或″目标确定条件″)。例如,在某些系统中,通过指定只在平日,不低于某个位置,只对某个位置的用户提供服务等等,广告商能够指定其广告的服务的目标。作为另一例子,在某些系统中,广告商可以指定仅在页面或搜索查询包含某些关键字或短语的情况下对其广告提供服务,尽管,如上面所指,本发明避免了广告商输入目标确定关键字的需要。作为另一个例子,在某些系统中,广告商可以指定仅在所服务的文档包含某些话题或概念,或落入一个特定词组或多个词组或某个其它分类或多种分类的情况下对其广告提供服务。
″广告信息″可以包含广告特征,广告服务约束,可从广告特征或广告服务约束导出的信息(称作″广告导出信息″),和/或涉及广告的信息(被称作″广告相关信息″),以及这种信息的扩展(例如,从广告相关信息导出的信息)的任意组合。
″文档″被广义解释为包含任何机器可读及机器可存储的工作产品。文档可以是文件,文件的组合,具有到其它文件的嵌入式链接的一或多个文件,等等;文件可以是例如文本,音频,图像,视频等等的任何类型。要呈现给最终用户的文档的部分可以被认为是文档的″内容″。文档可以包含″结构化数据″,其包含内容(单词,图片等等)和该内容的含义的某种指示(例如,电子邮件字段及相关数据,HTML标签及相关数据,等等)。文档中的广告位可以通过嵌入式信息或指令定义。在因特网的环境中,公共文档是Web页面。Web页面通常包含内容并且可以包含嵌入式信息(例如元信息,超链接等等)和/或嵌入式指令(例如JavaScript等等)。在许多情况下,文档具有唯一、可寻址的存储位置,并且因此可以通过这个可寻址位置被唯一标识。统一资源定位符(URL)是用于访问因特网上的信息的唯一地址。
″文档信息″可以包含文档中包含的任何信息,从文档中包含的信息导出的信息(被称作″文档导出信息″),和/或涉及文档的信息(被称作″文档相关信息″),以及这种信息的扩展(例如,从相关信息导出的信息)。文档导出信息的例子是基于文档的文本内容的分类。文档相关信息的例子包含来自链接到即时文档的其它文档的文档信息,以及来自即时文档链接到的其它文档的文档信息。
来自文档的内容可以被呈现在″内容呈现应用程序或设备″上。内容呈现应用程序的例子包含因特网浏览器(例如,Explorer或Netscape),媒体播放器(例如,MP3播放器,Realnetworks流音频文件播放器,等等),查看器(例如,Abobe Acrobat pdf阅读器),等等。
″内容所有者″是对文档的内容具有某种所有权的个人或实体。内容所有者可以是内容的作者。另外,或可选地,内容所有者可以具有再现内容的权利,准备内容的衍生作品的权利,公开显示或执行内容的权利,和/或内容的其它规定权利。尽管内容服务器可以是其服务的文档的内容的内容所有者,但这不是必要的。
″用户信息″可以包含用户行为信息和/或用户简表信息,例如2003年6月2日提交并且列出Steve Lawrence,Mehran Sahami和AmitSinghal作为发明人、标题为″SERVING ADVERTISEMENTS USINGUSER REQUEST INFORMATION AND USERINFORMATION″的美国专利申请No.10/452,791中所描述的。这里参考引用了这个专利申请。
″电子邮件信息″可以包含电子邮件(也被称作″内部电子邮件信息″)中包含的任何信息,可从电子邮件中包含的信息导出的信息和/或涉及电子邮件的信息,以及这种信息的扩展(例如,从相关信息导出的信息)。从电子邮件信息导出的信息的例子是响应由从电子邮件主题行提取的项组成的搜索查询而返回的从搜索结果提取的或从搜索结果导出的信息。涉及电子邮件信息的信息的例子包含关于指定电子邮件的相同发送方发送的一或多个其它电子邮件的电子邮件信息,或关于电子邮件接收方的用户信息。从电子邮件信息导出或涉及电子邮件信息的信息可以被称作″外部电子邮件信息″。
现在在4.2节中描述本发明的各种示例性实施例。
4.2示例性实施例图4是可以以符合本发明的方式执行的操作,及可产生、使用和/或存储的信息的泡式图。广告服务器操作420可以接受搜索查询410(例如,来自广告客户430)。可选地,广告服务器操作420可以确定例如广告客户430或用户的一方所感兴趣的信息。例如,这个信息从可以与该方相关的电子邮件或文档中提取,例如从主题字段,基于从文档提取的信息,例如从类似标题的某个结构化数据字段提取的信息等等。在本发明的一个实施例中,可以类似于搜索查询410地对待及处理这个信息。
广告服务器操作420可以接着把搜索查询410(或其某种派生)前进到搜索操作440。搜索操作440搜索可搜索数据结构。在本发明一个实施例中,可搜索数据结构可以包含广告商Web信息(这里示出为从广告商Web站点或Web页面提取的单词和/或短语的反向索引)460。可包含标识符(例如Web站点或Web页面URL,或某广告商标识符)的搜索结果被接着提供回到广告服务器操作。搜索结果可以按某种方式(例如,基于信息检索(″IR″)得分和/或页面排名等等)进行记分和/或排序。
广告服务器操作420可以使用一或多个搜索结果以从存储的广告信息470中获得一或多个广告(或广告标识符)。例如,该一或多个搜索结果的每个的广告商ID或Web站点/Web页面标识符可以被用作从广告信息470中查找一或多个广告的关键字。注意,尽管示出广告信息470为包含关键字目标确定信息,但是这种信息不是本发明所必需的。广告服务器操作420可以使用除了该一或多个搜索结果之外的信息(例如,地理定位目标确定信息,时间目标确定信息,用户信息,广告商信息,价格信息,广告性能信息等等)从存储的广告信息470中获得一组一或多个广告(或广告标识符)。因而,选择广告的基础可以包含查询无关成分和/或查询相关成分。查询无关条件判断广告(或Web站点,或Web页面),而无论实际查询如何。查询相关条件是只针对于例如传统IR相似测量的特定查询而确定的得分。
广告服务器操作420可以接着服务于一或多个广告中的至少某些480。可以使用或尤其使用通过搜索操作440提供的相应搜索结果得分或顺序来对广告进行计分和/或排序,即使这种计分和/或排序不是必要的。得分也可以反映刚才讨论的其它信息。
在本发明的一个具体实施例中,其中结合搜索结果490对作为目标的广告提供服务,搜索操作440(或其实例)可以是广告客户430。在这种情况下,搜索操作440也可以搜索一般Web内容的索引(例如,从被爬行的Web站点提取的单词的反向索引)450。在这种实施例中,搜索设备基础设施及技术可以有利地加以利用以执行一般内容搜索和广告商搜索。
在上述例子中,假定存在广告商Web站点/Web页面信息的索引460。基于本发明的一个方面,可以产生和/或维护对应于或与内容所有者(例如期望销售其产品和/或服务的内容所有者,例如广告商)相关的信息的这种索引。例如,使用在澳大利亚布里斯班的第七届国际环球网会议,S.Brin和L.Page的″The Anatomy of a Large-ScaleHypertextual Search Engine″(这里参考引用了该文章)中描述的原理产生这种索引。在一个实施例中,单独索引只索引对应于或与那些内容所有者相关的内容,这些内容所有者已表达与赞助的或付费广告服务关联的期望(例如,已与广告商索引的经营者达成付费契约协议的广告商)。也可以使用严格规定的搜索引擎原理更加一般地产生广告商索引。尽管这种原理被本领域技术人员较好地理解,但是为方便经验较少的阅读者,这里进行简要描述。
通用搜索引擎的一个目标是索引相当大部分的Web。已知搜索引擎通常包含三个主要部分--爬行器,索引器和查询处理器。爬行器(通常也被称作″蜘蛛″或″机器人″)通过从一组开始页面递归获取链接来收集文档。爬行器可以根据例如涉及跟随哪些链接,怎样深地搜索各种Web站点等等的策略进行操作。索引器处理通过爬行器收集的Web页面。在索引器决定索引哪个收集的页面之后(例如,可以丢弃重复的文档),接着建立表示Web页面的各种数据结构。多数搜索引擎建立反向索引数据结构的某种变型。索引器可以根据涉及索引哪些单词,大写词干形成,是否存储文档内的位置等等策略来进行操作。索引器也可以建立附加数据结构,类似于存储原始页面的库,存储超链接的Web图示,存储相关页面的相关页面查找器等等。查询处理器处理用户查询,并且按计分或排名算法确定的顺序返回匹配答案。更具体地,查询处理器把输入转换成标准格式(例如小写项),使用索引寻找匹配文档,并且把它们排序(排名)。
回到图4,可以如同下述产生广告商Web站点/Web页面信息的索引460。爬行器配有来自广告信息470的广告商Web页面URL(例如,Web站点的主页和/或登陆页面等等)的列表,以决定要爬行哪些页面。索引器可以接着建立查询时需要的所有数据结构。这些可以包含反向索引,URL数据库,和/或其它数据结构。在一个实施例中,针对每个单词,反向索引包含含有该单词的所有文档(例如,Web页面)的列表,可能还有文档中该单词的位置。这个列表可以按字典方式排序。数据结构462图解了具有项和相关的{文档ID,项计数}对的索引。为了节省空间,在索引和其它数据结构中文档可以用文档ID或广告商ID表示。如果这样做,则例如464的单独数据结构可以被用于把文档ID映射到例如URL的Web页面标识符。如上所述,包含文档ID,Web页面ID,或广告商ID的搜索结果可以被用作在广告信息470中查找广告(或广告标识符)的关键字。为了简化这个查找,可以提供与使Web页面ID(例如,URL)与一个广告或多个广告相关的数据结构,例如472。
图5是可以以符合本发明的方式用于产生广告商信息的可搜索数据结构的示例性方法500的流程图。接受或检索广告商Web站点/Web页面信息。(块510)接着,在离开方法500(节点530)之前,使用至少一些检索的信息建立至少一些检索的信息的可搜索数据结构(块520)。在下面的4.2.1节中描述执行这个方法的示例性实施例的细节。
图6是使用至少广告商Web信息的可搜索数据结构,以符合本发明的方式,用于对广告提供服务的示例性方法600的流程图。接受或产生搜索查询。(块610)接着使用搜索查询搜索广告商Web信息的可搜索数据结构(例如,从广告商Web站点/Web页面提取的项的反向索引)。(块620)接受搜索结果(其可以包含得分和/或排名)。(块630)最后,在离开方法600之前(节点650),至少使用所接受的搜索结果检索一或多个广告(块640)。可以使用搜索结果的得分和/或排名对所检索的广告进行排序和/或计分。
4.2.1产生广告商Web页面信息的可搜索数据结构的示例性技术回忆图5的块510,可以检索广告商Web站点/Web页面信息。在本发明的一个示例性实施例中,这可以通过以下方式执行(i)从前面输入和存储的广告信息(回忆例如图2的205和图4的470)获得广告商Web页面URL(其可以是广告商Web站点的主页,或登陆页面等等),(ii)依照某个爬行策略(例如,只提取主页,只提取登陆页面,只提取主页和登陆页面,提取连接到和/或来自主页和/或登陆页面的所有页面,提取广告商Web站点的所有页面等等)爬行广告商Web页面,及(iii)根据某种策略提取各项或其它信息。
回忆图5的块520,可以建立至少一些所检索信息的可搜索数据结构。在本发明的一个示例性实施例中,已知索引技术被用于建立按项进行关键字索引的反向索引。反向索引的每个项可以包含一或多个{文档ID,项计数}对。(回忆例如图4的462。)文档ID可以是(Web站点主页面,登陆页面等等的)广告商Web页面URL。可选地,文档ID可以是较短的值,具有单独数据结构,该数据结构具有各个记录,每个记录把文档ID与URL关联。(回忆例如图4的472)。
4.2.2使用广告商Web信息的可搜索数据结构对广告提供服务的示例性技术回忆图6的块610,接受或产生搜索查询。如果要结合搜索结果页面对广告提供服务,则搜索查询可以仅仅是最终用户提交到搜索引擎的原始搜索查询,或其派生。如果要结合例如Web页面的文档对广告提供服务,则可以通过从Web页面提取项来产生搜索查询。所提取的项可以来自于内容,和/或来自于元数据。所提取的项可以来自于选择性结构化数据(例如,来自标题,和/或来自头的项,等等)。如果要结合例如电子邮件的文档对广告提供服务,则可以通过从电子邮件提取项来产生搜索查询。所提取的项可以来自于电子邮件的主体,和/或来自某个结构化字段(例如,来自″主题″行的项)。
回忆图6的块620和630,使用搜索查询搜索广告商Web站点/Web页面信息的可搜索数据结构,并且接受搜索结果。进一步回忆,可搜索数据结构可以是反向索引。因而,在一个实施例中,搜索引擎可用于从广告商Web站点/Web页面搜索信息的反向索引。如果要使用搜索结果页面对广告提供服务,则搜索引擎可以搜索一般Web内容的索引和广告商Web站点/Web页面信息的索引。(回忆例如图4的450和460。)可以使用相同搜索引擎,或搜索引擎的不同实例。广告商Web站点/Web页面信息的索引可以被包含在一般Web内容的索引内。在这种情况下,广告商Web页面应该以某种方式从一般Web内容中识别出或可区分。因而,本发明可以利用现有搜索引擎技术和设备,即使这并不必要。
最后,从图6的块640回忆,可以至少使用所接受的搜索结果来检索广告。在本发明的一个示例性实施例中,这可以通过使用搜索结果URL作为广告商信息的索引关键字以查找相关广告来实现。(回忆例如图4的472。)至少使用通过搜索广告商Web站点/Web页面信息索引而返回的得分和/或排名来对广告进行计分和/或排名。这种搜索结果得分和/或排名可以反映,尤其是反映已知信息检索相似度计量。除了作为搜索结果得分的函数之外,可以使用以下之中的至少一或多个对广告提供服务,计分和/或排名(i)目标确定信息(包含或排除关键字),(ii)价格信息(例如,出价,最大出价,等等),(iii)广告性能信息(例如,点击率,转换率,用户排名,第三方排名,等等),(iv)广告商质量信息,和/或(v)用户信息,等等。
4.2.3改进和可选方式尽管广告商Web站点/Web页面信息的搜索结果可以包含可以接着被用于从广告信息中查找广告的URL,但是其它标识符也可以被用于这个目的(即,把相关广告商Web页面信息与广告匹配)。
尽管搜索结果被用于查找相关广告,但是它们可用于查找相关广告组或广告活动。
尽管关键字目标确定不需要被提供为广告信息,但是如果这种信息被提供,则它可与搜索结果URL组合被用于确定要提供服务的一组广告。实际上,某些广告可能具有关键字目标确定信息,而其它广告可能不具有这种关键字目标确定信息。本发明可用于帮助寻找未提供其目标确定信息的相关广告,而关键字目标确定(使用或者未使用这里描述的技术)可以被用于寻找为其提供这种信息的相关广告。
尽管把本发明描述为搜索广告商Web信息,但是其它广告商信息可以被搜索以寻找相关广告商或相关广告商信息,并因此搜索相关广告。
4.2.5示例性设备图7是可以执行上述一或多个操作的设备700的高层模块图。设备700基本上包含一或多个处理器710,一或多个输入/输出接口单元730,一或多个存储设备720,和利于所连接的单元间的信息通信的一或多个系统总线和/或网络740。一或多个输入设备732和一或多个输出设备734可以与一或多个输入/输出接口730连接。
一或多个处理器710可以执行机器可执行指令(例如,可从SunMicrosystems Inc.,Palo Alto,California得到的Solaris操作系统上运行的C或C++,或可从例如Red Hat,Inc.,Durham,North Carolina的若干提供商得到的Linux操作系统)以实现本发明的一或多个方面。至少一部分机器可执行指令可以被存储(临时或更加永久地)在一或多个存储设备720中,并且/或可以通过一或多个输入接口单元730从外部源接收。
在一个实施例中,机器700可以是一或多个常规个人计算机。在这种情况下,处理单元710可以是一或多个微处理器。总线740可以包含系统总线。存储设备720可以包含系统存储器,例如只读存储器(ROM)和/或随机访问存储器(RAM)。存储设备720也可以包含从硬盘读取和写入硬盘的硬盘驱动器,从磁盘读取或写入(例如,可移动)磁盘的磁盘驱动器,及从例如光盘或其它(磁性)光学介质的可移动(磁)光盘读取或写入的光驱。
用户可以通过例如键盘和点击设备(例如鼠标)的输入设备732把命令和信息输入到个人计算机。
也可以(或可选地)包含例如话筒,操纵杆,游戏垫,圆盘卫星电视天线,扫描仪等等的其它输入设备。这些和其它输入设备通常通过连接到系统总线740的适当接口730连接到处理单元710。输出设备734可以包含监视器或其它类型的显示设备,其也可以通过适当接口被连接到系统总线740。除了(或代替)监视器之外,个人计算机可以包含其它(外设)输出设备(未示出),例如扬声器和打印机。
广告服务器操作和搜索操作可以由一或多个设备700执行,并且各种信息可以存储在一或多个设备700上。
4.3示例性操作图8图解了使用至少广告商信息的可搜索数据结构,以符合本发明的方式,对广告提供服务的一个方式的消息图。在这个具体例子中,结合搜索结果页面对一或多个广告提供服务,并且相同搜索查询和搜索引擎被用于产生搜索并且利于广告的选择。当搜索引擎820接收查询830时,搜索引擎使用单词和/或短语832获得使用广告商Web站点/Web页面信息822的索引的搜索结果836。搜索结果836可以包含相关(例如,匹配)广告商Web页面(例如,其Web站点的主页面,或登陆页面等等)的URL。搜索引擎也使用单词和/或短语834(其可以与单词和/或短语832相同或不同)获得使用一般内容(例如,Web的多个Web站点和/或Web页面)824的索引的搜索结果846。搜索结果846可以包含URL和相关(例如,匹配)Web站点和/或Web页面的链接。搜索结果846也可以包含其它信息,例如来自Web站点或Web页面的查询相关摘录,相关指示符等等。
搜索引擎820可以接着把相关广告商Web站点和/或Web页面838的一或多个URL传递到广告服务器810。广告服务器810可以使用至少一或多个URL 840中的某些在广告信息815中查找广告842。广告服务器810可以接着把至少某些广告844返回到搜索引擎820。广告844可以包含得分或排名。
搜索引擎820可以接着对提交搜索查询830的用户提供搜索结果和广告848服务。
4.4结论可以从上述公开中理解,本发明可用于允许广告商把确定目标的广告放置在例如搜索结果页面,Web页面,电子邮件等等的各种内容上,或结合各种内容对广告提供服务,而无需广告商输入和/或维护例如关键字目标确定的某个目标确定信息。由于索引,搜索查询,和/或搜索引擎基础设施和技术可以利用,所以本发明尤其用于确定要结合搜索结果页面提供服务的广告。发明人考虑到一或多个上述方面或示例性实施例可以共同使用。
权利要求
1.一种方法,包括a)接受搜索查询;b)搜索包含广告商Web页面信息的可搜索数据结构;c)接受搜索结果;d)使用接受的搜索结果的至少一部分检索至少一个广告。
2.如权利要求1所述的方法,其中可搜索数据结构是反向索引。
3.如权利要求2所述的方法,其中反向索引包含记录,每个记录包含项和一或多个Web页面标识符。
4.如权利要求2所述的方法,其中反向索引包含记录,每个记录包含项和一或多个对,每个对包含Web页面标识符和项计数。
5.如权利要求2所述的方法,其中反向索引包含记录,每个记录包含从广告商Web页面提取的项,和标识该项出现在的广告商Web页面的一或多个Web页面标识符。
6.如权利要求1所述的方法,其中从一组广告商信息中检索该至少一个广告,该组广告商信息包含标识广告商Web页面的信息,并且其中包含广告商Web页面信息的可搜索数据结构包含专有地从所标识的广告商Web页面中提取的信息。
7.如权利要求1所述的方法,其中每个搜索结果具有得分。
8.如权利要求7所述的方法,其中还包括e)至少使用所述搜索结果得分对检索的至少一个广告中的至少某些进行计分。
9.如权利要求7所述的方法,还包括e)至少使用搜索结果得分,以及以下中的至少之一对检索的至少一个广告中的至少某些进行计分(1)广告性能信息,(2)广告价格信息,(3)广告商质量信息,和(4)用户信息。
10.如权利要求1所述的方法,其中可搜索数据结构包含记录,每个记录包含项和一或多个Web页面标识符,并且其中使用至少一部分接受的搜索结果检索至少一个广告的操作使用搜索结果中包含的Web页面标识符。
11.如权利要求10所述的方法,其中Web页面标识符被用作广告信息数据库的查找关键字。
12.如权利要求1所述的方法,其中至少一个广告不是接受的搜索结果中的一个。
13.如权利要求1所述的方法,其中检索至少一个广告的操作在不考虑特别输入的目标确定信息的情况下进行。
14.如权利要求1所述的方法,其中检索至少一个广告的操作在不考虑关键字目标确定信息的情况下进行。
15.如权利要求1所述的方法,还包括e)产生包含(1)使用搜索查询和第二可搜索数据结构确定的搜索结果,及(2)至少一个广告的文档。
16.如权利要求15所述的方法,其中每个搜索结果的格式不同于至少一个广告中的每个的格式。
17.一种方法,包括a)检索广告商Web页面信息;及b)专有地使用检索的广告商Web页面信息建立可搜索数据结构。
18.如权利要求17所述的方法,其中检索广告商Web页面信息的操作包含1)从广告信息数据库获得广告商Web页面标识符;及2)根据策略爬行由广告商Web页面标识符标识的广告商Web站点。
19.如权利要求18所述的方法,其中广告商Web页面标识符是唯一定位符。
20.如权利要求18所述的方法,其中广告商Web页面标识符是URL。
21.如权利要求17所述的方法,其中专有地使用检索的广告商Web页面信息建立可搜索数据结构的操作包含1)从广告商Web站点提取项;及2)建立反向索引。
22.如权利要求21所述的方法,其中反向索引包含记录,并且其中每个记录包含项及一或多个Web页面标识符。
23.一种搜索引擎,包括a)查询处理器;b)包含由环球网的Web页面导出的信息的第一索引;及c)包含专有地从广告商Web页面导出的信息的第二索引。
24.一种设备,包括a)存储设备,包含1)包含广告的广告信息,及2)包含广告商Web页面信息的可搜索数据结构;b)至少使用可搜索数据结构产生搜索结果的装置;及c)至少使用生成的搜索结果提供由广告信息提供一或多个广告的装置。
25.如权利要求24所述的设备,其中广告信息包含记录,每个记录包含广告及广告商Web页面标识符。
26.如权利要求25所述的设备,其中可搜索数据结构中包含的广告商Web站点信息由广告信息记录中包含的广告商Web页面标识符导出。
27.如权利要求24所述的设备,其中由广告信息提供一或多个广告的装置包含1)由搜索结果确定至少一个Web页面标识符的装置,及2)使用确定的至少一个Web页面指示符从广告信息中查找一或多个广告的装置。
28.一种设备,包括a)接受搜索查询的输入;b)搜索包含广告商Web页面信息的可搜索数据结构以生成搜索结果的装置;及c)使用至少一部分接受的搜索结果检索至少一个广告的装置。
29.如权利要求28所述的设备,其中可搜索数据结构是反向索引。
30.如权利要求29所述的设备,其中反向索引包含记录,每个记录包含项及一或多个Web页面标识符。
31.如权利要求29所述的设备,其中反向索引包含记录,每个记录包含项及一或多个对,每个对包含Web页面标识符及项计数。
32.如权利要求29所述的设备,其中反向索引包含记录,每个记录包含从广告商Web页面提取的项及标识该项出现在其中的广告商Web页面的一或多个Web页面标识符。
33.如权利要求28所述的设备,其中从一组广告商信息中检索该至少一个广告,该组广告商信息包含标识广告商Web页面的信息,并且其中包含广告商Web页面信息的可搜索数据结构包含专有地从标识的广告商Web页面提取的信息。
34.如权利要求28所述的设备,其中每个搜索结果具有得分。
35.如权利要求34所述的设备,还包括d)至少使用所述搜索结果得分对检索的至少一个广告中的至少某些进行计分的装置。
36.如权利要求34所述的设备,还包括d)至少使用所述搜索结果得分,以及以下中的至少之一对检索的至少一个广告中的至少某些进行计分的装置(1)广告性能信息,(2)广告价格信息,(3)广告商质量信息,和(4)用户信息。
37.如权利要求28所述的设备,其中可搜索数据结构包含记录,每个记录包含项和一或多个Web页面标识符,并且其中使用至少一部分接受的搜索结果检索至少一个广告的装置使用搜索结果中包含的Web页面标识符。
38.如权利要求37所述的设备,其中Web页面标识符被用作广告信息数据库的查找关键字。
39.如权利要求28所述的设备,其中至少一个广告不是接受的搜索结果中的一个。
40.如权利要求28所述的设备,其中检索至少一个广告的装置不特别考虑输入的目标确定信息。
41.如权利要求28所述的设备,其中检索至少一个广告的装置不考虑关键字目标确定信息。
42.如权利要求28所述的设备,还包括d)生成文档的装置,该文档包含(1)使用搜索查询及第二可搜索数据结构确定的搜索结果,及(2)至少一个广告。
43.如权利要求42所述的设备,其中每个搜索结果的格式不同于至少一个广告中的每个的格式。
44.一种设备,包括a)检索广告商Web页面信息的装置;及b)专有地使用检索的广告商Web页面信息建立可搜索数据结构的装置。
45.如权利要求44所述的设备,其中检索广告商Web页面信息的装置包含1)从广告信息数据库获得广告商Web页面标识符的输入;及2)根据策略爬行由广告商Web页面标识符标识的广告商Web站点的爬行器。
46.如权利要求45所述的设备,其中广告商Web页面标识符是唯一定位符。
47.如权利要求45所述的设备,其中广告商Web页面标识符是URL。
48.如权利要求44所述的设备,其中专有地使用检索的广告商Web页面信息建立可搜索数据结构的装置包含1)从广告商Web站点提取项的装置;及2)建立反向索引的装置。
49.如权利要求48所述的设备,其中反向索引包含记录,并且其中每个记录包含项及一或多个Web页面标识符。
全文摘要
允许广告商把作为目标的广告放置在例如搜索结果页面,Web页面,电子邮件等等的各种内容上,或结合各种内容服务于广告,而无需广告商输入和/或维护例如关键字目标确定的某些目标确定信息。这可以通过使用可搜索数据结构完成,例如可用广告商Web信息的反向索引(460)。广告商Web信息可以包含从广告商的Web站点提取的项和/或短语。尤其是,搜索查询(410)可以用于搜索匹配的广告商,因此搜索匹配广告。例如,搜索查询(410)可用于搜索包含从广告商Web站点提取的字和/或短语的反向索引(460)。广告商Web页面或某个其它标识符可以被用作搜索相关广告的关键字。
文档编号G06F7/00GK1842791SQ200480024260
公开日2006年10月4日 申请日期2004年6月30日 优先权日2003年6月30日
发明者乔治·R.·哈里克 申请人:Google公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1