用于关键字建议的系统和方法

文档序号:10694063阅读:195来源:国知局
用于关键字建议的系统和方法
【专利摘要】公开了用于向广告者建议竞标关键字的系统和方法。系统包括非暂态处理器可读存储介质和与该存储介质通信的处理器,该非暂态处理器可读存储介质包括用于向广告者建议竞标关键字的一组指令。处理器被配置为运行该组指令以:从广告者接收广告创意;基于所述广告创意,在不使用外部输入的种子关键字的情况下,确定与所述广告创意相关联的推荐竞标关键字;以及返回该推荐关键字用于在线广告竞标。
【专利说明】
用于关键字建议的系统和方法
技术领域
[0001] 本申请总体涉及在线广告系统。更具体地,本申请涉及用于针对在线广告者的关 键字建议的系统和方法。
【背景技术】
[0002] 作为广告者向潜在顾客和客户公开关于货品和服务的信息的方式,在线广告已经 变得越来越流行。广告者可通过使用诸如Yahoo!公司之类的在线提供商的网络可访问设施 来实现广告活动。在线提供商用来将广告者与访问在线资源(例如,搜索引擎和新闻以及信 息站点)的用户相连接。广告者的广告("ad")被提供给用户以通知并吸引用户的注意。
[0003] 在线提供商使得多个市场可用于由广告者进行广告活动。例如,Yahoo!公司在个 人计算机("PC")上以及移动平台上的应用("app")中提供许多它的流行的web资产(例如, 它的首页和主页)用于广告活动。
[0004] -些在线广告是依据关键字的。例如,广告者可竞标以基于从用户接收的搜索查 询在搜索引擎网站上显示广告。原生广告(一种形式的在线广告方法,其中广告者试图通过 提供用户的经历的上下文中的内容来增加注意)也与特定用户所关联的关键字重度相关。
[0005] 通常针对这些依据关键字的广告,当广告者公开新的产品和/或服务时,除了创建 与产品和/或服务相关联的广告创意之外,广告者需要规定类别信息以及种子关键字的列 表(即,广告者建议的竞标关键字)。对于初始类别信息和种子关键字的要求对广告者提出 了额外负担,使得广告服务不那么方便。另外,因为广告者可能不是在线广告的专家,广告 者可能不能提供准确和有效的种子关键字。因此,提供自动关键字和类别建议的在线广告 系统可在广告市场中具有更多优势。

【发明内容】

[0006] 根据本公开的一方面,一种系统包括非暂态处理器可读存储介质和与该存储介质 通信的处理器,该非暂态处理器可读存储介质包括用于向广告者建议竞标关键字的一组指 令。处理器可被配置为运行该组指令以:从广告者接收广告创意;基于所述广告创意,在不 使用外部输入的种子关键字的情况下,确定与所述广告创意相关联的推荐竞标关键字;以 及返回该推荐关键字用于在线广告竞标。
[0007] 根据本公开的另一方面,一种用于向广告者建议竞标关键字的计算机实现的方法 可包括:由计算机从广告者接收广告创意;由至少一个计算机基于所述广告创意,在不使用 外部输入的种子关键字的情况下,确定与所述广告创意相关联的推荐竞标关键字;以及由 计算机返回该推荐关键字用于在线广告竞标。
[0008] 根据本公开的另一方面,一种非暂态处理器可读存储介质可包括被配置为指令处 理器执行以下动作的一组指令:从广告者接收广告创意;基于所述广告创意,在不使用外部 输入的种子关键字的情况下,确定与所述广告创意相关联的推荐竞标关键字;以及返回该 推荐关键字用于在线广告竞标。
[0009]本公开的这些以及其他优点、方面和新颖特征以及其示出的实施例的细节将根据 以下描述和图示被更全面地理解。
【附图说明】
[0010]图1是示例在线信息系统的框图;
[0011] 图2是示出服务器的示例实施例的示意图;
[0012] 图3是示出客户端设备的示例实施例的示意图;
[0013] 图4是示出用于提供具有搜索结果的列表的互联网搜索页面的系统的示例;
[0014] 图5是根据本公开的示例实施例的竞标关键字建议系统的示意图;
[0015] 图6是示出如何确定关键字的特征向量的流程图;
[0016] 图7是根据本公开的示例实施例的关键字建议的第一阶段的流程图;
[0017] 图8是示出根据本公开的示例实施例的关键字建议的第二阶段的流程图;以及
[0018] 图9是示出根据本公开的示例实施例的回归训练过程的流程图。
【具体实施方式】
[0019] 本公开中的示例实施例提供了用于竞标关键字建议的系统和方法。系统可实现该 方法以帮助提供广告服务。使用这些系统和方法,广告者无需提供它的广告创意的类别信 息和/或初始种子关键字,即可接收所建议的用于竞标在线广告拍卖的关键字。为此,系统 和方法可实现两阶段的关键字分析方法。在阶段1分析中,系统和方法可基于特征相似度分 析从关键字数据库中选择多个候选关键字。在阶段1分析中,系统和方法可进一步通过综合 地评估候选关键字与广告创意的特征相似度、语义相似度和类别相似度来细化选择。最终 选择可被广告者用作竞标关键字。
[0020] 现在将参考附图在下文中更完全地描述主题,附图形成本文的一部分并且通过图 示的方式显示具体的示例实施例。然而,可以以各种不同的方式实施主题,因此所覆盖或所 要求的主题旨在被解释为不限制于本文所阐述的任何示例实施例,所提供的示例实施例仅 仅是说明性的。同样地,旨在为所要求或覆盖的主题包括合理的广阔范围。此外,例如,主题 可以作为方法、设备、组件或系统被实施。因此,下面的详细描述不旨在被理解为对所要求 保护的枢围造成限制。
[0021] 在整个说明书和权利要求书中,术语可能具有上下文暗示或隐含的超越了明确说 明的意思的微妙含义。同样的,如本文所用的短语"在一个实施例中"并不一定指的是同一 实施例,如本文所用的短语"在另一实施例中"并不一定指的是不同的实施例。所打算的是, 例如,所要求保护的主题包括示例实施例的全部或部分的组合。
[0022]在一般情况下,可以至少部分地从上下文中的用法来理解术语。例如,术语,比如 如本文中所用的"和"、"或"或"和/或"可以包括各种含义,其可能至少部分取决于使用这些 术语的上下文。通常,如果用于关联列表,比如A、B或C,则"或"不仅意在表示A、B和C,这里用 于包含意义,而且还表示A、B或C,这里用于独有意义。此外,如本文中所用的至少部分取决 于上下文的术语"一个或多个",可以用于描述单数意义的任何特征、结构或特性,或者可以 用于描述复数意义的特征、结构或特性的组合。类似地,术语,比如"一"或"该",再次,可以 理解为传达单数用法或传达复数用法,至少部分取决于上下文。此外,术语"根据"可以理解 为不一定旨在传达专属的一套因素,而是可能相反,(再次至少部分取决于上下文)允许不 一定被明确说明的附加的因素的存在。
[0023] 在线信息系统将广告者的广告放置于对末端用户可用的内容服务(例如,web页 面、移动应用("app")、TV app、或其他音频或视觉内容服务)内。广告与其他内容一同被提 供。其他内容可包括文本、图形、音频、视频、或者到这些内容的链接的任意组合。广告按照 惯例是基于多种标准(包括由广告者规定的那些)进行选择的。按照惯例,广告者定义广告 活动来控制广告如何以及何时可用于用户并且来规定那些广告的内容。广告的内容本身有 时被称作一个广告创意或多个广告创意。
[0024] 各种货币化技术或模型可结合赞助广告来使用。在拍卖类型的在线广告市场中, 广告者可结合广告的放置进行竞标,但是在确定广告选择或排名时也可包括其他因素。对 于依据关键字的广告,竞标可与一个或多个关键字或某些特定事件(occurrence)所关联的 一个或多个搜索查询相关联。竞标还可与广告者针对某些特定事件(例如,针对广告的放置 或点击)支付的数额相关联。广告者针对在线广告的支付可在各方之间进行划分,它们包括 一个或多个发行商或发行商网络、一个或多个市场促进者或提供商、或者潜在地包括其他 方。
[0025] 一些模型可包括保证送达广告或非保证送达广告,在保证送达广告中广告者可至 少部分地基于保证或提供广告者将接收某一协定数量的合适广告的确保的测量的协定来 进行支付,非保证送达广告可例如包括独立的服务机会或者(一个或多个)现货市场。在各 种模型中,广告者可至少部分地基于与广告送达或性能相关联或者与特定的(一个或多个) 广告者目标的测量或逼近相关联的各种度量中的任何度量来进行支付。例如,模型可包括 (除了其他之外)至少部分地基于每印象成本(CPM)或者每印象数量成本、每点击成本或每 点击数量成本(CPM )、针对(一个或多个)特定动作的每行动成本(CPA )、每转化或购买成本、 或者至少部分基于度量(可包括在线或离线度量)的某一组合的成本的支付。
[0026] 图1是在线信息系统100的框图。图1的示例实施例中的在线信息系统100可包括账 户服务器102、和账户数据库104、搜索引擎106、广告(ad)服务器108、和广告数据库110。在 线信息系统100可由一个或多个广告者设备(例如,广告者设备112a、112b)以及由一个或多 个用户设备(例如,用户设备124a、124b)通过网络120访问。在这样的在线信息系统的各种 示例中,用户可搜索并获得来自网络120上的源的内容。广告者可提供广告以便放置在通过 网络发送给用户设备(例如,用户设备124a、124b)的web页面以及其他通信上。在一个示例 中在线信息系统可由诸如Yahoo!公司之类的在线提供商部署和操作。
[0027] 账户服务器102可存储广告者的账户信息。账户服务器102可处于与账户数据库 104的数据通信中。账户信息可包括与各个广告者相关联的一个或多个数据库记录。任何适 合的信息可被账户管理服务器102存储、维护、更新以及从账户数据库104中读取。示例包括 广告者标识信息、诸如秘密和其他安全证书之类的广告者安全信息、以及账户余额信息。在 一些实施例中,管理在线信息系统100的在线提供商可分配一个或多个账户管理者给各个 广告者,并且关于一个或多个账户管理者的信息以及由账户管理者获得并记录用于后续访 问的信息可被维护在账户数据库104中。
[0028]账户服务器102可使用任何合适的设备实现。例如,账户管理服务器102可被实现 为单个服务器、多个服务器、或者本领域已知的任何其他类型的计算设备。对于账户服务器 102的访问可通过防火墙(未示出)来完成,该防火墙保护账户管理程序和账户信息免受外 部篡改。额外的安全性可经由对标准通信协议的增强(例如,安全HTTP或安全套接层)来提 供。
[0029] 账户服务器102可提供广告者前端以简化访问广告者的账户信息的过程。广告者 前端可以是形成用户界面的程序、应用或软件例程。根据本公开的示例实施例,广告者前端 可作为具有一个或多个web页面的web站点进行访问,接入的广告者可在诸如广告者设备 122a、122b之类的广告者设备上查看这一个或多个web页面。广告者可使用广告者前端查看 并编辑账户数据。在编辑广告数据之后,账户数据然后被保存至账户数据库104。
[0030] 搜索引擎106可以是计算机系统、一个或多个服务器、或者本领域已知的任何其他 计算设备。可替换地,搜索引擎106可以是在计算机可读存储介质上存储的计算机程序、指 令或软件代码,该计算机可读存储介质在单个服务器、多个服务器、或者本领域已知的任何 其他类型的计算设备的处理器上运行。搜索引擎106可例如通过由用户操作的用户设备(例 如,用户设备124a、124b)在网络120上访问。用户设备124a、124b可向搜索引擎106传送用户 查询。搜索引擎106可使用任何合适的协议或算法定位匹配信息并且向用户设备124a、124b 返回信息。搜索引擎106可被设计为帮助用户寻找位于互联网或内联网上的信息。根据本公 开的示例实施例,搜索引擎106还可通过网络120向用户设备124a、124b提供具有以下内容 的web页面:搜索结果、匹配用户查询的上下文的信息、到其他网络目的地或信息的链接、以 及操作用户设备124a、124b的用户感兴趣的信息的文件。
[0031] 搜索引擎106可使得设备(例如,用户设备124a、124b或者任何其他客户端设备)使 用搜索查询来搜索感兴趣的文件。通常,搜素引擎106可由客户端设备在网络120上经由一 个或多个服务器或者直接地进行访问。搜索引擎106例如可包括爬行器组件、索引器组件、 索引存储组件、搜索组件、排名组件、缓存、简档存储组件、登录组件、简档构建器、以及一个 或多个应用程序接口(API)。搜索引擎106可以用分布式形式来部署(例如,经由一组分布式 服务器)。组件在网络内可以是双份的,例如为了冗余或更好地访问。
[0032]广告服务器108可操作以将广告伺服给诸如用户设备124a、124b之类的用户设备。 广告包括定义了广告信息的数据,用户设备的用户可能对广告信息感兴趣。广告可包括文 本数据、图形数据、图像数据、视频数据、或音频数据。广告还可包括定义了到提供这些数据 的其他网络资源的一个或多个链接的数据。其他位置可以是互联网上的其他位置、由广告 者操作的内联网上的其他位置、或者任何接入。
[0033]对于在线信息提供商,广告可被显示在源自用户定义的搜索的web页面上,该用户 定义的搜索至少部分基于一个或多个搜索词语。还可基于用户打开的网页的内容来显示广 告。如果所显示的广告与一个或多个用户的兴趣相关,则广告对用户、广告者或者门户网站 有益。
[0034]广告服务器108可包括操作以对广告数据进行格式化用于传送给用户设备的逻辑 和数据。广告服务器108可与广告数据库110进行数据通信。广告数据库110可存储包括定义 了要被伺服给用户设备的广告的数据的信息。此广告数据可被另一数据处理设备或者被广 告者存储在广告数据库110中。
[0035]另外,广告服务器108可与网络120数据通信。广告服务器108可通过网络120向设 备传送广告数据和其他信息。此信息可包括被传送至用户设备的广告数据。此信息还可包 括与诸如广告者设备122a、122b之类的广告者设备通信的广告数据和其他信息。操作广告 者设备的广告者可通过网络接入广告服务器108以访问包括广告数据的信息。此访问可包 括开发广告创意、编辑广告数据、删除广告数据和其他活动。
[0036] 广告服务器108可提供广告者前端来简化访问广告者的广告数据的过程。广告者 前端可以是形成用户界面的程序、应用或软件例程。在一个具体实施例中,广告者前端可作 为具有一个或多个web页面的web站点进行访问,接入的广告者可在广告者设备上查看这一 个或多个web页面。广告者可使用广告者前端查看并编辑账户数据。在编辑广告数据之后, 广告数据然后可被保存至广告数据库110用于后续对用户设备的广告中的通信。
[0037] 广告服务器108可以是计算机系统、一个或多个服务器、或者本领域已知的任何其 他计算设备。可替换地,广告服务器108可以是在计算机可读存储介质上存储的计算机程 序、指令或软件代码,该计算机可读存储介质在单个服务器、多个服务器、或者本领域已知 的任何其他类型的计算设备的处理器上运行。
[0038] 账户服务器102、搜索引擎106、和广告服务器108可被实现为任何合适的计算设 备。计算设备能够发送或接收数据(例如,经由有线或无线网络),或者能够处理或存储信号 (例如在存储器中作为物理存储器状态),因此可用作服务器。因而,能够用作服务器的设备 可例如包括专用机架式服务器、台式计算机、膝上型计算机、机顶盒、合并前述设备的各种 特征(例如,两个或更多个特征)的集成设备等等。
[0039] 网络120可包括任何数据通信网络或多个网络的组合。网络可将设备进行耦合从 而使得可例如在服务器和客户端设备或其他类型的设备之间(例如,包括经由无线网络耦 合的无线设备之间)互换通信。网络还可包括大容量存储设备,例如网络附加存储(NAS)、存 储区域网络(SAN)、或其他形式的计算机或机器可读介质。网络可包括互联网、一个或多个 局域网(LAN)、一个或多个广域网(WAN)、线缆类型的连接、无线型连接、或者它们的任何组 合。类似地,子网络(例如,可采用不同的架构或者可与不同协议相兼容或者可兼容)可在诸 如网络120之类的更大网络内相互操作。例如可使用各种类型的设备来提供针对不同架构 或协议的互操作能力。作为一个说明性示例,路由器可提供以其他方式分离且独立的LAN之 间的链路。通信链路或信道例如可包括模拟电话线(例如,双绞线、同轴线缆)、全数字线路 或部分数字线路(包括Tl、T2、T3、或T4型线路)、基础服务数字网络(IDSN)、数字订户线路 (DSL)、包括卫星链路的无线链路、或者本领域技术人员已知的其他通信链路或信道。另外, 计算设备或其他相关电子设备可(例如,经由电话线或链路)远程地耦合到网络。
[0040] 广告者设备122a、122b可包括可通过网络120访问在线信息系统100的任何数据处 理设备。广告者设备122a、122b可操作以通过网络120与账户服务器102、搜索引擎106、广告 服务器108、内容服务器和其他数据处理系统进行交互。广告者设备122a、122b例如可实现 用于查看web页面和提交用户请求的web浏览器。广告者设备122a、122b可将数据传送给在 线信息系统100,该数据包括定义web页面的数据和其他信息。广告者设备122a、122b可从在 线信息系统100接收包括定义web页面和广告创意的数据的通信。
[00411用户设备124a、124b可包括可通过网络120访问在线信息系统100的任何数据处理 设备。用户设备124a、124b可操作以通过网络120与搜索引擎106进行交互。用户设备124a、 124b例如可实现用于查看web页面和提交用户请求的web浏览器。操作用户设备124a、124b 的用户可输入搜索请求并将搜索请求传送至在线信息系统100。搜索请求可由搜索引擎处 理并且搜索结果可返回至用户设备124a、124b。在其他示例中,用户设备124a、124b的用户 可从在线信息处理系统100请求诸如信息的页面之类的数据。数据继而可在诸如原生移动 应用、TV应用、或音频应用之类的另一环境中被提供。在线信息处理系统100可提供数据或 者将浏览器重定向至另一web站点。此外,广告服务器可从广告数据库110中选择广告并且 在向用户设备124a、124b提供的数据中包括定义了广告的数据。
[0042]广告者设备122a、122b和用户设备124a、124b在访问在线信息系统上的信息时可 用作客户端设备。诸如广告者设备122a、122b和用户设备124a、124b之类的客户端设备可包 括能够发送或接收数据(例如,经由有线或无线网络)的计算设备。客户端设备例如可包括 台式计算机或便携式设备,例如蜂窝电话、智能电话、显示寻呼机、无线电频率(RF)设备、红 外(IR)设备、个人数字助理(PDA)、手持式计算机、平板计算机、膝上型计算机、机顶盒、可穿 戴计算机、合并前述设备的各种特征(例如,两个或更多个特征)的集成设备等等。在图1的 示例中,膝上型计算机124b和智能电话124a可互换地用作广告者设备或用作用户设备。 [0043]图2是示出服务器200的示例实施例的示意图。服务器200可被用作图1的账户服务 器102、搜索引擎106和广告服务器108。服务器200可广泛地改变配置或能力,但是它可包括 一个或多个中央处理单元222和存储器232、存储应用程序242或数据244的一个或多个介质 230(例如,一个或多个大容量存储设备)、一个或多个电源226、一个或多个有线或无线网络 接口 250、一个或多个输入/输出接口 258、和/或一个或多个操作系统241 (例如,Windows Server?、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等等)。因此服务器200可例如包括专用机 架式服务器、台式计算机、膝上型计算机、机顶盒、诸如智能电话之类的移动计算设备、合并 前述设备的各种特征(例如,两个或更多个特征)的集成设备等等。
[0044]图1中示出的账户服务器102、搜索引擎106、内容服务器112和广告服务器108可被 实现为内容服务器或者可与内容服务器相通信。内容服务器可包括这样的设备,该设备包 括经由网络向另一设备提供内容的配置。内容服务器例如可主持诸如社交网络站点之类的 站点,其不例可包括但不限于:Yahoo !?、FlickerTM、TwitterTM、FacebookTM、LinkedIn?、S 个人用户站点(例如,博客、微博、在线约会站点等等)。内容服务器还可主持各种其他站点, 包括但不限于:商业站点、教育站点、词典站点、百科站点、维基、财务站点、政府站点等等。 内容服务器还可提供各种服务,包括但不限于:web服务、第三方服务、音频服务、视频服务、 电子邮件服务、即时通讯(頂)服务、SMS服务、MMS服务、FTP服务、IP语音(VOIP)服务、日程服 务、照片服务等等。内容的示例可包括文本、图像、音频、视频等等,它们例如可以用物理信 号(例如,电子信号)的形式进行处理,或者可在存储器中例如作为物理状态被存储。可用作 内容服务器的设备的示例包括台式计算机、多处理器系统、微处理器型或可编程消费电子 产品等等。内容服务器可不与一个或多个广告服务器共用所用权或控制。
[0045]图3是示出可被用作用户设备124a、124b和广告者设备122a、122b的客户端设备的 示例实施例的示意图。客户端设备可包括执行在本公开中介绍的方法和软件系统的装置。 客户端设备300可以是能够允许软件系统的计算设备。客户端设备300例如可以是诸如个人 台式计算机或便携式设备(例如,膝上型计算机、平板计算机、蜂窝电话、或智能电话)之类 的设备。
[0046]客户端设备300可在能力和特性方面改变。所要求保护的主题旨在覆盖潜在变体 的广泛范围。例如,客户端设备300可包括键盘/键板356。它还可包括显示器354,例如液晶 显示器(IXD)或者具有高级功能(例如,触敏彩色2D或3D显示器)的显示器。然而,相比之下, 作为另一示例,web使能的客户端设备300可包括一个或多个物理或虚拟键盘以及大容量存 储介质330。
[0047]客户端设备300还可包括或者可允许多种操作系统341,这些操作系统包括诸如 Window?、或Linux?之类的操作系统或者诸如iOS?、Android?、或Windows Mobile?之类的 移动操作系统。客户端设备300可包括或者可允许多种可能应用342,例如电子游戏345。应 用342可使能经由网络与其他设备的通信,例如经由网络与另一计算机、另一客户端设备或 服务器通信。
[0048]另外,客户端设备300可包括一个或多个非暂态处理器可读存储介质330以及与非 暂态处理器可读存储介质530通信的一个或多个处理器322。例如,非暂态处理器可读存储 介质330可以是RAM存储器、闪存存储器、ROM 334、340存储器、EPROM存储器、EEPROM存储器、 寄存器、硬盘、可移除盘、CD-ROM、或者本领域已知的任何其他形式的非暂态存储介质。一个 或多个非暂态处理器可读存储介质330可存储多组指令,或者包括这多组指令的单元和/或 模块用于进行本公开所描述的操作和/或方法步骤。可替换地,单元和/或模块可以是被配 置为施行本公开所描述的操作和/或方法步骤的客户端设备300中布置的硬件。一个或多个 处理器可被配置为允许多组指令并执行本公开的示例实施例中的操作。
[0049] 仅仅用于说明,在以下示例实施例中将在运行操作和/或方法步骤的客户端设备 和服务器中描述仅一个处理器。然而,应当注意本公开中的客户端设备和服务器还可包括 多个处理器,因而在本公开中由一个处理器执行的操作和/或方法步骤也可由多个处理器 联合地或者分立地执行。例如,如果在本公开中处理器执行步骤A和步骤B二者,应当理解步 骤A和步骤B也可由客户端设备中的两个不同的处理器联合地或者分立地执行(例如,第一 处理器执行步骤A并且第二处理器执行步骤B,或者第一和第二处理器联合地执行步骤A和 步骤B)。
[0050] 图4是示出用于提供具有查询搜索结果的web页面的系统400的示例。系统400可包 括至少一个服务器450。服务器450可以是图1中的服务器102、106和108的总表示,或者可以 是这些服务器中的一部分的总表示。服务器450可与至少一个数据库452通信来提供用于 web页面400的数据。数据库452可包括内容数据库,这包括要被显示在web页面400上的多个 文章(article)和/或web页面链接。文章可以是任何形式的内容项。例如,文章可以是文本 项(例如,文本报告、故事等等)或者多媒体的内容(例如,音频/视频片段)或者其组合。数据 库452还可包括广告数据库,这包括要被显示在网站中的多个广告。数据库452可被存储在 与服务器450通信的非暂态处理器可读存储介质中。图4中示出的web页面402是具有与搜索 查询"hard mattress (硬床垫)"相对应的搜索结果的示例互联网搜索页面。但是web页面 402也可以是网站的首页、着陆页、或者特定话题(例如,体育、财经、新闻等等)的web页面。 web页面402可被显示在用户设备124a、124b的浏览器上。
[00511 web页面402可包括搜索输入框440。用户可在搜索输入框440中输出搜索查询441 并且服务器450可返回并显示搜索结果在web页面402上。例如,在图4所示的web页面402中, 用户输入搜索查询"hardmattress"。
[0052] web页面402的中心栏可以是一栏web页面内容424 jeb页面内容424可包括多个槽 位,其中一系列项420、422、426、428、430和432被一项接一项地显示。各项422、426、428、430 和432可以是与搜索查询"hard mattress"对应的搜索结果。各项可包括该项的文本概括 412。项422、426、428、430和432还可包括图形/视频416、其他数据(未示出)以及到该项的附 加信息的链接414。点击或者以其他方式选择链接414可将用户设备124a、124b上的浏览器 重定向至具有附加信息的web页面。
[0053] 项422、426、428、430和432的界613页面内容424可包括任何类型的内容项。例如,¥6匕 页面内容424可包括文章,这包括新闻、商业相关的文章、体育相关的文章等等。除了文本或 图形内容之外,文章422、426、428、430和432可包括其他数据,例如音频和视频数据或应用。 [0054] 项422、426、428、430和432在《613页面内容424中的位置可基于相关性来确定。例 如,第一项422可以是相比第六项432与搜索查询"hard mattress"更相关的文章。然而位置 可以是也可以不是该项对于用户的受欢迎程度的精确指示符。例如,尽管第二项422相比第 六项432是与搜索查询"hard mattress"更相关的文章,但是与硬床垫提供商Ashley家具工 业公司相关联的第六项432可接收比第二项422更多的点击,第二项422是与背痛相关的文 早。
[0055] 在右手侧,web页面402可包括广告(例如,广告442)的栏444。广告442可被设计为 吸引用户的注意并且推销广告者的产品和/或服务。例如,图4中的广告442被设计为推销由 Ashley家具工业公司生产的家庭家具。此外,广告442也可被放置在中心栏424,或者web页 面402中的任何其他合适地方。
[0056]广告442的创意可包括名称(例如,广告者的名称);题目442a(例如,广告的题目); 和描述442b(例如,对广告者的产品和/或服务的描述)。在广告442中可仅显示创意的题目 442a和描述442b。另外,题目442a可被显示为超链接,从而使得点击该题目的用户将被引导 至广告者的web页面460(即,产品和/或服务的着陆页)。表1示出了广告442的创意的示例。
[0057]表 1
[0059] 广告442将题目442a作为超链接并且将描述442b作为纯文本显示在web页面402 上。当用户点击超链接时,用户被引导至Ashley家具工业公司的主页。
[0060] 广告者可通过由发布者(例如,网站402或者网站402的独立代理)提供的在线广告 竞拍服务来显示广告442。广告者可基于搜索查询441和与广告442相关联的竞标关键字的 列表之间的相似度来决定他的出价。当广告者从发布者处订购广告显示服务时,竞标关键 字的列表可由发布者提供,从而使得广告者不需要提供它自己的广告442的种子关键字和/ 或类别信息给发布者进行关键字分析。
[0061] 图5是根据本公开的示例实施例用于向服务器502提供竞标关键字建议服务的系 统500的示意图。系统500可属于广告发布者,从而关键字建议服务是由发布者提供的在线 广告服务的一部分。可替换地,系统500可以是独立于发布者向广告者提供独立竞标关键字 建议服务的系统。
[0062]系统500可包括关键字建议引擎504,其被配置为在不要求与创意相关联的种子关 键字作为外部输入的情况下向广告者建议竞标关键字。关键字建议引擎504可以是包括处 理器222和非暂态存储介质230的服务器200。存储介质230可具有在其中存储的一组指令。 这组指令可指引处理器222执行预定的性能。例如,当广告者502输入广告创意("创意")518 给关键字建议引擎504时,处理器222可允许在介质230中存储的相关性模型506(即,一组指 令)以进行两阶段的关键字分析。对创意518的第一阶段分析508和第二阶段分析510不需要 使用ad广告者(或者广告者的代理)建议的与该创意相关联的种子关键字(即,发起关键字 分析的关键字)。因此,关键字建议引擎504能够在不要求来自广告者的创意的种子关键字 或类别信息的输入的情况下向广告者返回建议竞标关键字520的列表。在示例实现中,关键 字建议引擎504可完全依靠创意518的输入来进行关键字分析。建议竞标关键字的列表可包 括预定数目(例如,50)的竞标关键字,这些竞标关键字根据与创意的相关性分数(即,推荐 度)来排名,从而使得广告者502可将建议竞标关键字520的列表当做用于在在线广告拍卖 中就其广告进行出价以将其广告放置在发布者的网站上的关键字。另外,分析可完全基于 创意518的输入来进行并且足够准确和有效以使得不需要广告者502提供它自己的一组竞 标关键字用于拍卖或者它自己的一组种子关键字用于进行扩展的关键字分析。
[0063]在第一阶段分析508中,处理器222可基于输入从关键字数据库中选择预定数目的 候选关键字。为此,关键字建议引擎504可与关键字词典512通信,该关键字词典是预先构建 的数据库,其包括成千上万的关键字、相关关键字、关键字之间的相关度的排名分数(向 量)、以及与每个关键字对应的特征向量(或者多个特征向量)。关键字可由频率过滤器516 提供,该频率过滤器516收集由一般大众在Yahoo!网络过去的一段时间内的日常在线活动 期间在互联网中输入的搜索查询。频率过滤器516可被配置为捕获用户对于搜索结果页面 的查看和点击行为。频率过滤器516可用作数据源,其中前一亿个经常搜索的关键字被从关 键字词典512中挑出。关键字词典512中存储的关键字足够完备从而使得在统计上讲,它几 乎覆盖了一般广告进行竞标广告拍卖所需的所有关键字。
[0064]在第二阶段分析510中,处理器222可进一步将在第一阶段分析中选择的候选关键 字细化为建议竞标关键字的列表。例如,处理器222可使用线性回归算法从大约500个候选 关键字中选择50个关键字作为建议竞标关键字。可使用由编辑者人工决断的一组训练数据 518通过训练模型514对线性回归算法进行预优化。
[0065] 图6是根据本公开的示例实施例示出如何确定预先构建的关键字词典512中的关 键字的特征向量的流程图。流程图中的过程可由诸如服务器200之类能够访问在关键字词 典512中保存的关键字数据库的服务器执行。服务器可在广告者向关键字建议引擎504输入 创意之前独立地对关键字数据库进行分析。
[0066] 在步骤602中,服务器可针对在关键字数据中保存的每个关键字(此后被称作"数 据库关键字")进行互联网搜索并获得搜索结果的列表。每个搜索结果可对应于URL(统一资 源位置)。另外,服务器可根据URL中的内容与数据库关键字的相关性对URL的列表进行排 名。URL的排名越高,URL的内容与数据库关键字越相关。
[0067]在步骤604,服务器可从搜索结果的列表中选择预定数目的候选URL,这些候选URL 具有被用该数据库关键字搜索互联网的一般用户点击的最高可能性。例如,服务器可仅从 搜索结果的列表中选择前10个URL。在选择候选URL时可考虑若干因素。例如,一个因素可以 是(但不被限于)URL在URL列表中的位置(即,排名),即用户可选择具有与数据库关键字更 相关的内容的那些URL。另一因素可以是在一段时间内一般大众访问该URL的次数,即服务 器也可选择URL的列表中最受欢迎的URL(即,被最多点击的URL)。因此,所选择的候选URL可 反映URL与数据库关键字的相关性以及URL在上网的一般用户间的受欢迎度二者,从而反映 了 URL将被使用对应的数据库关键字搜索互联网的用户选择的可能性。
[0068]在步骤606中,服务器可从每个URL指向的页面内容中提取多个关键字(下文被称为 "URL特征关键字")并计算每个URL特征关键字的重要性的值。为此,服务器可首先提取URL的 内容。例如,服务器可仅从URL提取文本内容,这排除了诸如广告之类的任何非相关信息。然后 月艮务器可将内容与词典(例如,关键字词典512)比较来从内容中提取URL特征关键字,这里词典 充当百科全书式的关键字数据库。另外,服务器可为每个URL特征关键字计算一值,该值反映了 URL特征关键字在URL的内容中的重要性。计算可基于URL特征关键字的语义值以及对应的URL将 被用户选择的可能性。例如,服务器可在URL指向的整个页面内容中针对每个URL特征关键字进 行TF-IDF(词频-逆向文档频率)分析,并获得URL特征关键字的对应TF-IDF值。服务器然后可使 用4
计算URL特征关键的重要性的值,其中d是URL所指向的文档(web页面内容),fid是第i个URL 特征关键字,α是经验倌,「l+log(clickd+l)]是与该URL在过去接收的点击数目相对应的权 重,并5
与URL在URL搜索结果的列表中的位置(即,该关键字的排名 或相关性)相对应的权重。考虑到针对相同关键字的重复搜索可能不产生相同的URL搜结 果,该位置可以是URL在预定数目的搜索间的平均位置。
[0069]服务器可针对每个候选URL进行上面的URL特征关键字提取以及重要性值计算,并 且将URL特征关键字收集到一起。当URL特征关键字在不止一个候选URL对应的内容中出现 时,服务器可根据以下公式将URL特征关键字的每个独立的重要性值相加以获得URL特征关 键字的总体重要性值:
[0070]
[0071 ]在步骤608中,服务器可为关键字词典512中的每个数据库关键字确定特征向量 (此后被称作"数据库关键字特征向量")。为此,服务器可将词典中的所有词或者关键字词 典512的关键字数据库中的所有关键字放置在预定序列中,并且将该序列看做特征向量模 板,从而使得序列中的每个词具有固定位置并且成为特征向量模板的元素。因此,候选URL 的所有URL特征关键字可对应于特征向量模板中的元素。接下来,服务器可通过分配特征向 量模板中的每个元素的值来获得数据库关键字的特征向量。如果特征向量模板中的元素不 是URL特征关键字,服务器可向该元素分配为0的值。如果该元素是URL特征关键字,服务器 可向该元素分配该URL特征关键字的总体重要性值。因此,数据库关键字特征向量可以是:
[0072] V(url_ feature_keyword) ,0,score(fi),0,score(f2),0,score (fi),〇,···}
[0073] 在步骤610中,服务器可保存数据库关键字特征向量并将它与对应的数据库关键 字相关联。服务器可在广告者505输入创意518之前完成上面针对关键字词典512中的每个 数据库关键字的数据库关键字特征向量确定。
[0074]图7是根据本公开的示例实施例的第一阶段分析508的流程图。在步骤702中从广 告者502接收创意518之后,关键字建议引擎504可确定创意的特征向量(此后被称作"创意 特征向量")。
[0075]为此,在步骤704中,关键字建议引擎504可基于词典以与步骤606中的提取过程类 似的方式从创意中提取关键字(此后被称作"创意关键字")。例如,对于表1中的创意,所提 取的关键字可以是:
[0076] <Ashley,look,furniture,visit,today,home,furniture,industries, store,...>〇
[0077] 关键字建议引擎然后也可针对每个创意关键字计算重要性值。例如,关键字建议 引擎504可对每个创意关键字进行TF-IDF分析并获得其值。TF-IDF值可被看作对应的创意 关键字的重要性值。因此,表1中的创意的每个创意关键字的重要性值可以是:
[0078] <Ashley:0.465, look:0.140,furniture:0.447,visit:0.151,today :0.152, home:10·13,furniture:0·401,industries:0·161,store:0·234,…>〇
[0079] 在步骤706中,关键字建议引擎504可确定创意的创意特征向量。为此,关键字建议 引擎504可使用步骤608中描述的特征向量模板,并且如果特征向量模板中的一元素不是创 意关键字则向该元素分配为〇的值。如果该元素是创意关键字,则关键字建议引擎504可向 该元素分配与创意关键字对应的重要性值。因此,表1中的创意的创意特征向量可以是:
[0080] V(creative) = {0,····,0· 465,···,0· 140,···,0· 447,···,0·151,···,0·152,···, 10.13,···,0·401,···,0.161,···,0·234,···}。
[00811在步骤708中,关键字建议引擎504可计算创意特征向量与关键字词典512中存储 的每个数据库关键字特征向量之间的相似度值(例如,余弦相似度)。创意特征向量与数据 库关键字特征向量之间的相似度越高,则创意与对应的数据库关键字越相关。
[0082]然后在步骤710中,关键字建议引擎504可选择一组候选关键字,这包括与具有相 对创意特征向量的最高相似度的数据库关键字特征向量相对应的预定数目(例如,500)的 数据库关键字。这些候选关键字可表示与创意最相关的关键字(例如,500个最相关的关键 字)。
[0083]在一些实例中,不是所有的候选关键字是理想的或者广告者更喜欢来提出竞标 的。例如,广告者可确定不响应于包括广告者的竞争者的名称的搜索查询来放置广告。因 此,关键字建议引擎504可获得该广告者的排除列表。排除列表可从关键字建议引擎504可 访问的数据库中获得,或者可由广告者提供。排除列表可包括广告者的竞争者名称,或者可 包括广告者不希望竞标的其他关键字。
[0084]接下来,在步骤712中,关键字建议引擎504可通过从候选关键字中过滤掉在排除 列表中的关键字来对候选关键字进行细化。例如,关键字建议引擎504可分析每个候选关键 字并从候选关键字中提取品牌相关的术语。关键字建议引擎504也可分析创意并提取其中 的品牌相关的术语(例如,表1的创意中的Ashley)。如果候选关键字不包括品牌相关的术 语,则候选关键字可能是内容中性的。进一步分析可能不被需要。否则,关键字建议引擎可 比较来自创意的品牌相关的术语与来自候选关键字的品牌相关的术语。如果术语具有较大 的重叠(即,两个品牌相关的术语类似),则关键字建议引擎504可确定对应的创意和候选关 键字有可能指代相同的产品或服务品牌。然而,如果来自候选关键字的品牌相关的术语存 在但是与来自创意的品牌相关的术语很少重叠或者不重叠,则关键字建议引擎504可确定 该品牌相关的术语与竞争者相关联。因此,对应的候选关键字可从候选关键字群组中被移 除。
[0085]图8是根据本公开的示例实施例示出第二阶段分析的流程图。在第二阶段分析中, 关键字建议引擎504可对经细化的候选关键字进行评估并进一步选择建议一组关键字520。 评估和选择可基于语义相似度、类别相似度、以及候选关键字与创意的特征相似度。
[0086] 在步骤802中,关键字建议引擎504可将创意518中的术语分解。在创意中通过空格 和标点与其他词分开的任何词语可被视为单个术语。结果,关键字建议引擎504可获得创意 术语集。例如,针对表1中的创意,对应的术语集可以是:〈ashley furniture industries inc.find great looking furniture that lasts ashley furniture store is the name in home furniture visit an ashley store save today>〇类似地,关键字建议引 擎504也可获得针对每个经细化的候选关键字的术语集。例如,对于关键字"home furnituresuggestion",术语集可以是:〈home furniture suggestion)〇
[0087]在步骤804中,关键字建议引擎504可确定每个候选关键字的文字重叠计数。文字 重叠计数可以是候选关键字术语集中也显现在创意术语集中的术语的数目。在上面的示例 中,两个术语"home"和"furni ture"是重叠术语,因为它们均显现在关键字术语集和创意术 语集二者中。因此,关键字"home furniture suggestion"的文字重叠计数是2。文字重叠计 数可反映候选关键字和创意之间的绝对的重叠度。文字重叠计数的值越大,候选关键字与 创意共享的术语越多。因此,文字重叠计数可反映候选关键字和创意之间的文字相似度的 一个方面。
[0088]在步骤806中,关键字建议引擎506可确定每个候选关键字的文字重叠比例。文字 重叠比例可以是文字重叠计数与候选关键字术语集中的术语数目之间的比例。例如,术语 集〈home furniture suggestion〉包括三个术语并且具有等于2的文字重叠计数。因此,它 的文字重叠比例是2/3。文字重叠比例可反映候选关键字与创意重叠的完全程度。文字重叠 比例越大,重叠就越好或者越"平行"。因此,文字重叠比例可反映候选关键字和创意之间的 文字相似度的另一方面。
[0089]在步骤808中,关键字建议引擎504可进一步对创意和经细化的候选关键字的每个 关键字进行分类。例如,关键字建议引擎504可访问被离线预先构建的类别分析设置。类别 分析设置可包括类别数据库并且可被配置为将每个类别映射以一组导航关键字。结果,当 类别分析设置接收创意时,它可搜索映射并确定最佳地匹配创意中的关键字的一个或多个 类别。例如,表1中的创意可被归类到3个类别中:retail (零售)、home(家庭WPappliance (器具);关键字"home furniture suggestion"可被归类到2个类别中:retail(零售)和 home (家庭)。
[0090]在步骤810中,关键字建议引擎504可进一步确定创意和经细化的候选关键字的每 个关键字之间的类别相似度。类别相似度可根据以下公式来计算:类别相似度=类别重叠 计数/创意类别数目。在以上示例中,关键字的类别重叠计数是2,因为存在关键字"home furniture suggestion"的两个类别(即,"retail(零售)"和"home(家庭)")与创意的三个 类别(即,"retail"、"home"和"appliances")相重叠。因此,关键字的类别相似度是2/3。
[0091]在步骤812中,关键字建议引擎504可确定对于每个经细化的候选关键字的推荐 度。该确定可基于候选关键字相对于创意的特征相似度、文字重叠计数、文字重叠比例、和 类别相似度。例如,关键字建议引擎504可将候选关键字相对于创意的特征相似度、文字重 叠计数、文字重叠比例、和类别相似度作为输入并且执行经预先训练的线性回归算法。线性 回归算法可通过评估输入的值来返回一得分(例如,0到1)作为推荐度。关键字建议引擎504 可仅在该得分高于或等于阈值(例如,0.4)时才采用候选关键字。
[0092]最终在步骤814中,关键字建议引擎504可选择具有最高推荐度的候选关键字作为 用于广告者502的建议竞标关键字并且返回建议竞标关键字。
[0093]图9是根据本公开的示例实施例示出了回归训练过程的流程图。此过程可由诸如 服务器200之类的服务器运行,并且可被用于步骤810中的线性回归算法。
[0094] 在步骤902中,编辑者可准备一组示例创意-关键字对。编辑者可以是人,例如关键 字建议系统500的设计者。这组示例创意-关键字对可包括大约100个创意,并且每个创意可 配对以30到50个关键字。每个关键字可以是基于创意来选择的。
[0095]在步骤904中,服务器可以在与第一阶段和第二阶段分析相同的过程中确定关键 字的特征相似度、文字重叠计数、文字重叠比例、和类别相似度。
[0096]在步骤906中,基于对于创意-关键字对的实际人类经验,可向创意-关键字对人工 地分配推荐度。例如,编辑者(其是人)可阅读每个创意-关键字对并用反映他/她有多么推 荐关键字的得分(即,基于他/她作为人的感受,关键字与创意的匹配有多好)来标记创意-关键字对。得分可以是0和1之间的值。例如,1可表示完美匹配,0.7可表示优秀的匹配,0.5 可表示良好匹配,0.4可表示一般匹配,而0可表示差匹配。因此,每个创意-关键字对可具有 人工标记的值。
[0097] 在步骤908中,关键字的得分以及特征相似度、文字重叠计数、文字重叠比例、和类 别相似度可作为训练数据用于优化线性回归算法。结果,线性回归算法可被用于确定候选 关键字的得分(即,推荐度),其中,候选关键字的特征相似度、文字重叠计数、文字重叠比 例、和类别相似度作为输入。
[0098] 本公开的以上示例实施例提供了用于竞标关键字建议的系统和方法。这些系统和 方法可基于广告者提交的创意来向广告者建议竞标关键字。广告者不需要给它的广告创意 提供初始种子关键字和/或类别信息来接收用于竞标在线广告机会的建议关键字。为此,系 统进行了两阶段的关键字建议分析。
[0099] 在第一阶段分析中,系统和方法可从由一般大众使用的搜索查询中收集关键字的 数据库。通过使用每个关键字的选择的搜索结果,系统和方法可为每个关键字构造数据库 关键字特征向量。当系统和方法从广告者接收创意时,系统和方法可构造创意特征向量并 把创意特征向量与数据库关键字特征向量相比较。系统和方法然后可从数据库中挑选向量 具有相比创意特征向量的最高相似度(例如,余弦相似度)的关键字。最终,系统和方法可移 除包含被排除的信息(例如,竞争者的名称)的那些被选择的数据库关键字,并且返回剩下 的所选择的数据库关键字作为候选关键字。
[0100]在第二阶段分析中,系统和方法可通过利用每个候选关键字和创意之间的特征相 似度、类别相似度和文字相似度评估每个候选关键字来对选择进行细化。最终选择的候选 关键字可被返回为建议关键字。广告者可在竞标在线广告机会时使用建议关键字。
[0101] 尽管本公开的示例实施例涉及用于在线广告关键字建议的系统和方法,这些系统 和方法还可应用于其他应用中。例如,除了建议在用户输入搜索查询时的场景中使用的竞 标关键字之外,系统和方法还可被实现来提供建议的web页面内容用于在线广告。在另一示 例中,除了分析广告创意之外,系统和方法还可被实现以分析web页面的内容。
[0102] 因此,图1-9中所示的示例实施例仅用作描述本公开的实现方案的若干方式的示 例。它们不应当被解释为限制本公开的示例实施例的精神和范围。应当注意,本领域技术人 员仍然可以在不背离示例实施例的精神和范围的情况下做出各种修改或变更。这样的修改 或变更应当落入在所附权利要求中定义的示例实施例的保护范围中。
【主权项】
1. 一种计算机系统,包括: 非暂态处理器可读存储介质,该非暂态处理器可读存储介质包括用于向广告者建议竞 标关键字的一组指令;以及 处理器,该处理器与该存储介质通信并且被配置为运行该组指令以: 从广告者接收广告创意; 基于所述广告创意,在不使用外部输入的种子关键字的情况下,确定与所述广告创意 相关联的推荐竞标关键字;以及 返回该推荐关键字用于在线广告竞标。2. 如权利要求1所述的系统,其中为了确定所述推荐关键字,所述处理器还被配置为运 行该组指令以: 基于所述广告创意,获得创意特征向量; 基于所述广告创意,在无需使用由所述广告者提供的种子关键字的情况下,获得多个 关键字,所述多个关键字中的每个关键字与关键字特征向量相关联; 确定所述创意特征向量与多个关键字特征向量中的每个关键字特征向量之间的特征 相似度;以及 基于这些相似度从所述多个关键字中选择多个候选关键字。3. 如权利要求2所述的系统,其中为了选择所述多个候选关键字,所述处理器还被配置 为运行该组指令以: 从所述多个候选关键字中移除预定被排除的关键字。4. 如权利要求2所述的系统,其中为了获得关键字特征向量,所述处理器还被配置为运 行该组指令以: 执行对于所述多个关键字中的关键字的互联网搜索以获得多个搜索结果; 基于搜索结果会被使用该关键字进行互联网搜索的用户选择的可能性,从所述多个搜 索结果中选择多个候选搜索结果; 基于所述多个候选搜索结果中的每个候选搜索结果的内容,确定分立的特征向量;以 及 通过组合这多个分立的特征向量来形成所述关键字特征向量。5. 如权利要求4所述的系统,其中搜索结果会被使用该关键字进行互联网搜索的用户 选择的可能性是至少基于所述搜索结果过去被点击的数目以及所述搜索结果的内容与所 述关键字的相关性而确定的。6. 如权利要求2所述的系统,其中所述处理器还被配置为运行该组指令以: 针对所述多个候选关键字中的每个候选关键字,至少基于该候选关键字与所述广告创 意之间的所述特征相似度、文字相似度和类别相似度来确定推荐分数;以及 由计算机基于所述推荐分数,从所述多个候选关键字中选择所述推荐关键字。7. 如权利要求6所述的系统,其中所述候选关键字的文字相似度包括: 文字重叠计数,该文字重叠计数是均出现在所述候选关键字中以及所述广告创意中的 术语的数目;以及 文字重叠比例,该文字重叠比例是所述文字重叠计数与所述候选关键字中的术语的总 数目之间的比例;并且 其中所述候选关键字的类别相似度包括: 类别重叠计数,该类别重叠计数是所述候选关键字和所述广告创意均属于的类别的数 目;以及 类别重叠比例,该类别重叠比例是所述类别重叠计数与所述候选关键字所属于的类别 的总数目之间的比例。8. -种用于向广告者建议竞标关键字的计算机实现的方法,包括: 由计算机从广告者接收广告创意; 由至少一个计算机基于所述广告创意,在不使用外部输入的种子关键字的情况下,确 定与所述广告创意相关联的推荐竞标关键字;以及 由计算机返回该推荐关键字用于在线广告竞标。9. 如权利要求8所述的方法,其中确定所述推荐关键字包括: 由计算机基于所述广告创意,获得创意特征向量; 由至少一个计算机基于所述广告创意,在无需使用由所述广告者提供的种子关键字的 情况下,获得多个关键字,所述多个关键字中的每个关键字与关键字特征向量相关联; 由计算机确定所述创意特征向量与多个关键字特征向量中的每个关键字特征向量之 间的特征相似度;以及 由计算机基于这些相似度从所述多个关键字中选择多个候选关键字。10. 如权利要求9所述的方法,其中选择所述多个候选关键字还包括: 由计算机从所述多个候选关键字中移除预定被排除的关键字。11. 如权利要求9所述的方法,其中获得关键字特征向量包括: 由计算机执行对于所述多个关键字中的关键字的互联网搜索以获得多个搜索结果; 由计算机基于搜索结果会被使用该关键字进行互联网搜索的用户选择的可能性,从所 述多个搜索结果中选择多个候选搜索结果; 由计算机基于所述多个候选搜索结果中的每个候选搜索结果的内容,确定分立的特征 向量;以及 由计算机通过组合这多个分立的特征向量来形成所述关键字特征向量。12. 如权利要求11所述的方法,其中搜索结果会被使用该关键字进行互联网搜索的用 户选择的可能性是至少基于所述搜索结果过去被点击的数目以及所述搜索结果的内容与 所述关键字的相关性而确定的。13. 如权利要求9所述的方法,还包括: 针对所述多个候选关键字中的每个候选关键字,由计算机至少基于该候选关键字与所 述广告创意之间的所述特征相似度、文字相似度和类别相似度来确定推荐分数;以及 由计算机基于所述推荐分数,从所述多个候选关键字中选择所述推荐关键字。14. 如权利要求13所述的方法,其中所述候选关键字的文字相似度包括: 文字重叠计数,该文字重叠计数是均出现在所述候选关键字中以及所述广告创意中的 术语的数目;以及 文字重叠比例,该文字重叠比例是所述文字重叠计数与所述候选关键字中的术语的总 数目之间的比例;并且 其中所述候选关键字的类别相似度包括: 类别重叠计数,该类别重叠计数是所述候选关键字和所述广告创意均属于的类别的数 目;以及 类别重叠比例,该类别重叠比例是所述类别重叠计数与所述候选关键字所属于的类别 的总数目之间的比例。15. -种非暂态处理器可读存储介质,包括被配置为指令处理器执行以下动作的一组 指令: 从广告者接收广告创意; 基于所述广告创意,在不使用外部输入的种子关键字的情况下,确定与所述广告创意 相关联的推荐竞标关键字;以及 返回该推荐关键字用于在线广告竞标。16. 如权利要求15所述的存储介质,其中确定所述推荐关键字包括: 基于所述广告创意,获得创意特征向量; 基于所述广告创意,在无需使用由所述广告者提供的种子关键字的情况下,获得多个 关键字,所述多个关键字中的每个关键字与关键字特征向量相关联; 确定所述创意特征向量与多个关键字特征向量中的每个关键字特征向量之间的特征 相似度;以及 基于这些相似度从所述多个关键字中选择多个候选关键字。17. 如权利要求16所述的存储介质,还包括从所述多个候选关键字中移除预定被排除 的关键字。18. 如权利要求16所述的存储介质,其中获得关键字特征向量包括: 执行对于所述多个关键字中的关键字的互联网搜索以获得多个搜索结果; 基于搜索结果会被使用该关键字进行互联网搜索的用户选择的可能性,从所述多个搜 索结果中选择多个候选搜索结果; 基于所述多个候选搜索结果中的每个候选搜索结果的内容,确定分立的特征向量;以 及 通过组合这多个分立的特征向量来形成所述关键字特征向量, 其中搜索结果会被使用该关键字进行互联网搜索的用户选择的可能性是至少基于所 述搜索结果过去被点击的数目以及所述搜索结果的内容与所述关键字的相关性而确定的。19. 如权利要求16所述的存储介质,还包括: 针对所述多个候选关键字中的每个候选关键字,至少基于该候选关键字与所述广告创 意之间的所述特征相似度、文字相似度和类别相似度来确定推荐分数;以及 基于所述推荐分数,从所述多个候选关键字中选择所述推荐关键字。20. 如权利要求19所述的存储介质,其中所述候选关键字的文字相似度包括: 文字重叠计数,该文字重叠计数是均出现在所述候选关键字中以及所述广告创意中的 术语的数目;以及 文字重叠比例,该文字重叠比例是所述文字重叠计数与所述候选关键字中的术语的总 数目之间的比例;并且 其中所述候选关键字的类别相似度包括: 类别重叠计数,该类别重叠计数是所述候选关键字和所述广告创意均属于的类别的数 目;以及 类别重叠比例,该类别重叠比例是所述类别重叠计数与所述候选关键字所属于的类别 的总数目之间的比例。
【文档编号】G06F17/30GK106062743SQ201480076363
【公开日】2016年10月26日
【申请日】2014年3月10日
【发明人】劳伦斯·庄, 张蔚茹, 韩晓, 马霖, 吴庭毅, 罗海特·查恩达
【申请人】埃克斯凯利博Ip有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1