在线商业意图的自动检测的制作方法

文档序号:6569980阅读:132来源:国知局
专利名称:在线商业意图的自动检测的制作方法
在线商业意图的自动检测背景现代社会已经十分依赖计算机和计算机技术。在公司为客户和产品销售激 烈竞争的商业竞技场上,尤其如此。具有即时库存和准确聚焦的广告战略的公 司通常比竞争对手产品更便宜并能更快地将产品递送到顾客手中。计算机技术 通过将商业、信息和顾客联网在一起,使该类业务优势成为可能。虽然最初,计算机经由仅由局域网(LAN)组成的网络与其它计算机通信,但是因特网的 出现允许基本上拥有计算机的每个人参与到全球网络中。这使得小企业能够与 较大企业进行竞争而无需筹资和建立网络结构。随着计算和网络化技术越来越稳健、安全和可靠,更多的消费者、批发商、 零售商、企业家、教育机构等都转变样式并采用因特网来执行业务,代替使用 传统的实体店。目前,许多企业提供web站点和在线服务。例如,当今,消费 者可经由因特网访问其银行账户并进行数量不断增多的可用交易,诸如余额査 询、资金转帐和账单支付。此外,电子商务已经普及到几乎所有可以想到的业务类型。人们开始期望 他们喜欢的商店不仅有实体业务点,而且还能通常经由因特网万维网(WWW) 来进行"在线"访问。Web使顾客能够查看企业的商店和产品的图形表示。家 中的简易使用以及便捷的购买方法通常引起销售的增加。买家享受能够比较商 店而无需花费时间和金钱来在商店间奔波的自由。这会导致在线企业之间的激烈竞争,使在线广告至关重要。 一般而言,广 告是几乎任何商业市场或背景下的关键收入来源。为了到达尽可能多的顾客, 广告通常是经由广告牌、电视、无线电和诸如报纸和杂质之类的印刷媒体来呈 现的。然而,通过因特网,广告客户找到了到达分布在广阔多样的地理范围上 的大量潜在客户的新且可能是更便宜的媒介。因特网广告可以通过由浏览器和 /或能够呈现因特网内容的其它客户机设备而呈现的任何内容来查看。这可以 包括电子邮件、游戏控制台、经由TV的视频点播、web页面、和/或web站点以及访问特定站点时的弹出窗口等等。因此,诸如因特网的全球通信网络已经提供了到达大量潜在顾客的商机。在 过去几年中,大量用户已经转向因特网作为新闻、研究资源和各种其它类型信 息的可靠来源。此外,在线购物、订餐、以及购买音乐会门票和/或电影票只 是当前坐在计算机前通过因特网进行的少数几种常见活动。访问因特网越来越 容易,这也推动了web站点通信量的指数增加。通常,企业希望确保就向其广告展示的通信量类型以某种担保来证明广告成 本合理。如果广告客户相信他们到达准备购买的用户(即处于商业"交易阶段" 的用户),但是实际上大多数用户只是研究特定类型的产品(即处于商业"信息阶段"的用户)或者甚至他们仅仅是出于娱乐而浏览Web (即处于非商业阶 段的用户),则企业会对为推算针对其产品类型的实际潜在购买者的广告支付 高费用十分不满。收到不需要的广告的用户也可能会形成对在他们不想购买时 持续用广告轰炸他们的企业产生负面印象。注意到这一点非常重要,因为将产 品与买家相匹配通常是企业在商业中立足之本。当发生显著失配时,广告客户 会撤资离开,导致广告收入损失。概述以下引入主题的简化概述以便提供对主题实施例某些方面的基本理解。本 概述不是对主题的详尽总览。它不旨在标识实施例的重要/关键元素或者刻划 本主题的范围。其唯一目的是以简化形式呈现本主题的某些概念,作为以下呈 现的更详细描述的序言。本主题一般涉及网络搜索和/或浏览,尤其涉及确定用户的网络搜索和/ 或浏览意图的系统和方法。利用从网络浏览器页面和/或网络搜索查询中提取 的特征,以便于检测用户的浏览和/或搜索意图。从这些特征构建的机器学习 分类器自动检测用户的在线商业意图(0CI)。用户的意图可以是商业或非商 业的,其中商业意图是信息性或交易性的。在一个实例中,对搜索引擎采用0CI排序机制,以便于提供根据用户意图 排序的搜索结果。这还提供一种将购买广告与更有可能准备进行购买(交易阶 段)的潜在顾客相匹配的手段。此外,可以将信息广告匹配到正研究潜在购买(信息阶段)的用户。因此,可以在广告拍卖方法和系统中采用这些实例以提 供增强的性能和增加的收入。为了实现以上和相关目的,本文中结合以下描述和附图对实施例的某些说 明性方面进行描述。然而,这些方面仅指示可以采用本主题原理的各种方法中 的几个,并且本主题旨在包括所有这些方面及其等效方案。结合附图考虑以下 详细描述,本主题的其它优点和新颖特征将变得显而易见。附图简述

图1是根据实施例一方面的意图确定系统的框图。图2是根据实施例一方面的意图确定系统的另一框图。图3是根据实施例一方面的意图确定系统的又一框图。图4是根据实施例一方面的意图确定系统的再一框图。 图5是根据实施例一方面的搜索中意图变化示例的图示。 图6是根据实施例一方面的在线商业意图(0CI)的程度的图示。 图7是根据实施例一方面的构建web页面意图分类器的示例的图示。 图8是根据实施例一方面的使用web页面意图分类器预测web页面意图的 示例的图示。图9是根据实施例一方面的构建搜索意图分类器的示例的图示。 图10是根据实施例一方面的使用web页面意图分类器和组合引擎作为搜 索意图分类器来预测搜索意图的示例的图示。图11是根据实施例一方面的在线商业意图系统体系结构的示例实现的图示。图12是根据实施例一方面的0CI广告排序系统的示例实现的图示。图13是根据实施例一方面的在线商业意图系统的示例用户界面的图示。图14是根据实施例一方面的构建网络浏览信息意图分类器的方法的流程图。图15是根据实施例一方面的对网络浏览信息的意图进行分类的方法的流 程图。图16是根据实施例一方面的构建搜索意图分类器的方法的流程图。图17是根据实施例一方面的对搜索信息的意图进行分类的方法的流程图。图18示出一实施例发挥功能的示例操作环境。图19示出一实施例发挥功能的另一示例操作环境。详细描述现在参照附图描述主题,其中相同的附图标记用于指示相同的元素。在以 下描述中,出于解释目的,阐述了许多具体细节以便提供对本主题的透彻理解。 然而,显然,本主题实施例能够在无需这些具体细节的情况下实施。在其它实 例中,以框图形式示出公知的结构和设备以便于描述这些实施例。如本申请中所使用的,术语"组件"旨在指代计算机相关实体,无论是硬 件、软硬件组合、软件还是执行中的软件。例如,组件可以是,但不限于正在 处理器上运行的进程、处理器、对象、可执行代码、执行线程、程序和/或计 算机。作为说明,在服务器上运行的应用程序以及该服务器都可以是计算机组 件。 一个或多个组件可以驻留在进程和/或执行线程内,并且组件可以位于一 个计算机上和/或分布在两个或多个计算机之间。在线用户取决于他们是从因特网搜寻信息还是决定要购买的品牌和产品/ 服务而具有不同的信息需求。对购买阶段提供正确的广告能够显著增加广告战 役的效率。例如,当用户仍在信息阶段时,广告客户更适合提供用户所需产品 的更多选择,以及诱导用户返回该站点。另一方面,当用户已经处于交易阶段, 则广告客户最好显示与具体产品有关的详细价格、特征和/或折扣信息等,以代替充斥许多产品的列表。本文中系统和方法的示例检测用户购买意图的不同程度。即,用户是否处 于购买过程中,如果是,则他们购买的愿望有多强。在一个实例中,web页面 (即网络浏览信息)首先被分类到三种在线商业分类之一中。接下来,将搜索 査询分类到三种在线商业分类之一中。然后,在给定用户搜索査询的情况下, 提供适当类型的广告。以这种方式,提供一种更加有效的传递适当广告的手段。在图1中,示出根据实施例一方面的意图确定系统100的框图。意图确定 系统100由接收网络关联信息104并提供在线商业意图(0CI) 106的意图确定组件102组成。意图确定组件102 —般结合有使用网络关联训练信息的已提取特征和/或内容来训练的机器学习算法。也可以使用标签以便于该训练。这些标签可以通过基于器官(例如用户在视觉上确定0CI类型等)的手段和/或通 过基于机器的手段(例如机器学习机制等)来提供。一旦执行了训练,则意图确定组件102提取网络关联信息104的特征和/ 或内容,它们确定了在线商业意图106。然后,使用这些特征和/或内容来确定 0CI类型,诸如非商业性、信息性或交易性,随后将其输出作为在线商业意图 106。可对搜索引擎采用意图确定系统100以便于0CI驱动的排序系统、广告 0CI排序系统、和/或其它基于意图的系统等等。虽然100通常可用于期望寻找 商品和/或服务的可能买家的系统,但是100还可以在期望寻找无商业意图的 用户的系统中采用。可以将意图确定系统100无缝地集成到系统中使得它能够基本上实时地 显示意图。例如,搜索web页面可以在搜索关键词输入点附近包括用户意图指 示器。能够用于方便意图确定的数据源包括,但不限于,搜索日志、片段、赞 助链接、点击日志、和/或广告点击日志等等。网络关联信息104可以包括,但不限于,网络浏览信息和/或搜索信息等 等。意图确定系统100可以用于诸如内联网等的本地网络和/或诸如因特网等 的全球网络。因此,网络浏览信息可以包括,但不限于,因特网和/或内联网 web页面、统一资源定位符(URL)、和/或统计浏览数据等等。搜索信息可以 包括,但不限于,搜索关键词和/或短语、和/或统计搜索数据等等。参见图2,示出根据实施例一方面的意图确定系统200的另一框图。意图 确定系统200由获取搜索信息204和/或网络浏览信息206并提供OCI类型208 的意图确定组件202组成。意图确定组件202由接收组件210和机器学习分类 器组件212组成。接收组件210从诸如内联网和/或因特网来源等获取搜索信 息204和/或网络浏览信息206。搜索信息204和/或网络浏览信息206表示要 相对于意图进行分类的信息。因此,接收组件210将所获得的信息204和/或 206中继到机器学习分类器组件212。机器学量机(SVM)。使用搜索特征214和/或网络浏览特征216等来训练意图模型。 如下文更详细描述的,可以对特征(包括搜索关键词等)进行标记和/或提取, 使得它们便于创建能够基于这些差别特征等来确定意图的模型。因此,机器学 习分类器组件212对搜索信息204和/或网络浏览信息206进行处理并提供在 线商业意图(0CI)类型208 (例如非商业性、信息性、交易性)。参见图3,示出根据实施例一方面的意图确定系统300的又一框图。意图 确定系统300由获取搜索信息304和/或网络浏览信息306并提供搜索意图308 和/或页面意图310的意图确定组件302组成。意图确定组件302由接收组件 312、搜索意图分类器组件314、以及页面意图分类器组件316组成。接收组件 312从诸如内联网和/或因特网来源等获取搜索信息304和/或网络浏览信息 306。搜索信息304和/或网络浏览信息306表示要相对于意图进行分类的信息。页面意图分类器组件316确定网络浏览信息306的意图并提供页面意图 310。 316采用利用网络浏览特征320进行训练的页面意图模型。搜索意图分类 器组件314采用利用搜索特征318进行训练的搜索意图模型(可以包括诸如页 面意图模型的全部或部分)。搜索意图分类器组件314从接收组件312接收搜 索信息304,并且通过至少部分地利用基于搜索信息304的搜索结果以及页面 意图分类器组件316来处理搜索信息304,以便于对网络浏览信息306进行分 类。采用页面意图分类器组件316来处理搜索结果,然后利用所学习的组合系 数(以下详细描述)对所确定的意图进行组合以提供搜索意图308。参见图4,示出根据实施例一方面的意图确定系统400的再一框图。意图 确定系统400由获取搜索信息404和/或网络浏览信息406并提供搜索引擎意 图驱动排序408和/或基于意图的网络广告排序410的意图确定组件402组成。 与意图确定系统300类似,意图确定系统400可以用于提供意图确定以支持不 同类型的系统,诸如搜索引擎意图驱动排序408和/或基于意图的网络广告排 序410等等。意图确定组件402能够采用利用搜索特征412和/或网络浏览特 征414进行训练的意图模型以便于确定意图。因此,意图确定系统400能够提 供用于基于意图的搜索引擎的在线商业意图和/或基于意图的广告机制等等。本文中系统和方法的实例提供通过用户的在线行为(例如浏览和/或搜索 网络)来自动检测用户购买意图(即在线商业意图或OCI)的程度的手段。在线广告的基本商业原理是用户的在线活动指示用户可能处于购买过程中。通 常,购买活动中有两个主要阶段,即信息阶段——其中用户研究品牌和/或产 品/服务信息,以及交易阶段——其中用户决定购买哪个品牌和/或产品/服务。图5示出根据实施例一方面的搜索中意图变化的示例500。示例500示出关于 购买跑车的意图变化。在线用户在这两个不同阶段中具有不同的信息需求。对购买阶段提供正确 的广告能够显著增加广告战役的效率。对于以上示例500,当用户仍然处于搜 索"福特Freestyle"的信息阶段502时,广告客户最好提供对"福特Freestyle" 的更多信息和/或选择,和/或诱导用户返回商家的web站点,而不仅是向用户 提供福特Freestyle汽车之一和价格标签。另一方面,当用户已经处于交易阶 段504时,搜索"坎贝尔福特奈尔斯密歇根",广告客户最好显示例如与 汽车商有关的详细价格、特征和/或折扣信息等,而不是充斥许多其它汽车的 列表。用户不同程度的购买意图,即用户是否处于购买过程中,如果是则用户购 买的愿望有多强,被定义为在线商业意图并在图6的图表600中示出。首先, 在线活动被分成两组,商业性602 (例如用户浏览在线商店产品购买页面和/ 或产品/价格比较站点等)以及非商业性604 (例如用户浏览学术课程页面、政 府页面和/或新闻页面等)。对于商业活动,基于用户在在线购买过程中通常 历经的两个阶段来定义两个子类,这两个阶段即信息性——当用户研究产品和 /或服务时以及交易性——当用户有强烈的购买意图(例如准备将物品放入购 物车和/或意愿清单中)。本文中系统和方法的实例可以用于提供自动检测网络浏览活动背后的在 线商业意图和/或自动检测网络搜索活动背后的在线商业意图的手段。为了自 动将web页面/或搜索査询分类到正确的意图,基于从web页面和/或搜索查询 提取的特征来构建机器学习分类器。一实例还可用于提供OCI驱动的排序机制。传统搜索弓I擎基于来自搜索査 询的关键词与来自web页面内容的关键词之间的内容相似性来提供信息。OCI 驱动的排序提出与所浏览的web页面和/或搜索査询背后的意图相匹配的信息。 这种排序机制能够基本上改进用户满意度,尤其是对提供广告而言。另一实例为广告出价系统提供0CI。例如可以对在具有极强购买意图的web页面上示出 广告设置较高的价格,等等。其它实例可用于便于系统和/或方法确定在线用 户是否旨在购买和/或该用户购买意愿有多强。例如,本文中系统和方法的实例可以用于将web页面(例如包括广告页面) 和/或搜索查询分类到三种在线商业意图中,即非商业性、商业一信息性(即 "信息性")、以及商业一交易性(即"交易性")。例如,实例还可以利用 诸如页面意图分类器将web页面自动分类到三种在线商业意图中。此外,实例 还可以利用诸如搜索意图分类器将搜索査询自动分类到三种在线商业意图中。 而且此外,实例还可以提供优化从搜索查询检索在线商业意图的性能的机器学 习算法。在图7中,示出根据实施例一方面的构建web页面意图分类器708的示例 700的图示。首先,对web页面特征提取704使用带有意图标签的训练web页 面702。所提取的特征区分来自web页面内容的不同页面OCI。通过使用来自 训练web页面702的意图标签以及来自web页面特征提取704的提取特征,实 现模型训练706。应用机器训练算法,来基于所提取的特征(例如关键词模式、 位置、链接、布局等)训练模型以提供web页面意图分类器708。参见图8,示出根据实施例一方面的使用web页面意图分类器预测web页 面意图的示例800的图示。当获取了web页面802以供分类时,进行web页面 特征提取804。所提取的特征至少部分地是在训练阶段使用的特征。然后,web 页面意图分类器806使用所提取的特征(例如关键词模式、位置、链接、布局 等)以基于该web页面802的在线商业意图确定web页面意图。转向图9,示出根据实施例一方面的构建搜索意图分类器912的示例900 的图示。带有标记意图902的查询由搜索引擎904进行处理。将从搜索引擎904 返回的结果页面和/或该搜索的前N个结果(其中N是从1到无穷大的整数) 发送给web页面意图分类器906。通常,在优化方法中使用第一 (或最高排序) 结果页面。搜索结果页面可以包含例如查询片段、赞助链接和/或与搜索查询 相关的其它信息等等。搜索结果页面和/或前N个结果的每一个都被视为web 页面。web页面意图分类器906为搜索结果页面和/或每个搜索结果确定OCI。 例如在某些实例中,web页面意图分类器906可以包括特别构建成处理搜索结果页面的特别固定页面结构的页面分类器。组合引擎908组合从搜索引擎904 返回的搜索结果页面和/或前N个搜索结果的0CI,以为带有标记意图902的査 询计算搜索意图,从而提供搜索意图分类器912。在此,组合引擎908中的N 和权重系数被优化,以便获得最佳分类准确性。在一个实例中,组合引擎908利用搜索结果的线性组合。可以利用带有标 记意图902的査询来训练组合系数910。可以利用机器学习算法来调谐这些参 数。web页面意图分类器906和组合引擎908可以一起使用,作为搜索意图分 类器912。本领域技术人员可以意识到,可以使用其它参数来代替和/或扩充前 N个结果,并且仍在本文中系统和方法的范围之内。例如,也可以使用诸如搜 索日志、片段、赞助链接、点击日志和/或广告点击日志等的其它数据源。参照图10,示出根据实施例一方面的将web页面意图分类器1006和组合 引擎1008用作搜索意图分类器1012来预测搜索意图的示例的图示。当搜索查 询1002传入时,将该搜索査询1002发送到搜索引擎1004。搜索结果页面和/ 或前P个搜索结果被搜索引擎1004获得,其中P是从1到无穷大的整数(并 且可与N不同)。搜索结果页面和/或前P个结果被视为各个web页面。然后, 将每个web页面传递到为每个搜索结果确定OCI的web页面意图分类器1006。 例如在某些实例中,web页面意图分类器1006可以包括特别构建成处理搜索结 果页面的特别固定页面结构的页面分类器。然后,将0CI传递给组合引擎1008。 组合引擎1008可以将经优化的系数应用到OCI并返回经组合的OCI作为该査 询的搜索意图1010。本领域技术人员可以意识到,可以使用其它参数来代替和 /或扩充前P个结果,并且仍在本文中系统和方法的范围之内。例如,也可以 使用诸如搜索日志、片段、赞助链接、点击日志和/或广告点击日志等的其它 数据源。参见图11,示出根据实施例一方面的在线商业意图系统体系结构1100的 示例实现的图示。体系结构1100在一个系统中提供训练进程、在线进程和特 征提取进程(其中Q表示从1到无穷大的整数)。参见图12,示出根据实施例 一方面的OCI广告排序系统1200的示例实现的图示(其中Z表示从1到无穷 大的整数)。本文中系统和方法的实例还可以被纳入如图13所示的示例用户 界面1300中。用于搜索输入的工具栏1302显示搜索査询1304,随后显示OCI1306。如果用户点击OCI 1306,则出现辅助显示1308,示出OCI类型的百分 比。就以上所示或所述的示例性系统而言,可以参照图14-17的流程图更好地 理解可根据实施例实现的方法。虽然出于说明简洁目的,可将这些方法示出和 描述为一系列框,但是应该理解和意识到,这些实施例并不受框次序的限制, 因为根据一实施例,某些框可以与本文所示和所述的不同次序和/或与其它框 并发进行。此外,并非所有示出的框都是实现根据本发明的方法所必须的。可以在由一个或多个组件执行的诸如程序模块的计算机可执行指令的一 般上下文中描述这些实施例。通常,程序模块包括执行特定任务或实现特定抽 象数据类型的例程、程序、对象、数据结构等。通常,可以按照实施例各个实 例中所需要地对程序模块的功能进行组合和分布。图14中,示出根据实施例一方面的构建网络浏览信息意图分类器的方法 1400的流程图。方法1400通过获取网络浏览信息以便于模型训练1404而在 1402开始。网络浏览信息可以包括,但不限于,因特网和/或内联网web页面、 统一资源定位符(URL)、和/或统计浏览数据等等。然后,从网络浏览信息提 取意图区分特征和/或内容1406。这些特征/内容便于区分在线商业意图(OCI) 的不同类型,即非商业性、信息性和交易性。这些特征可以包括,但不限于, 关键词模式、位置、链接和/或布局等。应用机器学习进程以基于所提取的特 征和/或内容训练意图模型1408。机器学习进程可以包括例如基于SVM的学习 等等。然后,基于意图模型构建网络浏览信息意图分类器1410,结束流程1412。 可以采用该分类器以便于确定例如web页面等的OCI类型。参见图15,示出根据实施例一方面的对网络浏览信息的意图进行分类的 方法1500的流程图。方法1500通过获取网络浏览信息以供分类1504而开始 1502。网络浏览信息可以包括,但不限于,因特网和/或内联网web页面、统 一资源定位符(URL)、和/或统计浏览数据等等。例如,信息可以源自广告系 统、直接来自用户、和/或来自需要搜索结果页面被处理的搜索引擎等等。然 后,从网络浏览信息提取意图特征和/或内容1506。然后,使用网络浏览信息 意图分类器来确定网络浏览信息的意图1508,结束流程1510。网络浏览信息意图分类器将所提取的意图特征和/或内容与区分在线商业意图(0CI)的不同 类型的特征进行比较以确定意图。参照图16,示出根据实施例一方面的构建搜索意图分类器的方法1600的 流程图。方法1600通过获取标记意图的查询信息1604而开始1602。查询信 息可以包括,但不限于,搜索关键词和/或短语、和/或统计搜索数据等等。然 后,用搜索引擎对标记查询信息进行处理以寻找搜索结果页面和/或前"N"个 查询结果1606,其中"N"是从1到无穷大的整数。通常,在优化方法中使用 第一 (或最高排序)结果页面。搜索结果页面可以包含例如査询片段、赞助链 接和/或与搜索查询相关的其它信息等等。然后经由采用网络浏览信息意图分 类器来确定与搜索结果页面和/或每一前"N"查询结果相关联的网络浏览信息 的意图1608。例如在某些实例中,网络浏览信息意图分类器可以包括特别构建 成处理搜索结果页面的特别固定页面结构的意图分类器。利用所学习的组合系 数来组合来自搜索结果页面和/或前"N"个查询结果的意图,以构建搜索意图 分类器1610,结束流程1612。可以采用机器学习,以便于组合系数的学习。 本领域技术人员可以意识到,可以使用其它参数来代替或扩充搜索结果页面和 /或前N个结果,并且仍在本文中系统和方法的范围之内。例如,也可以使用 诸如搜索日志、片段、赞助链接、点击日志和/或广告点击日志等的其它数据 源。参见图17,示出根据实施例一方面的对搜索信息的意图进行分类的方法 1700的流程图。方法1700通过获取查询信息以供分类1704而开始1702。然 后,用搜索引擎对査询信息进行处理以寻找搜索结果页面和/或前"P"个查询 结果1706,其中"P"是从1到无穷大的整数(注意用于训练查询意图模型 的结果数量不必与用于对查询意图进行分类的结果数量相同)。通常,在优化 方法中使用第一 (或最高排序)结果页面。搜索结果页面可以包含例如查询片 段、赞助链接和/或与搜索査询相关的其它信息等等。然后经由采用网络浏览 信息意图分类器来确定与搜索结果页面和/或每一前"P"个査询结果相关联的 网络浏览信息的意图1708。网络浏览信息意图分类器可以按照以上方法1400 构建并按照以上方法1500使用。例如在某些实例中,网络浏览信息意图分类 器可以包括特别构建成处理搜索结果页面的特别固定页面结构的意图分类器。通过使用所学习的组合系数对来自搜索结果页面和/或前"P"个查询结果的意图进行组合,来确定搜索意图1710,结束流程1712。本领域技术人员可以意 识到,可以使用其它参数来代替或扩充搜索结果页面和/或前"N"个结果,并 且仍在本文中系统和方法的范围之内。例如,也可以使用诸如搜索日志、片段、 赞助链接、点击日志和/或广告点击日志等的其它数据源。为了提供实现实施例各个方面的附加上下文,图18和以下讨论旨在提供 可以执行本发明各方面的合适计算环境1800的简要、 一般描述。虽然以上在 运行于本地计算机和/或远程计算机的计算机程序的计算机可执行指令的一般 上下文中对实施例进行了描述,但是本领域技术人员可以认识到,也可以结合 其它程序模块执行这些实施例。通常,程序模块包括执行特定任务和/或实现 特定抽象数据类型的例程、程序、组件、数据结构等。此外,本领域技术人员 会意识到,可以采用其它计算机系统配置来实践本发明的方法,包括单处理器 或多处理器计算机系统、小型计算机、大型计算机以及个人计算机、手持式计 算设备、基于微处理器和/或可编程消费电子产品等等,其中每个都能够与一 个或多个关联设备有效通信。还可以在分布式计算环境中实践本发明的所示方 面,其中特定任务可以通过经由通信网络链接的远程处理设备来执行。然而,即使不是实施例的全部方面,实施例的部分也可以在独立计算机上实践。在分 布式计算环境中,程序模块可以位于本地和/或远程存储器存储设备中。参照图18,用于执行实施例各方面的示例性系统环境1800包括常规计算 机1802,包括处理单元1804、系统存储器1806和将包括系统存储器在内的各 种系统组件耦合到处理单元1804的系统总线1808。处理单元1804可以是任何 市场上可购买的或专用处理器。此外,处理单元可以实现为由诸如并行连接的 一个以上处理器形成的多处理器。系统总线1808可以是若干类型总线结构中任一种,包括存储器总线或存 储器控制器、外围总线和使用诸如PCI、 VESA、微信道、ISA、和EISA的各种 常规总线体系结构中任一种的局域总线。系统存储器1806包括只读存储器 (ROM) 1810和随机存取存储器(RAM) 1812。基本输入/输出系统(BIOS) 1814 存储在ROM 1810中,包含帮助在诸如启动期间在计算机1802内元件之间传递 信息的基本例程。计算机1802还包括诸如对可移动磁盘1820读写的硬盘驱动器1816、磁 盘驱动器1828,以及对CD-R0M盘1824或其它光学介质读写的光盘驱动器1822。 硬盘驱动器1816,磁盘驱动器1818和光盘驱动器1822分别通过硬盘驱动器接 口 1826、磁盘驱动器接口 1828和光盘驱动器接口 1830连接于系统总线1808。 驱动器1816-1822及其关联计算机可读介质为计算机1802提供数据、数据结 构、计算机可执行指令等的非易失性存储。虽然以上计算机可读介质的描述涉 及硬盘、可移动磁盘和CD,但是本领域技术人员应该意识到,在示例性操作环 境1800中还可以使用可由计算机读取的其它类型介质,诸如磁带盒、闪存、 数字视频盘、贝努利盒式磁带等,并且任何这种介质可以包含用于执行本实施 例方法的计算机可执行指令。多个程序模块可以存储在驱动器1816-1822和RAM 1812中,包括操作系 统1832、 一个或多个应用程序1834、其它程序模块1836和程序数据1838。操 作系统1832可以是任何合适的操作系统或操作系统的组合。通过示例,应用 程序1834和程序模块1836可以包括根据实施例的一方面的意图确定方案。用户能够通过诸如键盘1840和定点设备(例如鼠标1842)的一个或多个 用户输入设备向计算机1802中输入命令和信息。其它输入设备(未输出)可 以包括麦克风、操纵杆、游戏手柄、圆盘式卫星天线、无线遥控、扫描仪等。 这些和其它输入设备通常经由耦合到系统总线1808的串行端口接口 1844连接 到处理单元1804,但是可以通过诸如并行端口、游戏端口或通用串行总线(USB) 的其它接口连接。还可以经由视频适配器1848将监视器1846或其它类型的显 示设备连接到系统总线1808。除了监视器1846之外,计算机1802可以包括其 它外围输出设备(未输出),诸如扬声器、打印机等。应该意识到,计算机1802能够在使用到一个或多个远程计算机1860的逻 辑连接的网络化环境中操作。远程计算机1860可以是工作站、服务器计算机、 路由器、对等设备或其它公共网络结点,并且通常包括相关于计算机1802描 述的元件的某些或全部,虽然出于简洁目的,在图18中只示出存储器存储设 备1862。图18所示的逻辑连接可以包括局域网(LAN) 1864和广域网(WAN) 1866。这种网络环境在办公室、企业范围计算机网络、内联网和因特网中十分 常见。例如,当在LAN联网环境中使用时,计算机1802经由网络接口或适配器 1868连接到局域网1864。当在WAN联网环境中使用时,计算机1802通常包括 调制解调器(例如电话、DSL、缆线等)1870,或者连接到LAN上的通信服务 器,或者具有用于在诸如因特网的WAN 1866上建立通信的其它装置。对计算 机1802或为内置或为外置的调制解调器1870经由串行端口接口 1844连接到 系统总线1808。在网络化环境中,程序模块(包括应用程序1834)和/或程序 数据1838可以存储在远程存储器存储设备1862中。应该意识到,所示网络连 接是示例性的,并且在执行实施例一方面时可以使用在计算机1802与1860之 间建立通信链路的其它装置(例如有线或无线)。根据计算机编程领域中技术人员的实践,除非另行指出,否则参照由诸如 计算机1802或远程计算机1860之类的计算机所执行动作和操作的符号表示来 描述实施例。这些动作和操作有时被称为计算机执行。应该意识到,这些动作 和符号表示的操作包括由处理单元1804对表示导致电信号表示的变换或縮减 的数据位的电信号的操控,以及数据位在存储器系统(包括系统存储器1806、 硬盘驱动器1816、软盘1820、 CD-ROM 1824和远程存储器1862)的存储器位 置上的维护以重新配置或以其他方式改变计算机系统操作、以及其它信号处 理。维护这些数据位的存储器位置是具有与数据位对应的特定电、磁或光性质 的物理位置。图19是实施例能够交互的示例计算环境1900的另一框图。系统1900还 示出包括一个或多个客户机1902的系统。客户机1902可以是硬件和/或软件(例如线程、进程、计算设备)。系统1900还包括一个或多个服务器1904。 服务器1904也可以是硬件和/或软件(例如线程、进程、计算设备)。客户机 1902与服务器1904之间的一种可能通信可以采用适于在两个或多个计算进程 之间传送的数据分组的形式。系统1900包括可以采用以便于客户机1902与服 务器1904之间通信的通信框架1908。客户机1902连接到可用于将信息存储到 客户机1902本地的一个或多个客户机数据存储1910。类似地,服务器1904 连接到可用于将信息存储到服务器1904本地的一个或多个服务器数据存储 1906。应该意识到,实施例的系统和/或方法可以在便于计算机组件和非计算机 相关组件等的意图确定中使用。此外,本领域技术人员会认识到,实施例的系 统和/或方法可以在大量相关电子技术中采用,包括但不限于计算机、服务器 和/或手持式电子设备等。以上所描述的包括实施例的示例。当然,不可能为了描述实施例而描述组 件或方法的所有可构想组合,但是本领域技术人员可以认识到,本发明的许多 其它组合和排列也有可能。相应地,本主题旨在涵盖落在所附权利要求书的精 神和范围内的所有这些更改、修改和变化。此外,就在详细描述或权利要求书 中使用的术语"包含"而言,该术语旨在以与术语"包括"类似的方式表示包 括性,如同"包含"在权利要求中用作过渡词汇时所解读的一样。
权利要求
1.一种便于确定意图的系统,包括接收至少部分地包括搜索信息和/或网络浏览信息的网络关联信息的组件;以及分类器组件,确定所述网络关联信息的意图并提供所述搜索信息和/或网络浏览信息的在线商业意图类型。
2. 如权利要求1所述的系统,其特征在于,所述分类器组件采用根 据所述网络浏览信息的所提取特征和/或内容训练的意图模型。
3. 如权利要求1所述的系统,其特征在于,所述分类器组件采用根 据搜索结果页面和/或前N个搜索结果的列表以及组合系数训练的意图模型, 其中N是从1到无穷大的整数。
4. 如权利要求1所述的系统,其特征在于,所述在线商业意图类型 包括非商业意图、信息意图或交易意图。
5. 如权利要求1所述的系统,其特征在于,所述分类器组件利用网 络浏览器信息分类器以便于对至少一个搜索查询进行分类。
6. 如权利要求1所述的系统,其特征在于,所述分类器组件采用机 器学习以便于确定意图。
7. 如权利要求1所述的系统,其特征在于,所述网络浏览信息包括 至少一个web页面和/或至少一个搜索结果页面。
8. —种采用如权利要求1所述的系统以便于基于搜索意图对搜索结果排序的搜索引擎。
9. 一种采用如权利要求1所述的系统以便于确定在线广告的定价和/或将广告关联到网络关联信息的在线广告系统。
10. —种便于确定意图的方法,包括 从网络获取浏览训练信息以便于模型训练; 从所述网络浏览训练信息提取意图区分特征和/或内容; 应用机器学习进程以基于所提取的特征和/或内容训练意图模型;以及 基于所述意图模型构建网络浏览信息意图分类器。
11. 如权利要求10所述的方法,其特征在于,还包括 将所述网络浏览信息意图分类器构建成至少部分地包括便于处理搜索结果页面的结构特征的意图分类器。
12. 如权利要求10所述的方法,其特征在于,还包括 从网络获取浏览信息用于意图分类; 从所述网络浏览信息提取至少一个意图特征;以及 采用所述网络浏览信息意图分类器来确定所述网络浏览信息的意图。
13. 如权利要求12所述的方法,其特征在于,还包括: 将web页面自动分类到在线商业意图(0CI)类型中。
14. 如权利要求IO所述的方法,其特征在于,还包括 获取标记意图的查询信息以便于搜索意图模型训练;用搜索引擎处理所述标记意图的査询信息以确定搜索结果页面和/或前N 个査询结果的列表,其中N是从1到无穷大的整数;经由采用所述网络浏览信息意图分类器,确定与所述搜索结果页面和/或的浏览信息的意图;以及至少部分地利用组合系数对来自所述搜索结果页面和/或所述前N个查询 结果的意图进行组合,以构建搜索意图分类器。
15. 如权利要求14所述的方法,其特征在于,还包括 获得查询信息以供意图分类;用搜索引擎处理所述査询信息以确定搜索结果页面和/或前p个查询结果的列表,其中P是从1到无穷大的整数;经由采用所述网络浏览信息意图分类器,确定与所述搜索结果页面和/或每一前P个査询结果相关联的网络浏览信息的意图;以及通过至少部分地利用所述组合系数对来自所述搜索结果页面和/或所述前 p个査询结果的意图进行组合,来确定搜索意图。
16. 如权利要求15所述的方法,其特征在于,还包括 采用机器学习算法来便于优化检测搜索查询意图的性能;
17. 如权利要求15所述的方法,其特征在于,还包括 将所述查询信息自动分类到在线商业意图(0CI)类型中。
18. —种至少部分地釆用如权利要求15所述的方法的广告销售方法。
19. 一种便于确定意图的系统,包括接收至少部分地包括搜索信息和/或网络浏览信息的网络关联信息的装置;确定所述网络关联信息的意图的装置;以及提供所述搜索信息和/或网络浏览信息的在线商业意图类型的装置。
20. —种采用如权利要求1所述的系统的设备,包括选自计算机、服 务器和手持式电子设备中的至少一个。
全文摘要
利用从网络浏览器页面和/或网络搜索查询中提取的特征,以便于检测用户的浏览和/或搜索意图。从这些特征构建的机器学习分类器自动检测用户的在线商业意图(OCI)。用户的意图可以是商业性或非商业性的,其中商业意图是信息性或交易性的。在一个实例中,对搜索引擎采用OCI排序机制,以便于提供根据用户意图排序的搜索结果。这还提供一种将购买广告与更有可能准备进行购买(交易阶段)的潜在顾客相匹配的手段。此外,可以将信息广告匹配到研究潜在(信息阶段)的用户。
文档编号G06F17/00GK101331475SQ200680046842
公开日2008年12月24日 申请日期2006年11月13日 优先权日2005年12月14日
发明者L·王, L·赵, Y·李, 文继荣, 聂再清 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1