定义用户意图的制作方法

文档序号:6425724阅读:126来源:国知局
专利名称:定义用户意图的制作方法
技术领域
本申请涉及定义用户意图。
背景技术
传统地,广告和其它信息源基于用户的当前行为被标识为与用户相关(用户的当前行为包括搜索查询以及页视图),而不考虑用户在更丰富的上下文中的意图。该方法很少为用户提供相关信息,因为该方法无法考虑除了用户的当前行为之外的用户信息的其它源。例如,当用户在搜索页上提交一查询时,在大多数情况下,很难根据单个查询来确定用户的真实需求或意图。例如,对“芝加哥”的查询具有多个意思,包括城市、乐队和电影。即使知道用户指的是城市,用户的真实意图仍然未知。例如,用户可能想要去芝加哥旅行、搬到芝加哥、寻找有关芝加哥的当前天气情况,可能仅仅需要芝加哥的总体信息,等等。进一步,用户将来的意图通常不能仅通过分析用户的当前行为来确定。作为一个附加示例,对“相机”的搜索查询可代表用户具有的与相机有关的多种意图,诸如购买、销售、阅读评论、维修、等等。仅根据对“相机”的搜索查询来提供搜索结果会带来令人沮丧的用户体验,因为在不多知道一点用户意图的情况下,用户时常没有被导向相关信息。

发明内容
提供本发明内容是为了以简化的形式介绍将在以下具体实施方式
中进一步描述的一些概念。本发明内容不旨在标识所要求保护的主题的关键特征或本质特征,也不旨在用于帮助确定所要求保护的主题的范围。本发明的实施例涉及用于基于从各种源接收到的用户信息来定义和确定用户意图的方法。在线服务的因素正在理解用户意图。在没有理解用户的真实需求的情况下,无法向在线用户提供相关服务。因此,本发明的实施例提供代表用户意图的科学方法的定义。 用户意图可以从三方面定义语义、偏好和语用,基于这些方面,用户随后可用更及时且更高效的方式来完成其目标。意图的语义部分指示意图在例如主题意义层面上实际是关于什么的。由此,主题表达表示意图的语义。意图的偏好部分(例如属性)指示针对特定主题表达的用户偏好。最后,意图的语用部分指示关于该主题表达的用户心中的任务或动作。 换言之,意图定义的语用部分定义了可被执行以完成任务的步骤和活动。主题表达以及相关联的属性和动作用意图结构来表示,该意图结构示出了各个主题表达之间的关系。然后使用一算法来将关键词从用户数据映射到意图结构来推断当前和将来的用户意图。各种类型的信息,例如广告和搜索结果,可基于推断的用户意图被提供给用户。


下面参考附图详细描述本发明,附图中图1是适用于实现本发明的各实施例的示例性计算环境的框图;图2是配置成用于实现本发明的各实施例的示例性计算系统体系结构的框图3是示出根据本发明的实施例的用于根据定义的用户意图来进行广告的示例性系统的框图;图4是示出根据本发明的一实施例的用于定义用户意图的三方面的图示;图5是根据本发明的一实施例的用于定义意图分类的分层树;图6是根据本发明的一实施例的示出主题的分层结构的表;图7是根据本发明的一实施例的列出与特定主题相关联的示例性动作的表;图8是根据本发明的一实施例的列出与特定主题相关联的示例性属性的表;图9是根据本发明的一实施例的用于定义用户意图的方法的流程图;以及图10是根据本发明的一实施例的用于表示用户意图的方法的流程图。详细描述此处用细节来描述本发明的主题以满足法定要求。然而,该描述本身并非旨在限制本专利的范围。相反,发明人设想所要求保护的主题还可结合其他当前或未来技术按照其他方式来具体化,以包括不同的步骤或类似于本文中所描述的步骤的步骤组合。此外,尽管术语“步骤”和/或“框”可在此处用于指示所采用的方法的不同元素,但除非而且仅当明确描述了各个步骤的顺序,否则该术语不应被解释为意味着此处公开的各个步骤之中或之间的任何特定顺序。本发明的实施例提供用于定义用户意图的方法,以便可推断和使用当前和将来的用户意图以向用户选择并提供相关的广告和其它这样的信息。首先,用户意图由三方面定义,包括语义、偏好、和语用。因此,生成包括特定语义(例如主题表达)、一个或多个语用 (例如动作)、以及(可选的)一个或多个偏好(例如属性)的三向图。因此,在一个实施例中,属性并不与特定主题表达相关联。从这些三向图中,生成了展现又在此处被称为主题表达的各主题之间的关系的分层的树结构。例如,第一主题表达“车辆”可包括诸如“摩托车”、“SUV”和“小型房车”的多个子主题表达。“车辆”的示例动作包括“服务”、“汽车”和 “代理商”。“车辆”的示例属性包括“燃料类型”和“花费”。一旦生成分层结构,可通过算法来推断用户意图,该算法将在用户数据(例如,日志数据、用户简档、社交网站)中找到的关键词与分层结构中的术语相匹配。从那里,可基于用户意图向用户提供广告和诸如搜索结果、用于执行任务的一系列步骤、网站个性化等其它信息源。因此,在一个方面中,本发明涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括标识主题表达,并将至少一个动作与主题表达相关联,其中至少一个动作指示要被执行以完成对应于主题表达的任务的步骤。该方法还包括生成指示主题表达和一个或多个其它主题表达之间的关系的意图结构。在另一方面中,本发明涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括搜索结果修改系统。该系统包括与一个或多个处理器相关联的计算设备、一个或多个计算机可读存储介质、以及与计算设备相耦合的数据存储。进一步,系统包括意图确定引擎,该意图确定引擎通过将动作和属性与主题表达相关联来定义用户意图、组织主题表达来表示主题表达之间的关系以及使用组织过的主题表达和从一个或多个源接收的用户数据为特定用户确定用户意图。
又一方面涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括将多个主题表达中的每一个与至少一个属性和至少一个动作相关联。该方法进一步包括生成表示多个主题表达之间的关系的分层结构,以及从一个或多个源接收用户数据。另外,该方法包括通过标识用户数据中对应于分层结构中的多个主题表达、至少一个属性和至少一个动作的关键词来通过算法确定用户意图。在简要描述了本发明各实施例的概览之后,以下描述可实现本发明的各实施方式的示例性操作环境,以便为本发明各方面提供通用上下文。首先具体参考图1,示出了用于实现本发明的各实施方式的示例性操作环境,并将其概括地指定为计算设备100。计算设备 100只是合适的计算环境的一个示例,并且不旨在对本发明的使用范围或功能提出任何限制。也不应该将计算设备100解释为对所示出的任一组件或其组合有任何依赖性或要求。本发明可以在由计算机或诸如个人数据助理或其他手持式设备之类的其他机器执行的计算机代码或机器可使用指令(包括诸如程序模块之类的计算机可执行指令)的一般上下文中描述。一般而言,包括例程、程序、对象、组件、数据结构等的程序模块指的是执行特定任务或实现特定抽象数据类型的代码。本发明可以在各种系统配置中实施,这些系统配置包括手持式设备、消费电子产品、通用计算机、更专用计算设备等等。本发明也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实施。参考图1,计算设备100包括直接或间接耦合以下设备的总线110 存储器112、一个或多个处理器114、一个或多个呈现组件116、输入/输出端口 118、输入/输出组件120、 和说明性电源122。总线110表示一个或多个总线可以为何物(诸如地址总线、数据总线或其组合)。虽然为了清楚起见利用线条示出了图1的各个框,但实际上,这些框表示逻辑组件而不一定是实际组件。例如,可以认为诸如显示设备的呈现组件是I/O组件。而且,处理器具有存储器。可以认识到,这是本领域的特性,并且重申,图1的图示只是例示可结合本发明的一个或多个实施例来使用的示例性计算设备。诸如“工作站”、“服务器”、“膝上型计算机”、“手持式设备”等分类之间没有区别,它们全部都被认为是在图1的范围之内的并且被称为“计算设备”。计算设备100通常包括各种计算机可读介质。计算机可读介质可以是可由计算机设备100访问的任何可用介质,且包括用任何方法和技术实现以存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机可读介质包括但不限于,RAM、ROM、EEPR0M、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、盒式磁带、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并且可由计算设备100访问的任何其它介质。上面各项中的任何项的组合也包括在计算机可读介质的范围内。存储器112包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移动的、不可移动的、或其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从诸如存储器112或I/O组件120等各种实体读取数据的一个或多个处理器。呈现组件116向用户或其他设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组件、振动组件等等。I/O端口 118允许计算设备100逻辑上耦合至包括I/O组件120的其它设备,其中某些可以是内置的。说明性组件包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、无线设备等等。现参考图2,提供了示出在其中可以采用本发明的各实施例的示例性系统200的框图。应当理解,此处所描述的这一和其它安排仅作为示例来阐明。附加于或替代于所示的安排和元素,可使用其他安排和元素(例如机器、接口、功能、次序、以及功能聚集等),并且可完全省略某些元素。此外,此处所描述的许多元素是可以实现为分立或分布式组件或结合其他组件来实现的、以及以任何合适的组合和在任何合适的位置的功能实体。此处被描述为由一个或多个实体执行的各种功能可由硬件、固件和/或软件来执行。例如,各种功能可由执行存储在存储器中的指令的处理器来执行。除了未示出的其它组件之外,系统200包括用户设备202、服务器204、第三方数据源206、广告存储208、以及意图确定引擎210。图2所示的组件中的每一个都可以是任何类型的计算设备,诸如例如参考图1描述的计算设备100。各组件可以经由网络220彼此通信,网络220包括但不限于一个或多个局域网(LAN)和/或广域网(WAN)。这样的联网环境常见于办公室、企业范围计算机网络、内联网和因特网中。应理解,可在本发明范围内的系统200内采用任何数量的用户设备、服务器、第三方数据源、广告存储、以及意图确定引擎。 它们各自可包括单个设备或在分布式环境中协作的多个设备。例如,多个用户设备通常在任意时刻通过网络进行通信。进一步,本发明的各实施例中可采用一个或多个第三方数据源。另外,在系统200内还可包括其他未示出的组件。用户可通过诸如用户设备202等用户设备与网络220通信。用户设备202可以是图1中描述的有关计算设备100的任何类型的设备。在一个实施例中,用户设备202允许用户通过网络220在搜索网站上提交一搜索查询。或者,用户可与诸如社交网站等各网站交互。可通过网络220从用户设备202捕捉来自这些网站的数据,这些数据可包括被用户访问过的网页的日志。第三方数据源206包括与用户相关联的各种类型的数据,仅作为示例,这些数据包括日志数据(例如查询日志、网页视图日志、web日志、工具栏日志)、用户简档信息(例如年龄、性别、位置、兴趣)以及现场数据,在一个例子中,该现场数据包括来自诸如社交网站等各网站的数据。来自第三方数据源的这些用户数据可以被用来推断或确定用户的意图。例如,用户数据可包括可以被提取并映射到先前生成的意图结构的各种关键词,该先前生成的意图结构可以是例如表示各主题表达之间的关系的分层树。在一个实例中,用户数据中的关键词包括主题表达的子集、动作的子集、以及属性的子集。如此处所使用的,主题表达是表示主题或语义的一个或多个字母数字串。例如,一个示例性主题表达是“芝加哥”。 主题表达与动作、以及在某些实施例中将在此进一步详述的属性相关联,以更彻底地定义主题表达。“芝加哥”可表示城市、乐队或电影。为了更彻底地理解用户的意图,需要关于主题表达的更多信息。广告存储208是包括了能根据用户意图被取出用来呈现给用户的广告的数据存储。意图确定引擎210 —般执行各种功能,包括通过将动作和(可选的)属性与主题表达相关联来定义用户意图、组织主题表达来表示主题表达之间的关系以及采用组织过的主题表达和从一个或多个源接收的用户数据为特定用户确定用户意图。意图确定引擎210 包括若干独立的组件或模块。除了那些在图2中显示的之外,这些模块包括意图定义模块212、意图分类模块214、意图推断模块216、以及广告模块218。该意图定义模块212负责定义用户意图,该模块可以采用多种方式实现。在本发明的一实施例中,用户意图由三方面定义,包括语义、偏好、和语用。语义表示意图是关于什么的,诸如与意图相关联的主题(例如主题表达)使用上述示例,“芝加哥”是一个示例性主题,但可表示城市、乐队、电影等, 为了更彻底地理解用户的意图,理解用户真正想知道什么是很有用的。第二方面是偏好,例如用户对于某个主题的偏好是什么。例如,对于“相机”的主题表达,偏好可包括颜色、品牌、 型号等。偏好在此处一般被称为属性。最后,语用包括用户心中的任务,例如可被执行以实现这些任务的步骤或活动。语用在此处一般被称为动作。通过绘图来表示,用户意图可采用诸如图3中所示的示图来阐述,下文将作更全面地描述。一旦用户意图被意图定义模块212所定义,意图分类模块214组织意图使得它们可以被方便地管理,并且使得用户行为可以被映射到意图。由此,生成了示出各意图或主题表达之间的关系的意图结构,使得意图链变得清晰。在一个实施例中,建立分类,其将主题表达组织成分层树。示例性关系包括“是一”、“部分”以及“特殊/ 一般”。主题或主题表达是意图的载体。因此,可采用现有的主题分类并将适当的动作和属性添加至分类或分层树的每个注释中,以将主题分类扩展为意图分类。仅作为示例,“汽车”可以是分层树中的第一层主题表达。在第二层处,示例性主题表达是“SUV”和“轿车”。在第三层处,示例性主题表达是“丰田”和“本田”。图5示出意图分类的示例性分层树,以下将详述。进一步,主题、属性和动作的示例在图6、7、8中的表中示出。意图推断模块216负责确定特定用户的实际意图。从一个或多个源接收用户数据,用户数据包括例如展示了用户之前的行为的日志数据(例如查询日志、网页视图日志、web日志、工具栏日志)、用户简档信息(例如年龄、性别、位置、兴趣)以及现场数据, 在一个例子中,该现场数据包括来自诸如社交网站等各网站的数据。例如,对应于用户与其它网站的交互的数据可为用户意图提供极有价值的信息。在一个实施例中,意图推断模块 216被给予来自由用户提交的搜索查询的初始意图。为了寻找相关联的动作以及(在某些实施例中)属性,采用上述来自一个或多个源的用户数据,并将该用户数据映射到由意图分类模块214生成的意图结构中的主题表达、相关联的属性和动作。可采用一个或多个算法,诸如条件随机场之类的为序列数据建模的算法。此处并没有描述特定算法,因为各种算法都能够执行此处描述的本发明的各实施例。以下阐述示例性数据结构,该数据结构可以被用来对用户意图进行分类。在此,输出是用户意图向量(列表〈CIntent〉,其中CHntent在以下被定义)。除了主题和动作标识外,属性和值也配对(例如型号/本田,式样/卡罗拉)。是用户将具有所定义的意图的可能性,TimeStamp是用户具有该意图的时刻。
8
权利要求
1.一个或多个存储计算机可使用指令的计算机可读介质,所述指令在由一个或多个计算设备使用时使得所述一个或多个计算设备执行一种方法,所述方法包括标识(910)主题表达;将至少一个动作与所述主题表达相关联(912),其中所述至少一个动作指示要被执行以完成对应于所述主题表达的任务的步骤;以及生成(916)意图结构,所述意图结构指示所述主题表达与一个或多个其它主题表达之间的关系。
2.如权利要求1所述的一个或多个计算机可读介质,其特征在于,还包括将至少一个属性与所述主题表达相关联。
3.如权利要求2所述的一个或多个计算机可读介质,其特征在于,还包括从一个或多个源接收用户数据,其中所述用户数据从社交网站、日志数据或用户简档中的至少一个被接收。
4.如权利要求2所述的一个或多个计算机可读介质,其特征在于,还包括使用所述用户数据,确定对应于特定用户的用户意图。
5.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括基于经确定的用户意图向所述用户提供一个或多个广告。
6.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括基于所述用户意图个性化网页。
7.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括基于所述用户意图在搜索结果网页上提供一个或多个搜索结果。
8.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括提供被推荐给所述用户以完成对应于所述主题表达的所述任务的一个或多个步骤。
9.一种搜索结果修改系统,包括计算设备Q02),所述计算设备与一个或多个处理器和一个或多个计算机可读存储介质相关联;数据存储006),所述数据存储与所述计算设备耦合;以及意图确定引擎010),所述意图确定引擎通过将动作和属性与主题表达相关联来定义用户意图、组织所述主题表达以表示所述主题表达之间的关系以及采用经组织的主题表达和从一个或多个源接收的用户数据为特定用户确定所述用户意图。
10.如权利要求9所述的系统,其特征在于,所述意图确定引擎通过标识所述用户数据中对应于所述分层结构中的所述主题表达、所述动作和所述属性的关键词来通过算法确定所述特定用户的所述用户意图。
11.如权利要求10所述的系统,其特征在于,在所述用户数据中的关键词包括所述主题表达的子集、所述动作的子集、以及所述属性的子集。
12.如权利要求11所述的系统,其特征在于,所述属性的子集指示对应于特定主题表达的用户偏好。
13.—个或多个存储计算机可使用指令的计算机可读介质,所述指令在由一个或多个计算设备使用时使得所述一个或多个计算设备执行一种方法,所述方法包括将多个主题表达中的每一个与至少一个属性和至少一个动作相关联(1010);生成(1012)表示所述多个主题表达之间的关系的分层结构; 从一个或多个源接收(1014)用户数据;以及通过标识所述用户数据中对应于所述分层结构中的所述多个主题表达、所述至少一个属性和所述至少一个动作的关键词来通过算法确定(1016)用户意图。
14.如权利要求13所述的一个或多个计算机可读介质,其特征在于,还包括基于经确定的用户意图向用户呈现一个或多个广告。
15.如权利要求13所述的一种或多种计算机可读介质,其特征在于,还包括 接收来自用户的搜索查询输入;以及基于所述搜索查询输入和所述用户数据,将搜索结果在搜索结果页面上呈现给用户。
全文摘要
揭示了定义用户意图。提供了用于定义用户意图使得能够确定用户意图并基于该用户的意图向用户提供广告和其他信息的方法和计算机可读介质。标识主题表达并将该主题表达与属性和动作相关联。动作指示能被执行以完成与主题表达相关联的任务的步骤。接着生成意图结构。意图结构指示被标识的主题表达与其他主题表达之间的关系。接着接收用户数据并将该用户数据映射到意图结构以确定当前和将来的用户意图。
文档编号G06Q30/00GK102262652SQ201110152208
公开日2011年11月30日 申请日期2011年5月27日 优先权日2010年5月28日
发明者D·沈, I·帕尔萨, M·叶里扎罗夫, T·B·马, V·利博斯基, Y·李 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1