来自源应用的基于上下文的动作的制作方法_3

文档序号:9620850阅读:来源:国知局
端中的搜索应用或工具)向云计算环境中的查询分类器404输入。查询分类器404分析查询402,连同适当的置信度量一起将一个或多个分类分配(例如加标签)给查询402 (例如应用内容查询、名人查询、音乐查询、前一万名查询、导航查询等),并且将经分类的查询传递给查询和答复管理器406。分类标签可以用于影响来自一个或多个搜索上下文的搜索结果之中的排名。分类标签还可以由查询和答复管理器406以及搜索框架中的其它组件使用以基于经分类的搜索查询确定应当查询哪些答复服务和内容提供者。
[0043]在又一实现方式中,分类标签可以用于消除搜索结果的歧义,由此对搜索结果分组、排名和过滤以便向用户提供搜索结果的更相关的集合。例如,查询可以被加标签以从属于音乐人“Michael Jackson”而不是威士忌专家“Michael Jackson”。因此,关于威士忌专家返回的搜索结果然后可以排名较低、在用户接口的不同区域中分组、一起被过滤掉等等。
[0044]分类标签还可以用于但不限于:
?确定是否将经分类的查询提交至特定答复工作流(例如Web内容答复工作流408、应用内容答复工作流409等);
?对应用内容答复工作流409和相关组件内的搜索结果过滤、排名、提升、降级等;以及
?聚集和/或合并来自查询和答复管理器406中的各种答复工作流(例如Web内容答复工作流408、应用内容答复工作流409等)的结果。
[0045]查询和答复管理器406接收经分类的查询并且将其引导至一个或多个适当的答复工作流,诸如Web内容答复工作流408或应用内容答复工作流409。也可以采用其它答复工作流,诸如多媒体内容答复工作流、广告工作流等。
[0046]在一个示例中,经分类的查询被传递到Web内容答复工作流408,其将经分类的查询应用于Web内容管线410的输出作为运行时间服务。在基本上连续的基础上,Web内容管线410从Web抓取器414接收Web内容流412并且对其编索引。Web抓取器416分析Web页面416并且将所抓取的Web内容流412提供给Web内容管线410,其对Web内容编索引并且以其它方式对其处理以使经索引的Web内容可用于Web内容答复工作流408。Web内容答复工作流408将所接收的经分类的查询应用于Web内容管线410的经索引的Web内容并且为查询和答复管理器408提供来自Web内容的排名和/或以其它方式上下文化的搜索结果Ο
[0047]在另一示例中,经分类的查询被传递给应用内容答复工作流409,其与应用内容索引服务器418 —起工作以将经分类的查询应用于从应用内容管线420接收的经索引的应用内容输出。应用内容管线420处理来自各种应用内容源的数据,包括但不限于Web内容流412、来自馈送423的应用内容和应用内容API交互432。这样的内容可以以各种各样的方式组织,包括但不限于通过规范实体和通过内容标识符组织。例如,当通过规范实体组织时,来自各种源的内容针对比如“Katy Perry”那样的公知实体进行匹配并且通过实体处理器434相对于该规范实体来存储。该技术允许来自应用内容索引服务器418的搜索结果在单个请求中拉取针对“Katy Perry”的全部相关应用内容。在一个实现方式中,查询分类器404主要负责确定规范实体“Katy Perry”是否为用户预期的话题。在另一示例中,当通过内容标识符组织时,从各种源接收的应用内容的每一个集合被编索引到单独的文档中。应用内容索引服务器418基于各种信号匹配来自这样的源的相关文档,诸如匹配的术语数目、文档的流行度、源的流行度、应用的流行度等。
[0048]应用内容排名器(ranker)模型422提供由应用内容索引服务器418使用的一个或多个模型以用于对从应用内容管线420接收的经索引的应用内容排名。应用内容索引服务器418向应用内容答复工作流409返回经排名的应用内容文档的集合。
[0049]在应用内容管线420的示例中,通过各种各样的机制将应用内容输入到应用内容管线420。一个可能的机制是通过Web内容流412进行,其(至少在应用内容的情况下)从通过应用可访问的Web站点(例如通过电影浏览和播放应用可访问的电影数据库)接收所抓取的Web内容并且提供来自相关联Web页面的信息的结构化内容。对于某些Web页面,例如,Web内容流412中的各个页面的元素被映射成通过应用内容提取器431提供结构化数据(例如Web页面中的某些位置处的图片是专辑封面图像,Web页面中的某些位置处的文本标识艺术家等)。Web抓取器414取得远射Web页面内容,其作为Web内容流412而被馈送到Web内容管线410。Web内容流412还由应用内容提取器431处理以基于映射生成结构化数据。结构化数据被传递给应用内容管线420。在可替换实现方式中,应用内容提取器431可以集成到Web抓取器414中。
[0050]映射由一个或多个URL模式到应用信息映射模型提供(参照例如映射430)。来自Web内容流412的结构化数据由应用内容管线420接收并且用于生成经索引的应用内容以用于对搜索查询做出响应。可替换地,Web页面开发者可以标记其Web页面以允许Web抓取器414从每一个标记的Web页面提取结构化数据。该结构化数据从具有通过用户系统上可执行的明确应用可访问的内容的Web页面来提取(诸如Web内容在输入到应用内容管线时还被称为某种类型的“应用内容”,因为其是基于经由用户计算机系统可执行的标识应用可访问的Web内容的)。
[0051]在用于提取应用内容的另一机制中,馈送聚集器424从一个或多个应用内容馈送(feed)426和/或应用仓库目录馈送428接收结构化应用内容423 (例如以XML格式)。由应用内容提供者(例如电影数据库提供者)和/或应用仓库通过馈送来提供结构元素。
[0052]在用于提取应用内容的又一机制中,应用内容API交互模块432经由源提供的API访问在线内容源。在这样的机制中,应用内容API交互模块432查询在线内容源以获取与这些源所提供的应用内容有关的结构化数据。
[0053]可以采用这些机制中的每一个以及其它潜在的应用内容提供机制以将结构化应用内容数据提供给应用内容管线420。在应用内容管线420内,应用内容储存库更新器435处理所接收的结构化应用内容数据并且更新应用内容储存库436中记录的已经存储的结构化应用内容数据。示例更新可以包括但不限于补充、更改或删除存储在应用内容储存库436中的应用内容的部分。例如,可以使新的电影通过经由客户端上的电影播放器应用可访问的电影服务而可用。表示新电影的应用内容可以添加到应用内容储存库436。相比之下,可能已经从电影服务中移除电影,因此表示之前可用的电影的应用内容可以从应用内容储存库436中删除。
[0054]—个或多个实体处理器434从应用内容储存库接收经更新的应用内容并且可以使一些内容与各种实体相关联。实体表示具有标注的性质(这样的唯一标识符)的语义数据对象、基于其表示的真实世界话题的属性的性质集群、表示话题到其它实体的关系的链接、搜索器针对该话题可能想要调用的动作等。实体处理器434压印(例如将一个或多个唯一标识符分配给)应用内容的组件以使其与实体数据库中的实体相关联(例如以使电影内容与电影实体、与演员实体等相关联)。应用数据储存库438可以包括但不限于诸如应用标题、图标、描述等等之类的应用元数据,其可以从在线应用仓库、应用元数据服务等获取。例如,这样的元数据可以用于增强与其经由用户接口 456的呈现中的应用内容搜索结果相关联的信息。
[0055]经索引的文档生成器440从实体处理器434接收经压印的应用内容并且从内容注入器442接收内容表征参数。内容注入器442接收内容表征参数,诸如遥测数据、锚定数据、排名参数等,其可以由经索引的文档生成器440用来提供丰富的经索引应用内容以供应用内容索引服务器418在将应用内容搜索结果供应给应用内容答复工作流409时使用。示例内容表征参数在下文描述。
[0056]当用户与应用内容数据及相关应用本身交互时,应用内容点击流444通过追踪历史用户行为(例如“点击流”)来收集和递送遥测数据。应用内容锚定流446在从Web页面收集的应用内容上操作并且收集和递送所选链接的锚定文本、位于所选链接附近的文本、位于所选链接所引用的Web页面上的文本等。以此方式,锚定文本可以映射到某些应用内容并且因此用于对应用内容排名。应用内容静态排名448收集并且递送由其它源提供的静态排名信息,诸如人类生成的排名数据、市场研究排名等。附加应用内容排名信号450收集并且递送各种各样的其它排名数据,包括但不限于视图计数和与应用内容相关联的用户评级。应用仓库静态排名452收集并且递送从一个或多个在线应用仓库接收的静态排名信息,诸如允许用户下载和安装应用到其客户端计算机以用于访问应用内容的在线仓库。例如,如果各种各样的电影应用可以访问一个或多个在线电影数据库,则来自应用仓库静态排名452的排名信息可以通过在线应用仓库或在线电影数据库为如从用户购买信息所辨别的最流行的电影应用提供较高排名信息。还应当理解到,某些排名数据还可以从动态排名源提供。
[0057]基于上述内容表征和所收集的应用内容,经索引的文档生成器440将经索引的应用数据提供给应用内容索引服务器418和应用内容答复工作流409以用于对搜索查询做出响应并且对应用内容搜索结果排名。应用内容答复工作流409还可以经由实时应用内容API 433接收实时应用内容,实时应用内容API 433提供用于应用内容的替换路径,使得应用内容不需要由应用内容管线422处理以用于索引并且可以通过应用内容答复工作流直接查询。例如,旅行应用可以提供实时API以预定从一个位置到另一个位置的航班。应用内容答复工作流409可以标识用户查询以匹配“预定航班”查询的模式并且然后直接呼叫实时应用内容API 433以实施相关动作。类似地,天气应用可以提供实时API以查询天气预报或位置。应用内容答复工作流409可以从实时应用内容API 433实时地检索数据,如果它确定查询意图涉及针对该位置的天气预报的话。类似地,运动应用可以提供实时API以支持针对实时分数的查询,并且新应用可以具有实时API以提供实时新闻馈送。
[
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1