一种提供聚合类型的智能摘要的方法和装置的制造方法_4

文档序号:9810712阅读:来源:国知局
后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段的方式可为:读取排序后的一个或多个搜索结果项对应链接的落地页的HTML文件,并检测HTML文件中是否包括预定的平级图文列表字段。
[0135]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置。这样的实现本发明的程序可以存储在计算机可读介质上。
[0136]本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着,结合实施例描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。此外,请注意,这里“在一个实施例中”的词语例子不一定全指同一个实施例。
[0137]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0138]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0139]此外,还应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
【主权项】
1.一种提供聚合类型的智能摘要的方法,其特征在于,包括: 对群体用户历史查询词进行聚类,对聚类后的历史查询词的搜索结果项对应链接的落地页进行结构化数据模板处理; 获取与用户查询词对应的搜索结果项; 检测所述与用户查询词对应的搜索结果项对应链接的落地页是否为包含平级图文列表字段且进行过结构化数据模板处理的站点; 如果是,则提取所述站点中图文列表字段中的图片信息及标题信息作为摘要信息,重新生成包含所述摘要信息的搜索结果项。2.如权利要求1所述的提供聚合类型的智能摘要的方法,其特征在于,所述对群体用户历史查询词进行聚类,对聚类后的历史查询词的搜索结果项对应链接的落地页进行结构化数据模板处理包括: 根据对多个历史查询词基于热度信息进行排序的排序结果,选取排序靠前的预定数量的查询词进行聚合,得到聚合后的热门历史查询词; 根据所述聚合后的热门历史查询词来确定相应的经排序的搜索结果项,并选取与每一聚合后的查询词相应的排序靠前的预定数量的搜索结果项作为热门搜索结果项; 提取所述热门搜索结果项对应链接的热门落地页; 检测所述热门搜索结果项对应链接的热门落地页中是否包含平级图文列表字段; 如果是,则对所述热门搜索结果项对应链接的热门落地页进行结构化数据模板处理。3.如权利要求1-2中任一项所述的提供聚合类型的智能摘要的方法,其特征在于,所述对所述热门搜索结果项对应链接的热门落地页进行结构化数据模板处理,包括: 首先生成与所述热门搜索结果项相匹配的列表摘要模板,然后根据所述列表摘要模板对所述搜索结果项进行结构化数据模板处理。4.如权利要求1-3中任一项所述的提供聚合类型的智能摘要的方法,其特征在于,所述根据所述列表摘要模板对所述搜索结果项进行结构化数据模板处理,包括: 提取所述热门搜索结果项对应链接的热门落地页的平级图文列表字段的数据信息;基于所述平级图文列表字段的数据信息,填充所述列表摘要模板,从而重新生成包含列表摘要信息的搜索结果项。5.如权利要求1-4中任一项所述的提供聚合类型的智能摘要的方法,其特征在于,所述提取所述站点中图文列表字段中的图片信息及标题信息作为摘要信息,包括: 从所述重新生成的包含列表摘要信息的搜索结果项中提取与图片信息及标题信息相关联记录的标记语言字段作为摘要信息,重新生成包含所述摘要信息的搜索结果项。6.如权利要求1-5中任一项所述的提供聚合类型的智能摘要的方法,其特征在于,所述平级图文列表字段包括以下一种或多种的组合: 列表类型标记语言字段; 统一资源定位符、标题信息相关联记录的多个标记语言字段; 统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段。7.一种提供聚合类型的智能摘要的装置,其特征在于,包括: 聚类模块,用于对群体用户历史查询词进行聚类; 结构化数据模板处理模块,用于对聚类后的历史查询词的搜索结果项对应链接的落地页进行结构化数据模板处理; 获取模块,用于获取与用户查询词对应的搜索结果项; 检测模块,用于检测所述与用户查询词对应的搜索结果项对应链接的落地页是否为包含平级图文列表字段且进行过结构化数据模板处理的站点; 生成模块,用于当检测模块的检测结果为“是”的时候,则提取所述站点中图文列表字段中的图片信息及标题信息作为摘要信息,重新生成包含所述摘要信息的搜索结果项。8.如权利要求7所述的提供聚合类型的智能摘要的装置,其特征在于,所述聚类模块对群体用户历史查询词进行聚类,结构化数据模板处理模块对聚类后的历史查询词的搜索结果项对应链接的落地页进行结构化数据模板处理包括: 根据对多个历史查询词基于热度信息进行排序的排序结果,选取排序靠前的预定数量的查询词进行聚合,得到聚合后的热门历史查询词; 根据所述聚合后的热门历史查询词来确定相应的经排序的搜索结果项,并选取与每一聚合后的查询词相应的排序靠前的预定数量的搜索结果项作为热门搜索结果项; 提取所述热门搜索结果项对应链接的热门落地页; 检测所述热门搜索结果项对应链接的热门落地页中是否包含平级图文列表字段; 如果是,则对所述热门搜索结果项对应链接的热门落地页进行结构化数据模板处理。9.如权利要求7-8中任一项所述的提供聚合类型的智能摘要的装置,其特征在于,所述对所述热门搜索结果项对应链接的热门落地页进行结构化数据模板处理,包括: 首先生成与所述热门搜索结果项相匹配的列表摘要模板,然后根据所述列表摘要模板对所述搜索结果项进行结构化数据模板处理。10.如权利要求7-9中任一项所述的提供聚合类型的智能摘要的装置,其特征在于,所述根据所述列表摘要模板对所述搜索结果项进行结构化数据模板处理,包括: 提取所述热门搜索结果项对应链接的热门落地页的平级图文列表字段的数据信息; 基于所述平级图文列表字段的数据信息,填充所述列表摘要模板,从而重新生成包含列表摘要信息的搜索结果项。
【专利摘要】本发明提供了一种提供聚合类型的智能摘要的方法和装置,所述方法包括:对群体用户历史查询词进行聚类,对聚类后的历史查询词的搜索结果项对应链接的落地页进行结构化数据模板处理;获取与用户查询词对应的搜索结果项;检测所述与用户查询词对应的搜索结果项对应链接的落地页是否为包含平级图文列表字段且进行过结构化数据模板处理的站点;如果是,则提取所述站点中图文列表字段中的图片信息及标题信息作为摘要信息,重新生成包含所述摘要信息的搜索结果项。该方法可以缩短用户信息寻找路径,改善用户的体验,有效的提高信息获取效率。
【IPC分类】G06F17/30
【公开号】CN105574185
【申请号】CN201510976108
【发明人】郑思晴, 吴凯
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
【公开日】2016年5月11日
【申请日】2015年12月22日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1