一种试题摘要信息的生成方法以及装置的制造方法

文档序号:9887701阅读:184来源:国知局
一种试题摘要信息的生成方法以及装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,尤其涉及一种网络搜索方法及装置。
【背景技术】
[0002]搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页标题和URL外还会提供一段来自网页的摘要以及其他信息。
[0003]随着在线教育的兴起,以及中小学课堂上也越来越多地引入了在线课堂等原因,试题类型的搜索词量越来越大,而搜索结果页没有展现良好的结果。
[0004]onebox配结果的解决方式通常是根据搜索词来进行正则匹配,因此对短词、top词效果良好,但长尾、长搜索词效果不佳。当用户在使用搜索引擎进行试题查询时,由于输入的搜索词较长,一般为试题的题干,因此难以从onebox的角度来配相应的结果。虽然自然结果可以保证匹配,但难以判断哪一条结果是最匹配的,用户需要点进每条自然结果,再去做判断。
[0005]图1为现有技术中试题类搜索的搜索结果页。用户输入“某工厂第一车间有X人”,搜索结果页显示多个命中的搜索结果,但是从搜索结果页并不能直接获得试题和解答,用户需要逐条点击进入落地页,才能进一步确认是否是自己需要的内容。
[0006]因此,现有技术的缺点在于:用户需要点击搜索结果项并进入相应落地页,随后从落地页中再去寻找其所需的具体内容,即用户从开始执行搜索行为到最终查找到想要的具体内容至少需要执行两个步骤,查询路径偏长;其次,对试题类型的检索结果的显示不直观,用户需要逐条打开落地页阅读后确认是否是自己需要的内容。

【发明内容】

[0007]鉴于上述问题,提出了本发明提供一种提供试题摘要的方法和装置,以便克服试题类型搜索时,答案获取路径长,不直观的缺陷。
[0008]根据本发明的一个方面,提供了一种试题摘要信息的生成方法,其包括:根据用户在搜索框输入的查询词,获得与查询词相匹配的排序后的一个或多个内容匹配结果;对排序后的一个或多个内容匹配结果提取与试题特征字段相应的内容;生成包含试题摘要信息的检索结果项,所述试题摘要信息包括试题特征字段名称及相应的内容。
[0009]可选的,所述提取与试题特征字段相应的内容还包括:检测排序后的一个或多个内容匹配结果对应链接的落地页是否包含平级图文列表字段,如果所述落地页包含平级图文列表字段,则提取与试题特征字段相应的内容。
[0010]可选的,所述提取与试题特征字段相应的内容还包括:检测排序后的一个或多个内容匹配结果对应链接的落地页是否进行过结构化处理;如果所述落地页进行过结构化处理,则提取与试题特征字段相应的内容。
[0011]可选的,所述试题特征字段包括以下一种或多种的组合:题目字段,解答字段,考点字段,专题字段,难度字段。
[0012]可选的,所述试题特征字段包括以下一种或多种的组合,还包括,图片字段。
[0013]可选的,还包括步骤:当查询词确定为试题类查询词时,对返回的一个或多个检索结果项进行结构化处理。
[0014]可选的,该方法还包括:根据对多个试题类查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门试题类查询词;根据所述热门试题类查询词来确定相应的经排序的检索结果项,并选取与每一热门试题类查询词相应的排序前预定数量的检索结果项作为热门检索结果项;提取所述热门检索结果项对应链接的热门落地页;对热门落地页进行结构化处理。
[0015]可选的,所述结构化处理是对包含平级图文列表字段的落地页对应的检索结果项,提取试题特征字段相应的内容,重新生成包含试题摘要信息的检索结果项。
[0016]可选的,所述平级图文列表字段包括以下一种或多种的组合:列表类型标记语言字段;统一资源定位符、标题信息相关联记录的多个标记语言字段;统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段。
[0017]可选的,该方法还包括基于所述生成的包含试题摘要信息的检索结果项绘制检索结果页面。
[0018]根据本发明的另一个方面,提供了一种网页摘要信息的展示方法,包括:根据用户在搜索框输入的查询词,获得与查询词相匹配的一个或多个检索结果项;当所述一个或多个检索结果项包含试题摘要信息时,则突出显示试题摘要信息。
[0019]可选的,所述显示的试题摘要信息至少包括题目字段,及相应的解答内容。
[0020]可选的,所述显示试题摘要信息包括突出显示试题特征字段数据。
[0021]根据本发明的另一个方面,提供了一种试题摘要信息生成装置,包括:结果获取模块,用于根据用户在搜索框输入的查询词,获得与查询词相匹配的一个或多个内容匹配结果;第一提取模块,用于对排序后的一个或多个内容匹配结果提取与试题特征字段相应的内容;第一生成模块,用于生成包含试题摘要信息的搜索结果项,所述试题摘要信息包括试题特征字段名称及相应的内容。
[0022]可选的,所述第一提取模块包括检测模块,和提取模块,其中所述检测模块用于检测排序后的一个或多个内容匹配结果对应链接的落地页是否包含平级图文列表字段;所述提取模块,用于当检测模块检测到所述落地页包含平级图文列表字段时,提取与试题特征字段相应的内容。
[0023]可选的,所述第一提取模块包括检测模块,和提取模块;所述检测模块用于检测排序后的一个或多个内容匹配结果对应链接的落地页是否进行过结构化处理;所述提取模块,用于当检测模块检测到所述落地页进行过结构化处理时,提取与试题特征字段相应的内容。
[0024]可选的,所述试题特征字段包括以下一种或多种的组合:题目字段,解答字段,考点字段,专题字段,难度字段。
[0025]可选的,所述试题特征字段包括以下一种或多种的组合,还包括,图片字段。
[0026]可选的,还包括结构化处理装置,用于当查询词确定为试题类查询词时,对返回的一个或多个检索结果项进行结构化处理。
[0027]可选的,还包括结构化处理装置,用于根据对多个试题类查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门试题类查询词;根据所述热门试题类查询词来确定相应的经排序的检索结果项,并选取与每一热门试题类查询词相应的排序前预定数量的检索结果项作为热门检索结果项;提取所述热门检索结果项对应链接的热门落地页;对热门落地页进行结构化处理。
[0028]可选的,所述结构化处理是对包含平级图文列表字段的落地页对应的检索结果项,提取试题特征字段相应的内容,重新生成包含试题摘要信息的检索结果项。
[0029]可选的,所述平级图文列表字段包括以下一种或多种的组合:列表类型标记语言字段;统一资源定位符、标题信息相关联记录的多个标记语言字段;统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段。
[0030]可选的,还包括绘制装置,用于基于所述生成的包含试题摘要信息的检索结果项绘制检索结果页面。
[0031]根据本发明的另一个方面,提供了一种网页摘要信息的展示装置,包括:获取装置,用于根据用户在搜索框输入的查询词,获得与查询词相匹配的一个或多个检索结果项;突出显示装置,用于当所述一个或多个检索结果项包含试题摘要信息时,突出显示试题摘要信息。
[0032]可选的,所述显示的试题摘要信息至少包括题目字段,及相应的解答内容。
[0033]可选的,所述显示试题摘要信息包括突出显示试题特征字段数据。
[0034]本发明的有益效果为:
[0035]本发明对试题类型搜索命中的网站进行结构化数据模板撰写和数据挖掘,并完成专业维度的细化信息抽取,最终获取试题类网站的描述信息,并将试题的描述信息作为检索结果的整体或一部分进行突出显示,让用户可以通过这些描述快速了解试题以及答案等
?目息O
[0036]在搜索结果展示形式上,还可以增加解析过程,考点,专题等描述信息,方便了用户的搜索效率和搜索范围的精确制定。
[0037]选取搜索结果中试题类型的摘要信息中排首位的摘要信息,将答案和主要解题思路强展示,使用户能够直观的,高效的获取最佳答案。
[0038]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0039]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0040]图1示意性示出了现有技术中试题类搜索的搜索结果页;
[0041 ]图2示意性示出了本发明中试题摘要信息的生成方法一个实施例的流程示意图;
[0042]图3为本发明中网页摘要信息的展示方法一个实施例的流程示意图;
[0043]图4为本发明中网页摘要信息的展示方法一个实施
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1