信息搜索方法和系统的制作方法

文档序号:9417372阅读:396来源:国知局
信息搜索方法和系统的制作方法
【技术领域】
[0001]本发明涉及搜索技术领域,尤其涉及一种信息搜索方法和系统。
【背景技术】
[0002]搜索引擎是网民获取信息和知识的重要途径,现有技术是基于关键词匹配方式,从网页索引库中获取和搜索词(query)相关的文档,以列表的形式呈现给用户。
[0003]用户的搜索行为存在这样一种情形:技能获取型搜索,比如:C语言怎么学,Android开发学习路线,会计从入门到精通等。针对这类搜索,现有技术中的搜索结果往往是各种培训班的网站,或者一些相关博客、文档,而这些结果零散不成体系,内容相似且不具备权威性和推广性,用户浏览了搜索结果页,依然不知道怎么学,即使跟着学了,也很容易误入歧途,因此用户需求并没有被解决。

【发明内容】

[0004]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本发明的一个目的在于提出一种信息搜索方法,该方法可以实现对知识的挖掘和整理,给用户一条真正切实可行,真实可靠的学习路线,满足用户对技能获取型搜索的需求。
[0006]本发明的另一个目的在于提出一种信息搜索系统。
[0007]为达到上述目的,本发明第一方面实施例提出的信息搜索方法,包括:接收搜索词;获取与所述搜索词关联的学习路线,所述学习路线是预先对图书的相关数据进行序列模式挖掘得到的,所述图书是所述搜索词所属学习领域的图书;在搜索结果页上,展示所述学习路线。
[0008]本发明第一方面实施例提出的信息搜索方法,通过序列模式挖掘,可以获取一条真正切实可行,真实可靠的学习路线,实现对零散知识的挖掘和整理,通过向用户展示学习路线,可以减少用户操作步骤和摸索时间,节约用户成本,提升用户体验,满足用户对技能获取型搜索的需求。
[0009]为达到上述目的,本发明第二方面实施例提出的信息搜索系统,包括:接收模块,用于接收搜索词;获取模块,用于获取与所述搜索词关联的学习路线,所述学习路线是预先对图书的相关数据进行序列模式挖掘得到的,所述图书是所述搜索词所属学习领域的图书;展示模块,用于在搜索结果页上,展示所述学习路线。
[0010]本发明第二方面实施例提出的信息搜索系统,通过序列模式挖掘,可以获取一条真正切实可行,真实可靠的学习路线,实现对零散知识的挖掘和整理,通过向用户展示学习路线,可以减少用户操作步骤和摸索时间,节约用户成本,提升用户体验,满足用户对技能获取型搜索的需求。
[0011]本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0013]图1是本发明一实施例提出的信息搜索方法的流程示意图;
[0014]图2是本发明实施例中的搜索结果页的示意图;
[0015]图3是本发明另一实施例提出的信息搜索方法的流程示意图;
[0016]图4是本发明实施例中确定学习路线的流程不意图;
[0017]图5是本发明实施例中一种用户评论的示意图;
[0018]图6是本发明实施例中一种聚类结果的示意图;
[0019]图7是本发明实施例中一种图书自身描述信息的示意图;
[0020]图8是本发明实施例中一种用户评价信息的示意图;
[0021]图9是本发明实施例中用于确定难度系数的一种用户评价内容的示意图;
[0022]图10是本发明实施例中用于确定难度系数的另一种用户评价内容的示意图;
[0023]图11是本发明实施例中难易度排序后的结果示意图;
[0024]图12是本发明另一实施例提出的信息搜索方法的流程示意图;
[0025]图13是本发明实施例中跳转到的购买页面的示意图;
[0026]图14是本发明另一实施例提出的信息搜索系统的结构示意图;
[0027]图15是本发明另一实施例提出的信息搜索系统的结构示意图。
【具体实施方式】
[0028]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0029]图1是本发明一实施例提出的信息搜索方法的流程示意图,该方法包括:
[0030]Sll:接收搜索词。
[0031]其中,用户可以采用如下方式中的一种或多种进行搜索词(query)输入:文本输入,语音输入,图像输入。
[0032]当客户端接收到用户输入的搜索词后,客户端可以将搜索词发送给服务端,由服务端获取与搜索词对应的搜索结果。
[0033]S12:获取与所述搜索词关联的学习路线,所述学习路线是预先对图书的相关数据进行序列模式挖掘得到的,所述图书是所述搜索词所属学习领域的图书。
[0034]当搜索词是技能获取型的搜索词时,现有技术中,搜索结果是培训班或者杂乱无章的结果,与现有技术不同的是,本实施例中,当搜索词是技能获取型的搜索词时,搜索结果是与该搜索词关联的学习路线。
[0035]例如,服务端预先将学习领域与学习路线关联存储,如,C语言领域对应第一学习路线,则当搜索词是“C语言怎么学”时,通过语义解析等可以获取当前的搜索词属于的学习领域是C语言领域,再根据预先存储的信息,可以获取关联的学习路线是第一学习路线。
[0036]可以理解的是,学习领域与学习路线在存储时是采用文本方式进行存储,当搜索词是文本方式输入时,可以直接根据文本内容获取相应的学习路线。当搜索词是语音或图像输入时,可以先进行语音识别或图像识别,将搜索词识别为文本,之后再根据文本内容获取相应的学习路线。
[0037]S13:在搜索结果页上,展示所述学习路线。
[0038]其中,服务端获取学习路线后,可以将学习路线发送给客户端,由客户端将学习路线作为搜索结果展示给用户。
[0039]另外,学习路线在展示时可以具体采用文本、图片、语音中一种或多种形式进行展不O
[0040]例如,参见图2,当搜索词21是“C语言怎么学”时,可以在搜索结果页上展示如图2所示的包括学习路线的搜索结果22,其中,图2中的学习路线用图片形式展示,学习路线的横坐标表示学习耗时,纵坐标表示难易程度,节点处的文字(如C程序设计语言)表示图书名称。
[0041]本实施例中,通过序列模式挖掘,可以获取一条真正切实可行,真实可靠的学习路线,实现对零散知识的挖掘和整理,通过向用户展示学习路线,可以减少用户操作步骤和摸索时间,节约用户成本,提升用户体验,满足用户对技能获取型搜索的需求。
[0042]为了在搜索时能够获取学习路线,可以先建立该学习路线。参见图3,该信息搜索方法还可以包括:
[0043]S31:获取所述搜索词所属学习领域的图书的相关数据,所述相关数据包括:用户评价数据,和/或,图书自身描述数据。
[0044]例如,参见图4,采用分布式爬虫(S41)对网络资源进行爬取,并从各类网络资源中获取特定领域的图书资源,以及从图书资源中获取图书的相关数据。其中,特定领域是指当前要建立的学习路线的关联领域,例如,当前要建立C语言领域的学习路线,则获取C语言领域的图书资源。
[0045]具体的,在爬取图书资源时,包括但不限于从如下网站进行爬取:
[0046]书评类网站,如豆瓣读书;<
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1