信息搜索方法和系统的制作方法_3

文档序号:9417372阅读:来源:国知局
务。用户看到切实可行的,而且经过别人检验过的成长路径,自然欣喜,那么接下来就要准备开始学习了,要学习得购买相关的学习资料,可以提供图书购买服务,包括纸质书和电子书,用户可自由选择。另外,这部分流量变现可以通过预设购买平台(如百度糯米平台)来完成。
[0087]另外,可以将相关图书打包销售,并给予一定的折扣优惠,提高流量的转化率。
[0088]一些实施例中,参见图12,该方法还可以包括:
[0089]S122:当用户在所述购买网页进行购买支付时,跳转到预设的支付网页进行支付。
[0090]支付网页同样可以指定,例如通过百度钱包支付。
[0091]在支付后,卖家就可以发货了。整个操作流程十分流畅,一气呵成,连用户买书的需求都满足了,减少用户找书、买书的时间,相比于通过打培训班广告的形式进行流量变现,这种变现方式可以非常大的提升用户体验。
[0092]图14是本发明另一实施例提出的信息搜索系统的结构示意图,该系统140包括:
[0093]接收模块141,用于接收搜索词;
[0094]其中,用户可以采用如下方式中的一种或多种进行搜索词(query)输入:文本输入,语音输入,图像输入。
[0095]当客户端接收到用户输入的搜索词后,客户端可以将搜索词发送给服务端,由服务端获取与搜索词对应的搜索结果。
[0096]获取模块142,用于获取与所述搜索词关联的学习路线,所述学习路线是预先对图书的相关数据进行序列模式挖掘得到的,所述图书是所述搜索词所属学习领域的图书;
[0097]当搜索词是技能获取型的搜索词时,现有技术中,搜索结果是培训班或者杂乱无章的结果,与现有技术不同的是,本实施例中,当搜索词是技能获取型的搜索词时,搜索结果是与该搜索词关联的学习路线。
[0098]例如,服务端预先将学习领域与学习路线关联存储,如,C语言领域对应第一学习路线,则当搜索词是“C语言怎么学”时,通过语义解析等可以获取当前的搜索词属于的学习领域是C语言领域,再根据预先存储的信息,可以获取关联的学习路线是第一学习路线。
[0099]可以理解的是,学习领域与学习路线在存储时是采用文本方式进行存储,当搜索词是文本方式输入时,可以直接根据文本内容获取相应的学习路线。当搜索词是语音或图像输入时,可以先进行语音识别或图像识别,将搜索词识别为文本,之后再根据文本内容获取相应的学习路线。
[0100]展示模块143,用于在搜索结果页上,展示所述学习路线。
[0101]其中,服务端获取学习路线后,可以将学习路线发送给客户端,由客户端将学习路线作为搜索结果展示给用户。
[0102]一些实施例中,所述展示模块143具体用于:
[0103]在搜索结果页上,以如下形式中的至少一种形式,展示所述学习路线:图片,文本,语音。
[0104]例如,参见图2,当搜索词21是“C语言怎么学”时,可以在搜索结果页上展示如图2所示的包括学习路线的搜索结果22,其中,图2中的学习路线用图片形式展示,学习路线的横坐标表示学习耗时,纵坐标表示难易程度,“C程序设计语言”等表示图书名称。
[0105]本实施例中,通过序列模式挖掘,可以获取一条真正切实可行,真实可靠的学习路线,实现对零散知识的挖掘和整理,通过向用户展示学习路线,可以减少用户操作步骤和摸索时间,节约用户成本,提升用户体验,满足用户对技能获取型搜索的需求。
[0106]为了在搜索时能够获取学习路线,可以先建立该学习路线。参见图15,一些实施例中,该系统140还包括:
[0107]收集模块144,用于获取所述搜索词所属学习领域的图书的相关数据,所述相关数据包括:用户评价数据,和/或,图书自身描述数据;
[0108]例如,参见图4,采用分布式爬虫(S41)对网络资源进行爬取,并从各类网络资源中获取特定领域的图书资源,以及从图书资源中获取图书的相关数据。其中,特定领域是指当前要建立的学习路线的关联领域,例如,当前要建立C语言领域的学习路线,则获取C语言领域的图书资源。
[0109]具体的,在爬取图书资源时,包括但不限于从如下网站进行爬取:
[0110]书评类网站,如豆瓣读书;
[0111]电商网站的图书频道,如京东网站的图书频道。
[0112]爬取的图书资源中会包括图书的信息,以及图书对应的相关数据,相关数据可以包括用户评价数据,和/或,图书自身描述数据。用户评价数据例如包括:用户对图书的评论、评分、满意度等,图书自身描述数据例如包括:作者,出版社,中文或外文图书等。
[0113]确定模块145,用于对所述相关数据进行序列模式挖掘,确定所述学习领域的学习路线;
[0114]序列模式挖掘(sequence pattern mining)是指挖掘相对时间或其他模式出现频率高的模式。在本实施例中,由于人类的学习过程是有潜在的行为模式,通过序列模式挖掘,可以获取人们通过图书获取知识的行为序列。
[0115]一些实施例中,所述确定模块145具体用于:
[0116]对所述相关数据进行信息抽取;
[0117]根据信息抽取的结果,对图书进行聚类;
[0118]在聚类后得到的每个簇族中,对图书进行打分,并在每个簇族内选择得分较高的预设个数的图书;
[0119]对选择出的图书进行难易度排序,得到所述学习领域的学习路线。
[0120]其中,确定模块的具体内容可以参见方法实施例中的相关描述,在此不再赘述。
[0121]存储模块146,用于将所述学习路线与所述学习领域关联存储。
[0122]例如,参见图4,将学习路线与学习领域关联存储在服务端的检索系统中(S46)。
[0123]本实施例中,通过获取图书相关数据,可以提高知识的权威性,通过序列模式挖掘获取学习路线,可以为用户挖掘和整理出权威有效以及简便的学习路径。具体的,通过对用户对图书评论和评分的挖掘,进行信息抽取,用户情感分析,通过聚类算法获取同一知识领域内多个簇族,从每个簇族中选出权威性最高的N个(N可人工指定),然后再依据学习难易程度排序,连点成线,整理成知识,减少用户寻找答案的时间,让搜索引擎更懂用户的意图,直接解答用户的疑惑。以图文并茂、良好交互体验的方式,让人们更便捷地获取信息、找到所求。通过对用户评论和评分数据和图书描述信息的挖掘,构造图书评价特征和图书自身属性特征,借鉴蚁群算法中路径发现的思路,运用聚类算法和排序算法,获取用户频繁路径(frequent path),最终得到一条行之有效、经过前人检验的成长曲线。
[0124]一些实施例中,所述搜索结果页上还包括如下项中的至少一项:
[0125]评论栏,点赞按钮,分享按钮,购买按钮。
[0126]其中,购买按钮例如为图2中所示的“批量购买”按钮,该按钮可以设置在学习路线的左下角。评论栏,点赞按钮,分享按钮可以设置在学习路线的右下角。可以理解的是,上述各按钮的设置位置只是示例,还可以设置在其他位置,例如对应每个图书设置。
[0127]通过评论栏,点赞按钮,分享按钮,可以供用户交流学习心得、反馈信息、分享经验,增加学习路线的可信度,对后台系统而言,可以获取更多用户数据,将更有利于提供更优的且个性化的学习路径,从而实现正向循环。
[0128]一些实施例中,所述搜索结果页上还包括:购买按钮,所述系统140还包括:
[0129]第一跳转模块147,用于当用户点击购买按钮后,跳转到预设的购买网页。
[0130]例如,用户点击“批量购买”按钮后,可以跳转到图13所示的购买页面。
[0131]本实施例中,提供了流量变现的新模式,完成from qu
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1