一种基于内容可信的Web搜索引擎系统及搜索方法

文档序号:6518832阅读:692来源:国知局
一种基于内容可信的Web搜索引擎系统及搜索方法
【专利摘要】本发明公开一种基于内容可信的Web搜索引擎系统及搜索方法,其特征在于它包括:Web用户接口模块;搜索请求处理模块;查询结果去重模块;内容可信度计算模块,根据内容可信的5个因素,对去重后的搜索结果进行内容可信度计算;查询结果重排序模块;查询结果存储数据库,存储具有内容可信度的查询结果。本发明为基于内容可信的搜索引擎及搜索方法,不仅实现了web搜索网页的内容可信因素的量化和内容可信度的计算,还提供了基于可信度高低的Web搜索网页的重排序。与传统搜索引擎及搜索方法相比,本发明可以提供更为准确和更加可信的搜索结果。
【专利说明】一种基于内容可信的Web搜索引擎系统及搜索方法
【技术领域】
[0001]本发明涉及网络通信处理领域,具体为一种基于内容可信的Web搜索引擎系统及搜索方法。
【背景技术】
[0002]随着信息技术和网络技术的不断发展,基于互联网的信息检索日益成为人们生活中的一部分,搜索引擎也成为其中不可或缺的工具。然而,基于传统搜索引擎和搜索方法检索到的Web信息来源广泛,内容丰富多样,但存在质量良莠不齐、表述不一,事实真假难辨等问题,使得基于传统搜索引擎和搜索方法检索到的Web信息难以保证其可信性。网页的过时、新闻的失真、垃圾广告、反动宣传等无处不在,并与正常的、可靠的信息资源鱼目混珠在一起。当前,为了从互联网上检索到用户期望的信息,用户必须通过人工的方式,判断从传统搜索引擎返回的海量Web信息中,哪些信息是可靠的或可信的。这种方法不仅耗时,而且,对大部分用户来讲,也很难判断搜索引擎返回Web信息的可信性。
[0003]虽然目前的研究者在搜索引擎返回Web信息的质量方面做了一些工作,但很少考虑Web信息的内容可信问题。目前的搜索引擎系统及搜索方法都不能实现基于内容可信的搜索。

【发明内容】

[0004]针对以上技术问题,本发明提供了一种基于内容可信的Web搜索引擎系统及搜索方法,可以实现web搜索网页的内容可信因素的量化、内容可信度的计算,以及基于内容可信判断的Web信息检索。
[0005]本发明包括:
一种基于内容可信的Web搜索引擎系统,包括:
(1)Web用户接口模块,接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低显示最终的搜索结果;
(2)搜索请求处理模块,将Web用户的搜索关键字分发给如Google等传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页;
(3)查询结果去重模块,对上所述搜索引擎以及查询结果存储数据库返回的搜索结果进行去重处理;
(4)内容可信度计算模块,根据内容可信的5个因素,对去重后的搜索结果进行内容可信度计算;
(5)查询结果重排序模块,将上述具有内容可信度的查询结果,根据可信度的高低,按照降序重新进行排序;
(6)查询结果存储数据库,存储具有内容可信度的查询结果。
[0006]一种基于内容可信的Web搜索引擎系统的搜索方法,通过以下技术方案实现:
(I)用户通过Web用户接口模块输入搜索关键字,并将该搜索关键字传送给搜索请求处理模块;
(2)通过相应的接口,搜索请求处理模块将搜索关键字分发给如Google等传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页,然后将返回的搜索结果传送给查询结果去重模块;
(3)查询结果去重模块对返回的搜索结果进行去重处理,然后将其传送给内容可信度计算模块;
(4)内容可信度计算模块根据内容可信的5个因素,对上述去重后的搜索结果进行内容可信度计算,然后将其传送给查询结果重排序模块;
(5 )查询结果重排序模块对上述具有内容可信度的查询结果,根据可信度的高低,按照降序重新进行排序,最后通过Web用户接口模块显示给用户。
[0007]进一步地,Web网页的内容可信度计算如下:对任一返回的Web网页根据内容可信的5个因素,即网页内容的相关性/?#、权威性AziA、外部链接数ftV、时间办^和点击率C/i/?,其内容可信度计算为:
【权利要求】
1.一种基于内容可信的Web搜索引擎系统,其特征在于它包括: (1)Web用户接口模块,接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低显示最终的搜索结果; (2)搜索请求处理模块,将Web用户的搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页; (3)查询结果去重模块,对上所述搜索引擎以及查询结果存储数据库返回的搜索结果进行去重处理; (4)内容可信度计算模块,根据内容可信的5个因素,对去重后的搜索结果进行内容可信度计算; (5)查询结果重排序模块,将上述具有内容可信度的查询结果,根据可信度的高低,按照降序重新进行排序; (6)查询结果存储数据库,存储具有内容可信度的查询结果。
2.根据权利要求1所述的一种基于内容可信的Web搜索引擎系统,其特征在于各模块之间的连接关系如下: (1)Web用户接口模块,与搜索请求处理模块和查询结果重排序模块相连接,负责接收Web用户输入的搜索关键字,将其传送给搜索请求处理模块,并根据内容可信度的高低,将查询结果重排序模块的最终可信搜索结果显示给用户; (2)搜索请求处理模块,与Web用户接口模块、查询结果存储数据库和查询结果去重模块相连接,负责将Web用户接口模块传来的用户搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页,同时将这些搜索结果传送给查询结果去重模块; (3)查询结果去重模块,与搜索请求处理模块和内容可信度计算模块相连接,负责将搜索请求处理模块传来的传统搜索结果进行去重处理,并将去重后的搜索结果传送给内容可信度计算模块; (4)内容可信度计算模块,与查询结果去重模块、查询结果存储数据库和查询结果重排序模块相连接,对查询结果去重模块传来的去重后的搜索结果,根据内容可信的5个因素进行内容可信度计算,并将带有内容可信度的搜索结果分发给查询结果存储数据库和查询结果重排序模块相; (5)查询结果重排序模块,与内容可信度计算模块和Web用户接口模块相连接,负责将内容可信度计算模块传来的具有内容可信度的搜索结果,根据可信度的高低,按照降序重新进行排序,并将排序后的搜索结果传送给Web用户接口模块; (6)查询结果存储数据库,与搜索请求处理模块和内容可信度计算模块相连接,接收搜索请求处理模块传来的搜索请求,并返回相应的搜索结果,同时存储经过处理后的具有内容可信度的搜索结果。
3.根据权利要求1或2所述的一种基于内容可信的Web搜索引擎系统,其特征在于内容可信度计算如下:对任一返回的Web网页/7,根据内容可信的5个因素,即网页内容的相关性/?#、权威性Auth、外部链接数BN、时间Agv和点击率CliR,其内容可信度计算为:
4.一种基于内容可信的Web搜索引擎系统的搜索方法,其特征在于: (1)用户通过Web用户接口模块输入搜索关键字,并将该搜索关键字传送给搜索请求处理模块; (2)通过相应的接口,搜索请求处理模块将搜索关键字分发给传统搜索引擎以及查询结果存储数据库,并接收它们返回的搜索结果,即搜索到的Web网页,然后将返回的搜索结果传送给查询结果去重模块; (3)查询结果去重模块对返回的搜索结果进行去重处理,然后将其传送给内容可信度计算模块; (4)内容可信度计算模块根据内容可信的5个因素,对上述去重后的搜索结果进行内容可信度计算,然后将其传送给查询结果重排序模块; (5 )查询结果重排序模块对上述具有内容可信度的查询结果,根据可信度的高低,按照降序重新进行排序,最后通过Web用户接口模块显示给用户。
5.根据权利要求4所述的一种基于内容可信的Web搜索引擎系统的搜索方法,其特征在于内容可信度计算如下:对任一返回的Web网页/7,根据内容可信的5个因素,即网页内容的相关性Rev、权威性Auth、外部链接数BN、时间Agv和点击率CliR,其内容可信度计算为:
【文档编号】G06F17/30GK103646034SQ201310564892
【公开日】2014年3月19日 申请日期:2013年11月14日 优先权日:2013年11月14日
【发明者】徐洪珍, 许杰云, 于臻, 汤彬 申请人:东华理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1