搜索引擎链接分析系统及分析方法与流程

文档序号:15932254发布日期:2018-11-14 01:49阅读:332来源:国知局

本发明涉及一种分析系统及分析方法,具体涉及一种搜索引擎链接分析系统及分析方法,属于互联网搜索领域。

背景技术

随着互联网的普及、网络搜索引擎的不断发展,人们在查阅各类信息时,越来越倾向于选择使用搜索引擎,网络搜索引擎在人们日常生活中的使用率和普及率也越来越高。

也正是由于这样的发展趋势,网络搜索引擎的排名系统也应运而生。一般而言,网络搜索引擎的排名系统可以根据关键词的搜索量、网站内关键词的点击量等信息,自动结算出搜索结果的排名,并以从高到低的形式呈现给使用者。

但是在实际的应用过程中,技术人员发现,目前现有的搜索引擎排名系统很容易受到网络内各类非法网站、非正规论坛等方面的恶意影响,尤其体现在博客群、论坛群发以及站群等几个方面。对站群和博客群而言,可以通过复制链接等方式在短时间内复制出大量的关键词,而对于论坛群发而言,也可以通过给目标关键词投票的方式为关键词制造大量的点击量。上述的这两种做法都会对搜索引擎的排名系统产生恶意影响,导致搜索结果的准确性与可靠性大大降低。

综上所述,如何提供一种搜索引擎链接分析系统及分析方法,以提高网络搜索引擎搜索结果的准确性,就成为了本领域内技术人员所亟待解决的问题。



技术实现要素:

鉴于现有技术存在上述缺陷,本发明的目的是提出一种搜索引擎链接分析系统及分析方法。

本发明的目的,将通过以下技术方案得以实现:

一种搜索引擎链接分析系统,包括:

互联网云平台单元,用于与万维网建立数据连接,获取万维网中的数据信息;

信息抓取单元,用于依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发;

信息存储单元,用于接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份;

信息运算处理单元,用于接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理;

客户端反馈单元,用于键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。

优选地,所述信息抓取单元包括:

爬虫服务器,用于在万维网中抓取数据信息;

网站服务器,用于接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。

优选地,所述信息运算处理单元包括:

网段查询模块,用于查询网站ip所属的网段;

域名查询模块,用于查询域名ip以及域名所有者信息;

阈值设定模块,用于设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据;

反链数上升速度判断模块,用于检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理;

外链增长速度判断模块,用于检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,对网站的外链进行降权操作;

初次内容比对模块,用于对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作;

二次内容比对模块,用于对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作;

网站外链分析模块,用于检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,对网站或外链进行降权操作;

网站内链分析模块,用于检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,对网站或外链进行降权操作。

优选地,所述锚文本为链接所在的上下文信息。

优选地,所述客户端反馈单元包括app客户端或web客户端。

一种搜索引擎链接分析方法,包括:

s1、互联网云平台步骤,与万维网建立数据连接,获取万维网中的数据信息;

s2、信息抓取步骤,依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发;

s3、信息存储步骤,接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份;

s4、信息运算处理步骤,接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理;

s5、客户端反馈步骤,键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。

优选地,所述信息抓取步骤包括:

s21、爬虫服务器设置子步骤,设置爬虫服务器,在万维网中抓取数据信息;

s22、网站服务器设置子步骤,设置网站服务器,接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。

优选地,所述信息运算处理步骤包括:

s41、网段查询子步骤,查询网站ip所属的网段;

s42、域名查询子步骤,查询域名ip以及域名所有者信息;

s43、阈值设定子步骤,设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据;

s44、反链数上升速度判断子步骤,检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理;

s45、外链增长速度判断子步骤,检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,对网站的外链进行降权操作;

s46、初次内容比对子步骤,对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作;

s47、二次内容比对子步骤,对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作;

s48、网站外链分析子步骤,检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,对网站或外链进行降权操作;

s49、网站内链分析子步骤,检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,对网站或外链进行降权操作。

优选地,所述锚文本为链接所在的上下文信息。

优选地,所述客户端反馈步骤包括设置app客户端或web客户端。

与现有技术上相比,本发明的突出效果如下:

本发明通过对搜索信息源的多次确认,判断搜索结果来源的可靠性,并以此作为依据,对搜索结果分析过程中的权重重新分配,从而提升了搜索结果的准确性与可靠性。

同时,本发明能够实时监测各类网站中的关键词排名,降低了各类突发、异常情况对搜索结果的影响,避免了人为恶意链接带给网络搜索引擎的不利影响。

此外,本发明的分析系统和分析方法还可以应用于各类相近功能的系统中,为各类基于互联网大数据的运算处理系统提供可靠的信息来源,适用性和通用性强。

综上所述,本发明提供了行之有效的链接分析系统及分析方法,使用效果良好且兼容性强,具有很高的使用及推广价值。

以下便结合实施例附图,对本发明的具体实施方式作进一步的详述,以使本发明技术方案更易于理解、掌握。

附图说明

图1是本发明中分析系统的结构框图。

具体实施方式

如图所示,本发明揭示了一种搜索引擎链接分析系统及分析方法。

具体而言,一种搜索引擎链接分析系统,包括:

互联网云平台单元,用于与万维网建立数据连接,获取万维网中的数据信息。

信息抓取单元,用于依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发。

信息存储单元,用于接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份。在本实施例中,所述信息存储单元为elasticsearch数据库。

信息运算处理单元,用于接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理。

客户端反馈单元,用于键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。

所述信息抓取单元包括:

多台爬虫服务器,用于在万维网中抓取数据信息。

至少一台网站服务器,用于接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。

所述信息运算处理单元包括:

网段查询模块,用于查询网站ip所属的网段。

域名查询模块,用于查询域名ip以及域名所有者信息。

阈值设定模块,用于设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据。

反链数上升速度判断模块,用于检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理。

外链增长速度判断模块,用于检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,对网站的外链进行降权操作。

初次内容比对模块,用于对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作。

二次内容比对模块,用于对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作。

网站外链分析模块,用于检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,对网站或外链进行降权操作。

网站内链分析模块,用于检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,对网站或外链进行降权操作。

所述锚文本为链接所在的上下文信息。

所述客户端反馈单元包括app客户端或web客户端。

本发明还揭示了一种搜索引擎链接分析方法,包括:

s1、互联网云平台步骤,与万维网建立数据连接,获取万维网中的数据信息。

s2、信息抓取步骤,依据用户的操作请求在万维网中获取数据信息,并对数据信息进行转载下发。

s3、信息存储步骤,接收信息抓取单元已抓取到的数据信息,并对数据信息进行存储备份。

s4、信息运算处理步骤,接收用户的操作请求,并依据操作请求在信息存储单元内获取数据信息,并进行运算处理。

s5、客户端反馈步骤,键入用户的操作请求,并将信息运算处理单元的处理结果反馈给用户。

所述信息抓取步骤包括:

s21、爬虫服务器设置子步骤,设置爬虫服务器,在万维网中抓取数据信息。

s22、网站服务器设置子步骤,设置网站服务器,接收用户的操作请求,依据操作控制爬虫服务器完成数据信息抓取,并将抓取到的数据信息转载下发。

所述信息运算处理步骤包括:

s41、网段查询子步骤,查询网站ip所属的网段。

s42、域名查询子步骤,查询域名ip以及域名所有者信息。

s43、阈值设定子步骤,设置反链数上升速度阈值、外链增长速度阈值,相同链接数量阈值以及相互链接数量阈值,作为判断处理依据。

s44、反链数上升速度判断子步骤,检测网站反链数的上升速度并进行比对,当检测网站反链数上升速度超过反链数上升速度阈值时,对网站进行降权处理或重点监测处理。

s45、外链增长速度判断子步骤,检测网站外链的增长速度并进行比对,当检测网站外链增长速度超过外链增长速度阈值时,可认为是存在大量发链广告导致,此时对网站的外链进行降权操作。

s46、初次内容比对子步骤,对比锚文件与链接页面内容,当锚文件与链接页面内容无关时,对外链进行降权操作。

s47、二次内容比对子步骤,对比网站反链页面和链接页面内容,当网站反链页面和链接页面内容无关时,对外链进行降权操作。

s48、网站外链分析子步骤,检测比对网站外链内容,获取网站内存在的链接相同的反链数量,当链接相同的反链数量大于相同链接数量阈值时,可认为是因为论坛、博客群发导致,此时对网站或外链进行降权操作。

s49、网站内链分析子步骤,检测比对网站url链接内容,获取url链接相似网站间相互链接的数量,当相互链接的数量大于相互链接数量阈值时,可认为是因为建立站群导致,此时对网站或外链进行降权操作。

所述锚文本为链接所在的上下文信息。

所述客户端反馈步骤包括设置app客户端或web客户端。

本发明通过对搜索信息源的多次确认,判断搜索结果来源的可靠性,并以此作为依据,对搜索结果分析过程中的权重重新分配,从而提升了搜索结果的准确性与可靠性。

同时,本发明能够实时监测各类网站中的关键词排名,降低了各类突发、异常情况对搜索结果的影响,避免了人为恶意链接带给网络搜索引擎的不利影响。

此外,本发明的分析系统和分析方法还可以应用于各类相近功能的系统中,为各类基于互联网大数据的运算处理系统提供可靠的信息来源,适用性和通用性强。

综上所述,本发明提供了行之有效的链接分析系统及分析方法,使用效果良好且兼容性强,具有很高的使用及推广价值。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神和基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图表记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1