一种判断网页是否为桥页的方法

文档序号:6490770阅读:210来源:国知局
一种判断网页是否为桥页的方法
【专利摘要】本发明公开了一种判断网页是否为桥页的方法,包括以下步骤:根据网站地址,通过虚拟请求的方式获取到网站页面的html源码,然后找出完整的meta标签,接着判断是否有指定http-equiv属性为refresh,紧接着判断是否有指定content属性为数字,再判断是否指定了url属性,最后如果以上判断全部成立,判定此网页为桥页。采用本发明技术方案,通过对桥页的判断,去除此类对搜索引擎不友好的方式,让网站在搜索引擎的表现更佳,达到更好得网站推广效果。
【专利说明】一种判断网页是否为桥页的方法
【技术领域】
[0001]本发明涉及网络软件【技术领域】,具体涉及一种判断网页是否为桥页的方法。
【背景技术】
[0002]随着互联网业的飞速发展,越来越多的互联网产品上线,竞争越来越激烈。想要自己的产品被广大网民发现,就必须让搜索引擎更加关注自己的产品。有些网站为了能够快速有效得被搜索引擎发现并收录,采用了桥页的方式来欺骗搜索引擎的收录,但是随着搜索引擎得不断升级,会对于此类现象进行惩罚。
[0003]因此,通过检测网站是否使用桥页,来提醒站主不要使用此方法变得极为重要,也为网站的规范化、合理化作出重大的贡献。

【发明内容】

[0004]本发明的目的在于提醒开发者不要使用此种“伎俩”,一面导致网站被搜索引擎惩罚,甚至使自己的网站知名度或者名声下降,本发明通过对桥页的判断,去除此类对搜索引擎不友好的方式,让网站在搜索引擎的表现更佳,达到更好得网站推广效果。
[0005]为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
[0006]一种判断网页是否为桥页的方法,包括以下步骤:
[0007]步骤I)输入网站地址,并触发检测;
[0008]步骤2)根据网址地址虚拟访问网页,并获取到网页源代码;
[0009]步骤3)通过源码获取到完整的meta信息;
[0010]步骤4)判断是否指定了 http-equiv属性为refresh,如果是进入下一步;如果不是,判定网页不是桥页;
[0011]步骤5)判断是否指定了 content属性为属性,如果是进入下一步;如果不是,判定网页不是桥页;
[0012]步骤6)判断是否指定了 url属性,如果指定了,判定网页是桥页;如果没有指定,判断网页不是桥页;
[0013]步骤7)返回判断结果。
[0014]本发明的有益效果是:
[0015]本发明通过对桥页的判断,去除此类对搜索引擎不友好的方式,让网站在搜索引擎的表现更佳,达到更好得网站推广效果。
[0016]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的【具体实施方式】由以下实施例及其附图详细给出。
【专利附图】

【附图说明】
[0017]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0018]图1是本发明的流程示意图。
【具体实施方式】
[0019]下面将参考附图并结合实施例,来详细说明本发明。
[0020]参照图1所示,一种判断网页是否为桥页的方法,包括以下步骤:
[0021]步骤I)输入网站地址,并触发检测;
[0022]步骤2)根据网址地址虚拟访问网页,并获取到网页源代码;
[0023]步骤3)通过源码获取到完整的meta信息;
[0024]步骤4)判断是否指定了 http-equiv属性为refresh,如果是进入下一步;如果不是,判定网页不是桥页;
[0025]步骤5)判断是否指定了 content属性为属性,如果是进入下一步;如果不是,判定网页不是桥页;
[0026]步骤6)判断是否指定了 url属性,如果指定了,判定网页是桥页;如果没有指定,判断网页不是桥页;
[0027]步骤7)返回判断结果。
[0028]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种判断网页是否为桥页的方法,其特征在于:包括以下步骤: 步骤I)输入网站地址,并触发检测; 步骤2)根据网址地址虚拟访问网页,并获取到网页源代码; 步骤3)通过源码获取到完整的meta信息; 步骤4)判断是否指定了 http-equiv属性为refresh,如果是进入下一步;如果不是,判定网页不是桥页; 步骤5)判断是否指定了 content属性为属性,如果是进入下一步;如果不是,判定网页不是桥页; 步骤6)判断是否指定了 url属性,如果指定了,判定网页是桥页;如果没有指定,判断网页不是桥页; 步骤7)返回判断结果。
【文档编号】G06F9/44GK103809941SQ201210439979
【公开日】2014年5月21日 申请日期:2012年11月7日 优先权日:2012年11月7日
【发明者】陈德阳, 黄国建, 李建中, 高涵毅, 张峰, 汪张宪, 范锋华, 朱平, 亓明敬 申请人:江苏仕德伟网络科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1