网页链接检测方法及装置的制造方法_3

文档序号:9551304阅读:来源:国知局
[0116]本发明实施例提供的网页链接检测装置的工作原理可参考图1-4中方法实施例所示,在此不再赘述。
[0117]同理,本发明实施例还提供了另一种网页链接检测装置,其结构如图8所示,包括:
[0118]获取模块801,用于获取待检测网页网址及待检测链接;
[0119]格式判断模块802,用于判断所述待检测网页网址格式是否正确;
[0120]域名等级判断模块803,用于在所述待检测网页网址格式正确的情况下,判断所述待检测网页网址的域名等级是否为预设等级,所述预设等级为独立域名等级或二级域名等级;
[0121]第三结果确定模块804,用于若所述待检测网页的域名等级为预设等级,则所述待检测链接有效。
[0122]第四结果确定模块805,用于若所述待检测网页网址格式不正确,或,所述待检测网页的域名等级不为预设等级,所述待检测链接无效。
[0123]本发明实施例提供的网页链接检测装置中,先通过判断网页网址格式是否正确的方式,筛选掉网页格式错误的网页,进而避免对这些网页上的链接进行检测,提高了检测的效率。并且,本实施例中,对网页格式正确的待检测网页进行进一步的判断,当其域名等级为预设等级时,则可以通过域名等级来确定该网页包含的待检测链接的有效性。即,可以直接确定待检测链接为有效。从而大大缩短了检测过程,减小了服务器的开销。
[0124]本实施例提供的网页链接检测装置的工作原理可参考图5所示实施例,在此不再赘述。
[0125]对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0126]需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0127]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0128]对所提供的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
[0129]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种网页链接检测方法,其特征在于,包括: 获取待检测网页网址及待检测链接; 判断所述待检测网页网址是否符合第一预设条件; 在所述待检测网页网址符合第一预设条件的情况下,判断所述待检测链接是否符合第二预设条件,所述第一预设条件至少包括:所述待检测网页网址格式正确,所述第二预设条件至少包括:所述待检测链接存在于所述待检测网页a标签中; 在所述待检测链接符合所述第二预设条件的情况下,所述待检测链接有效; 在所述待检测网页网址不符合第一预设条件,或,所述待检测链接不符合所述第二预设条件的情况下,所述待检测链接无效。2.根据权利要求1所述的方法,其特征在于,判断所述待检测网页网址是否符合第一预设条件的过程包括: 判断所述待检测网页网址是否以预设字符为开头,以预设域名后缀为结尾,若是,则所述待检测网页网址符合所述预设第一条件,若否,则所述待检测网页网址不符合所述第一预设条件。3.根据权利要求1所述的方法,其特征在于,所述第一预设条件还包括:所述待检测网页网址的域名等级为独立域名等级或二级域名等级。4.根据权利要求3所述的方法,其特征在于,所述判断所述待检测网页网址是否符合第一预设条件的过程包括: 判断所述待检测网页网址是否以预设字符为开头,以预设域名后缀为结尾; 在所述待检测网页网址以预设字符为开头,以预设域名后缀为结尾的情况下,判断所述待检测网页网址的域名等级是否为预设等级; 在所述待检测网页网址的域名等级为预设等级的情况下,所述待检测网页网址符合所述预设第一条件; 在所述待检测网页网址不以预设字符为开头或不以预设域名后缀为结尾的情况下,或者,在所述待检测网页的域名等级不为预设等级的情况下,所述待检测网页网址不符合所述预设第一条件。5.根据权利要求2或4所述的方法,其特征在于,所述第二预设条件还包括:所述待检测网页标签没有隐藏属性。6.一种网页链接检测方法,其特征在于,包括: 获取待检测网页网址及待检测链接; 判断所述待检测网页网址格式是否正确; 在所述待检测网页网址格式正确的情况下,判断所述待检测网页网址的域名等级是否为预设等级; 若所述待检测网页的域名等级为预设等级,则所述待检测链接有效; 若所述待检测网页网址格式不正确,或,所述待检测网页的域名等级不为预设等级,所述待检测链接无效,所述预设等级为独立域名等级或二级域名等级。7.—种网页链接检测装置,其特征在于,包括: 获取模块,用于获取待检测网页网址及待检测链接; 第一判断模块,用于判断所述待检测网页网址是否符合第一预设条件,所述第一预设条件至少包括:所述待检测网页网址格式正确; 第二判断模块,用于在第一判断模块判断出所述待检测网页网址符合所述第一预设条件时,判断所述待检测链接是否符合第二预设条件,所述第二预设条件至少包括:所述待检测链接存在于所述待检测网页a标签中; 第一结果确定模块,用于在所述待检测链接符合所述第二预设条件的情况下,所述待检测链接有效; 第二结果确定模块,用于在所述待检测网页网址不符合第一预设条件,或,所述待检测链接不符合所述第二预设条件的情况下,所述待检测链接无效。8.根据权利要求7所述的方法,其特征在于,所述第一判断模块包括: 第一判断单元,用于判断所述待检测网页网址是否以预设字符为开头,以预设域名后缀为结尾。9.根据权利要求7所述的方法,其特征在于,所述第一判断模块包括: 第一判断单元,用于判断所述待检测网页网址是否以预设字符为开头,以预设域名后缀为结尾; 第二判断单元,用于在所述待检测网页网址以预设字符为开头,以预设域名后缀为结尾的情况下,判断所述待检测网页网址的域名等级是否为预设等级。10.一种网页链接检测装置,其特征在于,包括: 获取模块,用于获取待检测网页网址及待检测链接; 格式判断模块,用于判断所述待检测网页网址格式是否正确; 域名等级判断模块,用于在所述待检测网页网址格式正确的情况下,判断所述待检测网页网址的域名等级是否为预设等级,所述预设等级为独立域名等级或二级域名等级; 第三结果确定模块,用于若所述待检测网页的域名等级为预设等级,则所述待检测链接有效; 第四结果确定模块,用于若所述待检测网页网址格式不正确,或,所述待检测网页的域名等级不为预设等级,所述待检测链接无效。
【专利摘要】本发明提供了网页链接检测方法及装置,该方法包括:获取待检测网页网址及待检测链接;判断所述待检测网页网址是否符合第一预设条件;在所述待检测网页网址符合第一预设条件的情况下,判断所述待检测链接是否符合第二预设条件,所述第一预设条件至少包括:所述待检测网页网址格式正确,所述第二预设条件至少包括:所述待检测链接存在于所述待检测网页a标签中;在所述待检测链接符合所述第二预设条件的情况下,所述待检测链接有效。因此,本发明实施例提供的网页链接检测方法中,先通过判断网页网址格式是否正确的方式,筛选掉网页格式错误的网页,进而避免对这些网页上的链接进行检测,提高了检测的效率,节省了服务器的开销。
【IPC分类】H04L29/06
【公开号】CN105306462
【申请号】CN201510670309
【发明人】郭明阳, 张阳华, 乔景亮, 王路, 张丽辉, 朱雨莹, 张扬蕾, 骆超锋, 陈拓
【申请人】郑州悉知信息科技股份有限公司
【公开日】2016年2月3日
【申请日】2015年10月13日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1