1.一种检测网站是否存在后门程序的方法,其特征在于,包括:
获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;
获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;
将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL,或者所述第一集合中包含的且所述第二集合中未包含的统一资源定位符确定为可疑统一资源定位符URL;
判断通过上述可疑统一资源定位符URL获得的与之对应的网页代码中是否包含预先确定的后门指纹,所述后门指纹是根据后门样本库中的多个样本后门程序训练得到的;
若是,判定所述待检测网站存在后门程序。
2.如权利要求1所述的方法,其特征在于,获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:
对所述第一集合中包含的统一资源定位符URL进行去重;和/或,
将所述第一集合中包含的具有对应静态资源的统一资源定位符URL进行过滤;
获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合之后,所述方法还包括:
对所述第二集合中包含的统一资源定位符URL进行去重;和/或,
将所述第二集合中包含的具有对应静态资源的统一资源定位符URL进行过滤。
3.如权利要求1所述的方法,其特征在于,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为上述待检测网站的可疑URL,具体包括:
确定所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL;
判断上述确定的统一资源定位符URL是否带有参数;
若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。
4.如权利要求1所述的方法,其特征在于,获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:
将所述第一集合划分为包含带有参数的统一资源定位符URL的第一子集、及包含不带有参数的统一资源定位符URL的第二子集;
获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:
将所述第二集合划分为包含带有参数的统一资源定位符URL的第三子集、及包含不带有参数的统一资源定位符URL的第四子集;
则,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可疑统一资源定位符URL,具体包括:
将所述第一子集中包含的且所述第三子集中未包含的统一资源定位符URL确定为带参数的可疑统一资源定位符URL;
将所述第二子集中包含的且所述第四子集中未包含的统一资源定位符URL确定为不带参数的可疑统一资源定位符URL。
5.如权利要求1所述的方法,其特征在于,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可疑统一资源定位符URL,具体包括:
确定所述第二集合中包含的且所述第一集合中未包含的带有参数的统一 资源定位符URL;
判断上述确定的统一资源定位符URL中是否包含预设的后门样本库中的后门URL特征;
若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。
6.一种检测网站是否存在后门程序的装置,其特征在于,包括:
第一获取单元,用于获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;
第二获取单元,用于获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;
确定单元,用于将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL或者所述第一集合中包含的且所述第二集合中未包含的统一资源定位符确定为可疑统一资源定位符URL;
判断单元,用于判断通过上述可疑统一资源定位符URL获得的与之对应的网页代码中是否包含预先确定的后门指纹,所述后门指纹是根据后门样本库中的多个样本后门程序训练得到的;若是,判定所述待检测网站存在后门程序。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
第一预处理单元,用于对所述第一集合中包含的统一资源定位符URL进行去重;和/或将所述第一集合中包含的具有相应静态资源的统一资源定位符URL进行过滤;
第二预处理单元,用于对所述第二集合中包含的统一资源定位符URL进行去重;和/或将所述第二集合中包含的具有相应静态资源的统一资源定位符URL进行过滤。
8.如权利要求6所述的装置,其特征在于,所述确定单元具体包括:
第一确定子单元,用于确定所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL;
第一判断子单元,用于判断上述确定的统一资源定位符URL是否带有参数;若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。
9.如权利要求6所述的装置,其特征在于,所述装置还包括:
第一划分单元,用于将所述第一集合划分为包含带有参数的统一资源定位符URL的第一子集、及包含不带有参数的统一资源定位符URL的第二子集;
第一划分单元,用于将所述第二集合划分为包含带有参数的统一资源定位符URL的第三子集、及包含不带有参数的统一资源定位符URL的第四子集;
则,所述确定单元具体用于:
将所述第一子集中包含的且所述第三子集中未包含的统一资源定位符URL确定为带参数的可疑统一资源定位符URL;
将所述第二子集中包含的且所述第四子集中未包含的统一资源定位符URL确定为不带参数的可疑统一资源定位符URL。
10.如权利要求6所述的装置,其特征在于,所述确定单元具体包括:
第二确定子单元,用于确定所述第二集合中包含的且所述第一集合中未包含的带有参数的统一资源定位符URL;
第二判断子单元,用于判断上述确定的统一资源定位符URL中是否包含预设的后门样本库中的后门URL特征;若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。