网页篡改检测方法及装置的制作方法

文档序号:6614840阅读:313来源:国知局
专利名称:网页篡改检测方法及装置的制作方法
技术领域
本发明实施例涉及网络安全技术,尤其涉及一种网页篡改检测方法及装置。
背景技术
随着Internet技术的飞速发展,网络安全的重要性及其对社会的影响越来越大,网络安全问题也越来越突出,其中,网页篡改是网络安全中常发生的事件之一。以政府网站为例,网页篡改(尤其是含有政治攻击色彩的篡改)会对政府形象造成严重损害。另外,一些电子政务、电子商务项目在招标中,已明确说明要防止网页篡改。因此,防范网页、主页篡改的问题已逐渐得到各方面的重视。目前,通过网页篡改检测引擎监检测网页篡改事件,当篡改事件发生时,网页篡改检测引擎实时发出警报。一般来说,网页篡改检测引擎为各种篡改事件分别设置检测流程,当被检测的事件过不了某个检测流程时,即判断该事件为篡改事件;或者,预先给每一检测流程设置加权值,将被检测事件通过每一检测流程分别得到的分数与预先设置的各个加权值相乘后求和得到一个总分数,将这个总分数和设置的阀值做比较,若果超过范围就是篡改,否则,则不是篡改事件。然而,在实现本发明实施例的过程中,发明人发现,过不了某一个检测流程并不都意味着该事件就为篡改事件,且网页篡改检测引擎中每一检测流程的预设加权值不能动态的变化,而各种网页篡改事件是随机发生的。因此,网页篡改检测引擎的误报率、漏报率参差不齐,有的甚至非常严重,存在检测准确率低的问题。

发明内容
本发明实施例提供一种网页篡改检测方法,通过网页篡改检测算法的网页篡改检测模型,从而提高网页篡改检测的准确度。第一个方面,本发明实施例提供一种网页篡改检测方法,包括步骤I :根据每一种类网页篡改的属性获取每个时间检测点i的网页篡改检测值Vi以构造网页篡改检测算法可读取的训练样本集Strain ;步骤2 :利用所述网页篡改检测算法以Cof(I)为概率抽取样本集Df对所述训练样本集Strain进行训练,更新训练样本权重以得到强学习机H,其中,ωΓ(1)为平均概率分布;步骤3 :若不满足下列条件I及条件2,则以ω f (η)为概率抽取样本集Df对所述训练样本集Strain进行迭代训练,重复更新训练样本权重以得到强学习机H,其中, f(n)为正态分布概率;否则,执行步骤4 ;条件I :所述网页篡改检测算法达到最大迭代次数k ;条件2 :所述样本集Df不再变化;步骤4 :输出强学习机H,利用所述强学习机完成网页篡改的检测。在第一种可能的实现方式中,上述步骤2包括以下步骤
步骤2. I :设定所述网页篡改检测算法最大迭代次数k,并设定所述网页篡改检测算法所调用的弱学习算法;步骤2. 2:从所述训练样本集Strain中以cof(l)为概率抽取所述样本集Df,并由弱学习算法训练,得到弱学习机匕,其中,所述概率Cof(I)为平均分布概率,且
权利要求
1.一种网页篡改检测方法,其特征在于,包括 步骤I :根据每一种类网页篡改的属性获取每个时间检测点i的网页篡改检测值Vi以构造网页篡改检测算法可读取的训练样本集Strain ; 步骤2 :利用所述网页篡改检测算法以cof(l)为概率抽取样本集Df对所述训练样本集Strain进行训练,更新训练样本权重以得到强学习机H,其中,cof(l)为平均概率分布;步骤3 :若不满足下列条件I及条件2,则以cof (n)为概率抽取样本集Df对所述训练样本集Strain进行迭代训练,重复更新训练样本权重以得到强学习机H,其中, f(n)为正态分布概率;否则,执行步骤4; 条件I :所述网页篡改检测算法达到最大迭代次数k ; 条件2 :所述样本集Df不再变化; 步骤4 :输出强学习机H,利用所述强学习机H完成网页篡改的检测。
2.根据权利要求I所述的方法,其特征在于,所述步骤2包括以下步骤 步骤2. I :设定所述网页篡改检测算法最大迭代次数k,并设定所述网页篡改检测算法所调用的弱学习算法; 步骤2. 2:从所述训练样本集Strain中以cof(l)为概率抽取所述样本集Df,并由弱学... (OiU)习算法训练,得到弱学习机匕,其中,所述概率cof(l)为平均分布概率,且
3.根据权利要求I所述的方法,其特征在于,所述步骤3中以cof(n)为概率抽取所述样本集Df对所述训练样本集Strain进行迭代训练,重复更新训练样本权重以得到强学习机H,具体包括以下步骤 步骤3. I :从所述训练样本集Strain中以cof(n)为概率抽取所述样本集Df,并由弱学习算法训练,得到弱学习机匕,所述概率cof(n)为正态分布概率,
4.根据权利要求2所述的方法,其特征在于, 所述训练误差ε f的计算公式为
5.根据权利要求3所述的方法,其特征在于,所述训练误差ef的计算公式为&=Σ%( )
6.根据权利要求Γ5任一所述的方法,其特在于,所述强学习机H的计算公式为
7.根据权利要求f5任一所述的方法,其特征在于,所述步骤I包括以下步骤步骤I. I :分析每一种类网页篡改的属性Xl,X2, L,Xn,进而构造层次化的网页篡改判断指标体系T ;步骤I. 2 :统计所述每一种网页篡改的检测结果Ri,按照时间检测点i的顺序,依次输入到所述网页篡改判断指标体系T中,得到每一所述时间检测点i的网页篡改检测值Vi。步骤I. 3 :根据所述每一时间检测点i的所述网页篡改检测值Vi,构造所述网页篡改检测算法可读取的训练样本集Strain。
8.—种网页篡改检测装置,其特征在于,包括构造模块,用于根据每一种类网页篡改的属性获取每个时间检测点i的网页篡改检测值Vi以构造网页篡改检测算法可读取的训练样本集Strain ;第一训练模块,用于利用所述网页篡改检测算法以《f(l)为概率抽取样本集Df对所述训练样本集Strain进行训练,更新训练样本权重以得到强学习机H,其中,ωΓ(1)为平均概率分布;第二训练模块,用于若不满足下列条件I及条件2,则以cof (η)为概率抽取样本集Df对所述训练样本集Strain进行迭代训练,重复更新训练样本权重以得到强学习机H,其中,ωΓ(η)为正态分布概率,否则,输出强学习机H;条件I :所述网页篡改检测算法达到最大迭代次数k ;条件2 :所述样本集Df不再变化;检测模块,用于输出强学习机H,利用所述强学习机H完成网页篡改的检测。
9.根据权利要求8所述的装置,其特征在于,所述第一训练模块,具体用于设定所述网页篡改检测算法最大迭代次数k,并设定所述网页篡改检测算法所调用的弱学习算法;从所述训练样本集Strain中以cof(l)为概率抽取所述样本集Df,并由弱学习算法训练,得到弱学习机匕,其中,所述概率cof(l)为平均分布概率,且
10.根据权利要求8所述的装置,其特征在于,所述第二训练模块,具体用于从所述训练样本集Strain中以cof(n)为概率抽取所述样本集化,并由弱学习算法训练,得到弱学习机匕,所述概率cof(n)为正态分布概率,
11.根据权利要求8 10任一所述的装置,其特征在于,所述构造模块,具体用于分析每一种类网页篡改的属性xl,x2, L,Xn,进而构造层次化的网页篡改判断指标体系T ;统计所述每一种网页篡改的检测结果Ri,按照时间检测点i的顺序,依次输入到所述网页篡改判断指标体系T中,得到每一所述时间检测点i的网页篡改检测值Vi。根据所述每一时间检测点i的所述网页篡改检测值Vi,构造所述网页篡改检测算法可读取的训练样本集Strain。
全文摘要
本发明提供一种网页篡改检测方法及装置。该方法包括根据每一种类网页篡改的属性获取每个时间检测点i的网页篡改检测值Vi以构造网页篡改检测算法可读取的训练样本集Strain,以ωf(l)为概率抽取样本集Df对训练样本集Strain进行训练,更新训练样本权重以得到强学习机H;若不满足下列条件1及条件2,则以ωf(n)为概率抽取样本集Df对训练样本集Strain进行迭代训练,重复更新训练样本权重以得到强学习机H;否则,输出强学习机H,利用强学习机完成网页篡改的检测。其中,条件1为网页篡改检测算法达到最大迭代次数k,条件2为样本集Df不再变化。本发明提供的网页篡改检测方法,通过网页篡改检测算法得到的网页篡改检测模型,从而提高网页篡改检测的准确度。
文档编号G06F17/30GK102938042SQ20121042497
公开日2013年2月20日 申请日期2012年10月30日 优先权日2012年10月30日
发明者张鸿勋, 卢梁, 柯强 申请人:北京神州绿盟信息安全科技股份有限公司, 北京神州绿盟科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1