基于粗糙集理论与WAODE算法的入侵检测方法与流程

文档序号:12467735阅读:来源:国知局

技术特征:

1.一种基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于步骤如下:

第一步,对于过去收集的、已标示是正常连接还是某种入侵方式的网络连接数据进行随机抽样,作为建立模型的训练集;

第二步,对抽样后的数据进行数据预处理;

第三步,对于完成预处理的数据,利用基于粗糙集理论的属性重要度对数据进行属性约简;

第四步,对于属性约简后的训练集数据,利用WAODE算法和约简后的训练集数据建立分类模型,得到入侵检测模型;

第五步,对于待检测的网络连接数据,将其输入入侵检测模型,利用检测模型判断该数据是属于正常数据还是入侵数据。

2.根据权利要求1所述的基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于:第二步中所述的数据预处理包括数据离散化和数据均一化。

3.根据权利要求1所述的基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于:第三步中所述基于粗糙集理论的属性重要度对数据进行属性约简的方法如下:

步骤1,初始化集合R为空集

步骤2,设定一个临时的集合T,令T=R;

步骤3,对于条件属性集C与属性集R的差集(C-R)中的每一个元素x,判断R与x的并集对于决策属性D的属性依赖度γR∪(x)(D)是否大于T对于决策属性D的属性依赖度γT(D),如果是,令T=R∪{x},否则,继续判断下一个元素,直到(C-R)中元素都判断一次;

步骤4,令R=T;

步骤5,判断集合R对于决策属性D的属性依赖度γR(D)是否等于条件属性集C对于决策属性D的属性依赖度γC(D),如果不等于,返回步骤2,否则返回属性约简集R。

4.根据权利要求1所述的基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于:第四步中所述的利用WAODE算法和约简后的训练集数据建立分类模型的方法如下:

步骤1,对于属性约简后的训练集的完成属性约简的训练集数据,对于标示是正常 连接还是某种入侵方式的类属性中每个不同的值ck,扫描所有类属性(c1,c2,c3…ck),分别记录不同类属性的样本数s1,s2,...,sn,,以公式计算先验概率P(ck);

步骤2,对于所有的非类属性的不同取值ai,计算ai与类属性ck的联合概率P(ai,c);

步骤3,对于属性约简后的训练集的所有分属性的不同取值ai,计算类属性ck与两个属性ai,aj之间的条件概率P(aj|ai,c);

步骤4,根据公式计算两个属性之间的互信息IP(Ai,c),以IP(Ai,c)作为属性Ai权重Wt,其中P(x),P(y)分别表示x,y的概率、P(x,y)表示x,y的联合概率;

步骤5,根据公式来建立分类模型。

5.根据权利要求3所述的基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于:所述基于粗糙集理论的属性重要度对数据进行属性约简的步骤3中,计算属性依赖度的方法如下:

若计算属性子集R对于决策属性D的属性依赖度γR(D):

步骤1:对于R中的每个属性Ri,将数据对象集U中Ri属性值相同的数据对象分别构成集合,求出U根据Ri属性得到的一个划分U/Ri

步骤2:对U关于属性集R中的属性R1,R2,...,Ri的划分集合U/R1U/R2...,U/Ri,进行操作,得到属性集U关于属性集R的划分U/R。,其中

步骤3:对于数据集U关于属性集R的划分U/R以及决策属性D,求出属性集R和数据集U的子集X的下近似集RX,其中

步骤4:对于属性集R的下近似集RX,求出属性集R对于决策属性D的正域POSR(D),其中POSR(D)=∪X∈DRX;

步骤5:分别求出正域POSR(D)和数据对象集U的基数||POSR(D)||和||U||,则

6.根据权利要求4所述的基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于所述利用WAODE算法和约简后的训练集数据建立分类模型的步骤2中,计算概 率P(ai,c)的方法如下:

步骤1:对于某一个属性A,对于所有训练集中的每种样本值x=<A2=a1,A2=a2....An=an>,首先选取其中一个属性值Ai=ai作为根属性,构建一个分类模型;

步骤2:扫描所有训练数据集,然后选择其中第Ai个属性值满足Ai=ai但个数不满足约束条件m=30的属性,则将其从分类模型中去除掉

步骤3:扫描所有训练数据集,记录其中第Ai个属性的属性值为ai且类为c的样本在训练集中的数量F(ai,c);

步骤4:扫描数据集,记录训练集样本的数量N;

步骤5:扫描数据集,记录与根属性Ai对应的属性值相同的样本的数量vi

步骤6:扫描数据集,记录类不同取值的数量k;

步骤7:根据计算P(ai,c)。

7.根据权利要求4所述的基于粗糙集理论与WAODE算法的入侵检测方法,其特征在于所述利用WAODE算法和约简后的训练集数据建立分类模型的步骤3中,计算概率P(aj|ai,c)的方法如下:

步骤1:对于某一个属性A,对于所有训练集中的每种样本值x=<A2=a1,A2=a2....An=an>,首先选取其中一个属性值Ai=ai作为根属性,构建一个分类模型;

步骤2:扫描所有训练数据集,然后选择第Ai个属性值满足Ai=ai但个数不满足约束条件m>=30的属性,将其从分类模型中去除掉;

步骤3:扫描所有训练数据集,记录其中第Ai个属性值为ai且第Ai个属性值为ai且类为c的样本在训练集中的数量F(aiai,c);

步骤4:扫描数据集,记录训练集样本的数量N;

步骤5:扫描数据集,记录与根属性Ai对应的属性值相同的样本的数量vj

步骤6:扫描数据集,记录类不同取值的数量k;

步骤7:扫描所有训练数据集,记录其中第Ai个属性的属性值为ai且类为c的样本在训练集中的数量F(ai,c);

步骤8:根据公式计算P(ai|ai,c)。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1