车联网中基于差分隐私的轻量级多级混合入侵检测方法

文档序号:37226982发布日期:2024-03-05 15:32阅读:26来源:国知局
车联网中基于差分隐私的轻量级多级混合入侵检测方法

本发明涉及车联网和深度学习技术,具体涉及一种车联网中基于差分隐私的轻量级多级混合入侵检测方法。


背景技术:

1、随着车载技术的不断革新以及联网汽车和自动驾驶汽车已经逐渐地取代传统的汽车,车载自组织网络也不断地发展完善。车载自组织网络支持车辆对一切通信,根据周围环境的性质,车辆对一切通信可以进行划分,包括车辆对车辆、车辆对基础设施、车辆对行人和车辆对网络通信。目前,车载自组织网络支持许多应用,主要集中在交通组织的不同方面,如驾驶辅助、公共安全、收费、道路交通控制、提高交通工具的安全性,也为司机提供方便快捷的信息娱乐服务。

2、车载自组织网络是一个高度断开、高移动性的网络,其中节点具有充足的计算能量和存储容量。车辆的高移动性、密度的可变性、通信方式的多样性和频繁的网络拓扑变化导致了设计和开发车载自组织网络架构存在很多的问题和挑战。也使得车载自组织网络容易受到各种网络攻击,例如拒绝服务、分布式拒绝服务和全球定位系统欺骗攻击等。这些攻击严重威胁车载自组织网络的安全性,降低车载自组织网络的稳定性和健壮性,能够导致车辆故障或者发生交通事故。

3、目前基于入侵检测方法的解决方案一直在安全区域中使用,主要用于检测攻击并制定相应对策。传统的静态检测技术如防火墙技术是一种被动防御,受到各种限制和区域的影响,在处理外部攻击时有一定的限制。入侵检测是对防火墙的补充,它可以主动防御网络安全威胁,通过分析网络和系统中的数据来确定是否存在入侵来保护系统,这弥补传统防御方法的不足。因此在车载自组织网络中,使用基于入侵检测方法的解决方案,这样就能保护车载自组织网络免受各种网络攻击。

4、目前,机器学习和数据挖掘算法被广泛认为是设计入侵检测方法的有效模型。然而,机器学习模型的训练需要大量可能包含敏感信息的数据。因此,在模型的训练过程中,隐私信息被泄露的风险很高,这给数据安全和隐私带来了更严重的挑战。在车载自组织网络的入侵检测方法领域,关于保护训练数据隐私的研究也很少。

5、此外,在车载自组织网络中的入侵检测领域还存在两个问题。首先,攻击者可以执行已知攻击模式中不包含的未知零日攻击。这种攻击可能被误归为正常,导致更高比例的误报。其次,研究者往往专注于检测异常数据,而忽略了正常数据。例如专利cn108322445 a公开一种基于迁移学习和集成学习的网络入侵检测方法,使用机器学习算法对网络流量数据进行筛选,构建多种包含攻击行为的网络流量数据,忽略了隐私泄露的问题,同时整个计算开销较大。例如专利cn 116155572a公开一种基于集成学习的加密流量网络入侵检测方法,仅对加密后的数据流量进行检测而未解决零日攻击问题,同样地,忽视了数据的隐私泄露问题。


技术实现思路

1、发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种车联网中基于差分隐私的轻量级多级混合入侵检测方法。

2、技术方案:本发明的一种车联网中基于差分隐私的轻量级多级混合入侵检测方法,包括以下步骤:

3、步骤(1)、将差分隐私范式中的拉普拉斯随机噪音r加入原始数据集x中,用来保护数据集的隐私信息,并得到差分隐私数据集xdp,xdp=x+r;

4、步骤(2)、由于差分隐私数据集xdp中的数据量较大,对差分隐私数据集xdp进行数据抽样,以降低数据的数量和机器学习算法的资源成本,得到差分隐私数据集xdp_1;

5、步骤(3)、采用数据正则化算法-标准分数,对差分隐私数据集xdp_1进行正则化,提高数据可比性,削弱数据解释性,得到差分隐私数据集xdp_2;

6、步骤(4)、对差分隐私数据集xdp_2使用信息增益和快速相关性滤波算法进行特征选择,从已有的m个特征中选择n个特征,使得系统的特定指标最优化,得到差分隐私数据集xdp_3;

7、步骤(5)、对差分隐私数据集xdp_3使用主成分分析法的特征提取方法,对某一模式的组测量值进行变换,以突出该模式具有代表性特征,并得到差分隐私数据集xdp_4;

8、步骤(6)、单类支持向量机模型检测差分隐私数据集xdp_4,用来判断数据是否为正常数据;

9、步骤(7)、如果差分隐私数据集xdp_4含有异常数据,之后使用多个监督学习模型集成的投票集成模型来检测已知攻击,具体方法为:

10、步骤(7-1)、投票集成模型是第二级检测模型;

11、步骤(7-2)、投票集成模型集成了三种基于监督学习的算法,即梯度增强决策树、随机森林和额外树,以实现更高性能的学习器;

12、步骤(7-3)、从单类支持向量机模型接收到差分隐私数据集xdp_4后,对差分隐私数据集xdp_4进行检测得到检测概率结果p’;

13、步骤(7-4)、如果p’>p,其中p为固定的阈值,则输出结果y={2,3,...,n},其中2,3,...,n代表多种类型的已知攻击;

14、步骤(7-5)、如果p’小于或等于p,投票集成模型将数据流标记为不确定实例,并将其提交给堆叠集成模型进行下一级检测;

15、步骤(8)、如果差分隐私数据集xdp_4中的异常数据都是未知攻击数据,使用多个无监督学习模型集成的堆叠集成模型,检测未知零日攻击。

16、进一步地,所述步骤(3)对差分隐私数据集xdp_1进行正则化的具体过程如下:

17、机器学习模型在标准化数据集上经常执行得更好,因此有必要使用标准分数算法对差分隐私数据集xdp_1进行归一化;

18、对于差分隐私数据集xdp_1中的数据x,通过标准分数算法即可归一化为均值为0,标准差为1;

19、标准分数算法的实现方法满足:其中xn为归一化特征值,x为原始特征值,μ和σ分别为特征值的均值和标准差。

20、进一步地,所述步骤(4)对差分隐私数据集xdp_2进行进行特征选择时,首先使用信息增益算法进行处理,之后使用快速相关性滤波算法进行处理,具体方法为:

21、首先使用信息增益算法对差分隐私数据集xdp_2进行特征选择,得到经过信息增益进行特征选择后的数据集x′dp_2;

22、然后,使用快速相关性滤波算法对x′dp_2进行特征选择,得到差分隐私数据集xdp_3。

23、进一步地单类支持向量机模型是第一级检测模型;它将学习正常观测的决策边界,并考虑一些离群值,如果奇异值位于决策边界内,则模型将其视为正常,否则将其视为异常;单类支持向量机模型检测差分隐私数据集xdp_4的具体过程如下:

24、单类支持向量机模型检测差分隐私数据集xdp_4是否为正常数据,得到检测结果集y;

25、如果仅有y={1},它直接输出数据检测结果为正常数据,或者将差分隐私数据集xdp_4标记为正常数据集;

26、如果y={1,-1},表示差分隐私数据集xdp_4中包含异常数据,然后将整个差分隐私数据集xdp_4提交到监督学习模型进行处理。

27、进一步地,所述步骤(8)监督学习模型无法对抗未知的攻击,但是它能将未知攻击标记为不确定实例,并在异常数据中存在未知攻击时,将其提交给无监督学习模型进行检测,堆叠集成模型是第三级检测模型;堆叠集成模型检测差分隐私数据集xdp_4中的未知零日攻击的具体过程如下:

28、单类支持向量机和隔离森林是典型的基于无监督学习的异常检测算法;

29、叠加集成模型首先通过两个基学习器单类支持向量机和隔离森林学习原数据,这两个基学习器都会对原数据进行输出,然后将这两个模型的输出按照列的方式进行堆叠,构成了(m,p)维的新数据,m代表样本数即差分隐私数据集xdp_4的行数,p代表基学习器的个数(由于本发明使用两个基学习器,因此此处p=2);

30、然后将新的样本数据交给第二层模型进行拟合,第二层模型则是两个基学习器中性能最好的一个基学习器,根据实验结果,隔离森林模型性能最好,因此第二层模型是隔离森林模型;

31、叠加集成模型从投票集成模型接收到不确定实例后,得到检测结果集y={-1},即为新型的攻击;

32、叠加集成模型对该新型攻击进行标记签名,并将其添加到已知攻击模式的数据库中;至此完成从未知攻击到已知攻击的转换,并且同一类型的下一次攻击将被视为已知攻击。

33、有益效果:与现有技术相比,本发明具有以下优点:

34、(1)本发明提出了一种新型入侵检测系统,它包括单类支持向量机模型、投票集成模型和堆叠集成模型,可以高性能地检测在车载自组织网络中的正常流量、已知攻击和未知的零日攻击。

35、(2)差分隐私技术被用于保护训练数据中的隐私信息。差分隐私技术中的拉普拉斯机制应用于训练数据集中,来获得不同隐私预算的差分隐私数据集,所提出的新型入侵检测系统来验证这些差分隐私数据集的实用性。

36、综上所述,本发明实现了更多的功能特性,例如正常流量检测、已知攻击检测、未知攻击检测等。此外,还使用差异隐私中的拉普拉斯机制保护训练数据的隐私信息。

37、

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1