本发明涉及卫星通信,特别涉及一种空天地信息网络加密流量管理架构及其加密流量识别方法。
背景技术:
1、随着互联网技术的发展,越来越多的应用和场景会使用加密流量,基于明文特征的http协议使用场景越来越少,粗略统计,网络中约有70%的流量都是加密流量
2、当前,采用加密机制的网络协议越来越多。一方面,通信加密有助于安全和隐私保护,另一方面,也成为不法分子逃避安全监测和管理的屏障。加密流量识别对网络犯罪行为分析具有重要意义。
3、加密就是把明文转换为不可辨识的密文的过程,使非授权人无法识别和篡改。加密流量的本质是加密协议交互产生的加密数据。
4、现有的加密流量识别算法模型迁移到空天地信息网络整体性能差,不能准确学习空天地信息网络下加密流量不同特征位置的相关性,拟合效果差。由于空天地信息网络时延长,节点计算力低,算法模型迁移到空天地场景效率无法满足要求。
技术实现思路
1、本发明针对现有技术的缺陷,提供了一种空天地信息网络加密流量管理架构及其加密流量识别方法。
2、为了实现以上发明目的,本发明采取的技术方案如下:
3、一种空天地信息网络加密流量管理架构,包括:卫星、卫星接入网、卫星网关、管理系统、加密流量识别系统、策略网络架构(pbn)、核心网;
4、卫星用于数据的中转服务和数据处理服务;
5、卫星接入网用于用户到卫星互联网的接入;
6、卫星网关用于是卫星接入网的主要组成部分;
7、管理系统用于负责管理整个空天地信息网络加密流量处理的信令信息;
8、加密流量识别系统用于执行加密流量识别方法;
9、策略网络架构(pbn)用于在整个加密流量管理架构下实现服务质量(qos)的管控;
10、包括:策略决策点(pdp)、策略执行点(pep)、qos服务器(quality of service,服务质量)
11、核心网用于存储用户相关的计费信息。
12、所述加密流量识别方法包括:通过被动监测点拦截卫星网关(gw)的加密流量数据;对加密流量通过深度学习进行特征提取识别,并标记流的qos类;将识别结果转发给pdp,pdp将作决策,以改善qos。然后资源分配pep和qos服务器将执行这些决策。
13、进一步地,所述基于加密流量识别方法,具体包括以下步骤:
14、该框架采用卫星体系结构和策略网络(pbn)体系结构的相关网络功能,增加四个级别来提供互联网流量识别。
15、s1:执行流量数据收集任务。
16、s2深度学习:采用基于capslstm-lite加密流量识别算法模型,将胶囊网络和长短期记忆网络相结合。
17、s3识别结果:将识别信号发送给gw的pdp,该决策点将做出改进qos的决定。
18、s4模型压缩:对推理过程进行优化,在准确度略有降低的范围内,提高模型在卫星节点的计算速度,节省时间和精力。
19、进一步地,所述基于capslstm-lite加密流量识别算法模型,包括:卷积层、主胶囊层、数字胶囊层、长短期记忆网络层(lstm)。
20、所述卷积层中,在数据预处理后进行维度转换,将原本的784维数据转换为[28,28],将二维图像作为输入数据传递到卷积层中。设xi代表输入数据,经过卷积层后的输出convi如(1)所示:
21、convi=σ(wconv·xi+bconv) (1)
22、wconv是卷积核,bconv是偏置项,σ是非线性激活函数。
23、主胶囊层通过squash函数建立卷积胶囊提取数据特征公式如(2):
24、capconv=ρ(wcap·convi+bcap) (2)
25、wcap是主胶囊的卷积核,bcap是偏置项,ρ是squash函数。
26、利用k-means动态路由,高层胶囊是聚类中心。胶囊网络的输入是一组向量,带有方向的具有识别能力的子胶囊,使原始数据中隐藏的信息在逐渐传递的过程中还能实现高度保真。
27、k-means的目标是在将低层胶囊特征u1,u2,…un划分为k类,找到k个高层胶囊中心特征v1,v2,…,vk,使得类内间隔最小:
28、
29、d代表底层胶囊和高层胶囊距离的度量,聚类的结果依赖d的具体形式,对所有高层胶囊的类别间的距离相加;
30、设目标是最小化距离:
31、
32、对公式(4)直接进行求梯度困难,通过近似值公式(5)、(6)对l进行求解。
33、
34、min(λ1,λ2,...λn)=-max(-λ1,-λ2,...-λn) (6)
35、
36、
37、cij=softjmax(-k·d(ui,vj)) (9)
38、
39、是vj的第r次迭代的结果,令公式(10)等于0,解出vj(r+1)。
40、用内积作为胶囊特征的相似度度量:
41、
42、公式中,代表标量乘积运算,将其带入公式(10),得到底层胶囊和高层胶囊之间的关系公式。
43、
44、聚类的结果与初始化的值有关,为了确定初始化的值,提高识别特征的能力,通过加变换矩阵的方式实现一个完整的动态路由。
45、
46、引入变换矩阵wij可以任意改变低层胶囊以及高层胶囊中心的维度,如公式(13)。保证高层胶囊的特征表达能力。通过胶囊的长度表示类别出现的概率,于是引入压缩函数squash。
47、
48、公式(14)主要分为两部分,第一个分数通过挤压函数改变sj长度,不改变sj的方向。第二个分数通过长度为1的向量控制前半部分的大小。
49、
50、
51、
52、
53、动态路由的基本步骤如式(15)、(16)、(17)、(18),当和vj同向时,说明低层胶囊和高层胶囊表达的特征相似度较高,bij的权重会增加;相反,极大概率低层胶囊特征不属于高层胶囊的,bij的权重会减小。动态路由算法通过权重更新方式建立起低层特征与高层特征的联系。
54、数字胶囊层的胶囊个数代表识别类别的个数,胶囊向量的长度表示待分类类别存在的概率。
55、capfull=φ(wfull·capconv+bfull) (19)
56、wfull和bfull分别是权重和偏置。每个胶囊通过一个变换矩阵与之前的胶囊网络相关联,利用变换矩阵对输入进行预测识别,利用动态路由机制对输入和输出的关系进行迭代调整。
57、长短期记忆网络层通过循环递推提取原始网络流的序列信息特征,从而提高最终的识别效率。为了获得历史特征信息,输入数据通过:遗忘门(f)、输入门(i)、输出门(o)。输入门的输入由历史状态ht-1和当前节点状态xt决定,σ是sigmoid函数,将输出控制在0~1之间。1表示保留历史信息,0表示遗忘历史信息,输入门的计算公式如下:
58、it=σ(wix·xt+wih·ht-1+bi) (20)
59、wix表示当前状态的权重矩阵,bi表示对输入门的权重偏置。同理,遗忘门和输出门对应的计算公式如下:
60、ft=σ(wfx·xt+wfh·ht-1+bf) (21)
61、ot=σ(wox·xt+woh·ht-1+bo) (22)
62、根据之前的状态gt和当前状态st选择新的信息传到下一个神经元。
63、gt=σ(wox·xt+woh·ht-1+bo) (23)
64、st=gt·it+st-1·ft (24)
65、ht=tanh(st)·ot (25)
66、通过tanh函数处理当前状态,将所得结果与输出门相乘得到隐藏向量ht,进而与下一单元联系,实现流量传输过程中前后数据包关联时间特征信息的提取。
67、此结构最后一层是输出层,使用softmax函数得到最终的预测向量输出结果,softmax函数具体公式如下:
68、
69、进一步地,capslstm网络中采用的损失函数分为间隔损失(margin loss)和重构损失(reconstruction loss)两部分,其中间隔损失占主导地位。
70、l=lmargin+0.005*lreconstruct (27)
71、lmargin表示间隔损失,lreconstruct表示重构损失。间隔损失函数如下:
72、
73、
74、公式(28)表示k类间隔损失函数的总和,tk表示第k类预测结果的损失值,若预测结果与标签一致,tk为1,反之则为0。通常λ取0.5,m+=0.9,m-=0.9。lreconstruct重构损失函数计算预测和输入的欧氏距离,防止过拟合。
75、与现有技术相比,本发明的优点在于:
76、根据空天地信息网络的特点设计了加密流量管理架构及加密流量识别算法模型,提出一种基于轻量化的胶囊记忆神经网络识别算法,将胶囊网络和长短期记忆网络结合,采用独特的胶囊向量通过动态路由和循环递归计算全面地提取特征,拟合效果适合于复杂的空天地信息网络;大大减少了空天地信息网络节点计算的压力,更适合在空天地网络节点部署。