一种基于特征值的不确定网络中免疫策略设计方法与流程

文档序号:17478250发布日期:2019-04-20 06:16阅读:127来源:国知局
一种基于特征值的不确定网络中免疫策略设计方法与流程
本发明涉及到恶意软件攻击与病毒传播等
技术领域
,尤其是涉及一种基于特征值在不确定网络中解决恶意软件攻击、病毒传播、疾病传播等问题的免疫策略设计方法。
背景技术
:随着互联网技术的普及,越来越多社交工具的出现使人与人之间的联系更加紧密化。人与人的连接可以看成是一个网络图,信息的传递和扩散都是经由人与人之间的联系逐步展开。虽然便捷的互联网发展在信息沟通和传递上非常便捷,但是,对于大多数实际网络,常会出现外部恶意软件的攻击以及恶意病毒在网络内部传播和扩散等情况。恶意病毒能够传播的一个关键原因便是网络间存在的连接,这些连接为病毒的传播提供了通道。恶意病毒的传播起始于某一个或多个个体,随着时间推移逐渐渗入到与其相连的所有邻接个体,最后再渗透至整个网络。网络中连接越紧密,传播速度就越快。设计免疫策略的目的就在于使用最少的成本最大化的破坏网络结构,使剩余网络具有更强的抵抗性来抵御外部的攻击。与此同时,弱化了网络的连接结构可以降低个体间的联系,并能有效的控制恶意病毒的不断扩散和传播。在传播过程中,网络中的最大特征值与传播临界值存在紧密的联系,而最大特征值也可以直接的反应网络中的脆弱性,即最大特征值越大,网络抵御外部攻击的能力就越弱,边越容易被攻击。因此,使用最大特征值可以有效的评估所设计的免疫策略是否具有防御外部恶意攻击和控制内部病毒传播的能力。目前已有大量的研究致力于在确定的网络中设计免疫策略以防止恶意攻击或恶意病毒的传播和扩散。但是,在实际应用网络中,链路预测或者信号干扰等因素都会导致网络连接的不确定,而大多数的研究都忽略了不确定因素对整体造成的影响。因此,在设计免疫策略方案上亟需将网络的不确定性考虑其中,并针对不确定的网络结构设计一种合理且有效的免疫策略来解决恶意软件的攻击或病毒的传播等问题。技术实现要素:针对当前在不确定网络中研究病毒传播且设计免疫策略方法的缺失,本发明提出了一种有效的方法使用特征值作为评估指标,在不确定网络中预防并抵御恶意软件的攻击以及恶意病毒的传播和扩散。为了克服现有技术和方法的不足,本发明提出的技术方案如下:一种基于特征值的不确定网络中免疫策略设计方法,包括如下步骤:步骤1、建立不确定网络,并确定最大特征值作为主要的评估指标,网络模型包含节点集、边集和不确定边的概率集,节点集中每个节点代表一个个体,边代表个体之间的连接,边的概率代表个体之间是否有连接的可能性。步骤2、基于不确定网络和最大特征值确定以期望值作为综合评估指标,由于不确定网络边的影响,会生成一定数量不同结构的样本网络,且每一个样本网络都有确定的生成概率,利用不同样本网络的生成概率和最大特征值确定期望特征值;步骤3、以期望特征值和染病规模作为免疫策略的关键评估因素,并设置sis为传播模型,该传播模型中的节点存在两种状态,s为易感染状态,i为染病状态,并通过当前时刻各个节点状态间的变化确定该时刻的染病规模;步骤4、通过抽取代表性案例来移除不确定网络的不确定性,在保留不确定网络底层属性的基础上降低大规模采样造成的时间耗费;步骤5、结合最大特征值及其对应的特征向量、节点的度以及网络的密度设计免疫策略,使免疫部分节点后剩余网络的期望特征值和染病规模最小化。本发明通过研究不确定网络中受恶意软件攻击及恶意病毒传播等影响下采取适当的免疫策略来抵御外部攻击或控制病毒最小化扩散,提出了一种基于特征值的不确定网络免疫策略设计方法。网络是否具有极强的抵御攻击能力与网络结构的稳固性息息相关,且病毒的传播依赖于个体之间联系。在传播过程中,传播临界值和最大特征值关系紧密,因此,可通过最大特征值来判断当前网络的抵抗能力。由于不确定网络中边的概率决定了边是否存在,因而衍生出了大量的不同结构的样本网络。结合各个样本网络的生成概率和最大特征值,可使用期望特征值来判断当前的网络结构。根据个体之间相互传播且具有自愈性的特点,个体在不同时刻不断改变状态,因此可通过某一时刻的染病规模来判断是否达到了期望的免疫效果。由于大规模的样本网络会造成巨大的计算成本,本发明设计了一种通过抽取代表性案例来替代大规模抽样的方法,既保证了精确度,又降低了计算强度。同时,本发明还基于特征值,节点度以及网络密度设计了免疫策略,不仅适用于各种类型各种规模的网络,还能保证结果更加精准,对于预防恶意攻击和抑制病毒传播都具有极好的效果。附图说明图1是本发明提出的基于特征值的不确定网络中免疫策略设计方法流程图;图2是本发明具体实施例中的不确定网络图;图3是本发明具体实施过程中的个体(节点)状态转变图;图4是本发明提取代表性案例过程图;图5是本发明中算法实现的原理图。具体的实施方式下面结合附图和实施例对本发明作进一步说明。为了能够更好的抑制恶意病毒的传播,本发明的具体实施方式中提出了一种基于特征值的不确定网络中免疫策略设计方案,首先结合不确定网络概念确定期望指标,再通过抽取代表性案例的方法移除不确定性来降低计算时间,最后再依据特征值,节点度和网络密度设计适合任意网络结构的免疫策略。其中免疫策略设计方法的具体步骤详见图1。步骤1、建立不确定网络,并确定最大特征值作为主要的评估指标。所述不确定网络结构如图2所示,该网络结构可以理解为由节点和边连接组成的图。该网络结构中包含节点集、边集和不确定边的概率集。其中节点由不同的个体组成,边则表示个体之间的连接,概率表示个体之间边存在的可能性。传播临界值τ是病毒能否扩散开的屏障,当病毒的传播强度超过传播临界值,病毒大肆扩散至爆发,否则,病毒得到有效控制直至消亡。在传播模型中,传播临界值和最大特征值存在反比关系,因此,本发明使用最大特征值作为评估指标,来研究控制病毒爆发的免疫策略。步骤2、基于不确定网络和最大特征值,确定以期望值作为综合评估指标。受不确定网络中不确定边数量的影响,多种不同结构的确定网络会随之产生,将这些网络称为样本网络。假设存在一个不确定图g=(v,e,p),不确定边的数量为m,则样本网络总数量可以表示为n=2m,样本网络是一个确定网络,可表示为每个样本网络的生成概率为:其中,表示第i个样本,pe表示边e存在的概率;表示第i个样本网络的边的集合。考虑到各个样本网络结构不同,最大特征值也不一致,因此本发明使用期望值来记录不确定网络的特征值:此处的ee表示不确定网络中的期望特征值,其结果是各个样本网络的生成概率和最大特征值的乘积之和。当ee值越小时,则表示该网络的连接结构越坚固,此时可以更好的抵御外部的攻击。步骤3、以期望特征值和染病规模作为免疫策略的关键评估因素,并设置sis为传播模型。在传播模型中,根据sis舱室模型,每个节点可能存在两种状态,s表示易感染状态,i表示染病状态。sis传播模型中状态的变化过程如图3所示,其中s-i表示节点从易染状态转变为染病状态,i-s表示节点从染病状态恢复到易染状态。其中β和σ分别表示病毒的传播率和恢复率。病毒的传播通常由某个个体开始,经过时间的推移,逐步扩散开。结合步骤1中所述传播临界值τ的重要作用可知,当β/σ<τ时,恶意病毒会随着时间的变化逐渐消亡;而当β/σ>τ,恶意病毒会存活下来,并成为一种疫情。因此,在本发明中,设置初始时期所有的个体都为染病状态,并设置传播率β远小恢复率σ。本发明设置时刻t作为节点状态变化的观测点。随着t的逐步改变可以确定每个时刻的染病规模。其中染病规模的计算过程可表示为其中,ρi,t表示节点i在时间步t时刻不被它的邻居感染的概率,ne(i)表示节点i的邻居集合,ψnei,t-1表示节点nei在时间步t-1时刻被感染成染病节点的概率,设置初始时期所有节点均为染病节点。随着时间步增加,节点之间状态不断改变,节点i在时间步t时刻被感染成染病节点的概率记为ψi,t,表示节点i在时间步t时被感染成染病节点的概率,详细计算步骤可表示为ψi,t=1-(1-ψi,t)ρi,t-σψi,t-1ρi,t本发明中每个节点的ψi,t是相互独立的。随着时间的推移,每个节点都在不断的改变状态,直至最后趋于稳定。本发明结合不同样本网络的网络结构来设计方法,并结合不确定边存在的概率确定随着时间步的增加染病规模的改变情况。对于一个样本网络其每个时间步的染病规模可以表示为其中,表示在时刻t染病节点的数量,n-k表示免疫k个节点后剩余网络中的节点的数量。当fi值逐渐下降趋近于0时,则表示病毒的传播得到了有效的控制,最后会逐渐消亡;当fi在某个传播规模下趋于稳定,则表示病毒的传播未成功控制。步骤4、通过抽取代表性案例来移除网络的不确定性。对于解决大型的不确定网络问题,使用抽样的方法代价都是非常昂贵的。因此,本发明建议抽取一个代表性案例来代替抽样。为了保证精确度,g*必须最大化保留不确定网络的潜在属性。节点度作为图结构最基本的属性值,通过保留节点度的相似性可以近似的保留不确定网络的性质。本文通过保留代表性样本中每个节点的度与概率网络中节点的度最大化近似的方法来捕获不确定网络的本质,基于此再扩展到近似求解其他指标的近似属性。求解代表性案例的具体过程可表述如下:4-1.计算不确定网络中所有的边的概率和,用于确定代表性案例的边数。抽取代表性样本的标准在于保留每个节点的期望度。因此,本发明的主要目的在于找到一个代表性案例g*使各个节点在g*中的度与在概率网络g中的期望度尽可能相近。其中节点v在g中的期望度可以表示为所有邻居边的概率之和,其计算过程可表示为由于选择边的数量为正整数,记为p,则选取e_degv最接近的整数值为p值。4-2.根据边的概率对不确定网络中所有的边进行排序,并依次从中选择p条边,生成初始代表性样本。为了避免选择的边固定导致的局部最优,依次从排序好的边中选择一条边,并使用r表示随机产生随机数,r∈[0,1]。当选择的边的概率pe<r时,则将这条边记入代表性样本网络结构中。受随机数的随机性影响,存在每一条边被选择过,但不满足需要选择出p条边要求的情况。由于此时剩余的边的较少,此时可从未选中的边中随机选择足量的数目保证初始样本网络的构造。4-3.分别计算代表性样本中的边移除后造成的差异值该变量以及未选中的边增加至代表性样本中造成的差异值改变量。本发明定义了disv来记录样本网络中节点v的度和概率网络g中节点v的期望度的差异值。具体可以表示为其中,degv表示样本网络中节点v的实际度。通过计算每个样本网络中每个节点的差异值,再计算所有节点的差异总值,总差异值最小的样本网络即为代表性案例g*。总差异值的计算可以表示为获取代表性案例的目标可以表示成为了保证提取出最佳的代表性案例,本发明提出分别计算出将初始代表性样本中的边移除后因减少一条边引起的差异值变化量和将未选中边加入代表性样本中增加一条边引起的差异值改变量。若边e1=(u,v)是代表性样本中的边,e2=(x,y)属于不确定网络的却不是代表性样本中的边,则删除一条边差异值的改变量表示为dt1=|disu-1|+|disv-1|-(|disu|+|disv|)增加一条边差异值的该变量表示为dt2=|disx+1|+|disy+1|-(|disx|+|disy|)取删除边中差异值最小的一个记为t1,对应的边为e1,取增加边中差异值最小的一个记为t2,对应的边为e2。4-4.当t1+t2<0时,说明替换边可以降低总差异值totaldis,此时将e1从代表性样本中移除,将e2插入到代表性样本中,重复步骤4-3,多次交换得到总差异值最小的样本为代表性案例。步骤5、结合最大特征值及其对应的特征向量,节点的度以及网络的密度设计免疫策略,使免疫部分节点后剩余网络的期望特征值和染病规模最小化。最大特征值作为评估网络结构的重要指标,其对应的特征向量也异常关键。就多项研究表明,度中心性是衡量节点重要性非常关键的一个指标。在无向网络中,节点的度表示节点对应的邻居的数量。节点的传输渠道也来源于节点间的连接。节点的度越大,其邻居节点越多,这也导致病毒更易从染病节点传播和扩散,而易染节点则更容易受其邻居节点影响从而变成染病节点。因此,度也作为衡量节点重要性的另一个关键指标。除此之外,网络的密度是判断网络中内部节点间连接是否紧密的一个很有效的指标。它可以表示为网络中实际存在的边的数量与全连接状态下的总边数的比值。密度越大网络中边的数量越多,则节点间的连接就更紧密。本发明根据评估指标设计了graphcom算法,其选择免疫结果过程可表述如下5-1.计算网络中节点的度d,最大特征值对应的特征向量u1,网络密度den。本发明结合了网络中节点度,最大特征值对应的特征向量,网络密度等指标的优势,使用rs来记录每个节点的重要程度。具体可表示为:其中d(i)表示节点i的度,u1(i)对应特征向量,den表示网络的密度,其中den的计算公式如下所示,n表示节点总数:5-2.设置免疫的节点数量为k,以此计算每个节点的rs值,并记录。选择rs最大的节点,将该节点做好标记,保存到选择免疫点的集合中。5-3.删除rs值最大的节点,更新整个网络,重复步骤5-1和步骤5-2,直到满足免疫k个节点。本发明提出的免疫策略方法不仅在解决不确定网络的求解模型上缩减了大量的计算时间,还适用于各种类型各种规模大小的网络,能够更广泛更全面的解决不确定网络上抵御恶意攻击、抑制病毒传播等问题。实施例1下面举例说明研究不确定网络的必要性以及提取代表性样本对后续执行graphcom算法的作用。图2为不确定网络图,该图中包含5个节点6条边,其中包含3条不确定边,可生成23=8个样本网络。此时从中选择一个节点进行免疫,其目标是使剩余网络ee最小。表1显示了免疫各个节点的不同结果。其中序号表示样本网络,而生成概率表示样本网络生成概率,以第1个样本网络,即所有边都存在为例,此时的样本网络生成概率后几列表示免疫节点序号,在1号样本网络中,免疫节点0后剩余网络的最大特征值为1.618,免疫剩余几个节点的最大特征值分别为2,2,17,2,17,1.618,结合所有的样本生成概率和剩余网络特征值,其乘积之和记为期望特征值ee。表1中结果可知,免疫节点4可以得到最小ee,但依据确定网络,依据常见的几种免疫方法,只能达到免疫节点2或者节点3的效果。表1概率网络免疫1个节点后的期望特征值序号生成概率免疫节点0123410.0241.61803421.6180342.1700862.17008620.0361.41421421.6180341.7320511.61803430.2161.6180341.6180341.6180341.6180341.61803440.0161.6180341.618034122.17008650.3241.4142141.6180341.6180341.414214160.0241.4142141.61803411.4142141.61803470.1441.6180341.41421411.4142141.61803480.2161.4142141.414214111ee--1.4957421.5675771.370821.4077251.306378基于此,我们对不确定网络执行了提取代表性案例的方法,提取过程可见图4。初始的不确定图如(a)所示,其中各个节点的期望度为edeg,如表2所示。计算得到样本网络边的概率总和为3+0.6+0.4+0.1=4.1,四舍五入取p=4表示提取的初始代表性样本包含4条确定边。(b)中表示提取的初始代表性样本,此时可计算得到各个节点的初始差异值,此时的总差异值为2.4。从初始代表性样本中移除一条边的差异值变化量可表示为dt1=|disu-1|+|disv-1|-(|disu|+|disv|),计算可得移除边后变化量分别为dt(0,1)=1.7+0.4-(0.7+0.6)=0.8,dt(1,2)=-0.2,dt(2,3)=1,dt(3,4)=2。此时设置t1=-0.2,e1=(1,2)。同理增加一条边至初始代表性样本中dt(0,6)=0.6,dt(0,4)=-0.6,设置t2=-0.6,e1=(0,4)。由于t1+t2=-0.8<0,交换e1和e2,得到结果如(c)所示。交换后差异值为最终disv,此时差异值最小为totaldis=1.8,设置为代表性案例。表2代表件案例提取过程数据变化表牛成概率01234e_degv1.71.41.521.6degv12221初始disv-0.70.60.50-0.6最终disv0.3-0.4-0.500.4当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1