网络攻击下产品与供应链协同演进系统补偿方法及系统

文档序号:30787218发布日期:2022-07-16 08:32阅读:167来源:国知局
网络攻击下产品与供应链协同演进系统补偿方法及系统

1.本发明涉及产品与供应链系统领域,特别是涉及一种网络攻击下产品与供应链协同演进系统补偿方法及系统。


背景技术:

2.产品与供应链协同演进系统是由服务于产品生产设计及流通的各个节点企业如供应商、制造商、分销商和零售商组成,通过对信息流、物流、资金流的控制实现将原材料生产为产品并交付给用户的分布式网络控制系统 (networked control system,ncs)。随着人工智能技术的迅速发展,制造业正逐步由制造自动化向协同智能制造转型。作为国家智能制造重大工程的支撑,产品与供应链协同演进系统在电力供应,智能制造,生物医药,食品加工等领域具有广泛应用前景。
3.传统的产品与供应链协同演进系统以满足生产需求为主导,采用专用信道进行数据传输,在运作过程中通常出现物流缓慢,信息传递不及时,无法实现定制化生产,以及因生产率设计不准确而导致库存积仓等问题,致使资源利用率极低。得益于大数据技术与人工智能技术的迅猛发展,产品与供应链协同演进系统开始向数字化,智能化,可组织化转变,成为数据驱动、综合计算和网络通信于一体的信息物理系统(cyber-physical system,cps)。基于信息物理系统与多智能体技术,产品与供应链协同演进系统可以实现以用户需求为导向的定制化生产,同时对生产过程实时监控以及智能化仓储,从而极大地减少商品库存过剩现象,简化生产流程,提高企业的经营效益。
4.基于信息物理系统的产品与供应链协同演进系统以可靠、高效、实时协同的优势为复杂产品的生产销售提供了极大的便利,但由于大量网络设备的引入,使得这类信息物理系统更易受到恶意网络攻击。近年来,网络攻击事件频发,对企业造成了严重的经济损失。产品与供应链协同演进系统已经成为网络攻击的主要目标,频繁的网络攻击会使得产品与供应链协同演进系统中的节点企业遭受严重经济损失,甚至会危害社会稳定和国家发展。因此,如何提高产品与供应链协同演进系统在一类突发网络攻击事件下的应急能力和稳定性具有重要的现实意义。


技术实现要素:

5.本发明的目的是提供一种网络攻击下产品与供应链协同演进系统变更补偿方法及系统,解决网络攻击情形下的系统应急变更控制问题。
6.为实现上述目的,本发明提供了如下方案:
7.一种网络攻击下产品与供应链协同演进系统补偿方法,所述方法包括:
8.获取产品与供应链协同演进系统中每条子链的历史库存状态数据,所述历史库存状态数据包括遭受网络攻击前子链的历史库存状态数据和遭受网络攻击后子链的历史库存状态数据;
9.以所述遭受网络攻击后子链的历史库存状态数据为输入,以所述遭受网络攻击前
子链的历史库存状态数据为标签,对基于循环神经网络建立的预测模型进行训练,得到训练好的预测模型;
10.针对每条子链,将遭受网络攻击后获得的子链最新库存状态数据输入所述训练好的预测模型,预测出子链当前库存状态数据;
11.根据所述子链当前库存状态数据得到子链的局部邻域库存跟踪误差;
12.根据所述子链的性能指标函数,以所述子链的局部邻域库存跟踪误差最小为目标,利用零和博弈方法设计子链的最佳生产率和不确定市场需求;所述性能指标函数为关于所述子链的局部邻域库存跟踪误差、所述生产率和所述不确定需求的函数。
13.本发明还提供一种网络攻击下产品与供应链协同演进系统补偿系统,所述系统包括:
14.历史库存状态数据获取模块,用于获取产品与供应链协同演进系统中每条子链的历史库存状态数据,所述历史库存状态数据包括遭受网络攻击前子链的历史库存状态数据和遭受网络攻击后子链的历史库存状态数据;
15.模型训练模块,用于以所述遭受网络攻击后子链的历史库存状态数据为输入,以所述遭受网络攻击前子链的历史库存状态数据为标签,对基于循环神经网络建立的预测模型进行训练,得到训练好的预测模型;
16.预测模块,用于针对每条子链,将遭受网络攻击后获得的子链最新库存状态数据输入所述训练好的预测模型,预测出子链当前库存状态数据;
17.子链的局部邻域库存跟踪误差计算模块,用于根据所述子链当前库存状态数据得到子链的局部邻域库存跟踪误差;
18.最佳生产率和不确定市场需求计算模块,用于根据所述子链的性能指标函数,以所述子链的局部邻域库存跟踪误差最小为目标,利用零和博弈方法设计子链的最佳生产率和不确定市场需求;所述性能指标函数为关于所述子链的局部邻域库存跟踪误差、所述生产率和所述不确定需求的函数。
19.根据本发明提供的具体实施例,本发明公开了以下技术效果:
20.本发明提供的网络攻击下产品与供应链协同演进系统补偿方法及系统,针对分布式信息物理系统在网络攻击下数据包丢失的问题,先利用每条子链的历史数据设计基于循环神经网络的预测模型,利用该预测模型预测子链当前库存状态数据,以弥补因网络攻击造成的库存数据丢失;其次,利用零和博弈的思想解决变更以及不确定市场需求下的产品与供应链协同演进系统变更后的一致性问题;最后计算出博弈解以确定最优生产率和不确定市场需求。本发明能够保证系统在dos攻击导致设计变更情形下,使产品与供应链协同演进系统达到领导跟随h∞一致,并抑制不确定需求和变更设计带来的牛鞭效应。
附图说明
21.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1为本发明提供的网络攻击下变更机制示意图;
23.图2为本发明实施例1提供的网络攻击下产品与供应链协同演进系统补偿方法流程图;
24.图3为本发明实施例1提供的产品与供应链协同演进系统拓扑关系图;
25.图4为本发明实施例1提供的s-c通道丢包情况示意图;
26.图5为本发明实施例1提供的第一个设备库存预测图;
27.图6为本发明实施例1提供的第二个设备库存预测图;
28.图7为本发明实施例1提供的变更前后第一个设备的库存状态变化曲线图;
29.图8为本发明实施例1提供的变更前后第二个设备的库存状态变化曲线图。
具体实施方式
30.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
31.本发明的目的是提供一种网络攻击下产品与供应链协同演进系统变更补偿方法及系统,解决网络攻击情形下的系统应急变更控制问题。
32.针对一类如dos攻击所造成的产品与供应链协同演进系统的安全问题,研究人员已开展大量卓有成效的工作,这些研究主要包括:(1)从攻击者角度研究最佳dos攻击时刻;(2)从防御者角度研究有效控制策略;(3)基于博弈论方法研究防御者和拒绝服务攻击者之间的对抗关系。尽管基于cps的安全控制问题研究已取得丰富结果,但基于分布式cps且模型未知的产品与供应链协同演进系统,dos攻击防御策略研究尚显不足。基于dos攻击的产品与供应链协同演进系统应急变更防御策略,是本技术的主要贡献。
33.作为一类重要的分布式cps,产品与供应链协同演进系统存在大量未建模动态及不确定,剧烈的需求波动及突发的网络事件,使系统的结构与参数极易发生变化,产品设计变更是维持产品与供应链协同演进系统稳定,满足用户需求及保证经济效益的重要手段。如网络攻击可能导致的系统设计变更。利用数据驱动技术设计应急变更补偿机制解决dos攻击下的产品与供应链系统变更控制,是本技术的另一重要贡献。
34.针对产品与供应链协同演进系统作为一类复杂的分布式信息物理系统 (cyber-physical systems,cps),含有大量的未建模动态与不确定性,剧烈的需求波动及突发的网络事件,使系统结构参数极易发生变化,产品设计变更是维持系统稳定、满足用户需求及保证经济效益的重要手段。本技术解决基于分布式cps的pscses在受到拒绝服务(denial-of-service,dos)攻击下的应急变更控制问题。首先,针对pscses在网络攻击下数据包丢失的问题,利用每条子链的历史数据设计基于循环神经网络(recurrentneuralnetworks,rnn)的预测器以弥补因网络攻击造成的库存数据丢失;其次,利用博弈论思想将h∞一致性控制问题转化为多人零和图博弈问题,提出一种应急变更补偿机制;进而基于策略迭代的q-learning方法设计了模型未知下控制器在线求解算法,实现了系统的库存状态h∞一致性。
35.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
36.为使本发明的技术方案更加清晰,现先对本发明所需解决的问题的产生过程进行
详细描述。
37.本发明所基于的产品与供应链协同演进系统是一种模型未知的分布式信息物理系统。考虑配置某产品生产的供应链由n条子链组成并协同生产,假设第i条子链的动力学方程为
[0038][0039]
其中,xi(t),ui(t),和yi(t)分别为第i条子链中的生产库存状态,生产率,用户需求及当前成品输出。从控制理论的角度出发,xi(t),ui(t),和yi(t)分别为第i个子链在t时刻的状态变量,控制输入,外界扰动和系统输出。为xi(t) 的导数。a,b和d为系统矩阵且未知。不失一般性,由实践经验可将不确定用户需求分解为常需求d以及能量有限需求ωi(t),即ωi(t)∈l2[0,∞]。
[0040]
考虑到产品与供应链协同演进系统存在一个链主,子链需要根据链主和邻居供应链的库存状态变化调整其自身库存状态,假设链主的动力学方程为
[0041][0042]
其中x0(t)为实际库存需求目标,即为子链库存状态的跟踪目标。考虑到实际生产过程中的产能等一些限制因素,现给出如下2条假设:
[0043]
1、生产率ui(t)会有一定的上界u
max
,即0≤ui(t)≤u
max

[0044]
2、实际的仓储环境下,库存容量是有限的。因此,设库存水平满足 0≤xi(t)≤x
max
。此处,x
max
表示第i条子供应链仓储能力的最大值。
[0045]
在供应链系统中,当第i条子链的库存状态xi(t)通过网络传输给到分布式控制中心时,若传感器-控制器(sensor-to-controller,s-c)通道遭受dos攻击就有可能造成数据包丢失的现象,如图1所示。图1中,t为极小采样时刻,为变更补偿后的第i条子链的库存状态,分布式控制中心可以获得的第i条子链的库存状态可以表示为
[0046][0047]
其中,α(t)∈{0,1},α(t)=0代表发生了网络攻击事件,即s-c通道遭受了dos 攻击,α(t)=1代表未发生网络攻击事件,即s-c通道能够进行正常的数据传输。不失一般性,对dos攻击有如下3和4两个假设;
[0048]
3、网络攻击者连续攻击的次数有限,即由网络攻击造成的最大连续丢包数有界,记为
[0049]
4、网络攻击者只针对子链发起攻击。
[0050]
本发明从主动防控dos攻击的角度出发,设计合理的变更机制补偿因攻击造成的数据包丢失。由于系统受到不确定性需求以及变更机制的影响将可能引发牛鞭效应,因此需要进一步设计出基于最优控制的h

控制器来抑制由于不确定性需求及变更机制带来的牛鞭效应,进而使得系统在遭受dos攻击下子链的库存状态xi(t)仍然可以实现与链主的库存状态x0(t)保持一致。首先由式 (1),(2)可将每条子链的局部邻域库存跟踪误差作如下定义
[0051][0052]
其中,a
ij
为节点间连接矩阵元素,gi≥0是子链i的牵引增益。当且仅当第 i条子链与链主之间存在有向路径时,gi>0,否则,gi=0。子链的全局库存跟踪误差向量可表示为
[0053][0054]
其中,全局库存跟踪误差向量为全局库存状态向量为l=[l
ij
]∈n×n是有向拓扑图的拉普拉斯矩阵,且g=[g
ij
]∈n×n是一个牵引增益作为对角线元素(g
ii
=gi)的对角矩阵,其展现了供应链链主与各子链间的链接关系;in是n维单位矩阵,1为元素为1 的n维向量,即假设产品与供应链协同演进系统的拓扑结构中包含生成树,故可令第i条子链的同步库存误差为进而可得到全局同步库存误差为进一步全局库存跟踪误差向量与全局同步库存误差的关系可表示为
[0055][0056]
进一步可知每条子链的跟踪库存误差可以表示为由自身及其所有相邻子链的控制行为驱动的且存在不确定用户需求的动态系统。因此,供应链系统的一致性问题转化为设计合理的生产率可以使得在不确定用户需求下及变更机制下局部邻域库存跟踪误差δi(t)最小,进而可以确保链主和所有子链之间的库存趋于同步,且生产率能使得如式1所示的每个智能体满足以下定义
[0057]
对于给定牛鞭效应抑制水平常数γ>0,如果满足如下两个条件,产品与供应链协同演进系统被称为能够以γ水平抑制牛鞭效应,即变更补偿方法有效,因此,下述1)和2)可作为判定所采用的变更补偿方法是否有效的依据。
[0058]
1)当不确定市场需求ωi(t)=0时,设计合理的生产率可以使得系统满足
[0059]
2)对于给定牛鞭效应抑制水平常数γ>0以及不确定市场需求满足ωi(t)≠0且ωi(t)∈l2[0,∞)时,如果每条子链都满足如下牛鞭效应抑制条件
[0060][0061]
则称产品与供应链协同演进系统能够以γ水平抑制牛鞭效应。其中,
[0062]
性能输出;
[0063]qii
≥0,r
ii
>0,r
ij
≥0,t
ii
>0和t
ij
>0为正定对称权重矩阵;β为有界函数且满足β(0)=0。令γ
min
为γ最小值。对于任意的γ≥γ
min
而言,后续的式10都成立。为表达方便需要,下文uj(t),ωj(t),δj(t)等在不引起误解时简记为uj,ωj,δj。
[0064]
针对上述过程中描述的问题,本发明具体采用下述技术方案:
[0065]
实施例1
[0066]
本实施例提供一种网络攻击下产品与供应链协同演进系统补偿方法,请参阅图2,所述方法包括:
[0067]
s1、获取产品与供应链协同演进系统中每条子链的历史库存状态数据,所述历史库存状态数据包括遭受网络攻击前子链的历史库存状态数据和遭受网络攻击后子链的历史库存状态数据;
[0068]
s2、以所述遭受网络攻击后子链的历史库存状态数据为输入,以所述遭受网络攻击前子链的历史库存状态数据为标签,对基于循环神经网络建立的预测模型进行训练,得到训练好的预测模型;
[0069]
s3、针对每条子链,将遭受网络攻击后获得的子链最新库存状态数据输入所述训练好的预测模型,预测出子链当前库存状态数据;
[0070]
本实施例提供的变更补偿方法,首先针对pscses在网络攻击下数据包丢失的问题,利用每条子链的历史数据设计基于循环神经网络(recurrent neuralnetworks,rnn)的预测器以弥补因网络攻击造成的库存数据丢失。
[0071]
基于rnn网络设计库存状态预测器,即定义在时间t之前发生的连续丢包数为n
α
(t-t),若在t时刻,x(t)传输成功,则n
α
(t-t)=0。显然,(为常数)。因此,在t时刻,分布式控制中心可以获得最新库存状态量为
[0072][0073]
若在t时刻s-c通信信道遭受攻击发生了丢包现象,则根据历史的库存状态数据x并利用预测器预测出当前的库存状态数据即
[0074][0075]
其中,h是隐含层,u,v和w分别代表输入层,输出层和隐含层的理想权重;f(.)和g(.)分别为隐含层和输出层的激活函数。
[0076]
s4、根据所述子链当前库存状态数据得到子链的局部邻域库存跟踪误差;
[0077]
根据所述步骤s1-s3获得了子链当前库存状态数据之后,将代入上述公式(3)即可获得第i条子链的库存状态进一步的,根据第i条子链的库存状态以及公式(4)即可得知第i条子链的局部邻域库存跟踪误差δi(t)。
[0078]
s5、根据所述子链的性能指标函数,以所述子链的局部邻域库存跟踪误差最小为目标,利用零和博弈方法设计子链的最佳生产率和不确定市场需求;所述性能指标函数为关于所述子链的局部邻域库存跟踪误差、所述生产率和所述不确定需求的函数。
[0079]
具体可针对第i条子链设计如下性能指标函数
[0080][0081]
其中δi(0)为初始误差数据。
[0082]
根据所述指标函数定义子链的值函数,第i条子链的值函数为
[0083][0084]
本实施例中,生产率和不确定市场需求可以看作博弈的双方,那么供应链系统的一致性等价于求解下述的供应链系统零和微分图博弈问题
[0085][0086]
如果上述零和微分博弈公式存在鞍点则该博弈存在唯一解,即
[0087][0088]
其与以下纳什均衡条件等价
[0089][0090]
根据莱布尼茨公式和贝尔曼方程,可以得到等价于式(11)的一个哈密顿函数(hamiltonian函数)(vi(0)=0)
[0091][0092]
由稳定性条件可得
[0093][0094][0095]
进一步可将第i条子链的值函数写成如下二次型的形式,即
[0096][0097]
其中,pi为待求正定对称矩阵。根据式(18),式(16)、(17)可以进一步表示为
[0098][0099]
[0100]
需要说明的是,本实施例需按照下述3点设计基于数据驱动和博弈理论的变更控制策略以使零和博弈下的产品与供应链协同演进系统达到库存同步与存在纳什解。
[0101]

对于产品与供应链协同演进系统(1),假设1-4条件成立,若hji方程存在光滑正定解且相邻子链的生产策略和不确定市场需求策略最优,那么在生产率保证子链i能够实现与链主库存状态同步一致并以水平γ≥γ
*

*
为给定常数)抑制牛鞭效应。
[0102]

对于产品与供应链协同演进系统(1),假设1-4条件成立,若hji方程存在光滑正定解且相邻子链的生产策略和不确定市场需求策略最优,则存在图博弈纳什均衡解亦即鞍点存在,且博弈值由hji的解给出。
[0103]

对于产品与供应链协同演进系统(1),假设1-4条件成立,子链节点及连接所构成的拓扑图g具有强连接关系,且相邻子链的生产策略和不确定市场需求策略最优,则产品与供应链协同演进系统在模型未知及dos网络攻击下,可以实现各子链与链主的库存状态达到一致,且系统满足一定用户需求并可以γ≥γ
min
水平抑制牛鞭效应。
[0104]
由于上述理论过程仅仅是理论推导过程,无法直接获得最终的生产率和不确定市场需求的数值,因此还需设计q-learning算法,通过策略迭代的 q-learning算法计算机输出生产率和不确定市场需求,基于策略迭代的 q-learning算法如下:
[0105][0106]
上述算法中,为式(15)中与变量ui,δi,ωi相乘所对应的矩阵元素的算法记号。
[0107]
本发明提供的方法,基于分布式cps的产品与供应链协同演进系统,在系统模型未知并在dos攻击下情形下解决应急变更控制问题。利用数据驱动技术,根据历史数据和参考
信息设计应急防御变更机制应对系统传感器-控制器通信信道受到dos攻击情形,通过零和微分图博弈理论与强化q-learning 技术设计h∞一致性控制器,保证系统在dos攻击导致设计变更情形下,使产品与供应链协同演进系统达到领导跟随h∞一致,并具有抑制不确定需求和变更设计带来的牛鞭效应,同时保证系统具有一定的产品适应度及用户满意度。
[0108]
为了说明本实施例上述方案的有效性,现提供下述方案进行验证:
[0109]
考虑如下模型未知且包含四条子链的产品与供应链协同演进系统
[0110][0111]
以及一个链主
[0112][0113]
其中每条子供应链包含两个设备,且系统的拓扑结构如图3所示.
[0114]
为设计数据驱动控制器,选取如下模型参数生成训练数据
[0115][0116]
且假设四条子链的初始库存状态值分别为x1=[50,10]
t
,x2=[35,40]
t
,x3=[21,10]
t
, x4=[20,25]
t
,链主的库存状态初值为x0=[10,30]
t

[0117]
第一步:为验证所采用预测算法的有效性,在仿真环境中,在如图4所示网络攻击造成的数据丢包情况下,用第一条子链200天的历史库存数据进行测试来预测未来50天的库存数据,进而得到如图5,6所示两个设备的预测结果。
[0118]
第二步:考虑产品供应链协同演进系统的变更补偿设计,选择合适的权值矩阵并通过策略迭代q-learning算法求解最小生产率以及最大不确定需求,进一步可得出各个子链的库存状态和同步库存误差状态响应曲线。为验证变更补偿措施的有效,对引入变更前后的各子供应链库存情况进行对比。图7、8分别展示了dos攻击下在引入变更补偿机制前后各个子链库存水平的变化情况。
[0119]
表1变更前后指标对比
[0120][0121]
从图中仿真结果可以看出,在系统引入变更补偿机制后,系统可以在第 10天左右可以有效的跟踪协同演进系统设定的用户需求,即达到一致。
[0122]
第三步:为了进一步验证变更补偿机制对产品适应度以及用户满意度的影响,考虑如表1所列指标值,即网络攻击下交货时间以及库存平均跟踪误差。由表1可以看出,在网络攻击下通过引入变更补偿机制可以有效提升系统的交货时间(即系统实现库存一致达到满足合同规定将产品交付客户的时间)且降低平均库存跟踪误差。
[0123]
综上,本技术提出的变更机制下基于q-learning的h∞控制器能够使得产品与供应链协同演进系统在抵制dos攻击的同时还可以有效的抑制牛鞭效应并实现领导-跟随一
致性。
[0124]
实施例2
[0125]
本实施例提供一种网络攻击下产品与供应链协同演进系统补偿系统,所述系统包括:
[0126]
历史库存状态数据获取模块m1,用于获取产品与供应链协同演进系统中每条子链的历史库存状态数据,所述历史库存状态数据包括遭受网络攻击前子链的历史库存状态数据和遭受网络攻击后子链的历史库存状态数据;
[0127]
模型训练模块m2,用于以所述遭受网络攻击后子链的历史库存状态数据为输入,以所述遭受网络攻击前子链的历史库存状态数据为标签,对基于循环神经网络建立的预测模型进行训练,得到训练好的预测模型;
[0128]
预测模块m3,用于针对每条子链,将遭受网络攻击后获得的子链最新库存状态数据输入所述训练好的预测模型,预测出子链当前库存状态数据;
[0129]
子链的局部邻域库存跟踪误差计算模块m4,用于根据所述子链当前库存状态数据得到子链的局部邻域库存跟踪误差;
[0130]
最佳生产率和不确定市场需求计算模块m5,用于根据所述子链的性能指标函数,以所述子链的局部邻域库存跟踪误差最小为目标,利用零和博弈方法设计子链的最佳生产率和不确定市场需求;所述性能指标函数为关于所述子链的局部邻域库存跟踪误差、所述生产率和所述不确定需求的函数。
[0131]
作为一种可选的实施方式,所述系统还包括:
[0132]
第一判定模块m6,用于判断所述不确定市场需求是否为零,得到第一判定结果;
[0133]
第二判定模块m7,用于根据所述第一判定结果验证产品与供应链协同演进系统中链主的库存状态是否与所有子链的库存状态保持一致得到第二判定结果,或根据所述第一判定结果验证所述产品与供应链协同演进系统能否抑制牛鞭效应,获得第三判定结果;
[0134]
第三判定模块m8,用于根据所述第二判定结果和/或所述第三判定结果判定所述变更补偿方法是否有效。
[0135]
对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0136]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1