基于大数据分析的风险评估方法、计算机装置及可读存储介质与流程

文档序号:26010014发布日期:2021-07-23 21:29阅读:103来源:国知局
基于大数据分析的风险评估方法、计算机装置及可读存储介质与流程

本发明属于信息系统风险技术领域,尤其涉及一种基于大数据分析的风险评估方法、计算机装置及可读存储介质。



背景技术:

伴随我国信息化发展进程加快,信息系统在政府、商业、各大企业中应用十分普遍。信息系统以其自身具备的开放性优势,给人们的工作及生活带来了极大的便利。伴随信息系统价值体现越发显著的同时,信息系统存在的安全问题同样不可忽视。一些不法人员通过非法途径入侵信息系统盗取资料,给个人和企业带来了严重的经济损失,因此信息系统的风险评估必不可少。通过信息系统风险评估可有效了解信息系统存在的安全问题以及未来可能存在的风险,便于及时采取应对措施将风险扼杀在摇篮。

信息系统风险是一个相对概念,一般采用可直接或间接体现信息系统风险产生影响因子的信息系统风险评估指标,评估一个信息系统的安全性。

由于信息系统风险的影响因素多、变化较为复杂,多种指标复杂性以及指标间的相关性会严重干扰信息系统风险评估,导致信息系统风险评估的精确性不足。



技术实现要素:

针对上述技术问题,本发明提供一种基于大数据分析的风险评估方法、计算机装置及可读存储介质,提升信息系统风险评估的准确性。

基于大数据分析的风险评估方法,所述方法包括以下步骤:

s1、构建信息系统风险评估指标体系;

s2、采用因子分析法,获取所述信息系统风险评估体系中的公共指标;

s3、采用改进的gwo算法优化bp神经网络,构建gwo-bp神经网络;

s4、将所述公共指标作为所述gwo-bp神经网络的输入数据,建立信息系统风险评估模型,完成信息系统风险评估。

进一步的,步骤s1中,所述信息系统风险评估体系的原始信息系统风险评估指标包括p个,所述原始信息系统风险评估指标fi通过m(m<p)个公共指标si和一个特殊指标εi经线性加权方式表达,表达式为:

fi=ωi1s1+ωi2s2+…+ωimsm+εi,i=1,2,…,n

其中ωim,n分别表示指标i在公共指标m上的系数。

进一步的,步骤s2中,所述采用因子分析法包括以下流程:

s201、对输入数据fij展开标准化处理,得到相关系数评判矩阵:

w=(ωij)p*p

其中表示相关系数;分别表示输入数据第i行、第j行的数据均值;

s202、利用kmo度量值展开各变量的相关性分析并建立因子变量,遵循|ηi-w|=0原则,计算累积方差贡献率:

其中ηi为相关性的矩阵特征值;

s203、选取累积方差贡献率范围的86%~91%中排名靠前的m个指标获取主要风险评估指标,其荷载矩阵z的表达式为:

z=li(zi)m*p,i=1,2,…,p

其中li表示第i个指标与原变量间的系数。

s204、获取原始变量的线性组合,变化处理指标变量,公式为:

si=li1f1+li2f2+…+lipfp,i=1,2,…,m。

进一步的,步骤s3中,所述改进的gwo算法对适应度差的算法施以罚函数。

进一步的,所述改进的gwo算法对适应度差的算法施以罚函数时,包括以下步骤:

s301、灰狼在捕食过程中,依据适应度值分为四个等级,分别为:最优、第二优、第三优和其他灰狼,分别用α,β,θ,μ表示;

s302、灰狼在捕食时,α,β,θ负责追赶猎物,μ沿着前三个等级灰狼的路线搜索目标,在这个过程中,灰狼个体与猎物之间的距离表达式为:

q=|c*bp(t)-b(t)|

其中:q,t分别表示灰狼个体与猎物之间的距离、迭代次数;bp(t),b(t)分别表示迭代次数为t时的猎物位置、灰狼个体位置;c=2r1,r1∈[0,1],为常数;

s303、灰狼位置更新为:

b(t+1)=bp(t)-a*q

a=2ar2-a

其中:a,max,r2分别表示收敛因子、最大迭代次数、[0,1]区间常数,若|a|>1,狼群执行全局搜索;若|a|<1,狼群执行局部搜索;

s304、计算灰狼个体间的距离dij<σ,比较灰狼i灰狼j的适应度fi,fj的大小,若dij<σ,则min(fi,fj)-penalty,σ是小生境半径,penalty是罚函数;

s305、α,β,θ追赶猎物的数学模型为:

s306、根据α,β,θ的位置获取μ的最终位置信息,公式为:

bp(t+1)=(b1+b2+b3)/3。

进一步的,步骤s3中,所述gwo-bp神经网络通过以下步骤构建:

s301、所述改进的gwo算法将bp神经网络的权重和阈值作为灰狼位置信息;

s302、利用灰狼搜索猎物的能力更新bp神经网络的权重和阈值;

s303、通过多次迭代,bp神经网络得到全局最优权值和阈值。

一种计算机装置,所述计算机装置包括处理器及存储器,所述存储器上存储有若干计算机程序,所述处理器用于执行存储器中存储的计算机程序时实现上述任意一项所述基于大数据分析的风险评估方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于大数据分析的风险评估方法的步骤。

本发明的有益效果:在庞大的数据集中,采用因子分析法消除指标相关性、降低风险评估指标体系复杂度,获取公共评估指标;采用改进的gwo算法优化bp神经网络,解决其收敛速度慢、容易陷入局部最优、初始化参数具备较强依赖性问题;将所获公共指标作为gwo-bp神经网络的输入数据,建立信息系统风险评估模型,实现信息系统风险评估,并使得评估速率更快、准确性更高。

附图说明

图1为本发明在一实施例中风险评估方法的步骤流程图;

图2为本发明在一实施例中gwo-bp模型的评估流程图;

图3为本发明在一实施中计算机装置的结构示意图;

图中:1、计算机装置,101、存储器,102、处理器。

具体实施方式

以下结合实施例对本发明作进一步的阐述,所述的实施例仅为本发明一部分的实施例,这些实施例仅用于解释本发明,对本发明的范围并不构成任何限制。

优选地,本发明的基于大数据分析的风险评估方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。

所述计算机装置可以是桌上型计算机、笔记本电脑、平板电脑、服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

如说明书附图1所示,在一实施例中,基于大数据分析的风险评估方法,包括以下步骤:

s1、构建信息系统风险评估指标体系;

由于信息系统风险评估指标体系中包含很多风险评估指标,例如金融系统中就存在绑定账户数量验证交易数量、频率、时间,以及账户资金交易的时间、数量、频率、流向等多个指标。

指标间可能存在一定的相关性,且不同指标对风险评估影响的差异显著。因此,为真实、精准衡量信息系统的实际风险情况,不能直接应用上述信息系统风险指标评估体系进行风险评估,需采用因子分析法通过缩减风险评估指标数量、消除指标相关性的方式,降低风险评估指标体系的复杂度,提升信息系统风险评估模型建模效率。

在该实施例中,假设原始的信息系统风险评估指标共包括p个,那么,信息系统风险的原始评估指标fi可通过m(m<p)个公共指标si和一个特殊指标εi经线性加权方式表达,表达式如下:

fi=ωi1s1+ωi2s2+…+ωimsm+εi,i=1,2,…,n

式中ωim,n分别表示指标i在公共指标m上的系数。

s2、采用因子分析法,获取所述信息系统风险评估体系中的公共指标;

具体的,因子分析法的应用流程如下:

s201、以消除变量的不同量纲干扰为目标,对输入数据fij展开标准化处理,得到相关系数评判矩阵:

其中表示相关系数;分别表示输w=(ωij)p*p

入数据第i行、第j行的数据均值;

s202、利用kmo(检验统计量)度量值展开各变量的相关性分析并建立因子变量,遵循|ηi-w|=0原则,计算累积方差贡献率:

其中ηi为相关性的矩阵特征值;

s203、选取累积方差贡献率范围的86%~91%中排名靠前的m个指标获取主要风险评估指标,其荷载矩阵z的表达式为:

z=li(zi)m*p,i=1,2,…,p

其中li表示第i个指标与原变量间的系数。

s204、获取原始变量的线性组合,变化处理指标变量,公式为:

si=li1f1+li2f2+…+lipfp,i=1,2,…,m。

s3、采用改进的gwo算法优化bp神经网络,构建gwo-bp神经网络;

其中,gwo算法是利用自然界中的灰狼围捕、狩猎方式建立的数学模型实现优化工作,在该实施例中,改进的gwo算法对适应度差的算法施以罚函数,加快了寻优过程。具体的,包括以下步骤:

s301、灰狼在捕食过程中,依据适应度值分为四个等级,分别为:最优、第二优、第三优和其他灰狼,分别用α,β,θ,μ表示;

s302、灰狼在捕食时,α,β,θ负责追赶猎物,μ沿着前三个等级灰狼的路线搜索目标,在这个过程中,灰狼个体与猎物之间的距离表达式为:

q=|c*bp(t)-b(t)|

其中:q,t分别表示灰狼个体与猎物之间的距离、迭代次数;bp(t),b(t)分别表示迭代次数为t时的猎物位置、灰狼个体位置;c=2r1,r1∈[0,1],为常数;

s303、灰狼位置更新为:

b(t+1)=bp(t)-a*q

a=2ar2-a

其中:a,max,r2分别表示收敛因子、最大迭代次数、[0,1]区间常数,若|a|>1,狼群执行全局搜索;若|a|<1,狼群执行局部搜索;

s304、计算灰狼个体间的距离dij<σ,比较灰狼i灰狼j的适应度fi,fj的大小,若dij<σ,则min(fi,fj)-penalty,σ是小生境半径,penalty是罚函数;

s305、α,β,θ追赶猎物的数学模型为:

s306、根据α,β,θ的位置获取μ的最终位置信息,公式为:

bp(t+1)=(b1+b2+b3)/3。

其中bp神经网络是一种遵循误差逆向传播实施训练的典型多层前馈神经网络,其自身具备自适应、自学习、非线性、自组织能力强等显著优势,能够有效阐述信息系统的风险因素的变化性和随机性。但bp神经网络运行时会过于依赖初始化参数,收敛速度较慢、易陷入局部最优困境,且bp神经网络中含有非线性的隐式元素,各指标表面的网络梯度执行无法完全确保达到全局最小值,同时属性值和阈值均处于网络的索引函数中,使其成为了多元函数,具备较高的复杂性。

为此,针对bp神经网络独立运行时的诸多不足,在bp神经网络中引入gwo算法,利用上述改进的gwo算法收敛速度快、全局搜索能力强的优势,将bp神经网络的权重和阈值看成灰狼位置信息,利用灰狼搜索猎物的能力更新位置信息,即更新bp神经网络的权重和阈值,通过多次迭代,得到全局最优权值和阈值,使bp神经网络优化,提升bp神经网络的梯度信息,缩短误差。

s4、将所述公共指标作为所述gwo-bp神经网络的输入数据,建立信息系统风险评估模型,完成信息系统风险评估。

如说明书附图2所示,其中在gwo-bp神经网络进行评估时,先采用因子分析法,以风险指标评估体系为依据,选择公共指标去除指标间相关性;然后将获取的公共指标数据分为训练样本和测试样本训练gwo-bp模型,即构建基于fa-gwo-bp的信息系统风险评估模型,其中训练样本训练的终止条件以均方误差超过一个数值范围为标准;测试样本输入gwo-bp神经网中分析实验结果,验证其优劣。其中模型的训练为本技术领域所熟知的技术手段,在此不做具体的阐述。

则采用因子分析方法可在庞大数据集中有效降低原始风险评估指标数量,消除风险指标间的相关性,获取代表性强的公共评估指标,降低bp神经网络的输入向量维数,提升模型构建速度。并且采用改进gwo优化后的bp神经网络对风险评估指标与信息系统风险值进行拟合发现,gwo-bp神经网络可有效描述信息系统风险值变化情况,具备较高的评估准确性。

如说明书附图3所示,在另一实施中,还提供一种计算机装置,所述计算机装置1包括存储器101、处理器102以及存储在所述存储器101中并可在所述处理器102上运行的计算机程序,所示计算机程序被处理器102执行时实现上述的基于大数据分析的风险评估方法的步骤。

所称处理器102可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器也可以是任何常规的处理器等,所述处理器102是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。

所述存储器101可用于存储所述计算机程序,所述处理器102通过运行或执行存储在所述存储器101内的计算机程序,以及调用存储在存储器101内的数据,实现所述计算机装置1的各种功能。所述存储器101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

通过以上方案,能有效的实现信息系统风险评估,收敛速度较快,风险评估相对误差小。

以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1