基于企业资产管理系统和GA-BP的企业设备寿命预测方法与流程

文档序号:17995705发布日期:2019-06-22 01:11阅读:129来源:国知局
基于企业资产管理系统和GA-BP的企业设备寿命预测方法与流程

本发明是一种基于企业资产管理系统和ga-bp的企业设备寿命预测方法,涉及企业资产管理技术领域。



背景技术:

企业资产是企业生产经营过程中的重要生产资料,是集团企业的核心竞争力,是企业生产力存在和发展的基础。一般来讲,企业资产分为有形资产和无形资产两大类,其中无形资产包括专利权,非专利技术,商标权,著作权,特许权,土地使用权等,有形资产包括生产设备、办公设备、土地房屋、交通工具等。企业资产管理系统建立在全面生产管理、标杆管理等先进的管理理念的基础之上,通过对有形资产进行信息化和标签化管理,通过工作单和工作流审批的方式对资产实现全生命周期的管理的系统。企业资产管理系统资产综合管控的功能模块包括一般包括预算管理,设备选型,验收建账,资产调拨,资产闲置,资产追加,资产启用,资产封存,资产报废,资产处置,资产出售,资产台账等,系统通过工作流审批的方式,以审批单的形式完成对整个资产全生命周期的管理和监控。企业资产管理系统的在企业中应用为企业资产积累了大量的信息,为进行后续的数据挖掘做了大量的数据积累。企业设备是企业资产的重要组成部分,企业设备寿命的预测是根据企业设备在资产价值管理系统的大量历史数据中选取可能的影响因素,通过构建预测模型来对企业现有设备寿命进行的预测,这会为企业的备品备件数量,维修检修计划,资产折旧计算等方面提供参考的依据,从而降低企业的成本,优化企业的管理方式,这有很大的研究价值和意义。近年来,机器学习在各领域得到了广泛的应用,机器学习算法通过从大量数据中进行学习和分析,来对新的数据做预测或者得出结论。神经网络作为机器学习中重要的一种算法模型,具有极强的非线性逼近、大规模并行处理、自训练学习、容错能力以及外部环境的适应能力,所以利用人工神经网络进行预测已经成为许多项目首选的方法。bp神经网络作为一种常见的前馈神经网络,因为结构简单易于实现,工作状态稳定,并且有很强的学习和扩展能力,被广泛应用。但bp神经网络也存在容易陷入局部最优的缺点,解决这个问题的思路集中在两个方面,一个是bp网络的自身调整,一个是bp网络与其他算法结合,常见的有遗传算法,粒子群算法等,其中遗传算法在全局优化方面很有优势,将遗传算法优化bp的初始权值和阈值的ga-bp成为研究的热点。



技术实现要素:

本发明提出了一种基于企业资产管理系统和ga-bp预测设备寿命的方法,通过对企业资产管理系统的数据和业务分析,从资产管理系统中提取出影响设备寿命的因素,并从数据库抽取相关数据构建ga-bp预测模型,对企业设备寿命进行预测。

本发明采用的技术方案为基于企业资产管理系统和ga-bp的企业设备寿命预测方法,该预测方法基于预测模型进行实现,预测模型的构建过程为如下:

1)分析某企业资产管理系统业务流程和数据流向;

2)提取抽象出影响设备寿命的因素;

3)从数据库抽取数据构建数据集;

4)构建bp神经网络模型用于预测;

5)用遗传算法优化bp模型,构建ga-bp预测模型;

6)根据实验结果优化ga-bp模型;

实现该方法的步骤如下:

步骤1,分析某企业资产管理系统业务流程和数据流向。一般来讲,企业设备全生命周期包括前期管理、中期管理和后期管理。前期管理包括预算编制、采购计划、资产申请、审核、采购、验收等。中期管理包含资产入库、库存管理、使用、变更、借出归还、调拨。后期管理包含设备报废、处置等。某企业资产管理系统资产综合管控的功能模块包括预算管理,设备选型,验收建账,资产调拨,资产闲置,资产追加,资产启用,资产封存,资产报废,资产处置,资产出售,资产台账等,系统通过工作流审批的方式,以审批单的形式完成对整个资产全生命周期的管理和监控。系统业务的流程是通过工单审批的方式进行的,业务的进行在不同的部门不同的角色审批过程中进行,工单的审批结果会在系统中留存,以历史单据的形式存在于数据库中。

步骤2,提取抽象出影响设备寿命的因素。建立设备寿命预测模型,首先要对于设备的寿命给出定义和计算方法,根据系统数据和实际生活经验,定义设备寿命的起点为设备的出厂日期,终点为报废日期。影响设备寿命的因素的选取主要从以下三个方面选取:

(1)设备自身的因素:包括设备的厂商,价格,类别,型号等因素

(2)设备的工作环境:设备工作所属部门,所属车间,功能位置等因素

(3)设备生命周期过程记录:设备闲置时间,设备封存时间,设备调拨过程等

步骤3,从数据库抽取数据构建数据集。根据数据存储和流向分析和影响因素确定,数据提取主要在台账表,设备启用、闲置、封存、调拨、报废表通过设备编码连接提取相关数据项,某资产价值管理系统采用b/s架构,数据库采用关系型数据库oracle,模型数据来自某资产管理系统数据库部分测试数据,采用sql多表联合查询的方式进行数据提取。对于数据提取后的数据缺失问题,采用直接丢弃或者根据相似数据项补齐的处理方式,尽量使数据趋于真实。最后将提取出的数据进行整合和计算,转换成满足特征项的数据,共计抽取整理可用数据5000条。

步骤4,构建bp神经网络模型用于预测。

(1)初步确定网络结构

由数据集的结构来看,预测模型的建立是一个13个输入,1个输出的回归预测问题,所以bp神经网络的输入层为13,输出层为1。从理论上来讲,隐藏层的节点数和层数越多,模型的预测效果越好,但与此同时增加的是需要计算的参数个数成倍增长,必然的会导致模型训练时间增长。根据kolmogrov定理,一个三层bp网络就可以解决一般问题了,因为它可以解决任意的m维到n维的映射,同时根据预实验,多层隐藏层神经网络与单层相比,并没有对预测结果的准确度并有多大提升,单层的神经网络的最优准确率已经达到了很高的水平,所以模型选用单层隐藏层的神经网络结构。对于隐藏层的节点数目选取,根据经验公式(1)(2)

其中h为所要选取的隐含层神经节点数,m为输入层神经节点数,n为输出层神经节点数,α为[1,10]之间的常数。根据上述经验公式初步确定隐含层节点数在[5,9]之间选取,然后根据实验结果和节点最少原则确定最佳网络结构。

(2)激活函数和初始学习率选择

根据研究,目前relu是应用最广泛的激活函数,并根据relu有了很多改进的relu激活函数,像leaky_relu、relu6等,所以选取relu为实验的初始激活函数,由于relu对于学习率比较敏感,所以设置学习率从比较小的0.01开始。

(3)初始权重阈值设定

大量实验数据表明,bp网络模型的初始权值选定很大程度上影响网络模型的训练速度和收敛性,由于神经网络本身就有容易陷入局部最优化的缺点,所以初始权重和阈值的设定,会导致因为初始权重的数值在训练过程中陷入局部最优化。根据研究,由he等人所写的论文推导了relu神经元的权重初始化问题,得出的结论是神经元的方差需要是2.0/n(n为神经网络的输入数量),即权重初始化选取为在的正态分布范围取随机值,这是目前在神经网络中使用相关神经网络的建议。

(4)确定网络衡量标准

模型采用2个衡量标准,一个是用于bp算法的loss函数(用于训练集,训练集为数据的80%),一个是用于衡量预测准确度的accuracy函数(用于测试集,测试集为数据的20%),loss越小表示训练集预测的均方差越小,神经网络的越趋向于整体最优,accuracy越小表示模型预测率越高。

(5)数据归一化处理

数据归一化问题是数据挖掘中特征向量表达时的重要问题,当不同的特征成列在一起的时候,由于特征本身表达方式的原因而导致在绝对数值上的小数据被大数据“吃掉”的情况,这个时候我们需要做的就是对抽取出来的数据进行归一化处理,以保证每个特征被平等对待。根据数据特征,采用0-1化的数据归一化方法,即通过遍历某项每一个数据,将最大值和最小值记录下来,并通过max-min作为基数(即min=0,max=1)进行数据的归一化处理,归一化公式如下:

x'=(x-x_min)/(x_max-x_min)(5)

x'为归一化后的值,x为原始值,x_min为原始值最小值,x_max为最大值。根据accuracy计算公式,在归一化的时候要把x_min设置比实际值小,避免除0出现计算错误。

(6)实验确定最终网络结构

根据初步确定的隐藏层节点个数,进行比较试验,试验结果如下,其中n为隐藏层节点数目,b为多次试验得到最佳结果的学习率,设置最大迭代次数为20000,目标正确率accuracy<=0.03

步骤5,用遗传算法优化bp模型,构建ga-bp预测模型。

(1)遗传算法优化bp神经网络的思路

使用遗传算法优化bp主要是对bp神经网络初始化的权值和阈值的优化,由于bp神经网络权值阈值的随机初始化和bp神经网络自身容易陷入局部最优化的特点,使用ga的全局最优化特点来给出bp的全局最优的初始化权值和阈值,从而加快神经网络训练模型的效率。

(2)染色体编码

根据bp神经网络的初始权值和阈值的取值范围n(0,2.0/n)和神经网络权值和阈值是浮点数的特点,对染色体采用浮点数编码的方式。结合神经网络的结构特点,可得染色体的编码长度为121

length=in_size*hide_size+hide_size*out_size+hide_size+out_size(6)

其中length为编码长度,in_size为神经网络的输入层节点数,hide_size为神经网络的隐藏层节点数,out_size为神经网络的输出层节点数

(3)个体适应度计算函数

个体适应度是衡量一个个体对于优化目标的接近程度,是遗传算法进行目标优化的重要衡量标准。遗传算法的优化目标和bp的优化目标是趋同的,即可以采用loss函数指标作为ga的优化目标,根据一般遗传算法适应度函数设置的函数公式,设置适应度计算函数为:

(4)遗传算子

选择。选择的目的,是为了在群体中挑选出优质的个体,将它复制繁衍到下一代。选择是以适应度为依据进行的筛选过程,将适应度低的个体从种群中淘汰掉,从而使优质个体有更多繁衍的机会。目前,常见的选择算子有轮盘赌选择,最佳保留选择,随机联赛选择等,本次模型选择轮盘赌的选择算子和最佳保留选择结合的方式,即在最优个体直接进入下一代的基础上进行轮盘赌。设种群规模为n,个体适应度为fi,则某个体被选择的概率为:

交叉。交叉算子是遗传算法产生新个体的重要渠道,是将父代的个体的部分结构重组替换形成新的个体。目前常见的交叉算子有单点交叉,多点交叉,随机交叉等,本次模型染色体选用的是浮点数编码的方式,所以交叉方式采用算术交叉方法产生新的个体。随机选择2个个体ki,kj,随机选择染色体参数位置h,记该位置参数为th,则产生的2个新个体km,kn在保留原来ki,kj非h位置的参数基础上,对h位置的参数更新算法如下:

变异。遗传算法中的变异运算,是指将个体染色体编码串中的某些基因座上的基因值用该基因座上的其它等位基因来替换,从而形成新的个体.目前常见的遗传算子有基本位变异,均匀变异,高斯近似变异等。由于bp神经网络的初始化权值在符合高斯分布的范围随机取值,变异采用高斯近似变异的方式,对某个个体随机参数位置进行在满足范围随机取值。

(5)遗传算法参数选择

种群初始化规模。种群初始化规模是遗传算法效果好坏的重要因素之一,如果种群规模小,则所包含的信息较小,则可能会造成遗传算法搜索空间中解的分布范围受到限制,使算法有可能过早的收敛于局部最优解。如果种群规模大,则会使遗传算法计算量变大,迭代速度过慢。一般来说,种群的初始化大小在20-100之间,实验选取初始化种群大小为50

交叉概率(pc),变异概率(pm)。模型采用strinvinas等提出的自适应遗传算法(aga),pm和pc能够根据适应度自动变化,当种群各个体适应度趋于一致或者局部最优的时候,使pm和pc增加,当群体适应度比较分散时,使pm和pc减少。同时,对于适应度高于群体平均适应度的个体,对应于较低的pm和pc,使该个体得以保护进入下一代,而低于群体平均适应度的个体,对应于较高的pm和pc,使该个体被淘汰掉。

pm和pc计算公式如下:

其中fmax为群体中最大适应值,favg为群体平均适应值,f为要交叉的2个个体中较大的适应度值,f′为要变异的个体适应度值,k1,k2,k3,k4为常数。

步骤6,根据实验结果优化ga-bp模型

(1)适应度函数改进

根据实验结果数据和理论分析,对ga-bp进行改进,由于公式7的cmax取固定值,虽然使在遗传算法初始阶段丢弃掉大量loss值大于cmax的个体,快速淘汰掉差距过大的个体。但随着遗传代数的迭代,loss值不断减小,cmax-f(x)会不断增大,导致不同个体的适应度值差距越来越小,在随机的轮盘赌过程中,由于适应度值越来越接近,导致优质个体和劣质个体进入下一代的概率越来越接近,适应度失去筛选的意义,对适应度函数改进如下:

其中(f(x)=loss,μ为小于1的小浮点数)

其中,n为遗传算法迭代代数,k为小于n的整数,当n≤k时,即遗传迭代的初期,沿用原来的适应度函数;当n>k时选用(μ+1)f(x)max-f(x)作为适应度函数,其中μ为小于1的小浮点数,由于此时遗传算法已经迭代了多代,loss变小,不同loss差值变小,采用此适应度函数可以拉开优质个体和劣质个体的差距,有利于促进优质个体的保留和劣质个体的淘汰。

(2)交叉算子改进

由于染色体编码长度为121,单点交叉的效果对于高长度编码来说,后代个体的变化不大,所以对模型采取多点随机交叉方式进行交叉运算,交叉率设置为染色体编码长度的40%。根据浮点数编码算术交叉算子的特点,产生的新的个体和原来的个体变更基因部分彻底改变,不利于优秀个体局部参数的保持,再此基础上对交叉算子进行改进:

其中p1,p2分别为取2个公式进行交叉算子运算的概率

附图说明

图1某企业资产管理系统资产管控模块工作流程图。

图2某企业资产管理系统数据存储和流向图

图3bp-不同隐藏层节点实验结果图。

图4遗传算法改进前后loss-step图。

具体实施方式

以下结合附图和实施方式对本发明进行详细说明。

step1:分析某企业资产管理系统业务流程和数据流向

图1(某企业资产管理系统资产管控模块工作流程图),图2(某企业资产管理系统数据存储和流向图)是对资产管理系统的业务和数据流向分析结果

step2:提取抽象出影响设备寿命的因素

表1(预测模型提取特征表)是根据对资产管理系统的业务和数据流向分析结果为基础,在数据库抽象出影响设备寿命的13个因素。

step3:从数据库抽取数据构建数据集

根据图2(某企业资产管理系统数据存储和流向图)和表1(预测模型提取特征表)影响因素确定,数据提取主要在台账表,设备启用、闲置、封存、调拨、报废表通过设备编码连接提取相关数据项,某资产价值管理系统采用b/s架构,数据库采用关系型数据库oracle,模型数据来自某资产管理系统数据库部分测试数据,采用sql多表联合查询的方式进行数据提取。对于数据提取后的数据缺失问题,采用直接丢弃或者根据相似数据项补齐的处理方式,尽量使数据趋于真实。最后将提取出的数据进行整合和计算,转换成满足特征项的数据,共计抽取整理可用数据5000条。

step4:构建bp神经网络模型用于预测

初步分析研究确定bp网络结构、激活函数和初始学习率、初始权重阈值、评价指标。对数据集进行归一化处理后进行实验,根据实验确定最终网络结构。表2(bp-不同隐藏层节点实验结果部分数据表),

表3(bp-不同隐藏节点最后一次迭代结果数据表),图3(bp-不同隐藏层节点实验结果图)是实验的结果:当n=8,b=0.065时,多次训练得到做好的结果,loss值一直递减,accuracy值在迭代了13880次之后获得了3%以内的预测平均误差,随着隐藏层节点的增加并没有比n=8取得更好的结果,所以最后模型确定为输入层13个节点,隐藏层8个节点,输出层为1的神经网络模型。

表4(n=8,b=0.065的神经网络多次重复实验结果表)显示相同的网络模型在不同时间训练得到的结果并不是都能取得好的结果,实验2在迭代20000次后取得1.8%的平均误差率,而实验3在迭代了20000次之后有5.8%的误差率;从迭代速度上看,实验4在迭代了6000次就达到了2.3%的误差率,实验5迭代到2.35%的误差率用了18000次。根据神经网络极易陷入局部最小的原理和实验结果分析,网络权值的初始化大小直接影响了神经网络的训练效率,找到合适的优化方法优化网络的初始化权值能使模型训练效率提升。实际生产环境中,系统的数据量和复杂程度必然远远大于实验数据,所以有效提高模型的训练效率对于实际应用有十分重要的意义。

step5:用遗传算法优化bp模型,构建ga-bp预测模型

根据数据特征研究构建ga的参数,研究确定染色体编码方式、适应度函数、遗传算子(选择,交叉,变异)、遗传算法参数(初始种群规模,交叉概率,变异概率),最后进行实验。表5(ga-bp实验结果表)是实验结果表,遗传算法进化的权值和阈值用于bp神经网络的结果在准确度accuracy上看,(对比表4)准确度并不比bp好,但是遗传算法进化后的bp权值用于bp训练后的结果更趋于稳定,多次ga-bp过程实验20000次训练accuracy趋于3%的误差率,并且,单次ga进化后的权值和阈值在多次bp实验时,loss和accuary随着迭代次数轨迹相同,提升了bp的稳定性。

step6:根据实验结果优化ga-bp模型

根据上一步实验结果,对ga-bp模型进行适应度函数和交叉算子的优化,优化结果如表6(改进的ga-bp结果表)。改进的遗传算法进化的权值有效的提高了bp的训练效率和平均精确度,多组实验数据accuracy比原来(表4)有提高,最好的准确率达到了1.4%,且以3%精确度衡量,使迭代次数控制在10000次左右。同时,同一次遗传进化出的参数在bp重复训练过程中对应的loss和accuracy曲线和数值一致,提高了相同参数下bp训练的稳定度。改进后的遗传算法在进化上更彻底,在全局优化的意义上效果更加明显,也更适合该bp模型的全局优化。

表1预测模型提取特征表

表2bp-不同隐藏层节点实验结果部分数据表

表3bp-不同隐藏节点最后一次迭代结果数据表

表4n=8,b=0.065的神经网络多次重复实验结果表

表5ga-bp实验结果表

表6改进的ga-bp结果表

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1