本发明涉及数据处理处理及人工智能,具体地说是一种基于知识图谱的设备运营成本预测方法、设备及介质。
背景技术:
1、在设备管理的任务工作中,对于老旧设备的维修或是购新是不可避免的决策问题,传统的做法是依靠财务等相关专业人员的经验来进行判断,希望通过对比旧设备维修成本与预采购设备的运营成本等相关财务数据,对维修采购决策进行推荐建议。
2、针对故障设备的维修或是采购的决策问题,目前的困境在于对预采购设备的运营成本难以实现精准预测。
3、使用机器学习算法来对预采购设备的运营成本进行智能预测,但重点在于难以对设备的特征进行有效完整的表示,而使用独热编码等方式进行向量表示容易使得样本特征过于稀疏。
4、综上所示,对于预采购设备的运营成本难以计算,同时依靠人员估计的方式准确性低且人力成本高是目前亟待解决的技术问题。
技术实现思路
1、本发明的技术任务是提供一种基于知识图谱的设备运营成本预测方法、设备及介质,来解决预采购设备的运营成本依靠人员估算的方式准确性低且人力成本高的问题。
2、本发明的技术任务是按以下方式实现的,一种基于知识图谱的设备运营成本预测方法,该方法具体如下:
3、s1、获取预采购设备信息,并以三元组形式表达;
4、s2、查询知识图谱,判断预采购设备是否在原知识图谱中且存在运营成本记录:
5、①若是,则将查到的设备运营成本作为预采购设备的运营成本;
6、②若否,则执行步骤s3;
7、s3、使用知识图谱的节点和知识表示向量推理出预采购设备的知识表示向量;
8、s4、将预采购设备的知识表示向量输入到训练好的kge-stacking模型,获取预采购设备运营成本。
9、作为优选,知识表示向量的获取具体如下:
10、收集整理设备资产知识数据;
11、构建资产设备管理领域知识图谱g,将资产设备知识数据按照三元组的形式进行保存整理,制作数据集;
12、使用transh、transr、mlp、complex和rotate五种知识图谱嵌入模型,对所构建的资产管理知识图谱g的三元组进行训练,得到transh、transr、mlp、complex和rotate五种知识图谱嵌入模型下的知识图谱中各节点、关系的知识表示向量。
13、作为优选,kge-stacking模型的训练具体如下:
14、构建知识图谱:采集设备的知识数据,并根据采集的设备的知识数据搭建节点之间的关联关系;
15、获取知识向量表示:使用transh、transr、mlp、complex、rotate五种不同的知识图谱嵌入模型对构建的知识图谱进行知识向量表示;
16、获取初始的实体与关系的知识向量表示:对用于训练的三元组数据进行整理并进行负采样,再获取transh、transr、mlp、complex、rotate五种不同的知识图谱嵌入模型各自模型初始化的实体与关系的向量,并根据transh、transr、mlp、complex、rotate五种不同的知识图谱嵌入模型各自模型的得分函数定义各自模型的损失函数计算loss,根据损失使用优化算法对各种模型的实体和关系的知识向量表示。
17、更优地,transh知识图谱嵌入模型针对每个三元组的得分函数具体如下:
18、在知识图谱的三元组(h,r,t)中,将头实体h和尾实体t的知识表示向量沿着法线进行投影,投影到与关系r对应的超平面上,记为h⊥和t⊥,计算表示为当知识图谱的三元组成立时,transh知识图谱嵌入模型认为h⊥+r≈t⊥,因此,transh知识图谱嵌入模型的得分函数为其中,h指的是头实体;r指的是关系;t指的是尾实体;
19、transr知识图谱嵌入模型针对每个三元组的得分函数具体如下:
20、针对知识图谱的三元组(h,r,t),transr知识图谱嵌入模型对每一个关系r设置一个投影矩阵投影矩阵用于将实体从实体空间投影到关系空间根据投影矩阵将实体投影向量计算定义为h⊥=mrh,t⊥=mrt,在知识图谱的三元组成立时,transh知识图谱嵌入模型认为h⊥+r≈t⊥,transr知识图谱嵌入模型的得分函数定义为:
21、更优地,mlp知识图谱嵌入模型针对每个三元组的得分函数具体如下:
22、在知识图谱中,每个关系和实体用单个向量表示,使用多层感知机捕获表达实体和关系之间的交互关系;mlp知识图谱嵌入模型针对每个三元组的得分函数为fr(h,t)=wτtanh(m1h+m2r+m3t);其中,wt、m1、m2、m3均为mlp知识图谱嵌入模型参数;
23、complex知识图谱嵌入模型针对每个三元组的得分函数具体如下:
24、complex知识图谱嵌入模型通过引入复数的向量空间,使用复数向量的形式对知识图谱中的实体和关系进行表示,评分函数定义为其中,是t的共轭;re(·)表示取复数值的实部;
25、rotate知识图谱嵌入模型针对每个三元组的得分函数具体如下:
26、rotate知识图谱嵌入模型将实体和关系映射到复数向量空间,关系被定位头实体向尾实体的旋转,在一个三元组(h,r,t)中,rotate知识图谱嵌入模型认为其中,实在复数空间的向量表示,其中模长|ri|=1;在复数空间的各个维度中,rotate知识图谱嵌入模型认为ti=hiri,其中rotate知识图谱嵌入模型针对每个三元组的得分函数为
27、更优地,transh、transr、mlp、complex、rotate五种不同的知识图谱嵌入模型均使用adam算法,对知识图谱中的节点、关系知识表示向量迭代求解;
28、对transh、transr、mlp三种知识图谱嵌入模型的损失函数公式如下:
29、
30、其中,f表示得分函数;x+表示正例样本;x-表示经负采样得到的负例样本,在梯度下降求解时计算对应的loss;
31、complex知识图谱嵌入模型的损失函数公式如下:
32、l=∑x∈xlog(1+exp(-l(x)·f(x)));
33、其中,l表示标注函数,给定三元组,输出标签真值{+1,-1},正例输出+1,负例输出-1;
34、rotate知识图谱嵌入模型的损失函数公式如下:
35、
36、其中,γ为固定的margin参数;σ是sigmoid函数;(h′i,r,t′i)是第i个负样本。
37、更优地,kge-stacking模型训练具体如下:
38、使用lightgbm、rf、ann、adaboost、gpr五种回归模型作为第一层的基学习器;在每次训练基学习器的过程中,使用的数据集为通过transh、transr、mlp、complex、rotate五种不同的知识图谱嵌入模型设备节点向量数据;当使用transh知识图谱嵌入模型得到的设备节点向量为训练数据集时,使用n折交叉验证对第一层基学习模型进行训练,将通过知识图谱嵌入得到设备节点知识表示向量样本数据平均分为n折,其中令n-1折样本数据为训练集,其余样本数据为验证集,训练第一层设备运营成本预测模型的基学习器;将基学习器对验证集的预测值进行记录,依次更换验证集重复进行训练和预测,得到对全部样本的第一层模型的预测值;将transr、mlp、complex、rotate四种知识图谱嵌入模型得到的设备节点向量,依次进行训练与预测,将对应不同知识图谱嵌入模型的第一层基学习器的预测值进行融合,作为输入训练第二层的学习器;
39、使用支持向量回归模型svr作为第二层的学习器:基于lightgbm的预测模型,将transh、transr、mlp、complex、rotate五种知识图谱嵌入模型的设备节点向量数据,根据第一层基学习器得到的预测值进行合并,得到第二层的学习器的训练数据;同样地,使用n折交叉验证的方式进行训练,对第二层的学习器的训练数据样本平均分为n折,其中n-1折训练数据样本训练svr回归模型,其余训练数据样本为验证集;将训练的svr回归模型对验证集的预测值进行记录,依次更换验证集重复进行训练并预测,得到svr回归模型对全部样本的预测值;
40、分别基于lightgbm、rf、ann、adaboost、gpr五种回归模型,得到的预测数据对第二层元学习器svr回归模型进行训练并预测;并将lightgbm、rf、ann、adaboost、gpr五种回归模型对应的第二层元学习器预测值进行合并融合作为第三层模型的训练数据,训练第三次的超元学习器;
41、最终输出设备运营成本的第三层超元学习器使用lr回归模型(岭回归模型);
42、其中,在训练第一层的lightgbm、rf、ann、adaboost、gpr五个基学习器时,通过complex知识图谱嵌入模型和rotate知识图谱嵌入模型得到的节点向量是复数空间向量,将得到的节点向量的实部和虚部进行合并融合后训练第一层的lightgbm、rf、ann、adaboost、gpr五个的基学习器。
43、作为优选,预采购设备运营成本预测具体如下:
44、整理关于预采购设备的知识信息,根据构建的知识图谱,将预采购设备与其余节点的关联关系使用三元组的形式进行表示;
45、判断预采购的设备是否存在于已经构建的知识图谱数据中,同时判断已存在于知识图谱的预采购设备的运营成本数据是否存在:
46、若存在,则使用在知识图谱中的对应预采购设备的运营成本数据作为预采购设备的运营成本,为后续决策提供依据;
47、若不存在,则将预采购设备节点使用transh、transr、mlp、complex、rotate五种知识图谱嵌入模型进行知识表示:将预采购的设备使用三元组进行表示,形式为(h,r,t);其中,h为头实体是预采购的设备,是原始的知识图谱中不存在的节点;r为关联关系;t为尾实体节点,两者在原始的知识图谱中都存在;
48、根据预采购设备的真实三元组数据进行数据负采样,使用预采购设备的正例和负例三元组数据求解预采购设备的知识表示向量;
49、求解h头实体的向量表示:首先将h头实体的知识表示向量根据不同的知识图谱嵌入模型的参数进行初始化,得到预采购设备节点的初始知识表示向量,对于r关系和t尾实体来说,由于存在于原始的知识图谱中,对应知识图谱嵌入模型的关系和尾实体的知识表示向量能够查询到;然后将h头实体的初始化向量进行表达后根据不同知识图谱嵌入模型的参数进行转换,并按照对应的知识图谱嵌入模型的得分函数和损失函数计算loss损失:
50、若loss的值大于等于阈值α且未达到最大迭代次数,则使用各个知识图谱嵌入模型选择使用的adam优化算法对h头实体的知识表示向量进行更新;
51、若loss的值小于阈值α或者达到最大的迭代次数,则将h头实体即预采购设备的知识向量表示进行输出;
52、对transh、transr、mlp、complex、rotate五种知识图谱嵌入模型重复进行求解,得到预采购设备的五种不同的知识表示向量;
53、将预采购设备的五种不同的知识表示向量输入到对应训练好的lightgbm、rf、ann、adaboost、gpr五种第一层的基学习器中,得到5组kge-stacking模型第二层元学习器的输入数据,分别将5组kge-stacking模型第二层元学习器的输入数据输入到对应的lightgbm、rf、ann、adaboost、gpr五个训练好的第二层元学习svr模型中,得到一组第三层超元学习器的输入数据,输入到第三层的超元学习器中,输出得到预采购设备的运营成本。
54、一种电子设备,其特征在于,包括:存储器和至少一个处理器;
55、其中,所述存储器上存储有计算机程序;
56、所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如上述的基于知识图谱的设备运营成本预测方法。
57、一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如上述的基于知识图谱的设备运营成本预测方法。
58、本发明的基于知识图谱的设备运营成本预测方法、设备及介质具有以下优点:
59、(一)本发明使用transh、transr、mlp、complex、rotate五种不同知识图谱嵌入模型得到不同知识表示向量,训练基学习器,kge-stacking模型从数据层面上集成不同知识图谱嵌入模型的优点,大大提高了预采购设备成本预测的精度;
60、(二)本发明通过使用知识图谱嵌入技术将知识图谱向量表示设备节点进行表示,分别针对不同的编码方式构建机器学习模型,然后将不同的嵌入模型生成的向量数据根据stacking集成模型的思想进行集成,实现对预采购设备运营成本的预测,降低了人工成本;
61、(三)本发明使用知识图谱嵌入模型将设备节点进行向量表达,可以充分的表示节点的信息,提高了预采购设备成本预测的精度;
62、(四)本发明通过stacking集成的方法,集成不同知识图谱嵌入模型的知识表示向量数据,提高了预采购设备成本预测的精度;
63、(五)本发明在有业务预测业务需求时,将新设备的节点及其与知识图谱g中其他节点的关系进行整理成三元组的形式,使用已经训练好的不同知识图谱嵌入模型的关系与节点的向量,对新设备的节点表示向量节点推理求解,新设备的节点知识向量表示输入训练好的kge-stacking机器学习模型,预测得到新设备的年运营成本,实现预采购设备的精准预测。