一种模型训练及异常数据识别方法、装置、设备及介质与流程

文档序号:30965671发布日期:2022-07-30 17:13阅读:137来源:国知局
一种模型训练及异常数据识别方法、装置、设备及介质与流程

1.本发明实施例涉及数据处理技术领域,尤其涉及一种模型训练及异常数据识别方法、装置、设备及介质。


背景技术:

2.随着变压器技术的发展,油浸式变压器已经取得了广泛的应用,油浸式变压器的器身往往装在充满变压器油的油箱中,油箱用钢板焊成。在油浸式变压器的应用场景中,需要利用油色采集装置对油浸式变压器的油色谱数据进行采集,但油色采集装置发生故障时,会导致采集的油浸式变压器油色谱数据异常。
3.因此,如何对油浸式变压器油色谱数据进行异常检测,提供更高质量的油色谱数据,是目前亟待解决的问题。


技术实现要素:

4.本发明实施例提供一种模型训练及异常数据识别方法、装置、设备及介质,训练的异常数据识别模型准确性更高,进而可以实现基于该模型对油色谱数据中的异常数据进行更精准的识别。
5.第一方面,本发明实施例提供了一种模型训练方法,包括:
6.根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
7.根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
8.第二方面,本发明实施例还提供了一种基于油色谱数据的异常数据识别方法,包括:
9.获取目标油色谱数据中的至少两组目标已有特征值,其中,不同组目标已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
10.将所述目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到所述至少两组目标已有特征值中的异常数据;
11.其中,所述异常数据识别模型根据本发明任意实施例中所提供的模型训练方法训练得到。
12.第三方面,本发明实施例还提供了一种模型训练装置,包括:
13.确定模块,用于根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
14.训练模块,用于根据所述至少两组样本已有特征值、所述至少两组样本已有特征
值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
15.第四方面,本发明实施例还提供了一种基于油色谱数据的异常数据识别装置,包括:
16.获取模块,用于获取目标油色谱数据中的至少两组目标已有特征值,其中,不同组目标已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
17.得到模块,用于将所述目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到所述至少两组目标已有特征值中的异常数据;其中,所述异常数据识别模型根据本发明任意实施例中所提供的模型训练方法训练得到。
18.第五方面,本发明实施例还提供了一种电子设备,该电子设备包括:
19.一个或多个处理器;
20.存储器,用于存储一个或多个程序;
21.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例中所提供的模型训练方法,和/或基于油色谱数据的异常数据识别方法。
22.第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序。其中,该程序被处理器执行时实现如本发明任意实施例所提供的模型训练方法,和/或基于油色谱数据的异常数据识别方法。
23.本发明实施例提供的方案,根据样本油色谱数据中的至少两组样本已有特征值,确定扩充特征值,然后根据至少两组样本已有特征值、对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,从而可以得到用于识别油色谱数据中的异常数据的模型。进一步的,通过获取目标油色谱数据中的至少两组目标已有特征值,并将其输入到训练好的异常数据识别模型中,可以得到已有特征值中的异常数据,实现对异常数据的识别。通过这样的方式,训练出的异常数据识别模型准确性更高,从而可以基于该模型对油色谱数据中的异常数据进行更精准的识别,获得更高质量的油色谱数据。
附图说明
24.图1a为本发明实施例一提供的一种模型训练方法的流程图;
25.图1b为本发明实施例一提供的模型结构示意图;
26.图2为本发明实施例二提供的一种模型训练方法的流程图;
27.图3为本发明实施例三提供的一种模型训练方法的流程图;
28.图4为本发明实施例四提供的一种基于油色谱数据的异常数据识别方法的流程图;
29.图5为本发明实施例五提供的一种模型训练装置的结构框图;
30.图6为本发明实施例六提供的一种基于油色谱数据的异常数据识别装置的结构框图;
31.图7为本发明实施例七提供的一种电子设备的结构示意图。
具体实施方式
32.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
33.实施例一
34.图1a为本发明实施例一提供的一种模型训练方法的流程图,图1b为本发明实施例一提供的模型结构示意图。本实施例可适用于对异常数据识别模型进行训练的情况,其中,油色谱数据中出现异常数据是油色采集装置故障所导致的。该方法可以由模型训练装置来执行,该装置可以采用软件和/或硬件的方式来实现。如图1a所示,该方法具体包括:
35.s101、根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值。
36.其中,样本油色谱数据是指包含至少两组样本已有特征值和已有特征值对应的扩充特征值的数据,样本油色谱数据中异常数据的标签信息是已知的。样本已有特征值是指油色采集装置采集的变压器油液中溶解的至少两种气体的含量数据。扩充特征值是指根据已有特征值扩充确定出的数据特征值。一组样本已有特征值是指同时采集的变压器油液中至少两种气体的含量值,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值,其中,气体含量的单位表示为浓度(ppm,parts per million)。变压器油液中包含的气体可以是氢气(h2)、甲烷(ch4)、乙烯(c2h4)、乙炔(c2h2)、一氧化碳(co)、二氧化碳(co2)、氧气(o2)、碳氢化合物(thc,total hydrocarbons)以及乙烷(c2h6)中的至少两种。
37.可选的,可以周期性地对样本油色谱数据中的已有特征值进行采集,即每隔一段预设的时间,对变压器油液中至少两种气体进行采集,确定其含量值,也可以在相关人员指定或满足预设的条件时,触发一次对变压器油液中的气体的采集,确定其含量值。
38.可选的,确定样本油色谱数据中的至少两组样本已有特征值之后,可以基于预设的规则,对已有特征值进行计算,确定扩充特征值;也可以将已有特征值输入预先配置好的扩充值确定模型,输出每组已有特征值对应的扩充特征值,即根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值。
39.示例性的,参见表1,若样本油色谱数据中存储有三组样本已有特征值,不同组样本已有特征值包含的变压器油液气体为氢气(h2)、甲烷(ch4)、乙烯(c2h4)、乙炔(c2h2)、一氧化碳(co)、二氧化碳(co2)、氧气(o2)、碳氢化合物(thc,total hydrocarbons)以及乙烷(c2h6),则样本已有特征值可以是通过如下表格的形式展示:
40.表1、样本已有特征值
[0041][0042]
s102、根据至少两组样本已有特征值、至少两组样本已有特征值对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
[0043]
其中,异常数据是指特征数据的值出现突变的数据。异常数据标签是指预先为油色谱数据中的每条数据标定好的,表征每组特征值数据为异常数据还是正常数据的标签。
[0044]
可选的,可以将每个时刻采集的已有特征值与对应的扩充特征值作为一组特征值数据,例如,在每组样本已有特征值的后面,添加对应的扩充特征值(如,可以在表1中新增一行补充特征值的数值),形成新的样本油色谱数据。由此可以得到至少两组包含已有特征值和扩充特征值的特征值数据,进一步的,每次将预设组数(至少两组)的特征值数据作为一个整体,输入异常数据识别模型,得到预设组数中异常的特征值数据以及对应的异常概率,具体的,可以根据前几组数据,确定最后一组数据是否异常,也可以分析全部预设组数的特征值数据,从中确定出异常的特征值数据,例如,当预设组数为5组时,可以根据前4组特征值数据,确定第5组特征值数据是否异常,也可以直接利用异常数据识别模型,对5组特征值数据值的走向趋势进行分析,确定异常的特征值数据,除异常数据组之外的其他组数据为正常数据。
[0045]
可选的,根据异常数据识别模型确定异常的特征值数据之后,针对每一组特征值数据,可以得到该组数据是否异常的预测结果,根据预测结果,与样本油色谱数据关联的异常数据标签进行比较,确定预测结果与实际结果的损失,最后基于损失,调整训练异常数据识别模型的参数,即训练异常数据识别模型,训练完成的异常数据识别模型可用于识别油色谱数据中的异常数据。
[0046]
可选的,异常数据识别模型基于长短期记忆lstm(long short-term memory)网络构建。示例性的,参见图1b,lstm网络的输入层可设置为8个时序连接的网络(包含8个σ),输出层可设置为2个节点,隐藏层可设置为32个节点,丢弃参数(dropout)可设置为0.25。
[0047]
这样设置的好处是,通过利用经典的lstm神经网络模型来构建异常数据识别模型,有助于训练出识别效果更优的异常数据识别模型,从而对异常数据的识别准确率更高。
[0048]
本发明实施例提供的方案,根据样本油色谱数据中的至少两组样本已有特征值,确定扩充特征值,然后根据至少两组样本已有特征值、对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,从而可以得到用于识别油色谱数据中的异常数据的模型,通过这样的方式,训练出的异常数据识别模型准确性更高,可以便于后续基于该模型对油色谱数据中的异常数据进行更精准的识别,获得更高质量的油色谱数据。
[0049]
可选的,根据至少两组样本已有特征值、至少两组样本已有特征值对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,包括:将每组样本已有特征值与该组样本已有特征值对应的扩充特征值,作为一组数据集;按照每组样本已有特征值的采集时间,对不同组数据集进行合并,得到训练集、验证集和测试集;基于训练集、验证集和测试集,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型。
[0050]
具体的,将每个时刻采集的已有特征值与对应的扩充特征值作为一组特征值数据之后,可以将根据预设的规则,如将间隔预设时间段或相邻采集时间的预设组数(如5个)的特征值数据作为一组数据集,进一步再次基于每组数据集中最后一组数据的采集时间,对多组数据集进行排序,然后按照预设的比例关系,如训练集、验证集以及测试集为7:2:1的比例关系,对排序后的多组数据集进行合并,得到训练集、验证集和测试集。最后利用训练集和异常数据标签,调节异常数据识别模型的相关参数,训练完成后,利用验证集和异常数据标签,验证异常数据识别模型的识别效果,验证通过后,利用测试集和异常数据标签,测试异常数据识别模型的识别准确率。
[0051]
这样设置的好处是:通过将至少两组已有特征值和扩充特征值进行合并,确定至少两组数据集,进一步将数据集划分为训练集、验证集和测试集,来对异常数据识别模型进行训练,这样训练得到的异常数据识别模型对油色谱数据中的异常数据的识别准确率更高。
[0052]
实施例二
[0053]
图2为本发明实施例二提供的一种模型训练方法的流程图,本实施例在上述实施例的基础上,进一步对“根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值”进行详细的解释说明,如图2所示,该方法具体包括:
[0054]
s201、根据样本油色谱数据中每组样本已有特征值之间的相关性,确定每组样本已有特征值对应的第一扩充特征值。
[0055]
其中,已有特征值之间的相关性是指至少两种已有特征值之间的数值关系。第一扩充特征值是指同一时刻采集的气体已有特征值对应的扩充特征值。
[0056]
可选的,可以通过每一时间点采集的不同气体的含量值之间的相关性,确定样本油色谱数据的第一扩充特征值。具体的,可以根据预设的计算规则,计算每一时间点采集的不同气体的含量值之间的数值关系,从而确定第一扩充特征值;也可以采用经典的检验法,对每一时间点采集的不同气体的含量值进行相关性分析,从而确定第一扩充特征值。
[0057]
可选的,根据预设的计算规则,计算每一时间点采集的不同气体的含量值之间的数值关系,从而确定第一扩充特征值的方式有很多,具体的,可以根据每一时间点采集的其中一种气体与其他一种或多种气体含量值的比值,或每一时间点采集的其他一种或多种气
体与其中一种气体的比值,确定样本油色谱数据的第一扩充特征值,也可以根据每一时间点采集的任意两种气体含量值的差值,确定样本油色谱数据的第一扩充特征值。
[0058]
示例性的,可以将每一时间点采集的乙炔(c2h2)与乙烯(c2h4)含量值的比值,作为这一时间点该组已有特征值对应的第一扩充值,即根据公式c2h2/c2h4,确定每组已有特征值的第一扩充值;也可以将每一时间点采集的甲烷(ch4)与碳氢化合物(thc)含量值的比值,作为这一时间点该组已有特征值对应的第一扩充值,即根据公式ch4/thc,确定每组已有特征值的第一扩充值;还可以根据公式(ch4+c2h4)/thc、ch4/(h2+thc)、ch4/(ch4+c2h4+c2h2)或ch4-c2h4,确定每组已有特征值的第一扩充值,其中ch4、c2h4、thc、h2以及c2h2分别代表甲烷、乙烯、碳氢化合物、氢气以及乙炔的含量值。
[0059]
可选的,可以采用经典的非参数秩和检验法,对每一时间点采集的不同气体的含量值进行相关性分析,从而确定第一扩充特征值。相应的,根据样本油色谱数据中每组样本已有特征值之间的相关性,确定每组样本已有特征值对应的第一扩充特征值,包括:采用秩和校验法,解析样本油色谱数据中每组样本已有特征值之间的相关性,得到每组样本已有特征值对应的至少两个气体关联值;根据每组样本已有特征值对应的至少两个气体关联值,确定每组样本已有特征值对应的第一扩充特征值。
[0060]
可选的,针对样本油色谱数据中同一时间点采集的已有特征值,可以采用秩和校验法,针对每种气体,解析该气体的已有特征值,与其他气体的已有特征值之间的关联性,得到该气体的关联值,具体的,可以先确定每一气体与其他气体已有特征值的偏差,再将所有偏差求和,得到该气体的总评分,将总评分的分值作为该气体的关联值,以此类推,从而得到至少两个气体的关联值。
[0061]
可选的,得到至少两个气体的关联值之后,可以进一步从得到的各气体的关联值中选择至少一个关联值作为样本油色谱数据的第一扩充特征值,具体的,可以对至少两个气体的关联值按照评分值大小进行排序,选择评分高的一个或多个气体的关联值作为样本油色谱数据的第一扩充特征值。
[0062]
这样设置的好处是:通过采用经典的校验算法,先确定每组样本已有特征值对应的至少两个气体关联值,然后确定出第一扩充特征值,可以使得确定的样本油色谱数据可以更好的表征变压器油的状态,由此数据训练出的异常数据识别模型也更准确合理。
[0063]
s202、根据同一气体在不同组样本已有特征值中对应的含量值,确定每组样本已有特征值对应的第二扩充特征值。
[0064]
其中,第二扩充特征值是指不同时刻采集的气体已有特征值对应的扩充特征值。
[0065]
可选的,确定同一气体在各组样本已有特征值中对应的含量值之后,可以根据预设的计算规则,对同一气体在各组样本已有特征值中对应的含量值进行计算,确定对应的第二扩充特征值;也可以针对每一种气体,将该气体在各组样本已有特征值中对应的含量值输入预先训练好的补充特征确定模型,输出对应的补充特征,即确定第二补充特征。
[0066]
s203、根据至少两组样本已有特征值、至少两组样本已有特征值对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
[0067]
本发明实施例提供的方案,根据样本油色谱数据中每组样本已有特征值之间的相关性,确定第一扩充特征值,根据同一气体在不同组样本已有特征值中对应的含量值,确定
第二扩充特征值,进一步结合样本油色谱数据关联的异常数据标签,训练异常数据识别模型,给出了一种确定补充特征值的可实施方式,通过这样的方式,训练出的异常数据识别模型准确性更高,可以便于后续基于该模型对油色谱数据中的异常数据进行更精准的识别,获得更高质量的油色谱数据。
[0068]
实施例三
[0069]
图3为本发明实施例三提供的一种模型训练方法的流程图,本实施例在上述实施例的基础上,进一步对“根据同一气体在不同组样本已有特征值中对应的含量值,确定每组样本已有特征值对应的第二扩充特征值”进行详细的解释说明,如图3所示,该方法具体包括:
[0070]
s301、根据样本油色谱数据中每组样本已有特征值之间的相关性,确定每组样本已有特征值对应的第一扩充特征值。
[0071]
s302、根据目标气体在第一组样本已有特征值和第二组样本已有特征值中对应的含量值,确定目标气体的绝对增长量和/或相对增长率,并将绝对增长量和/或相对增长率作为第二组样本已有特征值对应的第二扩充特征值。
[0072]
其中,目标气体是指需要确定其含量值来确定补充特征值的气体。第一组样本已有特征值的采集时间点早于第二组样本已有特征值的采集时间点。绝对增长量是指将不同时刻采集的相同气体已有特征值做差,得到的增长量。相对增长率是指绝对增长量,与至少两组样本已有特征值采集时间差的比值。
[0073]
可选的,可以将变压器油液中包含的所有气体依次作为目标气体,也可以根据预设的规则,选择变压器油液中包含的部分气体作为目标气体,即确定目标气体。
[0074]
可选的,确定目标气体之后,针对每一个目标气体,可以确定目标气体在第一组和第二组样本已有特征值中的含量值,将确定的两个含量值做差,确定出目标气体的绝对增长量,作为第二组样本已有特征值对应的第二扩充特征值;也可以在确定目标气体的绝对增长量之后,进一步确定第一组和第二组样本已有特征值的采集时间差,将绝对增长量与采集时间差的比值,即相对增长率,作为第二组样本已有特征值对应的第二扩充特征值;还可以同时将绝对增长量和相对增长率均作为第二组样本已有特征值对应的第二扩充特征值,本实施例对此不做限制。
[0075]
可选的,确定目标气体之后,还可以确定目标气体的相对增长量作为第二组样本已有特征值对应的第二扩充特征值,具体的,若第一组和第二组样本已有特征值的采集时间分别为p时刻和q时刻,则可以先计算p时刻与q时刻采集的相同气体已有特征值的差值,再计算差值与q时刻的气体已有特征值比值,作为相对增长量,进一步,将相对增长量也作为第二组样本已有特征值(即q时刻采集的气体已有特征值)对应的第二扩充特征值。
[0076]
s303、根据至少两组样本已有特征值、至少两组样本已有特征值对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
[0077]
本发明实施例提供的方案,在确定第一扩充特征值之后,进一步根据目标气体在第一组和第二组样本已有特征值中对应的含量值,确定目标气体的绝对增长量和/或相对增长率,并将绝对增长量和/或相对增长率作为第二扩充特征值最后结合样本油色谱数据关联的异常数据标签,训练异常数据识别模型,给出了一种确定第二补充特征值的可实施
方式,通过这样的方式,训练出的异常数据识别模型准确性更高,可以便于后续基于该模型对油色谱数据中的异常数据进行更精准的识别,获得更高质量的油色谱数据。
[0078]
实施例四
[0079]
图4为本发明实施例四提供的一种基于油色谱数据的异常数据识别方法的流程图,本实施例可适用于对油色采集装置故障导致的异常数据,进行识别的情况,尤其适用于采用上述实施例训练的异常数据识别模型实现异常数据识别的情况,该方法可以由基于油色谱数据的异常数据识别装置来执行,该装置可以采用软件和/或硬件方式实现,并可集成于具有基于油色谱数据的异常数据识别功能的电子设备中。如图4所示,本实施例提供的基于油色谱数据的异常数据识别方法具体包括:
[0080]
s401、获取目标油色谱数据中的至少两组目标已有特征值。
[0081]
其中,不同组目标已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值。目标油色谱数据是指需要检测是否存在异常数据的油色谱数据。目标油色谱数据中异常数据的标签信息是未知的。目标已有特征值是指从已有特征值中确定出的需要输入模型进行预测的已有特征值。
[0082]
可选的,可以由人工选择,确定目标油色谱数据,也可以在检测到油色谱数据满足一定的预设条件时,将满足条件的油色谱数据确定为目标油色谱数据。
[0083]
可选的,确定目标油色谱数据之后,可以将目标油色谱数据所包含的全部组数的已有特征值作为目标已有特征值,也可以根据预设的规则,选择其中至少两组已有特征值作为目标已有特征值,即获取目标油色谱数据中的至少两组目标已有特征值。
[0084]
s402、将目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到至少两组目标已有特征值中的异常数据。
[0085]
其中,异常数据识别模型可通过本发明任一实施例所提供的模型训练方法训练得到。
[0086]
可选的,可以将确定的至少两组目标已有特征值一起输入到训练好的异常数据识别模型中,也可以先按照一定的划分规则,先将将确定的至少两组目标已有特征值划分为多组,然后分别输入到训练好的异常数据识别模型中,即将目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中。
[0087]
可选的,将至少两组目标已有特征值输入到异常数据识别模型之后,可以输出至少两组目标已有特征值中异常的已有特征值数据以及对应的异常概率,即得到至少两组目标已有特征值中的异常数据,完成对油色谱数据中的异常数据的识别。
[0088]
可选的,输出异常的已有特征值数据以及对应的异常概率之后,可以将异常概率值满意预设条件的特征值数据直接舍弃,保证油色谱数据的有效性。
[0089]
本发明实施例提供的方案,获取目标油色谱数据中的至少两组目标已有特征值,将目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到至少两组目标已有特征值中的异常数据,可以利用训练好的异常数据识别模型,有效地识别出油色谱数据中的异常数据,对油浸式变压器油色谱采集装置的故障情况提前做出诊断,有助于保证电力系统安全稳定地运行,提高供电可靠性。
[0090]
实施例五
[0091]
图5为本发明实施例五提供的一种模型训练装置的结构框图,本发明实施例所提
供的模型训练装置可执行本发明任一实施例所提供的模型训练方法,具备执行该方法相应的功能模块和有益效果。
[0092]
该模型训练装置可以包括:确定模块501和训练模块502。
[0093]
其中,确定模块501,用于根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
[0094]
训练模块502,用于根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
[0095]
本发明实施例提供的方案,根据样本油色谱数据中的至少两组样本已有特征值,确定扩充特征值,然后根据至少两组样本已有特征值、对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,从而可以得到用于识别油色谱数据中的异常数据的模型,通过这样的方式,训练出的异常数据识别模型准确性更高,可以便于后续基于该模型对油色谱数据中的异常数据进行更精准的识别,获得更高质量的油色谱数据。
[0096]
进一步的,确定模块501可以包括:
[0097]
第一确定单元,用于根据样本油色谱数据中每组样本已有特征值之间的相关性,确定每组样本已有特征值对应的第一扩充特征值;
[0098]
第二确定单元,用于根据同一气体在不同组样本已有特征值中对应的含量值,确定每组样本已有特征值对应的第二扩充特征值。
[0099]
进一步的,第一确定单元具体用于:
[0100]
采用秩和校验法,解析样本油色谱数据中每组样本已有特征值之间的相关性,得到每组样本已有特征值对应的至少两个气体关联值;
[0101]
根据所述每组样本已有特征值对应的至少两个气体关联值,确定每组样本已有特征值对应的第一扩充特征值
[0102]
进一步的,第二确定单元具体用于:
[0103]
根据目标气体在第一组样本已有特征值和第二组样本已有特征值中对应的含量值,确定所述目标气体的绝对增长量和/或相对增长率,并将所述绝对增长量和/或相对增长率作为所述第二组样本已有特征值对应的第二扩充特征值;
[0104]
其中,所述第一组样本已有特征值的采集时间点早于所述第二组样本已有特征值的采集时间点。
[0105]
进一步的,训练模块502具体用于:
[0106]
将每组样本已有特征值与该组样本已有特征值对应的扩充特征值,作为一组数据集;
[0107]
按照每组样本已有特征值的采集时间,对不同组数据集进行合并,得到训练集、验证集和测试集;
[0108]
基于所述训练集、验证集和测试集,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型。
[0109]
进一步的,所述异常数据识别模型基于长短期记忆lstm网络构建。
[0110]
实施例六
[0111]
图6为本发明实施例六提供的一种基于油色谱数据的异常数据识别装置的结构框图,本发明实施例所提供的基于油色谱数据的异常数据识别装置可执行本发明任一实施例所提供的基于油色谱数据的异常数据识别方法,具备执行该方法相应的功能模块和有益效果。
[0112]
该基于油色谱数据的异常数据识别装置可以包括获取模块601和得到模块602。
[0113]
获取模块601,用于获取目标油色谱数据中的至少两组目标已有特征值,其中,不同组目标已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
[0114]
得到模块602,用于将所述目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到所述至少两组目标已有特征值中的异常数据;
[0115]
其中,所述异常数据识别模型根据本发明任一实施例所提供的模型训练方法训练得到。
[0116]
本发明实施例提供的方案,获取目标油色谱数据中的至少两组目标已有特征值,将目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到至少两组目标已有特征值中的异常数据,可以利用训练好的异常数据识别模型,有效地识别出油色谱数据中的异常数据,对油浸式变压器油色谱采集装置的故障情况提前做出诊断,有助于保证电力系统安全稳定地运行,提高供电可靠性。
[0117]
实施例七
[0118]
图7为本发明实施例七提供的一种电子设备的结构示意图。图7示出了适于用来实现本发明实施例实施方式的示例性设备的框图。图7显示的设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0119]
如图7所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0120]
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0121]
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0122]
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器(高速缓存32)。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例各实施例的功能。
[0123]
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明实施例所描述的实施例中的功能和/或方法。
[0124]
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0125]
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的模型训练方法,和/或基于油色谱数据的异常数据识别方法。
[0126]
实施例八
[0127]
本发明实施例八还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行本发明实施例所提供的模型训练方法,和/或基于油色谱数据的异常数据识别方法。
[0128]
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0129]
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0130]
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0131]
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如python、java、smalltalk、c++,还包括常规的过程式程序设计语言诸如“c”语言或类似的程序设计语言。
程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0132]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明实施例进行了较为详细的说明,但是本发明实施例不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1