本技术涉及人工智能,尤其涉及一种数据标注方法、装置、电子设备及存储介质。
背景技术:
1、随着人工智能与数据驱动方法的兴起,使得针对设备(例如暖通设备)进行基于数据驱动的故障诊断、故障预测及节能控制等方案得到广泛应用,给用户使用设备带来很多方便,降低设备使用成本。其中,基于数据驱动的方法大都属于监督学习方式,因此需要大数据量的带标签的数据。
2、相关技术中,对于数据,例如暖通设备数据,通常是人工进行标注,如此可以得到大数据量的带标签的数据(也可以称之为携带样本标签的训练样本)。但这种人工标注的方式,效率较低,需要花费较多的时间,增加了对设备进行基于数据驱动的故障诊断、故障预测及节能控制等方案的实施成本。
技术实现思路
1、为了解决上述由于人工标注的方式,效率较低,需要花费较多的时间,增加了对设备进行基于数据驱动的故障诊断、故障预测及节能控制等方案的实施成本的技术问题,本技术提供了一种数据标注方法、装置、电子设备及存储介质。具体技术方案如下:
2、第一方面,本技术提供了一种数据标注方法,所述方法包括:
3、获取设备数据,其中,所述设备数据包括设备的待标注数据以及故障类型;
4、获取预设故障类型集合,其中,所述预设故障类型集合中包括多个标准故障类型;
5、对比所述故障类型与所述预设故障类型集合中的多个所述标准故障类型;
6、根据所述故障类型与所述预设故障类型集合中的多个所述标准故障类型的对比结果,对所述待标注数据进行标注。
7、在一个可选的实施方式中,所述根据所述故障类型与所述预设故障类型集合中的多个所述标准故障类型的对比结果,对所述待标注数据进行标注,包括:
8、在所述故障类型与所述预设故障类型集合中的目标标准故障类型一致的情况下,确定所述故障类型为已知故障类型;
9、其中,所述目标标准故障类型为所述预设故障类型集合中的任一所述标准故障类型;
10、标注所述故障类型为样本标签,标注所述待标注数据为样本,并存储所述故障类型与所述待标注数据。
11、在一个可选的实施方式中,所述根据所述故障类型与所述预设故障类型集合中的多个所述标准故障类型的对比结果,对所述待标注数据进行标注,包括:
12、在所述故障类型与所述预设故障类型集合中的多个所述标准故障类型均不一致的情况下,从所述预设故障类型集合的多个所述标准故障类型中,确定与所述故障类型匹配的所述标准故障类型;
13、标注与所述故障类型匹配的所述标准故障类型为样本标签,标注所述待标注数据为样本;
14、存储与所述故障类型匹配的所述标准故障类型以及所述待标注数据。
15、在一个可选的实施方式中,所述从所述预设故障类型集合的多个所述标准故障类型中,确定与所述故障类型匹配的所述标准故障类型,包括:
16、针对所述预设故障类型集合中的任一所述标准故障类型,获取所述标准故障类型对应的已标注数据;
17、确定所述标准故障类型对应的所述已标注数据,与所述故障类型对应的所述待标注数据之间的距离;
18、对所述距离进行排序,根据排序结果,确定与所述故障类型匹配的所述标准故障类型。
19、在一个可选的实施方式中,所述根据排序结果,确定与所述故障类型匹配的所述标准故障类型,包括:
20、选取前c*n个所述距离,其中,所述c为正整数,所述n为所述标准故障类型的数量;
21、确定前c*n个所述距离各自对应的所述标准故障类型;
22、从前c*n个所述距离对应的所述标准故障类型中,确定与所述故障类型匹配的所述标准故障类型。
23、在一个可选的实施方式中,所述从前c*n个所述距离对应的所述标准故障类型中,确定与所述故障类型匹配的所述标准故障类型,包括:
24、从前c*n个所述距离对应的所述标准故障类型中,筛选不同的所述标准故障类型;
25、从前c*n个所述距离对应的所述标准故障类型中,统计不同的所述标准故障类型各自对应的出现次数;
26、根据不同的所述标准故障类型各自对应的出现次数,确定不同的所述标准故障类型各自的占比;
27、将占比最大的所述标准故障类型确定为与所述故障类型匹配的所述标准故障类型。
28、在一个可选的实施方式中,所述将占比最大的所述标准故障类型确定为与所述故障类型匹配的所述标准故障类型,包括:
29、判断占比最大的所述标准故障类型的占比是否超过预设占比阈值;
30、在占比最大的所述标准故障类型的占比超过预设占比阈值的情况下,将占比最大的所述标准故障类型确定为与所述故障类型匹配的所述标准故障类型。
31、在一个可选的实施方式中,所述方法还包括:
32、在占比最大的所述标准故障类型的占比未超过预设占比阈值的情况下,确定所述故障类型为未知故障类型;
33、将所述故障类型作为标准故障类型添加至所述预设故障类型集合中;
34、标注所述故障类型为样本标签,标注所述待标注数据为样本,并存储所述故障类型与所述待标注数据。
35、在一个可选的实施方式中,所述待标注数据包括设备型号、运行工况、状态参数;
36、所述存储所述故障类型与所述待标注数据,包括:
37、按照以下存储方式存储所述故障类型、所述设备型号、所述运行工况以及状态参数:
38、所述运行工况关联所述设备型号,所述故障类型关联所述运行工况,所述状态参数关联所述故障类型。
39、第二方面,本技术提供了一种数据标注装置,所述装置包括:
40、数据获取模块,用于获取设备数据,其中,所述设备数据包括设备的待标注数据以及故障类型;
41、集合获取模块,用于获取预设故障类型集合,其中,所述预设故障类型集合中包括多个标准故障类型;
42、类型对比模块,用于对比所述故障类型与所述预设故障类型集合中的多个所述标准故障类型;
43、数据标注模块,用于根据所述故障类型与所述预设故障类型集合中的多个所述标准故障类型的对比结果,对所述待标注数据进行标注。
44、第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
45、存储器,用于存放计算机程序;
46、处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的数据标注方法。
47、第四方面,还提供了一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面中任一所述的数据标注方法。
48、第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的数据标注方法。
49、本技术实施例提供的上述技术方案与现有技术相比具有如下优点:本技术实施例提供的该方法,获取设备数据,其中,设备数据包括设备的待标注数据以及故障类型,获取预设故障类型集合,其中,预设故障类型集合中包括多个标准故障类型,对比故障类型与预设故障类型集合中的多个标准故障类型,根据故障类型与预设故障类型集合中的多个标准故障类型的对比结果,对待标注数据进行标注。通过对比故障类型与预设故障类型集合中的多个标准故障类型,从而根据对比结果,对待标注数据进行标注,如此可实现数据的自主标注,减少人工标注,提高了效率,降低了对设备进行基于数据驱动的故障诊断、故障预测及节能控制等方案的实施成本。