本发明涉及工业智能化领域,尤其涉及一种钢铁工业生产数据质量评价方法和评价系统。
背景技术:
1、大数据技术的意义在于通过对海量数据的分析处理挖掘出其潜在的价值,并将其应用到指导钢铁的生产。
2、钢铁的生产涉及诸多环节,其中包含了大量的传感器,随着智能化的推进,数据来源增多,数据类型多样,对于数据质量评估以反映已经采集数据质量,以及基于数据质量发现异常生产信息,具有重要的意义。
技术实现思路
1、本发明的目的在于克服上述一种或多种现有的技术问题,提供一种钢铁工业生产数据质量评价方法。
2、为实现上述目的,本发明提供的一种钢铁工业生产数据质量评价方法,包括:
3、基于已经验证和分类的生产数据进行特征处理,确定若干生产数据的特征属性;
4、基于生产数据的特征属性在第一分类规则下的特征分布,以确定生产数据在第一分类规则下的第一异常数据;
5、基于生产数据的特征属性在第二分类规则下的特征分布,以确定生产数据在第二分类规则下的第二异常数据;
6、基于第一异常数据和第二异常数据对特征提取的规则进行调整,使第一异常数据通过第二分类规则被正确划分,以及第二异常数据通过第一分类规则被正常划分;
7、基于调整后的第一分类规则或第二分类规则对钢铁生产数据质量进行评价。
8、根据本发明的一个方面,生产数据包括原料钢比例、轧制压力、轧制速度、压下率过程控制数据、行进速度数据、气体流量数据、压力数据、温度数据,燃料信息、原辅料、气消耗量、煤炭消耗量和/或焦炭产量。
9、根据本发明的一个方面,第一分类规则和第二分类规则中包含的元素不同,第二分类规则中的特征属性包括第一分类规则特征属性的关联属性。
10、根据本发明的一个方面,根据钢铁产品的测试数据对数据进行分类,按照钢铁产品生产工艺的标准值点进行生产数据采样距离的计算,并按照采样距离进行排序,获取不高于5%比例的数据作为异常数据,去除异常数据中数值相较于标准值点的偏差值在对应字段的阈值范围内的数据,得到对应于分类字段的疑似异常数据值;
11、对疑似异常数据值进行聚类分类,进行聚类时,聚类中心的数目不高于分类规则中生产过程控制数据字段的数目,之后将聚类中心以及和聚类中心距离低于阈值疑似异常数据值作为异常数据。
12、根据本发明的一个方面,分别生产数据中涉及设备操作和原料的波动数据,生产数据按照生产时间对齐;
13、对生产数据中进行关联度分析,以获取生产数据的多个参考属性以及和参考属性相关联的关联属性;
14、基于参考属性构建第一分类规则,基于关联属性构建第二分类规则。
15、根据本发明的一个方面,第一分类规则根据参考属性序列和标准工艺数据中参考值的距离,选择离群性超过阈值的生产数据作为第一异常数据;
16、第二分类规则根据关联属性序列和标准工艺数据中参考值的距离,选择离群性超过阈值的生产数据作为第二异常数据。
17、根据本发明的一个方面,关联度分析包括对各个字段进行灰色统计评估分级,得到各个特征属性对于产品质量影响的评级,获得特征属性序列;
18、基于皮尔逊相关系数将特征属性序列划分为参考特征和关联特征。
19、根据本发明的一个方面,钢铁生产数据质量进行评价包括:
20、响应于第一分类规则和第二分类规则确定为异常数据,将生产数据确定为低关联度数据;
21、响应于第一分类规则或第二分类规则确定为低关联度数据,根据生产数据各序列和标准工艺对应特征属性的标准差差异,确定生产数据潜在的偏差数据源。
22、根据本发明的一个方面,使用指数归一化处理的方式对生产数据进行特征处理。
23、为实现上述目的,本发明提供一种钢铁工业生产数据质量评价系统,包括:
24、特征属性获取单元:用于基于已经验证和分类的生产数据进行特征处理,确定若干生产数据的特征属性;
25、第一异常获取单元:基于生产数据的特征属性在第一分类规则下的特征分布,以确定生产数据在第一分类规则下的第一异常数据;
26、第二异常获取单元:基于生产数据的特征属性在第二分类规则下的特征分布,以确定生产数据在第二分类规则下的第二异常数据;
27、优化评价单元:基于第一异常数据和第二异常数据对特征提取的规则进行调整,使第一异常数据通过第二分类规则被正确划分,以及第二异常数据通过第一分类规则被正常划分;
28、基于调整后的第一分类规则或第二分类规则对钢铁生产数据质量进行评价。
29、基于此,本发明的有益效果在于:本发明考虑数据之间的内在联系,可以快速实现对于钢铁工业生产数据质量的评价。
1.一种钢铁工业生产数据质量评价方法,其特征在于,包括:
2.如权利要求1所述的一种钢铁工业生产数据质量评价方法,其特征在于,生产数据包括原料钢比例、轧制压力、轧制速度、压下率过程控制数据、行进速度数据、气体流量数据、压力数据、温度数据,燃料信息、原辅料、气消耗量、煤炭消耗量和/或焦炭产量。
3.如权利要求2所述的一种钢铁工业生产数据质量评价方法,其特征在于,第一分类规则和第二分类规则中包含的元素不同,第二分类规则中的特征属性包括第一分类规则特征属性的关联属性。
4.如权利要求3所述的一种钢铁工业生产数据质量评价方法,其特征在于,根据钢铁产品的测试数据对数据进行分类,按照钢铁产品生产工艺的标准值点进行生产数据采样距离的计算,并按照采样距离进行排序,获取不高于5%比例的数据作为异常数据,去除异常数据中数值相较于标准值点的偏差值在对应字段的阈值范围内的数据,得到对应于分类字段的疑似异常数据值;
5.如权利要求4所述的一种钢铁工业生产数据质量评价方法,其特征在于,分别生产数据中涉及设备操作和原料的波动数据,生产数据按照生产时间对齐;
6.如权利要求5所述的一种钢铁工业生产数据质量评价方法,其特征在于,第一分类规则根据参考属性序列和标准工艺数据中参考值的距离,选择离群性超过阈值的生产数据作为第一异常数据;
7.如权利要求6所述的一种钢铁工业生产数据质量评价方法,其特征在于,关联度分析包括对各个字段进行灰色统计评估分级,得到各个特征属性对于产品质量影响的评级,获得特征属性序列;
8.如权利要求7所述的一种钢铁工业生产数据质量评价方法,其特征在于,响应于第一分类规则和第二分类规则确定为异常数据,将生产数据确定为低关联度数据;
9.如权利要求8所述的一种钢铁工业生产数据质量评价方法,其特征在于,使用指数归一化处理的方式对生产数据进行特征处理。
10.一种钢铁工业生产数据质量评价系统,其特征在于,包括: