一种工业数据趋势识别方法和系统与流程

文档序号:18740635发布日期:2019-09-21 01:44阅读:264来源:国知局
一种工业数据趋势识别方法和系统与流程

本发明涉及多项式曲线拟合技术领域,具体而言涉及一种工业数据趋势识别方法和系统。



背景技术:

PolynonmiaCurveFitter是一个多项式曲线拟合技术,建立在Apache Commons math3基础之上。这个类库提供了非常丰富的计算API,同时提供了多种数据拟合分析的方法,使得海量数据的分析变得非常容易。

工业生产经营过程中产生的数据应用潜力巨大,但目前而言,工业大数据在应用分析和价值挖掘上仍存在一些技术障碍,从工业数据中识别趋势是有效的数据分析方法。



技术实现要素:

本发明目的在于提供一种工业数据趋势识别方法和系统,通过提取特征值,结合特征值数组、原始数组的变化规律,联合分析得出这一组工业数据的变化趋势,由于引入了特征值的变化趋势,分析结果准确性高,计算量少;分析得到的工业数据的变化趋势能够有效利用到生产经营过程中去。另外,新产生的数据可以直接引入趋势识别过程,使趋势识别过程具有了实时性。

为达成上述目的,结合图1,本发明提出一种工业数据趋势识别方法,所述识别方法包括:

S1:根据提供的开始时间和结束时间,获取这一时间段范围内的工业数据,所述工业数据包括各自对应的时间戳。

S2:对获取的工业数据进行预处理,获取原始数组,并提取出其中的特征值,生成若干组特征组数组,所述特征值数组至少包括极大值数组、极小值数组、极大值、极小值。

所述极大值数组包括本时间段范围内工业数据中的局部波峰数值,所述极小值数组包括本时间段范围内工业数据中的局部波谷数值,所述极大值为本时间段范围内工业数据中的最大数值,所述极小值为本时间段范围内工业数据中的最小数值。

S3:对原始数组、特征值数组进行多项式曲线拟合,获取与各个数组对应的斜率值。

S4:根据设定的分析规则,结合各个数组对应的斜率值计算得到本时间段范围内的工业数据的趋势类型。

基于前述方法,本发明还提及一种工业数据趋势识别系统,所述识别系统包括以下模块:

(1)用于输入开始时间和结束时间的输入设备。

(2)用于根据输入的开始时间和结束时间获取这一时间段范围内的工业数据的模块。

(3)用于对获取的工业数据进行预处理,获取原始数组的模块。

(4)用于从获取的原始数组中提取出其中的特征值,生成若干组特征组数组的模块。

(5)用于对原始数组、特征值数组进行多项式曲线拟合,获取与各个数组对应的斜率值的模块。

(6)用于根据设定的分析规则,结合各个数组对应的斜率值计算得到本时间段范围内的工业数据的趋势类型的模块。

在工业生产经营过程中产生的工业数据通常包括数据类型、数值、时间戳等属性,例如能够反应生产经营结果的单位时间生产量、单位时间耗材量等,能够直接反应生产经营过程的单位时间良品率、单位时间废气排放量等,能够间接反应生产经营过程中电气设备使用情况的电压值、功率值等。

通过分析某一时间段内这类工业数据的趋势,能够快速有效的了解这一时间段内的生产经营情况。

首先根据提供的开始时间和结束时间,获取这一时间段范围内想要分析的工业数据,所述工业数据包括各自对应的时间戳。优选的,此时选取的工业数据均属于同一类,以确保分析结果的准确性。

其次,对获取的工业数据进行预处理,获取原始数组。预处理包括数据清洗、数据筛选、数据格式转换等。提取出原始数组中的特征值,生成若干组特征组数组,所述特征值数组至少包括极大值数组、极小值数组、极大值、极小值。

所述极大值数组包括本时间段范围内工业数据中的局部波峰数值,所述极小值数组包括本时间段范围内工业数据中的局部波谷数值,所述极大值为本时间段范围内工业数据中的最大数值,所述极小值为本时间段范围内工业数据中的最小数值。

最后,对原始数组、特征值数组进行多项式曲线拟合,获取与各个数组对应的斜率值。根据设定的分析规则,结合各个数组对应的斜率值计算得到本时间段范围内的工业数据的趋势类型。所述趋势类型包括周期性、平稳、第一上升、第二上升、第三上升、下降。具体的,通过逐个分析极大值数组、极小值数组、原始数组的斜率值变换,得到局部波峰数值、局部波谷数值、原始数值的变化规律,再联合分析,判断出这一时间段内工业数据的变化趋势。

当有新的数据产生时,可以直接引入原始数组尾部,通过判断原末位数据和新引入数据的特征值属性,将其导入对应的特征值数组,调整对应特征值数组的斜率,判断出新产生的数据对识别出的变化趋势的影响,使本发明提及的工业数据趋势识别方法具有了实时性。

以上本发明的技术方案,与现有相比,其显著的有益效果在于:

1)本发明通过提取特征值,结合特征值数组、原始数组的变化规律,联合分析得出这一组工业数据的变化趋势,由于引入了特征值的变化趋势,分析结果准确性高,计算量少。

2)分析得到的工业数据的变化趋势能够有效利用到生产经营过程中去。

3)新产生的数据可以直接引入趋势识别过程,使趋势识别过程具有了实时性。

应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。

结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。

附图说明

附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:

图1是本发明的工业数据趋势识别方法的流程图。

具体实施方式

为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。

结合图1,本发明提及一种工业数据趋势识别方法,所述识别方法包括:

S1:根据提供的开始时间和结束时间,获取这一时间段范围内的工业数据,所述工业数据包括各自对应的时间戳。

S2:对获取的工业数据进行预处理,获取原始数组,并提取出其中的特征值,生成若干组特征组数组,所述特征值数组至少包括极大值数组、极小值数组、极大值、极小值。

所述极大值数组包括本时间段范围内工业数据中的局部波峰数值,所述极小值数组包括本时间段范围内工业数据中的局部波谷数值,所述极大值为本时间段范围内工业数据中的最大数值,所述极小值为本时间段范围内工业数据中的最小数值。

步骤S2中,所述提取出其中的特征值,生成若干组特征组数组的过程包括以下步骤:

S21:生成极大值数组、极小值数组,选择原始数组中的任意一个数据作为极大值和极小值的初始值。

S22:将原始数组中的每个数据分别与其相邻的数据作比较,如果该数据均大于相邻的数据,将其加入极大值数组,如果该数据均小于相邻的数据,将其加入极小值数组。

S23:将原始数组中的每个数据分别与极大值和极小值比较,如果该数据大于极大值数据,将其更新为极大值,如果该数据小于极小值数据,将其更新为极小值。

本发明步骤S2所述的获取极大值、极大值数组数据、极小值、极小值数组数据,其分解步骤如下:

设原始数组中包括n个数据,每个数据表示为value[i]、其对应的时间戳表示为time[i],。

对原始数组的处理不局限于数组的排列顺序,为了便于描述,假设按照i从小到大的顺序对原始数组进行处理。

当时,value中的数据位置处于0,将value[0]的数据赋值给极大值max、极小值min,随后将其于value[1]进行比较,若value[0]大于value[1],将value[0]存放到极大值数组maxvalue中,并将对应的时间戳存放到maxtimes中,反之将value[0]和其对应的时间戳分别存放到极小值数组中minvalue及mintimes中。同时如果其大于极大值max,将其赋值给max,如果其小于极小值min,将其赋值给极小值min。

当时,value中的数据处于1到倒数最后一个位置,让value[i]与value[i-1]以及value[i+1]相比较,若value[i]同时大于value[i-1]以及value[i+1]时,将value[i]存放存放到极大值数组maxvalue中,并将对应的时间戳数据存放到maxtimes中,反之,将value[i]和其对应的时间戳数据分别存放到极小值数组中minvalue及mintimes中。同时如果value[i]大于极大值max,将value[i]赋值给max,如果value[i]小于极小值min,将value[i]赋值给极小值min。

当时,value中的数据处于最后一位时,让value[n-1]与value[n-2]进行比较,若value[n-1]大于value[n-2]时,将value[n-1]存放到极大值数组maxvalue中,并将对应的时间戳数据存放到maxtimes中,反之将value[n-1]及其对应的时间戳分别存放到极小值数组中minvalue及mintimes中。同时如果value[n-1]大于极大值max,将value[n-1]赋值给max,如果value[n-1]小于极小值min,将value[n-1]赋值给极小值min。

例如,原始数组为[1,2,3,4,5,4,3,4,3,6,5,6,2,4],将max和min设置为1,按照前述顺序由前至后对原始数组中的数据进行处理:

首先将第一个数据与第二个数据做比较,1小于2,因此将第一个数据1放到极小值数组中,max的值更新为2。

再将第二个数据分别和第一个数据、第三个数据做比较,2大于1小于3,因此第二个数据不列为特征值。

同样的,按照前述过程依次对原始数组中排在非首末位的数值进行处理,可以得出,极大值数组为[5,4,6,6],极小值数组为[3,3,5,2],过程中,max被更新为6,min维持1不变。

最后判断末位数据4与前一位数据2的大小,4大于2,因此将4放入极大值数组,最终的极大值数组为[5,4,6,6,4],极小值数组为[3,3,5,2],max为6,min维持1不变。

由前述可知,本发明提出将2-3个数值设定成一个局部分析数组,极大值数组中的数值均为局部波峰数值,极小值数组中的数值均为局部波谷数值,在不影响分析结果的情况下,对数据做了初步筛选,选取了能够反应趋势变化的特征值协同分析,一方面,从复杂的工业数组中筛选出了其中特征值,使分析结果具有了可行性和特征性,另一方面,减少了运算量。

S3:对原始数组、特征值数组进行多项式曲线拟合,获取与各个数组对应的斜率值。

步骤S3中,所述对原始数组、特征值数组进行多项式曲线拟合,获取与各个数组对应的斜率值的过程包括以下步骤:

结合极大值数组、极小值数组、原始数组以及对应的时间列表,以数值取值为x轴,以对应的时间戳为y轴,进行曲线拟合,求取对应的斜率值。

优选的,所述曲线拟合包括一元曲线拟合。更加优选的,采用多项式曲线拟合技术进行一元一次性曲线拟合。例如,采用PolynonmiaCurveFitter进行一元一次性曲线拟合。

S4:根据设定的分析规则,结合各个数组对应的斜率值计算得到本时间段范围内的工业数据的趋势类型。

在一些例子中,所述设定分析规则包括:

设极大值数组斜率、极小值数组斜率、原始数组斜率分别为maxR、minR、medR。

计算极大值数组的斜率绝对值maxRV、极小值数组的斜率绝对值minRV、原始数组的斜率绝对值medRV。

根据工业数据类型设定比对阈值h。

通过比对极大值数组斜率maxR、极小值数组斜率minR、原始数组斜率medR、极大值数组的斜率绝对值maxRV、极小值数组的斜率绝对值minRV、原始数组的斜率绝对值medRV与设定的比对阈值h,以确定所述工业数据的趋势类型。

应当理解,比对阈值h并非固定值,根据不同的分析目的和不同的数据类型,其取值不一,例如针对单位时间生产量,可以将h设定成0.1,当斜率绝对值小于0.1时,该斜线的变化趋势是极其平缓的,可以认定成单位时间生产量无明显变化。

进一步的,所述趋势类型包括周期性、平稳、第一上升、第二上升、第三上升、下降。趋势类型的划分方法根据工业数据的类型和分析目的包括多种,前述趋势类型只是其中一种。

基于前述趋势类型划分方法,本发明提供了其中一种设定分析规则。

(1)如果极大值数组的斜率绝对值maxRV、极小值数组的斜率绝对值minRV同时小于设定的比对阈值h,判定所述工业数据的趋势类型为周期性。

当极大值数组的斜率绝对值maxRV、极小值数组的斜率绝对值minRV同时小于设定的比对阈值h,如0.1时,极大值数组和极小值数组中的数值变化不大,即原始数组中的数据在极大值和极小值之间周期性波动,此时判定所述工业数据的趋势类型为周期性。

例如,原始数组为[1,2,6,2,1,4,6,2,1,6,3,1,2,6],极大值为6,极小值为1,极大值数组中的数据均为6,极小值数组中的数据均为1,极大值数组的斜率和极小值数组的斜率均为0。可以看到,原始数组中数据多样,直接观察难以判断变化趋势,通过提取极大值数组和极小值数组,能够有效排除掉中间的波动数据,使用户能够明确获知原始数组中的数据是呈周期性变化的。

(2)如果极大值数组斜率maxR、原始数组的斜率绝对值medRV小于设定的比对阈值h,且极小值数组斜率minR大于等于h,判定所述工业数据的趋势类型为平稳。

极大值数组斜率小于比对阈值h,说明极大值数组呈平稳或下降趋势,原始数值的原始数组的斜率绝对值,说明原始数值数组的变化呈平稳趋势,极小值数组斜率minR大于等于h,说明极小值数组呈平稳或上升趋势,但上升后的数值不超过极大值,此种情形下,原始数组呈收敛状,判定工业数据的变化趋势是数值趋于一致,趋势类型为平稳。

(3)如果极大值数组斜率maxR小于h,极小值数组斜率minR大于等于h,原始数组斜率medR大于h,判定所述工业数据的趋势类型为第一上升。

极大值数组斜率maxR小于h,说明极大值数组呈平稳或下降趋势,极小值数组斜率minR大于等于h,说明极小值数组呈上升趋势,原始数组斜率medR大于h,说明原始数组整体呈上升趋势,判定所述工业数据的趋势类型为第一上升,即,此时工业数据的变化趋势为波谷值逐渐上升,但上升后的最大数值具有界限,不超过原局部波峰值,第一上升状态主要是指波谷值的变化趋势。

(4)如果极大值数组斜率maxR大于等于h,极小值数组的斜率绝对值minRV小于h,判定所述工业数据的趋势类型为第二上升。

极大值数组斜率maxR大于等于h,说明极大值数组呈上升趋势,极小值数组的斜率绝对值minRV小于h,说明极小值呈平稳趋势,第三上升主要是指波峰值的变化趋势。

(5)如果极大值数组斜率maxR大于等于h,极小值数组斜率minR大于等于h,判定所述工业数据的趋势类型为第三上升。

极大值数组斜率maxR大于等于h,说明极大值数组呈上升趋势,极小值数组斜率minR大于等于h,说明极小值数组呈上升趋势,工业数据是整体呈现一个明显的上升趋势,即第二上升状态是指波峰和波谷的统一变化趋势。

(6)如果极大值数组斜率maxR小于h,极小值数组的斜率绝对值minRV大于等于h,且极小值数组斜率minR小于0,判定所述工业数据的趋势类型为下降。

极大值数组斜率maxR小于h,说明极大值数组呈平稳或下降趋势,极小值数组的斜率绝对值minRV大于等于h,且极小值数组斜率minR小于0,说明极小值呈明显下降趋势,整个工业数据均呈现下降趋势。

前述例子只是其中一种分析规则,分析规则的设定是结合分析目的和数据类型决定的,例如,还可以设置多个比对阈值范围,使分析结果更加多样化等等。

当有新的数据产生时,引入原始数组尾部,判断新引入数据的特征值属性,将其导入对应的特征值数组,调整对应特征值数组的斜率,判断新产生的数据对识别出的变化趋势的影响。

如果本次分析的原始数组为当前生产前一个时间段内的工业数据,当有新的工业数据产生时,可以直接将新产生的工业数据引入原始数组尾部,判断原末位数据和新引入数据的特征值属性,将两者分别导入对应的特征值数组,继而调整对应特征值数组的斜率,结合调整后的斜率判断新产生的数据对识别出的变化趋势的影响,由于只需要重新判断原末位数据和新引入数据的特征值属性,计算量小,运算时间短,使工业数据的分析具有了实时性。

基于前述方法,本发明还提及一种工业数据趋势识别系统,所述识别系统包括以下模块:

(1)用于输入开始时间和结束时间的输入设备。

(2)用于根据输入的开始时间和结束时间获取这一时间段范围内的工业数据的模块。

(3)用于对获取的工业数据进行预处理,获取原始数组的模块。

(4)用于从获取的原始数组中提取出其中的特征值,生成若干组特征组数组的模块。

(5)用于对原始数组、特征值数组进行多项式曲线拟合,获取与各个数组对应的斜率值的模块。

(6)用于根据设定的分析规则,结合各个数组对应的斜率值计算得到本时间段范围内的工业数据的趋势类型的模块。

在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定义在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。

虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1