基于产业供应链的工业大数据分析方法与流程

文档序号:17889855发布日期:2019-06-13 15:30阅读:215来源:国知局
基于产业供应链的工业大数据分析方法与流程

本发明涉及数据处理技术领域,尤其涉及一种基于产业供应链的工业大数据分析方法。



背景技术:

随着工业系统的复杂化,工业系统之间的连接更加紧密,产业供应链复杂。一个系统故障会导致与之关联的一个或多个其他系统的瘫痪,进而造成巨大损失。

如何对工业大数据进行高效分析,进而有效预警,避免损失成为工业界的关注重点。



技术实现要素:

为解决上述问题,本申请实施例提出了一种基于产业供应链的工业大数据分析方法。

为了达到上述目的,本发明采用的主要技术方案包括:

一种基于产业供应链的工业大数据分析方法,所述方法包括:

s101,每隔预设时间段采集第一系统的第一数据;

s102,获取产业供应链信息,所述产业供应链信息包括多个系统,多个系统之间的连接关系,每个系统的重要等级;

s103,根据所述产业供应链信息确定所述第一系统的第一重要等级,与所述第一系统存在连接关系的多个第二系统,各第二系统的第二重要等级;

s104,根据第一重要等级和各第二重要等级对第一数据进行分析。

可选地,所述s101中每当采集到第一系统的第一数据后,

s201,确定第一数据是否超出预设阈值;

s202,若超出预设阈值,则将超出预设阈值的第一数据作为分析数据并记录分析数据的采集时间;

所述s104包括:

根据第一重要等级和各第二重要等级对分析数据进行分析。

可选地,所述s101之后,且s102之前还包括:

确定分析数据的总数量大于每周采集额定总量;或者,

确定采集时间位于3天内的分析数据的数量大于每日采集额定总量;或者,

连续7个分析数据的采集时间差相同。

可选地,所述每周采集额定总量=7*每日采集额定总量;

所述每日采集额定总量=第一值的取整;

第一值=24/预设时间段。

可选地,所述第二系统为与所述第一系统存在直接连接关系的系统和与所述第一系统存在间接关系的系统;

所述s103之后,且所述s104之前还包括:

确定各第二系统与所述第一系统的关联度;

所述s104包括:

根据第一重要等级,各第二重要等级和各第二系统与所述第一系统的关联度对分析数据进行分析。

可选地,对于任一第二系统,

若所述任一第二系统与所述第一系统直接关联,则所述任一第二系统与所述第一系统的关联度=a1/与所述第一系统直接关联的系统的总数量;

若所述任一第二系统与所述第一系统间接关联,则

s301,确定所述任一第二系统与所述第一系统之间的间隔度,所述间隔度=所述任一第二系统与所述第一系统之间的关系链上包括的所有系统总数-1;

s302,所述任一第二系统与所述第一系统的关联度=a1*间隔度/所述任一第二系统与所述第一系统之间的关系链上包括的所有系统总数;

其中,a1为重要系数。

可选地,a1=第一重要等级/所述任一第二系统的第二重要等级。

可选地,所述根据第一重要等级,各第二重要等级和各第二系统与所述第一系统的关联度对分析数据进行分析,包括:

s104-1,通过k-means算法对所有分析数据进行聚类,得到类别总数和每个类别对应的分析数据;

s104-2,根据类别总数,每个类别对应的分析数据,各第二重要等级和各第二系统与所述第一系统的关联度计算每类的特征值;

s104-3,根据第一重要等级和各类特征值对分析数据进行分析。

可选地,所述s104-2包括:

若类别总数等于1,则该类的特征值=所有分析数据的总数量*所有分析数据的标准差*所有第二系统的第二值之和;

若类别总数大于1,则任一类的特征值=所述任一类对应的分析数据的数量*所述任一类对应的分析数据的标准差*所有第二系统的第一值之和/类别总数;

任一第二系统的第二值=所述任一第二系统与所述第一系统的关联度*所述任一第二系统的第二重要等级。

可选地,所述s104-3包括:

s104-3-1,确定各类特征值中的最大特征值,最小特征值和平均特征值;

s104-3-2,计算第三值=最大特征值-最小特征值;

s104-3-3,计算(平均特征值/第一重要等级)*第三值;

s104-3-4,若(平均特征值/第一重要等级)*第三值大于最大特征值,则进行预警;若(平均特征值/第一重要等级)*第三值不大于最大特征值,则不进行预警。

本发明的有益效果是:先根据产业供应链信息确定第一系统的第一重要等级,与第一系统存在连接关系的多个第二系统,各第二系统的第二重要等级,再根据第一重要等级和各第二重要等级对每隔预设时间段采集到的第一系统的第一数据进行分析,实现了基于产业供应链对工业大数据分析。

附图说明

下面将参照附图描述本申请的具体实施例,其中:

图1示出了本申请一实施例提供的一种基于产业供应链的工业大数据分析方法流程示意图。

具体实施方式

随着工业系统的复杂化,工业系统之间的连接更加紧密,产业供应链复杂。一个系统故障会导致与之关联的一个或多个其他系统的瘫痪,进而造成巨大损失。如何对工业大数据进行高效分析,进而有效预警,避免损失成为工业界的关注重点。

基于此,本发明提供一种方法先根据产业供应链信息确定第一系统的第一重要等级,与第一系统存在连接关系的多个第二系统,各第二系统的第二重要等级,再根据第一重要等级和各第二重要等级对每隔预设时间段采集到的第一系统的第一数据进行分析,实现了基于产业供应链对工业大数据分析。

参见图1,本实施例提供的一种基于产业供应链的工业大数据分析方法实现过程如下:

s101,每隔预设时间段采集第一系统的第一数据。

本步骤的是实现方式可以有多种,例如:简单的采集,即每隔预设时间段采集第一系统的第一数据,记录第一数据和采集时间。

对于简单采集的方案,后续会对采集到的所有第一数据均进行分析。但是在实践过程中,第一系统正常运行为常态,异常运行为非常态,也就是说,大部分的第一数据为第一系统正常运行产生的,对其花费资源进行分析无意义。

基于上述分析,s101还可以进行智能采集,此处的智能采集并非简单的采集过程,而是采集加分析过程。具体的,每隔预设时间段采集第一系统的第一数据,每当采集到第一系统的第一数据后,会s201,确定第一数据是否超出预设阈值。s202,若超出预设阈值,则将超出预设阈值的第一数据作为分析数据并记录分析数据的采集时间。

进而后续分析的不是全部的第一数据,而是分析数据。

分析数据为一种特殊的第一数据,是超出预设阈值的第一数据。

本实施例提供的上述方案,仅对超出预设阈值的第一数据(即认为有问题的第一数据)才进行后续的分析,而对未超出预设阈值的第一数据(即认为正常的第一数据)不会进行分析。此种处理方式有效的减少了分析数据的数据量,保证了后续分析数据均为非正常数据,提升了本方法的执行效率。

另外,在执行s101之后,会得到分析数据,但并非每次得到一个分析数据均对其进行分析。因为单一的数据异常并不能反映整个第一系统的状态,而需要一系列的异常数据才能够有效的反应第一系统的状态。因此,在执行s101之后,并非马上执行s102,而是执行s101之后判断一个触发,当满足触发条件时,才触发执行s102及后续步骤,否则会重复执行s101。

而出发条件有很多,例如:确定分析数据的总数量大于每周采集额定总量,则出发执行s102及后续步骤。再例如:确定采集时间位于3天内的分析数据的数量大于每日采集额定总量,则出发执行s102及后续步骤。还例如,连续7个分析数据的采集时间差相同,则出发执行s102及后续步骤。

其中,每周采集额定总量=7*每日采集额定总量。

每日采集额定总量=第一值的取整。

第一值=24/预设时间段。

例如,预设时间段为12小时,则第一值=24/12=2,每日采集额定总量=2的取整=2,每周采集额定总量=7*2=14。

再例如,预设时间段为5小时,则第一值=24/5=4.8,每日采集额定总量=4.8的取整=4,每周采集额定总量=7*4=28。

本实施例中的触发条件依据预设时间段的大小动态变化,如果预设时间段较短,即采集频率较高,那么每周采集额定总量会相应的变大。如果预设时间段较长,即采集频率较低,那么每周采集额定总量会相应的变小。保证了触发条件与实际情况的匹配,可以使本实施例提供的方案采用较佳的时间尺度进行数据处理。

s102,获取产业供应链信息。

其中,产业供应链信息包括多个系统,多个系统之间的连接关系,每个系统的重要等级。

重要等级为预先设定的,越重要的系统,重要等级数越小,例如重要等级为1的系统比重要等级为2的系统更为重要。

重要程度可以通过与之连接的系统数量,本身的工业价值等综合设定。

s103,根据产业供应链信息确定第一系统的第一重要等级,与第一系统存在连接关系的多个第二系统,各第二系统的第二重要等级。

此处的第二系统为与第一系统存在直接连接关系的系统和与第一系统存在间接关系的系统。

例如,系统a与系统b直接连接,当系统a为第一系统时,系统b与系统a之间存在的关系为直接关系,系统b为第二系统。若系统c与系统b直接连接,但是系统c未与系统a连接,此时的系统c与系统a之间存在的关系为间接关系,构成间接连接,系统c也是第二系统。

在确定了第二系统之后,还可以确定各第二系统与第一系统的关联度。

具体的确定方法如下:

对于任一第二系统,

若任一第二系统与第一系统直接关联,则任一第二系统与第一系统的关联度=a1/与第一系统直接关联的系统的总数量。

例如系统b(任一第二系统)与系统a(第一系统)直接关联,那么系统b与系统a的关联度=a1/与第一系统直接关联的系统的总数量。

若任一第二系统与第一系统间接关联,则

s301,确定任一第二系统与第一系统之间的间隔度。

其中,间隔度=任一第二系统与第一系统之间的关系链上包括的所有系统总数-1。

s302,任一第二系统与第一系统的关联度=a1*间隔度/任一第二系统与第一系统之间的关系链上包括的所有系统总数。

其中,a1为重要系数。

a1=第一重要等级/任一第二系统的第二重要等级。

例如,系统c(任一第二系统)与系统a(第一系统)间接关联,先确定系统c与系统a之间的间隔度=系统c与系统a的关系链上包括的所有系统总数-1。再计算系统c与系统a的关联度=a1*间隔度/任一第二系统与第一系统之间的关系链上包括的所有系统总数。

若系统c与系统a的关系链为:系统c与系统b连接,系统b与系统a连接,则系统c与系统a的关系链上包括的所有系统总数为3,系统c与系统a之间的间隔度=3-1=2。

其中,a1=系统a的第一重要等级/系统c的第二重要等级。

s104,根据第一重要等级和各第二重要等级对第一数据进行分析。

若s101中采用简单采集方案,则采集到的第一数据均会执行s104对第一数据进行分析。

若s101中采用智能采集方案,即每当采集到第一系统的第一数据后,均会确定该第一数据是否超出预设阈值。若超出预设阈值,才将超出预设阈值的第一数据作为分析数据并记录分析数据的采集时间。那么,s104并非对采集到的所有第一数据均进行分析,而是仅对分析数据进行分析,即根据第一重要等级和各第二重要等级对分析数据进行分析。此种分析方案可以大大减少分析量,提升分析效率。另外,分析数据均为异常数据,对分析数据进行分析可以保证最终分析结论与第一系统的现实运行情况匹配。

另外,若s103确定第一系统的第一重要等级,与第一系统存在连接关系的多个第二系统,各第二系统的第二重要等级之后,又确定各第二系统与第一系统的关联度,那么s104会根据第一重要等级,各第二重要等级和各第二系统与第一系统的关联度对分析数据进行分析。

具体的,根据第一重要等级,各第二重要等级和各第二系统与第一系统的关联度对分析数据进行分析的是实现方法为:

s104-1,通过k-means算法对所有分析数据进行聚类,得到类别总数和每个类别对应的分析数据。

s104-2,根据类别总数,每个类别对应的分析数据,各第二重要等级和各第二系统与第一系统的关联度计算每类的特征值。

例如:若类别总数等于1,则该类的特征值=所有分析数据的总数量*所有分析数据的标准差*所有第二系统的第二值之和。

若类别总数大于1,则任一类的特征值=任一类对应的分析数据的数量*任一类对应的分析数据的标准差*所有第二系统的第一值之和/类别总数。

任一第二系统的第二值=任一第二系统与第一系统的关联度*任一第二系统的第二重要等级。

s104-3,根据第一重要等级和各类特征值对分析数据进行分析。

具体的,

s104-3-1,确定各类特征值中的最大特征值,最小特征值和平均特征值。

s104-3-2,计算第三值=最大特征值-最小特征值。

s104-3-3,计算(平均特征值/第一重要等级)*第三值。

s104-3-4,若(平均特征值/第一重要等级)*第三值大于最大特征值,则进行预警。若(平均特征值/第一重要等级)*第三值不大于最大特征值,则不进行预警。

在执行s104对工业大数据件分析时,并非简单的分析,而是将分析数据进行聚类,不同簇的分析数据。同簇的分析数据之间具有一定的共性,不同簇的分析数据之间具有明显的异性。通过聚类可以再次将分析对象从分析数据的量级降至类数量的量级,进一步提升分析效率。

本实施例提供的方法,基于同簇的分析数据之间具有一定的共性,不同簇的分析数据之间具有明显的异性,对分析数据进行分析,不仅降低了分析对象的量级,提升分析效率,还会将分析视角从单个的数据拉升至具有共性的一簇数据群,即从微观上升至宏观。通过对分析数据之间的共性和异性的分析,可以准确的得到第一系统当前真实的状况,进行有效预警。避免了由于个别数据异常造成滥预警,保证了预警准确性。

需要说明的是,本发明中的“第一”,“第二”,“第三”并无实际含义,仅用于区分不同的系统,或者,区分不同的数据,或者,区分不同的重要等级,或者,区分不同的值。

本发明提供的方法,先根据产业供应链信息确定第一系统的第一重要等级,与第一系统存在连接关系的多个第二系统,各第二系统的第二重要等级,再根据第一重要等级和各第二重要等级对每隔预设时间段采集到的第一系统的第一数据进行分析,实现了基于产业供应链对工业大数据分析。

需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。

还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。

最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1