一种工业设备数据分析算法的推荐方法与流程

文档序号:15095852发布日期:2018-08-04 14:33阅读:235来源:国知局

本发明涉及的是一种自动控制领域的技术,具体是一种工业设备数据分析算法的推荐方法。



背景技术:

目前,随着工业设备的智能化水平不断提升,设备的远程状态监测与智能运维逐渐受到企业的重视,例如:实现风力发电机的无人值守。

设备远程智能运维的基础是采集设备的实时运行参数,并对其进行分析,进而掌握设备的实时运行状态,判断是否发生异常,或者预测其未来的状态,实现预测性维护等。由上述可知,其中的一个核心环节是设备数据的分析。

与传统的数据分析不同,工业设备的数据分析除了数据分析的理论和方法外,还需要关于设备的专业知识的支撑,也就是说,了解设备的工程师才是最适合进行设备运行数据分析的人员。

这些工程师对设备的各个运行参数有深刻理解,了解其之间的影响关系,在这些领域知识的基础上,结合数据分析的理论与方法,才可以在运行数据中挖掘出隐含的信息,更好的掌握设备的运行状态。

一般这些工程师对于数据分析的理论与方法并没有系统的学习和掌握,难以有效的将其经验和领域知识融入到数据分析中。因此,这便需要一个能够辅助工程师进行数据分析的系统,能够降低数据分析的门槛,可以在无需编程的情况下完成数据分析,让工程师将精力更多的放在设备数据本身,而不需要系统的掌握数据分析的理论和方法。

为了提高工业设备数据分析的效率,降低数据分析的门槛,辅助工程师快速、便捷的完成数据分析,将其专业知识以最便捷的方式融入到数据分析中,需要能够辅助工程师进行数据分析的方法。

在分析过程中,仍然有许多步骤需要用户根据具体问题的特点进行选择,而这依然需要用户对数据分析有着相对较深刻的理解。因此仅仅采用一般分析方法,难以完全达到上述目的。



技术实现要素:

本发明针对现有技术存在的上述不足,提出一种工业设备数据分析算法的推荐方法。本发明提高了设备数据的分析效率,降低了数据分析的难度,辅助工程师快速有效的完成数据分析,结合用户评分为用户提供更多、更准确的算法,并可为用户推荐下一步可能使用的算法,提高了算法的应用效率,从而提高了设备数据分析的效果。

本发明是通过以下技术方案实现的:

本发明涉及一种工业设备数据分析算法的推荐方法,预先设置多个数据处理策略;

还包括以下步骤:

步骤S1,获取用户本次数据处理所需的数据集合以及对应的处理问题,并根据所述数据集合和所述处理问题形成一处理特征矢量;

步骤S2,根据所述处理特征矢量选择并形成由至少一个所述数据处理策略组合形成的数据处理模型;

步骤S3,根据所述数据处理模型对所述数据集合进行处理,以形成对应的数据处理结果并输出。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S1中,形成所述处理特征矢量具体包括以下步骤:

步骤S11,采用一预先训练形成的数据集特征分析器提取所述数据集合的数据特征;

步骤S12,采用一预先训练形成的问题信息分析器提取所述处理问题的问题特征;

步骤S13,将所述数据特征和所述问题特征组合形成所述处理特征矢量;

所述步骤S11和所述步骤S12在执行顺序上不分先后。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S11中,所述数据特征包括数据量、数据维度和数据稀疏度。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S12中,所述问题特征包括问题类型、问题领域和问题对象。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S2中,选择所述数据处理策略的具体步骤包括:

步骤S21,根据所述处理特征矢量匹配预设数量的所述数据处理策略作为候选策略集合;

步骤S22,处理得到所述候选策略集合中的所述数据处理策略的效果指数和推荐指数;

步骤S23,根据所述效果指数和所述推荐指数形成所述数据处理策略的评分,并按照所述评分由高到低对所述候选策略集合中的所述数据处理策略进行排序;

步骤S24,选择前N项所述数据处理策略组成所述数据处理模型,N为大于等于1的自然数。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S24之后,根据用户的日志信息自动推荐与组成所述数据处理模型的所述数据处理策略同时使用次数最多的前M项所述数据处理策略,M为大于等于1的自然数。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S23与步骤S24之间,将经过排序后的所述数据处理策略应用于所述数据集合中的部分数据,根据所述数据处理策略的处理效果由高到低对所述数据处理策略进行再一次排序。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S22中,所述效果指数η=aX+bY,其中:a和b为系数,X为算法精度,Y为算法运行时间的倒数。

优选的,该一种工业设备数据分析算法的推荐方法,在所述步骤S22中,所述推荐指数β=cJ+dK,其中:c和d为系数,J为用户评分,K为算法使用频率。

上述技术方案的有益效果是:本发明提高了设备数据的分析效率,降低了数据分析的难度,辅助工程师快速有效的完成数据分析,结合用户评分为用户提供更多、更准确的算法,并可为用户推荐下一步可能使用的算法,提高了算法的应用效率,从而提高了设备数据分析的效果。

附图说明

图1为本发明的较佳的实施例中,一种工业设备数据分析算法的推荐方法流程示意图;

图2为本发明的较佳的实施例中,一种工业设备数据分析算法的推荐方法的处理特征矢量的形成流程示意图;

图3本发明的较佳的实施例中,一种工业设备数据分析算法的推荐方法的数据处理模型产生流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。

如图1所示,本实施例涉及一种工业设备数据分析算法的推荐方法,预先设置多个数据处理策略。

预先设置的数据处理策略即在工业设备数据分析过程中的各个算法。将每一数据处理策略进行模块化,将各个算法以模块的形式进行整合。在后续的处理步骤中,各个步骤直接调用一个或多个数据处理策略,调用的数据处理策略都是以模块的形式出现,方便直接调用。

数据处理策略包括神经网络模型、随机森林模型等,每个输出处理策略都有其特点和处理问题。

还包括以下步骤:

步骤S1,获取用户本次数据处理所需的数据集合以及对应的处理问题,并根据数据集合和所述处理问题形成一处理特征矢量。

数据集合包括工业设备的各个运行数据,用户对其进行分析。

如图2所示,形成处理特征矢量具体包括以下步骤:

步骤S11,采用一预先训练形成的数据集特征分析器提取数据集合的数据特征。

数据特征包括数据量、数据维度和数据稀疏度。针对数据集合中的各种数据,即工业设备的各个运行数据,提取各个运行数据的数据量、数据维度和数据稀疏度。

整个数据集合中的运行数据被提取之后,被保存于MySQL对象数据库中,当需要提取数据集合时,通过访问MySQL数据来获得所需的数据集合,以完成后续的步骤。

提取的数据特征以一数据特征向量,该数据特征向量的具有三个维度,三个维度包括数据量、数据维度和数据稀疏度。

步骤S12,采用一预先训练形成的问题信息分析器提取处理问题的问题特征。

问题类型以所需解决的问题的种类,问题类型包括回归问题和分类问题。

问题领域为进行数据分析的技术领域。

问题对象为进行数据分析的工业设备。

问题信息分析器提取的处理问题的问题特征,将问题特征组合形成一问题特征向量,该问题特征向量包括问题类型、问题对象以及问题领域,从而形成一三维的问题特征向量。

步骤S13,将数据特征和问题特征组合形成处理特征矢量。

步骤S11和步骤S12在执行顺序上不分先后。

将数据特征和问题特征组合形成的处理特征矢量,该处理特征矢量为一3×3的处理特征矢量。即该处理特征矢量由上述的数据特征向量以及问题特征向量组合形成。

步骤S2,根据处理特征矢量选择并形成由至少一个数据处理策略组合形成的数据处理模型。

根据数据特征向量以及问题特征向量组合形成的处理特征矢量来选择一个或者多个数据处理策略,将选择的一个或者多个数据处理策略组合形成数据处理模型,用户通过数据处理模型来处理所要分析的工业设备数据即数据集合中的数据。

如图3所示,选择数据处理策略的具体步骤包括:

步骤S21,根据处理特征矢量匹配预设数量的数据处理策略作为候选策略集合。

预先训练一相似性对比器,将处理特征矢量输入该相似性对比器中,相似性对比器根据已经得到的问题特征以及采集到的数据特征,在已有的数据库中检索相应的历史案例。将问题特征和数据特征与各个历史案例中的特征相比较,从而选择出预设数量的历史案例以及其所采用的数据处理策略。根据各个数据处理策略的效率、预测误差来选择预设数量的数据处理策略,并放入候选策略集合中。

步骤S22,处理得到候选策略集合中的数据处理策略的效果指数和推荐指数。

候选策略集合中的数据处理策略并不能完全适用于现在所需进行的工业设备数据的分析。

需要根据效果指数和推荐指数,在候选策略集合中进一步的选择所需要的数据处理策略。

效果指数计算公式为:

η=aX+bY;

其中:a和b为系数;

X为算法精度;

Y为算法运行时间的倒数。

效果指数中的算法精度X以及算法运行时间都从用于已有的操作日志中提取。即提取用户的操作日志,进而提取其中的各个处理策略的算法精度以及算法运行时间。进而通过公式:η=aX+bY,来计算各个数据处理策略的效果指数。

推荐指数公式为:

β=cJ+dK;

其中:c和d为系数;

J为用户评分;

K为算法使用频率。

用户对各个数据处理策略的效果有不同的需求,同时会对各个历史案例中的数据处理策略进行评分。所以,各个数据处理策略的用户评分以及其算法使用频率直接反应了用户对数据处理策略的偏好程度。从而能够通过推荐指数来向用户推荐数据处理策略。

步骤S23,根据效果指数和推荐指数形成数据处理策略的评分,并按照评分由高到低对候选策略集合中的数据处理策略进行排序。

分别按照推荐指数公式β=cJ+dK以及效果指数计算公式η=aX+bY来计算候选策略集合中的每一数据处理策略推荐指数以及效果指数。

根据计算得到的输出处理策略的推荐指数以及效果指数来对每一数据处理策略进行评分,效果指数和推荐指数的权重相同。

按照每一数据处理策略的评分对数据处理策略进行按照评分由高到低的排序。

步骤S24,选择前N项数据处理策略组成数据处理模型,N为大于等于1的自然数。

经过排列后的数据处理策略自动推荐给用户。

用户选择前一个或多个数据处理策略来组成数据处理模型。

步骤S3,根据数据处理模型对数据集合进行处理,以形成对应的数据处理结果并输出。

用户利用排序后的数据处理策略来建立数据处理模型,利于提高效率以及方便用户。

经过组合得到合适的数据处理模型,用户通过该数据处理模型来进行工业设备数据的分析。

一种较佳的实施例中,根据用户的日志信息自动推荐与组成数据处理模型的数据处理策略同时使用次数最多的前M项数据处理策略,M为大于等于1的自然数。

用户通过得到的数据处理模型对工业设备数据进行处理后,并不能完全得到满意的结果,还需要进行其它的数据处理过程,在该过程中需要进一步使用数据处理策略。

用户也需要对得到的数据处理模型进行交叉验证和优化,在这一工程中也需要进一步的使用其它数据处理策略。

提取用户的日志信息,从而得到与组成数据处理模型的数据处理策略同时或联合使用的其它数据处理策略。并将同时或者联合使用的数据处理策略按照使用的频率进行排序后,推荐给用户一个或多个数据处理策略,以供用户进行选择。

一种较佳的实施例中,在步骤S23与步骤S24之间,将经过排序后的数据处理策略应用于数据集合中的部分数据,根据数据处理策略的处理效果由高到低对数据处理策略进行再一次排序。

通过效果指数和推荐指数的评分进行排序后得到的数据处理模型并不能准确的与用户所要进行的工业设备数据的分析匹配。将经过排序后的数据处理策略应用于数据集合中的部分数据,根据数据处理策略的处理效果由高到低对数据处理策略进行再一次排序,而后从中选择N个数据处理策略,组成数据处理模型。

数据集合中的部分数据作为小样本,将数据处理策略应用于该小样本。处理得到每个数据处理策略的处理效果,这里以效果指数来衡量每个数据处理策略的处理效果。

本发明的一种工业设备数据分析算法的推荐方法,与现有技术相比:本发明提高了设备数据的分析效率,降低了数据分析的难度,辅助工程师快速有效的完成数据分析,结合用户评分为用户提供更多、更准确的算法,并可为用户推荐下一步可能使用的算法,提高了算法的应用效率,从而提高了设备数据分析的效果。

以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1