一种基于大数据的印刷设备检测分析方法与流程

文档序号:16741610发布日期:2019-01-28 13:03阅读:619来源:国知局
一种基于大数据的印刷设备检测分析方法与流程

本发明属于印刷设备检测分析领域,其涉及了印刷设备数据采集和基于大数据的数据分析及故障检测。



背景技术:

设备状态监测与故障诊断是一种了解和掌握机器在运行过程的状态,确定其整体或局部正常或异常,早期发现故障及其原因,并能预报故障发展趋势的技术,是识别机械设备运行状态的一门综合性应用科学和技术,它主要研究机械设备运行状态的变化在诊断信息中的反映。通过测取设备状态信号,并结合其历史状况对所测信号进行处理分析,特征提取,从而定量诊断设备及其零部件的运行状态(正常﹑异常﹑故障),进一步预测将来状态,最终确定需要采取的必要对策的一门技术。主要内容包括监测﹑诊断(识别)和预测三个方面。

传统的印刷设备检测通过对设备运行时的相关数据进行监测,提取其呼叫记录﹑智能仪表数据﹑传感器数据﹑设备日志等数据,将其汇总至专业人士手中,采取人工方法进行数据分析,从而分析印刷设备的故障类型并对潜伏性故障进行预测。由于采用人工检测分析不仅影响工厂效率,而且带来不可靠因素,直接影响到产品质量和生产成本,同时,设备信息的利用率也无法提高。因此,需要为此开发准确且高效的印刷设备自动检测机制。



技术实现要素:

本发明的主要目的是以大数据分析技术取代现有的人工分析,搭建基于spark分布式计算技术框架,对印刷设备的相关数据进行采集和存储,采用卷积神经网络与cart树结合的数据挖掘算法、分布式处理、预测性分析能力、语义引擎、数据质量和数据管理和数据可视化等大数据分析方法,对印刷设备进行检测和分析,使得机器能够自动发现印刷设备存在的问题。

为解决上述技术问题本发明的技术方案为:

一种基于大数据的印刷设备检测分析方法,其特征在于,具体步骤如下:

1.印刷设备数据采集。

需要采集的印刷设备数据包括印刷设备的呼叫记录、智能仪表数据、各传感器的监测数据、维护记录等。

2.将印刷设备数据传送至云端。

云端是基于spark分布式计算技术框架进行搭建的大数据平台。spark能快速处理多种场景下的大数据问题,能高效挖掘大数据中的价值,从而为印刷设备的故障分析提供决策支持。

3.对数据进行存储与数据预处理。

印刷设备数据存储在云端的shark中,shark是为了将hive应用移植到spark平台下而出现的数据仓库。将印刷设备数据存储在shark中,可以将数据进行持久化,能很方便的对相关数据进行业务逻辑查询,它也确保了数据的安全性。数据存储完成后可使用数据可视化技术对数据进行预处理,以便对数据进行更深入的分析。

4.使用数据挖掘算法提取出有用数据。

数据挖掘是指数据库中的知识发现,可用其提取出隐含其中、事先未被人们获知、却潜在有用的知识。本发明使用卷积神经网络与cart树算法进行数据挖掘。由于卷积神经网络适用于对海量数据进行特征提取,本发明首先通过卷积神经网络算法对印刷设备数据的有用特征进行提取,然后再使用cart树方法进行进一步特征选择,最终得到对于预测影响程度最大、最有用的特征信息,并将其用于预测分析。

5.利用分析预测算法对设备数据进行分析预测。

预测分析是一种统计或数据挖掘解决方案,可在结构化和非结构化数据中使用,以确定未来结果的算法和技术。本发明采用梯度提升树(gbdt)算法进行预测分析,梯度提升树是一个比较优秀的模型,它对于多维特征的数据集分类有很高的效率,还可以做特征重要性的选择。运行效率和准确率较高,实现起来也比较简单。通过在印刷设备大数据中挖掘出信息的特点与联系,就可以建立科学的梯度提升树预测模型,通过模型代入新的数据,从而对印刷设备的故障类型和潜在风险进行判断和预测。

6.将步骤5结果从云端传送至印刷设备,以日志形式进行存储,并根据处理结果进行响应。操作员排查印刷设备后,将结果反馈至大数据平台。

本发明的有益效果:

本发明基于大数据技术实现了印刷设备的故障检测、分析与预测。它适用于各大印刷企业日常使用,它改变了目前印刷企业机械故障诊断和预测方面所面临的困难,提高了诊断的正确率,及时的设备故障相应延长了设备的使用寿命,减少了由于设备故障产生的额外成本开销,故障预测也为印刷企业防微杜渐,修复印刷机器潜在的问题。这不仅会很大程度的推动印刷企业的发展,同时也会很大程度的提高我国的机械印刷水平。

附图说明

图1是基于大数据的印刷设备检测分析技术的操作流程图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

实施例

如图1所示,基于大数据的印刷设备检测分析技术具体包括以下步骤:

1.印刷设备数据采集。印刷设备的数据采集是故障诊断过程中的关键一步,能否获得准确的特征值直接关系这后续过程中机器的故障诊断和预测。印刷设备数据主要包括印刷设备的呼叫记录、智能仪表数据、设备运行和维护日志、电机扭矩和转速、印刷机噪声情况、滚筒振动、设备温度等。印刷设备的运行数据由相应的传感器测得,并保存在本地磁盘上,也可将采集到的数据即时传送到云端进行存储。

2.将印刷设备数据传送至云端。云端是基于spark分布式计算技术框架进行搭建的大数据平台。由第1步采集到的数据,通过互联网或局域网将其发送至云端设备,用于故障的诊断与预测。数据的传输采用sparkstreaming技术,它可以实现高吞吐、具备容错机制的实时流数据处理,并且能够支持从多种数据源获取数据,并将结果存储到数据库或文件系统中。

3.对数据进行存储与数据预处理。印刷设备数据存储在大数据平台的数据仓库shark中,不同的设备数据分别存储在不同的数据库表中,这样便于数据的统一化管理,也能够使用sql方便的进行业务逻辑查询。完成数据存储工作后,对数据进行预处理操作,例如对滚筒震动信号进行去噪处理,使用数据可视化技术将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。处理后的数据用于第4步和第5步的数据挖掘和分析预测操作。

4.使用卷积神经网络(cnn)与cart树结合的算法提取出有用数据。对于海量的数据集,找出其中有用的数据是提高运行效率和预测正确率的关键。在这一过程中寻找机器状态的特征值,它是反映机器故障状态的某些特征指标。例如第1步中所提到的滚筒振动谱、噪声、温度等。而这些数据中还分为故障相关和故障无关数据,本发明使用卷积神经网络算法,从大量数据集中提取有用特征,再使用cart树方法进行进一步的特征提取,得到可供故障诊断分析的数据,用于第5步的诊断和预测。

5.利用分析预测算法对设备数据进行分析预测。在预测分析前,需要训练相应的故障模型,本发明中采用gdbt模型来进行分析预测。采用gbdt故障树分析诊断法,它是一种将故障的形成原因,从总体到部件,按树枝形状逐步细化的方法,同时也是一种决策树模型。通过采集到的部分数据有监督地训练故障树,利用训练得到的故障树模型,将第4步获得的数据代入故障树,通过启发式的搜索,最终找到故障原因,同时,也对可能发生的故障进行预测。

6.将结果从云端传送至印刷设备,以日志形式进行存储,并根据处理结果进行响应。操作员根据云端诊断结果对设备进行排查,若有故障则进行维修;若有潜在故障则进行故障排查。然后将设备维护结果写入日志,并将日志回传至大数据端,大数据平台将日志存储,并用于故障模型的更新。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1