基于机器学习的数据训练方法及装置与流程

文档序号:15800136发布日期:2018-11-02 21:22阅读:226来源:国知局
基于机器学习的数据训练方法及装置与流程

本发明涉及机器学习的技术领域,尤其涉及基于机器学习的数据训练方法及装置。

背景技术

如图1所示,图中是一段数据序列的可视化,横坐标表示时间,纵坐标表示幅度;该数据序列特别重要的点包括:a特征即突发性扰动,b特征即低频变化,以及很多个s特征即例常扰动。

现有技术在对数据序列进行分析时,往往是单纯针对低频特征进行讨论,或者是单纯针对高频特征进行讨论,不能将低频特征和高频特征结合起来进行数据分析,对于图1中的数据序列,容易出现a特征或者b特征被忽略的情况,不能完整反映数据序列的特点。



技术实现要素:

为了克服现有技术的不足,本发明的目的在于提供基于机器学习的数据训练方法及装置,旨在解决现有技术对数据序列进行分析时容易出现某些特征被忽略、不能完整反映数据序列特点的问题。

本发明的目的采用以下技术方案实现:

一种基于机器学习的数据训练方法,包括:

低频检测步骤,检测数据序列中的低频特征,获取低频信息;

分段步骤,根据低频信息,对数据序列进行分段;

高频检测步骤,检测数据序列中的高频特征,获取高频信息;

装筐步骤,根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,得到装筐数据;

训练步骤,利用装筐数据,给定标签并进行神经网络训练,得到符合预期的神经网络。

在上述实施例的基础上,优选的,还包括:

诊断步骤,接收被诊断对象的执行状态数据,并依次进入低频检测步骤、分段步骤、高频监测步骤、装筐步骤,得到与执行状态数据相应的装筐数据;利用训练得到的神经网络,输入与执行状态数据相应的装筐数据,得到与执行状态数据相应的诊断结果。

在上述任意实施例的基础上,优选的,低频特征为持续时间超过总序列时间1/n的特征;高频特征为持续时间小于总序列时间1/n且大于等于单位时间的特征。

在上述任意实施例的基础上,优选的,低频信息包括低频特征的数量、发生时刻、持续时间、峰值;高频信息包括高频特征的数量、发生时刻、持续时间、峰值。

在上述任意实施例的基础上,优选的,所述分段步骤,具体为:

如果低频特征的数量为p,则将数据序列分段为第一低频特征之前、第一低频特征过程中、第一低频特征与第二低频特征之间、第二低频特征过程中、第二低频特征与第三低频特征之间……第p-1低频特征与第p低频特征之间、第p低频特征过程中、第p低频特征之后。

在上述任意实施例的基础上,优选的,所述装筐步骤,具体为:

根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,且各个分段内保存的高频特征数量相同,得到装筐数据。

一种基于机器学习的数据训练装置,包括:

低频检测模块,用于检测数据序列中的低频特征,获取低频信息;

分段模块,用于根据低频信息,对数据序列进行分段;

高频检测模块,用于检测数据序列中的高频特征,获取高频信息;

装筐模块,用于根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,得到装筐数据;

训练模块,用于利用装筐数据,给定标签并进行神经网络训练,得到符合预期的神经网络。

在上述实施例的基础上,优选的,还包括:

诊断模块,用于接收被诊断对象的执行状态数据,并依次调用低频检测模块、分段模块、高频监测模块、装筐模块,得到与执行状态数据相应的装筐数据;利用训练得到的神经网络,输入与执行状态数据相应的装筐数据,得到与执行状态数据相应的诊断结果。

在上述任意实施例的基础上,优选的,所述分段模块用于:

如果低频特征的数量为p,则将数据序列分段为第一低频特征之前、第一低频特征过程中、第一低频特征与第二低频特征之间、第二低频特征过程中、第二低频特征与第三低频特征之间……第p-1低频特征与第p低频特征之间、第p低频特征过程中、第p低频特征之后。

在上述任意实施例的基础上,优选的,所述装筐模块用于:

根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,且各个分段内保存的高频特征数量相同,得到装筐数据。

相比现有技术,本发明的有益效果在于:

本发明公开了基于机器学习的数据训练方法及装置,能够结合低频特征和高频特征对数据序列进行分析,检测数据序列中的低频特征和高频特征,根据低频特征对数据序列进行分段,找出每个分段内的高频特征,根据上述步骤得到的数据给定标签并进行神经网络训练,得到符合预期的神经网络。本发明根据低频特征对数据序列进行分段,考虑到了低频特征的影响;每个分段内的高频特征予以保留,避免了高频特征被忽略的情况,考虑到了高频特征的影响,因此能够完整反映数据序列的特点。优选的,得到的神经网络可以用于数据诊断,对于能够反映被诊断对象的真实动态过程的数据,只要数据与动作过程有强相关性即可利用本发明实施诊断,应用到对电磁继电器和/或与之类似的利用电磁力实现机械动作的一大类装置如电磁阀的动作诊断中,可以发现故障尤其是微小故障。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1示出了一段数据序列的可视化;

图2示出了本发明实施例提供的一种基于机器学习的数据训练方法的流程示意图;

图3示出了本发明实施例提供的一种基于机器学习的数据训练装置的结构示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

本发明实施例中的被诊断对象,可以是电磁继电器和/或与之类似的利用电磁力实现机械动作的一大类装置,例如电磁阀。

具体实施例一

如图1和图2所示,本发明实施例提供了一种基于机器学习的数据训练方法,包括以下步骤。

低频检测步骤s101,检测数据序列中的低频特征,获取低频信息。例如获取如b这样的低频特征的参数。

分段步骤s102,根据低频信息,对数据序列进行分段。

高频检测步骤s103,检测数据序列中的高频特征,获取高频信息;该步骤检测如a和s这样的比b频率高的特征的参数。

装筐步骤s104,根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,得到装筐数据。

训练步骤s105,利用装筐步骤s104得到的数据结果,给定标签并进行神经网络训练,得到符合预期的神经网络。

本发明实施例能够结合低频特征和高频特征对数据序列进行分析,检测数据序列中的低频特征和高频特征,根据低频特征对数据序列进行分段,找出每个分段内的高频特征,根据上述步骤得到的数据给定标签并进行神经网络训练,得到符合预期的神经网络。本发明实施例根据低频特征对数据序列进行分段,考虑到了低频特征的影响;每个分段内的高频特征予以保留,避免了高频特征被忽略的情况,考虑到了高频特征的影响,因此能够完整反映数据序列的特点。

优选的,本发明实施例还可以包括:诊断步骤s106,接收被诊断对象的执行状态数据,并依次进入低频检测步骤s101、分段步骤s102、高频监测步骤s103、装筐步骤s104,得到与执行状态数据相应的装筐数据;利用训练得到的神经网络,输入与执行状态数据相应的装筐数据,得到与执行状态数据相应的诊断结果。这样做的好处是,得到的神经网络可以用于数据诊断,本发明实施例对所诊断的数据不做限定,对于能够反映被诊断对象的真实动态过程的数据,只要数据与动作过程有强相关性即可利用本发明实施诊断,应用到对电磁继电器和/或与之类似的利用电磁力实现机械动作的一大类装置如电磁阀的动作诊断中,可以发现故障尤其是微小故障,此时训练步骤s105中,给定的标签可以为故障相关参数。本发明实施例中,被诊断对象的执行状态可以包括正常且无放电、正常单有梳状放电、正常但发生了弹跳放电等。

优选的,本发明实施例中,低频特征可以为持续时间超过总序列时间1/n的特征;高频特征可以为持续时间小于总序列时间1/n且大于等于单位时间的特征,任意符合“长度小于1/n且大于等于1的”特征都可以被检测。本发明实施例对n不做限定,优选的,n=4。

优选的,低频信息可以包括低频特征的数量、发生时刻、持续时间、峰值;高频信息可以包括高频特征的数量、发生时刻、持续时间、峰值。发生时刻即低频特征/高频特征的峰或谷对应到横轴上的时刻、持续时间即低频特征/高频特征的长度、峰值即低频特征/高频特征的峰或谷对应的纵轴读数。

本发明实施例对获取低频特征的方式不做限定,只要能够获得低频特征的方法均可使用且不影响结果。

优选的,所述分段步骤s102,可以具体为:如果低频特征的数量为p,则将数据序列分段为第一低频特征之前、第一低频特征过程中、第一低频特征与第二低频特征之间、第二低频特征过程中、第二低频特征与第三低频特征之间……第p-1低频特征与第p低频特征之间、第p低频特征过程中、第p低频特征之后。例如图1中根据低频特征b可分为三段:b特征之前、b特征过程中和b特征之后;如找到多于1个的类似b的低频特征,比如2个,则变成5个分段:b1之前、b1过程中、b1和b2之间、b2过程中、b2之后;如果再增加则如上类推。

优选的,所述装筐步骤s104,可以具体为:根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,且各个分段内保存的高频特征数量相同,得到装筐数据。装筐步骤s104可以将每个分段起止时间内检测到的高频信息分段保存而且保证每个分段内保存的高频特征数量是统一的,例如可以规定保留任意多个高频特征,且每个分段都要保留同样多的高频特征。例如每段内只保留10个而且只保留峰值最大的10个。如果要舍弃也不是一定要按照留峰值由大到小排序,而是可以用任何统一的方法如按照频率高低排序且只保留频率高的m个高频特征,进一步如果某个分段内高频特征本身数量不足则用0填充但是一定要保留足够多个,保证该分段和其他分段所保存的高频特征数量相同。

本发明实施例对训练步骤s105中进行神经网络训练所使用的神经网络模型不做限定,其可以是cnn也可以是rnn或lsmt以及其它;装筐步骤s104所得到的数据结果中包含了被诊断对象的信息,因此只需要在训练步骤s105中给定标签并进行bp直至训练得到预期的nn,而此后仍然用上述步骤s101~步骤s104的方法获得数据,输入nn即可得到诊断结果。

在上述的具体实施例一中,提供了基于机器学习的数据训练方法,与之相对应的,本申请还提供基于机器学习的数据训练装置。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

具体实施例二

如图3所示,本发明实施例提供了一种基于机器学习的数据训练装置,包括:

低频检测模块201,用于检测数据序列中的低频特征,获取低频信息;

分段模块202,用于根据低频信息,对数据序列进行分段;

高频检测模块203,用于检测数据序列中的高频特征,获取高频信息;

装筐模块204,用于根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,得到装筐数据;

训练模块205,用于利用装筐模块得到的数据结果,给定标签并进行神经网络训练,得到符合预期的神经网络。

本发明实施例能够结合低频特征和高频特征对数据序列进行分析,检测数据序列中的低频特征和高频特征,根据低频特征对数据序列进行分段,找出每个分段内的高频特征,根据上述过程得到的数据给定标签并进行神经网络训练,得到符合预期的神经网络。本发明实施例根据低频特征对数据序列进行分段,考虑到了低频特征的影响;每个分段内的高频特征予以保留,避免了高频特征被忽略的情况,考虑到了高频特征的影响,因此能够完整反映数据序列的特点。

优选的,本发明实施例还可以包括:诊断模块206,用于接收被诊断对象的执行状态数据,并依次调用低频检测模块201、分段模块202、高频监测模块203、装筐模块204,得到与执行状态数据相应的装筐数据;利用训练模块205训练得到的神经网络,输入与执行状态数据相应的装筐数据,得到与执行状态数据相应的诊断结果。

优选的,所述分段模块202可以用于:如果低频特征的数量为p,则将数据序列分段为第一低频特征之前、第一低频特征过程中、第一低频特征与第二低频特征之间、第二低频特征过程中、第二低频特征与第三低频特征之间……第p-1低频特征与第p低频特征之间、第p低频特征过程中、第p低频特征之后。

优选的,所述装筐模块204可以用于:根据数据序列的分段结果,将每个分段起止时间内检测到的高频信息分别保存,且各个分段内保存的高频特征数量相同,得到装筐数据。

本发明从使用目的上,效能上,进步及新颖性等观点进行阐述,其具有的实用进步性,己符合专利法所强调的功能增进及使用要件,本发明以上的说明及附图,仅为本发明的较佳实施例而己,并非以此局限本发明,因此,凡一切与本发明构造,装置,待征等近似、雷同的,即凡依本发明专利申请范围所作的等同替换或修饰等,皆应属本发明的专利申请保护的范围之内。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1