一种数据不平衡的电梯振动影响因素分析方法与流程

文档序号:24897089发布日期:2021-04-30 13:47阅读:146来源:国知局

本发明涉及计算机技术领域,尤其涉及一种数据不平衡的电梯振动影响因素分析方法。



背景技术:

随着城镇化政策的加强贯彻,城市高层拔地而起,电梯保有量以15%的年增长率增长。进而电梯的运行安全也变得日益重要。随着物联网基建技术的加快推进,电梯加装的传感器也与日俱增。通过24小时在线监测电梯的运行状态,及时发现电梯安全隐患,并以系统推送告警到相关单位,将故障扼杀在早期,即可有效地保障了人民的安全出行。

目前,基于物联网传感器监测电梯的告警中,包括速度异常、温度异常等,尤以基于加速度传感器监测的振动告警为各单位监测电梯的舒适度以及安全隐患提供了有效的数据服务。这种监测手段则难以对电梯的振动故障做出准确的判断。从而导致电梯振动告警频发。



技术实现要素:

本发明的目的在于提供一种数据不平衡的电梯振动影响因素分析方法。

为实现上述发明目的,本发明提供一种数据不平衡的电梯振动影响因素分析方法,包括:

s1.基于物联网设备采集电梯的运行数据,以及电梯的振动故障数据;

s2.基于采集到的所述振动故障数据的数据量,按照预设比例对所述运行数据进行采样,以使所述振动故障数据的数据量与所述运行数据的数据量达到平衡;

s3.采用预设的规约方式对所述运行数据进行规约离散处理;

s4.基于所述振动故障数据和规约离散处理后的所述运行数据,进行关联分析,获取所述振动故障数据与所述运行数据之间的关联规则;

s5.对所述关联规则进行测试验证,若所述关联规则满足要求,则进行线上部署。

根据本发明的一个方面,步骤s4中,基于所述振动故障数据和规约离散处理后的所述运行数据,进行关联分析,获取所述振动故障数据与所述运行数据之间的关联规则的步骤中,包括:

s41.设置支持度阈值以及置信度阈值;

s42.以规约离散处理后的所述运行数据为输入,以所述获取振动故障数据为输出,并采用关联规则分类算法进行频繁项集挖掘,获取所述运行数据与所述振动故障数据所有的关联规则;

s43.通过所述置信度阈值对所述关联规则进行筛选,获取有效的所述关联规则。

根据本发明的一个方面,步骤s5中,若所述关联规则不满足要求,则对步骤s41中的所述支持度阈值和所述置信度阈值进行重新设定。

根据本发明的一个方面,步骤s5中,若所述关联规则不满足要求,则对步骤s3中预设的规约方式进行优化。

根据本发明的一个方面,步骤s1中,所述运行数据包括:电梯开始运行楼层、到达楼层、运行时长、开始运行时间、运行方向、开门次数、关门次数、是否平层、有人时长。

根据本发明的一个方面,步骤s2中,基于采集到的所述振动故障数据的数据量,按照预设比例对所述运行数据进行采样的步骤中,所述振动故障数据的数据量与所述运行数据的数据量之间的预设比例为1:1至1:5之间。

根据本发明的一个方面,步骤s2中,基于采集到的所述振动故障数据的数据量,按照预设比例对所述运行数据进行采样的步骤中,采样方法为按维度分层抽样,系统抽样或者简单随机抽样中的至少一种。

根据本发明的一个方面,步骤s3中,所述规约方式为分位数法、距离区间法、频率区间法、聚类法、卡方过滤法中的至少一种。

根据本发明的一个方面,步骤s5中,基于所述关联规则,计算出所述关联规则的准确率和召回率,若所述准确率和召回率均满足要求,则进行线上部署;

其中,所述准确率为:

其中,tp表示真正例,fp表示假正例;

所述召回率为:

其中,tp表示真正例,fn表示假反例。

根据本发明的一种方案,具有优良的自动化甄别性能,尤其是对于隐患初期等表明振动严重级别的情况,能够被有效识别出来,方便了各监管单位对电梯的及时维护,有效降低电梯故障率。

根据本发明的一种方案,本发明基于物联网采集的电梯运行数据,在故障数据和正常数据不平衡的真实场景下,采用一种基于采样再平衡的关联分析方法,一方面有效解决了故障数据极少造成的挖掘不到有效规则及关注点的不足,算法效果可嘉;另一方面,在大数据场景下,采样再平衡的关联分析方法很大程度上提高了计算速度,在大数据频繁模式挖掘上性能可嘉。

根据本发明的一种方案,基于关联分析识别出的关联规则具有很强的可解释性,这极大便利了电梯相关人员对振动故障的了解和掌握。

根据本发明的一种方案,本发明采用了物联网、大数据、数据挖掘等技术,通过对故障数据和正常数据的采样再平衡方法,以故障数据和正常数据为目标,挖掘电梯振动故障的影响因子,提高了分析挖掘的准确性的同时提高了计算效率,从而便于各相关单位人员有效了解电梯故障特征,继而采取针对性的维护保养,提高人民乘梯的舒适性及安全性。

附图说明

图1是示意性表示根据本发明的一种实施方式的电梯振动影响因素分析方法的步骤框图。

图2是示意性表示根据本发明的一种实施方式的电梯振动影响因素分析方法的流程图。

具体实施方式

下面结合附图和具体实施方式对本发明作详细地描述,实施方式不能在此一一赘述,但本发明的实施方式并不因此限定于以下实施方式。

结合图1和图2所示,根据本发明的一种实施方式,本发明的一种数据不平衡的电梯振动影响因素分析方法,包括:

s1.基于物联网设备采集电梯的运行数据,以及电梯的振动故障数据;

s2.基于采集到的振动故障数据的数据量,按照预设比例对运行数据进行采样,以使振动故障数据的数据量与运行数据的数据量达到平衡;

s3.采用预设的规约方式对运行数据进行规约离散处理;

s4.基于振动故障数据和规约离散处理后的运行数据,进行关联分析,获取振动故障数据与运行数据之间的关联规则;

s5.对关联规则进行测试验证,若关联规则满足要求,则进行线上部署。

结合图1和图2所示,根据本发明的一种实施方式,步骤s1中,通过数据采集模块通过物联网采集电梯的运行数据,以及电梯的振动故障数据。在本实施方式中,运行数据包括:电梯开始运行楼层、到达楼层、运行时长、开始运行时间、运行方向、开门次数、关门次数、是否平层、有人时长。

结合图1和图2所示,根据本发明的一种实施方式,数据再平衡模块针对振动故障数据的数据量极少、正常的运行数据的数据量极多的情况,进行了振动故障数据的数据量和运行数据的数据量的优化。具体的,针对采集到的振动故障数据,按照按照预设比例对运行数据进行采样。在本实施方式中,振动故障数据的数据量与运行数据的数据量之间的预设比例为1:1至1:5之间。以使数据达到平衡,降低故障数据被大量正常的运行数据掩盖而无法获取关联规则的影响。

结合图1和图2所示,根据本发明的一种实施方式,步骤s2中,基于采集到的振动故障数据的数据量,按照预设比例对运行数据进行采样的步骤中,采样方法为按维度分层抽样,系统抽样或者简单随机抽样中的至少一种。

结合图1和图2所示,根据本发明的一种实施方式,数据规约模块针对电梯的运行数据进行规约离散,为系一部关联分析挖掘频繁项集做数据准备,得到李丹化后的属性标识。在本实施方式中,预设的规约方式为分位数法、距离区间法、频率区间法、聚类法、卡方过滤法中的至少一种。

根据本发明的一种实施方式,在步骤s4中,通过关联分析模块执行关联规则的获取,其采用关联分析方法挖掘频繁项集,该关联分析方法可采用apriori、fp-growth、prefixspan等。在关联分析(associationanalysis)过程中,其主要任务在于从大数据集中寻找有趣的关系。这其中设计以下参数:

频繁项集(frequentitemsets):经常一起出现的属性集合,即包含0个或多个项的集合称作项集。

支持度(support):数据集中包含该项集的记录所占的比例,是针对项集而言;

其中,a->b为一条关联规则,p(ab)为项ab的联合概率,#ab为ab同时在所有记录中出现的记录条目数,n则为总记录条目数。

置信度(confidence):出现某属性时,另外一些属性必定出现的概率,即条件概率,是针对规则而言;

其中,p(b|a)为b在a下的条件概率,p(a)为项a的概率,#a为a在所有项中出现的记录条目数。

关联规则(associationrules):暗示两个属性之间可能存在很强的关系。

形如a->b的表达式,规则a->b的度量包括支持度和置信度,表示为:

a->b(s=s%,c=c%)

其中,a和b分别为规则的前项和后项,前项为项目或项集,后项表示某种结论或事实。s=s%表示规则支持度为s%,c=c%表示规则置信度为c%。

在本发明中,后项b则表示为电梯振动故障(与振动故障数据相关),a则为基于电梯运行数据规约划分后的属性集形成的项集(即基于规约处理后的运行数据所构成的频繁项集)。

具体的,步骤s4中,基于振动故障数据和规约离散处理后的运行数据,进行关联分析,获取振动故障数据与运行数据之间的关联规则的步骤中,包括:

s41.设置支持度阈值以及置信度阈值;在本实施方式中,支持度阈值设置为最小支持度值,置信度阈值设置为最小置信度值。

s42.以规约离散处理后的运行数据为输入,以获取振动故障数据为输出,并采用关联规则分类算法进行频繁项集挖掘,获取运行数据与振动故障数据所有的关联规则;

s43.通过置信度阈值对关联规则进行筛选,获取有效的关联规则。

结合图1和图2所示,根据本发明的一种实施方式,通过测试验证模块进行关联规则的验证。其更具设定的最小支持度和最小置信度,在大数据下基于关联分析算法挖掘出的关联规则进行测试验证,主要验证基于关联规则所计算出的精确率(precision)和召回率(recall),尤以精确率为准。在本实施方式中,当获得的精确率和召回率满足要求时,则将获取的关联规则进行线上部署。

在本实施方式中,步骤s5中,若关联规则不满足要求,则对步骤s41中的支持度阈值和置信度阈值进行重新设定。进一步的,若对支持度阈值和置信度阈值进行重新设定后所获得的关联规则未满足验证要求,则对步骤s3中预设的规约方式进行优化。在本实施方式中,对预设的规约方式进行优化的过程中采用数据驱动的优化方式,根据数据统计分布,重新规约。

结合图1和图2所示,根据本发明的一种实施方式,步骤s5中,精确率和召回率均是在分类结果的混淆矩阵(confusionmatrix)下计算得到。

为便于说明,进行列表表示,如下表1:

其中,准确率为:

其中,tp表示真正例,fp表示假正例;

召回率为:

其中,tp表示真正例,fn表示假反例。

在本实施方式中,在将获取的有效关联规则部署上线后,由运行的系统自动化识别出影响电梯振动的因素,并将分析结果发布到web端以及app端,供相关人员查看,并对电梯采取针对性的维修措施。

为进一步说明本发明,通过如下实施例作进一步阐述。

在本实施方式中,涉及到的振动故障样例数(即振动故障数据)为3195(正例),而正常样例数(即电梯的运行数据)为320046(反例),正例和反例的比例约为1:100,样本极度不平衡。为了使得样本平衡,能够挖掘有效的频繁项集,且提高数据的计算速度,本实施方式中,针对反例采用了按加速度的方差进行的分层采样方法,得到最终参与分析挖掘的负例数量为8053起。

于是,基于3195起的正例和8053起的反例,本发明后续的步骤具体如下:

提取上述共计3195+8053=11248起运行提取出相关运行数据,包括:开始运行时间、运行时长、出发楼层、到达楼层、运行方向、平层状态、有人的时长等;

针对上述数据,进行数据规约。具体规约方法如下:

采用关联规则分类算法进行频繁项集挖掘。设定参数如下:min-support=0.001,min-confidence=0.5。

得到的部分规则举例如下:

注:上述positive指电梯振动故障,为正例;negative指正常运行,为负例。rules为关联规则,support为支持度,confidence为置信度,count为满足规则的记录条目数。

根据上述表格的部分规则,筛选出有效的关联规则。其中,筛选出的有效规则如下:

{cost='cost4',andstart='start1',anddown='down1'}=>{reviewresult=positive}

通过对筛选出的有效关联规则进行测试验证,且该规则的置信度达到95.66%,即精确度为95.66%,且召回率=2140*100/3195=66.98%。

另外,从规则也可以直观的对电梯振动故障进行解释如下:

在所学习的样本实验下,如果满足运行时长超过30s(30000ms)、从1楼及更低楼出现,且是在高峰运行,则有95.66%的概率发生剧烈振动。

上述内容仅为本发明的具体方案的例子,对于其中未详尽描述的设备和结构,应当理解为采取本领域已有的通用设备及通用方法来予以实施。

以上所述仅为本发明的一个方案而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1