一种基于高质量时域特征的焊偏实时智能检测方法与流程

文档序号:32044601发布日期:2022-11-03 06:35阅读:150来源:国知局
一种基于高质量时域特征的焊偏实时智能检测方法与流程

1.本发明涉及智慧焊接技术领域,特别涉及一种基于高质量时域特征的焊偏实时智能检测方法。


背景技术:

2.焊接作为现代制造业的重要工艺过程,广泛应用于包括航空航天、石油管道、机械制造在内的多个工业领域。随着自动化焊接技术的发展,焊接也从手工焊接逐步向自动焊接过渡。焊接机器人作为自动化焊接的重要载体,越来越多地应用于工厂生产过程中。焊接机器人具有效率高、质量稳定、节省人工成本、通用性强等优点,随着焊接机器人的普及,工厂生产效率得到大幅度提升,但焊接质量问题也不容忽视。焊接缺陷直接影响着机械的安全运行。因此,将焊接缺陷尽量控制在允许范围内是每名焊接操作人员和工程管理人员应尽的责任。
3.焊偏是焊接缺陷中比较常见的一种,也是在焊接机器人生产过程中最常发生的故障。在实际生产过程中,一个工人师傅要同时操作几台焊接机器人,并对这几台机器人生产出的工件进行检查,是否发生焊接缺陷,并进行修补。这种依靠人工进行焊偏检测的方式非常浪费时间、效率很低,而如果能在焊接过程中实时对焊偏缺陷进行检测并报警,则可提高缺陷检查的效率,避免“焊后检测”带来的后期修复程序复杂、成本高昂的代价。
4.现有技术中多以基于机器视觉的检测方法为主,视觉传感器具有信息量大、与工件不接触、灵敏度和精度高、抗电磁干扰能力强等优点,可以在不影响生产的情况下进行焊接质量的监测分析。图像处理是视觉传感焊接质量分析的软核心,通过对视觉传感器所采集的图像信息进行加工处理,提取焊接缺陷的特性信息,判断焊接质量问题。但基于机器视觉的焊接质量检测依旧存在不够实时的问题,无法针对焊偏的特殊场景进行实时、准确检测,此外,焊后检测也会因为无法及时反馈控制焊接动作造成实质上的焊接材料及返工成本的双重浪费。
5.中国专利cn114646665a(公开日20220621)公开了另一种电弧焊焊接缺陷实时检测方法,采集焊接电压数据,利用概率分布曲线分别计算至少一种特征值,并判断特征值是否小于预设阈值,以此方法来识别是否发生焊接缺陷,并未给出适应焊偏场景的特征值选择方法。


技术实现要素:

6.发明目的:针对上述背景技术中存在的问题,本发明提供了一种基于高质量时域特征的焊偏实时智能检测方法,针对采集的高频时序数据,提取高质量时域特征构造特征数据集,并用于机器学习分类算法的模型训练,最终获得更适合焊偏场景的焊偏识别模型。
7.技术方案:一种基于高质量时域特征的焊偏实时智能检测方法,包括以下步骤:步骤s1、采集高频时序数据并进行预处理,生成样本数据集;步骤s2、基于样本数据集构造特征数据集,获取各样本的特征数据集;所述特征数
据集包括以下时域特征中的一种或多种:(1)脉冲周期;(2)电压脉冲峰值的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度;(3)电流脉冲峰值的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度;(4)电压脉冲谷值的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度;(5)电流脉冲谷值的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度;(6)子窗口特征;步骤s3、基于构造的特征数据集,选择机器学习分类算法进行模型训练,获得焊偏识别模型;步骤s4、部署焊偏识别模型,获取高频时序数据并进行焊偏实时检测。
8.进一步地,步骤s1中所述高频时序数据包括电流、电压数据。
9.进一步地,步骤s1中所述预处理步骤包括:步骤s1.1、将采集到的高频时序数据按预设窗长window_size进行划窗采样;设定电压阈值th1、th2和数据点个数阈值α、β;当电压低于th1的数据点个数小于α且电压高于th2的数据点个数小于β时,判断为正常起弧状态,否则即为非起弧状态;过滤所有非起弧状态样本,保留正常起弧状态的焊接样本数据集;步骤s1.2、基于人工现场标注的焊偏起始时间和终止时间为焊接样本数据集标注,其中正常焊接标注为0,发生焊偏标注为1;步骤s1.3、将焊接样本数据集随机乱序,并按预设比例划分为训练集、验证集和测试集。
10.进一步地,针对步骤s1.3中划分的训练集进行数据增强,具体步骤包括:针对步骤s1.3中划分的训练集进行数据增强,具体步骤包括:步骤s1.3.1、将训练集中所有样本的电流和电压数据分别拼接成长序列,依次记为current_list和voltage_list;所述长序列长度len=m*window_size,其中m为训练集样本个数;步骤s1.3.2、从(λ1,len-λ2)区间中随机抽取k个整数,生成start_list列表,作为新生成电流、电压序列的备选开始点,其中λ1、λ2为预设常数;步骤s1.3.3、将start_list列表从小到大排序,遍历列表中的元素;当元素l整除window_size的余数小于0.2*window_size或元素l整除window_size的余数大于0.8*window_size时,剔除元素l;步骤s1.3.4、针对经步骤s1.3.3处理后的start_list列表,进一步遍历所有元素,当任意相邻两元素之差start_list[i+1]-start_list[i]≤0.4*window_size时,剔除start_list[i+1],否则保留元素,其中i为整数且0≤i<len-1;不断迭代,最终生成新的开始点列表start_list_final;步骤s1.3.5、遍历start_list_final中的每个元素s,新生成的每个电流序列为
current_list[s,s+window_size],新生成的每个电压序列为voltage_list[s,s+window_size]。
[0011]
进一步地,步骤s2中所述脉冲周期计算方法如下:设置count初始值为0,遍历电流序列的每一个点,当前一个点小于等于η而后一个点大于等于η时,count=count+1,其中η为预设阈值;遍历完成后的count即为脉冲周期。
[0012]
进一步地,步骤s2中所述子窗口特征如下:将每个样本拆分为n个子窗口,分别计算每个子窗口内电流、电压的和、最大值、最小值、分位数特征,得到m个长度为n的序列,其中m为计算的特征个数;分别计算m个序列的方差,即为子窗口特征。
[0013]
进一步地,步骤s2中所述时域特征还包括:(1)电流的分位数、中位数、均值、方差、最大值、最小值;(2)电压的分位数、中位数、均值、方差、最大值、最小值;(3)电流的偏度、峭度、波形因子、脉冲因子、裕度因子、峰值因子;(4)电压的偏度、峭度、波形因子、脉冲因子、裕度因子、峰值因子。
[0014]
进一步地,所述步骤s3中选用的机器学习分类算法包括但不限于xgboost、lightgbm、随机森林、支持向量机、朴素贝叶斯;选用其中一种独立算法或多种算法融合进行模型训练,得到焊偏识别模型。
[0015]
有益效果:(1)本发明提供的基于高质量时域特征的焊偏实时智能检测方法,创造性地设计了包括脉冲相关时域特征、电压电流峰谷值相关统计学特征和子窗口特征在内的多项时域特征,添加至传统时域特征数据集中,作为机器学习分类算法的训练依据,最终得出的焊偏缺陷识别模型,相比于仅采用传统时域特征搭建的焊偏识别模型,在召回率指标上具有显著提高。基于模型导出的特征重要性排序也可以看出,本发明添加的关键性特征在众多备选特征中排名靠前,对焊偏缺陷模型的召回率影响更高,进一步证明了本发明设置的高质量时域特征可以有效提升焊偏缺陷模型的准确性。
[0016]
(2)本发明在针对高频时序数据的预处理阶段设置了过滤条件,过滤了异常样本后进行现场标注,并划分数据集,针对划分出的训练集设计了具体的数据增强方法,扩充焊偏样本,解决了训练集中焊偏样本较少的问题。
[0017]
(3)本发明设计的各项时域特征适用于多种机器学习分类算法模型,可以选用常用机器学习分类算法模型中的一种或多种进行融合,在兼顾特征选择普适性的同时,具备良好的模型识别效果。
附图说明
[0018]
图1本发明提供的基于高质量时域特征的焊偏实时智能检测方法流程图;图2为正常焊接情况下电压变化曲线;图3为焊偏缺陷下电压变化曲线;图4为本发明实施例中焊偏识别模型导出的各特征重要性排序图;图5为采用本发明提供的所有时域特征搭建焊偏识别模型对应的混淆矩阵;图6为只采用传统时域特征搭建的焊偏识别模型对应的混淆矩阵。
具体实施方式
[0019]
下面结合附图对本发明做更进一步的解释。
[0020]
本发明针对在搭建焊偏缺陷识别模型时采用传统时域特征构建特征数据集存在识别精度不高,对焊偏场景识别不够敏感的问题,创造性地设计了若干关键时域特征,用于构建对焊偏场景更加敏感的特征数据集,进而训练机器学习分类算法模型,获得最终的焊偏识别模型。下面给出具体实施例,流程如图1所示,包括以下步骤:步骤s1、采集高频时序数据并进行预处理,生成样本数据集。上述时序数据主要包括电流数据、电压数据、保护气体流速、送丝速度等。本实施例中选取高频电流数据和电压数据生成样本数据集。针对样本数据集进行相应预处理,包括划窗采样、过滤非起弧样本、样本标注、数据集划分和数据增强。具体地,步骤s1.1、将采集到的高频时序数据按预设窗长window_size进行划窗采样。本实施例中window_size=1000。
[0021]
设定电压阈值th1、th2和数据点个数阈值α、β。当电压低于th1的数据点个数小于α且电压高于th2的数据点个数小于β时,判断为正常起弧状态,否则即为非起弧状态。过滤所有非起弧状态样本,保留正常起弧状态的焊接样本数据集。本实施例中,th1=5,th2=15,α=60,β=50。
[0022]
步骤s1.2、基于现场人工标注的焊偏起始时间和终止时间为焊接样本数据集标注,其中正常焊接标注为0,发生焊偏标注为1。
[0023]
步骤s1.3、将生成的所有焊接样本数据集随机乱序,设定训练集样本的比例train_size、验证集样本的比例dev_size和测试机样本比例test_size。按照比例截取训练样本train_data和验证集样本dev_data,剩余的即为测试集test_data,实施例中train_size=0.6,dev_size=0.2,test_size=0.2。
[0024]
针对划分出的训练集进行数据增强,进而扩充焊偏样本,解决训练集焊偏样本较少的问题。具体步骤如下:(1)分别将训练集的所有样本的电流和电压数据各拼接成一个长序列,分别记为current_list和voltage_list。假设训练集样本个数为m,则长序列的长度len=m*window_size。
[0025]
(2)从(λ1,len-λ2)区间中随机抽取k个整数,生成start_list列表,作为新生成电流、电压序列的备选开始点,其中λ1、λ2为预设常数。本实施例中λ1=250,λ2=1250,k=2500。
[0026]
(3)将start_list列表从小到大排序,遍历start_list列表中的k个元素,若该元素整除window_size的余数小于0.2*window_size或整除window_size的余数大于0.8*window_size,则从start_list列表中剔除该元素。
[0027]
(4)设置i=0,当i小于len-1时,判断start_list[i+1]-start_list[i]是否大于0.4*window_size,若是,则i=i+1,若否,则移除掉start_list[i+1]这个元素。得到最终的新生成电流、电压序列的开始点列表,记为start_list_final。
[0028]
(5)遍历start_list_final中的每个元素s,则新生成的每个电流序列为current_list[s,s+window_size],新生成的每个电压序列为voltage_list[s,s+window_size]。
[0029]
以current_list[s,s+window_size]为例说明,新生成的电流序列即为从原长序列current_list中截取的若干段起止区间为[s,s+window_size]的序列的集合。
[0030]
步骤s2、基于样本数据集构造特征数据集,获取各样本的特征数据集。
[0031]
一般情况下搭建机器学习分类算法模型的特征数据集包括以下时域特征:(1)电流的分位数、中位数、均值、方差、最大值、最小值。
[0032]
(2)电压的分位数、中位数、均值、方差、最大值、最小值。
[0033]
(3)电流的偏度、峭度、波形因子、脉冲因子、裕度因子、峰值因子。
[0034]
(4)电压的偏度、峭度、波形因子、脉冲因子、裕度因子、峰值因子。
[0035]
上述特征均为基于采集的电流或电压数据本身进行分析得到的一系列统计学特征。本实施例在此基础上,针对采集的高频电流、电压数据进一步设计了以下关键时域特征:(1)脉冲周期。
[0036]
本实施例中脉冲周期采用电流序列进行计算,对应的电压序列脉冲周期相同。具体计算方法如下:设置count初始值为0,遍历电流序列的每一个点,当前一个点小于等于η而后一个点大于等于η时,count=count+1,其中η为预设阈值。遍历完成后的count即为脉冲周期。本实施例中设置η=300。
[0037]
(2)电压脉冲峰值集合的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度。
[0038]
(3)电流脉冲峰值集合的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度。
[0039]
(4)电压脉冲谷值集合的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度。
[0040]
(5)电流脉冲谷值集合的方差、一阶差分的方差、分位数、一阶差分的分位数、最大值、最小值、偏度、峭度。
[0041]
本实施例分别统计了电压、电流脉冲的峰谷值集合,从4个集合中分别计算其统计学特征,作为关键时域特征,即上述(2)-(5)项。
[0042]
(6)子窗口特征。
[0043]
如图2-图3所示,正常焊接情况下电压随时间变化较为规整,而出现焊偏缺陷时,电压则会存在明显参差现象,因此本实施例针对上述情况,构造若干子窗口,用于表征焊偏缺陷。子窗口特征设计如下:将每个样本拆分为n个子窗口,分别计算每个子窗口内电流、电压的和、最大值、最小值、分位数特征,得到m个长度为n的序列,其中m为计算的特征个数。分别计算m个序列的方差,即为子窗口特征。本实施例中取子窗口数量n=10,特征个数取m=8,分别为电流、电压子窗口和的方差,最小值的方差,25%分位数的方差和75%分位数的方差。
[0044]
步骤s3、将上述构建的高质量时域特征添加至传统时域特征数据集中,形成本实施例特有的特征数据集,进一步选择机器学习分类算法进行模型训练,获得焊偏识别模型。
[0045]
本实施例中选取的机器学习分类算法为xgboost,实际应用中可以采用xgboost、lightgbm、随机森林、支持向量机、朴素贝叶斯等常用算法模型中的一种或多种算法融合进行模型训练。xgboost模型训练完成后,获取模型的部分特征重要性排名如图4所示,其中横坐标代表特征重要性得分,纵坐标代表特征种类,从上到下依次为:1-电流方差;2-电流脉
冲谷值的25%分位数;3-电流脉冲峰值的75%分位数;4-电流的峭度;5-电流的偏度;6-电流脉冲谷值的75%分位数;7-电压子窗口25%分位数的方差;8-电流最小值;9-脉冲周期;10-电流最大值;11-电流脉冲谷值的平均值;12-电流脉冲峰值的中位数。可以看出,本发明选取的高质量时域特征,在所有特征的重要性排序中比较靠前,对焊偏缺陷的测量准确率有重要影响。
[0046]
步骤s4、部署焊偏识别模型,获取高频时序数据并进行焊偏实时检测。
[0047]
本实施例通过对比正常焊接和焊偏情况下的电流、电压等高频时序数据,并进一步分析,设计若干高质量时域特征,结合传统时域特征数据,搭建具备较好识别效果的焊偏识别模型。如图5所示为采用本发明提供的所有时域特征搭建焊偏识别模型对应的混淆矩阵,其召回率指标可达58.84%,图6为只采用传统时域特征搭建的焊偏识别模型对应的混淆矩阵,其召回率指标仅为41.16%。可以直观看出,本发明提供的焊偏识别模型识别效果大幅度提高,适用于高精度工业焊接场景下的焊偏缺陷识别。
[0048]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1