一种应用于机器学习的时序特征有效窗口提取方法与流程

文档序号:20779893发布日期:2020-05-19 21:08阅读:296来源:国知局
一种应用于机器学习的时序特征有效窗口提取方法与流程

本发明涉及工业焊接机器人焊缝偏移检测技术领域,尤其是一种应用于机器学习的时序特征有效窗口提取方法。



背景技术:

随着制造技术的快速发展,焊接制造自动化与智能化已成为必然趋势。因焊接机器人拥有较强的通用性和工作可靠性等优点,已成为焊接自动化技术现代化的主要手段。提高大规模、高速度的现代化焊接质量是焊接工业的重要课题,检测是其重要保证。

焊接过程中主要出现裂纹、未焊透和未融合、夹渣、气孔和焊缝外观等缺陷,这些缺陷减少焊缝面积,降低承载能力,容易产生应力集中,从而导致焊缝强度降低,引起焊件破裂导致脆断。在这些缺陷中未融合属于严重缺陷,而研究表明焊丝偏移除了对焊缝外观成形产生严重影响,还会导致未融合。因此预测焊缝是否偏移有着重要的现实意义。

目前焊缝偏移检测主要是利用视觉传感器进行焊缝跟踪或超声波传感器进行检测,这种方法对工业现场环境设备及资金要求都较高。



技术实现要素:

针对上述技术问题,本发明旨在提供一种应用于机器学习的时序特征有效窗口提取方法,删除了焊接开头和结尾因受起弧和收弧控制而导致的不置信数据,增强相关因子与目标变量的提取,提高了自动建模的精度;基于该数据,能够有效预测焊缝偏移,准确度高。

为解决上述技术问题,本发明提供一种应用于机器学习的时序特征有效窗口提取方法,该方法包括以下步骤:

1)电弧电压与焊接电流信息获取模块:通过工业网关实时采集和收集焊接机器人的电弧电压和焊接电流数据,并对其中部分数据打标签,有偏移为1,无偏移为0,作为训练库;

2)数据有效窗口选择模块:对收集到的电弧电压和焊接电流数据根据自身数据特点进行有效窗口提取,删除因受起弧和收弧影响的开头和结尾数据;

3)特征变换和提取模块:由于输入电弧电压和焊接电流总是以单一频率提供,因此采用希尔伯特变换方法计算时变,分别对有效窗口内的电参数的实数值和复数值做均值、标准偏差、变异系数、峰度、一阶差分均值、形状因子、波峰因子、间隙系数、脉冲因子、前后窗平均值以及前后窗皮尔逊相关系数的特征提取;

4)特征标准化和选择模块:对提取的44个特征使用最大最小标准化,后用l1正则和递归特征消除法筛选特征,最终得到无多重共线性特征;

5)模型训练、识别和反馈模块:根据有标签数据自动筛选出的特征,使用决策树模型训练,对无标签样本或者新样本采取同样的有效窗口选择和特征提取的方法,代入模型预测,根据反馈结果,扩充训练库,不断迭代选择特征和更新模型;

针对在实际应用中发现的选择合适的数据有效窗对检测算法的准确度影响较大,对所述步骤2)数据有效窗口提取优化如下,具体步骤为:

2.1)对一条焊缝电参数数据按时间序列从小到大排序,对于有缺失的采样点采用相邻点向后填充的方法,统计数据点数n,则初始有效窗口为[0,n-1];

2.2)前窗选择:从有效窗口开始时刻开始,依次计算有效窗口中除当前采样点和采样点i+1,i+2,i+3的均值和标准偏差σ,得到阈值若采样点i不在阈值内,而i+1,i+2,i+3采样点都在阈值内,则有效窗口更新为[i+1,n-1];若采样点i和i+1,i+2,i+3采样点都在阈值内且i点取值与均值范围不超过整个阈值范围的1/3,则有效窗口更新为[i,n-1];否则继续选择有效窗口;令此时有效前窗序号为i*

2.3)后窗选择:从有效窗口[i*,n-1]结束时刻开始,依次计算有效窗口除当前采样点和接下来的4个采样点j-1,j-2,j-3,j-4取值的均值和标准偏差σ′,得到阈值若采样点j取值不在阈值内,而j-1,j-2,j-3,j-4值都在阈值内,则有效窗口更新为[i*,j-1];若采样点j和j-1,j-2,j-3,j-4采样点都在阈值内且采样点j值与均值范围不超过整个阈值范围的1/3,则有效窗口更新为[i*,j];否则继续选择;令此时有效后窗序号为j*

2.4)重新更新前窗序号:根据2.2)、2.3)得有效窗口为[i*,j*],计算有效窗口的均值和标准偏差σ*,得有效阈值当前窗删除样本数大于数据点的预设占比,则依次计算采样点的取值是否在阈值内,若取值在阈值内,则继续;否则,找到第一个不满足数据点l*,则停止,此时有效窗口为[l*+1,j*];当前窗删除样本数不超过数据点的预设占比时,则依次计算采样点的取值和l+1,l+2,l+3的取值,找到第一个这4个点取值都在有效阈值内的采样点,则停止,设有效前窗序号为l*,此时有效窗口为[l*,j*];令此时有效前窗序号为t*

2.5)重新更新后窗序号:当后窗删除样本数大于数据点的预设占比,则依次计算采样点的取值是否在有效阈值内,若取值在阈值内,则继续;否则,找到第一个不满足数据点k*,则停止,此时有效后窗序号为k*-1,此时有效窗口为[t*,k*-1];当后窗删除样本数不超过数据点的预设占比,则依次计算采样点的取值和接下来的4个点k-4,k-3,k-2,k-1的取值,找到第一个这5个点取值都在有效阈值内,则停止,此时有效前窗序号为k*,此时有效窗口为[t*,k*];令此时有效前窗序号为t*

2.6)确定有效窗口:对电压和电流数据分别运用2.1)-2.5),令电压有效窗口为[v,v],电流有效窗口为[i,i],则最终有效窗口为[max(i,v),min(i,v)];

本发明与现有技术相比较,本发明的实施效果如下:

本发明提出了一种应用于机器学习的时序特征有效窗口提取方法,有效删除了焊接开头和结尾因受起弧和收弧控制而导致的不置信数据,增强相关因子与目标变量的提取,通过不断自动反馈迭代,有效增强识别能力。基于本发明提供的方法获取的数据,能够有效预测焊缝偏移,准确度高。

附图说明

图1为本发明为应用于机器学习的时序特征有效窗口提取方法的流程示意图;

图2为有效窗口数据和完整电压数据时序图;

图3为有效窗口数据和完整电流数据时序图;

图4为实施例结果的示意图。

具体实施方式

下面结合附图和具体实例对本发明做更进一步的解释:

实施例1

如图1所示,为本发明提供的一种应用于机器学习的时序特征有效窗口提取方法的流程示意图,本发明以焊缝偏移为讨论对象作为实例,对本发明提供的方法展开详细描述。

本发明所述的一种应用于机器学习的时序特征有效窗口提取方法,该方法能够预测焊缝的偏移,该方法包括下列步骤:

1)电弧电压与焊接电流信息获取模块:通过工业网关实时采集和收集焊接机器人的电弧电压和焊接电流数据,并对其中210个数据打标签,有偏移为1,无偏移为0,作为训练库。

2)数据有效窗口选择模块:对收集到的电弧电压和焊接电流数据根据自身数据特点进行有效窗口提取,删除因受起弧和收弧影响的开头和结尾数据。

2.1)对一条焊缝电参数数据按时间序列从小到大排序,对于有缺失的采样点采用相邻点向后填充的方法,统计数据点数n,则初始有效窗口为[0,n-1]。

2.2)前窗选择:从有效窗口开始时刻开始,依次计算有效窗口中除当前采样点和采样点i+1,i+2,i+3的均值和标准偏差σ,得到阈值若采样点i不在阈值内,而i+1,i+2,i+3采样点都在阈值内,则有效窗口更新为[i+1,n-1];若采样点i和i+1,i+2,i+3采样点都在阈值内且i点取值与均值范围不超过整个阈值范围的1/3,则有效窗口更新为[i,n-1];否则继续选择有效窗口;令此时有效前窗序号为i*

2.3)后窗选择:从有效窗口[i*,n-1]结束时刻开始,依次计算有效窗口除当前采样点和接下来的4个采样点j-1,j-2,j-3,j-4取值的均值和标准偏差σ′,得到阈值若采样点j取值不在阈值内,而j-1,j-2,j-3,j-4值都在阈值内,则有效窗口更新为[i*,j-1];若采样点j和j-1,j-2,j-3,j-4采样点都在阈值内且采样点j值与均值范围不超过整个阈值范围的1/3,则有效窗口更新为[i*,j];否则继续选择;令此时有效后窗序号为j*

2.4)重新更新前窗序号:根据2.2)、2.3)得有效窗口为[i*,j*],计算有效窗口的均值和标准偏差σ*,得有效阈值当前窗删除样本数大于数据点的预设占比,本例中预设占比为总样本的5%,则依次计算采样点的取值是否在阈值内,若取值在阈值内,则继续;否则,找到第一个不满足数据点l*,则停止,此时有效窗口为[l*+1,j*];当前窗删除样本数不超过数据点的5%时,则依次计算采样点的取值和l+1,l+2,l+3的取值,找到第一个这4个点取值都在有效阈值内的采样点,则停止,设有效前窗序号为l*,此时有效窗口为[l*,j*];令此时有效前窗序号为t*

2.5)重新更新后窗序号:当后窗删除样本数大于数据点的5%,则依次计算采样点的取值是否在有效阈值内,若取值在阈值内,则继续;否则,找到第一个不满足数据点k*,则停止,此时有效后窗序号为k*-1,此时有效窗口为[t*,k*-1];当后窗删除样本数不超过数据点的5%,则依次计算采样点的取值和接下来的4个点k-4,k-3,k-2,k-1的取值,找到第一个这5个点取值都在有效阈值内,则停止,此时有效前窗序号为k*,此时有效窗口为[t*,k*];令此时有效前窗序号为t*

2.6)确定有效窗口:对电压和电流数据分别运用2.1)-2.5),令电压有效窗口为[v,v],电流有效窗口为[i,i],则最终有效窗口为[max(i,v),min(i,v)]。

如图2和图3所示,方框为被筛选的受起弧和收弧控制导致的不置信数据窗,由图可知被删除的样本与正常样本分布差异较大,认为该方法较为有效。

3)特征变换和提取模块:由于输入电弧电压和焊接电流总是以单一频率提供,因此采用希尔伯特变换方法计算时变,分别对提取的有效窗口内的电参数的实数值和复数值分别做如下特征提取:

①均值

②标准偏差

③变异系数

④峰度

⑤一阶差分均值

⑥形状因子

⑦波峰因子

⑧间隙系数

⑨脉冲因子

⑩前后窗平均值(前一半数据为前窗,后一半数据为后窗)

11前后窗皮尔逊相关系数

4)特征标准化和选择模块:将训练库中的210条样本进行3)的特征提取,共得到44个特征,对所得样本进行分层抽样,按8:2分成训练样本和验证样本,则训练样本共168个,验证样本共42个,分别计算44个特征的1%和99%分位点数,对于小于1%分位点的取值设为0,大于99%的分位点数的取值设为1,对在1%和99%分位点数之间的数据点采用最大最小标准化,作为新训练样本数据并记录每个特征的1%和99%分位点数。在验证集上,采用与训练数据同样的方法进行标准化,当小于训练时记录特征的1%分位点数时设为0,当大于训练时记录特征的99%分位点数时设为1,对在1%和99%分位点数之间的数据点采用最大最小标准化,对训练样本使用l1正则和递归特征消除法挑选特征以消除多重共线性,最终得到14个有用特征。

5)模型训练、识别和反馈模块:根据挑选出的14个特征,在训练数据集上,采用基尼指数划分节点数据集,构建决策树模型,训练集准确度为88%。当我们构建好决策树后,当有新的样本发送时,我们利用已有的决策树逻辑对新的信息结构进行判断。当样本的内容与决策树一致时,就进入下一分支进行判断,并通过叶子节点获得分类的结果,最终42个验证样本准确度为85%,即只有6个样本预测错误,这6个样本中有5个样本是无偏移样本被预测为偏移样本,这5个样本的焊接过程中出现过严重扰动,如图4。

基于本发明提供的应用于机器学习的时序特征有效窗口提取方法,对于无标签样本或者线上样本采取同样的有效窗口选择和提取相应的14个特征,代入构建好的决策树模型,若获得的分类结果为1,说明出现焊缝偏移,则给予提醒,由人工审核,对于预测错误的样本重新作为训练库,丰富训练样本库,重新进行特征选择和树模型构建即步骤2)-5)。

本方法根据电弧工业网关采集的数据进行焊缝偏移预测,剔除因焊接开头和结尾受起弧和收弧控制使得数据波动较大导致样本数据不置信的数据点,精度更高,更易于实现。可以极大地减少人工对焊缝质量的检测。

以上内容是结合具体的实施例对本发明所作的详细说明,不能认定本发明具体实施仅限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1