本申请涉及设备故障检测领域,特别涉及对半导体自动测试设系统的故障进行预测和诊断的一种设备故障检测方法和系统。
背景技术:
1、随着电子设备的复杂性不断增加,设备故障的检测、诊断变得越来越困难和耗时。传统故障检测方法依赖于预定义的规则和模型,在多种数据采集和分析时缺乏动态调整能力,无法充分利用实时和历史数据进行高效、精准的故障预测和诊断;同时,这些方法难以应对复杂系统中的多样化、快速变化的故障模式,影响了故障监测的准确性和自我优化能力。
技术实现思路
1、针对现有技术中的缺陷,本申请提出了一种设备故障检测方法,该方法通过自适应调度和多源数据采集优化了数据的获取效率,提高了故障预测的实时性和准确性。结合机器学习模型的动态训练和部署,系统能够及时适应新故障模式,确保高效、持续的预测与诊断。数字孪生模型进一步增强了设备的健康监测和未来故障的预测能力,实现了设备运行状态的仿真评估。
2、为解决上述问题,一方面,本申请实施例提供了一种设备故障检测方法,应用于ate系统,方法包括:
3、s1、数据采集:通过多个传感器从ate系统各设备中采集的实时运行数据,传感器由自适应算法动态调度,以根据设备的当前状态调整数据采集频率和范围;
4、s2、预处理:基于历史故障数据和历史运行数据训练多种类型的机器学习模型,并将训练完成的机器学习模型部署到ate系统中;
5、s4、故障监测:利用部署的机器学习模型对实时运行数据进行持续分析,预测潜在的设备故障,并在检测到潜在故障时,通过用户界面或通知系统向操作人员发送报警信息;
6、s5、故障诊断:当检测到潜在故障时,依据机器学习模型的分析结果生成故障诊断报告,并提供相应的修复建议;
7、s6、模型更新:记录ate系统的故障实例及故障时的实时运行数据,并加入历史故障数据以重新训练机器学习模型;更新机器学习模型以优化预测和诊断的准确性,并重新部署至ate系统;
8、s7、数字仿真:基于实时运行数据和历史运行数据生成设备的数字孪生模型,用于实时仿真设备的运行状态并预测未来可能出现的故障,评估设备健康状况。
9、在一种可能的实施例中,实时运行数据包括电气信号、环境参数和操作数据;
10、电气信号包括电压、电流和频率;
11、环境参数包括温度、湿度和振动;
12、操作数据包括操作日志、测试步骤和测试结果。
13、在一种可能的实施例中,预处理包括滤波、去噪、归一化中的至少一种处理方式。
14、在一种可能的实施例中,机器学习模型包括故障预测模型和故障分类模型。
15、在一种可能的实施例中,机器学习模型使用的算法包括决策树、随机森林、深度学习网络中的至少一种。
16、在一种可能的实施例中,诊断报告包括故障内容、发生原因及可能影响的ate系统模块。
17、在一种可能的实施例中,报警信息包括短信、邮件。
18、另一方面,本发明还提供了一种设备故障检测系统,包括:
19、数据采集模块,用于从不同的ate系统模块中通过多个类型的传感器和数据接口采集实时运行数据,实时运行数据包括电气信号、电气信号、环境参数和操作数据;
20、传感器调度模块,集成于数据采集模块,用于基于ate系统当前的运行状态和故障预测需求,通过分析设备的实时运行数据和历史运行数据,动态选择所需调用的传感器,并调整数据采集频率和范围,以优化数据采集效率并降低冗余数据的产生;
21、边缘计算模块,与数据采集模块和传感器调度模块通信,用于在ate系统的本地设备上接受并处理来自数据采集模块的实时运行数据,并对实时运行数据进行预处理,预处理包括滤波、去噪和归一化,以便优化数据质量并降低数据传输到中央处理器的延迟;
22、数据处理单元,用于从边缘计算单元接收经过预处理的实时运行数据,并进行进一步数据清洗、特征提取和数据融合操作,生成结构化的预测输入数据;
23、模型训练部署模块,与数据采集单元通信,从数据采集单元获取历史故障数据和历史运行数据作为训练数据,以对机器学习模型进行训练,并将训练完毕的机器学习模型部署至ate系统;
24、故障预警模块,与模型训练部署模块和数据处理单元通信,用于实时获取数据处理单元发送的预测输入数据,并基于部署至ate系统的机器学习模型实时对预测输入数据进行分析,当机器学习模检测到潜在故障时,生成对应的故障报警信息,并通过用户界面或通知系统将报警信息发送至操作人员;
25、诊断建议模块,与故障预警模块集成并通信,当检测到潜在故障时,依据机器学习模型的分析结果生成故障诊断报告,包括故障类型、发生原因及可能影响的ate系统的模块,并根据知识库生成故障修复建议,以向操作人员提供修复操作的参考信息;
26、自学习模块,与模型训练部署模块和故障预警模块通信,用于从故障预警模块获取故障实例及故障时的预测输入数据以加入历史故障数据;将新的历史故障数据重新发送至模型训练部署模块以对机器学习模型重新训练,以更新机器学习模型并重新部署至ate系统中。
27、进一步的,还包括功耗监测模块,功耗检测模块与数据采集模块和边缘计算模块通信,用于通过功率传感器实时采集ate系统各设备的功耗数据,并结合来自数据采集模块的实时运行数据,执行对ate系统各设备的功耗特征分析,并将功耗分析结果与故障预测模型整合,以增强故障预测的准确性。
28、进一步的,还包括数字孪生模块,数字孪生模型与数据采集模块和故障预警模块通信,基于从数据采集模块获取的实时运行数据和从故障预警模块获取的故障实例及故障时的预测输入数据,创建ate系统的虚拟副本,用于执行ate系统各设备的运行状态仿真,提供实时设备健康监测。
29、本申请与现有技术相比,具有以下优点及有益效果:
30、本发明提供了一种设备故障检测方法,该方法通过自适应调度和多源数据采集优化了数据的获取效率,提高了故障预测的实时性和准确性。结合机器学习模型的动态训练和部署,系统能够及时适应新故障模式,确保高效、持续的预测与诊断。数字孪生模型进一步增强了设备的健康监测和未来故障的预测能力,实现了设备运行状态的仿真评估。
31、本发明还提供了一种设备故障检测系统,通过该系统数据采集效率得到优化,传感器的动态调度提升了实时数据的准确性,边缘计算减少了数据传输延迟;自学习功能保证了系统在面对新故障模式时的自适应性,整体上提高了设备故障预测的实时性和准确性,增强了对设备运行状态的持续监测和故障预警能力。
1.一种设备故障检测方法,应用于ate系统,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的设备故障检测方法,其特征在于,所述实时运行数据包括电气信号、环境参数和操作数据;
3.根据权利要求2所述的设备故障检测方法,其特征在于,所述预处理包括滤波、去噪、归一化中的至少一种。
4.根据权利要求1所述的设备故障检测方法,其特征在于,所述机器学习模型包括故障预测模型和故障分类模型。
5.根据权利要求4所述的设备故障检测方法,其特征在于,所述机器学习模型使用的算法包括决策树、随机森林、深度学习网络中的至少一种。
6.根据权利要求1所述的设备故障检测方法,其特征在于,所述诊断报告包括故障内容、发生原因及可能影响的所述ate系统模块。
7.根据权利要求6所述的设备故障检测方法,其特征在于:所述报警信息包括短信、邮件。
8.一种设备故障检测系统,其特征在于,包括:
9.根据权利要求8所述的设备故障检测系统,其特征在于,还包括功耗监测模块,所述功耗检测模块与所述数据采集模块和所述边缘计算模块通信,用于通过功率传感器实时采集所述ate系统各设备的功耗数据,并结合来自所述数据采集模块的所述实时运行数据,执行对所述ate系统各设备的功耗特征分析,并将所述功耗分析结果与故障预测模型整合,以增强故障预测的准确性。
10.根据权利要求8或9所述的设备故障检测系统,其特征在于,还包括数字孪生模块,所述数字孪生模型与所述数据采集模块和所述故障预警模块通信,基于从所述数据采集模块获取的实时运行数据和从所述故障预警模块获取的所述故障实例及故障时的所述预测输入数据,创建所述ate系统的虚拟副本,用于执行所述ate系统各设备的运行状态仿真,提供实时设备健康监测。