模型训练数据确定方法、检测模型训练方法、装置及设备与流程

文档序号:26052108发布日期:2021-07-27 15:27阅读:103来源:国知局
模型训练数据确定方法、检测模型训练方法、装置及设备与流程

本申请涉及计算机技术领域,特别是涉及一种模型训练数据确定方法、检测模型训练方法、装置及设备。



背景技术:

随着现代化工业要求的发展,对制造设备的加工要求越来越高。制造设备的运行是否正常直接影响着制造设备的加工效率以及加工速度,准确检测出制造设备在工作状态异常情况,可以即使对设备异常进行处理,以达到提升制造设备加工效率的目的。

在传统方式中,通常是通过制造设备自身携带的电流采集功能对制造设备在运行过程中的电流以较高的频率进行采集,并基于采集到的电流,通过对检测模型进行训练并用于判断采集设备是否异常。

但是,在互联网条件下,需要通过外接的采集设备进行电流采集,处于对功耗的考虑,外接设备并不能实现对制造设备的运行电流进行高频率的采集,从而使得基于采集到的电流数据进行模型训练时,训练结果并不理想,模型准确率并不高。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提升模型训练准确性的模型训练数据确定方法、检测模型训练方法、装置及设备。

一种模型训练数据确定方法,所述模型训练数据确定方法包括:

获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态;

基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合;

对电流数据集合进行聚类,生成多个初始电流数据簇;

从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据;

获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。

在其中一个实施例中,从多个初始电流数据簇中确定目标电流数据簇,包括:

确定各初始电流数据簇中工作电流数据的数据量;

基于各数据量,对初始电流数据簇进行排序,并从排序后的多个初始电流数据簇中确定预设数量的初始电流数据簇作为对应多个制造设备的目标电流数据簇。

在其中一个实施例中,基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据,包括:

计算历史特征数据与初始特征数据之间的相似度和/或数据增益;

基于相似度和/或数据增益,从初始特征数据中确定对应的目标特征数据。

在其中一个实施例中,上述模型训练数据确定方法还包括:

获取模型训练请求,模型训练请求中携带有模型的训练要求;

对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据,包括:

基于训练要求,对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据。

在其中一个实施例中,上述模型训练数据确定方法还包括:

将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中的至少一个上传至区块链节点中进行存储。

一种检测模型训练方法,检测模型用于对制造设备异常运行状态进行检测,所述检测模型训练方法包括:

获取上述任一项模型训练数据确定方法确定的目标特征数据,并作为训练数据;

对训练数据进行标记,得到标记后的训练数据;

构建初始检测模型;

将标记后的训练数据输入初始检测模型,得到对应的检测结果;

基于检测结果以及标记后的训练数据,计算初始检测模型的模型损失;

根据模型损失对初始检测模型进行迭代训练,得到训练后的检测模型。

一种模型训练数据确定装置,所述模型训练数据确定装置包括:

数据模块,用于获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态;

拆分模块,用于基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合;

聚类模块,用于对电流数据集合进行聚类,生成多个初始电流数据簇;

特征提取模块,用于从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据;

筛选模块,用于获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。

一种检测模型训练装置,检测模型用于对制造设备异常运行状态进行检测,所述测模型训练装置包括:

获取模块,用于获取权利要求7模型训练数据确定装置确定的目标特征数据,并作为训练数据;

标记模块,用于对训练数据进行标记,得到标记后的训练数据;

模型构建模块,用于构建初始检测模型;

检测模块,用于将标记后的训练数据输入初始检测模型,得到对应的检测结果;

损失计算模块,用于基于检测结果以及标记后的训练数据,计算初始检测模型的模型损失;

迭代训练模块,用于根据模型损失对初始检测模型进行迭代训练,得到训练后的检测模型。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

上述模型训练数据确定方法、检测模型训练方法、装置及设备,通过获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态,然后基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合,进一步对电流数据集合进行聚类,得到对应的多个初始电流数据簇,然后从多个初始电流数据簇中确定对应的目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据,获取对应目标电流数据簇的历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。从而,对于低频采集到的离散初始电流数据,可以通过对其进行拆分以及聚类,得到对应的初始电流数据簇,并从中确定对应的目标电流数据簇,进而通过对目标电流数据簇进行特征提取以及通过历史特征数据进行筛选,使得可以得到较为准确且适用于模型训练的目标特征数据,可以使得模型训练更具针对性,进而可以提升模型训练的准确性。

附图说明

图1为一个实施例中模型训练数据确定方法的应用场景图;

图2为一个实施例中模型训练数据确定方法的流程示意图;

图3为一个实施例中检测模型训练方法的流程示意图;

图4为一个实施例中模型训练数据确定装置的结构框图;

图5为一个实施例中检测模型训练装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的模型训练数据确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以采集多个制造设备的初始电流数据以及工作状态数据,并发送至服务器104,使得服务器104获取到制造设备的初始电流数据和工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态。服务器104在获取到多个制造设备的初始电流数据以及各制造设备的工作状态数据后,可以基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合。然后服务器104可以对电流数据集合进行聚类,生成多个初始电流数据簇。服务器104可以从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据。进一步,服务器104可以获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种模型训练数据确定方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤s202,获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态。

其中,初始电流数据是指通过外接的终端设备或者是采集设备,采集制造设备的运行电流所得到的数据,具体可以是以较低的频率所采集的数据,例如,1分钟采集一次所生成的数据。

在本实施例中,电流数据可以是指电流信号数据,即在制造设备运行期间内,设备的电流信号的变化数据。

在本实施例中,初始电流数据是一定检测时间区间内的数据例如,半天的电流数据或者是一天的电流数据等,初始电流数据包括一定预设时间区间内多个采集时间点中对应各采集时间点的工作电流数据。本领域技术人员可以理解的是,检测时间区间可以根据实际的业务需求进行确定,本申请对此不作限制。

在本实施例中,对于制造设备,其可以包括多个工作状态,例如,对于半自动的加工设备,可以包括加工状态、非加工状态、待机状态等,或者也可以包括粗加工状态、精加工状态,或者加工工序一状态、加工工序二状态等,本申请对此不作限制。

在本实施例中,采集设备采集到的电流数据是指加工设备在连续运行时间区间的数据,即采集到的电流数据可以包括加工状态的电流数据,也可以包括非加工状态的电流数据,可以包括粗加工状态的电流数据,也可以包括精加工状态的电流数据,或者也可以包括加工工序一状态的电流数据,也可以包括加工工序二状态的电流数据。

在本实施例中,工作状态数据用于指示制造设备在预设时间区间内各时间点的工作状态,例如,12:00~12:05,制造设备处于待机状态,12:05~12:20,制造设备处于加工状态。

在本实施例中,不同的制造设备,其工作状态数据与初始电流数据可以不相同,例如,对于制造设备1,其处于待机状态的时间为“12:00~12:05”,处于加工状态的时间为“12:05~12:20”,从12:05~12:06进行粗加工,从12:07~12:08在进行精加工,而对于制造设备2,其处于待机状态的时间为“12:08~12:25”,其处于加工状态的时间为“12:25~12:30”,其可能仅包括粗加工过程等。

在本实施例中,终端可以在制造设备运行时,记录制造设备在整个运行区间的各工作状态,并生成对应的工作状态数据。例如,根据制造设备在运行时,确定是否在加工,确定是否处于加工状态,如果在加工状态时,根据执行的加工程序的程序标识,确定是精加工、初加工或者是加工工序一、加工工序二等,以此确定制造设备在各时间点的工作状态,以得到对应的工作状态数据。

在本实施例中,服务器可以通过对应各制造设备的终端获取对应的初始电流数据以及工作状态数据,并发送至服务器,使得服务器可以获取到多个制造设备的初始电流数据以及工作状态数据。

步骤s204,基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合。

具体地,服务器可以根据获取到的工作状态数据,对初始电流数据进行数据的拆分,以得到对应各不同工作状态的工作电流数据,例如,将初始电流数据拆分为加工状态的工作电流数据、非加工状态的工作电流数据或者是待机状态的工作电流数据等,加工状态的数据又可以分为精加工状态的工作电流数据以及粗加工状态的工作电流数据等。

在本实施例中,初始电流数据中可以包括时间信息,工作状态数据中也可以包括时间信息,服务器可以根据工作状态数据中的时间信息确定各时间点制造设备所处的工作状态,然后对初始电流数据进行拆分,以得到对应各工作状态的工作电流数据。例如,继续引用前例,12:00~12:05,制造设备处于待机状态,12:05~12:20,制造设备处于加工状态,则服务器可以以12:05为时间节点,将时间区间为12:00~12:20的初始电流数据拆分为对应12:00~12:05的工作电流数据以及对应12:05~12:20的工作电流数据,得到电流数据集合。

在本实施例中,服务器也可以设置切分单位时间,然后通过切分单位时间对初始电流数据进行拆分,得到以切分单位时间为时间周期的工作电流数据。然后服务器在对同一工作状态的数据进行聚类,得到对应各工作状态的工作电流数据。

在本实施例中,服务器可以根据各制造设备对应的工作状态数据,对对应的初始电流数据进行拆分,以得到对应各制造设备的各工作状态的电流数据集合。

步骤s206,对电流数据集合进行聚类,生成多个初始电流数据簇。

在本实施例中,服务器对电流数据集合中的各工作电流数据进行聚类,例如,通过高斯聚类等,得到对应的多个初始电流数据簇,即生成聚类结果。

在本实施例中,各初始电流数据簇可以对应于一种工作状态,例如,服务器通过对电流数据集合进行聚类,将不同制造设备的同一工作状态的工作电流数据聚为同一电流数据簇,以得到对应多个制造设备的多个初始电流数据簇。

在本实施例中,服务器可以根据模型的训练要求,从该多个初始电流数据簇中确定对应的目标电流数据簇,并进行后续的数据处理。

步骤s208,从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据。

在本实施例中,服务器可以根据模型的训练要求,确定对目标电流数据簇进行特征提取的提取方案,并对目标电流数据簇中各工作电流数据进行特征提取,例如,可以包括但不限于均值、中位数、众数、方差、峰值、波形、脉冲、裕度、峭度等。

在本实施例中,服务器可以根据训练要求中确定的特征提取方式,对目标电流数据簇中各工作电流数据进行数据处理,以得到对应的初始特征数据。

步骤s210,获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。

在本实施例中,服务器获取到的多个制造设备的初始电流数据可以是当前数据,例如,当前日的数据,而历史特征数据是指当前日之前时间所对应初始电流数据所得到的特征数据。对于当前数据进行处理后得到的初始特征数据其也可以是后续的预设时间区间所对应的历史特征数据。

在本实施例中,服务器可以从数据库中查询并获取到历史特征数据,然后基于获取到的历史特征数据,对当前得到的初始特征数据进行筛选,以得到用于作为模型训练据的目标特征数据。

上述模型训练数据确定方法中,通过获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态,然后基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合,进一步对电流数据集合进行聚类,得到对应的多个初始电流数据簇,然后从多个初始电流数据簇中确定对应的目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据,获取对应目标电流数据簇的历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。从而,对于低频采集到的离散初始电流数据,可以通过对其进行拆分以及聚类,得到对应的初始电流数据簇,并从中确定对应的目标电流数据簇,进而通过对目标电流数据簇进行特征提取以及通过历史特征数据进行筛选,使得可以得到较为准确且适用于模型训练的目标特征数据,可以使得模型训练更具针对性,进而可以提升模型训练的准确性。

在其中一个实施例中,从多个初始电流数据簇中确定目标电流数据簇,可以包括:确定各初始电流数据簇中工作电流数据的数据量;基于各数据量,对初始电流数据簇进行排序,并从排序后的多个初始电流数据簇中确定预设数量的初始电流数据簇作为对应多个制造设备的目标电流数据簇。

其中,数据量是指聚类后得到的各初始电流数据簇中工作电流数据的数量,例如,初始电流数据拆分为工作电流数据后,聚类后处于工作状态的工作电流数据的数量,精加工状态的工作电流数据的数量等。

本领域技术人员可以理解的是,这里的数量可以是按照时间维度定义的数量,例如,时间维度越长,代表数据量越大,时间维度越短,代表数据量越少。

在本实施例中,服务器可以统计各初始电流数据簇中工作电流数据的数据量,并按照数据量由大到小的顺序进行排序,得到排序后的各初始电流数据簇。

进一步,服务器可以按照预设的筛选条件,确定排序靠前的预设数量个初始电流数据簇,例如,取topn对应的初始电流数据簇,并作为对应该多个制造设备的目标电流数据簇。

上述实施例中,通过按照初始电流数据簇的数据量进行排序,并从排序后的初始电流簇中确定预设数量的初始电流数据簇作为对应制造设备的目标电流数据簇,使得确定的目标电流数据簇为制造设备异常检测的关键数据,使得目标电流数据簇的确定更加准确,进而可以提升后续数据处理的准确性。

在其中一个实施例中,基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据,可以包括:计算历史特征数据与初始特征数据之间的相似度和/或数据增益;基于相似度和/或数据增益,从初始特征数据中确定对应的目标特征数据。

其中,数据增益可以是指数据信息增益,即两个数据之间的差异。

在本设计实例中,服务器在获取到对应目标电流数据簇的历史特征数据后,可以对历史特征数据以及初始特征数据之间的相似度和/或数据增益进行计算,以确定数据之间的相似性。

在本实施例中,服务器可以通过方差、余弦、简单减法等进行相似度的计算。同理,服务器可以通过信息熵、交叉熵、相对熵、gini指数等计算历史特征数据以及初始特征数据之间的数据增益。

在本实施例中,服务器在计算得到历史特征数据以及初始特征数据之间的相似度和/或数据增益,可以根据预设的阈值条件,从初始特征数据中确定用于模型训练的目标特征数据。

例如,服务器可以基于大数据统计,确定相似度阈值以及数据增益阈值。然后对初始特征数据与历史特征数据之间的相似度进行判定,如相似度高于相似度阈值,则确定该初始特征数据异常,低于相似度阈值则确定该初始特征数据正常。数据增益的判断同理,初始特征数据与历史特征数据之间的数据增益高于数据增益阈值,则确定该初始特征数据正常,初始特征数据与历史特征数据之间的数据增益低于数据增益阈值,则确定该初始特征异常。

在本实施例中,当服务器确定根据相似度以及数据增益二者共同对初始特征数据进行筛选时,则服务器可以预先设置相似度与数据增益的比重,进而可以根据相似度与相似度阈值以及数据增益与数据增益阈值的比对结果,以及对应的比重,确定最终的目标特征数据。

上述实施例中,通过计算历史特征数据以及初始特征数据之间的相似度和/或数据增益,然后基于相似度和/或数据增益对初始特征数据进行筛选,得到对应的目标特征数据,从而可以剔除设备突发异常所带来的离群特征数据,使得作为训练的数据均是制造设备在正常情况下的正常数据,进而可以提升模型训练的准确性。

在其中一个实施例中,上述模型训练数据确定方法还可以包括:获取模型训练请求,模型训练请求中携带有模型的训练要求。

其中,模型训练请求是指请求对构建的检测模型进行训练的请求,模型训练请求中可以携带后模型的训练要求,例如,需要使用何种数据类型或者数据格式的数据进行训练,模型的迭代次数以及学习率等,或者待训练的模型所要学习的功能,如通过模型检测制造设备的稳定性,或者是通过模型检测制造设备的精确度,或者是检测加工工序等。

在本实施例中,对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据,可以包括:基于训练要求,对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据。

在本实施例中,对于不同的训练要求,所需特征数据可以不相同,则服务器可以根据训练要求,通过不同的特征提取方案对目标电流数据簇进行特征提取,例如,当通过模型检测制造设备的稳定性,则可以通过均数方差进行特征提取,当检测制造设备的工序时,则可以通过波形、峭度等方法进行特征提取。

在本实施例中,根据训练要求的不同,提取特征的方法可以包括但不限于均值、中位数、众数、方差、峰值、波形、脉冲、裕度、峭度等。

上述实施例中,通过根据模型的训练要求,对目标电流数据簇中的各目标电流数据进行特征提取,得到对应的初始特征数据,使得得到的特征数据更符合模型的训练要求,特征数据提取更具针对性,可以提升数据提取的准确性。

在其中一个实施例中,上述模型训练数据确定方法还可以包括:将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中的至少一个上传至区块链节点中进行存储。

其中,区块链是指分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。

具体地,区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

在本实施例中,服务器可以将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中的一个或者多个数据上传并存储于区块链的节点中,以保证数据的私密性和安全性。

上述实施例中,通过将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中至少一个上传至区块链并存储于区块链的节点中,从而可以保障存储至区块链节点中数据的私密性,可以提升数据的安全性。

在其中一个实施例中,如图3所示,提供了一种检测模型训练方法,检测模型用于对制造设备异常运行状态进行检测,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤s302,获取模型训练数据确定方法确定的目标特征数据,并作为训练数据。

在本实施例中,模型训练数据确定方法可以是上述方法实施例中的任一项模型训练数据确定方法,服务器可以获取前述实施例所述的目标特征数据,然后将目标特征数据作为训练数据。

在本实施例中,服务器可以将获取到的目标特征数据存储至同一个数据集合中,然后将数据集合中的数据拆分成多个样本,各样本中的数据量可以相等或者是数据量差异满足预设阈值。

步骤s304,对训练数据进行标记,得到标记后的训练数据。

具体地,服务器可以对训练样本数据进行标记,例如,正常数据标记为正样本数据,异常数据标记为负样本数据,以得到标记后的训练数据。

步骤s306,构建初始检测模型。

在本实施例中,服务器可以根据检测要求,构建初始检测模型。本领域技术人员可以理解的是,该初始监测模型可以是深度学习模型,例如,长短期记忆网络(lstm,longshort-termmemory)模型,transformer模型等。

步骤s308,将标记后的训练数据输入初始检测模型,得到对应的检测结果。

在本实施例中,服务器可以将标记的训练数据输入构建的初始检测模型中,以通过初始检测模型对训练数据进行特征提取,并进行回归检测,以得到对应的检测结果。

在本实施例中,初始检测模型输出的检测结果可以是指示特征数据为正常数据或者是异常数据的检测结果。

步骤s310,基于检测结果以及标记后的训练数据,计算初始检测模型的模型损失。

在本实施例中,服务器可以根据检测结果,以及对所述训练数据的标注结果,计算初始检测模型的模型损失,例如,检测结果为正常数据,而标注结果为异常数据,则说明初始检测结果并不正确,则服务器,通过训练数据所得到的检测结果,对模型的损失进行计算。

具体地,服务器可以通过指数损失函数,交叉熵损失函数,最大似然函数等对模型的损失值进行计算。

步骤s312,根据模型损失对初始检测模型进行迭代训练,得到训练后的检测模型。

在本实施例中,服务器可以基于计算的损失值,对初始检测模型的模型参数进行调整,以得到模型参数调整后的初始检测模型。

进一步,服务器对模型参数调整后的初始检测模型进行迭代训练,直至损失值趋于稳定,模型训练完成。

在本实施例中,服务器也可以通过设定初始检测模型的迭代次数以及学习训练率,然后按照迭代次数以及学习训练率对初始检测模型进行监督训练。

在其中一个实施例中,服务器还可以将获取到的训练数据分为训练样本集以及测试样本集,通过训练样本集数据对初始检测模型进行训练,并在训练完成后,通过测试样本集对训练后的初始检测模型进行测试验证,以确定训练后的初始检测模型是否训练完成。例如,验证通过率达到了预设值,则确定测试验证通过,则完成模型的训练与验证,若验证通过率低于预设值,则重新获取训练数据集,对初始检测模型继续进行训练,直至验证通过。

上述实施例中,通过按照模型训练数据确定方案确定的目标特征数据作为模型训练数据,然后进行初始检测模型的训练,使得用于训练初始检测模型的训练数据更加准确,可以使得模型训练更具针对性以及准确性。并且,通过前文所述方式获取目标特征数据,对于低频采集到的离散初始电流数据,可以通过数据拆分以及聚类后筛选出具有共性的目标特征数据,可以进一步提升模型训练的准确性。

应该理解的是,虽然图2和图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图4所示,提供了一种模型训练数据确定装置,包括:数据模块401、拆分模块402、聚类模块403、特征提取模块404以及筛选模块405,其中:

数据模块401,用于获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态。

拆分模块402,用于基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合。

聚类模块403,用于对电流数据集合进行聚类,生成多个初始电流数据簇。

特征提取模块404,用于从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据。

筛选模块405,用于获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。

在其中一个实施例中,特征提取模块404可以包括:

数据量确定子模块,用于确定各初始电流数据簇中工作电流数据的数据量。

目标电流数据簇确定子模块,用于基于各数据量,对初始电流数据簇进行排序,并从排序后的多个初始电流数据簇中确定预设数量的初始电流数据簇作为对应多个制造设备的目标电流数据簇。

在其中一个实施例中,筛选模块405可以包括:

计算子模块,用于计算历史特征数据与初始特征数据之间的相似度和/或数据增益。

目标特征数据确定子模块,用于基于相似度和/或数据增益,从初始特征数据中确定对应的目标特征数据。

在其中一个实施例中,上述模型训练数据确定装置还可以包括:

新来要求获取模块,用于获取模型训练请求,模型训练请求中携带有模型的训练要求。

在本实施例中,特征提取模块404用于基于训练要求,对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据。

在其中一个实施例中,上述模型训练数据确定装置还可以包括:

存储模块,用于将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中的至少一个上传至区块链节点中进行存储。

在一个实施例中,如图5所示,提供了一种检测模型训练装置,检测模型用于对制造设备异常运行状态进行检测,所述测模型训练装置包括:获取模块501、标记模块502、模型构建模块503、检测模块504、损失计算模块505以及迭代训练模块506,其中:

获取模块501,用于获取模型训练数据确定装置确定的目标特征数据,并作为训练数据。

标记模块502,用于对训练数据进行标记,得到标记后的训练数据。

模型构建模块503,用于构建初始检测模型。

检测模块504,用于将标记后的训练数据输入初始检测模型,得到对应的检测结果。

损失计算模块505,用于基于检测结果以及标记后的训练数据,计算初始检测模型的模型损失。

迭代训练模块506,用于根据模型损失对初始检测模型进行迭代训练,得到训练后的检测模型。

关于模型训练数据确定装置以及检测模型训练装置的具体限定可以参见上文中对于模型训练数据确定方法以及检测模型训练方法的限定,在此不再赘述。上述模型训练数据确定装置以及检测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种模型训练数据确定方法以及检测模型训练方法。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态;基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合;对电流数据集合进行聚类,生成多个初始电流数据簇;从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据;获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。

在其中一个实施例中,处理器执行计算机程序时实现从多个初始电流数据簇中确定目标电流数据簇,可以包括:确定各初始电流数据簇中工作电流数据的数据量;基于各数据量,对初始电流数据簇进行排序,并从排序后的多个初始电流数据簇中确定预设数量的初始电流数据簇作为对应多个制造设备的目标电流数据簇。

在其中一个实施例中,处理器执行计算机程序时实现基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据,可以包括:计算历史特征数据与初始特征数据之间的相似度和/或数据增益;基于相似度和/或数据增益,从初始特征数据中确定对应的目标特征数据。

在其中一个实施例中,处理器执行计算机程序时还可以实现以下步骤:获取模型训练请求,模型训练请求中携带有模型的训练要求。

在本实施例中,处理器执行计算机程序时实现对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据,可以包括:基于训练要求,对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据。

在其中一个实施例中,处理器执行计算机程序时还可以实现以下步骤:将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中的至少一个上传至区块链节点中进行存储。

在一个实施例中,提供了另一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取上述任一项模型训练数据确定方法确定的目标特征数据,并作为训练数据;对训练数据进行标记,得到标记后的训练数据;构建初始检测模型;将标记后的训练数据输入初始检测模型,得到对应的检测结果;基于检测结果以及标记后的训练数据,计算初始检测模型的模型损失;根据模型损失对初始检测模型进行迭代训练,得到训练后的检测模型。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取多个制造设备的初始电流数据以及各制造设备的工作状态数据,工作状态数据用于指示对应制造设备在预设时间区间内各时间点的工作状态;基于各工作状态数据,对对应的各初始电流数据进行拆分,得到多个制造设备在预设时间区间的电流数据集合;对电流数据集合进行聚类,生成多个初始电流数据簇;从多个初始电流数据簇中确定目标电流数据簇,并对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据;获取历史特征数据,并基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据。

在其中一个实施例中,计算机程序被处理器执行时实现从多个初始电流数据簇中确定目标电流数据簇,可以包括:确定各初始电流数据簇中工作电流数据的数据量;基于各数据量,对初始电流数据簇进行排序,并从排序后的多个初始电流数据簇中确定预设数量的初始电流数据簇作为对应多个制造设备的目标电流数据簇。

在其中一个实施例中,计算机程序被处理器执行时实现基于历史特征数据对初始特征数据进行筛选,得到用于作为模型训练数据的目标特征数据,可以包括:计算历史特征数据与初始特征数据之间的相似度和/或数据增益;基于相似度和/或数据增益,从初始特征数据中确定对应的目标特征数据。

在其中一个实施例中,计算机程序被处理器执行时还可以实现以下步骤:获取模型训练请求,模型训练请求中携带有模型的训练要求。

在本实施例中,计算机程序被处理器执行时实现对目标电流数据簇中各目标电流数据进行特征提取,得到对应目标电流数据簇的初始特征数据,可以包括:基于训练要求,对目标电流数据簇中各目标电流数据进行特征提取,得到对应的初始特征数据。

在其中一个实施例中,计算机程序被处理器执行时还可以实现以下步骤:将工作状态数据、电流数据集合、初始电流数据簇、目标电流数据簇、初始特征数据以及目标特征数据中的至少一个上传至区块链节点中进行存储。

在一个实施例中,提供了另一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取上述任一项模型训练数据确定方法确定的目标特征数据,并作为训练数据;对训练数据进行标记,得到标记后的训练数据;构建初始检测模型;将标记后的训练数据输入初始检测模型,得到对应的检测结果;基于检测结果以及标记后的训练数据,计算初始检测模型的模型损失;根据模型损失对初始检测模型进行迭代训练,得到训练后的检测模型。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1