一种检测模型的确定方法、验证方法和装置与流程

文档序号:23384932发布日期:2020-12-22 13:49阅读:187来源:国知局
一种检测模型的确定方法、验证方法和装置与流程

本公开涉及但不限于计算机技术领域,特别是涉及到一种检测模型的确定方法、所述检测模型的验证方法和对应的装置。



背景技术:

phm(故障预测与健康管理)是利用各类先进传感器实时监测装备运行状态参数及特征信号,借助智能算法和模型来评估装备健康状态,预测剩余使用寿命,诊断故障类型并在故障发生前提供一系列的故障维修决策的系统。phm技术是由先进的诊断技术、测试技术装备维修管理理论相结合的产物。借助该项技术的故障诊断能力来识别故障类型。装备使用人员与维修人员明确装备故障类型,从而采取有效的维修方式,有效降低故障风险,节约装备资源,减少因装备故障误诊带来的经济损失。

目前,phm技术对于实施装备产生的未知、少次信号的检测的方法目前主要有:基于传统的机器学习的检测方法,基于深度学习的方法,基于专家系统的检测方法。

基于传统的机器学习与深度学习方法的缺陷在于:在缺少足够的训练样本的情况下,容易造成学习过拟合现象,并陷入局部最优化。基于专家系统的检测方法,依赖于先验的背景知识,对于已知样本的检测具有很好的效果,但对于未知的、少次样本的信号的检测判断不稳定。



技术实现要素:

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本公开实施例提供了一种检测模型的确定方法,能够基于未知或少量样本数据建立具备高检测准确率的检测模型。本公开实施例还提供一种对上述检测模型进行验证的方法,确定该检测模型的检测准确度。

本公开实施例提供一种检测模型的确定方法,包括,

获取样本数据,所述样本数据包括:携带有正常标签的正常样本数据和携带有异常标签的异常样本数据;

根据从所述样本数据中划分出的第一样本数据子集初始化并训练长短时记忆神经网络,确定训练好的所述长短时记忆神经网络;

根据所述样本数据确定第一任务集集合,利用所述第一任务集集合采用预定的元学习训练算法对训练好的长短时记忆神经网络的模型参数进行调整,确定调整模型参数后的所述长短时记忆神经网络为所述检测模型。

一些示例性实施例中,所述根据所述样本数据确定第一任务集集合,包括:

将所述样本数据分为正常样本数据集和异常样本数据集;

根据所述正常样本数据集和所述异常样本数据集构建多组支持集和疑问集;

根据所述多组支持集和疑问集,确定多个任务集;其中,每一个任务集对应一组支持集和疑问集;

从所述多个任务集中选择第一预设比例的任务集构成所述第一任务集集合。

一些示例性实施例中,所述样本数据从1个设备中采集,每一个设备所采集的正常样本量和异常样本量相等;

根据所述正常样本数据集和所述异常样本数据集构建多组支持集和疑问集,包括:

将所述正常样本数据集分为1个正常子集,将所述异常样本数据集分为1个异常子集;每一个正常子集中的样本数据为同一个设备所采集的正常样本数据,每一个异常子集中的样本数据为同一个设备所采集的异常样本数据;

每一组支持集和疑问集分别根据以下方式构建:

从1个正常子集中选取一个正常子集na,从1个异常子集中选取一个异常子集am;所述正常子集na和异常子集am中的样本数据为来自同一个设备所采集的样本数据;

从所述正常子集na中抽取m-k个正常样本数据,从所述异常子集am中抽取m-k个异常样本数据;

从1个正常子集中选取另一个正常子集nb,从1个异常子集中选取另一个异常子集an;所述正常子集nb和异常子集an中的样本数据同为来自另一个设备所采集的样本数据;

从所述正常子集nb中抽取k+q个正常样本数据,从所述异常子集an中抽取k+q个异常样本数据;

根据所述k+q个正常样本数据中的q个正常样本数据和所述k+q个异常样本数据中的q个异常样本数据,建立一个疑问集;

根据所述k+q个正常样本数据中剩余的k个正常样本数据、所述k+q个异常样本数据中剩余的k个异常样本数据,和所述m-k个正常样本数据、所述m-k个异常样本数据,建立一个支持集;

所述一个支持集和所述一个疑问集构建一组支持集和疑问集;

其中,l为大于0的整数,k为大于或等于0的整数,m为大于k的整数,q为大于0的整数;不同组的支持集和疑问集所选取的正常子集不同,不同组的支持集和疑问集所选取的异常子集不同。

一些示例性实施例中,所述根据所述样本数据中的第一样本数据子集初始化并训练长短时记忆神经网络,包括:

对所述第一样本数据子集进行分窗时移得到训练数据;

根据所述训练数据和预设的期望目标向量,初始化所述长短时记忆神经网络;

根据前向传播算法确定初始化后的所述长短时记忆神经网络的学习误差向量;

根据所述学习误差向量利用反向传播算法迭代更所述长短时记忆神经网络的模型参数进行所述长短时记忆神经网络的训练,确定所述长短时记忆神经网络训练后的模型参数。

一些示例性实施例中,所述利用所述第一任务集集合采用预定的元学习训练算法对训练好的长短时记忆神经网络的模型参数进行调整,包括:

根据训练好的长短时记忆神经网络的模型参数,预设的学习率,第一更新迭代训练次数,元学习优化器的自适应内部更新超参数初始值,对所述第一任务集集合中每一个任务集,依次采用k次样本学习法,进行所述元学习优化器的训练,得到调整后的长短时记忆神经网络的模型参数。

本公开实施例还提供一种检测模型的验证方法,所述检测模型为上述方法所确定的检测模型;所述验证方法包括:

根据所述样本数据确定第二任务集集合,利用所述第二任务集集合和所述检测模型确定学习误差;

根据所述学习误差确定所述检测模型的检测准确度。

一些示例性实施例中,所述根据所述样本数据确定第二任务集集合,包括:

从所述多个任务集中选择第二预设比例的任务集构成所述第二任务集集合;

所述第二任务集集合包括的任务集不同于所述第一任务集集合包括的任务集。

一些示例性实施例中,所述学习误差包括:正常样本学习误差和异常样本学习误差;

所述利用所述第二任务集和所述检测模型确定学习误差,包括:

根据所述检测模型,预设的第二更新迭代训练次数,所述元学习优化器的训练后的自适应内部更新超参数,对所述第二任务集集合中每一个任务集,依次确定每一个任务集的正常样本学习误差和异常样本学习误差。

本公开实施例还提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一种检测模型的确定方法,或执行上述任一种检测模型的验证方法。

本公开实施例还提供一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一种检测模型的确定方法,或执行上述任一种检测模型的验证方法。

在阅读并理解了附图和详细描述后,可以明白其他方面。

附图说明

图1为本公开实施例中一种检测模型确定方法的流程图;

图2为本公开另一实施例中一种检测模型确定方法的流程图;

图3为本公开中样本数据集合生成示意图;

图4为本公开中多任务元学习训练的数据集合示意图;

图5为本公开中长短时记忆神经网络单元前向传播计算流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步的详细描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

首先,本领域相关定义说明如下,但不限于下述各具体情况:

机器学习:是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。相关领域的机器学习从学习策略的角度分为:模拟人脑的机器学习和采用数学方法的机器学习。其中采用数学的机器学习主要有统计机器学习,是基于对数据的初步认识以及学习目的的分析,选择合适的数学模型,拟定参数,并输入样本数据,依据一定的策略,运用合适的学习算法对模型进行训练,最后运用训练好的模型对数据进行分析预测。传统的机器学习研究模式是:获取特定任务的大型数据集,然后用这个数据集从头开始训练模型。很明显,这和人类利用以往经验,仅仅通过少量样本就迅速完成学习的情况相差甚远。元学习是目前机器学习领域一个令人振奋的研究趋势,它解决的是学习如何学习的问题。

概率神经网络:(probabilisticneuralnetworks,pnn)是d.f.specht博士在1989年提出的一种结构简单、应用广泛的神经网络,在模式分类问题中获得了广泛应用。

长短期记忆神经网络:(lstm,longshort-termmemory)是一种时间循环神经网络,是为了解决一般的rnn(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的rnn都具有一种重复神经网络模块的链式形式。

基于传统的机器学习与深度学习方法的缺陷在于:在缺少足够的训练样本的情况下,容易造成学习过拟合现象,并陷入局部最优化。基于专家系统的检测方法,依赖于先验的背景知识,对于已知样本的检测具有很好的效果,但对于未知的、少次样本的信号的检测判断不稳定。

相比于上述两种方法,本公开实施例提出的基于元学习的未知、少次信号的学习方法的优点在于:它有很强的非线性问题处理能力,以及强大的表征能力,提高了原有学习算法的性能,灵活地解决了未知,少次样本的学习问题。

实施例一

本公开实施例提供一种检测模型的确定方法,如图1所示,包括,

步骤11,获取样本数据;其中,所述样本数据包括:携带有正常标签的正常样本数据和携带有异常标签的异常样本数据;

步骤12,根据所述样本数据划分出第一样本数据子集;

步骤13,根据所述第一样本数据子集训练长短期记忆神经网络;训练后即可确定所述长短期记忆神经网络的模型参数,称为训练模型参数;

步骤14,根据所述样本数据确定第一任务集集合;所述第一任务集集合中的样本数据作为元学习训练集;

步骤15,利用所述第一任务集集合对所述步骤13中训练好的所述长短期记忆神经网络进行元学习训练,确定所述长短期记忆神经网络调整后的模型参数;即,利用所述第一任务集集合采用预定的元学习训练算法对步骤13中训练好的长短时记忆神经网络的训练模型参数进行调整;

步骤16,完成元学习训练后的所述长短时记忆神经网络即为所述检测模型;所述检测模型将用于实际生产或应用中,进行相关数据的检测。

一些示例性实施例中,步骤11中,选用同种型号的不同台发动机的氧涡轮入口压力信号采集数据作为原始数据,其中从原始数据中提取预设数量的工况状态数据,包括:正常信号数据,异常信号数据,分别标记为正常标签或异常标签,形成携带有正常标签的正常样本数据和携带有异常标签的异常样本数据,由此构成样本数据。

一些示例性实施例中,每一台发动机的正常、异常信号数据集取相同的样本量。

一些示例性实施例中,步骤12中,划分出的所述第一样本数据子集作为长短期记忆神经网络的训练集,即训练数据。

一些示例性实施例中,步骤13中,训练所述长短期记忆神经网络,包括:

输入经过分窗时移的训练数据以及期望目标向量,初始化lstm神经网络的参数,如输入,遗忘,更新,输出门的权重参数(wi、wf、wc、wo),以及其的偏置参数(bi,bf,bc,bo),连接权重参数v,经过前向传播算法得到学习误差向量,根据其结果进行反向传播算法迭代更新lstm神经网络模型参数,并进行优化,直到更新轮数结束,得到lstm神经网络更新后的模型参数;完成整个训练后所更新后的模型参数,也称为训练模型参数。

一些示例性实施例中,前向传播算法流程如图5所示。

前向传播算法说明及公式如下:

首先,根据初始化的输入,遗忘,更新,输出门的权重参数(wi、wf、wc、wo),以及其的偏置参数(bi,bf,bc,bo),计算输入,遗忘,更新,输出各个门的输出(it、ft、ct、ot),进而得到当前状态输出ht。下一步,再根据初始化的连接权重参数v,计算得到当前lstm神经元输出st。下一步,通过softmax函数计算得到预测结果下一步,根据真实结果tt以及损失函数计算得到误差et。

it=σ(wi*(xt+ht-1+ct-1)+bi)

ft=σ(wf*(xt+ht-1+ct-1)+bf)

ot=σ(wo*(xt+ht-1+ct-1)+bo)

ht=ot.*tanh(ct)

st=v*ht

其中,σ为sigmoid函数,公式为:其中,该运算符号.*为点乘运算,为更新门当前输出的更新值,ct-1为上一个更新门输出,ct为当前更新门输出,i为神经元序号。tt为期望目标向量。

一些示例性实施例中,反向传播算法说明及公式如下:

首先,为了得到输入,遗忘,更新,输出门的权重参数变化更新值,根据前向传播算法得到的误差et计算得到误差et对于ht的偏导

其中,τ为矩阵转置运算符号,σ′为sigmoid函数的导函数,tanh′为tanh函数的导函数,diag为对角矩阵运算,arg为偏导函数中的变量。

下一步,分别计算输出门,遗忘门,输入门,更新门更新下一时刻(ot+1,ft+1,it+1,ct+1)的输出对于当前状态ht的偏导以此计算下一时刻状态ht+1对于当前状态ht的偏导从而得到误差et对于当前状态ht以及当前输出门的偏导其中,分别为以上二者的公式化简。

下一步,计算输出门输出对于更新门输出的偏导以及状态输出对于更新门的偏导

下一步,分别计算更新门输出对于输入,遗忘,更新门更新的输出的偏导以及误差对于更新输出的偏导

下一步,分别计算输入门,遗忘门,更新门更新,输出门输出对于其相对应的权重参数(wi、wf、wc、wo)的偏导

其中,ep,eq均为单位向量。

下一步,化简偏导公式分别为

下一步,分别计算得到误差对于输入门,遗忘门,更新门,输出门相对应的权重参数的偏导分别计算输入门,遗忘门,更新门,输出门输出对于其相对应的偏置的偏导由此分别得到其相应的梯度更新。

其中,unitn为n维的单位向量

下一步,分别计算出误差对于输入门,遗忘门,更新门,输出门相对应的偏置参数的偏导由此分别得到其相应的梯度更新。

一些示例性实施例中,对lstm神经网络模型参数进行优化包括:采用预设的参数优化算法进行优化;

一些示例性实施例中,参数优化算法采用的是momentum算法

momentum算法:

首先,计算各个权重参数当前的梯度更新值gt。

下一步,初始化当前的期望平方梯度e[g2]t,并进行迭代更新。下一步,迭代更新各个权重参数w。

e[g2]t=eta*e[g2]t-1+α*gt

w=w-e[g2]t

其中,gt为当前权重参数梯度更新,e[g2]t为当前的期望平方梯度,w泛指为权重参数(wi、wf、wc、wo),eta为动量因子,α为学习率。

一些示例性实施例中,步骤14根据所述样本数据确定第一任务集集合,包括:

所获取的数据样本总体分为正常(n)和异常(a)两个大类数据集,其中在正常(n)中分为多个(l个,l大于0)子集(ni,i=1,2,3..l),在异常(a)中分为多个(l个,l大于0)子集(ai,i=1,2,3..l),在此说明,正常与异常数据集中的各个子集中包括的样本数据彼此之间均不同。下一步,从正常数据集中抽取某一正常子集,记为na,从异常数据集中抽取某一异常子集,记为am。下一步,从正常子集na和异常子集am中各抽取m-k个样本,其中m>>k,k≥0,a=m;即m远大于k。一些示例性实施例中,m=x*k,x为大于1的数;例如,m=20,k=4;m=50,k=5;m=35,k=10。一些示例性实施例中,k=0,m=30。不限于本实施例举例的具体数值。一些示例性实施例中,正常(n)中分为多个(l个,l大于0)子集(ni,i=1,2,3..l),异常(a)中分为多个(l个,l大于0)子集(ai,i=1,2,3..l),l等于采样的发动机的个数,每一个正常子集ni中的样本数据来自同一个发动机i,每一个异常子集ai中的样本数据来自同一个发动机i;

上述正常子集na和异常子集am中a=m,即正常子集na和异常子集am中的样本数据来自动一个发动机所采集的样本数据。

下一步,再从正常数据集中抽取另一正常子集,记为nb,从异常数据集中抽取另一异常子集,记为an。

下一步,从正常子集nb与异常子集an中,各取k+q个样本(其中q>0,k≥0,b=n),其中q个样本用来建立疑问集(qi)。下一步,用上一步的正常子集nb与异常子集an中分别剩下的k个样本与正常子集na和异常子集am中各抽取m-k个样本组合成为支持集(si)。其中,b=n表示另一正常子集nb和另一异常子集an中的样本数据来自另一个发动机(不同于正常子集na和异常子集am所属发动机)所采集的样本数据。

下一步,根据上述步骤可建立多组支持集与疑问集,每一组支持集与疑问集构成一个任务集。这多组支持集和疑问集对应多个任务集,即为用于多个任务训练和测试的总数据集合再将其分为用于训练的数据集,记为第一任务集集合,以及用于测试的数据集,记为第二任务集集合。其中,第一任务集集合所包括的任务集与第二任务集集合所包括的任务集不同。

关于数据集合的生成方式,以及用于多任务训练的整体数据总集合如图3,4所示。其中,图3的右图用于示例性说明一个任务集中支持集合疑问集的组成,并不代表整体(样本)数据集合只形成一个任务集。

一些示例性实施例中,步骤15包括:基于预定的元学习训练算法进行训练,包括:

输入为:用k次样本学习的训练数据集合为数据集合中的一个任务(第一任务集集合中一个任务集),学习率β,更新迭代训练次数u,元学习优化器的自适应内部更新超参数α,γ的初始值和步骤13中已经完成训练的lstm神经网络。其中,所述已完成训练的lstm神经网络包括训练好的分类器f和对应的权重参数w。

输出为:分类器优化后的权重参数w,w泛指为权重参数(wi、wf、wc、wo),所述元学习优化器的自适应内部更新优化超参数α,γ。

一些示例性实施例中,该元学习训练算法的步骤如下:

根据训练数据集合执行下列循环过程:

while持续执行循环:

for中的每个样本do:

关于循环过程的说明如下,为在第i个数据集的初始迭代的权重参数。在公式(1)中,numberofsi为第i个支持集中的样本个数,x为si支持集中的样本,y为与之所对应的标签数据,为以x为输入数据,并以为分类器f的权重参数作为分类器f的输入所得到的值。为si支持集中的所有样本损失函数值的总和,为si支持集平均损失函数值,在公式(2)中,为损失函数对于变量的偏导函数值,为在第i个数据集的第j轮迭代的权重参数。γj为γ的j次方。在公式(3)中,numberofqi为第i个疑问集中的样本个数,x为qi疑问集中的样本,y为与之所对应的标签数据,为qi疑问集中的所有样本损失函数值的总和。为qi疑问集平均损失函数值。在公式(4),(5),(6)中,分别为对于变量w,α,γ的偏导函数值。

即循环过程如下:

针对训练数据集合中的每一个任务集,依此执行以下步骤151-154:

步骤151,对于该任务集中所包含的每一个样本数据,依次执行以下步骤1511-1512:

步骤1511,该任务集的初始权重参数即赋值为当前的权重参数w;j赋值为1;

步骤1512,对于该样本数据,从j=1开始,j小于u时,循环执行以下步骤15121-15124:

步骤15121,计算当前任务集中支持集的平均损失函数值;

步骤15122,计算当前任务集中第j轮迭代的分类器f权重参数

步骤15123,计算当前任务集中疑问集的平均损失函数值;

步骤15124,j自增1;

步骤152,根据分类器f权重参数w、预设的学习率β、步骤1512执行后迭代得到的当前任务集中疑问集的平均损失函数值,确定新的权重参数w;

步骤153,根据自适应内部更新超参数α的初始值、预设的学习率β、步骤1512执行后迭代得到的当前任务集中疑问集的平均损失函数值,确定新的自适应内部更新超参数α;

步骤154,根据自适应内部更新超参数γ的初始值、预设的学习率β、步骤1512执行后迭代得到的当前任务集中疑问集的平均损失函数值,确定新的自适应内部更新超参数γ。

本公开实施例提供一种检测模型的验证方法,如图1所示,包括,

步骤11,获取样本数据;其中,所述样本数据包括:携带有正常标签的正常样本数据和携带有异常标签的异常样本数据;

步骤21,根据所述样本数据确定第二任务集集合;所述第二任务集集合中的样本数据作为元学习测试集;

步骤22,利用所述第二任务集集合和步骤16所确定的检测模型进行元学习测试;

步骤23,根据元学习测试结果和预设的判别算法,确定所述检测模型的检测准确度。

一些示例性实施例中,步骤21中,第二任务集集合中包括的任务集不同于第一任务集集合所包括的任务集,即用于测试的数据集。

一些示例性实施例中,步骤22中,采用元学习测试算法进行元学习测试,包括:

输入为:用k次样本学习的测试数据集合为数据集合中的一个任务(第二任务集集合中一个任务集),更新迭代训练次数u,通过之前训练得到的元学习优化器的自适应内部超参数α,γ,以及分类器的f权重参数w。

输出为:元学习后的学习误差

该测试算法的步骤如下述循环过程:

while持续执行循环:

for中的每个样本do:

关于循环过程的说明如下:公式(7),(8)与之前的(1),(2)形式相同,不同的是(7),(8)计算的是测试集中的支持集的平均损失函数值,以及测试集中的第i个支持集的第j轮迭代的权重参数在公式(9)中,为第i个疑问集中所有的数据样本,包括其中分别为第i个疑问集中的正常样本数据、异常样本数据;为第i个疑问集中所有的数据样本对应的标签数据,包括其中,分别为第i个疑问集中的样本所对应的正常、异常标签数据,为输入样本为第i个疑问集中所有的数据样本的与其中正常样本的误差损失,为输入样本为第i个疑问集中所有的数据样本的与其中异常样本的误差损失。

即循环过程如下:

针对测试数据集合中的每一个任务集,依此执行以下步骤221-223:

步骤221,对于该任务集中所包含的每一个样本数据,依次执行以下步骤2211-2212:

步骤2211,该任务集的初始权重参数即赋值为当前的权重参数w;j赋值为1;

步骤2212,对于该样本数据,从j=1开始,j小于u时,执行以下步骤22121-22123:

步骤22121,计算当前任务集中支持集的平均损失函数值;

步骤22122,计算当前任务集中第j轮迭代的分类器f权重参数

步骤22123,j自增1;

步骤222,根据当前任务集中的疑问集的所有样本数据和对应的正常标签,确定当前任务集中的疑问集中所有样本数据与其正常样本数据的损失误差;

步骤223,根据当前任务集中的疑问集的所有样本数据和对应异常的标签,确定当前任务集中的疑问集中所有样本数据与其异常样本数据的损失误差。

执行上述元学习测试算法后,获得了测试数据集合中每一个任务集的正常样本数据的误差损失和每一个任务集的异常样本数据的误差损失,即为测试结果。其中,损失误差又称为学习误差。

一些示例性实施例中,步骤23包括,计算输入的正常信号数据学习误差与异常信号学习误差,如果前者的值小于后者则,信号处于正常状态。否则,信号处于异常状态。最后,利用混淆矩阵法验证其信号检测准确度。

一些示例性实施例中,对于每一个样本数据,其归属的任务集的正常样本数据的误差损失即为该样本数据的正常信号数据学习误差,其归属的任务集的异常样本数据的误差损失即为该样本数据的异常信号数据学习误差。

一些示例性实施例中,步骤23中,每个任务集的疑问集中包括q个样本,因此,每个任务集与正常样本的误差损失为1*q的向量,与异常样本的误差损失也为1*q的向量。假设,得到的中的第一个元素值为0.4,得到的中的第一个元素值为0.6,因为0.4<0.6,则该样本对于正常样本学习误差小于异常样本的学习误差,根据判别算法,可知该样本为正常状态。以此类推,将每个任务集的疑问集中的每个样本作判断,得到一个1*q的向量,该1*q的向量代表任务集的疑问集中全部样本的状态,所述状态包括:正常或异常,称为样本状态向量。

最终得到全部测试数据集合的疑问集中的样本状态向量;根据全部测试数据集合的疑问集中的样本状态向量,利用混淆矩阵法计算得到信号检测准确度。

根据上述实施例一和二确定和检验方法,进行试验,结果如下:

其中,无元学习训练的测试结果,是以步骤13后训练得到的长短期记忆神经网络作为检测模型,对测试数据进行检测得到的测试结果;有元学习训练的测试结果,是以经过了步骤15的元学习训练后,以步骤16所确定的检测模型对测试数据进行检测得到的测试结果。可以看到,经过元学习训练后的所述长短时记忆神经网络具备更高的检测准确率。

实验1:

在本例中,数据集选用氧气涡轮入口压力在同种型号的不同发动机额定工况时时所采集的信号数据,直接从采集到的数据集合中将其总数量的80%划分为lstm神经网络的训练集(第一样本数据子集),即其中正常、异常样本的数量均等。各发动机所采集到的正常,异常信号样本数量在训练集中均等。将选取出来的训练集作为lstm的预训练。本例中,发动机的数量为10,(l=10),在元学习数据集合中的正常样本,异常样本子集数量分别为10个,第i个正常样本子集和第i个异常样本子集的数据均来自同一个发动机(第i个发动机)其中在各个正常样本子集中正常、异常样本数量均为50,共10*(50+50)=1000个样本数据。

在本例中,k取值为0,m取值为30,q取值为40,学习率α取值0.01,动量因子eta取值0.05,u迭代轮次为1000,元学习训练中的超参数α,γ初始值分别为0.001,1。

对于未知样本,在有和没有经过元学习训练对于用于元学习测试样本集的检测结果对比如下表1:

表1未知样本在有、无经过元学习训练的检测结果对比

无元学习训练(k=0),整体检测准确率:57.5%

有元学习训练(k=0),整体检测准确率:78.75%。

其中,57.5%=(25+21)/(40+40),78.75%=(35+28)/(40+40)

根据表1可以看到,经过了元学习训练后的检测模型(lstm神经网络)具有更高的整体检测准确率。

实验2:

在本例中,数据集选用氧气涡轮入口压力在同种型号的不同发动机额定工况时时所采集的信号数据,直接从采集到的数据集合中将其总数量的80%划分为lstm神经网络的训练集(第一样本数据子集),即其中正常、异常样本的数量均等。各发动机所采集到的正常,异常信号样本数量在训练集中均等。将选取出来的训练集作为lstm的预训练。本例中,发动机的数量为10,(l=10),在元学习数据集合中的正常样本,异常样本子集数量分别为10个,第i个正常样本子集和第i个异常样本子集的数据均来自同一个发动机(第i个发动机),其中在各个正常样本子集中正常、异常样本数量均为50。

在本例中,k取值分别为1、5、9,m取值为30,q取值为40,学习率α取值0.01,动量因子eta取值0.05,u迭代轮次为1000,元学习训练中的超参数α,γ分别为0.001,1。。

对于少次样本(0<k<10),在有和没有经过元学习训练对于用于元学习测试样本集的检测结果分别如下表2,3:

表2少次样本在没有经过元学习训练的检测结果

无元学习训练(k=1、5、9),整体检测准确率分别为:58.75%、66.25%、72.5%

其中,58.75%=(26+21)/(40+40),66.25%=(29+24)/(40+40),66.25%=(31+27)/(40+40)。

表3少次样本在有经过元学习训练的检测结果

有元学习训练(k=1、5、9),整体检测准确率分别为:82.5%、83.75%、88.75%。

其中,82.5%=(36+30)/(40+40),83.75%=(26+31)/(40+40),88.75%=(36+35)/(40+40)。

根据表2,3可以看到,经过了元学习训练后的检测模型(lstm神经网络)具有更高的整体检测准确率。

实施例三

本公开实施例提供一种检测模型的确定方法,如图2所示,包括,

步骤201,获取样本数据,所述样本数据包括:携带有正常标签的正常样本数据和携带有异常标签的异常样本数据;

步骤202,根据从所述样本数据中划分出的第一样本数据子集初始化并训练长短时记忆神经网络,确定训练好的所述长短时记忆神经网络;

步骤203,根据所述样本数据确定第一任务集集合,利用所述第一任务集集合采用预定的元学习训练算法对训练好的长短时记忆神经网络的模型参数进行调整,确定调整模型参数后的所述长短时记忆神经网络为所述检测模型。

一些示例性实施例中,所述根据所述样本数据确定第一任务集集合,包括:

将所述样本数据分为正常样本数据集和异常样本数据集;

根据所述正常样本数据集和所述异常样本数据集构建多组支持集和疑问集;

根据所述多组支持集和疑问集,确定多个任务集;其中,每一个任务集对应一组支持集和疑问集;

从所述多个任务集中选择第一预设比例的任务集构成所述第一任务集集合。

一些示例性实施例中,所述样本数据从l个设备中采集,每一个设备所采集的正常样本量和异常样本量相等;

所述根据所述正常样本数据集和所述异常样本数据集构建多组支持集和疑问集,包括:

将所述正常样本数据集分为l个正常子集,将所述异常样本数据集分为l个异常子集;每一个正常子集中的样本数据为同一个设备所采集的正常样本数据,每一个异常子集中的样本数据为同一个设备所采集的异常样本数据;

每一组支持集和疑问集分别根据以下方式构建:

从l个正常子集中选取一个正常子集na,从l个异常子集中选取一个异常子集am;所述正常子集na和异常子集am中的样本数据为来自同一个设备所采集的样本数据;

从所述正常子集na中抽取m-k个正常样本数据,从所述异常子集am中抽取m-k个异常样本数据;

从l个正常子集中选取另一个正常子集nb,从l个异常子集中选取另一个异常子集an;所述正常子集nb和异常子集an中的样本数据同为来自另一个设备所采集的样本数据;

从所述正常子集nb中抽取k+q个正常样本数据,从所述异常子集an中抽取k+q个异常样本数据;

根据所述k+q个正常样本数据中的q个正常样本数据和所述k+q个异常样本数据中的q个异常样本数据,建立一个疑问集;

根据所述k+q个正常样本数据中剩余的k个正常样本数据、所述k+q个异常样本数据中剩余的k个异常样本数据,和所述m-k个正常样本数据、所述m-k个异常样本数据,建立一个支持集;

所述一个支持集和所述一个疑问集构建一组支持集和疑问集;

其中,l为大于0的整数,k为大于或等于0的整数,m为大于k的整数,q为大于0的整数;不同组的支持集和疑问集所选取的正常子集不同,不同组的支持集和疑问集所选取的异常子集不同。

一些示例性实施例中,所述根据所述样本数据中的第一样本数据子集初始化并训练长短时记忆神经网络,包括:

对所述第一样本数据子集进行分窗时移得到训练数据;

根据所述训练数据和预设的期望目标向量,初始化所述长短时记忆神经网络;

根据前向传播算法确定初始化后的所述长短时记忆神经网络的学习误差向量;

根据所述学习误差向量利用反向传播算法迭代更所述长短时记忆神经网络的模型参数进行所述长短时记忆神经网络的训练,确定所述长短时记忆神经网络训练后的模型参数。

一些示例性实施例中,所述利用所述第一任务集集合采用预定的元学习训练算法对训练好的长短时记忆神经网络的模型参数进行调整,包括:

根据训练好的长短时记忆神经网络的模型参数,预设的学习率,第一更新迭代训练次数,元学习优化器的自适应内部更新超参数初始值,对所述第一任务集集合中每一个任务集,依次采用k次样本学习法,进行所述元学习优化器的训练,得到调整后的长短时记忆神经网络的模型参数。

实施例四

本公开实施例提供一种检测模型的验证方法,包括,

步骤401,根据所述样本数据确定第二任务集集合,利用所述第二任务集集合和检测模型确定学习误差;

步骤402,根据所述学习误差确定所述检测模型的检测准确度;

其中,所述检测模型为根据上述任一一种检测模型的确定方法所确定的检测模型。

一些示例性实施例中,所述根据所述样本数据确定第二任务集集合,包括:

从所述多个任务集中选择第二预设比例的任务集构成所述第二任务集集合;

所述第二任务集集合包括的任务集不同于所述第一任务集集合包括的任务集。

一些示例性实施例中,所述学习误差包括:正常样本学习误差和异常样本学习误差;

所述利用所述第二任务集和所述检测模型确定学习误差,包括:

根据所述检测模型,预设的第二更新迭代训练次数,所述元学习优化器的训练后的自适应内部更新超参数,对所述第二任务集集合中每一个任务集,依次确定每一个任务集的正常样本学习误差和异常样本学习误差。

一些示例性实施例中,根据所述学习误差确定所述检测模型的检测准确度,包括:

根据所述正常样本学习误差和异常样本学习误差,确定每一个样本的状态,包括:正常或异常;

根据所确定的第二任务集中全部样本的状态,利用混淆矩阵法确定所述检测模型的检测准确度。

实施例五

本公开实施例提供一种检测模型的确定装置,包括,

样本获取模块501,设置为获取样本数据,所述样本数据包括:携带有正常标签的正常样本数据和携带有异常标签的异常样本数据;

lstm神经网络训练模块502,设置为根据从所述样本数据中划分出的第一样本数据子集初始化并训练长短时记忆神经网络,确定训练好的所述长短时记忆神经网络;

元学习训练模块503,设置为根据所述样本数据确定第一任务集集合,利用所述第一任务集集合采用预定的元学习训练算法对训练好的长短时记忆神经网络的模型参数进行调整,确定调整模型参数后的所述长短时记忆神经网络为所述检测模型。

实施例六

本公开实施例提供一种检测模型的验证装置,包括,

学习误差确定模块601,设置为根据所述样本数据确定第二任务集集合,利用所述第二任务集集合和检测模型确定学习误差;

检测准确度确定模块602,根据所述学习误差确定所述检测模型的检测准确度。

本公开实施例还提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一一种检测模型的确定方法,或执行上述任一一种检测模型的验证方法。

本公开实施例还提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一一种检测模型的确定方法,或执行上述任一一种检测模型的验证方法。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1