一种基于多维时间序列的单粒子故障预测方法

文档序号:37633678发布日期:2024-04-18 17:47阅读:5来源:国知局
一种基于多维时间序列的单粒子故障预测方法

本发明属于故障系统中的故障预测领域,涉及一种基于多维时间序列的单粒子故障预测方法。


背景技术:

1、长短时记忆神经网络(lstm)克服了sepp在其1991年发表的论文中提出的根本性的深度学习问题。这是机器学习历史上最重要的论文之一。它还通过在1995年发布的技术报告中所称的长短时记忆神经网络的基本原理为解决根本性的深度学习问题提供了重要的思路。这催生了如下所述的大量后续工作。带有遗忘门的vanilla lstm架构,这是1999年到2000年间被提出的长短时记忆神经网络变体,直到现在仍然被广泛使用(例如,在谷歌的tensorflow中)。长短时记忆神经网络遗忘门实际上是一种端到端可微的快速权值控制器。

2、在2000年代初期,jürgen schmidhuber说明了长短时记忆神经网络如何学习传统模型无法学习的语言。到了2016~2017年,谷歌翻译和facebook翻译均基于两个连接的长短时记忆神经网络被提出,其中一个长短时记忆神经网络被用于输入文本,另一个被用于输出翻译,这种模型的性能比之前的模型要好得多。不久之后,长短时记忆神经网络便被广泛应用于涉及包括语言、语音、视频在内的序列数据的一切任务。截至2017年,人们基于长短时记忆神经网络模型构建了facebook的机器翻译系统,超过10亿台iphone上运行的苹果的quicktype智能输入法,亚马逊的alexa语音助手,谷歌的语音识别、图像字幕生成、机器翻译、自动邮件回复等系统。美国的商业周刊将长短时记忆神经网络成为商业化程度最高的人工智能研究成果。

3、单粒子效应是指计算机、航天器等中的电子器件受到高能带电粒子的照射,导致灵敏结构器件的逻辑状态发生不正常改变或者是器件损坏的现象。而单粒子翻转是指高能带电粒子使得器件逻辑状态发生翻转的一种单粒子效应。单粒子翻转也称为软错误或作瞬时性故障。

4、航空航天领域的工作环境中存在大量的高能粒子和射线的辐射。这些高能粒子和辐射很有可能会引起一系列的单粒子效应,从而影响相关计算机设备的正常运行,甚至使整个航天器失效。并且随着半导体技术的飞速发展,航天器使用半导体器件的集成度也不断提高,并且器件的特征尺寸越来越小,使得工作的电压越来越小。所以临界的电荷也越来越小,从而越容易导致单粒子效应的发生。

5、本专利提出一种基于多维时间序列的单粒子故障预测方法,将长短期神经网络模型和单粒子故障预测相结合,利用系统中历史故障信息作为模型训练输入,得到对系统中未来发生的单粒子故障的预测,可为单粒子故障预测分析提供一种思路。


技术实现思路

1、为了提高故障系统中单粒子翻转故障预测的能力,本发明提供了一种基于多维时间序列的单粒子翻转故障预测方法。它利用全连接网络提取数据之间的关联维度,来增加数据维度,然后利用长短期神经网络学习系统中出现单粒子故障的相关信息,从而提高长短期神经网络模型的故障预测的能力。

2、一种基于多维时间序列的单粒子故障预测方法的基本流程为:

3、步骤1:故障信息收集和预处理;

4、步骤2:数据维度加权处理和数据集的划分;

5、步骤3:输入处理后的数据,构造长短时记忆神经网络预测模型;

6、步骤4:对系统进行单粒子翻转预测。

7、针对步骤1的具体过程为:故障信息由四维向量组成,这四维分别由故障发生的位置、故障持续的时间、故障发生的时间、故障的类型所组成。收集系统实时收集系统发生的所有单粒子故障信息,对于故障发生的位置有通用寄存器、浮点寄存器以及进程内存中的地址段,对于在通用寄存器上发生的故障其位置向量用0表示,对于在浮点寄存器上发生的故障其位置向量用1表示,进程内存中发生的故障其位置向量用2表示,收集故障发生的时间和持续时间并填入相应的向量中,对于故障类型为固定位置单粒子翻转其类型向量用0表示,对于故障类型为随机位置单粒子翻转其类型向量用1表示,完整填入收集的单粒子故障信息即完成故障信息的收集和预处理。

8、针对步骤2的具体过程为:设计神经网络单元捕捉历史采样数据的时间特征,作为长短时记忆神经网络模型的输入。

9、针对步骤3的具体过程为:选择使用长短期神经网络模型来处理多维时间序列数据,构建长短期神经网络,初始化长短期神经网络隐含层单元个数,选择sigmoid函数作为激活函数,选择adam优化器和mse损失函数,对模型进行训练,完成故障预测模型的建立。

10、针对步骤4的具体过程为:将收集并预处理后的数据输入到多维时间序列的长短时记忆神经网络故障预测模型,计算下一次的故障预测结果。

11、一种基于多维时间序列的单粒子故障预测方法,所述方法包括数据收集模块、模型训练模块、故障预测模块。

12、数据收集模块,其功能是收集系统中的故障信息。对系统进行实时故障监控,获取故障信息并进行预处理,故障信息由四维向量组成,分别由故障发生位置、故障持续时间、故障发生时间、故障类型所组成。对于故障发生的位置有通用寄存器、浮点寄存器以及进程内存中的地址段,对于在通用寄存器上发生的故障其位置向量用0表示,对于在浮点寄存器上发生的故障其位置向量用1表示,进程内存中发生的故障其位置向量用2表示,收集故障发生的时间和持续时间并填入相应的向量中,对于故障类型为固定位置单粒子翻转其类型向量用0表示,对于故障类型为随机位置单粒子翻转其类型向量用1表示,填入所有单粒子故障信息即完成故障信息的收集和预处理。并完成数据集的训练集和测试集的分类工作。

13、模型训练模块,其功能是训练长短期时间网络模型。读取故障收集模块收集和预处理后的数据,从数据中提取有意义的特征,以供模型训练使用,接着用长短期神经网络训练,得到单粒子翻转故障预测模型。使用预处理后的数据集对构建好的预测模型进行训练,训练过程中,预测模型通过反向传播算法不断调整权重,以最小化损失函数。训练集和验证集的划分可以用于监控模型的过拟合情况。

14、故障预测模块,其功能是进行故障预测,完成对系统中单粒子翻转故障的出现时间和位置的预测。



技术特征:

1.一种基于多维时间序列的单粒子故障预测方法,其特征在于利用系统历史单粒子故障数据来构建长短时记忆神经网络单粒子预测模型来预测系统未来可能出现的单粒子故障,主要包括:数据收集模块,模型训练模块,故障预测模块;

2.根据权利要求1所述的数据收集模块,其特征在于收集系统历史故障信息,并将这些信息用四维向量表示,这四维分别由故障发生的位置、故障持续的时间、故障发生的时间、故障的类型所组成,将收集得到的数据按照时间戳进行对齐,并把收集到的每组数据当做一个特征,得到多维时间序列的数据,为了提高预测模型训练的稳定性和加速模型训练速度,用min-max方法对数据进行归一化处理,为了使数据更适合用于模型的训练,再对数据进行指数加权移动平均处理。

3.根据权利要求1所述的模型训练模块,其特征在于利用处理后的数据进行长短时间神经网络模型的建立,首先数据通过遗忘门让近期内不是很相关的结果先被忽视,避免它们影响之后的路径,再通过输入门,输入门用于更新细胞状态,首先通过sigmoid函数得到一个0~1之间的值,其次通过tanh函数创造一个新的侯选值向量,然后将sigmoid的输出值与tanh的输出值相乘,最后,由输出门确定下一个隐藏状态的值,首先,将前一个隐藏状态和当前输入传递到sigmoid函数中,然后将新得到的细胞状态传递给tanh函数,最后将tanh的输出与sigmoid的输出相乘,以确定隐藏状态应携带的信息,再将隐藏状态作为当前细胞的输出,把新的细胞状态和新的隐藏状态传递到下一个时间步长中去,至此完成lstm模型的训练。

4.根据权利要求1所述的故障预测模块,其特征在于可以用于预测系统中出现的单粒子故障会发生的类型和位置。


技术总结
本发明提供了一种基于多维时间序列的单粒子故障预测方法,该方法采用全连接网络提取故障信息的关联维度,然后利用循环神经网络中一种门控循环单元结构长短期神经网络学习辐射环境中发生的单粒子故障信息,得到故障注入预测模型。该系统包括数据收集模块、模型训练模块和故障预测模块。数据收集模块从系统中获取历史单粒子故障数据,并对该数据进行预处理,再交给模型训练模块。模型训练模块收到预处理后的数据开始进行长短时记忆神经网络模型的训练和优化。故障预测模块用训练好的模型预测系统中会出现的单粒子故障。

技术研发人员:季振洲,俞越,李少博,张立钊,孔胜嵩,马瑞琳,王鹤儒,谢玮勋,万一凡
受保护的技术使用者:哈尔滨工业大学(威海)
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1