神经网络的信息流动控制方法、装置、设备及介质

文档序号:35392571发布日期:2023-09-09 14:47阅读:26来源:国知局
神经网络的信息流动控制方法、装置、设备及介质

本发明涉及神经网络,尤其涉及一种神经网络的信息流动控制方法、装置、设备及介质。


背景技术:

1、神经网络又称人工神经网络(ann)或模拟神经网络(snn),是机器学习的子集,同时也是深度学习算法的核心。其名称和结构均受到人脑的启发,可模仿生物神经元相互传递的方式。神经网络由节点层组成,包含一个输入层、多个隐藏层和一个输出层。每个节点也称为一个人工神经元,它们连接到另一个节点,具有相关的权重和阈值。如果任何单个节点的输出高于指定的阈值,那么会激活该节点,并将数据发送到网络的下一层;否则,不会将数据传递到网络的下一层。

2、神经网络依靠训练数据来学习,并随时间推移提高自身准确性。而一旦这些学习算法经过了调优,提高了准确性,它们就会成为计算机科学和人工智能领域的强大工具,使我们能够快速对数据进行分类和聚类。然而,由于神经网络具有黑箱特性,并且神经网络涉及大量的网络参数,这些抽象的网络参数通常与所需解决的问题的物理性质无关。因此,研究人员无法直接将神经元的网络参数解释为可理解的知识,这导致神经网络的不透明性和不可解释性,因此可解释性尤为重要。

3、增强神经网络可解释性的研究思路之一是引入人类的先验知识,使模型尽量学习人类的判别标准。例如,睡眠分期领域拥有大量丰富的先验知识,这相对于计算机视觉与自然语言领域具有独特优势。但是,各睡眠阶段的划分规则存在一定的模糊性,甚至不同的人类专家在某种程度上可能会产生分歧。


技术实现思路

1、本发明描述了一种神经网络的信息流动控制方法、装置、设备及介质,能够增强神经网络的可解释性。

2、根据第一方面,本发明提供了一种神经网络的信息流动控制方法,包括:

3、将样本体表生理数据输入到目标神经网络中;其中,所述目标神经网络包括一个输入层、多个隐藏层和一个输出层;

4、针对至少一个所述隐藏层,对该隐藏层的至少部分输入特征进行置零处理;

5、在每对一个所述隐藏层进行置零处理时,确定所述目标神经网络在进行该置零处理前后的模型性能的变化量;

6、基于与每次进行的置零处理对应的模型性能的变化量,确定进入各所述隐藏层的输入特征的置零位置,以实现待测体表生理数据在所述目标神经网络中的信息流动控制;其中,所述样本体表生理数据和所述待测体表生理数据的数据类型相同,且所述样本体表生理数据和所述待测体表生理数据均为时间序列数据。

7、根据一个实施例,所述体表生理数据包括如下中的至少一种:呼吸压数据、脑电数据、眼电数据、肌电数据、心电数据、胸带数据、腹带数据、脉搏波数据、腿动数据、鼾声数据、脉率数据和血氧饱和度数据。

8、根据一个实施例,所述隐藏层包括如下中的至少一种:卷积层、激活层、池化层和全连接层。

9、根据一个实施例,所述卷积层的层数至少为两层,进行置零处理的隐藏层为前两层所述卷积层。

10、根据一个实施例,所述模型性能包括如下中的至少一种:准确率、kapapa系数和f1分数。

11、根据一个实施例,所述对该隐藏层的至少部分输入特征进行置零处理,包括:

12、将该隐藏层的输入特征进行频域变换处理,得到第一频谱特征;

13、将所述第一频谱特征中频率低于预设频率的位置置零,得到第二频谱特征;

14、将所述第二频谱特征进行频域反变换处理,得到对该隐藏层的至少部分输入特征进行置零处理后的目标输入特征。

15、根据一个实施例,所述基于与每次进行的置零处理对应的模型性能的变化量,确定进入各所述隐藏层的输入特征的置零位置,包括:

16、针对每次进行的置零处理,判断所述目标神经网络在进行该置零处理前后的模型性能是否得到提高;

17、如果得到提高,则判断所述目标神经网络在进行该置零处理前后的模型性能的变化量是否大于预设变化量;

18、如果大于预设变化量,则将当前进行的置零处理的置零位置作为进入该隐藏层的输入特征的置零位置。

19、根据第二方面,本发明提供了一种神经网络的信息流动控制装置,包括:

20、输入单元,用于将样本体表生理数据输入到目标神经网络中;其中,所述目标神经网络包括一个输入层、多个隐藏层和一个输出层;

21、置零单元,用于针对至少一个所述隐藏层,对该隐藏层的至少部分输入特征进行置零处理;

22、第一确定单元,用于在每对一个所述隐藏层进行置零处理时,确定所述目标神经网络在进行该置零处理前后的模型性能的变化量;

23、第二确定单元,用于基于与每次进行的置零处理对应的模型性能的变化量,确定进入各所述隐藏层的输入特征的置零位置,以实现待测体表生理数据在所述目标神经网络中的信息流动控制;其中,所述样本体表生理数据和所述待测体表生理数据的数据类型相同,且所述样本体表生理数据和所述待测体表生理数据均为时间序列数据。

24、根据第三方面,本发明提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现第一方面的方法。

25、根据第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。

26、根据本发明提供的神经网络的信息流动控制方法、装置、设备及介质,通过对至少一个隐藏层的至少部分输入特征进行置零处理,并基于与每次进行的置零处理对应的模型性能的变化量,确定进入各隐藏层的输入特征的置零位置,这样就可以主动抛弃不能被目标神经网络所利用的有效信息,降低特征分布的复杂性,提高模型性能。也就是说,上述技术方案可以根据输出结果来解释模型,增强了神经网络的可解释性,即实现了神经网络信息流动的逐层可控,从而可以实现待测体表生理数据在目标神经网络中的信息流动控制。



技术特征:

1.一种神经网络的信息流动控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述体表生理数据包括如下中的至少一种:呼吸压数据、脑电数据、眼电数据、肌电数据、心电数据、胸带数据、腹带数据、脉搏波数据、腿动数据、鼾声数据、脉率数据和血氧饱和度数据。

3.根据权利要求1所述的方法,其特征在于,所述隐藏层包括如下中的至少一种:卷积层、激活层、池化层和全连接层。

4.根据权利要求3所述的方法,其特征在于,所述卷积层的层数至少为两层,进行置零处理的隐藏层为前两层所述卷积层。

5.根据权利要求1所述的方法,其特征在于,所述模型性能包括如下中的至少一种:准确率、kapapa系数和f1分数。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述对该隐藏层的至少部分输入特征进行置零处理,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于与每次进行的置零处理对应的模型性能的变化量,确定进入各所述隐藏层的输入特征的置零位置,包括:

8.一种神经网络的信息流动控制装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。


技术总结
本发明涉及神经网络技术领域,尤其涉及一种神经网络的信息流动控制方法、装置、设备及介质。该方法包括:将样本体表生理数据输入到目标神经网络中;针对至少一个隐藏层,对该隐藏层的至少部分输入特征进行置零处理;在每对一个隐藏层进行置零处理时,确定目标神经网络在进行该置零处理前后的模型性能的变化量;基于与每次进行的置零处理对应的模型性能的变化量,确定进入各隐藏层的输入特征的置零位置,以实现待测体表生理数据在目标神经网络中的信息流动控制;其中,样本体表生理数据和待测体表生理数据的数据类型相同,且样本体表生理数据和待测体表生理数据均为时间序列数据。上述技术方案能够增强神经网络的可解释性。

技术研发人员:杨志宏,由育阳
受保护的技术使用者:中国医学科学院药用植物研究所
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1