一种卷积神经网络隐层解释方法

文档序号:30526538发布日期:2022-06-25 07:35阅读:93来源:国知局
一种卷积神经网络隐层解释方法

1.本公开涉及数据处理领域,具体涉及一种卷积神经网络隐层解释方法。


背景技术:

2.目前主要有隐层表征解释法、可解释卷积神经网络(convolutional neural networks,简称cnn)构建法和模型模仿解释法来对神经网络进行可解释研究。在采用模型模仿解释法的研究中,大多数利用可解释性模型替代神经网络某些部分或者从神经网络中学习一个可替代的新模型,从神经网络中获取一些分类的规则。但是这些规则往往由模型模拟cnn的输入输出得到,并没有体现神经网络内部的变化,且与人类认知方式存在差异,体现得不够直观。


技术实现要素:

3.有鉴于此,本技术的主要目的在于提供一种卷积神经网络隐层解释方法,所述方法包括下述步骤:
4.s100、获取卷积神经网络模型的隐层激活值集合;
5.s200、对激活值集合进行一次聚类,获得m个不同的集群;
6.s300、对每一个集群进行二次聚类,每个集群获得若干因子,为每个因子分配一个id,将这个id作为标签;
7.s400、构建m个特征转化分类器,对每个特征转化分类器,用原样本特征作为输入,标签作为输出,训练所述特征转化分类器;
8.s500、将原样本输入训练好的m个特征转化分类器,获得m维特征;
9.s600、将m维特征作为输入,原样本标签作为输出,使用c4.5决策树搭建分类模型;
10.m为大于0的整数。
11.优选地,在所述方法中,所述激活值集合通过下述步骤获取:
12.s101、获取训练好的卷积神经网络模型,将其作为原模型;
13.s102、构造一个以原模型输入为输入,以选定隐层为输出的网络,构建截取模型;
14.s103、基于截取模型,将样本数据输入,获得激活值集合。
15.优选地,在所述方法中,所述s102采用keras提供的model函数构建截取模型。
16.优选地,在所述方法中,所述一次聚类和所述二次聚类采用基于密度的有噪应用中的空间聚类算法。
17.优选地,在所述方法中,所述s400采用随机森林模型获取分类器。
18.优选地,在所述方法中,所述随机森林模型通过下述步骤进行特征转化解释:
19.s401、对随机森林模型中的t棵树进行遍历,获取每棵树的所有分类路径;
20.s402、将样本数据输入后,将每个分类路径中对应的各个节点分类的变量判别标准组成一条变量规则;
21.s403、从t个分类路径中抽取t条变量规则,将相同变量的规则进行合并,并按照顺
序排布,得到整理完的分类规则集合,进而获得最大兼容规则;
22.s404、基于最大兼容规则,进行样本重建。
23.优选地,在所述方法中,所述最大兼容规则通过下述步骤获得:
24.s4031、建立空白列表;
25.s4032、对每一条变量规则,判断其是否已存在于列表中;若不存在,执行s4033;否则,执行s4034;
26.s4033、将涉及的变量取并集后添加进列表;
27.s4034、将涉及的变量取交集覆盖所有规则后添加进列表。
28.优选地,在所述方法中,所述样本重建包括下述步骤:
29.s4041、构造一个尺寸与原样本相同的零矩阵;
30.s4042、将规则内涉及的变量取对应的特殊值,构造出一个满足最大兼容规则的特殊实例;
31.所述特殊值包括取范围中值、最值或者使用随机取值。
32.与现有技术相比:
33.本发明将神经网络分类过程与人类认知过程进行对应,提升解释信息的可读性。通过对特征转化和特征分类方法进行优化,提升模型分类准确率。进一步地,对特征转化过程的随机森林分类器进行规则抽取和样本重建,提升模型可解释效果。
附图说明
34.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
35.图1、本发明方法流程示意图;
36.图2、人类决策模式示意图;
37.图3、截取模型示意图;
38.图4、dtohl模型建立过程示意图;
39.图5、随机森林分类路径示意图;
40.图6、肺炎x光图像样本重建效果示意图;
41.图7、为图6肺炎x光图像示意图;
42.图8、正常x光图像样本重建效果示意图;
43.图9、为图8正常x光图像示意图。
具体实施方式
44.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。
45.在一个实施例中,对于卷积神经网络模型分类进行隐层解释。
46.首先对研究所涉及的图像集进行清洗、筛选,筛除样本特征不清晰或者不可读的图像。根据情况使用补全、裁剪或拉伸等手段,将图像集进行尺寸标准化,即将图像放缩至
相同尺寸。将标准化的图像转化为矩阵之后,得到模型建立所需的原始训练集、验证集和测试集d0。
47.其次,借助成熟的深度学习框架keras,通过序贯模型sequential序列化的方法,使用add()函数添加网络元素搭建一个卷积神经网络模型。使用数据集d0进行模型训练,借助grid-search进行参数调优直至模型准确率达到最高值,得到要研究的卷积神经网络模型。
48.接下来,采用下述方法步骤建立分类模型,将该模型记作dtohl(decision tree of hidden layer),用于对上面得到的卷积神经网络(convolutional neural networks,cnn)内特定隐层如何对样本进行分类进行研究。所述方法包括下述步骤:
49.s100、获取卷积神经网络模型的隐层激活值集合;
50.s200、对激活值集合进行一次聚类,获得m个不同的集群;m为大于0的整数;
51.s300、对每一个集群进行二次聚类,每个集群获得若干因子,为每个因子分配一个id,将这个id作为标签;
52.s400、构建m个特征转化分类器,对每个特征转化分类器,用原样本特征作为输入,标签作为输出,训练所述特征转化分类器;
53.s500、将原样本输入训练好的m个特征转化分类器,获得m维特征;
54.s600、将m维特征作为输入,原样本标签作为输出,使用c4.5决策树搭建分类模型。
55.上述方法对数据进行特征空间的转化,将原样本特征转化为简化的有效信息组合。这一过程与人类决策过程相同,人类决策时会将外部信息转化至自我认知框架中再进行判断,如图2所示。对模型而言,同样是样本的有效信息在帮助进行分类。
56.在所述方法中,为方便获取激活值集合,将训练好的卷积神经网络模型作为原模型,构造一个以原模型输入为输入,以选定隐层为输出的网络模型,将这个模型作为截取模型。具体的,取卷积神经网络中的某个全连接层为例,使用keras提供的model函数构造一个以原模型输入为输入,以选定隐层为输出的网络,等同于截取原模型中隐层前所有结构,如图3所示。将所有样本通过截取的模型,可以得到激活值集合。
57.优选地,在所述方法中,所述一次聚类和所述二次聚类采用基于密度的有噪应用中的空间聚类算法(density-based spatial clustering of applications with noise,简称dbscan)。具体地,使用dbscan算法对激活值集合进行聚类并定义为不同的集群f,数量记作m,在各个集群内部使用dbscan算法进行二次聚类生成若干因子,并为每一个因子分配一个id。
58.优选地,所述s400采用随机森林模型获取分类器。具体地,以d0中的原样本特征作为输入,以聚类结果id作为标签,在m个集群内使用随机森林模型训练m个特征转化分类器。将所有样本通过训练好的特征转化分类器后,得到m维特征。
59.以所述m维特征作为输入,原样本标签作为输出,使用c4.5决策树搭建分类模型得到dtohl(decision tree of hidden layer)模型,即可拟合人类将样本数据转化为有效信息之后再进行决策的过程。
60.若采用随机森林分类器,需要进一步对随机森林模型进行特征转化解释,包括下述步骤:
61.s401、对随机森林模型中的t棵树进行遍历,获取每棵树的所有分类路径;
62.s402、将样本数据输入后,将每个分类路径中对应的各个节点分类的变量判别标准组成一条变量规则;
63.s403、从t个分类路径中抽取t条变量规则,将相同变量的规则进行合并,并按照顺序排布,得到整理完的分类规则集合,进而获得最大兼容规则;
64.s404、基于最大兼容规则,进行样本重建。
65.在一个实施例采用上述方法对应用随机森林模型获取分类器进行可解释性研究。对给定t棵树的随机森林模型,对随机森林模型中各棵树的分支进行深度优先遍历,按照先遍历左子树,后遍历右子树的顺序,自根节点遍历至叶子节点,获取一个树所有的分类路径。
66.接下来,将样本数据输入随机森林模型后,对照分类路径一一比较相应的样本特征,得到经过每棵树的决策路径,这一路径中对应了各个节点分类的变量判别标准,即对应一整条符号规则,则对于一个样本可以得到t个分类路径,如图4所示。
67.然后从t个分类路径中抽取t条变量规则,比如得到如下规则:
[0068][0069][0070][0071]
直接从模型中获得变量规则较为混乱,可能存在多个节点包含对一个变量的规则或者分支中不包含对某些变量的分类规则,因此首先对规则进行初步整理,将涉及相同变量的规则进行合并,将变量按照顺序进行排布,得到整理完的分类规则集合如下所示:
[0072][0073]
rule2:(x1≥0.5)∧(x2<2.5)∧(x3≥4)
[0074]
rule
t
:(x1<2)∧(x2<2.8)∧(x4≥3)
[0075]
同一样本相同变量在t棵树能够符合不同的分类规则,证明虽然规则范围存在差异,但是各棵树的分类路径存在交集能够满足样本,因此基于t组规则集设定空白列表l,遍历t组规则,对于尚未出现在l内的变量取并集进行添加,对已存在于l内的变量取交集覆盖所有规则,即可得到样本在随机森林模型内的最大兼容规则(maximum compatibility rules,mcr),如下所示:
[0076]
rule:(0.5≤x1<2)∧(2≤x2<2.5)∧(x3≥4)∧(x4≥3)
[0077]
基于最大兼容规则解释随机森林模型分类器的分类模型dtohl模型如图5所示。经实验证明,采用dtohl模型使用新特征进行分类之后的准确率,高于其直接使用c4.5决策树模型直接使用原样本特征进行分类的准确率,这表明特征转化过程增强了信息的有效性,因此本方法模仿人类决策过程所构造的分类过程是有意义的,而新特征与原特征之间的确切联系还需要进一步研究。
[0078]
当样本各变量的取值满足最大兼容规则的各个取值范围时,在各棵树的决策路径即与抽取出的t条初始路径相符,且只要任何一个变量的覆盖范围扩大就会导致该样本在某一棵树的分类路径发生变化,影响最终的结果。
[0079]
基于最大兼容规则,对各个变量取规则范围内的特殊值,如取范围中值、最值或者
使用随机取值。构造一个尺寸与原样本相同的零矩阵,将规则内涉及的变量取对应的特殊值,构造出一个满足最大兼容规则的特殊实例。使用matplotlib中函数将矩阵还原成图像即可完成样本重建,即可得到图像分类过程中涉及分类的变量的可视化效果。在一个对肺炎x光图像识别的实施例,对正常样本和肺炎样本进行分类时,通过规则抽取和样本重建可以获得出对于x光图像分类有影响的样本变量,如图6-9所示。图6为肺炎x光图像样本重建效果示意图;图7为图6肺炎x光图像示意图;图8为正常x光图像样本重建效果示意图;图9为图8正常x光图像示意图。从还原的图像可以看出,基于最大兼容规则的样本重建后,得到的变量为对图像分类的有效变量集合。
[0080]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本公开方法可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用cpu、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本公开而言更多情况下,软件程序实现是更佳的实施方式。
[0081]
尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1