一种面向代谢性脂肪肝数据分类的分层模糊神经网络增量建模方法及装置

文档序号:37100138发布日期:2024-02-22 20:57阅读:22来源:国知局
一种面向代谢性脂肪肝数据分类的分层模糊神经网络增量建模方法及装置

本发明涉及数据处理,属于人工智能(人工神经网络)模式数据拟合、识别和分类领域,具体涉及一种面向代谢性脂肪肝数据分类的分层模糊神经网络(hierarchical fuzzy neural network,hfnn)增量建模方法。


背景技术:

1、基于人工智能方法的代谢性脂肪肝特征数据分析及分类能提供较为充分的病症特征相关性和参考性信息,对于代谢性脂肪肝诊断和后续治疗具有重要的辅助性应用意义和临床价值。代谢性脂肪肝特征数据具有分布复杂、关联信息多元、数据来源多样等特点,执行分类任务对于采用的人工智能模型具有一定的要求。本发明提出一种增量化分层模糊神经网络学习算法,实现对代谢性脂肪肝数据的特征分析和分类处理,达到辅助诊断代谢性脂肪肝病的目的。

2、增量学习是一种在已有知识基础上不断学习和适应新知识的技术,允许智能模型在不重新训练的情况下集成新数据。相较于传统批量学习,增量学习更灵活,能在变化环境中动态调整,避免遗忘先前知识,通过不断接收新数据来不断提升性能。因此,在机器学习和人工智能中获得了广泛的应用。

3、分层网络模型是处理复杂、高维、大规模数据的可行方法。通过分析数据特征的关联性和参考性信息,完成特征的初步划分,再通过串联式分层模型结构完成多阶段学习。串联式分层模型结构由多个分层模糊神经网络模型组成,通过层层递进的方式,逐步输入划分的特征数据,同时与前一层的数据和学习结果保持联系,共同完成多阶段参数学习任务。

4、随着代谢性脂肪肝病及相关研究的深入,除代谢性脂肪肝病主要生物因素指标外,诸如糖尿病、高血压、高尿酸血症等疾病,以及肥胖、饮酒、吸烟等生活习惯因素,也被纳入代谢性脂肪肝病的病因考察范畴,使得用于描述代谢性脂肪肝病的特征数据具有分布多样、关联信息丰富、数据来源广泛等特点,形成了复杂、高维、大规模的代谢性脂肪肝病数据集合。如何在多元化的代谢性脂肪肝病特征数据中开展数据分析并执行分类任务,并结合人工智能方法实现代谢性脂肪肝病的辅助诊断和患病风险评估是当前的热点研究内容和亟待解决的问题。


技术实现思路

1、本发明的目的是提供一种面向代谢性脂肪肝特征数据分类的分层模糊神经网络增量建模方法,在保证模糊神经网络模型泛化能力和建模性能的同时,通过分层结构建立的多阶段层级学习策略考虑了代谢性脂肪肝病特征数据的特点,并通过增量学习策略提升了模型的学习能力,实现对于代谢性脂肪肝病的辅助诊断和患病风险的评估。

2、本发明为实现上述目的所采用的技术方案为:

3、一种面向代谢性脂肪肝数据分类的分层模糊神经网络增量建模方法,包括以下步骤:

4、s1、采集数据并对所述数据进行归一化处理,形成代谢性脂肪肝数据样本集;

5、s2、基于代谢性脂肪肝数据样本集,利用重要性评价指标进行特征重要性分析,根据分析结果,对数据样本进行划分,形成多个特征数据子集;

6、s3、根据所述特征数据子集划分结果,自适应确立增量化分层模糊神经网络的级联式层次化模型结构数目,选取输入到各级模型中的特征数据子集;

7、s4、基于模糊神经网络建模策略和增量学习机制,构建层次化模型结构中的各级基模型,形成级联式层次化增量学习模型;

8、s5、基于所述级联式层次化增量学习模型进行参数学习,获得可迁移的增量化分层模糊神经网络模型,进而开展代谢性脂肪肝病的数据分类。

9、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s1具体包括:

10、采集关联于代谢性脂肪肝病的生化指标检测数据形成数据样本集,将数据样本集的输入序列表示为它包含描述代谢性脂肪肝病的特征信息,输出序列表示为它包含描述判断代谢性脂肪肝病的标签信息;n为样本数,d为特征数,k为标签数。

11、将数据样本集的每个数据映射到[0,1]形成归一化数据样本,归一化公式如下:

12、

13、式中,xij是数据样本集中第i行、第j列的原始数据点,min(xj)是数据样本集中第j列所属特征的最小值,max(xj)是数据样本集中第j列所属特征的最大值,i=1,2,...,n,j=1,2,...,d。上述公式确保每个特征的值都在[0,1]范围内,同时保持每组样本的特征分布。

14、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s2具体包括:

15、根据s1所述的代谢性脂肪肝数据样本集,结合如下概率模型,建立重要性评价指标:

16、

17、式中,p(xj)为数据样本中第j列特征数据的重要性评价指标,为数据样本集,xj是数据样本集中第j列的特征信息,为标签信息,j=1,2,...,d,||.||2代表欧氏距离。p值代表了数据样本中各个特征数据的重要性,它数值化了各个特征对于标签信息的相关程度,随着该数值的增加,相关性或影响因素的强度逐渐增大,即数值的升高与其重要性呈正相关关系。

18、根据上述重要性评价指标,计算数据样本中各列特征数据的重要性,依照重要性评价指标进行降序排列,以此完成数据特征重要性分析结果,将数据样本划分为划分比例为前30%所对应的特征列作为特征数据子集紧接着的30%所对应的特征列作为特征数据子集最后的40%所对应的特征列作为特征数据子集n为样本数,d为总特征数,d1、d2和d3代表个子样本集包含的特征数,且d1+d2+d3=d。根据建立的重要性评价指标,特征数据子集x1、x2和x3代表的特征重要性依次减弱。

19、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s3具体包括:

20、根据代谢性脂肪肝病数据集的划分结果,将原始数据样本集经过特征排序后划分为三个特征数据子集x1,x2和x3,设定具有三层级联结构的分层网络表示为如下形式:

21、y1=g1(x1),y2=g2(y1,x2),y3=g3(y2,x3),

22、也即:

23、y3=g3[g2(g1(x1),x2),x3]

24、式中,y1代表三层级联结构中第一层的输出,其输入为特征数据子集x1,g1(x1)代表第一层子结构;y2代表三层级联结构中第二层的输出,其输入为特征数据子集x2与第一层子结构的输出,g2(y1,x2)代表第二层子结构;y3代表三层级联结构中第三层的输出,同时也是最后一层结构的输出,其输入为特征数据子集x3与第二层子结构的输出,g3[g2(g1(x1),x2),x3]代表第三层子结构。

25、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s4具体包括:

26、基于以上所述分层网络结构,结合增量化学习策略和模糊神经网络,构建分层模糊神经网络增量建模策略。首先构造用于建立分层网络模型子结构的模糊神经网络,该模糊神经网络中第m条模糊规则表示如下:

27、rulem:if x1 is a1m…and xi is aim than tm isβm,m=1,2,...,k

28、其中,xi为第i维输入变量,aim是第m个规则对第i个输入变量的隶属函数,tm是第m个规则的输出,βm为第m个规则的后件参数,k为模糊规则的个数。构造的隶属函数aim如下所示:

29、

30、其中,cim和σim分别为隶属函数的中心与宽度。

31、模糊规则化的输出表示为:

32、

33、上式表明模糊规则层包含有k条模糊规则。

34、其次,建立具有三层串联式级联结构的级联式层次化增量学习模型。在三层级联结构中,基于重要性评价指标划分的特征数据子集分批进入各级模型。

35、在三层级联结构中,第一层子结构的学习过程可表示如下:

36、

37、式中,g1为sigmod激活函数,h1为模糊规则构造过程,包含k1条模糊规则,和是随机生成的输入权重,和是随机生成的输入偏置,l1是使用的神经元节点数目。特征映射节点部分的学习结果为增量学习的结果为它们共同组成了第一层子结构的输出y1是和第二维度拼接的结果,共包含2l1个神经元节点数。此外,和由符合[-λ1,λ1]上均匀分布的随机数生成,其中,λ1=[0.5,250]。为保证模型的收敛性能,w1和b1的配置过程受如下层级监督机制约束:

38、

39、其中,是中第l1列元素,l1=1,2,...,l1,以及选取对应的w1和b1作为本层子结构的输入偏置和权重,当l1=l1时,w1和b1的配置过程完成。

40、第二层子结构的学习过程表示为:

41、

42、

43、式中,g2为sigmod激活函数,h2为模糊规则构造过程,包含k2条模糊规则,和是随机生成的输入权重,和是随机生成的输入偏置,l2是使用的神经元节点数目。特征映射节点部分的学习结果为和增量学习的结果为共同确定了第二层的输出共包含3l2个神经元节点数。此外,和由符合[-λ2,λ2]上均匀分布的随机数生成,其中,λ2=[0.5,250]。基于如下层级监督机制,约束w2和b2的配置过程:

44、

45、其中,是中第l2列元素,l2=1,2,...,l2,以及选取对应的w2和b2作为本层子结构的输入偏置和权重,当l2=l2时,w2和b2的配置过程完成。

46、第三层子结构的学习过程可表示为:

47、

48、式中,g3为sigmod激活函数,h3为模糊规则构造过程,包含k3条规则,和是随机生成的输入权重,和是随机生成的输入偏置,l3是所使用的神经元节点数目。特征映射节点部分的学习结果为和增量学习的结果为共同确定了第三层的输出共包含3l3个神经元节点数。y3作为增量化分层模糊神经网络隐藏层的输出,重新表示为其维度为n×l,l=2l1+3(l2+l3)。此外,和由符合[-λ3,λ3]上均匀分布的随机数生成,其中,λ3=[0.5,250]。通过如下层级监督策略,对w3和b3的配置过程进行约束,保证模型的收敛性能:

49、

50、其中,是中第l3列元素,l3=1,2,...,l3,以及选取对应的w3和b3作为本层子结构的输入偏置和权重,当l3=l3时,w3和b3的配置过程完成。

51、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s5具体包括:

52、根据s4中所述增量化分层模糊神经网络的隐藏层构造方式和特征学习过程得到的隐藏层的输出求解增量化分层模糊神经网络的输出和输出权重,设计如下目标损失函数:

53、

54、式中,h为增量化分层模糊神经网络的隐藏层输出结果,β为输出权重,t为目标对象,γ1为lasso正则化调谐参数,γ2为ridge正则化调谐参数,||.||1代表曼哈顿距离,||.||2代表欧式距离,由两种不同的正则化方式共同组成了elastic-net正则化策略。

55、增量化分层模糊神经网络的输出权重β可表述如下:

56、β=(hth+γ2i)+(htt+γ1i)

57、特别的,

58、

59、式中,h+代表伪逆运算,i为单位矩阵。

60、根据上述内容,若使用代谢性脂肪肝并作为训练数据集,则在增量化分层模糊神经网络的输出中包含了对于代谢性脂肪肝预测结果,可表示如下:

61、

62、式中,h为增量化分层模糊神经网络的隐藏层输出矩阵,β为输出权重。

63、设计的增量化分层模糊神经网络主要用途是针对代谢性脂肪肝数据样本,通过执行分类任务实现代谢性脂肪肝检测,因此,将均方根误差(root mean square error,rmse),识别精度(accuracy,acc)和roc曲线下面积(area under the curve,auc)作为性能评估指标,它们分别表示如下:

64、

65、

66、

67、式中,auc是roc曲线(receiver operating characteristic curve)下的面积,其中roc曲线是一种以假正例率(false positive rate,fpr)为横轴,真正例率(truepositive rate,tpr)为纵轴的曲线,roc曲线上的每个点都代表一个不同的分类阈值下的真正例率和假正例率的值,通过对roc曲线下的面积进行积分可计算auc的值,该值是用于评估分类器性能的常用指标。

68、本发明还提供了一种代谢性脂肪肝病特征数据分析和建模方法的装置,包括:

69、采集单元,用于采集数据并对所述数据进行归一化处理后形成代谢性脂肪肝特征数据样本。

70、第一构造单元,用于基于所述代谢性脂肪肝病数据样本结合概率模型进行特征分析,依照数据特征间的相关性分析结构,划分数据样本,形成多个特征数据子集。

71、第二构造单元,用于根据所述特征数据子集划分结果确定增量化分层模糊神经网络的级联式层次化模型结构和各级输入样本;

72、第三构造单元,用于构建层次化模型子结构,形成增量化分层模糊神经网络的隐藏层;

73、计算单元,根据串联式分层级联模糊神经网络模型和增量学习策略进行参数学习,最终获得增量化分层模糊神经网络的输入层权重、输出权重以及输出序列,并以此获得预测输出序列,从而获得代谢性脂肪肝预测结果。

74、本发明的有益效果:本发明提出了一种增量化分层模糊神经网络新型建模方法,可以通过对代谢性脂肪肝病特征数据的重要性分析和特征学习,以实现对输入特征数据的拟合与分类任务。代谢性脂肪肝病的特征数据具有分布复杂、关联数据多样、数据渠道多元等特点,形成了复杂、高维、大规模的脂代谢性脂肪肝病样本集合。所提出的增量化分层模糊神经网络可通过重要性评价指标对每组特征进行重要性分析,得出各组特征与目标输出的关联程度和重要性程度,通过降序的方式对特征集进行排序,从而划分数据样本作为级联结构的输入数据。增量化分层模糊神经网络的子结构由模糊神经网络模型组成,该模型具有逼近能力强、模型精度高和泛化性能好的优点,结合分层模型结构处理高维复杂数据时的优势,以及增量学习策略,使得增量化分层模糊神经网络在继承了分层模型和模糊神经网络模型优势的同时,建模速度更快,计算代价更低,学习能力更强,适合面向代谢性脂肪肝病特征数据集的建模任务。在模型参数相同的情况下,本方法的建模速度与层级结构的数目呈正相关关系。同时,本方法由于包含了以重要性评价指标为基础的重要性分析过程,结合模糊神经网络模型的建模能力,因此可以用于不同类型的代谢性脂肪肝病特征数据和应用中,也可添加更加多元的生化指标和病灶特征,用于代谢性脂肪肝病特征集的扩充,以此提升代谢性脂肪肝病的患病检测和风险评估。进一步保证了使用增量化分层模糊神经网络在代谢性脂肪肝病数据集上进行数据分析和分类任务的可扩展性,简化了代谢性脂肪肝病数据的建模难度,为代谢性脂肪肝病的患病辅助诊断和患病风险评估提供了一种可行方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1