基于GA参数优化SVM集成学习的甲状腺结节良恶诊断系统

文档序号:34925213发布日期:2023-07-28 04:29阅读:74来源:国知局
基于GA参数优化SVM集成学习的甲状腺结节良恶诊断系统

本发明涉及医疗数据处理,具体涉及一种基于ga参数优化svm集成学习的甲状腺结节良恶诊断系统。


背景技术:

1、近年来,已有许多学者开展将机器学习与甲状腺结节良恶诊断相结合的研究,其中集成学习是研究的重中之重。这是因为医疗数据大都存在恶性样本少,良性样本多的数据不平衡特点,采用单一分类器无法对数据进行准确而合理的学习和预测。集成学习是将多个弱分类器进行组合,分类器之间互相学习,集成学习系统往往比单个分类器有更高的预测精度和泛化能力。因此,研究如何根据历史数据精准地有效鉴别出该甲状腺结节的良恶性是一项很有意义的工作,具有非常大的应用前景和经济效益。

2、针对上述问题,学者提出了基于支持向量机(svm)的bagging集成模型应用于医疗数据的预测,通过将单个svm分类器与bagging算法相结合,根据由数据子集训练的每个基础分类器,它以某种方式将这些基础分类器组合起来,以创建一个新的集成分类器。该算法在数据中使用自采样方法提取训练集,构造一个能够反映新信息变化的集成分类器,使新样本集显著不同。然后使用多个svm分类器学习每个子样本集,并使用多数投票方法对学习结果进行集成学习。该分类算法可以有效避免过度拟合,通过实验分析所提出模型的acc(accuracy,准确率)和auc(area under curve,roc曲线下的面积)都有所提升。

3、然而,svm分类结果的优劣与相关参数的取值直接相关,如果参数取值不合理,难以建立最优的分类模型。此外,集成学习的输出结果与集成方式有关,每个基础分类器的“重要性”不同,仅采用简单的多数投票对预测结果进行组合,具有局限性且泛化能力较弱。这最终都会影响甲状腺结节良恶诊断结果的准确性。


技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足,本发明提供了一种基于ga参数优化svm集成学习的甲状腺结节良恶诊断系统,解决了基于现有集成学习获取甲状腺结节良恶诊断结果的准确性有待提高的技术问题。

3、(二)技术方案

4、为实现以上目的,本发明通过以下技术方案予以实现:

5、一种基于ga参数优化svm集成学习的甲状腺结节良恶诊断系统,包括:

6、采集模块,用于采集并预处理甲状腺结节良恶诊断的历史数据,将所述历史数据划分为训练集和测试集;

7、第一训练模块,用于基于所述训练集生成基于ga参数优化的svm分类器,并根据参数优化后的svm,采用bootstrap有放回地随机自助采样方法产生n个基分类器;

8、第二训练模块,用于采用ga求解各个所述基分类器的最优权重,加权集成获取集成系统;

9、评估模块,用于基于所述测试集对最终的分类器进行精度评估,得到训练好的集成系统;

10、诊断模块,用于将甲状腺结节良恶诊断的当前数据输入所述训练好的集成系统中,获取良恶诊断结果。

11、优选的,所述第一训练模块生成若干基于ga参数优化的svm分类器,具体包括:

12、s21、初始化算法参数;

13、s22、编码,随机产生一组svm参数,产生初始种群;

14、s23、计算适应度函数,将svm的auc作为其适应度评价函数;

15、s24、选择,选出若干个适应度值大的个体进行下一步遗传操作;

16、s25、遗传,采用交叉、变异遗传操作对当前种群进行更新,产生下一代种群;

17、s26、重复操作s23,直至达到最大迭代次数,得到svm最优参数,停止寻找。

18、优选的,所述svm参数至少包括svm的惩罚因子c、不敏感系数gamma和rbf的核宽度epsilon。

19、优选的,所述第二训练模块采用ga求解各个所述基分类器的最优权重,具体包括:

20、s31、初始化算法参数;

21、s32、编码,随机产生一组分类器参数,产生初始种群;

22、s33、计算适应度函数,将基分类器的auc与对数损失的差值作为其适应度评价函数;

23、s34、选择,选出若干个适应度值大的个体进行下一步遗传操作;

24、s35、遗传,采用交叉、变异遗传操作对当前种群进行更新,产生下一代种群;

25、s36、重复操作s33,直至达到最大迭代次数,得到各个基分类器最优权重参数,停止寻找。

26、优选的,任一所述历史数据包括对甲状腺结节的病症描述和病理分级诊断结果,所述预处理包括:

27、从所述病症描述中提取边界清晰度、边缘规则度、内部回声、钙化、血液丰富度5种甲状腺超声特征和病理分级,将各甲状腺超声特征转化为相应的tirads等级;根据tirads分级与甲状腺结节恶性风险程度之间的对应关系,将标签集{1,2,3,4,5}作为甲状腺结节恶性得分集,其中标签值越大,恶性风险越高。

28、优选的,所述采集模块采用交叉验证法获取训练集和测试集。

29、(三)有益效果

30、本发明提供了一种基于ga参数优化svm集成学习的甲状腺结节良恶诊断系统。与现有技术相比,具备以下有益效果:

31、本发明中,针对基分类器精度不高、性能不足的缺点,设计了第一训练模块,用于采用遗传算法优化svm参数,找到最优参数以提升参与集成的基分类器的性能,确保单个基分类器的准确率;针对集成方法简单、可解释性差的不足,设计了第二训练模块,用于采用遗传算法优化基分类器权重以实现对基分类器的加权集成。根据基分类器性能以确定最优权重,发挥不同基分类器的预测优势,由此提升模型的分类精度和系统的泛化性能,提升了甲状腺结节良恶诊断结果的准确性。



技术特征:

1.一种基于ga参数优化svm集成学习的甲状腺结节良恶诊断系统,其特征在于,包括:

2.如权利要求1所述的甲状腺结节良恶诊断系统,其特征在于,所述第一训练模块生成若干基于ga参数优化的svm分类器,具体包括:

3.如权利要求2所述的甲状腺结节良恶诊断系统,其特征在于,所述svm参数至少包括svm的惩罚因子c、不敏感系数gamma和rbf的核宽度epsilon。

4.如权利要求1~3任一项所述的甲状腺结节良恶诊断系统,其特征在于,所述第二训练模块采用ga求解各个所述基分类器的最优权重,具体包括:

5.如权利要求4所述的甲状腺结节良恶诊断系统,其特征在于,任一所述历史数据包括对甲状腺结节的病症描述,所述预处理包括:

6.如权利要求4所述的甲状腺结节良恶诊断系统,其特征在于,所述采集模块采用交叉验证法获取训练集和测试集。


技术总结
本发明提供一种基于GA参数优化SVM集成学习的甲状腺结节良恶诊断系统,涉及医疗数据处理技术领域。本发明中,针对基分类器精度不高、性能不足的缺点,设计了第一训练模块,用于采用遗传算法优化SVM参数,找到最优参数以提升参与集成的基分类器的性能,确保单个基分类器的准确率;针对集成方法简单、可解释性差的不足,设计了第二训练模块,用于采用遗传算法优化基分类器权重以实现对基分类器的加权集成。根据基分类器性能以确定最优权重,发挥不同基分类器的预测优势,由此提升模型的分类精度和系统的泛化性能,提升了甲状腺结节良恶诊断结果的准确性。

技术研发人员:付超,李鑫鑫,王冬越
受保护的技术使用者:合肥工业大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1