一种融合Bagging的随机树慢性肾病分期预测算法的制作方法

文档序号:13250464阅读:164来源:国知局
技术领域本发明涉及慢病分类预测算法,尤其涉及一种融合Bagging的随机树慢性肾病分期预测算法。

背景技术:
随着慢性疾病多发、社会老龄化、老年人空巢化、慢性病年轻化等问题的加重,慢性疾病的预测和辅助诊疗工作正面临前所未有的挑战,其也成为关乎民生的重大问题。数据挖掘是在没有明确假设的前提下,通过从大量含有噪声的数据源中,提取出未知的、有价值的,表现为规则、模式等多种形式的知识,并使用所发现的知识帮助解释当前的行为或预测未来的结果的知识发现和应用过程。bagging是一种用来提高学习算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将它们组合成一个预测函数。该算法训练多轮,每轮的训练集由从初始的训练集中随机取出的n个训练样本组成,某个初始训练样本在某轮训练集中可以出现多次或根本不出现,训练之后可得到一个预测函数序列,最终的预测函数对分类问题采用投票方式,对回归问题采用简单平均方法对新示例进行判别。

技术实现要素:
本发明公开了一种融合Bagging的随机树慢性肾病分期预测算法,简称RTB算法。该算法首先在适于慢病分类决策的随机树算法基础上,将随机树算法看作一个反向传播的基分类器,融合Bagging思想,通过多次随机抽样,形成多个同样大小的袋内数据集,对生成的多个袋内数据集分别构建基分类器,用基分类器分别对每个袋外数据集进行分类,最后多数投票得到分类预测结果。其次,考虑到样本和基分类器的权重是固定的,在每次迭代时不能动态调整权重,提出一种双向自适应权重分配策略,前向更新样本的权重,对于错分的样本设置更大的权重,后向更新基分类器的权重,基分类器的投票权重随着分类错误率增大而减小。附图说明图1是本发明一种融合Bagging的随机树慢性肾病分期预测算法的原理图图2是本发明Bagging算法实现过程图。具体实施方式下面结合图对本发明做进一步的说明。如图1所示,本发明公开了一种融合Bagging的随机树慢性肾病分期预测算法,简称RTB算法。该算法首先在适于慢病分类决策的随机树算法基础上,将随机树算法看作一个反向传播的基分类器,融合Bagging思想,通过多次随机抽样,形成多个同样大小的袋内数据集,对生成的多个袋内数据集分别构建基分类器,用基分类器分别对每个袋外数据集进行分类,最后多数投票得到分类预测结果。其次,考虑到样本和基分类器的权重是固定的,在每次迭代时不能动态调整权重,提出一种双向自适应权重分配策略,前向更新样本的权重,对于错分的样本设置更大的权重,后向更新基分类器的权重,基分类器的投票权重随着分类错误率增大而减小。图2是本发明Bagging算法实现过程图,是用一种弱分类算法和一个原始训练集,让该学习算法训练多轮以训练多个分类器,每轮训练时,都要通过引导程序从原始的训练集中进行随机有放回抽样,重新构成一个新的训练集用来训练一个基分类器。训练完成之后可以得到一个预测函数的序列,最终对各个预测函数采用简单投票法对待测样本进行分类。由于每次随机抽样获得的训练样本子集不同,从而训练得到不同的基分类器,继而保证了基分类器的多样性。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1