技术特征:
技术总结
本发明涉及一种基于半监督学习的疾病预测模型建立方法及装置,包括以下步骤:将有标签数据进行分类,得到有标签数据的基础分类模型;选取部分无标签数据;将选取的部分无标签数据通过聚类方法进行分类,并且利用所述基础分类模型对选取的部分无标签数据进行标记,根据所述无标签数据的聚类结果和预测结果得到无标签数据的标记结果,再与有标签数据合并起来进行分类,得到更新的基础分类模型,从剩下的无标签数据中继续选取部分无标签数据重新建模,如此迭代直至所有无标签数据处理完毕,得到最终分类模型。本发明对无标签数据进行建模,具体结合了有标签的分类方法和无标签的聚类方法,并通过迭代方式提升预测精度,更好地提升模型预测精度。
技术研发人员:王宏志;宋扬
受保护的技术使用者:哈尔滨工业大学
技术研发日:2017.11.16
技术公布日:2018.04.20