用于肠道菌群检测的集成模型的构建方法及其检测装置与流程

文档序号:34650341发布日期:2023-06-29 19:26阅读:43来源:国知局
用于肠道菌群检测的集成模型的构建方法及其检测装置与流程

本申请涉及针对肠道菌群数据的机器学习模型的构建和使用。更具体地,本申请涉及用于肠道菌群检测的集成模型的构建方法及其检测装置。


背景技术:

1、人体肠道菌群构成复杂,对于维护人体健康和体内微生态平衡有重要作用。肠道菌群是重要的生物数据,在疾病风险预测、健康状况判断、药物使用效果分析等实际临床问题中具有重要意义。通过对人体肠道菌群进行检测,有助于对肠道菌群及人体健康程度进行评估,针对性的改善肠道菌群构成,从而恢复肠道菌群动态平衡和身体健康,以便改善有腹泻、便秘、胀气、湿疹、免疫力差等症状人群的健康状况。

2、然而,目前大多数研究仍停留在针对肠道菌群的群落多样性分析,但将肠道菌群检测用于特定疾病诊疗的临床应用比较少,也缺乏针对肠道菌群这一重要生物数据的有效模型构建方法。因此,如何构建和使用针对肠道菌群数据的机器学习模型是实际临床应用中极具挑战性的问题。


技术实现思路

1、根据本申请的一个方面,提供了一种用于肠道菌群检测的集成模型的构建方法,包括:获得原始肠道菌群数据,所述原始肠道菌群数据包括健康肠道菌群数据样本和异常肠道菌群数据样本;将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集;分别基于所述多个肠道菌群数据样本集中的每个肠道菌群数据样本集对多个单次模型进行训练以确定每个单次模型的模型参数;以及将所述多个单次模型融合为所述用于肠道菌群检测的集成模型。

2、在一些实施例中,将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集包括:从所述健康肠道菌群数据样本中随机选择所述多个不同子集与所述异常肠道菌群数据样本分别组合为所述多个肠道菌群数据样本集。

3、在一些实施例中,在将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集之前,所述方法还包括:确定所述健康肠道菌群数据样本和所述异常肠道菌群数据样本中的多个候选肠道菌种是否达到检测门限;以及从所述健康肠道菌群数据样本和所述异常肠道菌群数据样本中删除未达到所述多个候选肠道菌种的检测门限的数据样本。

4、在一些实施例中,在将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集之前,所述方法还包括:计算所述健康肠道菌群数据样本和所述异常肠道菌群数据样本中的多个候选肠道菌种的每个候选肠道菌种的特征重要度;根据所述多个候选肠道菌种的每个候选肠道菌种的特征重要度,从所述多个候选肠道菌种中选择多个关键肠道菌种;以及保留所述健康肠道菌群数据样本和所述异常肠道菌群数据样本中对应于所述多个关键肠道菌种的含量信息。

5、在一些实施例中,所述多个候选肠道菌种的每个候选肠道菌种的特征重要度根据以下中的一项或多项来计算:决策树算法、皮尔逊相关系数算法、互信息和最大信息系数算法和递归特征消除算法。

6、在一些实施例中,分别基于所述多个肠道菌群数据样本集中的每个肠道菌群数据样本集对多个单次模型进行训练以确定每个单次模型的模型参数包括:对于每个肠道菌群数据样本集:利用多个机器学习算法分别对所述肠道菌群数据样本集进行学习以得到多个机器学习模型;以及将所述多个机器学习模型中的最优机器学习模型的模型参数作为基于所述肠道菌群数据样本集进行训练而确定的单次模型的模型参数。

7、在一些实施例中,所述多个肠道菌群数据样本集中的每个肠道菌群数据样本集包括训练集和测试集。利用多个机器学习算法分别对所述肠道菌群数据样本集进行学习以得到多个机器学习模型包括:利用所述多个机器学习算法分别对所述肠道菌群数据样本集的训练集进行学习以得到所述多个机器学习模型。将所述多个机器学习模型中的最优机器学习模型的模型参数作为基于所述肠道菌群数据样本集进行训练而确定的单次模型的模型参数包括:利用所述肠道菌群数据样本集的测试集分别测试所述多个机器学习模型的预测性能,并且确定具有最优预测性能的所述最优机器学习模型的模型参数。

8、在一些实施例中,所述多个机器学习算法包括以下中的两项或更多项:随机森林算法、支持向量机算法、决策树算法、逻辑回归算法、朴素贝叶斯算法、k最邻近算法、k均值算法、线性判别分析算法和线性回归算法。

9、在一些实施例中,将所述多个单次模型融合为所述用于肠道菌群检测的集成模型包括:根据所述多个单次模型针对肠道菌群数据样本的对应多个预测结果,采用多数投票法确定所述集成模型的预测结果。

10、根据本申请的另一方面,提供了一种用于利用集成模型进行肠道菌群检测的装置,包括:输入设备,用于接收待检测的肠道菌群数据样本;存储器,用于存储用于肠道菌群检测的集成模型的模型参数,其中,所述集成模型通过以下方式构建:获得原始肠道菌群数据,所述原始肠道菌群数据包括健康肠道菌群数据样本和异常肠道菌群数据样本;将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集;分别基于所述多个肠道菌群数据样本集中的每个肠道菌群数据样本集对多个单次模型进行训练,以确定每个单次模型的模型参数;以及将所述多个单次模型融合为所述集成模型;处理器,用于运行所述集成模型进行肠道菌群检测以检测所述待检测的肠道菌群数据样本是否存在异常;以及输出设备,用于提供所述待检测的肠道菌群数据样本的检测结果。



技术特征:

1.一种用于肠道菌群检测的集成模型的构建方法,包括:

2.根据权利要求1所述的构建方法,其中,将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集包括:

3. 根据权利要求1所述的构建方法,其中,在将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集之前,所述方法还包括:

4.根据权利要求1所述的构建方法,其中,在将所述健康肠道菌群数据样本的多个不同子集与所述异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集之前,所述方法还包括:

5.根据权利要求4所述的构建方法,其中,所述多个候选肠道菌种的每个候选肠道菌种的特征重要度根据以下中的一项或多项来计算:决策树算法、皮尔逊相关系数算法、互信息和最大信息系数算法和递归特征消除算法。

6.根据权利要求1所述的构建方法,其中,分别基于所述多个肠道菌群数据样本集中的每个肠道菌群数据样本集对多个单次模型进行训练以确定每个单次模型的模型参数包括:

7. 根据权利要求6所述的构建方法,其中,所述多个肠道菌群数据样本集中的每个肠道菌群数据样本集包括训练集和测试集,并且

8.根据权利要求6所述的构建方法,其中,所述多个机器学习算法包括以下中的两项或更多项:

9.根据权利要求1所述的构建方法,其中,将所述多个单次模型融合为所述用于肠道菌群检测的集成模型包括:

10.一种利用集成模型进行肠道菌群检测的装置,包括:


技术总结
本申请提供用于肠道菌群检测的集成模型的构建方法及其检测装置。该构建方法包括:获得原始肠道菌群数据,其包括健康肠道菌群数据样本和异常肠道菌群数据样本;将健康肠道菌群数据样本的多个不同子集与异常肠道菌群数据样本分别组合为多个肠道菌群数据样本集;分别基于每个肠道菌群数据样本集对多个单次模型进行训练以确定每个单次模型的模型参数;以及将多个单次模型融合为用于肠道菌群检测的集成模型。根据本申请提出的用于肠道菌群检测的集成模型的构建方法,能够明显提高机器学习建模分析的预测准确率和减小多次建模结果的方差,减小数据结果的随机波动,整体直观反应数据集的整体情况,提高建模预测的准确性和客观性及临床适用性。

技术研发人员:任毅,崔玉涛,李旭,方沁怡,穆煜,李响,任静,张志明
受保护的技术使用者:北京卡尤迪生物科技股份有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1