一种II型糖尿病微生物标志物及其应用的制作方法

文档序号:18461395发布日期:2019-08-17 02:03阅读:5311来源:国知局
一种II型糖尿病微生物标志物及其应用的制作方法

本发明属于微生物领域,涉及一种ii型糖尿病微生物标志物及其应用。



背景技术:

糖尿病是由遗传因素、免疫功能紊乱、微生物感染及其毒素、自由基毒素、精神因素等等各种致病因子作用于机体导致胰岛功能减退、胰岛素抵抗等而引发的糖、蛋白质、脂肪、水和电解质等一系列代谢紊乱综合征,临床上以高血糖为主要特点。其中ii型糖尿病占糖尿病患者人数的90%以上。ii型糖尿病患者除有明显的家族史外,肥胖和饮食是诱发糖尿病的主要环境因素,胃肠道菌群也同时兼具基因及环境双重因素,大多时候,两者息息相关。例如某些肠道菌产物的吲哚丙酸可预防ii型糖尿病,而某些肠道菌产物的三甲胺氧化物可引发肥胖和胰岛素抵抗从而引发糖尿病,此外有报道指出二甲双胍对ii型糖尿病的起效的关键在于调控了肠道内的微生物。还有研究发现特定的肠道细菌不平衡能够导致胰岛素耐受性,从而导致ii型糖尿病等健康问题的风险增加。ii型糖尿病如不能良好控制,任其发展不但后续治疗将更加困难,还将会带来例如糖尿病酮症酸中毒,高血糖高渗透压综合症等急性并发症和例如脑心血管病,肾病等慢性并发症,因此需要提倡早诊断,早预防。目前ii型糖尿病的诊断方法主要有以下方法:随机(或偶然)血浆葡萄糖检测、空腹血浆葡萄糖检测、口服葡萄糖耐量试验、a1c(糖化血红蛋白)。

糖尿病治疗方法根据病情由轻到重一般分为下述几种(如血糖控制不达标(hba1c≥7.0%)则进入下一步治疗):1)单药治疗,例如二甲双胍或α-糖苷酶抑制剂/胰岛素促泌剂选择其一;2)二联治疗,例如二甲双胍+口服类的胰岛素促泌剂/a-糖苷酶抑制剂/二肽基肽酶iv抑制剂/噻唑烷二酮类/钠-葡萄糖协同转运蛋白2抑制剂,或者二甲双胍+注谢类胰岛素(1~2次/d)/胰高血糖素样肽1受体激动剂;3)三联治疗,二甲双胍+上述不同作用机制的两种药物;4)胰岛素多次注射,二甲双胍+基础胰岛素+餐时胰岛素,或每日多次预混胰岛素。现有技术中的诊断方法虽然简单快速精确,但是需要有创采血,且只检测到了2型糖尿病的最终结果,无法展示更多与ii型糖尿病相关的信息。有些治疗方法只是参看血糖含量高低,治疗多于预防,只能随着血糖含量的增高步步增加药物的品种和数量,根治仍然需要个性化的调控饮食。而某些人在血糖发生异常之前,已需要提前干预调控饮食了。ii型糖尿病有好诊断却不好控制的特征,不同个体,可能血糖结果相同,但是其发展为糖尿病的风险是不同的,其治疗或预防的有效措施也是不同的,其饮食调整的方案也是不同的。

cn104540962a公开了一组糖尿病生物标志物,包括嗜黏蛋白阿克曼氏菌akkermansiamuciniphila、肠道拟杆菌bacteroidesintestinalis、拟杆菌属bacteroidessp.20_3、鲍氏梭菌clostridiumbolteae、哈氏梭菌clostridiumhathewayi、多枝梭菌clostridiumramosum、梭菌属clostridiumsp.hgf2、共生梭菌clostridiumsymbiosum、脱硫弧菌属desulfovibriosp.3_1_syn3、缓慢爱格士氏菌eggerthellalenta、大肠埃希氏菌escherichiacoli、梭菌目clostridialessp.ss3/4、直肠真杆菌eubacteriumrectale、普氏栖粪杆菌faecalibacteriumprausnitzii、副流感嗜血杆菌haemophilusparainfluenzae、肠道罗斯拜瑞氏菌roseburiaintestinalis以及食葡糖罗斯拜瑞氏菌roseburiainulinivorans。

cn108949965a公开了snp标志物在ii型糖尿病诊断中的应用。发现了肠道微生物b.coprocola菌株edv01869.1基因snp位点基因型与ii型糖尿病有关,通过检测粪便基因组中edv01869.1基因424位的snp的基因型,可以判断患者是否患有ii型糖尿病,提示可将上述snp位点应用于ii型糖尿病的早期临床诊断。

因此,提供一种特异性好、灵敏度高、能指示肠道细菌含量平衡状态、指导肠道菌群调节的ii型糖尿病微生物标志物具有重要意义。



技术实现要素:

针对现有技术的不足及实际的需求,本发明提供一种ii型糖尿病微生物标志物及其应用,本发明的ii型糖尿病微生物标志物可用于指示肠道微生物环境与ii型糖尿病的关联,作为协助诊断,对ii型糖尿病患病风险进行预警,指导肠道微生物环境的调整。

为达此目的,本发明采用以下技术方案:

第一方面,本发明提供一种ii型糖尿病微生物标志物,所述微生物标志物包括爱格士氏菌属(eggerthella)、丹毒丝菌属(erysipelotrichaceae)、faecalitalea菌属、毛螺菌菌属(lachnospiraceae_ge)和lachnoclostridium菌属的组合。

本发明的ii型糖尿病微生物标志物均与ii型糖尿病的患病风险相关,可以通过确定对象肠道菌群中是否存在所述微生物有效判断该对象是否患有或容易患上ii型糖尿病,并且还可用于监控糖尿病患者的治疗效果。通过五种菌属的配合即可有助于协助诊断或预警ii型糖尿病的患病风险,可用于糖尿病早期筛查,预防性调整肠道菌群,其后期应用广泛。

优选地,所述微生物标志物还包括肠杆菌属(enterobacteriaceae)、巨球形菌属(megasphaer)、odoribacter菌属、普雷沃菌属(prevotella_9)、tyzzerella_3菌属、放线杆菌属(actinobacillus)、拟普雷沃菌属(alloprevotella)、别样杆菌属(alistipes)、消化链球菌属(peptostreptococcaceae)、bacteroidales_s24-7_group_ge菌属、伯克霍尔德氏菌属(burkholderiales)、嗜胆菌属(bilophila)或副拟杆菌属(parabacteroides)中的任意一种或至少两种的组合,优选为至少两种的组合。

优选地,所述微生物标志物包括爱格士氏菌属(eggerthella)、丹毒丝菌属(erysipelotrichaceae)、faecalitalea菌属、毛螺菌菌属(lachnospiraceae_ge)和lachnoclostridium菌属(lachnoclostridium)、肠杆菌属(enterobacteriaceae)、巨球形菌属(megasphaer)、odoribacter菌属、普雷沃菌属(prevotella_9)、tyzzerella_3菌属、放线杆菌属(actinobacillus)、拟普雷沃菌属(alloprevotella)、别样杆菌属(alistipes)、消化链球菌属(peptostreptococcaceae)、bacteroidales_s24-7_group_ge菌属、伯克霍尔德氏菌属(burkholderiales)、嗜胆菌属(bilophila)和副拟杆菌属(parabacteroides)的组合。

本发明中,发明人发现,在包含爱格士氏菌属(eggerthella)、丹毒丝菌属(erysipelotrichaceae)、faecalitalea菌属、毛螺菌菌属(lachnospiraceae_ge)和lachnoclostridium菌属的情况下,细菌变量数为5种及5种以上时,微生物标志物的组合与ii型糖尿病的相关度不断升高,构建得到的模型灵敏度较高,当细菌菌属数量为18种时达到最高,进一步增加其他菌属的细菌并不会相应提高预测灵敏度反而增加前期检测的成本。通过细菌种类和数量的配合,所述18个属的特定细菌组合可以进一步提高标志物的特异性和检测灵敏度,可用于早期ii型糖尿病的筛查,或风险预警,指导肠道菌群调整,预防ii型糖尿病发生和发展。

第二方面,本发明提供一种检测如第一方面所述的ii型糖尿病微生物标志物的试剂。

本发明中,所述试剂可以是针对所述ii型糖尿病微生物标志物的引物探针组合或其他检测试剂,用以判断所述微生物标志物的丰度。

第三方面,本发明提供一种如第一方面所述的ii型糖尿病微生物标志物或第二方面所述试剂的用途,所述用途包括用于构建预测ii型糖尿病风险的模型、制备ii型糖尿病诊断或治疗的试剂,或制备ii型糖尿病诊断试剂盒中的任一种或至少两种的组合。

第四方面,本发明提供一种预测ii型糖尿病风险的模型,所述模型的输入变量为第一方面所述的ii型糖尿病微生物标志物的丰度。

优选地,所述ii型糖尿病微生物标志物丰度的测定方法包括宏基因组测序、16s测序或qpcr定量检测中的任意一种或至少两种的组合。

本发明将某一类细菌丰度作为预测指标,因此,不管是用宏基因组测序定量,还是16s测序定量,甚至是qpcr定量,皆可作为测量手段,多样化了定量手段,打破了特定实验设备和实验技能的限制,使某些不具备特定实验设备的实验室也可实验本发明的数据测量和预测,本发明所述丰度均为相对丰度。

第五方面,本发明提供一种如第四方面所述模型的构建方法,包括如下步骤:分别获取健康个体和ii型糖尿病患者粪便样本中的如第一方面所述微生物标志物的细菌丰度,将所有样本的细菌丰度和分类标签进行机器学习后存储模型。

优选地,步骤(2)所述机器学习模型包括logistic回归、支持向量机、随机森林或xgboost中的任意一种,优选为xgboost。

本发明中使用交叉验证选取模型,交叉验证是在机器学习建立模型和验证模型参数时常用的办法。重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某个样本再下次可能成为测试集中的样本,即所谓“交叉验证”。

优选地,所述模型的输出值判定结果如下:

(a)风险值<0.4判定为健康人,无需调整肠道菌群;

(b)0.4≤风险值≤0.5判定为健康人,需要调整肠道菌群;

(c)风险值>0.5判定为ii型糖尿病高风险人群,建议进行临床诊断。

本发明不仅提供了良好精度的ii型糖尿病预测模型,以协助早期诊断ii型糖尿病,而且可展示个体与ii型糖尿病相关的肠道细菌情况,临床医生可根据个体肠道菌的实际情况给出临床指导意见,例如某些风险值范围的人群,特定肠道菌丰度已接近或超过特定值,可建议通过粪群移植,服用益生菌,改善饮食等方式改善肠道环境以做到提前预防,以减少发生ii型糖尿病的风险,此外对某些高风险且已确诊患有ii型糖尿病的患者,也可根据肠道菌情况进行某些必要的肠道微环境治疗。本发明可辅助临床进行ii型糖尿病的提前预测,早期诊断,对降低ii型糖尿病发病率,提高其疾病治疗率具有重大的临床意义。

本发明中,提供一组糖尿病微生物标志物,包括爱格士氏菌属(eggerthella)、丹毒丝菌属(erysipelotrichaceae)、faecalitalea菌属、毛螺菌菌属(lachnospiraceae_ge)和lachnoclostridium菌属、肠杆菌属(enterobacteriaceae)、巨球形菌属(megasphaer)、odoribacter菌属、普雷沃菌属(prevotella_9)、tyzzerella_3菌属、放线杆菌属(actinobacillus)、拟普雷沃菌属(alloprevotella)、别样杆菌属(alistipes)、消化链球菌属(peptostreptococcaceae)、bacteroidales_s24-7_group_ge菌属、伯克霍尔德氏菌属(burkholderiales)、嗜胆菌属(bilophila)和副拟杆菌属(parabacteroides)的组合,将所述标志物丰度输入xgboost模型,训练测试后得到相应的预测ii型糖尿病风险的模型。本发明的ii型糖尿病微生物标志物预测ii型糖尿病风险精确度高,灵敏性好,只需要获取肠道微生物标志物的丰度,通过模型计算给出风险预警,评估患ii型糖尿病的可能性,可以用于预防警示受试者和提示其是否有必要进一步诊断确诊,还有利于个体通过调整饮食或医疗界入改善肠道菌微环境,从而减少个体患ii型糖尿病的风险。

第六方面,本发明提供一种试剂盒,所述试剂盒包括如第二方面所述的试剂或/和如第四方面所述的模型。

与现有技术相比,本发明具有如下有益效果:

(1)本发明提供一种ii型糖尿病微生物标志物,可用于ii型糖尿病的预测与辅助诊断,检测特异性好,灵敏度高,指示肠道微生物菌群的状况,指导肠道微生态的调整,降低ii型糖尿病的患病率;

(2)本发明发现粪便中特定微生物组合的含量与ii型糖尿病的患病风险的相关关系,采用粪便做样本,安全无创,利于采样;

(3)本发明的通过大量筛选得到包含18个特定菌属的微生物标志物,通过构建模型指示肠道特定菌属的含量,协助ii型糖尿病早期筛查,指导肠道菌微环境的调整;

(4)本发明提供一种ii型糖尿病预测模型的构建方法,以标志物组合的丰度做输入变量,不局限于测量手段,只要能获取细菌丰度值的实验手段均支持本模型方法,有利于本发明的模型实现和推广。

附图说明

图1为本发明研究流程示意图;

图2为实施例1中数据样本分布;

图3为实施例1中分别针对logistic回归、随机森林、xgboost和adaboost的5折分层采样交叉切分,测试集平均结果的roc曲线分析;

图4为实施例2中xgboost输出的前20个特定细菌菌属的重要性图;

图5为实施例2中针对xgboost模型进行特征工程筛选得到的roc-auc分数与特征变量个数的关系图;

图6为实施例2中将xgboost作为机器学习模型,重要性排名前18个变量作为输入变量,5折分层采样交叉切分,每折测试集结果以及5折平均值的roc曲线。

具体实施方式

为更进一步阐述本发明所采取的技术手段及其效果,以下通过具体实施方式来进一步说明本发明的技术方案,但本发明并非局限在实施例范围内。

本发明通过前期筛选运算找到最适模型与特定种属的细菌作为微生物标志物,根据带类标的数据进行模型优化调参,提高模型的精确度和灵敏度,通过输出的风险值进行ii型糖尿病早期筛查预测,并可以指示肠道微生物平衡状态,指导个体化肠道菌群调整,降低ii型糖尿病患病风险,本发明的具体实施思路见图1。

实施例1机器学习分类器的挑选

本发明通过大量信息的筛选与匹配,挑选xgboost为最优模型基础,具体方法如下:

(1)针对66例ii型糖尿病人和53例健康人的粪便细菌进行16s测序,清洗数据并匹配数据库得到243个特定菌属的细菌的丰度含量,实验样本分布图见图2;

(2)构建机器学习分类器:测到的243个菌属丰度值作为输入数据,诊断结果作为目标结果(0:对照,1:患二型糖尿病疾病))。构建的分类器包含logistic回归,随机森林,adaboost以及xgboost,将所述分类器用gridsearch进行调参,选取最优参数;

(3)交叉验证选取模型:运用5折分层采样交叉切分(sklearn库中的stratifiedkfold),5次构建训练集和测试集,训练集输入分类器训练模型,测试集用于测试分类器的预测结果。将每次分类器的预测结果和测试集的真实结果进行比较,得到灵敏度和特异性,将5次平均的灵敏性和特异性做受试者曲线图(roc)见图3。

由图3可知,xgboost作为机器学习分类器的auc值最高,标准差最小,稳定性最好,根据结果选定xgboost作为分类器进行后续模型优化。

实施例2特定种属的细菌挑选

(1)特征筛选:包裹式选择特征,即把最终将要使用的学习器(xgboost)的性能作为特征子集的评价原则。xgboost模型得到变量特征的重要性(feature-importance)分数,前20名特征及其重要性分数见图4,根据该分数的高低排序,逐步增加细菌变量个数,得到roc-auc最优所需要的变量(见图5);

(2)测试模型:将18个特定属的细菌丰度作为输入特征变量的值,诊断结果作为目标结果。所有数据进行5折分层采样交叉切分,训练集输入xgboost,测试集用于测试xgboost的预测结果,将每次xgboost的预测结果和测试集的真实结果进行比较,得到灵敏度和特异性,每次结果和平均结果见图6;

(3)存储模型:将xgboost作为机器学习模型,输所有样本的18个细菌丰度和分类标签进行机器学习后存储模型。

由图4可知,根据xgboost分类器的结果,肠道菌中对ii型糖尿病相关度按照由高到底依次为爱格士氏菌属(eggerthella)、丹毒丝菌属(erysipelotrichaceae)、faecalitalea菌属(faecalitalea)、毛螺菌菌属(lachnospiraceae_ge)和lachnoclostridium菌属(lachnoclostridium)、肠杆菌属(enterobacteriaceae)、巨球形菌属(megasphaer)、odoribacter菌属(odoribacter)、普雷沃菌属(prevotella_9)、tyzzerella菌属(tyzzerella_3)、放线杆菌属(actinobacillus)、拟普雷沃菌属(alloprevotella)、别样杆菌属(alistipes)、消化链球菌属(peptostreptococcaceae)、bacteroidales菌属(bacteroidales_s24-7_group_ge)、伯克霍尔德氏菌属(burkholderiales)、嗜胆菌属(bilophila)、副拟杆菌属(parabacteroides)、双歧杆菌属(bifidobacterium)和栖热菌属(thermus)。

由图5可知,按照重要性排名进行输入变量个数的逐渐增加,auc的值先显著增加,然后缓慢降低,当变量数为5时auc值即可达到0.8左右,满足预测模型的功能,在变量数为18时auc值达到最大0.87,说明本发明的模型灵敏度高,特异性好。

由图6可知,最终确认的模型是18个输入变量,通过5折分层采样交叉切分,将数据集进行多次拆分,可以显著提高模型的稳定性,其测试集的平均auc为0.87,证明通过本发明所述ii型糖尿病微生物标志物配合本发明的建模方法可以得到稳定性好、灵敏度高的预测模型。

综上所述,本发明以特定种属细菌的丰度为输入指标,扩展实验测量手段,构建相应的预测ii型糖尿病的风险模型,除了协助诊断,还可以用于预防警示,有利于个体通过调整饮食或医疗界入改善肠道菌微环境,从而减少个体患ii型糖尿病的风险。本发明对降低ii型糖尿病发病率,提高其疾病治疗率具有重大的临床意义。

申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1