本发明涉及医学检验,具体涉及基于微生物与宿主互作的阿尔兹海默症标志物识别方法。
背景技术:
1、至今对阿尔兹海默病(alzheimer disease,ad)的早期诊断依旧是一大难题。即使在症状前几年已呈现出各种病理改变,如大脑中β-淀粉样蛋白的过度产生和积累、tau蛋白的过度磷酸化,但这些生物标志物的检测需要正电子发射断层扫描或腰椎穿刺,当没有或只有轻微症状时,很少有人能接受这些放射性或侵入性检查。除此之外,一些遗传因素也可能加剧ad的发病,如apoeε4等位基因是公认的ad重要风险基因。因此,宿主基因相关研究识别更多新的风险基因位点,进一步揭示ad的发病机制,为治疗提供新的方向,具有巨大的临床应用价值。
2、研究表明,ad患者肠道微生物失调的特征是促炎菌增多,抗炎菌减少,及其微生物衍生的代谢物共同影响着肠道通透性和血脑屏障完整性。如厚壁菌门与炎症反应和代谢功能的调节有关,而代谢功能又会影响行为和认知功能。但目前单靠宏基因组学数据构建的ad预测模型大多效果不理想,尤其是用于跨队列的交叉验证上,因此如何得到队列间更一致的ad标志物尤为重要,也是一大挑战。
3、对阿尔兹海默症(ad)的病例-对照队列研究中,微生物组、宿主全基因组的单一组学与ad的关联研究已较多。目前关于微生物和宿主互作模式的探索主要涉及微生物组学与宿主全基因组的联合分析,但现有研究大多基于健康队列,进而挖掘微生物特征(以物种组成、功能通路为主)与宿主免疫、代谢相关性状的关联,较少研究同时纳入病例-对照队列。
技术实现思路
1、本发明的目的在于提供基于微生物与宿主互作的阿尔兹海默症标志物识别方法,解决以下技术问题:
2、如何利用先验信息,结合微生物组学和宿主基因组学的整合分析,共同揭示ad的疾病标志物。
3、本发明的目的可以通过以下技术方案实现:
4、基于微生物与宿主互作的阿尔兹海默症标志物识别方法,包括以下步骤:
5、采集患者的粪便样本和血液样本,分别提取微生物基因组和宿主基因组并进行质检,将通过质检的微生物-宿主基因组配对样本标记为发现集;
6、使用主题模型识别微生物基因组中与阿尔兹海默症表型关联的子社团结构,将所述子社团结构与宿主基因组进行关联,对显著关联的宿主基因变异位点进行基因注释和富集分析;
7、将显著关联的基因变异位点作为工具变量,对子社团结构进行单样本孟德尔随机化和双样本孟德尔随机化,识别子社团结构特征与阿尔兹海默症表型及现存人体疾病表型间的因果关系;
8、采集与阿尔兹海默症相关的风险基因所覆盖的snp,将该snp与微生物单菌丰度进行关联分析,并提取出有在疾病-健康组间存在显著差异的微生物物种作为差异物种集,检验与疾病风险基因显著关联的候选关键微生物物种集是否富集到阿尔兹海默症的差异物种上,将检验通过的微生物特征标记为阿尔兹海默症标志物。
9、作为本发明进一步的方案:对所述微生物基因组进行质检的过程为:
10、提取所述粪便样本中微生物的宏基因组测序样本,对宏基因组测序样本的原始基因序列采用trimmomatic和bowtie2进行质检,并通过metaphlan3进行物种注释,获得界至种水平的相对丰度表,将通过质检的宏基因组测序样本标记为微生物基因组。
11、作为本发明进一步的方案:对所述宿主基因组进行质检的过程为:
12、提取血液样本中的全基因组测序数据,将全基因组测序数据与参考基因序列进行对比,得到snp变异信息,借助plink工具对样本和snp进行质检,将满足预设条件的有效snp标记为宿主基因组。
13、作为本发明进一步的方案:对snp的预设条件为:
14、选取同时满足漏检率missingrate低于2%、最小等位基因频率maf大于等于5%且hwe的p值小于1*10-6的snp变异信息。
15、作为本发明进一步的方案:所述双样本孟德尔随机推断子社团结构可能关联表型基于biobank japan的gwas数据库。
16、作为本发明进一步的方案:判断所述子社团结构与疾病表型间因果关系的过程为:
17、利用现有ad风险基因变异位点,对所述子社团结构进行单样本孟德尔随机化,推断子社团结构特征与ad间的因果关系;采集biobank japan的gwas summary data,利用双样本孟德尔随机推断所述子社团结构与现有疾病表型间的因果关系。
18、作为本发明进一步的方案:单样本孟德尔随机化直接使用两阶段逻辑回归实现,双样本孟德尔随机化通过twosamplemr r package标准流程实现。
19、作为本发明进一步的方案:在检验候选风险snp关联物种富集分析前,使用lindar package对单菌进行组间差异分析,选取各亚组p<0.05且|log2(foldchange)|>1的物种作为差异物;在疾病预测模型构建中,使用3次5折的嵌套式随机森林分类器,模型auc、f1score作为分类精度指标。
20、本发明的有益效果:
21、本发明展示了如何利用多组学信息挖掘疾病关联信号,并首次在微生物组-宿主基因组关联研究中利用子社团结构的概念,不仅能够使用较少的物种特征提升对ad表型预测模型的泛化能力,而且联合基因组验证了因果关系,整合了微生物-宿主基因组的多组学数据,挖掘出ad的微生物疾病标志物,既具有微生物意义,又能从宿主遗传上解释,并能构建泛化能力较好的疾病预测模型;比较了两种思路、且可拓展探索多界(真菌-细菌等)特征对ad队列的疾病预测模型精度的贡献度;可通过宿主基因组学数据推断主题模型挖掘的子社团结构与疾病表型间的因果关系。
1.基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,对所述微生物基因组进行质检的过程为:
3.根据权利要求1所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,对所述宿主基因组进行质检的过程为:
4.根据权利要求3所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,对snp的预设条件为:
5.根据权利要求1所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,所述双样本孟德尔随机推断子社团结构可能关联表型基于biobank japan的gwas数据库。
6.根据权利要求1所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,判断所述子社团结构与疾病表型间因果关系的过程为:
7.根据权利要求6所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,单样本孟德尔随机化直接使用两阶段逻辑回归实现,双样本孟德尔随机化通过twosamplemr r package标准流程实现。
8.根据权利要求1所述的基于微生物与宿主互作的阿尔兹海默症标志物识别方法,其特征在于,在检验候选风险snp关联物种富集分析前,使用linda r package对单菌进行组间差异分析,选取各亚组p<0.05且|log2(foldchange)|>1的物种作为差异物;在疾病预测模型构建中,使用3次5折的嵌套式随机森林分类器,模型auc、f1 score作为分类精度指标。