一种诊断草酸钙结石的肠道菌群标志物及其应用

文档序号:27215782发布日期:2021-11-03 15:40阅读:160来源:国知局
一种诊断草酸钙结石的肠道菌群标志物及其应用

1.本发明属于生物医药领域,具体涉及一种诊断草酸钙结石的肠道菌群标志物及其应用。


背景技术:

2.泌尿系结石是泌尿外科的常见疾病,在住院患者中居首位(《中国泌尿外科和男科疾病诊断治疗指南》(2019版))。影响结石形成的因素有很多,包括年龄、性别、种族、遗传、环境、饮食习惯和职业等,重视结石形成的因素能够减少结石的形成和复发。其中,与结石成分有关的代谢异常越来越受到人们的关注。流行病学的调查结果显示,80%以上的结石都是草酸钙结石。
3.作为一种多病因所引起的疾病,草酸钙结石的发病机制尚不明确。目前发现微生物可能在肾结石的发病机制和预防中起到重要作用,因此肠道菌群与肾脏疾病的关系是近年来研究的一项热点。研究肠道菌群与草酸钙结石形成的关系,对于揭示草酸钙结石的发病机制以及防治草酸钙结石具有重要的意义。


技术实现要素:

4.本发明的第一个目的是提供一种诊断草酸钙结石的肠道菌群标志物。
5.本发明通过收集草酸钙结石患者和健康人的样本,进行全基因组测序以及使用生物信息学进行测序数据的统计,首次发现了burkholderia pseudomallei和/或bacteroides sp.cag:443在草酸钙结石患者和健康人中呈现显著性差异,说明burkholderia pseudomallei或bacteroides sp.cag:443可作为草酸钙结石的预测因子。
6.因此,本发明提供了一种诊断草酸钙结石的肠道菌群标志物,其为burkholderia pseudomallei和/或bacteroides sp.cag:443。
7.本发明的第二个目的是提供burkholderia pseudomallei和/或bacteroides sp.cag:443在作为诊断草酸钙结石的标志物中的应用。
8.本发明的第三个目的是检测burkholderia pseudomallei和/或bacteroides sp.cag:443丰度的试剂在制备诊断草酸钙结石的试剂中的应用。
9.优选,是检测肠道菌群中burkholderia pseudomallei和/或bacteroides sp.cag:443丰度的试剂在制备诊断草酸钙结石的试剂中的应用。
10.优选,所述的检测burkholderia pseudomallei和/或bacteroides sp.cag:443丰度的试剂可以是能检测burkholderia pseudomallei和/或bacteroides sp.cag:443丰度的特异性的引物、探针或反义寡核苷酸。
11.优选,所述的检测肠道菌群是以粪便为样本。
12.优选,所述的试剂还包括提取微生物基因组dna的试剂。
13.本发明首次发现了burkholderia pseudomallei和bacteroides sp.cag:443与草酸钙结石相关,其丰度在草酸钙结石患者和健康人群中呈现显著性差异,roc曲线分析其作
为检测变量具有较高的特异性和敏感性,因此,可以将burkholderia pseudomallei和/或bacteroides sp.cag:443作为检测标志物应用于草酸钙结石患者的诊断。以burkholderia pseudomallei和/或bacteroides sp.cag:443作为检测标志物,完全无创,准确性高。
附图说明:
14.图1是差异物种burkholderia.pseudomallei在组间的丰度分布箱图,其中p为草酸钙结石患者,c为健康对照。
15.图2是差异物种bacteroides sp.cag:443在组间的丰度分布箱图,其中p为草酸钙结石患者,c为健康对照。
16.图3是burkholderia.pseudomallei和bacteroides sp.cag:443联合诊断效能roc曲线
具体实施方式:
17.下文提供了本说明书中使用的一些术语的定义。除非另有说明,本文中使用的所有技术和科学用语通常具有和本发明所属领域的普通技术人员通常理解的意思相同的意思。
18.本文中使用的术语“扩增”表示现有技术已知的用于复制目标核酸且由此增大所选择的核酸序列的拷贝的数量的一种或多种方法。扩增可以是以指数的或线性的。目标核酸可以是dna或rna。以此方式扩增的序列形成“扩增子”。尽管下文描述的示例性方法涉及利用聚合酶链反应(“pcr”)进行扩增,但在现有技术中已知用于扩增核酸的很多其他方法(例如,等温法、滚环法等)也包括在本发明中。本领域的技术人员将理解,这些其他的方法可以替代pcr方法使用或者可以与pcr方法一起使用。
19.本文中使用的术语“诊断”指的是区分或确定疾病、综合征或病症,或者指的是区分或确定患有特定的疾病、综合征或病症的人。在本发明的说明性实施方式中,基于分析样本中的菌群标志物来诊断对象中的草酸钙结石。
20.本文中使用的术语“杂交”或“特异性杂交”指的是两个互补的核酸链在适当严格的条件下彼此退火结合。通常利用探针长度的核酸分子来进行杂交。核酸杂交技术在现有技术中是公知的。本领域的技术人员了解如何估计和调整杂交条件的严格度,使得具有至少所需程度的互补性的序列将稳定地杂交,而具有较低互补性的序列将不能稳定地杂交。
21.本文中使用的术语“严格性”用来指进行核酸杂交的温度、离子强度和其他化合物的存在的条件。在高严格性条件下,将仅在具有含高频率的互补碱基序列的足够长的片段的核酸之间发生核酸碱基配对。示例性的杂交条件如下。高严格性通常指的是这样的条件:在65℃下且在0.018m的nacl中,仅允许那些形成稳定的杂交产物的核酸杂交。例如,可以通过以下来提供高严格性条件:在50%的甲酰胺、5
×
denhardt溶液、5
×
ssc(盐水柠檬酸钠)、0.2%的sds(十二烷基硫酸钠)中且在42℃下杂交,之后在0.1
×
ssc和0.1%sds中且在65℃下洗涤。中度严格性指的是等效于以下的条件:在50%的甲酰胺、5
×
denhardt溶液、5
×
ssc、0.2%的sds中且在42℃下杂交,之后在0.2
×
ssc和0.2%的sds中且在65℃下洗涤。低严格性指的是等效于以下的条件:在50℃下,在10%的甲酰胺、5
×
denhardt溶液、6
×
ssc、0.2%的sds中杂交,之后在1
×
ssc和0.2%的sds中洗涤。
22.本文中使用的用于扩增的“引物”是特异性地退火结合至目标核苷酸序列或标记核苷酸序列的寡核苷酸。该引物的3’核苷酸应当与相对应的核苷酸位置的目标序列或标记序列相同以通过聚合酶实现最佳的引物延伸。
23.在本发明中,术语“抗体”以最广义使用,而且具体涵盖例如单克隆抗体,多克隆抗体,具有多表位特异性的抗体,单链抗体,多特异性抗体和抗体片段。此类抗体可以是嵌合的,人源化的,人的和合成的。
24.本文中使用的术语“样本”或“测试样本”指的是含核酸的任何液体材料或固体材料。在合适的实施方式中,测试样本从生物源获取(即“生物样本”),比如培养中的细胞,或者是来自动物且最优选地来自人类的组织样本。在示例性实施方式中,所述样本是粪便。
25.本发明的方法和组合物可以用来利用获取自个体的生物样本来检测与各种细菌有关的核酸。可以根据本领域的技术人员所熟知的任何方法将该核酸(dna或rna)从所述样本中分离出来。可以通过标准步骤来获取生物样本并且可以立即使用所述生物样本,或者可以在适于该类型的生物样本的条件下储存该生物样本以备后续使用。
26.下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件。
27.实施例1:筛选与草酸钙结石相关的肠道菌群
28.1、研究对象和样本收集
29.研究在湖北省武汉市华中科技大学同济医学院附属同济医院收集的24例草酸钙结石患者和24例共同生活的健康对照(hc)。
30.纳入标准:通过结石成分分析筛选草酸钙结石患者,通过泌尿系彩超以及病史询问筛选健康对照。
31.排除标准:(1)年龄<18岁;(2)采样前3个月内使用抗生素。
32.样本临床特征:患者中14例为男性,健康对照组中5例为男性。
33.收集研究对象的粪便作为样本。
34.2、dna抽提和测序
35.本实施例利用illumina hiseq高通量测序技术对研究对象(24例草酸钙结石患者和24例共同生活的健康对照)的粪便样本进行宏基因组测序,具体步骤如下:
36.使用dna提取试剂盒提取各粪便样本中的dna,操作步骤按说明书进行。采用荧光计或微量平板读取器(如qubit fluorometer,invitrogen)检测dna的浓度,采用琼脂糖凝胶电泳法(琼脂糖凝胶浓度:1%v,电压:150v,电泳时间:40min)检测样品的完整性和纯度。使用covaris随机打断基因组dna,用磁珠筛选出平均大小为200

400bp的片段化的基因组dna。将得到的dna片段进行末端修复,将3’端进行腺苷酸化,并将接头连接到3’端腺苷酸化的片段的末端,然后进行pcr扩增。使用磁珠对pcr产物进行纯化。双链pcr产物进行热变形,并用夹板寡核苷酸序列进行环化,将单链环状dna(sscir dna)格式化构建最终文库,并对文库质量进行质控。检测合格的dna样品用covaris超声波破碎仪随机打断成长度约为350bp的片段,经末端修复、加a尾、加测序接头、纯化、pcr扩增等步骤完成整个文库制备。文库构建完成后,先使用qubit2.0进行初步定量,稀释文库至2ng/μl,随后使用agilent 2100对文库的insert size进行检测,insert size符合预期后,使用q

pcr方法对文库的有效浓
度进行准确定量(文库有效浓度>3nm),以保证文库质量。然后采用illumina hiseq高通量测序平台进行测序,测序得到的下机数据(raw data)将用于后期信息分析。
37.3、质量控制
38.对测得的数据进行质控处理,最终得到优质的数据进行后续的分析,质控步骤如下:1)去除所含低质量碱基(质量值≤38)超过一定比例(默认设为40bp)的reads;2)去除n碱基达到一定比例的reads(默认设为10bp);3)去除与adapter之间overlap超过一定阈值(默认设为15bp)的reads;4)如果样品存在宿主污染,需与宿主数据库进行比对,过滤掉可能来源于宿主(默认采用soapaligner软件,参数设置:identity≥90%,

l 30,

v 7,

m 4,

m 200,

x 400)的reads;
39.4、物种注释
40.从单样品和混合组装后的scaftigs出发,采用metagenemark进行基因预测,并将各样品和混合组装预测产生的基因放在一起,进行去冗余,构建gene catalogue,从gene catalogue出发,综合各样品的clean data,可获得gene catalogue在各样品中的丰度信息。从gene catalogue出发,和micronr库进行比对,获得每个基因(unigene)的物种注释信息,并结合基因丰度表,获得不同分类层级的物种丰度表。步骤如下:1)使用diamond软件将unigenes与从ncbi的nr(version:2016

11

05)数据库中抽提出的细菌(bacteria)、真菌(fungi)、古菌(archaea)和病毒(viruses)序列进行比对(blastp,evalue≤1e

5);2)比对结果过滤:对于每一条序列的比对结果,选取evalue<=最小evalue*10的比对结果进行后续分析;3)过滤后,由于每一条序列可能会有多个比对结果,得到多个不同的物种分类信息,为了保证其生物意义,采取lca算法(应用于megan软件的系统分类),将出现第一个分支前的分类级别,作为该序列的物种注释信息;4)从lca注释结果及基因丰度表出发,获得各个样品在各个分类层级(界门纲目科属种)上的丰度信息,对于某个物种在某个样品中的丰度,等于注释为该物种的基因丰度的加和;5)从lca注释结果及基因丰度表出发,获得各个样品在各个分类层级(界门纲目科属种)上的基因数目表,对于某个物种在某个样品中的基因数目,等于在注释为该物种的基因中,丰度不为0的基因数目;6)从各个分类层级(界门纲目科属种)上的丰度表出发,进行krona分析,相对丰度概况展示,丰度聚类热图展示,pca和nmds降维分析,anosim组间(内)差异分析,组间差异物种的metastat和lefse多元统计分析。
41.5、统计分析
42.为了研究组间具有显著性差异的物种,从不同层级的物种丰度表出发,利用metastats方法对组间的物种丰度数据进行假设检验得到p值,通过对p值的校正,得到q值;最后根据q值筛选具有显著性差异的物种。使用r的proc分析绘制roc曲线并计算其auc面积。
43.6、结果
44.物种差异性结果分析显示,在绝大部分研究对象中均检测到且呈现显著性差异(q<0.05)的菌种有10个,其中roc检测auc值>0.7的有4个,具体情况如表1、图1和图2所示。对4个auc值>0.7差异菌群通过多因素logistic回归进行联合诊断分析,结果如表2所示。其中,burkholderia pseudomallei(p=0.026)和bacteroides sp.cag:443(p=0.037)与草酸钙结石独立相关。burkholderia pseudomallei auc值为0.776,诊断阈值为0.0000028(即
burkholderia pseudomallei菌在待测人粪便中的丰度/健康人粪便中的丰度,如果小于诊断阈值,则可能患草酸钙结石),在最佳临界点的特异性为0.708,敏感性为0.75;bacteroides sp.cag:443 auc值为0.714,诊断阈值为0.000216(即bacteroides sp.cag:443菌在待测人粪便中的丰度/健康人粪便中的丰度,如果小于诊断阈值,则可能患草酸钙结石),在最佳临界点的特异性为0.833,敏感性为0.625,说明使用上述2个菌种诊断草酸钙结石具有较高的准确性和特异性。如图3所示,分析上述菌群的联合诊断效能,发现burkholderia pseudomallei和bacteroides sp.cag:443联合具有较高的诊断效能(auc值为0.873),说明将上述菌群单独或者联合作为检测指标能有效的区分草酸钙结石患者和健康人。
45.表1差异菌群及其auc值
[0046][0047][0048]
表2 auc值>0.7差异菌群多因素logistic回归
[0049][0050]
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1