本发明属于生物医药技术领域,具体涉及一种肠道微生态标志物及其应用。
背景技术:
肝癌是全球范围内肿瘤相关死亡的第三位主要原因。在美国,目前男性有预计29200例新发的肝癌患者,女性有11510例新发的肝癌患者。在中国由于乙肝病毒持续感染及其引起的肝硬化的流行,导致肝癌的发病情况更严重,男性有343700例新发肝癌患者,女性有122300例新发肝癌患者。由于肝癌早期缺乏特异性症状和有效的早期诊断标志物,大部分肝癌患者诊断时已是晚期,预后很差(死亡率/发生率的整体比例约0.95)。因此,当下亟需新型的诊断标志物和新型的治疗策略来改善肝癌患者的预后。
人体肠道微生态是机体最重要的微生态系统。它不仅作为肠道炎症的关键决定因子,而且在慢性肝脏疾病中发挥重要作用。肠道微生态的改变促进多种慢性肝脏疾病的进展,包括酒精性肝脏疾病、非酒精性脂肪性肝脏疾病、肝硬化及其并发症。近来的动物实验指出肠道微生态通过微生态-肝脏轴促进肝细胞的发生发展。然而临床肝癌患者的肠道微生态特征还未曾报道过。
肠道微生态作为特定疾病或肿瘤的无创诊断工具正在被广泛认可。qinj等鉴定和验证了60000个2型糖尿病相关的微生物标志物,指出了区别2型糖尿病的微生物标志物的有效性。yuj等在不同民族患者中揭示并验证了结直肠癌的微生物标志物,指出微生物标志物作为一种可支付的、无创的结直肠癌的早期诊断标志物。我们之前研究了肝硬化和健康对照的肠道微生物组,建立了基于肠道微生物标志物的患者区分指数。然而,肠道微生物标志物是否能够用于区别早期肝癌还未曾报道过。本发明旨在评估肠道微生物组作为肝癌无创标志物的诊断能力。
技术实现要素:
本发明提供了一种用于肝癌诊断的生物标志物,由seqidno:1-34所示的34种基因组成,所述基因在肠道中富集。
另外本发明还提供了一种用于检测试剂,包括用于检测seqidno:1-34所示的34种基因的引物。
所述引物序列为seqidno:35-36。
本发明还提供了检测试剂在制备肝癌诊断试剂盒中的应用,所述检测试剂适用于检测seqidno:1-34所示的34种基因。
所述肝癌诊断试剂盒适用于肝癌早期筛查和诊断。
对所述对象的粪便排泄物进行检测,以便确定是否存在所述生物标志物。
通过无创的方法收集入组对象的粪便,进行肠道菌群的16srrnamiseq测序,检测是否存在权利要求1所述的生物标志物。
进一步的,通过无创的方法收集入组对象的粪便,进行肠道菌群的16srrnamiseq测序;在标志物发现期,通过随机森林法,在早期肝硬化肝癌患者、肝硬化患者和健康对照之间,鉴定早期肝癌特异性的微生物基因标志物。
具体包括:
(1)通过无创的方法收集入组对象的粪便,进行肠道菌群的16srrnamiseq测序;
(2)在标志物发现期,通过随机森林法,在早期肝硬化肝癌患者、肝硬化患者和健康对照之间,鉴定早期肝癌特异性的微生物基因标志物。
(3)建立肝癌患病率(pod)指数,实现自身标志物发现期的验证。
(4)在标志物验证期,计算验证期患者的pod指数,实现pod指数对于验证期肝癌患者的诊断价值的验证。
(5)同时,入组不同地区的肝癌患者样本,再次实现肠道微生态诊断标志物的跨地区验证。
(6)对于早期肝硬化肝癌的诊断,联合肠道微生物标志物建立的患病率(pod)指数和血清afp可以增强单纯血清afp对早期肝硬化肝癌的诊断能力,表明pod指数可以作为血清afp的一种辅助性诊断工具。
另外,还提供了一种用于肝癌早期诊断的试剂盒,包括用于检测权利要求1所述的seqidno:1-34所示的34种基因的引物。
本发明的其操作步骤如下:
(1)按照前瞻性样本收集和回顾性盲法评估的设计原则,肠道微生态作为肝癌无创诊断工具的研究设计如图1所示。该研究方案得到了浙江大学医学院第一附属医院和郑州大学第一附属医院伦理委员会的批准。所有入组的患者签署知情同意书。
(2)每一个患者提供一份新鲜的粪便样本,分装样本并立即冻存于-80℃。粪便细菌dna抽提按照试剂盒的说明书进行。
(3)完成粪便细菌dna样本的扩增和dna文库构建,在illuminamiseq测序平台完成16srrna测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
(4)从所有样本中随机抽选等量的序列数,按照uparse传递途径拼接成对应的16srrna基因序列分类单元(operationaltaxonomyunits,otus)。按照标志物发现期、标志物验证期和独立诊断期,将产生的otus收集整理。使用rdp分类器2.6版本注释基于序列。
(5)通过基于样本的otus分析,使用r软件程序包计算并获得微生物多样性指数,并获得otus对应的细菌分类和菌属组成。
(6)基于代表性的序列,产生出标志物发现期的otus频率文件、验证期otus频率文件和独立诊断期otus频率文件。这些otus用于一个相关性研究来鉴定在患者和健康对照之间差异明显的otus丰度。使用wilcoxon检验联合benjamin和hochberg多重检验校正来计算两组之间otus频率文件差异的概率。对于特异性,使用一个非常严格的显著阈值:fdr<0.0001。
(7)为了阐明粪便微生物组对早期肝癌的诊断价值,我们构建了一个能够特异性鉴定早期肝癌样本的随机森林区分模型。为了鉴定早期肝癌的独特的otus标志物,在标志物发现期,我们分别在75例早期肝硬化肝癌和40例肝硬化(模型a)、75例健康对照和75例早期肝硬化肝癌(模型b)、40例肝硬化和75例健康对照(模型c)之间进行5次尝试的10倍交差验证(即50次)(图2)。在每一个模型中,计算5次尝试的交叉验证的错误率并用交叉验证错误曲线显示。基于错误曲线的平均值,最小的错误值作为cut-off值使用。在50次尝试验证中,筛选出低于cut-off值的错误率的otus标志物,选择错误率最小的otus标志物作为最佳的标志物集。
(8)基于标志物发现期的otus丰度文件集,通过leave-one-out(loo)交叉验证模式,我们使用r软件3.0.2和随机森林软件包4.6-7(除了设置“importance=true,proximity=true,ntree=1000”之外,软件参数默认),来构建随机森林模型。通过使用随机生成的决策树的比率来计算患病率(probabilityofdisease,pod)指数。决策树预测样本为“hcc”,设置的参数预测为:proximity=t,norm.votes=t,predict.all=true。在loo模式中构建的150个随机森林模型用于预测验证集中每一个样本的pod指数,最终计算每一个样本的平均预测的pod指数。对于每一个样本,pod指数构建的流程图如图3所示。随后,进一步在标志物验证集和独立诊断集中检验了pod指数,并决定了预测错误率。另外,在早期肝癌样本中,我们进一步分析了pod指数和血清afp联合标志物的诊断能力。
(9)我们从中国的华东(杭州)、华中(郑州)和西北地区(新疆)前瞻性地收集了486例粪便样本。经过严格的病理诊断和排除过程以后,最终419例患者样本纳入研究,完成了肠道微生物16srrnamiesq测序。纳入的患者随机分为标志物发现期和验证期。在发现期,75例早期肝硬化肝癌,40例肝硬化和75例健康对照描述了肝癌患者肠道微生态特征,鉴定了微生物标志物,通过随机森林法建立了hcc分类模型并计算了hcc患病率(pod)指数。在验证期,56例健康对照、30例早期肝癌和45例晚期肝癌验证了模型的诊断效能。18例新疆的肝癌患者和80例郑州的肝癌患者用于pod指数的独立诊断(图1)。
(10)在标志物发现期,在模型a(75例早期肝硬化肝癌和40例肝硬化)中,最佳的6个otus标志物集被鉴定,在两组之间显示了80.43%的曲线下面积(auc);在模型b(75例健康对照和75例早期肝硬化肝癌)中,最佳的29个otus标志物集被筛选,在两组之间达到了85.59%的auc值;在模型c(40例肝硬化和75例健康对照)中,最佳的2个otus标志物集被检测,在两组之间达到了81.07%的auc值。为了鉴定早期肝癌特异性的微生物标志物,我们删除了在模型a和模型c中肝硬化患者富集的otus。最终剩余的肝癌特异性的最佳的34个otus标志物用于建立早期肝癌的pod指数(图2)。34个otus的基因序列见seqidno:1-34。
(11)首先,我们使用基于微生物标志物的hcc区分器在75例早期肝硬化肝癌和75例健康对照之间开展自我诊断。其auc值达到了86.2%,95%置信区间(ci)为0.801-0.922。我们进而计算了每一个健康对照和患者的pod指数,表明了pod指数在早期肝癌和健康对照之间显示了强有力的区分能力(图4)。
(12)其次,在标志物验证期,56个健康对照,11个早期肝硬化肝癌,19个无肝硬化肝癌和45个晚期肝癌用于验证hcc区分器的诊断效能。每一个患者的pod指数被计算。其中11个早期肝硬化肝癌患者的pod指数平均值为81.82%,19个无肝硬化肝癌患者的pod指数平均值为73.68%。重要的是,在45个晚期肝癌患者中,pod指数平均值为77.78%。这些结果表明了我们发明的肝癌诊断的pod指数对于肝硬化肝癌、无肝硬化肝癌和晚期肝癌都显示了强有力的诊断能力。
(13)为了进一步确认微生物标志物对于肝癌的诊断能力和适用范围,18个来自新疆的hcc患者和80个来自郑州的hcc患者作为独立诊断集来验证hcc区分器的诊断能力。结果显示:18个新疆hcc样本的pod指数平均值为72.22%,而80个郑州地区hcc样本的pod指数平均值为73.75%。这些结果进一步指出了微生物标志物对于华中地区(郑州)和西北地区(新疆)肝癌患者的强有力的诊断能力(图5)。
(14)血清afp值在肝癌的诊断中已经有很长的使用历史和应用价值。因此,我们进一步探索了肝癌pod指数和血清afp的联合应用对肝癌的诊断能力。结果显示:肝癌pod指数和血清afp值的联合应用对于早期肝癌的诊断能力优于单纯的血清afp的诊断效能,表明我们发明的基于肠道微生物标志物的pod指数可以作为增强血清afp对早期肝癌诊断能力的辅助性工具(图6)。
本发明通过无创的方法收集入组患者的粪便,进行肠道菌群的16srrnamiseq测序。在标志物发现期,通过随机森林法,在早期肝硬化肝癌患者、肝硬化患者和健康对照之间,鉴定早期肝癌特异性的微生物基因标志物,建立肝癌患病率(probabilityofdisease,pod)指数,实现自身标志物发现期的验证。在标志物验证期,计算验证期患者的pod指数,实现pod指数对于验证期肝癌患者的诊断价值的验证。同时,入组不同地区的肝癌患者样本,再次实现肠道微生态诊断标志物的跨地区验证。本发明可达到肠道微生物标志物对于早期肝癌的特异性诊断,并成功实现该诊断模型的跨地区验证,最终建立早期肝癌的无创诊断新方法,实现肝癌的早期筛查、早期诊断和早期治疗。
附图说明
图1.肠道微生态作为肝癌无创诊断工具的研究设计和实验流程图。
图2.通过随机森林法鉴定早期肝癌特异性的肠道微生物基因标志物。
图3.在标志物发现集和验证集中,每一个样本的患病率(pod)指数的建立和计算流程。
图4.基于肠道微生物标志物建立的患病率(pod)指数在发现期对早期肝硬化肝癌和健康对照的区别能力。
图5.基于肠道微生物标志物建立的患病率(pod)指数在验证期和独立诊断期患者中的诊断能力。
图6.基于肠道微生物标志物建立的患病率(pod)指数和血清afp对早期肝硬化肝癌和健康对照的联合诊断。
具体实施方式
下面结合实施例对本发明作进一步的阐述,但本发明的保护内容不仅限于这些实施例。
下列实施例中所用方法如无特别说明,均为常规方法。下列实施例中所需要的材料或试剂,如无特殊说明均为公开商业途径获得。
我们从中国的华东、华中和西北地区前瞻性地收集了486例粪便样本。经过严格的病理诊断和排除过程以后,最终419例患者样本纳入研究,完成了肠道微生物16srrnamiesq测序。纳入的患者随机分为标志物发现期和验证期。在发现期,75例早期肝硬化肝癌,40例肝硬化和75例健康对照描述了肝癌患者肠道微生态特征,鉴定了微生物标志物,通过随机森林法建立了hcc分类模型并计算了hcc患病率(pod)指数。在验证期,56例健康对照、30例早期肝癌和45例晚期肝癌验证了模型的诊断效能。18例新疆的肝癌患者和80例郑州的肝癌患者用于pod指数的独立诊断。
其操作步骤如下:
(1)按照前瞻性样本收集和回顾性盲法评估的设计原则,肠道微生态作为肝癌无创诊断工具的研究设计如图1所示。该研究方案得到了浙江大学医学院第一附属医院和郑州大学第一附属医院伦理委员会的批准。所有入组的患者签署知情同意书。
(2)每一个患者提供一份新鲜的粪便样本,分装样本并立即冻存于-80℃。粪便细菌dna抽提按照试剂盒的说明书进行。
(3)完成粪便细菌dna样本的扩增和dna文库构建,在illuminamiseq测序平台完成16srrna测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
(4)从所有样本中随机抽选等量的序列数,按照uparse传递途径拼接成对应的16srrna基因序列分类单元(operationaltaxonomyunits,otus)。按照标志物发现期、标志物验证期和独立诊断期,将产生的otus收集整理。使用rdp分类器2.6版本注释基于序列。
(5)通过基于样本的otus分析,使用r软件程序包计算并获得微生物多样性指数,并获得otus对应的细菌分类和菌属组成。
(6)基于代表性的序列,产生出标志物发现期的otus频率文件、验证期otus频率文件和独立诊断期otus频率文件。这些otus用于一个相关性研究来鉴定在患者和健康对照之间差异明显的otus丰度。使用wilcoxon检验联合benjamin和hochberg多重检验校正来计算两组之间otus频率文件差异的概率。对于特异性,使用一个非常严格的显著阈值:fdr<0.0001。
(7)为了阐明粪便微生物组对早期肝癌的诊断价值,我们构建了一个能够特异性鉴定早期肝癌样本的随机森林区分模型。为了鉴定早期肝癌的独特的otus标志物,在标志物发现期,我们分别在75例早期肝硬化肝癌和40例肝硬化(模型a)、75例健康对照和75例早期肝硬化肝癌(模型b)、40例肝硬化和75例健康对照(模型c)之间进行5次尝试的10倍交差验证(即50次)(图2)。在每一个模型中,计算5次尝试的交叉验证的错误率并用交叉验证错误曲线显示。基于错误曲线的平均值,最小的错误值作为cut-off值使用。在50次尝试验证中,筛选出低于cut-off值的错误率的otus标志物,选择错误率最小的otus标志物作为最佳的标志物集。
(8)基于标志物发现期的otus丰度文件集,通过leave-one-out(loo)交叉验证模式,我们使用r软件3.0.2和随机森林软件包4.6-7(除了设置“importance=true,proximity=true,ntree=1000”之外,软件参数默认),来构建随机森林模型。通过使用随机生成的决策树的比率来计算患病率(probabilityofdisease,pod)指数。决策树预测样本为“hcc”,设置的参数预测为:proximity=t,norm.votes=t,predict.all=true。在loo模式中构建的150个随机森林模型用于预测验证集中每一个样本的pod指数,最终计算每一个样本的平均预测的pod指数。对于每一个样本,pod指数构建的流程图如图3所示。随后,进一步在标志物验证集和独立诊断集中检验了pod指数,并决定了预测错误率。另外,在早期肝癌样本中,我们进一步分析了pod指数和血清afp联合标志物的诊断能力。
(9)我们从中国的华东(杭州)、华中(郑州)和西北地区(新疆)前瞻性地收集了486例粪便样本。经过严格的病理诊断和排除过程以后,最终419例患者样本纳入研究,完成了肠道微生物16srrnamiesq测序。纳入的患者随机分为标志物发现期和验证期。在发现期,75例早期肝硬化肝癌,40例肝硬化和75例健康对照描述了肝癌患者肠道微生态特征,鉴定了微生物标志物,通过随机森林法建立了hcc分类模型并计算了hcc患病率(pod)指数。在验证期,56例健康对照、30例早期肝癌和45例晚期肝癌验证了模型的诊断效能。18例新疆的肝癌患者和80例郑州的肝癌患者用于pod指数的独立诊断(图1)。
(10)在标志物发现期,在模型a(75例早期肝硬化肝癌和40例肝硬化)中,最佳的6个otus标志物集被鉴定,在两组之间显示了80.43%的曲线下面积(auc);在模型b(75例健康对照和75例早期肝硬化肝癌)中,最佳的29个otus标志物集被筛选,在两组之间达到了85.59%的auc值;在模型c(40例肝硬化和75例健康对照)中,最佳的2个otus标志物集被检测,在两组之间达到了81.07%的auc值。为了鉴定早期肝癌特异性的微生物标志物,我们删除了在模型a和模型c中肝硬化患者富集的otus。最终剩余的肝癌特异性的最佳的34个otus标志物用于建立早期肝癌的pod指数(图2)。34个otus的基因序列见seqidno:1-34。
(11)首先,我们使用基于微生物标志物的hcc区分器在75例早期肝硬化肝癌和75例健康对照之间开展自我诊断。其auc值达到了86.2%,95%置信区间(ci)为0.801-0.922。我们进而计算了每一个健康对照和患者的pod指数,表明了pod指数在早期肝癌和健康对照之间显示了强有力的区分能力(图4)。
(12)其次,在标志物验证期,56个健康对照,11个早期肝硬化肝癌,19个无肝硬化肝癌和45个晚期肝癌用于验证hcc区分器的诊断效能。每一个患者的pod指数被计算。其中11个早期肝硬化肝癌患者的pod指数平均值为81.82%,19个无肝硬化肝癌患者的pod指数平均值为73.68%。重要的是,在45个晚期肝癌患者中,pod指数平均值为77.78%。这些结果表明了我们发明的肝癌诊断的pod指数对于肝硬化肝癌、无肝硬化肝癌和晚期肝癌都显示了强有力的诊断能力。
(13)为了进一步确认微生物标志物对于肝癌的诊断能力和适用范围,18个来自新疆的hcc患者和80个来自郑州的hcc患者作为独立诊断集来验证hcc区分器的诊断能力。结果显示:18个新疆hcc样本的pod指数平均值为72.22%,而80个郑州地区hcc样本的pod指数平均值为73.75%。这些结果进一步指出了微生物标志物对于华中地区(郑州)和西北地区(新疆)肝癌患者的强有力的诊断能力(图5)。
(14)血清afp值在肝癌的诊断中已经有很长的使用历史和应用价值。因此,我们进一步探索了肝癌pod指数和血清afp的联合应用对肝癌的诊断能力。结果显示:肝癌pod指数和血清afp值的联合应用对于早期肝癌的诊断能力优于单纯的血清afp的诊断效能,表明我们发明的基于肠道微生物标志物的pod指数可以作为增强血清afp对早期肝癌诊断能力的辅助性工具(图6)。
本研究基于大批量的肝癌患者粪便样本,在国际上率先建立了基于肠道微生物组的早期肝癌诊断模型,并在中国西北和华中地区成功实现了跨区域验证。因此,靶向肠道微生态标志物代表了一种肝癌早期诊断的潜在的无创诊断工具。
本发明可达到肠道微生物标志物对于早期肝癌的特异性诊断,并成功实现该诊断模型的跨地区验证,最终建立早期肝癌的无创诊断新方法,实现肝癌的早期筛查、早期诊断和早期治疗。
序列表
<110>浙江大学
<120>一种用于肝癌早期诊断的生物标志物及其应用
<130>21-2018-1801
<141>2018-05-15
<160>36
<170>siposequencelisting1.0
<210>1
<211>430
<212>dna
<213>厚壁菌目(selenomonadales)
<400>1
gtggggaatcttccgcaatggacgaaagtctgacggagcaacgccgcgtgagtgatgaag60
gatttcggtctgtaaagctctgttgtttatgacgaacgtgcagtgtgtgaacaatgcatt120
gcaatgacggtagtaaacgaggaagccacggctaactacgtgccagcagccgcggtaata180
cgtaggtggcgagcgttgtccggaattattgggcgtaaagagcatgtaggcggcttaata240
agtcgagcgtgaaaatgcggggctcaaccccgtatggcgctggaaactgttaggcttgag300
tgcaggagaggaaaggggaattcccagtgtagcggtgaaatgcgtagatattgggaggaa360
caccagtggcgaaggcgcctttctggactgtgtctgacgctgagatgcgaaagccagggt420
agcgaacggg430
<210>2
<211>405
<212>dna
<213>根瘤菌目(rhizobiales)
<400>2
gtgggggatattgcacaatgggggaaaccctgatgcagcgacgccgcgtggaggaagaag60
gttttcggattgtaaactcctgtcgttagggacgataatgacggtacctaacaagaaagc120
accggctaactacgtgccagcagccgcggtaaaacgtagggtgcaagcgttgtccggaat180
tactgggtgtaaagggagcgcaggcggaccggcaagttggaagtgaaaactatgggctca240
acccataaattgctttcaaaactgctggccttgagtagtgcagaggtaggtggaattccc300
ggtgtagcggtggaatgcgtagatatcgggaggaacaccagtggcgaaggcgacctactg360
ggcaccaactgacgctgaggctcgaaagcatgggtagcaaacagg405
<210>3
<211>425
<212>dna
<213>拟杆菌目(bacteroidales)
<400>3
gtgaggaatattggtcaatgggcgagagcctgaaccagccaagtagcgtgaaggatgaag60
gtcctacggattgtaaacttcttttatacgggaataaagtttcctacgtgtaggattttg120
tatgtaccgtatgaataagcatcggctaactccgtgccagcagccgcggtaatacggagg180
atgcgagcgttatccggatttattgggtttaaagggagcgcagacgggagattaagtcag240
ttgtgaaagtttgcggctcaaccgtaaaattgcagttgatactggtttccttgagtgcag300
ttgaggcaggcggaattcgtggtgtagcggtgaaatgcttagatatcacgaagaaccccg360
attgcgaaggcagcttgctaaactgtaactgacgttcatgctcgaaagtgtgggtatcaa420
acagg425
<210>4
<211>408
<212>dna
<213>梭菌目(clostridiales)
<400>4
gtggggaatattgcacaatgggggaaaccctgatgcagcaacgccgcgtgaaggatgacg60
gttttcggattgtaaacttcttttcttagtgacgaagacagtgacggtagctaaggaata120
agcatcggctaactacgtgccagcagccgcggtaatacgtaggatgcaagcgttatccgg180
atttactgggtgtaaagggagcgcaggcgggactgcaagttggatgtgaaataccgtggc240
ttaaccacggaactgcatccaaaactgtagttcttgagtgaagtagaggcaagcggaatt300
ccgagtgtagcggtgaaatgcgtagatattcggaggaacaccagtggcgaaggcggcttg360
ctgggctttaactgacgctgaggctcgaaagtgtggggagcaaacagg408
<210>5
<211>425
<212>dna
<213>拟杆菌目(bacteroidales)
<400>5
gtgaggaatattggtcaatggacgcaagtctgaaccagccatgccgcgtgcaggatgacg60
gctctatgagttgtaaactgcttttgtacgagggtaaacgcagatacgtgtatctgtctg120
aaagtatcgtacgaataaggatcggctaactccgtgccagcagccgcggtaatacggagg180
attcaagcgttatccggatttattgggtttaaagggtgcgtaggcggtttgataagttag240
aggtgaaatttcggggctcaaccctgaacgtgcctctaatactgttgagctagagagtag300
ttgcggtaggcggaatgtatggtgtagcggtgaaatgcttagagatcatacagaacaccg360
attgcgaaggcagcttaccaaactatatctgacgttgaggcacgaaagcgtggggagcaa420
acagg425
<210>6
<211>425
<212>dna
<213>拟杆菌目(bacteroidales)
<400>6
gtgaggaatattggtcaatggacgagagtctgaaccagccaagtagcgtgaaggatgaag60
gttctatggattgtaaacttcttttatacgggaataaacggatccacgtgtggatttttg120
catgtaccgtatgaataaggatcggctaactccgtgccagcagccgcggtaatacggagg180
atccgagcgttatccggatttattgggtttaaagggagcgtagatgggttgttaagtcag240
ttgtgaaagtttgcggctcaaccgtaaaattgcaattgatactggcagtcttgagtacag300
ttgaggtaggcggaattcgtggtgtagcggtgaaatgcttagatatcacgaagaactccg360
attgcgaaggcagcttactaacctgtaactgacattgatgctcgaaagtgtgggtatcaa420
acagg425
<210>7
<211>431
<212>dna
<213>脱硫弧菌目(desulfovibrionales)
<400>7
gtggggaatattgcgcaatgggcgaaagcctgacgcagcgacgccgcgtgagggatgaag60
gttctcggatcgtaaacctctgtcaggggggaagaaaccccctcgtgtgaataatgcgag120
ggcttgacggtacccccaaaggaagcaccggctaactccgtgccagcagccgcggtaata180
cggagggtgcaagcgttaatcggaatcactgggcgtaaagcgcacgtaggcggcttggta240
agtcaggggtgaaatcccacagcccaactgtggaactgcctttgatactgccaggcttga300
gtaccggagagggtggcggaattccaggtgtaggagtgaaatccgtagatatctggagga360
acaccggtggcgaaggcggccacctggacggtaactgacgctgaggtgcgaaagcgtggg420
tagcaaacagg431
<210>8
<211>408
<212>dna
<213>梭菌目(clostridiales)
<400>8
gtggggaatattgcgcaatgggggcaaccctgacgcagcaacgccgcgtgcaggaagaag60
gtcttcggattgtaaactgttgtcgcaagggaagaagacagtgacggtaccttgtgagaa120
agtcacggctaactacgtgccagcagccgcggtaatacgtaggtgacaagcgttgtccgg180
atttactgggtgtaaagggcgcgtaggcggactgtcaagtcagtcgtgaaataccggggc240
ttaaccccggggctgcgattgaaactgacagccttgagtatcggagaggaaagcggaatt300
cctagtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggcttt360
ctggacgacaactgacgctgaggcgcgaaagtgtggggagcaaacagg408
<210>9
<211>407
<212>dna
<213>梭菌目(clostridiales)
<400>9
gtggggaatattgggcaatgggcgaaagcctgacccagcaacgccgcgtgaaggaagaag60
gccttcgggttgtaaacttcttttaagagggacgaagaagtgacggtacctcttgaataa120
gccacggctaactacgtgccagcagccgcggtaatacgtaggtggcgagcgttatccgga180
tttactgggtgtaaagggcgcgtaggcgggaatgcaagtcagatgtgaaatccaagggct240
caacccttgaactgcatttgaaactgtatttcttgagtgtcggagaggttgacggaattc300
ctagtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggtcaac360
tggacgataactgacgctgaggcgcgaaagcgtggggagcaaacagg407
<210>10
<211>430
<212>dna
<213>肠杆菌目(enterobacteriales)
<400>10
gtggggaatattgcacaatgggcgcaagcctgatgcagccatgccgcgtgtatgaagaag60
gccttcgggttgtaaagtactttcagcggggaggaaggcgacagggttaataaccctgtc120
gattgacgttacccgcagaagaagcaccggctaactccgtgccagcagccgcggtaatac180
ggagggtgcaagcgttaatcggaattactgggcgtaaagcgcacgcaggcggtctgtcaa240
gtcggatgtgaaatccccgggctcaacctgggaactgcattcgaaactggcaggctagag300
tcttgtagaggggggtagaattccaggtgtagcggtgaaatgcgtagagatctggaggaa360
taccggtggcgaaggcggccccctggacaaagactgacgctcaggtgcgaaagcgtgggg420
agcaaacagg430
<210>11
<211>425
<212>dna
<213>拟杆菌目(bacteroidales)
<400>11
gtgaggaatattggtcaatggccgagaggctgaaccagccaagtcgcgtgagggatgaag60
gttctatggatcgtaaacctcttttataagggaataaagtgcgggacgtgtcccgttttg120
tatgtaccttatgaataaggatcggctaactccgtgccagcagccgcggtaatacggagg180
atccgagcgttatccggatttattgggtttaaagggtgcgtaggcggccttttaagtcag240
cggtgaaagtctgtggctcaaccatagaattgccgttgaaactggggggcttgagtatgt300
ttgaggcaggcggaatgcgtggtgtagcggtgaaatgcatagatatcacgcagaaccccg360
attgcgaaggcagcctgccaagccattactgacgctgatgcacgaaagcgtggggatcaa420
acagg425
<210>12
<211>424
<212>dna
<213>拟杆菌目(bacteroidales)
<400>12
gtgaggaatattggtcaatggacgtaagtctgaaccagccaagtcgcgtgagggaagact60
gccctatgggttgtaaacctcttttataagggaagaataagttctacgtgtagaatgatg120
cctgtaccttatgaataagcatcggctaactccgtgccagcagccgcggtaatacggagg180
atgcgagcgttatccggatttattgggtttaaagggtgcgtaggcggtttattaagttag240
tggttaaatatttgagctaaactcaattgtgccattaatactggtaaactggagtacaga300
cgaggtaggcggaataagttaagtagcggtgaaatgcatagatataacttagaactccga360
tagcgaaggcagcttaccagactgtaactgacgctgatgcacgagagcgtgggtagcgaa420
cagg424
<210>13
<211>430
<212>dna
<213>伯克霍尔德氏菌目(burkholderiales)
<400>13
gtggggaattttggacaatgggggcaaccctgatccagccatgccgcgtgcaggatgaag60
gtcttcggattgtaaactgcttttgtcagggacgaaaagggatgcgataacaccgcattc120
cgctgacggtacctgaagaataagcaccggctaactacgtgccagcagccgcggtaatac180
gtagggtgcaagcgttaatcggaattactgggcgtaaagcgtgcgcaggcggttctgtaa240
gatagatgtgaaatccccgggctcaacctgggaattgcatatatgactgcaggacttgag300
tttgtcagaggagggtggaattccacgtgtagcagtgaaatgcgtagatatgtggaagaa360
caccgatggcgaaggcagccctctgggacatgactgacgctcatgcacgaaagcgtgggg420
agcaaacagg430
<210>14
<211>425
<212>dna
<213>拟杆菌目(bacteroidales)
<400>14
gtgaggaatattggtcaatggacgcaagtctgaaccagccatgccgcgtgcaggaagacg60
gctctatgagttgtaaactgcttttgtacgagagtaaacgctcttacgtgtaagagcctg120
aaagtatcgtacgaataaggatcggctaactccgtgccagcagccgcggtaatacggagg180
atccaagcgttatccggatttattgggtttaaagggtgcgtaggcggtttgataagttag240
aggtgaaataccggtgcttaacaccggaactgcctctaatactgttgaactagagagtag300
ttgcggtaggcggaatgtatggtgtagcggtgaaatgcttagagatcatacagaacaccg360
attgcgaaggcagcttaccaaactatatctgacgttgaggcacgaaagcgtggggagcaa420
acagg425
<210>15
<211>405
<212>dna
<213>梭菌目(clostridiales)
<400>15
gtggggaatattgcacaatggaggaaactctgatgcagcgacgccgcgtgagtgaagaag60
tatttcggtatgtaaagctctatcagcagggaagacagtgacggtacctgactaagaagc120
tccggctaaatacgtgccagcagccgcggtaatacgtatggagcaagcgttatccggatt180
tactgggtgtaaagggagtgtaggtggtatcacaagtcagaagtgaaagcccggggctca240
accccgggactgcttttgaaactgtggaactggagtgcaggagaggtaagtggaattcct300
agtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggcttactg360
gactgtaactgacactgaggctcgaaagcgtggggagcaaacagg405
<210>16
<211>406
<212>dna
<213>红蝽菌目(coriobacteriales)
<400>16
gtggggaatcttgcgcaatggggggaaccctgacgcagcgacgccgcgtgcgggacggag60
gccttcgggtcgtaaaccgctttcagcagggaagagtcaagactgtacctgcagaagaag120
ccccggctaactacgtgccagcagccgcggtaatacgtagggggcgagcgttatccggat180
tcattgggcgtaaagcgcgcgtaggcggcccggcaggccgggggtcgaagcggggggctc240
aaccccccgaagcccccggaacctccgcggcttgggtccggtaggggagggtggaacacc300
cggtgtagcggtggaatgcgcagatatcgggtggaacaccggtggcgaaggcggccctct360
gggccgagaccgacgctgaggcgcgaaagctgggggagcgaacagg406
<210>17
<211>406
<212>dna
<213>梭菌目(clostridiales)
<400>17
gtggggaatattgcacaatgggcgcaagcctgatgcagcaacgccgcgtgaaggaagacg60
gttttcggattgtaaacttctgttcttagtgaagaataatgacggtagctaaggagcaag120
ccacggctaactacgtgccagcagccgcggtaatacgtaggtggcaagcgttgtccggaa180
ttactgggtgtaaagggagcgcaggcgggtgatcaagtcagctgtgaaaactacgggctt240
aacccgtagactgcagttgaaactgttcatcttgagtgaagtagaggttggcggaattcc300
gagtgtagcggtgaaatgcgtagatattcggaggaacaccggtggcgaaggcggccaact360
gggctttaactgacgctgaggctcgaaagtgtggggagcaaacagg406
<210>18
<211>405
<212>dna
<213>梭菌目(clostridiales)
<400>18
gtggggaatattgcacaatgggggaaaccctgatgcagcgacgccgcgtgaaggaagaag60
tatctcggtatgtaaacttctatcagcagggaagaaaatgacggtacctgactaagaagc120
cccggctaactacgtgccagcagccgcggtaatacgtagggggcaagcgttatccggatt180
tactgggtgtaaagggagcgtagacggatggacaagtctgatgtgaaaggctggggctca240
accccgggactgcattggaaactgcccgtcttgagtgccggagaggtaagcggaattcct300
agtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggcttactg360
gacggtaactgacgttgaggctcgaaagcgtggggagcaaacagg405
<210>19
<211>405
<212>dna
<213>梭菌目(clostridiales)
<400>19
gtggggaatattgcacaatgggggaaaccctgatgcagcgacgccgcgtgagtgaagaag60
tatctcggtatgtaaagctctatcagcagggaagaaaatgacggtacctgactaagaagc120
cccggctaactacgtgccagcagccgcggtaatacgtagggggcaagcgttatccggaat180
tactgggtgtaaagggtgcgtaggtggtatggcaagtcagaagtgaaaacccagggctta240
actctgggactgcttttgaaactgtcagactggagtgcaggagaggtaagcggaattcct300
agtgtagcggtgaaatgcgtagatattaggaggaacatcagtggcgaaggcggcttactg360
gactgaaactgacactgaggcacgaaagcgtggggagcaaacagg405
<210>20
<211>408
<212>dna
<213>梭菌目(clostridiales)
<400>20
gtggggaatattgcgcaatgggggaaaccctgacgcagcaacgccgcgtgattgaagaag60
gccttcgggttgtaaagatctttaatcagggacgaaacaaatgacggtacctgaagaata120
agctccggctaactacgtgccagcagccgcggtaatacgtagggagcaagcgttatccgg180
atttactgggtgtaaagggcgcgcaggcgggccggcaagttggaagtgaaatctatgggc240
ttaacccataaactgctttcaaaactgctggtcttgagtgatggagaggcaggcggaatt300
ccgtgtgtagcggtgaaatgcgtagatatacggaggaacaccagtggcgaaggcggcctg360
ctggacattaactgacgctgaggcgcgaaagcgtggggagcaaacagg408
<210>21
<211>430
<212>dna
<213>乳杆菌目(lactobacillales)
<400>21
gtagggaatcttccacaatggacgcaagtctgatggagcaacgccgcgtgagtgaagaag60
gtcttcggatcgtaaaactctgttgttagagaagaacacgagtgagagtaactgttcatt120
cgatgacggtatctaaccagcaagtcacggctaactacgtgccagcagccgcggtaatac180
gtaggtggcaagcgttgtccggatttattgggcgtaaagggaacgcaggcggtcttttaa240
gtctgatgtgaaagccttcggcttaaccggagtagtgcattggaaactggaagacttgag300
tgcagaagaggagagtggaactccatgtgtagcggtgaaatgcgtagatatatggaagaa360
caccagtggcgaaagcggctctctggtctgtaactgacgctgaggttcgaaagcgtgggt420
agcaaacagg430
<210>22
<211>406
<212>dna
<213>梭菌目(clostridiales)
<400>22
gtggggaatattgcgcaatgggggaaaccctgacgcagcaacgccgcgtgattgaagaag60
gccttcgggttgtaaagatctttaattcgggacgaattttgacggtaccgaaagaataag120
ctccggctaactacgtgccagcagccgcggtaatacgtagggagcaagcgttatccggat180
ttactgggtgtaaagggcgcgcaggcgggccggcaagttggaagtgaaatccgggggctt240
aacccccgaactgctttcaaaactgctggtcttgagtgatggagaggcaggcggaattcc300
gtgtgtagcggtgaaatgcgtagatatacggaggaacaccagtggcgaaggcggcctgct360
ggacattaactgacgctgaggcgcgaaagcgtggggagcaaacagg406
<210>23
<211>406
<212>dna
<213>梭菌目(clostridiales)
<400>23
gtgggggatattgcacaatgggggaaaccctgatgcagcgatgccgcgtggaggaagaag60
gttttcggattgtaaactcctgtcgtaagggaagaggaaggactgtaccttacaagaaag120
ctccggctaactacgtgccagcagccgcggtaatacgtagggagcgagcgttgtccggaa180
tgactgggtgtaaagggagcgtaggcgggatggcaagtcagatgtgaaacctgagggctc240
aaccttcagactgcatttgaaactgctgttcttgagtgaagtagaggtaagcggaattcc300
tggtgtagcggtgaaatgcgtagagatcaggaggaacatcggtggcgaaggcggcttact360
gggcttttactgacgctgaggctcgaaagcgtggggagcaaacagg406
<210>24
<211>405
<212>dna
<213>梭菌目(clostridiales)
<400>24
gtgggggatattgcacaatgggggaaaccctgatgcagcaacgccgcgtgagggaagaag60
gttttcggattgtaaacctctgttcttagtgacgataatgacggtagctaaggagaaagc120
tccggctaactacgtgccagcagccgcggtaatacgtagggagcgagcgttgtccggatt180
tactgggtgtaaagggtgcgtaggcggcgaggcaagtcaggcgtgaaatctatgggctta240
acccataaactgcgcttgaaactgtcttgcttgagtgaagtagaggtaggcggaattccc300
ggtgtagcggtgaaatgcgtagagatcgggaggaacaccagtggcgaaggcggcctactg360
ggctttaactgacgctgaagcacgaaagcatgggtagcaaacagg405
<210>25
<211>405
<212>dna
<213>红蝽菌目(coriobacteriales)
<400>25
gtggggaattttgcgcaatgggggaaaccctgacgcagcaacgccgcgtgcgggacgacg60
gccttcgggttgtaaaccgctttcagcagggaagaaattcgacggtacctgcagaagaag120
ctccggctaactacgtgccagcagccgcggtaatacgtagggagcgagcgttatccggat180
tcattgggcgtaaagagcgcgtaggcggcctctcaagcgggatctctaatccgagggctc240
aacccccggccggatcccgaactgggaggctcgagttcggtagaggcaggcggaattccc300
ggtgtagcggtggaatgcgcagatatcgggaagaacaccgatggcgaaggcagcctgctg360
ggccgcaactgacgctgaggcgcgaaagctaggggagcgaacagg405
<210>26
<211>404
<212>dna
<213>梭菌目(clostridiales)
<400>26
gtgggggatattgcacaatggaggaaactctgatgcagcgacgccgcgtgagggaagacg60
gtcttcggattgtaaacctctgtctttggggacgataatgacggtacccaaggaggaagc120
tccggctaactacgtgccagcagccgcggtaatacgtagggagcgagcgttgtccggaat180
tactgggtgtaaagggagcgtaggcggggtctcaagtcgaatgttaaatctaccggctca240
actggtagctgcgttcgaaactggggctcttgagtgaagtagaggcaggcggaattccta300
gtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggcctgctgg360
gcttttactgacgctgaggctcgaaagcgtggggagcaaacagg404
<210>27
<211>408
<212>dna
<213>梭杆菌目(fusobacteriales)
<400>27
gtggggaatattggacaatggaccaaaagtctgatccagcaattctgtgtgcacgatgac60
gtttttcggaatgtaaagtgctttcagttgggaagaaaaaaatgacggtaccaacagaag120
aagtgacggctaaatacgtgccagcagccgcggtaatacgtatgtcacaagcgttatccg180
gatttattgggcgtaaagcgcgtctaggtggttatgtaagtctgatgtgaaaatgcaggg240
ctcaactctgtattgcgttggaaactgcatgactagagtactggagaggtaagcggaact300
acaagtgtagaggtgaaattcgtagatatttgtaggaatgccgatggggaagccagctta360
ctggacagatactgacgctaaagcgcgaaagcgtgggtagcaaacagg408
<210>28
<211>430
<212>dna
<213>巴斯德氏菌目(pasteurellales)
<400>28
gtggggaatattgcgcaatgggggcaaccctgacgcagccatgccgcgtgaatgaagaag60
gccttcgggttgtaaagttctttcggtgacgaggaaggcgtgatgtttaataggcatcac120
gattgacgttaatcacagaagaagcaccggctaactccgtgccagcagccgcggtaatac180
ggagggtgcgagcgttaatcggaataactgggcgtaaagggcacgcaggcggctatttaa240
gtgaggtgtgaaatccccgggcttaacctgggaattgcatttcagactgggtagctagag300
tactttagggaggggtagaattccacgtgtagcggtgaaatgcgtagagatgtggaggaa360
taccgaaggcgaaggcagccccttgggaatgtactgacgctcatgtgcgaaagcgtgggg420
agcaaacagg430
<210>29
<211>430
<212>dna
<213>厚壁菌目(selenomonadales)
<400>29
gtggggaatcttccgcaatgggcgaaagcctgacggagcaacgccgcgtgaacgatgaag60
gtcttaggatcgtaaagttctgttgttagggacgaagggcaagggttataatacagcctt120
tgtttgacggtacctaacgaggaagccacggctaactacgtgccagcagccgcggtaata180
cgtaggcggcaagcgttgtccggaattattgggcgtaaagggagcgcaggcgggaaacta240
agcggatcttaaaagtgcggggctcaaccccgtgatggggtccgaactggttttcttgag300
tgcaggagaggaaagcggaattcccagtgtagcggtgaaatgcgtagatattgggaagaa360
caccagtggcgaaggcggctttctggactgtaactgacgctgaagctcgaaagtgcgggt420
atcgaacagg430
<210>30
<211>408
<212>dna
<213>梭菌目(clostridiales)
<400>30
gtggggaatattgggcaatgggcgaaagcctgacccagcaacgccgcgtgaaggaagaag60
gccttcgggttgtaaacttcttttaccagggacgaaggacgtgacggtacctggagaaaa120
agcaacggctaactacgtgccagcagccgcggtaatacgtaggttgcaagcgttgtccgg180
atttactgagtgtaaagggcgtgtaggcggagatgcaagttaggagtgaaatctgtgggc240
tcaacccataaactgcttctaaaactgtatcccttgagtatcggagaggcaagcggaatt300
cctagtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggcttg360
ctggacgacaactgacgctgaggcgcgaaagcgtggggagcaaacagg408
<210>31
<211>425
<212>dna
<213>拟杆菌目(bacteroidales)
<400>31
gtgaggaatattggtcaatgggcgagagtctgaaccagccaagtagcgtgcaggatgacg60
gccctatgggttgtaaactgcttttataagggaataaagtgagctacgtgtagctttttg120
catgtaccttatgaataaggaccggctaattccgtgccagcagccgcggtaatacggaag180
gtccgggcgttatccggatttattgggtttaaagggagcgtaggccgtcttataagcgtg240
ttgtgaaatgtagatgctcaacatctgcactgcagcgcgaactggtttccttgagtacgc300
acaaagtgggcggaattcgtggtgtagcggtgaaatgcttagatatcacgaagaactccg360
attgcgaaggcagctcactggagcgcaactgacgctgaagctcgaaagtgcgggtatcga420
acagg425
<210>32
<211>430
<212>dna
<213>肠杆菌目(enterobacteriales)
<400>32
gtggggaatattgcacaatgggcgcaagcctgatgcagccatgccgcgtgtgtgaagaag60
gccttcgggttgtaaagcactttcagcggggaggaaggcggtgaggttaataacctcacc120
gattgacgttacccgcagaagaagcaccggctaactccgtgccagcagccgcggtaatac180
ggagggtgcaagcgttaatcggaattactgggcgtaaagcgcacgcaggcggtttgttaa240
gtcagatgtgaaatccccgggctcaacctgggaactgcattcgaaactggcaggctagag300
tcttgtagaggggggtagaattccaggtgtagcggtgaaatgcgtagagatctggaggaa360
taccggtggcgaaggcggccccctggacaaagactgacgctcaggtgcgaaagcgtgggg420
agcaaacagg430
<210>33
<211>408
<212>dna
<213>梭菌目(clostridiales)
<400>33
gtgggggatattggtcaatgggggaaaccctgaaccagcaatgccgcgtgagggaagaag60
gtcttcggattgtaaacctaagtagtcagggacgaagaaagtgacggtacctgaagagta120
agctccggctaactacgtgccagcagccgcggtaatacgtagggagcgagcgttgtccgg180
atttactgggtgtaaagggtgcgtaggcgggtcggcaagtcagatgtgaaataccggggc240
ttaactccggggctgcatttgaaactgttgatcttgagtgaagtagaggcaggcggaatt300
cctagtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcggcctg360
ctgggctttaactgacgctgaggcaccaaagcatggggagcaaacagg408
<210>34
<211>405
<212>dna
<213>梭菌目(clostridiales)
<400>34
gtggggaatattgcacaatgggcgaaagcctgatgcagcgacgccgcgtgagtgaagaag60
tatttcggtatgtaaagctctatcagcagggaagaaaatgacggtacctgactaagaagc120
cccggctaactacgtgccagcagccgcggtaatacgtagggggcaagcgttatccggatt180
tactgggtgtaaagggggcgtagacggtaaagcaagtctgaagtgaaagcccgcggctca240
actgcgggactgctttggaaactgtttaactggagtgtcggagaggtaagtggaattcct300
agtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcgacttactg360
gacgataactgacgttgaggctcgaaagcgtggggagcaaacagg405
<210>35
<211>19
<212>dna
<213>人工序列(artificialsequence)
<400>35
actcctacgggaggcagca19
<210>36
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>36
ggactachvgggtwtctaat20