一种口腔微生物群落数据库及其应用的制作方法

文档序号:6441718阅读:754来源:国知局
专利名称:一种口腔微生物群落数据库及其应用的制作方法
技术领域
本发明涉及人体共生菌群和公共卫生领域,具体的讲是通过新一代高通量测序技术,得到人体口腔系统以唾液微生物群落为代表的口腔共生菌群相关的物种和基因组信 息,针对不同健康状态人群建立的一种口腔微生物群落数据库及其在疾病风险评估、预测 和诊断中的应用。
背景技术
作为人类健康的一个重要组成部分的口腔健康,在很大程度上影响生活质量,因 此口腔疾病的预防非常重要。口腔疾病,如龋齿、牙周病、口腔黏膜病、口腔癌、HIV的口腔 表现、走马疳和口腔颂面外伤,均为重要的公共卫生问题。由于疼痛难忍、功能损害和生活 质量下降,口腔疾病对个体和社区的影响不容忽视。世界卫生组织一直致力于在全世界范 围唤起人们对口腔健康的广泛重视,呼吁和指导各国政府、社会各界和个人采取切实有效 的措施预防口腔疾病的发生,旨在提高全人类口腔健康水平。如何提高口腔健康水平,不仅仅是在疾病发生之后给予补救性治疗措施,更重要 的是寻找疾病的病因所在,开展疾病的预防和防控工作,筛选疾病敏感人群,开展有效的早 期预防、早期诊断及早期治疗。越来越多的研究使人们逐步认识到人体疾病与健康状态 的相互转化不仅取决于人类自身染色体所携带的遗传基因,还取决于人体内大量共生菌群 间以及与人体自身的相互作用。Peterson等学者研究认为(Peterson,J.,S. Garges, et al. (2009). “ The NIH Human Microbiome Project. “ Genome Res 19(12) :2317_2323), 人个体所携带的共生菌群数量远远超过构成人体本身细胞的十倍之多,共生菌群基因组理 论的诞生将“人”的含义加以延伸至人类个体所携带的微生物群落,正是这些共生菌群赋予 人类不依赖于自身进化而获得的复杂个体特征。如此“人”可被定义为人体细胞和微生物 细胞的共生组合体,携带两套基因组,一套是从垂直关系遗传自父母的人类基因组,其编码 大约2. 5万个基因;另一套则是出生后才寄生于人体的大量共生菌群,作为人体的第二基 因组,是后天禀赋的主要承载者,其遗传信息的总和被称为“微生物组”,也可称为“元基因 组”,它所编码的基因数量在100万个左右。两套基因组相互协调、和谐一致,维系了人体的 健康。为全面分析人体微生物群系,揭示人体健康疾病状态与人体微生物群系的关系,美 国国立卫生研究院(NIH)于2007年12月19日宣布正式启动一项新的基因工程-人体共 生菌群基因组计划(HMP),对人体内5种已知为微生物群落寄生的区域,包括消化道、口腔、 皮肤、鼻腔和女性泌尿生殖道系统的微生物进行表征分析,确定个体之间是否有共同的核 心人微生物群系的存在,从而加深对人体微生物群系的变化是否与人体健康状况相关的理 解,并构建微生物在人体特定区域的存在及变化情况与特定的疾病之间的联系。

发明内容
本发明的目的在于提供一种口腔微生物群落数据库,率先对口腔系统微生物菌群 进行分析。本数据库是采用454和Solexa新一代高通量测序技术,对不同人群、不同健康状态来源的口腔唾液微生物进行16S rRNA和全基因组测序,通过超级计算机运算,构建的可 以用于人体疾病风险预测和诊断的口腔微生物菌群数据库。该数据库涵盖了生物系统进化 树上从细菌、真菌和病毒门到属等不同层面的物种信息,且几乎覆盖所有菌种全基因组的、 具有详细注释的功能基因,计算机存储数据量高达105G以上。该结果使人们对口腔细菌种 类的认识达到了前所未有的深度,提供了更多疾病研究、预测和诊断的候选基因和切入点。具体地说,本发明提供的口腔微生物群落数据库,是以不同健康状况人群口腔唾 液为数据库样品来源,通过DNA的提取,聚合酶链式反应扩增和高通量测序,得到样品唾液 微生物群落及其基因组信息,通过计算机进行数据的更新和维护。所述的口腔微生物群落数据库,其中,人群包括成人、儿童、老龄人群以及特殊疾 病来源人群;人群健康状态包括完全健康、龋病、牙周病、牙髓病、口臭、难治性根尖炎、糖 尿病、肿瘤放疗化疗后病人、艾滋病、结核病和病毒性肝炎。所述的口腔微生物群落数据库,其中,唾液微生物群落特征包括口腔细菌、真菌和病毒。所述的口腔微生物群落数据库,其中,口腔微生物基因组信息采用454和Solexa 高通量测序仪得到。所述的口腔微生物群落数据库,其中,基因组信息涵盖针对每一种口腔微生物核 糖体的16S、18SrDNA序列和所有微生物的宏基因组序列。本发明所构建的数据库可以应用在临床口腔疾病、艾滋病、结核、病毒性肝炎、肥 胖和糖尿病的风险评估、预测和辅助诊断中。
具体实施例方式本发明提供的口腔微生物群落数据库,是通过收集各种不同疾病来源(如龋病、 牙周病、难治性根尖炎等)、不同健康状态人群的唾液样品,通过构建16S rDNA、18S rDNA标 签序列文库和全基因组文库,借助高通量测序手段,构建针对各样品的唾液微生物群落数 据库信息,主要包括以下步骤(以下以龋敏感人群为对象示例)1)收集不同人群唾液,然后利用裂解缓冲液(50mM Tris,pH8. 0, 50mMEDTA, 50mM sucrose, lOOmM NaCl,l%SDS)裂解细胞,采用目前已经公知的高盐法提取唾液中微生物的 全基因组DNA(gDNA)。2)对于16S rDNA标签序列文库,通过合成带有6个碱基的样品特异标记的PCR探 针,采用公知的聚合酶链式反应(PCR)方法扩增样品DNA的16S高变区片段,然后将PCR产 物提纯后建库,利用454上机测序。3)通过对比 RDP 数据库(The Ribosomal Database Project, http://rdp. cme. msu. edu/,其内包含有不断更新的涵盖细菌和古菌域的核糖体相关数据,含有大约 1358,426条序列信息截止2010年1月),同时利用相对成熟的联合分析流程(主要包括 商业软件MOTHUR、ULUST、CD-HIT、RDP-CLASSIFIER等),借助超级计算机(主要有曙光天潮 TC2600刀片服务器、天阔A950r-F机架服务器和天阔A620r_FX机架服务器组成,总计算能 力达每秒3. 6万亿次)获得样品的物种多样性和丰度信息。4)对于全基因组(或宏基因组)数据库,直接将PCR产物提纯后建库,通过特异性 标i己,禾IJ用 Solexa上机IlJ序。通过比对KEGG(KyotoEncyclopedia of Genes and Genomes,http://www.genome.jp/kegg/), CAZyme(Carbohydrate-Active enZYmes Database, http://www. cazy. org/)等大型的全基因组及代谢途径数据库,进行相关代谢途径的重建 以及功能基因的注释和分析。5)在上述研究基础上构建唾液微生物群落数据库,该数据库含有不同人群口腔样 品所有微生物菌群(包括各菌群的多样性及丰度)及其对应的16S rDNA和全基因组信息。按照以上步骤,是本领域技术人员能够实现的。本发明基于对口腔菌群深入了解的基础上构建的针对特异性疾病及健康人群的 唾液菌群数据库,该数据库可用于疾病微生物病因学因素的探讨,探寻疾病可能的生物筛 选标志以及预后判断指标,利于发现疾病内部与局部菌群之间的隐秘关系。以下举实施例作进--步的描述。
实施例1
1、高盐法提取唾液DNA
1)加30iU的蛋白酶K和150 ill的10% SDS到唾液-缓冲液中,53°C水浴中过夜培养。
2)加入400 ill的5M NaCl并冰上培养lOmin, 13,OOOrpm高速离心lOmin,取上清液。
3)加入800 u 1异丙醇,室温下培养lOmin, 13,OOOrpm高速离心15min。
4)弃上清液,采用500 u 1 70%乙醇洗沉淀三次,溶于30 ill的EB溶液。
2、16S rDNA标签序列文库的构建
1)采用带有独特标记的引物扩增V4-V5高变区
50 u 1PCR体系包括
lOxbuffer5u 1
dNTP4u 1
DNA polymerase0. 25u 1
H2036. 75 u 1
Primer pair1 u 1*2
template 2 y 1
PCR反应条件
94°C,5min
<formula>formula see original document page 5</formula>72°C, lOmin2)切胶回收提纯PCR产物,不同样品以等摩尔数混合3)按照454FLX Titanium测序标准流程建库(包括末端补平,接头连接,小片端去 除,DNA库固定,填充空缺以及单链DNA库的分离)4)按照454FLX Titanium测序标准操作上机测序(包括乳化PCR扩增,珠子的回收和富集以及测序引物的链接后上机测序)3、对于全基因组(或宏基因组)数据库,样品DNA经提纯后直接按照Solexa GA II 标准建库流程建库(包括氮气打断,末端补平,两端添加接头,切胶回收300-400bp片段后 PCR扩增),将构建的DNA文库在ClusterStation上种植于Flow cell后,经桥式PCR扩增 并杂交测序引物后,SolexaGA II上机测序。4、数据分析16S rDNA 序列1)将原始数据进行质量筛选(依据测序得出的质量评估值,长度,模糊碱基,可能 的嵌合体的标准进行初步筛选)2)对筛选后的序列进行0TU分析(Operational Taxonomy Unit),统计菌种多样
性f曰息。3)对筛选后的序列进行物种鉴定,研究各个分类水平细菌的种类及丰度,寻找在 疾病样品和健康样品中从细菌门到细菌属等不同分类水平上菌种丰度的统计学差异;对于 疾病和健康来源的样品,基于整个微生物群落的种系发育信息进行Unifrac(http://bmf2. Colorado, edu/unifrac/index. psp)分析,比较群落结构差异,基于上述基础对疾病的监测 和筛查指标进行归类。全基因组(或宏基因组)数据1)宏基因组数据的初步筛选(去除含有模糊碱基的序列),通过与人的参考基因 组比较去除人基因组来源序列2)与代谢数据库包括KEGG,CAZyme等代谢数据库比对,进行序列的注释,重建相 应的代谢途径以及功能基因差异的比较。5、由于口腔微生物涵盖的细菌种群复杂,基因组信息也很庞大。目前该数据库已 经通过超级计算机进行数据的更新、维护和后台管理。该数据库信息的访问采用基于付费 制度的用户名和密码方式登录。登录网站为www. microbialdb. org。以上是结合具体实施例子对本发明所做的进一步描述。本领域技术人员应该了 解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理, 在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都 落入要求保护的本发明范围内。本发明要求保护范围由权利要求书及其等效物界定。
权利要求
一种口腔微生物群落数据库,是以不同健康状况人群口腔唾液为数据库样品来源,通过DNA的提取,聚合酶链式反应扩增和高通量测序,得到样品唾液微生物群落及其基因组信息,通过计算机进行数据的更新和维护。
2.根据权利要求1所述的口腔微生物群落数据库,其中,人群包括成人、儿童、老龄人 群以及特殊疾病来源人群;人群健康状态包括完全健康、龋病、牙周病、牙髓病、口臭、难 治性根尖炎、糖尿病、肿瘤放疗化疗后病人、艾滋病、结核病和病毒性肝炎。
3.根据权利要求1所述的口腔微生物群落数据库,其中,唾液微生物群落特征包括口 腔细菌、真菌和病毒。
4.根据权利要求1所述的口腔微生物群落数据库,其中的口腔微生物基因组信息采用 454和Solexa高通量测序仪得到。
5.根据权利要求4所述的口腔微生物群落数据库,其中的基因组信息涵盖针对每一种 口腔微生物核糖体的16S、18SrDNA序列和所有微生物的宏基因组序列。
6.权利要求1所构建的数据库在临床口腔疾病、艾滋病、结核、病毒性肝炎、肥胖和糖 尿病的风险评估、预测和辅助诊断中的应用。
全文摘要
一种口腔微生物群落数据库,是以不同健康状况人群口腔唾液为数据库样品来源,通过DNA的提取,聚合酶链式反应扩增和高通量测序,得到样品唾液微生物群落及其基因组信息,通过计算机进行数据的更新和维护。该数据库可用于深入分析各类人群口腔微生物群落结构组成;用于疾病微生物病因学因素的风险评估、预测和人体健康状况评价。也可以用于筛选疾病诊断的生物标志以及预后判断指标。
文档编号G06F19/00GK101833613SQ20101019822
公开日2010年9月15日 申请日期2010年6月4日 优先权日2010年6月4日
发明者凌均棨, 宋厚辉, 徐健, 曾晓维, 杨芳, 王玮 申请人:中国科学院青岛生物能源与过程研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1