从混合核酸中获得目标核酸的方法

文档序号:10505899阅读:512来源:国知局
从混合核酸中获得目标核酸的方法
【专利摘要】本发明公开一种从混合核酸中获得大量目标核酸的方法,所述混合核酸包括目标核酸和非目标核酸,所述方法包括:从所述混合核酸中富集所述目标核酸,所述富集包括利用甲基结合域蛋白结合所述非目标核酸,去除形成的甲基结合域蛋白-非目标核酸结合物;扩增经过所述富集的目标核酸,所述扩增包括利用N6随机引物;其中,所述大量目标核酸指所述目标核酸的量达到或者超过测序要求的最低核酸量,所述N6随机引物为由A、T、C和G随机排列组合成的长度为6bp的序列。本发明还公开一种鉴定人源宏基因组样本中的低丰度菌种的方法。
【专利说明】
从混合核酸中获得目标核酸的方法
技术领域
[0001]本发明涉及生物样品处理领域,具体的,本发明涉及一种从混合核酸中获得大量目标核酸的方法,以及一种鉴定人源宏基因组样本中低丰度菌种的方法。
【背景技术】
[0002]宏基因组(Metagenome,简称meta),也称微生物环境基因组或元基因组,其定义为特定环境中全部微小生物遗传物质的总和,其包含微生物群落所有物种的基因组。
[0003]来源于人的宏基因组样本(人源宏基因组样本),如来自人的皮肤、粪便、唾液等的核酸样本,包含的微生物核酸是微量的,且不同来源的人源m e t a样本中的主要菌种不同,有的菌种的丰度极低,难以获得有效的扩增,难以被检测到。
[0004]微量人源meta样本中宿主DNA占绝大部分,对人源meta样本的测序分析,利用宏基因组建库测序技术对微量低丰度的人源meta样本中的低丰度菌种进行分析,之前的策略是在混合核酸测序数据中取出宿主DNA,这一策略对于微量的、低丰度的样本而言,存在浪费数据,成本高,低丰度微生物分析困难的问题。而且,在测序文库构建时,因为样本起始核酸量过低,文库构建的成功率很低,而且即便构建的测序文库符合上机要求,一般在测序时只能根据经验在常规相关样本研究背景的基础上增加测序深度来获得大量测序数据,接着利用生物信息分析技术对测序数据中包含的来自低丰度菌种的序列进行分析,测序成本高,且由于数据量大分析工作量大。

【发明内容】

[0005]本发明旨在解决上述问题至少之一或者提出一种商业选择。
[0006]依据本发明的一方面,本发明提供一种从混合核酸中获得大量目标核酸的方法,所述混合核酸包括目标核酸和非目标核酸,所述方法包括以下步骤:从所述混合核酸中富集所述目标核酸,所述富集包括利用甲基结合域蛋白结合所述非目标核酸,去除形成的甲基结合域蛋白-非目标核酸结合物;扩增经过所述富集的目标核酸,所述扩增包括利用N6随机引物;其中,所述大量目标核酸指所述目标核酸的量达到或者超过测序所需要的最低核酸量,所述N6随机引物为由A、T、C和G随机排列组合成的长度为6bp的序列。
[0007]在本发明的一个实施例中,所述混合核酸来自人源meta样本,例如人皮肤meta样本,人皮肤meta样本中的核酸混有大量来自人的核酸,其中的目标核酸为meta核酸。人源meta样本中,在富集meta核酸之前所含的人核酸的量可能是目标meta核酸的量的5倍、10倍、20倍、30倍、40倍、50倍、100倍、150倍、200倍或者250倍。一般的,只要非目标核酸的量达到目标核酸的量的5倍,测序实现的就基本是获得非目标核酸的序列了。
[0008]所说的甲基结合域蛋白包括能够与DNA中的CpG-甲基化胱氨酸特异性结合的MeCP2、甲基化CpG结合域蛋白I (MBDl)、MBD2、MBD3或者MBD4(US7, 670, 773),在本发明的一个实施例中,所说的甲基结合域蛋白为甲基化CpG结合域蛋白2 (MBD2),MBD2能够与人DNA上甲基化的CpG区域结合。在本发明的一个实施例中,先将MBD2结合到磁珠(MagneticBeads)上,MBD2与磁珠的结合是通过将磁珠包被上蛋白A或者蛋白G,将MBD2与抗体Fe部分结合,接着通过Fe与蛋白A或蛋白G的结合实现MBD2和磁珠的结合,一个包被的磁珠可以与多个MBD2结合,接着加入人源meta DNA样本,样本中的宿主DNA(人DNA)与MBD2-磁珠结合,在磁力架作用下,宿主DNA-MBD2-磁珠复合物被吸附沉降,富集得到存在于上清液中的meta DNA,实现所说的目标核酸富集。蛋白A是一种细胞壁蛋白,具有不在抗原结合点而与免疫球蛋白结合的性质。蛋白G能与多种动物的IgG的Fe区发生结合。磁珠是指具有细小粒径的超顺磁微球,磁珠一般具有超强的顺磁性,在磁场中能够迅速聚集,离开磁场后又能够有助于磁分离的均匀分散,其次,具有合适的且差别较小的粒径,如粒径为4.0-4.5 μπι或者3.0-3.9 μ m,保证足够强的磁响应性又不会沉降。盐的存在被证明能够加强MBD2-磁珠与人DNA的结合,在本发明的一个实施例中,富集所使用的缓冲液包含150-400mM NaCl和非离子表面活性剂小于1%,其中,非离子表面活性剂可以为Tween 20 (吐温20)、Tween80或者Tween 100。利用上述的包含盐和表面活性剂的缓冲液来进行所说的富集,能够显著降低非甲基化CpG核酸与MBD2的非特异性结合。
[0009]在本发明的一些实施例中,所述扩增是多重置换扩增(MDA),MDA能对有限的核酸样品进行快速、均匀、无偏向的等温全基因组扩增。所述MDA扩增包含多条N6随机引物与富集后的变性目标DNA的结合过程,以及使用Phi 29聚合酶在恒定温度下进行的链置换合成过程,置换链作为模板结合引物,从而生成了大量的扩增目标DNA。Phi 29聚合酶源于噬菌体,是一种具有3’端一5’端外切酶活性(校正活性)的DNA聚合酶,能够提供比TaqDNA聚合酶高100倍的保真性。多条N6随机引物(随机六聚体)能够结合到(互补配对至IJ)模板的多个位置,利于对目标DNA整体的无偏向扩增,多条N6随机引物可以为2条、3条、4 条、5 条、10 条、15 条、20 条、30 条、40 条、50 条、60 条、70 条、80 条、100 条、150 条、200条、250条或300条随机引物,基本上,N6随机引物的条数可以根据目标DNA的大小来调整,利用多组不同条数的N6随机引物来试验,使相邻两条N6的结合位置之间的序列可以得以有效扩增。在本发明的一个实施例中,一组共用的N6随机序列为ATCACG、CGATGT、TTAGGC、TGACCA、ACAGTG、GCCAAT、CAGATC、ACTTGA、GATCAG、TAGCTT、GGCTAC 和 CTTGTA。在本发明的一个实施例中,扩增的缓冲液体系的pH值为5?10,包含Mg2+0.l-25mM、NaCl或KCl l_150mM和铵盐,例如,扩增缓冲体系为 Tris, pH 8.5, 1mM MgCl2, 50mM KCl,20mM(NH4) 2S04。Phi 29聚合酶结合这一缓冲体系,能够方便的克服如发卡环一类的二级结构困难,在扩增过程中避免滑脱、聚合酶解离等现象的发生。这样无偏差的DNA片段能够合成至10kb的长度。
[0010]在本发明的一个实施例中,所述最低核酸量为20ng。利用本发明这一方面的方法能够从微量人源meta样本中简单准确获得大于20ng的meta核酸,使能够满足一般文库构建对起始核酸量的要求,易于meta文库构建、测序,获得目标核酸序列,与常规方法相比,提高建库成功率,降低测序成本,而且,因为测序数据中中的大部分为目标核酸数据,没有大量宿主数据的干扰,使得后续基于测序数据的分析变得相对简单。
[0011]可以将上述本发明这一方面的或者任一【具体实施方式】中涉及的试剂配方、酶、反应体系和/或序列等组合成试剂盒,试剂盒还可进一步包括扩增核苷酸底物dNTP、扩增产物检测引物、其它缓冲液等。该试剂盒可以用于从混合核酸中获得大量目标核酸,特别是从微量人源meta样本中获取微量的meta DNA。
[0012]依据本发明的另一方面,本发明提供一种构建宏基因组测序文库的方法,该方法包括:获取宏基因组样本中的核酸,所述核酸包含来自宿主的核酸和来自微生物的核酸;富集所述核酸中的来自微生物的核酸,所述富集包括,利用甲基结合域蛋白结合来自宿主的核酸,去除形成的甲基结合域蛋白-宿主核酸结合物;扩增经过所述富集的核酸,所述扩增包括利用N6随机引物;对获得的扩增产物进行测序文库构建,以获得所述宏基因组测序文库。
[0013]依据本发明的再一方面,本发明提供一种测序方法,其包括,利用上述宏基因组测序文库构建方法构建宏基因组测序文库,以及对获得的测序文库进行测序。可依据所选择的测序平台进行相应的测序文库构建,例如,可以进行单端测序文库构建、双末端文库构建等,测序可以选择现有平台来进行,包括但不限于Illumina Hiseq2000/2500、LifeTechnologies 1n Torrent、Complete Genomics CGA 和 Roche 454 测序平台。前述对本发明一方面的从混合核酸中获得大量目标核酸的方法的技术特征和优点的描述,同样适用本发明这一方面的测序文库构建方法和测序方法,在此不再赘述。
[0014]依据本发明的另一方面,本发明提供一种鉴定人源宏基因组样本中低丰度菌种的方法,包括:获取所述人源宏基因组样本中的核酸,所述核酸包含来自人的核酸和来自微生物的核酸;富集所述核酸中的来自微生物的核酸,所述富集包括,利用甲基结合域蛋白结合来自人的核酸,去除形成的甲基结合域蛋白-人核酸结合物;扩增经过所述富集的核酸,所述扩增包括利用N6随机引物;对扩增后的核酸进行序列测定,获得测序数据;将所述测序数据与微生物参考序列比对,获得比对结果;依据所述比对结果鉴定所述低丰度菌种。比对可以利用 S0AP(Short OligonucleotideAnalysis Package),bwa,GATK等软件进行,本发明对此不作限制。微生物参考序列指已知的微生物序列,可以是预先获得的微生物基因组或者片段,例如,可以为自己测定组装出的或者从公开数据库能够获取的多种微生物的基因组或者片段的组合。进一步地,根据人源meta样本来源的部位,可能包含的主要菌种或者菌种,可以预先配置包含更多参考序列的序列库,有助于获得更准确的鉴定分析结果。前述对本发明一方面或者任一【具体实施方式】中的从混合核酸中获得大量目标核酸的方法的技术特征和优点的描述,同样适用本发明这一方面的方法。在本发明的一个实施例中,利用本发明的这一方法能够鉴定出人源meta样本中的丰度低至0.4%的菌种。
[0015]本发明的这一方法提供了一种微量人源meta样本中低丰度菌种测序分析策略,即先去除微量人源meta样本中的大部分(可以达90%以上)宿主DNA,再扩增微量metaDNA,使微量meta DNA的总量达到测序文库构建的需求。这一发明方法很好地改善了之前通过增大测序数据量,以提高微量人源宏基因组样本中低丰度菌种的鉴定率的策略,达到了减少测序数据浪费、微量人源宏基因组样本测序分析成本,以及提高微量人源宏基因组样本中低丰度菌种的鉴定率的效果。
【附图说明】
[0016]本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
[0017]图1是本发明的一个实施例中的MDA后的扩增产物的电泳结果图,其中Ml泳道为λ Hind III酶切DNA,I泳道为富集后meta DNA, 2泳道为富集后人DNA,3泳道为阴性对照,M2泳道为标准分子量Maker (D2000),单位bp ;
[0018]图2是本发明的一个实施例中的扩增产物的管家基因检测电泳图,其中M泳道为标准分子量(Maker,单位bp),I泳道为YH标准品,2泳道为富集后meta DNA的全基因组扩增(WGA)产物,3泳道为富集后人源DNA的WGA产物,4泳道为NTC (阴性对照)的WGA产物。
【具体实施方式】
[0019]以下结合对具体样本依据本发明的方法进行目标核酸获取、低丰度菌种鉴定等进行详细的描述及结果展示。下面示例,仅用于解释本发明,而不能理解为对本发明的限制。本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0020]除另有交待,以下实施例中涉及的未特别交待的试剂、序列(接头、标签和引物)、软件及仪器,都是常规市售产品或者公开的,比如购自Illumina公司的hiseq2000测序平台建库相关试剂盒来进行测序文库构建等。
[0021]实施例
[0022](一 )材料准备
[0023]获取微量人源meta样本,获取的是人体皮肤meta样本包含核酸共32ng,浓度为
1.1ng/ μ 10
[0024]( 二)方法可以分以下几个步骤
[0025]1、富集微量的meta核酸
[0026]利用该步去除了 90%以上的人源DNA,使meta DNA的含量大大提高,实现所说的富集微量meta DNA。
[0027]具体的,将MBD2-FC与包被有蛋白A的磁珠结合,用垂直混悬仪室温下结合lOmin,用结合缓冲液洗涤2次,结合缓冲液由1mM Tris, pH7.5,ImM EDTA,0.2% Tween20和300mMNaCl组成,接着以结合缓冲液重悬MBD2-FC-磁珠,与DNA样本结合50min,将反应管置于磁力架上静置至液体澄清,吸取上清即可得到meta DNA。管中的磁珠用蛋白酶K(20mg/ml,2 μ I)和 TE buffer (1mMTris, ImM EDTA,pH8.0)于 75°C 下孵育 20min,将反应管置于磁力架上静置至液体澄清,吸取上清即可得到宿主DNA。对上清液和回溶液进行核酸提取纯化,例如用AMPure XP Bead纯化可得到能进行后续反应的DNA样品。
[0028]对上清液及回溶液中回收的人DNA进行定量,Qubit检测浓度:得到18ul 0.76ng/ul 的 Meta DNA,共 14.4ng ;得到得到 9.5ul 0.749ng/ul 的人源 DNA,共 7.12ng,其他核酸为实验中的损失。
[0029]2、MDA 扩增
[0030]用一组N6随机序引物和Phi29DNA聚合酶对得到的meta DNA和宿主DNA分别进行全基因组扩增,一组 N6 随机引物包括 ATCACG、CGATGT、TTAGGC、TGACCA、ACAGTG、GCCAAT、CAGATC、ACTTGA、GATCAG、TAGCTT、GGCTAC和 CTTGTA。首先,将样品溶解在 TE buffer 中,加入变性溶液进行温和的碱变性,避免变性时发生片段化和损害模板DNA,变性溶液包含0.25mMKOH和0.625 μ M EDTA。然后,用中和缓冲液将样本中和,再和MDA扩增反应液在30°C下孵育,中和缓冲液为 3mol/LNaAc,pH = 5.2,MDA 扩增反应液由 Tris, pH 8.5,1mM MgCl2, 50mMKCl,20mM (NH4)2SO4组成。使用多重置换扩增(MDA)技术,随机引物与变性DNA结合,等温环境下利用Phi29聚合酶进行置换合成反应。每个置换的单链作为模板,与引物结合,扩增生成高产量的DNA。扩增反应:30°C 16h,65°C 3min,维持4°C。
[0031]利用0.6%的琼脂糖电泳对扩增产物检测,检测结果如图1,图中Ml为AHind III酶切DNA、1为富集后meta DNA, 2为富集后人DNA、3为NTC(阴性对照,微生物DNA)、M2为Marker (D2000),从图1可看出全基因组得以扩增或者获得的扩增产物为大片段。利用宿主管家基因对扩增产物进行检测,2%琼脂糖电泳检测扩增结果,结果如图2,图中各个泳道,M为Maker、I为YH(炎黄,来自炎黄项目)标准品、2为富集后meta DNA的全基因组扩增(WGA)产物、3为富集后人源DNA的WGA产物、4为NTC的WGA产物。
[0032]扩增管家基因的引物可采用CN201010619689中的多对管家基因引物,或者市售人管家基因检测试剂盒中的引物。
[0033]从图2可看出,MDA扩增后的宿主DNA的管家基因检测结果显示8条管家基因条带,而MDA扩增富集后的meta DNA的管家基因检测结果显示无管家基因条带,说明富集后的meta DNA中基本不含有宿主DNA,至少在琼脂糖电泳检测灵敏度下不含宿主DNA。经过全基因组扩增后的meta DNA构建小片段文库后用HiSeq测序仪测序,生物信息分析结果显示富集能够去除91%的宿主DNA,降低了人源meta样本对测序数据量的要求,并能够分析得到极低丰度的微生物序列。从该人体皮肤meta样本中,找到了极低丰度的不动杆菌属。人源皮肤样本中不动杆菌属含量很低,含量低于0.5%,之前同一样本相同核酸含量,多次利用目前的研究方法,包括多次建库、增大测序数据量,和/或从大量混合测序数据中去除人DNA数据,结果要么找不到不动杆菌要么找到的不动杆菌少于3种。但是,利用该示例方法,总数据量不到之前的1/10但可以找到了 7种不动杆菌。该示例中,鉴定meta数据中是否包含某一菌属的标准与通常鉴定标准的是一致的,例如,可以基于测序数据中有读段或者有一定比例的读段比对到该菌属的特异参考序列上,来说明该人源meta样本中包含该菌属。以上说明了利用本发明方法能够实现微量人源meta样本的建库测序,能够降低对测序数据量的需求,并能够提高低丰度微生物的检测灵敏度。
【主权项】
1.一种从混合核酸中获得大量目标核酸的方法,所述混合核酸包括目标核酸和非目标核酸,其特征在于,包括以下步骤: 从所述混合核酸中富集所述目标核酸,所述富集包括利用甲基结合域蛋白结合所述非目标核酸,去除形成的甲基结合域蛋白-非目标核酸结合物; 扩增经过所述富集的目标核酸,所述扩增包括利用N6随机引物;其中, 所述大量目标核酸指所述目标核酸的量达到或者超过测序要求的最低核酸量, 所述N6随机引物为由A、T、C和G随机排列组合成的长度为6bp的序列。2.权利要求1的方法,其特征在于,所述混合核酸来自人源meta样本,所述目标核酸为meta核酸。3.权利要求2的方法,其特征在于,所述甲基结合域蛋白结合在磁珠上; 任选的,所述去除是通过磁力实现所述甲基结合域蛋白-非目标核酸结合物与所述目标核酸的分尚。4.权利要求2的方法,其特征在于,所述扩增是多重置换扩增。5.权利要求2的方法,其特征在于,进行所述扩增包括利用多条N6随机引物。6.权利要求2的方法,其特征在于,所述扩增利用的聚合酶为Phi29聚合酶。7.权利要求1-6任一方法,其特征在于,所述最低核酸量为20ng。8.一种构建宏基因组测序文库的方法,其特征在于,包括, 获取宏基因组样本中的核酸,所述核酸包含来自宿主的核酸和来自微生物的核酸;富集所述核酸中的来自微生物的核酸,所述富集包括,利用甲基结合域蛋白结合来自宿主的核酸,去除形成的甲基结合域蛋白-宿主核酸结合物; 扩增经过所述富集的核酸,所述扩增包括利用N6随机引物; 对获得的扩增产物进行测序文库构建,以获得所述宏基因组测序文库。9.一种测序方法,其特征在于,包括, 利用权利要求8的方法构建宏基因组测序文库, 对获得的测序文库进行测序。10.一种鉴定人源宏基因组样本中低丰度菌种的方法,其特征在于,包括, 获取所述人源宏基因组样本中的核酸,所述核酸包含来自人的核酸和来自微生物的核酸; 富集所述核酸中的来自微生物的核酸,所述富集包括,利用甲基结合域蛋白结合来自人的核酸,去除形成的甲基结合域蛋白-人核酸结合物; 扩增经过所述富集的核酸,所述扩增包括利用N6随机引物; 对扩增后的核酸进行序列测定,获得测序数据; 将所述测序数据与微生物参考序列比对,获得比对结果; 依据所述比对结果鉴定所述低丰度菌种; 任选的,所述低丰度菌种包括在所述人源宏基因组样本中的丰度大于0.4%的菌种。
【文档编号】C40B50/06GK105861486SQ201510026998
【公开日】2016年8月17日
【申请日】2015年1月19日
【发明人】韦金池, 王娟
【申请人】深圳华大基因科技服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1