一种构建杂交测序文库的方法

文档序号:74624阅读:2682来源:国知局
专利名称:一种构建杂交测序文库的方法
技术领域
本发明涉及核酸测序技术领域
,特别是序列捕获技术领域
,特别是基于杂交的序列捕获技术。另外,本发明还涉及标签技术,以及实现多个样品在同一反应体系中进行序列捕获的方法。本发明的方法特别适用于第二代测序技术,尤其是SOlexa测序技术。本发明的方法可用于基因组学研究。
背景技术
以Illumina solexa、AB Solid和Roche妨4为代表的第二代测序技术使测序成本大大降低,在近几年得到快速发展,并成为基因组学研究的重要工具。与链终止法的 Sanger测序技术相比,第二代测序技术采用边合成边测序的技术策略。第二代测序技术最大的特点是高通量,其可对数以亿计的DNA片段同时进行测序,目前一台高通量测序仪一次可产生高达200( 的数据,相当于将一个人的全基因组测序65次。然而这种高通量的测序技术是通过超声波或其他方法将基因组打断成一系列的小片段,并在小片段的两侧加上接头,然后通过接头引物进行桥式PCR或emotion PCR扩增形成测序的基本单位,再根据接头上的部分序列设计公共测序引物,对基因组DNA进行测序。
尽管高通量的测序技术使测序成本大大降低,然而测序一个人的全基因组序列仍需要数万美元,这对于需要对大量样品进行测序的疾病研究等研究项目来说,总测序成本仍然很昂贵,难以大规模推广应用。另一方面,对于研究人类某些疾病的科学家来说,他们并不需要对全基因组进行测序,他们感兴趣的往往只是很小部分的基因组区域,例如全外显子区(相当于的人全基因组大小),如果能选择性地对这些区域进行测序,将使测序总成本显著降低同时也能缩短测序时间。序列捕获技术是一种对基因组特定区域进行选择性富集的技术,其通过合适的方法将感兴趣的区域从基因组中分离出来,然后再对该目标区域进行测序,这对于低成本地有针对性的进行基因组学研究有非常重要的意义。
目前常用的序列捕获方法主要有三种PCR法、分子倒置探针法(Molecular insersion probes,MIP)和杂交法。PCR法具有高灵敏性、高特异性和重复性好等优点。 PCR富集法在第二代测序技术平台也有潜在的应用前景,其适合用于捕获一些很小的区域, 特别是一些连续的区域。对于较大的非连续的区域,如全外显子,该方法需要合成大量的引物、大规模的PCR反应和高强度的劳动力等。因此,PCR序列捕获方法的适用性受到较大的限制。尽管最近报道的微滴PCR(Rair^torm)等PCR技术能在一定程度上缓解上述部分问题,然而实际上这些PCR反应由于在同一反应中使用多种引物,导致大量非特异扩增产物的产生,并且容易出现部分区域无法扩增的情况,此外其扩增的区域大小也有限。
分子倒置探针富集法具有样品前期处理简单、样品需求量极小等优点,然而其需要合成价格较高的分子探针、均一性较差、难以对一些区域较大的基因组序列进行捕获等缺点,限制了该技术在第二代测序平台的应用前景。
基于杂交的序列捕获技术是目前在第二代测序平台中使用较多的序列富集方法, 主要分为芯片杂交和液相杂交两种。芯片杂交序列捕获技术是一种将探针合成在芯片上,并在芯片上进行杂交的高通量序列捕获技术,其可以在一个芯片内捕获整个外显子甚至更大的区域。液相杂交技术是通过将芯片上合成的探针剪切回收之后进行扩增富集而构建用于杂交的目的杂交探针库,液相杂交在动力学上相对固相杂交更具优势,能降低对于样品起始量要求。
芯片杂交技术与液相杂交技术属于高通量的序列捕获技术,对于需要对大量样品进行重测序的项目来说,逐一对样品进行杂交与洗脱需要大量的劳动力与时间,同时也增加了成本和操作错误的风险。为了与第二代测序技术平台联合使用,我们需要实现多个样品在同一反应体系中进行杂交洗脱,同时在测序后又能分辨来源不同的样品,这将使工作量与工作时间大大减少,对减少操作错误的风险也有一定的预防作用。
最近,国外研究人员报道了多个样品混合杂交的方法(专利号W02009106308 ;公开号W02009/106208A2 ;
公开日2009年9月3日),该方法通过连接接头的方法引入代表特定样品的标签序列(共133个标签序列)来区分不同来源的DNA样品。所有标签序列均由11个脱氨核苷酸组成,位于测序引物和DNA样品之间。在构建测序文库时,每个样品接上包括不同标签序列的接头,混合后在MmbleGen芯片杂交系统中进行序列捕获。洗脱后的捕获序列在Roche 454测序平台进行测序,通过测序接头上的标签序列来区分不同来源的样品。
然而,该技术在应用范围和效率等多个方面还存在缺陷
1、其通过接头引入标签序列的方法不利于该技术在Solexa等测序平台的应用 一方面,接头连接后加入的标签序列位于测序引物与样品DNA之间,在测序样品DNA之前必须先测序Ilbp的标签序列,这种用同一测序引物对标签序列和样品DNA进行连续测序的方法在测序长度本来就较短的第二代测序技术平台中使用,无疑会进一步缩短样品DNA的有效测序长度;另一方面,基于接头连接的方法引入标签序列会导致样品DNA的两个末端均带上标签序列,这样在Solexa等测序平台进行双末端测序时会导致标签序列被测序两次, 造成测序数据的浪费。
2、该技术没有使用接头的blocks (也称为封闭序列),这会导致样品在杂交时, 由于接头互补序列之间的退火,使样品DNA与探针的结合效率降低,影响序列捕获效果,同时,没有任何关联的样品DNA可能由于接头之间的退火而相连,并级联放大形成“大分子 DNA",当探针与靶DNA退火结合后,同时也会把与靶DNA相连的其他非靶DNA —起捕获下来,造成捕获序列中存在大量的非靶序列。
3、由于该技术主要针对芯片杂交进行优化,而在液相系统中使用时,由于样品DNA 起始量较小,它们通过接头连接在一起后,可能对序列捕获效果产生较大影响,同时也可能捕获大量非靶序列。因此,该技术方案在Agilent液相杂交平台的序列捕获效果可能会较差。
4、该技术采用连接带有标签序列接头方式进行文库制备,对于起始量要求较高, 不利于大规模推广用于疾病研究领域。

发明内容
本发明设计了长度为8bp的一段核酸序列,作为标签(也称为index)序列(如表 1所示),用于对不同的样品进行标记。标记后的不同来源样品可以在同一杂交系统中进行序列捕获,捕获的序列在洗脱后通过测序其上的标签序列,即可确定该序列的样品来源。设计的任意两个标签序列之间至少有3个碱基的差异,这种设计使我们可以在测序后对偶然出现的标签序列测序错误有一定的校正功能(能对标签序列中一个碱基的测序错误进行发现与校正)。设计的标签序列不包括与测序引物3’末端有较高相似性的序列和一些包含3个以上连续相同碱基的序列。本发明通过PCR方法为样品引入标签序列,该方法简单有效,同时大大减少了对于样品起始量要求。
本发明设计并合成了 2条接头的blocks序列,分别命名为blockl和block2(如表2中所示),用于接头序列的封闭。这些blocks只封闭DNA单链5’端的接头序列,其中 blockl封闭测序芯片接头P5及测序引物I(SPl)区,block2封闭测序引物2(SP2)区、标签区和测序芯片接头P7区。blockl对所有样品都是一样的,所以叫做公用block ;block2 是针对不同的标签序列设计的,所以在进行杂交时要为含不同标签序列的样品加入相应的 block20
本发明目的在于实现多个样品在同一反应体系中进行序列捕获,该技术方案包括从样品基因组DNA起始到测序结果输出全部实验流程。技术方案主要由以下三部分组成 文库构建、杂交、测序与数据分析。
文库构建将样品基因组DNA通过包括但不限于超声波打断法打断成200 250bp大小的片段,通过末端修复、加“A”碱基、连接等过程为DNA片段加上接头,然后通过 PCR方法在不同来源的基因组文库样品DNA的接头末端引入8bp的标签序列,使每个基因组 DNA文库均带上含特定序列的标签。其中标签序列可以位于接头序列末端。PCR产物纯化后即完成文库的构建与不同来源样品DNA的标记。
杂交将上一步纯化获得的需要杂交的样品(是否就是上步纯化的PCR产物) 按一定比例(混合比例可根据预计需要数据量确定,例如,如需要数据量均为20X测序深度,则取等量样品进行混合)混合,在95°C变性10分钟后在NimbleGen芯片杂交平台或 Agilent液相杂交平台进行杂交,同时在杂交体系中加入接头的blockl和block2以及重复序列block(Cot-IDNA)。Cot-IDNA是基因组中重复比例较高的一部分DNA片段,在杂交时使用能帮助提高杂交效率,Cot-IDNA可得自商品化的产品Human Cot-I DNA (invitrogen),可参考革文新,万大方,赵新泰,蒋惠秋,顾健人.人cot-lDNA的制备[J], 《肿瘤》1998年5月(第18卷第3期)(127)。待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到来自不同样品捕获后的序列混合物。
测序与数据分析将捕获的序列在Solexa或其他测序平台(需要在构建文库时加入相应的接头(比如对于SOLiD测序平台,使用该测序平台提供的短片段文库构建接头) 采用边合成边测序的方法进行序列测定。先用测序引物I(SPl)对样品DNA的一端测序,再用测序引物3(SP;3)对标签序列测序,最后用测序引物2 (SP》对样品DNA的另一端进行测序(SP1,SP2,SP3均来自IIlumina商业测序试剂盒)。对用SP3测序引物测序得到的数据进行分析可知其上的标签序列,根据此标签序列确定其对应的样品DNA的来源。
发明的有益效果
本发明的提供的方法中,技术方案采用PCR方法引入特定的标签序列,标签序列引入效率显著提高。该方法可保证只在其中一个接头末端引入标签序列,避免了两次对标签序列进行测序造成的数据浪费,而且能通过PCR方法减少对于样品起始量要求.[0022]本发明的提供的方法中,标签序列与样品DNA序列的测序采用不同的测序引物, 分次进行测序,避免了由于对标签序列测序而导致样品DNA有效测序长度的降低。
本发明所提供的方法采用了 8个碱基的标签序列,其中任意两个标签序列之间至少有3个碱基的差异,这种设计可在一定程度上防止样品标签序列由于测序错误(可对标签序列中一个碱基的测序错误进行发现与校正)而引起样品弄混,因此在数据分析时具有一定的校正功能。
本发明所提供的方法中引入了接头引物的blocks。这些blocks可封闭接头序列, 避免样品DNA由于接头退火连在一起而影响捕获效率和导致非特异序列捕获。
本发明所提供的方法中,标签序列与样品DNA序列的测序采用不同的测序引物, 分次进行测序,避免了由于对标签序列测序而导致样品DNA有效测序长度的降低。
本发明所提供的blocks只封闭单链DNA 5’末端的接头区域,而不封闭其3’末端区域,在保证接头区域有效封闭的同时,又避免了捕获的序列在洗脱后可能残留的blocks 在PCR反应中作为引物扩增而导致样品标签序列弄混和样品标签序列丢失。
本发明所提供的方法在NimbleGen芯片杂交系统、Agilent液相杂交系统和 NimbleGen EZ液相杂交系统中均适用,在相同或接近的测序深度(每个碱基被测序次数) 时作为衡量序列捕获效果的目标区域覆盖度和序列捕获特异性指标在单个样品杂交或者多个样品杂交时结果一致。
本发明所提供的方法在构建杂交测序文库时,只需要更换为所使用测序平台提供的对应接头引物序列,即可适用于Roche 4 和ABSOLiD等其他的第二代测序平台,有较广的应用前景。


图1 实验流程图。本发明的技术方案包括从DNA起始到数据输出整套实验流程, 在保证序列捕获效率的同时,可实现不同样品在同一反应体系中同时进行序列捕获。
图2 构建完成的含特定标签序列的样品DNA文库示意图。其中标签序列通过PCR 方法引入。
图3 接头Blocks杂交封闭示意图。Blocks只封闭单链DNA 5,末端的接头。
图 4 单个样品杂交(Pooling-l,Pooling-3,Pooling-4,Pooling-5,Pooling-ll, Pooling-12)和两个样品混合后杂交(Pooling-31,Pooling-32,Pooling-33, Pooling-34, Pooling-35, Pooling-36),在Nimblegen液相杂交系统杂交的捕获效率。其中,横坐标 depth表示测序深度,纵坐标coverage )表示捕获效率。
图 5 单个样品杂交(Pooling-l,Pooling-3,Pooling-4,Pooling-5,Pooling-ll, Pooling-12)和两个样品混合后杂交(Pooling-31,Pooling-32,Pooling-33, Pooling-34, Pooling-35, Pooling-36),在Nimblegen液相杂交系统杂交后测序,数据比对至目标区域的比例统计结果。其中横坐标pooling表示样品编号,纵坐标Percent(W)表示数据比对至目标区域的比例。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。
本发明一方面提供了一组标签,所述一组标签包括如下或由如下组成表3所示 159个标签或与之相差一个碱基的标签中的至少10个,或至少20个,或至少30个,或至少 40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少 110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部159个,
所述一组标签优选地至少包括表3所示的159个标签中的hdex—Newl-lO, 或 Index_Newll-20, Index_New21-30,或 Index_New31-40, Index_New41-50,或 Index_ New51-60, Index_New61_70,或 Index_New71_80, Index_New81_90,或 Index_New91-100, Index_Newl01-110,或 Index_Newl11-120, Index_Newl21_130,或 Index_Newl31_140, Index_Newl41-150,或hdex_Newl51_159,或者他们任何两个或多个的组合。
在本发明的一个具体实施方式
中,所述“相差一个碱基的标签”的表述中,相差一个碱基包括标签序列中1个碱基的取代、添加或缺失。
本发明另一方提供了所述标签用于构建的基因组文库,以及进行序列捕获和/或测序的用途,其中所述标签包含在用于扩增目的序列的PCR引物中,从而构成各自相对应的PCR标签引物,其中使用所述PCR标签弓I物和如表2所示的引物PE Primer 1. 0通过PCR 方法为基因组文库引入标签序列。优选地,所述PCR标签引物是3’引物,引物PEft~imer 1.0 是5’引物。
本发明进一步提供了使用所述标签构建的基因组文库。
本发明一方面提供了含有上述标签的一组PCR标签引物,其中所述PCR标签引物包含所述标签,并且优选地用作PCR的3’引物,所述一组PCR标签引物包括如下或由如下组成表1所示159个PCR标签引物或与其中包含的标签相差一个碱基的PCR标签引物中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70 个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部159个,
所述一组标签优选地至少包括表1所示的159个PCR标签引物中的 Newl-IOPrimer, 或 Index_Newll_20Primer, Index_New21_30Primer, 或 Index_ New31-40Primer, Index_New41_50Primer, 或 Index_New5l_60Primer, Index_ New61-70Primer, 或 Index_New71_80Primer, Index_New81_90Primer, 或 Index_ New91-1OPrimerOPrimer, Index_NewlOPrimer1-1IOPrimer,或 Index_Newl1l-120Primer, Index_Newl21-130Primer,或 Index_Newl31-140Primer, Index_Newl41-150Primer,或 hdex_Newl51-159Primer,或者他们任何两个或多个的组合。
在本发明的一个具体实施方式
中,“与其中包含的标签相差一个碱基的PCR标签引物”的表述中,所述相差一个碱基包括对表3所示的159个标签定序列中1个碱基的取代、 添加或缺失。
本发明另一方面提供了所述PCR标签引物用于构建的基因组文库,以及进行序列捕获和/或测序的用途,其中使用所述PCR标签引物和如表2所示的引物PE Primer 1.0 通过PCR方法为基因组文库引入标签序列。优选地,所述PCR标签引物是3’引物,引物PE Primer 1. 0 是 5,引物。
本发明进一步提供了使用所述PCR标签引物构建的基因组文库,其中使用所述PCR标签引物和如表2所示的引物PE Primer 1. 0通过PCR方法进行构建。优选地,所述 PCR标签引物是3,引物,引物PEI^rimer 1.0是5,引物。
本发明另一方面提供了接头封闭序列,其如表2中blockl和block2所示的序列或与其相差一个碱基的序列,其中block2中的NNNNNNNN如表4中所示的block序列或与其相差一个碱基。
在本发明的一个具体实施方式
中,“关于接头封闭序列的上下文中,所述相差一个碱基包括序列中1个碱基的取代、添加或缺失。
本发明另一方面提供了所述接头封闭序列用于封闭接头序列的用途,在进行杂交时要为含不同标签序列的每个样品加入相应的block。
在本发明的一个具体实施方式
中,所述杂交在包括但不限于如下杂交系统的中进行=NimbleGen芯片杂交系统、Agilent液相杂交系统和NimbleGen EZ液相杂交系统。
本发明进一步提供了使用所述接头封闭序列构建的基因组文库。
本发明另一方面提供了一种构建基因组文库的方法,所述方法的特征在于使用上文所述PCR标签引物,和/或使用上文所述接头封闭序列。
本发明另一方面提供了一种构建基因组文库的方法,其包括
文库构建将样品基因组DNA通过包括但不限于超声波打断法打断成优选为 200 250bp大小的片段,通过末端修复、加“A”碱基、接头连接等过程为DNA片段加上特定接头,然后通过PCR方法使用上文所述PCR标签引物和如表2所示的引物PE Primer 1.0 对不同来源的基因组文库样品DNA进行扩增,优选地所述PCR标签引物是3’引物,引物PE Primer 1. 0是5’引物,使每个基因组DNA文库均带上含特定序列的标签,其中所引入的标签序列可以位于接头序列末端;然后对PCR产物进行纯化;其中所述特定接头包括但不限于以下步骤所使用测序平台所提供的接头。
杂交经纯化的PCR产物作为杂交文库按一定比例(根据各样品所需要的数据量确定)混合,在95°C变性10分钟后在NimbleGen芯片杂交平台或Agilent液相杂交平台进行杂交,同时在杂交体系中加入接头的blockl和block2以及重复序列block(Cot-IDNA); 待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到来自不同样品捕获后的序列混合物。所述重复序列block(Cot-IDNA)是基因组上重复比例较高的一些序列,用于提交杂交效率。
本发明进一步提供了通过上文所述的方法构建的文库或文库混合物。
本发明另一方面提供了一种测序的方法,所述方法的特征在于使用上文所述的 PCR标签引物,和/或使用上文所述的接头封闭序列。
在本发明的另一方面中,使用通过上文所述的方法构建的文库或文库混合物进行测序。文库测序可采用任何方法,例如双脱氧链终止法。然而,优选高通量测序方法 如第二代测序技术(Metzker ML. Sequencing technologies-the next generation. Nat Rev Genet. 2010Jan ;11(1) :31-46),包括 S0LEXA、SOLID 和 454 (焦磷酸测序)测序技术 (平台)。或者是单分子测序技术(单分子测序平台),包括Helicos公司的True Single Molecule DNA sequencing 技术,Pacific Biosciences 公司的 the single molecule, real-time (SMRT. TM.)技术,以及 Oxford Nanopore ^Technologies 公司的纳米孔测序技术等(Rusk,Nicole (2009-04-01) · CheapThird-Generation Sequencing. Nature Methods6(4) :244-245) ο
本发明另一方面提供了一种测序的方法,其包括
测序与数据分析将捕获的序列在Solexa或其他测序平台(需要在构建文库时加入相应的接头)釆用边合成边测序的方法进行序列测定。具体而言,先用测序引物I(SPl) 对样品DNA的一端测序,再用测序引物3 (SP:3)对标签序列测序,最后用测序引物2 (SP2)对样品DNA的另一端进行测序(Illmnina测序试剂盒中商业测序引物)。对用SP3测序引物测序得到的数据进行分析可知其上的标签序列,根据此标签序列确定其对应的样品DNA的来源。
在本发明的一个具体实施方式
中,所述的方法中,标签序列与样品DNA序列的测序釆用不同的测序引物,分次完成两端测序以及中间标签序列测序。
在本发明的一个具体实施方式
中,所述的方法适用于Roche 4 和AB Solid等其他的第二代测序平台。
表1,PCR标签引物列表(Index_NewN Primer),其中N为1-159的整数。[0062]
权利要求
1.一组标签,所述一组标签包括如下或由如下组成表3所示159个标签或与之相差一个碱基的标签中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个, 或至少130个,或至少140个,或至少150个,或全部159个,所述一组标签优选地至少包括表3所示的159个标签中的hdex_Newl-10,或hdex_ Newl1-20, Index_New21-30,或 Index_New31_40, Index_New41_50,或 Index_New51_60, Index_New61-70,或 Index_New71-80, Index_New81-90,或 Index_New91-100, Index_ NewlOl-I10,或 Index_Newl11-120, Index_Newl21_130,或 Index_Newl31_140, Index_ Newl41-150,或hdex_Newl51_159,或者他们任何两个或多个的组合。
2.权利要求
1所述的标签,其中所述相差一个碱基包括标签序列中1个碱基的取代、添加或缺失。
3.权利要求
1所述的标签用于构建基因组文库的用途,其中所述标签包含在用于扩增目的序列的PCR引物中,从而构成各自相对应的PCR标签引物,其中使用所述PCR标签引物和如表2所示的引物PEft~imer 1. 0通过PCR方法为基因组文库引入标签序列,优选地所述 PCR标签引物是3’引物,引物PE Primer 1.0是5,引物。
4.使用权利要求
1或2所述的标签构建的基因组文库。
5.含有权利要求
1所述的标签的一组PCR标签引物,其中所述PCR标签引物包含权利要求
1所述的标签,并且优选地用作PCR的3’引物,所述一组PCR标签引物包括如下或由如下组成表1所示159个PCR标签引物或与其中包含的标签相差一个碱基的PCR标签引物中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130 个,或至少140个,或至少150个,或全部172个,所述一组标签优选地至少包括表1所示的159个PCR标签引物中的hdet Newl-IOPrimer, 或 Index_Newll_20Primer, Index_New21_30Primer, 或 Index_ New3l-40Primer, Index_New4l-50Primer, 或 Index_New5l_60Primer, Index_ New61-70Primer, 或 Index_New71_80Primer, Index_New81_90Primer, 或 Index_ New91-1OPrimerOPrimer, Index_NewlOPrimer1-1IOPrimer,或 Index_Newl1l-120Primer, Index_Newl21-130Primer,或 Index_Newl31-140Primer, Index_Newl41-150Primer,或 hdex_Newl51-159Primer,或者他们任何两个或多个的组合。
6.权利要求
5所述的PCR标签引物,其中所述相差一个碱基包括对表3所示的159个标签定序列中1个碱基的取代、添加或缺失。
7.权利要求
4或5所述的PCR标签引物用于进行构建基因组文库的用途,其中使用所述PCR标签引物和如表2所示的引物PE Primer 1. 0通过PCR方法为基因组文库引入标签序列,优选地所述PCR标签引物是3,引物,引物PE Primer 1. 0是5,引物。
8.使用权利要求
5或6所述的PCR标签引物构建的基因组文库,其中使用所述PCR标签引物和如表2所示的引物PE Primer 1. 0通过PCR方法进行构建,优选地所述PCR标签引物是3,引物,引物PE Primer 1.0是5,引物。
9.接头封闭序列,其如表2中blockl和block2所示的序列或与其相差一个碱基的序列,其中block2中的NNNNNNNN如表4中所示的block序列或与其相差一个碱基。
10.权利要求
9所述的接头封闭序列,所述相差一个碱基包括序列中1个碱基的取代、 添加或缺失。
11.权利要求
9或10所述的接头封闭序列用于封闭接头序列的用途,在进行杂交时要为含不同标签序列的每个样品加入相应的block。
12.权利要求
11所述的用途,其中所述杂交在包括但不限于如下杂交系统的中进行 NimbleGen芯片杂交系统、Agilent液相杂交系统和NimbleGen EZ液相杂交系统。
13.使用权利要求
9或10所述的接头封闭序列构建的基因组文库。
14.一种构建基因组文库的方法,所述方法的特征在于使用5或6所述的PCR标签引物,和/或使用权利要求
9或10所述的接头封闭序列。
15.权利要求
14所述的方法,其包括文库构建将样品基因组DNA通过包括但不限于超声波打断法打断成优选为200 250bp大小的片段,通过末端修复、加“A”碱基、接头连接过程为DNA片段加上接头,然后通过PCR方法使用权利要求
5或6所述PCR标签引物和如表2所示的引物PE Primer 1.0 对不同来源的基因组文库样品DNA进行扩增,优选地所述PCR标签引物是3’引物,引物PE Primer 1.0是5’引物,使每个基因组DNA文库均带上含特定序列的标签,其中所引入的标签序列可以位于接头序列末端;然后对PCR产物进行纯化;杂交经纯化的PCR产物作为杂交文库按优选地根据各样品所需要的数据量确定的一定比例混合,在95°C变性10分钟后在NimbleGen芯片杂交平台或Agilent液相杂交平台进行杂交,同时在杂交体系中加入接头的blockl和block2以及重复序列block(Cot-IDNA); 待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到来自不同样品捕获后的序列混合物。
16.通过权利要求
14或15所述的方法构建的文库或文库混合物。
专利摘要
本发明提供了用于核酸测序,特别是序列捕获技术的标签,以及采用PCR方法引入所述标签的方法。本发明还提供了用于封闭接头的接头封闭序列,及其在NimbleGen芯片杂交系统、Agilent液相杂交系统和NimbleGen EZ液相杂交系统中的用途。本发明进一步还提供了使用上述标签和/或接头封闭序列用于构建文库和/或测序的方法,以及通过所述方法构建的文库。
文档编号C12N15/11GKCN102409047SQ201010299269
公开日2012年4月11日 申请日期2010年9月21日
发明者刘晓, 吴仁花, 吴明枝, 欧阳伟汉, 武靖华, 蒋慧, 赵美茹 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1