一种基于高通量测序的dna标签文库构建方法

文档序号:3365809阅读:266来源:国知局
专利名称:一种基于高通量测序的dna标签文库构建方法
技术领域
本发明涉及核酸测序技术领域,特别是高通量测序技术领域。另外,本发明还涉及标签技术,以及实现多个样品在同一反应体系中进行构建标签文库的方法。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。
背景技术
Illumina公司提供的Solexa DNA测序平台,可在一个反应中同时加入四种带荧光标记的核苷酸,采用边合成边测序Gequencing BySynthesis,SBS),具有所需样品量少, 高通量,高精确性,拥有简单易操作的自动化平台和功能强大等特点[1-4]。文库构建首先需要将目的片段进行末端修复,在目的片段的3’末端连接A碱基,将3’末端带有“A”碱基的目的片段与DNA接头连接,通过PCR反应将目的片段进行扩增,最后回收含有DNA接头的目的片段文库,见

图1。目的片段文库与测序芯片上面的DNA接头进行杂交,通过桥式PCR 进行扩增后,最后边合成边测序。在每个循环过程里,荧光标记的核苷和聚合酶被加入到单分子阵列中。互补的核苷和核苷酸片断的第一个碱基配对,通过酶加入到引物上。多余的核苷被移走。这样每个单链DNA分子通过互补碱基的配对被延伸,针对每种碱基的特定波长的激光激发结合上的核苷的标记,这个标记会释放出荧光,最后收集到的荧光信号来翻译成碱基序列。目前这种DNA建库方法可以根据需求运用于各种研究领域,如基因组的De Novo测序,基因组重测序、转录组测序和表观基因组测序等。基于上述建库方法illumina公司也推出了 DNA标签(也称为index)建库方法, 如图2所示。在DNA标签建库流程中,PCR过程使用了 3条PCR标签引物,通过PCR导入标签来构建DNA标签文库[5]。专利申请W02005068656A1和W02008093098A2中公开了一种使用标签序列标记核酸样品的来源从而可以将样品进行混合测序的方法,可以通过PCR的过程将特定的核苷酸序列(标签序列)通过PCR导入到文库中,PCR标签引物序列见表1。 这些带有标签的文库可以根据需求进行任意混合,然后通过solexa测序仪器进行测序,最后将数据按标签标签序列进行分类。但是illumina公司提供的标签文库制备的方法存在着一些缺陷第一、目前 illumina公司只提供12个长度为6bp的标签序列,标签的数量较少,随着solexa测序通量的增加,不能对大量样本进行混合测序将是一个巨大的缺陷;第二、目前illumina公司提供的标签建库方法是通过PCR反应将标签序列导入到目的片段文库中,需要3条PCR引物对目的片段进行扩增(两条公用引物和一条PCR标签引物,如表1),而且PCR扩增效率不尚ο在标签混合量少于12个样品的情况下,必须考虑到混合后的标签上的每个碱基位点的GT含量。因为solexa测序过程中,碱基G和T的激发荧光一样,碱基A和C的激发光是一样的,因此必须考虑碱基“GT”含量与碱基“AC”含量的“平衡”,最适碱基“GT”含量为50%,能保证标签识别率最高。因此将标签引物进行优化和改进就十分必要了,不仅能提高文库制备的效率和标签的识别率,也能提高目前DNA样品的测序通量,极大的降低了单个文库的测序费用。表Iillumina公司提供的标签序列及PCR标签引物(indexN PCR引物)序列
权利要求
1.一组DNA标签,所述DNA标签包括如下或由如下组成表2所示DNA标签或与之相差 1个碱基的DNA标签中的至少5个,或至少10个,或至少15个,或至少20个,至少25个,或至少30个,或至少35个,或至少40个,或45个,或至少50个,或至少55个,或全部59个,所述DNA标签优选地至少包括表2所示的59个DNA标签的DNAhdexl DNA Index5, 或 DNA Index6 DNA IndexlO,或 DNAhdexll DNA Indexl5,或 DNA Indexl6 DNA hdex20,或 DNAhdex21 DNA Index25,或 DNA Index26 DNA Index30,或 DNAhdex31 DNA Index35,或 DNA Index36 DNA Index40,或 DNAhdex41 DNA Index45,或 DNA Index46 DNA Index50,或 DNAIndex51 DNA Index55,或 DNA Index55 DNA Index59, 或者他们任何两个或多个的组合。
2.权利要求1所述的DNA标签,其中所述的相差1个碱基包括标签中1个碱基的取代、 添加或删除。
3.权利要求1或2所述的DNA标签用于构建DNA标签文库的用途,其中DNA标签文库的DNA标签接头在3,末端包含所述DNA标签,从而构成各自相对应的DNA标签接头,所述 DNA标签接头优选地用作DNA标签文库的接头。
4.权利要求3所述的用途,其中所述DNA标签插入DNA标签接头中的3’末端中,或通过或不通过连接子连接在DNA接头的3’末端,优选地插入DNA标签接头中的3’末端中;更优选地距离DNA标签接头中的3,末端1个碱基插入DNA标签接头中。
5.通过权利要求1或2所述的DNA标签构建的DNA标签文库。
6.含有权利要求1或2所述的DNA标签的一组DNA标签接头,其中DNA标签文库的DNA 标签接头在3’末端包含权利要求1所述的标签,并且优选地用作接头,所述一组所述DNA 标签接头包括如下或由如下组成表3所示59个DNA标签接头或与其所包含的DNA标签序列相差1个碱基的DNA标签接头中的至少5个,或至少10个,或至少15个,或至少20个, 至少25个,或至少30个,或至少35个,或至少40个,或45个,或至少50个,或至少55个, 或全部59个,所述DNA标签接头优选地至少包括表3所示的59个DNA标签接头中的DNA IndexlF/ R_adapter DNA Index5F/R_adapter, ^; DNAIndex6F/R_adapter DNA IndexlOF/R_ adapter,或 DNAIndexl 1F/R_adapter DNA Index 15F/R_adapter,或 DNAIndexl6F/R_ adapter DNA Index20F/R_adapter,或 DNAIndex21F/R_adapter DNA Index25F/R_ adapter,或 DNAhdex26F/R_adapter DNA Index30F/R_adapter,或 DNAhdex31F/R_ adapter DNA Index35F/R_adapter ,DNAIndex36F/R_adapter DNA Index40F/ R_adapter,或 DNAIndex41F/R_adapter DNA Index45F/R_adapter,或 DNAIndex46F/R_ adapter DNA Index50F/R_adapter,或 DNAIndex51F/R_adapter DNA Index55F/R_ adapter,或 DNAIndex55F/R_adapter DNA Index59F/R_adapter,或者他们任何两个或多个的组合。
7.权利要求6所述的DNA标签接头,其中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
8.权利要求6或7所述的DNA标签接头用于构建DNA标签文库的用途,优选地所述DNA 标签接头用作DNA标签文库的接头。
9.通过权利要求6或7所述的DNA标签接头构建的DNA标签文库。
10.一组PCR标签引物,所述PCR标签引物与权利要求5或6所述的DNA标签接头相对应,所述PCR标签引物包括上游引物PCR1. 0标签引物和下游引物PCR2. 0标签引物,所述PCR1. 0标签引物包括如下或由如下组成表4所示59个PCR1. 0标签引物或与其所包含的DNA标签序列相差1个碱基的PCR1. 0标签引物中的至少5个,或至少10个,或至少15个,或至少20个,至少25个,或至少30个,或至少35个,或至少40个,或45个,或至少50个,或至少55个,或全部59个,所述PCR1.0标签引物优选地至少包括表3所示的59个PCR1.0标签引物中的 PCR1. 0_lndex_lprimer PCR1. 0_Index_5primerr,或 PCR1. 0_Index_6primer PCR1. 0_ Index_10primerr,或 PCR1. 0_lndex_lIprimer PCR1. 0_Index_15primerr,或 PCR1. 0_ Index_16primer PCR1. 0_Index_20primerr, 或 PCR1. 0_Index_2Iprimer PCR1. 0_ Index_25primerr,或 PCR1. 0_Index_26primer PCR1. 0_Index_30primerr,或 PCR1. 0_ Index_3Iprimer PCR1. 0_Index_35primerr, 或 PCR1. 0_Index_36primer PCR1. 0_ Index_40primerr,或 PCR1. 0_lndex 41primer PCRL 0_Index_45primerr,或 PCRL 0_ Index_46primer PCR1. 0_Index_50primerr, 或 PCR1. 0_Index_5Iprimer PCR1. 0_ Index_55primerr,或 PCR1. 0_Index_55primer PCR1. 0_Index_59primerr,或者他们任何两个或多个的组合;所述PCR2. 0标签引物包括如下或由如下组成表5所示59个PCR2. 0标签引物或与其所包含的DNA标签序列相差1个碱基的PCR2. 0标签引物中的至少5个,或至少10个,或至少15个,或至少20个,至少25个,或至少30个,或至少35个,或至少40个,或45个,或至少50个,或至少55个,或全部59个,所述PCR2.0标签引物优选地至少包括表5所示的59个PCR2.0标签引物中的 PCR2. 0_lndex_lprimer PCR2. 0_Index_5primerr,或 PCR2. 0_Index_6primer PCR2. 0_ Index_10primerr,或 PCR2. 0_lndex_lIprimer PCR2. 0_Index_15primerr,或 PCR2. 0_ Index_16primer PCR2. 0_Index_20primerr, 或 PCR2. 0_Index_2Iprimer PCR2. 0_ Index—25primerr,或 PCR2. 0—Index—26primer PCR2. 0_Index_30primerr,或 PCR2. 0_ Index_31primer PCR2. 0_Index_35primerr, 或 PCR2. 0—Index—36primer PCR2. 0_ Index_40primerr,或 PCR2. 0_Index_41primer PCR2. 0_Index_45primerr,或 PCR2. 0_ Index_46primer PCR2. 0_Index_50primerr, 或 PCR2. 0_Index_5Iprimer PCR2. 0_ Index_55primerr,或 PCR2. 0_Index_55primer PCR2. 0_Index_59primerr,或者他们任何两个或多个的组合。
11.权利要求10所述的PCR标签引物,其中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
12.权利要求10或11所述的PCR标签引物用于构建DNA标签文库的用途。
13.通过权利要求10或11所述的PCR标签引物构建的DNA标签文库。
14.一种标签文库的构建方法,所述方法的特征在于使用包含标签的DNA接头来构建标签文库。
15.权利要求14所述的方法,其包括1)提供η个DNA样品,η为整数且1彡η彡59的整数,优选地η为整数且2彡η彡59, 所述DNA样品来自所有真核和原核DNA样品,包括但不限于人DNA样品;2)将人基因组DNA打断,其中打断方法包括但不限于超声波打断方法,优选地使打断后的DNA条带集中在180bp左右;3)末端修复;4)DNA片段3,末端加“A”碱基;5)连接DNA标签接头,其中优选地每一个标签接头连接到DNA片段的两端,;6)将步骤幻得到的连接产物进行凝胶回收纯化,优选地通过2%的琼脂糖胶进行电泳并回收,并将各个DNA样品的回收产物混合在一起;7)PCR反应,使用步骤6)的回收产物的混合物作为模板,在适于扩增目的核酸的条件下进行PCR扩增,将PCR产物进行胶回收纯化,优选地回收280 300bp的目的片段。
16.权利要求14或15所述的方法,其中DNA标签文库的DNA标签接头包括如下或由如下组成表3所示59个DNA标签接头或与其所包含的DNA标签序列相差1个碱基的DNA标签接头中的至少5个,或至少10个,或至少15个,或至少20个,至少25个,或至少30个, 或至少35个,或至少40个,或45个,或至少50个,或至少55个,或全部59个,所述DNA标签接头优选地至少包括表3所示的59个DNA标签接头中的DNA IndexlF/ R_adapter DNA Index5F/R_adapter,或 DNAIndex6F/R_adapter DNA IndexlOF/R_ adapter,或 DNAIndexl1F/R_adapter DNA Index15F/R_adapter,或 DNAIndexl6F/R_ adapter DNA Index20F/R_adapter,或 DNAIndex21F/R_adapter DNA Index25F/R_ adapter,或 DNAhdex26F/R_adapter DNA Index30F/R_adapter,或 DNAhdex31F/R_ adapter DNA Index35F/R_adapter,或 DNAIndex36F/R_adapter DNA Index40F/R_ adapter,或 DNAIndex41F/R_adapter DNA Index45F/R_adapter,或 DNAIndex46F/R_ adapter DNA Index50F/R_adapter,或 DNAIndex51F/R_adapter DNA Index55F/R_ adapter,或 DNAIndex55F/R_adapter DNA Index59F/R_adapter,或者他们任何两个或多个的组合。
17.权利要求16所述的方法,其中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
18.权利要求15所述的方法,其中步骤7)PCR反应中使用的引物是如权利要求10或 11 所述的 PCR Primer 1. 0 和 PCR Primer 2. 0。
19.通过权利要求14或15所述的方法构建的标签文库。
全文摘要
本发明提供了长度为7bp独特的标签序列,可以分别通过接头连接和PCR反应分别将标签序列导入DNA标签文库。本发明基于目前illumina公司的solexa测序平台提供了使用所述标签序列构建DNA标签文库的方法,应用于solexa DNA测序,提高了DNA标签文库的制备的效率,增大了DNA样品的测序通量,降低了单个样品的solexa测序费用。
文档编号C40B40/06GK102409048SQ20101029927
公开日2012年4月11日 申请日期2010年9月21日 优先权日2010年9月21日
发明者于竞, 周妍, 张艳艳, 田方, 章文蔚, 陈海燕, 龚梅花 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1