有利于高通量基因序列标签测序的dna粘端接头与应用的制作方法

文档序号:564054阅读:360来源:国知局

专利名称::有利于高通量基因序列标签测序的dna粘端接头与应用的制作方法
技术领域
:本发明涉及一种DNA接头,特别是涉及一种有利于高通量基因序列标签测序的DNA粘端接头与应用。
背景技术
:新一代的高通量测序技术平台包括罗氏454公司的GenomeSequencer系统,Illumina公司的Solexa系统,以及AppliedBiosystems公司的S0LiD系统。与传统的Sanger测序方法相比,新一代测序技术平台不仅测序通量大大提高,测序成本显著降低,并且无需进行繁琐的常规建库、克隆等过程,省时省力。因此,自2005年商业化的新一代高通量测序仪首次推出以来,已广泛应用于基因组学、转录组学等生命科学领域的研究。上述的三种新一代高通量测序技术平台中,罗氏454公司的GenomeSequencerFLX系统的单个序列可读取长度最长,可达500个碱基以上,而其他两种技术平台目前的测序长度均小于100个碱基。目前,该系统已被世界上几乎所有从事基因组测序和相关结构功能研究的顶级实验室配备使用,对大规模基因序列的研究和应用产生了巨大的推动作用。应用GenomeSequencerFLX系统进行高通量测序,一般步骤为长度约300-800bp的待测样品DNA片段,与特异的DNA接头(由罗氏公司的GSFLXStandardDNALibraryPreparationKit提供)相连接,经过emPCR对DNA平行扩增后进行测序。Kit中提供的特异DNA接头在后续的纯化、扩增、富集和测序等步骤中起着重要作用。但是,这种特异DNA接头是一种平端接头,只能与平端的样品DNA片段相连接。虽然所有的样品DNA片段均可通过现有的分子生物学技术被补平或切平而成为平端,但这样不仅增加了实验步骤,导致本已有限的样品DNA片段在实验中的损失加大;更重要的是,在某些情况下,特别是在基因序列标签的测序中,通过补平或切平的方法将粘端DNA片段转化为平端,可能会损失其粘性末端所携带的信息,使测序的效率降低。由此,需要设计一种能够应用于GenomeSequencerFLX高通量测序系统的、具有粘性末端的DNA接头,该接头可以与粘端的样品DNA直接进行连接,然后进行后续的emPCR等高通量测序步骤,而不需要将粘端DNA片段转化为平端,以简化实验步骤,并保护粘性末端所携带的信息,提高测序效率。
发明内容本发明所要解决的技术问题是提供一种有利于高通量基因序列标签测序的DNA粘端接头与应用,由于该潔A接头是一种具有粘性末端的DNA接头,可与具有与之相匹配的末端突出的粘端DNA片段直接进行连接,用于高通量基因序列标签测序,以提高对粘性末端DNA片段的测序效率。为解决上述技术问题,本发明的有利于高通量基因序列标签测序的DNA粘端接头,是一种末端突出的DNA接头,带有可识别序列Xn、Yn,其序列式为序列(I)和序列(II),5,-CCATCTCATCCCTGCGTGTCCCATCTGTTCCCTCCCTGTCTCAGXndm-3,正义链5,-YnCTGAGACAGGGAGGGAACAGATGGGACACGCAGGGATGAG-3,反义链(I)5'-Biotin-CCTATCCCCTGTGTGCCTTGCCTATCCCCTGTTGCGTGTCTCAGXndm-3,正义链5'-YnCTGAGACACGCAACAGGGGATAGGCAAGGCACACAGGGGA-3,反义链(n)其中,X表示A、T、G、C四种碱基中的任意一种,n为4-10之间的任意整数,任意两个相邻的X不能是相同的碱基,Y是与X—一对应的互补碱基,dm是末端突出标志,d表示A、T、G、C四种碱基中的任意一种,m为l-4之间的任意整数,如dm可以是CATG。本发明的一种有利于高通量基因序列标签测序的DNA粘端接头的应用在于采用DNA粘端接头用于高通量基因序列标签测序,该测序方法的具体步骤包括(1)取长度在300-800bp的末端突出的样品DNA片段;(2)在DNA连接酶的作用下,样品DNA片段与DNA粘端接头相连接;(3)用QiaquickPCR纯化试剂盒纯化连接有接头的DNA片段;(4)通过电泳分离并回收大小在300-800bp的连接有接头的DNA片段;(5)再按照常规高通量测序的后续步骤进行测序。采用本发明的DNA粘端接头,能同时进行多个样品的高通量测序,并且样品DNA来源不限,也可以是由RNA经反转录得到的DNA,其中,在基因序列标签的测序中,具有以下优点1)简化实验步骤4在基因序列标签的测序中,使用本发明中的末端突出的DNA接头,可以省略四个实验步骤(对比图1和图2),不仅节省了时间,而且由于DNA片段每经过一次纯化就会损失一部分,省略了两次纯化步骤,可以减少DNA片段在实验过程中的损失;2)提高测序效率在基因序列标签的测序中,识别所测序列中的一组基因标签是依靠该组标签两端的CATG四个碱基的标志,如果任意一端的CATG四个碱基缺失,那么将不能识别该组基因标签。使用平端DNA接头的测序结果为ATTATGAACTTGCCACAGAAGCTGTGTTTTGAA^ATGl7T7MgrgC7TCC7T6Mggrgg7Tgg6Mgg(XrOJCATG[rCGGATATCAAGCCTAGTAGCTGGG。由于序列原本带有的5,端突出的CATG标志在T4DNA聚合酶、大肠杆菌DNA聚合酶作用下被切除而转变为平端,所以在测序结果中缺失,导致第一组的基因标签由于缺少了一端的CATG标志而无法被识别。这样,在长度为100bp的序列中,能够得到的基因标签只有一组(用斜体字表示)。使用本发明中的粘端DNA接头的测序结果为^g^^6tr腐(扁6m^藩掘c腐(;n7^^^m^a:扁6T7^7mn6CT6t^W7rg77|CATG|CACAGTTCACAATAGG。使用粘端DNA接头可以有效地保护序列5'端突出的CATG标志,使第一组基因标签能够被识别。这样在长度为100bp的序列中,能够得到的基因标签有两组(用斜体字表示)。ACTG(即本发明中的Xn)是粘端DNA接头的特异性标记,通过对其碱基组成和长度的改变,可以用于区分不同的接头。不同的样品DNA与带有各自特异性标记的不同的接头相连接,从而实现在高通量测序同时检测多个不同样品。下面结合附图与具体实施方式对本发明作进一步详细的说明图l是高通量基因序列标签测序中,使用平端DNA接头的常规实验步骤流程图;图2是高通量基因序列标签测序中,使用本发明中的末端突出的DNA接头的实验步骤流程图。具体实施例方式以下实施例中的DNA粘端接头是人工合成序列,由宝生物工程(大连)有限公司合成,且实施例1-4中的接头序列I、II只有在Xn处及相应的Yn处有所不同,其它接头序列部分相同。实施例1在转录组SAGE(SerialAnalysisofGeneExpression)基因序列标签高通量测序中的应用步骤一、长度约300-800bp的末端突出的基因表达标签的制备A.在0.5ml试管中,依次加入人体肝癌组织的新鲜RNA20叫,500吗biotin标记的oligodT磁珠,5XFirstStrandBuffer18nl,RNaseOUTl|al,DEPCWater54.5^1,0.1MDTT9.0^1,dNTPMix(10mMeach)4.5pl。轻轻混匀管内成分,置于37°C温育2分钟后再加入3^1SuperscriptIIReverseTranscriptase(200U/V1),混匀后置于42。C温育1小时,反应结束后立即将反应物置于冰上放置2分钟。反应产物为第一链cDNA。B.上述反应管内依次加入DEPCWater465^1,5XSecondStrandBuffer150^1,dNTPMix(10mMeach)15pl,E.coliDNALigase(10U/^il)5|al,E.coliDNAPolymerase(10U/pl)20nl,E.coliRNaseH(2U/^il)5^1。轻轻混匀管内成分,于16。C反应2小时,获得双链cDNA。C.移去反应管内的上清,保留管内磁珠,并用172^1LoTE(3mMTris-HCl,pH7.5;0.2mMEDTA,pH7.5)重悬磁珠。向管内依次加入100XBSA2(il,10XBuffer20nl,NlaIII(10UAil)6^1。轻轻混匀管内成分,置于37。C温育1小时。NlaIII是一种识别4碱基位点的锚定酶,理论上在每一个转录本上至少有一个酶切位点,因此每一个双链DNA分子均可以被该酶切割而获得3'端cDNA。D.移去反应管内的上清,保留管内磁珠,并将磁珠等分于2个新的反应管内。向第一个反应管内依次加入AdaptorA(40ng/nl)l.5nl,LoTE14|al,10XLigaseBuffer2pl,T4DNAligase(5U/V1)2.5^1。向第二个反应管内依次加入AdaptorB(40ng/|al)1.5|xl,LoTE14(U,10XLigaseBuffer2|al,T4DNAligase(5U/jxl)2.5^1。轻轻混匀管内成分,于16。C反应2小时。AdaptorA和B的序列如下AdaptorA:5'TTTGGATTTGCTGGTGCAGTACAACTAGGCTTAATAGGGACATG3'63,amino(C7)CCTAAACGACCACGTCATGTTGATCCGAATTATCCCTP045,AdaptorB:5,TTTCTGCTCGAATTCAAGCTTCTAACGATGTACGGGGACATG3,3,amino(C7)GACGAGCTTAAGTTCGAAGATTGCTACATC-CCCCTP045,E.移去上述2个反应管内的上清,保留管内磁珠,依次向2个反应管内加入LoTE174pl,10XBuffer20nl,100XBSA(10mg/ml)4fU,BsmFI(2U/fU)2^1。轻轻混匀管内成分,置于65。C温育1小时。反应结束后,将2个反应管内的上清分别转移到2个新的反应管内。F.向上述含有上清的2个新的反应管内加入与上清等体积的酚/氯仿,充分混匀后室温下离心(13,000rpm)5分钟。将上清分别转移到2个新的反应管,依次加入133pl乙酸铵,3|almusselglycogen(20mg/ml),lml100%乙醇。混匀管内成分,放置于干冰上20分钟,4。C离心(13,000rpm)40分钟。弃上清,将沉淀用lml70%乙醇洗2遍,最终溶解于10nlLoTE中。G.向上述2个含有10plLoTE的反应管中依次加入10XKlenowBuffer5.0pl,100XBSAl.O^il,dNTPMix(10mMeach)2.5^1,DEPCWater30.5^1,Kle丽Polymerase(9U/V1)l.Onl。轻轻混匀管内成分,置于37。C温育30分钟。H.反应结束后,将2管内的反应液混合,加入100^ULoTE,混匀后再加入200pl酚/氯仿,充分混匀后室温下离心(13,000rpm)5分钟。将上清转移到新的反应管,依次加入133pl乙酸铵,3jxlmusselglycogen(20mg/ml),lml100%乙醇。混匀管内成分,放置于干冰上20分钟,4。C离心(13,000rpm)40分钟。弃上清,将沉淀用lml70%乙醇洗2遍,最终溶解于1.5plLoTE中。I.配制连接混合物3mMTris-HCl(pH7.5)1.25pl,10XLigaseBuffer0.75pl,ddH200.75pl,T4丽ALigase(5U/V1)1^1。取1.5^1连接混合物加入上一步骤的1.5^1LoTE中,混合均匀,放置于16。C连接反应16小时。连接反应产物即为含有一组两端分别含有接头A和B的2个基因序列标签的、长约100个碱基的Ditag(双标签)。J.向上述连接反应物中加入600ialLoTE后混匀,取lplDitag作为PCR模板,并依次加入10XBuffer5pl,DMS03|al,dNTPs(10mMeach)7.5|al,引物_1(175ng/pl)2|^1,引物-2(175ng/Vl)2^1,ddH2029nl,TaqDNApolymerase(511/^1)0.5^1。共配置400份PCR反应液,按照如下热循环参数进行PCR反应95。C2分钟,1个循环;95°C30秒、55°C1分钟、70°C1分钟,共27个循环;70°C5分钟,1个循环。引物-1和引物-2的序列如下,引物-l:5'-GGATTTGCTGGTGCAGTACA-3';引物-2:5'-CTGCTCGAATTCAAGCTTCT-3'。K.将PCR产物进行12%聚丙烯酰胺凝胶分离纯化,回收100bp的Ditag,回收产物溶解于42(alLoTE,并加入10XBuffer15pl,100XBSA2|al,NlaIII12pl,ddH2079nl。轻轻混匀管内成分,置于37°C温育2小时。将反应物进行12%聚丙烯酰胺凝胶分离纯化,回收26bp的Ditag,回收产物溶解于8.75|alLoTE中。26bp的Ditag是一组仅含有2个基因序列标签、而去除了接头A和B的Ditag。L.向上述8.75^1LoTE中加入T4DNALigase(5U/pl)1.25pl,混匀后置于16°C反应2小时。反应结束后,将连接反应产物进行8%聚丙烯酰胺凝胶分离纯化,回收长度约300-800bp的DNA片段。回收产物溶解于10plLoTE中,即获得了粘性末端(5'突出末端为CATG)的样品DNA片段,系由多个26bp的Ditag组成的基因表达标签串联体。步骤二、接头I和II与样品丽A的连接M.向步骤L中的溶解于10plLoTE中的DNA片段中依次加入40nM接头I1^1,40一接头IIl)dl,10XLigaseBuffer1^1,ddH206pl,T4DNALigase(5U/|al)1^1。混匀管内成分,置于16。C反应30分钟。然后依次加入10XBuffer4^1,dNTPs(10mMeach)lpl,ddH2011.5)^1,Bstpolymerase(8U/nl)lpl,混匀管内成分,置于65°C反应30分钟。接头I和接头II的序列如下(I)5,-CCATCTCATCCCTGCGTGTCCCATCTGTTCCCTCCCTGTCTCAGXnlCAT(f3,正义链5,-YnCTGAGACAGGGAGGGAACAGATGGGACACGCAGGGATGAG-3,反义链(II)5,-Biotin-CCTATCCCCTGTGTGCCTTGCCTATCCCCTGTTGCGTGTCTCAGXn^^-3,正义链5'-YnCTGAGACACGCAACAGGGGATAGGCAAGGCACACAGGGGA-3'反义链其中,Xn是ACTG,Yn是CAGT;N.使用QiaquickPCR纯化试剂盒(Qiagen)纯化步骤M的反应产物,纯化产物进行8%聚丙烯酰胺凝胶分离,回收长度约300-800bp的DNA片段,即获得了两端分别含有接头I和II的、由多个26bp的Ditag组成的基因表达标签串联体。该DNA片段可直接用于后续GenomeSequencerFLX系统高通量测序的常规实验步骤(使用罗氏公司的GSFLXStandardDNALibraryPreparationKit)。实验结果对人体肝癌组织RNA样品进行的这种转录组SAGE基因序列标签的高通量测序,提供了覆盖所有高丰度和低丰度转录物的大量序列数据。序列数据的特征是每条序列均以Xn(ACTG)起始,其后即为由多个26bp的Ditag组成的基因表达标签串联体,每一组Ditag的两端均为CATG序列,CATG是识别串联体中每一组Ditag的特异性标记。依据测序序列长度的不同,每条序列中包含38组Ditag或更多(参考表1)。表l<table>tableseeoriginaldocumentpage9</column></row><table>实施例2在转录组LongSAGE基因序列标签高通量测序中的应用步骤一、长度约300-800bp的末端突出的基因表达标签的制备步骤A、B、C同实施例1D.移去反应管内的上清,保留管内磁珠,并将磁珠等分于2个新的反应管内。向第一个反应管内依次加入AdaptorC(40ng/|il)l.5nl,LoTE14pl,10XLigaseBuffer2^1,T4DNAligase(5U/pl)2.5|^1。向第二个反应管内依次加入AdaptorD(40ng/nl)1.5(xl,LoTE14pl,10XLigaseBuffer2fU,T4DNAligase(5U/pl)2.5nl。轻轻混匀管内成分,于16。C反应2小时。AdaptorC和D的序列如下AdaptorC:5'TTTGGATTTGCTGGTGCAGTACAACTAGGCTTAATATCCGACATG3'3'amino(C7)CCTAAACGACCACGTCATGTTGATCCGAATTATAGGCTP045'AdaptorD:5'TTTCTGCTCGAATTCAAGCTTCTAACGATGTACGTCCGACATG3'3'amino(C7)GACGAGCTTAAGTTCGAAGATTGCTACATGCAGGCTP045'E.依次向2个反应管内加入LoTE70|al,10XBuffer10|al,10XSAM(400pM)化l,MmeI(2U/V1)10|al。轻轻混匀管内成分,置于37。C温育2.5小时。反应结束后,将2个反应管内的上清分别转移到2个新的反应管内。步骤F、G、H、I同实施例l,但步骤I的连接反应产物为含有一组两端分别含有接头C和D的2个基因序列标签的、长约130个碱基的Ditag。步骤J、K、L同实施例l,但步骤K对PCR产物及Nlain酶切产物进行12。/。聚丙烯酰胺凝胶分离纯化时,回收的Ditag分别为130bp和34bp;步骤L中最终获得的粘性末端(5'突出末端为CATG)的样品DNA片段,系由多个34bp的Ditag组成的基因表达标签串联体。步骤二、接头I和II与样品DNA的连接步骤M、N同实施例l,但步骤M中的接头I和接头II的序列中的Xn变为CTGAC,Yn变为GTCAG,其它接头序列部分相同。步骤N得到了两端分别含有接头I和n的、由多个34bp的Ditag组成的基因表达标签串联体。该DNA片段可直接用于后续Gen咖eSequencerFLX系统高通量测序的常规实验步骤(使用罗氏公司的GSFLXStandardDNALibraryPreparationKit)。实验结果对人体肝癌组织RNA样品进行的这种转录组LongSAGE基因序列标签的高通量测序,提供了覆盖所有高丰度和低丰度转录物的大量序列数据。与实施例1的方法相比,通过本方法获得的基因序列标签长度增加,由26bp增加到34bp,从而提高了对基因序列标签注释的准确度。序列数据的特征是每条序列均以Xn(CTGAC)起始,其后即为由多个34bp的Ditag组成的基因表达标签串联体,每一组Ditag的两端均为CATG序列,CATG是识别串联体中每一组Ditag的特异性标记。依据测序序列长度的不同,每条序列中包含25组Ditag或更多(参考表2)。表2<table>tableseeoriginaldocumentpage11</column></row><table>实施例3在基因组基因序列标签高通量测序中的应用A.在0.5ml试管中,依次加入人体白血病细胞基因组DNA10pl(l叫/nl),10XBuffer20pl,100XBSA2pl,ddH20162pl,Sacl6pl(20U/pl)。混匀管内成分,放置于37。C温育1.5小时。B.反应结束后,向管内加入200nl酚/氯仿,充分混匀后室温下离心(13,000rpm)5分钟。将上清转移到新的反应管,依次加入133^1乙酸铵,3plmusselglycogen(20mg/ml),lml100%乙醇。混匀管内成分,放置于干冰上20分钟,4°C离心(13,000rpm)40分钟。弃上清,将沉淀用lml70%乙醇洗2遍,最终溶解于5|nlLoTE中。C.向上述管内依次加入SacILinker(35ng/pl)1.6^1,ddH202^1,5XLigationBuffer2.4|^1,T4DNAligase(5U/ul)1^1。混匀管内成分,置于16°C连接反应3小时。反应结束后,向管内加入188)^1LoTE,混匀,再加入20(^1酚/氯仿,重复步骤B。SaclLinker的序列如下5,-biotin-TTTGCAGAGGTTCGTAATCGAGTTGGGTGAGCT-3,5,-phosphate-CACCCAACTCGATTACGAACCTCTGC-3'D.向上述管内加入LoTE167pl,100XBSA2pl,10XBuffer20pl,NlaIII(10U/pl)6^1。混匀管内成分,置于37。C温育1小时。重复步骤B。E.向管内加入200nlDynabeadM-280磁珠(10mg/ml),室温放置30分钟,每隔5分钟轻轻混匀管内成分。将磁珠等分于2个新的管内,移去上清,保留管内磁珠,后续步骤同实施例2步骤D、E、F、G、H、I、J、K、L、M、N,但步骤M中的接头I和接头II的序列中的Xn变为GTACGA,Yn变为TCGTAC,其它接头序列部分相同。实验结果:对人体白血病细胞DNA样品进行的这种基因组序列标签的高通量测序,提供了覆盖全基因组的大量序列数据。通过本方法获得的基因组序列标签长度为34bp,由于人类全基因组序列是己知的,因而可以对这些序列标签进行注释和分析,从而获得白血病病人基因组扩增或缺失的详细信息。序列数据的特征是每条序列均以Xn(GTACGA)起始,其后即为由多个34bp的Ditag组成的基因组序列标签串联体,每一组Ditag的两端均为CATG序列,CATG是识别串联体中每一组Ditag的特异性标记。依据测序序列长度的不同,每条序列中包含25组Ditag或更多(参考表3)。表3序列序列长测序结果包含Ditag名称度(bp)组数I96""O^CATGATACGCTGCCGCAAGCCCGAGGCACTTGGGACAGCATGCGCACTGGCCAGGAGCCGCATTTGAAGAACATCCCATGATGATCGCCT2II138G7M<XCATGATGATAGAAGGCAGTTATCCTGGAATCTGGCTCACATGGGCTTCAGAAGATAGCTCGGATCACTTTGAGCTCCATGTCACCTCGCTGCAGGACAAGACGTGCTTAAGATTCATGCAACTAGGCAGCTA312<table>tableseeoriginaldocumentpage13</column></row><table>实施例4在甲基化基因序列标签高通量测序中的应用A.在0.5ml试管中,依次加入人体白血病细胞基因组DNA10pl(1吗/^1),10XBuffer20^1,ddH20164^1,Ascl6fxl(10U/pl)。混匀管内成分,放置于37。C温育1.5小时。B.反应结束后,向管内加入200^1酚/氯仿,充分混匀后室温下离心(13,000rpm)5分钟。将上清转移到新的反应管,依次加入133pl乙酸铵,3plmusselglycogen(20mg/ml),lml100%乙醇。混匀管内成分,放置于干冰上20分钟,4°C离心(13,000rpm)40分钟。弃上清,将沉淀用lml70%乙醇洗2遍,最终溶解于5^1LoTE中。C.向上述管内依次加入AscILinker(35ng/pl)1.6pl,ddH202fU,5XLigationBuffer2.4|xl,T4DNAligase(5U/ul)l)al。混匀管内成分,置于16°C连接反应3小时。反应结束后,向管内加入188|alLoTE,混匀,再加入200nl酚/氯仿,重复步骤B。AsclLinker的序列如下5,-biotin-TTTGCAGAGGTTCGTAATCGAGTTGGGTGG-3,5,-phosphate-CGCGCCACCCAACTCGATTACGAACCTCTGC-3'D.向上述管内加入LoTE167pl,100XBSA2nl,10XBuffer20nl,NlaIII(10U/^il)6pl。混匀管内成分,置于37。C温育1小时。重复步骤B。E.向管内加入200nlDynabeadM-280磁珠(10mg/ml),室温放置30分钟,每隔5分钟轻轻混匀管内成分。将磁珠等分于2个新的管内,移去上清,保留管内磁珠,后续步骤同实施例2步骤D、E、F、G、H、I、J、K、L、M、N,但步骤M中的接头I和接头II的序列中的Xn变为CAGTAGA,Yn变为TCTACTG,其它接头序列部分相同。实验结果:对人体白血病细胞DNA样品进行的这种基因组序列标签的高通量测序,提供了覆盖全基因组甲基化位点的大量序列数据。本方法采用用甲基化敏感的限制性内切酶Ascl对基因组DNA进行酶切,Ascl仅选择性地作用于非甲基化区域的识别位点,而不能酶解甲基化的识别位点。因此,通过本方法获得的长度为34bp的基因组序列标签为基因组低甲基化区域的标签。由于人类全基因组序列是已知的,因而可以对这些序列标签进行注释和分析,从而获得全基因组甲基化水平的分布情况。序列数据的特征是每条序列均以Xn(CAGTAGA)起始,其后即为由多个34bp的Ditag组成的基因组序列标签串联体,每一组Ditag的两端均为CATG序列,CATG是识别串联体中每一组Ditag的特异性标记。依据测序序列长度的不同,每条序列中包含25组Ditag或更多(参考表4)。表4序列名称序列长度(bp)测序结果包含Ditsg组数I97CM6T^fiCATGATACGCTGCCGCAAGCCCGAGGCACTTGGGACAGCATGCGCACTGGCCAGGAGCCGCATTTGAAGAACATCCCATGATGATCGCCT2II139C/Itf7X6^CATGATGATAGAAGGCAGTTATCCTGGAATCTGGCTCACATGGGCTTCAGAAGATAGCTCGGATCACTTTGAGCTCCATGTCACCTCGCTGCAGGACAAGACGTGCTTAAGATTCATGCAACTAGGCAGCTA3III179C^7^fiCATGGCTTAGAACACAGGATATGCCTGCAGTCCCAGCTCATGAGTGCAGGACACACAGAAGTGAAGCCTTCCTGGACATGAATCACGCTTATTACGGGCACACCTGCAAGGTGGCATGGGACAAAGCCCAGGCTGTCTGCATTCAACCTGTCCATGGACAAGTGACTGCCTG4IV208CMG7M6MCATGATCTCTCATCTTCCAGCCTGAATGTGTTCGCTGTCATGAGACATCAGGTGCTGCGGTCCTTCAGAGAAGCTGCATGTAGGACTGCTGGCACAAGACGTTACTTGCTGTACCATGAGTCCAGAACAGACCGAAGCCAATGTGCCTGACCCATGGAGCCAGGGAGCTCACCTGTGCCTCGCTCTCAGGCATGCAGCCAG51权利要求1、一种有利于高通量基因序列标签测序的DNA粘端接头,其特征在于该DNA粘端接头是一种末端突出的DNA接头,带有可识别序列Xn、Yn,其序列式为序列(I)和序列(II),5’-CCATCTCATCCCTGCGTGTCCCATCTGTTCCCTCCCTGTCTCAGXndm-3’正义链5’-YnCTGAGACAGGGAGGGAACAGATGGGACACGCAGGGATGAG-3’反义链(I)5’-Biotin-CCTATCCCCTGTGTGCCTTGCCTATCCCCTGTTGCGTGTCTCAGXndm-3’正义链5’-YnCTGAGACACGCAACAGGGGATAGGCAAGGCACACAGGGGA-3’反义链(II)其中,X表示A、T、G、C四种碱基中的任意一种,n为4-10之间的任意整数,任意两个相邻的X不能是相同的碱基,Y是与X一一对应的互补碱基,dm是末端突出标志,d表示A、T、G、C四种碱基中的任意一种,m为1-4之间的任意整数。2、如权利要求1所述的有利于高通量基因序列标签测序的DNA粘端接头,其特征在于所述的dm是CATG。3、一种有利于高通量基因序列标签测序的DNA粘端接头在高通量基因序列标签测序方法中的应用,该方法步骤包括(1)取长度在300-800bp的末端突出的样品DNA片段;(2)在DNA连接酶的作用下,样品DNA片段与DNA粘端接头相连接;(3)用QiaquickPCR纯化试剂盒纯化连接有接头的DNA片段;(4)通过电泳分离并回收大小在300-800bp的连接有接头的DNA片段;(5)再按照常规高通量测序的后续步骤进行测序。全文摘要本发明公开了一种有利于高通量基因序列标签测序的DNA粘端接头与应用,该接头是一种末端突出的DNA接头,带有可识别序列Xn、Yn,其序列式为序列(I)和序列(II),该DNA粘端接头可应用于高通量基因序列标签的测序。采用本发明的DNA粘端接头,能同时进行多个样品的高通量基因序列标签测序,并且样品DNA来源不限,测序前DNA制备的步骤简化,测序效率高。文档编号C12N15/11GK101503733SQ200810044118公开日2009年8月12日申请日期2008年12月17日优先权日2008年12月17日发明者任双喜,艳沈,王升跃,辉董,赵国屏,金维荣,震钱,陈样宜申请人:上海人类基因组研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1