一种实现基因组定点修饰的蛋白表达载体的方法【专利摘要】本发明涉及生物基因克隆表达技术,特别是一种快速高效地构建转录激活因子样效应蛋白切割酶(TALEN)表达载体的方法。特别适合用于大规模的构建针对高等动物基因组遗传修饰的表达载体,以研究动物基因的功能。【专利说明】一种实现基因组定点修饰的蛋白表达载体的方法【
技术领域:
】[0001]本发明涉及生物基因克隆表达技术,特别是一种快速高效地构建转录激活因子样效应蛋白切割酶(TALEN)表达载体的方法。特别适合用于大规模的构建针对高等动物基因组遗传修饰的表达载体,以研究动物基因的功能。【
背景技术:
】[0002]一.TALEN技术的介绍和应用[0003]随着越来越多的物种全基因组序列测定工作的完成,当前的基因组学研究热点已经由结构基因组学转向了功能基因组学,因此发展能够快速、高效、高通量的基因功能研究方法和策略具有广泛的需求。基因敲除(Knockout)技术是当今动物基因功能研究中最为重要的手段。近一年多来,陆续有文献报导转录激活因子样效应蛋白(TALEtranscriptionActivatorLikeEffectors)能够高效的用于基因组的修饰,从而达到调控动植物内源基因的转录调控,其特异性高,操作简便,重复性好。[0004]转录激活因子样效应蛋白(TALE!TranscriptionActivatorLikeEffectors)是植物致病菌Xanthomonas通过III型分泌系统注入到宿主细胞内的一种蛋白质(参考文献1-4)。TALE蛋白的奇特之处在于它包括一个DNA结合结构域,该DNA结合结构域不同于其他已知的DNA结合结构域。它是由数量不同(通常15到35个)的重复单元组成,每一个重复单元能够特异识别一个DNA碱基对。通常情况下每个重复单元由34个氨基酸组成,除了第12和13位的氨基酸存在变化,其他位点的氨基酸高度保守。这两个不保守的氨基酸被命名为RVD(RepeatVariableDiresidue)。现在已经确定,每个重复单元中12和13位的氨基酸和识别的核苷酸种类有特殊的一一对应关系:HD单元对应碱基C;NI单元对应碱基A;NG单元对应碱基T;NN单元对应碱基G。[0005]TALE蛋白的特异DNA序列识别的特性以及DNA结合结构域中重复单元的可组装性为它们在生物学和生物技术中的应用提供了巨大的前景,理论上科学家们可以设计和组装任意的TALE单元去识别目标DNA序列。目前为止,利用TALE蛋白这一特性的应用中,前途最为广阔的是用于构造切割特异双链DNA序列的工具酶TALEN(TALENuclease)0TALEN把限制性内切酶(FokI)融合表达于TALE蛋白的羧基端,通过在细胞中表达一对TALEN融合蛋白,称之为5’端TALEN蛋白和3’端TALEN蛋白。它们的DNA结合结构域可以分别特异识别并结合目标DNA序列,实现对基因组中目的基因的锚定。5’端TALEN蛋白和3’端TALEN蛋白的羧基端融合的限制性内切酶FokI,在空间上靠近后可以形成二聚体,切割位于DNA结合结构域锚定的DNA序列之间的DNA双螺旋,形成DNA双链断裂。见图1。[0006]绝大多数物种在进化中都形成了天然的DNA断裂修复机制。通过TALEN识别并结合指定的基因组中的特定位点,高效并且精确地造成靶位点DNA断裂。然后,细胞可以自发的识别基因组中的DNA双链断裂,利用天然的DNA修复过程一“同源定向修复”或“非同源末端连接”来修复靶DNA断裂。研究人员可以利用这个过程,进行各种形式的基因组编辑或修饰。通过“非同源末端连接”,可以导入DNA碱基插入和碱基缺失,从而实现基因敲除;通过“同源定向修复”,可以实现基因替换和定向的基因添加。传统的基因敲除技术依赖于细胞内自然发生的同源重组,其效率非常低,通常为10-6级别。而TALEN技术可以实现在基因组的特定DNA位点产生缺口,通过细胞内源的同源重组或非同源末端连接来实现目的基因的敲除,因此极大的提高了基因敲除的效率,可以达到10-25%。迄今为止,TALEN已经成功应用于模式物种果蝇、斑马鱼、小鼠和大鼠的细胞和个体水平的基因组修饰(参考文献5-9)。[0007]二.TALEN技术实现的难点[0008]通过TALEN技术实现在动物细胞或者个体中进行基因组修饰,必须通过分子生物学技术构建TALEN蛋白的表达载体。TALEN蛋白的结构包括氨基端蛋白片段、羧基端蛋白片段和位于前二者之间的DNA结合结构域。DNA结合结构域由数量不同(通常15到20个)的重复单元组成,每一个重复单元特异识别一个DNA碱基对。其中,最后一个重复单元(末位重复单元)是一个部分完整的重复单元。组成重复单元的34个氨基酸中,只有第12和13位点的氨基酸存在变化,这种氨基酸片段的高度重复结构使得构建TALEN蛋白的表达元件非常有难度。[0009]目前,已知的构建TALEN蛋白表达载体的方法主要有2种:[0010]第一种是采用顺序克隆的方法(见图2)。顺序克隆的内容是:将4个不同的重复单元(分别HD单元;NI单元;NG单元和NN单元)的表达元件,分别构建于一个克隆载体中,然后通过DNA酶切和DNA连接,每次将一个重复单元的表达元件DNA切下,并且插入到最终目的表达载体,完成一个重复单元的组装。第一个重复单元组装后,再进行第二个重复单元的组装,直到依次将所有的重复单元组装完毕。第二种方法采用全化学合成的方法,合成TALEN蛋白的DNA结合结构域的表达元件,来实现表达载体的构建。[0011]上述2种方法虽然能够成功构建TALEN蛋白表达载体,但是明显存在不足,主要表现在以下几个方面:[0012]1.步骤繁琐,克隆效率低。顺序克隆方法中,每一轮操作都需要DNA的酶切、片段的纯化回收、DNA插入片度和载体的连接、大肠杆菌的转化、含有重组载体的阳性菌的筛选鉴定以及阳性菌中的重组载体质粒的提取。一轮操作下来所需要的时间最少为3天。用于基因组修饰的TALEN蛋白,通常需要DNA结合结构域包括15到20个重复单元。因此要实现含有15到20个重复单元的TALEN蛋白的表达载体的构建,通常需要5轮上述操作。待完整的TALEN蛋白表达元件构建完成,需要再进行一轮操作,将整个表达元件酶切下来,连接到最终的真核生物表达载体中。[0013]2.成本高。顺序克隆方法中,每一轮操作都包括:DNA的酶切、目的DNA片段的纯化回收、DNA插入片度和载体的连接、连接产物转化大肠杆菌、筛选鉴定含有重组载体的阳性菌和重组载体质粒的提取。“顺序克隆”方法构建一个含有20个重复单元的TALEN蛋白的真核表达载体,需要6轮操作。每一个步骤都意味着投入的耗材、试剂和人力的成本。化学合成方法现阶段最大的不足在于化学合成长片段的DNA片段成本非常高。按照现在主要提供商的产品合成价格,合成一个含有20个重复单元的DNA结合结构域的表达元件DNA,成本闻于2_3万人民币。[0014]因此,在本领域中,仍有对快速、高效、低成本地构建TALEN蛋白表达载体的需要。[0015]参考文献:[0016]1.PlantPathogenRecognitionMediatedbyPromoterActivationofthePepperBs3ResistanceGene.PatrickRdlTier3SimoneHahn,TinaJordan,TinaStrau,UllaBonas,ThomasLahaye.Science318,645(2007)[0017]2.ABacterialEffectorActsasaPlantTranscriptionFactorandInducesaCellSizeRegulator.SabineKayjSimoneHahn,EricMaroisjGerdHausejUllaBonas.Science318,648(2007)[0018]3.ASimpleCipherGovernsDNARecognitionbyTALEffectors.MatthewJ.MoscouandAdamJ.Bogdanove.SCIENCE326,1501(2009)[0019]4.BreakingtheCodeofDNABindingSpecificityofTAL-TypeII1.JensBochjHeidiScholzejSebastianSchornackjAngelikaLandgraf,SimoneHahn,SabineKayjThomasLahaye,AnjaNickstadtjUllaBonas.Science326,1509(2009)[0020]5.ATALEnucleasearchitectureforefficientgenomeediting.JeffreyCMillerjSiyuanTan,GuijuanQiao,KyleABarlow,JianbinWang,DannyFXiajXiangdongMengjDavidEPaschonjEloLeung,SarahJHinkleyjGladysPDulayjKevinLHua,IrinaAnkoudinova,GregoryJCost,FyodorDUrnovjSteveZhangjMichaelCHolmes,LeiZhang,PhilipDGregory&EdwardJRebar,NatureBiotechnol.29,143-148(2011)[0021]6.KnockoutratsgeneratedbyembryomicroinjectionofTALENs.LaurentTessonjClaireUsaljSeverineMenoretjEloLeung,BrettJNiles,SeverineRemyjYolandaSantiago,AnnaIVincent,XiangdongMengjLeiZhang,PhilipDGregoryjIgnacioAnegon&GregoryJCost,NatureBiotechnol.29,695-696(2011)[0022]7.TargetedgenedisruptioninsomaticzebrafishcellsusingengineeredTALENs.JeffryDSander,LindsayCade,CydKhayter,DeepakReyonjRandallTPetersonjJKeithJoung&Jing-RueyJYeh.NatureBiotechnol.29,697-698(2011)[0023]8.HeritablegenetargetinginzebrafishusingcustomizedTALENs.PengHuangjAnXiao,MingguoZhou,ZuoyanZhu,ShuoLin&BoZhang.NatureBiotechnol.29,699-700(2011)[0024]9.GeneticengineeringofhumanpluripotentcellsusingTALEnucleases.DirkHockemeyer,HaoyiWang,SamiraKiani,ChristineSLaijQingGaojJohnPCassady,GregoryJCost,LeiZhang,YolandaSantiago,JeffreyCMiller,BryanZeitler,JenniferMCherone,XiangdongMeng,SarahJHinkley,EdwardJRebar,PhilipDGregory,FyodorDUrnov&RudolfJaenisch.NatureBiotechnol.29,731-734(2011)【
发明内容】[0025]在本申请中,除非另行指明,对于核苷酸序列,A、C、T、G代表核苷酸碱基的单字母缩写,而下述大写字母代表选自多个碱基中的任一个:[0026]R----A/G[0027]Y----C/T[0028]M----A/C[0029]K——G/T[0030]S——G/C[0031]WA/T[0032]H----A/T/C[0033]B——G/T/C[0034]V----G/A/C[0035]D----G/A/T[0036]N——A/G/C/T。[0037]在本申请中,除非另行指明,只表明序列之间的连接关系,本身不代表任何序列。[0038]本发明由下述段落所描述:[0039]1.一种核苷酸序列,所述核苷酸序列包含下述结构:[0040]R1-Ln-Xn-Lntl-R2,[0041]其中η选自I至m的自然数,m为7、8、9、10、11、12、13或14;[0042]R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;[0043]1^和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;[0044]其中,[0045]L1为SEQIDNO:2的编码序列的J1至jj1-l位;[0046]Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+1-l位;[0047]Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;[0048]其中J1选自I至970-1;[0049]jm+1选自I至730-1;[0050]当k为2至m时,jk选自I至97-1,[0051]且L1至Llrt彼此各不相同;[0052]当n=l时,父?为YD1,[0053]当n=m时,Xn为YE,[0054]当η为2至m-Ι时,Xn选自YDn*YSn,[0055]其中YDn为FLn-YLn-FMn-YRn-FRn,[0056]YSn为FLn-Yn-FRn,[0057]YE为FLn1-Yn1-FRE,[0058]其中,[0059]当n=l时,[0060]FL1为SEQIDNO:2的编码序列的jji至969位,但当1=9704时,该FL1为空序列,[0061]其他情况下:[0062]FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,[0063]FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,[0064]FMn为SEQIDNO:1的编码序列,[0065]FRE为SEQIDNO:3的编码序列的I至jm+rl位,但当jm+1=l时,该FRn为空序列,[0066]其中Yn、YLn,YRn彼此独立地为碱基Α、C、T或G的TALE识别序列的编码序列。[0067]2.一种试剂盒,所述试剂盒包括m种核苷酸序列,且任选地包括表达载体,其中m为7、8、9、10、11、12、13或14,[0068]其中第η种核苷酸序列包含下述结构:[0069]R1-Ln-Xn-Lntl-R2,[0070]其中η选自I至m的自然数;[0071]R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;[0072]Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;[0073]其中,[0074]L1为SEQIDNO:2的编码序列的J1至j'+1-l位;[0075]Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+1-l位;[0076]Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;[0077]其中J1选自I至970-1;[0078]jm+1选自I至730-1;[0079]当k为2至m时,jk选自I至97-1,[0080]且L1至Llrt彼此各不相同;[0081]当n=l时,Xn为YD1,[0082]当n=m时,Xn为YE,[0083]当η为2至m-Ι时,Xn选自YDn*YSn,[0084]其中YDn为FLn-YLn-FMn-YRn-FRn,[0085]YSn为FLn-Yn-FRn,[0086]YE为FLn1-Yn1-FRE,[0087]其中,[0088]当η=I时,[0089]FL1为SEQIDNO:2的编码序列的jji至969位,但当1=9704时,该FL1为空序列,[0090]其他情况下:[0091]FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,[0092]FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,[0093]FMnSSEQIDNO:1的编码序列,[0094]FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRE为空序列,[0095]其中Yn、YLn,YRn彼此独立地为碱基Α、C、T或G的TALE识别序列的编码序列。[0096]其中所述表达载体包含下述结构:[0097]PN-L1-R2-M-R1-Lmtl-PC-NE,[0098]R1和R2的定义如上所述;[0099]PN为SEQIDNO:2的编码序列的I至位,但当J1=I时,该PN为空序列;[0100]PC为SEQIDNO:3的编码序列的jm+1+i至729位,但当jm+1=730-1时,该PC为空序列;[0101]NE为核酸内切酶的编码序列;[0102]M为选择性标记。[0103]3.一种试剂盒,所述试剂盒包括20(m-Ι)种核苷酸序列,且任选地包括表达载体,其中m为7、8、9、10、11、12、13或14,[0104]所述20(m-Ι)种核苷酸序列分为m组,[0105]其中第η组核苷酸序列包含下述共同结构:[0106]R1-Ln-Xn-Lntl-R2,[0107]其中η选自I至m的自然数;[0108]R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;[0109]Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;[0110]其中,[0111]L1为SEQIDNO:2的编码序列的J1至j'+1-l位;[0112]Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+1-l位;[0113]Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;[0114]其中J1选自I至970-1;[0115]jm+1选自I至730-1;[0116]当k为2至m时,jk选自I至97-1,[0117]且L1至Llrt彼此各不相同;[0118]对于第I组,XnSYD1,[0119]YD1为FL1-YLrFMrYR1-FR1,[0120]FL1为SEQIDNO:2的编码序列的jji至969位,但当1=9704时,该FL1为空序列,[0121]FR1为SEQIDNO:1的编码序列的I至j2_l位,但当J2=I时,该FRn为空序列,[0122]FM1为SEQIDNO:1的编码序列,[0123]第I组共包括16个序列,在这16个序列中,YL1和YR1分别为碱基A、C、T或G的TALE识别序列的编码序列的不同组合;[0124]对于第[0125]YE为FLn1-Yn1-FRE,[0126]其中,[0127]FLm为SEQIDNO:1的编码序列的jm+i至96位,但当jm=97_i时,该FLm为空序列,[0128]FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRE为空序列,[0129]第m组共包括4个序列,在这4个序列中,Yn分别为碱基A、C、T或G的TALE识别序列的编码序列;[0130]对于第2至m-Ι组,Xn选自YDn或YSn,[0131]其中YDn为FLn-YLn-FMn-YRn-FRn,[0132]YS1^FLn-Yn-FRn,[0133]其中,[0134]FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,[0135]FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,[0136]FMnSSEQIDNO:1的编码序列,[0137]对于第2至m-Ι组,每组共包括20个序列,在其中16个序列中,Xn为YDn,且YLn和YRn分别为碱基A、C、T或G的TALE识别序列的编码序列的不同组合,在剩下4个序列中,Xn为YSn,且Yn分别为碱基A、C、T或G的TALE识别序列的编码序列;[0138]其中所述表达载体包含下述结构:[0139]PN-L1-R2-M-R1-Ln^1-PC-NE,[0140]R1和R2的定义如上所述;[0141]PN为SEQIDNO:2的编码序列的I至位,但当J1=I时,该PN为空序列;[0142]PC为SEQIDNO:3的编码序列的jm+1+i至729位,但当jm+1=730-1时,该PC为空序列;[0143]NE为核酸内切酶的编码序列;[0144]M为选择性标记。[0145]4.一种组装DNA结合结构域元件的方法,其中所述DNA序列由不多于20个碱基组成:[0146](I)根据目标DNA序列,将DNA序列按5’到3’端分为m个碱基组,第一个碱基组由2个碱基组成,第m个碱基组由I个碱基组成,其他各组由I个或2个碱基组成,其中m为7、8、9、10、11、12、13或14;[0147](2)根据所述m个碱基组的碱基序列,设计m个对应的核苷酸序列,和表达载体;[0148]其中第η种核苷酸序列包含下述结构:[0149]R1-Ln-Xn-Lntl-R2,[0150]其中η是I至m的自然数;[0151]R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;[0152]Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;[0153]其中,[0154]L1为SEQIDNO:2的编码序列的J1至位;[0155]Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+1-l位;[0156]Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;[0157]其中J1选自I至970-1;[0158]jm+1选自I至730-1;[0159]当k为2至m时,jk选自I至97-1,[0160]且L1至Llrt彼此各不相同;[0161]对于第I个碱基组,Xn为YD1,[0162]对于第m个碱基组,Xn为YE,[0163]对于第2至m-Ι个碱基组,当该碱基组由一个碱基组成时,Xn为YSn,而当该碱基组由两个碱基组成时,Xn为YDn,[0164]其中YDn为FLn-YLn-FMn-YRn-FRn,[0165]YSnSFLn-Yn-FRn,[0166]YE为FLn1-Yn1-FRE,[0167]其中,[0168]当n=l时,[0169]FL1为SEQIDNO:2的编码序列的J1+!至969位,但当1=9704时,该FL1为空序列,[0170]其他情况下:[0171]FLnSSEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,[0172]FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,[0173]FMnSSEQIDNO:1的编码序列,[0174]FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRE为空序列,[0175]其中Yn、YLn,YRn彼此独立地为碱基Α、C、T或G的TALE识别序列的编码序列。[0176]当该碱基组由一个碱基组成时,Yn为该碱基的TALE识别序列的编码序列,而当该碱基组由两个碱基组成时,YLn和YRn分别为所述碱基组中第一个和第二个YDn碱基的TALE识别序列的编码序列;[0177]其中所述表达载体包含下述结构:[0178]PN-L1-R2-M-R1-Lmtl-PC-NE,[0179]R1和R2的定义如上所述;[0180]PN为SEQIDNO:2的编码序列的I至位,但当J1=I时,该PN为空序列;[0181]PC为SEQIDNO:3的编码序列的jm+1+i至729位,但当jm+1=730_i时,该PC为空序列;[0182]NE为核酸内切酶的编码序列;[0183]M为选择性标记;[0184]任选地,所述m种核苷酸序列并非设计的,而是直接从如本发明第三个方面所述的20(m-l)个核苷酸中选取的;[0185](3)将所述m种核苷酸序列,所述表达载体,与R1和R2对应的限制性内切酶IIS,和DNA连接酶混合;[0186](4)将(3)中的混合物用所述IIS型限制性内切酶酶切,并用DNA连接酶连接,获得包含组装的DNA结合结构域元件的表达载体;[0187]任选地,本发明的该方面还包括回收所述包含组装的DNA结合结构域元件的表达载体的方法,所述方法进一步包括下述步骤:[0188](5)用(4)的反应产物转化、转导或转染宿主细胞,并针对选择性标记M筛选包含表达载体的宿主细胞;[0189](6)在适于表达载体增殖的条件下,培养经筛选的宿主细胞,和[0190](7)从培养的宿主细胞回收经增殖的表达载体。[0191]5.段落1-4任一项的核苷酸序列、试剂盒或方法,其中所述SEQIDNO:1的编码序列为:[0192]GGNGGNAARCARGCNYTNGARACNGTNCARMGNYTNYTNCCNGTNYTNTGYCARGAYCAYGGNYTNACNCCNGAYCARGTNGTNGCNATHGCNWSN(SEQIDNO:5);和/或[0193]所述SEQIDNO:2的编码序列为:[0194]ATGGCNWSNWSNCCNCCNAARAARAARMGNAARGTNWSNTGGAARGAYGCNWSNGGNTGGWSNMGNATGCAYGCNGAYCCNATHMGNCCNMGNMGNCCNWSNCCNGCNMGNGARYTNYTNCCNGGNCCNCARCCNGAYMGNGTNCARCCNACNGCNGAYMGNGGNGTNWSNGCNCCNGCNGGNWSNCCNYTNGAYGGNYTNCCNGCNMGNMGNACNGTNWSNMGNACNMGNYTNCCNWSNCCNCCNGCNCCNWSNCCNGCNTTYWSNGCNGGNWSNTTYWSNGAYYTNYTNMGNCCNTTYGAYCCNWSNYTNYTNGAYACNWSNYTNYTNGAYWSNATGCCNGCNGTNGGNACNCCNCAYACNGCNGCNGCNCCNGCNGARTGGGAYGARGCNCARWSNGCNYTNMGNGCNGCNGAYGAYCCNCCNCCNACNGTNMGNGTNGCNGTNACNGCNGCNMGNCCNCCNMGNGCNAARCCNGCNCCNMGNMGNMGNGCNGCNCARCCNWSNGAYGCNWSNCCNGCNGCNCARGTNGAYYTNMGNACNYTNGGNTAYWSNCARCARCARCARGARAARATHAARCCNAARGTNMGNWSNACNGTNGCNCARCAYCAYGARGCNYTNGTNGGNCAYGGNTTYACNCAYGCNCAYATHGTNGCNYTNWSNCARCAYCCNGCNGCNYTNGGNACNGTNGCNGTNACNTAYCARCAYATHATHACNGCNYTNCCNGARGCNACNCAYGARGAYATHGTNGGNGTNGGNAARCARTGGWSNGGNGCNMGNGCNYTNGARGCNYTNYTNACNGAYGCNGGNGARYTNMGNGGNCCNCCNYTNCARYTNGAYACNGGNCARYTNGTNAARATHGCNAARMGNGGNGGNGTNACNGCNATGGARGCNGTNCAYGCNWSNMGNAAYGCNYTNACNGGNGCNCCNYTNAAYYTNACNCCNGAYCARGTNGTNGCNATHGCNWSN(SEQIDNO:6);和/或[0195]所述SEQIDN0:3的编码序列为:[0196]GGNGGNAARCARGCNYTNGARWSNATHGTNGCNCARYTNWSNMGNCCNGAYCCNGCNYTNGCNGCNYTNACNAAYGAYCAYYTNGTNGCNYTNGCNTGYYTNGGNGGNMGNCCNGCNATGGAYGCNGTNAARAARGGNYTNCCNCAYGCNCCNGARYTNATHMGNMGNGTNAAYMGNMGNATHGGNGARMGNACNWSNCAYMGNGTNGCNGAYTAYGCNCARGTNGTNMGNGTNYTNGARTTYTTYCARTGYCAYWSNCAYCCNGCNTAYGCNTTYGAYGARGCNATGACNCARTTYGGNATGWSNMGNAAYGGNYTNGTNCARYTNTTYMGNMGNGTNGGNGTNACNGARYTNGARGCNMGNGGNGGNACNYTNCCNCCNGCNWSNCARMGNTGGGAYMGNATHYTNCARGCNWSNGGNATGAARMGNGCNAARCCNWSNCCNACNWSNGCNCARACNCCNGAYCARGCNWSNYTNCAYGCNTTYGCNGAYWSNYTNGARMGNGAYYTNGAYGCNCCNWSNCCNATGCAYGARGGNGAYCARACNMGNGCNWSNWSNMGNAARMGNWSNMGNWSNGAYMGNGCNGTNACNGGNCCNWSNGCNCARCARGCNGTNGARGTNMGNGTNCCNGARCARMGNGAYGCNYTNCAYYTNCCNYTNWSNTGGMGNGTNAARMGNCCNMGNACNMGNATHTGGGGNGGNYTNCCNGAYCCNATHWSNMGNWSNCAR(SEQIDNO:7)。[0197]6.段落1-5任一项的核苷酸序列、试剂盒或方法,其中m为8至12的自然数,优选m为9至11的自然数,更优选m是10。[0198]7.段落1-6任一项的核苷酸序列、试剂盒或方法,其中所述核苷酸序列是载体,优选适于在宿主细胞中复制的载体,更优选可在宿主细胞中大量复制的载体。[0199]8.段落1-7任一项的核苷酸序列、试剂盒或方法,其中所述载体是质粒,优选地,所述质粒是多拷贝质粒。[0200]9.段落1-8任一项的核苷酸序列、试剂盒或方法,其中所述宿主是真核宿主。[0201]10.段落1-9任一项的核苷酸序列、试剂盒或方法,其中所述宿主是原核宿主,优选大肠杆菌。[0202]11.段落1-10任一项的核苷酸序列、试剂盒或方法,其中所述载体是病毒载体。[0203]12.段落1-11任一项的核苷酸序列、试剂盒或方法,其中i为3、4或5,优选i为4。[0204]13.段落1-12任一项的核苷酸序列、试剂盒或方法,其中所述IIS型限制性内切酶是BsmBI,R1是BsmBI识别序列CGTCTCN,而R2是BsmBI识别序列的反向互补序列NGAGACG,和i=4。[0205]14.段落1-13任一项的核苷酸序列、试剂盒或方法,其中[0206]J1为I至970-1的自然数;和/或[0207]jm+1为I至730-1的自然数;和/或[0208]当k为2至m时,jk为I至97-1的自然数。[0209]15.段落1-14任一项的核苷酸序列、试剂盒或方法,其中当k为2至m时,jk选自a至b的自然数,其中a和b均选自I至97_i的自然数,且a<b。[0210]16.段落1-15任一项的核苷酸序列、试剂盒或方法,其中当k为2至m时,jk为57至86的自然数。[0211]17.段落1-16任一项的核苷酸序列、试剂盒或方法,其中FMn为:[0212]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,或[0213]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGC,[0214]18.段落1-17任一项的核苷酸序列、试剂盒或方法,其中J1选自a至b的自然数,其中a和b均选自I至970-1的自然数,且a<b,优选地,J1选自891至967,更优选J1选自901至961,更优选J1选自911至951,更优选J1选自921至941,更优选J1为931。[0215]19.段落1-18任一项的核苷酸序列、试剂盒或方法,其中FL1为:[0216]ACCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC。[0217]20.段落1-19任一项的核苷酸序列、试剂盒或方法,其中当k为2至m时,FLk为:[0218]GGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0219]GCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0220]CCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0221]CTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0222]TGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0223]GACTCCGGACCAAGTGGTGGCTATCGCCAGC,[0224]ACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0225]CGGACCAAGTGGTGGCTATCGCCAGC,或[0226]CGCCAGC。[0227]21.段落1-20任一项的核苷酸序列、试剂盒或方法,其中FRn为:[0228]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGA,[0229]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGAC,[0230]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACC,[0231]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCA,[0232]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCAT,[0233]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATG,[0234]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGG,[0235]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTG,或[0236]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGG。[0237]22.段落1-21任一项的核苷酸序列、试剂盒或方法,其中jm+1选自a至b的自然数,其中a和b均选自I至730-1的自然数,且a≤b,优选地,jm+1选自I至727,更优选jm+i选自3至143,更优选jm+1选自13至133,更优选jm+1选自23至123,更优选jm+1选自33至113,更优选jm+1选自43至103,更优选jm+1选自53至93,更优选jm+1选自63至83,更优选jm+i为73。[0238]23.段落1-22任一项的核苷酸序列、试剂盒或方法,其中FRE为:[0239]GGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACC。[0240]24.段落1-23任一项的核苷酸序列、试剂盒或方法,[0241]其中L1为CTGA;和/或[0242]Lm+1为AACG;和/或[0243]Lk选自[0244]CTGA,[0245]CCAT,[0246]CATG,[0247]ATGG,[0248]TGGC,[0249]GGCC,[0250]GCCT,[0251]CCTG,[0252]ACCCdP[0253]CTAT;[0254]其中k为2至m。[0255]25.段落1-24任一项的核苷酸序列、试剂盒或方法,其中所述NE为FokI的编码序列,优选地,所述NE为SEQIDNO:4的编码序列,更优选地,所述NE为SEQIDNO:8。[0256]26.段落1-25任一项的核苷酸序列、试剂盒或方法,其中所述选择性标记M为LbcZ0[0257]27.段落1-26任一项的核苷酸序列、试剂盒或方法,其中所述突光蛋白是GFP或RFP。[0258]28.段落1-27任一项的核苷酸序列、试剂盒或方法,其中所述表达载体为pCMV-TALEN、pCMV-TALEN-GFP或pCMV-TALEN-RFP。[0259]29.段落3的试剂盒,包括下述180个DNA序列:[0260](I)144个包含“双碱基重复单元表达元件”的DNA序列,所述“双碱基重复单元表达元件”的序列如SEQIDNO:11~154所示;[0261](2)32个包含“单碱基重复单元表达元件”的DNA序列,所述“单碱基重复单元表达元件”的序列如SEQIDNO:155~186所示;[0262](3)4个包含“末位单碱基重复单元表达元件”的DNA序列,所述“末位单碱基重复单元表达元件”的序列如SEQIDNO:187~190所示;[0263]任选地,所述试剂盒还包括[0264](4)已构建的哺乳动物真核表达载体,其可为pCMV-TALEN。[0265]30.段落29的试剂盒,包括下述180个环状质粒:[0266](1)144个“双碱基重复单元表达元件质粒”,每个质粒由一个“双碱基重复单元表达元件”和该元件两翼的5’和3’侧翼质粒骨架序列组成,命名为pXX-n,XX为A、C、T、G的所有16种两两组合,η为1-9,其中所述双碱基重复单元表达元件”的序列如SEQIDNO:11~154所示;[0267](2)32个“单碱基重复单元表达元件质粒”,每个质粒由一个“单碱基重复单元表达元件”和该元件两翼的5’和3’侧翼质粒骨架序列组成,命名为ρΧ_η,Χ为A、T、C或G,n为2-9,其中所述“单碱基重复单元表达元件”的序列如SEQIDNO:155~186所示;[0268](3)4个“末位单碱基重复单元表达元件质粒”,每个质粒由一个“末位单碱基重复单元表达元件”和该元件两翼的5’和3’侧翼质粒骨架序列组成,分别是pC-L、pG-L、pA-L和pT-L,其中所述“末位单碱基重复单元表达元件”的序列如SEQIDNO:187~190所示;[0269]其中,所述5,和3,侧翼质粒骨架序列分别为SEQIDNO:9和10;[0270]任选地,所述试剂盒还包括[0271](4)已构建的哺乳动物真核表达载体,其可为pCMV-TALEN。[0272]31.SEQIDNO:1-193的氨基酸序列或核苷酸序列。【专利附图】【附图说明】[0273]图1:TALEN蛋白用于基因组定点修饰的原理示意图。[0274]图2顺序克隆”策略构建TALEN蛋白表达载体示意图。[0275]图3:本发明方法中构建TALEN蛋白表达载体示意图。多片段DNA定向连接克隆的示意图。示意图中演示在一个反应体系中按照正确的顺序组装10个DNA片段。这种连接策略使用IIS型限制性内切酶(本发明中使用BsmBI),其特点在于DNA识别序列和切割序列不重叠。预先在所有10个DNA片段中精准设计相同的BsmBI的DNA识别序列和不同的DNA切割序列。经过BsmBI切割后,所有的DNA片段都会产生4碱基长的粘末端。只有具有反向互补序列粘末端的DNA片段,在连接酶作用下,实现两个DNA片段的定向连接。同理,通过在需要连接的多个DNA片段两侧精准设计好酶切序列,待IIS型限制性内切酶作用后,可以获得含有不同序列的4碱基长的粘末端,便可以实现多片段DNA的定向组装。[0276]图4:本发明中包含重复单元表达元件的载体质粒结构示意图。[0277]图5:哺乳动物表达载体pCMV-TALEN结构示意图。【具体实施方式】[0278]定义[0279]核苷酸序列和氨基酸序列[0280]在本文中,除非另行指明,核苷酸序列从左向由为5’至3’方向,氨基酸序列从左向右为氨基至羧基方向。[0281]TALE重复单元和TALE识别序列[0282]在本文中,所谓“TALE重复单元”是指TALE蛋白中DNA结合结构域中的重复单元,所述重复单元通常由34个氨基酸组成,其氨基酸序列为LTPEQVVAIASZiZ2GGKQALETVQRLLPVLCQAHG,其中,Z1Z2代表两个氨基酸残基,称作RVDOtepeatVariableDiresidue)。RVD的选择决定了该TALE重复单元所识别的DNA碱基:[0283]当RVD为HD时,该TALE重复单元识别碱基C;[0284]当RVD为NI时,该TALE重复单元识别碱基A;[0285]当RVD为NG时,该TALE重复单元识别碱基T;[0286]当RVD为NN时,该TALE重复单元识别碱基G。[0287]在上述情况下,识别特定碱基的RVD序列即称为该碱基的TALE识别序列。[0288]IIS型限制性内切酶[0289]限制性内切酶是存在于许多物种中,能够在识别位点序列特异性结合DNA,并且在结合位点处或接近结合位点处切割DNA。IIS型限制性内切酶(或简称IIS型酶)是一类在与识别位点不同的位点切割DNA的限制性内切酶。举例而言,BsaI催化DNA的双链切割,其识别位点为,而在一条链距离其识别位点I个核苷酸处,而在另一条链距离其识别位点5个核苷酸处切割DNA双链。[0290]本发明中可使用的IIS型限制性内切酶包括但不限于表1中所列出的这些:[0291]表1:本发明可用的IIS型限制性内切酶[0292]【权利要求】1.一种核苷酸序列,所述核苷酸序列包含下述结构:Ri_Ln_Xn-Ln+1-R2,其中η选自I至m的自然数,m为7、8、9、10、11、12、13或14;R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;其中,L1为SEQIDNO:2的编码序列的J1至i+1-1位;Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+i_l位;Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;其中J1选自1至970-1;jm+1选自1至730-1;当k为2至m时,jk选自I至97-1,且L1至Lm+1彼此各不相同;当n=l时,XnSYD1,当n=m时,Xn为YE,当η为2至m-Ι时,Xn选自YDn或YSn,其中YDn为FLn-YLn-FMn-YRn-FRn,YSn为FLn-Yn-FRn,YE为FLm-Ym-FRE,其中,当n=l时,FL1为SEQIDNO:2的编码序列的J1+!至969位,但当1=9704时,该FL1为空序列,其他情况下:FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,FMnSSEQIDNO:1的编码序列,FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRn为空序列,其中Yn、YLn,YRn彼此独立地为碱基Α、C、T或G的TALE识别序列的编码序列。2.一种试剂盒,所述试剂盒包括m种核苷酸序列,且任选地包括表达载体,其中m为7、.8、9、10、11、12、13或14,其中第η种核苷酸序列包含下述结构:Ri_Ln_Xn-Ln+1-R2,其中η选自I至m的自然数;R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;其中,L1为SEQIDNO:2的编码序列的J1至i+1-1位;Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+i_l位;Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;其中J1选自1至970-1;jm+1选自1至730-1;当k为2至m时,jk选自I至97-1,且L1至Lm+1彼此各不相同;当n=l时,XnSYD1,当n=m时,Xn为YE,当η为2至m-Ι时,Xn选自YDn或YSn,其中YDn为FLn-YLn-FMn-YRn-FRn,YSn为FLn-Yn-FRn,YE为FLm-Ym-FRE,其中,当n=l时,FL1为SEQIDNO:2的编码序列的J1+!至969位,但当1=9704时,该FL1为空序列,其他情况下:FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,FMnSSEQIDNO:1的编码序列,FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRE为空序列,其中Yn、YLn,YRn彼此独立地为碱基Α、C、T或G的TALE识别序列的编码序列。其中所述表达载体包含下述结构:PN-L1-R2-M-R1-Llrt-PC-NE,R1和R2的定义如上所述;PN为SEQIDNO:2的编码序列的I至位,但当J1=I时,该PN为空序列;PC为SEQIDNO:3的编码序列的jm+1+i至729位,但当jm+1=730-1时,该PC为空序列;NE为核酸内切酶的编码序列;M为选择性标记。3.一种试剂盒,所述试剂盒包括20(m-Ι)种核苷酸序列,且任选地包括表达载体,其中m为7、8、9、10、11、12、13或14,所述20(m-Ι)种核苷酸序列分为m组,其中第η组核苷酸序列包含下述共同结构:Ri_Ln_Xn-Ln+1-R2,其中η选自I至m的自然数;R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;其中,L1为SEQIDNO:2的编码序列的J1至i+1-1位;Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+i_l位;Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;其中J1选自I至970-1;jm+1选自I至730-1;当k为2至m时,jk选自I至97-1,且L1至Lm+1彼此各不相同;对于第I组,XnSYD1,YD1为FL1-YL1-FM1-YR1-FR1,FL1为SEQIDNO:2的编码序列的J1+!至969位,但当1=9704时,该FL1为空序列,FR1为SEQIDNO:1的编码序列的I至j2_l位,但当j2=l时,该FRn为空序列,FM1为SEQIDNO:1的编码序列,第I组共包括16个序列,在这16个序列中,YL1和YR1分别为碱基A、C、T或G的TALE识别序列的编码序列的不同组合;对于第m组,Xn为YE,YE为FLm-Ym-FRE,其中,FLm为SEQIDNO:1的编码序列的jm+i至96位,但当jm=97-1时,该FLm为空序列,FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRE为空序列,第m组共包括4个序列,在这4个序列中,Yn分别为碱基A、C、T或G的TALE识别序列的编码序列;对于第2至m-Ι组,Xn选自YDn或YSn,其中YDn为FLn-YLn-FMn-YRn-FRn,YSn为FLn-Yn-FRn,其中,FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,FMnSSEQIDNO:1的编码序列,对于第2至m-Ι组,每组共包括20个序列,在其中16个序列中,Xn为YDn,且YLn和YRn分别为碱基A、C、T或G的TALE识别序列的编码序列的不同组合,在剩下4个序列中,Xn为YSn,且Yn分别为碱基A、C、T或G的TALE识别序列的编码序列;其中所述表达载体包含下述结构:PN-L1-R2-M-R1-Llrt-PC-NE,R1和R2的定义如上所述;PN为SEQIDNO:2的编码序列的I至位,但当J1=I时,该PN为空序列;PC为SEQIDNO:3的编码序列的jm+1+i至729位,但当jm+1=730-1时,该PC为空序列;NE为核酸内切酶的编码序列;M为选择性标记。4.一种组装DNA结合结构域元件的方法,其中所述DNA序列由不多于20个碱基组成:(I)根据目标DNA序列,将DNA序列按5’到3’端分为m个碱基组,第一个碱基组由2个碱基组成,第m个碱基组由I个碱基组成,其他各组由1个或2个碱基组成,其中m为7、.8、9、10、11、12、13或14;(2)根据所述m个碱基组的碱基序列,设计m个对应的核苷酸序列,和表达载体;其中第η种核苷酸序列包含下述结构:R1-Ln_Xn-Ln+1-R2,其中n是1至m的自然数;R1和R2分别为IIS型限制性内切酶识别序列及其反向互补序列;Ln和Ln+1为i个核苷酸的接头序列,i为该IIS型选择性内切酶酶切产生的粘性末端的长度;其中,L1为SEQIDNO:2的编码序列的J1至i+1-1位;Lm+1为SEQIDNO:3的编码序列的jm+1至jm+1+i_l位;Lk为SEQIDNO:1的编码序列的jk至jk+i_l位,k是2至m的自然数;其中J1选自1至970-1;jm+1选自1至730-1;当k为2至m时,jk选自I至97-1,且L1至Lm+1彼此各不相同;对于第1个碱基组,XnSYD1,对于第m个碱基组,XnSYE,对于第2至m-1个碱基组,当该碱基组由一个碱基组成时,XnSYSn,而当该碱基组由两个碱基组成时,Xn为YDn,其中YDn为FLn-YLn-FMn-YRn-FRn,YSn为FLn-Yn-FRn,YE为FLm-Ym-FRE,其中,当n=l时,FL1为SEQIDNO:2的编码序列的J1+!至969位,但当1=9704时,该FL1为空序列,其他情况下:FLn为SEQIDNO:1的编码序列的jn+i至96位,但当jn=97_i时,该FLn为空序列,FRn为SEQIDNO:1的编码序列的I至jn+1_l位,但当jn+1=l时,该FRn为空序列,FMnSSEQIDNO:1的编码序列,FRE为SEQIDNO:3的编码序列的I至jm+1_l位,但当jm+1=l时,该FRE为空序列,其中Yn、YLn,YRn彼此独立地为碱基Α、C、T或G的TALE识别序列的编码序列。当该碱基组由一个碱基组成时,Yn为该碱基的TALE识别序列的编码序列,而当该碱基组由两个碱基组成时,YL1^PYRn分别为所述碱基组中第一个和第二个YDn碱基的TALE识别序列的编码序列;其中所述表达载体包含下述结构:PN-L1-R2-M-R1-Llrt-PC-NE,R1和R2的定义如上所述;PN为SEQIDNO:2的编码序列的I至位,但当J1=I时,该PN为空序列;PC为SEQIDNO:3的编码序列的jm+1+i至729位,但当jm+1=730-1时,该PC为空序列;NE为核酸内切酶的编码序列;M为选择性标记;任选地,所述m种核苷酸序列并非设计的,而是直接从如本发明第三个方面所述的.20(m-1)个核苷酸中选取的;(3)将所述m种核苷酸序列,所述表达载体,与R1和R2对应的限制性内切酶HS,和DNA连接酶混合;(4)将(3)中的混合物用所述IIS型限制性内切酶酶切,并用DNA连接酶连接,获得包含组装的DNA结合结构域元件的表达载体;任选地,本发明的该方面还包括回收所述包含组装的DNA结合结构域元件的表达载体的方法,所述方法进一步包括下述步骤:(5)用(4)的反应产物转化、转导或转染宿主细胞,并针对选择性标记M筛选包含表达载体的宿主细胞;(6)在适于表达载体增殖的条件下,培养经筛选的宿主细胞,和(7)从培养的宿主细胞回收经增殖的表达载体。5.权利要求1-4任一项的核苷酸序列、试剂盒或方法,其中所述SEQIDNO:l的编码序列为:6.权利要求1-5任一项的核苷酸序列、试剂盒或方法,其中m为8至12的自然数,优选m为9至11的自然数,更优选m是10。7.权利要求1-6任一项的核苷酸序列、试剂盒或方法,其中所述核苷酸序列是载体,优选适于在宿主细胞中复制的载体,更优选可在宿主细胞中大量复制的载体。8.权利要求1-7任一项的核苷酸序列、试剂盒或方法,其中所述载体是质粒,优选地,所述质粒是多拷贝质粒。9.权利要求1-8任一项的核苷酸序列、试剂盒或方法,其中所述宿主是真核宿主。10.权利要求1-9任一项的核苷酸序列、试剂盒或方法,其中所述宿主是原核宿主,优选大肠杆菌。【文档编号】C12N15/11GK103898099SQ201210572536【公开日】2014年7月2日申请日期:2012年12月25日优先权日:2012年12月25日【发明者】袁晶,王惠申请人:袁晶,王惠