提高基因组编辑效率的方法与流程

文档序号:11899297阅读:475来源:国知局
提高基因组编辑效率的方法与流程

本发明提供一种提高基因组编辑效率的方法,特别是涉及一种新的能够显著提高同源重组概率的增效因子,将所述增效因子与基因组编辑系统结合可提高基因组编辑效率。



背景技术:

在CRISPR/Cas9基因编辑系统中,设计不同的sgRNA足以指导Cas9内切酶完成对DNA的定点切割,形成DNA双链断裂(DSB),进而启动细胞自身的两种修复机制——非同源末端连接(NHEJ)和同源重组(HR),实现错误修复或者引入改变,造成DNA序列改变,从而实现基因的定向修饰操作。

DNA断裂产生后,当细胞内不存在同源片段时,细胞会启动非同源末端连接修复机制,在切口附近随机缺失或插入碱基,连接断裂的DNA双链。当细胞内存在同源片段时,细胞会发生极低概率的同源重组;如单链退火(SSA)是细胞内同源重组的一种常见方式。

CRISPR/Cas9系统是通过同源重组修复机制实现目标基因中不同类型的修饰,包括基因的删除、添加和替换等。当CRISPR/Cas9系统应用于植物时,即使存在外源引入的同源片段,植物体内发生同源重组的概率依然很低,这成为限制基因组编辑效率的瓶颈,所以提高同源重组概率对于基因组编辑系统的优化具有重要的意义。

目前,提高同源重组概率主要有以下途径:1)抑制非同源末端连接;实验表明,若抑制非同源末端连接途径中的相关蛋白如Ku70、Ku80、Lig4等的表达,会提高同源重组的概率。2)引入增效因子;已报道在拟南芥中引入酵母的Rad54基因(ScRad54),能够使同源重组概率提高约27倍,但目前没有其他有效的增效因子。



技术实现要素:

本发明的目的是提供一种提高基因组编辑效率的方法,有效克服了现有技术在植物体内发生同源重组概率低进而影响精确编辑的技术缺陷。

为实现上述目的,本发明提供一种提高同源重组概率的方法,包括向宿主细胞中引入增效因子,所述增效因子具有SEQ ID NO:1所示的氨基酸序列组成的蛋白质。

进一步地,所述增效因子包含a)或b):

a)编码SEQ ID NO:1所示的氨基酸序列组成的蛋白质的多核苷酸序列;

b)SEQ ID NO:2所示的多核苷酸序列。

进一步地,编码所述增效因子的多核苷酸序列有效连接于第一调控序列。

更进一步地,所述第一调控序列包括Ⅱ型启动子和/或定位结构域。

优选地,所述Ⅱ型启动子包括花椰菜花叶病毒35S启动子或泛素启动子。

在上述技术方案的基础上,所述方法还包括向宿主细胞中引入序列操纵系统。

具体地,所述序列操纵系统为CRISPR/Cas系统。

进一步地,编码所述基因组编辑系统的多核苷酸序列有效连接于第二调控序列。

更进一步地,所述第二调控序列包括Ⅲ型启动子。

优选地,所述Ⅲ型启动子包括U6启动子或U3启动子。

在上述技术方案的基础上,所述宿主细胞为植物细胞。

为实现上述目的,本发明还提供一种基因组编辑系统,包括包含a)和b):

a)编码增效因子的多核苷酸序列;

b)编码序列操纵系统的多核苷酸序列;

其中,所述增效因子具有SEQ ID NO:1所示的氨基酸序列组成的蛋白质。

可选地,所述增效因子与所述序列操纵系统由不同载体表达。

可选地,所述增效因子与所述序列操纵系统由同一载体表达。

进一步地,所述增效因子包含a)或b):

a)编码SEQ ID NO:1所示的氨基酸序列组成的蛋白质的多核苷酸序列;

b)SEQ ID NO:2所示的多核苷酸序列。

进一步地,编码所述增效因子的多核苷酸序列有效连接于第一调控序列。

更进一步地,所述第一调控序列包括Ⅱ型启动子和/或定位结构域。

优选地,所述Ⅱ型启动子包括花椰菜花叶病毒35S启动子或泛素启动子。

在上述技术方案的基础上,所述序列操纵系统为CRISPR/Cas系统。

进一步地,编码所述CRISPR/Cas系统的多核苷酸序列有效连接于第二调控序列。

更进一步地,所述第二调控序列包括Ⅲ型启动子。

优选地,所述Ⅲ型启动子包括U6启动子或U3启动子。

为实现上述目的,本发明还提供一种提高基因组编辑效率的方法,包括向宿主细胞中引入所述基因组编辑系统。

进一步地,所述宿主细胞为植物细胞。

为实现上述目的,本发明还提供一种实现高效基因组编辑的方法,包括在生物体中表达所述基因组编辑系统。

为实现上述目的,本发明还提供一种高效编辑靶位点序列的方法,包括将所述基因组编辑系统导入生物体中。

为实现上述目的,本发明还提供一种产生基因组编辑的植物的方法,包括向植物基因组中引入编码所述基因组编辑系统的核苷酸序列。

为实现上述目的,本发明还提供一种产生基因组编辑植物种子的方法,包括将所述方法产生的基因组编辑的植物自交,从而获得具有基因组编辑植物种子。

为实现上述目的,本发明还提供一种培育基因组编辑植物的方法,包括:

种植至少一粒所述方法产生的所述基因组编辑植物种子;

使所述种子长成植株。

为实现上述目的,本发明还提供一种增效因子在提高同源重组概率中的用途,其中,所述增效因子具有SEQ ID NO:1所示的氨基酸序列组成的蛋白质。

为实现上述目的,本发明还提供一种所述基因组编辑系统在提高同源重组概率和/或提高基因组编辑效率中的用途。

本发明中所述的CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats),是指成簇的规律间隔的短回文重复序列,含有多个短同向重复的基因座,其被发现存在于约40%测序细菌的基因组中和90%测序古细菌的基因组中。CRISPR作为原核的免疫系统发挥功能,其赋予对外来遗传元件例如质粒和噬菌体的抵抗性。CRISPR系统提供了一种获得性免疫形式。外源DNA的短片段(称为间隔区)整合在CRISPR重复序列之间的基因组中,然后CRISPR间隔区以类似于真核生物中RNAi的方式用于识别和沉默外来遗传元件。

本发明所述Cas蛋白的非限制性实例包括:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8,Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同系物、或其修饰形式。这些酶是已知的;例如,化脓链球菌Cas9蛋白的氨基酸序列可见于SwissProt数据库登录号Q99ZW2下。在一些实施例中,未修饰的CRISPR酶如Cas9具有DNA切割活性。在一些实施例中,该CRISPR酶是Cas9,并且可以是来自化脓链球菌或肺炎链球菌的Cas9。

本发明中所述的Cas9,Ⅱ型CRISPR/Cas系统中一种重要的蛋白质成分,可以从生物体如链球菌属物种(Streptococcus sp.),优选酿脓链球菌(Streptococcus pyogenes)中分离得到。当Cas9与称为CRISPR RNA(crRNA)和反式激活crRNA(TracrRNA)的两个RNA复合时,形成活性核酸内切酶,从而切断入侵噬菌体或质粒中的外源遗传元件,以保护宿主细胞。crRNA从宿主基因组中的CRISPR元件转录,其中该CRISPR元件之前自外源入侵物捕获。研究表明通过融合crRNA和tracrRNA的必要部分产生的单链嵌合RNA可以取代Cas9/RNA复合体中的两个RNA以形成功能性核酸内切酶。Cas9蛋白质的变体可以是Cas9的突变体形式,其中催化性天冬氨酸残基改变为任何其它氨基酸。优选地,所述其它氨基酸可以是丙氨酸。

本发明中所述的向导RNA或引导RNA(guide RNA,gRNA),也称为小向导RNA(small guide RNA,sgRNA),作用于动质体(kinetoplastid)体内一种称为RNA编辑(RNA editing)的后转录修饰过程中,也是一种小型非编码RNA。可与pre-mRNA配对,并在其中插入一些尿嘧啶(U),产生具有作用的mRNA。向导RNA编辑的RNA分子,长度大约是60-80个核苷酸,是由单独的基因转录的,在gRNA的5’末端有一段锚定区,以特殊的G-U配对方式与非编辑的pre-mRNA序列互补,锚定序列促进gRNA与pre-mRNA中的编辑区互补,特意结合;在gRNA分子的中间部位有一个编辑区负责在被编辑的pre-mRNA分子中插入U的位置,其与被编辑mRNA精确互补;在gRNA分子的3’末端,有一段转录后加入的由大约15个非编码的PolyU序列,功能为把gRNA链接到pre-mRNA的编辑区的5’上游富含嘌呤碱基的核苷酸序列上。在编辑时,形成一个编辑体(editosome),以gRNA内部的序列作为模板进行转录物的校正,同时产生编辑的mRNA。

有三种类型CRISPR/Cas系统,其中涉及Cas9蛋白质和crRNA、tracrRNA的Ⅱ型CRISPR/Cas系统是代表性的。Cas9蛋白质通过人工修饰的向导RNA的导向作用可以打靶DNA序列的5’-N20-NGG-3’(N代表任何脱氧核苷酸碱基),N20是与gRNA的5’序列相同的20个碱基,NGG是PAM区(原型间隔子邻近基序,Protospacer-adjacent motif)。Cas9剪切的位点就是PAM附近的区域。相对于锌指和转录激活因子样效应物DNA结合蛋白提供了优势-因为在核苷酸结合CRISPR-Cas蛋白中的位点特异性由RNA分子调控而不是DNA结合蛋白调控。

本发明中所述重组,当用于例如细胞、核酸、蛋白质或载体时,表示该细胞、核酸、蛋白质或载体已通过引入异源核酸或蛋白质、或改变天然核酸或蛋白质而被修饰,或该细胞源自此修饰的细胞。

本发明中向导RNA可以以编码该向导RNA的RNA或DNA的形式转移到细胞或生物体中。向导RNA可以是分离的RNA、并入病毒载体的RNA的形式、或者在载体中编码。优选地,载体可以是病毒载体、质粒载体、或农杆菌载体。

编码向导RNA的DNA可以是包含编码向导RNA序列的载体。例如,可以通过用分离的向导RNA或包含编码向导RNA的序列和启动子的质粒DNA转染细胞或生物体,将向导RNA转染到细胞或生物体。

本发明中所述切割或剪切是指核苷酸分子共价骨架的断裂。向导RNA可以制备为特异于任何待切割的靶,通过向导RNA的靶特异性部分切割任何靶DNA。

本发明中所述非同源末端连接(Non-homologous end joining,NHEJ)指完全不需要任何模版的帮助,修复蛋白可以直接将DNA断裂的末端彼此拉近,再借由DNA连接酶的帮助将断裂的末端重新接合的修复机制。

本发明中所述同源重组(Homologous Recombination,HR)是指发生在非姐妹染色单体之间或同一染色体上含有同源序列的DNA分子之间或分子之内的重新组合。同源重组需要一系列的蛋白质催化,如原核生物细胞内的RecA、RecBCD、RecF、RecO、RecR等;以及真核生物细胞内的Rad51、Mre11-Rad50等等。同源重组反应通常根据交叉分子或Holliday结构的形成和拆分分为三个阶段,即前联会体阶段、联会体形成和Holliday结构的拆分。同源重组反应依赖于DNA分子之间的同源性,100%同源性的DNA分子之间的重组常见于非姐妹染色体之间的同源重组,称为Homologous Recombination,而小于100%同源性的DNA分子之间或分子之内的重组,则被称为Hemologus Recombination。后者可被负责碱基错配对的蛋白如原核细胞内的MutS或真核生物细胞内的MSH2-3等蛋白质“编辑”。同源重组可以双向交换DNA分子,也可以单向转移DNA分子,后者又被称为基因转换(Gene Conversion)。

本发明中,单链退火(SSA)模型是由Lin等于1984年提出的。在SSA模型中,重组在DNA双链断裂处开始,在单链特异性核酸外切酶的作用下,断裂点两侧逐渐形成DNA单链区域,这一过程持续到两个断点处出现互补DNA单链。互补DNA单链退火,非互补末端被切除,单链缺口修复连接,完成DNA重组。SSA模型没有其它模型所需的双链DNA的识别配对过程,不形成Holliday结构作为重组的中间过渡形式。因此,重组产生DNA双链交换,并丢失非退火区域单链DNA顺序。

本发明中所述的植物、植物组织或植物细胞的基因组,是指植物、植物组织或植物细胞内的任何遗传物质,且包括细胞核和质体和线粒体基因组。

本发明中所述的多核苷酸和/或核苷酸形成完整“基因”,在所需宿主细胞中编码蛋白质或多肽。本领域技术人员很容易认识到,可以将本发明的多核苷酸和/或核苷酸置于目的宿主中的调控序列控制下。

如本申请,包括权利要求中使用的,除非上下文中清楚地另有说明,否则单数和单数形式的术语,例如“一”、“一个”和“该”,包括复数指代物。因此,例如“植物”、“该植物”或“一个植物”也指示多个植物。并且根据上下文,使用术语“植物”还可指示该植物在遗传上相似或相同的后代。类似地,术语“核酸”可以指核酸分子的许多拷贝。类似地,术语“探针”可以指代相同或相似的探针分子。

数字范围包括限定该范围的数字,并明确地包括所限定的范围内的每个整数和非整数分数。除非另外指出,否则本文所用的全部技术和科学术语具有与本领域普通技术人员普遍理解的相同的含义。

本发明中,术语“核酸”、“核苷酸”、“核苷酸序列”、“寡核苷酸”和“多核苷酸”可互换使用,它们是指具有任何长度的核苷酸的聚合形式,根据上下文含义,可指代DNA或RNA、或其类似物。其中DNA包括但不限于cDNA、基因组DNA、合成DNA(例如人工合成)和含核酸类似物的DNA(或RNA)。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。核酸可为双链或单链(既有义链或反义单链)。多核苷酸的非限制性示例包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物、以及核酸类似物。

本发明中“非天然存在的”表明人工的参与。当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。

本发明中“表达”指感兴趣的序列转录产生对应mRNA并且该mRNA翻译产生对应产物,即肽、多肽或蛋白。调节元件控制或调整感兴趣的序列表达,所述调节元件包括5’调节元件如启动子。

本发明中“多肽”、“肽”和“蛋白质”可互换地使用,是指具有任何长度的氨基酸聚合物。该聚合物可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物;这些修饰例如二硫键形成、糖基化、脂化、乙酰化、磷酸化、或任何其他操作,如与标记组分的结合。术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及D和L旋光异构体、以及氨基酸类似物和肽模拟物。

本发明中术语“载体”是指能够在宿主细胞内复制的DNA分子。质粒和粘粒是示例性载体。此外,术语“载体”和“媒介”可互换使用以指将DNA片段从一种细胞转移至另一种细胞的核酸分子,因此细胞不必要属于相同的生物(例如将DNA片段从农杆菌细胞转移至植物细胞)。

本发明中术语“表达载体”是指含有所需要的编码序列和在特定宿主生物中表达有效连接的编码序列所需要的适宜核酸序列的重组DNA分子。

本发明中术语“重组表达载体”指来自任何来源、能够整合入基因组或自主复制的任何因子如质粒、粘粒、病毒、BAC(细菌人工染色体)、自主复制型序列、噬菌体、或者线性或环状单链或双链DNA或RNA核苷酸序列,包括其中一种或多种DNA序列使用众所周知的重组DNA技术以功能性可操作方式连接的DNA分子。

本发明中,真核生物有3类RNA聚合酶,负责转录3类不同的启动子。由RNA聚合酶I负责转录的rRNA基因,启动子(I型)比较单一,由转录起始位点附近的两部分序列构成:第一部分是核心启动子(core promoter),由-45—+20位核苷酸组成,单独存在时就足以起始转录;另一部分由-170—-107位序列组成,称为上游调控元件,能有效地增强转录效率。

由RNA聚合酶Ⅲ负责转录的是5S rRNA、tRNA和某些核内小分子RNA(snRNA),其启动子(Ⅲ型)组成较复杂,又可被分为两个亚类:一类属于结构基因内启动子,一类属于结构基因外启动子。内启动子的有效启动依赖于基因内部包含的两个不连续的DNA片段,这两个DNA片段包括一些不同的连续DNA序列A、B或C区,两个区之间被隔开。根据两个区的不同组合,可以分为I类和II类两种:I类包括A和C区,目前发现其仅存在于5S rRNA的基因中;II类包括A和B区,存在于tRNA的基因、7SLRNA的基因、腺病毒VAI与VAII的RNA中。A、B或A、C内部DNA序列是转录因子TFⅢA和TFⅢC转录启动结合部位。在多数情况下,5’端还会有其它调节或关键元件,这些元件对RNA的高效转录是必需的。这些序列的存在与否之间影响着转录效率。这些序列呈现复杂的多样性,不过大多数启动子5’端-30到-20处存在着TATA盒样序列,与外启动子相似。外启动子缺乏相应的内部序列,仅在5’端有顺式作用元件,在基因的末端有一组由4个或更多胸腺嘧啶组成的终止信号,如脊椎动物U6核小RNA和7SK RNA启动子,这些启动子都高度相似或完全相同,其位置和碱基序列高度保守,其结构与pol II启动子也有一定的相似性。它们的5’端顺式作用元件包括几个控制元件,在其上游约-30处存在一个TATA样序列,近-60处有一个snRNA PSE(snRNA近似序列)和一个或多个被称为OCT的修饰序列5’-ATGCAAAT-3’。TATA样序列是pol III对snRNA基因进行转录特异的。TATA样元件和PSE元件共同决定了转录起始位点的选择和转录效率。TATA样元件和PSE元件之间的距离决定了RNA聚合酶转录的特异性,但似乎TATA样元件更重要,因为在PSE缺失的U6RNA和7SK RNA基因转录中,只有转录效率的下降。而且,PSE元件可能和B盒(boxB)相关,B盒在一定程度上可以替代PSE元件。这些序列对下游基因的转录具有决定性的作用,而且它们与起始位点相距较远,往往超过150bp,而对pol III内启动子来说,一般在80bp以内;与pol III外启动子相比,pol II启动子5’端各顺式作用元件的作用刚好相反,如果TATA样元件缺失,PSE则可以履行TATA样元件功能,决定转录的起始部位。在PSE上游,外启动子还有一个远端控制序列,其结构与pol II增强子OCT骨架相似,但较其复杂。而在-223处还有一个CACC序列与OCT骨架相连。这些远端控制序列的存在可大大提高U6RNA和7SK RNA的表达效率。

由RNA聚合酶II负责转录的II型基因包括所有蛋白质编码基因和部分snRNA基因,后者的启动子结构与III型基因启动子中的第三亚类相似,编码蛋白质的II型基因启动子在结构上有共同的保守序列。转录起始位点没有广泛的序列同源性,但第一个碱基为腺嘌呤,而两侧是嘧啶碱基。这个区域被称为起始子(initiator,Inr),序列可表示为Py2CAPy5。Inr元件位于-3—+5。仅由Inr元件组成的启动子是具有可被RNA聚合酶II识别的最简单启动子形式。多数II型启动子有一个被称为TATA盒的共有序列,通常处于-30区,相对于转录起始位点的位置比较固定。TATA盒存在于所有真核生物中,TATA盒是一个保守的七碱基对,也有一些II型启动子不含有TATA盒,这样的启动子称为无TATA盒启动子。

本发明中所述“有效连接”或“可操作地连接”表示核酸序列的联结,所述联结使得一条序列可提供对相连序列来说需要的功能。在本发明中所述“有效连接”可以为将启动子与感兴趣的序列相连,使得该感兴趣的序列的转录受到该启动子控制和调控。当感兴趣的序列编码蛋白并且想要获得该蛋白的表达时“有效连接”表示:启动子与所述序列相连,相连的方式使得得到的转录物高效翻译。如果启动子与编码序列的连接是转录物融合并且想要实现编码的蛋白的表达时,制造这样的连接,使得得到的转录物中第一翻译起始密码子是编码序列的起始密码子。备选地,如果启动子与编码序列的连接是翻译融合并且想要实现编码的蛋白的表达时,制造这样的连接,使得5’非翻译序列中含有的第一翻译起始密码子与启动子相连结,并且连接方式使得得到的翻译产物与编码想要的蛋白的翻译开放读码框的关系是符合读码框的。可以“有效连接”的核酸序列包括但不限于:提供基因表达功能的序列(即基因表达元件,例如启动子、5’非翻译区域、内含子、蛋白编码区域、3’非翻译区域、聚腺苷化位点和/或转录终止子)、提供DNA转移和/或整合功能的序列(即T-DNA边界序列、位点特异性重组酶识别位点、整合酶识别位点)、提供选择性功能的序列(即抗生素抗性标记物、生物合成基因)、提供可计分标记物功能的序列、体外或体内协助序列操作的序列(即多接头序列、位点特异性重组序列)和提供复制功能的序列(即细菌的复制起点、自主复制序列、着丝粒序列)。

本发明中,所述调控序列包括但不限于启动子、转运肽、终止子,增强子,前导序列,内含子以及其它可操作地连接到CRISPR系统的一个或多个元件,从而驱动该CRISPR系统的所述一个或多个元件的表达。一般而言,CRISPR(规律间隔成簇短回文重复),也称为SPIDR(Spacer间隔开的同向重复),构成通常对于特定细菌物种而言特异性的DNA基因座的家族。该CRISPR座位包含在大肠杆菌中被识别的间隔开的短序列重复(SSR)的一个不同类、以及相关基因。类似的间隔开的SSR已经鉴定于地中海富盐菌、化脓链球菌、鱼腥草属和结核分枝杆菌中。这些CRISPR座位典型地不同于其它SSR的重复结构,这些重复已被称为规律间隔的短重复(SRSR)。一般而言,这些重复是以簇存在的短元件,其被具有基本上恒定长度的独特间插序列规律地间隔开。虽然重复序列在菌株之间是高度保守的,许多间隔开的重复和这些间隔区的序列一般在菌株与菌株之间不同,已经在40种以上的原核生物中鉴定出CRISPR座位。

本发明中,“靶序列”或“靶位点序列”是待被作用的任何期望的预定的核酸序列,包括但不限于编码或非编码序列、基因、外显子或内含子、调节序列、基因间序列、合成序列和细胞内寄生物序列。在一些实施方案中,靶序列存在于靶细胞、组织、器官或生物体内。

术语“引物”是一段分离的核酸分子,其通过核酸杂交,退火结合到互补的目标DNA链上,在引物和目标DNA链之间形成杂合体,然后在聚合酶(例如DNA聚合酶)的作用下,沿目标DNA链延伸。本发明的引物对涉及其在目标核酸序列扩增中的应用,例如,通过聚合酶链式反应(PCR)或其他常规的核酸扩增方法。

引物的长度一般是11个多核苷酸或更多,优选的是18个多核苷酸或更多,更优选的是24个多核苷酸或更多,最优选的是30个多核苷酸或更多。这种引物在高度严格杂交条件下与目标序列特异性地杂交。尽管不同于目标DNA序列且对目标DNA序列保持杂交能力的引物是可以通过常规方法设计出来的,但是,优选的,本发明中的引物与目标序列的连续核酸具有完全的DNA序列同一性。

本发明中氨基酸序列的取代、缺失或添加是本领域的常规技术,优选这种氨基酸变化为:小的特性改变,即不显著影响蛋白的折叠和/或活性的保守氨基酸取代;小的缺失,通常约1-30个氨基酸的缺失;小的氨基或羧基端延伸,例如氨基端延伸一个甲硫氨酸残基;小的连接肽,例如约20-25个残基长。

保守取代的实例是在下列氨基酸组内发生的取代:碱性氨基酸(如精氨酸、赖氨酸和组氨酸)、酸性氨基酸(如谷氨酸和天冬氨酸)、极性氨基酸(如谷氨酰胺、天冬酰胺)、疏水性氨基酸(如亮氨酸、异亮氨酸和缬氨酸)、芳香氨基酸(如苯丙氨酸、色氨酸和酪氨酸),以及小分子氨基酸(如甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的那些氨基酸取代在本领域内是众所周知的,并且已由,例如,N.Neurath和R.L.Hill在1979年纽约学术出版社(Academic Press)出版的《Protein》中进行了描述。最常见的互换有Ala/Ser,Val/Ile,Asp/Glu,Thu/Ser,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,以及它们相反的互换。

对于本领域的技术人员而言显而易见地,这种取代可以在对分子功能起重要作用的区域之外发生,而且仍产生活性多肽。对于由本发明的多肽,其活性必需的并因此选择不被取代的氨基酸残基,可以根据本领域已知的方法,如定点诱变或丙氨酸扫描诱变进行鉴定(如参见,Cunningham和Wells,1989,Science 244:1081-1085)。后一技术是在分子中每一个带正电荷的残基处引入突变,检测所得突变分子的抗虫活性,从而确定对该分子活性而言重要的氨基酸残基。底物-酶相互作用位点也可以通过其三维结构的分析来测定,这种三维结构可由核磁共振分析、结晶学或光亲和标记等技术测定(参见,如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol 224:899-904;Wlodaver等,1992,FEBS Letters 309:59-64)。

本发明的引物在严格条件下与目标DNA序列杂交。核酸分子或其片段在一定情况下能够与其他核酸分子进行特异性杂交。如本发明使用的,如果两个核酸分子能形成反平行的双链核酸结构,就可以说这两个核酸分子彼此间能够进行特异性杂交。如果两个核酸分子显示出完全的互补性,则称其中一个核酸分子是另一个核酸分子的“互补物”。如本发明使用的,当一个核酸分子的每一个核苷酸都与另一个核酸分子的对应核苷酸互补时,则称这两个核酸分子显示出“完全互补性”。如果两个核酸分子能够以足够的稳定性相互杂交从而使它们在至少常规的“低度严格”条件下退火且彼此结合,则称这两个核酸分子为“最低程度互补”。类似地,如果两个核酸分子能够以足够的稳定性相互杂交从而使它们在常规的“高度严格”条件下退火且彼此结合,则称这两个核酸分子具有“互补性”。从完全互补性中偏离是可以允许的,只要这种偏离不完全阻止两个分子形成双链结构。为了使一个核酸分子能够作为引物或探针,仅需保证其在序列上具有充分的互补性,以使得在所采用的特定溶剂和盐浓度下能形成稳定的双链结构。

如本发明使用的,基本同源的序列是一段核酸分子,该核酸分子在高度严格条件下能够和相匹配的另一段核酸分子的互补链发生特异性杂交。促进DNA杂交的适合的严格条件,例如,大约在45℃条件下用6.0×氯化钠/柠檬酸钠(SSC)处理,然后在50℃条件下用2.0×SSC洗涤,这些条件对本领域技术人员是公知的。例如,在洗涤步骤中的盐浓度可以选自低度严格条件的约2.0×SSC、50℃到高度严格条件的约0.2×SSC、50℃。此外,洗涤步骤中的温度条件可以从低度严格条件的室温约22℃,升高到高度严格条件的约65℃。温度条件和盐浓度可以都发生改变,也可以其中一个保持不变而另一个变量发生改变。优选地,本发明的一个核酸分子可以在中度严格条件下,例如在约2.0×SSC和约65℃下与SEQ ID NO:2或其互补序列,或者上述序列的任一片段发生特异性杂交。更优选地,本发明的一个核酸分子在高度严格条件下与SEQ ID NO:2或其互补序列,或者上述序列的任一片段发生特异性杂交。本发明中,优选的标记物核酸分子具有SEQ ID NO:2或其互补序列,或者上述序列的任一片段。本发明另一优选的标记物核酸分子与SEQ ID NO:2或其互补序列,或者上述序列的任一片段具有80%到100%或90%到100%的序列同一性。SEQ ID NO:2可以用作植物育种方法中的标记物以鉴定遗传杂交的后代。探针与目标DNA分子的杂交可以通过任何一种为本领域技术人员所熟知的方法进行检测,这些方法包括但不限于,荧光标记、放射性标记、抗体类标记和化学发光标记。

关于使用特定的扩增引物对目标核酸序列进行的扩增(例如,通过PCR),“严格条件”指的是在DNA热扩增反应中仅允许引物对目标核酸序列发生杂交的条件,具有与目标核酸序列相应的野生型序列(或其互补序列)的引物,能够与所述目标核酸序列结合,并且优选产生唯一的扩增产物,扩增产物即扩增子。

术语“特异性结合(目标序列)”是指在严格杂交条件下引物仅与包含目标序列的样品中的目标序列发生杂交。

本发明中,“试剂盒”可包括本发明描述的基因组修饰系统与以下的任一种或全部:测定试剂、缓冲液、探针和/或引物、和无菌盐水或另一种药学上可接受的乳剂和悬液基底。此外,试剂盒可包括含有用于实践本发明描述的方法的用法说明(例如,操作方案)的说明性材料。

转化方案以及将核苷酸序列导入植物的方案依定向转化的植物或植物细胞类型而异,即单子叶植物或双子叶植物。将核苷酸序列导入植物细胞并随后插入植物基因组中的适合方法包括但不限于,农杆菌介导的转化、微量发射轰击、直接将DNA摄入原生质体、电穿孔或晶须硅介导的DNA导入。

已经转化的细胞可按照常规的方式生长成植物。这些植物被培育,用相同的转化株或不同的转化株授粉,得到的杂交体表达所需的被鉴定的表现型特征。可培育二代或多代以保证稳定地保持和遗传所需表现型特征的表达,然后收获可保证得到所需表现型特征表达的种子。

本发明提供了一种提高基因组编辑效率的方法,具有以下优点:

1、本发明提供了一些新的增效因子,能够显著提高细胞内同源重组概率,促进同源重组的发生,为提高植物体中同源重组概率提供了新的途径;

2、本发明提供了一种更高效的基因组编辑系统,当本发明所述增效因子在与分子剪刀共同使用时,可以显著提升分子剪刀的切割效率,进而提升基因组编辑的效率。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明提高基因组编辑效率的方法中重组克隆载体DBN01-T构建流程图;

图2为本发明提高基因组编辑效率的方法中重组表达载体DBN-A构建流程图;

图3为本发明提高基因组编辑效率的方法中重组表达载体DBN-B01载体结构图;

图4为本发明提高基因组编辑效率的方法中剪刀载体DBN-C载体结构图;

图5为本发明提高基因组编辑效率的方法中不同增效因子对于报告载体同源重组概率的增效倍数示意图;

图6为本发明提高基因组编辑效率的方法中不同增效因子对于剪刀载体切割效率的增效倍数示意图。

具体实施方式

下面通过具体实施例进一步说明本发明提高基因组编辑效率的方法的技术方案。

第一实施例、报告载体DBN-A的构建

1、获得GUUS核苷酸序列

编码相应于所述GUUS核苷酸序列(3086bp),如序列表SEQ ID NO:6所示,所述GUUS核苷酸序列(如序列表中SEQ ID NO:6所示)由南京金斯瑞生物科技有限公司合成。合成的所述GUUS核苷酸序列(如序列表中SEQ ID NO:6所示)的5’端还连接有SacI酶切位点;合成的所述GUUS核苷酸序列(如序列表中SEQ ID NO:6所示)的3’端还连接有BamHI酶切位点。

2、重组克隆载体的构建

将合成的GUUS核苷酸序列连入克隆载体pGEM-T(Promega,Madison,USA,CAT:A3600)上,操作步骤按Promega公司产品pGEM-T载体说明书进行,得到重组克隆载体DBN01-T,其构建流程如图1所示(其中,Amp表示氨苄青霉素抗性基因;f1表示噬菌体f1的复制起点;LacZ为LacZ起始密码子;SP6为SP6RNA聚合酶启动子;T7为T7RNA聚合酶启动子;GUUS为GUUS核苷酸序列(GUUS核苷酸序列如SEQ ID NO:6所示);MCS为多克隆位点)。

然后将重组克隆载体DBN01-T用热激方法转化大肠杆菌T1感受态细胞(Transgen,Beijing,China,CAT:CD501),其热激条件为:50μl大肠杆菌T1感受态细胞、10μl质粒DNA(重组克隆载体DBN01-T),42℃水浴30秒;37℃振荡培养1小时(100rpm转速下摇床摇动),在表面涂有IPTG(异丙基硫代-β-D-半乳糖苷)和X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷)的氨苄青霉素(100mg/L)的LB平板(胰蛋白胨10g/L,酵母提取物5g/L,NaCl 10g/L,琼脂15g/L,用NaOH调pH至7.5)上生长过夜。挑取白色菌落,在LB液体培养基(胰蛋白胨10g/L,酵母提取物5g/L,NaCl 10g/L,氨苄青霉素100mg/L,用NaOH调pH至7.5)中于温度37℃条件下培养过夜。碱法提取其质粒:将菌液在12000rpm转速下离心1min,去上清液,沉淀菌体用100μl冰预冷的溶液I(25mM Tris-HCl,10mM EDTA(乙二胺四乙酸),50mM葡萄糖,pH8.0)悬浮;加入200μl新配制的溶液II(0.2M NaOH,1%SDS(十二烷基硫酸钠)),将管子颠倒4次,混合,置冰上3-5min;加入150μl冰冷的溶液III(3M醋酸钾,5M醋酸),立即充分混匀,冰上放置5-10min;于温度4℃、转速12000rpm条件下离心5min,在上清液中加入2倍体积无水乙醇,混匀后室温放置5min;于温度4℃、转速12000rpm条件下离心5min,弃上清液,沉淀用浓度(V/V)为70%的乙醇洗涤后晾干;加入30μl含RNase(20μg/ml)的TE(10mM Tris-HCl,1mM EDTA,pH8.0)溶解沉淀;于温度37℃下水浴30min,消化RNA;于温度-20℃保存备用。

提取的质粒经SacI和BamHI酶切鉴定后,对阳性克隆进行测序验证,结果表明重组克隆载体DBN01-T中插入的所述GUUS核苷酸序列为序列表中SEQ ID NO:6所示的核苷酸序列,即GUUS核苷酸序列正确插入。

3、重组表达载体的构建

将pCAMBIA2300(CAMBIA机构可以提供)载体进行改造,利用常规的酶切方法构建载体是本领域技术人员所熟知的,通过点突变去掉pCAMBIA2300载体上的BsaI位点,同时将卡那霉素表达盒去掉,得到pDBN骨架载体。向所述pDBN骨架载体引入花椰菜花叶病毒35S启动子和终止子,得到表达载体DBN-OE1,用于下述载体构建。

用限制性内切酶SacI和BamHI酶切重组克隆载体DBN01-T和表达载体DBN-OE1,将切下的GUUS核苷酸序列插入表达载体DBN-OE1,利用常规的酶切方法构建载体是本领域技术人员所熟知的,构建成重组表达载体DBN-A,其构建流程如图2所示(Kan:卡那霉素基因;RB:右边界;pr35S:花椰菜花叶病毒35S启动子(SEQ ID NO:7);GUUS:GUUS核苷酸序列(SEQ ID NO:6);t35S:花椰菜花叶病毒35S终止子(SEQ ID NO:8);LB:左边界)。

第二实施例、测试载体的构建

1、序列合成

水稻ExoI增效因子(OsExoI)的氨基酸序列(836个氨基酸),如序列表中SEQ ID NO:1所示;编码相应于OsExoI氨基酸序列的OsExoI核苷酸序列(2511个核苷酸),如序列表中SEQ ID NO:2所示。

炭疽菌DNTT增效因子(CoDNTT)的氨基酸序列(291个氨基酸),如序列表中SEQ ID NO:3所示;依据水稻密码子优化后编码相应于CoDNTT氨基酸序列的CoDNTT核苷酸序列(876个核苷酸),如序列表中SEQ ID NO:4所示。

依据水稻密码子优化后编码相应于酵母Rad54增效因子(ScRad54)的氨基酸序列的ScRad54核苷酸序列(2697个核苷酸),如序列表中SEQ ID NO:5所示。

所述OsExoI核苷酸序列(如序列表中SEQ ID NO:2所示)、所述CoDNTT核苷酸序列(如序列表SEQ ID NO:4)和所述ScRad54核苷酸序列(如序列表中SEQ ID NO:5所示)由南京金斯瑞生物科技有限公司合成。合成的所述OsExoI核苷酸序列(SEQ ID NO:2)、所述CoDNTT核苷酸序列(SEQ ID NO:4)和所述ScRad54核苷酸序列(SEQ ID NO:5)的5’端和3’端分别均连接有BsaI酶切位点。

2、重组表达载体的构建

按照上述第一实施例2中的方法,将所述OsExoI核苷酸序列连入克隆载体pGEM-T上,得到重组克隆载体DBN02-T,其中OsExoI为水稻ExoI增效因子的核苷酸序列(SEQ ID NO:2)。酶切和测序验证重组克隆载体DBN02-T中所述OsExoI核苷酸序列正确插入。

按照上述第一实施例2中的方法,将所述CoDNTT核苷酸序列连入克隆载体pGEM-T上,得到重组克隆载体DBN03-T,其中CoDNTT为依据水稻密码子优化的炭疽菌DNTT增效因子的核苷酸序列(SEQ ID NO:4)。酶切和测序验证重组克隆载体DBN03-T中所述CoDNTT核苷酸序列正确插入。

按照上述第一实施例2中的方法,将所述ScRad54核苷酸序列连入克隆载体pGEM-T上,得到重组克隆载体DBN04-T,其中ScRad54为依据水稻密码子优化的酵母Rad54增效因子的核苷酸序列(SEQ ID NO:5)。酶切和测序验证重组克隆载体DBN04-T中所述ScRad54核苷酸序列正确插入。

按照第一实施例3中所述方法,向所述表达载体DBN-OE1引入prZmUbi启动子和tNos终止子,中间引入BsaI酶切位点,得到表达载体DBN-OE2,用于下述载体构建。

用BsaI酶切重组克隆载体DBN02-T和表达载体DBN-OE2,将切下的OsExoI核苷酸序列插入表达载体DBN-OE2,利用常规的酶切方法构建载体是本领域技术人员所熟知的,构建成重组表达载体DBN-B01,其载体结构如图3所示(Kan:卡那霉素基因;RB:右边界;pr35S:花椰菜花叶病毒35S启动子(SEQ ID NO:7);GUUS:GUUS核苷酸序列(SEQ ID NO:6);t35S:花椰菜花叶病毒35S终止子(SEQ ID NO:8);prZmUbi:玉米泛素(Ubiquitin)基因启动子(SEQ ID NO:9);OsExoI:水稻ExoI增效因子的核苷酸序列(SEQ ID NO:2);tNos:胭脂碱合成酶基因的终止子(SEQ ID NO:10);LB:左边界)。

按照上述构建重组表达载体DBN-B01方法,用BsaI酶切重组克隆载体DBN03-T切下的所述CoDNTT核苷酸序列插入表达载体DBN-OE2,得到重组表达载体DBN-B02,酶切和测序验证重组表达载体DBN-B02中的核苷酸序列含有为序列表中SEQ ID NO:4所示核苷酸序列,即依据水稻密码子优化的CoDNTT核苷酸序列,所述依据水稻密码子优化的CoDNTT核苷酸序列可以连接所述prZmUbi启动子和tNos终止子。

按照上述构建重组表达载体DBN-B01方法,用BsaI酶切重组克隆载体DBN04-T切下的所述ScRad54核苷酸序列插入表达载体DBN-OE2,得到重组表达载体DBN-B03,酶切和测序验证重组表达载体DBN-B03中的核苷酸序列含有为序列表中SEQ ID NO:5所示核苷酸序列,即依据水稻密码子优化的ScRad54核苷酸序列,所述依据水稻密码子优化的ScRad54核苷酸序列可以连接所述prZmUbi启动子和tNos终止子。

第三实施例、剪刀载体的构建

根据Cas9蛋白识别PAM序列(NGG/NGGNG)的原则,在CRISPRDirect网站(http://crispr.dbcls.jp/)筛选到来源于玉米的一个靶位点序列(20bp),即45CS1靶位点序列,如SEQ ID NO:11所示。

45CS1正向引物:tacccaggtctcaggcaCCCAAGAGCGGGCGAGGTAG,如SEQ ID NO:12所示;

45CS1反向引物:taagttggtctcgaaacCTACCTCGCCCGCTCTTGGG,如SEQ ID NO:13所示;

其中,上述引物5’端的粗体小写字母为保护碱基,斜体小写字母为BsaI酶切位点,带下划线的小写字母为BsaI酶切位点的粘性末端,正常字体大写字母为45CS1靶位点序列或其反向互补序列。

所述45CS1正向引物和所述45CS1反向引物分别包括45CS1靶位点序列,二者反向互补,互为模板,用Pfu酶(NEB)进行PCR扩增,PCR体系如下:

PCR反应条件为:98℃预变性30s,然后进入下列循环:98℃变性10s,56-60℃退火30s,72℃延伸30s/kb,共30-32个循环,最后72℃延伸5-10min;于4℃保存。

使用过柱纯化试剂盒(购自北京全式金生物技术有限公司)对上述PCR产物过柱纯化,具体方法参考其产品说明书;用BsaI酶切PCR产物和市售表达载体pRGEB32(购自Addgene),切胶回收对应酶切产物后,将酶切后的表达载体pRGEB32产物和PCR产物按照1:10的比例用T4连接酶于温度16℃下连接30min,利用常规的酶切方法构建载体是本领域技术人员所熟知的,获得引入了45CS1靶位点的剪刀载体DBN-C,其载体结构如图4所示(Kan:卡那霉素基因;LB:右边界;Hpt:潮霉素磷酸转移酶基因;pr35S:花椰菜花叶病毒35S启动子;prU3:水稻U3启动子;45CS1:45CS1靶位点序列(SEQ ID NO:11);sgRNA:sgRNA序列;prZmUbi:玉米泛素(Ubiquitin)基因启动子;Cas9:Cas9核苷酸序列;Ter:可以为花椰菜花叶病毒35S终止子;RB:右边界),按照第一实施例2中的方法,将剪刀载体DBN-C用热激方法转化大肠杆菌T1感受态细胞,碱法提取其质粒,提取的质粒进行测序验证,结果表明剪刀载体DBN-C构建正确。

第四实施例、重组表达载体转化农杆菌

对己经构建正确的重组表达载体DBN-A、DBN-B01、DBN-B02、DBN-B03和DBN-C用液氮法转化到农杆菌LBA4404(Invitrgen,Chicago,USA,CAT:18313-015)中,其转化条件为:100μl农杆菌LBA4404、3μl质粒DNA(重组表达载体);置于液氮中5min,37℃温水浴5min;将转化后的农杆菌LBA4404接种于LB试管中于温度28℃、转速为200rpm条件下培养2小时,涂于含25mg/L的利福平(Rifampicin)和50mg/L的卡那霉素的LB平板上直至长出阳性单克隆,挑取单克隆培养并提取其质粒,用限制性内切酶对重组表达载体DBN-A、DBN-B01、DBN-B02、DBN-B03和DBN-C酶切后进行酶切验证,结果表明重组表达载体DBN-A、DBN-B01、DBN-B02、DBN-B03和DBN-C结构完全正确。

第五实施例、增效因子在报告载体中的功能验证

1、瞬时转化的烟草植株的获得

活化菌液:用包含重组表达载体DBN-A、DBN-B01、DBN-B02和DBN-B03的LBA4404菌种划线,按照1:50的比例将温度-80℃冻存菌液(LBA4404)接种至1ml含25mg/L利福平和50mg/L卡那霉素的YEP培养基(牛肉浸膏10g/L、酵母提取液10g/L、NaCl 5g/L,pH7.0)中;约20h后,按照1:100的比例,将上述培养菌液增加至4ml,并于温度28℃下过夜培养16-18h(OD600值约为2),而后在转速为8000rpm条件下离心4min,弃上清,用10mM MgCl2将弃上清后的菌液浓度调至OD600=1;加入终浓度为10mM的2-吗啉乙磺酸(MES,pH5.6),然后加入终浓度为200μM的乙酰丁香酮(AS),室温静止放置3小时后获得侵染液。

用不带针头的注射器将侵染液注射进烟草叶片(6-8周),设5组处理,每组处理为在同一片叶片左边注射含有DBN-A的侵染液,右边分别注射含有DBN-B01、DBN-B02和DBN-B03的侵染液,并黑暗处理48-72h。获得转入DBN-A-B01的烟草叶片、转入DBN-A-B02的烟草叶片和转入DBN-A-B03的烟草叶片,每组处理设3次重复。

2、瞬时转化烟草植株的GUS定量测定

分别取瞬时转化获得的转入DBN-A-B01的烟草叶片、转入DBN-A-B02的烟草叶片和转入DBN-A-B03的烟草叶片作为样品,参照Jefferson等(Jefferson,R.A.,Kavanagh,T.A.and Bevan,M.W.GUS fusions:beta-glucuronidase as a sensitive and versatile gene fusion marker in higher plants.EMBO J.,1987,3901-3907)的方法,用4-甲基伞形酮(4-MU)通过荧光法测定GUS活性,即增效因子有助于使GUUS恢复GUS染色。实验设3次重复,以注射含有DBN-A的侵染液的部分作为对照,取平均值。测定GUS活性的具体方法如下:

步骤1、分别称取新鲜的转入DBN-A-B01的烟草叶片、转入DBN-A-B02的烟草叶片和转入DBN-A-B03的烟草叶片各20mg,用植物总蛋白提取试剂盒(采购自北京康为世纪生物科技有限公司)提取上述样品的叶片总蛋白,具体方法参考其产品说明书;

步骤2、在温度4℃、转速13000rpm下离心10min后,收集上清液,并置4℃下保存;

步骤3、在250μl预热(37℃、至少30min)的反应缓冲液(50mM Na3PO4(pH7.0)、1mM二硫苏糖醇(DTT)、10mM EDTA、0.1%十二烷基肌氨酸钠(Sarcosyl)、0.1%聚乙二醇辛基苯基醚(Triton X-100)、1mM 4-甲基伞形酮酰-β-葡萄糖苷酸(MUG))中加入50μl所述上清液,混匀,于温度37℃下反应15min后,取出30μl加入到270μl反应终止液(2%(m/v)碳酸钠)中终止反应;

步骤4、制作4-MU的标准曲线(0、50、100、250、500、1000、1500和2000pmol 4-MU稀释于2%碳酸钠),用SpectraMax M2测定各样品的Ex365/Em455值。

3、增效因子在报告载体中的功能验证

分别测得转入DBN-A-B01的烟草叶片、转入DBN-A-B02的烟草叶片和转入DBN-A-B03的烟草叶片的GUS活性平均值(pmol 4-MU/mg蛋白/min)为41.63/3421.31、29.50/502.86和32.16/501.71。

根据GUS活性值分别计算增效因子对GUUS的增效倍数,增效因子的增效倍数=测试载体恢复GUS表达的活性值/报告载体恢复GUS表达的活性值。如图5所示,上述实验结果表明,所述3个增效因子均能使GUUS恢复GUS染色,即当存在同源片段时,增效因子可以提高同源重组概率;所述OsExoI对同源重组概率的增效倍数均显著高于所述ScRad54(依据水稻密码子优化),为82.18,所述ScRad54(依据水稻密码子优化)对同源重组概率的增效倍数仅为15.60。

第六实施例、增效因子在剪刀载体中的增效功能验证

1、瞬时转化的烟草植株的获得

活化菌液:按照第五实施例1中所述方法,由包含重组表达载体DBN-A、DBN-C、DBN-B01、DBN-B02和DBN-B03的LBA4404菌种分别获得DBN-A、DBN-C、DBN-B01、DBN-B02和DBN-B03的菌液。按照以下组合将菌液等体积混合:DBN-C和DBN-A菌液(对照处理)、DBN-C和DBN-B01菌液(处理1)、DBN-C和DBN-B02菌液(处理2)、DBN-C和DBN-B03菌液(处理3),室温静置3h,获得对应处理的侵染液。

用不带针头的注射器将侵染液注射进烟草叶片(6-8周),上述3组处理中每组处理为在同一片叶片左边注射含有对照处理的侵染液,右边分别注射含有处理1、处理2和处理3的侵染液,并黑暗处理48-72h。获得转入DBN-AC-B01C的烟草叶片、转入DBN-AC-B02C的烟草叶片和转入DBN-AC-B03C的烟草叶片,每组处理设3次重复。

2、增效因子在剪刀载体中的增效功能验证

按照第五实施例2中的方法,分别测得转入DBN-AC-B01C的烟草叶片、转入DBN-AC-B02C的烟草叶片和转入DBN-AC-B03C的烟草叶片的GUS活性值(pmol 4-MU/mg蛋白/min)如表1所示。

表1、3个处理的GUS活性值(pmol 4-MU/mg蛋白/min)和增效倍数

根据GUS活性值分别计算增效因子对剪刀的增效倍数,增效因子的增效倍数=测试载体与剪刀载体共转化后恢复GUS表达的活性值/报告载体与剪刀载体共转化后恢复GUS表达的活性值。由图6和表1可得,所述3个增效因子通过有效切割可以提高CRISPR/Cas9系统的剪切效率,使GUUS恢复GUS染色,进而可以提高基因组编辑效率;所述OsExoI对CRISPR/Cas9系统剪切效率的提升效果(增效倍数和GUS活性值)明显优于所述ScRad54(依据水稻密码子优化),进而也使基因组编辑效率得到显著提高。

综上所述,本发明首次提供了一些新的增效因子,特别是所述OsExoI增效因子,能够显著提高细胞内同源重组概率,促进同源重组的发生,为提高植物体中同源重组概率提供了新的途径;当本发明所述增效因子在与分子剪刀共同使用时,可以显著提升分子剪刀的切割效率,进而提升基因组编辑的效率。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

SEQUENCE LISTING

<110> 北京大北农生物技术有限公司

<120> 提高基因组编辑效率的方法

<130> DBN119

<160> 13

<170> PatentIn version 3.5

<210> 1

<211> 836

<212> PRT

<213> Oryza sativa

<400> 1

Met Gly Ile Gln Gly Leu Leu Pro Gln Leu Lys Ser Ile Met Ala Pro

1 5 10 15

Ile Gly Val Glu Ala Leu Lys Gly Gln Thr Val Ala Val Asp Thr Tyr

20 25 30

Ser Trp Leu His Lys Gly Ala Leu Ser Cys Gly Asp Arg Leu Cys Lys

35 40 45

Gly Leu Pro Thr Thr Arg His Ile Glu Tyr Cys Met His Arg Val Asn

50 55 60

Met Leu Arg His His Gly Val Lys Pro Ile Leu Val Phe Asp Gly Gly

65 70 75 80

His Leu Pro Met Lys Gly Asp Gln Glu Thr Lys Arg Glu Arg Ser Arg

85 90 95

Lys Glu Asn Leu Glu Arg Ala Lys Glu His Glu Ser Ala Gly Asn Ser

100 105 110

Arg Ala Ala Phe Glu Cys Tyr Gln Lys Ala Val Asp Ile Thr Pro Arg

115 120 125

Ile Ala Phe Glu Leu Ile Gln Val Leu Lys Gln Glu Lys Val Asp Tyr

130 135 140

Ile Val Ala Pro Tyr Glu Ala Asp Ala Gln Met Thr Phe Leu Ser Val

145 150 155 160

Asn Lys Leu Val Asp Ala Val Ile Thr Glu Asp Ser Asp Leu Ile Pro

165 170 175

Phe Gly Cys Ser Arg Ile Ile Phe Lys Met Asp Lys Phe Gly Gln Gly

180 185 190

Val Glu Phe His Ile Thr Arg Leu Gln Arg Cys Arg Glu Leu Asp Leu

195 200 205

Asn Gly Phe Thr Met Gln Met Leu Leu Glu Met Cys Ile Leu Ser Gly

210 215 220

Cys Asp Tyr Leu Pro Ser Leu Pro Gly Met Gly Val Lys Arg Ala His

225 230 235 240

Ala Leu Ile Gln Lys Leu Lys Gly His Glu Lys Val Ile Lys His Leu

245 250 255

Arg Tyr Ser Ala Val Ser Val Pro Pro Gln Tyr Glu Glu Asn Phe Arg

260 265 270

Lys Ala Ile Trp Ala Phe Gln Phe Gln Arg Val Tyr Asp Pro Val Thr

275 280 285

Glu Asp Ile Val His Leu Ser Gly Ile Pro His Gly Ser Ser Glu Asp

290 295 300

Leu Asp Phe Leu Gly Pro Trp Leu Pro Gln Thr Val Ala Lys Gly Ile

305 310 315 320

Ala Gln Gly Asn Ile Asp Pro Ile Thr Lys Glu Pro Phe Glu Gly Lys

325 330 335

Thr Glu Ser Ser Ala Leu Ala Phe Asp Lys Val His Leu Asn Arg Glu

340 345 350

Ser Ser Ala Pro Ser Asn Gly Lys Lys Lys Leu Asp Leu Pro Val Gln

355 360 365

Arg Asn Val Leu Thr Asn Tyr Phe Cys Leu Ala Ser Leu Glu Ala Lys

370 375 380

Arg Lys Phe Arg Ala Pro Lys Val Thr Pro Lys Gln Gln Val Leu Asn

385 390 395 400

Gly Ser Leu Pro Ser Pro Arg Ile Glu Asp Ser Gly Thr Pro Asp Leu

405 410 415

Ile Glu Asp Thr Ser Leu Pro Ser Asn Asn Ile Gln Val Tyr Gln Cys

420 425 430

Ser Ser Glu His Phe Ser Ser Gly Thr Pro Leu Asp Asp Ser Ile Asn

435 440 445

Thr Ala Ser Gln Cys Ser Ser Glu Arg Val Arg Cys Asp Ile Pro Arg

450 455 460

Asp Asp Ser Ala Ser Val Ser Pro Gln Cys Ser His Asp Ile Gly Ser

465 470 475 480

Asp Pro Ala Glu Asp Pro Asp Ile Glu Gly Asn Lys Val Lys Val Asn

485 490 495

Phe Cys Asn Arg Ser Thr Ile Pro Thr Gly Ser Phe Leu Glu Gly Thr

500 505 510

Leu Pro Gly Ile Ser Asp Pro Phe Leu Asp Ser His Asn Thr Glu Pro

515 520 525

Ser Arg Ala Ala Pro Arg Tyr Ala Glu Lys Ser Asn Val Val Ser Ala

530 535 540

Asn Arg Asn Ile Thr Val Arg Ser Ser Tyr Phe Lys Thr Val Asn Lys

545 550 555 560

Arg Val Cys Thr Asn Gln Gly Glu Asp Glu Cys His Asp Glu Asp Asn

565 570 575

Cys Glu Thr Gly Asn Tyr Thr Leu Pro Gly Asp Gln Gln Arg Ser Ser

580 585 590

Gly Gly Ile Leu Lys Arg Arg Lys Phe Ser Asp Pro Gln Asn Phe Glu

595 600 605

Asp Gly Met Phe Gln Pro Thr Ser Pro His Glu Ser Pro Pro Val Ala

610 615 620

Asp Lys Gly Cys Asp Ser Asp Ser His Asp Gly Ile Asn Thr Asn Ser

625 630 635 640

Glu Gly Lys Phe Gly Cys Asn Val Ala His Val Asn Lys Tyr Ser Gly

645 650 655

Ile Ala Glu Lys Ser Met Asp Lys Phe Ala Ala Leu Ile Ser Ser Phe

660 665 670

Arg Tyr Ala Gly Ser Arg Ala Ser Gly Leu Arg Ala Pro Leu Lys Asp

675 680 685

Val Lys Asn Thr Leu Pro Val Arg Ser Val Leu Arg Pro Pro Glu Gln

690 695 700

Arg Phe Gly Cys Thr Ala Lys Lys Thr Thr Arg Val Pro Leu Gln Ser

705 710 715 720

Arg Phe Ser Ser Asp Ala Thr Asn Ser Thr Asp Val Pro Asp Leu Ser

725 730 735

Thr Phe Ala Tyr Arg Pro Thr Thr Ala Ser Ala His Ser Asp Gln Gly

740 745 750

Lys Ile Thr Ser Lys Ala Thr Asp Ala Ala Ala Gly Pro Pro Asp Leu

755 760 765

Arg Thr Phe Ala Tyr Ala Pro Thr Arg Ser Thr Thr Ser Arg Phe Asp

770 775 780

Gln Ser Glu Asn Thr Arg Lys Ala Met Cys Thr Ala Asp Ser Pro Pro

785 790 795 800

Asp Ile Ser Thr Phe Glu Tyr Lys Pro Met Lys Ser Ala Val Arg Arg

805 810 815

Ser Asp Gly Ser Lys Phe Ser Gly Ala Ala Leu Lys Ala Ala Arg Arg

820 825 830

Thr Ser Arg Ser

835

<210> 2

<211> 2511

<212> DNA

<213> Oryza sativa

<400> 2

atggggatcc agggattgct gccgcagctg aagtcgatca tggcgcccat cggggtggag 60

gcgctcaagg gccagacggt ggccgtcgac acctactcct ggctccacaa gggcgccctc 120

tcctgcggcg accgcctctg caagggccta cccaccacca ggcatattga gtattgcatg 180

catagggtta acatgttgcg gcaccatggc gtgaaaccaa tccttgtatt tgacggaggt 240

catctgccga tgaagggtga tcaagagact aaacgtgaaa ggtcacgaaa ggaaaatctt 300

gagcgtgcca aggagcatga atctgctggg aattcacgtg ctgcttttga gtgttatcag 360

aaagctgttg acattacacc taggattgct tttgaactga tccaggtatt gaagcaagaa 420

aaggttgatt atattgttgc gccttatgaa gcagatgcac aaatgacatt cttgtctgtg 480

aacaaacttg ttgatgccgt tatcacagag gattctgatc tgataccatt tggctgttct 540

agaattattt tcaagatgga caagtttgga caaggtgttg aatttcatat tacacgattg 600

cagcgatgca gggagcttga tcttaatgga ttcactatgc aaatgctact agagatgtgt 660

attttaagtg gctgtgatta tcttccatca ttgcctggaa tgggtgtgaa acgagctcat 720

gcacttatcc aaaagctcaa gggtcatgaa aaggtaatca agcacctgag gtacagtgct 780

gtttctgttc cacctcaata tgaagaaaac ttcagaaagg cgatctgggc atttcagttc 840

caaagagttt atgaccctgt gacggaagat attgttcatt tgtcaggcat tccccatggc 900

agtagtgaag acttggactt tttgggccca tggctaccac agactgttgc taaaggcatt 960

gcccaaggga atatcgatcc gattaccaag gaaccatttg agggcaaaac agagagtagc 1020

gcactcgctt ttgataaagt gcatctgaac agagagtcca gtgctccttc aaatggaaag 1080

aaaaagcttg atctacctgt ccaaagaaac gtattgacaa attacttctg cttagcatcg 1140

cttgaggcaa aacggaagtt cagagcacct aaggttacac ctaagcaaca agtacttaat 1200

gggtctttgc ccagtcccag aattgaagac tctggtaccc ctgatttaat tgaagatact 1260

agcttgccat caaataacat tcaagtttat cagtgtagtt ctgagcattt tagctcagga 1320

acccctctag atgattcaat caataccgcc tctcaatgta gttctgagcg tgtccgctgt 1380

gacatccctc gggatgattc agccagtgtt tcaccccagt gttctcatga tattggtagt 1440

gatcctgctg aggacccaga cattgaaggc aacaaggtga aagtcaactt ctgcaacaga 1500

agtacaatac cgacaggctc tttcttagag gggactttgc ctgggatatc agatccattt 1560

ttagattcac acaacacaga gccatccaga gctgcaccac gttatgctga aaaaagcaat 1620

gtggtctctg ccaatagaaa tattactgtg aggagttcat atttcaaaac agtaaataaa 1680

agagtttgca caaatcaagg agaagatgag tgccatgatg aagataactg cgagactggt 1740

aattacactc ttcctggaga tcaacaaaga agctctggag gtatattgaa gagaagaaaa 1800

tttagtgatc cccaaaattt tgaagatgga atgtttcaac ccactagtcc tcatgaaagt 1860

ccaccggttg ctgataaagg ctgtgactct gattcccacg acggtatcaa cacaaattct 1920

gaaggaaaat ttggatgcaa tgtcgcccat gtaaataaat acagtggcat tgcagagaaa 1980

tcaatggata agtttgctgc gctgatatca tctttcagat acgcaggctc tcgtgccagt 2040

ggtcttcgcg ctcctttaaa ggatgtgaag aacactcttc ctgtcagatc tgttctcaga 2100

cctccagaac agagattcgg ttgtacggct aagaagacta ctagagtgcc tctacaaagc 2160

agattctcaa gtgatgctac aaacagcact gacgttcctg atctgagcac atttgcatac 2220

aggcctacaa ctgcttctgc tcattctgat caggggaaga tcacaagcaa agctacagat 2280

gctgctgctg gacctcctga cctgagaaca tttgcttatg caccaacaag atctaccacc 2340

agccgttttg atcagagtga aaacacgcgc aaagctatgt gcactgcgga cagccctcct 2400

gatattagca cattcgaata taaacccatg aaaagcgccg tcagacgttc agatgggagc 2460

aagttttcag gtgcagcact aaaagcagct agacgaacct ctcggagctg a 2511

<210> 3

<211> 291

<212> PRT

<213> Colletotrichum orbiculare

<400> 3

Met Asp Pro Glu Ile Thr Arg Leu Pro Gly Cys Gly Ser Lys Val Ala

1 5 10 15

Glu Leu Trp His Glu Trp Lys Glu Ser Gly Arg Leu Arg Glu Val Asp

20 25 30

Glu Ala His Gly Asp Pro Lys Leu Ser Val Leu Gln Ala Phe Tyr Asp

35 40 45

Ile Trp Gly Val Gly Asp Ala Thr Ala Arg Asp Phe Tyr Asn Lys Asp

50 55 60

Leu Asp Asp Val Val Asp Phe Gly Trp Gln Ser Leu Ser Arg Ala Gln

65 70 75 80

Gln Ile Gly Val Lys Phe Tyr Asp Glu Phe Lys Leu Lys Ile Gln Arg

85 90 95

Asp Glu Val Glu Ala Ile Ala Glu Asp Ile Leu Lys His Ala Arg Asn

100 105 110

Phe Ser Pro Asp Phe Gln Met Val Ile Val Gly Gly Tyr Arg Arg Gly

115 120 125

Lys Gln Asp Ser Gly Asp Val Asp Val Ile Ile Ser His Pro Asp Glu

130 135 140

Ser Ala Thr Leu Asn Phe Val Asp Lys Leu Val Leu Ser Leu Glu Lys

145 150 155 160

Ser Arg Arg Val Thr His Thr Leu Ser Leu Ser Thr His Asn Ser Gln

165 170 175

Arg Gly Gln Arg Pro Val Ser Trp Arg Gly Asn Glu Arg Arg Gly Ser

180 185 190

Gly Phe Asp Thr Leu Asp Lys Ala Leu Val Val Trp Gln Glu Pro Leu

195 200 205

Arg Asp Ala Asp Asp Arg Ile Ser Leu Glu Lys Gly Arg Ala Cys Gln

210 215 220

Ala Pro His Arg Arg Val Asp Ile Ile Lys Glu Arg Gly Leu Arg Phe

225 230 235 240

Asp Ser Ser Gly Ile Arg Ser Arg Leu Asp Gly Thr Trp Val Asn Phe

245 250 255

Glu Gly Gly Asp Gly Gly Thr Ala Gln Asp Met Leu Thr Ala Glu Lys

260 265 270

Arg Val Phe Asp Gly Leu Gly Leu Arg Phe Val Asp Pro Tyr Asn Arg

275 280 285

Cys Thr Gly

290

<210> 4

<211> 876

<212> DNA

<213> Artificial Sequence

<220>

<223> CoDNTT核苷酸序列

<400> 4

atggaccctg agataacacg gcttcctggc tgtgggagta aagtcgctga actgtggcac 60

gagtggaaag aatcggggcg gttgcgtgag gtggatgaag ctcacgggga ccctaagctc 120

tcggttctgc aggccttcta cgatatctgg ggtgtcgggg atgctacagc ccgggacttc 180

tataacaagg atttggatga cgtggttgac tttggatggc agagcctctc aagagctcag 240

caaatcggtg tgaaattcta cgatgagttt aagttgaaga tacaaaggga cgaggttgaa 300

gcgattgcag aagatatact caagcacgcc cgcaacttct ctccggactt tcagatggtt 360

attgtcggcg gatatagaag gggtaaacaa gattccgggg atgtggacgt tatcattagc 420

catcccgacg agtcagcgac gcttaatttc gtcgataagc tcgtgctttc tctggaaaaa 480

tcccgccggg tcactcacac cttgtcgctc agtactcata actcgcagag agggcaaagg 540

ccggtgagtt ggagaggcaa tgagcgtaga ggcagcggat ttgatacctt ggacaaggcg 600

ctcgtcgtgt ggcaggagcc tcttcgtgac gcagatgaca gaatatcact ggaaaagggt 660

agggcttgcc aagccccaca taggcgcgtt gatataatca aagagcgcgg ccttcggttc 720

gactcttccg gaattcggag ccgtctggat ggtacatggg tcaattttga gggtggggac 780

ggcggaacag cgcaagatat gctcacggca gaaaagcgtg tgtttgatgg gctcgggctg 840

cggtttgttg acccctataa tcgttgcact ggttga 876

<210> 5

<211> 2697

<212> DNA

<213> Artificial Sequence

<220>

<223> ScRad54核苷酸序列

<400> 5

atggcacggc gtaggcttcc cgataggccc ccgaacggta ttggagcagg cgaaagacct 60

cgtctggtcc cgcgtccgat aaatgtccag gattcagtta atcgtctgac taagccattc 120

agagtcccgt acaaaaacac ccatatccct ccagctgccg gacggattgc aacaggttct 180

gacaacatag tgggcggacg tagcctcaga aagaggtctg ctacggtttg ctactctggc 240

ctcgatatca acgcagacga agctgagtat aactcccagg atatctcttt ctcccaactc 300

actaagagaa ggaaagatgc cctttctgca cagcggctgg ccaaggaccc tacccgtctt 360

tcgcacattc aatacacact gcgccggagt tttacggtcc ccataaaagg gtatgtgcag 420

aggcattccc tccctcttac tctgggcatg aagaaaaaga ttaccccaga gccccgccct 480

ctgcacgatc caacagacga attcgctatc gttttgtatg atccgtcggt cgacggagag 540

atgattgtgc atgatacttc tatggataat aaggaggaag agtcgaaaaa gatgattaag 600

agtacccaag agaaggataa cataaataag gagaagaact ctcaggaaga gaggcctact 660

caacgtatcg ggagacaccc tgcactcatg accaatggcg tgcgcaacaa gccacttcgg 720

gagctcctcg gcgattctga aaattccgcc gagaacaaaa agaaattcgc gtctgttcca 780

gtggttatcg atccgaagct cgcgaaaatt ctgaggccac accaggtgga gggagttcgg 840

ttcctttacc gttgtgtgac aggtttggtt atgaaggact atctcgaagc tgaggccttt 900

aacacttctt ctgaagatcc gttgaagtct gacgaaaaag cactcacaga gtcccaaaag 960

actgagcaaa acaatagagg ggcatacggc tgcattatgg ctgatgagat gggcctcggc 1020

aagactctcc agtgtatcgc tctcatgtgg acgctgttga gacagggacc acaaggcaag 1080

agactcatcg acaaatgcat cattgtttgt ccgagctcat tggtcaacaa ttgggcaaac 1140

gagcttatca agtggctggg gcccaacact ttgacccctc tcgctgtcga tggcaagaaa 1200

tcgagtatgg gtgggggcaa tactaccgtg tcgcaggcca tccatgcgtg ggcacaggct 1260

caaggtagaa atattgtcaa gccagtgctt ataatcagct acgagactct gcgtagaaac 1320

gtcgatcaat tgaagaactg caatgtgggc ttgatgctcg ccgacgaagg acacaggctc 1380

aaaaacggcg atagcttgac attcacggcg ctcgacagca tttcatgtcc aaggcgcgtt 1440

attctgtctg gcaccccgat acagaatgat ttgtccgagt atttcgccct cctttcgttt 1500

agtaacccgg ggctgttggg ctcaagagcg gagttcagga agaactttga aaatcctatt 1560

cttcgcgggc gggatgccga cgcgactgat aaggagatca ccaaaggcga agcccagctt 1620

caaaagctga gcacaatagt gtcaaaattc attatacggc gtacgaatga catcttggcg 1680

aagtacctcc cctgcaaata tgagcatgtt atattcgtca acttgaagcc tctccagaat 1740

gagctttaca acaagctgat caaaagccgc gaagtgaaga aagtcgtgaa gggagttgga 1800

ggttcacaac ccctcagagc catcggtatt cttaagaaac tgtgtaacca cccaaatctc 1860

cttaacttcg aagatgagtt tgatgacgaa gatgaccttg agctgccaga tgactacaat 1920

atgccgggct ctaaggcacg cgacgtccag acaaagtatt cggctaaatt cagtatattg 1980

gagcggtttc tccataagat caaaacggaa agcgatgaca agatagtgct catctcaaac 2040

tacactcaaa ccttggatct cattgagaag atgtgccgct acaaacacta tagcgctgtt 2100

cggctcgacg ggaccatgtc aattaataag aggcagaaac ttgtcgatcg cttcaacgac 2160

ccggaaggac aagagttcat ctttctgctc tcttctaagg ccgggggctg tgggattaat 2220

cttataggcg ctaacaggct tatcctcatg gaccctgact ggaatcctgc ggcagatcag 2280

caagcactgg ctagggtttg gcgcgatgga cagaagaaag actgcttcat ctatagattc 2340

atcagcactg gtacgataga agagaagatc tttcagaggc aatctatgaa aatgtccctg 2400

agctcatgtg ttgtcgatgc caaggaggat gtggagcgtt tgttctcgag tgataatttg 2460

agacagctct ttcaaaagaa cgagaatacc atctgcgaaa ctcacgagac ttaccattgc 2520

aaaaggtgta acgcgcaggg aaagcaactc aaacgcgccc ctgcgatgct ttatggtgac 2580

gcaacaacgt ggaatcacct taaccatgat gctctggaaa agactaacga ccatctcctc 2640

aaaaacgagc accactacaa cgacatctcc ttcgcctttc aatacataag ccactaa 2697

<210> 6

<211> 3086

<212> DNA

<213> Artificial Sequence

<220>

<223> GUUS核苷酸序列

<400> 6

atggtagatc tgagggtaaa tttctagttt ttctccttca ttttcttggt taggaccctt 60

ttctcttttt atttttttga gctttgatct ttctttaaac tgatctattt tttaattgat 120

tggttatggt gtaaatatta catagcttta actgataatc tgattacttt atttcgtgtg 180

tctatgatga tgatgatagt tacagaaccg acgaacttct ctgtacccga tcaacaccga 240

aacccgtggc gtcttcgacc tcaatggcgt ctggaacttc aagctggact acgggaaagg 300

actggaagag aagtggtacg aaagcaagct gaccgacact attagtatgg ccgtcccaag 360

cagttacaat gacattggcg tgaccaagga aatccgcaac catatcggat atgtctggta 420

cgaacgtgag ttcacggtgc cggcctatct gaaggatcag cgtatcgtgc tccgcttcgg 480

ctctgcaact cacaaagcaa ttgtctatgt caatggtgag ctggtcgtgg agcacaaggg 540

cggattcctg ccattcgaag cggaaatcaa caactcgctg cgtgatggca tgaatcgcgt 600

caccgtcgcc gtggacaaca tcctcgacga tagcaccctc ccggtggggc tgtacagcga 660

gcgccacgaa gagggcctcg gaaaagtcat tcgtaacaag ccgaacttcg acttcttcaa 720

ctatgcaggc ctgcaccgtc cggtgaaaat ctacacgacc ccgtttacgt acgtcgagga 780

catctcggtt gtgaccgact tcaatggccc aaccgggact gtgacctata cggtggactt 840

tcaaggcaaa gccgaaaaca ggataatgag gtactggctg gaaggcccaa gagcgggcga 900

ggtagaggtg ttcgcgaacc tgccgggctt ccccgacaac gtgcgctcca acggcagggg 960

ccagttctgg gtggcgatcg actgctgccg gacgccggcg caggaggtgt tcgccaagag 1020

gccgtggctc cggaccctat acttcaagtt cccgctgtcg ctcaaggtgc tcacttggaa 1080

ggccgccagg aggatgcaca cggtgctcgc gctcctcgac ggcgaagggc gcgtcgtgga 1140

ggtgctcgag gaccggggcc acgaggtgat gaagctggtg agtgaggtgc gggaggtggg 1200

cagcaagctg tggatcggaa ccgtggcgca caaccacatc gccaccatcc cctacccttt 1260

agaggactaa ttttacccgt ggcgtcttcg acctcaatgg cgtctggaac ttcaagctgg 1320

actacgggaa aggactggaa gagaagtggt acgaaagcaa gctgaccgac actattagta 1380

tggccgtccc aagcagttac aatgacattg gcgtgaccaa ggaaatccgc aaccatatcg 1440

gatatgtctg gtacgaacgt gagttcacgg tgccggccta tctgaaggat cagcgtatcg 1500

tgctccgctt cggctctgca actcacaaag caattgtcta tgtcaatggt gagctggtcg 1560

tggagcacaa gggcggattc ctgccattcg aagcggaaat caacaactcg ctgcgtgatg 1620

gcatgaatcg cgtcaccgtc gccgtggaca acatcctcga cgatagcacc ctcccggtgg 1680

ggctgtacag cgagcgccac gaagagggcc tcggaaaagt cattcgtaac aagccgaact 1740

tcgacttctt caactatgca ggcctgcacc gtccggtgaa aatctacacg accccgttta 1800

cgtacgtcga ggacatctcg gttgtgaccg acttcaatgg cccaaccggg actgtgacct 1860

atacggtgga ctttcaaggc aaagccgaaa ccgtgaaagt gtcggtcgtg gatgaggaag 1920

gcaaagtggt cgcaagcacc gagggcctga gcggtaacgt ggagattccg aatgtcatcc 1980

tctgggaacc actgaacacg tatctctacc agatcaaagt ggaactggtg aacgacggac 2040

tgaccatcga tgtctatgaa gagccgttcg gcgtgcggac cgtggaagtc aacgacggca 2100

agttcctcat caacaacaaa ccgttctact tcaagggctt tggcaaacat gaggacactc 2160

ctatcaacgg ccgtggcttt aacgaagcga gcaatgtgat ggatttcaat atcctcaaat 2220

ggatcggtgc caacagcttc cggaccgcac actatccgta ctctgaagag ttgatgcgtc 2280

ttgcggatcg cgagggtctg gtcgtgatcg acgagactcc ggcagttggc gtgcacctca 2340

acttcatggc caccacggga ctcggcgaag gcagcgagcg cgtcagtacc tgggagaaga 2400

ttcggacgtt tgagcaccat caagacgttc tccgtgaact ggtgtctcgt gacaagaacc 2460

atccaagcgt cgtgatgtgg agcatcgcca acgaggcggc gactgaggaa gagggcgcgt 2520

acgagtactt caagccgttg gtggagctga ccaaggaact cgacccacag aagcgtccgg 2580

tcacgatcgt gctgtttgtg atggctaccc cggagacgga caaagtcgcc gaactgattg 2640

acgtcatcgc gctcaatcgc tataacggat ggtacttcga tggcggtgat ctcgaagcgg 2700

ccaaagtcca tctccgccag gaatttcacg cgtggaacaa gcgttgccca ggaaagccga 2760

tcatgatcac tgagtacggc gcagacaccg ttgcgggctt tcacgacatt gatccagtga 2820

tgttcaccga ggaatatcaa gtcgagtact accaggcgaa ccacgtcgtg ttcgatgagt 2880

ttgagaactt cgtgggtgag caagcgtgga acttcgcgga cttcgcgacc tctcagggcg 2940

tgatgcgcgt ccaaggaaac aagaagggcg tgttcactcg tgaccgcaag ccgaagctcg 3000

ccgcgcacgt ctttcgcgag cgctggacca acattccaga tttcggctac aagaacgcta 3060

gccatcacca tcaccatcac gtgtga 3086

<210> 7

<211> 328

<212> DNA

<213> Cauliflower mosaic virus

<400> 7

ccattgccca gctatctgtc actttattgt gaagatagtg gaaaaggaag gtggctccta 60

caaatgccat cattgcgata aaggaaaggc catcgttgaa gatgcctctg ccgacagtgg 120

tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac 180

gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg acgcacaatc 240

ccactatcct tcgcaagacc cttcctctat ataaggaagt tcatttcatt tggagaggac 300

acgctgacaa gctgactcta gcagatct 328

<210> 8

<211> 195

<212> DNA

<213> Cauliflower mosaic virus

<400> 8

ctgaaatcac cagtctctct ctacaaatct atctctctct ataataatgt gtgagtagtt 60

cccagataag ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa 120

cccttagtat gtatttgtat ttgtaaaata cttctatcaa taaaatttct aattcctaaa 180

accaaaatcc agtgg 195

<210> 9

<211> 1992

<212> DNA

<213> Zea mays

<400> 9

ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60

agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120

tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180

tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240

gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600

cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 660

cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 720

acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 780

ggcaggcggc ctcctcctcc tctcacggca cggcagctac gggggattcc tttcccaccg 840

ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900

tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960

ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc ctctctacct 1020

tctctagatc ggcgttccgg tccatggtta gggcccggta gttctacttc tgttcatgtt 1080

tgtgttagat ccgtgtttgt gttagatccg tgctgctagc gttcgtacac ggatgcgacc 1140

tgtacgtcag acacgttctg attgctaact tgccagtgtt tctctttggg gaatcctggg 1200

atggctctag ccgttccgca gacgggatcg atttcatgat tttttttgtt tcgttgcata 1260

gggtttggtt tgcccttttc ctttatttca atatatgccg tgcacttgtt tgtcgggtca 1320

tcttttcatg cttttttttg tcttggttgt gatgatgtgg tctggttggg cggtcgttct 1380

agatcggagt agaattctgt ttcaaactac ctggtggatt tattaatttt ggatctgtat 1440

gtgtgtgcca tacatattca tagttacgaa ttgaagatga tggatggaaa tatcgatcta 1500

ggataggtat acatgttgat gcgggtttta ctgatgcata tacagagatg ctttttgttc 1560

gcttggttgt gatgatgtgg tgtggttggg cggtcgttca ttcgttctag atcggagtag 1620

aatactgttt caaactacct ggtgtattta ttaattttgg aactgtatgt gtgtgtcata 1680

catcttcata gttacgagtt taagatggat ggaaatatcg atctaggata ggtatacatg 1740

ttgatgtggg ttttactgat gcatatacat gatggcatat gcagcatcta ttcatatgct 1800

ctaaccttga gtacctatct attataataa acaagtatgt tttataatta ttttgatctt 1860

gatatacttg gatgatggca tatgcagcag ctatatgtgg atttttttag ccctgccttc 1920

atacgctatt tatttgcttg gtactgtttc ttttgtcgat gctcaccctg ttgtttggtg 1980

ttacttctgc ag 1992

<210> 10

<211> 253

<212> DNA

<213> Agrobacterium tumefaciens

<400> 10

gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60

atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120

atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 180

gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240

atgttactag atc 253

<210> 11

<211> 20

<212> DNA

<213> Zea mays

<400> 11

cccaagagcg ggcgaggtag 20

<210> 12

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<223> 45CS1正向引物

<400> 12

tacccaggtc tcaggcaccc aagagcgggc gaggtag 37

<210> 13

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<223> 45CS1反向引物

<400> 13

taagttggtc tcgaaaccta cctcgcccgc tcttggg 37

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1