用于多元RNA引导的基因组编辑和其它RNA技术的方法和组合物与流程

文档序号:11595792阅读:728来源:国知局
发明领域本发明涉及在分子生物学和遗传工程领域内用于基因靶向和基因组编辑的方法。更具体地,本发明描述了使用trna加工系统来使得能够进行基于多元rna的或多元rna引导的基因组工程、基因抑制等。发明背景用于特异性基因靶向或精准基因组编辑的方法学对于植物或动物基因的功能性表征而言是非常重要的。近年来,已经开发了序列特异性核酸酶来提高基因靶向或基因组编辑在植物、动物或微生物体系中的效率。近来,基于成簇的规律间隔的短回文重复序列(crispr)-相关核酸酶系统,已经在微生物和哺乳动物体系中开发了新的基因组编辑工具。所述crispr-相关核酸酶是细菌和古细菌获得性免疫的一部分。cas9内切核酸酶,酿脓链球菌(streptococcuspyogenes)ii型crispr/cas系统的成分,与称为crisprrna(crrna)和反式激活crrna(transcrrna)的两个短rna分子形成复合物,所述rna分子引导核酸酶在特异性位点对非自身dna的两条链进行切割。所述crrna-transcrrna异源双链体可以由一个嵌合rna(所谓的引导rna(grna))来取代,其继而可以被编排至靶向的特定位点。编排grna-cas9的最小限制为经改造的5’-rna和靶向的dna之间至少15个碱基配对且无错配,以及在靶向的dna序列中跟随碱基配对区的ngg基序(所谓的前间区序列邻近基序或pam)。一般而言,grna区的5’末端中的15-22nt是用于指导cas9核酸酶来在特定位点产生dsb。crispr/cas系统对于人类、小鼠、斑马鱼、酵母和细菌中的基因组编辑已经得到了证明。与重组分子(dna、rna或蛋白质)可以直接进行转化而用于cas9-介导的基因组编辑的动物、酵母、或细菌细胞不同,重组质粒dna由于细胞壁的存在通常是经过土壤杆菌(agrobacterium)介导的转化、基因枪轰击、或原生质体转化而递送至植物细胞内的。因而,需要创建专用的分子工具和方法,以有利于用于植物和动物细胞中基因组编辑的质粒dna的构建和递送以及cas9和grna的有效表达。用于制备和使用crispr-cas系统的组合物和方法在题目为“用于改变基因产物的表达的crispr-cas系统和方法”的美国专利号no.8,697,359中有描述,其以整体援引加入本文。原则上,多元遗传操纵可以通过表达多个针对相应靶向位点的grna和cas9(或cas9衍生的效应物)来实现。然而,由于递送方法和目前grna表达装置的局限,在植物、动物、或微生物生物体中同时产生许多种grna依然是种挑战。本发明的目标是提供这样的策略,使用细胞的内源trna加工系统作为有效且精准的手段来从单一多核苷酸构建体/合成基因产生许多种grna,由此加强crispr/cas9或其它用于基因组工程的rna介导的遗传操纵工具的多元编辑能力。在另一方面,本发明涉及包含上文所述核酸的多核苷酸构建体、表达盒、载体或经修饰的受体细胞。本发明的另外的目标、特征或优势是提供这样的组合物和方法,其用于操纵多个靶基因,或者单一靶基因中的多个位置,其引入单一表达盒,所述表达盒包括在受体细胞中利用trna系统的序列。另外的目标、特征和优势会在本文所包含的公开内容的基础上显而易见。发明概述申请人已经产生了材料和方法来从一个多核苷酸构建体(合成基因)产生许多小rna,以促进rna-引导的多元基因组编辑、表达抑制、遗传学或表观遗传学修饰、以及其它基于rna的技术。所述合成基因/多核苷酸构建体编码由trna所分开的多顺反子rna组件,并且优选还包括调节组件如启动子或终止子,以形成表达盒。一旦在细胞中经转录,转录物经内源trna加工系统而被细胞加工成多个rna分子。本发明的方法可用于改良任何基于rna的基因组编辑和调节技术,使得可以经单一的多核苷酸构建体和内源trna加工系统产生和分离出多元的rna。此类方法可包括但不限于cas9-介导的基因组编辑、人工微rna介导的基因沉默、以及其它rna-介导的机制等等。根据本发明,用于在受体细胞中产生多元rna遗传操纵的方法包括,提供异源多核苷酸序列,其具有两个或更多个与一或多个trna切割序列(trna前体)串联的rna介导的遗传操纵序列。该多核苷酸通过许多标准技术中任何技术来引入至受体细胞,并且经表达,所述受体细胞trna加工系统在trna序列处切割该异源多核苷酸。具体而言本发明提供了trna切割序列,其用于rna-核酸裂解活性(如在trna前体剪接中)、3'末端mrna前体内切核酸酶活性、trna前体切割活性、和/或核糖体rna前体切割活性。所述rna遗传操纵序列和所述rna切割序列可操作地连接至用于在受体细胞中表达的调节序列,如启动子和终止子序列。trna切割序列包括与细胞的内源trna系统(如rnasep、rnasez和rnasee(细菌))有活性地相互作用(并被其切割)的任何序列和/或结构基序。这可包括结构识别元件如受体茎、d-环臂,tψc环以及特定的序列基序。有许多trna活性序列和基序是本领域技术人员已知的并可用的,如通过trna-se程序等资源,其可得自万维网lowelab.ucsc.edu/trnacan-se/或万维网trna.bioinf.uni-leipzig.de/dataoutput/organisms(对于所有生物体),或万维网plantrna.ibmp.cnrs.fr/(对于植物)。许多文章和genbank资源也是可用的并且在本文中引用。本发明还包括用于多元rna遗传操纵的多核苷酸构建体、表达构建体、载体和受体细胞(已经过操纵)。所述构建体包含多核苷酸序列,其编码两个或更多个rna介导的遗传操纵序列,所述rna介导的遗传操纵序列与编码trna切割序列的序列串联。在一个实施方案中,该rna介导的遗传操纵序列包括用于cas9-介导的基因组编辑的引导rna。该引导rna(或grna)与内切核酸酶一起引入,在此情形中是crispr相关(cas)核酸酶cas9。该引导rna提供支架(scaffold)和与靶点位互补的间隔区(spacer)序列。在另一实施方案中该rna遗传操纵序列是干扰rna如sirna,或根据本领域中的标准方法设计为用于基因沉默的微rna序列。该构建体还包括一或多个trna切割序列,其可以由细胞内的内源trna切割系统进行有活性地加工。所述构建体优选是表达构建体或合成基因(其包括启动子和终止子序列)。出乎意料地,申请人已发现当与crispr系统使用时,rna切割组件提供多达30倍的更高的表达(很可能是由于内部trna启动子元件)。本发明还包括已经过遗传操纵的细胞及其后代,此类细胞可包括基因组插入或缺失或者通过基因沉默对基因表达的操纵。此类细胞的后代可以用于开发株系,以及植物和动物育种材料。在一些实施方案中所述细胞是人类细胞。虽然公开了多个实施方案,本领域技术人员从下文的详述(显示和描述了本发明说明性的实施方案)还可以了解本发明其它的实施方案。因此,附图和详述应视为说明性质的而不是限制性的。附图详述图1.改造内源trna系统用于由crispr/cas9进行的多元基因组编辑。(a)具有5’前导序列和3’尾随序列的真核trna前体被rnasep和rnasez在特定的位点切割。(b)trna基因由rna聚合酶iii(poliii)进行的转录。trna基因中的框a和框b的元件功能为内部转录元件并由转录因子iiic(tfiiic)所结合,其招募tfiiib和poliii来起始转录。(c)用于同时靶向多个位点的ptg/cas9方法的示意图。合成的ptg由串联排列的trna-grna单元组成,且每个grna含有靶特异性的间隔区(用不同颜色标记为菱形)和保守的grna支架(矩形)。含有框a和b元件的trna显示为圆角矩形。ptg的初级转录物经内源rnasep和rnasez(标记为剪刀)切割以释放成熟grna和trna(三叶草结构的红线)。经剪切的成熟grna将cas9引导至多个靶。图2.功能性grna在体内从合成ptg基因的精准剪切。(a)两个sgrna基因和四个ptg的架构以产生一个grna。(b)ptg基因的trna-grna-trna融合的序列和预测的2级rna结构(seqidno:87)。trna区的碱基用红色表示,并且trna5’-前导序列显示为小写。所述grna用黑色表示并且grna间隔区序列显示为n。(c-f)用crt-pcr对从sgrna或ptg产生的成熟grna的检验。来自表达原生质体的空载体的总rna被用作对照(ck)。箭头表示通过crt-pcr扩增的成熟grna,并且星表示非特异性扩增的rrna。(g)根据来自crt-pcr的作图的grna末端的ptg(seqidno:88)中剪切位点的总结(参见si附录,图s3-s5)。箭头表示ptg中的切割位点以释放grna。在所有的crt-pcr结果中准确地在trna-grna融合位点从ptg剪切成熟grna5’-末端,而其3’-末端在trna5’前导序列(小写)内迁移了1-4nt。(h)从u3p:sgrna产生的grna(seqidno:89)。所有经检测的u3p:sgrna产生的grna以核糖核苷酸a起始并以多个u终止。(i)在水稻原生质体中通过ptg1:cas9或ptg2:cas9将插入/缺失引入至期望的位点(如pcr/re所示)。箭头表示抗re消化的突变片段。插入/缺失频率标在下方。(j)sgrna1/2和ptg1/2in在水稻原生质体中的相对表达。数据代表均值±sd。nd,未检测的。ck,空载体对照。图18.psico-sgrna-ef1a-mcherry-t2a-cas9载体的示意图谱。引导序列或ptg基因可以在插入此载体的bbsi位点后进行表达。红色字母表示克隆位点中的悬突。图19.从hptg基因精准地产生具有期望的引导序列的成熟grna。(a)crt-pcr产物在丙烯酰胺凝胶中的电泳。红箭头表示从hptg1和hptg2产生的成熟grna。vec,空载体对照。(b)通过crt-pcr和dna测序反映的成熟grna序列的色谱。箭头表示成熟grna的5’末端的第一个核苷酸。(c)hptg1和hptg2中根据crt-pcr结果作图的切割位点。剪刀表示trna加工系统经切割的位点。蓝色字母,trna;红色字母,grna引导序列;小写字母,grna支架序列;加下划线的字母,poliii终止子。图20.在hdac基因座的染色体片段靶向缺失。(a和b)在表达cas9-hptg构建体的人类细胞中各个hdac基因座处通过截短的pcr产物(由箭头表示)反映染色体片段缺失。(c)表达不同数目的grna的hptg构建体的缺失效率。图21.在hdac基因的基因座具有染色体缺失的扩增子的dna序列。图22.多顺反子trna-grna基因(ptg)加工系统的示意图以及用于靶向4个水稻mpk的ptg的设计。a:多顺反子trna-grna基因(ptg)由串联排列的trna-grna重复序列组成,且具有poliii启动子来起始转录(通过poliii终止子来终止)。细胞的内源rnasep和rnasez可识别初级转录物内trna的二级结构并从该转录物剪接多个功能性grna。经加工的grna可以与cas9内切核酸酶复合以同时靶向多个独立的基因组位点。b:设计了8个grna来靶向4个紧密相关的水稻mpk基因以用于基因敲除。在核苷酸的小插入和缺失之外,在每个基因上都可以通过非同源末端连接而发生染色体缺失,因为每个基因被两个grna所靶向。c:在此研究中使用了共表达1至8个grna的总共8个ptg。ptg2和ptg6靶向mpk5。ptg3、ptg4、和ptg5分别靶向mpk1、mpk2、和mpk6。ptg7和ptg8靶向mpk1/mpk5和mpk2/mpk6以创建双突变。ptg9共表达了8个grna以同时靶向所有的4个mpk基因。图23.4个ptgb9株系的t1代水稻植株在4个基因中携带有8个双等位基因突变。a:经pcr-re测定法在5个位点检测突变。突变dna的pcr产物不能被适宜的限制性内切酶(re;在b中蓝色名称且加下划线)所消化。在所有4株t1植株中相应基因的pcr产物都对消化有抗性(红箭头)并且剪刀表示在这些位点的插入/缺失突变。注意mpk2具有两个econi位点并且对来自突变的dna的pcr产物的消化产生两个条带而不是野生型dna对照中的3个条带。ck:野生型dna对照。b:在4个ptgb9株系的t1植株中所有8个靶向的位点处的准确插入/缺失突变。通过对pcr产物或ta克隆(对植株1-2的mpk6序列序列的情形)的直接测序获得序列。植株号码后面的小写字母a和b表示不同的等位基因。序列显示出re位点(蓝色下划线)和所有剩余的靶位点都经突变。剪刀表示pam3bp下游的预测的dsb位点(以红色字母标注)。用于靶向的前间区序列以绿色进行突出。横线表示当与野生型相比时缺失的核苷酸,并且小写字母表示插入的或取代的核苷酸。mpk1wt(seqidno:79);mpk11-2a(seqidno:135);mpk11-2b(seqidno:136);mpk12-1(seqidno:137);mpk13-2a(seqidno:138);mpk13-2b(seqidno:139);mpk14-2(seqidno:140);mpk2wt(seqidno:81);mpk21-2(seqidno:141);mpk22-1(seqidno:142);mpk23-1(seqidno:143);mpk24-2(seqidno:144);mpk24-2b(seqidno:145);mpk5wt(seqidno:82);mpk51-2(seqidno:146);mpk52-1(seqidno:147);mpk53-2(seqidno:148);mpk54-2(seqidno:149);mpk6wt(seqidno:84);mpk61-2a(seqidno:150);mpk61-2b(seqidno:151);mpk62-1(seqidno:152);mpk63-2(seqidno:153);mpk64-2a(seqidno:154);mpk64-2b(seqidno:155)。图24.ptg/cas9诱导的插入和缺失以及其频率。所显示的是在来自独立突变事件的54个序列的样品中检测到的插入/缺失突变以及其观察到的频率的总结。插入的框显示出经计算的所有插入对比所有缺失的频率。图25.染色体缺失在t1和t2代植株中的遗传。a:在t0代突变植株上对全长(mpk5)和染色体缺失(δ)等位基因的检测。通过截短的pcr产物(蓝箭头)与全长pcr产物(绿箭头)相比显示出在靶向的mpk5基因座处的染色体缺失。如全长和截短的pcr产物的扩增所示,株系5、4、和6对于缺失是杂合的。b:染色体缺失遗传至t1代。注意植株4-2和6-1每株仅遗传了两个等位基因之一并且变成纯合的。c:固定的缺失遗传至t2代。在植株6-1的后代中仅检测到显示缺失的截短的pcr产物。ck:野生型dna对照。图26.mpk1和mpk6基因座中的突变倾向于保持序列的开放阅读框(orf)。a:在ptgb9t1植株的4个基因中的8个靶向的位点上orf保留的突变对比非保留的突变的频率。b:当仅考虑外显子中靶位点时orf保留的突变的频率。c:突变体等位基因的预测的mpk1蛋白序列(小写)(seqidno156-158)与野生型序列(大写)(seqidno:80)比较。mpk1中的突变在mpk1蛋白中缺失了1至5个氨基酸,但却将预测的蛋白激酶结构域(其在野生型蛋白中从氨基酸67开始)保持完整。d:突变体等位基因的预测的mpk5蛋白序列(seqidno159-162)与野生型序列(seqidno:83)比较。所有等位基因中的突变都在野生型蛋白预测的蛋白激酶结构域(从氨基酸35开始)之前产生提早的终止。e:来自愈伤组织的ptgb3t0代植株(在mpk1上对染色体缺失是纯合的)与空载体对照比较。成熟植株4-a和4-b与对照相比保持严重矮化和无生育能力。在主图中尺度条是5cm而在放大的插图中是1cm。图27.显示4个基因mpk的靶向位点的示意。空白矩形表示第一个外显子的5’非翻译区而黑色实心矩形表示蛋白编码外显子。作为用于grna的靶位点的前间区序列区用红条标注。用于在pcr-re测定中检测突变事件的限制性内切酶位点用蓝条标注。注意mpk2具有2个econi位点并且对来自突变dna的pcr产物进行的消化产生两个条带而不是三个条带。用于靶区域扩增的引物用褐色箭头标注。图28.在ptgb3愈伤组织和ptgb5植物株系中检测诱变。a:通过pcr-re测定在4个独立的转基因愈伤组织片中确认了成功且完全的mpk1的编辑(红箭头)。株系4的愈伤组织在mpk1上携带有染色体缺失(如截短的pcr产物(δ)所示)。b:pcr-re测定确认了ptgb5t0代植株中成功且完全的mpk6的编辑,因为pcr产物是不可消化的(红箭头)。ck:野生型dna对照。图29.ptgb2和ptgb4植物株系诱变的检测。a:pcr-re测定确认了对经ptgb2转化的植株的mpk5基因座成功且完全的编辑,因为来自所有9个独立株系的pcr产物都对适宜酶的消化有抗性(红箭头)。b:类似地,pcr-re测定确认了所有13个经检验的ptgb4株系的完全的mpk2编辑。注意mpk2具有2个econi位点并且对来自突变dna的pcr产物的消化产生两个条带,以及株系9、10、和13的异常条带模式是mpk2基因座上更长缺失的结果。c:未经消化的来自株系9至13的pcr产物。株系9、10、和13中检测到的截短的pcr产物(δ)表明染色体缺失。ck:野生型dna对照。图30.ptgb8株系中诱变的检测。mpk6和mpk2基因座上的消化抗性条带(红箭头)表示具有成功的基因组编辑的株系。注意具有成功的基因组编辑的株系的总数目理论上可以更高,因为4个grna靶位点中仅有2个能够通过pcr-re测定进行检验,以及mpk2具有2个econi位点并且对来自突变dna的pcr产物的消化产生两个条带。绿框表示在两个位点都同时具有突变并且是推定的mpk6/mpk2双敲除株系的转基因株系。ck:野生型dna对照。图31.ptgb9株系的无转基因t1植株。在ptgb9株系的t0和t1植株中对基因组编辑装置(u3:ptg和cas9的1kb片段)的存在进行筛选。虽然t0株系在其基因组中含有基因组编辑装置的拷贝,t0株系的自花授粉使得可以从t1代植株去除基因组编辑装置。来自植株2-1、3-2、和4-2的基因组dna(蓝箭头)不含任何可检测的u3:ptg或cas9的片段。对照pcr产物容易地从内源水稻基因loc_os05g49730扩增,表明所使用的dna具有足够的质量用于pcr。wt:野生型dna对照。图32.mpk5上染色体缺失的序列。所示的是来自ptgb9株系4的截短片段(δ)的测序结果(seqidno:163)。该dna精准地在pam(红色字母,红色下划线)下游3bp的前间区序列靶位点的两个预测的双链断裂位点(绿色突出,绿色下划线)对接,在mpk5基因座上产生了727bp的染色体缺失。图33.mpk5的全长和截短的等位基因的遗传模式。对于来自株系4的8个t1植株,来自株系5的10个t1植株,和来自株系6的9个t1植株,筛选全长(mpk5)或截短的mpk5(δ)等位基因的遗传。所述植株当含有两个等位基因时分类为杂合的(h),而如果仅检测到较长的pcr产物则对于全长(f)是纯合的,或者如果仅检测到截短的pcr产物则对于缺失(d)是纯合的。ck:野生型dna对照。发明详述本技术提供了同时操纵多个基因或dna序列的方法,其中是通过单一多核苷酸表达盒的基于rna-引导的基因组编辑或基因沉默。一般而言,常规的基因组编辑或基因沉默技术仅能够操纵一个基因靶。目前用于多元基因组编辑的方法涉及多个启动子/终止子和繁琐的克隆步骤。申请人的发明提供了简单的、精准的和有效的方法来在体内从一个多核苷酸构建体(合成基因)产生多个小rna(例如,cas9的grna、sirna或mirna),并由此为目前的工具(如crispr/cas9系统,rnai)配备了操纵多个靶的能力。作为一般性的平台,此方法还简化并改善了grna:cas9/cas9-切口酶介导的基因组编辑、grna:失活-cas9介导的基因激活/阻抑/标记/表观基因组编辑、dsrna-介导的基因沉默、人造微rna和其它小rna介导的基因沉默的性能和可靠性。在植物中此技术可以用于通过同时操纵多个必要基因或数量性状基因座(qtl)来改善农作物产量、质量、胁迫耐受、昆虫和疾病抗性、和/或除草剂抗性。在动物中此技术可用于提高动物的繁殖力、健康和安宁,并辅助开发具有改善性状(如增重、饲料利用率等)的创始株系。在人类中此技术可以因为其紧凑的大小而有利于病毒介导的多个grna递送,并且可以用于治疗或缓解各种疾病状态。因为此技术是基于存在于所有生物体中的trna加工系统,其在基因组工程中的应用拓展至微生物、动物和人类,以用于工业和医疗的生物技术。定义所述方法的实施,以及本文公开的组合物的制备和用途,利用在本领域技术之内的分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组dna和相关领域的常规技术,除非另有说明。这些技术在文献中有完整的解释。参见例如,sambrook等人molecularcloning:alaboratorymanual,2ded.,coldspringharborlaboratorypress,1989;3ded.,2001;ausubel等人,currentprotocolsinmolecularbiology,johnwiley&sons,newyork,1987以及周期性的更新;methodsinenzymology系列,academicpress,sandiego;wolffe,chromatinstructureandfunction,thirdedition,academicpress,sandiego,1998;methodsinenzymology,vol.304,"chromatin"(p.m.wassarmananda.p.wolffe,eds.),academicpress,sandiego,1999;以及methodsinmolecularbiology,vol.119,"chromatinprotocols"(p.b.becker,ed.)humanapress,totowa,1999。术语“核酸”、“多核苷酸”、和“寡核苷酸”可互换使用并且是指脱氧核糖核苷酸或核糖核苷酸聚合物(线性或环状的构象,以及是单链或双链的形式)。对于本公开的目的,这些术语不应理解为是对于聚合物的长度进行限制。所述术语可涵盖核苷酸已知的类似物,以及在碱基、糖或磷酸酯部分经修饰的核苷酸(例如,硫代磷酸酯骨架)。一般而言,特定核苷酸的类似物具有同样的碱基配对特异性;也即,a的类似物将会与t碱基配对。术语“多肽”、“肽”和“蛋白”可互换地用于指氨基酸残基的聚合物。所述术语还适用于其中一或多个氨基酸是相应天然存在氨基酸的化学类似物或经修饰衍生物的氨基酸聚合物。“结合”是指大分子之间(例如,蛋白和核酸之间)序列特异性的、非共价的相互作用。并不是所有结合相互作用的成分都需要是序列特异性的(例如,在dna骨架中与磷酸酯残基接触),只要相互接触整体上是序列特异性的。此类相互作用一般通过10-6m-1或更低的解离常数(kd)来表征。“亲和性”是指结合的强度:提高的结合亲和性对应于较低的kd。“结合蛋白”是能够非共价地结合至另一分子的蛋白。结合蛋白可以例如结合至dna分子(dna-结合蛋白)、rna分子(rna-结合蛋白)和/或蛋白分子(蛋白-结合蛋白)。对于蛋白-结合蛋白的情形,其可以结合至自身(形成同二聚体、同三聚体等)和/或其可以结合一或多个分子的不同的蛋白。结合蛋白可以具有超过一种类型的结合活性。例如,锌指蛋白具有dna-结合、rna-结合和蛋白-结合活性。术语“序列”是指任何长度的核苷酸序列,其可以是dna或rna;可以是线性的、环状的、或分枝的,并且可以是单链的或双链的。术语“供体序列”是指插入基因组内的核苷酸序列。供体序列可以是任何长度的,例如长度为2至10,000个核苷酸(或者是之间或其上的任何整数),优选长度为大约100至1,000个核苷酸(或者之间的任何整数),更优选长度为大约200至500个核苷酸。用于确定核酸和氨基酸序列相同性的技术是本领域熟知的。通常,此类技术包括确定基因的mrna的核苷酸序列和/或确定由其所编码的氨基酸序列,并将这些序列与第二个核苷酸或氨基酸序列进行比较。基因组序列也可以此方式进行确定和比较。一般而言,相同性是指两个多核苷酸或多肽分别确切的核苷酸-对-核苷酸或氨基酸-对-氨基酸的对应。两个或更多个序列(多核苷酸或氨基酸)可以通过确定其百分比相同性来进行比较。两个序列(核酸或氨基酸序列)的百分比相同性,是用两个比对的序列之间确切匹配的数目除以较短序列的长度再乘以100。smith和waterman,advancesinappliedmathematics2:482-489(1981)的局部同源性算法提供了对核酸序列的大约比对。此算法可以通过使用dayhoff,atlasofproteinsequencesandstructure,m.o.dayhoffed.,5suppl.3:353-358,nationalbiomedicalresearchfoundation,washington,d.c.,usa开发的评分矩阵而应用于氨基酸序列,并通过gribskov,nucl.acidsres.14(6):6745-6763(1986)来进行归一化。此算法用于确定序列的百分比相同性的示例性施行由geneticscomputergroup(madison,wis.)在“bestfit"”实用应用中提供。用于此方法的缺省参数在wisconsinsequenceanalysispackageprogrammanual,version8(1995)(可得自geneticscomputergroup,madison,wis.)中有描述。在本公开的背景下建立百分比相同性的优选方法,是使用版权归爱丁堡大学、由johnf.collins和shanes.sturrok开发的、并由intelligenetics,inc.(mountainview,calif.)销售的mpsrch程序包。从此套程序包可以使用smith-waterman算法,其中缺省参数用于评分表(例如,12的缺口开放罚分、1的缺口延伸罚分、以及6的缺口)。从所产生的数据中,“匹配”值反映出序列相同性。其它用于计算序列之间百分比相同性或相似性的适宜程序一般是本领域已知的,例如,另一比对程序是blast,以缺省参数使用。例如,blastn和blastp可用以下的缺省参数来进行使用:基因编码=标准;过滤器=无;链=两条;截断值=60;预期=10;矩阵=blosum62;描述=50序列;排序=高得分;数据库=非冗余的,genbank+embl+ddbj+pdb+genbankcds翻译+swiss蛋白+spupdate+pir。这些程序的细节可以在以下互联网地址找到:http://www.ncbi.nlm.gov/cgi-bin/blast。对于本文所描述的序列,序列相同性程度预期的范围是大约80%至100%以及期间的任何整数值。通常序列之间的百分比相同性为至少70-75%、优选80-82%、更优选85-90%、更优选92%、更优选95%、以及最优选98%的序列相同性。或者,多核苷酸之间序列相似性的程度可以通过以下来进行确定:将多核苷酸在允许同源区域之间形成稳定双链体的条件下进行杂交,随后用单链特异性的核酸酶进行消化,并确定经消化片段的大小。当序列在给定长度的分子上展现出至少约70%-75%、优选80%-82%、更优选85%-90%、更优选92%、更优选95%、以及最优选98%的序列相同性(使用上文的方法确定)时,则两个核酸、或两个多肽序列基本上是同源的。如本文所用,基本上同源也是指显示出对指定的dna或多肽序列完全的相同性的序列。基本上同源的dna序列可以(在例如对该特定系统而定义的严格条件下)于southern杂交实验中进行鉴定。定义适宜的杂交条件是本领域的技术。参见例如,sambrook等人,supra;nucleicacidhybridization:apracticalapproach,editorsb.d.hamesands.j.higgins,(1985)oxford;washington,d.c.;irlpress)。两个核酸片段的选择性杂交可以如下进行确定。两个核酸分子之间的序列相同性程度影响此类分子之间杂交的效率和强度。部分相同的核酸序列将至少部分地抑制完全相同的序列对靶分子的杂交。完全相同序列杂交的抑制可以使用本领域熟知的杂交测定来进行评估(例如,southern(dna)印迹、northern(rna)印迹、溶液杂交,或者类似的等,参见sambrook,等人,molecularcloning:alaboratorymanual,secondedition,(1989)coldspringharbor,n.y.)。此类测定可以使用不同程度的选择性来进行,例如,使用从低到高严格性变化的条件。如果使用低严格性的条件,可以使用甚至缺乏部分程度的序列相同性的第二探针(例如,与靶分子具有低于大约30%序列相同性的探针)来评估非特异性结合的,从而,在缺乏非特异性结合事件时,所述第二探针将不会杂交至靶。当利用基于杂交的检测系统时,选择与参考核酸序列互补的核酸探针,并继而通过选择适宜的条件使所述探针和所述参考序列选择性地彼此杂交、或结合以形成双链分子。能够在中等严格杂交条件下选择性地杂交至参考序列的核酸分子,通常在使得能够检测长度至少约10-14核苷酸的核酸序列(与选择的核酸探针序列具有至少大约70%的序列相同性)的条件下杂交。严格杂交条件通常使得能够检测长度至少约10-14核苷酸的靶核酸序列(与选择的核酸探针序列具有超过大约90-95%的序列相同性)。用于探针/参考序列杂交的杂交条件(其中所述探针和参考序列具有特定程度的序列相同性),可以如本领域中已知的那样进行确定(参见,例如,nucleicacidhybridization:apracticalapproach,editorsb.d.hamesands.j.higgins,(1985)oxford;washington,d.c.;irlpress)。用于杂交的条件是本领域技术人员熟知的。杂交严格性是指杂交条件不利于含错配核苷酸的杂合体形成的程度,且较高的严格性对应于对错配杂合体较低的容忍度。影响杂交严格性的因素是本领域技术人员熟知的,且包括但不限于,温度、ph、离子强度、以及有机溶剂(如例如甲酰胺和二甲基亚砜)的浓度。如本领域技术人员所知的那样,通过更高的温度、更低的离子强度和更低的溶剂浓度来提高杂交严格性。对于杂交的严格性条件,本领域熟知的是可以使用许多等同的条件来建立特定的严格性,例如,通过改变以下因素:序列的长度和性质、各种序列的碱基组成、盐和其它杂交溶液成分的浓度、杂交溶液中封闭剂(例如,硫酸葡聚糖、和聚乙二醇)的存在或缺乏、杂交反应温度和时间参数、以及改变洗涤条件。特定杂交条件组的选择依照本领域中的标准方法来进行选择(参见,例如,sambrook,等人,molecularcloning:alaboratorymanual,secondedition,(1989)coldspringharbor,n.y.)。“切割”是指dna分子共价骨架的断裂。切割可以通过各种方法来起始,包括但不限于,磷酸二酯键的酶活化学水解。单链的切割和双链的切割都是可能的,并且双链的切割可以作为两个不同的单链切割事件的结果来发生。dna切割可导致产生平滑的末端或交错的末端。在某些实施方案中,融合多肽用于靶向的双链dna的切割。“染色体”是包含细胞的所有或部分基因组的染色质复合物。细胞的基因组常常通过其核型来表征,其是包含细胞的基因组的所有染色体的集合。细胞的基因组可包含一或多个染色体。“靶位点”或“靶序列”是定义结合分子所将结合的核酸部分(只要存在结合的充分条件)的核酸序列。例如,序列5'-gaattc-3'是ecori限制性内切核酸酶的靶位点。“外源”或“异源”分子是通常不存在于细胞中但是可以通过一或多种遗传学、生物化学或其它方法来引入细胞中的分子。“通常存在于细胞中”是针对细胞的特定发育阶段和环境条件来确定的。因而,例如,仅在肌肉的胚胎发育期间存在的分子对于成年肌肉细胞而言是外源分子。类似地,通过热休克诱导的分子对于非热休克细胞而言是外源分子。相反,“内源”分子是在特定的发育阶段于特定的环境条件下通常存在于细胞中的分子。例如,内源核酸可包含染色体,线粒体、叶绿体或其它细胞器的基因组,或者天然发生的附加体核酸。另外的内源分子可包括蛋白,例如,转录因子和酶。“基因表达”是指基因中所含的信息转换成基因产物。基因产物可以是基因的直接转录产物(例如,mrna、trna、rrna、反义rna、核酶、结构rna或任何其它类型的rna)或通过mrna的翻译产生的蛋白。基因产物还包括通过如加帽、多腺苷酸化、甲基化、和编辑的方法而经修饰的rna,以及通过例如甲基化、乙酰化、磷酸化、泛素化、adp-核糖基化、十四烷基化、和糖基化而经修饰的蛋白。基因表达的“调节”是指基因活性的改变。表达的调节可包括,但不限于,基因激活和基因抑制。术语“操作性连接”和“操作性地连接”(或“可操作地连接”)可互换地用于指两个或更多个成分(如序列元件)的毗邻,其中所述成分经过安排从而使得两个成分都功能正常并使得至少一个所述成分有可能介导对至少一个其它成分所发挥的功能。作为说明,如果转录调节序列因应一或多个转录调节因子的存在或缺失而控制编码序列的转录水平,则该转录调节序列,如启动子,可操作地连接至编码序列。转录调节序列一般以顺式与编码序列可操作地连接,但却并不必需是直接与其相邻。例如,增强子是与编码序列可操作地连接的转录调节序列,尽管它们并不紧邻。如本文所用,术语“编码区”和“编码序列”可互换使用并且是指编码多肽(并且当置于适当的调节序列的控制下时表达所编码的多肽)的核苷酸序列。编码区的边界一般是通过在其5'末端的翻译起始密码子和在其3'末端的翻译终止密码子来确定的。“调节序列”是调节其可操作地连接的编码序列的核苷酸序列。调节序列的非限制性实例包括启动子、增强子、转录起始位点、翻译起始位点、翻译终止位点、和转录终止子。包括编码区的多核苷酸可包括在编码区一侧或两侧的异源核苷酸。如本文所用,“异源核苷酸”是指通常不存在于编码区(其存在于野生型细胞中)旁侧的核苷酸。例如,在野生型微生物中存在的并且编码cas9多肽的编码区旁侧为同源序列,而在编码区旁侧的任何其它核苷酸序列则认为是异源的。异源核苷酸的实例包括,但不限于调节序列。通常,通过使用本领域技术人员熟知的标准遗传学和/或重组方法来使异源核苷酸存在于本文公开的多核苷酸中。本文公开的多核苷酸可以包括在适宜的载体中。如本文所用,“经遗传修饰的细胞”是指已经“通过人工”来改变的细胞。经遗传修饰的细胞,包括其中已经引入外源多核苷酸的细胞、愈伤组织、组织、植株、或动物。经遗传修饰的细胞,也是指已经过遗传操纵从而使内源核苷酸改变为包括突变(如缺失、插入、转换、颠换、或其组合)的细胞。例如,内源编码区可以被缺失。此类突变可以导致与内源多核苷酸所编码的多肽具有不同氨基酸序列的多肽。经遗传修饰的细胞、愈伤组织、组织、植株、或动物的另一实例是具有改变的调节序列,如启动子,以导致可操作连接的内源编码区表达提高或降低。除非另有指明,“一(a)”、“一(an)”、“所述”和“至少一”可互换使用并且意味着一个或超过一个。在本文中还有,通过端点来提及的数值范围包括归入该范围内的所有数值(例如,1至5包括1、1.5、2、2.75、3、3.80、4、5等)。如本文所用,术语“trna切割序列”是指由trna剪接内切核酸酶,如rnasep、rnasez或rnasee,所识别和剪切的任何核苷酸序列。如本文所用,术语“trna剪接内切核酸酶”是指负责识别trna前体中所含有的剪接位点以及切割trna前体中存在的内含子的酶。古细菌trna剪接内切核酸酶识别古细菌trna前体中的凸起-螺旋-凸起基序。真核trna剪接内切核酸酶通过测量从成熟结构域到剪接位点的距离还识别trna前体中所含有的剪接位点。表述“反义rna”表示能够结合至靶核酸序列(dna或rna)从而限制或阻止其发挥功能的rna;具体而言,反义rna能够结合至靶信使rna从而阻止其翻译(参见,例如,tafech等人(2006)curr.med.chem.13:863-881)。表述“干扰rna”表示能够通过干扰现象来阻止或限制靶基因表达的rna(参见,例如,tafech等人(2006)curr.med.chem.13:863-881)。本发明的方法和组合物trnatrna的一般特征是本领域技术人员熟知的。优选地,trna是由单一的核糖核苷酸链(其能够折叠以采取特征性的、所谓的三叶草二级结构)形成的。此特征性的二级结构包含:(i)由核糖核苷酸链5'末端的前7个核糖核苷酸和核糖核苷酸链3'末端最后4个核糖核苷酸之前的7个核糖核苷酸所组成的受体茎,由此形成包含6或7对核糖核苷酸的双链结构,由核糖核苷酸链5'末端的第一个核糖核苷酸和核糖核苷酸链3'末端最后4个核糖核苷酸之前的核糖核苷酸所组成的核糖核苷酸可以不配对;ii)由4对核糖核苷酸组成的d臂和由8至10个核糖核苷酸组成的d环,通过跟随核糖核苷酸链5'末端前7个核糖核苷酸之后的部分核糖核苷酸链的折叠所形成;(iii)由5对核糖核苷酸组成的反密码子的茎,和由7个核糖核苷酸组成的反密码子的环(反密码子的茎-环),通过跟随d臂和d环之后的部分核糖核苷酸链的折叠所形成;(iv)由4至21个核糖核苷酸组成的并且由跟随反密码子的茎和反密码子的环之后的部分核糖核苷酸链所形成的可变环;(v)由5对核糖核苷酸组成的t臂,和由8个核糖核苷酸组成的t环,通过跟随可变环之后且在核糖核苷酸链3'末端参与受体茎组成的核糖核苷酸之前的部分核糖核苷酸链的折叠所形成;同样优选地,从5'末端朝向3'末端的方向,在核糖核苷酸链5'末端的前7个核糖核苷酸与d臂和环之间存在2个核糖核苷酸,一方面在d臂和环之间、另一方面在反密码子的茎和环之间存在1个核糖核苷酸,以及一方面在反密码子的茎和环之间、另一方面可变环存在1个核糖核苷酸。优选地,并且根据本领域技术人员熟知的且由sprinzl等人(1998)"compilationoftrnasequencesandsequencesoftrnagenes".nucleicacidsres.26:148-153所定义的编号,trna包含17个核糖核苷酸,确保trna的三维结构以及被细胞的酶所识别,也即:u.sub.8、a.sub.14、(a或g).sub.15、g.sub.18、g.sub.19、a.sub.21、g.sub.53、u.sub.54、u.sub.55、c.sub.56、(a或g).sub.57、a.sub.58、(c或u).sub.60、c.sub.61、c.sub.74、c.sub.75、a.sub.76。所示的核糖核苷酸对应于由细胞器对某些核糖核苷酸进行任何转录后修饰之前所转录的trna的序列。具体而言,上文定义的trna可以选自以下组:古细菌、细菌、病毒、原生动物、真菌、藻类、植物、或动物trna。可以根据本发明使用的trna还包括sprinzl等人(1998)"compilationoftrnasequencesandsequencesoftrnagenes".nucleicacidsres.26:148-153所描述的所有trna或者可以得自以下站点的那些trna:http://www.uni-bayreuth.de/departments/biochemie/trna/。在本发明的背景下,术语“trna”还包括通过对上文所定义的trna进行修饰而获得的结构,或者上文所定义的trna的天然变体,只要这些经修饰的结构或那些变体保留未经修饰的trna的功能性,也即特别是与蛋白的相互作用,所述蛋白如ef-tu因子(参见,例如,rodnina等人(2005)febs.lett.579:938-942)或ccase(参见,例如,augustin等人(2003)j.mol.biol.328:985-994)。有许多trna活性序列和基序是通过以下资源使本领域技术人员已知且可得的:如可得自万维网lowelab.ucsc.edu/trnacan-se/的trna-se程序或万维网trna.bioinf.uni-leipzig.de/dataoutput/organisms(对于所有生物体),或万维网plantrna.ibmp.cnrs.fr/(对于植物)。许多文章和genbank资源也是可得的并在本文中提及。用于rnase的trna内切核酸酶的底物可以通过本领域技术人员熟知的任何方法来产生。例如,所述底物可以通过使用亚磷酰胺或其它溶液或固相方法来化学合成。用于通过亚磷酰胺方法形成多核苷酸的化学的详细描述是已知的(参见例如,caruthers等热,u.s.pat.nos.4,458,066和4,415,732;caruthers等热,1982,geneticengineering4:1-17;user’smanualmodel392and394polynucleotidesynthesizers,1990,页码6-1至6-22,appliedbiosystems,partno.901237;ojwang,等人,1997,biochemistry,36:6033-6045)。在合成之后,所述底物可以使用本领域技术人员熟知的标准技术来进行纯化(参见hwang等人,1999,proc.natl.acad.sci.usa96(23):12997-13002以及其中引用的参考文献)。根据所述底物的长度以及其合成方法,此类纯化技术包括但不限于,反相高效液相色谱(“反相hplc”)、快速高效液相色谱(“fplc”)、和凝胶纯化。本领域技术人员有许多rnase资源可用,包括以下:rnasee1.soderbomf,svardsg,kirsebomla.2005.rnaseecleavageinthe5'leaderofatrnaprecursor.jmolbiol352(1):22-27.2.nakajiman,ozekih,shimuray.1981.organizationandstructureofane.colitrnaoperoncontainingseventrnagenes.cell23(1):239-249.3.liz,deutschermp.2002.rnaseeplaysanessentialroleinthematurationofescherichiacolitrnaprecursors.rna8(1):97-109.rnasep1.kirsebomla.2007.rnaseprnamediatedcleavage:substraterecognitionandcatalysis.biochimie89(10):1183-1194.2.gutmannb,goberta,giegep.2012.prorpproteinssupportrnasepactivityinbothorganellesandthenucleusinarabidopsis.genesdev.26(10):1022-1027.3.forsterac,altmans.1990.externalguidesequencesforanrnaenzyme.science249(4970):783-786.4.yuany,altmans.1995.substraterecognitionbyhumanrnasep:identificationofsmall,modelsubstratesfortheenzyme.emboj14(1):159-168.rnasez1.kruszkak,barnechef,guyotr,ailhasj,meneaui,schiffers,marchfeldera,echeverriam.2003.plantdicistronictrna-snornagenes:anewmodeofexpressionofthesmallnucleolarrnasprocessedbyrnasez.emboj22(3):621-632.2.schiffers,roschs,marchfeldera.2002.assigningafunctiontoaconservedgroupofproteins:thetrna3'-processingenzymes.emboj21(11):2769-2777.3.barbeziern,caninog,rodorj,jobete,saez-vasquezj,marchfeldera,echeverriam.2009.processingofadicistronictrna-snornaprecursor:combinedanalysisinvitroandinvivorevealsalternatepathwaysandcouplingtoassemblyofsnornp.plantphysiol150(3):1598-1610.4.caninog,bociane,barbeziern,echeverriam,fornerj,binders,marchfeldera.2009.arabidopsisencodesfourtrnasezenzymes.plantphysiol150(3):1494-1502如本文所用,表述“3'末端mrna前体内切核酸酶的底物”是指由3'末端mrna前体内切核酸酶识别并剪切的任何核苷酸序列。例如,包含切割位点上游的序列aauaaa的六核苷酸以及下游的富含g/u的序列元件的核苷酸序列,可以在本文所述的测定用作3'末端mrna前体内切核酸酶的底物。由3'末端mrna前体内切核酸酶识别并剪切的核苷酸序列,可包含10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、25个核苷酸、30个核苷酸、40核苷酸。45个核苷酸、50个核苷酸、55个核苷酸、60个核苷酸、65个核苷酸、75核苷酸、100个核苷酸、125个核苷酸、150核苷酸、或更多。在具体的实施方案中,本文所述测定中所使用的3'末端mrna前体内切核酸酶包含切割和多腺苷酸化位点。载体和核酸多种核酸可以被引入细胞内用于本发明的目的。如本文所用,术语核酸包括dna、rna、和核酸类似物,以及双链的或单链的核酸(也即,有义或反义单链)。核酸类似物可以在碱基部分、糖部分、或磷酸酯骨架进行修饰,以改善例如核酸的稳定性、杂交、或溶解度。在碱基部分的修饰包括脱氧尿苷代替脱氧胸苷,以及5-甲基-2'-脱氧胞苷和5-溴-2'-脱氧胞苷代替脱氧胞苷。糖部分的修饰包括修饰核糖的2'羟基以形成2'-o-甲基或2'-o-烯丙基糖。脱氧核糖磷酸酯骨架可以经过修饰以产生吗啉代核酸,其中每个碱基部分连接至六元的吗啉环、或肽核酸,其中脱氧磷酸酯骨架被伪肽骨架所取代并且保留四种碱基。参见,summerton和weller(1997)antisensenucleicaciddrugdev.7(3):187;和hyrup等人(1996)bioorgan.med.chem.4:5。另外,可以用例如,硫代磷酸酯或二硫代磷酸酯骨架、亚磷酰胺、或烷基磷酸三酯骨架来取代脱氧磷酸酯骨架。所述核酸序列可以是可操作地连接至调节区如启动子。调节区可以是猪调节区或者是来自其它物种。如本文所用,可操作地连接是指调节区相对于核酸序列的位置是允许或促进靶核酸转录的方式。任何类型的启动子都能可操作地连接至靶核酸序列。启动子的实例包括且不限于,组织特异性启动子、组成性启动子、可诱导启动子、以及对特定刺激应答或不应答的启动子。适宜的组织特异性启动子可以导致核酸转录物在β细胞中的优先表达,并且包括例如人胰岛素启动子。其它组织特异性启动子可导致例如在肝细胞或心脏组织中的优先表达,并且可分别包括白蛋白或α-肌球蛋白重链启动子。在其它实施方案中,可以使用促进核酸分子表达而无显著的组织或时间特异性的启动子(也即,组成性启动子)。例如,可以使用β-肌动蛋白启动子如鸡β-肌动蛋白基因启动子、泛素启动子,minicag启动子,甘油醛-3-磷酸脱氢酶(gapdh)启动子、或3-磷酸甘油酸激酶(pgk)启动子,以及病毒启动子如单纯疱疹病毒胸苷激酶(hsv-tk)启动子、sv40启动子、或巨细胞病毒(cmv)启动子。在一些实施方案中,使用鸡β-肌动蛋白基因启动子和cmv增强子的融合作为启动子。参见,例如,xu等人(2001)hum.genether.12:563;andkiwakietal.(1996)hum.genether.7:821。可用于核酸构建体的另外的调节区包括但不限于,多腺苷酸化序列、翻译控制序列(例如,内部核糖体进入区段,ires)、增强子、可诱导元件、或内含子。此类调节区可以不是必需的,虽然它们可以通过影响转录、mrna的稳定性、翻译效率等等来提高表达。此类调节区可以包括在核酸构建体中以期望获得核酸在细胞中的最佳表达。然而,有时没有此类额外元件时可以获得充分的表达。可以使用编码信号肽或可选择标志物的核酸构建体。可以使用信号肽从而将所编码的多肽引导至特定的细胞部位(例如,细胞表面)。可选择标志物的非限制性实例包括嘌呤霉素、更昔洛韦、腺甙脱氨酶(ada)、氨基糖苷磷酸转移酶(neo,g418,aph)、二氢叶酸还原酶(dhfr)、潮霉素-b-磷酸转移酶、胸苷激酶(tk)、和黄嘌呤鸟嘌呤磷酸核糖转移酶(xgprt)。此类标志物可用于在培养物中选择稳定的转化体。其它可选择标志物包括荧光多肽,如绿色荧光蛋白或黄色荧光蛋白。核酸可以掺入载体中。载体是广义的术语,其包括设计为从运载体移动进入靶dna的任何特定的dna区段。载体可以是指表达载体,或载体系统,其是将dna插入带至基因组或其它靶向的dna序列(如附加体、质粒、或者甚至是病毒/噬菌体dna区段)的一组部件。用于在动物中递送基因的载体系统如病毒载体(例如,逆转录病毒,腺相关病毒和整合噬菌体病毒),和非病毒载体(例如,转座子)具有两个基本部件:1)由dna(或者是逆转录成cdna的rna)组成的载体和2)转座酶、重组酶、或者其它识别载体和dna靶序列并将载体插入至靶dna序列中的整合酶。载体最经常含有一或多个表达盒(包含一或多个表达控制序列),其中表达控制序列是分别控制和调节另一dna序列或mrna的转录和/或翻译的dna序列。许多不同类型的载体是已知的。例如,质粒和病毒载体,例如,逆转录病毒载体,是已知的。多核苷酸构建体可以通过许多常规技术来引入至期望的受体或受体细胞的基因组中。对于此类技术的综述,参见,例如,weissbach&weissbachmethodsforcell,molecularbiology(1988,academicpress,n.y.)sectionviii,pp。421-463;和grierson&corey,cellmolecularbiology(1988,2ded.),blackie,london,ch.7-9。例如,可以使用技术如电穿孔和显微注射来将所述dna构建体直接引入至细胞的基因组dna中,可以使用基因枪方法如dna粒子轰击来将所述dna构建体直接引入至植物或动物(参见例如,klein等人(1987)nature327:70-73)。或者,所述dna构建体可以与适宜的t-dna侧翼区结合并被引入至常规的根瘤土壤杆菌(agrobacteriumtumefaciens)宿主载体中。根瘤土壤杆菌-介导的转化技术,包括卸甲(disarming)和使用双元载体,在科学文献中有很好的描述。参见例如horsch等人(1984)science233:496-498,和fraley等人(1983)proc.nat'l.acad.sci.usa80:4803。当细胞使用双元tdna载体(bevan(1984)nuc.acidres.12:8711-8721)或共培养过程(horsch等人(1985)science227:1229-1231)而受到细菌感染时,根瘤土壤杆菌宿主的毒力功能将直接引导所述构建体和相邻的标志物进入细胞dna。参见hernalsteen等人(1984)emboj3:3039-3041;hooykass-vanslogteren等人(1984)nature311:763-764;grimsley等人(1987)nature325:1677-179;boulton等人(1989)cellmol.biol.12:31-40;和gould等人(1991)cellphysiol.95:426-434。另外的基因转移和转化方法包括但不限于,通过钙-、聚乙二醇(peg)-、或电穿孔-介导的裸dna摄取进行的原生质体转化(参见paszkowski等人(1984)emboj3:2717-2722,potrykus等人(1985)molec.gen.genet.199:169-177;fromm等人(1985)proc.nat.acad.sci.usa82:5824-5828;和shimamoto(1989)nature338:274-276)和细胞、植物或动物组织的电穿孔(d'halluin等人(1992)cell,4:1495-1505)。用于细胞转化的另外的方法包括显微注射,碳化硅介导的dna摄取(kaeppler等人(1990)cellreporter9:415-418),和微粒轰击(参见klein等人(1988)proc.nat.acad.sci.usa85:4305-4309;和gordon-kamm等人(1990)cell2:603-618)。可以通过选择或筛选经修饰的细胞、植物或动物材料由转化dna上存在的标志物基因所编码的性状,来对经转化的细胞、愈伤组织、组织植物或动物进行鉴定和分离。例如,可以通过使经修饰的细胞在含有一致性量的抗生素或除草剂(转化基因对其赋予抗性)的培养基上生长来进行筛选。另外,还可以通过筛选重组核酸构建体上存在的任何可视标志物基因的活性(例如,β-葡萄糖苷酸酶、荧光素酶、b或c1基因)来鉴定经转化的细胞。此类选择和筛选方法学是本领域技术人员熟知的。还可以使用物理学和生物化学方法来鉴定含有插入的基因构建体的转化体。这些方法包括但不限于:1)用于检测和确定重组dna插入物结构的southern分析或pcr扩增;2)用于检测和检验基因构建体的rna转录物的northern印迹、s1rnase保护、引物-延伸或逆转录酶-pcr扩增;3)用于检测酶或核酶活性的酶测定,其中此类基因产物是由所述基因构建体所编码的;4)蛋白凝胶电泳、western印迹技术、免疫沉淀、或酶联免疫测定,其中所述基因构建体产物是蛋白。另外的技术,如原位杂交、酶染色、和免疫染色,也可用于检测检测在具体细胞、植物或动物器官和组织中重组构建体的存在或表达。用于进行所述这些测定的方法都是本领域技术人员熟知的。基因组改变包括稳定掺入细胞中的多核苷酸、或通过基因编辑创建的插入/缺失,可以例如使用标准育种技术来引入至其它的细胞、组织、植物或动物中。通过任何上述转化技术所制备的经遗传修饰的细胞可以进行培养,以再生具有转化的基因型并因而具有期望表型的完整植物或动物组织。此类再生技术依赖于组织培养生长培养基中特定植物激素的操纵,通常依赖于已经与期望的核苷酸序列一起引入的杀虫剂和/或除草剂标志物。从培养的原生质体再生植物或动物在handbookofcell,plantoranimalcellculture,pp.124-176,macmillianpublishingcompany,newyork,1983中evans等人的"protoplastsisolationandculture";以及binding,regenerationofprotoplasts,pp.21-73,crcpress,bocaraton,1985中有描述。再生也可以从愈伤组织,外植细胞(excell),器官、花粉、胚胎或其部分来获得。此类再生技术一般在klee等人(1987)ann.rev.ofcell,plantoranimalphys.38:467-486中有描述。引入至细胞内的核酸,可用于将期望的性状赋予基本上任何细胞、植物或动物。可以使用本公开的核酸构建体和上文提到的各种转化方法来修饰多种多样的细胞、植物或动物系统,以获得本文所述的期望的生理学和农艺学特征。在优选的实施方案中,用于在植物中进行修饰的靶细胞可以包括但不限于,那些单子叶植物和双子叶植物细胞,植物或动物,如农作物包括谷类作物(例如,小猫、玉米、水稻、粟、大麦),果蔬作物(例如,番茄、苹果、梨、草莓、桔子),饲料作物(例如,苜蓿),根菜作物(例如,胡萝卜、马铃薯、甜菜、山药)、叶菜作物(例如,生菜、菠菜);开花细胞、植物或动物(例如,矮牵牛、玫瑰、菊花),针叶树和松树(例如,松杉,云杉);用于植物修复的细胞、植物或动物(例如,重金属积累细胞、植物或动物);油料作物(例如,向日葵、油菜籽)以及用于实验目的的细胞、植物或动物(例如,拟南芥)。因而,所公开的方法和组合物在广泛的细胞、植物或动物中有用途,包括但不限于来自以下属的种类:芦笋属、燕麦属、芸苔属、柑桔属、西瓜属、辣椒属、南瓜属、胡萝卜属属、大豆属、大麦属、莴苣属、番茄属、苹果属、木薯属、烟草属、稻属、鳄梨属、豌豆属、梨属、李属、萝卜属、黑麦属、茄属、高粱属、小麦属、葡萄、豇豆属、和玉蜀黍属。本领域技术人员会意识到,在表达盒稳定掺入转基因细胞、植物或动物中并确认是可操作的之后,其可以通过有性杂交而引入至其它的细胞、植物或动物中。可以使用许多标准育种技术中的任何技术(取决于要进行杂交的物种)。使用本文公开的方法进行的基因操纵可以通过以下进行观测,例如,分离自感兴趣组织的rna(例如,mrna)的northern印迹。通常,如果mrna的量提高了,可以推定相应的内源基因在以比之前更高的速率表达。可以使用其它测量基因活性的方法。可以使用不同类型的酶测定,取决于所使用的底物和检测反应产物或副产物增加或减少的方法。另外,所表达的水平和/或蛋白可以通过免疫化学进行测量,也即,elisa、ria、eia和本领域技术人员熟知的其它基于抗体的测定,如通过电泳检测测定(用染色或蛋白印迹)。转基因可以在一些组织中或者在某些发育阶段选择性地表达,或者转基因可以在基本上所有细胞中表达,基本上在其整个生命周期。然而,任何组合表达的模式也是适用的。本公开还涵盖了上文所述转基因细胞的后代、克隆、细胞系或细胞,其中所述后代、克隆、细胞系或细胞具有转基因或基因构建体或者已经过编辑。用于基因靶向和基因组编辑的质粒载体根据本发明的一个方面,提供了使得能够在细胞中进行基因靶向和基因组编辑的组合物。在一个方面,提供了具体的rna-引导的基因组编辑载体。在优选的实施方案中,所述载体包括在植物或动物细胞中可操作的第一调节元件,其可操作地连接至至少一个编码crispr-cas系统引导rna(其与靶序列杂交)的核苷酸序列;和在植物或动物细胞中可操作的第二调节元件,其可操作地连接至编码ii型crispr-相关的核酸酶的核苷酸序列。所述编码crispr-cas系统引导rna的核苷酸序列和事实编码ii型crispr-相关的核酸酶的核苷酸序列可以在系统的相同或不同载体上。所述引导rna靶向靶序列,并且所述crispr-相关的核酸酶切割dna分子,其中至少一种基因产物的表达经改变。在优选的实施方案中,所述载体包括核苷酸序列,该核苷酸序列包含依赖dna的rna聚合酶iii启动子,其中所述启动子可操作地连接至grna分子和poliii终止子序列,其中所述grna分子包括dna靶序列;和包括核苷酸序列,该核苷酸序列包含依赖dna的rna聚合酶ii启动子,其中所述启动子可操作地连接至编码ii型crispr-相关核酸酶的核酸序列。所述crispr-相关核酸酶优选是cas9蛋白。在另一实施方案中,提供了用于土壤杆菌-介导的瞬时表达或者植物或动物组织中稳定转化的载体。具体而言,用于在原生质体、组织培养物中瞬时表达的质粒载体含有:(1)依赖dna的rna聚合酶iii(poliii)启动子(例如,水稻snornau3或u6启动子)来控制细胞、植物或动物细胞中经改造grna分子的表达,其中通过poliii终止子(poliiiterm)来终止转录,(2)依赖dna的rna聚合酶ii(polii)启动子(例如,35s启动子)来控制cas9蛋白的表达;(3)位于poliii启动子和grna支架之间的多克隆位点(mcs),其用于插入15-30bpdna序列以产生经改造的grna。为了有利于土壤杆菌-介导的转化,提供了双元载体(例如,pcambia1300载体),其中grna支架/cas9盒经土壤杆菌转化而插入至植物、动物和真菌细胞内。为了编排grna,可以将与靶基因组序列互补的15-30bp长的合成dna序列插入至载体的mcs位点内。将改造的grna-cas9构建体引入细胞基因组基因组编辑和遗传修饰的方法根据本发明的另一方面,可以通过各种方法将携带grna-cas9核酸酶的基因构建体引入细胞内,其包括但不限于peg-或电穿孔-介导的原生质体转化,组织培养或者通过基因枪轰击进行的细胞、植物或动物组织转化,或者土壤杆菌-介导的瞬时和稳定转化。所述转化可以是瞬时或稳定转化。用于基因组编辑和遗传修饰的靶基因序列可以使用现有技术中已知的、且在此申请的其它部分描述的方法来进行选择。在优选的实施方案中,鉴定包括或接近前间区序列邻近基序(pam)的靶序列。一旦经鉴定,可以通过合成一对靶特异性dna寡核苷酸(具有适当的克隆接头)来靶向该具体序列,并将所述寡核苷酸磷酸化、退火、并连接至经消化的质粒载体内,如本文中所述。包含靶特异性寡核苷酸的质粒载体可以继而用于细胞、植物或动物的转化。设计具有最小脱靶风险的特异性grna的方法根据一个方面,本发明提供了设计dna/rna序列的方法,所述dna/rna序列引导cas9核酸酶以高特异性靶向期望的位点。经修饰的grna的特异性可以通过其间隔区序列与所靶向的生物体的基因组序列的序列比对来进行计算。制备非转基因的、经遗传修饰的植物或动物的手段使用前述的质粒载体和递送方法,可以通过特异性的基因靶向和基因组编辑来制备经遗传修饰的细胞、植物或动物。在许多情形中,所得到的经遗传修饰的农作物不含有外源基因并且基本上是非转基因的。通过此技术可以将编码grna的dna序列设计为特异性地靶向任何基因或dna序列,以用于经插入或缺失或其它修饰(例如,转录激活和阻抑、甲基化和去甲基化、标记)而进行的定向突变。在细胞、植物或动物基因组中有效地且特异性地创建定向突变或修饰的能力大大地辅助具有改善的或新的性状的许多新后代的开发。因为所述crispr/cas基因构建体在原生质体中仅仅瞬时表达并且未整合至基因组内,从原生质体再生的经遗传修饰的植物或动物不含有外源dna并且基本上是非转基因的。另外,可以在基因组编辑的转基因株系回交或自交之后通过遗传分离来获得无转基因的植物或动物。其它基于rna的遗传操纵技术本发明可同样地适用于其它rna介导的遗传操纵技术,如基于rna的基因表达抑制。通常,能够产生抑制至少一种多肽的转录和/或翻译的rna分子的表达盒包括在本发明内。在本发明的一些实施方案中,用能够表达多核苷酸(其抑制多肽的表达)的表达盒来转化细胞。术语“表达”如本文所用是指基因产物的生物合成,包括所述基因产物的转录和/或翻译。蛋白或多肽从dna分子的“表达”或“产生”是指编码序列的转录和翻译以产生所述蛋白或多肽,而蛋白或多肽从rna分子的“表达”或“产生”是指rna编码序列的翻译以产生蛋白或多肽。抑制多肽表达的多核苷酸的实例包括有义抑制/共抑制,其中表达盒设计为表达相应于所有或部分以“有义”方向编码多肽的信使rna的rna分子,并且所述rna分子的过表达可导致天然基因表达的降低;反义抑制,其中表达盒设计为表达与所有或部分编码acc合酶多肽的信使rna互补的rna分子,并且所述反义rna分子的过表达可导致天然基因表达的降低;双链rna干扰,其中如上文所述用于共抑制的有义rna分子、以及与所述有义rna分子完全或部分互补的反义rna分子,在同一细胞中表达,导致相应内源信使rna、发夹rna干扰和含有内含子的发夹rna干扰表达的抑制,其中所述表达盒设计为表达与自身杂交已形成发夹结构(包含单链的环区和碱基配对的茎)的rna分子、小干扰rna或微rna,其中所述表达盒设计为表达仿照内源mirna基因的rna分子。另外,本发明中所描述的多元grna-介导的基因组编辑可以与失活的cas蛋白一起使用,来用于多个基因的转录激活和抑制、多个位点或基因的表观基因组编辑(例如,甲基化和去甲基化)、基因组元件的标记、以及其它活生物体中的多元遗传操纵。实施例实施例1所述crispr/cas9系统正在被利用为在基础研究、分子疗法和作物改良中用于基因组工程的有力工具。此系统利用小引导rna(grna)来将cas9内切核酸酶导向特定的dna位点,因而其靶向能力大大地受到grna表达装置的局限。申请人开发了从单一的多顺反子基因产生许多grna的一般策略。将精准切割trna前体两个末端的内源trna加工系统,改造为简单的且强力的平台以加强crispr/cas9系统的靶向和多元编辑能力。申请人在本文中证明了,具有串联排列的trna-grna架构的合成基因在体内被高效且精准地加工为具有期望的5’靶向序列的grna,其引导cas9来编辑多个染色体靶。使用此策略,在稳定的转基因水稻植株中容易地以高效率(高达100%)实现多元基因组编辑和染色体片段缺失。因为trna以及其加工体系实际上在多有存活生物体中都是保守的,此方法可以广泛用于加强crispr/cas9工具包的靶向能力和编辑效率。较高等的生物体通常利用具有功能上冗余的基因的复杂遗传网络,以对细胞过程进行微调。因此,具有同时操纵多个基因的能力的分子工具,在遗传工程的基础研究和实践应用中都具有很高的价值。近来,细菌ii型规律成簇的间隔短回文重复序列(crispr)和crispr-相关蛋白(cas)系统正在成为用于此目的的有前景的工具。来自酿脓链球菌的cas9内切核酸酶(偶合有人工的引导rna(grna)),能够靶向5’-n20-ngg-3’(n表示任何碱基)的dna序列,其中n20与grna5’序列的20个碱基相同(下文称作grna间隔区)和ngg为前间区序列邻近基序(pam)(1-3)。简单的rna-引导的可编排规则以及基因组中pam的高出现率,使得cas9-grna能够容易地靶向几乎所有遗传元件用于基因组编辑。由于其简便性和高效性,已经迅速开发基于cas9的工具以用于基因组/表观基因组编辑、转录调节以及其它遗传工程中的应用(4-6)。原则上,多元基因组编辑可以通过将cas9(或cas9衍生的效应子)与用于各个靶位点的多个grna一起表达来实现。常规递送方法包括显微注射或含有多个用于多元基因组编辑的单一grna(sgrna)表达盒的基因构建体的表达(2,3,7-11)。体外合成的grna和cas9蛋白(或cas9mrna)直接显微注射至细胞或胚胎内仅适宜用于很少的系统。结果,最常见的策略是在一个质粒构建体中堆积多个sgrna表达盒,或者使用多个构建体。一个sgrna表达盒通常的大小是大约400-500bp并且由rna聚合酶iii(poliii)启动子、grna和poliii终止子组成。由于递送方法和质粒载体容量的限制,对于大部分生物体来说以此种grna表达策略同时产生许多grna都会是种挑战。另外,真核poliii转录的rna必须要以减少cas9/grna可靶向位点的特定核糖核苷酸来开始。先进的策略是将多个grna压至一个合成基因中并改造rna加工系统来从初级转录物剪切个体grna。基于此种策略的唯一经证实的方法是将csy4内切核糖核酸酶(endo-rnase)与cas9表达来加工含有grna(融合有csy4-可切割的rna)的转录物(12,13)。尽管如此,仍然需要用于同时产生多个grna的更有力和精确的方法,以改善多元编辑能力和促进更精密的cas9应用。rna是基础的细胞成分并且其制备是通过不同生物体中保守且精确的rna加工系统来保证的。这激发了我们改造内源rna加工系统以从单一转录物产生多个grna,而不是与cas9/grna成分一起引入任何另外的rnase。申请人在本文中证明了,在通过内源rnase体内精准剪切转录物之后,可以从具有trna-grna架构的单一合成基因有效产生多个grna。此grna表达策略显示出不仅使得能够进行多元靶向,还改善了crispr/cas9系统在植物中的编辑效率。因为trna加工系统存在于几乎所有生物体中,此策略可以广泛用于加强用于基因组工程的crispr/cas9工具的多元编辑能力。结果改造trna加工系统用于产生许多grna的策略为了从一个初级转录物同时产生多个grna,我们目的是将一簇具有不同的间隔区的grna压至一个多顺反子基因中,并操控内源rna加工系统来将此转录物切割成核中的个体grna。在搜寻潜在符合此要求的rna和内源-rnase的过程中,trna因为其以下的特征而吸引了我们的注意。(i)在核质中,trna前体(trna前体)在真核细胞中于特定的位点分别被rnasep和rnasez(或在细菌中为rnasee)切割以去除5’和3’附加序列(图1a)(14-18)。(ii)rnasep和rnasez识别trna结构,不论是否trna前体序列(17,18)。此前的研究反映出,对于trna前体的rnasep和rnasez切割,只有trna的受体茎、d-环臂、和tψc-环臂是必需的(16-19)。(iii)trna在细菌的多顺反子转录单位中发现(20)以及时而会在真核细胞中发现(19,21),表明trna加工系统很可能被用作固有的机制,以从来自单一多顺反子基因的trna(19)产生不同的小rna(例如,snorna)。(iv)由于trna是最丰富的细胞成分之一,因而内源trna加工系统应当很强力,以便加工大量的底物。(v)trna基因含有内部启动子元件(框a和b)来募集rna聚合酶iii(poliii)复合物(图1b)(22,23)。因而trna序列也可以充当用于poliii的潜在转录增强子。基于这些特征,我们假定内源trna系统能被改造为用于grna的精准加工的一般平台。为了将内源trna系统用于以cas9/grna进行的多元基因组编辑,我们设计了多顺反子的trna-grna(ptg)基因,以用于同时产生许多grna。如图1c中所示,此ptg基因由trna-grna的串联重复序列组成,并且将会在poliii启动子的控制下被转录为正常的snorna或sgrna基因。加工trna的内源rnase(例如,植物中的rnasep和rnasez)将会识别trna成分,并从ptg转录物剪切个体grna。所得的grna将继而引导cas9至多个靶位点以进行基因组编辑(图1c)。将ptg精准加工以产生具有期望靶序列的功能性grna为了探究合成的ptg基因是否会如我们所预期的那样转录、加工和发挥功能(图1c),我们合成了4种具有trna-grna(ptg1和ptg2)或trna-grna-trna(ptg1.1和ptg2.1,图2a)结构的ptg基因。这4种ptg基因设计为产生此前已用sgrna基因(sgrna1和sgrna2)在cas9-介导的基因组编辑中(实施例2,图5a和参见表2.1中的基因序列)经过测试的grna1(ptg1和ptg1.1)和grna2(ptg2和ptg2.1)(24)。两种grna都靶向于水稻mpk5基因,该基因编码参与生物和非生物信号通路的丝裂原-激活的蛋白激酶(mapk)。这些ptg用77-bp长的trna前体gly基因来构建,该基因识别ggc密码子并广泛存在于各种生物体中(25)。所选择的trna前体gly序列由5’前导序列(5’-aacaaa-3’,6bp)和成熟trna(71bp)组成(图2b)。ptg中的此种trna-grna融合模拟了植物中的天然trna-snorna43双顺反子(19)。在此研究中,我们使用了质粒载体(实施例2,图6),其中sgrna或ptg用水稻u3snorna启动子(u3p)来表达,而cas9用水稻泛素启动子外加完整的5’非翻译区(ubip)来表达。在用含有u3p:sgrna或u3p:ptg的质粒转染水稻原生质体之后,进行了循环的逆转录pcr(crt-pcr)(26,27)以对成熟grna5’-末端和3’-末端作图(crt-pcr的原理参见si附录,图s7和表s2)。从表达ptg或sgrna的原生质体检测到具有预期大小的成熟grna(图2c-2f)。然而,来自ptg的trna-grna融合的转录物通过crt-pcr不能检测,可能是由于强力的trna加工系统将大部分的(如果不是全部的话)ptg初级转录物切割。对crt-pcr产物的序列分析反映出所有4种ptg转录物都精准地在trna-grna接合处切割,并产生携带期望的5’间隔区序列(无附加的核苷酸)的成熟grna(图2g和实施例2,图8和9)。另一方面,成熟grna的3’-末端携带有1-7nt长的聚(u)尾(如果其出现在poliii终止子之前的话)(sgrna,ptg1和ptg2,参见实施例2,图8)、或者1-4nt的来自trna-前导序列的核糖核苷酸(当其出现在trna之前时)(ptg1.1和ptg2.1,参见实施例2,图9)。所述crt-pcr数据还确认了从u3p:sgrna转录的grna必须要以核苷酸a开始,而u3p:ptg产生的grna没有第一个核苷酸的限制(实施例2,图8和9)。归纳来说,从ptg产生的grna是与sgrna相同的,但是却并不必须要以特定的核苷酸开始(图2g和2h)。通过检验插入/缺失(插入缺失)突变(通过在预测的cas9:grna切割位点进行修复的非同源末端连接(nhej)所引入)来确认了ptg1和ptg2的功能性。因为grna1和grna2靶分别含有kpni和saci限制性内切酶(re)位点(实施例2,图5a),由ptg1/cas9和ptg2/cas9所诱导的突变可以容易地通过对pcr产物(涵盖靶向的位点及相应的re)的消化来进行分析(pcr/re测定)。在用ptg1/cas9和ptg2/cas9转染的水稻原生质体中,发现分别有15%和9%的靶位点携带插入缺失(图2i),这比我们此前使用的sgrna:cas9构建体的突变率略高(24)。与我们的假设(trna可以作用为poliii的转录增强子)一致,用grna特异性引物进行的定量rt-pcr反映出,ptg1和ptg2的转录物水平分别比原生质体中的sgrna1和sgrna2高大约3和31倍(图2j)。总而言之,我们的结果证明了内源trna系统可以被用作精准且有力地工具,来从ptg产生grna以用于cas9-介导的基因组编辑。在水稻原生质体中经ptg/cas9的有效多元基因组编辑为了测试ptg系统的靶向能力和效率,将高达8个grna(grna1-grna8,实施例2,表2.3和图5)串联排列来构建ptg以用于靶向4个同源的水稻mapk(mpk1/2/5/6),所述基因可以冗余地在多样的细胞信号通路中发挥作用。将这些grna分为4对,并且每对靶向于基因座内的两个基因组位点(它们之间有350-750bp的距离)(实施例2,图5)。通过组合不同的grna对,我们设计了编码2个(ptg3/4/5/6)、4个(ptg7/8)、和8个(ptg9)grna的ptg基因,以相应地同时靶向于1个、2个、和4个mpk基因座(图3a和实施例2,表2.1)。我们预期此种设计可能会导致两个cas9切割位点之间短染色体片段的缺失,并使我们能够容易地检验ptg的效力。为了合成具有重复trna-grna架构的ptg,我们基于goldengate拼装策略的原则,设计了可扩展的且弹性的手段来从pcr成分拼装ptg(28)(细节参见实施例2,图10和11)。我们的基因拼装手段使得能够对具有来自共同寡核苷酸引物的不同grna组合的ptg进行快速合成。使用一部或两步拼装,我们合成了ptg3-ptg9基因并将他们克隆至crispr/cas9表达载体中(实施例2,图6和表2.1-2.3)。我们继而用含有u3p:ptg3-ptg9和ubip:cas9的质粒转染水稻原生质体。我们在以4%–45%的效率表达各ptg的原生质体中检测到于4个mapk基因座处的染色体片段缺失,其通过用靶特异性引物进行的截短的pcr产物的扩增而得到反映(图3b)。虽然从ptg9同时产生8个grna,但是它们依然引导cas9在所有4个靶向的基因座以4%–20%的频率有效地剪切染色体片段(图3b)。在mpk5基因座的片段缺失效率进一步通过使用涵盖grna2切割位点的引物的定量pcr而得到了确认(si附录,表s4)。对这些截短的pcr产物的测序确认了两个grna/cas9切割之间的片段是从靶向的基因座(有或无额外的插入/缺失)剪切的(图3c)。一般而言,片段缺失效率与两个配对位点之间的距离负相关(相关的效率r=-0.95),但是不同的grna可具有变化的效率。我们注意到一个ptg中grna的总数目在原生质体中不同的靶处以可变的程度影响缺失效率(图3b)。在3个靶向基因座(mpk2/5/6),含有2个grna的ptg(ptg4/5/6)展现出比具有4个(ptg7/8)和8个(ptg9)grna的tg稍高的效率。但是在mpk1基因座处,ptg3(2个grna)显示出了比ptg7(4个grna)或ptg9(8个grna)高~2倍的缺失频率。具有较高grna数目的ptg效率的此种降低可能是由于grna之间对cas9的竞争。尽管如此,具有串联排列的trna-grna架构的ptg能够以高效率同时产生许多grna并引导cas9至多个染色体靶。在具有ptg/cas9的稳定转基因植物中改善多元基因组编辑因为许多植物,包括重要的农作物如水稻,并不能容易地从原生质体再生,我们使用了常规的土壤杆菌-介导的转化来产生稳定的转基因株系,并评估了ptg/cas9系统在完整的水稻植物中用于多元基因组编辑的效力。在表达sgrna1:cas9、sgrna2:cas9、ptg6:cas9或ptg7:cas9的转基因植物中grna1和grna2靶处的诱变频率,在t0代进行了检验。在sgrna1:cas9(n=32)和sgrna2:cas9植物的t0代中(n=20),其中分别有44%和60%携带插入/缺失而分别有13%和20%具有双等位基因突变(表1和实施例2,图12)。相反,在包含35%(grna1)和76%(grna2)双等位基因突变的所有ptg6:cas9植物中(100%,n=17),检测了两个位点处的插入缺失(表1和实施例2,图13)。但是用pcr在ptg6:cas9植物中未检测到grna1和grna2靶位点之间的染色体片段缺失,其在再生的愈伤组织/植物中可以比在原生质体中更低的频率发生。尽管如此,结果显示出ptg6不仅同时表达两种grna,还在个体靶处比sgrna增强了诱变效率(studentt-检验p<0.01,表1和实施例2,图12和13)。当靶的总数在ptg7:cas9植物中增加至4个的时候,在grna1位点处观测到了与sgrna1:cas9植物相当的插入/缺失频率,但是在grna2位点处发现了比sgrna2:cas9显著更高的插入/缺失频率(表1和实施例2,图14)。有趣的是,我们获得了一个ptg7:cas9株系(6%),其携带有在mpk1中~350bp的双等位基因缺失和在mpk5中~750bp的单等位基因缺失(图4a和4b)。这促使我们进一步检验了ptg9:cas9株系中所有8个grna的效率。在其突变会破坏re位点的5个grna靶(grna1/2/3/5/7)处,50%(n=14)的ptg9:cas9t0株系在所有5个靶处携带有双等位基因突变(实施例2,图15)。有趣的是,pcr/re测定表明这5个grna展现出相当的效率,并且它们所有的都显示出了比我们在sgrna1/2:cas9株系中观察到的显著更高的诱变活性(表1)。对来自ptg9:cas9植物的4个mpk基因座的片段进行的sanger测序确认了突变被引入至所有8个位点(实施例2,图16)。然而,仅在两个ptg9:cas9株系中的mpk2和mpk5基因座处检测到片段缺失(实施例2,图15)。与原生质体相比,成对的grna/cas9切割位点之间靶向的染色体片段缺失的效率在转基因植物中较低,这可能是由于grna和cas9在水稻愈伤组织/再生的植物中相对较低的表达(在土壤杆菌介导的转化之后通常仅有单拷贝的转基因被整合至水稻基因组中)。我们的数据证明了ptg方法不仅增加了grna数目和靶向位点,还可能在个体位点增强诱变效率,尤其是当使用ptg表达多个grna的时候。为了进一步证实用ptg/cas9进行的诱变的高效率,我们合成了具有两个grna(grna9和grna10)的ptg10,以靶向水稻八氢番茄红素去饱和酶(pds)基因(实施例2,图13a)。pds经常被用作便捷的基因靶来检验敲除效率,因为具有功能性pds的植物会导致可见的光致褪色的表型。引人注目的是,从愈伤组织再生的所有ptg10:cas9转基因幼苗(t0代,n=15)都显示出光致褪色表型,并且其中的13株是完全白化的,表明这些植物没有携带功能性的pds(图4c)。虽然我们仅仅鉴定了在两个grna靶向的位点之间携带有染色体缺失的一个株系,对来自所述株系pds靶的测序确认了插入/缺失被引入至靶位点处(实施例2,图13)。通过将这些数据与此前报道的sgrna/cas9系统的效率(9,11,29-32)进行比较,就我们所知,ptg/cas9手段产生了在植物中靶向诱变的最高效率(高达100%,图4和表1)。我们的结果也证明了用ptg用两个grna靶向一个基因,将会大大提高完整基因敲除的效率。讨论我们开发了一般性的策略和平台,以通过操控内源trna加工系统而从单一的合成ptg基因产生多个grna(图1)。我们还提供了框架来设计、合成和利用ptg来用cas9进行多元基因组编辑。这些ptg用poliii启动子(例如u3p)以与sgrna基因相同的方式表达,但是却并不必需要以特定的核苷酸起始(图2)。结果,目前用于表达sgrna的crispr/cas9载体可以直接用于表达多元基因组编辑的ptg,如我们在此研究中证明的那样。通过从单一多顺反子基因产生多个grna,ptg技术可以用于改善多个基因组基因座的同时诱变或短染色体片段的缺失(图3和4)。此种基因组工程手段可以导致同时敲除多个蛋白编码基因、或非编码rna区和其它遗传元件的缺失。在靶向诱变/缺失之外,所述ptg手段可以促进其它基于cas9的应用(其中需要多个grna)。例如,ptg可以用于以cas9切口酶来改善靶向可靠性(13,33,34),或者以失活的cas9转录激活剂或抑制剂来操纵多个基因表达(35,36)。考虑到我们观测到的rnasep和rnasez的高加工准确性和能力(图2),trna加工系统也可以用作一般性的平台来从单一的合成基因产生其它调节性rna(例如短发夹rna或人工微rna)。这些不同类别的调节性rna,如grna和短发夹rna,也可以被压至单一的多顺反子基因中以开发更加精密的设备用于遗传工程。近来,融合了具有28ntrna的grna(称作grna-28nt)的多顺反子转录物被成功地用于在人了细胞中引导cas9靶向高达4个靶(12,13)。具有grna-28nt架构的合成基因产生了具有28nt附加3’序列的成熟grna,并且还需要共表达来自绿脓假单胞菌(pseudomonasaeruginosa)的内切核酸酶csy4以切割转录物。与grna-28nt策略相比,我们的手段利用有力的内源trna加工系统,其使得可以精准产生仅具有在grna3’末端1-4nt的附加序列的grna(图1和2),并且不会给受体带来内切核酸酶csy4毒性的额外风险。考虑到具有可变序列的trna基因的极大数目以及rnasep和rnasez精准识别具有类trna结构的rna底物这一情况(18,37),有许多trna序列的选择来嵌入ptg中。另外,trna加工系统在所有活生物体中是通用的,因而ptg技术可以直接调适用于其它生物体进行cas9-介导的基因组工程。当通过ptg/cas9在水稻植物中产生多个dsb时,易错nhej修复所导致的插入缺失比直接连接两个dsb所产生的片段缺失更加频繁地发生(实施例2,图14和15)。目前,两个dsb直接连接在一起在体内产生染色体易位或片段缺失的分子机制大多都还不清楚。我们推测导致此种染色体异常的过程可能以同样的时间间隔来需要两个dsb,并且可能通过grna/cas9切割和内源dna修复之间的高度动态相互作用、以及还通过dsb之间的距离来确定。由于grna和cas9的递送、表达和活性的差异,因而在原生质体(图3b)和稳定的转基因植物之间以及在不同的ptg转基因株系中发现片段缺失频率的一些出入并不是出乎意料的(图4a和实施例2,图13-15)。因为ptg技术使得能够在基因组dna中产生许多dsb,其可以提供有效的工具来辅助剖析染色体缺失的分子过程。更重要的是,所述ptg技术显著改善多元编辑能力和效率,并且预期会有助于更加复杂的cas9应用,如冗余基因或基因元件的靶向诱变和缺失、多个基因和通路的转录调节、许多基因组位点的修饰和标记、位点特异性整合和基因置换。材料和方法植物材料水稻(oryzasatival.ssp)kitaake和nipponbare栽培种用于此研究。水稻植物在温室或生长箱中以28℃白天/23℃夜晚(且12h的光照)进行种植。质粒载体构建质粒载体prge32用于在水稻原生质体中瞬时表达u3p:sgrna或u3p:ptg(与ubip:cas9一起),而prgeb32用于土壤杆菌-介导的水稻转化(实施例2,图6)。对于质粒载体构建的细节,参见实施例2,si方法。sgrna:cas9和ptg:cas9表达构建体u3p:sgrna1和u3p:sgrna2构建体如此前所述进行制备(24)。用于grna3-grna8的具体间隔区序列(实施例2,表2.3),是使用万维网genome.arizona.edu\crispr\的crispr-plant数据库进行选择的(38)。ptg基因和u3p:ptg构建体如实施例2,si方法中所述产生,图10-11和表2.3。所合成的ptg被插入至bsai消化的prge32或prgeb32中,以分别用于瞬时原生质体表达或稳定的水稻转化。此研究中使用的sgrna1、sgrna2和ptg基因的序列在实施例2,表2.1中列出。水稻原生质体转染水稻原生质体的制备和转染如此前所述那样进行(24)。简言之,20μg的质粒dna被用于以~40%-50%的转染效率转染2×105原生质体。在转染后36h从原生质体样品提取总水稻基因组dna,并继而用于pcr和序列分析。土壤杆菌介导的水稻转化根据常规方案,通过根瘤土壤杆菌-介导的转化使用水稻成熟种子衍生的愈伤组织来产生转基因水稻植物(39)。基因组dna提取和pcr/re测定如此前所述用ctab方法提取水稻基因组dna(24)。为了在期望的位点检测诱变,以特定的引物使用gotaqdna聚合酶(promega)扩增靶向区(对于引物序列参见实施例2,表2.2)。pcr产物在1%的琼脂糖凝胶中分离并用溴化乙锭染色以检测染色体片段缺失。为了用pcr/re在特定的位点检测插入/缺失,将涵盖靶位点的pcr产物用适宜的限制性酶(re)消化5小时,并继而用1%琼脂糖凝胶电泳和溴化乙锭染色进行分析。经染色的凝胶使用geldocxrs系统(bio-rad)成像,并用quantityone4.6程序(bio-rad)来进行定量。将经过选择的pcr产物克隆至pgemt-easy载体(promega)用于dna测序。rna提取,crt-pcr和定量pcr细节参见实施例2,si方法。genebank中的基因登录号基因以及它们的genebankrefseq登录号如下:mpk1,os06g0154500;mpk2,os08g0157000;mpk5,os03g0285800;mpk6,os10g0533600;ubi,os02g0161900;和pds,os03g0184000。文献1.jinekm,etal.(2012)aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337(6096):816-821.2.congl,etal.(2013)multiplexgenomeengineeringusingcrispr/cassystems.science339(6121):819-823.3.malip,etal.(2013)rna-guidedhumangenomeengineeringviacas9.science339(6121):823-826.4.malip,esveltkm,churchgm(2013)cas9asaversatiletoolforengineeringbiology.natmethods10(10):957-963.5.sanderjd,joungjk(2014)crispr-cassystemsforediting,regulatingandtargetinggenomes.natbiotechnol32(4):347-355.6.hsupd,landeres,zhangf(2014)developmentandapplicationsofcrispr-cas9forgenomeengineering.cell157(6):1262-1278.7.wangh,etal.(2013)one-stepgenerationofmicecarryingmutationsinmultiplegenesbycrispr/cas-mediatedgenomeengineering.cell153(4):910-918.8.jinekm,etal.(2013)rna-programmedgenomeeditinginhumancells.elife2:e00471.9.lijf,etal.(2013)multiplexandhomologousrecombination-mediatedgenomeeditinginarabidopsisandnicotianabenthamianausingguidernaandcas9.natbiotechnol31(8):688-691.10.zhouh,liub,weeksdp,spaldingmh,yangb(2014)largechromosomaldeletionsandheritablesmallgeneticchangesinducedbycrispr/cas9inrice.nucleicacidsresearch42(17):10903-10914.11.shanq,etal.(2013)targetedgenomemodificationofcropplantsusingacrispr-cassystem.natbiotechnol31(8):686-688.12.nissiml,perlisd,fridkina,perez-pinerap,lutk(2014)multiplexedandprogrammableregulationofgenenetworkswithanintegratedrnaandcrispr/castoolkitinhumancells.molcell54(4):698-710.13.tsaisq,etal.(2014)dimericcrisprrna-guidedfokinucleasesforhighlyspecificgenomeediting.natbiotechnol32(6):569-576.14.phizickyem,hopperak(2010)trnabiologychargestothefront.genesdev24(17):1832-1860.15.schiffers,roschs,marchfeldera(2002)assigningafunctiontoaconservedgroupofproteins:thetrna3'-processingenzymes.emboj21(11):2769-2777.16.gutmannb,goberta,giegep(2012)prorpproteinssupportrnasepactivityinbothorganellesandthenucleusinarabidopsis.genesdev26(10):1022-1027.17.barbeziern,etal.(2009)processingofadicistronictrna-snornaprecursor:combinedanalysisinvitroandinvivorevealsalternatepathwaysandcouplingtoassemblyofsnornp.plantphysiol150(3):1598-1610.18.caninog,etal.(2009)arabidopsisencodesfourtrnasezenzymes.plantphysiol150(3):1494-1502.19.kruszkak,etal.(2003)plantdicistronictrna-snornagenes:anewmodeofexpressionofthesmallnucleolarrnasprocessedbyrnasez.emboj22(3):621-632.20.nakajiman,ozekih,shimuray(1981)organizationandstructureofane.colitrnaoperoncontainingseventrnagenes.cell23(1):239-249.21.nakaarv,dareao,hongd,ullue,tschudic(1994)upstreamtrnagenesareessentialforexpressionofsmallnuclearandcytoplasmicrnagenesintrypanosomes.molcellbiol14(10):6736-6742.22.whiterj(2011)transcriptionbyrnapolymeraseiii:morecomplexthanwethought.natrevgenet12(7):459-463.23.diecig,fiorinog,castelnuovom,teichmannm,paganoa(2007)theexpandingrnapolymeraseiiitranscriptome.trendsgenet23(12):614-622.24.xiek,yangy(2013)rna-guidedgenomeeditinginplantsusingacrispr-cassystem.molplant6(6):1975-1983.25.chanpp,lowetm(2009)gtrnadb:adatabaseoftransferrnagenesdetectedingenomicsequence.nucleicacidsres37(databaseissue):d93-97.26.kuhnj,binders(2002)rt-pcranalysisof5'to3'-end-ligatedmrnasidentifiestheextremitiesofcox2transcriptsinpeamitochondria.nucleicacidsres30(2):439-446.27.yokoboris,paabos(1995)transferrnaeditinginlandsnailmitochondria.procnatlacadsciusa92(22):10432-10435.28.englerc,kandziar,marillonnets(2008)aonepot,onestep,precisioncloningmethodwithhighthroughputcapability.plosone3(11):e3647.29.nekrasovv,staskawiczb,weigeld,jonesjd,kamouns(2013)targetedmutagenesisinthemodelplantnicotianabenthamianausingcas9rna-guidedendonuclease.natbiotechnol31(8):691-693.30.fengz,etal.(2014)multigenerationanalysisrevealstheinheritance,specificity,andpatternsofcrispr/cas-inducedgenemodificationsinarabidopsis.procnatlacadsciusa111(12):4632-4637.31.wangy,etal.(2014)simultaneouseditingofthreehomoeoallelesinhexaploidbreadwheatconfersheritableresistancetopowderymildew.natbiotechnol32(9):947-951.32.zhangh,etal.(2014)thecrispr/cas9systemproducesspecificandhomozygoustargetedgeneeditinginriceinonegeneration.plantbiotechnolj12(6):797-807.33.ranfa,etal.(2013)doublenickingbyrna-guidedcrisprcas9forenhancedgenomeeditingspecificity.cell154(6):1380-1389.34.guilingerjp,thompsondb,liudr(2014)fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.natbiotechnol32(6):577-582.35.gilbertla,etal.(2013)crispr-mediatedmodularrna-guidedregulationoftranscriptionineukaryotes.cell154(2):442-451.36.malip,etal.(2013)cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.natbiotechnol31(9):833-838.37.forsterac,altmans(1990)externalguidesequencesforanrnaenzyme.science249(4970):783-786.38.xiek,zhangj,yangy(2014)genome-widepredictionofhighlyspecificguidernaspacersforcrispr-cas9-mediatedgenomeeditinginmodelplantsandmajorcrops.molplant7(5):923-926.39.hieiy,komarit(2008)agrobacterium-mediatedtransformationofriceusingimmatureembryosorcalliinducedfrommatureseed.natprotoc3(5):824-834.表1.ptg:cas9对比sgrna:cas9植物中的定向突变效率对于在转基因株系中靶向位点处的突变(mut.)和双等位基因突变(bi-mut.)的频率进行了检验,并基于pcr/re测定进行了计算(实施例2,图s8-s11)。在sgrna和ptg植物之间比较了grna1和grna2靶处的编辑频率。**,studentt-检验p<0.01;*,studentt-检验p<0.05;n.a.,不适用。实施例2支持信息质粒载体的构建为了构建prge32,用特定的引物对(ubi-f和ubi-r,引物序列参见表s2),从nipponbare栽培变种的基因组dna扩增水稻ubip片段。在用引物ugw-u3-f和ugw-grna-r从prge31(addgene质粒50929)扩增u3p-grna片段之后,用引物ugw-u3-f和ubi-r通过重叠延伸pcr将u3p-grna和ubip片段连接在一起。继而通过gibsoncloning(newenglandbiolabs)构建了prge32,以用u3p-grna-ubip取代prge31中的u3p-grna-35s片段。用于土壤杆菌介导的水稻转化的prgeb32双元载体(载体图谱参见图6),是通过用gibsoncloning(newenglandbiolabs)将来自prge32的u3p-grna-ubip-cas9片段插入至pcambia1301-bsai来创建的。所述pcambia1300-bsai是通过定点诱变去除所有的bsai位点之后而衍生自pcambia1300的。质粒构建中使用的引物在表2.2中列出。此研究中,使用含有grna-trna融合片段的pgtr质粒,作为模板来合成ptg。为了构建pgtr,通过pcr使用特定的引物对(bsa-grna-f和grna-r)来扩增grna支架片段,而trnagly片段被扩增为g-trna-f和trna-r的引物二聚体。继而使用引物bsa-grna-f和trna-r通过重叠延伸pcr,将这两个片段融合为grna-trna。重叠pcr产物从琼脂糖凝胶中分离并纯化,并继而被插入至pgem-teasy(promega)来产生pgtr质粒。pgtr中grna-trna融合的序列在表s1中示出。质粒构建中使用的引物在表2.2中列出。rna提取、crt-pcr和定量pcr使用trizolreagent(lifetechnologies)根据厂商指引从原生质体提取总rna。crt-pcr在图7中有示意性的图示,并如下进行。为了将rna环化,将1μg的总rna在20μl的反应中进行温育,所述反应含有1×t4rna连接酶缓冲剂(newenglandbiolabs)、50μmofatp、10%peg8000、20u的rnase抑制剂(newenglandbiolabs)和10u的t4rna连接酶(newenglandbiolabs)。连接在25℃进行4h。继而将10u的dnasei(newenglandbiolabs)添加至连接反应,以在25℃去除基因组dna污染物20min。继而用trizolreagent(lifetechnologies)将环化的rna纯化,并溶解于无核酸酶得水中。将总共200ng环化的rna与0.5mm的dntp和1μm的特异于grna间隔区的寡核苷酸(grna1-r和grna2-r,参见表s2)混合,并在70℃变性5min。在冰上冷却后,添加1×mumlv逆转录酶缓冲液、20u的rnase抑制剂(newenglandbiolabs)、和10u的mumlv逆转录酶(newenglandbiolabs),以在42℃合成1stcdna达1小时。也对所有样品进行了没有添加mumlv逆转录酶的阴性对照(-rt)。在逆转录之后,将mumlv在70℃失活10min。继而用以下的50μl反应进行pcr:二十分之一的1stcdna、1×phusionhf缓冲液、0.2mmdntp、0.5μm的正向引物、0.5μm的反向引物、和1u的phusiondna聚合酶(thermoscientific)。所得的pcr产物用2%的琼脂糖凝胶电泳进行分析。继而在克隆至pgem-teasy载体(promega)中之后,将crt-pcr产物测序。用于crt-pcr的引物序列参见表2.2。对于定量rt-pcr,使用特定的引物grna-r与mumlv(newenglandbiolabs)一起,依照厂商指引,将经过dnasei处理的总rna逆转录,以产生cdna。使用gotaqqpcrmastermix(promega)在steponeplusrealtimepcr系统(lifetechnologies)中,进行了实时pcr。grna1-f和grna-r引物用于sgrna1和ptg1,而grna2-f和grna-r引物用于sgrna2和ptg2。水稻ubi基因用作内部参考以用于相对定量。引物序列参见表s2。为了对缺失效率进行定量,使用10ng的基因组dna作为模板来进行定量pcr,以在mpk5或ubi基因座内扩增片段。涵盖grna2切割位点的特定的引物对(mpk5-qf和mpk5-r611,表s2)用于扩增mpk5不含有片段缺失的拷贝(图s1a)。使用ubi作为参考基因,对不具有缺失的mpk5片段的相对量(rq)进行了计算。因为只有不具有缺失的mpk5片段被扩增,片段缺失的效率可以估算为100%-rq(表2.4)。通过goldengate拼装来合成多顺反子trna-grna(ptg)基因基于goldengate(gg)拼装原理合成了ptg基因,所述goldengate(gg)拼装原理广泛用于拼装dna的部分,如定制化的转录激活子样效应因子(tale)。我们的拼装手段使得可以使用相同的成分以grna的不同组合来合成ptg。例如,我们用相同组的寡聚物引物(表s3)制备了ptg3-ptg9。通过分等级的gg拼装反应,可以将ptg拼装在一起,以创建较长的ptg(如ptg9)。具有不超过6个grna的ptg(例如ptg1-ptg8)可以通过一步gg拼装(1级,图10)来合成,而具有超过6个grna的ptg(例如,ptg9)则需要两个或更多个gg拼装步骤(2级,图11)。ptg合成手段的示意图在图10和11中示出,而引物设计、gg拼装和质粒构建的细节在下文中描述。步骤1.设计引物来扩增grna-trna部分为了将多个dna部分以期望的顺序连接起来,gg拼装需要独特的4-bp悬突以在用bsai(或其它的ii型内切核酸酶如aari、bbsi、bsmai、bsmbi)消化之后连接两个dna部分。grna间隔区是ptg中仅有的独特序列(图1c),因而ptg应当分为grna间隔区内的dna部分。如图10a和10b中所示,将grna间隔区分为具有4bp重叠两部分,并且间隔区的每一半在具有bsai位点的寡聚物引物内合成。设计grna特异性引物的细节如下所述:1.1.在gg拼装中,每个grna间隔区内选择4-bp长的序列作为bsai悬突。所述悬突可以是grna间隔区的任何4个连续的核苷酸。值得注意的是,在相同的gg反应中拼装的dna部分应当具有独特的4-bp悬突,并且不可以是5’-ggca-3’或5’-aaac-3’,其在末端衔接子中用于克隆至prge32和prgeb32(图6)。1.2.如下设计引物序列(也参见图6):在此实例中,选择grna[x]的20nt长的间隔区中第9至第12个核苷酸作为bsai悬突用于gg克隆:5’-n1-n2-n3-n4-n5-n6-n7-n8--n13-n14-n15-n16-n17-n18-n19-n20-3’所述引物应为:grna[x]-f(正向引物,退火至grna支架的5’-末端):5’-ta-ggtctc-n-n13n14n15n16n17n18n19n20-gttttagagctagaa-3’grna[x]-r(反向引物,退火至trna前体的3’-末端):5’-cg-ggtctc-n-n8n7n6n5n4n3n2n1-tgcaccagccggg-3’注意:间隔区中任何4个连续的核苷酸都可以被选择作为用于gg拼装的悬突。这是的可以对gg拼装中每个dna部分选择特定的悬突。两个5’-端碱基(显示为小写)是随机添加的核苷酸,以增强pcr产物的bsai消化。红色表示间隔区的反向互补序列。在3’-末端的小写字母表示退火至grna(正向引物)或trna(反向引物)的碱基。步骤2.1级gg拼装(ptg1-ptg8基因的构建)对于ptg的1级gg拼装的整体策略参见参见图s6c。2.1.设定50μl的pcr反应来扩增用于ptg构建的dna部分。pgtr质粒0.1ng5xphusionhf缓冲液10μldntps(10mm)1μl正向引物(10μm)2.5μl反向引物(10μm)2.5μlphusion(2u/μl,neb)0.5μlh2oxμltotal50μl为了构建用于此研究的ptg,扩增1级部分的正向和反向引物如下进行添加:pcr以如下程序运行:2.2.用spincolumnpcr产物purification试剂盒(biobasic)来纯化pcr产物。2.3.通过gg拼装用以下反应将个体部分连接在一起:对于构建ptg1-ptg8的gg拼装反应,1级部分如下进行添加:2.4.gg反应如下进行,在循环变温加热器(bio-rad)中温育30-50循环的:37℃,5min和20℃,10min;并继而保持在20℃1小时。2.5.将gg反应产物用180μl的h2o稀释。2.6.在50μlpcr反应中扩增1级gg拼装产物:pcr在循环变温加热器(bio-rad)中以如下程序运行:2.7.用spincolumnpcrproductpurification试剂盒(biobasic)来纯化pcr产物。2.8.用foki(neb)消化纯化的pcr产物。2.9.在1%琼脂糖凝胶中分离foki消化的产物;从凝胶剪切具有期望大小的dna条带,并继而用spincolumndnagelextraction试剂盒(biobasic)来对其进行纯化。2.10.用t4dna连接酶将foki消化的gg片段连接至bsai消化的prge32或prgeb32载体。2.11.将连接产物转化至大肠杆菌dh5α,纯化重组的质粒并通过sanger测序对构建体进行确认。步骤3.2级gg拼装(通过两步gg拼装构建ptg9)2级gg拼装的示意图在图11中示出。2级gg拼装用于合成具有超过6个grna的ptg。此种大ptg是通过将两个较小的ptg(2级parts)连接在一起而构建的。这两个小ptg是通过1级gg拼装合成的并且含有一个重叠的grna作为桥接(桥接grna,图11),以在下一个gg拼装反应中连接2级部分。为了从1级拼装的ptg扩增2级部分,需要仅退火至桥接grna间隔区的特定引物对用于终端衔接子引物的pcr(s5ad5-f和s3ad5-r)。在此研究中,以此手段合成ptg9并且使用grna7作为桥接grna。3.1.设计桥接grna间隔区-特异性引物来扩增2级部分。桥接grna间隔区:5’-n1-n2-n3-n4-n5-n6-n7-n8-n13-n14-n15-n16-n17-n18-n19-n20-3’任何连续的4-bp可以选择作为用于gg拼装的悬突。在此实例中,选择n9-n10-n11-n12作为悬突。ln-gr[x]-f(正向引物,仅退火至桥接grna间隔区):5’-ta-ggtctc-nn13n14n15n16n17n18n19n20-3’ln-gr[x]-r(反向引物,仅退火至桥接grna间隔区):5’-cg-ggtctc-n-n8n7n6n5n4n3n2n1-3’注意:两个5’-端碱基(显示为小写)是随机添加的核苷酸,以增强pcr产物的bsai消化。红色表示间隔区的反向互补序列。3.2.用从2.1-2.2产生的以下1级部分设定gg反应:以与步骤2.4-2.5相同的方式进行1级拼装。3.3.用以下引物和模板扩增2级dna部分:pct条件与步骤2.6相同3.4.在1%琼脂糖凝胶中分离pcr产物;从凝胶剪切具有期望大小的dna条带,并继而用spincolumndnagelextraction试剂盒(biobasic)来对其进行纯化。3.5.设定gg拼装反应将两个dna部分(l2-p1和l2-p2)连接在一起。3.6.在循环变温加热器(bio-rad)中使用以下程序来进行pcr:25个循环的:37℃,5min;20℃,10min;和20℃进行1小时。3.7.扩增用s5ad5-f和s3ad5-r拼装的2级gg,继而使用与步骤2.6-2.11相同的程序将扩增的产物插入至prge32或prgeb32中。实施例2表格表2.1此研究中所使用的合成基因的序列所述序列经如下标注:u3p(seqidno:14的最后10bp:加下划线grna支架:粗体trna前体(seqidno:13):经框出,粗斜体grna间隔区:斜体poliii终止子(tttt..t):灰色背景表2.2用于质粒构建、crt-pcr、和基因分型的引物表2.3用于合成ptg基因的寡核苷酸a经框出的字母表示goldengate拼装中的悬突序列。b前两个字母是随机添加的核苷酸。斜粗体序列表示bsai位点(5’-ggtctcn-3’,n表示任何核苷酸),加下划线的序列是grna间隔区的部分,而粗体加下划线的序列是bsai消化之后的悬突。关于引物设计和ptg拼装的细节参见si方法。小写字母的序列是特异于grna支架(5’-gttttagagctagaa-3’,正向引物中)或trna(5’-tgcaccagccggg-3’,反向引物中)。表2.4.通过qpcr对水稻原生质体中mpk5基因座处染色体片段缺失频率进行确定使用基因组dna作为模板以及涵盖mpk5内grna2切割位点的特定引物对,以qpcr来评估在mpk5基因座处的片段缺失效率(图s1a)。因为具有片段缺失的mpk5基因座将会被扩增,缺失(del.)效率可以估算为100%-rq。使用图3b中的基因组dna,并且ubi基因作为参考用于相对定量。ct,阈值循环;sd,标准偏差;rq,相对定量;rq-min和rq-max表示rq的95%的置信区间。实施例3多顺反子的trna和crispr引导rna使得能够在人类细胞中进行高效率的多元化基因组工程在过去的三年期间,规律成簇的间隔短回文重复序列(crispr)和crispr-相关的蛋白核酸酶已经成为在许多生物体中进行基因组编辑的最有力工具(1-4)。用于基因组编辑的最常用的cas内切核酸酶是酿脓链球菌cas9(下文称为cas9)。该cas9蛋白由人工短引导rna(grna)引导以切割dna,所述dna其序列与grna的5’-末端互补并且其之前为前间区序列邻近基序(pam,5’-ngg-3’)(5-7)。此种简单的由rna引导的dna靶向系统从根本上增强了我们对用于遗传操纵的特定基因组位点进行评估的能力。所述crispr-cas9系统已经过改造以用于靶向诱变、dna片段的位点特异性整合、以及染色体的精准操纵如大区段的缺失和易位等。核酸酶缺陷型cas9(dcas9)和grna也经过改造,以在体内控制所靶向的基因的表达(8-11)以及对染色体具体基因座的标记(12)。这些基于cas9的工具在各种医疗和农业领域大大地促进了基础研究以及生物技术的实施。有力地且有效的cas9-介导的基因组工程需要在体内对cas9和grna的表达进行控制。cas9的表达可以容易地且精准地用dna聚合酶ii启动子来进行控制,而作为小的非编码rna的grna的有效表达,依然是瓶颈。特别是,许多基于cas9的应用需要多个grna的同时表达。例如,需要一对grna来编辑cas9切口酶中的一个位点(13,14),并且dcas9-foki(15,16)介导的基因组编辑有助于降低与原本的crispr-cas9系统相关联的脱靶风险。在dcas9介导的转录调节中,需要多个grna以用于有力的基因激活或抑制,或者产生精密的转录线路装备(10,17,18)。一般而言,grna表达受聚合酶iii启动子驱动,如广泛使用的snornau3和u6基因启动子。然而,这些poliii启动子从特定核苷酸开始转录grna酸。例如,u3启动子从“a”转录而u6启动子以“g”起始转录物。这限制了cas9-grna的靶向间隔区。因此,需要更有力的grna表达策略来加强crispr-cas9工具的能力。近来,我们证明了内源转运rna(trna)加工系统可以经过改造,以加强cas9多元靶向能力(19)。多个grna从人工多顺反子的-trna-grna(ptg)基因串联表达。内源rnasep和z识别trna并精准切割ptg以释放trna和grna。此系统不仅使得能够同时表达许多grna,还增强了poliii转录,因为trna也作用为内部增强子或启动子。ptg系统在植物中实施,但是我们推测其会在所有生物体中发挥功能,因为trna加工系统在所有生物体中是高度保守的。在此研究中,我们将cas9-ptg技术针对人类基因组编辑进行了调适。使ptg基因同时表达2至6个grna以用于对1至4个组蛋白去乙酰化酶(hdac)基因进行精准的基因组编辑。我们的研究证明trna系统可以被改造为通用的工具以用于在人类和动物系统中进行有效的和多元的基因组编辑。材料和方法质粒载体构建为了构建psicor-sgrna-mcherry-cas9载体,将psico-ef1-mch-puro(addgene质粒31845)(20)中的嘌呤霉素片段于来自px260(addgene质粒42229)的nls-cas9-nls片段融合。继而将具有克隆位点(含由两个bbsi位点)的grna支架插入至u6启动子的下游。psico-sgrna-mcherry-cas9载体的示意图在图18中显示。ptg基因的拼装为了在人类细胞中编辑hdac基因(hdac1/2/3/4/6),基于pam的存在和前间区序列特异性,对每个基因选择了由250-500bp分开的一对靶位点(表3.1)。使用合成的寡核苷酸(表3.3)在体外拼装了总共7个ptg基因(hptg1至hptg7,表3.2)。hptg基因的体外合成如此前所述那样进行(19)。细胞培养物和转染将人胚胎肾293(hek293)细胞在具有10%胎牛血清(atlantabiologicals)、10单位/ml青霉素和10μg/ml链霉素(gibco)的dmem(sigma)中进行培养。每2天更换培养基,并在细胞达到80%至90%铺满时进行亚培养。为进行转染,在6孔平板中以每孔3x105细胞来培养hek293细胞。在达到70%铺满之后,用质粒和聚乙烯亚胺(pei)来转染细胞。简言之,在转染前一小时用新鲜培养基培养细胞。接着,将3μg的质粒dna和12μg的pei添加至每孔。将经转染的细胞在co2温育箱内温育5小时,并用新鲜培养基再培养48小时。crt-pcr和定量rt-pcr用trizolreagent(lifetechnologies)从hek293细胞提取总rna并用dnasei(newenglandlabs)进行处理。为了扩增grna,如此前所述进行了crt-pcr。简言之,总rna用t4rna连接酶(newenglandlabs)进行了自身连接,并继而用trizolreagent进行了纯化。使用grna特异性的引物和mmlv逆转录酶(newenglandlabs)来将连接的总rna逆转录。使用特异性引物(序列参见表3.3)扩增cdna并将其克隆至pgem-teasy(promega)中用于进行sanger测序。dna提取和pcr用磷酸缓冲盐水洗涤经转染的细胞,并在溶解缓冲液(10mmtrisph8.0,100mmnacl和10mmedta)中进行了溶解,继而用异丙醇将基因组dna沉淀。为了检测每个基因内两个靶位点之间的片段缺失,对每个hdac基因设计了涵盖靶位点的pcr引物(表s2)。在含有800ng基因组dna、0.2mmdntp、0.4um引物、1xpcr缓冲剂和1单位dreamtaqdna聚合酶(thermofisherscientific)的反应中,进行了pcr扩增。pcr产物在含有溴化乙锭的1.5%琼脂糖凝胶中进行分离,以检测染色体片段缺失。用imagej(http://rsb.info.nih.gov/ij/)评估片段缺失效率。另外,将pcr片段克隆至pgem-teasy(promega)中用于进行sanger测序。结果和讨论ptg使得能够在人类细胞中有效产生多个grna我们此前证明了具有串联排列trna-grna的ptg不仅使得能够对多个grna进行精准加工和高效制备,还使得cas9能够在植物中同时靶向多个基因组位点。我们推测ptg基因应当也加强crispr/cas9在动物中的靶向效率,因为trna和其加工系统在所有生物体中是高度保守的。为了证明在动物系统中ptg用于基因组编辑的用途,我们首先检验了在人类细胞中grna从hptg1和hptg2转基因的剪切准确性。每个人工ptg基因编码两个grna。hptg1表达hdac1-sg1和hdac2-sg2,而hptg2表达hdac2-sg1和hdac2-sg2(表3.2)。在hptg1和hptg2构建体转染至hek293细胞内之后,进行了crt-pcr以对成熟grna的5’和3’末端作图。在crt-pcr中检测到单一grna具有预期大小的预测cdna产物(~96nt),尽管有一些非特异性扩增的产物存在。(图19a)。如图19a和19c中所示,对这些cdna产物进行的dna测序表明,从hptg基因精准地加工了具有期望的5’-末端(含有靶向引导序列)的成熟grna。如我们此前在植物中观测的那样,衍生自ptg的grna,如果其在trna之前的话则在3’-末端具有两个额外的核苷酸(5’-aa-3’),或如果其在poliii终止子之前的话则具有两个额外的t。我们还在成熟hdac2-sg2的3’-末端检测到了推定的多腺苷酸。这些结果表明ptg基因可以由人类trna加工系统进行加工,以产生多个grna。cas9-ptg使得在人类细胞中能够进行多元基因组编辑为了检验用于多元基因组编辑的ptg方法的效率,我们用7个表达不同hptg基因和cas9的质粒构建体来转染人类细胞。这些hptg基因编码多个grna,所述grna靶向位于不同染色体中的5个hdac基因。hptg1至hptg5用于对hdac1、2、3、4、和6内的每个基因靶向两个基因组位点;而hptg6和hptg7设计为分别同时靶向hdac3和2(表3.2)。因为我们使用了两个grna来编辑一个基因,可以通过测量每个靶向基因内染色体片段缺失的频率来确定cas9-ptg的效率。如所预测的那样,在所有样品中检测到截短的pcr扩增子(图20)。dna序列分析进一步确认了这些染色体缺失是通过cas9-ptg引入至经转染细胞中的(图21)。基于dna条带强度的计算,两个grna靶向位点之间的缺失频率为40-50%。有趣的是,具有变化数目靶的不同hptg基因的效率是相当的。例如,hptg2(2个grna)和hptg6(6个grna)以~40%的频率从hdac2基因座导致片段缺失,虽然他们在grna数目上有差异。我们的结果证明了ptg方法可以用于不仅在植物中、还在人类细胞中有效地表达多个grna以及同时编辑多个位点。因为ptg策略并不使用多个启动子和终止子,因而起大大降低了grna构建体的大小。结果,其对于各种基因编辑目的(如病毒介导的用于人类基因疗法的多个grna的递送)而言更加适宜和有效。参考文献1.doudna,j.a.andcharpentier,e.(2014)genomeediting.thenewfrontierofgenomeengineeringwithcrispr-cas9.science,346,1258096.2.hsu,p.d.,lander,e.s.andzhang,f.(2014)developmentandapplicationsofcrispr-cas9forgenomeengineering.cell,157,1262-1278.3.sander,j.d.andjoung,j.k.(2014)crispr-cassystemsforediting,regulatingandtargetinggenomes.nat.biotechnol.,32,347-355.4.mali,p.,esvelt,k.m.andchurch,g.m.(2013)cas9asaversatiletoolforengineeringbiology.nat.methods,10,957-963.5.jinek,m.,chylinski,k.,fonfara,i.,hauer,m.,doudna,j.a.andcharpentier,e.(2012)aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science,337,816-821.6.mali,p.,yang,l.,esvelt,k.m.,aach,j.,guell,m.,dicarlo,j.e.,norville,j.e.andchurch,g.m.(2013)rna-guidedhumangenomeengineeringviacas9.science,339,823-826.7.cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.etal.(2013)multiplexgenomeengineeringusingcrispr/cassystems.science,339,819-823.8.gilbert,l.a.,larson,m.h.,morsut,l.,liu,z.,brar,g.a.,torres,s.e.,stern-ginossar,n.,brandman,o.,whitehead,e.h.,doudna,j.a.etal.(2013)crispr-mediatedmodularrna-guidedregulationoftranscriptionineukaryotes.cell,154,442-451.9.qi,l.s.,larson,m.h.,gilbert,l.a.,doudna,j.a.,weissman,j.s.,arkin,a.p.andlim,w.a.(2013)repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression.cell,152,1173-1183.10.cheng,a.w.,wang,h.,yang,h.,shi,l.,katz,y.,theunissen,t.w.,rangarajan,s.,shivalila,c.s.,dadon,d.b.andjaenisch,r.(2013)multiplexedactivationofendogenousgenesbycrispr-on,anrna-guidedtranscriptionalactivatorsystem.cellres.,23,1163-1171.11.mali,p.,aach,j.,stranges,p.b.,esvelt,k.m.,moosburner,m.,kosuri,s.,yang,l.andchurch,g.m.(2013)cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.nat.biotechnol.,31,833-838.12.chen,b.,gilbert,l.a.,cimini,b.a.,schnitzbauer,j.,zhang,w.,li,g.w.,park,j.,blackburn,e.h.,weissman,j.s.,qi,l.s.etal.(2013)dynamicimagingofgenomiclociinlivinghumancellsbyanoptimizedcrispr/cassystem.cell,155,1479-1491.13.ran,f.a.,hsu,p.d.,lin,c.y.,gootenberg,j.s.,konermann,s.,trevino,a.e.,scott,d.a.,inoue,a.,matoba,s.,zhang,y.etal.(2013)doublenickingbyrna-guidedcrisprcas9forenhancedgenomeeditingspecificity.cell,154,1380-1389.14.shen,b.,zhang,w.,zhang,j.,zhou,j.,wang,j.,chen,l.,wang,l.,hodgkins,a.,iyer,v.,huang,x.etal.(2014)efficientgenomemodificationbycrispr-cas9nickasewithminimaloff-targeteffects.nat.methods,11,399-402.15.tsai,s.q.,wyvekens,n.,khayter,c.,foden,j.a.,thapar,v.,reyon,d.,goodwin,m.j.,aryee,m.j.andjoung,j.k.(2014)dimericcrisprrna-guidedfokinucleasesforhighlyspecificgenomeediting.nat.biotechnol.,32,569-576.16.guilinger,j.p.,thompson,d.b.andliu,d.r.(2014)fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.,32,577-582.17.maeder,m.l.,linder,s.j.,cascio,v.m.,fu,y.,ho,q.h.andjoung,j.k.(2013)crisprrna-guidedactivationofendogenoushumangenes.nat.methods,10,977-979.18.perez-pinera,p.,kocak,d.d.,vockley,c.m.,adler,a.f.,kabadi,a.m.,polstein,l.r.,thakore,p.i.,glass,k.a.,ousterout,d.g.,leong,k.w.etal.(2013)rna-guidedgeneactivationbycrispr-cas9-basedtranscriptionfactors.nat.methods,10,973-976.19.xie,k.,minkenberg,b.andyang,y.(2015)boostingcrispr/cas9multiplexeditingcapabilitywiththeendogenoustrna-processingsystem.pnas,112,3570-3575.20.salomonis,n.,schlieve,c.r.,pereira,l.,wahlquist,c.,colas,a.,zambon,a.c.,vranizan,k.,spindler,m.j.,pico,a.r.,cline,m.s.etal.(2010)alternativesplicingregulatesmouseembryonicstemcellpluripotencyanddifferentiation.pnas,107,10514-10519.表格和图注表3.1用于基因组编辑的靶序列表3.2hptg基因的结构表3.3a用于hptg合成的引物表3.3b用于基因分型的引物序列实施例4多个紧密相关水稻基因上通过ptg/cas9介导的基因组编辑所创建的可遗传突变的表征在此研究中,通过在四个水稻丝裂原相关蛋白激酶(mpk)基因的不同组合创建1至8个突变(效率为66-100%),我们显示了ptg/cas9对于紧密相关的基因进行突变是有力的工具。ptg/cas9通过自花授粉去除,并且无转基因t1和t2植株携带有所有的8个突变或者染色体缺失。所诱导的突变是得自多个碱基对的缺失或插入以及有时是得自染色体缺失。我们证明了ptg/cas9可靠地产生多个突变,所述突变可以稳定地传播至后代。新的基因组编辑工具近来有希望使给定基因组中的几乎任何基因成熟。基因的突变是通过(由细胞所修复的)靶位点诱导的双链断裂(dsb)来实现的。有缺陷的非同源末端连接(nhej)通路是普遍的dsb修复通路,并且其有缺陷的性质导致了在修复期间核苷酸的插入或缺失(插入缺失)。如果突变阻止或改变了基因的转录或翻译,则这些插入/缺失可引起基因敲除。如果存在与dsb位点具有足够同源性的供体模板,那么经同源重组来进行更精确地修复理论上是可能的,但是高等植物具有低内在同源性重组率(voytas,2013)。在基因组中实现定点dsb的主要工具是锌指核酸酶(zfn)、转录激活因子样核酸酶(talen)、以及最近的细菌ii型规律成簇的间隔短回文重复序列(crispr)和crispr-相关的蛋白9核酸酶(cas9)系统。zfn和talen的靶向能力依赖于蛋白:dna相互作用,因而需要设计新的结合结构域来改变核酸酶的靶位点(voytas,2013)。crispr/cas9系统更加容易进行编排,因为cas9内切核酸酶可以循环切割不同的靶位点(基于所谓的单一引导rna的rna:dna相互作用)(grna;jinek等人,2012)。grna5’-末端的20个碱基(grna间隔区),与紧接在前间区序列邻近基序(pam,对于酿脓链球菌cas9的情形是5’-ngg-3’;jinek等人,2012;cong等人,2013;mali等人,2013)之后的基因组靶dna序列(前间区序列)互补。crispr/cas9系统已经成功地用于拟南芥、烟草、本氏烟草(n.benthiama)、马铃薯、番茄、大豆、甜橙、地钱、玉米、高粱、小麦、和水稻的基因组编辑以敲除基因(brooks等人,2014;cai等人,2015;jia和wang,2014;jiang等人,2013;li等人,2013;miao等人,2013;shan等人,2013;sugano等人,2014;xie和yang,2013)。除了其容易设计之外,crispr/cas9系统可以用于靶向几乎任何基因。当使用spcas9时,拟南芥中所有转录单元的97.1%和水稻中所有转录单元的89.6%可以用高度特异性的grna间隔区来进行靶向(xie等人,2014a)。其余的基因依然可以由对于特异性grna具有不同的pam-要求的cas9变体来进行靶向。crispr/cas9系统的最大优势之一可能是其用于多元基因组编辑的能力。如果若干个grna共表达,那么cas9内切核酸酶理论上可以同时靶向多个靶。这使得研究者能够靶向多个基因进行敲除以及在单一步骤中创建双重突变体、三重突变体、或者甚至是十重突变体。然而,大多数多元编辑载体使用若干个grna表达盒,其用自己的poliii启动子和终止子推动每个grna(li等人,2013;lowder等人,2015;ma等人,2015a)。每个单一grna表达盒具有500至820bp的典型长度,并且使多元基因组编辑在植物中依然是种挑战,因为同时可表达的grna的数目受到载体容量和克隆效率的限制。即使可以叠加超过6个此类表达盒,拼装依然是低效的且常常失败(lowder等人,2015)。常见的植物转化技术通常将基因组编辑装置作为质粒经原生质体转染或粒子轰击来进行递送,或者是作为t-dna经土壤杆菌来进行递送。从单一转录物而不是多个个体盒表达多个grna是克服此限制的有希望的选择。通过引入从单一人工基因产生多个grna的多顺反子trna-grna基因(ptg),我们此前增强了crispr/cas9基因组编辑的多元能力(图1;xie等人,2015)。此基因由串联排列的trna-grna序列(其之前是poliii启动子以及之后是poliii终止子)组成。所使用的trna序列,如实施例1和2中公开的水稻甘氨酸trna前体,已经成功地用于各种生物体,包括用于多元基因组编辑的线虫(c.elegans)、果蝇和哺乳动物细胞。每个串联重复序列长度少于180bp(相较于个体盒所需的至少500bp)。每个grna可以含有识别不同靶的独特的间隔区,使得可以在一次转化中同时靶向多个基因组位点(图22)。内源rnasep和rnasez识别trna的二级结构(barbezier等人,2009;canino等人,2009;gutmann等人,2012;phizicky和hopper,2010;schiffer等人,2002),并且在特定位点切割trna以释放成熟的grna(其引导cas9内切核酸酶至多个特异性的靶)(图22)。另外,具有ptg的grna的表达可以比用简单的poliii启动子表达高出达30倍,可能是因为trna的a-和b-框可以增强ptg初级转录物的转录(xie等人,2015)。同时突变若干个基因的能力在分析紧密相关的基因(会具有类似或重叠的功能)时尤其有用。研究者目前需要找到可靠的突变体株系,并将其杂交以获得双重突变体或更高阶的突变体。ptg/cas9技术可以显著改善紧密相关基因的分析,因为多个基因的高数目可以在单一转化内被有效地进行靶向。在此研究中,通过在单一、双重、和四重突变体的组合中(具有高达8个共表达的grna)成功地突变了水稻tey-型丝裂原-相关蛋白激酶(mpk)基因家族的4个成员,我们测试了ptg/cas9创建突变体资源用于研究紧密相关基因的能力。mpk是重要的信号转导者,其已知在拟南芥中具有部分重叠的功能(beckers等人,2009;pitzschke等人,2009)。我们还显示出诱导的突变具有高度的多样性,并且突变和染色体缺失可靠地遗传至无转基因的后代。我们在mpk1的实例中发现必要基因很难进行敲除,因为突变倾向于保留现有的开饭放阅读框。此研究证明了,使用多元ptg/cas9技术,可以同时对紧密相关的基因进行编辑和突变,并且可以通过稳定遗传获得无转基因的、多基因突变体以用于研究复杂的基因家族和基因网络。结果和讨论用ptg/cas9对四个紧密相关的水稻mpk基因的高度有效的靶向我们设计了用于土壤杆菌介导的转化的基因构建体,以突变单个或组合的水稻中胁迫反应性mpk,并且探索ptg是否能可靠地产生稳定的突变,以便剖析紧密相关基因和基因家族的功能(表1)。拟南芥中的直系同源mpk基因在其功能上有重叠,并且在单突变体中彼此部分弥补(asai等人,2002;beckers等人,2009)。携带有基因构建体的ptg/cas9被设计为靶向单一的mpk基因或者它们的组合(在双重和四重突变体中)(表4.1)。ptgb3、ptgb4、ptgb5、和ptgb6携带有水稻泛素启动子(ubip:cas9)推动的cas9以及和水稻u3启动子(u3p:ptg)推动的ptg,以分别靶向mpk1、mpk2、mpk6、和mpk5,以用于创建单突变体(表4.1)。单突变体的ptg编码靶向一个基因的两个grna。另外的构建体,ptgb2,靶向在前间区序列2(ps2;图17)处仅具有一个grna的mpk5。ptgb7和ptgb8含有ptg,其中每四个靶向mpk5/mpk1和mpk6/mpk2的grna创建双重突变体(表4.1)。我们选择了这些mpk基因对,其中是基于它们在水稻mpk家族中紧密的系统发生学关系(reyna和yang,2006)。创建水稻mpk基因的双重突变可能有助于揭示类似的冗余功能性(如此前在拟南芥中所观测到的那样)。ptgb9包括了8个grna的ptg,以在单一转化事件中突变所有4个紧密相关的水稻mpk基因。我们此前的研究确认了水稻原生质体中使用的所有grna的功能性,并确定了ptgb6(mpk5)、ptgb7(mpk5/1)、和ptgb9(mpk5/1/6/2)在经土壤杆菌介导的转化产生的转基因水稻植物中的突变效率(86–100%)(xie等人,2015)。在此研究中,我们靶向了mpk1、mpk2、mpk6和mpk6/2以研究我们是否能够以类似的高百分比的基因组编辑的植物,来突变这些单一的和组合的mpk基因。用ptgb3(mpk1)、ptgb4(mpk2)、和ptgb5(mpk6)转化每个对经测试的株系产生了100%的基因组编辑效率(表4.1;图28和29)。然而,当同时靶向mpk6和mpk2时(ptgb8),效率较低,其中mpk6为83%而mpk2基因座为66%(图30)。我们仅在每个基因两个靶位点中的一个测试了转化效率,因为仅有一个前间区序列提供了用于pcr-re测定的方便的限制性内切酶(re)位点(图27)。因此,如果所有4个靶位点都予以考虑,那么ptgb8的实际编辑效率可以比测量的83%和66%高。ptgb8转化的主要目标是获得mpk6/mpk2双重突变体。高百分比的66%显示出两个基因处的基因组编辑,其产生了推定的双重突变体(图30)。现在这些推定的双重突变体株系中,75%在mpk6和mpk1上同时具有双等位基因突变。当用ptgb4、ptgb6、ptgb2、ptgb7、ptgb8和ptgb9进行的转化产生了有充分潮霉素抗性的和推定经编辑的愈伤组织细胞时,仅以ptgb3突变mpk1或以ptgb5突变mpk6的尝试不太成功。在每个构建提总共600个经转化的愈伤组织中(对每种载体有200个愈伤组织的三个独立重读),对于ptgb3我们仅能回收4个潮霉素抗性的愈伤组织,而对于ptgb5则仅有2个抗性愈伤组织。尽管如此,我们仍显示出有低百分比的回收株系以100%的效率突变(表4.1;图28)。因此,ptg/cas9可以设计为在紧密相关的基因和它们的组合中诱导基因特异性的突变(66–100%的效率)。研究可能被冗余基因遮蔽的表型的一个关键目标是,在单一株系中成功获得多个突变的基因。对ptgb8的分析显示出,所获得的所有株系中的50%在两个靶向的基因都携带有双等位基因突变。我们此前的研究当同时编辑4个基因时甚至实现了更高的效率,其中所有株系的86%在所有四个靶向的基因携带有双等位基因突变(xie等人,2015)。双等位基因突变在所有靶的这种高频率应当使得筛选多个敲除事件所需的时间和努力最小化。我们的结果表明ptg/cas9技术是用于通过多基因敲除来研究基因家族或冗余基因功能的可行工具。无转基因t1水稻植株从其亲代继承了所有8个同时诱导的突变在我们此前显示出ptg/cas9可仅使用单一转化事件而同时在8个基因组位点诱导突变(xie等人,2015)之后,现在我们研究当去除基因组编辑装置时这些突变是否能够遗传至下一代。我们选择分析自花授粉的t0ptgb9植株(此前显示出双等位基因突变)的种子。这些双等位基因突变体的t1代易于进行基因分型,因为8个靶向的基因组位点中有5个涵盖了re位点(其在两个等位基因处都被引入的突变所破坏)(图23;;图27)。自花授粉也可以通过t-dna片段的遗传分离来去除基因组编辑装置。在这些无转基因植物中检测到的任何突变,都应当是遗传的结果,因为不再存在基因组编辑装置来诱导新的突变。我们分析了四种不同ptgb9株系的一株t1代植株,其中三种植物是无转基因的。功能性ptg/cas9系统由多个grna编码ptg和cas9蛋白组成。无转基因植物不应当含有编码ptg或cas9蛋白的任何dna。用扩增u3:ptg盒和cas9基因的1kb片段的引物所进行的pcr,确认了植物2-1、3-2和4-2缺乏基因组编辑装置(图31,蓝箭头)。相反,所有4个t1株系的转基因亲代植物(t0)都显示出在其基因组dna中存在u3:ptg和cas9dna(图31)。扩增内源水稻基因的引物确认了所有样品中的dna都有良好的质量,因为从转基因和无转基因植物提取的基因组dna可以容易地扩增出pcr产物(图30,对照)。为了对t1代株系的突变进行基因分型,我们继而扩增了涵盖所靶向的8个前间区序列的4个基因的片,以用于pcr-re测定。如果两个突变的等位基因都如预期那样得到遗传,那么双等位基因t0ptgb9株系的t1后代在pcr-re测定期间应产生完全可消化的pcr产物。实际上,pcr-re测定发现,在前间区序列ps3、ps5、ps2、ps1、和ps7处所携带的突变(图27),正常传播至t1代(图23a,23b)。虽然适当的re会消化来自野生型dna的pcr产物,但是该处理并不会影响来自任何双等位基因t0植物经测试的后代的pcr产物,表明是破坏re位点的突变(图23a,红箭头)。我们进一步测试了在其余的三个靶向的位点是否也能发现突变。因为用pcr-re测定不可能在ps4、ps6、和ps8检测到突变(图22),且t7核酸内切酶i测定不适宜用于检测纯合突变(xie等人,2014b),我们决定对pcr产物直接测序。pcr产物直接测序的结果也可以告知t1突变体植物的接合性。如果两个等位基因都携带相同的突变并且是纯合的,那么测序结果就会由清晰的单峰组成。如果基因在每个等位基因上携带不同突变并且是杂合的,那么结果就会由模糊的双峰组成,通常从cas9靶向位点开始。来自杂合突变的双峰可以用简并序列解码来进行破译(ma等人,2015b)。对pcr产物的测序反映出在ptgb9的t1代植株中4个mpk基因的所有8个基因组靶位点处的突变,并确认了8个突变都忠实地遗传至后代(图23b)。然而,每株植物都具有不同程度的杂合性。植株2-1在所有4个基因携带有8个纯合的突变。植株3-2对于mpk2、mpk5、和mpk6是纯合的,但是对于mpk1上的ps4是杂合的。植株1-2对于mpk2和mpk5是纯合的,但是在mpk1和mpk6的所有4个ps区上都是杂合的。植株4-2对于mpk1和mpk5携带有纯合的突变,但是对于mpk2的ps6和mpk6的ps7是杂合的(图18b)。除了携带8个突变之外,经检验的t1代植株中有3株还是无转基因的,由缺乏可检测的来自基因组dna的u3:ptg和cas9片段可知(图31)。我们显示出ptg/cas9技术对于同时突变基因家族的若干成员是高度有效的工具,其中效率高达100%(表4.1)并且无转基因t1代在所有靶向的位点携带有突变(图23;图30)。近来,lowder等人(2015)显示出他们基于仅有一个grna的个体表达盒(每个盒长度达820bp)的模块系统可以叠加至8个盒,但是6个或更多个盒的拼装常常失败并效率低下。另外,该研究仅分析了同时表达最多达3个grna的构建体,并且不知道用个体盒表达更多的grna是否会导致令人满意的基因组编辑效力(lowder等人,2015)。相反,我们的ptg,从单一表达盒表达多个grna并且操控有力的内源trna加工器来讲初级转录物转化成多功能的grna(图22)。即使是从一个ptg同时表达8个grna的时候,在稳定的转基因株系中所有8个靶位点实现了86%的编辑效力(表1;xie等人,2015)。因此,ptg/cas9是高度有效的基因组编辑装置,其使得能快速且可靠的进行多个基因的诱变。ptg/cas9产生多种突变此前在拟南芥和水稻中使用crispr/cas9系统的大多数研究,都报道了在经稳定转化的t0植物中靶向的基因上有1bp的插入/缺失突变的强倾向性(endo等人,2014;feng等人,2014;hyun等人,2014;mikami等人,2015;zhang等人,2014)。相反,其它研究鉴定了较长的缺失(≥3bp)作为主要的突变类型(xu等人,2015;zhou等人,2014)。我们分析了来自ptg/cas9-突变的t0株系的所有可得的测序结果(n=54),来研究我们的多元基因组编辑系统是否能主要产生1bp的插入/缺失或者更多样的突变。在总共54个独立位点中,ptg/cas9-诱导的突变稍微偏向于1bp的插入(29.6%;图24),但是程度上要比此前的报道低很多(37-54%;feng等人,2014;zhang等人,2014)。近来的研究发现talen(转录激活因子样效应物核酸酶)产生69.9%的缺失,有81.1%影响多个碱基对(zhang等人,2015)。然而,整体突变效率talen仅达到25%,即使支架已经对于靶向水稻而进行了优化(zhang等人,2015)。在我们的ptg/cas9系统中,缺失占所检测突变的64.8%(图24)所有检测到的突变中有59.3%影响多个碱基对。此突变率显示出ptg/cas9丰富了突变的多样性(类似于talen)(图24),但是却有利地展现出更高的靶向效率(66-100%,即使是在多个基因组位点上)(表4.1)。缺失在突变类型方面展示出最高的多样性(高达74bp受影响)(表4.2)。相反,插入和转换分别仅观测到达到4或3bp。突变的多样性对于mpk5和mpk6基因座(74至1和48至1bp)要比mpk1和mpk2(15至1bp和11至1bp)更高,表明靶区至少部分地影响了突变多样性(表4.2)。zhang等人(2015)声称talen和crispr/cas9之间突变类型的差异是由于dsb的性质。talen产生两个间隔开的单链断裂以诱导dsb,而cas9蛋白在同一位置切割两条链。然而,似乎可以通过增强其编辑效率,从而使crispr/cas9的突变模式发生变迁(表4.2;图24)。crispr/cas9在原生质体中的早期结果(其中认为成分会高表达),显示出多种多样的突变模式(li等人,2013;shan等人,2013;xie和yang,2013)。相较于常规方法,ptg系统大大提高了细胞内grna的量(xie等人,2015)。我们假设grna的高滴度引起了所观测到的高效率和多碱基对突变的富集。ptg/cas9系统对于talen而言是优选的工具,即便是必须要突变多个碱基对的时候,因为其提供了易于使用的具有高效率和突变多样性的多元基因组编辑装置。另外,可以对ptg/cas9系统进行编排以缺失若干个较小或较大的染色体片段。这使得研究者能够从基因组去除整个基因或调节元件。水稻mpk基因由ptg-诱导的染色体缺失忠实地遗传至t1和t2代ptg提供了便捷和有效的方法来同时表达多个grna。以两个grna靶向染色体区域可以导致两个位点之间片段的缺失。我们此前的研究显示出,ptg/cas9可以在瞬时转化的原生质体中以及稳定转化的水稻愈伤组织中诱导染色体缺失(xie等人,2015)。但是目前尚未知后代是否会遗传这些ptg-诱导的缺失,以及遗传是否遵循孟德尔遗传学。我们分析了对于mpk5中的片段缺失是杂合体的ptgb9株系的t1后代,以解决此问题。我们推断如果引物的pcr产物在两个靶位点侧翼,那么全长的等位基因将会与从野生型序列所预测的是同样大小。另一方面,727bp的较小的pcr产物将表明染色体缺失。两个条带同时出现则理解为是杂合子。t0ptgb9株系4、5、和6在一个等位基因上携带有完整大小的mpk5基因,以及在另一个等位基因上是具有727bp缺失的拷贝,如通过测序所确认的(图25a;图32)。缺失的发生是作为预测的ps1和ps2断裂位点(前间区序列邻近基序上游3bp)的准确接合(图32)。选择株系3作为对照,并且其对于全长基因是纯合的(图25a)。来自每个株系的两株t1植物的基因分型,已经反映出染色体缺失是忠实遗传的(图25b)。t1植株4-2和6-1对于全长等位基因或者具有缺失的等位基因都分别是纯合的,显示出可以通过自花授粉来将每个等位基因固定在基因组中。为了研究全长和缺失等位基因是否会由t1植株以孟德尔的方式遗传,我们进一步分析了株系4、5、和6的后代。对于杂合的t0植物在t1后代中的预期比例为d:h:f是1:2:1(d:缺失,纯合的;h:杂合的;f:全长,纯合的)。我们测试了来自株系4的8株t1植物、来自株系5的10株t1植物、和来自株系6的9株t1植物子集。株系4和株系6展示出大致符合预期的比例,分别为0.8:2:0.4(d:h:f)和1.5:2:1(d:h:f),而株系5的后代稍稍富集了杂合的植物,比例为0.25:2:0.25(d:h:f;图33)。株系5中稍微偏离比例可能是所测试后代数目较小的结果。但是即使该子集较小,我们依然从所有经测试的株系检测到了至少1株t1植株对于缺失是纯合的或者对于全长等位基因是纯合的(图33)。另外,t1植株6-1,其对于缺失是纯合的,产生了仅显示出具有缺失的大小较小的片段的t2后代(图25c)。此结果进一步证明了6-1实际上是在mpk5基因中携带有纯合缺失的植株,并且这些缺失可以遗传至t2代。我们在此显示出,用两个ptg编码的grna靶向单一的基因,可以在t0代中引起染色体缺失,其可以孟德尔的方式遗传至后代。如果t0植株对于缺失是杂合的,其自花授粉可以产生具有纯合缺失的后代并且随后的那些代将会保持纯合,如植株6-1的后代所示。此前一项对于烟草中类似的染色体缺失的报道仅仅显示出在原生质体转染中的缺失(gao等人,2015)。另一报道显示出t0代水稻植株中较大的缺失,但是却并未证明缺失遗传周后代(zhou等人,2014)。另外,两项研究都使用了以其自己的启动子和终止子来表达每个grna的系统,这限制了可以同时共表达的grna的数目,在烟草中限制为2个grna而在谁要研究中限制为4个grna(gao等人,2015;zhou等人,2014)。在此研究中使用的新ptg/cas9系统使得能够表达高得多数目的grna,并且还提高了细胞内grna的滴度(xie等人,2015)。理论上来说,我们的系统能够允许4个染色体缺失(当8个gran同时共表达时)以及允许2个缺失(当4个grna共表达时)。然而,在ptgb7t0株系中(1个ptg中4个grna),我们此前仅检测到一个株系同时携带有mpk1中的单等位基因缺失和mpk5中的双等位基因缺失(xie等人,2015)。ptgb9t0株系(1个ptg中8个grna)显示出mpk5中片段缺失具有类似的趋势,但是其它三个靶向的mpk基因却不是这样(xie等人,2015)。可能需要大量的基因组编辑的植物来鉴定具有2个或4个基因的同时缺失的株系。另外,除了基因-靶向效率之外的因素也可以影响染色体缺失的形成。缺失主要在mpk5中检测到,这表明对于片段缺失效率有潜在的位置效应。考虑到mpk在植物发育和胁迫反应中的重要性,也可能是两个或更多个紧密相关mpk基因中的染色体缺失可导致极端的或有害的表型。此类致命表型可能防止了在单一再生植物中多个缺失的形成。mpk1和mpk6偏好可保留蛋白功能的突变与此前对于突变或缺失在一些水稻mpk基因中不利的推测一致,在ptgb9株系的4株经分析的t1植物中,我们在mpk1和mpk6中检测到了可以除以3而无余数的突变的富集(图26)。此类突变可能会保留编码序列的开放阅读框,因为3个碱基构成了1个氨基酸的编码单元。相反,在mpk2和mpk5中检测到的所有突变都是可能中断序列的开放阅读框的插入/缺失。67%的mpk1突变影响了3或3的倍数个碱基对(图26a),而mpk6中的突变具有此种突变类型的更高倾向性,有75%(图25a)。然而,当仅考虑外显子中的突变时,mpk1中100%的突变保留了开放阅读框,但在mpk6中仅有66.7%(图26b)。此结果表明,在水稻植物中,保留功能性的蛋白对于mpk1基因可能比对于mpk6基因更重要。为了预测mpk1中突变的作用,我们将突变体的编码序列翻译成蛋白序列,并将前60个氨基酸与野生型序列进行比较(图26c)。植株1-2具有两个不同的突变体等位基因,其中一个翻译成的蛋白缩短5个氨基酸(qatls;1-2a)而另一个翻译成的蛋白缩短了1个氨基酸(s;1-2b)。植株2-1、3-2、和4-2携带有来自1-2b的不同的核苷酸突变,但是翻译成相同的蛋白序列(缩短了位置45上的丝氨酸)(图26c)。用interproscan进行的分析反映出,所有三种蛋白序列的突变保留预测的蛋白激酶结构域(其在野生型蛋白中从氨基酸67开始)完整。与mpk1等位基因的结果相反,ptgb9株系中检测到的所有mpk5等位基因导致mpk5蛋白在野生型蛋白预测的蛋白激酶结构域(从氨基酸35开始)之前提早终止(图26d)。结果表明mpk1在水稻中发挥重要的作用,而mpk1基因中的突变产生有害的或致命的表型。实际上,当我们尝试用ptgb3(两个grna靶向mpk1)来突变愈伤组织时,我们遇到了问题。虽然ptgb3株系1(ptgb3-1)和ptgb3-2在再生培养基上产生了正常的幼苗,株系ptgb3-3和ptgb3-4的愈伤组织在培养基上变黑并且大部分死亡。ptgb3-3不能再生成幼苗。有趣的是,虽然株系ptgb3-4的愈伤组织在mpk1基因上携带有纯合的缺失(图28a),但是我们能够从再生培养基恢复两株幼苗(图26e)。然而,所恢复的幼苗一直严重矮化并且仅产生一个不育的穗,支持了mpk1的敲除引起有害或致命作用的假设(图26e)。对于也靶向mpk1的ptgb7和ptgb9的株系,我们并未观测到任何负面作用。但是如对于ptgb9所示,所有经分析的t1突变体植物的确携带有mpk1等位基因,其中具有保留现有开放阅读框的突变(图26c)。这些其它株系可携带有突变的但是依然具有功能的mpk1蛋白,其防止幼苗遭受所观测到的株系ptgb3-3和ptgb3-4的有害表型。此前其它组的报道在其研究中使用了mpk1敲除突变体细胞系,其是通过插入反转录子tos17而诱导的(kishi-kaboshi等人,2010;kurusu等人,2005)。很可能是mpk1可以在组织分化或植物发育中发挥目前未知的且关键的作用。核酸酶诱导的突变与经t-dna或tos17的插入突变相比的一个差异是,核酸酶如crispr/cas9仅切割dna,但是引起敲除的突变依赖于细胞的修复机制。我们发现在mpk1的情形中,在存活的t1代上的突变总是保留现有的开放阅读框(图26b),而mpk1的染色体缺失引起了愈伤组织提早死亡或产生严重矮化的和不育的植物(图26e)。虽然真正关键的基因的敲除由于致命性而在定义上是不可能的,但是似乎crispr/cas9也未能可靠地对重要的但并非真正关键的基因进行敲除。当敲除若干成员可引起极端表型但是转化和突变系统在一或多个靶向的基因中却选择保留突变的开放阅读框时,这对于分析基因家族或冗余基因可能会带来问题。虽然研究者希望发现此极端表型,但是其可能一直检测不到,因为所述突变不能敲除所有的基因。shi等人(2015)通过阴性筛选在癌细胞中鉴别关键基因的尝试中有过类似的观察。当他们用crispr/cas9靶向此前已知的关键基因的5’编码外显子时,所诱导的突变常常保留现有的开放阅读框并且变体都保留功能性(shi等人,2015)。他们通过直接靶向蛋白结构域而不是5’外显子来克服了这一局限,并用此策略实现了更严苛的阴性筛选表型。因此,当研究基因家族或冗余基因时,建议用ptg/cas9来靶向关键蛋白结构域,以提高基因对真正的敲除突变体进行评定的可能性。或者,可以产生单等位基因突变或杂合的突变体株系,并将其用于研究关键或致命基因。材料和方法植物材料和生长条件水稻kitaake栽培变种(oryzasativaspp.japonica)用于此研究。种子于45℃在食品脱水器中干燥36-48h,以便在萌发之前前打断休眠期,所述萌发是在37℃温水中萌发两天。将萌发的种子种植在metromix360soil(sungrohorticulture,agawam,ma)中,并在温室内生长(以28℃日/23℃夜的温度,每天12h补充光照)。所述植物在第一周之后用0.25%的尿素和0.1%的sprint铁溶液施肥,并在随后的周内用0.25%的尿素施肥脂质开花。ptg/cas9基因构建体ptg构建体ptgb6、ptgb7、和ptgb9此前有描述(xie等人,2015)。通过将此前描述和拼装的ptg(ptg3、ptg4、ptg5、ptg2、和ptg8)(xie等人,2015)插入bsai-digestedprgeb32双元载体(addgene质粒#63142)内,来构建ptgb3、ptgb4、ptgb5、ptgb2、和ptgb8。土壤杆菌介导的水稻转化经电穿孔将双元载体转化至根瘤土壤杆菌菌株eha105中。用土壤杆菌介导的方法根据此前描述的方案(hiei和komari,2008),来对衍生自kitaake栽培变种的种子的水稻愈伤组织进行转化。基因组dna提取通过添加0.9ml的预温的ctab缓冲剂(140mmsorbitol,220mmtris-hclph8.0,22mmedta、800mmnacl、34mm肌氨酰、和22mmctab)并在65℃于1.5ml的反应管中温育1h,从而从100-200μl体积的n2-磨碎的叶材料提取基因组dna。在添加400μl的氯仿:异戊醇(24:1)后将样品涡旋,并在转动器上于室温混合20min,之后在12,000rpm离心15min。将2/3体积的异丙醇添加至上层水相,之后在-20℃冷育30min以使dna沉淀。通过在12,000rpm离心30sec至5min来使dna沉淀成丸,并用70%的乙醇洗涤沉淀丸,之后用含有0.1mg/mlrnasea的te缓冲剂在37℃温育30min。通过添加1/10体积的3m乙酸钠ph5.2和2-2.5体积的无水乙醇,使dna再次沉淀,并在-20℃冷育过夜。使dna沉淀成丸并用70%的乙醇洗涤,之后将干燥的沉淀丸溶解于适当量的te缓冲液。通过分光光度计来测量浓度。所有的pcr都用gotaqdna聚合酶在gotaq反应缓冲剂(promega,madison,wi)中进行。通过用1%琼脂糖凝胶和用溴化乙锭染色的电泳来分析pcr产物和消化。用于基因分型的引物可以在附录的表4.1中找到。基因组编辑装置在后代中的存在或缺乏通过使用特异于u3p:ptg的引物的pcr来检测。通过使用每个基因两个靶位点侧翼的引物的pcr来检测染色体缺失。如果发生了染色体缺失,则产物大小会降低具体数目的碱基对。通过pcr-re测定来检测靶位点上由基因组编辑事件导致的插入缺失。用适当的re将涵盖靶位点的pcr产物消化2-3h。突变的dna不能被re所消化。将选择的pcr产物测序,以确定具体突变。每个等位基因中由不同突变产生的双峰使用简并序列解码来进行解析(ma等人,2015b)。如果双峰未能解码,则通过ta克隆将pcr产物克隆至pgem-teasy载体(promega,madison,wi)中,以用于对单一等位基因进行测序。蛋白序列与功能性结构域预测的比对通过clustalomegamultiple多序列比对工具(li等人,2015),将mpk1和mpk5突变体等位基因的预测的蛋白序列与其相应的野生型序列(msurgaprelease7)进行比对。用基于网页的interproscan工具来预测所述序列的功能蛋白结构域(jones等人,2014)。基因登录号靶基因的genbankrefseq登录号是os06g0154500(mpk1)、os08g0157000(mpk2)、os03g0285800(mpk5)、和os10g0533600(mpk6)。表格表4.1:ptg/cas9基因构建体靶向四个紧密相关的mpk基因的设计和效率。1此前在xie等人,pnas2015中有描述2经基因组编辑的t0株系相对于经测试的t0株系总数目的百分比,经测试株系的总数目在括号中表4.2:在所有经测序的来自突变体植株的pcr产物中观察到的ptg/cas9诱导的突变类型的总结。-:未检测的.表4.3:研究中使用的寡核苷酸以及其目的。mpk1-f2(seqidno:174);mpk1-r2(seqid:175);mpk2-nbf(seqidno:176);mpk2-r2(seqidno:177);mpk5-f256(seqidno:178);mpk5-nbr(seqidno:179);mpk6-f(seqidno:180);mpk6-r(seqidno:181);ugw-u3-f(seqidno:182);ugw-grna-r(seqidno:183);gtcas9-f(seqidno:184);gtcas9-r(seqidno:185);对照-f(seqidno:186);对照-r(seqidno:187)。引用的文献asai,t.,tena,g.,plotnikova,j.,willmann,m.r.,chiu,w.-l.,gomez-gomez,l.,boller,t.,ausubel,f.m.,andsheen,j.(2002).mapkinasesignallingcascadeinarabidopsisinnateimmunity.nature415,977–983.barbezier,n.,canino,g.,rodor,j.,jobet,e.,saez-vasquez,j.,marchfelder,a.,andecheverría,m.(2009).processingofadicistronictrna-snornaprecursor:combinedanalysisinvitroandinvivorevealsalternatepathwaysandcouplingtoassemblyofsnornp.plantphysiol.150,1598–1610.beckers,g.j.m.,jaskiewicz,m.,liu,y.,underwood,w.r.,he,s.y.,zhang,s.,andconrath,u.(2009).mitogen-activatedproteinkinases3and6arerequiredforfullprimingofstressresponsesinarabidopsisthaliana.plantcell21,944–953.brooks,c.,nekrasov,v.,lippman,z.b.,andeck,j.van(2014).efficientgeneeditingintomatointhefirstgenerationusingtheclusteredregularlyinterspacedshortpalindromicrepeats/crispr-associated9system1.166,1292–1297.cai,y.,chen,l.,liu,x.,sun,s.,wu,c.,jiang,b.,han,t.,andhou,w.(2015).crispr/cas9-mediatedgenomeeditinginsoybeanhairyroots.plosone10,e0136064.canino,g.,bocian,e.,barbezier,n.,echeverría,m.,forner,j.,binder,s.,andmarchfelder,a.(2009).arabidopsisencodesfourtrnasezenzymes.plantphysiol.150,1494–1502.cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.,etal.(2013).multiplexgenomeengineeringusingcrispr/cassystems.science(80-.).339,819–824.endo,m.,mikami,m.,andtoki,s.(2014).multigeneknockoututilizingoff-targetmutationsofthecrispr/cas9systeminrice.plantcellphysiol.56,41–47.feng,z.,mao,y.,xu,n.,zhang,b.,wei,p.,yang,d.-l.,wang,z.,zhang,z.,zheng,r.,yang,l.,etal.(2014).multigenerationanalysisrevealstheinheritance,specificity,andpatternsofcrispr/cas-inducedgenemodificationsinarabidopsis.proc.natl.acad.sci.u.s.a.111,4632–4637.gao,j.,wang,g.,ma,s.,xie,x.,wu,x.,zhang,x.,wu,y.,zhao,p.,andxia,q.(2015).crispr/cas9-mediatedtargetedmutagenesisinnicotianatabacum.plantmol.biol.87,99–110.gutmann,b.,gobert,a.,andgiegé,p.(2012).prorpproteinssupportrnasepactivityinbothorganellesandthenucleusinarabidopsis.genesdev.26,1022–1027.hiei,y.,andkomari,t.(2008).agrobacterium-mediatedtransformationofriceusingimmatureembryosorcalliinducedfrommatureseed.nat.protoc.3,824–834.hyun,y.,kim,j.-s.j.,cho,s.w.,choi,y.,kim,j.-s.j.,andcoupland,g.(2014).site-directedmutagenesisinarabidopsisthalianausingdividingtissue-targetedrgenofthecrispr/cassystemtogenerateheritablenullalleles.planta241,271–284.jia,h.,andwang,n.(2014).targetedgenomeeditingofsweetorangeusingcas9/sgrna.plosone9,e93806.jiang,w.,zhou,h.,bi,h.,fromm,m.,yang,b.,andweeks,d.p.(2013).demonstrationofcrispr/cas9/sgrna-mediatedtargetedgenemodificationinarabidopsis,tobacco,sorghumandrice.nucleicacidsres.41,e188.jinek,m.,chylinski,k.,fonfara,i.,hauer,m.,doudna,j.a,andcharpentier,e.(2012).aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337,816–821.jones,p.,binns,d.,chang,h.y.,fraser,m.,li,w.,mcanulla,c.,mcwilliam,h.,maslen,j.,mitchell,a.,nuka,g.,etal.(2014).interproscan5:genome-scaleproteinfunctionclassification.bioinformatics30,1236–1240.kishi-kaboshi,m.,okada,k.,kurimoto,l.,murakami,s.,umezawa,t.,shibuya,n.,yamane,h.,miyao,a.,takatsuji,h.,takahashi,a.,etal.(2010).aricefungalmamp-responsivemapkcascaderegulatesmetabolicflowtoantimicrobialmetabolitesynthesis.plantj.63,599–612.kurusu,t.,yagala,t.,miyao,a.,hirochika,h.,andkuchitsu,k.(2005).identificationofaputativevoltage-gatedca2+channelasakeyregulatorofelicitor-inducedhypersensitivecelldeathandmitogen-activatedproteinkinaseactivationinrice.plantj.42,798–809.li,j.-f.,norville,j.e.,aach,j.,mccormack,m.,zhang,d.,bush,j.,church,g.m.,andsheen,j.(2013).multiplexandhomologousrecombination-mediatedgenomeeditinginarabidopsisandnicotianabethamianausingguidernaandcas9.nat.biotechnol.31,688–691.li,w.,cowley,a.,uludag,m.,gur,t.,mcwilliam,h.,squizzato,s.,park,y.m.,buso,n.,andlopez,r.(2015).theembl-ebibioinformaticswebandprogrammatictoolsframework.nucleicacidsres.43,580–584.lowder,l.g.,paul,j.w.,baltes,n.j.,voytas,d.f.,zhang,y.,zhang,d.,tang,x.,zheng,x.,hsieh,t.-f.,andqi,y.(2015).acrispr/cas9toolboxformultiplexedplantgenomeeditingandtranscriptionalregulation.plantphysiol.doi:10.1104/pp.15.00636.ma,x.,zhang,q.,zhu,q.,liu,w.,chen,y.,qiu,r.,wang,b.,yang,z.,li,h.,lin,y.,etal.(2015a).arobustcrispr/cas9systemforconvenient,high-efficiencymultiplexgenomeeditinginmonocotanddicotplants.mol.plant8,1274–1284.ma,x.,chen,l.,zhu,q.,chen,y.,andliu,y.-g.(2015b).rapiddecodingofsequence-specificnuclease-inducedheterozygousandbiallelicmutationsbydirectsequencingofpcrproducts.mol.plant8,1285–1287.mali,p.,yang,l.,esvelt,k.m.,aach,j.,guell,m.,dicarlo,j.e.,norville,j.e.,andchurch,g.m.(2013).rna-guidedhumangenomeengineeringviacas9.science(80-.).339,823–827.miao,j.,guo,d.,zhang,j.,huang,q.,qin,g.,zhang,x.,wan,j.,gu,h.,andqu,l.-j.(2013).targetedmutagenesisinriceusingcrispr-cassystem.cellres.23,1233–1236.mikami,m.,toki,s.,andendo,m.(2015).parametersaffectingfrequencyofcrispr/cas9mediatedtargetedmutagenesisinrice.plantcellrep.34,1807–1815.phizicky,e.m.,andhopper,a.k.(2010).trnabiologychargestothefront.genesdev.24,1832–1860.pitzschke,a.,schikora,a.,andhirt,h.(2009).mapkcascadesignallingnetworksinplantdefence.curr.opin.plantbiol.12,421–426.reyna,n.s.,andyang,y.(2006).molecularanalysisofthericemapkinasegenefamilyinrelationtomagnaporthegriseainfection.mol.plant.microbe.interact.19,530–540.schiffer,s.,s.,andmarchfelder,a.(2002).assigningafunctiontoaconservedgroupofproteins:thetrna3′-processingenzymes.emboj.21,2769–2777.shan,q.,wang,y.,li,j.,zhang,y.,chen,k.,liang,z.,zhang,k.,liu,j.,xi,j.j.,qiu,j.-l.,etal.(2013).targetedgenomemodificationofcropplantsusingacrispr-cassystem.nat.biotechnol.31,686–688.shi,j.,wang,e.,milazzo,j.p.,wang,z.,kinney,j.b.,andvakoc,c.r.(2015).discoveryofcancerdrugtargetsbycrispr-cas9screeningofproteindomains.nat.biotechnol.33,661–667.sugano,s.s.,shirakawa,m.,takagi,j.,matsuda,y.,shimada,t.,hara-nishimura,i.,andkohchi,t.(2014).crispr/cas9-mediatedtargetedmutagenesisintheliverwortmarchantiapolymorphal.plantcellphysiol.55,475–481.voytas,d.f.(2013).plantgenomeengineeringwithsequence-specificnucleases.annu.rev.plantbiol.64,327–350.xie,k.,andyang,y.(2013).rna-guidedgenomeeditinginplantsusingacrispr-cassystem.mol.plant6,1975–1983.xie,k.,zhang,j.,andyang,y.(2014a).genome-widepredictionofhighlyspecificguidernaspacersforthecrispr-cas9-mediatedgenomeeditinginmodelplantsandmajorcrops.mol.plant7,923–926.xie,k.,minkenberg,b.,andyang,y.(2014b).targetedgenemutationinriceusingacrispr-cas9system.bio-protocol4,e1225.xie,k.,minkenberg,b.,andyang,y.(2015).boostingcrispr/cas9multiplexeditingcapabilitywiththeendogenoustrna-processingsystem.proc.natl.acad.sci.112,3570–3575.xu,r.-f.,li,h.,qin,r.-y.,li,j.,qiu,c.-h.,yang,y.-c.,ma,h.,li,l.,wei,p.-c.,andyang,j.-b.(2015).generationofinheritableand“transgeneclean”targetedgenome-modifiedriceinlatergenerationsusingthecrispr/cas9system.sci.rep.5,11491doi:10.1038/srep11491.zhang,h.,gou,f.,zhang,j.,liu,w.,li,q.,mao,y.,botella,j.r.,andzhu,j.-k.(2015).talen-mediatedtargetedmutagenesisproducesalargevarietyofheritablemutationsinrice.plantbiotechnol.j.doi:10.1111/pbi.12372.zhang,h.h.,zhang,j.,wei,p.,zhang,b.,gou,f.,feng,z.,mao,y.,yang,l.,zhang,h.h.,xu,n.,etal.(2014).thecrispr/cas9systemproducesspecificandhomozygoustargetedgeneeditinginriceinonegeneration.plantbiotechnol.j.12,797–807.zhou,h.,liu,b.,weeks,d.p.,spalding,m.h.,andyang,b.(2014).largechromosomaldeletionsandheritablesmallgeneticchangesinducedbycrispr/cas9inrice.nucleicacidsres.42,10903–10914序列表序列表序列表序列表序列表序列表<110>宾州研究基金会<120>用于多元rna引导的基因组编辑和其它rna技术的方法和组合物<130>p1123us01<150>62/065,093<151>2014-10-17<160>189<170>patentinversion3.5<210>1<211>113<212>dna<213>artificialsequence<220><223>sgrna1targetmpk5<400>1gatccgtggcaagatgtcgtagagcaggtacgttttagagctagaaatagcaagttaaaa60taaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt113<210>2<211>115<212>dna<213>artificialsequence<220><223>sgrna2targetmpk5<400>2gatccgtggcagtctacatcgccacggagctcagttttagagctagaaatagcaagttaa60aataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt115<210>3<211>96<212>dna<213>artificialsequence<220><223>grna1scaffoldtargetmpk5<400>3agatgtcgtagagcaggtacgttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>4<211>97<212>dna<213>artificialsequence<220><223>grna2scaffoldtargetmpk5<400>4tctacatcgccacggagctcagttttagagctagaaatagcaagttaaaataaggctagt60ccgttatcaacttgaaaaagtggcaccgagtcggtgc97<210>5<211>96<212>dna<213>artificialsequence<220><223>grna3scaffold.targetmpk1<400>5atccaggcgacgctgagccagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>6<211>96<212>dna<213>artificialsequence<220><223>grna4scaffold.targetmpk1<400>6tggcccaccggggtataaaagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>7<211>96<212>dna<213>artificialsequence<220><223>grna5scaffold.targetmpk2<400>7gaacccggtcgcctcaaggagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>8<211>96<212>dna<213>artificialsequence<220><223>grna6scaffold.targetmpk2<400>8gaatgcgcagactcgtcagggttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>9<211>96<212>dna<213>artificialsequence<220><223>grna7scaffold.targetmpk6<400>9gtgtccgcttggcatcgatagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>10<211>96<212>dna<213>artificialsequence<220><223>grna8scaffold.targetmpk6<400>10gcgggtgcgggtcaatcaaagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>11<211>96<212>dna<213>artificialsequence<220><223>grna9scaffold.targetpds<400>11acaagccaggagaattcagcgttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>12<211>96<212>dna<213>artificialsequence<220><223>grna10scaffold.targetpds<400>12cactgcatggataactcatcgttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>13<211>77<212>dna<213>artificialsequence<220><223>pre-trnasequence<400>13aacaaagcaccagtggtctagtggtggaatagtaccctgccacggtacagacccgggttc60gattcccggctggtgca77<210>14<211>10<212>dna<213>artificialsequence<220><223>last10bpofu3promoter<400>14gatccgtggc10<210>15<211>153<212>dna<213>artificialsequence<220><223>grna-trnainpgtrplasmid<400>15gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60ggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacg120gtacagacccgggttcgattcccggctggtgca153<210>16<211>193<212>dna<213>artificialsequence<220><223>trna-grna1<400>16gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgctttttttttt193<210>17<211>194<212>dna<213>artificialsequence<220><223>trna-grna2<400>17gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcatctacatcgccacggagctcagttttagagcta120gaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcg180gtgctttttttttt194<210>18<211>270<212>dna<213>artificialsequence<220><223>trna-grna1-trna<400>18gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatttttttttt270<210>19<211>271<212>dna<213>artificialsequence<220><223>trna-grna2-trna<400>19gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcatctacatcgccacggagctcagttttagagcta120gaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcg180gtgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgg240gttcgattcccggctggtgcatttttttttt271<210>20<211>365<212>dna<213>artificialsequence<220><223>trna-grna3-trna-grna4<400>20gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaatccaggcgacgctgagccagttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatggcccaccggggtataaaagttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt360ttttt365<210>21<211>366<212>dna<213>artificialsequence<220><223>trna-grna5-trna-grna6<400>21gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcagaacccggtcgcctcaaggagttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcagaatgcgcagactcgtcagggttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt360tttttt366<210>22<211>366<212>dna<213>artificialsequence<220><223>trna-grna7-trna-grna8<400>22gatgatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggta60cagacccgggttcgattcccggctggtgcagtgtccgcttggcatcgatagttttagagc120tagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagt180cggtgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagaccc240gggttcgattcccggctggtgcagcgggtgcgggtcaatcaaagttttagagctagaaat300agcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgct360tttttt366<210>23<211>367<212>dna<213>artificialsequence<220><223>trna-grna1-trna-grna2<400>23gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatctacatcgccacggagctcagttttagagctagaaatag300caagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttt360ttttttt367<210>24<211>713<212>dna<213>artificialsequence<220><223>trna-grna1-trna-grna2-trna-grna3-trna-grna4<400>24gatccgtggcaataaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatctacatcgccacggagctcagttttagagctagaaatag300caagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaac360aaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgat420tcccggctggtgcaatccaggcgacgctgagccagttttagagctagaaatagcaagtta480aaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcac540cagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggc600tggtgcatggcccaccggggtataaaagttttagagctagaaatagcaagttaaaataag660gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttttttt713<210>25<211>711<212>dna<213>artificialsequence<220><223>trna-grna7-trna-grna8-trna-grna5-trna-grna6<400>25gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcagtgtccgcttggcatcgatagttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcagcgggtgcgggtcaatcaaagttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaaca360aagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgatt420cccggctggtgcagaacccggtcgcctcaaggagttttagagctagaaatagcaagttaa480aataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcacc540agtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggct600ggtgcagaatgcgcagactcgtcagggttttagagctagaaatagcaagttaaaataagg660ctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttttt711<210>26<211>1404<212>dna<213>artificialsequence<220><223>trna-grna1-trna-grna2-trna-grna3-trna-grna4-trna-grna7-trna-grna8-trna-grna5-trna-grna6<400>26gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatctacatcgccacggagctcagttttagagctagaaatag300caagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaac360aaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgat420tcccggctggtgcaatccaggcgacgctgagccagttttagagctagaaatagcaagtta480aaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcac540cagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggc600tggtgcatggcccaccggggtataaaagttttagagctagaaatagcaagttaaaataag660gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggt720ctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgca780gtgtccgcttggcatcgatagttttagagctagaaatagcaagttaaaataaggctagtc840cgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggtctagtgg900tagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgcagcgggtg960cgggtcaatcaaagttttagagctagaaatagcaagttaaaataaggctagtccgttatc1020aacttgaaaaagcggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaata1080gtaccctgccacggtacagacccgggttcgattcccggctggtgcagaacccggtcgcct1140caaggagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttga1200aaaagtggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccct1260gccacggtacagacccgggttcgattcccggctggtgcagaatgcgcagactcgtcaggg1320ttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtg1380gcaccgagtcggtgcttttttttt1404<210>27<211>367<212>dna<213>artificialsequence<220><223>trna-grna9-trna-grna10<400>27gatccgtggcaacaaagcaccagtggtctagtggtggaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaacaagccaggagaattcagcgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240tccgattcccggctggtgcacactgcatggataactcatcgttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt360ttttttt367<210>28<211>20<212>dna<213>artificialsequence<220><223>primergrna1-rforcrt-pcrofgrna1<400>28aaacgtacctgctctacgac20<210>29<211>20<212>dna<213>artificialsequence<220><223>primergrna2-rforcrt-pcrofgrna2<400>29aaactgagctccgtggcgat20<210>30<211>34<212>dna<213>artificialsequence<220><223>primerbsa-grna-fforcrt-pcrandamplifygrna<400>30ggagaccgaggtctcggttttagagctagaaata34<210>31<211>24<212>dna<213>artificialsequence<220><223>primergrna1-fforqrt-pcr<400>31ggcaagatgtcgtagagcaggtac24<210>32<211>22<212>dna<213>artificialsequence<220><223>primergrna2-fforqrt-pcr<400>32gtctacatcgccacggagctca22<210>33<211>18<212>dna<213>artificialsequence<220><223>primergrna-rforqrt-pcr<400>33gcaccgactcggtgccac18<210>34<211>22<212>dna<213>artificialsequence<220><223>primerubi-qfforqrt-pcr<400>34tggtcagtaatcagccagtttg22<210>35<211>22<212>dna<213>artificialsequence<220><223>primerubi-qrforqrt-pcr<400>35caaatacttgacgaacagaggc22<210>36<211>20<212>dna<213>artificialsequence<220><223>primermpk5-qfforqpcr<400>36gatcccgccgccgatccctc20<210>37<211>54<212>dna<213>artificialsequence<220><223>primerg-trna-fforconstructpgtr<400>37gcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccctg54<210>38<211>60<212>dna<213>artificialsequence<220><223>primertrna-rforconstructpgtr<400>38ctgccatgcaccagccgggaatcgaacccgggtctgtaccgtggcagggtactattctac60<210>39<211>37<212>dna<213>artificialsequence<220><223>primerubi-fforamplifyingubip<400>39tgcatgcctgcaggtccacaaattcgggtcaaggcgg37<210>40<211>41<212>dna<213>artificialsequence<220><223>primerubi-rtoamplifyubip<400>40caaacttgttgataactatctgcaagaaataatcaccaaac41<210>41<211>41<212>dna<213>artificialsequence<220><223>primerugw-u3-fforconstructprge32<400>41gaccatgattacgccaagcttaaggaatctttaaacatacg41<210>42<211>37<212>dna<213>artificialsequence<220><223>primerugw-grna-rforconstructprge32<400>42ggacctgcaggcatgcacgcgctaaaaacggactagc37<210>43<211>18<212>dna<213>artificialsequence<220><223>primermpk1-fforgenotypingofmpk1<400>43gggtcggcacagcatctc18<210>44<211>20<212>dna<213>artificialsequence<220><223>primermpk1-r2forgenotypingofmpk1<400>44tgcgcctaaaaatcgagggt20<210>45<211>21<212>dna<213>artificialsequence<220><223>primermpk2-fforgenotypingofmpk2<400>45tttgggaagcatgtatgaagc21<210>46<211>20<212>dna<213>artificialsequence<220><223>primermpk2-r2forgenotypingofmpk2<400>46tatgccagccaatgagccaa20<210>47<211>21<212>dna<213>artificialsequence<220><223>primermpk5-f256forgenotypingofmpk5<400>47gccaccttccttcctcatccg21<210>48<211>20<212>dna<213>artificialsequence<220><223>primermpk5-r611forgenotypingofmpk5<400>48gttgctcggcttcaggtcgc20<210>49<211>21<212>dna<213>artificialsequence<220><223>primermpk6-fforgenotypingofmpk6<400>49ttgacgccccaacataaataa21<210>50<211>18<212>dna<213>artificialsequence<220><223>primermpk6-rforgenotypingofmpk6<400>50tgttgctgccgcttttct18<210>51<211>20<212>dna<213>artificialsequence<220><223>primerpds-fforgenotypingofpds<400>51ggtagaaatgccatgcggga20<210>52<211>20<212>dna<213>artificialsequence<220><223>primerpds-rforgenotypingofpds<400>52attcagccgaacctcaccac20<210>53<211>46<212>dna<213>artificialsequence<220><223>primerl5ad5-fforptgsynthesisandcloning<400>53cgggtctcaggcaggatgggcagtctgggcaacaaagcaccagtgg46<210>54<211>52<212>dna<213>artificialsequence<220><223>primerl3ad5-rforptgsynthesisandcloning<400>54taggtctccaaacggatgagcgacagcaaacaaaaaaaaaagcaccgactcg52<210>55<211>31<212>dna<213>artificialsequence<220><223>primers5ad5-fforptgsynthesisandcloning<400>55cgggtctcaggcaggatgggcagtctgggca31<210>56<211>31<212>dna<213>artificialsequence<220><223>primers3ad5-rforptgsynthesisandcloning<400>56taggtctccaaacggatgagcgacagcaaac31<210>57<211>36<212>dna<213>artificialsequence<220><223>primergr1-fforsynthesisofptg<400>57taggtctcctagagcaggtacgttttagagctagaa36<210>58<211>36<212>dna<213>artificialsequence<220><223>primergr1-rforsynthesisofptg<400>58atggtctcatctacgacatcttgcaccagccgggaa36<210>59<211>36<212>dna<213>artificialsequence<220><223>primergr2-fforsynthesisofptg<400>59taggtctccccacggagctcagttttagagctagaa36<210>60<211>37<212>dna<213>artificialsequence<220><223>primergr2-rforsynthesisofptg<400>60atggtctcagtggcgatgtagatgcaccagccgggaa37<210>61<211>36<212>dna<213>artificialsequence<220><223>primergr3-fforsynthesisofptg<400>61taggtctccgacgctgagccagttttagagctagaa36<210>62<211>36<212>dna<213>artificialsequence<220><223>primergr3-rforsynthesisofptg<400>62atggtctcacgtcgcctggattgcaccagccgggaa36<210>63<211>38<212>dna<213>artificialsequence<220><223>primergr4-fforsynthesisofptg<400>63taggtctccaccggggtataaaagttttagagctagaa38<210>64<211>32<212>dna<213>artificialsequence<220><223>primergr4-rforsynthesisofptg<400>64cgggtctcacggtgggccatgcaccagccggg32<210>65<211>37<212>dna<213>artificialsequence<220><223>primergr5-fforsynthesisofptg<400>65taggtctccgtcgcctcaaggagttttagagctagaa37<210>66<211>33<212>dna<213>artificialsequence<220><223>primergr5-rforsynthesisofptg<400>66cgggtctcacgaccgggttctgcaccagccggg33<210>67<211>37<212>dna<213>artificialsequence<220><223>primergr6-fforsynthesisofptg<400>67taggtctcccagactcgtcagggttttagagctagaa37<210>68<211>33<212>dna<213>artificialsequence<220><223>primergr6-rforsynthesisofptg<400>68cgggtctcatctgcgcattctgcaccagccggg33<210>69<211>36<212>dna<213>artificialsequence<220><223>primergr7-fforsynthesisofptg<400>69taggtctccttggcatcgatagttttagagctagaa36<210>70<211>36<212>dna<213>artificialsequence<220><223>primergr7-rforsynthesisofptg<400>70atggtctcaccaagcggacactgcaccagccgggaa36<210>71<211>37<212>dna<213>artificialsequence<220><223>primergr8-fforsynthesisofptg<400>71taggtctcccgggtcaatcaaagttttagagctagaa37<210>72<211>33<212>dna<213>artificialsequence<220><223>primergr8-rforsynthesisofptg<400>72cgggtctcacccgcacccgctgcaccagccggg33<210>73<211>21<212>dna<213>artificialsequence<220><223>primerln-gr7-fforsynthesisofptg<400>73taggtctccttggcatcgata21<210>74<211>21<212>dna<213>artificialsequence<220><223>primerln-gr7-rforsynthesisofptg<400>74atggtctcaccaagcggacac21<210>75<211>38<212>dna<213>artificialsequence<220><223>primergr9-fforsynthesisofptg<400>75taggtctcccaggagaattcagcgttttagagctagaa38<210>76<211>32<212>dna<213>artificialsequence<220><223>primergr9-rforsynthesisofptg<400>76cgggtctcacctggcttgttgcaccagccggg32<210>77<211>38<212>dna<213>artificialsequence<220><223>primergr10-fartificialsynthesisofptg<400>77taggtctccatggataactcatcgttttagagctagaa38<210>78<211>32<212>dna<213>artificialsequence<220><223>primergr10-rforsynthesisofptg<400>78cgggtctcaccatgcagtgtgcaccagccggg32<210>79<211>1720<212>dna<213>oryzasativa<400>79attccgcctccactttcccttcccttcctcctccacctccacctcctcgtcgcgatccaa60atccgaatccggccatggacgccggggcgcagccgccggacacggagatggcggaggccg120gcggcgggcagcagccgcctgctgcggctgcggcggcgggggcgggggcaggggcgggga180tgatggagaacatccaggcgacgctgagccatggcgggaggttcatccagtacaacatct240tcgggaacgtgttcgaggtcaccgccaagtacaagccccccatcctccccatcggcaagg300gcgcctacggcatcgtctgctcggcgctcaactcggagacgggggagcaggtggcgatca360agaagatcgccaacgcgttcgacaacaagatcgacgccaagcgcacgctcagggagatca420agctgctccgccacatggaccacgagaatattgttgccataagggatatcatacctcctc480cacaaaggaattcattcaatgacgtttatattgcatatgaattgatggatactgatctgc540atcaaattattcgctcaaatcaagcattgtcagaggagcactgccagtatttcctttatc600agattctccgtggcttgaagtatatacattcagcaaatgtccttcaccgagacttgaagc660ccagcaacctacttttgaatgcaaattgtgacctcaaaatttgtgattttggacttgctc720gtaccacctcagaaaccgattttatgactgagtatgttgtcacaagatggtatagggcac780cggaacttctgttgaattcctctgaatatactgcagcaattgatgtgtggtctgtgggct840gtatttttatggaactcatggatcgtaaacctttgtttcctggaagagatcatgtccatc900aattacgtctactaatggagctcatcggaacgccaaatgaggctgatctggattttgtaa960atgaaaatgcaagaagatacattcgccaacttcctagacatgcaaggcagtcctttcctg1020aaaaatttccacatgttcatcctttagcaattgatctggttgaaaagatgctgacatttg1080atcctagacagagaataacagttgaaggtgcccttgcacatccttacctggcatcactgc1140atgacataagtgatgagccagtctgctcatcacccttcagctttgacttcgagcagcatg1200cattgtccgaggaacaaatgaaggatctaatctaccaagaaggccttgcgttcaaccctg1260attaccagtagctggtgttctatttcagccttggattgattctattcatatggagttttt1320tcctcctgcgccacaaaaggtcgccgacagtgatcactagttgtaaataattgcctcacc1380tgaaaaatcctccctggttcaaagctgaaggtgttgttctaagagtagaaatgtactttg1440tgatcaagttcctgggtagctgctatgccattcttatgcttatgtatgttgtttaatgtg1500ggatttttttccatcttaaatgtttttagtcccttttgtaagaagagttagttcatgaac1560gatgacggcctaaattctgcggttatcatcaaattccccattttcttgtcgattcatgga1620tttctcatggttttacttaatgctccatgttgtaagacgtggtcaatggaagaggatata1680ttgactcttgattcagtggtggcagtttggagttgatcgt1720<210>80<211>398<212>prt<213>oryzasativa<400>80metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnileglnalathrleuserhisglygly354045argpheileglntyrasnilepheglyasnvalphegluvalthrala505560lystyrlysproproileleuproileglylysglyalatyrglyile65707580valcysseralaleuasnsergluthrglygluglnvalalailelys859095lysilealaasnalapheaspasnlysileaspalalysargthrleu100105110arggluilelysleuleuarghismetasphisgluasnilevalala115120125ileargaspileileproproproglnargasnserpheasnaspval130135140tyrilealatyrgluleumetaspthraspleuhisglnileilearg145150155160serasnglnalaleuserglugluhiscysglntyrpheleutyrgln165170175ileleuargglyleulystyrilehisseralaasnvalleuhisarg180185190aspleulysproserasnleuleuleuasnalaasncysaspleulys195200205ilecysasppheglyleualaargthrthrsergluthraspphemet210215220thrglutyrvalvalthrargtrptyrargalaprogluleuleuleu225230235240asnserserglutyrthralaalaileaspvaltrpservalglycys245250255ilephemetgluleumetasparglysproleupheproglyargasp260265270hisvalhisglnleuargleuleumetgluleuileglythrproasn275280285glualaaspleuaspphevalasngluasnalaargargtyrilearg290295300glnleuproarghisalaargglnserpheproglulyspheprohis305310315320valhisproleualaileaspleuvalglulysmetleuthrpheasp325330335proargglnargilethrvalgluglyalaleualahisprotyrleu340345350alaserleuhisaspileseraspgluprovalcysserserprophe355360365serpheaspphegluglnhisalaleuserglugluglnmetlysasp370375380leuiletyrglngluglyleualapheasnproasptyrgln385390395<210>81<211>1577<212>dna<213>oryzasativa<400>81gggttcgtttcttggctggttttcttgggcggcgatcgatcgatgcgcatggagggcggc60ggcggcggcggccatggccatcacggcggcggcggcggtggccatggccatcacggtggc120atcggaggaggggaggcgcagatcaaggggacgctgacgcacggcgggaggtacgtgcag180tacaacgtgtatggtaacctgttcgaggtttcgtccaagtacgtccctcccatccgcccc240gtcggccgcggcgcctgcggcatcatctgtgcggttgtgaatgcgcagactcgtcaggag300gtggcaatcaagaagatcggcaacgcgttcgacaaccagatcgacgccaagcgcaccctg360cgagagatcaagctgcttcggcacatggatcatgataatgtcatctcaataaaggacatc420atacggccaccaaggagggagaacttcaatgatgtctacattgtctatgagctcatggac480actgatcttcaccaccttcttcgatcaaaccagccactaacagatgatcactgtcagtat540tttctctatcaggtactacgaggattgaagtatgtgcattcagcaaatgtcttgcacaga600gacctcaggccaagtaatttgctgctgaatgcgaaatgcgatcttaagatcggagacttt660ggattagcaaggaccacaaatgaaactgacttcatgatggagtatgttgttactcgatgg720tacagggcacctgaactcctgctaaactgctcagagtacactgcagctattgatatctgg780tcggtaggctgcatccttggtgagatcgttacaagggagcctttgtttcctggaaaggat840tatgtccatcagctgaggctaataactgagttaataggctcacctgatgactcgagcctt900gggtttcttcgaagcgacaacgcccgcagatatgtgaggtcgcttcctcaataccccaag960caacaattccgtgcacggttccccactatgtctagtggtgccatggatttgcttgagagg1020atgcttgtgtttgatcccagcaaaaggattactgttgatgaagctctgtgccatccatac1080ttggcatcccttcatgagatatatgatgaaccagtctgcccagcgcctttcagcttcgat1140ttcgagcagccgtcgctcaccgaagaagatatcaaggagatcatatggagggaggcactt1200aagttcaaccctgaaccaattcactagatgaatttccaatgaagaacggaagcagatcac1260actggcagatgatcatccatccactccttggggaagacatgagccaacagcatgatgtat1320agttgatcaccctctcagcatctcatcttgtggcttgtcagcgacaccctgacatcgcaa1380attcggacatttatgaaaacaagaaaagcttgatcaaataatttgtagtacgaaaaaaat1440caggagcttaactgtatcttcttgttagatttgtatctatcccatttggttgtatgctta1500agaaacctgggagcttgtcactagttatggaggtacagcaatctccagatactcttcagt1560catcagttcagttcacc1577<210>82<211>1489<212>dna<213>oryzasativa<400>82agcgatcacaaattgtgccaattcacaaaccgccgcccccttccctttttaatagctgcc60ttcgcctctcgtcccctctccctcatcgccttgctgtctctgcgaatcgagagagagtca120gataaggtcgttaattaggtttgtcaattcggctgcttgcggcgagagaagaggaggagg180gattagggatggacggggcgccggtggcggagttcaggccgacgatgacgcacggcggcc240ggtacctgctctacgacatcttcgggaacaagttcgaggtgacgaacaagtaccagccgc300ccatcatgcccattggccgcggcgcctacgggatcgtctgctccgtgatgaactttgaga360cgagggagatggtggcgataaagaagatcgccaacgcgttcaacaacgacatggacgcca420agcgcacgctccgggagatcaagctcctcaggcacctcgaccacgagaacatcataggca480tcagggatgtgatcccgccgccgatccctcaggcgttcaacgacgtctacatcgccacgg540agctcatggacaccgacctccatcacatcatccgctccaaccaagaactgtcagaagagc600actgccagtatttcctgtaccagatcctgcgggggctcaagtacatccactcggcgaacg660tgatccaccgcgacctgaagccgagcaacctgctgctgaacgccaactgcgacctcaaga720tctgcgacttcgggctggcgcggccgtcgtcggagagcgacatgatgacggagtacgtgg780tcacccggtggtaccgcgcgccggagctgctgctcaactccaccgactactccgccgcca840tcgacgtctggtccgtcggctgcatcttcatggagctcatcaaccgccagccgctcttcc900ccggcagggaccacatgcaccagatgcgcctcatcaccgaggtgatcgggacgccgacgg960acgacgagctggggttcatacggaacgaggacgcgaggaagtacatgaggcacctgccgc1020agtacccgcgccggacgttcgcgagcatgttcccgcgggtgcagcccgccgcgctcgacc1080tcatcgagaggatgctcaccttcaacccgctgcagagaatcacagttgaggaggcgctcg1140atcatccttacctagagagattgcacgacatcgccgatgagcccatctgcctggagccct1200tctccttcgacttcgagcagaaggctctaaacgaggaccaaatgaagcagctgatcttca1260acgaagcgatcgagatgaacccaaacatccggtactagattgaatcaccatggaaatgag1320atcccgtctatacctgctttgtacatatgatcaagattgagagccgggtagactgaacat1380tgcatttgtttgtttgttgatgttcgaaacccacattctctgcaagttgtggctgctttg1440tatgatatatggtactatgttcgaataaaagggtttggaactttggatt1489<210>83<211>369<212>prt<213>oryzasativa<400>83metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyrleuleutyraspilepheglyasnlysphegluvalthr202530asnlystyrglnproproilemetproileglyargglyalatyrgly354045ilevalcysservalmetasnphegluthrargglumetvalalaile505560lyslysilealaasnalapheasnasnaspmetaspalalysargthr65707580leuarggluilelysleuleuarghisleuasphisgluasnileile859095glyileargaspvalileproproproileproglnalapheasnasp100105110valtyrilealathrgluleumetaspthraspleuhishisileile115120125argserasnglngluleuserglugluhiscysglntyrpheleutyr130135140glnileleuargglyleulystyrilehisseralaasnvalilehis145150155160argaspleulysproserasnleuleuleuasnalaasncysaspleu165170175lysilecysasppheglyleualaargprosersergluseraspmet180185190metthrglutyrvalvalthrargtrptyrargalaprogluleuleu195200205leuasnserthrasptyrseralaalaileaspvaltrpservalgly210215220cysilephemetgluleuileasnargglnproleupheproglyarg225230235240asphismethisglnmetargleuilethrgluvalileglythrpro245250255thraspaspgluleuglypheileargasngluaspalaarglystyr260265270metarghisleuproglntyrproargargthrphealasermetphe275280285proargvalglnproalaalaleuaspleuilegluargmetleuthr290295300pheasnproleuglnargilethrvalgluglualaleuasphispro305310315320tyrleugluargleuhisaspilealaaspgluproilecysleuglu325330335propheserpheaspphegluglnlysalaleuasngluaspglnmet340345350lysglnleuilepheasnglualaileglumetasnproasnilearg355360365tyr<210>84<211>1560<212>dna<213>oryzasativa<400>84attccgcggtcgccgcccgagtcaaaaagagggggaagcttctcccaccatagtcctcct60cctcctcctcctactcccatcaacgactagtcgcggcgaccaagagccaaaccctacgcc120tcctcccctccccctccacctcgtcctccccgcgagcggcggcggccatggattcctcct180ccggcggcgcgggcggcggcggcggcgcgcagatcaaggggatggggacgcacgggggcc240gctacgtgctgtacaacgtgtacgggaacttcttcgaggtctcctccaagtacgcccctc300ccatccgccccatcggccggggcgcctacggcattgtctgcgcggctgttaactcggaga360acggcgaggaagttgccatcaagaagattggcaatgcattcgacaaccatatcgatgcca420agcggacactgagagaaatcaagctgcttcgccacatggaccacgagaatattattgcca480taaaggacataattcgccccccaagaagagacaactttaatgatgtttacattgtttctg540agttgatggatactgatctccatcagatcatacgctcaaatcaaccattgactgatgacc600actgccagtacttcctgtaccagttgctacgagggctaaaatatgtgcactcggcaaatg660tcttgcaccgtgatctgaagccaagcaatttgttccttaatgcaaattgtgatctcaaga720ttgctgattttgggcttgcaagaaccactacggagactgacctcatgacagagtatgtgg780tcactcgttggtatcgagcaccagagctgctgttgaactgctcgcagtatactgctgcta840ttgatgtctggtcagttggatgcatacttggtgaaattgtgactcgtcaacccctgtttc900ctggaagggattacattcagcaactaaaattgatcactgagctgatagggtcgccagatg960actcaagcctagggtttcttcggagtgataatgcaagaagatacatgaaacagctaccac1020agtacccaaggcaggacttccgcttgcgcttccgcaacatgtctgctggtgcagtcgatc1080tgttagagaaaatgctggtgtttgacccaagcagacggataactgttgatgaggctcttc1140atcacccatacttggcttctcttcatgacatcaatgaagaacccacctgcccagcacctt1200tcagctttgattttgagcaaccatcctttactgaagaacatataaaagaactcatctgga1260gggaatccttggcatttaatccggatcctccctactaagagctcagagcaatttatcaat1320gctggcatctgaagatcggtagctctagaaaagccaaatccccttgctttgtgcatctat1380taattttatgcccacttgttgggcgaatgagcatggattattgttatagtgacaattttt1440cttaaggcctgtctaaagaaacaacatttgtattccttatcagatagcctgaacttgggc1500ctgtattataccggttgattgcataactgttcttatgtatctaagcctgtaattgtcttc1560<210>85<211>1641<212>dna<213>oryzasativa<400>85gcatcagctccacccccgaaaaatttctccccaatctcgcgaggctctcgtcgtcgaatc60gaatcctctcgcgtcctcaagatgcagatctttgtgaagacattgaccggcaagactatc120accctcgaggtggagtcctctgacaccatcgataatgtcaaggctaagatccaagataag180gagggcatccccccggaccagcagcgtctcatcttcgctggcaagcagctggaggatggc240aggacccttgctgactacaacatccagaaggagtcgacccttcaccttgtcctccgcctc300cgtggtggcatgcagatctttgtcaagactctgaccggcaagactatcacccttgaggtg360gagtcttctgacaccatcgacaacgtcaaggccaagatccaggacaaagagggcatcccc420ccagaccagcagcgtctcatcttcgccggcaagcagctggaggatggcaggacccttgct480gactacaacatccagaaggagtccaccctccaccttgtcctccgcctccgtggtggcatg540cagatctttgtcaagacactgaccggcaagaccatcaccctcgaggtggaatcttctgac600accatcgacaacgtcaaggccaagatccaggacaaggagggcattcccccggaccagcag660cgtctcatctttgccggcaagcagcttgaggacggcaggacccttgctgactacaacatc720cagaaggagtcaacgcttcaccttgtcctccgtctcaggggaggcatgcaaatcttcgtg780aagactctgaccggcaagaccatcaccctcgaggtggagtcttctgataccatcgacaat840gtcaaggccaagatccaggacaaggagggcattcccccggaccagcagcgcctcatcttt900gctggcaagcagctggaggatggcaggacccttgctgactacaacatccagaaggagtcc960accctccaccttgtgctccgccttcgtggtggtatgcagatctttgtcaagaccctcaca1020ggcaagaccatcaccctggaggttgagagctcggacaccatcgacaacgtcaaggccaag1080atccaggacaaggagggcatccccccagaccagcagcgtctcatcttcgccggcaagcag1140ctcgaggatggccgcaccctcgccgactacaacatccagaaggagtctaccctccacctg1200gtgcttcgtctccgtggtggtatgcagatcttcgtgaagaccttgactgggaagaccatc1260actttggaggttgagagctccgacaccattgataatgtgaaggccaagatccaggacaag1320gaggggattcccccagaccagcagcgtctgatcttcgctggcaagcagctggaggatgga1380cgcaccctcgccgactacaacatccagaaggagtccaccctccacctggtgctccgcctc1440cgtggtggtcagtaatcagccagtttggtggagctgccgatgtgcctggtcgtcccgagc1500ctctgttcgtcaagtatttgtggtgctgatgtctacttgtgtctggtttaatggaccatc1560gagtccgtatgatatgttagttttatgaaacagtttcctgtgggacagcagtatgcttta1620tgaataagttggatttgaacc1641<210>86<211>1971<212>dna<213>oryzasativa<400>86ggacaacttcctactcataggtgcttcgcaagtagcagcatccaagcactgaaaagtagt60cagcatgtgagctttggagtgaaatctcttgtcttaaggaataaaggaaaaagattccgt120cggaggctcggtgctctacaggttgtttgccaggactttccaagacctccactagaaaac180acaataaactttttggaagctggacaactatcttcatttttcagaaacagtgaacaaccc240actaaaccattacaggtcgtgattgctggagcaggattagctggtttatcaacggcaaaa300tatctggcagatgctggtcataaacccatattgcttgaggcaagggatgttttgggtgga360aagatagctgcttggaaggatgaagatggagattggtatgaaactgggcttcatatcttt420tttggagcttatcccaacatacagaacttgtttggcgagcttggtattaatgatcggttg480caatggaaggaacactccatgatatttgccatgccaaacaagccaggagaattcagccgg540tttgattttcctgaaacattgcctgcacccttaaatggaatatgggccatactaagaaac600aatgaaatgctaacttggccagagaaggtgaagtttgctcttggacttttgccagcaatg660gttggtggccaagcttatgttgaagctcaagatggttttactgtttctgagtggatgaaa720aagcagggtgttcctgatcgagtgaacgatgaggttttcattgcaatgtcaaaggcactt780aatttcataaatcctgatgagttatccatgcagtgcattctgattgctttaaaccgattt840cttcaggagaagcatggttctaagatggcattcttggatggtaatcctcctgaaaggtta900tgcatgcctattgttgaccatgttcgctctttgggtggtgaggttcggctgaattctcgt960attcagaaaatagaacttaatcctgatggaacagtgaaacactttgcacttactgatgga1020actcaaataactggagatgcttatgtttttgcaacaccagttgatatcttgaagcttctt1080gtacctcaagagtggaaagaaatatcttatttcaagaagctggagaagttggtgggagtt1140cctgttataaatgttcatatatggtttgatagaaaactgaagaacacatatgaccacctt1200cttttcagcaggagttcacttttaagtgtttatgcggacatgtcagtaacttgcaaggaa1260tactatgatccaaaccgttcaatgctggagttggtctttgctcctgcagaggaatgggtt1320ggacggagtgacactgaaatcatcgaagcaactatgcaagagctagccaagctatttcct1380gatgaaattgctgctgatcagagtaaagcaaagattctgaagtatcatgttgtgaagaca1440ccaagatctgtttacaagactatcccggactgtgaaccttgccgacctctgcaaagatca1500ccgattgaagggttctatctagctggtgactacacaaagcagaaatatttggcttcgatg1560gagggtgcagttctatctgggaagctttgtgctcagtctgtagtggaggattataaaatg1620ctatctcgtaggagcctgaaaagtctgcagtctgaagttcctgttgcctcctagttgtag1680tcaggactattcccaatggtgtgtgtgtcatcatcccctagtcagtttttttctatttag1740tgggtgcccaactctccaccaatttacacatgatggaacttgaaagatgcctattttggt1800cttatcatatttctgtaaagttgatttgtgactgagagctgatgccgatatgccatgctg1860gagaaaaagaacattatgtaaaacgacctgcatagtaattcttagacttttgcaaaaggc1920aaaaggggtaaagcgaccttttttttctatgtgaagggattaagagacctt1971<210>87<211>250<212>rna<213>artificialsequence<220><223>trna-grna-trnascheme<220><221>misc_feature<222>(78)..(97)<223>nisa,c,g,oru<400>87aacaaagcaccaguggucuagugguagaauaguacccugccacgguacagacccggguuc60gauucccggcuggugcannnnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaag120uuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcaacaaag180caccaguggucuagugguagaauaguacccugccacgguacagacccggguucgauuccc240ggcuggugca250<210>88<211>100<212>rna<213>artificialsequence<220><223>grnafromptggene<220><221>misc_feature<222>(1)..(20)<223>nisa,c,g,oru<400>88nnnnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60cguuaucaacuugaaaaaguggcaccgagucggugcaaca100<210>89<211>100<212>rna<213>artificialsequence<220><223>grnafromsgrnagene<220><221>misc_feature<222>(2)..(20)<223>nisa,c,g,oru<400>89annnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60cguuaucaacuugaaaaaguggcaccgagucggugcuuuu100<210>90<211>27<212>dna<213>oryzasativa<400>90ccaaccattttccatggcgggaggttc27<210>91<211>26<212>dna<213>oryzasativa<400>91ccaaccatttccatggcgggaggttc26<210>92<211>26<212>dna<213>oryzasativa<400>92ttctccctccaggaggtggcaatcaa26<210>93<211>61<212>dna<213>oryzasativa<400>93ttctccctcctaatctggaccaaagtgctgtccgcctacaacaagaggaggtggcaatca60a61<210>94<211>29<212>dna<213>oryzasativa<400>94ttctcccctcctcaggaggtggcaatcaa29<210>95<211>27<212>dna<213>oryzasativa<400>95gcggccggtactcatggacaccgacct27<210>96<211>26<212>dna<213>oryzasativa<400>96gcggccggtatcatggacaccgacct26<210>97<211>24<212>dna<213>oryzasativa<400>97atcaccctttggccaagcggacac24<210>98<211>23<212>dna<213>oryzasativa<400>98atcaccctttgccaagcggacac23<210>99<211>27<212>dna<213>oryzasativa<400>99atcaccctttcgatgccaagcggacac27<210>100<211>31<212>dna<213>oryzasativa<400>100gcacggcggccggtatcatggacaccgacct31<210>101<211>32<212>dna<213>oryzasativa<400>101cgcgtgccaaccatttgccatggcgggaggtt32<210>102<211>85<212>dna<213>oryzasativa<400>102cgcacggcgccggtacctgctctacgacatcttcgggaacaagttcaacgacgtctacat60cgccacggagctcatggacaccgac85<210>103<211>87<212>dna<213>oryzasativa<400>103gtcggtgtccatgagctccgtggcgatgtagacgtcgttgaaacttgttcccgaagatgt60cgtagagcaggtaccggccgccgtgcg87<210>104<211>78<212>dna<213>oryzasativa<400>104gccaaccattttataccccggtgggccaccacccccacctatggagaacatccaggcgac60gctgagccatggcgggag78<210>105<211>78<212>dna<213>oryzasativa<400>105ctcccgccatggctcagcgtcgcctccatgttctccataggtgggggtggtggcccaccg60gggtataaaatggttggc78<210>106<211>92<212>dna<213>oryzasativa<400>106cctccttctccctccttgaggcgaccgggttcgtttcttggctgtgcggttgtgaatgcg60cagactcgtcaggaggtggcaatcaagaagat92<210>107<211>92<212>dna<213>oryzasativa<400>107atcttcttgattgccacctcctgacgagtctgcgcattcacaaccgcacagccaagaaac60gaacccggtcgcctcaaggagggagaaggagg92<210>108<211>86<212>dna<213>oryzasativa<400>108tgatcaaccctttgattgacccgcacccgcatccctttccccattcgacaaccatatcga60tgccaagcggacactgagagaaatca86<210>109<211>83<212>dna<213>oryzasativa<400>109tgatttctcagtgtccgcttggcatcgatatggttgtcgaatggggaaagggatgcgggt60gcgggtcaatcaaagggtgatca83<210>110<211>100<212>dna<213>artificialsequence<220><223>vector<400>110aaggaatctttaaacatgatttaaaagagttgtgcagatgatccgtggcaggagaccgag60gtctcggttttagagctagaaaccgagtcggtgctttttt100<210>111<211>100<212>dna<213>artificialsequence<220><223>vector<400>111aaaaaagcaccgactcggtttctagctctaaaaccgagacctcggtctcctgccacggat60catctgcacaactcttttaaatcatgtttaaagattcctt100<210>112<211>44<212>dna<213>oryzasativa<400>112agtggcaccgagtcggtgctttaagatgtcgtagagcaggtacg44<210>113<211>42<212>dna<213>oryzasativa<400>113agtggcaccgagtcggtgctaagatgtcgtagagcaggtacg42<210>114<211>43<212>dna<213>oryzasativa<400>114agtggcaccgagtcggtgcttaagatgtcgtagagcaggtacg43<210>115<211>46<212>dna<213>oryzasativa<400>115gtggcaccgagtcggtgctttttttagatgtcgtagagcaggtacg46<210>116<211>37<212>dna<213>oryzasativa<400>116ggcaccgagtcggtgctttacatcgccacggagctca37<210>117<211>44<212>dna<213>oryzasativa<400>117aagtggcaccgagtcggtgctttctacatcgccacggagctcag44<210>118<211>46<212>dna<213>oryzasativa<400>118agtggcaccgagtcggtgcaaagatgtcgtagagcaggtacaatcg46<210>119<211>47<212>dna<213>oryzasativa<400>119aaaagtggcaccgagtcggtgcaatctacatcgccacggagctcagt47<210>120<211>67<212>dna<213>oryzasativa<400>120cgcgtgccaaccatttataccccggtgggccacatccaggcgacgctgaaaccatggcgg60gaggttc67<210>121<211>63<212>dna<213>oryzasativa<400>121cgcgtgccaaccatttataccccggtgggccacatccaggcgacgctccatggcgggagg60ttc63<210>122<211>65<212>dna<213>oryzasativa<400>122cgcgtgccaaccatttataccccggtgggccacatccaggcgacgctgaccatggcggga60ggttc65<210>123<211>39<212>dna<213>oryzasativa<400>123tcctccttctccctcctgaggcgaccgggttcgaatgcg39<210>124<211>68<212>dna<213>oryzasativa<400>124tcctccttctccctcctttgaggcgaccgggttcgaatgcgcagactcgtctaggaggtg60gcaatcaa68<210>125<211>56<212>dna<213>oryzasativa<400>125tcctccttaggcgaccgggttcgaatgcgcagactcgtctaggaggtggcaatcaa56<210>126<211>61<212>dna<213>oryzasativa<400>126cgcacggcggccggtatacgacatcttctacatcgccacggagcatcatggacaccgacc60t61<210>127<211>52<212>dna<213>oryzasativa<400>127cgcacggcggccggtattctacatcgccacggagcttcatggacaccgacct52<210>128<211>32<212>dna<213>oryzasativa<400>128cgcacggcggccggtatcatggacaccgacct32<210>129<211>59<212>dna<213>oryzasativa<400>129ggtgtgatcacccttttacccgcacccgccattcgacaaccatattgccaagcggacac59<210>130<211>58<212>dna<213>oryzasativa<400>130ggtgtgatcaccctttatgacccgcacccgccattcgacaaccataccaagcggacac58<210>131<211>64<212>dna<213>oryzasativa<400>131ggtgtgatcaccctttagacccgcacccgccattcgacaaccatatacgatgccaagcgg60acac64<210>132<211>76<212>dna<213>oryzasativa<400>132gccatgccaaacaagccaggagaattcagccggtttgaaaatcctgatgagttatccatg60cagtgcattctgattg76<210>133<211>26<212>dna<213>oryzasativa<400>133ccatgccaaacaagccagccggttga26<210>134<211>31<212>dna<213>oryzasativa<400>134aaatcctgatatccatgcagtgcattctgat31<210>135<211>50<212>dna<213>oryzasativa<400>135cgcgtgccaaccatttataccccggtggccacatccatggcgggaggttc50<210>136<211>62<212>dna<213>oryzasativa<400>136cgcgtgccaaccaggggaccccggtgggccacatccaggcgacgctgaatggcgggaggt60tc62<210>137<211>68<212>dna<213>oryzasativa<400>137cgcgtgccaaccaaccattttataccccggtgggccacatccaggcgacgctccatggcg60ggaggttc68<210>138<211>65<212>dna<213>oryzasativa<400>138cgcgtgccaaccatttatataccccggtgggccacatccaggcgacgctccatggcggga60ggttc65<210>139<211>64<212>dna<213>oryzasativa<400>139cgcgtgccaaccattttatatcccggtgggccacatccaggcgacgctccatggcgggag60gttc64<210>140<211>63<212>dna<213>oryzasativa<400>140cgcgtgccaaccatttgtgccccggtgggccacatccaggcgacgctccatggcgggagg60ttc63<210>141<211>66<212>dna<213>oryzasativa<400>141tcctccttctccctccgaggcgaccgggttcgaatgcgcagactcgtcaaaggaggtggc60aatcaa66<210>142<211>68<212>dna<213>oryzasativa<400>142tcctccttctccctcctttgaggcgaccgggttcgaatgcgcagactcgtctaggaggtg60gcaatcaa68<210>143<211>68<212>dna<213>oryzasativa<400>143tcctccttctccctcctttgaggcgaccgggttcgaatgcgcagactcgtccaggaggtg60gcaatcaa68<210>144<211>54<212>dna<213>oryzasativa<400>144tcctccttaggcgaccgggttcgaatgcgcagactcgtcggaggtggcaatcaa54<210>145<211>54<212>dna<213>oryzasativa<400>145tcctccttaggcgaccgggttcgaatgcgcagactcgtcggaggtggcaatcaa54<210>146<211>71<212>dna<213>oryzasativa<400>146cgcacggcggccggtatcctgctctacgacatcttctctacatcgccacggagcctcatg60gacaccgacct71<210>147<211>57<212>dna<213>oryzasativa<400>147cgcacggcggccgcttctctacgacatcttctctacatcgctcatggacaccgacct57<210>148<211>56<212>dna<213>oryzasativa<400>148cgcacggcggccgctatctacgacatcttctctacatcgctcatggacaccgacct56<210>149<211>65<212>dna<213>oryzasativa<400>149cgcacggcggccgctatctacgacatcttctctacatcgccacggagcttcatggacacc60gacct65<210>150<211>58<212>dna<213>oryzasativa<400>150ggtgtgatcaccttgacccgcagggcgattcgacaaccatccgatgccaagcggacac58<210>151<211>26<212>dna<213>oryzasativa<400>151acccgcacccgctgccaagcggacac26<210>152<211>58<212>dna<213>oryzasativa<400>152ggtgtgatcaccctttaacccgcacccgcattcgacaaccatattgccaagcggacac58<210>153<211>53<212>dna<213>oryzasativa<400>153ggtgtgatcaccctttacacccgcattcgacaaccatattgccaagcggacac53<210>154<211>53<212>dna<213>oryzasativa<400>154ggtgtgatcaccctttacacccgcattcgacaaccatattgccaagcggacac53<210>155<211>57<212>dna<213>oryzasativa<400>155ggtgtgatcaccctttacacccgcattcgacaaccatatacgatgccaagcggacac57<210>156<211>55<212>prt<213>oryzasativa<400>156metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnilehisglyglyargpheileglntyr354045asnilepheglyasnvalphe5055<210>157<211>59<212>prt<213>oryzasativa<400>157metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnileglnalathrleuhisglyglyarg354045pheileglntyrasnilepheglyasnvalphe5055<210>158<211>59<212>prt<213>oryzasativa<400>158metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnileglnalathrleuasnglyglyarg354045pheileglntyrasnilepheglyasnvalphe5055<210>159<211>21<212>prt<213>oryzasativa<400>159metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyrproala20<210>160<211>19<212>prt<213>oryzasativa<400>160metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyr<210>161<211>19<212>prt<213>oryzasativa<400>161metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyr<210>162<211>19<212>prt<213>oryzasativa<400>162metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargphe<210>163<211>31<212>prt<213>oryzasativa<400>163glycysalacysglyglycysglyglycyscysglyglythralathr151015cysalathrglyglyalacysalacyscysglyalacyscysthr202530<210>164<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac1<400>164gtaagaccaccgcactaggc20<210>165<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac1<400>165gccctgcagctattaccatt20<210>166<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac2<400>166gtattttaggatattggtgc20<210>167<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac2<400>167tgtttcaatctaacagtcaa20<210>168<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac3<400>168gagcagaactcaaagagccc20<210>169<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac3<400>169gctcaagtaagtagcccagg20<210>170<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac4<400>170gagctcctgaatacgtcgca20<210>171<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac4<400>171gctcctttgccgtccccgag20<210>172<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac6<400>172cgactggcagcaggacgtgc20<210>173<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac6<400>173caagctgatcctgtctctgg20<210>174<211>20<212>dna<213>artificialsequence<220><223>primer:genotypingofmpk1<400>174cctcgtgtttggtgttgctg20<210>175<211>20<212>dna<213>artificialsequence<220><223>primer:genotypingofmpk2<400>175tgcgcctaaaaatcgagggt20<210>176<211>21<212>dna<213>artificialsequence<220><223>primer:genotypingmpk2<400>176tttgggaagcatgtatgaagc21<210>177<211>20<212>dna<213>artificialsequence<220><223>primer:gentoypingmpk2<400>177tatgccagccaatgagccaa20<210>178<211>21<212>dna<213>artificialsequence<220><223>genotypingofmpk5<400>178gccaccttccttcctcatccg21<210>179<211>20<212>dna<213>artificialsequence<220><223>genotypingofmpk5<400>179actccgtcatcatgtcgctc20<210>180<211>21<212>dna<213>artificialsequence<220><223>genotypingofmpk6<400>180ttgacgccccaacataaataa21<210>181<211>18<212>dna<213>artificialsequence<220><223>genotypingofmpk6<400>181tgttgctgccgcttttct18<210>182<211>41<212>dna<213>artificialsequence<220><223>detectionofu3:ptg<400>182gaccatgattacgccaagcttaaggaatctttaaacatacg41<210>183<211>37<212>dna<213>artificialsequence<220><223>detectionofu3:ptg<400>183ggacctgcaggcatgcacgcgctaaaaacggactagc37<210>184<211>20<212>dna<213>artificialsequence<220><223>detectionofcas9<400>184gcttgtgcgtttcgatttga20<210>185<211>20<212>dna<213>artificialsequence<220><223>detectionofcas9<400>185ccgctcgtgcttcttatcct20<210>186<211>19<212>dna<213>artificialsequence<220><223>controlfordnaquality<400>186cgctgccactctccactga19<210>187<211>20<212>dna<213>artificialsequence<220><223>controlfordnaquality<400>187agctgcttccactcgttcca20<210>188<211>77<212>dna<213>artificialsequence<220><223>trna1forptg7<400>188aataaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttc60gattcccggctggtgca77<210>189<211>77<212>dna<213>artificialsequence<220><223>trnausedforptg10<400>189aacaaagcaccagtggtctagtggtggaatagtaccctgccacggtacagacccgggttc60gattcccggctggtgca77当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1