一种获得水稻指定基因突变体的方法及其应用的制作方法
【专利摘要】本发明提供了一种获得水稻指定基因突变体的方法,通过对传统的CRISPR/Cas系统进行优化,分别构建了优化后的CAS9基因的表达载体、优化后的sgRNA的表达载体和优化后的双元crRNA:tracrRNA的表达载体,并将筛选出的水稻特定基因的识别序列克隆到上述载体中,构建转化载体,最终获得水稻指定基因的突变体。该方法把CRISPR/Cas系统应用到水稻中产生指定基因的突变体,且突变率高,在植物基因工程中有广泛的应用价值。
【专利说明】一种获得水稻指定基因突变体的方法及其应用
【技术领域】
[0001] 本发明属于植物基因工程【技术领域】,具体涉及一种在水稻中获得指定基因突变体 的方法及其应用。
【背景技术】
[0002] 水稻(Oryza sativaL.)是重要的粮食作物,养活了半数地球人口,研究水稻、提高 水稻产量对保证国家的粮食安全有重要的意义。因而对水稻基因功能的研究和阐明,以及 利用已有的基因功能信息来操纵和改造水稻基因功能,对于改善农艺性状,提高粮食产量 具有重要的理论和应用价值。水稻是单子叶植物的模式植物,具有悠久的研究历史;同时, 相对其它禾本科植物,基因组较小,是最早完成基因组测序的植物之一。水稻基因组测序完 成之后,极大地促进了水稻基因功能的研究。在正向遗传学方面,例如利用图位克隆的技术 可以确定导致特定突变表型的基因位点。在反向遗传学方面,大量已知边界序列的T-DNA 插入突变体为研究特定基因的功能带来便利。尽管如此,目前这些方法本身都是基于随机 性的原理,研究者不总是能够获得特定位点的理想的突变体材料。同时,绝大多数对水稻 基因组的操作依然停留在随机破坏基因功能的层面上,无法进行更加精细和准确的序列改 变,比如只在个别位点对某个基因的序列进行替换,而不是完全破坏该基因的功能;或者利 用同源重组进行报告基因的定点整合。即使有报道在水稻中通过同时使用正负筛选标记的 方法得到了定点整合入基因组的植株,也是通过提高转基因植株的筛选量来实现的,这种 策略的效率很低,不适合广泛采用。对于农业生物技术来说也存在类似的问题,研究者需要 通过一代一代反复的杂交回交等耗时费力的劳动把优良的性状汇聚到新的品种当中,因而 迫切需要新的、能够直接改变基因组序列的方法来提高效率。
[0003] 为了实现高效的基因组编辑,关键的前提是能够定点产生DNA双链的断裂。目 前较为常用的可以在基因组水平用来实现定点切割的技术有基于归巢内切酶(homing nuclease)的meganuclease,基于锋指结构的内切酶(Zfn),以及基于Taleffector的 TALEN技术。由于归巢内切酶可以识别约20个碱基,特异性远远优于普通限制性内切酶,但 是该酶的DNA识别域和切割域位于同一结构域,因而人为改变该酶的DNA识别序列往往同 时导致切割效率降低,因而meganuclease技术的设计成本很高,目前尚无法推广。基于锌 指结构的内切酶(Zfn),和基于Taleffector的TALEN技术都不存在上述的问题,由于DNA 识别域和切割域是分开的,研究者只需要专注于设计可以特异结合指定DNA序列的蛋白序 列。他们的相似之处还在于,都是把识别少数几个碱基或者一个碱基的结构域模块,进行 串联重复来实现对指定DNA序列的特异性识别,这就意味着遇到不同的DNA序列都要重新 构建载体,但是将不同模块的重复序列进行拼接对于传统的克隆方法是有挑战的。最近新 发明的基于 CRISPR(ClusteredRegularlyInterspacedSmallPalindromicRepeats)/ Cas(CRISPRassociatatedsystem)系统的基因组编辑方法显示了更大的潜力。CRISPR/ Cas系统最近发现是广泛存在于原核生物中的一套针对外源DNA分子的适应性免疫系统, 在真细菌和古菌中负责抵御噬菌体入侵,降解转化的质粒。该系统能够在细胞初次被攻 击后将入侵的DNA的部分序列有规律的整合到事先存在的CRISPR重复序列之间,称为间 隔子(spacer),待到细胞再次受到攻击时,这段序列被一同转录为小分子RNA-crRNA (CRISPRRNA)。对于CRISPRII型系统,还存在一个小分子RNA-tracrRNA与crRNA形成 二聚体,参与crRNA的加工,并与crRNA -同行使功能。同时与其他类型相比,CRISPR II 型系统的结构是最紧凑的:仅需要一个蛋白酶CAS9,便可以在crRNA: tracrRNA双元分子的 指导下,由spacer序列入侵的DNA双链中形成R-loop,随后CAS9的两个酶活位点对DNA 进行序列特异的切割。为了正确的识别DNA分子,spacer序列下游(5' -3'方向)存在PAM (Protospacer Adjacent Motif)基序5' -NGG-3',切割位点通常位于PAM上游3-4个核苷 酸的位置。为了方便表达载体的构建,crRNA: tracrRNA双元分子被进一步融合为嵌合的 sgRNA (single guide RNA),其5'端20nt是负责识别特定基因的区域。这样只要同时在 细胞核内表达CAS9蛋白和sgRNA就可以实现对基因组DNA编辑。这种基于CRISPR/Cas系 统的技术不同于上述以蛋白质为核心的技术,CRISPR/Cas系统对DNA进行特异的切割是由 小分子RNA介导的,针对不同的靶标基因,只需要设计不同的小分子RNA即可。有研究表明 负责识别特定基因的20nt可以分为两个部分,5'端8nt由于远离将要识别的PAM序列,对 特异性贡献很小,同时5' -NAG-3'类型的PAM也可以被一顶程度的识别。因而为了实现切 割的特异性,识别特定基因的20nt中,临近PAM的12nt需要尽可能高的特异性,同时要可 虑如果使用5' -NAG-3'类型的PAM是否在基因组内可以找到被识别的基因位点。
[0004] 在多种模式动物和模式微生物中已经证明,将该系统进行改造和优化表达可以实 现基因组的编辑,目前已经发表的结果包括人的细胞系,小鼠,斑马鱼,果蝇,线虫和酵母, 其中一些实验里,突变的效率甚至可以达到100%。
【发明内容】
[0005] 本发明提供了一种获得水稻指定基因突变体的方法。把优化后的CRISPR/Cas系 统应用到水稻中产生指定基因的突变体,优化后的CRISPR/Cas系统稳定,突变效率高,该 方法在植物基因工程中有广泛的应用价值。
[0006] 本发明提供了一种CRISPR/Cas系统,包含优化后的CAS9基因和优化后的SgRNA, 其中:
[0007] 所述优化后的CAS9基因的核昔酸序列如序列表中的SEQ IDNo : 1所不;
[0008] 上述优化是针对CAS9蛋白在水稻中的表达,对来源于酿脓链球菌 (Streptococcuspyogenes)的核酸序列,进行了密码子优化;
[0009] 所述优化后的sgRNA(singleguideRNA)的核苷酸序列如序列表中的SEQID No: 2所示;
[0010] 上述优化是针对sgRNA在水稻中的表达,对来源于酿脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列进行了结构稳定性优化。
[0011]进一步地,所述优化后的CAS9基因,在5'端融合了核定位信号。
[0012] 进一步地,所述优化后的sgRNA具有颈环结构,所述颈环结构含有13个配对核苷 酸,用于结合CAS9基因,参见附图2 (1)。
[0013] 进一步地,上述CRISPR/Cas系统还包括优化后的双元crRNA: tracrRNA,参见附图 2⑵。
[0014] 所述优化后的双元crRNA:tracrRNA的核苷酸序列如序列表中的SEQ ID No :3、SEQ ID No :4所示,其中,SEQ ID No :3所示是优化后的crRNA的核苷酸序列;SEQ ID No :4所 示是优化后的tracrRNA的核苷酸序列;
[0015] 上述优化是针对双元crRNA:tracrRNA在水稻中的表达,对来源于酿脓链球菌 (Streptococcuspyogenes)的双元crRNA:tracrRNA核酸序列进行了结构稳定性优化。.[0016] 本发明提供了一种表达载体,包含上述核苷酸序列以及与上述核苷酸序列操作性 相连的表达调控序列。
[0017] 进一步地,所述表达调控序列包括组成型高表达的调控序列,例如驱动CAS9表达 的玉米UBIQUITIN基因的启动子,以及驱动guideRNA(sgRNA或双元crRNA:tracrRNA)表 达的U3snoRNA基因的启动子。
[0018] 进一步地,本发明提供的优化后的sgRNA的表达载体,能够插入多个sgRNA及多个 基因。
[0019] 本发明提供了设计好的针对水稻全基因组的特定基因的识别序列,并且提供了将 这些序列克隆到优化后的sgRNA或双元crRNA:tracrRNA的表达载体中,构建转化载体的方 法。
[0020] 本发明还提供了利用构建好的转化载体获得指定水稻基因突变体的方法,包括以 下步骤:
[0021] 1)获得优化后的CAS9基因的表达载体、优化后的sgRNA或双元crRNA:tracrRNA 的表达载体;
[0022] 2 )筛选特定基因的识别序列并将其分别克隆到优化后的sgRNA或双元 crRNA:tracrRNA的表达载体中;
[0023] 3)将步骤2)克隆得到的表达载体中与优化后的CAS9基因的表达载体组装为终载 体;
[0024] 4)将上述终载体导入水稻细胞内,获得水稻指定基因突变体。
[0025] 进一步地,筛选特定基因的识别序列包括特异性筛选和结构稳定性筛选。
[0026] 进一步地,筛选特定基因的识别序列包括以下步骤:
[0027] i)选择以5' -NGG-3'结尾的23nt序列,包含spacer的20nt和PAM的3nt,将包 含连续五个T的序列排除;
[0028] ii)将3'端的15个碱基,包含spacer的12nt和PAM的3nt,进行BLAST或者 B0WTIE的比对,排除不特异的序列;
[0029]iii)将选好的20ntspacer序列与sgRNA序列融合,用RNAfold服务器进行RNA二 级结构的预测。
[0030] 进一步地,步骤i )中,所述N是A或T或C或G。
[0031] 本发明还提供了上述获得指定水稻基因突变体的方法在编辑水稻基因组中的应 用。
[0032]本发明的有益效果在于:
[0033]a)本发明提供的CRISPR/Cas系统中,载体分为两部分,CAS9部分和guide RNA(sgRNA或双元crRNA:tracrRNA)部分。通过LR反应可以把这两部分合为一个单独的载 体,其中在guideRNA的载体上,可以选择放置多个sgRNA或者在一个双元crRNA:tracrRNA 中放置多个spacer,都可以达到同时针对多个基因的目的;
[0034] b)本发明提供的sgRNA与CAS9结合的部位(即颈环结构)更长,含有13个配对核 苷酸,RNA二级结构更稳定,效率更高;
[0035] c)本发明中使用的识别序列(spacer),都是经过RNA二级结构折叠分析过的,从 而能够保证颈环结构的稳定性以及识别序列的高特异性;
[0036] d)本发明提供的方法,突变效率高,可以达到50%,在植物基因工程中有广泛的应 用价值。
【专利附图】
【附图说明】
[0037] 图1 (1)显示了本发明优化后的CAS9的表达载体结构图。
[0038] 图1 (2)显示了本发明优化后的sgRNA的表达载体结构图。
[0039] 图1 (3)显示了本发明优化后的双元crRNA:tracrRNA的表达载体结构图。
[0040] 图2 (1)显示了包含针对LAZY1基因的spacer的sgRNA的二级结构示意图。
[0041] 图2 (2)显不了包含针对CA01基因的spacer的双兀crRNA:tracrRNA的二级结 构示意图。
[0042] 图3 (1)显示了本发明实施例带有LAZY1基因的识别序列(spacer)的sgRNA和 双元crRNA:tracrRNA折叠的二级结构图。虚线框表明了颈环结构中可以形成A-U/G-C配 对的位置。
[0043] 图3 (2)显示了本发明实施例带有CA01基因的识别序列(spacer)的sgRNA和双 元crRNA:tracrRNA折叠的二级结构图。虚线框表明了颈环结构中可以形成A-U/G-C配对 的位置。
[0044] 图4 (1)显示了本发明实施例LAZY1基因的识别位点相对于LAZY1基因的位置以 及实施例5中获得的LAZY1基因突变体的突变位点,其中,PAM的序列由下划线表示,spacer 序列为突出显示部分;突变的位置(缺失和替换)为方框所示。
[0045] 图4 (2)显示了CA01基因的识别位点相对于CA01基因的位置以及实施例5中获 得的CA01基因突变体的突变位点,其中,PAM的序列由下划线表示,spacer序列为突出显示 部分;突变的位置(缺失和替换)为方框所示。
[0046] 图4(3)显示了本发明实施例5中获得的LAZY1基因突变体的突变位点,其中,PAM 的序列由下划线表示,spacer序列为突出显示部分。
[0047] 图4 (4)显示了本发明实施例5中获得的LAZY1基因突变体的突变位点,其中, PPAM的序列由下划线表示,spacer序列为突出显示部分。
【具体实施方式】
[0048] 实施例1、在水稻细胞核中高水平表达CAS9的载体和在细胞核内表达小分子RNA 的载体的构建。
[0049] Streptococcus pyogenes的CAS9基因序列首先在5'端融合了核定位信号,然 后整个编码区针对水稻的基因表达进行了密码子优化(SEQ ID No: 1)。然后用吉布森拼接 的方法把来自玉米的组成型启动子Ubi,CAS9,和35S终止子串联在一起克隆到转化载体 pH2GW7 (购自比利时根特大学http://gateway, psb. ugent. be/)中,同时替换了该载体自 带的35S启动子。测序正确的载体命名为pH-Ubi-CAS9-7,如图1 (1)所示。
[0050] Streptococcus pyogenes的sgRNA基因序列最大限度的模拟了双兀 crRNA:tracrRNA的二级结构,如图3 (1)、图3 (2)所示。将粳稻U3snRNA启动子序列后添 加两个Bsal或者两个BsmBI酶切位点以及8个连续的核苷酸T,作为终止子,通过Topo克隆 得到 Entry 载体。将两个 sgRNA (SEQ ID No:2)或者双元 crRNA:tracrRNA (SEQ ID No:3、 SEQ ID No :4)分别克隆到Bsal和BsmBI内部,如图4 (1)、图4 (2)所示,最后得到的载体 命名为 p〇S-sgRNA (SEQ ID No:18)和 pOS-cr-tracr (SEQ ID No:19、SEQ ID No:20),分 别如图1 (2)、图1 (3)所示。在pOS-sgRNA和pOS-crRNA中依然保留了两个Bsal或者两 个BsmBI酶切位点用于克隆实施例2筛选的特定基因的识别序列。
[0051] 实施例2、筛选特定基因的识别序列(spacer)。
[0052] 毎个某闵的转录本序列从MSU/TIGR水稻某闵纟目数据库中获得(httD://rice. plantbiology.msu.edu/)。第一步选择以 5'-NGG-3'结尾的 23nt 序列(spacer 的 20nt 和 PAM的3nt),这里N是A/T/C/G任何一种。将包含连续五个T的序列排除。第二步,将3'端 的15个碱基,包含spacer的12nt和PAM的3nt,进行BLAST或者B0WTIE的比对,排除不特 异的序列。重复第二步可以进一步排除5'-NAG-3'PAM的非特异活性。包含全部水稻基因 的特异识别序列可以到ftp. cbi. pku. edu. cn/pub/supplementary_file/下载。根据这个 列表,我们挑出了针对CA01和LAZY1基因的特异识别序列。第三步,将选好的20nt spacer 序列与sgRNA序列融合,用RNAfold服务器进行RNA二级结构的预测。我们对二级结构采 用的标准有两点,一是稳定的颈环结构,二是尽量不配对的spacer区。
[0053] 具体地,在spacer与sgRNA的其它序列没有很强结合的情况下,一方面不会影响 sgRNA其它序列的正常折叠,保证sgRNA与CAS9结合的部位(颈环结构)很稳定,另一方面 防止了 spacer与sgRNA的其它序列结合而不能顺利插入祀DNA双链中。
[0054] 不特异序列的排除也是提高最终突变效率的一个重要因素。
[0055] 实施例3、针对CA01和LAZY1基因的特异识别序列的克隆。
[0056] 在选好的spacer的5'端加上5' -GGCA-3',在选好的spacer的互补链5'端加上 5' -AAAC-3',以针对CA01和LAZY1基因的特异识别序列为例:
【权利要求】
1. 一种CRISPR/Cas系统,包含优化后的CAS9基因和优化后的sgRNA,其中: 所述优化后的CAS9基因的核昔酸序列如序列表中的SEQ ID No :1所不; 所述优化后的sgRNA的核苷酸序列如序列表中的SEQ ID No :2所示。
2. 如权利要求1所述的CRISPR/Cas系统,其特征在于,所述优化后的sgRNA具有颈环 结构,所述颈环结构含有13个配对核苷酸,用于结合CAS9基因。
3. 如权利要求1所述的CRISPR/Cas系统,其特征在于,还包括优化后的双元 crRNA:tracrRNA 〇
4. 如权利要求3所述的CRISPR/Cas系统,其特征在于,所述优化后的双元 crRNA: tracrRNA的核苷酸序列如序列表中的SEQ ID No :3、SEQ ID No :4所示,其中,SEQ ID No :3所示是优化后的crRNA的核苷酸序列;SEQ ID No :4所示是优化后的tracrRNA的 核苷酸序列。
5. 表达载体,由权利要求1-4任一所述的CRISPR/Cas系统中的核苷酸序列以及与上述 核苷酸序列操作性相连的表达调控序列构成。
6. 如权利要求5所述的表达载体,其特征在于,所述表达调控序列包括组成型高表达 的调控序列。
7. 如权利要求5所述的表达载体,其特征在于,所述表达载体,包括优化后的CAS9 基因的表达载体、优化后的sgRNA的表达载体和优化后的双元crRNA: tracrRNA的表达 载体,其中优化后的sgRNA的表达载体序列如序列表SEQ ID No :18所示,优化后的双元 crRNA:tracrRNA 的表达载体如序列表 SEQ ID No :19、SEQ ID No :20 所示。
8. -种获得指定水稻基因突变体的方法,包括以下步骤: 1) 获得权利要求7所述的表达载体; 2) 筛选特定基因的识别序列并将其分别克隆到优化后的sgRNA或双元 crRNA:tracrRNA的表达载体中; 3) 将步骤2)克隆得到的表达载体中与优化后的CAS9基因的表达载体组装为终载体; 4) 将上述终载体导入水稻细胞内,获得水稻指定基因突变体。
9. 如权利要求8所述的方法,其特征在于,所述筛选特定基因的识别序列包括识别序 列的特异性筛选和结构稳定性筛选。
10. 如权利要求8所述的方法,其特征在于,筛选特定基因的识别序列包括以下步骤: i) 选择以5' -NGG-3'结尾的23nt序列,包含spacer的20nt和PAM的3nt,将包含连 续五个T的序列排除; ii) 将3'端的15个碱基,包含spacer的12nt和PAM的3nt,进行BLAST或者B0WTIE 的比对,排除不特异的序列; iii) 将选好的20nt spacer序列与sgRNA序列融合,用RNAfold服务器进行RNA二级 结构的预测。
11. 如权利要求10所述的方法,其特征在于,步骤i )中,所述N是A或T或C或G。
12. 权利要求8-11任一所述的方法在编辑水稻基因组中的应用。
【文档编号】C12N15/31GK104450745SQ201310415047
【公开日】2015年3月25日 申请日期:2013年9月12日 优先权日:2013年9月12日
【发明者】瞿礼嘉, 苗靳, 郭冬姝, 张金喆, 黄清配, 秦跟基, 顾红雅, 康定明 申请人:北京大学