通过Cas9-crRNA复合物的RNA指导的DNA裂解的制作方法

文档序号:467273阅读:1496来源:国知局
通过Cas9-crRNA复合物的RNA指导的DNA裂解的制作方法
【专利摘要】嗜热链球菌CRISPR3/Cas系统的Cas9-crRNA复合物的分离或体外组装及其用于DNA裂解的用途,所述DNA具有与crRNA互补的核苷酸序列和原型间隔子毗邻基序。使用RNA导向的DNA核酸内切酶在体外或体内对靶标DNA分子进行位点特异性修饰的方法,所述DNA核酸内切酶包含RNA序列及RuvC活性位点基序和HNH活性位点基序中至少一种;通过至少一个点突变使多肽中活性位点(RuvC或HNH)之一失活将Cas9多肽转化为双链DNA的切口酶裂解一条链的方法;在体内或体外组装活性多肽-多核糖核苷酸复合物的方法;以及在体外对Cas9-crRNA复合物的特异性进行重新编程的方法,该方法中使用了含有单一的重复序列-间隔子-重复序列单元的序列盒子。
【专利说明】通过Cas9-crRNA复合物的RNA指导的DNA裂解
[0001] 本申请要求同时申请的美国申请序列号61/613, 373 (提交于2012年3月20日) 及61/625,420 (提交于2012年4月17日)的优先权,二者都明确地以其全文并入本文作 为参考。
[0002] 摘要
[0003] CRISPR/Cas系统为细菌和古细菌提供针对病毒和质粒的适应性免疫。预先装载有 小干扰crRNA的核糖核蛋白(RNP)复合物执行对入侵核酸的沉默,其中crRNA引导对外源 核酸的靶向和降解。在本文中,我们描述了 Cas9-crRNA复合物的分离,并证明其在体外产 生靶标DNA分子中特异性位点上的双链断裂,其中靶标DNA分子与crRNA序列互补并在匹 配序列邻近具有短的原型间隔子序列峨邻基序(proto-spacer adjacent motif,PAM)。我 们表明,对DNA的裂解是由Cas9内部两个不同的活性位点(RuvC和HNH)进行的,二者在相 反的DNA链上生成位点特异性切口。Cas9-crRNA复合物的序列特异性是由42nt的crRNA 控制的,其包括与靶标DNA中原型间隔子序列互补的20nt片段。复合物可在体外或体内装 配。总体而言,我们的数据证明Ca S9-crRNA复合物起到RNA指导的核酸内切酶作用,识别 序列特异性靶标位点并在两个不同的链切口处进行裂解。
[0004] 发明背景
[0005] 成簇的规律间隔的短回文重复序列(CRISPR)与cas(CRISPR相关)基因构成适 应性免疫系统,其为细菌和古细菌提供针对入侵的外源核酸的获得性抗性(Barrangou等 人,2007. Science 315:1709-12)。CRISPR由短保守重复序列的阵列构成,其中间隔有类似 大小的独特可变DNA序列,称为间隔子,这些序列通常起源于噬菌体或质粒DNA (Barrangou 等人,2007.Science 315:1709-12 ;Bolotin 等人,2005.Microbiology 151:2551-61; Mojica等人,2005. J Mol Evol 60:174-82)。CRISPR-Cas系统发挥作用是通过获得外 源DNA的短片段(间隔子),将其插入到CRISPR区域中,并在随后暴露于携带有匹配 序列的噬菌体和质粒时为其提供免疫(Barrangou等人,2007. Science 315:1709-12 ; fcouns等人,2008. Science 321:960-4) CRISPR-Cas免疫通常是通过三个阶段进行的, 称为i)适应/免疫化/间隔子获得,ii)CRISPR表达/crRNA生物生成,iii)干扰/免 疫。(Horvath&Barrangou, 2〇10. Science 327 :l67_7〇;Deveau 等人,2〇10.Annu Rev Microbiol. 64:475-93 ;Marraffini&Sontheimer, 2010. Nat Rev Genet 11, 181-90 ;Bhaya 等人,Annu Rev Genet 45:273-97 ;Wiedenheft 等人,2012. Nature 482:331-338)。本文中 我们具体聚焦于使得crRNA介导的外源核酸沉默进行的干扰/免疫步骤。
[0006] CRISPR-Cas系统是高度多样化的,其分类为三种主要类型,这三种类型基于核 心兀件含量和序列又进一步划分为十种亚型(Makarova等人,2011. Nat Rev Microbiol 9:467-77)。crRNA介导的外源核酸沉默中所涉及的核蛋白复合物的结构组织和功能对于 不同的 CRISPR/Cas 类型是有差别的(Wiedenheft 等人,2012. Nature 482:331-338)。在 以大肠埃希氏菌为例的1-E型系统中,crRNA被整合入称为Cascade (用于抗病毒防御的 CRISPR相关复合物)的多亚基效应子复合物中(Brouns等人,2008. Science 321:960-4), 其结合于靶标DNA并通过签名Cas3蛋白质引发降解(Sinkunas等人,2011.EMB0 J 30:1335-42 ;Beloglazova 等人,2011.EMB0 J 30:616-27)。在矿硫化叶菌(Sulfolobus solfataricus)和强烈炽热球菌(Pyrococcus furiosus)的 III 型 CRISPR/Cas 系统中,Cas RAMP模块(Cmr)和crRNA复合物在体外识别并裂解合成的RNA (Hale等人,2012. Mol Cell 45:292-302 ;Zhang 等人,2012. Mol Cell, 45:303-13),而表皮葡萄球菌(Staphylococcus epidermidis)的 CRISPR/Cas 系统在体内革巴向 DNA(MarrafTini&Sontheime;r,Scien ce.322:1843-5)。
[0007] 在II型CRISPR/Cas系统,更具体地是嗜热链球菌(Streptococcus thermophilus)DGCC7710 的 CRISPR3/Cas 系统中(Horvath&Barrangou, 2010. Science 327:167-70)所进行的DNA沉默中涉及的RNP复合物由四种cas基因cas9、casl、cas2和 csn2组成,这些基因位于12个重复间隔子单元的上游(图1A)。Cas9 (之前称为cas5或 csnl)是 II 型系统的签名基因(Makarova 等人,2011. Nat Rev Microbiol 9:467-77)。在 与之密切相关的嗜热链球菌CRISPRl/Cas系统中,破坏cas9会消除crRNA介导的DNA干 扰(Barrangou等人,2007. Science 315:1709-12)。我们在近期的研究中已经表明,嗜 热链球菌的CRISPR3/Cas系统可被转移至大肠埃希氏菌(Escherichia coli)中,并且 这种异源系统从头开始提供了针对质粒转化和噬菌体感染的保护(Sapranauskas等人, 2011. Nucleic Acids Res 39:9275-82)。嗜热链球菌CRISPR3提供的针对噬菌体和质粒 DNA的干扰要求靶标DNA中存在与间隔子衍生的crRNA互补的原型间隔子序列,以及保守 的PAM(原型间隔子峨邻基序)序列NGGNG,其紧邻原型间隔子下游(Deveau等人,2008. J Bacteriol 190:1390-400 ;Horvath 等人,2008. J Bacteriol 190:1401-12 ;Mojica 等 人,2009. Microbiology 155:733-40)。PAM或限定的原型间隔子位置中单一点突变使得噬 菌体或质粒能避免CRISPR介导的免疫(Deveau等人,2008. J Bacteriol 190:1390-400; Garneau 等人,2〇10.Nature 468:67_7l;Sapranauskas 等人,2〇ll.Nucleic Acids Res 39:9275-82)。我们已经确认在异源系统中,cas9是CRISPR编码的干扰中唯一需要的cas 基因(Sapranauskas 等人,2011. Nucleic Acids Res 39:9275-82),这表明此蛋白质参与 了 crRNA加工和/或crRNA介导的对入侵DNA的沉默。嗜热链球菌CRISPR3/Cas系统中的 Cas9是一个大的多结构域蛋白质,由1,409aa残基构成(Sapranauskas等人,2011. Nucleic Acids Res 39:9275-82)。其含有两个核酸酶结构域,其一是靠近氨基末端的RuvC样核酸 酶结构域,另一个是位于蛋白质中部的HNH样结构域。突变分析已经确认Cas9提供的体 内干扰需要RuvC和HNH两种基序的存在(Sapranauskas等人,2011.Nucleic Acids Res 39:9275-82)。
[0008] 本文提供了嗜热链球菌CRISPR3/Cas系统中Cas9_crRNA复合物的分离以及分离 组分在体外的复合物组装,且证明了其以PAM依赖的方式裂解具有与crRNA互补的核苷酸 序列的合成寡脱氧核糖核苷酸或是质粒DNA。进一步地,我们提供了实验证据,证明PAM 是在双链DNA中被识别的,并且对体外DNA结合和裂解起至关重要的作用。最后,我们表 明,Cas9的RuvC-和HNH-活性位点负责相反DNA链的裂解。总的说来,我们的数据表明 Cas9-crRNA复合物起RNA指导的核酸内切酶的作用,其使用RNA进行靶标位点识别,使用 Cas9进行DNA裂解。Cas9-crRNA复合物的简单模块化组织为工程改造普适性的RNA指导 的DNA核酸内切酶提供了灵活的平台,其中对DNA靶标的特异性是由小crRNA编码而裂解 机制则由单个多结构域Cas蛋白质构成。事实上,我们提供证据证明,通过改变Cas9-crRNA 复合物中的RNA序列可以为体外和体内应用设计可编程的内切核酸酶,我们还提供了所述 新型应用的定制方案。这些发现为RNA指导的DNA手术开发新型分子工具奠定了基础。
[0009] 发明概述
[0010] 提供了用于对靶标DNA分子进行位点特异性修饰的方法,通过在合适的条件下将 靶标多脱氧核糖核苷酸分子;与包含至少一种RNA序列及RuvC活性位点基序及HNH活性位 点基序中至少之一的RNA指导的DNA核酸内切酶相接触;产生的靶标多脱氧核糖核苷酸分 子在一定的区域得到修饰,该区域是由RNA序列向靶标DNA分子的互补结合确定的。该方法 包括在合适的条件下对组合物进行孵育,所述组合物包括靶标双链多脱氧核糖核苷酸或单 链多脱氧核糖核苷酸;其中双链多脱氧核糖核苷酸含有短的原型间隔子毗邻基序(PAM), 这对于单链多脱氧核糖核苷酸不是需要的;其中的PAM包含5' NGGNG-3'序列;多核糖核苷 酸(crRNA)包含3'和5'区域,其中3'区域包含含有CRISPR基因座的存在于微生物中的 至少22nt的重复,而5'区域则包含紧邻CRISPR基因座中重复的下游的至少20nt的间隔 子序列,其与靶标多核苷酸的部分大体上互补,可选地与其互补;多肽,其中多肽的氨基酸 序列与SEQ ID NO: 1的氨基酸序列具有至少80%的同一性,所述多肽分离自嗜热链球菌或 遗传修饰的微生物包括遗传修饰的大肠杆菌,或者其中的多肽由选自重组DNA技术或化学 合成的方法产生;核苷酸序列为SEQ ID N0:5(或与其有至少80%的同一性)的多核糖核 苷酸tracrRNA,包含5'和3'区域,其中5'区域由与crRNA的22个核苷酸3'区域互补的 至少22个核苷酸构成,以及3'区域。其中多核糖核苷酸是通过体外转录或化学合成产生 的。其中,合适的条件指的是可能发生反应的体外或体内条件。
[0011] 提供了将Cas9多肽转化为切口酶(其仅仅裂解双链DNA的一条链)的方法,其 通过产生至少一个点突变使多肽上活性位点(RuvC或HNH)之一失活,示例有D31A(SEQ ID N0:2),N891A(SEQ ID N0:3)和 H868A(SEQ ID N0:4)点突变。RuvC 基序突变体仅裂解对于 5' NGGNG-3'基序而言的底部DNA链,而HNH基序突变体裂解顶部DNA链。
[0012] 多肽-多核糖核苷酸复合物可分离自经遗传修饰的微生物(例如大肠埃希氏菌或 嗜热链球菌),或在体外由分开的组分组装而成。在遗传修饰的微生物组分中,复合物的组 分可以是在含有来自遗传修饰微生物的宿主启动子或来自原生宿主基因组的启动子的一 种、两种或三种分开的质粒上编码的。
[0013] 提供了用于在体外组装活性多肽-多核糖核苷酸复合物的方法,包含在适合复合 物组装的条件下孵育组合物的组分。所述复合物可使用三或四种组分组装。用于三种组 分组装的方法包括对Cas9多肽、78nt的tracrRNA多核糖核苷酸(SEQIDN0:5)及42nt 的crRNA多核糖核苷酸(5' -NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUGUGUUGUUUCG-3')(SEQID NO: 15)在适合复合物组装的条件下进行孵育。用于四种组分组装的方法包括对Cas9多肽; 102nt的tracrRNA多核糖核苷酸(SEQIDN0:6);含有序列 5'-NNNNNNNNNNNNNNNNNNNNGUU UUAGAGCUGUGUUGUUUCG-3'(SEQIDN0:15)和邻侧区域以及裂解双链RNA多核苷酸的RNase III多肽进行孵育。含有序列 5'-NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUGUGUUGUUUCG-3'(SEQ IDNO: 15)的多核糖核苷酸的实例为SEQIDN0:8、SEQIDN0:9、SEQIDNO: 10、SEQID NO: 11和SEQIDNO: 12)。合适的RNaselll的来源的实例包括大肠埃希氏菌或嗜热链球菌。
[0014] 提供了用于对CaS9-crRNA复合物特异性进行重新编程的方法,是通过将分开的 组分相混合或使用含有单个重复序列-间隔子-重复序列单元的序列盒子(cassette)完 成的。任何序列都可使用合适的限制性内切酶插入序列盒子中的两个重复序列之间。所述 序列盒子可用于在体内靶向序列,或产生适合体外复合物组装的RNA核糖核苷酸。
[0015] 附图简述
[0016] 图1显示了与crRNA共纯化的Cas9蛋白质。(A)嗜热链球菌CRISPR3/Cas系统的 不意图。四个cas基因(cas9、casl、cas2、csn2)位于CRISPR重复序列-间隔子阵列的上 游,由13个重复序列(R)和12个独特的间隔子(S1-S12)构成。II型CRISPR系统的crRNA 成熟中需要的 tracrRNA (Deltcheva 等人,2011. Nature 471:602-7)位于 cas9 基因的上 游,并在相对CRISPR3/Cas系统其他元件的相反DNA链(以箭头指出)上编码。(B)用于 Cas9-crRNA共表达的两个质粒中异源基因座的示意图。大肠杆菌RR1菌株含有pCas9 (-) 1 SP (编码 Casl、Cas2、Csn2、SP1 和 tracrRNA)及 pASKIBA-Cas9(编码 Cas9 的 Str印标签 形式)质粒。(C)使用抗-crDNA寡核苷酸作为探针对Cas9-crRNA复合物进行的Northern 分析。Ml -对应于间隔子S1-重复序列单元的84nt的寡脱氧核糖核苷酸;M2 -对应于推 定的嗜热链球菌CRISPR3crRNA的42nt的合成寡核糖核苷酸(见图4) ;crRNA(wt)-分离 自 wt Cas9 复合物的 crRNA ;K1 -用 DNase I 对 crRNA(wt)处理 15min ;K2 -用 RNasel 处 理15min的crRNA(wt),D31A -纯化自Cas9D31A突变体复合物的crRNA ;N891A -纯化自 Cas9N891A突变体复合物的crRNA。
[0017] 图2显示了 Cas9-crRNA复合物对DNA的裂解情况,该复合物是通过Cas9与全长 CRISPR基因座共表达而获得。(A)携带内源SthCRISPR3/Cas系统的12间隔子-重复序列 阵列的重组pCas9 (-)质粒以及携带C末端具有Strep标签的cas9基因的pASKIBA-Cas9质 粒的CRISPR/Cas基因座示意图。(B)寡双链体裂解测定。在大肠杆菌中共表达pCas9(_) 和pASKIBA-Cas9两种质粒,纯化Cas9-crRNA复合物并对其进行裂解分析,使用的是在(+) 链5'端以33P标记的SP1 (第一原型间隔子)和SP2 (第二原型间隔子)寡双链体。在PAA 凝胶上对反应产物进行分析。
[0018] 图3显示了 SthCRISPR3/Cas系统提供的大肠杆菌细胞中对质粒转化的免疫。(A) 携带内源SthCRISPR3/Cas系统的12间隔子-重复序列阵列的重组pCRISPR3质粒以及携 带1个间隔子-重复序列单元的工程改造PCRISPR3-SP1质粒的CRISPR/Cas基因座示意图。 (B)大肠杆菌细胞中SthCRISPR3/Cas系统对质粒转化的干扰。用携带原型间隔子和PAM或 pUC18(l)的质粒pSPl对携带质粒pACYC184, pCRISPR3或pCRISPR3-SPl的大肠埃希氏菌 RR1受体菌株进行转化。转化效率以每纳克质粒DNA的cfu(平均值土SD)表示。
[0019] 图4显示了来自嗜热链球菌DGCC7710、LMD-9以及化脓链球菌(S. pyogenes)SF370 菌株的IIA型CRISPR/Cas系统的比较。(A) CRISPR/Cas系统的组织示意图。对应化脓链球 菌(2)的crRNA成熟所需要的tracrRNA的核苷酸序列存在于LMD-9和DGCC7710中。由虚 线相连的对应的蛋白质序列之间相同和类似的残基(以括号表示)的百分比。(B)保守重 复序列和tracrRNA的序列比对。来自DGCC7710和LMD-9的对应序列是相同的。在比对的 序列下用星号标记在三种菌株中都相同的核苷酸位置。图4(B)以出现顺序分开地公开了 SEQ ID N0 50、50-52和52-53。(C) crRNA序列的比较。化脓链球菌crRNA的序列和长度 是通过深度测序分析确定的(2)。通过northern印迹分析确定来自嗜热链球菌LMD-9 (2) 和DGCC7710(本研究)菌株的crRNA的近似长度。图4(C)以出现顺序分别公开了 SEQ ID NOS 54-56。
[0020] 图5显示Cas9_crRNA复合物在体外裂解原型间隔子内的双链DNA。(A)裂解测定 中使用的寡双链体底物。55nt的寡双链体SP1含有原型间隔子1 (红色字体)、PAM(蓝色字 体)并在两边都有一段与PSP1质粒中相同的10nt的邻侧序列。在SP1寡双链体DNA中, 与crRNA(红色字体)的5'末端片段互补的DNA链命名为(+)链,相反的DNA链命名为(-) 链。图5(A)以出现顺序分别公开了 SEQ ID N0S 31、7和34。(B)寡双链体SP1的裂解情 况。在37°C下将2. 5nM Cas9-crRNA复合物和InM SP1寡双链体((+)或㈠链的5'端以 33P 标记)加入反应缓冲液(10mM Tris-HCl,pH = 7. 5,10mM NaCl, 10mM MgCl2, 0? lmg/ml BSA)中孵育不同时间长度(30s-10min)并在20%的PAA凝胶中分析反应产物。Ml和M2 泳道含有化学合成的5'端以33P标记的37nt和18nt的寡脱氧核糖核苷酸,其分别对应于 (-)和(+)DNA链的裂解产物。裂解位置以箭头指示。图5(B)公开了 SEQ ID N0:31。(C)用 于质粒裂解测定的 pSPl 质粒(Sapranauskas 等人,2011. Nucleic Acids Res 39:9275-82) 示意图。图5(C)公开了 SEQ ID N0:57。(D)pSPl质粒裂解情况。对pSPl裂解产物进行琼 脂糖凝胶分析(左图)。SC -超螺旋质粒DNA,0C -在一条链上有切口的开环DNA,FLL -全长线性DNA,在两条链上有剪口。37°C下最终的反应混合物在反应缓冲液(B部分)中含 有2. 5nM pSPl质粒和2. 5nM Cas9-crRNA复合物。pSPl质粒裂解产物的(+)链(上部)和 (_)链(下部)的直接测序电泳图谱(右图)。序列末端的腺嘌呤的非模板加入是由聚合 酶引起的测序矫作物(此处显示的是反向互补序列中的T)。图5(D)以出现顺序分别公开 了 SEQ ID N057-59、58 和 60。
[0021] 图6显示了缺少crRNA的Cas9_Chis蛋白质的DNA结合和裂解分析。
[0022] Cas9_Chis蛋白质结合到(A)双链SP1寡双链体和⑶单链的s(+)SPl寡核苷 酸的电泳迁移率变动分析(EMSA)。电泳迁移率变动实验是在结合缓冲液中进行的(40mM Tris-乙酸,25°C下pH8.3,0.1EDTA,0.1mg/mlBSA,10%v/v甘油)。反应物含有0.5nM 的33P-标记的寡双链体,以及如每个泳道上标记的浓度的蛋白质。(C).寡核苷酸裂解测 定。将5nMCas9-Chis蛋白质与InM寡核苷酸在反应缓冲液中(10mMTris-HCl,pH=7. 5, 10mMNaCl,10mMMgCl2,0.lmg/mlBSA)于37°C下孵育。用33P标记SP1寡双链体(+)或 (_)链的5'端。用33P标记单链寡核苷酸的s(+)SPl的5'端。
[0023] 图7显示了对Cas9_crRNA复合物的重新编程。⑷用于Cas9_crRNA复合物重新 编程的两个质粒中异源基因座的示意图。通过插入新的间隔子序列(SN)(5'-CC ACC CAG CAA AAT TCG GIT ITC TGG CTG-3'(SEQ ID N0:16))并如(1)中描述的方法失活 Cas9 基 因,由pCas9 (-)质粒构建pCas (-) SPN (见图2A)。(B)质粒DNA裂解产物的琼脂糖凝胶分 析。将pSPl和pSPl+SPN(具有插入的新原型间隔子且Aatll位点上有PAM的pSPl质粒) 以2. 5nM的浓度与2nM的Cas9-crRNA复合物在反应缓冲液中(10mM Tris-HCl pH = 7. 5, 10mM NaCl,10mM MgCl2,0. lmg/ml BSA)于37°C下孵育不同的时间段,并在琼脂糖凝胶中分 析反应产物。SC-超螺旋质粒DNA,0C-在一条DNA链上有切口的开环DNA,FLL-全长线 性DNA,在两条链上都有剪口。(C)寡双链体SP1裂解情况。将2. 5nM的Cas9-crRNA复合 物和InM以33P标记(+)或㈠链的5'端的SPN寡双链体(表S2)在反应缓冲液中(10mM Tris-HCl pH =7.5,10mM NaCl,10mM MgC12,0. lmg/ml BSA)于 37°C下孵育。Ml-18nt 长的 标记物泳道。Ml和M2含有化学合成的5'端以33P标记的18nt和37nt的寡脱氧核糖核苷 酸,其分别对应于(_)和(+)DNA链的裂解产物。(D)SPN寡双链底物及裂解产物的示意图。 SPN寡双链含有新的原型间隔子(红色字体)、PAM(蓝色字体)。以箭头标记出裂解位置。 图 7(D)公开了 SEQ ID NO:39。
[0024] 图8显示了间隔子长度对CRISPR编码的免疫的影响。(A)经转化的质粒中插入的 精简形式的原型间隔子的示意图。图8(A)以出现顺序分别公开了 SEQ ID N0 7和61-66。 (B) 原型间隔子长度对质粒转化效率的效应。转化效率以每纳克质粒DNA的cfu(平均值 土SD)表示。(C).用于体外裂解和结合实验的寡双链体的示意图。图8(C)以出现顺序分 别公开了 SEQ ID N0 31和38。(D)27bp寡双链体(全长原型间隔子SP1,实心圈)和20bp 寡双链体(截短的原型间隔子SP1-20,方块)被Cas9-crRNA复合物裂解的时间过程。(E) Cas9-crRNA复合物结合SP1和SP1-20寡双链体的电泳迁移率变动分析。
[0025] 图9显示PAM是Cas9_crRNA复合物进行体外DNA结合和裂解所需要的。(A)对质粒 DNA裂解产物进行琼脂糖凝胶分析。将三种不同的质粒:PAM+原型间隔子+ (含有原型间隔 子和PAM二者的pSPl质粒),PAM-原型间隔子-(含有多个PAM但没有原型间隔子的pUC18 质粒)以及PAM-原型间隔子+ (含有原型间隔子但不含PAM的pSPl-p A (Sapranauskas等 人,2011. Nucleic Acids Res 39:9275-82))以 2. 5nM 的浓度与 2nM 的 Cas9-crRNA 复合物 在反应缓冲液(10mM Tris-HCl pH = 7. 5,10mM NaCl,10mM MgCl2,0. lmg/ml BSA)于37°C下 中孵育不同的时间段并在琼脂糖凝胶中分析反应产物。SC -超螺旋质粒DNA,0C-在一条 DNA链上有切口的开环DNA,FLL -全长线性DNA,在两条链上有剪口。⑶单链和双链寡脱 氧核苷酸的(+)链水解的时间过程。反应物含有2nM的Cas9-crRNA和InM的寡脱氧核糖核 苷酸,在反应缓冲液(A部分)于37°C下中进行反应。用SP1 (实心圈)和SPI-pA (空心方 块)寡双链体作为dsDNA。s (+) SP1 (空心三角)和s (+) SPI-p A (实心方块)用作SSDNA。 (C) 和⑶通过Cas9-crRNA复合物的dsDNA和ssDNA⑴链的结合。反应物含有0. 5nM的 33P标记的ssDNA或dsDNA寡核苷酸以及如各泳道上标明的浓度的蛋白质。室温15min后, 对样品进行2h的PAGE实验并如"材料和方法"中所述进行分析。
[0026] 图10显示了对Cas9_crRNA复合物进行的RNA结合及裂解分析。(A)分别针对 Cas9-crRNA复合物结合含有原型间隔子-1、PAM以及两侧均有一段24nt的邻侧序列的84nt RNA片段进行电泳迁移率变动分析(EMSA)。左图:RNA(-)链;中图:RNA(+)链;右图:双链 RNA。用于分析的RNA片段是通过体外转录(TranscriptAid? T7High Yield Transcription Kit,Fermentas)从RNA编码序列前端插入有17启动子的PCR片段生成的。编码(+)、(-)RNA 链的PCR片段获自pSPl质粒(1),分别使用了下列引物:5' taatacgactcactataGggtaccgag ctcgaattg 3' (SEQ ID N0:17)/5'GGGAAACAGCTATGACCATGATTACGAAITC-3' (SEQ ID N0:18) 及 5,gggtaccgagctcgaattgaaattcTAAACG3, (SEQ ID N0:19)/5,taatacgactcactataGggAAA CAGCTATGACCATGATTACG 3'(SEQ ID N0:20)(下划线表示I7RNA聚合酶启动子,黑体表示转 录起点)。反应物含有InM的33P标记的RNA片段以及如各泳道上标明的浓度的蛋白质。 室温15min后,对样品进行2h的PAGE实验并如"材料和方法"中所述进行分析。(B) RNA裂 解测定。在InM的(+)和(-)RNA链(左侧)或在(+)和(-)链上有标记的双链RNA的存 在下在反应缓冲液(10mM Tris-HCl pH = 7. 5, 10mM NaCl, 10mM MgC12,0. lmg/ml BSA)中 于37°C下对2. 5nM的Cas9-crRNA复合物进行孵育。在变性PAA凝胶中对反应产物进行分 析。
[0027] 图11显示了 Cas9的RuvC和HNH活性位点基序有助于对相反的DNA链的裂解。 (A)Cas9蛋白质内保守活性位点基序的定位。标明了鉴定为对Cas9体内活性至关重要的氨 基酸残基(Sapranauskas 等人,2011. Nucleic Acids Res 39:9275-82)。(B)Cas9 和突变蛋 白质对pSPl质粒裂解后进行琼脂糖凝胶分析。如"材料和方法"所述进行反应。(C)D31A 突变体的链偏好。如图2A和"方法和材料"中所述进行反应。D31突变体仅仅裂解SP1寡 双链体的⑴链。图11(C)以出现顺序分别公开了 SEQ ID NO 31和67。(D)N891A突变体 的链偏好。N891突变体仅仅裂解SP1寡双链的(-)链。裂解位点以箭头指示。图11(D)以 出现顺序分别公开了 SEQ ID NO 31和68。
[0028] 图12显示了 Cas9活性位点突变体-crRNA复合物的特性。(A)用Cas9突变体 D31A(RuvC样活性位点基序)获得的反应产物的直接测序情况。图12(A)以出现顺序分别 公开了 SEQ ID N0 58、59、58和58。(B)用Cas9突变体N891A(HNH样活性位点基序)获得 的反应产物的直接测序情况。图12(B)以出现顺序分别公开了 SEQ ID N0 58、58、58和60。 (C)wt Cas9-crRNA及活性位点突变体复合物对SP1寡双链体结合的情况。(D)Cas9-crRNA 突变体复合物对(+)SP1链的裂解情况。
[0029] 图13显示了 wt Cas9_Chis蛋白质的分子质量。在室温下进行凝胶过滤实验,使 用Superdex 20010/300GL柱子(GE healthcare),其预先用含有500mM氯化钠的10mM磷酸 钠缓冲液(pH 7.4)平衡。通过在用一套已知Mw(黑色圆圈)的蛋白质(Bio-Rad凝胶过滤 标准品)获得的标准曲线中获得内插值得到Cas9(黑色三角)的表观Mw值。
[0030] 图14显示了 Cas9-crRNA复合物进行的crRNA导向的DNA裂解的图示流程及机 制。图上部示意性显示了 Cas9的结构域组织形式。Cas9-crRNA复合物结合至含有PAM的 dsDNA。crRNA结合至互补的(+)链,导致DNA链的分开并形成R-环。在这个三元复合物 中,Cas9的RuvC活性位点位于未配对的(-)链的易断的磷酸基团上,而HNH活性位点位于 结合至crRNA的DNA⑴链上易断的磷酸基团上。两个活性位点的协同作用导致在距离PAM 4nt距离处发生双链断裂,生成平末端DNA。图14以出现顺序分别公开了 SEQ ID N0:31和 69 〇
[0031] 图15显示了 Cas9-crRNA及裂解产物的非变性电泳情况。在0. 5nM的SP1寡双链 体存在时,将各泳道上标明的浓度的蛋白质在反应缓冲液(10mM Tris-HCl pH = 7. 5,10mM NaCl,10mM MgCl2,0. lmg/ml BSA)中于37°C下孵育30min。将样品与上样染料溶液(0. 01% 溴酚蓝和75mM EDTA,溶于50% v/v的甘油)混合并通过非变性PAGE进行分析。凝胶泳道 记作M--代表裂解反应产物的融解形式。凝胶各边的卡通图阐明蛋白质-DNA复合物及对 应每条带的DNA,而凝胶下面的卡通图阐明了反应后主要的底物形式。
[0032] 图16显示了 Cas9-crRNA复合物对质粒DNA的裂解情况。(A)pSPl和pUC18质粒 DNA的裂解。将Cas9-crRNA复合物与pSPl和pUC18质粒在实施例1中提供的反应缓冲液 中孵育。pSPl质粒含有原型间隔子1序列,邻侧是5' -GGNG-3' PAM序列。原型间隔子1序 列不存在于PUC18中。在琼脂糖凝胶中对反应产物进行分析。在这些条件下,pSPl被转化 为线性形式,而缺少原型间隔子1序列的PUC18质粒对裂解产生抗性。(B)在缺少一种组分 的情况下pSPl的裂解反应。在缺乏一种组分(分别是缺少Cas9、crRNA或tracrRNA)的反 应混合物中,pSPl质粒没有被裂解。SC -超螺旋质粒DNA,0C -在一条链上有切口的开环 DNA,FLL-全长线性DNA。
[0033] 图17显示了 Cas9-crRNA复合物对DNA寡双链体的裂解。寡双链体中与crRNA互 补的链被记做(+)链,另一条链记做(_)链。为监测裂解反应,将P33标记在寡双链的(+) 或㈠链的5'末端。Ml和M2为对应于㈠链的37nt以及⑴链的18nt的合成寡核苷酸 标记物,用于确定裂解产物大小并为裂解位置定位。Cas9蛋白质在原型间隔子内第37个核 苷酸之后,PAM上游4nt(5'-GGNG-3')处裂解寡双链体的全部两条链,留下平末端。将非特 异性底物(K1和K2)与Cas9-crRNA复合物孵育30min后,两条链都没有被裂解。图17公 开了 SEQ ID N0:31。
[0034] 图18显示了无RNaselll的情况下组装的Cas9_crRNA复合物对质粒DNA的裂解 情况。将Cas9-crRNA复合物与pSPl质粒孵育并在琼脂糖凝胶中分析反应产物。pSPl质粒 在无crRNA组装的复合物存在下对裂解有抗性(左图)。在使用了合成的42ntcrRNA(无 RNaselll)组装的复合物存在下,pSPl质粒被转化为线性形式(中图)。在使用CRISPRRNA 转录物(无RNaselll)组装的复合物存在下,pSPl质粒被转化为线性和环状DNA形式的混 合物(右图)。
[0035] 图19显示了 Cas9-crRNA复合物对DNA寡双链体的裂解情况。寡双链体中与crRNA 互补的链被记做(+)链,另一条链记做(_)链。为监测裂解反应,将P33标记在寡双链的 (+)或㈠链的5'末端。Ml和M2为对应于㈠链的37nt以及⑴链的18nt的合成寡核 苷酸标记物,用于确定裂解产物大小并为裂解位置定位。Cas9蛋白质在原型间隔子内裂解 寡双链的全部两条链,位于从5'端起第37个核苷酸之后,PAM上游4nt (5' -GGNG-3')处, 留下平末端。将非特异性底物(K1和K2)与Cas9-crRNA复合物孵育30min后,两条链都没 有被裂解。图19公开了 SEQ ID N0:31。
[0036] 图20显示了(A)嗜热链球菌DGCC7710的CRISPR3/Cas系统的示意图。四种cas 基因(cas9、casl、cas2、csn2)位于CRISPR重复序列-间隔子阵列上游,由13个重复序 列(R)及12个独特的间隔子(S1-S12)构成。II型CRISPR/Cas系统中crRNA成熟所需的 tracrRNA(Deltcheva等人,2011. Nature 471,602-7)位于cas9基因上游且编码在相对此 系统其他元件相反的DNA链(以箭头表示)上。(B)用于新的间隔子插入CRISPR区域和 CRISPR RNA合成的通路。编码所需间隔子序列并含有SapI和Ec〇31I限制性兼容末端的合 成寡双链体被插入到两个重复片段之间。使用PCR技术对CRISPR区域进行扩增。通过体 外转录获得编码CRISPR RNA的新间隔子。(C)Cas9-RNA复合物的体外组装。CRISPR RNA 和tracrRNA转录物被组装成为双链体。首先将Cas9蛋白质与RNA双链进行预孵育,随后 与RNasell孵育,生成具有催化能力的Cas9_RNA复合物。
[0037] 图21显示了 A.pUC18质粒的示意图。SapI和Astll限制性位点之间距离为775bp, 而两个间隔子之间的距离为612bp。B.经过重新编程的Cas9-crRNA复合物对pUC18质粒 的裂解情况。〃l〃_pUC18质粒;〃2〃 -以Aatll裂解的pUC18 ;〃3〃 -以含有crRNA匹配原型 间隔子1的复合物裂解的PUC18 ;〃4〃 -以SapI裂解的pUC18 ;〃5〃-以含有crRNA匹配原型 间隔子2的复合物裂解的pUC18 ;〃6〃 -以Aatll和SapI裂解的pUC18 ;〃7〃 -以第3、第5 条中所用复合物的混合物裂解的PUC18。
[0038] 图22显示了以体外组装的Cas9_RNA复合物对基因组DNA的裂解情况。(A)对线 性入DNA裂解产物进行琼脂糖凝胶分析。将噬菌体A DNA与Cas9-RNA复合物在反应缓冲 液中孵育不同的时间段。Cas9-RNA复合物的靶向位点位于距离cos位点的8kb处。(B). 为DNA杂交试验进行探针选择。用PstI酶处理将基因组DNA片段化。原型间隔子位于两 个PstI位点之间。如果用Cas9-RNA复合物裂解基因组DNA,应当检测到466bp的片段。 否则,探针则会与1499bp长的片段杂交。(C)对基因组DNA片段进行Southern印迹分析。 C线-用PstI片段化的大肠杆菌基因组DNA。在片段化前,将Cas9-RNA-基因组DNA与 Cas9-RNA复合物孵育。(D). Cas9-crRNA复合物对人基因组DNA的裂解情况。完整DNA和 DNA片段的相对量通过qPCR进行估计。
[0039] 图23示意性地阐明了包含在报告子质粒(pMTC-DSR+eGFP)中的靶向序列。eGFP 编码序列被一个来自GAPDH基因的内含子隔开。指出了 5'和3'RFP编码序列。homol表 示RFP基因中发生同源重组所需要的同源序列。A、B、C和D指出了 Cas9-介导的裂解中四 个不同的靶标位点。靶标A和B位于内含子中。靶标C和D位于eGFP的编码区域中。Cre 表示Cre内切酶的靶标位点,位于内含子序列中。
[0040] 图24显示引入Cas9/RNA复合物后eGFP阳性细胞减少情况。用报告子质粒和含 有靶向eGFP序列A (内含子)、eGFP序列C (编码)或非特异性序列K的crRNA的Cas9/RNA 复合物转染CH0-K1细胞。通过流式细胞术确定eGFP阳性细胞百分比。作为阴性对照,用 未转染(NC)或仅以报告子质粒转染(DNA)或以报告子质粒与单独Cas9蛋白质共转染以及 报告子质粒与Cas9非特异性crRNA复合物共转染(DNA+K)的细胞。
[0041] 图25显示了细胞的照片,其中RFP的出现表示存在同源重组(HR)引起的对Cas9/ RNA-介导的双链断裂的修复。在与报告子质粒和靶向eGFP序列C的Cas9/RNA复合物共转 染48小时后,通过荧光显微镜观察CH〇-kl细胞中的eGFP and RFP表达情况。
[0042] 图26示意性地阐明了包含在报告子质粒(pMTC-DSR+eGFP)中的靶向序列。eGFP 编码序列被来自基因组DNA的GAPDH内含子隔开。指出了 RFP N-和C-编码序列。RFP基 因中的同源序列为发生同源重组所必须。位于eGFP内含子内部的靶标E以黑体表示。
[0043] 图27为凝胶分析结果,显示使用了合成crRNA和tracRNA的Cas9/RNA复合物的 功能类似于使用合成crRNA及体外转录tracrRNA的Cas9/RNA复合物。在进行琼脂糖凝胶 电泳后,可以观察到质粒的情况。C泳道:未剪切的质粒。1-3泳道:以Cas9+crRNA剪切 的质粒,其中1:体外转录tracrRNA对照;2:未修饰合成tracrRNA (89nt);或3:未修饰合 成 tracrRNA (74nt)。
[0044] 图28A-E示意性地显示了报告子质粒(pMTC-DSR+eGFP)内含有的靶向序列及可能 的加工/基因重排结果。
[0045] 图29在引入Cas9/RNA复合物后eGFP阳性细胞减少情况。用报告子质粒和含有 靶向eGFP序列A(内含子)、eGFP序列C(编码)或非特异性序列K的crRNA的Cas9/RNA 复合物转染CH0-K1细胞。通过流式细胞术确定eGFP阳性细胞百分比。作为阴性对照,未 转染(NC)或仅以报告子质粒转染(DNA)或以报告子质粒与单独Cas9蛋白质共转染以及报 告子质粒与Cas9非特异性crRNA复合物共转染(DNA+K)的细胞。
[0046] 图30示意性地显示了包含在报告子质粒(pMTC-DSR+eGFP)中的靶向序列。eGFP 编码序列以黑色表示,由拷贝自基因组DNA的GAPDH内含子隔开。RFP N-和C-编码序列以 灰色表示。RFP基因中的同原序列是发生同源重组所必须的。位于eGFP内含子内的靶标E 以黑体表示。
[0047] 以下非限制性实例进一步描述了方法、组合物、用途和实施方式。
[0048] 阐述性实施方式详述
[0049] 实施例1
[0050] 在本实施例中,我们已经分离了嗜热链球菌CRISPR3/Cas系统的Cas9_crRNA复合 物并表明其以PAM依赖的方式剪切具有与crRNA互补的核苷酸序列的合成寡脱氧核糖核苷 酸和质粒DNA。进一步地,我们提供了实验证据,证明PAM是在双链DNA的情况下得到识别 的,并且对于体外DNA结合和裂解至关重要。最终,我们表明Cas9的RuvC和HNH基序有助 于对相反的DNA链进行裂解。综上所述,我们的数据表明Cas9-crRNA复合物起到RNA导向 的核酸内切酶的作用,其使用RNA模块进行靶标位点的识别并采用蛋白质模块中的两个分 开的活性位点进行DNA裂解。这些发现为把可编程的Ca S9-crRNA复合物工程改造为通用 的RNA导向的核酸内切酶奠定了基础。
[0051] 材料和方法
[0052] DNA操作。使用嗜热链球菌DGCC7710的基因组DNA作为PCR反应的模板以克隆 cas9。为生成pASKIBA3_Cas9质粒用于表达C末端有Strep标签的Cas9蛋白质变体,以下 和5'-4061'(^01^60^0:1'(^(:07^1'11^-3'(5£〇10勵:22),并将片段经£8口31位点克隆至 PASK-IBA3表达载体。为生成pBAD-Cas9质粒用于表达C末端有6xHi s标签的Cas9蛋白质 变体(如SEQ ID N0:23公开的〃6xHis〃),以下列引物对扩增PCR片段:5' -ACGTCTCACATGA IDN0:25),并将片段经Ncol和Xhol位点克隆入pBAD24-Chis表达载体。对pASKIBA3-Cas9和pBAD_Cas9质粒中cas9基因进行全长测序的结果表明其与起始的cas9序列之间无差 异。为获得具有单个间隔子1的质粒pCas9 (-)SP1(图1B)和pCRISPR3-SPl(图2A),以下 列引物对自PCRISPR3质粒扩增PCR片段:5'GACCACTTAITGAGGTAAATGAG3'(SEQIDN0:26) /5'CAAACCAGGATCCAAGCTAATACAGCAG-3'(SEQIDN0:27) ((BamHI(GGATCC)位点以下划线表 不)并将其分别克隆至pCas9(_)和pCRISPR3质粒中(Sapranauskas等人,2011.Nucleic AcidsRes39:9275-82)。
[0053] Cas9蛋白质及Cas9-crRNA复合物的表达和纯化。使用了用于嗜热链球菌 CRISPR4/Cas 系统中 Cas3 蛋白质所描述的流程(Sinkunas 等人,2011. EMBO J 30:1335-42) 对具有(His) 6标签的Cas9蛋白质形式(如SEQ ID N0:23中公开的〃 (His) 6〃)进行表达 和纯化。为纯化Cas9-crRNA复合物,在具有pCas9 (-) SP1质粒的大肠杆菌RR1菌株中表达 Cas9蛋白质的Str印标签形式(图IB)。LB培养液中补充有Ap(100iig/ml)和Cm(10iig/ ml)。用于Cas9-crRNA复合物分离的大肠杆菌细胞以两个步骤进行培养。首先,将4ml的 细胞培养物在37°C下培养至0D600值?0. 5,然后通过添加0. g/ml的无水四环素(AHT) (Sigma)诱导表达。4h后,将预先经诱导的培养物的1/400接种至补充有Ap (100 yg/ml), Cm(12iig/ml)和AHT(0. 2iig/ml)的新鲜LB培养基中并在37°C下培养过夜。通过超声破 坏所收获的细胞,通过离心移除细胞碎片。将上清液加样至lml的Str印Trap HP柱子(GE Healthcare)并以2. 5mM脱硫生物素进行洗脱。以1L大肠杆菌培养物运行一次可获得大约 1.5iig Cas9蛋白质。含有Cas9的部分在+4°C下储存数日。通过SDS-PAGE估测蛋白质制 备物的均质性。通过对含有Strep-Tactin纯化的Cas9蛋白质以及已知量的加His标签的 Cas9蛋白质的样品的SDS-PAGE凝胶进行灰度分析确定Cas9-crRNA复合物中的蛋白质浓 度。假定Cas9是单体形式并以1:1的摩尔比结合于在复合物中的crRNA,以Cas9蛋白质的 浓度来表示Cas9-crRNA复合物的浓度。
[0054] Northern印迹分析。将Cas9_结合的RNA从Strep-Tactin纯化的Cas9 (其与 pCas9(-)SPl 质粒共表达)上分离,使用的是 miRNeasy Mini kit (Qiagen)。进行 Northern 印迹,使RNA在10%聚丙烯酰胺凝胶(含有溶于20mM MOPS/NaOH pH 8缓冲液的7M尿素)中 进行。将 RNA通过半干杂交使用 Trans-blot SD(Bio-Rad)转移至 SensiBlot? Plus Nylon Membrane (Fermentas)上。在60 °C下,使用0? 16M的1_乙基_3_ (3_二甲氛基丙基)-碳 二亚胺(EDC)(Pierce)/0. 13M 1-甲基咪唑(Sigma)pH 8将RNA与膜交联lh。将膜与含 有1% SDS和0. lmg/ml变性鱼精DNA(Ambion)的2XSSC缓冲液在40°C下预杂交lh。用 32P-5'_标记的42nt抗-crRNA DNA寡核苷酸(含有20nt的间隔子1和22nt的重复序列) (5, -TCGAAACAACACAGCTCTAAAACTGTCCTCTTCCTCTTTAGC-3'(SEQ ID N0:28)对印迹进行 12h 的探针检测。用含有〇. 2% SDS的0. 2XSSC缓冲液洗涤印迹3X15min,使用感光成像进行 观察。42nt 的合成寡核糖核苷酸(5'-CGCUAAAGAGGAAGAGGACAGUUUUAGAGCUGUGUUGUUUCG-3, (SEQ ID NO: 7))和 84nt 的 DNA 寡核苷酸。
[0055] 寡核苷酸底物。本研究中所使用的所有寡核苷酸底物都在表1中给出。寡脱 氧核苷酸购自 Metabion(Martinsried, Germany)。使用 PNK (Fermentas)和[y-33P] ATP (Hartmann Analytic)对寡核苷酸的5' -端进行放射性标记。通过将两条寡核苷酸与互 补序列退火产生双链体(SP1,SP1-AP,SP2)。在与未标记链退火前,向单个DNA链的5'端 引入放射性标签。
[0056] 与寡核苷酸底物的反应。反应通常这样进行,在37°C下将2nM的Cas9_crRNA复 合物添加至溶于10mM Tris-HCl的InM标记的寡核苷酸(37°C下pH 7. 5),10mM的NaCl, 0. lmg/ml的BSA和10mM的MgCl2*。在确定的时间间隔移出等分试样并用加样染料(95% 乂八甲酰胺,0.01%溴酚蓝,2511^的£0144119.0)淬灭,随后在20%聚丙烯酰胺凝胶中进 行变性凝胶电泳,然后进行FLA-5100感光成像仪(Fujilm)检测。
[0057] 与质粒底物的反应。在37°C下在用于寡核苷酸底物反应的缓冲液中,进行pUC18 质粒及其衍生物的反应(Sapranauskas 等人,2011. Nucleic Acids Res 39:9275-82)。反 应混合物通常含有2. 5nM超螺旋质粒及2nM的Cas9-crRNA复合物。通过将蛋白质加入其 他组分的混合物而起始反应。在确定的时间间隔移出等分试样并用苯酚/氯仿进行淬灭。 将水相与加样染料溶液(〇.〇1%溴酚蓝和75禮£014,溶于50%¥八甘油)混合,通过琼脂 糖凝胶电泳进行分析。
[0058] 质粒裂解位置确定。为对质粒底物进行完全裂解,将8nM的Cas9_crRNA复合物与 2. 5nM超螺旋质粒在反应缓冲液中于37°C孵育10min。使用GeneJET PCR Purification Kit (Fermentas)对反应产物进行纯化和浓缩。使用以下引物对由Cas9线性化及缺口化的 质粒的间隔子1周围区域进行直接测序:5'-〇〇8〇&1:〇388〇8〇〇31:1:〇8〇〇-3'(5£( >)10勵:29) (对(+)链测序)和 5'-gcgaggaagcggaagagcgccc_3'(SEQ ID NO:3〇)(对(_)链测序)。
[0059] 结合测定。将量不断增加的蛋白质-crRNA复合物与0. 5nM的33P-标记的双链和 单链DNA底物(表1)在结合缓冲液(40mM Tris-乙酸,25°C下pH 8. 3,0. 1的EDTA,0. lmg/ ml的BSA,10% v/v甘油)中于室温下孵育15min。游离DNA和蛋白质-DNA复合物在8% 的非变性聚丙酰胺凝胶(丙烯酰胺//N,N'_甲叉双丙烯酰胺比例为29:1)中分离,使用的 电泳缓冲液为补充有〇. ImM EDTA的40mM Tris-乙酸(pH 8. 3)。在室温下以6V/cm进行 3h的电泳。
[0060] 诱变。通过先前描述的方法进行定点诱变获得突变体D31A和N891A(Tamulaitis 等人,2007. Nucleic Acids Res 35:4792-9)。对每个突变体的整个基因进行测序的结果确 定仅仅引入了所设计的突变。
[0061]
【权利要求】
1. 用于对靶标DNA分子进行位点特异性修饰的方法,所述方法包括在合适的条件下将 靶标DNA分子和RNA导向的DNA核酸内切酶相接触,所述RNA导向的DNA核酸内切酶含有 至少一个RNA序列以及RuvC活性位点基序和HNH活性位点基序中的至少一个; 以使得靶标DNA分子在某个区域受到修饰,所述区域是由RNA序列与靶标DNA分子的 互补结合所确定的。
2. 权利要求1的方法,其中位点特异性修饰在体内或在体外发生。
3. 权利要求1的方法,其中靶标DNA是双链或单链的。
4. 蛋白质-RNA复合物,其包含 a) 与SEQ ID NO: 1具有至少80%同一性的多肽, b) 第一多核糖核苷酸crRNA,其包含3'区域和5'区域,其中3'区域包含CRISPR基因 座中存在的至少22个核苷酸的重复序列,而5'区域包含CRISPR基因座中重复序列下游紧 跟的至少20个核苷酸的间隔子序列,以及 c) 第二多核糖核苷酸tracrRNA,其包含5'和3'区域,其中5'区域的至少一部分与 crRNA的3'区域互补。
5. 权利要求4的复合物,其中tracrRNA的5'区域为至少22个核苷酸,并与crRNA的 22个核苷酸的3'区域互补。
6. 权利要求4的复合物,其分离自嗜热链球菌。
7. 权利要求4的复合物,其分离自遗传修饰的微生物。
8. 权利要求4的复合物,其中多肽分离自遗传修饰的大肠埃希式杆菌。
9. 权利要求4的复合物,其中多肽是由选自重组DNA技术或化学合成的方法产生的。
10. 权利要求4的复合物,其中多肽或其片段是以融合多肽的形式表达的,其包含至少 一种其他的氨基酸序列。
11. 权利要求10的复合物,其中所述其他的序列用于通过亲和色谱纯化融合多肽。
12. 权利要求4的复合物,其中多肽在RuvC活性位点基序含有一个点突变。
13. 权利要求12的复合物,其中点突变是D31A。
14. 权利要求4的复合物,其中多肽在HNH活性位点基序内含有点突变。
15. 权利要求14的复合物,其中点突变是N891A。
16. 权利要求4的复合物,其中第一多核糖核苷酸(crRNA)序列包含5' -NNNNNNNNNNNN NNNNNNNNGUUUUAGAGCUGUGUUGUUUCG-3' (SEQ ID N0:15)〇
17. 用于在遗传修饰的微生物中获得权利要求4的复合物的方法,所述复合物含有体 内组装权利要求4的多肽和多核糖核苷酸复合物所需的第一多核糖核苷酸(crRNA)和第二 多核糖核苷酸(tracrRNA),所述方法包括 向微生物中引入至少一种编码权利要求4的多肽、权利要求4的第一多核糖核苷酸以 及权利要求4的第二多核糖核苷酸的质粒,以产生遗传修饰的微生物, 其中第二多核糖核苷酸包含与嗜热链球菌DGCC7710CRISPR3系统的重复序列区域及 下游区域显示至少80%互补的序列,且第一多核糖核苷酸(crRNA)由间隔子及邻侧的重复 序列组成, 其中权利要求4的多肽以及第一和第二多核糖核苷酸在遗传修饰微生物中至少一种 质粒中编码,其中所述质粒含有所述遗传修饰微生物的宿主启动子或来自原生宿主基因组 的启动子。
18. 权利要求17的方法,其进一步包含从所述遗传修饰微生物中分离复合物。
19. 权利要求17的方法,其中权利要求4的多肽和多核糖核苷酸是在遗传修饰微生物 的两种分开的质粒中编码的。
20. 权利要求17的方法,其中权利要求4的多肽和多核糖核苷酸是在遗传修饰微生物 的三种分开的质粒中编码的。
21. 权利要求17的方法,其进一步包括从遗传修饰微生物中分离所述多肽、第一多核 糖核苷酸crRNA以及第二多核糖核苷酸tracrRNA,并将所述多肽、crRNA和tracrRNA在适 合复合物组装的条件下进行孵育。
22. 权利要求21的方法,其中第一多核糖核苷酸crRNA序列包含5' -NNNNNNNNNNNNNNN NNNNNGUUUUAGAGCUGUGUUGUUUCG-3' (SEQ ID NO:15).
23. 用于裂解多核苷酸序列的方法,所述方法包括: 将权利要求4的复合物与靶标DNA在适合于DNA裂解的条件下孵育, 其中靶标DNA含有 原型间隔子序列,其与复合物中第一多核糖核苷酸的间隔子序列至少80%互补,以及 位于原型间隔子序列下游的原型间隔子邻近基序(PAM)序列NGGNG, 其中多肽在位于PAM序列上游4个核苷酸处的裂解位点裂解两条靶标DNA链,形成平 末端。
24. 权利要求23的方法,其中原型间隔子序列与间隔子序列100%互补。
25. 权利要求23的方法,其中裂解发生在体外或体内。
26. 用于裂解核苷酸序列的方法,所述方法包括 将权利要求4的复合物与单链靶标DNA在适合DNA裂解的条件下孵育,其中靶标DNA 含有与第一多核糖核苷酸中间隔子序列至少80%互补的原型间隔子序列,其中多肽在裂解 位点裂解单一的DNA链。
27. 权利要求26的方法,其中原型间隔子序列与多核糖核苷酸中的间隔子序列100% 互补。
28. 权利要求26的方法,其中裂解发生于体外或体内。
29. 用于对多核苷酸序列进行位点特异性切口的方法,所述方法包括 将复合物与双链靶标DNA在适合进行DNA切口的条件下进行孵育,其中复合物包含 (a) 第一多核糖核苷酸crRNA,其包含3'区域和5'区域,其中3'区域包含CRISPR基 因座中存在的至少22个核苷酸的重复序列,而5'区域包含CRISPR基因座中重复序列下游 紧跟的至少20个核苷酸的间隔子序列, (b) 第二多核糖核苷酸tracrRNA,其包含5'和3'区域,其中5'区域中至少一部分与 第一多核糖核苷酸的3'区域互补,以及 (c) 多肽RuvC,其在活性位点基序中含有点突变, 其中靶标DNA含有与第一多核糖核苷酸中的间隔子序列至少80%互补的原型间隔子 序列和位于原型间隔子序列下游的原型间隔子邻近基序(PAM)序列NGGNG,其中多肽在位 于PAM序列上游4个核苷酸处的裂解位点处裂解双链DNA的一条DNA链,产生位点特异性 切口。
30. 权利要求29的方法,其中原型间隔子序列与多核糖核苷酸中间隔子序列100%互 补。
31. 权利要求29的方法,其中位点特异性切口在体外或体内发生。
32. 用于对核苷酸序列进行位点特异性切口的方法,所述方法包括复合物与双链靶标 DNA在适合进行DNA切口的条件下进行孵育,其中复合物包含 (a)第一多核糖核苷酸crRNA,其包含3'区域和5'区域,其中3'区域包含CRISPR基 因座中存在的至少22个核苷酸的重复序列,而5'区域包含CRISPR基因座中重复序列下游 紧跟的至少20个核苷酸的间隔子序列,(b)第二多核糖核苷酸tracrRNA,其包含5'和3' 区域,其中5'区域的至少一部分与第一多核糖核苷酸的3'区域互补(c)多肽HNH,其在活 性位点基序中含有点突变, 其中靶标DNA含有与第一多核糖核苷酸中的间隔子序列有至少80%互补的原型间隔 子序列和位于原型间隔子序列下游的原型间隔子邻近基序(PAM)序列NGGNG,其中多肽在 位于PAM序列上游4个核苷酸处的裂解位点处裂解双链DNA的一条DNA链。
33. 权利要求32的方法,其中原型间隔子序列与多核糖核苷酸中的间隔子序列100% 互补。
34. 权利要求32的方法,其中位点特异性切口在体外或体内发生。
35. 生成权利要求4的复合物的体外方法,该方法包括 将复合物的组分在适合复合物组装的条件下孵育,其中复合物包含第一多核糖核苷酸 和任何所需的间隔子序列,所述第一多核糖核苷酸具有包含5' -NNNNNNNNNNNNNNNNNNNNGUU UUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO:15)的序列。
36. 权利要求35的方法,其中第一多核糖核苷酸是通过体外转录或化学合成获得的, 其中体外转录是从含有单一重复序列-间隔子-重复序列单元的DNA片段进行,其中间隔 子具有任何所需的序列。
37. 权利要求35的方法,其中组分包含Cas9多肽(SEQ ID NO: I)、tracrRNA多核糖核 苷酸(SEQ ID N0:5)以及 crRNA 多核糖核苷酸(5'-NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUGU GUUGUUUCG-3')(SEQIDN0 :15),并具有任何所需的间隔子序列。
38. 权利要求35的方法,其进一步包括向复合物中加入RNaseIII多肽。
39. 来自嗜热链球菌DGCC7710菌株CRISPR3/Cas系统的分离的Cas9-crRNA复合物。
40. 嗜热链球菌DGCC7710菌株CRISPR3系统的分离的Cas9蛋白质,以及显示有80% 同一性并含有D31A和N891A突变的序列,这些突变体显示了 DNA切口活性。
41. 嗜热链球菌DGCC7710菌株CRISPR3系统的分离的crRNA,其具有5'标签但缺少3' 标签。
42. 使用含有单一重复序列-间隔子-重复序列单元的序列盒子对Cas9-crRNA特异性 重新编程的方法,所述方法包括 (a) 通过体外转录从DNA序列中产生具有30个核苷酸长度的序列盒子, (b) 将所述序列盒子插入crRNA的重复序列-间隔子-重复序列,以及 (c) 使用步骤(b)的crRNA组装Cas9_crRNA复合物。
43. 用于体内对靶标DNA分子进行选择性位点特异性修饰的方法,该方法包括 生成第一多核糖核苷酸crRNA,其含有对靶标DNA中所需修饰位点显示互补的间隔子 序列, 将第一多核糖核苷酸crRNA与具有与SEQ ID NO: 1至少80%同一性的多肽及第二多核 糖核苷酸tracrRNA在形成复合物的适合条件下进行复合,以及 将复合物引入至少一个细胞中以产生靶标DNA分子的选择性位点特异性修饰,发生修 饰的区域是通过第一多核糖核苷酸crRNA与靶标DNA分子的互补间隔子序列确定的。
44. 权利要求43的方法,其中第一多核糖核苷酸crRNA是通过体外翻译生成的或化学 合成的。
45. 权利要求43的方法,其中的修饰是靶标DNA分子的双链裂解,以至少产生靶标DNA 分子的第一和第二部分。
46. 权利要求45的方法,其进一步包括通过同源重组或非同源末端连接之一的方法将 靶标DNA分子的第一和第二部分的重新连接。
47. 权利要求43的方法,其中靶标DNA含有与复合物中第一多核糖核苷酸crRNA中的 间隔子序列至少80%互补的原型间隔子序列和在原型间隔子序列下游的原型间隔子邻近 基序(PAM)序列NGGNG,其中多肽在位于PAM序列上游4个核苷酸处的裂解位点裂解两条靶 标DNA链,形成平末端。
48. 权利要求43的方法,其中多肽为Cas9(SEQ ID N0:1)。
49. 权利要求43的方法,其进一步包含向复合物中加入RNaseIII多肽。
【文档编号】C12N15/10GK104520429SQ201380023255
【公开日】2015年4月15日 申请日期:2013年3月20日 优先权日:2012年3月20日
【发明者】V·希克斯尼斯, G·加休那斯, T·卡维利斯, A·鲁比斯, L·扎里奥斯奇尼, M·格勒姆扎特, A·史密斯 申请人:维尔纽斯大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1