使用CRISPR/Cpf1系统的基因组编辑组合物及其用途的制作方法

文档序号:22688067发布日期:2020-10-28 12:57阅读:616来源:国知局
使用CRISPR/Cpf1系统的基因组编辑组合物及其用途的制作方法

本发明涉及用于使用crispr/cpf1系统进行基因组编辑的组合物及其用途,并且更具体地,涉及用于基因组编辑的组合物,其包含:包含与靶核苷酸序列互补的指导序列和连接至所述指导序列的3’末端的尿苷(u)重复序列的crisprrna(crrna),或编码所述crrna的dna;以及cpf1蛋白或编码所述cpf1蛋白的dna,使用所述组合物的基因组编辑方法、遗传修饰生物的构建方法以及遗传修饰生物。



背景技术:

基因组编辑是指通过自由地校正生物的遗传信息来表现出期望遗传性状的方法,并且通过开发crispr相关蛋白(crispr/cas)系统已经在用于从研究基因功能到治疗疾病的多个领域中的同时取得了显著的发展。

成簇的规则间隔的短回文重复序列(crispr)是存在于细菌和古细菌的基因组中的含有多个短的直接重复序列的基因座,其基因序列已被揭示,并且作为获得性原核免疫系统发挥作用以赋予对外源遗传元件(例如病毒和噬菌体)的抗性。被称为前间隔序列的外源dna的短基序在crispr重复序列之间被整合到基因组中,并用于记住过去对外部因素的暴露。这样整合的基序的间隔序列用作产生指导rna的模板,并用于切割外部侵入的遗传物质。

基于crispr的基因编辑技术的核心在于在生物中使用rna作为介质识别特定碱基序列,通过效应蛋白(例如cas9)在相应基因位点诱导双链断裂(dsb),并且然后修复dsb的过程。在真核细胞中恢复由crispr/cas系统产生的dsb的过程中,存在非同源末端连接(nhej),其中在截短的碱基序列中发生随机插入和缺失(indel),以及同源性指导的修复(hdr),其使用具有与被切割dna的附近区域相同的碱基序列的dna链为模板来修复切割位点。每种基因修复方法都能够进行敲除,其诱导由基因碱基序列的插失引起的特定基因的移码,以及敲入,其诱导期望基因中特定碱基序列的预期插入或替换。因此,需要提高dsb频率和准确性以提高精确位置的敲除或敲入效率,并且为此目的,一直进行着旨在寻找现有crispr/cas系统或新crispr/cas系统的修改方法的研究。

最近,像cas9一样,在多种类型的细菌中也发现了cpf1(来自普雷沃菌(prevotella)和弗朗西丝菌1(francisella1)的v型cas系统,称为crispr)。cpf1属于2类,其与cas9一样,具有一个蛋白质作为效应蛋白,并且在crrna(crisprrna)的指导下,该效应蛋白通过识别特定的前间隔序列相邻基序(pam)序列在dna中引起dsb。

但是,区别在于cas9需要crrna和反式激活crrna(tracrrna)用于特异性碱基序列识别和切割,而cpf1仅需要crrna。此外,在其中效应蛋白和crrna复合物识别特定dna碱基序列的pam序列中,不同之处在于cas9需要富含g的序列,而cpf1识别富含t的序列。即使是在这种情况下产生的dsb的形式,cas9在靠近pam的位点切割成平末端,而cpf1在距离pam18-23个核苷酸(nt)处切割成交错末端。另外,cpf1的基因尺寸小于cas9,因此预期对于临床目的更加有用。

cpf1的上述特征可在基因治疗中发挥优势。尤其是,与cas9相比,需要尺寸相对小的蛋白质和crrna的cpf1特征可具有极大的优势,因为当使用病毒(例如腺相关病毒(aav))将用于基因编辑的遗传物质递送到人体中时,可以递送的遗传物质的尺寸具有限制。另外,即使在基因治疗的稳定性方面,与cas9相比cpf1的脱靶结果低的事实也是重要的优势。但是,由于迄今已发现,相对于cas9,cpf1的插失效率相对较低或取决于待靶向的基因存在大偏差,所以难以代替cas9。因此,为了在使cpf1的优势最大化的情况下代替或超越cas9,必须开发提高cpf1的插失效率的方法。

可以通过操纵crispr/cas系统中的效应核酸内切酶或指导rna来提高靶基因的插失效率或准确性,并且在cas9的情况下,这样的研究已经积极开展,而对cpf1系统的研究不足。

[发明详述]

[技术问题]

因此,作为对开发能够克服crispr/cas9系统的缺点的crispr/cpf1系统的深入研究的结果,本发明人发现,与相关领域中具有crrna的cpf1系统和cas9系统相比,通过在用于crispr/cpf1系统的crrna的3’-末端序列添加尿苷重复序列,改善了插失效率,从而完成了本发明。

本发明的一个目的是提供crispr/cpf1系统中的多核苷酸,其由连接至与靶核苷酸序列互补的指导序列的3’末端的尿苷(u)重复核苷酸序列组成。

本发明的另一个目的是提供用于基因组编辑的组合物,其包含:包含与靶核苷酸序列互补的指导序列和连接至所述指导序列的3’末端的尿苷(u)重复序列的crisprrna(crrna),或编码所述crrna的dna;以及cpf1蛋白或编码所述cpf1蛋白的dna。

本发明的又一个目的是提供用于基因组编辑的方法,所述方法包括:将用于基因组编辑的组合物引入分离的细胞或生物中。

本发明的又一个目的是提供用于构建遗传修饰生物的方法,所述方法包括:将用于基因组编辑的组合物引入分离的细胞或生物中。

本发明的又一个目的是提供通过所述方法构建的遗传修饰生物。

技术方案

本发明的一个方面提供了crispr/cpf1系统中的多核苷酸,其由连接至与靶核苷酸序列互补的指导序列的3’末端的尿苷(u)重复核苷酸序列组成。

本发明的另一方面提供了用于基因组编辑的组合物,其包含:包含与靶核苷酸序列互补的指导序列、连接至所述指导序列的3’末端的尿苷重复序列的crisprrna(crrna),或编码所述crrna的dna;以及cpf1蛋白或编码所述cpf1蛋白的dna。

本发明的另一方面提供了用于基因组编辑的方法,所述方法包括:将用于基因组编辑的组合物引入分离的细胞或生物中。

本发明的另一方面提供了用于构建遗传修饰生物的方法,所述方法包括:将用于基因组编辑的组合物引入分离的细胞或生物中。

本发明的又一方面提供了通过所述方法构建的遗传修饰生物。

[有益效果]

本发明可以在使用cripspr/cpf1系统对真核细胞进行基因组编辑中提高插失效率并降低脱靶活性,并且因此可以容易地构建具有插入其中(敲入)或从其中缺失(敲除)的期望基因的遗传修饰细胞或者遗传修饰动物或植物。

附图

图1至14示出了体外实验的结果,其确认在3’末端具有u重复序列的crrna(富含u的crrna(u-richcrrna))提高了cpf1的dsdna切割效率:

图1示出了结果,其确认了根据crrna的3’末端的3核苷酸序列的突变,体内ascpf1的插失效率的差异。

图2示出了结果,其确认了根据靶标(dnmt1、lgals3bp和vegfa),u3末端对插失效率的影响。

图3示出了结果,其确认了根据反应时间和条件,3’末端的富含u的crrna提高了ascpf1的dsdna切割效率。

图4是示出了氨苄青霉素抗性基因靶序列和crrna文库序列的图。

图5是一组照片,其根据菌落形成单位(cfu)示出用pet21质粒载体转化的bl21(de3)大肠杆菌的菌落,其中使用不依赖序列和连接的克隆方法克隆寡核苷酸文库(li&elledge,methodsmolbiol,2012)。

图6是这样的图,其示出了用于寻找最佳crrna排列的无偏体外实验方法的示意图。

图7示出了深度测序数据分析的结果,其确认制备了crrna编码质粒dna文库,以使得a、t、g和c在每个位置占几乎相同的摩尔比。

图8示出了从显示最佳crrna排列的每个位置处的核苷酸比率的倒数值计算概率值的结果。

图9示出了结果,其确认了根据crrna的3’-末端尿苷序列的长度,ascpf1活性的变化。

图10是示意图,其示出了用于分析dsdna切割活性的体外实验方法。

图11示出结果,其确认crcrna中富含u的3’突出端增强了ascpf1的活性(平均值±标准差,在比较时,*;p<0.05,**;p<0.01,u8(n=3))。

图12是示意图,其示出用于确认crrna的最佳排列的实验设计。

图13示出了结果,其显示读段的数目(thenumberofread)和crrna的效率成反比。

图14示出了结果,其通过读段的标准化确认了具有u83’突出端的crrna显示最佳的ascpf1活性。

图15至图21示出了结果,其确认了用于增强体内基因组效率的最佳crrna结构:

图15是概念图,其示意性示出了用于确定根据本发明的crrna的最佳结构的体内分析方法。

图16示出了结果,其确认了通过根据本发明的富含u的3’-突出端序列改善了插失效率(平均值±标准偏差;分别在三次重复实验之后显示了代表性的结果)。

图17示出了结果,其确认了与cas9不同,cpf1中特异性地出现了通过3’末端富含u的指导rna改善了插失效率(平均值±标准差;分别在三次重复实验之后显示了代表性的结果)。

图18示出了结果,其确认了根据尿苷长度的增加,ascpf1的插失效率的变化。

图19示出了结果,其确认了根据crrna的3’末端序列,插失效率的差异(*;p>0.05,**;p<0.05,***;p<0.01,n=3)。

图20示出了结果,其确认了用于富含u的crrna的尿苷的最佳靶标长度。

图21示出了结果,其验证了用于改善crispr/cpf1系统中的基因组效率的最佳crrna结构(平均值±标准差;分别在三次重复实验之后显示了代表性的结果)。

图22至图24示出了结果,其确认了通过包含富含u的3’突出端的crrna改善了敲入效率。

图22示意性地说明,在crrna和供体dna的存在下,出现了在dnmt1位置的dsdna切割。

图23示出了结果,其确认了在通过crispr/cpf1系统引起插失突变之后靶位点的插失和敲入效率。

图24示出了使用ascpf1和spcas9靶向相同位点的结果。

图25和26示出了大规模比较crispr/ascpf1和crispr/spcas9的基因组编辑效率的结果:

图25示出了结果,其通过点图显示了对于hek-293t细胞中的相同靶基因确认的ascpf1和spcas9的插失效率,并且图26通过box-whisker图示出了结果。

图27至33示出了实验结果,其确认了根据本发明的富含u的crrna不会导致脱靶效应:

图27示出了深度测序结果,其对相关领域中的crrna序列和富含u的crrna序列在潜在的脱靶位点处的脱靶活性进行了比较。

图28示出了结果,其对与在靶序列具有一个错配碱基的相关领域中的crrna和富含u的crrna的脱靶活性进行了比较。

图29示出了结果,其确认了98%或更多的基因组dna不仅被ascpf1-富含u的crrna而且被ascpf1标准crrna核糖核蛋白复合物降解。

图30示出了通过整合的基因组观察器(igv)确认非靶标链的第18-20位和靶标链的第22位的典型切割模式的结果。

图31示出了显示脱靶位点的结果,其中在整个基因组circosplot中证实了con-crrna和富含u的crrna(u-rich-crrna)的dna切割得分和差异为2.5或更大且6或更小。

图32通过图示出了分别针对标准和富含u的crrna确认的脱靶位点的数目和共同脱靶位点的数目。

图33是示出了标准和富含u的crrna中全基因组circos图的相同脱靶模式的图。

图34至图36显示,根据本发明的富含u的crrna被应用于多重基因组编辑和pam突变:

图34示出了结果,其确认了多个富含u的crrna同时提高了多个靶标的插失效率。

图35和36显示,富含u的crrna被应用于ascpf1pam变体(*;p>0.001,**;p<0.01,n=3)。

图37至41确认了ascpf1-富含u的crrna复合物的改善的结合亲和力。

图37示出了结果,其通过进行northern印迹分析显示了crrna水平,以确认提高的cpf1活性是由于提高的crrna稳定性还是由于cpf1的直接调节。

图38示出了结果,其显示化学修饰的富含u的crrna显示出比化学修饰的标准crrna高得多的cpf1活性,但是对于cas9的化学修饰的指导rna没有显著差异。

图39示出了结果,63nt的长度是不显示tracrrna活性降低的最小长度,并且在该长度,u4au4的存在不诱导提高的cas9活性。

图40示出了结果,证实与标准crrna相比,富含u的crrna显著提高了对ascpf1的结合亲和力,但是富含u的sgrna未引起与spcas9复合物的结合强度的显著差异。

图41示出了分别对富含u的crrna和标准crrna进行等温滴定量热(itc)分析的结果。

[最佳模式]

本发明已经进行了努力来解决上述问题,并且提供了crispr/cpf1系统中的多核苷酸,其由连接至能够与靶核苷酸序列杂交(互补)的指导序列的3’末端的尿苷(u)重复核苷酸序列组成。此外,本发明提供了用于基因组编辑的组合物,其包含:包含能够与靶核苷酸序列杂交的指导序列和连接至所述指导序列的3’末端的尿苷重复序列的crisprrna(crrna),或编码所述crrna的dna;以及cpf1蛋白或编码所述cpf1蛋白的dna。

如本文所用,除非另外特别指出,否则术语“基因组编辑”是指通过在靶基因的靶位点处进行切割而通过一个或更多个核酸分子(例如1至100,000bp、1至10,000bp、1至1,000bp、1至100bp、1至70bp、1至50bp、1至30bp、1至20bp、或1至10bp)的缺失、插入、替换等导致的基因功能的损失、改变和/或修复(校正)。根据一个示例性的实施方案,能够通过使用cpf1蛋白的v型crispr/cpf1系统在靶dna的期望位置处进行切割,并且根据另一个示例性的实施方案,可以通过使用cpf1蛋白的v型crispr/cpf1系统校正细胞中的特定基因。

另外,在将crispr/cpf1核糖核蛋白(rnp)或编码rnp的dna递送至细胞的技术中,提供了用于克服现有显微注射方法的缺点的方法。作为这样的方法的一个实例,提供了通过将核糖核蛋白或编码核糖核蛋白的dna引入质粒等中并通过电穿孔、脂质转染等将质粒一次性递送至大量细胞来编辑基因组的技术,但是使用cpf1系统的基因组编辑技术不限于此。

crispr/cpf1基因编辑组合物可以以包含编码cpf1之dna的重组载体和包含编码crrna之dna的重组载体的形式引入细胞或生物中,或者可以以包含cpf1蛋白和crrna的混合物或其中cpf1蛋白与crrna形成复合物的核糖核蛋白的形式引入细胞或生物中。

一个示例性实施方案提供了用于基因组编辑的组合物,其包含能够与靶核苷酸序列杂交的指导序列或编码所述指导序列的dna,以及cpf1蛋白或编码所述cpf1蛋白的dna,或者作为crrna和cpf1蛋白的复合物的核糖核蛋白。

另一个示例性实施方案提供了用于生物的基因组编辑的方法,所述方法包括:将包含指导rna(crrna)和cpf1蛋白的核糖核蛋白递送至生物。

用于基因组编辑的组合物或用于基因组编辑的方法中包含或使用的cpf1蛋白或编码cpf1蛋白的dna和指导rna或编码指导rna的dna可以以包含cpf1蛋白和指导rna的混合物或者其中cpf1蛋白与指导rna形成复合物的核糖核蛋白(rna)的形式使用,或者可以在编码cpf1蛋白的dna和编码指导rna的dna各自包含在单独的载体中或者一起包含在一个载体中的情况下使用。

组合物和方法可以应用于真核生物。真核生物可以选自真核细胞(例如:真菌如酵母,真核动物和/或真核植物来源的细胞(例如,胚胎细胞、干细胞、体细胞、生殖细胞等)等等)、真核动物(例如:脊椎动物或无脊椎动物,更特别地,哺乳动物,包括灵长类动物,例如人和猴、狗、猪、牛、绵羊、山羊、小鼠、大鼠等)、和真核植物(例如:藻类如绿藻、单子叶植物或双子叶植物,例如玉米、大豆、小麦和水稻等)。

另一个示例性实施方案提供了用于通过使用cpf1蛋白的基因组编辑来构建遗传修饰生物的方法。更具体地,用于构建遗传修饰生物的方法可以包括:将cpf1蛋白或编码cpf1蛋白的dna以及指导rna(crisprrna;crrna)或编码指导rna的dna递送至真核细胞。当遗传修饰生物是遗传修饰真核动物或遗传修饰真核植物时,制备方法可以进一步包括在递送的同时或之后培养和/或分化真核细胞。

另一个示例性实施方案提供了通过用于构建遗传修饰生物的方法构建的遗传修饰生物。

所述遗传修饰生物可选自所有真核细胞(例如:真菌如酵母,真核动物和/或真核植物来源的细胞(例如,胚胎细胞、干细胞、体细胞、生殖细胞等)等等)、真核动物(例如:脊椎动物或无脊椎动物,更特别地,哺乳动物,包括灵长类动物,例如人和猴、狗、猪、牛、绵羊、山羊、小鼠、大鼠等)、和真核植物(例如:藻类如绿藻、单子叶植物或双子叶植物,例如玉米、大豆、小麦和水稻等)。

在本说明书中提供的用于基因组编辑的方法和用于构建遗传修饰生物的方法中,真核动物可以是除人以外的那些,并且真核细胞可以包括从包括人在内的真核动物分离的细胞。

如本文所用,术语“核糖核蛋白”是指蛋白质-核糖核酸复合物,其包含作为rna指导的核酸内切酶的cpf1蛋白和指导rna(crrna)。

cpf1蛋白是不同于crispr/cas9系统的新crispr系统的核酸内切酶,其与cas9相比尺寸相对较小,不需要tracrrna,并且可以通过单个指导crrna起作用。此外,cpf1蛋白是前间隔序列相邻基序(pam)序列,识别位于5’末端的富含胸腺嘧啶的dna序列,例如5’-ttn-3′或5’-tttn-3′(n是任何核苷酸,和具有碱基a、t、g或c的核苷酸),并切割dna的双链以产生粘性末端(粘性双链断裂)。所得的粘性末端可以促进靶位置(或切割位置)处的nhej介导的转基因敲入。

本发明的cpf1蛋白可来源于念珠菌(candidatus)属、毛螺菌(lachnospira)属、丁酸弧菌(butyrivibrio)属、异域菌门(peregrinibacteria)、氨基酸球菌(acidominococcus)属、卟啉单胞菌(porphyromonas)属、普雷沃菌(prevotella)属、弗朗西丝菌(francisella)属、candidatusmethanoplasma或真杆菌(eubacterium)属,并且可以来源于例如以下的微生物:俭菌总门(parcubacteria)细菌(gwc2011_gwc2_44_17)、毛螺菌科(lachnospiraceae)细菌(mc2017)、butyrivibrioproteoclasiicus、异域菌门(peregrinibacteria)细菌(gw2011_gwa_33_10)、氨基酸球菌属(acidaminococcussp.)(bv3l6)、猕猴卟啉单胞菌(porphyromonasmacacae)、毛螺菌科细菌(nd2006)、porphyromonascrevioricanis、解糖胨普雷沃菌(prevotelladisiens)、波伏丘利莫拉菌(moraxellabovoculi)(237)、smiihellasp.(sc_ko8d17)、稻田钩端螺旋体(leptospirainadai)、毛螺菌科细菌(ma2020)、新凶手弗朗西斯菌(francisellanovicida)(u112)、candidatusmethanoplasmatermitum、candidatuspaceibacter和挑剔真杆菌(eubacteriumeligens),但不限于此。在一个实例中,cpf1蛋白可来源于俭菌总门细菌(gwc2011_gwc2_44_17)、异域菌门细菌(gw2011_gwa_33_10)、氨基酸球菌属(bv3l6)、猕猴卟啉单胞菌、毛螺菌科细菌(nd2006)、porphyromonascrevioricanis、解糖胨普雷沃菌、波伏丘利莫拉菌(237)、稻田钩端螺旋体、毛螺菌科细菌(ma2020)、新凶手弗朗西斯菌(u112)、candidatusmethanoplasmatermitum或挑剔真杆菌,但不限于此。

cpf1蛋白可以是从微生物中分离的或通过重组或合成方法非天然存在的。cpf1蛋白可还包含但不限于通常用于真核细胞中的核内递送的元件(例如:核定位信号(nls)等)。cpf1蛋白可以以纯化蛋白质的形式使用,或者可以以编码cpf1蛋白的dna或包含该dna的重组载体的形式使用。

在本发明的cpf1系统中使用的crrna的特征在于连接至与靶基因杂交的指导rna序列的3’末端的尿苷重复序列。

在本发明的一个示例性实施方案中,尿苷重复序列可以是其中尿苷重复2至20次的核苷酸序列。优选地,本发明的crrna可以包含6至10重复尿苷序列,更优选8尿苷重复序列。

在本发明的另一个示例性实施方案中,尿苷重复序列可以是由(uav)nub表示的核苷酸序列。在这种情况下,a和b是2至20的整数,n是1至5的整数,并且v是腺嘌呤(a)、胞嘧啶(c)或鸟嘌呤(g)。

在本发明的一个优选的示例性实施方案中,v是a并且可以是由(uaa)nub表示的核苷酸序列。

在本发明的一个优选的示例性实施方案中,n是1并且可以是由uavub表示的核苷酸序列。

在本发明的一个优选的示例性实施方案中,尿苷重复序列可以是由u4au6表示的核苷酸序列。

在本发明中,能够与靶核苷酸序列杂交的指导序列是指与基因靶位点的核苷酸序列(靶序列)具有50%或更多、60%或更多、70%或更多、80%或更多、90%或更多、95%或更多、99%或更多、或100%的序列互补性的核苷酸序列(在下文中,除非另有说明,否则以相同的含义使用,并且可以使用典型的序列比较手段(例如,blast)来确认序列同源性)。例如,能够与靶序列杂交的crrna可以具有与位于靶序列(与pam序列所在的链位于同一序列上)所在的核酸链(即,pam序列所在的链)的相反链上的对应序列互补的序列,并且换句话说,crrna可以包含其中将靶序列中的t替换为u的序列,其指示dna序列作为靶向序列位点。

在本说明书中,crrna可以表达为靶序列,并且在这种情况下,即使没有另外提及,crrna序列也可以解释为将靶序列中t替换为u的序列。

基因靶位点的核苷酸序列(靶序列)可以是其中tttn或ttn(n是a、t、c或g)或者与tttn或ttn具有50%或更多、66%或更多、或75%或更多的序列同源性的前间隔序列相邻基序(pam)连接至其5’末端(例如,pam序列直接连接至靶序列的5’末端(0nt距离)或以1至10nt的距离连接至靶序列的5’末端)的序列,或者可以是其中除了5’末端的pam序列外,与pam序列在相反方向互补的序列(naaa或naa,与naaa或naa具有50%或更多、66%或更多、或75%或更多的序列同源性的序列;n是a、t、c或g;3’末端的反向pam序列)连接至其3’末端(例如,反向pam序列直接连接至靶序列的3’末端(0nt距离)或以1至10nt的距离连接至靶序列的3’末端)的序列。

在本发明的一个示例性实施方案中,crrna中包含的指导序列的长度可以为18至23nt,但不限于此。

在本发明的一个示例性实施方案中,crrna可以以包含编码crrna的dna的pcr扩增子的形式或包含在重组载体中的形式提供。作为一个实例,本发明可以提供用于基因组编辑的组合物,其包含:包含编码crrna的dna的pcr扩增子,和包含编码cpf1蛋白的dna的重组载体。作为另一个示例性实施方案,本发明可以提供用于基因组编辑的组合物,其包含:包含编码crrna的dna的重组载体,和包含编码cpf1蛋白的dna的重组载体。在这种情况下,重组载体可以包含crrna表达盒,所述crrna表达盒包含转录控制序列,例如crrna编码dna和/或与其有效连接的启动子。

可以将根据本发明的编码crrna的dna和编码cpf1蛋白的dna插入一个重组载体中或分开的载体中。

可以将根据本发明的编码crrna的dna和编码cpf1蛋白的dna克隆到一个重组载体中或分开的载体中。

作为另一个实例,可以通过局部注射、显微注射、电穿孔、脂质转染等将以下递送到细胞或生物中:包含rna指导的核酸内切酶(rgen)和指导rna的混合物,或核糖核蛋白(rnp),编码rgen、指导rna和rnp的dna,或包含dna的重组载体。

在上述方法中,可以通过诸如显微注射、电穿孔和脂质转染的方法将包含体外表达的(纯化的)cpf1和crrna的混合物或cpf1和crrna已与其缀合的核糖核蛋白递送到真核细胞或真生生物来进行包含cpf1(核酸内切酶)或编码cpf1之dna和crrna或编码crrna之dna的混合物、或核糖核蛋白、或编码核糖核蛋白的nda的递送。在又一个实例中,可以通过诸如局部注射、显微注射、电穿孔和脂质转染的方法将分别包含在分开的载体或在一个载体中包含含有编码cpf1之dna的表达盒和含有编码crrna之dna的表达盒的重组载体递送到真核细胞和/或真核生物来进行包含cpf1或编码cpf1之dna和crrna或编码crrna之dna的混合物或核糖核蛋白的递送。

除了核酸内切酶编码dna或crrna编码dna之外,表达盒还可以包含与核酸内切酶编码dna或crrna编码dna可操作地连接的形式的典型基因表达控制序列。

术语“可操作地连接”是指基因表达控制序列和另一核苷酸序列之间的功能结合。

基因表达控制序列可以是选自复制起点、启动子和转录终止序列(终止子)的一种或更多种。

本文所述的启动子是转录控制序列之一,其调节特定基因的转录起始,并且通常是长度为约100至约2500bp的多核苷酸片段。在一个示例性实施方案中,可以不受限制地使用启动子,只要该启动子可以调节细胞例如真核细胞中的转录起始即可。例如,启动子可以选自以下的一种或更多种:巨细胞病毒(cmv)启动子(例如,人或小鼠cmv立即早期启动子)、u6启动子、ef1-α(延伸因子1-a)启动子、ef1-α短(efs)启动子、sv40启动子、腺病毒启动子(主要晚期启动子)、plλ启动子、trp启动子、lac启动子、tac启动子、t7启动子、牛痘病毒7.5k启动子、hsvtk启动子、sv40e1启动子、呼吸道合胞病毒(rsv)启动子、金属硫蛋白启动子、β-肌动蛋白启动子、泛素c启动子、人白介素2(il-2)基因启动子、人淋巴毒素基因启动子、人粒细胞巨噬细胞集落刺激因子(gm-csf)基因启动子等,但不限于此。

转录终止序列可以是多腺苷酸化序列(pa)等。复制起点可以是f1复制起点、sv40复制起点、pmb1复制起点、腺复制起点、aav复制起点、bbv复制起点等。

本文所述的载体可以选自质粒载体、黏粒载体和病毒载体,例如噬菌体载体、腺病毒载体、逆转录病毒载体和腺相关病毒载体。可以用作重组载体的载体可以通过使用以下作为基础进行构建:质粒(例如,pcdna系列、psc101、pgv1106、pacyc177、cole1、pkt230、pme290、pbr322、puc8/9、puc6、pbd9、phc79、pij61、plafr1、phv14、pgex系列、pet系列、puc19等)、噬菌体(例如λgt4λb、λ-charon、λδz1、m13等)、病毒载体(例如腺相关病毒(aav)载体等),或本领域中使用的类似物质,但不限于此。

[实施方式]

在下文中,将通过实施例更详细地描述本发明。这些实施例仅用于举例说明本发明,并且对于本领域普通技术人员来说明显的是,本发明的范围不被理解为被这些实施例所限制。

<实验方法>

1.细胞培养和转染

将1mm热失活的青霉素/链霉素和10%fbs(corning)添加到高浓度葡萄糖dmem培养基,并在37℃和5%co2的条件下培养hek-293t细胞(293t/17,atcc)。

通过电穿孔或脂质转染法进行细胞转导。具体地,对于电穿孔,使用neon电穿孔仪(invitrogen)将其中编码2至5μgascpf1、lbcpf1或spcas9的质粒载体(addgene)与其中编码1至3μgcrrna或sgrna的pcr扩增子一起转导到5x105至1x106个hek-293t细胞中。如有必要,使用化学合成的crrna(bioneer)代替pcr扩增子。

对于脂转染方法,将3至15μlfugene试剂(promega)与其中编码1至5μgascpf1、lbcpf1或spcas9的质粒载体和3至15μgpcr扩增子混合15分钟。在转导前一天,将5x105个细胞在1mldmem中铺板,然后通过将混合物(300μl)添加到培养基来培养48小时。

培养之后,收获细胞,并使用purehelixtm基因组dna制备试剂盒(nanohelix)或maxwelltmrsc核酸分离工作站(promega)制备基因组dna。

pspcas9(bb)-2a-gfp(px458)、py010(pcdna3.1-hascpf1)和py016(pcdna3.1-hlbcpf1)获自fengzhang(分别为addgeneplasmid#48138、#69982、#69988)。在下面的[表1]和[表2]中示出了本发明该实施例中使用的靶标的信息。

表1

(*上述靶序列的[]中的四种序列表示pam序列)

表2

2.ascpf1pam变体

使用py010质粒载体作为模板和诱变引物,在veriti热循环仪(lifetechnologies)上进行定点诱变。

使用诱变引物对(seqidno:52和53)产生s542r突变。使用另外的诱变引物(seqidno:54至57)产生k607r和k548v/n552r突变。下表3中示出了本实施例中使用的引物序列。

表3

简单地说,将100ng质粒模板和15pmol的每种诱变引物添加到50μltoyobokod混合物(takara),并进行初始变性步骤(3分钟,94℃),变性步骤(20秒,95℃)、退火步骤(40秒,62℃)和聚合步骤(10分钟,72℃)的25个循环。将10μlpcr产物与2μldpni(newenglandbiolabs)在37℃下反应2小时。将该反应混合物(5μl)在62℃下加热变性20分钟,然后用于转化bl21(de3)大肠杆菌细胞。通过sanger测序仪确认诱变形成。

3.重组ascpf1的纯化

将获自氨基酸球菌属(acidaminococcussp.)的密码子人源化的cpf1基因克隆到pet-28a(+)质粒载体(invitrogen)中,并将载体结构转化到bl21(de3)大肠杆菌细胞中。

使遗传修饰大肠杆菌菌落在lb培养基(lb肉汤)中于37℃生长至光密度(ca)达0.7,然后将细胞在0.1mm异丙基硫代-β-d-半乳糖苷(iptg)的存在下于30℃培养过夜,以诱导重组蛋白的产生。接下来,通过以3,500g离心30分钟获得细胞,并将细胞通过超声破碎。通过以15,000g离心30分钟来纯化细胞洗脱液,并使用0.45μm注射器过滤器(millipore)过滤。将纯化的洗脱液上样到使用fplc纯化系统(aktapurifier,gehealthcare)的ni2+亲和柱上。

此外,通过向体外转录混合物添加1μg遗传构建体来在自动化蛋白质生产系统(exiprogen,bioneer)中纯化重组ascpf1。使用牛血清白蛋白(bsa)作为参考,用考马斯蓝染色通过sds-page确认产生的蛋白质的浓度。

4.ascpf1体外dna切割

将接着具有5′-ctgatggtccatgtctgttactc-3’(seqidno:58)dna序列的pcr扩增子的tttcpam克隆到t-blunt载体(solgent)中。载体构建体在dh5α大肠杆菌细胞中扩增,并使用higenetmdna纯化试剂盒(biofact)纯化。使靶载体(20ng/μl)与纯化的重组ascpf1蛋白(50ng/μl)和化学合成的crrna(10ng/μl)在37℃下反应30至60分钟。通过将反应混合物溶解在10%sds-page凝胶中以定量裂解产物,或通过在42℃下添加热冲击2分钟,将反应混合物用于转化dh5α大肠杆菌感受态细胞。将遗传修饰的细胞应用于含有氨苄青霉素(50ng/μl)的lb琼脂板,并在37℃下培养。对形成以诱导ascpf1的crrna依赖性dna切割的菌落数目进行计数。

5.插失定量

进行了t7核酸内切酶i(t7e1)测定,以评估hek-293t细胞的靶向基因座中ascpf1、lbcpf1或spcas9的插失效率。通过使用基于solgtmpfu的pcr扩增试剂盒(solgent)对靶位点进行pcr扩增获得pcr产物。然后使pcr产物(100至300μg)与25μ反应混合物中的10单位t7e1酶(newenglandbiolabs)在37℃下反应1小时。将20μl反应混合物直接上样到10%sds-page凝胶上,并将切割的pcr产物在tbe缓冲液系统中运行。将凝胶图像用溴化乙锭溶液染色,然后在printgraph2m凝胶成像系统(atto)上数字化。为了计算插失效率,使用imagej软件分析了数字化图像。

6.脱靶活动评估

使用cas-offinder[21;http://www.rgenome.net/casoffinder;表4至9]选择具有两个或更少凸起和错配的潜在脱靶位点。在用ascpf1载体构建体和编码crrna的pcr扩增子转导之后,将hek-293t细胞在dmem中培养2天。

表4

(*以上靶序列的[]中的四种序列表示pam序列。小写字母是错配序列,-号表示凸起;**靶序列的位置,根据genomereferenceconsortiumhumanbuild38patchrelease11(grch38.p11)。

表5

表6

表7

表8

表9

(***通过与未处理的等位基因序列进行比较来监测所研究的等位基因中snp的发生。将在cpf1处理和未处理的等位基因之间相同观察到的这些单核苷酸变异视为snp。在计算脱靶频率时考虑并排除那些snp)

使用巢式pcr扩增在靶和潜在脱靶位点,并用于文库构建。使用agencourtampurexp(beckmancoulter)纯化每个文库,并使用quanti-itpicogreendsdna测定试剂盒(invitrogen)通过picogreen方法进行定量。

在使用agilent2100生物分析仪系统(agilenttechnologies)确认文库的大小之后,进行qpcr分析以确认剂量和合适的簇是否很好符合illumina的建议。接下来,使用miseqreagentkitv3(lifesciences)根据illuminamiseq序列平台进行配对末端测序。使用cutadapt工具(版本1.14)从每个原始数据中移除引物序列。约束修整的序列,并进行序列比较。通过脱靶活性将在23nt靶序列中观察到的插失突变视为遗传校正。

或者,通过pcr扩增hek-293t细胞系的dnmt1靶位点,然后通过电穿孔将5μgascpf1载体构建体和3μgcrrna以及在靶或仅一个碱基错配的序列转导到2x106个hek-293t细胞中来诱导插失突变。通过t7e1消化测定经sds-page凝胶测量插失效率。

7.无偏体外实验

合成了在3’末端具有11nt随机序列的crrna文库寡核苷酸,并使每种crrna具有相同的摩尔比(integrateddnatechnologies)。使用不依赖序列和连接的克隆(slic)方法将寡核苷酸文库克隆到pet21质粒载体中。克隆的质粒用于转化bl21(de3)大肠杆菌细胞,并确保菌落形成单位为108cfu/ml或更高。通过对在氨苄青霉素(+)板上连续稀释的遗传修饰细胞的菌落进行计数来计算cfu值。使遗传修饰细胞在补充有50ng/ml氨苄青霉素的lb培养基中生长,直到光密度达到0.6。使用genepulserxcell电穿孔仪(biorad)用携带dcpf1或cpf1的pet-28a(+)质粒载体(50至200ng)对水溶性细胞(2x1010个细胞/ml)进行遗传修饰。将遗传修饰的细胞在补充有氨苄青霉素和卡那霉素的琼脂板上铺板,向其添加0.1miptg。通过收集在每个板上形成的菌落来纯化质粒载体。使用illuminahiseqxten测序仪(macrogen,southkorea)对质粒载体进行了深度测序分析,以计算crrna的每个位置的a/t/g/c频率。

8.结合实验

使用等温滴定量热法(itc)和微尺度热泳(mst)进行结合实验。

在auto-itc200微量热计(gehealthcare)中进行itc。具体地,将25℃的pbs缓冲液(ph7.4)中含有5μm经纯化重组ascpf1蛋白的滴定细胞用化学合成的标准或富含u的crrna(50μm)以2μl/注射进行滴定。使用microcalorigin(tm)软件(gehealthcare)进行数据分析。计算值是三个独立实验的平均值。使用monolithnt.115(nanotempertechnologiesgmbh)测量指导rna与效应蛋白(spcas9和ascpf1)的结合亲和力。化学合成的crrna(idttechnologies)用cy5荧光染料标记。将多种浓度(0.25nm至50μm)的经纯化重组ascpf1与8nm标记的rna在含有0.05%tween-20和0.05%bsa的pbs缓冲液中混合。使用5%led功率和20%mst功率在24℃进行分析。

同时,在cas9mst实验中,使cy5标记的crrna与tracrrna以相同的分子比杂交。具体地,将重悬于nuclease-freeduplexbuffer(idttechnologies)中的两种rna寡核苷酸在95℃下加热5分钟,然后在室温下冷却。将多种浓度(0.1nm至15μm)的经纯化spcas9蛋白与8nm标记的rna在含有150mmkcl、0.05%tween-20和0.05%bsa的20mmhepes缓冲液(ph7.4)中混合。使用20%led功率和20%mst功率在24℃进行分析。将所有样品放置在nanotemper标准毛细管中,并且每次测量重复至少3次。使用nanotemper分析软件分析结合亲和力数据。

9.northern印迹分析

使用maxwellrscmirna组织试剂盒(promega)根据制造商的说明从hek-293t细胞中提取总rna。将每个样品在rna变性缓冲液(20%甲醛,50%甲酰胺,50mmmops,ph7.0)中于65℃变性15分钟后,从1%琼脂糖/16%甲醛凝胶分离了0.3至0.5μg分离的rna。然后通过毛细管迁移过夜将rna从10xssc转移到带正电的尼龙膜上。将rna与预热至50℃的digeasyhybrnight中的20至50ng/mlpcrdig探针预杂交30分钟,与pcrdig标记混合物(roche)反应,然后在96℃变性5分钟。洗涤印迹并用anti-degoxigenin-apfab片段(roche)进行免疫检测。通过使用cdp-star底物(roche)的化学发光测定法使靶rna-dna探针杂交体可视化。下表10中示出了探针序列(seqidno:69和70)。

表10

10.统计分析

使用两尾studentt检验,在sigmaplot上进行插失效率的统计分析。统计分析结果表明,p值<0.05是显著的。

实施例1.确认了包含u重复序列的crrna(富含u的crrna)对改善ascpf1的dsdna切割效率的作用

根据对crrna-cpf1复合物和靶dna进行了结构分析以确认cpf1如何被crrna指导并且在具有pamc的t重复序列的靶标处断裂dna双螺旋的现有技术文献(dongetal.nature532,522-538(2016).,yamanoetal.cell165,949-962(2016)),已知crrna和靶dna的3-4个核苷酸残基由于其高柔韧性而仍未被鉴定。这意味着识别和结合特定靶标所需的crrna的关键核苷酸长度为约20nt,如在crispr/cas9系统中。

本发明人用质粒载体以及表达密码子人源化的ascpf1基因和crrna的pcr扩增子转染了hek-293t细胞,以确认crrna3’末端的3-4个核苷酸是否可能仅仅是不必要的部分,或者可能具有除靶标识别以外的其他次要作用。设计crrna,以包含用于dnmt1基因的20nt靶序列,然后是三个可变序列。

对于碱基确认,测试了四种不同的crrna,其各自包含3’突出端aaa(a3)、uuu(u3)、ggg(g3)或ccc(c3)作为可变序列。通过t7e1消化分析确认的结果表明,在具有u33’-突出端的crrna中,插失效率最高(图1)。此外,与具有23nt靶标互补序列的crrna相比,具有u33’突出端的crrna表现出更高的插失效率。即使在对三种另外的靶基因进行的实验中,也显示出相同的结果(图2)。体外dna降解分析表明,与富含胍(富含g)的情况相比,具有u33’突出端的crrna显著提高了dsdna切割(图3)。

另外,制备了编码具有3’突出端文库的crrna的质粒dna文库。具体地,合成具有11nt3’末端序列文库的crrna文库寡核苷酸(411),并且使每种crrna具有相同的摩尔比。每种crrna被设计成具有用于在靶序列的17nt和11nt(n11)随机核苷酸序列(图4至6)。通过这种设计,旨在清楚地确认必要的在靶长度和另外的控制序列。由于具有有效crrna的大肠杆菌细胞在补充有氨苄青霉素的琼脂板中存活较低,因此采用了阴性选择方法来追踪crrna的最佳排列。然后,通过收集活的大肠杆菌细胞来提取编码crrna的质粒dna,并通过进行深度测序分析来计算靶位点的每个位置处的核苷酸数(图7)。作为分析深度测序数据的结果,确认制备了crrna编码质粒dna文库,以使得a、t、g和c在每个位置占几乎相同的摩尔比,如通过dcpf1处理评估的。将边缘变化相对于通过dcpf1处理获得的值进行归一化。相反,证实了当处理ascpf1时,每种核苷酸的频率以位置依赖性方式存在显著差异。从表现出最佳crrna排列的每个位置的核苷酸比率的倒数值获得概率值(图8)。结果,证实了20nt的在靶序列是重要的,但是在21位之后是不依赖于在靶序列的富含u的3’尾。

接下来,化学合成在3’末端具有不同尿苷酸化(uridinylate)长度的crrna,并在体外测试了ascpf1/crrna核糖核蛋白的dsdna切割效率。结果,可以看出,在具有u8突出端的crrna中,dna切割效率是最好的(图9)。

尿苷化长度的进一步增加对dsdna切割没有显著影响。由此可见,向20nt靶标互补序列添加8个尿苷化显示出最佳的dsdna体外切割效率。

接下来,为了确认是否通过crrna的富含u的3’突出端提高了ascpf1的dsdna切割效率,设计了体外实验,其中将具有dnmt1的23nt靶序列的puc19质粒载体与等摩尔比的ascpf1/crrna核糖核蛋白一起培养。具体地,在部分消化1小时之后,使用消化的质粒载体转化大肠杆菌dh-5α。在将大肠杆菌细胞在含有氨苄青霉素的lb琼脂培养基上铺板之后,对形成的菌落数进行计数(图10)。通过重复的实验,可以看出添加八个尿苷化对增强ascpf1活性的效率是重要的(图11)。确认了当在任意位置将尿苷替换为任何其他核苷酸时,ascpf1的dsdna切割活性降低。

最后,通过用菌株进行稳健性测定以确认crrna的最佳排列,确认了富含u的crrna的有效性(图12)。具体地,用携带具有多种8nt3’尾的crrna的pet21载体转化bl21(de3)大肠杆菌细胞。将crrna设计为靶向质粒中氨苄青霉素抗性基因的5’临近区域。将具有独特crrna序列的菌落筛选到电感受态细胞中。将每种感受态细胞以相同数量收集以制备crrna文库细胞。之后,用具有或不具有ascpf1基因的pet-28a(+)质粒载体转化感受态细胞。将转化细胞在补充有氨苄青霉素、卡那霉素和0.1mmiptg的琼脂板上铺板。通过收集在每个板上形成的菌落来纯化质粒载体,并通过深度测序分析来测量每种crrna的占有率。结果,确认了读段数目与crrna的效率成反比(图13)。在不存在ascpf1的情况下获得的每个读段用于对感受态细胞中的多种crrna模板的修饰进行标准化。另外,通过读段的标准化,证实具有u83’突出端的crrna显示出最佳的ascpf1活性(图14)(与非u8突出端相比,p<0.01,n=3)。

从以上结果可以证实,crrna的3’末端富含u的尾是ascpf1高效dsdna切割的关键结构决定因素。

实施例2.确认了具有u4au43’突出端序列的crrna对增强cpf1的基因编辑效率的作用(体内)

为了确认crrna的u重复序列结构是否与体内基因组编辑效率的增强直接相关,在用具有密码子人源化的ascpf1基因和u6启动子的载体构建体以及包含20nt靶标互补序列和3’末端突变序列的编码crrna的pcr扩增子转染的hek-293t细胞中评估插失效率(图15)。

随着将具有4nt3’末端突变序列(a4、g4、t4、c4,或与靶标互补的四个核苷酸)的编码crrna的pcr扩增子添加至20nt靶标互补序列,靶向了dnmt1基因。结果,可以确认,以与体外结果相同的方式(图1),在体内,甚至在将富含u的crrna(20tt4)用在3’末端时,与其他crrna(20ta4、20tg4、20tc4和24t)相比,插失效率显著提高(图16)。

据此,认为重复的尿苷残基赋予了细胞中的crrna稳定性,并且由于crrna的稳定性而提高了ascpf1的插失效率。

然而,与ascpf1不同,编码单指导rna(sgrna)的pcr扩增子的3’末端的t6序列不影响crispr/cas9系统的插失效率(图17)。此外,由于确认了富含u的3’突出端在体外系统中是有效的,因此可以看出,当富含u的drrna与cpf1结合时,富含u的crrna调节cpf1的活性。

接下来,在crrna中,确认了由于3’末端尿苷的长度引起的ascpf1插失效率的变化。在体外实验中确认了cpf1活性与长度成比例地增加,直到尿苷的长度增加至实施例1中的8聚体(图3)。然而,与体外实验结果相反,已确认了当编码crrna的pcr扩增子中t的长度为4时,插失效率几乎饱和,并且即使长度增加更多,插失效率也不受影响。(图18)。

这一结果可以用rna聚合酶iii调节u6启动的基因转录的事实解释。在此过程中,模板dna的连续t重复序列(t5或t6)充当终止信号,导致在3’末端产生四个尿苷(u4)。因此,模板中胸苷碱基序列的长度增加不伴随crrna中尿苷长度的增加。然而,当使用化学合成的crrna时,确认了当尿苷的长度增加直至8聚体时,cpf1活性与长度成比例地增加,如在体外实验中所观察到的(图18)。

考虑到在3’末端重复的尿苷对于提高crrna插失效率至关重要,因此设计了编码crrna的模板dna,以使得四个脱氧胸苷酸(t4)连接至一个非t碱基和t6,从而允许u4vu产生包含3’尾序列的crrna(这里,v为a、c或g)。u4尾实际上是在模板的t重复末端序列(t5或t6)的转录本中完成的。与当g或c结合至t重复序列时相比,当a结合至t重复序列时插失效率提高(图19)。另一方面,通过添加u4a单元来增加u的数目并没有进一步提高插失效率。由此可见,具有添加至靶标互补序列的至少8个尿苷(u8)的合成crrna对于改善基因组编辑效率非常重要。当由dna模板转录和制备crrna时,模板序列在与靶标匹配的序列之后必须具有序列′ttttatttttt′。该结构在crrna中产生u4au43’突出端,其可以表现出与合成的u8-crrna几乎类似的插失效率。

在这种情况下,作为检查根据靶标长度的插失效率的结果,可以看出,最有效的靶标长度是20(±1)nt,其随靶标而变化(图20)。

这种优化的crrna结构相同地适用于来源于毛螺菌科细菌的cpf1(lbcpf1),其与ascpf1一起被称为可应用于真核细胞的效应蛋白(图21)。

“敲入”实验可以清楚确认通过富含u的crrna改善cpf1活性的重要性。crispr/cpf1系统的总体敲入效率低于crispr/cas9,即使将单链寡核苷酸(ssodn)用作供体,也是如此。仅富含u的crrna能够检测通过ascpf1的基于ssodn的敲入水平(图22至24)。

实施例3.通过包含u重复序列的富含u的crrna的ascpf1基因组编辑效率的大规模验证

为了确认通过富含u的crrna改善的插失效率是否是序列依赖性的,并且富含u的crrna是否可以应用于广泛的靶标,对ascpf1的插失效率进行了大规模研究并与从spcas9获得的结果进行了比较。

首先,搜索cpf1和cas9共同的靶基因,以排除靶依赖性插失效率引起的差异。针对包含ascpf1和spcas9的pam序列并且共有20nt靶标序列的5’-tttv(n)20ngg-3’序列搜索特异性靶标。结果在hek-293t细胞中发现了115个pcr验证的靶标,包括49个外显子,32个内含子和34个基因(基因间)(下表11和12中示出了靶标信息)。将单指导rna(sgrna)和crrna设计为从包含u6启动子和具有各自靶序列的sgrna或crrna序列的pcr扩增子转录。

表11

表12

分别通过点图和箱须图表示图25和26中研究的靶标中的插失效率。对于每个靶标,研究了具有spcas9和标准crrna(典型crrna)的ascpf1(con-ascpf1)和具有包含u重复序列的crrna的ascpf1(富含u的ascpf1)的插失效率。115个靶标中的两个未表现出通过基因编辑系统的插失突变,但其余113个靶标在至少一种测试系统中显示了可检测的插失突变水平(98.2%覆盖率)。

通过本发明的实施例,第一次在具有统计上充分量样品的情况下比较了cas9和cpf1的插失效率。作为对这些大数据进行统计分析的结果,得出以下结论:

1)与已知cpf1的效率与spcas9的效率类似的事实不同,通过标准crrna诱导的ascpf1的总效率低于spcas9的效率(p=0.003)。

2)富含u的crrna显著改善了ascpf1的插失效率(p=0.00003),并且通过富含u的crrna改善的ascpf1的效率几乎与spcas9的效率类似(p=0.29)。

3)在其中没有检测到由于标准crrna引起的插失突变的靶标情况下,使用富含u的crrna不影响效率改善。但是,在具有可检测突变的靶标的情况下,90.3%(94/104)的靶标显示了通过富含u的crrna增加的效率,其增加/减少范围为1.07至12.98倍,平均增加率为2.31。

4)cpf1和cas9作为基因组编辑工具彼此互补。通过富含u的crrna有效诱导的ascpf1不能通过spcas9诱导突变,或具有低插失效率的有效突变靶标,反之亦然。

从这些结果可以看出,使用富含u的crrna作为高效且可预测的方法的crispr/cpf1系统可以用作基因组编辑工具,以补充crispr/cas9系统。

实施例4.通过富含u的crrna的脱靶效应

通过数项研究已知cpf1的高靶标特异性和低脱靶活性,并且已知尤其是ascpf和lbcpf1两者对人细胞中的基因组编辑具有高度特异性,并且具有比spcas9低的脱靶活性。尽管富含u的crrna显示出显著增加在靶编辑活性,但问题是,缩短的靶标长度(23到20nt)改善cpf1的靶标特异性,但可增加脱靶活性。为了解决这个问题,本发明人以偏倚方式将由富含u的crrna诱导的ascpf1的脱靶活性与由标准的23nt靶标互补crrna诱导的脱靶活性进行了比较。由于已经广泛研究了cpf1的全基因组靶标特异性,脱靶活性的偏倚分析可以充分评估可由富含u的crrna引起的潜在特异性问题。

使用cas-offinder,选择了九个潜在的脱靶位点,其具有最小的凸起和与磷酸酪氨酸激酶6(ptk6)的靶序列不匹配的序列。接下来,在hek-293t细胞中研究了由ascpf1引起的突变发生率,并比较了标准23ntcrrna(con-crrna)和富含u的crrna之间插失效率的差异。作为深度测序分析的结果,可以看出,通过富含u的crrna,本发明的在靶插失效率增加了2.61倍,如图2和3中所示的结果(图27)。

然而,对于所有潜在的脱靶,在靶序列内未观察到插失突变。由于单核苷酸多态性(snp)在ascpf1未处理的细胞中以相同或相似的水平出现,因此参考序列中的差异很可能是由于单核苷酸多态性引起的(参见表4至9)。从该结果可以看出,使用富含u的crrna不影响ascpf1的脱靶活性。

接下来,本发明人使用具有与前间隔序列不匹配的单个碱基的crrna检查了dnmt1位点的脱靶水平是否改变。在crrna的3’末端和中间位点(位置8至10)观察到了显著且相当大的耐受水平差异。

即使在上述区域中出现了较高脱靶水平,但通过重复实验已经确认,脱靶插失突变广泛出现在整个靶位置靶位点(图28)。有趣的是,富含u的crrna的使用降低了除3’末端区域(18至20位置)以外的大多数靶位置对单核苷酸错配的抵抗力。该结果与表明切割的指导rna改善了spcas9的靶特异性的相关领域研究一致。如在相关领域中所报道的,本发明人观察到在18至20位置处显著更高的脱靶活性,并且确认了富含u的crrna使该区域中的脱靶活性稍微恶化。然而,考虑到脱靶与靶突变水平的比例实际上很重要的事实,本发明人发现,即使使用富含u的crrna也不会显著损害cpf1特异性的固有水平。

最后,为了监测根据crrna结构的脱靶活性的变化,通过切割基因组测序技术(digenome-seq)分析对cpf1特异性进行了无偏倚的整体基因组测定。提供分离自hek-293t细胞的无细胞基因组dna,以用于通过ascpf1-crrna核糖核蛋白复合物进行体外切割。作为定量实时pcr分析的结果,确认了基因组dna中超过98%被ascpf1-标准crrna核糖核蛋白复合物以及ascpf1-富含u的crrna降解(图29和30)。

随后,将切割产物应用于全基因组测序,并将序列数据与人参考基因组数据库(grch38.p11)进行比对。通过整合的基因组观察器(igv),确认了非靶标链第18-20位和靶标链第22位的典型切割模式。使用digenome-seq程序进行了计算机分析,以找到脱靶位点,在该位点上,dna切割得分和差异分别被确认为2.5或更大且6或更小。确认的位点列于表13(con-crrna)和表14(富含u的crrna)中,并且脱靶位点显示在整个基因组circos图中(图31)。

表13

表14

标准和富含u的crrna的脱靶位点数量没有显著差异。对于标准和富含u的crrna分别确认了41和46个脱靶位点,其中共同确认了30个(图32)。

在不存在crrna的情况下,确认了crrna依赖性dna切割,因为没有产生具有显著的dna切割得分(>2.5)的切割位点。此外,两种crrna的整个基因组circos图的总体脱靶模式几乎相同。通过序列标记分析,确认了pam邻近序列是相同保守的,并且两种crrna具有对pam远端序列具有更大的抗性的相同模式(图33)。

从这些结果,确认了富含u的3’突出端未损害ascpf1的高特异性。

实施例5.cpf1的多基因组编辑以及富含u的crrna在pam突变中的应用

为了确认富含u的crrna是否可以应用于最近报道的哺乳动物中的多基因组编辑,本发明人将具有23nt靶标互补序列的crrna序列插入到egfp基因的3’-utr区域中。作为比较例,将富含t的序列插入到20碱基的靶标与相邻crrna的支架之间(图34)。

作为对实施例3的大规模验证研究中包含的三种靶标进行调查的结果,可以看出,这三种靶标的插失效率水平与单独调查的靶标的相似,并且插失效率提高到通过插入富含u的序列在单个实验结果中显示的那些类似的水平。

一个小组发表了另外的研究结果,该小组产生了具有突变s542r/k607r(rr突变)和s542r/k548v/n552r(rvr突变)的两种ascpf1pam变体(gao,l.etal.engineeredcpf1variantswithalteredpamspecificities.nat.biotechnol.35,789-792(2017))。由于这两种变体分别依赖于pam序列tycv和tatv,因此这些变体显著降低了cpf1靶标范围基本上受到限制的障碍。本发明人已经确认了富含u的crrna是否可以改善针对在野生型ascpf1中观察的两种ascpf1变体的插失效率。

首先,选择三个位点作为wtascpf1和rr突变的共同靶标,并且该靶标在一条链上具有tttapam序列,并且在另一条链上具有两个ttcc和一个tccc序列(tycc)(图35)。作为实验的结果,可以看到,在所有三种情况下,富含u的crrna增强了ascpf1的插失效率,尽管效率提高的程度取决于靶标而存在差异。在靶标1和靶标2中,当通过标准crrna指导时,rr变体表现出比wtascpf1更高的插失效率,而在通过富含u的crrna指导时,效率增强略有下降。然而,在靶标3中,与rr变体相比,富含u的crrna显著改善了插失水平的效率。

接下来,将rvrascpf1变体与wtascpf1进行了比较。由于rvr变体具有识别tttvpam的特征,因此wt和rvr变体共有具有tttapam的单个靶标(图36)。如预期地,富含u的crrna改善了wt和rvr变体二者的插失效率。在这种情况下,尽管每种靶标的效率改善百分比不同,但无论靶标和ascpf1形式如何,通常都观察到富含u的crrna插失效率的增强。

由此可见,富含u的crrna可不同地用于多种靶标的遗传编辑以及在哺乳动物细胞中使用cpf1变体,从而使crispr/cpf1系统成为可适用范围更广泛的新的基因组编辑工具。

实施例6.ascpf1-富含u的crrna复合物的改善的结合亲和力的确认

如果crrna的稳定性主要提高了cpf1的活性,则根据pcr扩增产物的转染,crrna的内源水平或模式会有差异。为了确认提高的cpf1活性是由于改善的crrna的稳定性还是由于cpf1的直接调节,通过进行northern印迹分析来追踪crrna的水平(图37)。

结果,未观察到由于富含u的3’突出端导致的内源crrna水平的显著增加。

另外,为了消除对于cas9和cpf1二者根据3’-突出端和核糖核酸酶的缔合的crrna的差异降解,使用了化学修饰的指导rna,以使得3’末端的四个核苷酸为共价键合到硫代磷酸酯基团。通过如上所述的处理,可以通过防止核糖核酸外切酶对指导rna的降解来消除核酸酶耐受性的问题,从而可以研究富含u的3’突出端的作用。

结果,确认了化学修饰的富含u的crrna显示出比化学修饰的标准crrna高得多的cpf1活性。另一方面,针对cas9的化学修饰的指导rna没有显著差异(图38)。在第324版中,karvelis等人报道了对于全部spcas9活性的tracrrna的最小长度为约63nt,并且较短的长度(例如58nt)表现出降低的活性。如果聚尿苷影响了指导rna在细胞中的稳定性,则短tracrrna中富含u的3’突出端将增强spcas9活性。然而,短tracrrna中u4au4的存在不诱导cas9活性增加。然而,聚尿苷下调了spcas9对63nttracrrna的活性(图39)。通过这些结果,确认了由于富含u的3’突出端而导致活性增加的主要原因不是由于稳定性作用。

此外,通过应用两种独立的方法学方法,分析了富含u的3’突出端是否有助于crrna与cpf1分子的有益结合。

首先,应用mst技术以评估效应蛋白(spcas9和ascpf1)和其指导rna的结合特性。mst基于分子随温度梯度的定向迁移,这种效应被称为“热泳”。由于结合诱导的尺寸、电荷和溶剂化能的变化,蛋白质的热传递行为通常不同于蛋白质-配体复合物的热传递。通过测量针对结合效应蛋白滴定的配体(cy5标记的指导rna)的标准化荧光(fnorm)变化,可通过将fnorm相对于适当的浓度作图来得出解离常数kd。如下所示,与标准crrna相比,富含u的3’突出端显著提高了对ascpf1的结合亲和力。然而,富含u的3’突出端不会引起与sgrna-spcas9复合物的结合特征的可检测差异(图40)。

为了获得更多的定量结果,进行了itc分析(图41),并在ascpf1存在下滴定crrna。结果,确认了通过富含u的crrna观察到更快的热变化,并且结合常数增加了16.2倍[富含u的crrna的ka=(1.90±0.87)×108m-1,相比之下典型crrna的为(1.15±0.54)×107m-1)。确认了富含u的crrna和标准crrna的δh分别为-31.92±1.79和-22.86±1.86kcalmol-1,并且富含u的crrna和标准crrna的δs分别为-69.2和-44.4cal-1mol-1deg-1

通过这些结果,确认了富含u的3’-突出端有助于形成更稳定的crrna-ascpf1复合物,并且富含u的3’-突出端通过诱导crrna与cpf1之间的更有利的结合而改善了cpf1活性。

综上所述,主要基于本发明的一些优选实施例对本发明进行了综述。本发明所属领域的普通技术人员将能够理解,在不脱离本发明的本质特征的情况下,可以以修改的形式来实现本发明。因此,所公开的实施例不应从限制性的观点而是从解释性的观点来考虑。本发明的范围不是在上述说明中限定的,而是在权利要求中限定的,并且应当理解为等同范围内的所有差异都包括在本发明内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1