NME2CAS9-脱氨酶融合蛋白的可编程DNA碱基编辑

文档序号:26003647发布日期:2021-07-23 21:21阅读:419来源:国知局
相关申请的交叉引用本申请要求于2018年10月15日提交的美国临时专利申请号62/745,666的优先权,其全部内容通过引用并入本文。本发明涉及基因编辑领域。特别地,基因编辑针对单核苷酸碱基编辑。例如,这样的单核苷酸碱基编辑导致c·g碱基对向t·a碱基对的转化。本文公开的单核苷酸碱基基因编辑器的高准确度和高精度是通过与核苷酸脱氨酶蛋白融合的nmecas9核酸酶实现的。与大量相容的前间区序列邻近基序偶联的nmecas9的紧凑性质使得本文所设想的cas9融合构建体具有基因编辑窗口,该窗口可以编辑其他常规spycas9基础编辑器平台无法靶向的位点。
背景技术
::许多人类疾病是由于单个碱基的突变而引起的。在治疗这些遗传病症中,纠正这样的遗传畸变的能力至关重要。聚簇的规则间隔的短回文重复序列(crispr)与crispr相关(cas)蛋白一起构成古细菌和细菌中的rna指导的适应性免疫系统。这些系统通过靶向和灭活源自外源遗传元件的核酸来提供免疫力。spycas9碱基编辑平台由于其受限的编辑窗口而不能用于靶向所有单碱基突变。编辑窗口部分受到对nggpam的要求以及所编辑的碱基与pam的非常精确的距离的要求的限制。spycas9还与基因组编辑中的高脱靶效应固有地相关。本领域中需要的是一种高度准确的cas9单碱基编辑平台,该平台由于识别pam位点的多样群体而具有可编程的靶标特异性。技术实现要素:本发明涉及基因编辑领域。特别地,基因编辑针对单核苷酸碱基编辑。例如,这样的单核苷酸碱基编辑导致c·g碱基对向t·a碱基对的转化。本文公开的单核苷酸碱基基因编辑器的高准确度和高精度是通过与核苷酸脱氨酶蛋白融合的nmecas9核酸酶实现的。与大量相容的前间区序列邻近基序偶联的nmecas9的紧凑性质使得本文所设想的cas9融合构建体具有基因编辑窗口,该基因编辑窗口优于其他常规spycas9碱基编辑器平台。在一个实施方案中,本发明涉及一种突变的nmecas9蛋白,其包含融合的核苷酸脱氨酶和针对n4cc核苷酸序列的结合区。在一个实施方案中,所述蛋白是nme2cas9。在一个实施方案中,所述蛋白还包含核定位信号蛋白。在一个实施方案中,所述核苷酸脱氨酶是胞苷脱氨酶。在一个实施方案中,所述核苷酸脱氨酶是腺苷脱氨酶。在一个实施方案中,所述蛋白还包含尿嘧啶糖基化酶抑制剂。在一个实施方案中,所述核定位信号蛋白包括但不限于核质蛋白(nls)和/或sv40nls和/或c-mycnls。在一个实施方案中,所述结合区是前间区序列辅助基序相互作用结构域。在一个实施方案中,所述前间区序列辅助基序相互作用结构域包含所述突变。在一个实施方案中,所述突变是d16a突变。在一个实施方案中,所述突变的nmecas9蛋白还包含cbe4。在一个实施方案中,所述突变的nmecas9蛋白还包含接头。在一个实施方案中,所述接头是73aa接头。在一个实施方案中,所述接头是3xha标签。在一个实施方案中,本发明涉及一种构建体,其中所述构建体是优化的nnme2cas9-abemax。在一个实施方案中,本发明涉及一种构建体,其中所述构建体是nnme2cas9-cbe4。在一个实施方案中,本发明涉及一种构建体,其中所述构建体是ye1-be3-nnme2cas9(d16a)-ugi。在一个实施方案中,本发明涉及包含突变的nmecas9蛋白的腺相关病毒,所述突变的nmecas9蛋白包含融合的核苷酸脱氨酶和针对n4cc核苷酸序列的结合区。在一个实施方案中,所述病毒是腺相关病毒8。在一个实施方案中,所述病毒是腺相关病毒6。在一个实施方案中,所述蛋白是nme2cas9。在一个实施方案中,所述蛋白还包含核定位信号蛋白。在一个实施方案中,所述核苷酸脱氨酶是胞苷脱氨酶。在一个实施方案中,所述核苷酸脱氨酶是腺苷脱氨酶。在一个实施方案中,所述蛋白还包含尿嘧啶糖基化酶抑制剂。在一个实施方案中,核定位信号蛋白包括但不限于核质蛋白(nls)和/或sv40nls和/或c-mycnls。在一个实施方案中,所述结合区是前间区序列辅助基序相互作用结构域。在一个实施方案中,所述前间区序列辅助基序相互作用结构域包含所述突变。在一个实施方案中,所述突变是d16a突变。在一个实施方案中,所述突变的nmecas9蛋白还包含cbe4。在一个实施方案中,所述突变的nmecas9蛋白还包含接头。在一个实施方案中,所述接头是73aa接头。在一个实施方案中,所述接头是3xha标签。在一个实施方案中,本发明涉及一种构建体,其中所述构建体是优化的nnme2cas9-abemax。在一个实施方案中,本发明涉及一种构建体,其中所述构建体是nnme2cas9-cbe4。在一个实施方案中,本发明涉及一种构建体,其中所述构建体是ye1-be3-nnme2cas9(d16a)-ugi。在一个实施方案中,本发明涉及一种方法,其包括:a)提供;i)包含具有突变的单碱基的基因的核苷酸序列,其中所述基因的两侧为n4cc核苷酸序列;ii)突变的nmecas9蛋白,其包含融合的核苷酸脱氨酶和针对所述n4cc核苷酸序列的结合区;b)在使得所述结合区附着于所述n4cc核苷酸序列的条件下,使所述核苷酸序列与所述突变的nmecas9蛋白接触;和c)利用所述突变的nmecas9蛋白用野生型碱基替代所述突变的单碱基。在一个实施方案中,所述蛋白是nme2cas9。在一个实施方案中,所述蛋白还包含核定位信号蛋白。在一个实施方案中,所述核苷酸脱氨酶是胞苷脱氨酶。在一个实施方案中,所述核苷酸脱氨酶是腺苷脱氨酶。在一个实施方案中,所述蛋白还包含尿嘧啶糖基化酶抑制剂。在一个实施方案中,核定位信号蛋白包括但不限于核质蛋白(nls)和/或sv40nls和/或c-mycnls。在一个实施方案中,所述结合区是前间区序列辅助基序相互作用结构域。在一个实施方案中,所述前间区序列辅助基序相互作用结构域包含所述突变。在一个实施方案中,所述突变是d16a突变。在一个实施方案中,所述突变的nmecas9蛋白还包含cbe4。在一个实施方案中,所述突变的nmecas9蛋白还包含接头。在一个实施方案中,所述接头是73aa接头。在一个实施方案中,所述接头是3xha标签。在一个实施方案中,所述基因编码酪氨酸酶。在一个实施方案中,所述基因是fah。在一个实施方案中,所述基因是c-fos。在一个实施方案中,本发明涉及一种方法,其包括:a)提供;i)包含核苷酸序列的患者,所述核苷酸序列含有具有突变的单碱基的基因,其中所述基因的两侧为n4cc核苷酸序列,其中所述突变的基因引起基于遗传的医学病况;ii)包含突变的nmecas9蛋白的腺相关病毒,所述突变的nmecas9蛋白包含融合的核苷酸脱氨酶和针对所述n4cc核苷酸序列的结合区;b)在使得所述突变的nmecas9蛋白用野生型单碱基替代所述突变的单碱基的条件下,用所述腺相关病毒处理所述患者,使得不发展所述基于遗传的医学病况。在一个实施方案中,所述基因编码酪氨酸酶蛋白。在一个实施方案中,所述基于遗传的医学病况是酪氨酸血症。在一个实施方案中,所述病毒是腺相关病毒8。在一个实施方案中,所述病毒是腺相关病毒6。在一个实施方案中,所述蛋白是nme2cas9。在一个实施方案中,所述蛋白还包含核定位信号蛋白。在一个实施方案中,所述核苷酸脱氨酶是胞苷脱氨酶。在一个实施方案中,所述核苷酸脱氨酶是腺苷脱氨酶。在一个实施方案中,所述蛋白还包含尿嘧啶糖基化酶抑制剂。在一个实施方案中,核定位信号蛋白包括但不限于核质蛋白(nls)和/或sv40nls和/或c-mycnls。在一个实施方案中,所述结合区是前间区序列辅助基序相互作用结构域。在一个实施方案中,所述前间区序列辅助基序相互作用结构域包含所述突变。在一个实施方案中,所述突变是d16a突变。在一个实施方案中,所述突变的nmecas9蛋白还包含cbe4。在一个实施方案中,所述突变的nmecas9蛋白还包含接头。在一个实施方案中,所述接头是73aa接头。在一个实施方案中,所述接头是3xha标签。在一个实施方案中,所述基因编码酪氨酸酶。在一个实施方案中,所述基因是fah。在一个实施方案中,所述基因是c-fos。在一个实施方案中,本发明涉及一种方法,其包括:a)提供;i)包含核苷酸序列的患者,所述核苷酸序列包含具有突变的单碱基的基因,其中所述基因的两侧为n4cc核苷酸序列,其中所述突变的基因引起基于遗传的医学病况;ii)优化的nnme2cas9-abemax,其包含突变的nmecas9蛋白,所述突变的nmecas9蛋白包含融合的核苷酸脱氨酶和针对所述n4cc核苷酸序列的结合区;b)在使得所述突变的nmecas9蛋白用野生型单碱基替代所述突变的单碱基的条件下,用所述优化的nnme2cas9-abemax处理所述患者,使得不发展所述基于遗传的医学病况。在一个实施方案中,本发明涉及一种方法,其包括:a)提供;i)包含核苷酸序列的患者,所述核苷酸序列包含具有突变的单碱基的基因,其中所述基因的两侧为n4cc核苷酸序列,其中所述突变的基因引起基于遗传的医学病况;ii)nnme2cas9-cbe4,其包含突变的nmecas9蛋白,所述突变的nmecas9蛋白包含融合的核苷酸脱氨酶和针对所述n4cc核苷酸序列的结合区;b)在使得所述突变的nmecas9蛋白用野生型单碱基替代所述突变的单碱基的条件下用所述nnme2cas9-cbe4处理所述患者,使得不发展所述基于遗传的医学病况。在一个实施方案中,本发明涉及一种方法,其包括:a)提供;i)包含核苷酸序列的患者,所述核苷酸序列包含具有突变的单碱基的基因,其中所述基因的两侧为n4cc核苷酸序列,其中所述突变的基因引起基于遗传的医学病况;ii)ye1-be3-nnme2cas9(d16a)-ugi,其包含突变的nmecas9蛋白,所述突变的nmecas9蛋白包含融合的核苷酸脱氨酶和针对所述n4cc核苷酸序列的结合区;b)在使得所述突变的nmecas9蛋白用野生型单碱基替代所述突变的单碱基的条件下用所述nnme2cas9-cbe4处理所述患者,使得不发展所述基于遗传的医学病况。定义为了促进对本发明的理解,下面定义了许多术语。本文所定义的术语具有与本发明有关的领域的普通技术人员通常理解的含义。诸如“一个”、“一种”和“该”之类的术语并不旨在仅指单数实体,而是包括通用类别,其的特定实例可用于举例说明。本文中的术语用于描述本发明的特定实施方案,但是除了权利要求中概述的以外,它们的使用不限制本发明。如本文所用,术语“编辑”、“经编辑”或“编辑的”是指通过选择性删除特定的基因组靶标来改变多核苷酸的核酸序列(例如,野生型天然存在的核酸序列或突变的天然存在的序列)的方法。这样的特定基因组靶标包括但不限于染色体区域、基因、启动子、开放阅读框或任何核酸序列。如本文所用,术语“单碱基”是指核酸序列内的一个且仅一个核苷酸。当在单碱基编辑的上下文中使用时,其是指用不同的碱基替代核酸序列内特定位置的碱基。这样的替代可以通过许多机制发生,包括但不限于取代或修饰。如本文所用,术语“靶标”或“靶位点”是指任何组成和/或长度的预先鉴定的核酸序列。这样的靶位点包括但不限于染色体区域、基因、启动子、开放阅读框或任何核酸序列。在一些实施方案中,本发明用grna的互补序列询问这些特定的基因组靶序列。如本文所用,术语“中靶结合序列”是指可以与可编程的dna结合结构域和/或单个指导rna序列完全互补的特定基因组靶标的子序列。如本文所用,术语“脱靶结合序列”是指可以与可编程的dna结合结构域和/或单个指导rna序列部分互补的特定基因组靶标的子序列。如本文所用,术语“有效量”是指包含达到临床有益结果(即,例如,减轻症状)的治疗剂的药物组合物的特定量。这样的组合物的毒性和治疗功效可通过细胞培养或实验动物中的标准药学程序来确定,例如用于确定ld50(使群体的50%死亡的剂量)和ed50(在50%的群体中治疗有效的剂量)。毒性和治疗效果之间的剂量比是治疗指数,并且其可以表示为比率ld50/ed50。表现出高治疗指数的化合物是优选的。从这些细胞培养测定和其他动物研究中获得的数据可用于配制用于人类使用的一系列剂量。这样的化合物的剂量优选在包括几乎没有或没有毒性的ed50的循环浓度的范围内。取决于所采用的剂型、患者的敏感性和施用途径,剂量在此范围内变化。如本文所用,术语“症状”是指患者观察到的疾病或身体不适的任何主观或客观证据。例如,主观证据通常基于患者的自我报告,并且可以包括但不限于疼痛、头痛、视觉障碍、恶心和/或呕吐。可替代地,客观证据通常是医学测试的结果,包括但不限于体温、全血细胞计数、脂质组(lipidpanel)、甲状腺组(thyroidpanel)、血压、心率、心电图、组织和/或身体成像扫描。如本文所用,术语“疾病”或“医学病况”是指活动物体或植物体或其部分之一的正常状态的任何中断或改变重要功能的执行的损害。通常表现为明显的体征和症状,其通常是针对以下的反应:i)环境因素(如营养不良、工业危害或气候);ii)特定的传染物(如蠕虫、细菌或病毒);iii)有机体的固有缺陷(如遗传异常);和/或iv)这些因素的组合。当涉及相对于经治疗的受试者,未经治疗的受试者中任何症状的表达时,术语“减轻”、“抑制”、“减少”、“阻止”、“降低”、“防止”和语法等价形式(包括“较低”、“较小”等)意指经治疗的受试者中症状的量和/或程度比未经治疗的受试者低由任何医学训练人员认为在临床上相关的任何量。在一个实施方案中,所治疗的受试者中症状的量和/或严重程度比未经治疗的受试者中症状的量和/或严重程度低至少10%,低至少25%,低至少50%,低至少75%和/或低至少90%。如本文所用,术语“附着”是指介质(或承载体)与药物之间的任何相互作用。附着可以是可逆的或不可逆的。这样的附着包括但不限于共价键合、离子键合、范德华力或摩擦力等。如果药物浸渍、掺入、包被在介质(或承载体)中、与介质(或承载体)处于悬浮液中、与介质(或承载体)处于溶液中或与介质(或承载体)混合,则药物附着至该介质(或承载体)。如本文所用,术语“药物”或“化合物”是指能够被施用以实现所需效果的任何药理活性物质。药物或化合物可以是合成的或天然存在的非肽、蛋白质或肽、寡核苷酸或核苷酸、多糖或糖。如本文所用,术语“施用”或“给药”是指向患者提供组合物以使该组合物对患者具有预期作用的任何方法。示例性的施用方法是通过直接机制例如局部组织施用(即,例如血管外放置)、口服、透皮贴剂、局部、吸入、栓剂等。如本文所用,术语“患者”或“受试者”是人或动物,并且不需要是住院的。例如,门诊患者、疗养院中的人是“患者”。患者可以包括任何年龄的人类或非人类动物,因此包括成年和未成年人(即儿童)。术语“患者”并不意味着需要医学治疗,因此,患者可以自愿或非自愿地参与实验,无论是临床的还是支持基础科学研究。如本文所用,术语“亲和力”是指物质或颗粒之间引起它们进入并保持化学组合的任何吸引力。例如,与具有低亲和力的抑制剂相比,对受体具有高亲和力的抑制剂化合物将提供更大的防止受体与其天然配体相互作用的功效。如本文所用,术语“药学上”或“药学上可接受的”是指当施用于动物或人时不会产生不利、过敏或其他不良反应的分子实体和组合物。如本文所用,术语“药学上可接受的承载体”包括任何和所有溶剂或分散介质,包括但不限于水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)、其合适的混合物,以及植物油、包衣、等渗和吸收延迟剂、脂质体、市售清洁剂等。补充的生物活性成分也可以掺入这样的承载体中。术语“病毒载体”涵盖能够掺入异源核酸序列以用于在宿主生物中表达的源自病毒基因组的任何核酸构建体。例如,这样的病毒载体可以包括但不限于腺相关病毒载体,慢病毒载体,sv40病毒载体,逆转录病毒载体,腺病毒载体。尽管病毒载体有时从病原性病毒产生,但它们可以以最小化其整体健康风险的方式进行修饰。这通常涉及参与病毒复制的一部分病毒基因组的删除。这样的病毒可以有效感染细胞,但是感染发生后,该病毒可能需要辅助病毒来提供缺失的蛋白以用于产生新的病毒体。优选地,病毒载体应该对其感染的细胞的生理学具有最小的影响,并表现出遗传稳定的特性(例如,不经历自发的基因组重排)。大多数病毒载体经改造以感染尽可能多的细胞类型。即使这样,也可以修饰病毒受体以将病毒靶向至特定种类的细胞。以这样的方式修饰的病毒被称为是假病毒。病毒载体通常被改造以掺入有助于鉴定吸收了病毒基因的细胞的某些基因。这些基因被称为标记基因。例如,常用的标记基因赋予针对某种抗生素的抗生素抗性。如本文所用,“rosa26基因”或“rosa26基因”是指广泛用于在小鼠中实现一般性表达的人或小鼠(分别)基因座。可以通过在原始基因捕获线上游约248bp的唯一的xbai位点上将所需基因导入基因座的第一个内含子来实现对rosa26基因座的靶向。可以使用腺病毒剪接受体随后是在唯一的xbai位点上插入的感兴趣的基因和聚腺苷酸化位点来构建构建体。新霉素抗性盒也可以包括在靶向载体中。如本文所用,“pcsk9基因”或“pcsk9基因”是指编码pcsk9蛋白的人或小鼠(分别)基因座。pcsk9基因位于1号染色体上的1p32.3带,并包含13个外显子。该基因可以通过选择性剪接产生至少两种异构体。术语“蛋白质原转化酶枯草杆菌蛋白酶/kexin9型”和“pcsk9”是指由调节低密度脂蛋白水平的基因编码的蛋白。蛋白质原转化酶枯草杆菌蛋白酶/kexin9型,也称为pcsk9,是一种在人中由pcsk9基因编码的酶。seidah等人,"thesecretoryproproteinconvertaseneuralapoptosis-regulatedconvertase1(narc-1):liverregenerationandneuronaldifferentiation"proc.natl.acad.sci.u.s.a.100(3):928–933(2003)。在许多物种中发现了相似的基因(直系同源基因)。包括psck9在内的许多酶在首次合成时都是无活性的,因为它们具有阻断其活性的一部分肽链;蛋白质原转化酶去除该部分以激活该酶。据信psck9在胆固醇稳态中起调节作用。例如,pcsk9可以与低密度脂蛋白受体(ldl-r)的表皮生长因子样重复序列a(egf-a)结构域结合,从而导致ldl-r内在化和降解。显然,将预期降低的ldl-r水平导致减少的ldl-c代谢,这导致高胆固醇血症。如本文所用,术语“高胆固醇血症”是指其中血液胆固醇水平升高到高于临床推荐水平的任何医学病况。例如,如果使用低密度脂蛋白(ldl)测量胆固醇,则如果测量的ldl水平高于例如大约70mg/dl,则可能存在高胆固醇血症。可替代地,如果使用游离血浆胆固醇测量胆固醇,如果测得的游离胆固醇水平高于例如大约200-220mg/dl,则可能存在高胆固醇血症。如本文所用,术语“crispr”或“聚簇的规则间隔的短回文重复序列”是指包含碱基序列的多个短的直接的重复序列的dna基因座的首字母缩写。每个重复序列包含一系列碱基,后接30个左右的碱基对,称为“间隔子dna”。间隔子是来自病毒的dna的短片段,并可以用作过去暴露的“记忆”,以促进针对未来入侵的适应性防御。如本文所用,术语“cas”或“crispr相关(cas)”是指通常与crispr重复间隔子阵列相关的基因。如本文所用,术语“cas9”是指来自ii型crispr系统的核酸酶,该酶专门用于在dna中产生双链断裂,其具有两个活性切割位点(hnh和ruvc结构域),各自针对双螺旋的一条链。jinek将tracrrna和间隔子rna组合成“单指导rna”(sgrna)分子,该分子与cas9混合,可以通过sgrna内的指导序列与靶dna序列之间的watson-crick配对找到并切割dna靶。如本文所用,术语“前间区序列邻近基序”(或pam)是指cas9/sgrna形成r环以通过其指导rna与基因组的watson-crick配对询问特定dna序列可能所需的dna序列。pam特异性可以是cas9蛋白(例如,cas9的c末端的“前间区序列邻近基序识别结构域”)的dna结合特异性的函数。如本文所用,术语“sgrna”是指与crispr相关系统(cas)结合使用的单指导rna。sgrna是crrna和tracrrna的融合体,并且包含与所需靶位点互补的核苷酸序列。jinek等人,“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity”science337(6096):816-821(2012)。sgrna与靶位点的watson-crick配对允许r环形成,其与功能性pam结合允许dna切割,或者在核酸酶缺陷的情况下,cas9允许与该基因座的dna结合。如本文所用,术语“荧光蛋白”是指包含响应于适当的波长而发出荧光的至少一个有机化合物部分的蛋白结构域。例如,荧光蛋白可以发射红色、蓝色和/或绿色的光。这样的蛋白可容易地商购获得,包括但不限于:i)mcherry(clonetechlaboratories):激发:556/20nm(波长/带宽);发射:630/91nm;ii)sfgfp(invitrogen):激发:470/28nm;发射:512/23nm;iii)tagbfp(evrogen):激发387/11nm;发射464/23nm。如本文所用,术语“sgrna”是指与crispr相关系统(cas)结合使用的单指导rna。sgrna包含与所需靶位点互补的核苷酸序列。sgrna与靶位点的watson-crick配对招募核酸酶缺陷的cas9以在该基因座处结合dna。如本文所用,术语“正交”是指靶标不重叠、不相关或是独立的。例如,如果实施与不同效应结构域融合的两个正交的核酸酶缺陷的cas9基因,则针对每一个编码的sgrna不会相互干扰或重叠。并非所有核酸酶缺陷的cas9基因同样地起作用,这使得融合到不同效应结构域的正交核酸酶缺陷的cas9基因的使用能够提供适当的正交sgrna。如本文所用,术语“表型改变”或“表型”是指生物体的可观察的特征或性状(例如其形态、发育、生化或生理特性、物候、行为和行为产物)的组合。表型是由生物体基因的表达以及环境因素的影响以及两者之间的相互作用引起的。如本文所用,“核酸序列”和“核苷酸序列”是指寡核苷酸或多核苷酸及其片段或部分,以及指可以是单链或双链的并代表正义或反义链的基因组或合成来源的dna或rna。如本文所用,术语“分离的核酸”是指已经从其天然状态移除(例如,从细胞移除并且在优选的实施方案中不含其他基因组核酸)的任何核酸分子。如本文所用,术语“氨基酸序列”和“多肽序列”是可互换的,并且是指氨基酸序列。如本文所用,术语“部分”在涉及蛋白质时(如在“给定蛋白的一部分”中)是指所述蛋白质的片段。片段的大小范围可以从四个氨基酸残基到整个氨基酸序列减去一个氨基酸。当关于核苷酸序列使用时,术语“部分”是指该核苷酸序列的片段。片段的大小范围可以从5个核苷酸残基到整个核苷酸序列减去一个核酸残基。如本文所用,术语“互补的”或“互补性”是关于通过碱基配对规则叙述的“多核苷酸”和“寡核苷酸”(它们是指核苷酸的序列的可互换术语)使用的。例如,序列“c-a-g-t”与序列“g-t-c-a”互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则不匹配。核酸之间的“全部”或“完全”互补性是其中在碱基配对规则下,每个核酸碱基与另一个碱基匹配。核酸链之间的互补性程度对核酸链之间的杂交效率和强度具有重要影响。这在扩增反应以及依赖于核酸之间结合的检测方法中特别重要。如本文所用,关于核苷酸序列的术语“同源性”和“同源的”是指与其他核苷酸序列的互补程度。可以存在部分同源性或完全同源性(即同一性)。与核酸序列部分互补,即“大体上同源”的核苷酸序列是至少部分抑制完全互补序列与靶核酸序列杂交的核苷酸序列。可以在低严格性条件下使用杂交测定法(southern或northern印迹,溶液杂交等)来检查完全互补序列与靶序列的杂交的抑制。大体上同源的序列或探针将在低严格性条件下竞争并抑制完全同源的序列与靶序列的结合(即杂交)。这并不是说低严格性的条件是允许非特异性结合的;低严格性条件要求两个序列彼此的结合是特异性的(即选择性的)相互作用。可以通过使用缺乏甚至部分的互补程度(例如,小于约30%同一性)的第二靶序列来测试是否存在非特异性结合;在没有非特异性结合的情况下,探针将不与第二非互补靶杂交。如本文所使用的关于氨基酸序列的术语“同源性”和“同源的”是指两个氨基酸序列之间的一级结构的同一性程度。这样的同一性程度可以针对每个氨基酸序列的一部分,或者针对氨基酸序列的整个长度。“大体上同源”的两个或更多个氨基酸序列可以具有至少50%的同一性,优选至少75%的同一性,更优选至少85%的同一性,最优选至少95%或100%的同一性。在本文中,作为“同源物”的寡核苷酸序列被定义为当比较具有100bp或更大的长度的序列时,与序列表现出大于或等于50%同一性的寡核苷酸序列。低严格性条件包括等同于在当使用长度为约500个核苷酸的探针时,在42℃下在由5xsspe(43.8g/lnacl,6.9g/lnah2po4·h2o和1.85g/ledta,ph用naoh调节至7.4)、0.1%sds、5xdenhardt试剂(每500ml50xdenhardt包含:5gficoll(400型,pharmacia),5gbsa(级分v;sigma))和100μg/ml变性鲑鱼精子dna组成的溶液中结合或杂交然后在42℃下在包含5xsspe和0.1%sds的溶液中洗涤的条件。也可以采用许多等效条件来构成低严格性条件;因素例如探针的长度和性质(dna、rna、碱基组成)和靶标的性质(dna、rna、碱基组成、存在于溶液中或固定化等)以及盐和其他组分的浓度(例如,甲酰胺、硫酸葡聚糖、聚乙二醇的存在或不存在)以及杂交溶液的组分可以改变以产生与上文列出的条件不同但等效的低严格性杂交条件。另外,还可以使用促进在高严格性条件下的杂交的条件(例如,提高杂交和/或洗涤步骤的温度,在杂交溶液中使用甲酰胺等)。如本文所用,术语“杂交”是关于使用其中核酸链通过碱基配对与互补链结合以形成杂交复合物的任何过程的互补核酸的配对所使用的。杂交和杂交强度(即核酸之间的缔合强度)受诸如以下的因素的影响:核酸之间的互补程度,所涉及条件的严格性,形成的杂合体的tm和核酸内的g:c比率。如本文所用,术语“杂交复合物”是指由于互补的g和c碱基之间以及互补的a和t碱基之间的氢键的形成而在两个核酸序列之间形成的复合物;这些氢键可通过碱基堆积相互作用进一步稳定。两个互补核酸序列以反平行构型氢键合。杂交复合物可以在溶液中形成(例如,c0t或r0t分析),或可以在溶液中存在的一个核酸序列与固定在固相支持物(例如,southern和northern印迹、斑点印迹中使用的尼龙膜或硝酸纤维素滤膜或原位杂交,包括fish(荧光原位杂交)中使用的载玻片)上的另一个核酸序列之间形成。dna分子被称为具有“5'末端”和“3'末端”,因为单核苷酸以一个单核苷酸戊糖环的5'磷酸通过磷酸二酯键联附着至其邻居的3'氧的方式进行反应以生成寡核苷酸。因此,如果寡核苷酸的5'磷酸不与单核苷酸戊糖环的3'氧连接,则将该寡核苷酸的末端称为“5'末端”。如果寡核苷酸的3'氧未与另一个单核苷酸戊糖环的5'磷酸连接,则将该寡核苷酸的末端称为“3'末端”。如本文所用,即使在较大的寡核苷酸内部,核酸序列也可以被认为具有5'和3'末端。在线性或环状dna分子中,离散元件被称为“上游”或5'或“下游”或3'元件。该术语反映了这样一个事实,即转录沿着dna链以5'到3'的方式进行。指导连接基因的转录的启动子和增强子元件通常位于编码区的5'或上游。然而,即使位于启动子元件和编码区的3',增强子元件也可以发挥其作用。转录终止和聚腺苷酸化信号位于编码区的3'或下游。术语“转染”或“转染的”是指将外源dna引入细胞。如本文所用,术语“核酸分子编码”、“dna序列编码”和“dna编码”是指沿着脱氧核糖核酸链的脱氧核糖核苷酸的顺序或序列。这些脱氧核糖核苷酸的顺序决定了沿着多肽(蛋白)链的氨基酸的顺序。因此,dna序列编码氨基酸序列。如本文所用,术语“基因”是指脱氧核糖核苷酸序列,其包含结构基因的编码区,并且包含位于5'和3'末端上在任一末端上约1kb距离的与编码区相邻的序列,使得该基因与全长mrna的长度相对应。位于编码区5'并且存在于mrna上的序列被称为5'非翻译序列。位于编码区3'或下游并且存在于mrna上的序列被称为3'非翻译序列。术语“基因”涵盖基因的cdna和基因组形式。基因的基因组形式或克隆包含被非编码序列打断的编码区,所述非编码序列被称为“内含子”或“插入区”或“插入序列”。内含子是被转录成异质核rna(hnrna)的基因区段;内含子可包含调控元件,例如增强子。内含子从核转录物或初级转录物中被去除或“剪接掉”;因此,信使rna(mrna)转录物中不存在内含子。mrna在翻译过程中起作用,以指定新生多肽中氨基酸的序列或顺序。除包含内含子外,基因的基因组形式还可包含位于存在于rna转录物上的序列的5'和3'末端的序列。这些序列被称为“侧翼”序列或区域(这些侧翼序列位于存在于mrna转录物上的非翻译序列的5'或3')。5′侧翼区可包含控制或影响基因转录的调控序列,例如启动子和增强子。3′侧翼区可包含指导转录终止、转录后切割和聚腺苷酸化的序列。本文使用的术语“标记”或“可检测标记”是指可通过光谱、光化学、生物化学、免疫化学、电学、光学或化学手段检测的任何组合物。这样的标记包括用于用标记的链霉亲和素缀合物染色的生物素,磁珠(例如),荧光染料(例如荧光素,得克萨斯红,罗丹明,绿色荧光蛋白等),放射性标记(例如3h、125i、35s、14c或32p),酶(例如辣根过氧化物酶,碱性磷酸酶和elisa中常用的其他酶)和量热标记,例如胶体金或有色玻璃或塑料(例如聚苯乙烯,聚丙烯,乳胶等)珠子。教导这样的标记的使用的专利包括但不限于美国专利号3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149;和4,366,241(全部通过引用整体并入本文)。本发明中考虑的标记可以通过许多方法来检测。例如,可以使用胶片或闪烁计数器来检测放射性标记,可以使用光电检测器检测发射的光来检测荧光标记。通常通过向酶提供底物并检测通过酶在底物上的作用产生的反应产物来检测酶标记,以及通过简单地可视化有色标记来检测量热标记。附图简要说明专利或申请文件包含至少一幅彩色附图。专利局将根据要求并在提供必要的费用后提供带有彩色附图的本专利或专利申请公开的副本。图1示出了nmecas9脱氨酶融合蛋白单碱基编辑器的示例性示意性实施方案和碱基编辑器的示例性构建质粒。图1a显示了示例性的ye1-be3-nnme2cas9(d16a)-ugi构建体。图1b显示了示例性的abe7.10nnme2cas9(d16a)构建体。图1c显示了包含两个sv40nls序列的示例性abe7.10-nnme2cas9(d16a)构建体。图1d显示了示例性的nnme2cas9-cbe4(也称为be4-nnme2cas9(d16a)-ugi-ugi)构建体。图1e显示了示例性的优化的nnme2cas9-abemax构建体。图2呈现了用包含通过核转染在hek293t细胞中有效地将内源性靶位点25(ts25)处的c转化为t的ye1-be3-nnme2cas9(d16a)-ugi融合蛋白的dna质粒对hek293t细胞的电穿孔的示例性数据。图2a显示了ts25内源性靶位点的示例性序列(在黑色矩形内)。gn23sgrna与靶dna链碱基配对,留下取代的dna链用于胞苷脱氨酶进行编辑(例如新的绿色核苷酸)。图2b显示了示例性测序数据,该数据显示了双峰核苷酸峰(从5’末端起的第7个位置;箭头),表明从胞苷到胸苷的成功单碱基编辑(例如,将c·g碱基对转化为t·a碱基对)。图2c显示了图2b中所示数据的示例性定量,绘制了c→t单碱基编辑的转化百分比。在经碱基编辑器和sgrna处理的样品中,c转化为t的百分比为约40%(p值=6.88x10-6)。“无sgrna”对照显示由于sanger测序而产生的背景噪音。使用editr(kluesner等人,2018)进行分析。图3呈现了示例性的特定ugi靶位点,其分别整合到ye1-be3-nnme2cas9/d16a突变融合蛋白中,并与增强型绿色荧光蛋白(egfp)共表达在稳定的k562衍生的细胞系中。经转化的碱基以橙色突出显示。使用阴性对照样品(没有sgrna构建体的ye1-be3-nnme2cas9核转染的k562细胞)过滤背景信号。n4ccpam被框出。右栏中显示了在碱基编辑器靶向的位点中表现出突变的总读数的百分比。图3a显示了示例性的egfp-位点1。图3b显示了示例性的egfp-位点2。图3c显示了示例性的egfp-位点3。图3d显示了示例性的egfp-位点4。图3e显示了示例性深度测序分析,其表明ye1-be3-nnme2cas9在内源性c-fos启动子区域将c残基转化为t残基的位置。右栏中显示了在碱基编辑器靶向的位点中表现出突变的总读数的百分比。经转化的碱基以橙色或黄色突出显示。使用阴性对照样品过滤背景信号。最高的编辑百分比是32.50%。图3f显示了示例性深度测序分析,其表明abe7.10-nnme2cas9或abemax(koblan等人,2018)-nnme2cas9在内源性c-fos启动子区域将a残基转化为g残基。右栏中显示了在碱基编辑器靶向的位点中表现出突变的总读数的百分比。经转化的碱基以橙色突出显示。使用阴性对照样品过滤背景信号。abe7.10-nnme2cas9的编辑百分比为0.53%,abemax-nnme2cas9(d16a)的编辑百分比为2.33%。图4呈现了野生型fah基因与酪氨酸血症fah突变基因的示例性比对,其显示了a-g单碱基基因编辑靶位点(位置9)。指示了相应的spycas9单pam位点和nmecas9双pam位点,以用于展示相对于spycas9pam位点的次优靶向窗口。图5示出了具有不同pam的示例性三个紧凑相关的脑膜炎奈瑟氏球菌(neisseriameningitidis)cas9直系同源物。图5a显示了一个示例性示意图,其显示了映射到nme1cas9的预测结构上的nme2cas9(左)和nme3cas9(右)之间的突变残基(橙色球),揭示了pid中的突变簇(黑色)。图5b显示了使用10-bp随机pam区域的体外pam发现测定的示例性实验工作流程。体外消化后,将衔接子连接至切割产物以用于文库构建和测序。图5c显示了由体外pam发现产生的示例性序列标识揭示了对nme1cas9的n4gattpam的富集,与其先前建立的特异性一致。图5d显示了示例性序列标识,其表明其pid与nme2cas9(左)或nme3cas9(右)的pid交换的nme1cas9需要在pam位置5处的c。由于pid交换的蛋白嵌合体的较小的切割效率,剩余的核苷酸未以高置信度测定(参见图6c)。图5e显示了示例性序列标识,其显示了全长nme2cas9识别n4ccpam,这基于在pam位置5具有固定的c并且具有随机化的pamnt1-4和6-8的靶标库的有效底物切割。图6呈现了如与图5相关的具有快速发展的pid的脑膜炎奈瑟氏球菌cas9直系同源物的表征。图6a显示了与nme1cas9>80%同一的nmecas9直系同源物的示例性无根系统发生树。出现了三个不同的分支,大多数突变聚集在pid中。组1(蓝色)、2(橙色)和3(绿色)具有与nme1cas9分别具有>98%、~52%和~86%同一性的pid。指出了三个代表性的cas9直系同源物(每组一个)(nme1cas9、nme2cas9和nme3cas9)。图6b显示了示例性示意图,其显示了编码来自(a)的三个cas9直系同源物(nme1cas9、nme2cas9和nme3cas9)的菌株的crispr-cas基因座。显示了每个crispr-cas组分与脑膜炎奈瑟氏球菌8013(编码nme1cas9)的同一性百分比。蓝色和红色箭头分别表示pre-crrna和tracrrna转录起始位点。图6c显示绘制了针对完整的nme1cas9(灰色)、针对其中nme1cas9的pid与nme2cas9和nme3cas9的pid交换的嵌合体(混合色)和针对全长nme2cas9(橙色)的体外测定的切割dna的示例性标准化读数计数(总读数的百分比)。减少的标准化读数计数表明嵌合体中较低的切割效率。图6d显示了通过nme1cas9的pid与nme2cas9(左)或nme3cas9(右)的pid交换在nnnncnnnpam库上进行的体外pam发现测定的示例性序列标识。图7呈现了示例性数据,该数据显示nme2cas9使用22-24nt间隔子编辑与n4ccpam邻近的位点。所有实验均一式三份进行,误差棒代表平均值的标准误差(s.e.m.)。图7a显示了描绘hek293ttlr2.0细胞的瞬时转染和编辑的示例性示意图,其中在转染后72小时通过流式细胞术检测mcherry+细胞。图7b显示了tlr2.0报告因子的示例性nme2cas9编辑。具有n4ccpam的位点以不同的效率被靶向,而在n4gattpam上或在没有sgrna的情况下未观察到nme2cas9靶向。spycas9(靶向先前已验证的具有nggpam的位点)和nme1cas9(靶向n4gatt)用作阳性对照。图7c显示了间隔子长度对nme2cas9编辑效率的示例性影响。靶向单个tlr2.0位点的sgrna,其中间隔子长度为24至20nt(包括u6启动子所需的5’末端g),表明使用22-24nt间隔子获得最高的编辑效率。图7d显示了示例性的nme2cas9双切口酶可以串联使用以在tlr2.0中生成基于nhej和hdr的编辑。将表达nme2cas9和sgrna的质粒以及用于同源修复的800bpdsdna供体一起电穿孔到hek293ttlr2.0细胞中,并通过流式细胞术对nhej(mcherry+)和hdr(gfp+)的结果进行评分。hnh切口酶,nme2cas9d16a;ruvc切口酶,nme2cas9h588a。使用任一切口酶靶向分开32bp和64bp的切割位点。hnh切口酶(nme2cas9d16a)产生有效的编辑,尤其是对于相距32bp的切割位点,而ruvc切口酶(nme2cas9h588a)无效。野生型nme2cas9用作对照。图8呈现了示例性数据,其显示了在哺乳动物细胞中如与图7相关的nme2cas9靶向的pam、间隔子和种子需求。所有实验均一式三份进行,并且误差棒代表s.e.m.。图8a显示了tlr2.0中n4cd位点处的示例性nme2cas9靶向,其中基于mcherry+细胞估计编辑。检查了每个非c核苷酸在测试位置(n4ca、n4ct和n4cg)的四个位点,并将n4cc位点用作阳性对照。图8b显示了tlr2.0中n4dc位点处的示例性nme2cas9靶向[类似于(a)]。图8c显示了在具有n4ccapam的tlr2.0位点(与图2c中的不同)上的示例性指导截断,显示出与在其他位点上观察到的那些相似的长度要求。图8d显示了示例性的nme2cas9靶向效率对sgrna的种子区域中的单核苷酸错配差异敏感。数据显示了沿着tlr2.0靶位点中23-nt间隔子行走的单核苷酸sgrna错配的影响。图9呈现了示例性数据,其显示了通过多种递送方法在哺乳动物细胞中内源基因座处的nme2cas9基因组编辑。所有结果代表3个独立的生物学重复,误差棒代表s.e.m.。图9a显示了在瞬时转染表达nme2cas9和sgrna的质粒后,hek293t细胞中内源性人位点的示例性nme2cas9基因组编辑。最初筛选了40个位点(表1);然后一式三份地重新分析了显示的14个位点(选择以包括不同编辑效率的代表,如通过tide所测量的)。nme1cas9靶位点(具有n4gattpam)用作阴性对照。图9b显示了示例性的数据图表:左图:表达nme2cas9和sgrna(靶向pcsk9和rosa26基因座)的单个质粒的瞬时转染使得能够在hepa1-6小鼠细胞中进行编辑,如通过tide所检测的。右图:将sgrna质粒电穿孔到从慢病毒载体稳定表达nme2cas9的k562细胞中导致有效的插入缺失形成。图9c显示了示例性nme2cas9可以作为rnp复合物被电穿孔以诱导基因组编辑。将40皮摩尔的cas9以及50皮摩尔的靶向三个不同基因座的体外转录的sgrna电穿孔到hek293t细胞中。使用tide在72小时后测量插入缺失。图10呈现了示例性数据,其显示了如与图9相关的nme2cas9的剂量依赖性和区段缺失。图10a显示了示例性地增加电穿孔的nme2cas9质粒的剂量(500ng相对图3a中的200ng)提高了两个位点(ts16和ts6)处的编辑效率。以黄色提供的数据从图9a重复使用。图10b显示了示例性nme2cas9可用于产生精确的区段缺失。具有相距32bp的切割位点的两个tlr2.0靶标同时被nme2cas9靶向。产生的大多数病变是恰好32bp的缺失(蓝色)。图11呈现了示例性数据,其显示nme2cas9在体外和细胞中受到ii-c型抗crispr家族的亚群的抑制。所有实验均一式三份进行,误差棒代表s.e.m.。图11a显示了在存在五个先前表征的抗crispr蛋白(acr:cas9的比例为10:1)的情况下,nme1cas9和nme2cas9的示例性体外切割测定。上图:在不存在acr的情况下或在存在阴性对照acr(acre2)的情况下,nme1cas9有效地切割含有具有n4gattpam的前间区序列的片段。如预期的那样,所有五个先前表征的ii-c型acr家族均抑制nme1cas9。下图:nme2cas9抑制与nme1cas9相同,但缺少通过acriic5smu的抑制。图11b显示了在存在五个先前描述的抗crispr家族的情况下的示例性基因组编辑。将表达nme2cas9(200ng)、sgrna(100ng)和每个相应的acr(200ng)的质粒共转染到hek293t细胞中,并在转染后72小时使用通过分解追踪插入缺失(indesbydecompostion)(tide)测量基因组编辑。与我们的体外分析一致,除acriic5smu外,所有ii-c型抗crispr均抑制基因组编辑,尽管效率不同。图11c显示nme2cas9的示例性acr抑制是剂量依赖性的,具有明显的表观效力。nme2cas9以共转染的acr和nme2cas9质粒的2:1和1:1质量比分别被acriic1nme和acriic4hpa完全抑制。图12呈现了示例性数据,其显示了如与图11相关的nme2cas9pid交换使nme1cas9对acriic5smu抑制不敏感。在先前表征的acr蛋白(10umcas9-sgrna+100umacr)的存在下,nme1cas9-nme2cas9pid嵌合体的体外切割。图13呈现了示例性数据,其显示了如与图12相关的nme2cas9和spycas9在双靶位点处的正交性和相对准确性。图13a显示了示例性nme2cas9和spycas9指导物是正交的。tide结果显示了由靶向ds2的两种核酸酶与其同源sgrna或与其他直系同源物的sgrna产生的插入缺失的频率。图13b显示了示例性的nme2cas9和spycas9,其表现出可比较的中靶编辑效率,如通过guide-seq所评估的。条形图表示在每个直系同源物靶向的三个双位点处的来自guide-seq的中靶读数计数。橙色条代表nme2cas9,黑色条代表spycas9。图13c显示了每个位点的示例性spycas9的中靶相对脱靶读数计数。橙色条代表中靶读数,而黑色条代表脱靶。图13d显示了每个位点的示例性nme2cas9中靶相对脱靶读数。图13e的条形图显示了由crisprseek预测的潜在脱靶位点的示例性插入缺失效率(通过tide测量)。中靶和脱靶位点序列显示在左侧,其中pam区用下划线标出,并且sgrna错配和非共有pam核苷酸以红色表示。图14呈现了示例性数据,其显示了nme2cas9在哺乳动物细胞中几乎没有或没有可检测到的脱靶。图14a显示了示例性示意图,其描绘了可通过spycas9和nme2cas9二者借助于其非重叠的pam而靶向的双位点(ds)。nme2cas9pam(橙色)和spycas9pam(蓝色)突出显示。24nt的nme2cas9指导序列以黄色表示;spycas9的相应指导序列在5'末端将短4nt。图14b显示了在ds处诱导插入缺失的示例性nme2cas9和spycas9。选择了vegfa(具有gn3gn19nggncc序列)中的六个ds,以用于直接比较通过两个直系同源物的编辑。表达每个cas9(具有相同的启动子、接头、标签和nls)及其同源指导物的质粒被转染到hek293t细胞中。转染后72小时通过tide测定插入缺失效率。nme2cas9编辑在所有六个位点均可检测到,并且在两个位点(分别为ds2和ds6)比spycas9略微或明显更为有效。spycas9编辑了六个位点中的四个(ds1、ds2、ds4和ds6),其中两个位点的编辑效率比nme2cas9(ds1和ds4)显著更高。选择ds2、ds4和ds6进行guide-seq分析,因为在这些位点,nme2cas9与spycas9相比分别具有相同的效率、更低的效率和更高的效率。图14c显示了在人细胞中高度精确的示例性nme2cas9基因组编辑。显示了由guide-seq在各个靶位点针对每种核酸酶检测到的脱靶位点的数量。除双位点外,我们还分析了小鼠hepa1-6细胞中的ts6(由于其高的中靶编辑效率)以及pcsk9和rosa26位点(以测量另一种细胞类型的准确性)。图14d显示用于检测编辑的细胞中的插入缺失的示例性的靶向深度测序证实了由guide-seq指示的高nme2cas9准确性。图14e显示了rosa26指导物的经验证的脱靶位点的示例性序列,显示了pam区(带下划线),共有ccpam二核苷酸(粗体)和间隔区pam远端部分的三个错配(红色)。图15呈现了示例性数据,其显示了通过多合一aav递送在体内编辑nme2cas9基因组。图15a显示了在小鼠中通过靶向pcsk9递送aav8.sgrna.nme2cas9以降低胆固醇水平的示例性工作流程。上图:表达nme2cas9和sgrna的多合一aav载体示意图(个体基因组元件未按比例绘制)。bgh,牛生长激素多聚(a)位点;ha,表位标签;nls,核定位序列;h,人密码子优化的。下图:aav8.sgrna.nme2cas9尾静脉注射(4x1011gc)的时间线,然后在第14天进行胆固醇测量,并在注射后第28天进行插入缺失、组织学和胆固醇分析。图15b显示了示例性的tide分析,以测量从注射有靶向pcsk9和rosa26(对照)基因座的aav8.nme2cas9+sgrna的小鼠的肝脏提取的dna中的插入缺失。还通过tide评估了guide-seq在这两个sgrna(rosa26|ot1)识别的单个脱靶位点的插入缺失效率。图15c显示了与靶向rosa26的对照相比,注射了靶向pcsk9的指导物的小鼠中血清胆固醇水平的示例性降低。p值通过不成对的双尾t检验计算。图16呈现了示例性数据,其显示了与图15相关的nme2cas9aav递送和编辑后的pcsk9敲低和肝脏组织学。图16a显示了使用抗pcsk9抗体的示例性蛋白质印迹揭示了与用sgrosa26处理的小鼠相比,用sgpcsk9处理的小鼠的肝脏中pcsk9的极大降低的水平。将2ng重组pcsk9用作迁移率标准品(最左侧泳道),并用星号表示肝脏样品中的交叉反应带。gapdh被用作上样对照(下图)。图16b显示了来自用aav8.nme2cas9+sgrosa26(左)或aav8.nme2cas9+sgpcsk9(右)载体注射的小鼠的肝脏的示例性h&e染色。比例尺,25μm。图17呈现了示例性数据,其显示与图16相关的小鼠受精卵中的tyr离体编辑。图17a显示了在hepa1-6细胞中针对编辑进行测试的在tyr中的示例性的两个位点,每个位点具有n4ccpam。sgtyr2指导物显示出更高的编辑效率,因此被选择用于进一步测试。图17b显示了示例性的七只小鼠,它们在出生后发育中存活下来,并且每只表现出毛色表型以及中靶编辑,如通过tide测定的。图17c显示了来自(b)的每只小鼠以及未经编辑的c57bl/6nj小鼠的尾部dna的示例性插入缺失谱,如通过tide分析所示。指出了各种大小的插入(正)和缺失(负)的效率。图18呈现了示例性数据,其显示了通过多合一aav递送的nme2cas9基因组离体编辑。图18a显示了单aavnme2cas9离体编辑以通过靶向tyr基因产生白化病c57bl/6nj小鼠的示例性工作流程。受精卵在含有aav6.nme2cas9:sgtyr的ksom中培养5-6小时,在m2中漂洗,并培养一天,然后转移到假孕受体的输卵管中。图18b显示了通过3x109gc生成的示例性白化病(左)和银灰色(chinchilla)或杂色(中)小鼠,以及通过具有aav6.nme2cas9:sgtyr的受精卵的3x108gc生成的银灰色或杂色小鼠(右)。图18c显示了在两个aav剂量下nme2cas9.sgtyr单aav离体tyr编辑实验的示例性总结。图19显示了针对nspcas9-abemax和优化的abemax-nnme2cas9(d16a)活性的示例性mcherry报告因子测定。图19a显示了abe-mcherry报告因子的序列信息的示例性序列信息。在mcherry编码区中有一个tag终止密码子。在报告因子整合的稳定细胞系中,没有mcherry信号。如果nspcas9-abemax或优化的abemax-nnme2cas9(d16a)可以将tag转化为cag(其编码gln),则将显示mcherry信号。图19b显示了由于spcas9-abe或abemax-nnme2cas9(d16a)在mcherry报告因子的特定区域中处于活跃状态,示例性mcherry信号点亮。上图是阴性对照,中图显示了在用nspcas9-abemax处理的报告细胞中mcherry信号点亮,下图显示了在用优化的abemax-nnme2cas9(d16a)处理的报告细胞中mcherry信号点亮。图19c显示了用spcas9-abe或abemax-nnme2cas9(d16a)转染的mcherry报告细胞中的碱基编辑事件的示例性facs定量。n=6;误差棒代表s.d.。结果来自在技术重复中进行的生物学重复。图20显示了针对nspcas9-cbe4(addgene#100802)和cbe4-nnme2cas9(d16a)-ugi-ugi(cbe4从addgene#100802克隆)活性的示例性gfp报告因子测定。图20a显示了cbe-gfp报告因子的示例性序列信息。gfp报告因子系的荧光团核心区域中存在突变,其将gyg转化为ghg。因此,没有gfp信号。如果nspcas9-cbe4或cbe4-nnme2cas9(d16a)-ugi-ugi可以将cac转化为tac/tat(组氨酸到酪氨酸),则将显示gfp信号。图20b显示了由于nspcas9-cbe4或cbe4-nnme2cas9(d16a)-ugi-ugi在gfp报告因子的特定区域中处于活跃状态的示例性的gfp信号(绿色)。上图是阴性对照。中图显示在用cbe4-nnme2cas9(d16a)-ugi-ugi处理的报告细胞中mcherry信号点亮。下图显示在用cbe4-nnme2cas9(d16a)-ugi-ugi处理的报告细胞中gfp信号点亮。图20c显示了用nspcas9-cbe4或cbe4-nnme2cas9(d16a)-ugi-ugi转染的gfp报告细胞中的碱基编辑事件的示例性facs定量。n=6;误差棒代表s.d.。结果来自在技术重复中进行的生物学重复。图21显示了通过cbe4-nnme2cas9(d16a)-ugi-ugi进行的示例性胞嘧啶编辑。上图显示了nme2cas9的kank3靶向序列信息(pam序列以红色表示)和阴性对照样品中的碱基编辑。下图显示了kank3靶序列的cbe4-nnme2cas9(d16a)-ugi-ugi编辑窗口中每种类型的碱基的取代率的量化。序列表格显示每个位置的核苷酸频率。预期的c至t转化的频率以红色突出显示。图22显示了分别通过cbe4-nnme2cas9(d16a)-ugi-ugi和优化的abemax-nnme2cas9(d16a)进行的示例性胞嘧啶和腺嘌呤编辑。上图显示了nme2cas9的plxnb2靶向序列信息(pam序列以红色表示)和阴性对照样品中的碱基编辑。中图显示了plxnb2靶序列的优化的abemax-nnme2cas9(d16a)编辑窗口中每种类型的碱基的取代率的量化。序列表格显示了每个位置的核苷酸频率。预期的a至g转化的频率以红色突出显示。下图显示了plxnb2靶序列的cbe4-nnme2cas9(d16a)-ugi-ugi编辑窗口中每种类型的碱基的取代率的量化。序列表格显示了每个位置的核苷酸频率。预期的c至t转化的频率以红色突出显示。发明详述本发明涉及基因编辑领域。特别地,基因编辑针对单核苷酸碱基编辑。例如,这样的单核苷酸碱基编辑导致c·g碱基对向t·a碱基对的转化。本文公开的单核苷酸碱基基因编辑器的高准确度和高精度是通过与核苷酸脱氨酶蛋白融合的nmecas9核酸酶实现的。与大量相容的前间区序列邻近基序偶联的nmecas9的紧凑性质使得本文所设想的cas9融合构建体可以编辑常规spycas9碱基编辑器平台无法靶向的位点。a.nmecas9单碱基编辑cas9是一种可编程的核酸酶,其使用指导rna以在任何所需的基因组位点产生双链断裂。此可编程性已被用于生物医学和治疗方法。然而,cas9诱导的断裂通常导致通过细胞机制的不精确修复,从而阻碍了其在单碱基校正以及统一而精确的基因敲除中的治疗应用。此外,将cas9诱导的dna双链断裂和用于同源定向修复(hdr)的修复模板结合以用于校正有丝分裂后细胞(例如神经元细胞)中的遗传突变是极具挑战性的。单核苷酸碱基编辑是一种基因组编辑方法,其中将核酸酶失活或受损的cas9(例如,失活的cas9(dcas9)或切口酶cas9(ncas9))与另一种能够碱基编辑核苷酸而不引起dna双链断裂的酶融合。迄今为止,已经开发出两种广泛类别的cas9碱基编辑器:i)胞嘧啶脱氨酶(将c·g碱基对编辑为t·a碱基对)spycas9融合蛋白;和ii)腺苷脱氨酶(将a·t碱基对编辑为g·c碱基对)spycas9。liu等人,“nucleobaseeditorsandusesthereof”us2017/0121693;和lui等人,“fusionsofcas9domainsandnucleicacid-editingdomains”us2015/0166980(均通过引用并入本文)。但是,如上所述,由于spycas9碱基编辑平台由于其受限的编辑窗口而无法用于靶向所有单碱基突变。编辑窗口受针对nggpam的要求的约束。spycas9还与基因组编辑中的高脱靶效应固有地相关。在一个实施方案中,本发明涉及具有紧凑和超准确性的nme2cas9(脑膜炎奈瑟氏球菌的几个种)的脱氨酶融合蛋白。与具有1,368个氨基酸的spycas9相比,该nme2cas9具有1,082个氨基酸。该nme2cas9直系同源物在哺乳动物细胞中有效发挥功能,识别n4ccpam,并且固有地非常准确。edraki等人,molcell.(在准备中)。尽管不必理解发明的机制,但据信nmecas9碱基编辑器的紧凑性和超准确性靶向本领域目前已知的其他cas9平台先前无法实现的单碱基突变。进一步认为,本文考虑的nmecas9碱基编辑器靶向通过当前碱基编辑器平台不可实行的病原性突变,并且具有增加的碱基编辑准确性。在一个实施方案中,本发明涉及包含nme2cas9和脱氨酶蛋白的融合蛋白,示例性实例包括abe7.10-nnme2cas9(d16a);优化的nnme2cas9-abemax;nnme2cas9-cbe4(等同be4-nnme2cas9(d16a)-ugi-ugi)以及abemax-nnme2cas9(d16a)。参见,图1a、图1b、图1c、图1d和图1e。图1示出了nmecas9脱氨酶融合蛋白单碱基编辑器的示例性示意性实施方案和碱基编辑器的示例性构建质粒。图1a显示了示例性的ye1-be3-nnme2cas9(d16a)-ugi构建体。图1b显示了示例性的abe7.10nnme2cas9(d16a)构建体。图1c显示了示例性的abe7.10-nnme2cas9(d16a)构建体。图1c显示了包含两个sv40nls序列的示例性abe7.10-nnme2cas9(d16a)构建体。图1d显示了示例性的nnme2cas9-cbe4(也称为be4-nnme2cas9(d16a)-ugi-ugi)构建体。图1e显示了示例性的优化的nnme2cas9-abemax构建体。在一个实施方案中,脱氨酶蛋白是apobec1(ye1-be3)。并不旨在将apobec1限于一种生物。在一个实施方案中,apobec1衍生自大鼠物种。kim等人,“increasingthegenome-targetingscopeandprecisionofbaseeditingwithengineeredcas9-cytidinedeaminasefusions”.naturebiotechnology35(2017)。在一个实施方案中,nme2cas9包含nnme2cas9d16a突变体。在一个实施方案中,融合蛋白还包含尿嘧啶糖基化酶抑制剂蛋白(ugi)。在一个实施方案中,融合蛋白包含ye1-be3-nnme2cas9(d16a)-ugi构建体。在一个实施方案中,ye1-be3-nnme2cas9(d16a)-ugi构建体具有以下序列:ye1-be3(加下划线的);接头(粗体),nnme2cas9(斜体),ugi(粗体/加下划线的),sv40nls(无格式)。在一个实施方案中,ye1-be3-nnme2cas9(d16a)-ugi构建体具有以下序列:ye1-be3(加下划线的);接头(粗体),nnme2cas9(斜体),ugi(粗体/加下划线的),sv40nls(无格式)。在一个实施方案中,本发明涉及包含nmecas9/abe7.10脱氨酶蛋白的融合蛋白。在一个实施方案中,脱氨酶蛋白是tada。在一个实施方案中,脱氨酶蛋白是tada7.10。在一个实施方案中,abe7.10-nnme2cas9(d16a)构建体具有以下序列:tada(加下划线的),tada7.10(加下划线的/粗体),接头(粗体),nnme2cas9(斜体),核质蛋白nls(无格式)。在一个实施方案中,abe7.10-nnme2cas9(d16a)构建体具有以下氨基酸序列:tada(加下划线的),tada7.10(加下划线的/粗体),接头(粗体斜体),nnme2cas9(斜体),核质蛋白nls(无格式)。在一个实施方案中,abemax-nnme2cas9(d16a)构建体具有以下氨基酸序列:tada(加下划线的),tada*7.10(加下划线的/粗体),接头(粗体斜体),nnme2cas9(斜体),核质蛋白nls(无格式)和sv40nls(粗体)。在一个实施方案中,cbe4-nnme2cas9(d16a)-ugi-ugi构建体具有以下氨基酸序列:rapobec1(加下划线的),ugi(加下划线的/粗体),接头(粗体斜体),nnme2cas9(d16a)(斜体),cmyc-nls(无格式)和sv40nls(粗体)。在一个实施方案中,优化的nnme2cas9-abemax构建体是指具有改进的启动子、nls序列和接头序列的优化版本。在一些实施方案中,优化的nnme2cas9-abemax构建体从5'至3'包含c-mycnls、12aa接头、15aa接头、sv40nls、tada、tada*7.10、48aa接头、nnme2cas9、73aa接头(3xha-标签)、15aa接头和c-mycnls。在一些实施方案中,优化的nnme2cas9-abemax构建体在3'末端还包含至少两个各自交替的c-mycnls和12aa接头。在一些实施方案中,优化的nnme2cas9-abemax构建体在5’末端还包含至少两个各自交替的15aa接头和c-mycnls。例如,参见图1e。在一个实施方案中,优化的nnme2cas9-abemax构建体具有以下氨基酸序列:htada7.10(加下划线的),htada*7.10(加下划线的/粗体),接头(粗体斜体),nnme2cas9(斜体),cmyc-nls(无格式),sv40-nls(粗体)。在一些实施方案中,质粒nspcas9-abemax(addgeneid:112095)用于实验对照和用于分子克隆。在一些实施方案中,质粒nspcas9-cbe4(addgeneid:100802)用于实验对照和用于分子克隆。用包含ye1-be3-nme2cas9核苷酸脱氨酶融合蛋白的dna质粒对hek293t细胞进行电穿孔在内源性靶位点(ts25)上实现c·g碱基对至t·a碱基对的强健的单碱基编辑。参见图2a-c。图2呈现了用包含通过核转染在hek293t细胞中有效地将内源性靶位点25(ts25)处的c转化为t的ye1-be3-nnme2cas9(d16a)-ugi融合蛋白的dna质粒对hek293t细胞的电穿孔的示例性数据。图2a显示了ts25内源性靶位点的示例性序列(在黑色矩形内)。gn23sgrna与靶dna链碱基配对,留下取代的dna链用于胞苷脱氨酶进行编辑(例如新的绿色核苷酸)。图2b显示了示例性测序数据,该数据显示了双峰核苷酸峰(从5’末端起的第7个位置;箭头),表明从胞苷到胸苷的成功单碱基编辑(例如,将c·g碱基对转化为t·a碱基对)。图2c显示了图2b中所示数据的示例性定量,绘制了c→t单碱基编辑的转化百分比。在经碱基编辑器和sgrna处理的样品中,c转化为t的百分比为约40%(p值=6.88x10-6)。“无sgrna”对照显示由于sanger测序而产生的背景噪音。使用editr(kluesner等人,2018)进行分析。在表达增强型绿色荧光蛋白(egfp)的稳定的k562衍生的细胞系中,将另外四个ye1-be3-nnme2cas9/d16a突变融合蛋白与增强型绿色荧光蛋白(egfp)共表达。每个ye1-be3-nnme2cas9/d16a突变融合蛋白都有特定的ugi靶位点。参见图3a-d。深度测序分析表明,ye1-be3-nnme2cas9在四个egfp靶位点的每一个处将c残基转化为t残基。编辑的百分比范围为从0.24%到2%。潜在的碱基编辑窗口来自置换的dna链中的核苷酸2-8,将5’(pam远端)末端的核苷酸算作核苷酸#1。参见图3a-d。图3呈现了示例性的特定ugi靶位点,其分别整合到ye1-be3-nnme2cas9/d16a突变融合蛋白中,并与增强型绿色荧光蛋白(egfp)共表达在稳定的k562衍生的细胞系中。经转化的碱基以橙色突出显示。使用阴性对照样品(没有sgrna构建体的ye1-be3-nnme2cas9核转染的k562细胞)过滤背景信号。n4ccpam被框出。右栏中显示了在碱基编辑器靶向的位点中表现出突变的总读数的百分比。图3a显示了示例性egfp位点1。图3b显示了示例性egfp位点2。图3c显示了示例性egfp位点3。图3d显示了示例性egfp位点4。用包含ye1-be3-nnme2cas9c-fos启动子的dna质粒对hek293t细胞进行电穿孔,实现了在c-fos启动子中内源性靶位点上c·g碱基对至t·a碱基对的强健的单碱基编辑(图3e)。图3e显示了示例性深度测序分析,其表明ye1-be3-nnme2cas9在内源性c-fos启动子区域将c残基转化为t残基的位置。右栏中显示了在碱基编辑器靶向的位点中表现出突变的总读数的百分比。经转化的碱基以橙色或黄色突出显示。使用阴性对照样品过滤背景信号。最高的编辑百分比是32.50%。图3f显示了示例性深度测序分析,其表明abe7.10-nnme2cas9或abemax(koblan等人,2018)-nnme2cas9在内源性c-fos启动子区域将a残基转化为g残基的位置。右栏中显示了在碱基编辑器靶向的位点中表现出突变的总读数的百分比。经转化的碱基以橙色突出显示。使用阴性对照样品过滤背景信号。abe7.10-nnme2cas9的编辑百分比为0.53%,abemax-nnme2cas9(d16a)的编辑百分比为2.33%。在一个实施方案中,本发明涉及用于碱基编辑的abe7.10-nnme2cas9(d16a)融合蛋白的表达。尽管不必理解发明的机制,但据信nme2cas9碱基编辑可以是通过用abe7.10-nnme2cas9(d16a)融合蛋白逆转fah基因中的g至a点突变而有效用于酪氨酸血症的治疗。fah基因中外显子8的最后一个核苷酸的g至a突变(红色)导致外显子跳跃。fah缺乏导致毒素蓄积和严重的肝损伤。突变下游的spycas9pam(黑色矩形框)的位置对于设计sgrna并非最佳,因为a突变在abe7.10的有效碱基编辑窗口(其是在5’(pam远端)末端的第4-7nt(加下划线的)(gaudelli等人,2017))之外。但是,下游序列中有两个nme2cas9pam(红色矩形框),它们可以潜在地纠正突变,并通过abe7.10-nnme2cas9(d16a)将dna序列逆转为野生型。参见图4。图4呈现了野生型fah基因与酪氨酸血症fah突变基因的示例性比对,其显示了a-g单碱基基因编辑靶位点(位置9)。指示了相应的spycas9单pam位点和nmecas9双pam位点,以用于展示相对于spycas9pam位点的次优靶向窗口。此图用作其中nme2cas9可以克服现有碱基编辑器的限制的位点的潜在实例。进一步相信,本文所述的nmecas9碱基编辑器可以执行传统的spycas9衍生的碱基编辑器由于相对于附近可用pam而言次优的碱基编辑窗口而无法实现的精确的碱基编辑。此外,我们设想将碱基编辑扩展到酪氨酸血症小鼠模型以用于通过使用abemax-nnme2cas9(d16a)的病毒递送方法逆转g至a点突变,其中由于相对于附近可用pam而言次优的碱基编辑窗口,使用spycas9衍生的碱基编辑器无法实现所需的编辑(例如,图4)。b.nmecas9构建体:紧凑且超准确聚簇的规则间隔的短回文重复序列(crispr)和crispr相关(cas)蛋白一起构成针对噬菌体和其他移动遗传元件(mge)的细菌和古细菌适应性免疫途径(barrangou等人,2007;brouns等人,2008;marraffini和sontheimer,2008)。在ii型crispr系统中,crisprrna(crrna)与反式激活性crrna(tracrrna)结合并加载到切割与crrna互补的mge核酸的cas9效应蛋白上(garneau等人,2010;deltcheva等人,2011;sapranauskas等人,2011;gasiusnas等人,2012;jinek等人,2012)。可以将crrna:tracrrna杂合体融合到单指导rna(sgrna)中(jinek等人,2012)。cas9核酸内切酶的rna可编程性使其成为生物技术和医学中强大的基因组编辑平台(cho等人,2013;cong等人,2013;hwang等人,2013;jiang等人,2013;jinek等人,2013;mali等人,2013b)。除sgrna外,cas9靶标识别通常与互补dna序列下游的1-5个核苷酸特征(称为前间区序列邻近基序(pam))相关(deveau等人,2008;mojica等人,2009)。cas9直系同源物在pam长度和序列上表现出相当大的多样性。在已表征的cas9直系同源物中,酿脓链球菌(streptococcuspyogenes)cas9(spycas9)被最广泛地使用,部分原因是它识别提供高密度的可靶向位点的短nggpam(jinek等人,2012)(n代表任何核苷酸)。尽管如此,spy的相对大的尺寸(即1,368个氨基酸)使得该cas9难以包装(连同sgrna和启动子一起)到单个重组腺相关病毒(raav)中。鉴于aav载体对于体内基因递送所显示的前景,这已显示是治疗应用的一个弊端(keeler等人,2017)。此外,spycas9及其rna指导物要求广泛的表征和工程改造以最小化编辑近同源(near-cognate)、脱靶位点的趋势。(bolukbasi等人,2015b;tsai和joung,2016;tycko等人,2016;chen等人,2017;casini等人,2018;yin等人,2018)。迄今为止,后续的工程改造工作尚未克服这些尺寸限制。已经验证了用于哺乳动物基因组编辑的从不同物种(包括脑膜炎奈瑟氏球菌(nmecas9,1,082aa)(esvelt等人,2013;hou等人,2013),金黄色葡萄球菌(staphylococcusaureus)(saucas9,1,053aa)(ran等人,2015),空肠弯曲菌(campylobacterjejuni)(cjecas9,984aa)(kim等人,2017)和嗜热脂肪地芽孢杆菌(geobacillusstearothermophilus)(geocas9,1,089aa)(harrington等人,2017b)的菌株)获得的几种长度小于1,100个氨基酸的cas9直系同源物。nmecas9、cjecas9和geocas9是ii-c型cas9的代表(mir等人,2018),其中大多数<1,100aa。除geocas9外,这些较短的序列直系同源物各自已成功用于通过多合一aav递送(其中单个载体表达指导物和效应子两者)的体内编辑(ran等人,2015年;kim等人,2017;ibraheim等人,2018,已提交)。此外,nmecas9和cjecas9已证明对脱靶编辑具有天然抗性(lee等人,2016;kim等人,2017;amrani等人,2018,已提交)。但是,由紧凑型cas9识别的pam通常比spycas9的pam更长,从而显著减少了给定基因座处或附近的可靶向位点的数量;例如,i)nmecas9的n4gayw/n4gytt/n4gtct(esvelt等人,2013;hou等人,2013;lee等人,2016;amrani等人,2018);ii)saucas9的n2grrt(ran等人,2015);iii)cjecas9的n4ryac(kim等人,2017);和iv)geocas9的n4craa/n4gmaa(harrington等人,2017b)(y=c、t;r=a、g;m=a、c;w=a、t)。靶位点的较小子集有利于高度准确和高度精确的基因编辑任务,包括但不限于:i)小靶标(例如mirna)的编辑;ii)通过碱基编辑校正突变,其相对于pam改变非常狭窄的碱基窗口(komor等人,2016;gaudelli等人,2017);或iii)通过同源定向修复(hdr)进行精确编辑,当重写的碱基靠近切割位点时,这是最有效的(gallagher和haber,2018)。由于pam限制,即使使用这些较短的cas9蛋白,也无法使用多合一aav载体靶向许多编辑位点以用于体内递送。例如,已经开发出具有降低的pam限制(n3rrt)的saucas9突变体(saucas9kkh),尽管靶向范围的这样的增加通常是以降低的中靶编辑功效为代价的,并且仍然观察到脱靶编辑。(kleinstiver等人,2015)。通过在人细胞中具有高活性、对脱靶有抗性、足够紧凑以用于多合一aav递送并能够获得高密度的基因组位点的cas9直系同源物和变体将大大增强安全有效的基于crispr的治疗性基因编辑。在一个实施方案中,本发明涉及来自脑膜炎奈瑟氏球菌不同菌株的紧凑的、超准确的cas9(nme2cas9)。在一个实施方案中,本发明涉及一种用于nme2cas9及其sgrna的单aav递送的方法,以在体内和/或离体执行有效的基因组编辑。尽管不必理解发明的机制,但据信该直系同源物在哺乳动物细胞中有效起作用并识别n4ccpam,该n4ccpam提供与野生型spycas9相同的靶位点密度(例如,当考虑两条dna链时,平均每8bp)。1.pam相互作用结构域和抗crispr蛋白通过cas9直系同源物的pam识别主要通过pam相互作用结构域(pid)和与前间区序列邻近的核苷酸之间的蛋白-dna相互作用发生(jiang和doudna,2017)。pam突变通常使噬菌体能够逃脱ii型crispr免疫(paez-espino等人,2015),使这些系统处于选择性压力下,不仅获取新的crispr间隔子,还通过pid突变进化出新的pam特异性。此外,一些噬菌体和mge表达抑制cas9的抗crispr(acr)蛋白(pawluk等人,2016;hynes等人,2017;rauch等人,2017)。pid结合是一些acr采用的有效抑制机制(dong等人,2017;shin等人,2017;yang和patel,2017),这表明pid变异也可能是由选择性压力驱动的,以逃避acr抑制。cas9pid可能会进化,使得紧密相关的直系同源物识别不同的pam,如最近在两个地芽孢杆菌属(geobacillus)物种中所举例说明的。由嗜热脂肪地芽孢杆菌编码的cas9识别n4craapam,但是当其pid与菌株lc300的cas9的pid交换时,其pam要求改变至n4gmaa(harrington等人,2017b)。在一个实施方案中,本发明涉及具有识别不同pam的相异pid的多个脑膜炎奈瑟氏球菌cas9直系同源物。在一个实施方案中,本发明涉及与nmecas9菌株8013的cas9蛋白(nme1cas9)具有高度序列同一性(沿其全长>80%)的cas9蛋白(zhang等人,2013)。如上所讨论的,nme1cas9还具有较小的尺寸和天然的高准确性。(lee等人,2016;amrani等人,2018)。比对揭示了三个脑膜炎球菌cas9直系同源物的进化枝,每个进化枝在n末端~820个氨基酸(aa)残基(其包括pid以外的所有蛋白质区域)中具有>98%的同一性。参见图5a和图6a。所有这些cas9直系同源物的长度均为1,078-1,082aa。第一个进化枝(第1组)包括直系同源物,其中与nme1cas9>98%aa的序列同一性延伸通过pid。相反,其他两组具有与nme1cas9的pid显著不同的pid,其中第2组和第3组直系同源物与nme1cas9分别具有平均~52%和~86%的pid序列同一性。从每组中选择一种脑膜炎球菌菌株用于详细分析:i)来自第2组的de11444;和ii)来自第3组的98002用于详细分析,在本文中分别称为nme2cas9(1,082aa)和nme3cas9(1,081aa)。来自这两个菌株的crispr-cas基因座具有与菌株8013相同的重复序列和间隔子长度。参见图6b。这有力地表明,它们的成熟crrna还具有24nt的指导序列和24nt的重复序列(zhang等人,2013)。类似地,de11444和98002的tracrrna序列与8013tracrrna具有100%的同一性。参见图6b。这些观察结果暗示相同的sgrna序列支架可以指导通过所有三种cas9的dna切割。为了确定这些cas9直系同源物是否具有不同的pam,将nme1cas9的pid替代为nme2cas9或nme3cas9的pid。为了确定相应的pam要求,这些蛋白嵌合体在大肠杆菌中表达,纯化并用于体外pam鉴定(karvelis等人,2015;ran等人,2015;kim等人,2017)。简而言之,使用重组cas9和同源的体外转录的sgrna在体外切割包含前间区序列后接10-nt随机化序列的dna片段库。参见图5b。预期仅包含cas9pam序列的那些dna被切割。然后对切割产物进行测序以鉴定pam。参见图5c-d。在回收的全长nme1cas9中验证了预期的n4gattpam共有序列。参见图5c。嵌合的pid交换的衍生物表现出对在第5位的c残基(取代由nme1cas9识别的g)的强烈的偏好。参见图5d。在一个实施方案中,abe7.10-nnme2cas9(d16a)用于a·t碱基对至g·c碱基对的单碱基编辑。在一个实施方案中,bemax-nnme2cas9(d16a)用于a·t碱基对至g·c碱基对的单碱基编辑。(参见图3f)。图5示出了具有不同pam的示例性三个紧凑相关的脑膜炎奈瑟氏球菌cas9直系同源物。图5a显示了一个示例性示意图,其显示了映射到nme1cas9的预测结构上的nme2cas9(左)和nme3cas9(右)之间的突变残基(橙色球),揭示了pid中的突变簇(黑色)。图5b显示了使用10-bp随机pam区域的体外pam发现测定的示例性实验工作流程。体外消化后,将衔接子连接至切割产物以用于文库构建和测序。图5c显示了由体外pam发现产生的示例性序列标识揭示了对nme1cas9的n4gattpam的富集,与其先前建立的特异性一致。图5d显示了示例性序列标识,表明其pid与nme2cas9(左)或nme3cas9(右)的pid交换的nme1cas9需要在pam位置5处的c。由于pid交换的蛋白嵌合体的较小的切割效率,剩余的核苷酸未以高置信度测定(参见图6c)。图5e显示了示例性序列标识,其显示了全长nme2cas9识别n4ccpam,这基于在pam位置5具有固定的c并且具有随机化的pamnt1-4和6-8的靶标库的有效底物切割。由于在所用条件下嵌合蛋白的低切割效率,因此无法可靠地分配任何剩余的pam核苷酸。参见图6c。为了进一步解析pam,在具有在第5个pam位置上具有不变的c的7-nt随机化序列(例如sgrna非互补链上的5’-nnnncnnn-3’)的文库上进行了体外测定。该策略产生了高得多的切割效率,并且结果表明nme2cas9和nme3cas9pid分别识别nnnncc(a)和nnnncaaapam。参见图6c-d。nme3cas9共有序列与geocas9的共有序列相似(harrington等人,2017b)。使用具有nnnncnnndna库的全长nme2cas9(而不是pid交换的嵌合体)重复这些测试,并再次回收nnnncc(a)共有序列。参见图5e。注意到该测试具有更有效的切割。参见图6c。这些数据表明,在pid之外的nme2cas9(相对于nme1cas9)的15个氨基酸变化中的一个或多个支持有效的dna切割活性。参见图6c。因为nme2cas9的独特的2-3ntpam提供了比先前描述的紧凑型cas9直系同源物更高的潜在靶位点密度,因此选择它用于进一步分析。图6呈现了如与图5相关的具有快速发展的pid的脑膜炎奈瑟氏球菌cas9直系同源物的表征。图6a显示了与nme1cas9>80%同一的nmecas9直系同源物的示例性无根系统发生树。出现了三个不同的分支,大多数突变聚集在pid中。组1(蓝色)、2(橙色)和3(绿色)具有与nme1cas9分别具有>98%、约52%和约86%同一性的pid。指出了三个代表性的cas9直系同源物(每组一个)(nme1cas9、nme2cas9和nme3cas9)。图6b显示了示例性示意图,其显示了编码来自(a)的三个cas9直系同源物(nme1cas9、nme2cas9和nme3cas9)的菌株的crispr-cas基因座。显示了每个crispr-cas组分与脑膜炎奈瑟氏球菌8013(编码nme1cas9)的同一性百分比。蓝色和红色箭头分别表示pre-crrna和tracrrna转录起始位点。图6c显示绘制了针对完整的nme1cas9(灰色)、针对其中nme1cas9的pid与nme2cas9和nme3cas9的pid交换的嵌合体(混合色)和针对全长nme2cas9(橙色)的体外测定的切割dna的示例性标准化读数计数(总读数的百分比)。减少的标准化读数计数表明嵌合体中较低的切割效率。图6d显示了通过nme1cas9的pid与nme2cas9(左)或nme3cas9(右)的pid交换在nnnncnnnpam库上进行的体外pam发现测定的示例性序列标识。2.n4ccpam指导的基因编辑为了测试nme2cas9在人基因组编辑中的功效,将全长(例如未经pid交换的)人密码子优化的nme2cas9构建体克隆到哺乳动物表达质粒中,该质粒具有附加的核定位信号(nls)和先前针对nme1cas9验证的接头(amrani等人,2018)。对于初始测试,使用改进的基于荧光的红绿灯报告因子(trafficlightreporter)(tlr2.0)(certo等人,2011)。简而言之,破坏的gfp后面是框外的t2a肽和mcherry盒。当将dna双链断裂(dsb)引入破碎的gfp盒中时,非同源末端连接(nhej)修复事件的一个子集留下+1移码的插入缺失,将mcherry置于读框中并产生容易通过流式细胞术定量的红色荧光,参见图7a。通过包含恢复功能性gfp序列的dna供体,产生绿色荧光,还可以同时对同源介导的修复(hdr)结果进行评分(certo等人,2011)。由于一些插入缺失不引入+1移码,因此荧光读数通常低估真正的编辑效率。尽管如此,该测定的速度、简便性和低成本使其可用作在携带通过慢载体掺入的单个tlr2.0基因座的hek293t细胞中基因组编辑的初始的半定量测量措施。对于初始测试,将nme2cas9质粒与15个sgrna质粒之一瞬时共转染,这些质粒携带靶向具有n4ccpam的tlr2.0位点的间隔子。没有包括hdr供体,因此仅对基于nhej的编辑(mcherry)进行了评分。如对于nme1cas9常规使用的,大多数sgrna呈g23格式(即5’末端g以促进转录,后接23nt指导序列)(lee等人,2016;pawluk等人,2016;amrani等人,2018;ibraheim等人,2018)。没有sgrna和靶向n4gattpam的sgrna用作阴性对照,而将spycas9+sgrna和nme1cas9+sgrna共转染(分别靶向ngg和n4gatt前间区序列)包括作为阳性对照。通过spycas9和nme1cas9的编辑可容易地被检测到(分别~28%和10%mcherry)。参见图7b。对于nme2cas9,具有n4ccpam的所有15个靶标都是功能性的,尽管达到4%到20%mcherry的不同范围。这15个位点包括在第7个pam位置(例如,在cc二核苷酸之后)中具有四个可能核苷酸中的每个核苷酸的实例,表明在体外观察到的对a残基的轻微偏爱(图5e)不反映针对在人细胞中的编辑应用的pam要求。n4gattpam对照产生类似于无sgrna对照的mcherry信号。参见图7b。为了确定n4ccpam中的两个c残基是否都参与编辑,在tlr2.0报告细胞中测试了一系列n4dc(d=a、t、g)和n4cdpam位点。参见图8a和8b。在这些位点中的任何位点均未发现可检测的编辑,从而提供了n4ccpam共有序列的两个c残基对于有效的nme2cas9活性都是需要的初步指示。在crrna中间隔子的长度在cas9直系同源物间不同,并且可影响中靶相对脱靶活性(cho等人,2014;fu等人,2014)。spycas9的最佳间隔子长度为20nt,其中截短至17nt是可容忍的(fu等人,2014)。相比之下,nme1cas9通常具有24nt的间隔子(hou等人,2013;zhang等人,2013),并且容忍截短至18-20nt(lee等人,2016;amrani等人,2018)。为了测试对于nme2cas9的间隔子长度要求,针对每个靶向的单个tlr2.0位点创建了指导rna质粒,但具有不同的间隔子长度。参见图7c和图8c。使用g23、g22和g21指导物观察到可比较的活性,但是在进一步截短至g20和g19长度后,观察到明显降低的活性。参见图7c。这些结果验证了nme2cas9作为在培养的人细胞中的在n4ccpam位点处的使用22-24nt指导序列的基因组编辑平台。图7呈现了示例性数据,该数据显示nme2cas9使用22-24nt间隔子编辑与n4ccpam邻近的位点。所有实验均一式三份进行,误差棒代表平均值的标准误差(s.e.m.)。图7a显示了描绘hek293ttlr2.0细胞的瞬时转染和编辑的示例性示意图,其中在转染后72小时通过流式细胞术检测mcherry+细胞。图7b显示了tlr2.0报告因子的示例性nme2cas9编辑。具有n4ccpam的位点以不同的效率被靶向,而在n4gattpam上或在没有sgrna的情况下未观察到nme2cas9靶向。spycas9(靶向先前已验证的具有nggpam的位点)和nme1cas9(靶向n4gatt)用作阳性对照。图7c显示了间隔子长度对nme2cas9编辑效率的示例性影响。靶向单个tlr2.0位点的sgrna(间隔子长度为24至20nt(包括u6启动子所需的5’末端g))表明使用22-24nt间隔子获得最高的编辑效率。图7d显示了示例性的nme2cas9双切口酶可以串联使用以在tlr2.0中生成基于nhej和hdr的编辑。将表达nme2cas9和sgrna的质粒以及用于同源修复的800bpdsdna供体一起电穿孔到hek293ttlr2.0细胞中,并通过流式细胞术对nhej(mcherry+)和hdr(gfp+)的结果进行评分。hnh切口酶,nme2cas9d16a;ruvc切口酶,nme2cas9h588a。使用任一切口酶靶向分开32bp和64bp的切割位点。hnh切口酶(nme2cas9d16a)产生有效的编辑,尤其是对于相距32bp的切割位点,而ruvc切口酶(nme2cas9h588a)无效。野生型nme2cas9用作对照。3.通过hdr和hnh切口酶的精确编辑cas9酶利用其hnh和ruvc结构域分别切割靶dna的指导互补链和非互补链。其中hnh或ruvc结构域被突变地失活的spycas9切口酶(ncas9)已被用于诱导同源定向修复(hdr)并通过双切口酶的dsb诱导提高基因组编辑特异性(mali等人,2013a;ran等人,2013)。为了测试nme2cas9作为切口酶的功效,创建了nme2cas9d16a(hnh切口酶)和nme2cas9h588a(ruvc切口酶),它们分别在ruvc和hnh结构域的催化残基中具有丙氨酸突变(esvelt等人,2013;hou等人,2013;zhang等人,2013)。tlr2.0细胞与gfp供体dsdna一起用于确定nme2cas9诱导的切口是否可以通过hdr诱导精确的编辑。使用靶向间隔开32bp和64bp的切割位点的指导物,tlr2.0中的靶位点用于测试每种切口酶的功能。参见图7d。靶向单个位点的野生型nme2cas9显示有效的编辑,nhej和hdr均为修复的结果。对于切口酶,分开32bp和64bp的切割位点显示使用nme2cas9d16a(hnh切口酶)的编辑,但使用nme2cas9h588a对两个靶标对均不发挥作用。这些结果表明,只要位点紧邻,nme2cas9hnh切口酶可用于有效的基因组编辑。对先前表征的cas9的研究已经鉴定了pam附近的特定区域,其中cas9的活性对序列错配高度敏感。这个8到12nt的区域被称为种子序列,并且迄今为止已在所有表征的cas9中被观察到(gorski等人,2017)。为了确定nme2cas9是否也具有种子序列,进行了一系列瞬时转染,每个转染靶向tlr2.0中的相同基因座,但具有在指导物的不同位置处的单核苷酸错配。参见图8d。在靠近pam的前10-12nt中,对于错配观察到mcherry阳性细胞数量的显著减少,这表明nme2cas9在该区域中具有种子序列。图8呈现了示例性数据,其显示了在哺乳动物细胞中如与图7相关的nme2cas9靶向的pam、间隔子和种子需求。所有实验均一式三份进行,并且误差棒代表s.e.m.。图8a显示了tlr2.0中n4cd位点处的示例性nme2cas9靶向,其中基于mcherry+细胞估计编辑。检查了每个非c核苷酸在测试位置(n4ca、n4ct和n4cg)的四个位点,并将n4cc位点用作阳性对照。图8b显示了tlr2.0中n4dc位点处的示例性nme2cas9靶向[类似于(a)]。图8c显示了在具有n4ccapam的tlr2.0位点(与图2c中的不同)上的示例性指导截断,显示出与在其他位点上观察到的那些相似的长度要求。图8d显示了示例性的nme2cas9靶向效率对sgrna的种子区域中的单核苷酸错配差异地敏感。数据显示了沿着tlr2.0靶位点中23-nt间隔子行走的单核苷酸sgrna错配的影响。4.哺乳动物细胞类型的递送方法使用各种递送方法测试了nme2cas9在不同哺乳动物细胞系中发挥功能的能力。作为初始测试,四十(40)个不同的位点(29个使用n4ccpam,和使用n4cdpam测试了11个位点)。选择了几个基因座(aavs1、vegfa等),并随机选择了具有n4ccpam的靶位点用于使用nme2cas9进行编辑。通过瞬时转染150ng的nme2cas9以及150ng的sgrna质粒,然后在转染后72小时进行tide分析来确定编辑(%)。选择在该初始筛选中表现出一定范围的编辑效率的位点子集用于进行一式三份的重复分析。参见图9a;和表1。图9呈现了示例性数据,其显示了通过多种递送方法在哺乳动物细胞中内源基因座处的nme2cas9基因组编辑。所有结果代表3个独立的生物学重复,误差棒代表s.e.m.。图9a显示了在瞬时转染表达nme2cas9和sgrna的质粒后,hek293t细胞中内源性人位点的示例性nme2cas9基因组编辑。最初筛选了40个位点(表1);然后一式三份地重新分析了显示的14个位点(选择以包括不同编辑效率的代表,如通过tide所测量的)。nme1cas9靶位点(具有n4gattpam)用作阴性对照。图9b显示了示例性的数据图表:左图:表达nme2cas9和sgrna(靶向pcsk9和rosa26基因座)的单个质粒的瞬时转染使得能够在hepa1-6小鼠细胞中进行编辑,如通过tide所检测的。右图:将sgrna质粒电穿孔到从慢病毒载体稳定表达nme2cas9的k562细胞中导致有效的插入缺失形成。图9c显示了示例性nme2cas9可以作为rnp复合物被电穿孔以诱导基因组编辑。将40皮摩尔的cas9以及50皮摩尔的靶向三个不同基因座的体外转录的sgrna电穿孔到hek293t细胞中。使用tide在72h后测量插入缺失。表1.nme2cas9靶向的示例性内源性人基因组编辑位点。hek293t细胞用于支持瞬时转染,并且在转染后72小时,收获细胞,随后进行基因组dna提取和靶基因座的选择性扩增。tide分析用于测量每个基因座的插入缺失效率(brinkman等人,2014)。在大多数这些位点中都可以检测到nme2cas9编辑,尽管效率根据靶序列而有所不同。表1。有趣的是,nme2cas9在具有n4cdpam的几个基因组位点处诱导了插入缺失,尽管一致性较低且水平较低。表1。以一式三份分析了具有n4ccpam的十四(14)个位点,并观察到一致的编辑。参见图9a。此外,通过增加递送的nme2cas9质粒的量,可以显著提高编辑效率,并且使用两个指导物可以使这样的高效率扩展至精确的片段缺失。参见图10a和10b。nme2cas9发挥功能的能力已在小鼠hepa1-6细胞(肝癌来源的)中进行了测试。对于hepa1-6细胞,瞬时转染编码nme2cas9和sgrna(靶向rosa26或pcsk9)的单个质粒,并在72小时后测量插入缺失。在两个位点上都容易地观察到编辑。参见图9b,左。当在人白血病k562细胞中稳定表达时还测试了nme2cas9的功能性。为此,创建了表达nme2cas9的慢病毒构建体,并转导细胞以在sffv启动子的控制下稳定表达nme2cas9。与未转导的细胞相比,这样的稳定的细胞系在生长和形态上没有显示任何可见的差异,这表明nme2cas9在稳定表达时没有毒性。这些细胞用表达sgrna的质粒瞬时电穿孔,并在72小时后通过tide分析以测量插入缺失效率。在所有测试的三个位点均观察到有效(>50%)的编辑,从而验证了nme2cas9在k562细胞中在慢病毒递送后发挥功能的能力。参见图9b。cas9及其sgrna的核糖核蛋白(rnp)递送也可用于一些基因组编辑应用,并且cas9存在的更大瞬态性可最小化脱靶编辑(kim等人,2014;zuris等人,2015)。此外,一些细胞类型(例如某些免疫细胞)对于基于dna转染的编辑是抗拒的(schumann等人,2015)。为了测试nme2cas9是否通过rnp递送起作用,将6xhis标记的nme2cas9(与三个nls融合)克隆到细菌表达构建体中,并纯化重组蛋白。然后,将重组蛋白用靶向三个先前验证的位点的t7rna聚合酶转录的sgrna装载。nme2cas9:sgrna复合物的电穿孔诱导了在hek293t细胞中在三个靶位点中的每个位点处的成功编辑,如通过tide检测的。参见图9c。这些结果共同表明,nme2cas9可以通过质粒或慢病毒或作为rnp复合体有效地递送到多种细胞类型中。5.抗crispr调控迄今为止,已显示来自不同细菌物种的五个acr家族在体外和在人细胞中抑制nme1cas9(pawluk等人,2016;lee等人,2018,已提交)。考虑到nme1cas9和nme2cas9之间的高度序列同一性,这些acr家族中的至少一些应抑制nme2cas9。为了对此进行测试,所有五个家族的重组acr被表达、纯化并测试了nme2cas9在每个家族的成员的存在下体外切割靶标的能力(acr:cas9摩尔比为10:1)。将抑制剂用于大肠杆菌中的i-e型crispr系统(acre2)作为阴性对照,而nme1cas9被用作阳性对照。(pawluk等人,2014);(pawluk等人,2016)。如预期的,所有5个家族都抑制nme1cas9,而acre2却没有。参见图11a,上图。acriic1nme、acriic2nme、acriic3nme和acriic4hpa完全抑制nme2cas9。然而,令人惊讶的是,先前被报道为最有效的nme1cas9抑制剂的acriic5smu(lee等人,2018)即使在10倍摩尔过量的情况下也无法在体外抑制nme2cas9。这表明它可能通过与其pid相互作用来抑制nme1cas9。图10呈现了示例性数据,其显示了如与图9相关的nme2cas9的剂量依赖性和区段缺失。图10a显示了示例性地增加电穿孔的nme2cas9质粒的剂量(500ng相对图3a中的200ng)提高了两个位点(ts16和ts6)处的编辑效率。以黄色提供的数据从图9a重复使用。图10b显示了示例性nme2cas9可用于产生精确的区段缺失。具有相距32bp的切割位点的两个tlr2.0靶标同时被nme2cas9靶向。产生的大多数病变是恰好32bp的缺失(蓝色)。图11呈现了示例性数据,其显示nme2cas9在体外和细胞中受到ii-c型抗crispr家族的亚群的抑制。所有实验均一式三份进行,误差棒代表s.e.m.。图11a显示了在存在五个先前表征的抗crispr蛋白(acr:cas9的比例为10:1)的情况下,nme1cas9和nme2cas9的示例性体外切割测定。上图:在不存在acr的情况下或在存在阴性对照acr(acre2)的情况下,nme1cas9有效地切割含有具有n4gattpam的前间区序列的片段。如预期的那样,所有五个先前表征的ii-c型acr家族均抑制nme1cas9。下图:nme2cas9抑制与nme1cas9相同,但缺少通过acriic5smu的抑制。图11b显示了在存在五个先前描述的抗crispr家族的情况下的示例性基因组编辑。将表达nme2cas9(200ng)、sgrna(100ng)和每个相应的acr(200ng)的质粒共转染到hek293t细胞中,并在转染后72小时使用通过分解追踪插入缺失(tide)测量基因组编辑。与我们的体外分析一致,除acriic5smu外,所有ii-c型抗crispr均抑制基因组编辑,尽管效率不同。图11c显示nme2cas9的示例性acr抑制是剂量依赖性的,具有明显的表观效力。nme2cas9以共转染的acr和nme2cas9质粒的2:1和1:1质量比分别被acriic1nme和acriic4hpa完全抑制。为了对此进行进一步测试,测试了与nme2cas9的pid的nme1cas9/nme2cas9嵌合体。参见图5d和图6d。由于该杂合体的活性降低,因此使用了~30x更高浓度的cas9以实现类似的切割效率,同时保持10:1的cas9:acr摩尔比。没有观察到acriic5smu对所述蛋白嵌合体的抑制作用。参见图12。此数据提供了acriic5smu可能与nme1cas9的pid相互作用的进一步的证据。不管通过acriic5smu的差异抑制的机制基础如何,这些结果表明nme2cas9受到其他四种ii-c型acr家族的抑制。图12呈现了示例性数据,其显示了如与图11相关的nme2cas9pid交换使nme1cas9对acriic5smu抑制不敏感。在先前表征的acr蛋白(10umcas9-sgrna+100umacr)的存在下,nme1cas9-nme2cas9pid嵌合体的体外切割。基于上述体外数据,假设可以将acriic1nme、acriic2nme、acriic3nme和acriic4hpa用作nme2cas9基因组编辑的关闭开关(off-switch)。为了测试这一点,在存在或不存在acr表达质粒的情况下,在hek293t细胞中进行了靶向ts16的nme2cas9/sgrna质粒转染(每个质粒150ng),因为据报道大多数acr以这些质粒比率抑制nme1cas9(pawluk等人,2016)。如预期的,acriic1nme、acriic2nme、acriic3nme和acriic4hpa抑制nme2cas9基因组编辑,而acriic5smu没有作用。参见图11b。通过acriic3nme和acriic4hpa观察到完全抑制,表明与acriic1nme和acriic2nme相比,它们具有针对nme2cas9的高效力。为了进一步比较acriic1nme和acriic4hpa的效力,我们以acr质粒与cas9质粒的各种比率重复了实验。参见图11c。数据显示,acriic4hpa质粒对nme2cas9特别有效。总之,这些数据表明,几种acr蛋白可用作基于nme2cas9的应用的关闭开关。6.超准确性nme1cas9在细胞和小鼠模型中显示出卓越的编辑保真度(lee等人,2016;amrani等人,2018;ibraheim等人,2018)。此外,nme2cas9与nme1cas9在其大部分长度上的相似性表明,它可能类似地是超准确的。但是,与nme1cas9及其较不频繁遇到的4-核苷酸pam相比,由于双核苷酸pam而在基因组中更高数量的采样位点可能为nme2cas9脱靶创造更多机会。为了评估nme2cas9的脱靶特征谱,使用guide-seq(通过测序实现的双链断裂的全基因组、无偏见鉴定)以凭经验和以无偏见的方式鉴定潜在的脱靶位点(tsai等人,2014)。即使是最佳的脱靶预测算法也容易产生假阴性,因此需要经验性的靶位点分析方法(bolukbasi等人,2015b;tsai和joung,2016;tycko等人,2016)。guide-seq依赖于在整个基因组中双链寡脱氧核苷酸(dsodn)在dna双链断裂位点中的整合。然后,通过扩增和高通量测序检测这些插入位点。由于spycas9是良好表征的cas9直系同源物,因此其可用于与其他cas9进行多重应用,并作为其编辑属性的基准(jiang和doudna,2017年;komor等人,2017)。将spycas9和nme2cas9克隆到具有相同utr、接头、nls和启动子的相同质粒主链中以用于并行瞬时转染(以及类似匹配的表达sgrna的质粒)到hek293t细胞中。首先,证实了用于spycas9和nme2cas9的rna指导物是正交的,即nme2cas9sgrna不由spycas9指导编辑,反之亦然。参见图13a。这与较早报道的使用nme1cas9的结果相反(esvelt等人,2013;fonfara等人,2014)。接下来,为了鉴定将spycas9用作guide-seq的基准,因为spycas9和nme2cas9具有不重叠的pam,因此它可以潜在地编辑侧接5’-nggncc-3’序列的任何双位点(ds),这同时满足了两种cas9的pam要求。这允许将脱靶与促进完全相同的中靶位点的编辑的rna指导物进行并行比较。参见图14a。靶向vegfa中的六(6)个ds,每个ds还在pam的5’的适当位置具有g,使得spycas9和nme2cas9指导物(由u6启动子驱动)均与靶位点100%互补。转染后七十二(72)小时,对每个核酸酶靶向的这些位点进行tide分析。nme2cas9在所有六个位点均诱导插入缺失,尽管其中两个效率较低,而spycas9在六个位点中的四个诱导插入缺失。参见图14b。在spycas9有效的四个位点中的两个(ds1和ds4)处,它诱导比nme2cas9约7倍更多的插入缺失,而nme2cas9在ds6处比spycas9诱导约3倍更高频率的插入缺失。两种cas9直系同源物以几乎相等的效率编辑ds2。对于guide-seq,选择了ds2、ds4和ds6来采样使用nme2cas9指导物的脱靶切割,该nme2cas9指导物与相应的spycas9指导物相比同样有效、效率更低或效率更高地指导中靶编辑。除了三个双重位点之外,还添加了ts6,因为已观察到ts6是有效编辑的nme2cas9靶位点,取决于细胞类型具有大约30-50%的插入缺失效率。参见图9a和10a。使用小鼠pcsk9和rosa26nme2cas9位点看到类似的数据。参见图9b。对每个cas9及其同源sgrna和dsodn进行质粒转染。随后,如前所述(amrani等人,2018)制备了guide-seq文库。guide-seq分析显示了两种cas9直系同源物的有效中靶编辑,其中相对效率(由guide-seq读数计数反映)类似于通过tide观察到的效率。图13b和表2。(tsai等人,2014;zhu等人,2017)。图13呈现了示例性数据,其显示了如与图12相关的nme2cas9和spycas9在双靶位点处的正交性和相对准确性。图13a显示了示例性nme2cas9和spycas9指导物是正交的。tide结果显示了由靶向ds2的两种核酸酶与其同源sgrna或与其他直系同源物的sgrna产生的插入缺失的频率。图13b显示了示例性的nme2cas9和spycas9,其表现出可比较的中靶编辑效率,如通过guide-seq所评估的。条形图表示在每个直系同源物靶向的三个双位点处的来自guide-seq的中靶读数计数。橙色条代表nme2cas9,黑色条代表spycas9。图13c显示了每个位点的示例性spycas9的中靶相对脱靶读数计数。橙色条代表中靶读数,而黑色条代表脱靶。图13d显示了每个位点的示例性nme2cas9中靶相对脱靶读数。图13e的条形图显示了由crisprseek预测的潜在脱靶位点的示例性插入缺失效率(通过tide测量)。中靶和脱靶位点序列显示在左侧,其中pam区用下划线标出,并且sgrna错配和非共有pam核苷酸以红色表示。表2:guide-seq数据spyds2spyds4spyds6对于脱靶鉴定,分析显示,当通过guide-seq分析基于质粒的spycas9编辑时,ds2、ds4和ds6spycas9sgrna似乎在脱靶的正常范围内分别以93、10和118个脱靶候选位点指导编辑(fu等人,2014;tsai等人,2014)。与之形成鲜明对比的是,ds2、ds4和ds6nme2cas9sgrna似乎分别以1、0和1个脱靶位点指导编辑。图14c和表2。与针对spycas9脱靶的guide-seq读数计数相比,nme2cas9的读数计数非常低,进一步表明nme2cas9具有高度特异性。参见图13c,图13d。用ts6、pcsk9和rosa26进行的nme2cas9guide-seq分析产生了相似的结果(分别为0、0和1个脱靶位点,对于rosa26-ot1脱靶位点具有较小的读数计数)。图13c,图14d和表2。图14呈现了示例性数据,其显示了nme2cas9在哺乳动物细胞中几乎没有或没有可检测到的脱靶。图14a显示了示例性示意图,其描绘了可通过spycas9和nme2cas9二者借助于其非重叠的pam而靶向的双位点(ds)。nme2cas9pam(橙色)和spycas9pam(蓝色)突出显示。24nt的nme2cas9指导序列以黄色表示;spycas9的相应指导序列在5’末端将短4nt。图14b显示了在ds处诱导插入缺失的示例性nme2cas9和spycas9。选择了vegfa(具有gn3gn19nggncc序列)中的六个ds,以用于直接比较通过两个直系同源物的编辑。表达每个cas9(具有相同的启动子、接头、标签和nls)及其同源指导物的质粒被转染到hek293t细胞中。转染后72小时通过tide测定插入缺失效率。nme2cas9编辑在所有六个位点均可检测到,并且在两个位点(分别为ds2和ds6)比spycas9略微或明显更为有效。spycas9编辑了六个位点中的四个(ds1、ds2、ds4和ds6),其中两个位点的编辑效率比nme2cas9(ds1和ds4)显著更高。选择ds2、ds4和ds6进行guide-seq分析,因为在这些位点,nme2cas9与spycas9相比分别具有相同的效率、更低的效率和更高的效率。图14c显示了在人细胞中高度精确的示例性nme2cas9基因组编辑。显示了由guide-seq在各个靶位点针对每种核酸酶检测到的脱靶位点的数量。除双位点外,我们还分析了小鼠hepa1-6细胞中的ts6(由于其高的中靶编辑效率)以及pcsk9和rosa26位点(以测量另一种细胞类型的准确性)。图14d显示用于检测编辑的细胞中的插入缺失的示例性的靶向深度测序证实了由guide-seq指示的高nme2cas9准确性。图14e显示了rosa26指导物的经验证的脱靶位点的示例性序列,显示了pam区(带下划线),共有ccpam二核苷酸(粗体)和间隔区pam远端部分的三个错配(红色)。为了验证通过guide-seq检测的脱靶位点,在guide-seq独立编辑(即不进行dsodn的共转染)后,进行靶向的深度测序以测量在顶部的脱靶位点处的插入缺失形成。尽管spycas9在测试的大多数脱靶位点都显示出可观的编辑,并且在一些情况下比在相应的中靶位点处更有效,但nme2cas9在单独的ds2和ds6候选脱靶位点上没有显示可检测到的插入缺失。参见图14d。使用rosa26sgrna,nme2cas9在hepa1-6细胞中的rosa26-ot1位点处诱导~1%的编辑,相比之下中靶编辑为~30%。参见图14d。值得注意的是,这个脱靶位点具有共有的nme2cas9pam(actccct),其在指导物互补区的pam远端(即在种子的外部)只有3个错配。参见图14e。这些数据支持并加强了我们的guide-seq结果,表明了哺乳动物细胞中nme2cas9基因组编辑的高度准确性。为了进一步证实以上的guide-seq结果,使用crisprseek来计算地预测靶向ts25和ts47(两者也都位于vegfa中)的两个活性nme2cas9sgrna的潜在脱靶位点。参见图9a;(zhu等人,2014)。最紧密匹配的预测位点中的三个(ts25)或四个(ts47),五个具有n4ccpam,两个具有n4capam;每个具有2-5个错配,主要是在它们的pam远端的非种子区域中。参见图13e。nme2cas9+sgrna质粒转染到hek293t细胞后,通过每个基因座的靶向扩增,然后进行tide分析,比较了中靶编辑与脱靶编辑。一致地,在任一sgrna的那些脱靶位点处通过tide未检测到插入缺失,而在来自相同细胞群的dna中容易检测到有效的中靶编辑。综上所述,我们的数据表明nme2cas9是哺乳动物细胞中的天然超准确基因组编辑平台。7.腺相关病毒递送nme2cas9的紧凑尺寸、小的pam和高保真度为使用腺相关病毒(aav)递送的体内基因组编辑提供了主要优势。为了测试是否可以通过单aav递送实现有效的nme2cas9基因组编辑,将nme2cas9与其sgrna及其启动子(分别为u1a和u6)克隆到aav载体主链中。参见图15a。用包装到亲肝aav8衣壳中的sgrn-.nme2cas9制备多合一aav以靶向小鼠肝脏中的两个基因:i)rosa26(通常使用的用于转基因插入的安全港基因座)(friedrich和soriano,1991)作为阴性对照;和ii)pcsk9作为表型靶标,其是循环胆固醇稳态的主要调节物(rashid等人,2005)。小鼠肝脏中pcsk9中的saucas9或nme1cas9诱导的插入缺失导致和降低胆固醇水平,从而为新的编辑平台提供了有用且易于评分的体内基准(ran等人,2015;ibraheim等人,2018)。nme2cas9rna指导物与上文使用的那些相同。参见图9b、图13d和图14。由于rosa26-ot1是唯一在培养的哺乳动物细胞中经过验证的nme2cas9脱靶位点,因此rosa26指导物还为我们提供了评估在体内的中靶相对脱靶编辑的机会。参见图14d-e。两组小鼠(n=5)的尾静脉被注射了靶向pcsk9或rosa26的4x1011个aav8.sgrna.nme2cas9基因组拷贝(gc)。在注射后0、14和28天收集血清以用于胆固醇水平测量。注射后28天处死小鼠,并收集肝组织。参见图15a。每个基因座的靶向深度测序揭示了肝脏中pcsk9和rosa26编辑位点处分别~38%和~46%的插入缺失诱导。参见图15b。由于肝细胞仅占成年肝脏中总细胞含量的65-70%,因此使用sgpcsk9和sgrosa的nme2cas9aav诱导的肝细胞编辑效率分别为约54-58%和66-71%(racanelli和rehermann,2006)。在rosa26-ot1脱靶位点仅检测到总体2.25%的肝脏插入缺失(肝细胞中的约3-3.5%),与我们在转染的hepa1-6细胞中在该位点观察到的1%编辑相当。参见图15b,图14d。在注射后第14天和第28天,pcsk9编辑伴随着血清胆固醇水平的~44%的降低,而在整个研究过程中,用表达sgrosa26的aav处理的小鼠保持正常水平的胆固醇。参见图15c。nme2cas9/sgpcsk9aav处理的小鼠中血清胆固醇的~44%的减少与当靶向同一基因时使用saucas9多合一aav所报道的~40%的减少良好相当(ran等人,2015)。图15呈现了示例性数据,其显示了通过多合一aav递送在体内编辑nme2cas9基因组。图15a显示了在小鼠中通过靶向pcsk9递送aav8.sgrna.nme2cas9以降低胆固醇水平的示例性工作流程。上图:表达nme2cas9和sgrna的多合一aav载体示意图(个体基因组元件未按比例绘制)。bgh,牛生长激素多聚(a)位点;ha,表位标签;nls,核定位序列;h,人密码子优化的。下图:aav8.sgrna.nme2cas9尾静脉注射(4x1011gc)的时间线,然后在第14天进行胆固醇测量,并在注射后第28天进行插入缺失、组织学和胆固醇分析。图15b显示了示例性的tide分析,以测量从注射有靶向pcsk9和rosa26(对照)基因座的aav8.nme2cas9+sgrna的小鼠的肝脏提取的dna中的插入缺失。还通过tide评估了guide-seq在这两个sgrna(rosa26|ot1)识别的单个脱靶位点的插入缺失效率。图15c显示了与靶向rosa26的对照相比,注射了靶向pcsk9的指导物的小鼠中血清胆固醇水平的示例性降低。p值通过不成对的双尾t检验计算。图16呈现了示例性数据,其显示了与图15相关的nme2cas9aav递送和编辑后的pcsk9敲低和肝脏组织学。图16a显示了使用抗pcsk9抗体的示例性蛋白质印迹揭示了与用sgrosa26处理的小鼠相比,用sgpcsk9处理的小鼠的肝脏中pcsk9的极大降低的水平。将2ng重组pcsk9用作迁移率标准品(最左侧泳道),并用星号表示肝脏样品中的交叉反应带。gapdh被用作上样对照(下图)。图16b显示了来自用aav8.nme2cas9+sgrosa26(左)或aav8.nme2cas9+sgpcsk9(右)载体注射的小鼠的肝脏的示例性h&e染色。比例尺,25μm。使用抗pcsk9抗体进行蛋白质印迹以评估用sgpcsk9和sgrosa26处理的小鼠的肝脏中pcsk9蛋白的水平。在用sgpcsk9处理的小鼠中,肝脏pcsk9低于检测极限,而sgrosa26处理的小鼠表现出正常水平的pcsk9。参见图16a。苏木精和伊红(h&e)染色和组织学检查显示,nme2cas9表达后,两组均未显示毒性或组织损伤的迹象。参见图16b。这些数据验证了nme2cas9是体内的高效基因组编辑系统,包括在通过单aav载体递送时。aav载体最近已用于生成基因组编辑的小鼠,而无需显微注射或电穿孔,只需将受精卵浸入含有aav载体的培养基中,然后再植入假孕雌性动物中(yoon等人,2018)。先前使用双aav系统获得编辑,其中spycas9及其sgrna在分开的载体中递送(yoon等人,2018)。为了测试nme2cas9是否可以使用多合一aav递送系统在小鼠受精卵中执行准确和有效的编辑,我们靶向了酪氨酸酶(tyr)。tyr的双等位基因失活破坏黑色素的产生,从而导致白化病表型(yokoyama等人,1990)。验证了有效的tyrsgrna,其通过瞬时转染在hepa1-6细胞中距经典白化病突变的位点仅十七(17)bp的位置处切割tyr基因座。参见图17a。接下来,将c57bl/6nj受精卵在含有3x109或3x108gc的表达nme2cas9以及tyrsgrna的多合一aav6载体的培养基中孵育5-6小时。在新鲜培养基中过夜培养后,那些进入两细胞期的受精卵被转移到假孕受体的输卵管中并允许发育至末期(term)。参见图18a。幼仔的毛色分析显示,小鼠是白化的、银灰色(表示酪氨酸酶的亚等位基因)或具有由白化和银灰色斑组成的杂色毛色但缺乏黑色色素沉着。参见图18b-c。这些结果表明双等位基因突变的高频率,因为野生型酪氨酸酶等位基因的存在应导致黑色色素沉着。从3x109gc实验总共出生了5只幼仔(10%)。它们都携带插入缺失;从表型上看,两只是白化的,一只是银灰色的,以及两只具有杂色色素沉着,表明有镶嵌性。根据3x108gc实验,获得了四(4)只幼仔(14%),其中两只在出生时死亡,从而阻止了毛色或基因组分析。其余两只幼仔的毛色分析显示,一只银灰色幼仔和一只镶嵌色幼仔。这些结果表明,nme2cas9的单aav递送及其指导物可用于在无需显微注射或电穿孔的情况下在小鼠受精卵中产生突变。为了测量在tyr基因中的中靶插入缺失形成,从每只小鼠的尾巴分离dna,扩增基因座,并在其上进行tide分析。所有小鼠均具有高水平的通过nme2cas9的中靶编辑,范围从84%到100%不等。参见图17b-c。白化小鼠9-1中的大多数病变是1-bp或4-bp缺失,提示镶嵌性或反式杂合性(trans-heterozygosity),但白化小鼠9-2表现出一致的2-bp缺失。参见图17c。图17呈现了示例性数据,其显示与图16相关的小鼠受精卵中tyr离体编辑。图17a显示了在hepa1-6细胞中针对编辑进行测试的在tyr中的示例性的两个位点,每个位点具有n4ccpam。sgtyr2指导物显示出更高的编辑效率,因此被选择用于进一步测试。图17b显示了示例性的七只小鼠,它们在出生后发育中存活下来,并且每只表现出毛色表型以及中靶编辑,如通过tide测定的。图17c显示了来自(b)的每只小鼠以及未经编辑的c57bl/6nj小鼠的尾部dna的示例性插入缺失谱,如通过tide分析所示。指出了各种大小的插入(正)和缺失(负)的效率。图18呈现了示例性数据,其显示了通过多合一aav递送的nme2cas9基因组离体编辑。图18a显示了单aavnme2cas9离体编辑以通过靶向tyr基因产生白化病c57bl/6nj小鼠的示例性工作流程。受精卵在含有aav6.nme2cas9:sgtyr的ksom中培养5-6小时,在m2中漂洗,并培养一天,然后转移到假孕受体的输卵管中。图18b显示了通过3x109gc生成的示例性白化病(左)和银灰色或杂色(中)小鼠,以及通过具有aav6.nme2cas9:sgtyr的受精卵的3x108gc生成的银灰色或杂色小鼠(右)。图18c显示了在两个aav剂量下nme2cas9.sgtyr单aav离体tyr编辑实验的示例性总结。该数据关于在小鼠9-2中是否没有镶嵌性或者从小鼠9-1中是否缺失了其他等位基因是不确定的,因为仅对尾巴样品进行了测序,并且其他组织可能有明显的病变。来自银灰色小鼠的尾巴dna的分析显示存在读框内突变,这可能是引起银灰色毛色的原因。有限的突变复杂性表明编辑在这些小鼠的胚胎发育早期发生。这些结果通过应用单个aav载体为哺乳动物诱变提供了简化的途径,在这样的情况下,该载体递送nme2cas9及其sgrna两者。图19显示了针对nspcas9-abemax和优化的abemax-nnme2cas9(d16a)活性的示例性mcherry报告因子测定。图19a显示了abe-mcherry报告因子的序列信息的示例性序列信息。在mcherry编码区中有一个tag终止密码子。在报告因子整合的稳定细胞系中,由于此终止密码子而没有mcherry信号。如果nspcas9-abemax或优化的nnme2cas9-abemax可以将tag转化为cag(其编码谷氨酰胺残基),则将活化mcherry信号。图19b显示了由于spcas9-abe或nme2cas9-abe活性活化示例性mcherry信号。上图:阴性对照(无编辑);中图:通过nspcas9-abemax的mcherry活化;下图:通过优化的nnme2cas9-abemax的mcherry活化。图19c显示了用spcas9-abe或nme2cas9-abe转染的mcherry报告细胞中的碱基编辑事件的示例性facs定量。n=6;误差棒代表s.d.。结果来自在技术重复中进行的三次生物学重复。图20显示了针对nspcas9-cbe4(addgene#100802)和nnme2cas9-cbe4(与addgene#100802相同的质粒主链)活性的示例性gfp报告因子测定。图20a显示了cbe-gfp报告因子的示例性序列信息。gfp报告因子系的荧光团核心区域中存在突变,其将gyg转化为ghg。由于该突变,没有gfp信号。如果nspcas9-cbe4或nnme2cas9-cbe4可以将cac(编码组氨酸)转化为tac/tat(编码酪氨酸),则gfp信号将被激活。图20b显示了由于nspcas9-cbe4或nnme2cas9-cbe4活性而激活的示例性gfp信号。上图:阴性对照(无编辑);中图:通过nspcas9-cbe4的gfp激活;下图:通过nnme2cas9-cbe4的gfp激活。图20c显示了用nspcas9-cbe4或nnme2cas9-cbe4转染的gfp报告细胞中的碱基编辑事件的示例性facs定量。n=6;误差棒代表s.d.。结果来自在技术重复中进行的生物学重复。图21显示了通过nnme2cas9-cbe4进行的示例性胞嘧啶编辑。上图显示了nme2cas9的kank3靶向序列信息(pam序列以红色表示)和阴性对照样品中的碱基编辑。下图显示了kank3靶序列的nnmecas9-cbe4编辑窗口中每种类型的碱基的取代效率的量化。序列表格显示每个位置的核苷酸频率。预期的c至t转化的频率以红色表示。图22显示了分别通过nnme2cas9-cbe4和nnme2cas9-abemax进行的示例性胞嘧啶和腺嘌呤编辑。上图显示了nme2cas9的plxnb2靶向序列信息(pam序列以红色表示)和阴性对照样品中的碱基编辑。中图显示了plxnb2靶序列的nnmecas9-abemax编辑窗口中每种类型的碱基的取代率的量化。序列表格显示每个位置的核苷酸频率。预期的a至g转化频率以红色突出显示。下图显示了plxnb2靶序列的nnmecas9-cbe4编辑窗口中每种类型的碱基的取代效率的量化。序列表格显示每个位置的核苷酸频率。预期的c至t转化的频率以红色突出显示。8.序列nme1cas9和nme2cas9的比对非pidaa差异(青绿色-加下划线的);pidaa差异(黄色-加下划线的粗体);活性位点残基(红色-粗体)。nme1cas9和nme3cas9的比对非pidaa差异(蓝绿色-加下划线的);pidaa差异(黄色-加下划线的粗体);活性位点残基(红色-粗体)。质粒表达的nme2cas9sv40nls(黄色-粗体);3x-ha-标签(绿色-(加下划线的/粗体);cmyc样nls(蓝绿色-无格式);接头(洋红色-粗体斜体)和nme2cas9(斜体)。aav表达的nme2cas9sv40nls(黄色-粗体);3x-ha-标签(绿色(加下划线的/粗体);核质蛋白样nls(红色-加下划线的);c-mycnls(蓝绿色-无格式);接头(洋红色-粗体斜体)和nme2cas9(斜体)。重组nme2cas9sv40nls(黄色-粗体);核质蛋白样nls(红色-加下划线的);接头(洋红色-粗体斜体)和nme2cas9(斜体)。用于哺乳动物细胞rnp递送的重组nme2cas9:sv40nls(黄色-粗体);核质蛋白样nls(红色-加下划线的);接头(洋红色-粗体斜体)和nme2cas9(斜体)。9.治疗应用尽管紧凑型cas9直系同源物先前已被验证用于基因组编辑,包括通过单aav递送进行,但由于靶位点频率低于更广泛采用的spycas9,因此它们较长的pam限制了治疗的发展。此外,saucas9及其具有宽松pam要求的kkh变体(kleinstiver等人,2015)倾向于使用一些sgrna的脱靶编辑(friedland等人,2015;kleinstiver等人,2015)。这些限制在使用需要在狭窄序列窗口内进行编辑或需要精确的片段缺失的靶基因座的情况下加剧。我们已经鉴定nme2cas9是用于通过aav递送进行体内基因组编辑的紧凑且高度准确的cas9,其具有限制性更小的二核苷酸pam。nme2cas9的开发极大地扩展了体内编辑的基因组范围,尤其是通过病毒载体递送。这项研究中建立的nme2cas9多合一aav递送平台原则上可用于靶向与spycas9一样广泛范围的位点(由于相同密度的最佳n4cc和nggpam),但无需将两个单独的载体递送到同一靶细胞。nme2cas9催化失活形式(dnme2cas9)的可用性也有望扩大应用范围,例如crispri、crispra、碱基编辑和相关方法(dominguez等人,2016;komor等人,2017)。此外,nme2cas9的超准确性使得能够精确编辑靶基因,从而可能减轻由脱靶活动导致的安全性问题。可能与常识相反,nme2cas9的较高靶位点密度(与nme1cas9相比)不会导致前者的脱靶编辑的相对增加。最近报道了类似的结果,其中spycas9变体进化为具有更短的pam(hu等人,2018)。ii-c型cas9直系同源物是通常在体外比spycas9更慢的核酸酶(ma等人,2015;mir等人,2018);有趣的是,酶学原理表明,减少的表观kcat(在限制范围内)可以提高rna指导的核酸酶的中靶相对脱靶特异性(bisaria等人,2017)。nme2cas9和nme3cas9的发现依赖于未开发的与先前经过验证用于人基因组编辑的直系同源物高度相关(在pid之外)的cas9(esvelt等人,2013;hou等人,2013;lee等人,2016;amrani等人,2018)。nme2cas9和nme3cas9与nme1cas9的关联性带来了额外的好处,即它们使用完全相同的sgrna支架,从而避免了为各自鉴定和验证功能性tracrrna序列的需求。在天然crispr免疫的背景下,新型pam特异性的加速进化可能反映出恢复已通过pam突变逃避干扰的噬菌体和mge的靶向的选择性压力(deveau等人,2008;paez-espino等人,2015)。我们对acriic5smu抑制nme1cas9而非nme2cas9的观察提示了加速的pid变异的第二个非互斥的基础,即抗crispr抑制的逃避。我们还推测,加速的变异性可能不限于pid,可能是由于逃避结合其他cas9结构域的抗crispr的选择性压力所引起的。与cas9的更保守的区域结合的cas9抑制剂(例如acriic1)可能呈现较少的针对突变逃逸的途径,并因此表现出更广的抑制谱(harrington等人,2017a)。无论驱动acr和cas9共同进化的选择性压力的来源如何,经过验证的nme2cas9抑制剂(例如acriic1-4)的可用性为对其活性的额外水平的控制提供了机会。这项研究(即搜寻在cas9中的快速进化的结构域)中使用的方法可以在其他地方实现,尤其是在基因组序列水平上经过充分采样的细菌物种的情况下。此方法也可以应用于其他crispr-cas效应蛋白,例如cas12和cas13,其也已经被开发用于基因组或转录组工程改造和其他应用。与nme1cas9的情况一样,此策略在使用与已证实在异源背景下(例如在真核细胞中)具有功效的直系同源物密切相关的cas蛋白的情况下尤其引人注目。将此方法应用于脑膜炎球菌cas9直系同源基因产生了一个新的基因组编辑平台nme2cas9,其具有有望加速用于一般和治疗应用的基因组编辑工具的开发的独特的特征组合(紧凑的大小,二核苷酸pam,超准确性,单aav递送性和acr敏感性)。表3。下面给出了本文公开的质粒和寡核苷酸的示例性序列。用于哺乳动物基因组编辑的rnp递送对于rnp实验,完全如所述的(amrani等人,2018)使用neon电穿孔系统。简而言之,将40皮摩尔的3xnls-nme2cas9以及50皮摩尔的t7转录的sgrna组合在缓冲液r中,并使用10μlneontip进行电穿孔。电穿孔后,将细胞铺在预热的包含适当的不含抗生素的培养基的24孔板中。电穿孔参数(电压、宽度、脉冲数)对于hek293t细胞为1150v、20ms、2个脉冲;对于k562细胞为1000v、50ms、1个脉冲。体内aav8.nme2cas9+sgrna递送和肝组织处理对于aav8载体注射,通过尾静脉向8周大的雌性c57bl/6nj小鼠注射4x1011个基因组拷贝/小鼠,其中sgrna靶向pcsk9或rosa26中的经验证的位点。载体施用28天后处死小鼠,并收集肝组织用于分析。将肝组织在4%福尔马林中固定过夜,包埋在石蜡中,切片并用苏木精和伊红(h&e)染色。在注射后0、14和28天从面静脉抽血,并使用血清分离器(bd,目录号365967)分离血清,并在-80℃下保存直至测定。按照制造商的方案并如先前描述的(ibraheim等人,2018),使用infinitytm比色终点测定法(thermo-scientific)测量血清胆固醇水平。对于抗pcsk9蛋白质印迹,将来自组织的40μg蛋白或2ng重组小鼠pcsk9蛋白(r&dsystems,9258-se-020)加载到tgxtm预制凝胶(bio-rad)上。将分离的条带转移至pvdf膜上,并在室温下用5%blocking-gradeblocker溶液(bio-rad)封闭2小时。接下来,将膜与兔抗gapdh(abcamab9485,1:2,000)或山羊抗pcsk9(r&dsystemsaf3985,1:400)抗体孵育过夜。将膜在tbst中洗涤,并与辣根过氧化物酶(hrp)缀合的山羊抗兔(bio-rad1706515,1:4,000)和驴抗山羊(r&dsystemshaf109,1:2,000)二抗在室温下孵育2小时。再次在tbst中洗涤膜,并使用m35axomat处理器(kodak),使用claritytmwesternecl底物(bio-rad)可视化。小鼠受精卵中的离体aav6.nme2cas9递送将受精卵在含3x109或3x108gc的aav6.nme2cas9.sgtyr载体的ksom(potassium-supplementedsimplexoptimizedmedium,millipore,目录号mr-106-d)的15μl滴剂中(每滴中4个受精卵)孵育5-6小时。孵育后,将受精卵在m2中漂洗,并转移到新鲜的ksom用于过夜培养。第二天,将进行到2-细胞期的胚胎转移到假孕受体的输卵管中,并允许其发育至末期。实验实施例i具有差异不同的pid的cas9直系同源物的发现在blast搜索中使用nme1cas9肽序列作为查询,以查找脑膜炎奈瑟氏球菌种中的所有cas9直系同源物。选择与nme1cas9具有>80%同一性的直系同源物用于本研究的其余部分。然后使用clustalw2将pid与nme1cas9的pid(残基820-1082)进行比对,并选择在pid中具有突变簇的那些用于进一步分析。使用figtree(http://tree.bio.ed.ac.uk/software/figtree/)构建了nmecas9直系同源物的无根系统发育树。实施例iicas9和acr直系同源物的克隆、表达和纯化表3列出了本研究中使用的质粒和寡核苷酸的示例。nme2cas9和nme3cas9的pid作为gblocks(idt)进行订购以使用gibsonassembly(neb)替代细菌表达质粒pmscg7中的nme1cas9的pid(zhang等人,2015),所述质粒编码具有6xhis标签的nme1cas9。如前所述(pawluk等人,2016),将构建体转化到大肠杆菌中,进行表达和纯化。简而言之,使包含各个cas9质粒的rosetta(de3)细胞在37℃下生长至0.6的od600,并在18℃通过1mmiptg诱导蛋白表达16小时。收获细胞,并在补充有1mg/ml溶菌酶和蛋白酶抑制剂混合物(sigma)的裂解缓冲液[50mmtris-hcl(ph7.5),500mmnacl,5mm咪唑,1mmdtt]中通过超声处理进行裂解。然后使裂解物跑过ni2+-nta琼脂糖柱(qiagen),并将结合的蛋白用300mm咪唑洗脱,并透析到存储缓冲液[20mmhepes-naoh(ph7.5),250mmnacl,1mmdtt]中。对于acr蛋白,在大肠杆菌菌株bl21rosetta(de3)中表达6xhis标记的蛋白。使细胞在振荡培养箱中在37℃生长至0.6的光密度(od600)。将细菌培养物冷却至18℃,并通过添加1mmiptg诱导蛋白表达以进行过夜表达。第二天,收获细胞并将其重悬于补充有1mg/ml溶菌酶和蛋白酶抑制剂混合物(sigma)的裂解缓冲液中,并使用与cas9相同的方案纯化蛋白。通过将树脂结合蛋白与烟草蚀刻病毒(tev)蛋白酶在4℃孵育过夜来去除6xhis标签以分离未标记的acr。实施例iii体外pam发现测定通过重叠pcr产生具有随机pam序列的dsdna靶文库,其中正向引物包含10-nt随机pam区。将该文库进行凝胶纯化,并通过纯化的cas9以及t7转录的sgrna进行体外切割反应。将300nmcas9:sgrna复合物用于在37℃在1xnebuffer3.1(neb)中切割300nm的靶片段1小时。然后将反应物在50℃用蛋白酶k处理10分钟,并在4%琼脂糖/1xtae凝胶上电泳。使用经修改的先前描述的方案(zhang等人,2012)对切割产物进行切除、洗脱和克隆。简而言之,修复dna末端,添加非模板化的2’-脱氧腺苷尾巴,并连接y形衔接子。pcr后,用kapa文库定量试剂盒对产物进行定量,并使用nextseq500(illumina)进行测序,以获得75nt的配对末端读数。使用自定义脚本和r分析序列。实施例iv转染和哺乳动物基因组编辑通过gibsonassembly将人密码子优化的nme2cas9克隆到先前用于nme1cas9和spycas9表达的pcdest2质粒主链中(pawluk等人,2016;amrani等人,2018)。如先前所述(amrani等人,2018)进行hek293t和hek293t-tlr2.0细胞的转染。对于hepa1-6转染,使用在转染前已培养24小时的细胞,使用lipofectamineltx在24孔板(~105个细胞/孔)中转染500ng的多合一aav.sgrna.nme2cas9质粒。对于通过慢病毒载体递送的稳定表达nme2cas9的k562细胞(见下文),使用10μlneontip用500ngsgrna质粒对50,000–150,000个细胞进行电穿孔。为了在转染72小时后测量所有细胞中的插入缺失,收获细胞并使用dnaesy血液和组织试剂盒(qiagen)提取基因组dna。通过pcr扩增靶向的基因座,进行sanger测序(genewiz),并通过tide(brinkman等人,2014)使用基于desktopgenetics网络的界面(http://tide.deskgen.com)进行分析。实施例v慢病毒转导k562细胞以稳定表达nme2cas9如先前针对nme1cas9所述(amrani等人,2018),生成了稳定表达nme2cas9的k562细胞。对于慢病毒产生,使用transit-lt1转染试剂(mirusbio)将慢病毒载体与包装质粒(addgene12260和12259)一起在6孔板中共转染到hek293t细胞中。24小时后,从转染的细胞吸出培养基,并用1ml新鲜的dmem代替。第二天,收集含有病毒的上清液,并通过0.45μm过滤器过滤。将10ul的未稀释上清液与2.5ug聚凝胺一起用于转导6孔板中的~106个k562细胞。使用补充有2.5μg/ml嘌呤霉素的培养基来选择转导的细胞。实施例vi用于哺乳动物基因组编辑的rnp递送对于rnp实验,完全如所述(amrani等人,2018)的使用neon电穿孔系统。简而言之,将40皮摩尔的3xnls-nme2cas9以及50皮摩尔的t7转录的sgrna组合在缓冲液r中,并使用10μlneontip进行电穿孔。电穿孔后,将细胞铺在预热的包含适当的不含抗生素的培养基的24孔板中。电穿孔参数(电压、宽度、脉冲数)对于hek293t细胞为1150v、20ms、2个脉冲;对于k562细胞为1000v、50ms、1个脉冲。实施例viiguide-seq如前所述(tsai等人,2014)进行guide-seq实验,其中进行了微小改变(bolukbasi等人,2015a)。简而言之,使用polyfect(qiagen)将200ngcas9质粒、200ngsgrna质粒和7.5pmol退火的guide-seq寡核苷酸转染hek293t细胞。可替代地,如上文所述转染hepa1-6细胞。转染后72小时,根据制造商的方案,使用dneasy血液和组织试剂盒(qiagen)提取基因组dna。完全如前所述(bolukbasi等人,2015a)进行文库制备和测序。为了进行分析,与靶位点具有多至十个错配以及在第五个pam位置具有c(n4cn)的所有序列被认为是潜在的脱靶位点。使用bioconductor软件包guideseq版本1.1.17(zhu等人,2017)分析数据。实施例viii靶向的深度测序和分析我们使用靶向的深度测序来确认guide-seq的结果,并以最大的准确度测量插入缺失率。我们使用了两步pcr扩增针对每个中靶和脱靶位点产生dna片段。为了在ds2和ds6上进行spycas9编辑,我们基于guide-seq读数计数选择了排名靠前的脱靶位点。为了在ds4上进行spycas9编辑,通过guide-seq鉴定了较少的候选脱靶位点,并且仅通过测序检查了具有ngg(ds4|ot1,ds4|ot3,ds4|ot6)或ngc(ds4|ot2)pam的那些。在第一步中,我们使用携带具有与衔接子互补的末端的通用突出端的基因座特异性引物。在第一步中,使用2xpcr预混液(neb)生成具有突出端的片段。在第二步中,用通用正向引物和索引反向引物扩增纯化的pcr产物。将全尺寸产物(~250bp)进行凝胶纯化,并在illuminamiseq上以配对末端模式进行测序。如前所述(pinello等人,2016;ibraheim等人,2018)进行miseq数据分析。实施例ix使用crisprseek的脱靶分析使用bioconductor软件包crisprseek进行针对ts25和ts47的全局脱靶预测。进行了较小的改变以适应不与spycas9共有的nme2cas9的特征。具体地,我们使用了以下改变:grna.尺寸=24,pam=“nnnncc”,pam.尺寸=6,rna.pam.模式=“nnnncn”,并收集了具有少于6个错配的候选脱靶位点。基于错配的数量和位置选择最可能的脱靶位点。来自被每个各自sgrna靶向的细胞的基因组dna被用于扩增每个候选脱靶基因座,然后通过tide进行分析。实施例x小鼠品系和胚胎收集所有动物实验均在马萨诸塞大学医学院的机构动物护理和使用委员会(iacuc)的指导下进行。c57bl/6nj(库存号005304)。小鼠获自thejacksonlaboratory。将所有动物维持在12小时的光照周期中。在观察到交配栓时的那一天的光周期的中间被认为是妊娠的胚胎日0.5(e0.5)。在e0.5通过用镊子撕开壶腹并在含有透明质酸酶的m2培养基中孵育以除去卵丘细胞收集受精卵。实施例xi体内aav8.nme2cas9+sgrna递送和肝组织处理对于aav8载体注射,通过尾静脉向8周大的雌性c57bl/6nj小鼠注射4x1011个基因组拷贝/小鼠,其中sgrna靶向pcsk9或rosa26中的经验证的位点。载体施用28天后处死小鼠,并收集肝组织用于分析。将肝组织在4%福尔马林中固定过夜,包埋在石蜡中,切片并用苏木精和伊红(h&e)染色。在注射后0、14和28天从面静脉抽血,并使用血清分离器(bd,目录号365967)分离血清,并在-80℃下保存直至测定。按照制造商的方案并如先前描述的(ibraheim等人,2018),使用infinitytm比色终点测定法(thermo-scientific)测量血清胆固醇水平。对于抗pcsk9蛋白质印迹,将来自组织的40μg蛋白或2ng重组小鼠pcsk9蛋白(r&dsystems,9258-se-020)加载到tgxtm预制凝胶(bio-rad)上。将分离的条带转移至pvdf膜上,并在室温下用5%blocking-gradeblocker溶液(bio-rad)封闭2小时。接下来,将膜与兔抗gapdh(abcamab9485,1:2,000)或山羊抗pcsk9(r&dsystemsaf3985,1:400)抗体孵育过夜。将膜在tbst中洗涤,并与辣根过氧化物酶(hrp)缀合的山羊抗兔(bio-rad1706515,1:4,000)和驴抗山羊(r&dsystemshaf109,1:2,000)二抗在室温孵育2小时。再次在tbst中洗涤膜,并使用m35axomat处理器(kodak),使用claritytmwesternecl底物(bio-rad)可视化。实施例xii小鼠受精卵中的离体aav6.nme2cas9递送将受精卵在含3x109或3x108gc的aav6.nme2cas9.sgtyr载体的ksom(potassium-supplementedsimplexoptimizedmedium,millipore,目录号mr-106-d)的15μl滴剂中(每滴中4个受精卵)孵育5-6小时。孵育后,将受精卵在m2中漂洗,并转移到新鲜的ksom用于过夜培养。第二天,将进行到2-细胞期的胚胎转移到假孕受体的输卵管中,并允许其发育至末期。参考文献,其各自通过引用整体并入本文:amrani,n.,gao,x.d.,liu,p.,edraki,a.,mir,a.,ibraheim,r.,gupta,a.,sasaki,k.e.,wu,t.,donohoue,p.d.,等人(2018).nmecas9isanintrinsicallyhigh-fidelitygenomeeditingplatform.biorxiv,https://doi.org/10.1101/172650.barrangou,r.,fremaux,c.,deveau,h.,richards,m.,boyaval,p.,moineau,s.,romero,d.a.,和horvath,p.(2007).crisprprovidesacquiredresistanceagainstvirusesinprokaryotes.science315,1709-1712.bisaria,n.,jarmoskaite,i.,和herschlag,d.(2017).lessonsfromenzymekineticsrevealspecificityprinciplesforrna-guidednucleasesinrnainterferenceandcrispr-basedgenomeediting.cellsyst.4,21-29.bolukbasi,m.f.,gupta,a.,oikemus,s.,derr,a.g.,garber,m.,brodsky,m.h.,zhu,l.j.,和wolfe,s.a.(2015a).dna-binding-domainfusionsenhancethetargetingrangeandprecisionofcas9.nat.methods12,1150-1156.bolukbasi,m.f.,gupta,a.,和wolfe,s.a.(2015b).creatingandevaluatingaccuratecrispr-cas9scalpelsforgenomicsurgery.nat.methods13,41-50.brinkman,e.k.,chen,t.,amendola,m.,和vansteensel,b.(2014).easyquantitativeassessmentofgenomeeditingbysequencetracedecomposition.nucleicacidsres.42,e168.brouns,s.j.,jore,m.m.,lundgren,m.,westra,e.r.,slijkhuis,r.j.,snijders,a.p.,dickman,m.j.,makarova,k.s.,koonin,e.v.,和vanderoost,j.(2008).smallcrisprrnasguideantiviraldefenseinprokaryotes.science321,960-964.casini,a.,olivieri,m.,petris,g.,montagna,c.,reginato,g.,maule,g.,lorenzin,f.,prandi,d.,romanel,a.,demichelis,f.,等人(2018).ahighlyspecificspcas9variantisidentifiedbyinvivoscreeninginyeast.nat.biotechnol.36,265-271.certo,m.t.,ryu,b.y.,annis,j.e.,garibov,m.,jarjour,j.,rawlings,d.j.,和scharenberg,a.m.(2011).trackinggenomeengineeringoutcomeatindividualdnabreakpoints.nat.methods8,671-676.chen,j.s.,dagdas,y.s.,kleinstiver,b.p.,welch,m.m.,sousa,a.a.,harrington,l.b.,sternberg,s.h.,joung,j.k.,yildiz,a.,和doudna,j.a.(2017).enhancedproofreadinggovernscrispr-cas9targetingaccuracy.nature550,407-410.cho,s.w.,kim,s.,kim,j.m.,和kim,j.s.(2013).targetedgenomeengineeringinhumancellswiththecas9rna-guidedendonuclease.nat.biotechnol.31,230-232.cho,s.w.,kim,s.,kim,y.,kweon,j.,kim,h.s.,bae,s.,和kim,j.s.(2014).analysisofoff-targeteffectsofcrispr/cas-derivedrna-guidedendonucleasesandnickases.genomeres.24,132-141.cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.,等人(2013).multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823.deltcheva,e.,chylinski,k.,sharma,c.m.,gonzales,k.,chao,y.,pirzada,z.a.,eckert,m.r.,vogel,j.,和charpentier,e.(2011).crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.nature471,602-607.deveau,h.,barrangou,r.,garneau,j.e.,labonte,j.,fremaux,c.,boyaval,p.,romero,d.a.,horvath,p.,和moineau,s.(2008).phageresponsetocrispr-encodedresistanceinstreptococcusthermophilus.j.bacteriol.190,1390-1400.dominguez,a.a.,lim,w.a.,和qi,l.s.(2016).beyondediting:repurposingcrispr-cas9forprecisiongenomeregulationandinterrogation.nat.rev.mol.cellbiol.17,5-15.dong,guo,m.,wang,s.,zhu,y.,wang,s.,xiong,z.,yang,j.,xu,z.,和huang,z.(2017).structuralbasisofcrispr-spycas9inhibitionbyananti-crisprprotein.nature546,436-439.esvelt,k.m.,mali,p.,braff,j.l.,moosburner,m.,yaung,s.j.,和church,g.m.(2013).orthogonalcas9proteinsforrna-guidedgeneregulationandediting.nat.methods10,1116-1121.fonfara,i.,lerhun,a.,chylinski,k.,makarova,k.s.,lecrivain,a.l.,bzdrenga,j.,koonin,e.v.,和charpentier,e.(2014).phylogenyofcas9determinesfunctionalexchangeabilityofdual-rnaandcas9amongorthologoustypeiicrispr-cassystems.nucleicacidsres.42,2577-2590.friedland,a.e.,baral,r.,singhal,p.,loveluck,k.,shen,s.,sanchez,m.,marco,e.,gotta,g.m.,maeder,m.l.,kennedy,e.m.,等人(2015).characterizationofstaphylococcusaureuscas9:asmallercas9forall-in-oneadeno-associatedvirusdeliveryandpairednickaseapplications.genomebiol.16,257.friedrich,g.,和soriano,p.(1991).promotertrapsinembryonicstemcells:ageneticscreentoidentifyandmutatedevelopmentalgenesinmice.genesdev.5,1513-1523.fu,y.,sander,j.d.,reyon,d.,cascio,v.m.,和joung,j.k.(2014).improvingcrispr-casnucleasespecificityusingtruncatedguidernas.nat.biotechnol.32,279-284.gallagher,d.n.,和haber,j.e.(2018).repairofasite-specificdnacleavage:old-schoollessonsforcas9-mediatedgeneediting.acschem.biol.13,397-405.garneau,j.e.,dupuis,m.e.,villion,m.,romero,d.a.,barrangou,r.,boyaval,p.,fremaux,c.,horvath,p.,magadan,a.h.,和moineau,s.(2010).thecrispr/casbacterialimmunesystemcleavesbacteriophageandplasmiddna.nature468,67-71.gasiunas,g.,barrangou,r.,horvath,p.,和siksnys,v.(2012).cas9-crrnaribonucleoproteincomplexmediatesspecificdnacleavageforadaptiveimmunityinbacteria.proc.natl.acad.sci.usa109,e2579-2586.gaudelli,n.m.,komor,a.c.,rees,h.a.,packer,m.s.,badran,a.h.,bryson,d.i.,和liu,d.r.(2017).programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471.ghanta,k.,dokshin,g.,mir,a.,krishnamurthy,p.,gneid,h.,edraki,a.,watts,j.,sontheimer,e.,和mello,c.(2018).5′modificationsimprovepotencyandefficacyofdnadonorsforprecisiongenomeediting.biorxiv354480.gorski,s.a.,vogel,j.,和doudna,j.a.(2017).rna-basedrecognitionandtargeting:sowingtheseedsofspecificity.nat.rev.mol.cellbiol.18,215-228.harrington,l.b.,doxzen,k.w.,ma,e.,liu,j.j.,knott,g.j.,edraki,a.,garcia,b.,amrani,n.,chen,j.s.,cofsky,j.c.,等人(2017a).abroad-spectruminhibitorofcrispr-cas9.cell170,1224-1233.harrington,l.b.,paez-espino,d.,staahl,b.t.,chen,j.s.,ma,e.,kyrpides,n.c.,和doudna,j.a.(2017b).athermostablecas9withincreasedlifetimeinhumanplasma.nat.commun.8,1424.hou,z.,zhang,y.,propson,n.e.,howden,s.e.,chu,l.f.,sontheimer,e.j.,和thomson,j.a.(2013).efficientgenomeengineeringinhumanpluripotentstemcellsusingcas9fromneisseriameningitidis.proc.natl.acad.sci.usa110,15644-15649.hu,j.h.,miller,s.m.,geurts,m.h.,tang,w.,chen,l.,sun,n.,zeina,c.m.,gao,x.,rees,h.a.,lin,z.,等人(2018).evolvedcas9variantswithbroadpamcompatibilityandhighdnaspecificity.nature556,57-63.hwang,w.y.,fu,y.,reyon,d.,maeder,m.l.,tsai,s.q.,sander,j.d.,peterson,r.t.,yeh,j.r.,和joung,j.k.(2013).efficientgenomeeditinginzebrafishusingacrispr-cassystem.nat.biotechnol.31,227-229.hynes,a.p.,rousseau,g.m.,lemay,m.-l.,horvath,p.,romero,d.a.,fremaux,c.,和moineau,s.(2017).ananti-crisprfromavirulentstreptococcalphageinhibitsstreptococcuspyogenescas9.nat.microbiol.2,1374-1380.ibraheim,r.,song,c.-q.,mir,a.,amrani,n.,xue,w.,和sontheimer,e.j.(2018).all-in-oneadeno-associatedvirusdeliveryandgenomeeditingbyneisseriameningitidiscas9invivo.biorxiv,https://doi.org/10.1101/295055.jiang,f.,和doudna,j.a.(2017).crispr–cas9structuresandmechanisms.annu.rev.biophys.46,505-529.jiang,w.,bikard,d.,cox,d.,zhang,f.,和marraffini,l.a.(2013).rna-guidededitingofbacterialgenomesusingcrispr-cassystems.nat.biotechnol.31,233-239.jinek,m.,chylinski,k.,fonfara,i.,hauer,m.,doudna,j.a.,和charpentier,e.(2012).aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337,816-821.jinek,m.,east,a.,cheng,a.,lin,s.,ma,e.,和doudna,j.(2013).rna-programmedgenomeeditinginhumancells.elife2,e00471.karvelis,t.,gasiunas,g.,young,j.,bigelyte,g.,silanskas,a.,cigan,m.,和siksnys,v.(2015).rapidcharacterizationofcrispr-cas9protospaceradjacentmotifsequenceelements.genomebiol.16,253.keeler,a.m.,elmallah,m.k.,和flotte,t.r.(2017).genetherapy2017:progressandfuturedirections.clin.transl.sci.10,242-248.kim,e.,koo,t.,park,s.w.,kim,d.,kim,k.-e.,kim,k.,cho,h.-y.,song,d.w.,lee,k.j.,jung,m.h.,等人(2017).invivogenomeeditingwithasmallcas9orthologderivedfromcampylobacterjejuni.nat.commun.8,14500.kim,s.,kim,d.,cho,s.w.,kim,j.,和kim,j.s.(2014).highlyefficientrna-guidedgenomeeditinginhumancellsviadeliveryofpurifiedcas9ribonucleoproteins.genomeres.24,1012-1019.kim,b.,komor,a.,levy,j.,packer,m.,zhao,k.,和liu,d.(2017).increasingthegenome-targetingscopeandprecisionofbaseeditingwithengineeredcas9-cytidinedeaminasefusions.naturebiotechnology35.kleinstiver,b.p.,prew,m.s.,tsai,s.q.,nguyen,n.t.,topkar,v.v.,zheng,z.,和joung,j.k.(2015).broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition.nat.biotechnol.33,1293-1298.kluesner,m.,nedveck,d.,lahr,w.,garbe,j.,abrahante,j.,webber,b.,和moriarity,b.(2018).editr:amethodtoquantifybaseeditingfromsangersequencing.thecrisprjournal1,239–250.koblan,l.,doman,j.,wilson,c.,levy,j.,tay,t.,newby,g.,maianti,j.,raguram,a.,和liu,d.(2018).improvingcytidineandadeninebaseeditorsbyexpressionoptimizationandancestralreconstruction.natbiotechnol36,843.komor,a.c.,badran,a.h.,和liu,d.r.(2017).crispr-basedtechnologiesforthemanipulationofeukaryoticgenomes.cell168,20-36.komor,a.c.,kim,y.b.,packer,m.s.,zuris,j.a.,和liu,d.r.(2016).programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage.nature533,420-424.lee,c.m.,cradick,t.j.,和bao,g.(2016).theneisseriameningitidiscrispr-cas9systemenablesspecificgenomeeditinginmammaliancells.mol.ther.24,645-654.lee,j.,mir,a.,edraki,a.,garcia,b.,amrani,n.,lou,h.e.,gainetdinov,i.,pawluk,a.,ibraheim,r.,gao,x.d.,等人(2018).potentcas9inhibitioninbacterialandhumancellsbynewanti-crisprproteinfamilies.biorxiv,https://www.biorxiv.org/content/early/2018/2006/2020/350504.ma,e.,harrington,l.b.,o'connell,m.r.,zhou,k.,和doudna,j.a.(2015).single-strandeddnacleavagebydivergentcrispr-cas9enzymes.mol.cell60,398-407.mali,p.,aach,j.,stranges,p.b.,esvelt,k.m.,moosburner,m.,kosuri,s.,yang,l.,和church,g.m.(2013a).cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.nat.biotechnol.31,833-838.mali,p.,yang,l.,esvelt,k.m.,aach,j.,guell,m.,dicarlo,j.e.,norville,j.e.,和church,g.m.(2013b).rna-guidedhumangenomeengineeringviacas9.science339,823-826.marraffini,l.a.,和sontheimer,e.j.(2008).crisprinterferencelimitshorizontalgenetransferinstaphylococcibytargetingdna.science322,1843-1845.mir,a.,edraki,a.,lee,j.,和sontheimer,e.j.(2018).typeii-ccrispr-cas9biology,mechanismandapplication.acschem.biol.13,357-365.mojica,f.j.,diez-villasenor,c.,garcia-martinez,j.,和almendros,c.(2009).shortmotifsequencesdeterminethetargetsoftheprokaryoticcrisprdefencesystem.microbiology155,733-740.paez-espino,d.,sharon,i.,morovic,w.,stahl,b.,thomas,b.c.,barrangou,r.,和banfield,j.f.(2015).crisprimmunitydrivesrapidphagegenomeevolutioninstreptococcusthermophilus.mbio6.pawluk,a.,amrani,n.,zhang,y.,garcia,b.,hidalgo-reyes,y.,lee,j.,edraki,a.,shah,m.,sontheimer,e.j.,maxwell,k.l.,等人(2016).naturallyoccurringoff-switchesforcrispr-cas9.cell167,1829-1838e1829.pawluk,a.,bondy-denomy,j.,cheung,v.h.,maxwell,k.l.,和davidson,a.r.(2014).anewgroupofphageanti-crisprgenesinhibitsthetypei-ecrispr-cassystemofpseudomonasaeruginosa.mbio5,e00896.pinello,l.,canver,m.c.,hoban,m.d.,orkin,s.h.,kohn,d.b.,bauer,d.e.,和yuan,g.c.(2016).analyzingcrisprgenome-editingexperimentswithcrispresso.nat.biotechnol.34,695-697.racanelli,v.,和rehermann,b.(2006).theliverasanimmunologicalorgan.hepatology43,s54-62.ran,f.a.,cong,l.,yan,w.x.,scott,d.a.,gootenberg,j.s.,kriz,a.j.,zetsche,b.,shalem,o.,wu,x.,makarova,k.s.,等人(2015).invivogenomeeditingusingstaphylococcusaureuscas9.nature520,186-191.ran,f.a.,hsu,p.d.,lin,c.y.,gootenberg,j.s.,konermann,s.,trevino,a.e.,scott,d.a.,inoue,a.,matoba,s.,zhang,y.,等人(2013).doublenickingbyrna-guidedcrisprcas9forenhancedgenomeeditingspecificity.cell154,1380-1389.rashid,s.,curtis,d.e.,garuti,r.,anderson,n.n.,bashmakov,y.,ho,y.k.,hammer,r.e.,moon,y.a.,和horton,j.d.(2005).decreasedplasmacholesterolandhypersensitivitytostatinsinmicelackingpcsk9.proc.natl.acad.sci.usa102,5374-5379.rauch,b.j.,silvis,m.r.,hultquist,j.f.,waters,c.s.,mcgregor,m.j.,krogan,n.j.,和bondy-denomy,j.(2017).inhibitionofcrispr-cas9withbacteriophageproteins.cell168,150-158e110.sapranauskas,r.,gasiunas,g.,fremaux,c.,barrangou,r.,horvath,p.,和siksnys,v.(2011).thestreptococcusthermophiluscrispr/cassystemprovidesimmunityinescherichiacoli.nucleicacidsres.39,9275-9282.schumann,k.,lin,s.,boyer,e.,simeonov,d.r.,subramaniam,m.,gate,r.e.,haliburton,g.e.,ye,c.j.,bluestone,j.a.,doudna,j.a.,等人(2015).generationofknock-inprimaryhumantcellsusingcas9ribonucleoproteins.proc.natl.acad.sci.usa112,10437-10442.shin,j.,jiang,f.,liu,j.j.,bray,n.l.,rauch,b.j.,baik,s.h.,nogales,e.,bondy-denomy,j.,corn,j.e.,和doudna,j.a.(2017).disablingcas9byananti-crisprdnamimic.sci.adv.3,e1701620.tsai,s.q.,和joung,j.k.(2016).definingandimprovingthegenome-widespecificitiesofcrispr-cas9nucleases.nat.rev.genet.17,300-312.tsai,s.q.,zheng,z.,nguyen,n.t.,liebers,m.,topkar,v.v.,thapar,v.,wyvekens,n.,khayter,c.,iafrate,a.j.,le,l.p.,等人(2014).guide-seqenablesgenome-wideprofilingofoff-targetcleavagebycrispr-casnucleases.nat.biotechnol.33,187-197.tycko,j.,myer,v.e.,和hsu,p.d.(2016).methodsforoptimizingcrispr-cas9genomeeditingspecificity.mol.cell63,355-370.yang,h.,和patel,d.j.(2017).inhibitionmechanismofananti-crisprsuppressoracriia4targetingspycas9.molcell67,117-127e115.yin,h.,song,c.q.,suresh,s.,kwan,s.y.,wu,q.,walsh,s.,ding,j.,bogorad,r.l.,zhu,l.j.,wolfe,s.a.,等人(2018).partialdna-guidedcas9enablesgenomeeditingwithreducedoff-targetactivity.nat.chem.biol.14,311-316.yokoyama,t.,silversides,d.w.,waymire,k.g.,kwon,b.s.,takeuchi,t.,和overbeek,p.a.(1990).conservedcysteinetoserinemutationintyrosinaseisresponsiblefortheclassicalalbinomutationinlaboratorymice.nucleicacidsres.18,7293-7298.yoon,y.,wang,d.,tai,p.w.l.,riley,j.,gao,g.,和rivera-perez,j.a.(2018).streamlinedexvivoandinvivogenomeeditinginmouseembryosusingrecombinantadeno-associatedviruses.nat.commun.9,412.zhang,y.,heidrich,n.,ampattu,b.j.,gunderson,c.w.,seifert,h.s.,schoen,c.,vogel,j.,和sontheimer,e.j.(2013).processing-independentcrisprrnaslimitnaturaltransformationinneisseriameningitidis.mol.cell50,488-503.zhang,y.,rajan,r.,seifert,h.s.,mondragón,a.,和sontheimer,e.j.(2015).dnasehactivityofneisseriameningitidiscas9.mol.cell60,242-255.zhang,z.,theurkauf,w.e.,weng,z.,和zamore,p.d.(2012).strand-specificlibrariesforhighthroughputrnasequencing(rna-seq)preparedwithoutpoly(a)selection.silence3,9.zhu,l.j.,holmes,b.r.,aronin,n.,和brodsky,m.h.(2014).crisprseek:abioconductorpackagetoidentifytarget-specificguidernasforcrispr-cas9genome-editingsystems.plosone9,e108424.zhu,l.j.,lawrence,m.,gupta,a.,pagés,h.,kucukural,a.,garber,m.,和wolfe,s.a.(2017).guideseq:abioconductorpackagetoanalyzeguide-seqdatasetsforcrispr-casnucleases.bmcgenomics18,379.zuris,j.a.,thompson,d.b.,shu,y.,guilinger,j.p.,bessen,j.l.,hu,j.h.,maeder,m.l.,joung,j.k.,chen,z.-y.,和liu,d.r.(2015).cationiclipid-mediateddeliveryofproteinsenablesefficientprotein-basedgenomeeditinginvitroandinvivo.nat.biotechnol.33,73-80.以上说明书中提及的所有出版物和专利均通过引用并入本文。在不脱离本发明的范围和精神的情况下,本发明的所描述的方法和系统的各种修改和变化对于本领域技术人员将是明显的。尽管已经结合特定的优选实施方案描述了本发明,但是应当理解,所要求保护的本发明不应不适当地限制于这样的特定实施方案。实际上,对于生物学控制、生物化学、分子生物学、昆虫学、浮游生物、渔业系统和淡水生态学或相关领域的技术人员明显的对所描述的用于实施本发明的方式的各种修改都在以下权利要求的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1