具有改进的精度和特异性的碱基编辑器的制作方法

文档序号:20274503发布日期:2020-04-03 19:28阅读:503来源:国知局
优先权声明本申请要求2017年5月25日提交的美国临时专利申请系列号62/511,296;2017年8月4日提交的美国临时专利申请系列号62/541,544;和2018年1月26日提交的美国临时专利申请系列号62/622,676的权益。前述文献的完整内容通过引用的方式并入。联邦赞助研究或开发本发明借助美国政府支持在国立卫生研究院授予的授权号gm118158下做出。美国政府在本发明中享有某些权利。本文中描述用于改进靶向性碱基编辑技术的全基因组特异性的方法和组合物。
背景技术
::碱基编辑(be)技术使用一种工程化的dna结合结构域(如rna指导的、无催化活性cas9(死cas9或dcas9)、切口酶形式的cas9(ncas9)、或锌指(zf)阵列)以将胞苷脱氨酶结构域招募至基因组特定位置,以实现位点特异性胞嘧啶→胸腺嘧啶转换置换1,2。be是用于治疗细胞背景下表现出的遗传疾病的特别有吸引力工具,其中通过同源介导修复(hdr)产生精确突变将是治疗有益的,但是难以由基于核酸酶的传统基因组编辑技术产生。由于hdr途径限于细胞周期的g2和s期,例如,在主要由缓慢分裂或有丝分裂后的细胞群组成的组织中难以或不可能实现hdr结果3。此外,通过非同源末端接合介导对核酸酶诱导断口(break)的修复所致竞争性和更有效诱导可变长度插入/缺失突变,可导致hdr修复的效率在编辑前后大幅度降低。相反,be技术具有允许实施者在无需细胞类型可变的dna修复机制情况下产生高度可控、高度精确突变的潜力。技术实现要素:crispr碱基编辑器平台(be)拥有在无需供体dna分子情况下产生精确的、用户限定的基因组编辑事件的独特能力。碱基编辑器(be)按照位点特异性方式有效诱导胞苷至胸苷(c至t)碱基转换,如通过crispr指导rna(grna)间隔子序列确定的,其中所述碱基编辑器包含与胞苷脱氨酶结构域和尿嘧啶糖基化酶抑制剂(ugi)(例如,be3)融合的产生单链切口的crispr-cas9(ncas9)蛋白1。与全部基因组编辑试剂一样,至关重要的是,在用于治疗药之前,首先确定然后降低be产生脱靶突变的能力,从而限制其产生有害和不可逆基因编码副作用的潜力。这里,我们提出对be技术的技术改进,所述改进将使其能够向临床意义成熟。首先,我们描述了通过建立利用天然或工程化脱氨酶的be,限制可用于be脱氨的可用胞嘧啶底物的绝对数目的方法,所述脱氨酶仅可以使特定2-或3-核苷酸基因组背景下存在的胞嘧啶脱氨(表1)。这些蛋白质可以包含表7中列出的一个或多个突变,例如,单独或以任何可能组合用于增加脱氨酶蛋白或结构域的特异性。这些蛋白质可以包含表8中列出的一个或多个突变,例如,旨在改变可靶向的基序序列的突变,任选地与表7中的任何突变组合,例如,以产生底物序列改变和增加的工程化脱氨酶蛋白或结构域。另外,这些蛋白质可以包含表9中列出的一个或多个突变,任选地与表7或表8中列出的任何突变组合以产生工程化脱氨酶蛋白,例如,具有对三核苷酸基序中的第一或第三核苷酸改变的特异性并且具有相对于其他可能的脱氨底物基序,对其靶基序为增加的特异性。在一些实施方案中,haid、rapobec1*、mapobec3、hapobec3a、hapobec3b、hapobec3c、hapobec3f、hapobec3g、或hapobec3h的工程化变体包含表7、表8和/或表9中显示的一个或多个突变。在一些实施方案中,所述突变是n57a/g/q/d/e;a71v;i96t;y130f;或k60a/d/e或其组合。在一些实施方案中,haid、rapobec1*、mapobec3、hapobec3a、hapobec3b、hapobec3c、hapobec3f、hapobec3g或hapobec3h的工程化变体包含(i)表7和/或表8中显示的一个或多个突变和(ii)表9中显示的一个或多个突变。在一些实施方案中,haid、rapobec1*、mapobec3、hapobec3a、hapobec3b、hapobec3c、hapobec3f、hapobec3g或hapobec3h的工程化变体包含在n57(优选n57g或n57q);k60(优选k60a或k60d)和/或y130(优选y130f)中一处或多处具有突变的hapobec3a;或者具有与n57(例如,如表7中所示的位置3处,例如,位置3处的g)、k60(例如,如表7中所示的位置4处,例如,位置4处的d))、或y130(例如,如表7中所示的位置6处,例如,位置6处的f)对应的突变的haid、rapobec1*、mapobec3、hapobec3b、hapobec3c、hapobec3f、hapobec3g或hapobec3h。在一些实施方案中,haid、rapobec1*、mapobec3、hapobec3a、hapobec3b、hapobec3c、hapobec3f、hapobec3g或hapobec3h的工程化变体包含在n57(优选n57g)和y130(优选y130f)处具有突变的hapobec3a;或者具有与n57(例如,如表7中所示的位置3处,例如,位置3处的g)对应的突变和与y130(例如,如表7中所示的位置6处,例如,位置6处的f)对应的突变的haid、rapobec1*、mapobec3、hapobec3b、hapobec3c、hapobec3f、hapobec3g、或hapobec3h。在一些实施方案中,haid、rapobec1*、mapobec3、hapobec3a、hapobec3b、hapobec3c、hapobec3f、hapobec3g或hapobec3h的工程化变体包含在a71和/或i96处具有突变的hapobec3a;或者具有与a71和/或i96对应的(例如,如表10中所示)突变的haid、rapobec1*、mapobec3、hapobec3b、hapobec3c、hapobec3f、hapobec3g或hapobec3h。例如,i96t、a71v、和y130f各自减弱来自wt的脱氨酶的编辑活性(其因脱靶效应而至关重要),不恢复太多的(若有的话)序列偏好性,使它们成为针对所有碱基编辑位点的良好候选者。此外,本文提供治疗具有β地中海贫血突变hbb-28(a>g)的受试者的方法,所述方法包括递送治疗有效量的根据前述权利要求任一项所述的融合蛋白,其中脱氨酶包括包含在n57g或n57a或n57q或k60a或k60d或y130f处的突变的apo3a,并且优选地其中所述融合蛋白包含产生ssdna切口的或无催化活性的cas9。在一些实施方案中,所述融合蛋白以rnp、mrna或质粒的形式递送。在一些实施方案中,这些方法包括在足以使突变体脱氨的条件下,将融合蛋白离体递送至从受试者采集的包含cd34+造血干细胞和/或祖细胞的细胞的群中,并且将细胞回输至受试者中。本文中还提供使核酸中所选胞苷脱氨的方法,所述方法包括使核酸与本文所述的融合蛋白或碱基编辑系统接触。另外,本文提供包含纯化的如本文所述的融合蛋白或碱基编辑系统的组合物。此外,本文还提供编码本文所述的融合蛋白或碱基编辑系统的核酸,以及包含所述核酸的载体、和包含所述核酸的宿主细胞,例如,干细胞,例如,造血干细胞。除非另外限定,否则本文中所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。本文中描述了用于本发明中的方法和材料;也可以使用本领域公知的其他合适方法和材料。材料、方法和实施例仅为示例性的,而非旨在限制。本文所提及的全部出版物、专利申请、专利、序列和数据库条目和其他参考文献通过引用的方式完整并入。在矛盾的情况下,本说明书(包括定义)将居主导。本发明的其他特征和优点将从以下具体实施方式及附图并且从权利要求中显而易见。附图说明图1.示例性典型高效率碱基编辑系统的简图。在其两个核酸酶结构域之一处携带无催化活性的突变的产生切口的cas9(ncas9)与由sgrna的可变间隔子序列决定的靶位点结合。稳定r-环的形成在非脱氨链上产生ssdna编辑窗口。cas9在基因组dna中产生单链断口,提示宿主细胞使用脱氨链作为模板修复损伤,因此使修复偏向胞嘧啶→胸腺嘧啶转换的置换。图2a-2b.图2a和图2b分别显示识别环1(rl1)和环7的比对。两个区域均显示跨全部蛋白质的低保守性并且已经经验地展示出它们明显有助于每种酶的序列特异性或基于同源性预测它们有如此作用。通过blosum62矩阵执行比对并且在geneious中可视化。图3a-3b.在apo3a和ssdna底物之间形成的蛋白质-dna接触。rl1残基以品红色显示,环7残基以红色显示,ssdna底物以黄色显示,apo3a的剩余残基以灰色显示。图3a显示rl1和环7中全部残基的方向,其中我们提出对所述残基进行置换突变,以改变或增强本文所述的脱氨酶结构域的特异性(seqidnos:1-9)。图3b显示以黑色虚线显示的、在-1位置处的胸腺嘧啶(相对于靶c)和d131处之间形成的碱基特异性氢键(seqidnos:10-18)。pdb代码:5sww。图4.apo3a-ncas9-ugi蛋白在u2os细胞中随靶向基因组整合型egfp基因(seqidno:19)内部的某位点的指导rna一起过量表达。在72小时后,从这些细胞提取基因组dna并对其进行illumina测序。对15个携带单一残基置换的apo3a变体中每者绘制间隔子内部每个胞嘧啶核苷酸的c>t转换频率。图5.apo3a-ncas9-ugi蛋白在u2os细胞中随靶向基因组整合型egfp基因(seqidno:19)内部的某位点的指导rna一起过量表达。在72小时后,从这些细胞提取基因组dna并对其进行illumina测序。对n57或k60处携带单一残基置换的apo3a-ncas9-ugi蛋白绘制间隔子内部每个胞嘧啶核苷酸的c>t转换频率。这些蛋白质中每一者以相对于野生型碱基编辑器蛋白为降低的效率,使编辑窗口内部的脱靶gct基序脱氨,但在编辑窗口内部的中靶tcg基序处保留有效脱氨活性。图6.对携带单一残基置换的每种apo3a-ncas9-ugi蛋白绘制egfp位点1处中靶tcg基序和脱靶gct基序(两者均在编辑窗口中)的胞嘧啶至胸腺嘧啶编辑效率比。相对于野生型apo3a碱基编辑器蛋白,携带n57或k60置换的蛋白质具有增加的特异性比。图7.apo3a-ncas9-ugi蛋白在u2os细胞中随靶向基因组整合型egfp基因(seqidno:20)内部的某位点的指导rna一起过量表达。在72小时后,从这些细胞提取基因组dna并对其进行illumina测序。对每种碱基编辑器蛋白绘制间隔子内部每个胞嘧啶核苷酸的c>t转换频率。图8.对每种碱基编辑器蛋白绘制egfp位点2靶的编辑窗口内的全部胞嘧啶(其中全部位于脱靶三核苷酸基序内)的累积性胞嘧啶至胸腺嘧啶转换频率。在n57和k60处携带单一残基置换的apo3a碱基编辑器蛋白具有显著降低的使该靶位点的编辑窗口中存在的脱靶胞嘧啶脱氨的能力。值得注意地,apo3an57a在该位点不显示任何脱氨酶活性。图9.用表达靶向egfp(seqidno:22)和所示碱基编辑器蛋白的指导物的质粒转染携带稳定整合型egfp基因的u2os细胞。在72小时后,从细胞提取基因组dna,通过pcr扩增靶位点,并且对pcr产物进行高通量illumina测序。对每种转染条件绘制在同源基序和非同源基序处的c至t转换频率。对hapobec3a(apo3a)n57所进行的突变在恢复碱基编辑器结构中的脱氨酶结构域的序列特异性方面非常有效。图10.用表达所示grna和碱基编辑器蛋白质的质粒瞬时转染hek293t细胞。携带两个置换的apo3abe3蛋白通常在受测的两种grna中的同源基序处失去明显的活性。但是,apo3an57q/y130f碱基编辑器3(be3)双突变体保留对两种grna的同源基序的活性,同时显著降低在非同源基序处脱氨的效率。图11.用表达所示grna和碱基编辑器蛋白的质粒瞬时转染hek293t细胞。在72小时后,提取基因组dna,通过pcr扩增靶位点,并且对pcr产物进行高通量illumina测序。以热图格式绘制20个核苷酸间隔子序列内的全部胞苷的c至t转换频率。与be3和工程化变体ye1、ye2和yeebe3(yebe3)相比,全部三种apo3abe3蛋白都可以使脱氨强烈偏向同源基序,这通过将与be3相比减慢其动力学速率并限制其编辑窗口长度的点突变并入大鼠apobec1(rapo1)脱氨酶结构域来降低此类旁观者突变(bystandermutation)的频率44。参考序列,seqidnos:23-28。图12.用表达所示grna和碱基编辑器蛋白的质粒瞬时转染hek293t细胞。在72小时后,提取基因组dna,通过pcr扩增靶位点,并且对pcr产物进行高通量illumina测序。以热图格式绘制20个核苷酸间隔子序列内的全部胞苷的c至t转换频率。与be3和yebe3蛋白相比,全部三种apo3abe3蛋白都可以使脱氨强烈偏向同源基序。参考序列,seqidnos:29-34。图13.用表达所示grna和碱基编辑器蛋白的质粒瞬时转染hek293t细胞。如前文略述那样处理样品。除n57g之外携带a71或i96突变的apo3abe3蛋白在非同源基序处大大降低脱氨频率。对变体碱基编辑器蛋白中每一者的全部三个位点绘制每个位点的同源与非同源编辑之比,显示apo3an57gi96tbe3对受测三个位点中每一者实现大约13的同源:非同源编辑比。参考序列,seqidnos:35-37。图14.用表达所示grna和碱基编辑器蛋白的质粒瞬时转染hek293t细胞。如前文略述那样处理样品。为了获得绘制的脱氨频率,总结了落在编辑窗口内部的胞苷的全部c至t转换频率。apo3abe3在25个脱靶位点中的16个位点处诱导非常高水平的脱氨。be3在与apo3abe3相同的脱靶位点诱导脱氨,但频率较低。apo3an57gbe3在25个位点中的仅6个位点处诱导插入缺失(indels),并且频率比be3在这6个位点处的频率低得多。图15.用表达所示grna和碱基编辑器蛋白质的质粒瞬时转染hek293t细胞。如前文略述那样处理样品。为了获得绘制的脱氨频率,总结了落在编辑窗口内部的胞苷的全部c至t转换频率。apo3abe3在15个脱靶位点中3个位点处诱导非常高水平的脱氨。be3在与apo3abe3相同的脱靶位点诱导脱氨,但频率较低。apo3an57gbe3在15个研究的脱靶位点中的任一个位点不诱导脱氨。图16.显示来自用碱基编辑器蛋白靶向hbb-28(a>g)疾病等位基因的潜在等位基因产物的示意图。突变编辑窗口中存在的-25旁观者胞苷的突变造成β地中海贫血表型,与-28位置处编辑无关。从而,-25位置不受碱基编辑器蛋白编辑是至关重要的。显示seqidnos:38-42。图17.用表达hbb-28靶向grna和所示be蛋白的质粒瞬时转染携带hbb-28(a>g)致病等位基因的染色体整合型200碱基对片段的hek293t细胞。be3和yebe3蛋白以大约相等的频率使同源胞苷和非同源胞苷脱氨,同时apo3an57gbe蛋白使-28同源基序强烈脱氨,以校正疾病,同时避免使编辑窗口中的第二胞苷脱氨。图18.be3和yebe3蛋白诱导致病hbb-28(a>g)突变脱氨,但这导致在小于1%测序的总等位基因中产生完美校正的等位基因。相反,apo3an57gbe蛋白在15-22%测序的总等位基因中产生完美校正的等位基因。参考序列,seqidno:43。图19.用表达所示grna和碱基编辑器蛋白的质粒瞬时转染携带hbb-28(a>g)等位基因的染色体整合型片段的hek293t细胞。如前文略述那样处理样品。为了获得绘制的脱氨频率,总结了落在编辑窗口范围内部的胞苷全部c至t转换频率。be3在研究的8个脱靶位点中的3个位点产生脱氨,同时apo3an57be3在这8个位点中的仅一个位点产生脱氨且频率非常低。显示seqidno:44。具体实施方式在迄今描述的最有效的be配置中,胞苷脱氨酶(da)结构域和尿嘧啶糖基化酶抑制剂(ugi;抑制宿主细胞尿嘧啶dna去糖基化酶(udg)(该酶负责从基因组切除尿嘧啶)的噬菌体小蛋白1,4)均融合至ncas9(衍生自酿脓链球菌(streptococcuspyogenes)cas9(spcas9)或金黄色葡萄球菌(staphylococcusaureus)cas9(sacas9))。ncas9在依据其单一指导rna(sgrna)和邻近前间区序列邻近基序(pam)识别作用所规定的靶位点形成r-环,任由大约4-8个核苷酸非靶链作为单链dna(ssdna)暴露在r-环的pam远端附近(图1)。该ssdna区域是能够由ssdna特异性的da结构域脱氨以产生鸟苷:尿嘧啶(g:u)错配的模板并且限定了编辑窗口。ncas9切刻dna的非脱氨链,通过指导细胞利用脱氨链作为模板修复切口损伤,使g:u错配的转换偏向于腺嘌呤:胸腺嘧啶(a:t)碱基对。迄今,这些融合蛋白中所述的da结构域是大鼠apobec1(rapo1)、衍生自七鳃鳗的活化诱导胞苷脱氨酶(aid)(称作cda(pmcda))、人aid(haid)、或缺少核输出信号的haid超活性形式1-2,5-7。主要使用spcas9蛋白针对其ncas9结构域(nspcas9)建立be技术,然而尽管本文中我们提到ncas9,但除非特别指示,否则基于cpf1蛋白的任何直向同源物(包括相关的cpf1酶类),通常可以使用任何cas9样切口酶。在治疗环境中使用be的一个重要考虑将要评估其全基因组脱靶诱变能力及将要修改该技术以最小化或理想地消除刺激有害脱靶突变的风险。采用当前阶段的be技术,我们可以预测三个脱靶突变形成的潜在来源:(1)中靶位点内的胞嘧啶碱基的不希望的修饰,原因是ncas9刺激的r-环形成可以使总计8个中靶核苷酸暴露于脱氨;(2)脱靶r-环形成(cas9具有在与其sgrna具有不同程度同源性的脱靶位点处结合的充分可查能力8-9)导致胞嘧啶在这些位点脱氨;和(3)be介导的脱氨可能在不通过融合物的cas9部分与dna结合的位点发生(例如,从溶液或在仅由脱氨酶本身微弱指定的位点处介导的活性)。这里,我们描述了对be的技术性改进,这些改进可以用来减少或消除不需要的潜在be诱变。通过使用具有更高或改变的靶位点偏好性的胞苷脱氨酶结构域来增加碱基编辑器的特异性目前阶段的be技术使用大鼠apobec1(rapobec1)的胞嘧啶脱氨活性在单链dna(ssdna)的大约8个核苷酸的窗口中实现胞嘧啶→胸腺嘧啶转换置换。ssdna靶窗口由be融合蛋白的ncas9部分产生的r-环形成,并且在sgrna互补性区域的5’最末端核苷酸的下游大约4个核苷酸开始。因此,待脱氨的靶c处于grna靶互补性序列范围内。在靶序列内,它需要位于从5'起计数的位置5、6、7、8或9处。rapobec1结构域本身几乎没有固有的底物序列特异性并且在全部序列背景下均良好脱氨胞嘧啶,除非与靶c的5’紧邻的碱基是g,在这种情况下脱氨不太有效,但仍是有可能的。此外,当rapobec1与ncas9融合时,它似乎对编辑窗口内部的多个胞嘧啶具有持续合成能力1--ssdna靶窗口处单一结合事件经常导致窗口中多于一个胞嘧啶脱氨(如果存在两个以上的胞嘧啶)。每个靶窗口多个脱氨可在基因组的中靶结合位点处和由ncas9结合的其他脱靶dna序列处导致不需要的变化。某种程度上,可以改变分隔rapobec1和ncas9的蛋白质接头的长度和柔性来控制中靶编辑窗口内部不需要的脱氨;然而,这种控制不能对编辑窗口中的特定序列位置微调并且仍在有限的编辑窗口外部显示可检测的脱氨10。为了减少或完全消除中靶位点的编辑窗口内部的非靶胞嘧啶的不利脱氨、脱靶位点处任何胞嘧啶的脱氨,并且限制中靶位点处不需要的进行性脱氨事件,我们使用对短序列基序具有固有特异性和/或具有非进行性脱氨活性的工程化脱氨酶结构域,建立了be。碱基编辑器在一些实施方案中,碱基编辑器是修饰胞苷dna碱基的脱氨酶,例如,来自脱氨酶的载脂蛋白bmrna编辑酶催化性多肽样(apolipoproteinbmrna-editingenzyme,catalyticpolypeptide-like,apobec)家族的胞苷脱氨酶,包括apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d/e、apobec3f、apobec3g、apobec3h、apobec4(例如,参见yang等人,jgenetgenomics.2017sep20;44(9):423-437);活化诱导的胞苷脱氨酶(aid),例如,活化诱导的胞苷脱氨酶(aicda)、胞嘧啶脱氨酶1(cda1)和cda2、和作用于trna的胞嘧啶脱氨酶(cdat)。下表1提供示例性序列;也可以使用其他序列。表1.示例性脱氨酶*来自酿酒酵母(saccharomycescerevisiae)s288c人aid(haid)、人apobec3和小鼠apobec3酶(apo3a-hapo3h、mapo3)具有对包围靶胞嘧啶的一个、两个或三个附加核苷酸的特异性(表2)11-16。从1至3个附加核苷酸加入的特异性将导致可用于随机分布的dna中脱氨的be编辑窗口内部非靶胞嘧啶的概率降低4倍至64倍。这将在基因组内在具有与sgrna高程度相似性的中靶位点和ncas9脱靶位点两者处大幅度增强碱基编辑酶的特异性并且还将通过大大减少基因组中总底物位点的数目来有助于限制整个基因组中潜在的、假sgrna/ncas9非依赖性脱氨。重要地,hapo3和mapo3酶的固有序列特异性提高可以工程化这些蛋白质以改变或重新赋予其靶序列特异性的可能性。在这种情况下,可以潜在地工程化许多不同的2-和3-bp识别性脱氨酶,以适应每个目标靶底物的序列特征。表2.本研究中描述的胞苷脱氨酶结构域及其底物序列偏好性。变体核苷酸序列偏好性haid5’-wrcrapobec1*5’-tc≥cc≥ac>gcmapobec35’-tychapobec3a5’-tcyhapobec3b5'-tcr>tcthapobec3c5’-wychapobec3f5’-ttchapobec3g5’-ccchapobec3h5’-ttca~ttct~ttcg>accca>tgca不明确的或允许2个以上的核苷酸的核苷酸位置根据iupac代码注释,其中w=a或t,r=a或g并且y=c或t。每个内源性hapo3和mapo3酶在它可以发挥作用的位点具有固有2-3nt靶底物基序偏好性。例如,apo3a使tc(a/g)中的粗体胞嘧啶脱氨,而hapo3g靶向形式ccc的底物。将有利的是,能够调节可由给定apo3酶靶向的序列基序的范围,从而增加该提出类别的底物特异性含apo3的be试剂的总体靶向范围。此外,工程化apo3酶的底物特异性决定残基将允许我们不仅改变优选的底物位点,还允许相对于可在整个基因组上大量存在的其他密切匹配的二或三核苷酸特征来改进apo3酶对其优选位点的特异性。hapo3酶类通过具有可变序列组成的两个识别环(称作识别环1(rl1)和环7)中的残基之间所形成的直接接触来识别其同源序列基序(cognatesequencemotif)12-13,17-22(参见表3、图2a-2b和图3a-3b)。其他酶具有对这些残基所进行的前述置换突变,所述置换突变松弛或改变这些结构域的特异性。例如,使hapo3g环7残基d316和d317突变成精氨酸将酶的底物特异性从ccc改变成ccc(其中粗体c表示脱氨用底物)23。使hapo3fd311a突变增加了对tgc和tcc的靶向,而未修饰的酶优选靶向ttc15。另外,其中rl1残基已经由hapo3g的rl1残基替换的嵌合apo3a蛋白显著松弛酶的特异性24,并且haid环7残基由来自hapo3g或hapo3f的那些残基置换改变突变体haid酶的靶序列特征,以类似于供体酶的那些靶序列特征25。该研究确立,对rl1和环7中的残基的置换突变通过改变蛋白质和靶ssdna之间形成的碱基特异性接触预测改变apo3蛋白的特异性,但尚不存在超出这些初始研究之外的再工程化apo3底物序列特异性的报道。另外,就我们所知,尚无小组描述突出这些结构域对其靶序列基序的特异性的策略。表3.识别环残基脱氨酶识别环1残基环7残基haidv18-k22a111-p123rapobec1*d11-r15a117-r126mapobec3*l33-k37s129-e138hapobec3ag25-r28a127-l135hapobec3cl24-n28a121-c130hapobec3ge209-r213a312-r320hapobec3h*k16-y23s109-p118hapobec3fl207-y211a304-d313每个识别环1和环7区域代表已知有助于酶的序列特异性的酶区域,或在缺少结构信息情况下,基于序列比对,预测有助于序列特异性的酶区域(参见图3a-3b)(*表示缺少足够的结构信息的蛋白质)。全部蛋白质序列获自uniprot.org。全部位置信息指如下文描述的全长蛋白质序列内部的位置。为此目的,可以对存在于rl1和/或环7中的残基进行置换突变(关于与每种apo3或aid酶对应的残基参见表3,并且关于这些蛋白质的比对结果参见图2a-2b)。为了对rl1或环7中诸位置处氨基酸置换组合的最大数目采样,我们将随机化这些环中的氨基酸并且使用细菌选择方案来选择对所需序列具有稳健脱氨活性的文库成员。在环7的情况下,据信主要负责指定序列基序的残基将单独突变为可预期与所需序列基序形成碱基特异性相互作用的残基,并将随机化环7中的剩余位置。例如,已知apo3a残基d131与5’-tcy形成氢键(其中粗体t代表碱基特异性接触)。为了从tct>act改变apo3a的序列特异性,我们首先设计携带d131至n、q、或r置换的apo3a突变体。随后通过克隆由使用nnb、nns或nnk精简密码子集合(其中n=a/c/g/t,b=c/g/t,s=c/g并且k=g/t)制成的合成简并寡核苷酸文库,在位置132-134处修饰这些apo3a变体中每一者。对这些残基各自所进行的置换突变包括与针对任何其他指定残基位置所进行的置换突变任意组合的20个典型氨基酸中的任一者。另外,这些突变可以与将表3中的酶截短至催化活性所需的最小结构域(催化结构域;cd)组合进行。关于从本文所述酶的子集衍生的cd实例,参见示例性蛋白质序列。这些突变也可以在5个先前展示的置换突变的全部或其任何组合存在或不存在下进行,以增加hapo3g的溶解性和催化活性(关于本文所述的每种apo或aid酶的同源性置换突变的完整列表,参见表4)。值得注意地,表1中列出的脱氨酶结构域可以相对于缺少我们可能做出的任何工程化的rapobec1,可具有有利的固有特性。从而,除我们可以产生的任何工程化变体之外,我们在此还描述了表1中列出的未修饰的结构域。表4.示例性置换突变脱氨酶置换1置换2置换3置换4置换5haid--f109k--rapobec1*l39k-y115k--mapobec3*--f127k--hapobec3a--f125k-c171ahapobec3gl234kc243af310kc321ac356ahapobec3h*--f107k--hapobec3f--f302k--每个置换突变代表已知有助于酶的稳定性和溶解性的酶的残基,或在缺少结构信息情况下,基于与hapobec3g的序列比对,预测有助于序列特异性的酶残基(*表示缺少足够的结构信息的蛋白质)。全部位置信息指获自uniprot.org的野生型蛋白质序列。这些残基的确切位置可以在工程化的变体如haidv中变化。全部位置信息指如下文描述的全长蛋白质序列内部的位置。crispr-cas核酸酶本文所述的序列特异性脱氨酶与cas9切口酶融合。尽管本文中我们提到ncas9,但除非特别指示,否则基于cpf1蛋白的任何直向同源物(包括相关的cpf1酶类),通常可以使用任何cas9样切口酶。表5提供示例性列表。表5.示例性cas9直向同源物列表本领域公知的这些直向同源物、及其突变体与变体可以用于本文所述的任何融合蛋白中。例如,参见wo2017/040348(其描述特异性增加的sacas9和spcas9变体)和wo2016/141224(描述pam特异性改变的sacas9和spcas9变体)。来自酿脓链球菌的cas9核酸酶(此后简称为cas9)可以受工程化指导rna(grna)例如单一指导rna或crrna/tracrrna对等的17-20个核苷酸和例如匹配序列ngg或nag的pam等的紧邻前间区序列邻近基序(pam)的目标靶基因组dna序列的互补链之间的简单碱基对互补性指导(shen等人,cellres(2013);dicarlo等人,nucleicacidsres(2013);jiang等人,natbiotechnol31,233-239(2013);jinek等人,elife2,e00471(2013);hwang等人,natbiotechnol31,227-229(2013);cong等人,science339,819-823(2013);mali等人,science339,823-826(2013c);cho等人,natbiotechnol31,230-232(2013);jinek等人,science337,816-821(2012))。也可以使用工程化的来自普氏菌属和弗朗西斯菌属的crispr1(crisprfromprevotellaandfrancisella1,cpf1)核酸酶,例如,如zetsche等人,cell163,759-771(2015);schunder等人,intjmedmicrobiol303,51-60(2013);makarova等人,natrevmicrobiol13,722-736(2015);fagerlund等人,genomebiol16,251(2015)中所述。不同于spcas9,cpf1仅需要单一42ntcrrna,其在3'末端具有23nt与靶dna序列的前间区序列互补的核苷酸(zetsche等人,2015)。另外,spcas9识别存在于前间区3’的nggpam序列,而ascpf1和lbcp1识别存在于前间区5’的tttnpam(同上)。在一些实施方案中,本发明的系统利用来自酿脓链球菌或金黄色葡萄球菌的野生型或变体cas9蛋白或来自氨基酸球菌属物种bv3l6或毛螺科细菌nd2006的野生型cpf1蛋白,所述蛋白质如在细菌中编码或经密码子优化以在哺乳动物细胞中表达和/或在其pam识别特异性和/或其全基因组特异性方面被修饰。已经描述多种变体;例如,特别参见wo2016/141224;pct/us2016/049147;kleinstiver等人,natbiotechnol.2016aug;34(8):869-74;tsai和joung,natrevgenet.2016may;17(5):300-12;kleinstiver等人,nature.2016jan28;529(7587):490-5;shmakov等人,molcell.2015nov5;60(3):385-97;kleinstiver等人,natbiotechnol.2015dec;33(12):1293-1298;dahlman等人,natbiotechnol.2015nov;33(11):1159-61;kleinstiver等人,nature.2015jul23;523(7561):481-5;wyvekens等人,humgenether.2015jul;26(7):425-31;hwang等人,methodsmolbiol.2015;1311:317-34;osborn等人,humgenether.2015feb;26(2):114-26;konermann等人,nature.2015jan29;517(7536):583-8;fu等人,methodsenzymol.2014;546:21-45;和tsai等人,natbiotechnol.2014jun;32(6):569-76。指导rna与cas9或cpf1一起表达或存在于细胞中。指导rna或核酸酶之一或两者,可以在细胞中瞬时或稳定表达或作为纯化的蛋白质或核酸引入。在一些实施方案中,cas9还包含以下突变之一,所述突变减少cas9的核酸酶活性;例如,对于spcas9,d10a或h840a处的突变(所述突变产生单链切口酶)。在一些实施方案中,spcas9变体还在以下氨基酸位置之一处包含破坏cas9的核酸酶活性的突变:d10、e762、d839、h983、或d986和h840或n863,例如、d10a/d10n和h840a/h840n/h840y,以使该蛋白质的核酸酶部分无催化活性;在这些位置处的置换可以是丙氨酸(如它们在nishimasu等人,cell156,935–949(2014)中那样)或其他残基,例如,谷氨酰胺、天冬酰胺、酪氨酸、丝氨酸或天冬氨酸,例如,e762q、h983n、h983y、d986n、n863d、n863s或n863h(参见wo2014/152432)。在一些实施方案中,cas9与一个或多个尿啶糖基化酶抑制剂(ugi)序列融合;示例性ugi序列如下:tnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikml(seqidno:45)。ugi可以是n末端的、c末端的、或不存在(和任选地顺式表达,例如,分别顺式表达,或分别提供或施用)。使用方法本发明的组合物和方法可以用来通过工程化的apo3a脱氨酶增强全基因组特异性。例如,当通过质粒瞬时转染递送时,be3结构中所用的apo3an57g在通过指导rna的间隔子序列的同一性确定的脱靶位点处具有增加的全基因组特异性。此外,这些方法可以包括例如,使用rnp或mrna转染法递送具有表7中任何突变的apo3abe3,以限制碱基编辑器试剂的全基因组脱靶突变形成。另外,可以使用质粒瞬时转染法、rnp或mrna递送具有表7中任何突变的apo3abe3(本身或一并),其中产生ssdna切口的或无催化活性的cas9(ncas9)是识别与spcas9nggpam正交的pam序列以限制该融合蛋白所致脱靶诱变的任何工程化spcas9蛋白46。另外,也可以使用与金黄色葡萄球菌cas9或识别正交pam序列的工程化金黄色葡萄球菌cas9融合的具有表7中任何突变的apo3a47。变体在一些实施方案中,融合蛋白的组分与(例如,如本文提供的)示例性序列的氨基酸序列至少80%相同,例如,至少85%、90%、95%、97%或99%相同,例如,在示例性序列的多达5%、10%、15%或20%残基处具有差异,所述残基例如替换为除本文所述突变之外的保守突变。在优选实施方案中,变体保留亲本的所需活性,例如,切口酶活性,和/或与指导rna和/或靶dna相互作用的能力。为了确定两个核酸序列的同一性百分比,为了最佳比较目的将序列比对(例如,可以在第一和第二氨基酸或核酸序列之一或两者中引入空位用于最佳的比对,或者出于比较的目的可以忽略非同源序列)。出于比较目的而比对的参考序列的长度是参考序列长度的至少80%,并且在一些实施方案中是至少90%或100%。随后比较相应的氨基酸位置或核苷酸位置处的核苷酸。当第一序列中的位置被与第二序列中相应位置相同的核苷酸占据时,则该分子在该位置是同一的(如本文所用,核酸“同一性”等同于核酸“同源性”)。两个序列之间的同一性百分比是序列共有的同一的位置的数量的函数,考虑了为了两个序列的最佳比对而需要引入的空位的数量和每个空位的长度。按照本领域技术范围内的各种方式确定两个多肽或核酸序列之间的同一性百分比,例如,使用公众可获得的计算机软件,例如smithwatermanalignment(smith,t.f.和m.s.waterman(1981)jmolbiol147:195-7);已合并到genematcherplustm,schwarz和dayhof(1979)atlasofproteinsequenceandstructure,dayhof,m.o.编著,第353-358页中的“bestfit”(smith和waterman,advancesinappliedmathematics,482-489(1981));blast程序(基本局部比对检索工具;(altschul,s.f.,w.gish等人,(1990)jmolbiol215:403-10)、blast-2、blast-p、blast-n、blast-x、wu-blast-2、align、align-2、clustal或megalign(dnastar)软件。此外,本领域技术人员可以确定用于衡量比对的合适参数,包括在被比较的序列全长上实现最大比对所需的任何算法。通常,对于蛋白质或核酸,比较的长度可以是任何长度,达到并包括全长(例如,5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%)。出于本发明组合物和方法的目的,序列全长的至少80%进行比对。为了本发明的目的,序列的比较和两个序列之间同一性百分比可以使用空位罚分12、空位延伸罚分4以及移框缺口罚分5的blossum62评分矩阵来确定。保守性置换一般包括在以下组内的置换:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。本文还提供编码分割型脱氨酶融合蛋白的分离的核酸;包含分离的核酸的载体,所述核酸任选地与一个或多个调节结构域可操作地连接以表达变体蛋白;以及宿主细胞,例如,哺乳动物宿主细胞,所述细胞包含核酸并且任选地表达变体蛋白。在一些实施方案中,宿主细胞是干细胞,例如,造血干细胞。本文所述的分割型脱氨酶融合蛋白可以用于改变细胞的基因组。这些方法通常包括在细胞中表达或接触分割型脱氨酶融合蛋白;在使用一种或两种cas9的版本中,这些方法包括使用具有与细胞基因组的所选部分互补的区域的指导rna。本领域已知选择性改变细胞基因组的方法,例如,参见us8,993,233;us20140186958;us9,023,649;wo/2014/099744;wo2014/089290;wo2014/144592;wo144288;wo2014/204578;wo2014/152432;wo2115/099850;us8,697,359;us20160024529;us20160024524;us20160024523;us20160024510;us20160017366;us20160017301;us20150376652;us20150356239;us20150315576;us20150291965;us20150252358;us20150247150;us20150232883;us20150232882;us20150203872;us20150191744;us20150184139;us20150176064;us20150167000;us20150166969;us20150159175;us20150159174;us20150093473;us20150079681;us20150067922;us20150056629;us20150044772;us20150024500;us20150024499;us20150020223;us20140356867;us20140295557;us20140273235;us20140273226;us20140273037;us20140189896;us20140113376;us20140093941;us20130330778;us20130288251;us20120088676;us20110300538;us20110236530;us20110217739;us20110002889;us20100076057;us20110189776;us20110223638;us20130130248;us20150050699;us20150071899;us20150050699;us20150045546;us20150031134;us20150024500;us20140377868;us20140357530;us20140349400;us20140335620;us20140335063;us20140315985;us20140310830;us20140310828;us20140309487;us20140304853;us20140298547;us20140295556;us20140294773;us20140287938;us20140273234;us20140273232;us20140273231;us20140273230;us20140271987;us20140256046;us20140248702;us20140242702;us20140242700;us20140242699;us20140242664;us20140234972;us20140227787;us20140212869;us20140201857;us20140199767;us20140189896;us20140186958;us20140186919;us20140186843;us20140179770;us20140179006;us20140170753;wo/2008/108989;wo/2010/054108;wo/2012/164565;wo/2013/098244;wo/2013/176772;us20150071899;makarova等人,"evolutionandclassificationofthecrispr-cassystems"9(6)naturereviewsmicrobiology467-477(1-23)(2011年6月);wiedenheft等人,"rna-guidedgeneticsilencingsystemsinbacteriaandarchaea"482nature331-338(2012年2月16日);gasiunas等人,"cas9-crrnaribonucleoproteincomplexmediatesspecificdnacleavageforadaptiveimmunityinbacteria"109(39)proceedingsofthenationalacademyofsciencesusae2579-e2586(2012年9月4日);jinek等人,"aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity"337science816-821(2012年8月17日);carroll,"acrisprapproachtogenetargeting"20(9)moleculartherapy1658-1660(2012年9月);2012年5月25日提交的美国申请号61/652,086;al-attar等人,clusteredregularlyinterspacedshortpalindromicrepeats(crisprs):thehallmarkofaningeniousantiviraldefensemechanisminprokaryotes,biolchem.(2011)第392卷,第4期,第277-289页;hale等人,essentialfeaturesandrationaldesignofcrisprrnasthatfunctionwiththecasrampmodulecomplextocleavernas,molecularcell,(2012)第45卷,第3期,292-302。在一些实施方案中,所述融合蛋白包含dna结合结构域(例如,zfn、tale或ncas9)和be结构域之间的接头。可以用于这些融合蛋白(或串联结构的融合蛋白之间)的接头可以包含不干扰所述融合蛋白的功能的任何序列。在优选的实施方案中,所述接头是短的,例如,2-20个氨基酸,并且一般是柔性的(即,包含高自由度的氨基酸,例如甘氨酸、丙氨酸和丝氨酸)。在一些实施方案中,所述接头包含由gggs(seqidno:46)或ggggs(seqidno:47)组成的一个或多个单元,例如,gggs(seqidno:47)或ggggs(seqidno:46)单元的两个、三个、四个或多个重复。也可以使用其他接头序列。在一些实施方案中,所述分割型脱氨酶融合蛋白包含促进向细胞内空间递送的细胞穿透肽序列,例如,hiv衍生的tat肽、穿透素(penetratin)、转运蛋白(transportan)或hct衍生的细胞穿透肽,例如参见,caron等人,(2001)molther.3(3):310-8;langel,cell-penetratingpeptides:processesandapplications(crcpress,bocaratonfl2002);el-andaloussi等人,(2005)currpharmdes.11(28):3597-611;和deshayes等人,(2005)cellmollifesci.62(16):1839-49。细胞穿透肽(cpp)是短肽,其促进各种各样的生物分子跨细胞膜移动进入细胞质或其他细胞器,例如线粒体和细胞核。可以由cpp递送的分子的例子包括治疗药物、质粒dna、寡核苷酸、sirna、肽核酸(pna)、蛋白质、肽、纳米颗粒和脂质体。cpp通常为30个氨基酸或更少,来源于天然或非天然存在的蛋白质或嵌合序列,含有高相对丰度的正电荷氨基酸,例如赖氨酸或精氨酸,或交替模式的极性和非极性氨基酸。本领域常使用的cpp包括tat(frankel等人,(1988)cell.55:1189-1193;vives等人,(1997)j.biol.chem.272:16010-16017)、穿透素(derossi等人,(1994)j.biol.chem.269:10444-10450)、聚精氨酸肽序列(wender等人,(2000)proc.natl.acad.sci.usa97:13003-13008;futaki等人,(2001)j.biol.chem.276:5836-5840)和转运蛋白(pooga等人,(1998)nat.biotechnol.16:857-861)。cpp可以通过共价或非共价策略与它们的货物连接。本领域已知共价连接cpp和它的货物的方法,例如化学交联法(stetsenko等人,(2000)j.org.chem.65:4900-4909;gait等人,(2003)cell.mol.life.sci.60:844-853)或克隆融合蛋白(nagahara等人,(1998)nat.med.4:1449-1453)。货物与包含极性和非极性结构域的短的两亲性cpp之间的非共价偶联通过静电和疏水性相互作用来建立。本领域中已经利用cpp来向细胞递送潜在治疗性的生物分子。实例包括用于免疫抑制的连接到聚精氨酸的环孢菌素(rothbard等人,(2000)naturemedicine6(11):1253-1257)、用于抑制肿瘤形成的、与cpp连接的针对细胞周期蛋白b1的sirna,称为mpg(crombez等人,(2007)biochemsoc.trans.35:44-46),与cpp连接的肿瘤抑制物p53肽以减少癌细胞生长(takenobu等人,(2002)mol.cancerther.1(12):1043-1049;snyder等人,(2004)plosbiol.2:e36),和与tat融合的ras的显性阴性形式或磷酸肌醇3激酶(pi3k)以治疗哮喘(myou等人,(2003)j.immunol.171:4399-4405)。本领域已经利用cpp将造影剂转运到细胞内用于成像和生物传感应用。例如,附着到tat的绿色荧光蛋白(gfp)已经用于标记癌细胞(shokolenko等人,(2005)dnarepair4(4):511-518)。缀合至量子点的tat已经用于成功地跨越血-脑屏障以可视化大鼠脑(santra等人,(2005)chem.commun.3144-3146)。cpp还与磁共振成像技术组合用于细胞成像(liu等人,(2006)biochem.andbiophys.res.comm.347(1):133-140)。还参见ramsey和flynn,pharmacolther.2015jul22.pii:s0163-7258(15)00141-2。可选地或另外地,所述分割型脱氨酶融合蛋白可以包含核定位序列,例如,sv40大t抗原nls(pkkkrrv(seqidno:48))和核质蛋白nls(krpaatkkagqakkkk(seqidno:49))。本领域已知其他nls;例如,参见cokol等人,emborep.2000nov15;1(5):411–415;freitas和cunha,currgenomics.2009dec;10(8):550–557。在一些实施方案中,所述分割型脱氨酶融合蛋白包括对配体例如gst序列、flag序列或六组氨酸序列具有高亲和性的部分。这样的亲和标签可以促进重组分割型脱氨酶融合蛋白的纯化。对于其中将分割型脱氨酶融合蛋白递送给细胞的方法,所述分割型脱氨酶融合蛋白可以使用本领域已知的任何方法产生,例如,通过体外翻译,或在合适的宿主细胞中从编码所述分割型脱氨酶融合蛋白的核酸表达;本领域已知许多产生蛋白的方法。例如,所述蛋白可以在酵母、大肠杆菌、昆虫细胞系、植物、转基因动物或培养的哺乳动物细胞中产生并从中纯化;例如,参见palomares等人,“productionofrecombinantproteins:challengesandsolutions,”methodsmolbiol.2004;267:15-52。此外,所述分割型脱氨酶融合蛋白可以连接到便于转移入细胞的部分,例如,脂质纳米颗粒,任选地使用一旦蛋白质处于细胞内部就被切割的接头。例如,参见lafountaine等人,intjpharm.2015aug13;494(1):180-194。表达系统为了使用本文所述的分割型脱氨酶融合蛋白,可期望从编码它们的核酸表达这些变体。这可以以多种方式进行。例如,可以将编码分割型脱氨酶融合物的核酸克隆到中间载体中,以便转化入原核细胞或真核细胞用于进行复制和/或表达。中间载体一般是原核生物载体,例如,质粒、或穿梭载体、或昆虫载体,用于编码分割型脱氨酶融合物的核酸的保存或操作,用于产生分割型脱氨酶融合蛋白。也可以将编码分割型脱氨酶融合蛋白的核酸克隆到表达载体中,用于向植物细胞、动物细胞、优选地哺乳动物细胞或人细胞、真菌细胞、细菌细胞或原生动物细胞施用。为了获得表达,一般将编码分割型脱氨酶融合蛋白的序列亚克隆到含有指导转录的启动子的表达载体中。合适的细菌启动子和真核启动子是本领域熟知的,例如,在sambrook等人,molecularcloning,alaboratorymanual(3ded.2001);kriegler,genetransferandexpression:alaboratorymanual(1990);和currentprotocolsinmolecularbiology(ausubel等人编著,2010)中描述。用于表达工程化蛋白质的细菌表达系统可获自例如大肠杆菌、芽孢杆菌属物种(bacillussp.)和沙门氏菌属(salmonella)(palva等人,1983,gene22:229-235)中。用于这类表达系统的试剂盒是市售的。用于哺乳动物细胞、酵母和昆虫细胞的真核表达系统是本领域熟知的并且也是市售的。用来指导核酸表达的启动子取决于具体应用。例如,强组成型启动子一般用于融合蛋白的表达和纯化。相比之下,当分割型脱氨酶融合蛋白将被体内施用而用于基因调节时,可以使用组成型或诱导型启动子,这取决于分割型脱氨酶融合蛋白的具体运用。此外,用于分割型脱氨酶融合蛋白的施用的优选启动子可以是弱启动子,如hsvtk或具有类似活性的启动子。启动子还可以包含响应于反式激活的元件,例如,低氧反应元件、gal4反应元件、lac阻遏物反应元件和小分子控制系统,例如四环素调节的系统和ru-486系统(例如,参见gossen和bujard,1992,proc.natl.acad.sci.usa,89:5547;oligino等人,1998,genether.,5:491-496;wang等人,1997,genether.,4:432-441;neering等人,1996,blood,88:1147-55;和rendahl等人,1998,nat.biotechnol.,16:757-761)。除启动子之外,表达载体一般还含有转录单位或表达盒,其含有核酸在原核或真核宿主细胞中表达所需要的全部其他元件。因此,典型的表达盒含有启动子,其可操作地连接至,例如,编码所述分割型脱氨酶融合蛋白的核酸序列,以及例如为了转录产物的有效多聚腺苷化、转录性终止、核糖体结合位点或翻译终止所需要的任何信号。表达盒的额外元件可以包括,例如,增强子和异源剪接的内含子信号。针对所述分割型脱氨酶融合蛋白的预期用途选择用于将遗传信息转运入细胞的具体表达载体,例如,在植物、动物、细菌、真菌、原虫等中表达。标准的细菌表达载体包括质粒,例如基于pbr322的质粒、pskf、pet23d和市售的标签融合表达系统如gst和lacz。含有来自真核病毒的调节元件的表达载体经常用于真核表达载体中,例如,sv40载体、乳头瘤病毒载体和来自epstein-barr病毒的载体。其他示例性真核载体包括pmsg、pav009/a+、pmto10/a+、pmamneo-5、杆状病毒pdsve,和其他任何载体,所述载体允许蛋白质在sv40早期启动子、sv40晚期启动子、金属硫蛋白启动子、鼠乳腺瘤病毒启动子、劳斯肉瘤病毒启动子、多角体蛋白启动子或其他示出真核细胞中的表达有效性的启动子的指导下表达。用于表达所述分割型脱氨酶融合蛋白的载体可以包含rnapoliii启动子以驱动指导rna的表达,例如,h1、u6或7sk启动子。这些人类启动子允许分割型脱氨酶融合蛋白在质粒转染后在哺乳动物细胞中表达。一些表达系统具有用于选择稳定转染的细胞系的标志物,如胸苷激酶、潮霉素b磷酸转移酶和二氢叶酸还原酶。高产率表达系统也是合适的,例如,在昆虫细胞中使用杆状病毒载体,以及在多角体蛋白启动子或其他强杆状病毒启动子的指导下的grna编码序列。一般包括在表达载体中的元件还包括在大肠杆菌中起作用的复制子,编码抗生素抗性的基因以允许选择带有重组质粒的细菌,处在质粒的非关键区域中的独特的限制性位点以允许重组序列的插入。使用标准转染方法来产生表达大量蛋白质的细菌、哺乳动物、酵母或昆虫细胞系,随后使用标准技术进行纯化(例如,参见colley等人,1989,j.biol.chem.,264:17619-22;guidetoproteinpurification,引自methodsinenzymology,第182卷(deutscher编著,1990))。根据标准技术进行真核细胞和原核细胞的转化(例如,参见morrison,1977,j.bacteriol.132:349-351;clark-curtiss和curtiss,methodsinenzymology101:347-362(wud等人编著,1983)。可以使用向宿主细胞中引入外源核苷酸序列的任何已知方法。这些方法包括使用磷酸钙转染法、聚凝胺法、原生质体融合法、电穿孔法、核转染法、脂质体法、微量注射法、裸dna法、质粒载体法、病毒载体(游离的和整合的)和任何其他公知的方法将克隆的基因组dna、cdna、合成性dna或其他外源遗传物质导入宿主细胞中(例如,参见sambrook等人,上文)。仅仅必需的是,所用的具体基因工程方法能够向可表达所述分割型脱氨酶融合蛋白的宿主细胞中成功地导入至少一种基因。可选地,这些方法可以包括将分割型脱氨酶融合蛋白和指导rna一起递送,例如,作为复合体递送。例如,可以将分割型脱氨酶融合蛋白和grna在宿主细胞中过量表达并纯化,随后与指导rna复合(例如,在试管中)以形成核糖核蛋白(rnp),并递送至细胞。在一些实施方案中,可以通过使用细菌表达质粒,在细菌中表达分割型脱氨酶融合蛋白并从其中纯化。例如,可以将加his标签的分割型脱氨酶融合蛋白在细菌细胞中表达并且随后使用镍亲和色谱纯化。rnp的使用规避了递送编码核酸酶或指导物的质粒dna或者mrna的形式的编码核酸酶的质粒dna的必要性。rnp递送还可改进特异性,大概是因为rnp的半衰期较短并且不存在核酸酶和指导物的持续性表达(如从质粒将会得到那样)。例如,使用脂质介导的转染或电穿孔,可以将rnp在体内或在体外递送至细胞。例如,参见liang等人"rapidandhighlyefficientmammaliancellengineeringviacas9proteintransfection."journalofbiotechnology208(2015):44-53;zuris,johna.等人"cationiclipid-mediateddeliveryofproteinsenablesefficientprotein-basedgenomeeditinginvitroandinvivo."naturebiotechnology33.1(2015):73-80;kim等人"highlyefficientrna-guidedgenomeeditinginhumancellsviadeliveryofpurifiedcas9ribonucleoproteins."genomeresearch24.6(2014):1012-1019。本发明还包括例如用于本文所述方法中的载体和包含载体的细胞,以及包含本文所述蛋白质和核酸的试剂盒。治疗β地中海贫血β地中海贫血是一组特征为遗传性缺乏β-珠蛋白链合成的遗传疾病。其中受累个体的突变为纯合型的重型地中海贫血与需要输血的重度贫血相关。轻型地中海贫血最不严重并且一般不需要治疗,而严重度级别介于轻型地中海贫血和重型地中海贫血之间的那些人称为患有中间型地中海贫血。例如,参见cao和galanello,geneticsinmedicine12,61–76(2010)。hapobec3a突变体,例如,n57g或n57a或n57q或k60a或k60d或y130f,作为如本文所述的be3结构中的融合蛋白,可以作为疗法用于例如具有常见于一些东亚人群中的β地中海贫血突变hbb-28(a>g)的受试者中(参见liang等人,proteincell.2017nov;8(11):811-822)。本领域已知用于鉴定具有该突变的受试者的方法;例如,参见saetung等人,southeastasianjtropmedpublichealth.2013nov;44(6):1055-64;liu等人,hemoglobin.2015;39(1):18-23;doro等人,hemoglobin.2017mar;41(2):96-99;zhang等人,bmjopen.2017jan31;7(1):e013367。这些方法可以包括动员并且随后提取cd34+造血干细胞和祖细胞(hspcs)(例如,参见bonig和papayannopoulou,methodsmolbiol.2012;904:1–14;jin等人,biomedresearchinternational,第2014卷,论文id435215,9页,2014)。随后通过引入编码碱基编辑器蛋白的mrna或通过使用纯化的碱基编辑器蛋白+指导物(例如,rnp),离体(在受试者身体外部)修饰hspc。在将修饰的细胞回输至受试者中前,可以维持培养细胞以允许增殖,例如,持续几天。受试者也可以在输注之前接受骨髓细胞清除,以确保修饰的细胞良好移入(参见sullivan,keithm.等人,newenglandjournalofmedicine378.1(2018):35-47.)。随后允许修饰的干细胞移入受试者的骨髓中并产生无β地中海贫血的红细胞。如本文所述,我们研究apo3an57gbe3是否能够在一些东亚人群中常见的造成β-地中海贫血的等位基因hbb-28(a>g)处有效诱导单核苷酸编辑。我们首先产生一个携带单一整合的200bp片段致病hbb-28(a>g)启动子等位基因的hek293t模型细胞系并且相对于be3或yebe3衍生物,试验apo3an57gbe3是否能够在-28(a>g)位置(在反义链上编辑,以影响有义链)更有效诱导单核苷酸编辑。如预期的,apo3an57gbe3在hbb-25旁观者基序处诱导显著更少的编辑事件,同时在-28(a>g)同源基序处保留高编辑活性。采用be3编辑产生了0.57%完美校正的等位基因。编辑窗口中采用be3对hbb-25胞苷的脱氨在等位基因中分别产生11.5%和1.8%的因果性β-地中海贫血突变hbb-25(g>t)和(g>c)突变。采用be3编辑后占总等位基因15.2%的产物-25(g>a)还可以产生独立的β-地中海贫血表型,但是这尚待临床证实。相反,用apo3an57gbe3在hbb-28(a>g)位点编辑产生22.5%完美校正的等位基因,40倍多于be3,并且在-25位置产生3.96%的总编辑率。实施例以下实施例中进一步描述本发明,所述实施例不限制权利要求中描述的本发明范围。材料和方法质粒和寡核苷酸通过pcr和标准分子克隆方法产生含有氨基酸置换的be表达质粒。通过将退火的寡核苷酸双链体连接至bsmbi切割的mlm3636,构建grna表达质粒。除靶向hbb-28(a>g)和ctnnb1位点的那些以外,全部grna设计成靶向含有5′鸟嘌呤核苷酸的位点。人细胞培养和转染在补充有10%热灭活胎牛血清、2mmglutamax、青霉素和链霉素的dmem中在37℃5%co2下培养含有egfp-pest报告基因的单一稳定整合拷贝的2os.egfp细胞和hek293t细胞。u2os.egfp细胞的培养基补充有400μgml-1遗传霉素(geneticin)。通过str分析(atcc)验证细胞系身份并且对细胞定期检验支原体污染。在lonza4-dnucleofector上使用dn-100程序和se细胞系试剂盒,根据生产商的推荐,用750ng表达be的质粒和250ng表达sgrna的质粒转染u2os.egfp细胞。对于hek293t转染,将75,000个细胞接种在24孔平板中并且18小时后根据生产商的推荐,使用transit-293(mirus),用600ng表达be的质粒和200ng表达sgrna的质粒转染。对于全部靶向扩增子测序和guide-seq实验,转染后72小时提取基因组dna。在含有100mmtris-hclph8.0、150mmnacl、5mmedta和0.05%sds的裂解缓冲液中裂解细胞并在55℃在培养箱中250rpm振摇时温育过夜。使用重悬于2.5mnacl和18%peg-6000中的羧基修饰的sera-mag快速磁珠(magneticspeed-beads)(磁珠),从裂解的细胞提取基因组dna。在慢病毒载体中通过将hbb启动子的200碱基对片段克隆至驱动嘌呤霉素耐药基因表达的ef1a启动子上游,构建hek293t.hbb细胞系。通过pcr和标准分子克隆方法插入hbb-28(a>g)突变。将该慢病毒载体转染至293fs细胞中并且72小时后收获含有病毒颗粒的培养基。将含有病毒颗粒的培养基连续稀释并按大约1000万个hek293t细胞添加至10cm平板。在48小时后,向培养基补充2.5μgml-1嘌呤霉素并且从存活集落最少的10cm平板收获细胞以确保单复制整合。脱靶位点选择和扩增子设计两个在此表征的位点,emx1位点1和fancf,先前已通过改良digenome-seq法(一种发现be3特异性脱靶位点的无偏见方案)表征。研究了通过改良digenome-seq法发现的全部脱靶,并且这些位点代表最全面的脱靶表征,因为它们是使用be3从头发现的。vegfa位点2靶是先前通过guide-seq法表征的混杂的均聚grna。因为vegfa位点2grna具有超过一百个核酸酶脱靶位点,我们选择具有最高数目guide-seq读段(read)的20个脱靶位点,其也位于我们能够设计唯一pcr扩增引物用于本文表征的基因座中。ctnnb1和hbb-28(a>g)grna先前尚未就be或核酸酶脱靶位点进行表征。使用这些grna,我们如先前所述那样进行guide-seq17以确定spcas9核酸酶脱靶位点,并且使用cas-offinder来预测具有一个rna凸出和一个错配的全部潜在脱靶位点。(使用hg38参考基因组,执行guide-seq和cas-offinder分析)相对于核酸酶,这类脱靶在be3中更为普遍16,并且因此在我们不大可能通过guide-seq发现的位点中更为普遍。引物设计成扩增全部脱靶位点,从而编辑的潜在胞苷处于illuminahts读段的前100碱基对内。涵盖emx1位点1、vegfa位点2和ctnnb1位点1脱靶位点的总计六个引物对未扩增其预期扩增子并且因此从进一步分析中排除。统计检验使用双尾学生t检验,根据benjamini、krieger、和yekutieli法,假定样品之间无等方差情况下执行全部统计检验。靶向扩增子测序从来自每种条件的三个生物学重复的约100ng基因组dna扩增中靶位点和脱靶位点。用phusion高保真dna聚合酶(neb)进行pcr扩增。用1x体积磁珠纯化50μlpcr反应。在qiaxcel仪上通过毛细管电泳法核实扩增保真度。对每个三重复转染汇集具有正交序列的扩增子,并且根据生产商说明,使用nebnextultraiidna文库制备试剂盒,添加illumina流动池相容性衔接头。使用来自nebnextmultiplexoligosforillumina(双端索引引物试剂盒1(dualindexprimersset1))的引物,通过额外10个采用q5高保真dna聚合酶的pcr循环添加illuminai5和i7索引,并且使用0.7x体积磁珠纯化。通过微滴数字式pcr定量含有illumina相容性衔接子和索引的最终扩增子文库,并在illuminamiseq仪上用150bp配对末端读段测序。通过测序用读段通过miseqreporter分离(demultiplex),随后通过crispresso修订版分析每个位置处的碱基频率28。在包围每种sgrna的预期切割位点的10碱基对窗口中定量插入缺失。hbb-28(a>g)grna的表达为了使用具有减少全基因组脱靶编辑的hf1或hypa突变的ea3abe,必须使用间隔子和靶位点之间无错配的grna中20个核苷酸的间隔子序列。我们从质粒表达hbb-28(a>g)grna,所述质粒使用偏好在+1位置的鸟嘌呤核苷酸处启动转录的u6启动子。为了保护间隔子和靶位点之间的完美匹配,我们附接了能够在间隔子5’移除错配鸟嘌呤的自剪切型5’锤头状核酶。示例性蛋白质序列rapobec1-xtenl8-ncas9-ugi-sv40nlsmssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglksgsetpgtsesatpesdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggspkkkrkv(seqidno:50)尿嘧啶糖基化酶抑制剂(ugi)tnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikml(seqidno:45)haidmdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl(seqidno:51)缺少n末端rna结合区域的haidv溶解性变体mdphiftsnfnngigrhktylcyeverldsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl(seqidno:52)缺少n末端rna结合区域和c末端结构不良区域的haidv溶解性变体mdphiftsnfnngigrhktylcyeverldsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillpl(seqidno:53)rapobec1mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk(seqidno:54)mapobec3mgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfrpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppmsn(seqidno:55)mapobec3催化结构域mgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrr(seqidno:56)hapobec3ameaspasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn(seqidno:57)hapobec3gmkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen(seqidno:58)hapobec3g催化结构域pptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen(seqidno:59)hapobec3hmalltaetfrlqfnnkrrlrrpyyprkallcyqltpqngstptrgyfenkkkchaeicfineiksmgldetqcyqvtcyltwspcsscawelvdfikahdhlnlgifasrlyyhwckpqqkglrllcgsqvpvevmgfpkfadcwenfvdhekplsfnpykmleeldknsraikrrlerikipgvraqgrymdilcdaev(seqidno:60)hapobec3fmkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile(seqidno:61)hapobec3f催化结构域keilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile(seqidno:62)金黄色葡萄球菌(s.aureus)cas9mkrnyilgldigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrelindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfynndlikingelyrvigvnndllnrievnmidityreylenmndkrppriiktiasktqsikkystdilgnlyevkskkhpqiikkg(seqidno:63)空肠弯曲杆菌(c.jejuni)cas9marilafdigissigwafsendelkdcgvriftkvenpktgeslalprrlarsarkrlarrkarlnhlkhlianefklnyedyqsfdeslakaykgslispyelrfralnellskqdfarvilhiakrrgyddiknsddkekgailkaikqneeklanyqsvgeylykeyfqkfkenskeftnvrnkkesyerciaqsflkdelklifkkqrefgfsfskkfeeevlsvafykralkdfshlvgncsfftdekrapknsplafmfvaltriinllnnlkntegilytkddlnallnevlkngtltykqtkkllglsddyefkgekgtyfiefkkykefikalgehnlsqddlneiakditlikdeiklkkalakydlnqnqidslsklefkdhlnisfkalklvtplmlegkkydeacnelnlkvainedkkdflpafnetyykdevtnpvvlraikeyrkvlnallkkygkvhkinielarevgknhsqrakiekeqnenykakkdaeleceklglkinsknilklrlfkeqkefcaysgekikisdlqdekmleidhiypysrsfddsymnkvlvftkqnqeklnqtpfeafgndsakwqkievlaknlptkkqkrildknykdkeqknfkdrnlndtryiarlvlnytkdyldflplsddentklndtqkgskvhveaksgmltsalrhtwgfsakdrnnhlhhaidaviiayannsivkafsdfkkeqesnsaelyakkiseldyknkrkffepfsgfrqkvldkideifvskperkkpsgalheetfrkeeefyqsyggkegvlkalelgkirkvngkivkngdmfrvdifkhkktnkfyavpiytmdfalkvlpnkavarskkgeikdwilmdenyefcfslykdsliliqtkdmqepefvyynaftsstvslivskhdnkfetlsknqkilfknanekeviaksigiqnlkvfekyivsalgevtkaefrqredfkk(seqidno:64)食清洁剂细小棒菌(p.lavamentivorans)cas9merifgfdigttsigfsvidysstqsagniqrlgvrifpeardpdgtplnqqrrqkrmmrrqlrrrrirrkalnetlheagflpaygsadwpvvmadepyelrrrgleeglsayefgraiyhlaqhrhfkgreleesdtpdpdvddekeaaneraatlkalkneqttlgawlarrppsdrkrgihahrnvvaeeferlwevqskfhpalkseemrarisdtifaqrpvfwrkntlgecrfmpgeplcpkgswlsqqrrmleklnnlaiaggnarpldaeerdailsklqqqasmswpgvrsalkalykqrgepgaekslkfnlelggeskllgnaleakladmfgpdwpahprkqeirhavherlwaadygetpdkkrviilsekdrkahreaaansfvadfgitgeqaaqlqalklptgwepysipalnlflaelekgerfgalvngpdwegwrrtnfphrnqptgeildklpspaskeererisqlrnptvvrtqnelrkvvnnliglygkpdririevgrdvgkskrereeiqsgirrnekqrkkatedlikngianpsrddvekwilwkegqercpytgdqigfnalfregryevehiwprsrsfdnsprnktlcrkdvniekgnrmpfeafghdedrwsaiqirlqgmvsakggtgmspgkvkrflaktmpedfaarqlndtryaakqilaqlkrlwpdmgpeapvkveavtgqvtaqlrklwtlnniladdgektradhrhhaidaltvacthpgmtnklsrywqlrddpraekpaltppwdtiradaekavseivvshrvrkkvsgplhkettygdtgtdiktksgtyrqfvtrkkieslskgeldeirdprikeivaahvagrggdpkkafppypcvspggpeirkvrltskqqlnlmaqtgngyadlgsnhhiaiyrlpdgkadfeivslfdasrrlaqrnpivqrtradgasfvmslaageaimipegskkgiwivqgvwasgqvvlerdtdadhstttrpmpnpilkddakkvsidpigrvrpsnd(seqidno:65)灰奈瑟氏菌(n.cinerea)cas9maafkpnpmnyilgldigiasvgwaiveideeenpirlidlgvrvferaevpktgdslaaarrlarsvrrltrrrahrllrarrllkregvlqaadfdenglikslpntpwqlraaaldrkltplewsavllhlikhrgylsqrknegetadkelgallkgvadnthalqtgdfrtpaelalnkfekesghirnqrgdyshtfnrkdlqaelnllfekqkefgnphvsdglkegietllmtqrpalsgdavqkmlghctfeptepkaakntytaerfvwltklnnlrileqgserpltdteratlmdepyrkskltyaqarklldlddtaffkglrygkdnaeastlmemkayhaisralekeglkdkksplnlspelqdeigtafslfktdeditgrlkdrvqpeileallkhisfdkfvqislkalrrivplmeqgnrydeacteiygdhygkknteekiylppipadeirnpvvlralsqarkvingvvrrygsparihietarevgksfkdrkeiekrqeenrkdreksaakfreyfpnfvgepkskdilklrlyeqqhgkclysgkeinlgrlnekgyveidhalpfsrtwddsfnnkvlalgsenqnkgnqtpyeyfngkdnsrewqefkarvetsrfprskkqrillqkfdedgfkernlndtryinrflcqfvadhmlltgkgkrrvfasngqitnllrgfwglrkvraendrhhaldavvvacstiamqqkitrfvrykemnafdgktidketgevlhqkahfpqpweffaqevmirvfgkpdgkpefeeadtpeklrtllaeklssrpeavhkyvtplfisrapnrkmsgqghmetvksakrldegisvlrvpltqlklkdlekmvnrerepklyealkarleahkddpakafaepfykydkagnrtqqvkavrveqvqktgvwvhnhngiadnativrvdvfekggkyylvpiyswqvakgilpdravvqgkdeedwtvmddsfefkfvlyandlikltakkneflgyfvslnratgaidirthdtdstkgkngifqsvgvktalsfqkyqidelgkeirpcrlkkrppvr(seqidno:66)红嘴鸥弯曲杆菌(c.lari)cas9mrilgfdiginsigwafvendelkdcgvriftkaenpknkeslalprrnarssrrrlkrrkarliaikrilakelklnykdyvaadgelpkayegslasvyelrykaltqnletkdlarvilhiakhrgymnknekksndakkgkilsalknnalklenyqsvgeyfykeffqkykkntknfikirntkdnynncvlssdlekelklilekqkefgynysedfineilkvaffqrplkdfshlvgactffeeekracknsysawefvaltkiineikslekisgeivptqtinevlnlildkgsitykkfrscinlhesisfkslkydkenaenaklidfrklvefkkalgvhslsrqeldqisthitlikdnvklktvlekynlsneqinnlleiefndyinlsfkalgmilplmregkrydeaceianlkpktvdekkdflpafcdsifahelsnpvvnraiseyrkvlnallkkygkvhkihlelardvglskkarekiekeqkenqavnawalkeceniglkasaknilklklwkeqkeiciysgnkisiehlkdekalevdhiypysrsfddsfinkvlvftkenqeklnktpfeafgkniekwskiqtlaqnlpykkknkildenfkdkqqedfisrnlndtryiatliakytkeylnflllsenenanlksgekgskihvqtisgmltsvlrhtwgfdkkdrnnhlhhaldaiivaystnsiikafsdfrknqellkarfyakeltsdnykhqvkffepfksfrekilskideifvskpprkrarralhkdtfhsenkiidkcsynskeglqialscgrvrkigtkyvendtivrvdifkkqnkfyaipiyamdfalgilpnkivitgkdknnnpkqwqtidesyefcfslykndlillqkknmqepefayyndfsistssicvekhdnkfenltsnqkllfsnakegsvkveslgiqnlkvfekyiitplgdkikadfqprenislktskkyglr(seqidno:67)实施例1.改进靶向碱基编辑技术的全基因组特异性野生型胞苷脱氨酶结构域具有针对2-3核苷酸基序的固有底物序列特异性(参见表1)。apobec酶类通过具有可变序列组成的称作识别环1(rl1)和环7的两个识别环中的残基之间所形成的直接接触来识别其同源序列基序12-13,17-22(参见表2、图2a-2b和图3a-3b)。例如,apo3a底物序列特异性的主要决定因素是环7中的残基d131,所述残基与5’tc基序中的胸腺嘧啶产生两个氢键。为了调节apo3a的特异性,我们将位置131处残基的身份改变成先前已证明形成碱基特异性接触的残基(表7)43。为了改变表1中所列的全部其他apobec脱氨酶的特异性,我们改变了通过与apo3a序列比对所鉴定的来自这些蛋白质中每一者的同源残基(homologousresidue)。尽管野生型apo3a对5’tcr基序拥有固有序列特异性,但它能够以较低效率使5’acr、5’gcr和5’ccr基序脱氨(其中小写c是脱氨的碱基)。这表明,或许可通过以下方式工程化apo3a,以对其典型tcr底物基序具有更大特异性:去除apo3a和其底物ssdna之间所形成的接触形式的过量结合能,从而仅使tcg或tca基序有效脱氨。基于与底物ssdna结合的apo3a的晶体结构21,我们鉴定r28和k30(其似乎以半特异性方式接触紧邻tcr的3’的碱基)以及n57、r60和y130(它们均以非碱基特异性方式接触ssdna底物主链)作为候选残基,所述候选残基的dna接触可能贡献明显的非特异性底物结合能,从而改变它们可以导致特异性更强的脱氨酶。我们还已经将w98鉴定为有助于形成埋入有靶胞嘧啶碱基的疏水性口袋的残基,并且假设w98y将减少该口袋的疏水性,同时保留脱氨酶活性,因而减少在tc基序脱氨所需要的结合能之上的任何可能的过量结合能。因为多个apobec同源物和直向同源物在序列水平与apo3a具有显著相似性,我们还已经鉴定了预期增加这些蛋白质中每者的底物序列特异性的同源残基。为了验证我们假设可有助于工程化的碱基编辑蛋白对tcr基序的特异性增加的突变,我们将编码在apo3a中携带单一残基置换的apo3a-ncas9-ugi蛋白的基因克隆至用于在哺乳动物细胞中过量表达蛋白质的质粒载体中。我们随后将这些质粒载体与设计成表达靶向两个独立位点之一的指导rna的质粒组合时转染至人u2os细胞中,其中所述位点携带多个能够作为单一整合型egfp基因内部脱氨底物发挥作用的三核苷酸基序。在72小时后,我们从转染的u2os群体收获基因组dna并且在指导rna基因组靶位点进行高通量扩增子测序。我们发现,当野生型apo3a蛋白与ncas9-ugi融合时,所得的蛋白质能够在预期的tcr基序的靶位点实现c>t转换,还对靶位点处存在的gct和gcg基序实现这种转换(图4)。但是,将n57或k60突变成表7中列出的残基时,我们在编辑窗口中存在的中靶tcg处观察到稳健脱氨,但观察到这些蛋白质靶向在碱基编辑窗口外部和编辑窗口中存在的gct基序处的基序的能力显著降低。值得注意地,apo3an57a-ncas9-ugi和apo3ak60d-ncas9-ugi对编辑窗口tcg保留稳健活性,但对编辑窗口gct基序保留低至很低的活性(图5)。为了定量评价编辑窗口egfp位点1中这种相对于gct的对tcg偏好性的增加,我们将编辑窗口中tcg基序处的脱氨频率除以编辑窗口中gct基序的脱氨频率,以确定这些蛋白质的特异性比(图6)。我们发现,相对于野生型apo3a-ncas9-ugi蛋白,apo3an57a-ncas9-ugi和apo3ak60d/e/n-ncas9-ugi均已经展示相对于gct基序的对tcg基序的增加的特异性。我们随后在egfp位点2(在编辑窗口外部携带gca、aca、acc、ccc、cca和gcg基序以及tcg基序的靶位点)上评价这些蛋白质的活性。前述每种突变体都对靶位点中这些脱靶基序的每一者展示显著降低的活性,以及对编辑窗口外部找到的中靶tcg基序展示降低的活性(图7、图8)。基于与其ssdna底物复合的apo3a的晶体结构21,我们确定k30与tcg基序中的第三核苷酸形成碱基特异性接触。我们假设,对该位置的残基所进行的突变将改变三核苷酸底物基序中由apo3a-ncas9-ugi识别的第三核苷酸的身份。因为我们期望位置30处残基的身份显著影响底物基序中第三核苷酸的身份,故而我们已经确定了我们期望与表9中特定碱基发生接触的残基。当通过瞬时转染将编码碱基编辑器蛋白的所得质粒dna连同编码靶向染色体整合型egfp基因的grna的质粒一起递送至人细胞时,对apo3a中多个残基所进行的突变(表9)能够程度各异地恢复序列偏好性(图9)。我们还发现,可以通过以下方式增强apo3a对其同源5’tc基序的特异性:组合对表7中所列的位置的突变,并且通过质粒瞬时转染将be蛋白靶向相同的egfp靶位点,产生对apo3an57a或n57gbe3具有相似基序特异性的apo3an57q/y130fbe3变体(图10)。我们在12个除另一个非同源5’vc(其中v=a、c或g)外另在编辑窗口中含有同源5’tc基序的内源基因组位点筛选了apo3an57a或n57g或(n57q/y130f)be3的活性并且将它们与be3和现有技术的工程化变体ye1、ye2和yeebe3(yebe3)比较,其中所述的工程化变体通过将相比be3而言减慢其动力学速率并限制其编辑窗口长度的点突变并入大鼠apobec1(rapo1)脱氨酶结构域,降低此类旁观者突变的频率44。我们发现在12个位点中8个位点,工程化的apo3abe3变体在同源基序诱导的c至t编辑比非同源5’vc基序处多5倍至264倍(图11-图12)。但是,工程化的apo3abe3变体在剩余4个位点以小于5的比率诱导同源:非同源编辑。接着,我们力图通过向apo3an57gbe3的在先前经证实影响同源蛋白催化速率和持续合成能力的残基添加突变,在这些位点改进序列特异性脱氨(表10)。尽管添加衍生自yebe3蛋白的各个同源突变未显著增加apo3an57g双突变体的序列特异性,但对残基a71和i96所进行的突变大大增加三个受测位点的同源:非同源编辑比,从小于5至大约13(图13)。至关重要地,这些突变的确切性质可以按依赖于递送模式的方式不同。例如,通过核糖核蛋白(rnp)或在mrna中编码而递送这些试剂可以导致蛋白质在细胞中持续时间较短。与较长期递送(例如通过质粒转染法递送)相比,细胞中碱基编辑器蛋白的较短持续时间可以导致不同的突变谱45。结果,或许有必要使用当通过质粒递送时保留次优序列特异性、而通过较短寿命模式递送时保留最佳序列特异性的工程化胞苷脱氨酶be,例如apo3an57q或k60d或y130fbe3。与野生型apo3abe3和be3相比,工程化变体apo3an57gbe3还在脱靶位点展示增加的全基因组保真度。我们用编码apo3abe3、apo3an57gbe3或be3的质粒dna连同表达充分表征的emx1grna(图14)或fancfgrna(图15)的质粒瞬时转染细胞。在emx1的25个先前已鉴定的脱靶位点中的16个位点和fancf的15个脱靶位点中的3个位点,be3诱导通过高通量测序可检测的编辑。相反,apo3an57gbe3在emx1的25位点中6个位点和fancf的15位点中0个位点诱导编辑。在apo3an57gbe3确实诱导脱靶编辑的位点处,与be3相比,它处于大大降低的频率。将来自hf1或hypaspcas9的高保真突变添加至apo3an57gbe3将全部脱靶编辑作用降低至测定的检测阈值以下。最后,我们力图确定apo3an57g碱基编辑器是否可以用来更有效地校正β地中海贫血突变hbb-28(a>g)。在反义链上靶向该突变的grna(ctgacttctatgcccagccc(其中加粗小写“c”是靶胞嘧啶))中,除位置-28处前置有5’t的靶胞苷之外,前置有5’a(旁观者胞苷)的第二胞苷还存在于编辑窗口中。对旁观者胞苷的突变产生独立的β地中海贫血表型并且应当在hbb-28(a>g)突变的任何潜在疗法中予以避免。我们向携带hbb启动子的编码hbb-28(a>g)突变的慢病毒整合型200碱基对片段的hek293细胞瞬时转染编码be3或apo3an57gbe3(以及图16中所示的其他蛋白质,包括添加第二ugi结构域至a3an57gbe3或添加hf1或hypa高保真突变至ncas9部分的那些蛋白质)的质粒dna。在72小时后,我们从细胞收获基因组dna并使用pcr扩增靶位点,并且通过illumina高通量测序法,对pcr产物测序以检查靶胞苷和旁观者胞苷的脱氨频率。我们发现,尽管be3蛋白和yebe3蛋白以大致等同的比率编辑靶胞苷和旁观者胞苷,但apo3an57gbe3使靶胞苷脱氨多于使旁观者胞苷脱氨大约15倍(图17)。我们随后分析用be3编辑hbb-28(a>g)位点产生完美校正的等位基因(即其中已经编辑-28位置但未编辑任何其他位置的等位基因)的频率。be3以0.5%所测序的总等位基因的频率产生完美编辑的等位基因。相反,用apo3an57gbe3进行的编辑以22%所测序的总等位基因的比率产生完美编辑的等位基因,40倍多于用be3进行的编辑(图18)。接着,我们研究使用hbb-28(a>g)grna时,用apo3an57gbe3进行的编辑是否产生比be3更少的脱靶脱氨事件。be3在8个脱靶位点中的3个位点诱导可检测的脱氨,而apo3an57gbe3在8个脱靶位点中的仅1个位点诱导编辑(图19)。因此,如与be3蛋白或现有技术的yebe3蛋白相比,工程化的apo3an57gbe3变体能够在八个受检位点更有效地校正hbb-28(a>g)致病等位基因,脱靶效应更少。在附加实验中,使用从捐赠收获的具有hbb-28(a>g)突变的人类患者cd34+hspc。将纯化的a3an57gbe3蛋白随指导rna一起递送至细胞。在5天后,提取gdna并且通过测序评价疾病校正情况。表7中列出的突变可以单独或以任何可能组合用于增加脱氨酶蛋白或结构域的特异性。表8中列出的突变意在改变可靶向的基序序列,并且可以与表7中的任何突变组合,以产生底物序列改变和增加的工程化脱氨酶蛋白或结构域。另外,表9中列出的突变可以与表7或表8中列出的任何突变组合以产生工程化脱氨酶蛋白,所述工程化脱氨酶蛋白对三核苷酸基序中的第一或第三核苷酸具有改变的特异性,并且相对于其他可能的脱氨底物基序,对其靶基序具有增加的特异性。表7.通过影响蛋白质:底物相互作用界面来增强胞苷脱氨酶蛋白的序列特异性的突变*表示缺少足够的结构信息的蛋白质。表7显示用于特异性工程化的具有显著序列和结构相似性的apobec直向同源物。在这些情况下,与apo3a的蛋白序列比对用于确定与apo3a位置同源的残基。将待突变的六个残基位置各自列出,连同预期通过减少脱氨酶蛋白和其ssdna底物之间的过量结合能,增加该脱氨酶结构域对其典型底物序列或再工程化底物序列的特异性的一个或多个残基。表8.用于底物序列特异性再工程化的具有显著序列和结构相似性的apobec直向同源物(*表示缺少足够的结构信息的蛋白质)*表示缺少足够的结构信息的蛋白质。在这些情况下,与apo3a的蛋白序列比对用于确定与apo3ad131同源的残基。对每个双核苷酸基序,给出预期改变每种蛋白质的序列特异性的残基突变的位置和身份。全部位置信息指获自uniprot.org的野生型蛋白序列。表9.用于底物序列特异性再工程化的具有显著序列和结构相似性的apobec直向同源物*表示缺少足够的结构信息的蛋白质。在这些情况下,与apo3a的蛋白序列比对用于确定与apo3ak30同源的残基。对每个三核苷酸基序,给出预期改变每种蛋白质的序列特异性的残基突变的位置和身份。全部位置信息指获自uniprot.org的野生型蛋白序列。表10.通过影响酶的动力学速率及其持续合成能力来增强胞苷脱氨酶蛋白的序列特异性的突变参考文献1.komor,alexisc.,yongjoob.kim,michaels.packer,johna.zuris,anddavidr.liu."programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage."nature533.7603(2016):420-24.2.yang,luhan,adrianw.briggs,weileongchew,prashantmali,marcguell,johnaach,danielbryangoodman,davidcox,yinankan,emallesha,venkataramanansoundararajan,fengzhang,andgeorgechurch."engineeringandoptimisingdeaminasefusionsforgenomeediting."naturecommunications7(2016):13330.3.jasin,maria,androdneyrothstein."repairofstrandbreaksbyhomologousrecombination."coldspringharborperspectivesinbiology5.11(2013):a012740.4.cone,richard,thomasbonura,ande.c.friedberg."inhibitorofuracil-dnaglycosylaseinducedbybacteriophagepbs2.purificationandpreliminarycharacterization."journalofbiologicalchemistry255.21(1980):10354-10358.5.kuscu,cem,andmazharadli."crispr-cas9-aidbaseeditorisapowerfulgain-of-functionscreeningtool."naturemethods13.12(2016):983-84.6.hess,gaelent.,laurefrésard,kyuhohan,cameronh.lee,amyli,karlenea.cimprich,stephenb.montgomery,andmichaelc.bassik."directedevolutionusingdcas9-targetedsomatichypermutationinmammaliancells."naturemethods13.12(2016):1036-042.7.nishida,k.,t.arazoe,n.yachie,s.banno,m.kakimoto,m.tabata,m.mochizuki,a.miyabe,m.araki,k.y.hara,z.shimatani,anda.kondo."targetednucleotideeditingusinghybridprokaryoticandvertebrateadaptiveimmunesystems."science353.6305(2016).8.tsai,shengdarq.,zonglizheng,nhut.nguyen,matthewliebers,vedv.topkar,vishalthapar,nicolaswyvekens,cydkhayter,a.johniafrate,longp.le,martinj.aryee,andj.keithjoung."guide-seqenablesgenome-wideprofilingofoff-targetcleavagebycrispr-casnucleases."naturebiotechnology33.2(2014):187-97.9.wu,xuebing,davida.scott,andreaj.kriz,anthonyc.chiu,patrickd.hsu,danielb.dadon,albertw.cheng,alexandroe.trevino,silvanakonermann,sidichen,rudolfjaenisch,fengzhang,andphillipa.sharp."genome-widebindingofthecrisprendonucleasecas9inmammaliancells."naturebiotechnology32.7(2014):670-76.10.kim,y.bill,alexisc.komor,jonathanm.levy,michaels.packer,kevint.zhao,anddavidr.liu."increasingthegenome-targetingscopeandprecisionofbaseeditingwithengineeredcas9-cytidinedeaminasefusions."naturebiotechnology35.4(2017):371-76.11.byeon,in-jal.,jinwooahn,mithunmitra,chang-hyeockbyeon,kamilhercík,jozefhritz,lisam.charlton,judithg.levin,andangelam.gronenborn."nmrstructureofhumanrestrictionfactorapobec3arevealssubstratebindingandenzymespecificity."naturecommunications4(2013):1890.12.bransteitter,ronda,courtneyprochnow,andxiaojiangs.chen."thecurrentstructuralandfunctionalunderstandingofapobecdeaminases."cellularandmolecularlifesciences66.19(2009):3137-147.13.mitra,mithun,dustinsinger,yumano,jozefhritz,gabrielnam,robertj.gorelick,in-jal.byeon,angelam.gronenborn,yasumasaiwatani,andjudithg.levin."sequenceandstructuraldeterminantsofhumanapobec3hdeaminaseandanti-hiv-1activities."retrovirology12.1(2015):3.14.nair,s.,s.sanchez-martinez,x.ji,anda.rein."biochemicalandbiologicalstudiesofmouseapobec3."journalofvirology88.7(2014):3850-860.15.langlois,marc-andré,etal."mutationalcomparisonofthesingle-domainedapobec3canddouble-domainedapobec3f/ganti-retroviralcytidinedeaminasesprovidesinsightintotheirdnatargetsitespecificities."nucleicacidsresearch33.6(2005):1913-1923.16.harris,reubens.,svendk.petersen-mahrt,andmichaels.neuberger."rnaeditingenzymeapobec1andsomeofitshomologscanactasdnamutators."molecularcell10.5(2002):1247-253.17.chen,kuan-ming,elenaharjes,phillipj.gross,amrfahmy,yongjianlu,keisukeshindo,reubens.harris,andhiroshimatsuo."structureofthednadeaminasedomainofthehiv-1restrictionfactorapobec3g."nature452.7183(2008):116-19.18.pham,phuong,samira.afif,mayukoshimoda,kazuhikomaeda,nobuosakaguchi,larsc.pedersen,andmyronf.goodman."structuralanalysisoftheactivation-induceddeoxycytidinedeaminaserequiredinimmunoglobulindiversification."dnarepair43(2016):48-56.19.shandilya,shivenderm.d.,madhavin.l.nalam,ellena.nalivaika,phillipj.gross,johnathanc.valesano,keisukeshindo,mingli,marymunson,williame.royer,elenaharjes,takahidekono,hiroshimatsuo,reubens.harris,mohansomasundaran,andceliaa.schiffer."crystalstructureoftheapobec3gcatalyticdomainrevealspotentialoligomerizationinterfaces."structure18.1(2010):28-38.20.shi,ke,michaela.carpenter,kayokurahashi,reubens.harris,andhidekiaihara."crystalstructureofthednadeaminaseapobec3bcatalyticdomain."journalofbiologicalchemistry290.47(2015):28120-8130.21.shi,ke,michaela.carpenter,surajitbanerjee,nadinem.shaban,kayokurahashi,danielj.salamango,jenniferl.mccann,gabrielj.starrett,justinv.duffy,demir,rommiee.amaro,daniela.harki,reubens.harris,andhidekiaihara."structuralbasisfortargeteddnacytosinedeaminationandmutagenesisbyapobec3aandapobec3b."naturestructural&molecularbiology24.2(2016):131-39.22.salter,jasond.,ryanp.bennett,andharoldc.smith."theapobecproteinfamily:unitedbystructure,divergentinfunction."trendsinbiochemicalsciences41.7(2016):578-94.23.holdenlg,prochnowc,changpy,bransteitterr,chelicol,senu,stevensrc,goodmanmf,chenxs(2008)crystalstructureoftheanti-viralapobec3gcatalyticdomainandfunctionalimplications.nature456:121–124.24.logue,ericc.,etal."adnasequencerecognitionlooponapobec3acontrolssubstratespecificity."plosone9.5(2014):e97062.25.kohli,r.m.,s.r.abrams,k.s.gajula,r.w.maul,p.j.gearhart,andj.t.stivers."aportablehotspotrecognitionlooptransferssequencepreferencesfromapobecfamilymemberstoactivation-inducedcytidinedeaminase."journalofbiologicalchemistry284.34(2009):22898-2904.26.kim,daesik,kayeonglim,sang-taekim,sun-heuiyoon,kyoungmikim,seuk-minryu,andjin-sookim."genome-widetargetspecificitiesofcrisprrna-guidedprogrammabledeaminases."naturebiotechnology(2017).27.kleinstiver,benjaminp.,vikrampattanayak,michelles.prew,shengdarq.tsai,nhut.nguyen,zonglizheng,andj.keithjoung."high-fidelitycrispr–cas9nucleaseswithnodetectablegenome-wideoff-targeteffects."nature529.7587(2016):490-95.28.slaymaker,i.m.,l.gao,b.zetsche,d.a.scott,w.x.yan,andf.zhang."rationallyengineeredcas9nucleaseswithimprovedspecificity."science351.6268(2015):84-88.29.dahlman,jamese.,omaro.abudayyeh,juliajoung,jonathans.gootenberg,fengzhang,andsilvanakonermann."orthogonalgeneknockoutandactivationwithacatalyticallyactivecas9nuclease."naturebiotechnology33.11(2015):1159-161.30.fu,yanfang,etal."improvingcrispr-casnucleasespecificityusingtruncatedguidernas."naturebiotechnology32.3(2014):279-284.31.boissel,s.,j.jarjour,a.astrakhan,a.adey,a.gouble,p.duchateau,j.shendure,b.l.stoddard,m.t.certo,d.baker,anda.m.scharenberg."megatals:arare-cleavingnucleasearchitecturefortherapeuticgenomeengineering."nucleicacidsresearch42.4(2013):2591-601.32.bolukbasi,mehmetfatih,ankitgupta,sarahoikemus,alang.derr,manuelgarber,michaelh.brodsky,lihuajuliezhu,andscota.wolfe."dna-binding-domainfusionsenhancethetargetingrangeandprecisionofcas9."naturemethods12.12(2015):1150-156.33.kleinstiver,benjaminp.,etal."broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition."naturebiotechnology(2015).34.ma,enbo,etal."single-strandeddnacleavagebydivergentcrispr-cas9enzymes."molecularcell60.3(2015):398-407.35.santos-pereira,josém.,andandrésaguilera."rloops:newmodulatorsofgenomedynamicsandfunction."naturereviewsgenetics16.10(2015):583-97.36.rebhandl,stefan,michaelhuemer,richardgreil,androlandgeisberger."aid/apobecdeaminasesandcancer."oncoscience2(2015):320.37.suspene,rodolphe,etal."recoveryofapobec3-editedhumanimmunodeficiencyvirusg→ahypermutantsbydifferentialdnadenaturationpcr."journalofgeneralvirology86.1(2005):125-129.38.aynaud,marie-ming,etal."humantribbles3protectsnucleardnafromcytidinedeaminationbyapobec3a."journalofbiologicalchemistry287.46(2012):39182-39192.39.shinohara,masanobu,etal."apobec3bcanimpairgenomicstabilitybyinducingbasesubstitutionsingenomicdnainhumancells."scientificreports2(2012):806.40.holtz,colleenm.,hollya.sadler,andlouism.mansky."apobec3gcytosinedeaminationhotspotsaredefinedbybothsequencecontextandsingle-strandeddnasecondarystructure."nucleicacidsresearch(2013):gkt246.41.rebhandl,stefan,michaelhuemer,richardgreil,androlandgeisberger."aid/apobecdeaminasesandcancer."oncoscience2(2015):320.42.ear,pohien,andstephenw.michnick."agenerallife-deathselectionstrategyfordissectingproteinfunctions."naturemethods6.11(2009):813-16.43.luscombe,nicholasm.,romana.laskowski,andjanetm.thornton."aminoacid–baseinteractions:athree-dimensionalanalysisofprotein–dnainteractionsatanatomiclevel."nucleicacidsresearch29.13(2001):2860-2874.44.kim,y.bill,etal."increasingthegenome-targetingscopeandprecisionofbaseeditingwithengineeredcas9-cytidinedeaminasefusions."naturebiotechnology35.4(2017):371-376.45.rees,hollya.,etal."improvingthednaspecificityandapplicabilityofbaseeditingthroughproteinengineeringandproteindelivery."naturecommunications8(2017):ncomms15790.46.kleinstiver,benjaminp.,etal."engineeredcrispr-cas9nucleaseswithalteredpamspecificities."nature523.7561(2015):481-485.47.kleinstiver,benjaminp.,etal."broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition."naturebiotechnology33.12(2015):1293-1298.其他实施方案要理解的是虽然已经连同其详细说明一起描述了本发明,以上的描述意图说明而不是限制本发明的范围,本发明的范围由附随的权利要求的范围所定义。其他方面、优点和改变在所附权利要求的范围之内。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1