提高Cas核酸酶靶标特异性

文档序号:29575544发布日期:2022-04-09 06:34阅读:146来源:国知局
提高Cas核酸酶靶标特异性
提高cas核酸酶靶标特异性
1.本发明涉及一种修饰宿主细胞中的靶标位点的方法,其包括使所述宿主细胞与cas核酸酶接触,其中还使所述宿主细胞与低亲和力cas抑制剂和/或亚抑制浓度的cas抑制剂接触;并且涉及一种用于提高cas核酸酶的特异性的方法,其包括a)提供cas核酸酶;b)使所述cas核酸酶与低亲和力cas抑制剂或亚抑制浓度的cas抑制剂接触;和c)从而提高所述cas酶的特异性。此外,本发明涉及与之相关的组合物、多肽、用途和方法。
2.crispr(成簇规则间隔短回文重复序列)-cas技术的出现使得详细透彻的基因组研究成为可能并让遗传疾病的靶向治疗前近了一步。cas核酸酶的保真性,即与表现出与rna指导部分互补的脱靶(off-target)位点相比针对单指导(sg)rna匹配基因组靶标基因座的选择性,是crispr应用要考虑的关键参数。先前的研究采用了定向进化或结构引导的蛋白质工程来鉴定cas酶中减少脱靶编辑的点突变(例如,kulcsar et al.,genome biol 18:190(2017),kleinstiver et al.,nature 529:490-495(2016))。互补的尝试为靶标特异性sgrna的设计设计出了规则(例如,akcakayaet al.,nature 561:416-419(2018))。虽然这些策略总体上强大,但仍通常要求使用者采用特定的crispr-cas组分。
3.抗-crispr(acr)蛋白最初被鉴定为是天然存在的crispr-cas抑制剂。其中有acriia4,一种强效的化脓性链球菌(spy)cas9抑制剂,它以亚纳摩尔亲和力结合cas9-sgrna复合物并损害dna靶向以及核酸酶功能(例如,dong et al.,nature 546:436-439(2017))。最近的数据表明,在spycas9-sgrna递送后不久施用acriia4可减少脱靶编辑(shin et al,sci adv 3,e1701620(2017))。然而,这种策略需要两个单独的、精确定时的递送步骤(一个用于cas9-sgrna,一个用于acr)并还显著降低在靶(on-target)编辑效率。
4.因此,本领域需要提供可靠的手段来提高cas核酸酶靶标特异性。特别地,需要提供将至少部分避免上述现有技术缺点的手段和方法。
5.该问题通过具有独立权利要求的特征的方法、组合物和用途来解决。在从属权利要求中列出了可以单独的方式或以任何任意组合实现的优选实施方案。
6.相应地,本发明涉及一种修饰宿主细胞中的靶标位点的方法,其包括使所述宿主细胞与cas核酸酶接触,其中所述方法还包括使所述宿主细胞与低亲和力cas抑制剂和/或亚抑制浓度的cas抑制剂接触。
7.如在下文中使用的,术语“具有”、“包含”或“包括”或其任何任意语法变型以非排他方式使用。因此,这些术语既可指除了由这些术语引入的特征之外在上下文中描述的实体中不存在更多的特征的情况,也可指还存在一个或多个更多的特征的情况。作为一个实例,表达“a具有b”、“a包含b”和“a包括b”都可指其中除b外在a中不存在其他要素的情况(即,其中a仅且排他地由b组成的情况)并且可指其中除b外在实体a中还存在一个或多个更多的要素如要素c、要素c和d或甚至更多的要素的情况。
8.此外,如在下文中使用的,术语“优选地”、“更优选地”、“最优选地”、“特别地”、“更特别地”、“具体地”、“更具体地”或类似的术语与任选的特征结合使用而不限制更多的可能性。因此,由这些术语引入的特征是任选的特征而不旨在以任何方式限制权利要求的范围。本领域技术人员将认识到,本发明可通过使用替代的特征来执行。类似地,由“在一个实施
方案中”或类似的表达引入的特征旨在是任选的特征,而对本发明的更多实施方案没有任何限制,对本发明的范围没有任何限制,且对组合以这样的方式引入的特征与本发明的其他任选或非任选特征的可能性没有任何限制。
9.如本文所用,术语“标准条件”,如果没有另外说明,则指iupac标准环境温度和压力(satp)条件,即优选地,25℃的温度和100kpa的绝对压力;还优选地,标准条件包括为7的ph。而且,如果没有另外指示,则术语“约”指指示值加上相关领域中普遍接受的技术精度,优选地指指示值
±
20%,更优选
±
10%,最优选
±
5%。此外,术语“基本上”表示不存在会对指示的结果或用途有影响的偏差,即潜在的偏差不会导致指示的结果偏离超过
±
20%、更优选
±
10%、最优选
±
5%。因此,“基本上由
……
组成”指包括所指定的组分但不包括除以杂质存在的材料、因用来提供组分的过程而存在的不可避免的材料和出于实现本发明的技术效果之外的目的而添加的组分外的其他组分。例如,使用表述“基本上由
……
组成”定义的组合物涵盖任何已知的可接受的添加剂、赋形剂、稀释剂、载剂等。优选地,基本上由一组组分组成的组合物将包含小于5重量%,更优选小于3重量%,甚至更优选小于1重量%,最优选小于0.1重量%的一种或多种未指定组分。在核酸序列的上下文中,术语“基本上相同”表示至少80%,优选至少90%,更优选至少98%,最优选至少99%的%同一性值。如将理解的,术语基本上相同包括100%同一性。上述内容比照地适用于术语“基本上互补”。
10.本发明的方法可以是体外方法或体内方法。优选地,所述方法为体外方法;因此,所述方法优选为不在人体或动物体上进行的方法,更优选在分离的细胞上进行,最优选在不重新施用于人体或动物体的分离的宿主细胞上进行。还优选地,所述方法为体内方法;因此,优选地,所述方法为在人体或动物体上进行的方法。应理解,在所述方法为体内方法的情况下,它可以是治疗和/或预防如本文别处指定的疾病的方法。所述方法可包括除了上面明确提到的那些外的步骤。例如,更多的步骤可涉及例如为步骤a)提供宿主细胞,或在步骤b)之后孵育宿主细胞。而且,所述步骤中的一个或多于一个可由自动化设备执行。优选地,所述方法为特异性地修饰宿主细胞中的基因和/或修饰基因的表达,优选特异性地修饰宿主细胞中的基因的方法。还优选地,所述方法还包括使所述宿主细胞与至少一种指导rna(grna),优选地至少一种与目标靶标位点特异性结合的grna接触。为目标靶标位点设计grna的原则是技术人员已知的,例如从上文引用的文献已知。
11.如本文所用,术语“靶标位点”指包含在宿主细胞中的多核苷酸中的核酸序列,优选包含在所述宿主细胞中的基因组dna、细胞器dna或质粒中的核酸序列。优选地,靶标位点为所述宿主细胞中的独特位点,即为在宿主细胞中仅出现一次的核酸序列。优选地,靶标位点具有至少12个核苷酸,更优选至少15个核苷酸,还更优选至少18个核苷酸,最优选至少20个核苷酸的长度。优选地,靶标位点包含,更优选为可被如本文别处指定的grna识别的序列;因此,优选地,靶标位点包含与grna互补的至少15个核苷酸,优选至少18个核苷酸,更优选至少20个核苷酸的序列。应理解,靶标位点可包含在基因内;还应理解,基因通常包含多个即两个或多于两个个优选非全同的靶标位点。因此,通过修饰一个或多于一个靶标位点,可修饰靶标基因。
12.技术人员将术语“脱靶位点”理解为指多核苷酸中具有与如上文指定的靶标位点非全同的核酸序列的任何位点。因此,脱靶位点的核酸序列与靶标位点的核酸序列相差至少一个,优选至少两个,更优选至少三个核苷酸。优选地,当施用给定靶标序列的cas核酸酶
和grna时,实验表明脱靶位点在宿主细胞中被编辑;即,优选地,脱靶序列为已知的脱靶序列或预测的脱靶序列;用于预测脱靶位点的手段和方法是本领域已知的并包括例如由crispr offinder(www.rgenome.net/cas-offinder/)提供的服务。正如技术人员所理解的,术语脱靶位点的含义取决于所选的靶标位点,即,优选地,脱靶位点为特定靶标位点的脱靶位点。
13.术语“修饰靶标位点”和“修饰靶标基因”指包括在靶标位点处向多核苷酸中至少引入双链断裂和/或修饰靶标位点或靶标基因的结合状态的修饰。优选地,与在不使所述cas核酸酶与低亲和力cas抑制剂或亚抑制浓度的cas抑制剂接触的情况下脱靶修饰的频率相比,在本文指定的方法中,脱靶修饰的频率为至多1/2,优选至多1/3,更优选至多1/10,最优选至多1/15。
14.优选地,修饰靶标位点和修饰靶标基因包括修饰靶标位点或靶标基因的结合状态。如本文中与靶标位点或靶标基因结合所用,术语“结合状态”指优选在宿主细胞中与所述靶标位点或靶标基因结合的分子,特别是多肽的种类和数量。优选地,靶标位点或靶标基因的结合状态的修饰包括优选在grna的介导下cas核酸酶与所述靶标位点或靶标基因的结合,优选地优选在grna的介导下cas核酸酶与所述靶标位点或靶标基因的特异性结合;优选地,在这样的情况下,cas核酸酶为非催化突变蛋白,即,优选地,为与靶标位点结合但不切割包含所述靶标位点的多核苷酸的cas核酸酶变体;更优选地,在这样的情况下,cas核酸酶为与转录激活结构域、转录抑制结构域、dna甲基转移酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶、组蛋白甲基转移酶、组蛋白脱甲基酶和/或dna碱基修饰酶,特别是胞苷脱氨酶或腺嘌呤碱基修饰酶融合或非共价缔合的非催化突变蛋白。转录激活结构域和转录抑制结构域是本领域公知的。因此,优选地,靶标位点或靶标基因的结合状态的修饰是将调节性多肽,优选激活因子结构域或抑制因子结构域与靶标位点或靶标基因隔离。
15.更优选地,靶标位点或靶标基因的修饰包括在靶标位点处向多核苷酸中至少引入双链断裂。优选地,所述修饰还包括引入突变,特别是插入或缺失。还优选地,术语修饰靶标基因还包括将所述靶标基因的部分或完整核酸序列交换为非全同的核酸序列,优选交换为不同的等位基因的序列,更优选交换为不会引起疾病的等位基因。优选地,靶标位点的编辑频率(即,通过在靶标位点处向多核苷酸中引入至少双链断裂的修饰频率)与任何脱靶位点的编辑频率的比为至少2,优选至少5,更优选至少7,还更优选至少10,还更优选至少15,甚至更优选至少18,最优选至少20。
16.如本文所用,术语“宿主细胞”指包含dna多核苷酸,优选作为基因组的任何细胞。优选地,该术语涉及包含由cas核酸酶修饰靶标位点所需的对于该通路常规存在的所有组分的宿主细胞;即,优选地,在提供cas核酸酶和包含与靶标位点互补的序列的grna的情况下,预期会在宿主细胞中发生rna干扰。优选地,所述细胞为细菌细胞,更优选本领域已知的普通实验室细菌菌株的细胞,最优选埃希氏菌属菌株,特别是大肠杆菌菌株。还优选地,宿主细胞为真核细胞,优选植物或酵母细胞,例如,面包酵母菌株的细胞,或者是动物细胞。更优选地,宿主细胞为昆虫细胞或哺乳动物细胞。甚至更优选地,宿主细胞为哺乳动物细胞,特别是人、小鼠或大鼠细胞,最优选地为人细胞。然而,还设想宿主细胞为植物细胞,优选双子叶植物或单子叶植物的,更优选作物植物的,特别是玉米、水稻、小麦、黑麦或大豆。
17.如本文所用,术语“crispr相关内切核酸酶”和“cas核酸酶”二者同等地指识别如
本文指定的grna的内切核酸酶,优选内切dna酶或内切rna酶,更优选内切dna酶,其原则上是本领域已知的。优选地,cas核酸酶为ii型crispr内切核酸酶。优选地,cas核酸酶为来自普雷沃氏菌的crispr内切核酸酶和弗朗西斯菌内切核酸酶,即cpf1内切核酸酶。更优选地,crispr内切核酸酶为cas9内切核酸酶。优选地,cas9核酸酶为来自金黄色葡萄球菌的cas9内切核酸酶或为来自化脓性链球菌的cas9内切核酸酶,更优选为来自化脓性链球菌的cas9内切核酸酶。优选地,cas核酸酶具有如seq id no:1中所示的氨基酸序列,优选由如seq id no:2中所示的核酸序列编码。
18.如本文所用,术语“cas抑制剂”指与在不存在所述cas抑制剂的情况下的cas核酸酶的活性相比,导致所述cas核酸酶活性降低的化合物,优选多肽。因此,技术人员能够通过比较在存在和不存在所述候选化合物的情况下cas核酸酶的活性来确立是cas抑制剂的候选化合物。优选地,cas抑制剂为acr多肽。术语“抗-crispr多肽”和“acr多肽”是技术人员已知的并且同等地指具有抑制至少一种cas核酸酶,优选地cas9核酸酶的前述活性的多肽。acr多肽及其鉴定方法是本领域已知的,例如从pawluk et al.(2016),cell 167(7):1829和从rauch et al.(2017),cell 168(1-2):150已知。还应理解,优选地,本发明的acr多肽选择为使得其抑制所使用的cas核酸酶。因此,例如如果使用来自化脓性链球菌的cas9内切核酸酶来进行靶标位点修饰,则可使用单核细胞增生李斯特菌原噬菌体或嗜热链球菌烈性噬菌体的acr多肽。因此,优选地,acr多肽为单核细胞增生李斯特菌原噬菌体的acr多肽,更优选为acriia2或acriia4多肽,最优选为acriia4多肽。优选地,acr多肽包含如seq id no:3中所示的氨基酸序列,优选由其组成,更优选由包含如seq id no:4中所示的序列,优选由其组成的核酸序列编码。
19.根据上文,术语“低亲和力cas抑制剂”指对cas核酸酶具有降低的亲和力的如上指定的cas抑制剂。优选地,当在cas活性测定中以与cas核酸酶等摩尔量存在时,低亲和力cas抑制剂将抑制靶标位点修饰达至多50%,优选至多40%,更优选至多30%,甚至更优选至多20%,最优选至多10%。cas活性测定是本领域已知的并特别包括在下文提供的实施例中示出的那些。优选地,低亲和力cas抑制剂为如上文指定的cas抑制剂的衍生物,术语“衍生物”在低亲和力cas抑制剂的上下文中指与其所衍生自的cas抑制剂具有至少50%,优选至少75%,更优选至少90%,最优选至少95%的序列同一性的多肽。因此,为低亲和力cas抑制剂的衍生物优选为cas抑制剂的突变蛋白或融合多肽。优选地,低亲和力cas抑制剂对cas核酸酶具有相应的cas抑制剂的0.01%至90%,优选0.1至50%,更优选0.5%至25%,还更优选1%至10%的亲和力。
20.优选地,cas抑制剂为acr多肽,优选为acriia4多肽。因此,优选地,低亲和力cas抑制剂为如上指定的acr多肽,优选acriia4多肽的衍生物。因此,优选地,低亲和力cas抑制剂为acr多肽,优选acriia4多肽的衍生物,如上文所指定对cas核酸酶,优选cas9核酸酶具有相应的acr多肽,优选相应的acriia4多肽的0.01%至90%,优选0.1至50%,更优选0.5%至25%,还更优选1%至10%的亲和力。优选地,低亲和力cas抑制剂为acriia4多肽的突变蛋白,其包含至少一个选自以下列表的突变:(i)m77a;(ii)d76a/m77a;(iii);(iv)d14a;(v)d14a/y15a;(vi)d14a/g38a;(vii)g38a;(viii)d37a/g38a;(ix)d14a/g38a;(x)氨基酸n64/q65/e66的缺失和lov-结构域的插入;(xi)氨基酸n64/q65/e66的缺失;(xii)包含t406a、t407a、g528a和n538e突变(位置与来自燕麦的全长向光素-1蛋白有关)的lov-结构域的插
入;和(xiii)(i)至(xii)的任意组合。如技术人员应理解的,所示的氨基酸编号对应于acriia4多肽中的氨基酸编号,优选如seq id no:3中所示。更优选地,低亲和力cas抑制剂为包含至少一个选自以下列表的突变的acriia4多肽的突变蛋白:(i)n39a;(ii)d14a/g38a;(iii)氨基酸n64/q65/e66的缺失及包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(iv)(i)至(iii)的任意组合。因此,优选地,低亲和力cas抑制剂包含seq id no:5的氨基酸序列、优选由seq id no:5的氨基酸序列组成,优选由如seq id no:6中示出的核酸序列编码;包含seq id no:7的氨基酸序列,优选由seq id no:7的氨基酸序列组成,优选由如seq id no:8中示出的核酸序列编码;或包含seq id no:9的氨基酸序列,优选由seq id no:9的氨基酸序列组成,优选由如seq id no:10中示出的核酸序列编码。
21.如本文所用,术语“lov-结构域”指光-氧-或电压(lov)结构域,其原则上是技术人员已知的;优选地,lov-结构域为lov2结构域,优选来自燕麦或拟南芥向光素-1,更优选来自燕麦。优选地,lov-结构域具有如seq id no:11中示出的氨基酸序列或与所述序列至少70%,优选至少80%,更优选至少90%,最优选至少95%相同的序列;更优选地,lov-结构域具有如seq id no:11中示出的氨基酸序列,优选由如seq id no:12中示出的核酸序列编码。优选地,lov-结构域插入到acr的表面暴露环中,优选在对应于acriia4多肽的氨基酸62至69中之一的插入位点处,即优选对应于seq id no:3的氨基酸62至69中之一。如本文所用,表达“对应于氨基酸x的插入位点”指在常规的n-末端至c-末端标记系统中的氨基酸x之后的插入;因此,例如对应于氨基酸63的插入位点指在氨基酸63和64之间的插入。还更优选地,lov-结构域被插入到acr中,替换对应于acriia4多肽的氨基酸62至69中之一的至少一个氨基酸。优选地,至少一个,更优选至少两个,更优选至少三个,最优选三个氨基酸被替换。更优选地,对应于seq id no:3的氨基酸64至67的至少一个、两个或三个氨基酸被替换,更优选对应于seq id no:3的氨基酸64至67的三个氨基酸被替换。最优选地,lov-结构域被插入到acr中,替换对应于seq id no:3的氨基酸64至68的氨基酸。
22.技术人员应将术语“接触”理解为指使所指示的化合物物理接近以允许组分相互作用。优选地,接触包括使化合物混合存在于溶液中,优选水溶液中。更优选地,接触包括使所指示的化合物进入宿主细胞中或在宿主细胞中表达。还优选地,接触还包括使化合物转移至宿主细胞内的相关隔室,优选真核宿主细胞的细胞核,例如通过将核定位序列(nls)与化合物融合。相应地,可通过允许cas核酸酶和cas抑制剂相互作用的任何方法来实现cas核酸酶与(低亲和力)cas抑制剂的接触,优选在宿主细胞中,更优选在宿主细胞的相关隔室中,最优选在宿主细胞的细胞核中。
23.优选地,cas核酸酶和cas抑制剂在宿主细胞中共表达,即,优选地,提供至少一种包含编码cas核酸酶的核酸序列和编码cas抑制剂的核酸序列的多核苷酸,两种核酸序列均呈可表达形式。更优选地,在两种非全同的多核苷酸上以可表达形式提供编码cas核酸酶的核酸序列和编码cas抑制剂的核酸序列。因此,优选地,共表达来自两种不同的表达构建体,这两种表达构建体可随后或优选同时引入到细胞中。向宿主细胞中引入多核苷酸,特别是表达构建体,可通过技术人员认为适宜的任何方法来实现,例如通过转染到宿主细胞中或通过用适宜的病毒载体感染宿主细胞。
24.如本文所用,术语“多核苷酸”是指线形或环状核酸分子。该术语涵盖单链以及部分或完全双链的多核苷酸。优选地,多核苷酸为rna或dna,包括cdna。而且,还包括经化学修
饰的多核苷酸,包括天然存在的经修饰的多核苷酸如糖基化或甲基化的多核苷酸或经人工修饰的衍生物如生物素化的多核苷酸。本发明的多核苷酸应优选作为分离的多核苷酸(即从其天然环境中分离)或以遗传修饰形式提供。如本文所指定的多核苷酸优选包含至少一个异源序列,即包含来自至少两个不同物种的序列。优选地,所述来自两个不同物种的序列为编码如本文别处指定的acr多肽和cas核酸酶的序列。还优选地,多核苷酸包含至少一个相对于哺乳动物细胞,优选人类细胞的异源序列,即包含至少一个不知道会或不会在哺乳动物细胞,优选人类细胞中出现的核酸序列。优选地,所述相对于哺乳动物细胞的异源序列至少是编码acr多肽的序列。
25.本发明的多核苷酸具有编码cas核酸酶和/或cas抑制剂,特别是低亲和力cas抑制剂的活性。更优选地,多核苷酸编码如本文别处指定的cas核酸酶/低亲和力cas抑制剂融合多肽。优选地,多核苷酸包含seq id no:2、4、6、8和10中至少之一的核酸序列,更优选为编码包含seq id no:15至28中至少之一的氨基酸序列的融合多肽的多核苷酸。如本文所用,术语多核苷酸优选包括具体指示的多核苷酸的变体。更优选地,术语多核苷酸指所指示的特定多核苷酸。技术人员知道如何选择编码具有特定氨基酸序列的多肽的多核苷酸,也知道如何根据用于表达所述多核苷酸的生物体的密码子使用来优化多核苷酸中使用的密码子。如本文所用,术语“多核苷酸变体”指与本文相关的多核苷酸的变体,其包含特征在于序列可通过至少一个核苷酸置换、添加和/或缺失而从前述特定的核酸序列衍生得到的核酸序列,其中所述多核苷酸变体应具有针对特定的多核苷酸指定的活性。因此,应理解,如根据本发明提及的多核苷酸变体应具有由于至少一个核苷酸置换、缺失和/或添加而与原始多核苷酸不同的核酸序列。优选地,所述多核苷酸变体包含特定多核苷酸或其功能性子序列的直系同源物、旁系同源物或另一同源物,所述功能性子序列有例如编码cas核酸酶、cas抑制剂多肽和/或融合多肽的序列。还优选地,所述多核苷酸变体包含特定多核苷酸或其功能性子序列的天然存在的等位基因。在多核苷酸变体的上下文中,如本文所用,术语“功能性子序列”指介导如本文别处指定的活性的多核苷酸的序列的一部分。多核苷酸变体还涵盖包含能够与前述特定的多核苷酸或其功能性子序列杂交的核酸序列的多核苷酸,优选地,在严格杂交条件下。这些严格条件是技术人员已知的并可见于current protocols in molecular biology,john wiley & sons,n.y.(1989),6.3.1-6.3.6中。严格杂交条件的一个优选实例为在大约45℃下在6x氯化钠/柠檬酸钠(=ssc)中,然后在50至65℃下在0.2x ssc、0.1%sds中进行一个或多个洗涤步骤的杂交条件。技术人员知道,这些杂交条件随核酸的类型而异,并在例如存在有机溶剂时在温度和缓冲液的浓度方面也不同。例如,在“标准杂交条件”下,温度随核酸的类型而异,在42℃至58℃之间,水性缓冲液浓度为0.1x至5x ssc(ph 7.2)。如果前述缓冲液中存在有机溶剂,例如50%的甲酰胺,则标准条件下的温度为大约42℃。dna:dna杂交体的杂交条件优选为例如0.1x ssc和20℃至45℃,优选在30℃至45℃之间。dna:rna杂交体的杂交条件优选为例如0.1x ssc和30℃至55℃,优选在45℃至55℃之间。前述杂交温度为例如针对长度为大约100bp(=碱基对)且g+c含量为50%的核酸在不存在甲酰胺的情况下所确定。技术人员通过参考标准教科书会知道如何确定所需的杂交条件。替代地,多核苷酸变体可通过基于pcr的技术获得,如基于混合寡核苷酸引物的dna扩增,即使用针对本发明的多肽的保守结构域的简并引物。多肽的保守结构域可通过本发明的多核苷酸的核酸序列或多肽的氨基酸序列与其他生物体的序列的序列比较来鉴定。作为
模板,可使用来自细菌、真菌、植物或优选来自动物的dna或cdna。此外,变体包括包含与特定指示的核酸序列或其功能性子序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%相同的核酸序列的多核苷酸。而且,还涵盖包含编码与特定指示的氨基酸序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%相同的氨基酸序列的核酸序列的多核苷酸。优选地,在整个氨基酸或核酸序列区域上计算同一性百分数值。技术人员可使用基于各种算法的一系列程序来比较不同的序列。在此背景下,needleman和wunsch或smith和waterman的算法给出特别可靠的结果。为了进行序列比对,使用程序pileup(j.mol.evolution.,25,351-360,1987,higgins et al.,cabios,5 1989:151-153)或程序gap and bestfit(needleman and wunsch(j.mol.biol.48;443-453(1970))和smith and waterman(adv.appl.math.2;482-489(1981))),其是gcg软件包(genetics computer group,575science drive,madison,wisconsin,usa 53711(1991))的一部分。上面以百分数(%)记载的序列同一性值优选在整个序列区域上使用程序gap用以下设置确定:间隔权重:50,长度权重:3,平均匹配:10.000,平均错配:0.000,除非另有说明,否则应始终使用这些设置作为序列比对的标准设置。
26.包含任何特定指示的核酸序列的片段的多核苷酸也作为一种变体多核苷酸而涵盖,所述多核苷酸保留所指示的一种或多于一种活性。如本文所指的片段优选包含任何一个特定核酸序列的至少100个,优选至少200个,更优选至少250个连续核苷酸或编码包含任何一个特定氨基酸序列的至少50个,优选至少60个,更优选至少75个连续氨基酸的氨基酸序列。
27.本发明的多核苷酸由前述核酸序列组成、基本上由前述核酸序列组成或包含前述核酸序列。因此,它们也可含有更多的核酸序列。具体而言,本发明的多核苷酸可编码还包含融合伴侣的融合蛋白,特别是本文别处指定的那些。融合蛋白可作为另外的部分包含用于监测表达(例如,绿色、黄色、蓝色或红色荧光蛋白、碱性磷酸酶等)的多肽或可充当可检测标志物或充当用作纯化目的的辅助措施的所谓“标签”。用于不同目的的标签是本领域公知的并在本文别处描述。优选地,多核苷酸编码与核定位序列(nls)融合的多肽。优选地,多核苷酸还包含编码cas核酸酶的至少一个片段的核酸序列,优选如本文别处所指定;还优选地,多核苷酸不包含编码cas核酸酶的至少一个片段的核酸序列。
28.优选地,多核苷酸为rna。更优选地,多核苷酸为包含可表达为连续rna的核酸序列的dna,所述连续rna包含编码多肽或融合多肽的所述序列。优选地,在多核苷酸为dna的情况下,多核苷酸与允许在原核或真核,优选真核宿主细胞或其分离部分中表达的表达控制序列有效连接,即优选地,多核苷酸为表达构建体。所述多核苷酸的表达包括多核苷酸的转录,优选转录为可翻译的mrna。确保在真核细胞,优选哺乳动物细胞中表达的调控元件是本领域公知的。它们优选地包含确保转录的起始的调控序列和任选地确保转录的终止和转录本的稳定的poly-a信号。另外的调控元件可包括转录增强子以及翻译增强子。允许在真核宿主细胞中表达的调控元件的实例有酵母中的aox1或gal1启动子或smvp-、cmv-efs-、sv40-或rsv-启动子(劳斯肉瘤病毒)、cmv-增强子、sv40-增强子或哺乳动物和其他动物细胞中的球蛋白内含子。此外,本发明的多核苷酸中可包含诱导型或细胞类型特异性表达控制序列。诱导型表达控制序列可包含tet或lac操纵子序列或由热休克或其他环境因素诱导的序列。合适的表达控制序列是本领域公知的。除了负责转录的起始的元件外,这样的调控
元件还可包含转录终止信号,如多核苷酸下游的sv40-poly-a位点或tk-poly-a位点。
29.优选地,使cas核酸酶与亚抑制浓度的cas抑制剂接触包括cas核酸酶和cas抑制剂在宿主细胞中的共表达,其中调节cas核酸酶∶cas抑制剂的比使得cas核酸酶的活性显著降低,但cas核酸酶不被完全抑制。因此,优选地,使所述cas核酸酶与亚抑制浓度的cas抑制剂接触包括使所述cas核酸酶与cas抑制剂以10∶1至1∶1,优选8∶1至1.5∶1,更优选6∶1至1.75∶1,甚至更优选5∶1至2∶1,还更优选4∶1至2.2∶1,最优选约3∶1的cas核酸酶∶cas抑制剂摩尔比接触。优选地,前述比率通过提供具有不同表达程度的两种表达构建体来调节,例如通过使用在宿主细胞中具有不同活性的启动子。任选地,在这样的情况下,所述启动子中的一者或两者可以是可调节的。更优选地,cas核酸酶和cas抑制剂由相似的表达构建体表达,所述相似的表达构建体优选包含具有基本上相同的强度的启动子,更优选包含相同的启动子。优选地,使cas核酸酶与亚抑制浓度的cas抑制剂接触包括使所述cas核酸酶与cas抑制剂以10∶1至1∶1,优选8∶1至1.5∶1,更优选6∶1至1.75∶1,甚至更优选5∶1至2∶1,还更优选4∶1至2.2∶1,最优选约3∶1的表达构建体摩尔比,优选地载体摩尔比、cas核酸酶∶cas抑制剂摩尔比接触。使cas核酸酶与亚抑制浓度的cas抑制剂接触还可包括使所述cas核酸酶与低亲和力cas抑制剂接触;如技术人员将理解的,在这样的情况下,前述摩尔比可能需要调节,优选需要降低,以补偿低亲和力cas抑制剂与cas抑制剂相比的更低活性。
30.优选地,使cas核酸酶与低亲和力cas抑制剂接触包括提供cas核酸酶与低亲和力cas抑制剂之间的复合物或融合多肽。优选地,在提供包含cas核酸酶和低亲和力cas抑制剂的复合物的情况下,复合物cas核酸酶/低亲和力cas抑制剂的解离常数(kd)为至多10-6
m,优选至多10-7
m,更优选至多10-8
m,最优选至多10-9
m;适宜的kd值可例如通过将cas核酸酶和低亲和力cas抑制剂融合到高亲和力分子对的各个组分上来实现,如在strep-tag系统中或在抗体/抗原复合物中。更优选地,使cas核酸酶与低亲和力cas抑制剂接触包括提供所述cas核酸酶与所述低亲和力cas抑制剂的融合多肽,优选经由接头肽,更优选经由包含gs和/或gg的接头,优选包含ggsg(seq id no:13)的接头,更优选(ggsg)
n-接头,其中n为1至100的整数,优选2至50的整数,更优选3至25的整数,甚至更优选为约10,最优选为10。最优选地,接头具有氨基酸序列ggsgggsgggsgggsgggsgggsgggsgggsgggsgggsg(seq id no:14)。因此,优选地,使cas核酸酶与低亲和力cas抑制剂接触包括在融合多肽中以1∶1的摩尔比提供cas核酸酶和低亲和力cas抑制剂。优选地,cas核酸酶与低亲和力cas抑制剂的n-末端融合,即优选地,融合多肽中的序列为cas核酸酶-低亲和力cas抑制剂。优选地,融合多肽中的cas核酸酶和/或低亲和力cas抑制剂为如上文指定的那些。更优选地,融合多肽中的cas核酸酶和低亲和力cas抑制剂为如上文指定的那些。最优选地,在这样的情况下,融合多肽为包含(i)cas核酸酶和(ii)如下文指定的低亲和力cas抑制剂的多肽。
31.有利地,在本发明的基础工作中发现,可以将cas核酸酶的脱位活性与靶标活性(即,在靶活性)在动力学上进行分离,并且通过降低cas活性,特别是通过使cas核酸酶与亚抑制活性的cas抑制剂接触或通过使cas核酸酶与低亲和力cas抑制剂接触,脱靶活性可降低超过一个数量级,而仅适度降低靶标活性。
32.上述定义比照地适用于以下内容。下面进一步作出的附加定义和解释也比照地适用于本说明书中描述的所有实施方案。
33.本发明还涉及一种组合物,其包含cas核酸酶和(i)低亲和力cas抑制剂和/或(ii)
亚抑制浓度的cas抑制剂或者引起宿主细胞中cas核酸酶和(i)低亲和力cas抑制剂和/或(ii)亚抑制浓度的cas抑制剂的表达。
34.术语“组合物”是技术人员理解的。优选地,该术语涉及包含至少所指示的组分,优选由至少所指示的组分组成的物质组合物。优选地,组合物包含cas核酸酶和低亲和力cas抑制剂,优选地以如上文指定的复合物或融合多肽,更优选地以融合多肽。还优选地,组合物包含cas核酸酶和亚抑制浓度的cas抑制剂;因此,在这样的情况下,相应地调节化合物的相对浓度,优选如上文所指定。组合物优选包含所指示的多肽。更优选地,组合物包含多核苷酸,优选地引起所指示的组分在宿主细胞中的表达的表达构建体。优选地,组合物以预先调整的,优选即用的方式包含组分,特别是具有所述相对量的cas核酸酶和cas抑制剂或使得其表达得到预先调节的多核苷酸。组合物还可包含额外的化合物,特别是增溶手段如溶剂,比如水、盐、转染剂、至少一种grna等。优选地,额外的组分选择为不干扰所指示的组分的活性。优选地,组合物为药物组合物。
35.如本文所用,术语“药物组合物”指包含如所指定的化合物和任选地一种或多种药学上可接受的载剂的组合物,优选生产和混合以使该组合物适合于药物用途。因此,化合物优选在药品生产质量管理规范(gmp)的条件下生产和/或混合。本发明的化合物可配制为药学上可接受的盐。可接受的盐是本领域已知的并优选包括乙酸盐、硫酸盐、氯化物盐等。药物组合物优选局部或全身施用。常规用于药物施用的合适施用途径为口服、静脉内或肠胃外施用以及吸入。然而,取决于化合物的性质和作用方式,药物组合物也可通过其他途径施用。例如,可通过使用病毒载体或病毒或脂质体在基因治疗方法中施用多核苷酸化合物,如本文别处所指定的。此外,所述化合物可以普通药物组合物或作为分离的药物组合物与其他药物组合施用,其中所述分离的药物组合物可以各部分的试剂盒的形式提供。化合物优选以通过根据常规程序将药物与标准药物载剂组合而制备的常规剂型施用。这些程序可能涉及混合、制粒和压缩或溶解适用于所需制剂的成分。应理解,药学上可接受的载剂或稀释剂的形式和特性由与其组合的活性成分的量、施用的途径和其他公知的变量决定。
36.在与制剂的其他成分相容并且对其接受者无害的意义上,载剂必须是可接受的。所采用的药物载剂可以是例如固体、凝胶或液体。固体载剂的示例有乳糖、白土、蔗糖、滑石、明胶、琼脂、果胶、阿拉伯树胶、硬脂酸镁、硬脂酸等。液体载剂的示例有磷酸盐缓冲盐水溶液、糖浆、油如花生油和橄榄油、水、乳液、各种类型的润湿剂、无菌溶液等。类似地,载剂或稀释剂可包括本领域公知的延迟材料,如单硬脂酸甘油酯或二硬脂酸甘油酯,单独地或与蜡一起。所述合适的载剂包括上述那些及本领域公知的其他载剂,参见例如remington

s pharmaceutical sciences,mack publishing company,easton,pennsylvania。所述一种或多种稀释剂选择为不影响组合的生物活性。这样的稀释剂的实例有蒸馏水、生理盐水、林格氏溶液、右旋糖溶液和汉克氏溶液。另外,药物组合物或制剂还可包含其他载剂、佐剂或无毒、非治疗性、非免疫原性的稳定剂等。
37.治疗有效剂量是指待用于预防、改善或治疗伴随本说明书中提及的疾病或病况的症状的本发明药物组合物中的化合物的量。这样的化合物的治疗功效和毒性可通过标准药物程序在细胞培养物或实验动物中确定,例如,ed50(对50%的群体治疗有效的剂量)和ld50(对50%的群体致死的剂量)。治疗作用和毒性作用之间的剂量比为治疗指数,它可以比率ld50/ed50表示。给药方案将由主治医师和其他临床因素决定;优选根据上述方法中的
任何一种。正如医学领域所公知的,任何一名患者的剂量取决于许多因素,包括患者的体型、体表面积、年龄、待施用的特定化合物、性别、施用时间和途径、一般健康状况及其他同时施用的药物。可通过定期评估来监测进展。典型的剂量可例如在1至1000μg的范围内;然而,预想到低于或高于该示例性范围的剂量,尤其是在考虑到前述因素时。通常,作为药物组合物的常规施用的方案应在每天1μg至10mg单位的范围内。如果方案为连续输注,则其也应分别在每千克体重每分钟1μg至10mg单位的范围内。可通过定期评估来监测进展。然而,取决于对象和施用的方式,物质施用的量可在宽范围内变化以提供每kg体重约0.01mg至每kg体重约10mg。在施用病毒载体、特别是腺相关病毒载体的情况下,优选的剂量为5x10
11
至2x10
13
个病毒颗粒或病毒基因组/kg体重;如应理解的,除了上述因素外,还可根据附加的因素如病毒的类型、靶器官等来修改这些示例性剂量。优选地,调节剂量使得向打算施用的宿主细胞中的至少25%,更优选至少50%,最优选至少75%提供组分,特别是cas核酸酶和cas抑制剂。本文提及的药物组合物和制剂被施用至少一次以治疗或改善或预防本说明书中记载的疾病或病况。然而,所述药物组合物可施用不止一次,例如每天一至四次,上至不受限制的天数。
38.具体的药物组合物以药学领域中公知的方式制备并至少包括使如上文所提及的一种或多种活性化合物与药学上可接受的载剂或稀释剂混合或以其他方式结合。为了制备那些特定的药物组合物,通常将一种或多于一种活性化合物与载剂或稀释剂混合,或者包封或胶囊化在胶囊、香囊、扁囊、纸或其他合适的容器或媒介物中。所得制剂将采取施用的方式,即呈片剂、胶囊剂、栓剂、溶液剂、混悬剂等形式。剂量建议应在处方者或使用者的说明书中指明以便根据有所考虑的接受者预测剂量调节。
39.本发明还涉及包含(i)cas核酸酶和(ii)低亲和力cas抑制剂的多肽或多肽复合物。
40.如上文所指示,包含(i)cas核酸酶和(ii)低亲和力cas抑制剂的多肽优选为融合多肽。如本文所用,术语“多肽”和“融合多肽”优选涵盖所述多肽和融合多肽的变体,术语“多肽变体”和“融合多肽变体”指包含至少一种如本文别处指定的多肽或融合多肽的任何化学分子,其具有所指示的活性,但与上文指示的所述多肽或融合多肽的一级结构不同。因此,多肽变体优选为具有所指示的活性的突变蛋白。优选地,多肽变体包含具有对应于如上指定的多肽中包含的20至1000个,更优选50至500个,甚至更优选100至250个连续氨基酸的氨基酸序列的氨基酸序列的肽。此外,还涵盖前述多肽的其他(融合)多肽变体。这样的(融合)多肽变体具有与特定多肽至少基本上相同的生物活性。此外,应理解的是,如根据本发明提及的(融合)多肽变体应具有由于至少一个氨基酸置换、缺失和/或添加而不同的氨基酸序列,其中所述变体的氨基酸序列仍优选与特定(融合)多肽的氨基酸序列至少50%、60%、70%、80%、85%、90%、92%、95%、97%、98%或99%相同。两个氨基酸序列之间的同一性程度可通过本领域公知的算法来确定。优选地,通过在比较窗口上比较两个最佳比对的序列来确定同一性程度,其中比较窗口中的氨基酸序列片段与和其最佳比对所比较的序列相比可能包含添加或缺失(例如,间隔或多出(overhang))。计算百分数的做法是,优选在多肽的全长上确定两个序列中出现相同氨基酸残基的位置数以产生匹配位置数,然后将匹配位置数除以比较窗口中的总位置数并将结果乘以100而产生序列同一性的百分数。用于比较的序列的最佳比对可通过下述方法进行:smith和waterman(1981)的局部同源性算法,
needleman和wunsch(1970)的同源性比对算法,pearson和lipman(1988)的搜索相似性方法,这些算法的计算机化实现(威斯康星遗传学软件包中的gap、bestfit、blast、pasta和tfasta,genetics computer group(gcg),575science dr.,madison,wi),或目视检查。鉴于已鉴定两个序列用于比较,故优选采用gap和bestfit来确定它们的最佳比对和因此同一性程度。优选地,对于间隔权重使用5.00的缺省值,而对于间隔权重长度(gap weight length)使用0.30的缺省值。本文提及的(融合)多肽变体可以是等位基因变体或任何其他物种特异性同源物、旁系同源物或直系同源物。此外,本文提及的(融合)多肽变体包括特定多肽的片段或前述类型的(融合)多肽变体,只要这些片段和/或变体具有如上文提及的生物学活性即可。这样的片段可以是或可源自例如多肽的降解产物或剪接变体。还包括由于翻译后修饰如磷酸化、糖基化、泛素化、sumo化或十四烷基化、因引入非天然氨基酸和/或因成为肽模拟物而不同的变体。优选地,包含(i)cas核酸酶和(ii)低亲和力cas抑制剂的多肽或多肽复合物包含如上文指定的cas核酸酶和/或如上文指定的低亲和力cas抑制剂。更优选地,包含(i)cas核酸酶和(ii)低亲和力cas抑制剂的多肽为包含如上文指定的cas核酸酶和/或如上文指定的低亲和力cas抑制剂,优选由如上文指定的cas核酸酶和/或如上文指定的低亲和力cas抑制剂组成的融合多肽。更优选地,多肽包含seq id no:15至28中的至少之一的氨基酸序列。
41.本发明还涉及根据本发明的组合物或根据本发明的多肽或多肽复合物用于医学中;和/或用于治疗和/或预防遗传疾病、神经变性病、癌症和/或传染病中。
42.本发明的手段和方法原则上可用于治疗和/或预防每一种其中细胞,优选特定类型的细胞的遗传或表观遗传修饰或靶标基因的表达的修饰被认为有益的疾病。在遗传疾病、神经变性病、癌症和传染病中,情况尤其如此。如本文所用,术语“遗传修饰”优选包括在给定的时间包含在宿主细胞中的任何种类的核酸的修饰,包括核dna、细胞器dna(线粒体dna或质体dna),但也包括来自传染因子的核酸,或作为游离核酸或与宿主细胞的dna共价连接的核酸。优选地,遗传修饰为宿主细胞的细胞核中存在的核酸、优选dna的修饰。更优选地,遗传修饰为宿主细胞的细胞核中存在的至少一种基因的核酸序列的修饰。
43.术语“治疗”是指在显著程度上改善本文提及的疾病或病症或伴随其的症状。如本文所用的所述治疗还包括在本文提及的疾病或病症方面完全恢复健康。应理解,根据本发明使用的治疗可能不对所有待治疗的对象都有效。然而,该术语应要求,优选地,统计学显著部分的患有本文提及的疾病或病症的对象可被成功治疗。本领域技术人员可使用各种公知的统计评估工具例如置信区间的确定、p-值确定、学生t-检验、mann-whitney检验等毫不费力地确定一个部分是否是统计学显著的。优选的置信区间为至少90%、至少95%、至少97%、至少98%或至少99%。p-值优选为0.1、0.05、0.01、0.005或0.001。优选地,治疗应对给定队列或群体中至少10%、至少20%、至少50%、至少60%、至少70%、至少80%或至少90%的对象有效。
44.术语“预防”是指在对象中在本文提及的疾病或病症方面保持健康达一定的时间段。应理解的是,所述时间段取决于对象的多种个体因素和具体的预防性治疗。应理解的是,预防可能不对所有用根据本发明的化合物治疗的对象都有效。然而,该术语要求,优选地,队列或群体中统计学显著部分的对象被有效地预防患上本文提及的疾病或病症或其伴随症状。优选地,在此上下文中设想对象的队列或群体,其通常,即在没有根据本发明的预
防措施的情况下,会发生如本文提及的疾病或病症。本领域技术人员可使用本说明书中别处讨论的各种公知的统计评估工具毫不费力地确定一个部分是否是统计学显著的。
45.如本文所用,术语“遗传疾病”指与个体的基因组中的一种或多于一种修饰,优选突变有因果关系的疾病。因此,优选地,遗传疾病与一种或多于一种表观遗传变化有因果关系,更优选与一种或多于一种基因突变有因果关系。优选地,遗传疾病为单基因疾病,即病症及其症状基本上是由一个基因中的遗传变化引起的。应理解的是,遗传疾病的症状常常由突变基因的表达和/或在一种或多于一种特定组织和/或细胞类型中提供基因产物的正常功能的基因的表达的缺失引起。因此,通过cas活性仅对那些突变导致疾病的细胞进行遗传修饰可能更可取。优选地,遗传疾病为杜氏肌营养不良症、亨廷顿病、血友病a/b、囊性纤维化、肌管性肌病、糖原贮积症或镰状细胞性贫血,其原因和症状是技术人员从医学教科书已知的。
46.术语“神经变性病”指由个体的周围和/或中枢神经系统中神经元的结构和/或功能的逐步丧失引起的疾病。优选地,神经变性病为运动神经元的神经变性病和/或中枢神经系统的神经变性病。优选地,神经变性病为阿尔茨海默氏病、肌萎缩性侧索硬化(als)、帕金森氏病或脊髓小脑共济失调,优选脊髓小脑共济失调1型(sca1)。应理解,许多神经变性病为遗传疾病。
47.术语“癌症”原则上是技术人员理解的并指以一组体细胞(“癌细胞”)不受控制的生长为特征的动物(包括人)疾病。这种不受控制的生长可能伴随着向周围组织中的入侵和周围组织的破坏以及癌细胞向身体中其他部位的可能扩散。优选地,术语癌症还包括复发。因此,优选地,癌症为非实体癌,例如,白血病,或者为实体癌的肿瘤、转移或其复发,特别是肝细胞癌、胰腺癌、骨肉瘤、白血病或结肠直肠癌。如技术人员所知,癌细胞特别是在癌基因中或肿瘤抑制基因中积累突变,这些突变可能通过遗传修饰进行校正。而且,本发明的手段和方法可用于诱导细胞死亡,例如经由凋亡,尤其是在癌细胞中。优选地,治疗癌症为减少对象中的肿瘤和/或癌细胞负荷。本领域技术人员应理解,例如癌症的治疗有效性取决于多种因素,包括例如癌症分期和癌症类型。本领域技术人员还应理解,在疾病为癌症的情况下,优选治疗该疾病。
48.术语“传染病”原则上是技术人员所理解的。优选地,如本文所用,该术语指其中传染因子的复制循环包括至少一个如下阶段的传染病,在该阶段中传染因子的基因组存在于允许宿主细胞(permissive host cell)中。因此,传染病优选为病毒感染,优选为免疫缺陷病毒感染、疱疹病毒感染、乳头瘤病毒感染或乙型肝炎病毒感染。
49.本发明还涉及一种包含根据本发明的组合物或根据本发明的多肽或多肽复合物的试剂盒;其包含在外壳中。
50.如本文所用,术语“试剂盒”是指本发明的前述化合物、手段或试剂的集合,其可以或可不被包装在一起。试剂盒的组分可由单独的小瓶包含(即作为单独的部分的试剂盒)或提供在单个小瓶中。而且,应理解的是,本发明的试剂盒优选用于实施本文别处提及的方法。在一个实施方案中,设想以即用方式提供所有组分来实施上文提及的方法。此外,试剂盒优选含有用于实施所述方法的说明。这些说明可由纸质或电子形式的用户手册提供。另外,手册可包含用于解释在使用本发明的试剂盒进行前述方法时获得的结果的说明。
51.优选地,试剂盒包含更多的组分。优选地,试剂盒还包含编码至少一种指导rna
(grna)的多核苷酸。
52.还优选地,试剂盒还包含至少一种用于其包含的至少一种组分的递送手段,术语“递送手段”指适合于介导试剂盒的多核苷酸、多肽和/或宿主细胞的进入以进入到对象身体中的相关位点的任何手段。优选地,在试剂盒包含本发明的宿主细胞的情况下,相关位点优选为血流、肿瘤块或体腔。优选地,在试剂盒包含本发明的多核苷酸或多肽的情况下,相关位点优选为宿主细胞的内部。合适的递送手段是本领域已知的并特别包括转染试剂、包装手段等。优选地,将本发明的多核苷酸预包装在递送手段中,例如病毒颗粒中。
53.本发明还涉及一种用于修饰宿主细胞中的靶标位点的装置,其包含(i)根据本发明的组合物或根据本发明的多肽或多肽复合物;和
54.(ii)适合于使所述宿主细胞与所述组合物、多肽或多肽复合物接触的接触单元。
55.如本文所用,术语“装置”指至少包括彼此可操作地连接以允许施用本发明的化合物或组合物的手段的系统。使宿主细胞与化合物接触的优选手段是本领域公知的。如何以操作方式连接这些手段将取决于装置中包含的手段的类型和设想的施用种类。优选地,在这样的情况下,手段由单个装置包含。所述装置可因此包括用于将化合物或组合物施用到宿主细胞的递送单元和用于进行接触步骤的孵育单元。然而,还预期本发明的手段在这样的实施方案中可作为单独的装置出现并优选作为试剂盒包装在一起。本领域技术人员应毫不费力地认识到如何连接这些手段。优选的装置为那些无需专业技术人员的专门知识即可应用的装置。
56.本发明还涉及(i)根据本发明的组合物或(ii)根据本发明的多肽或多肽复合物用于修饰宿主细胞中的靶标位点的用途。
57.本发明还涉及一种提高cas核酸酶的特异性的方法,其包括
58.a)提供cas核酸酶;和
59.b)使所述cas核酸酶与低亲和力cas抑制剂或亚抑制浓度的cas抑制剂接触;和
60.c)从而提高所述cas酶的特异性。
61.本发明的提高cas核酸酶的特异性的方法优选为体外方法。然而,所述方法也可为体内方法。而且,其可包括除了上面明确提到的那些外的步骤。而且,所述步骤中的一个或多于一个可由自动化设备执行。
62.此外,本发明涉及一种鉴定低亲和力cas核酸酶抑制剂的方法,其包括
63.a)为至少一个靶标位点和至少一个脱靶位点提供依赖于cas抑制剂强度的编辑效率的表示;
64.b)在存在至少一种候选低亲和力cas抑制剂的情况下确定所述至少一个靶标位点和所述至少一个脱靶位点的编辑效率;
65.c)将步骤b)中获得的编辑效率与步骤a)中获得的表示进行比较;和从而
66.d)鉴定低亲和力cas核酸酶抑制剂。
67.本发明的鉴定低亲和力cas核酸酶抑制剂的方法优选为体外方法。而且,其可包括除了上面明确提到的那些外的步骤。而且,所述步骤中的一个或多于一个可由自动化设备执行。
68.术语“依赖于cas抑制剂强度的编辑效率的表示”指指示给定靶标位点或脱靶位点的cas抑制剂强度与编辑效率之间的关系的优选图形表示。因此,提供所述表示优选包括在
不存在cas抑制剂的情况下和在存在至少一种cas抑制剂的情况下确定cas核酸酶在靶标位点或脱靶位点处的编辑频率;更优选地,为至少两种、更优选至少三种非全同的cas抑制剂提供所述表示,其中所述cas抑制剂优选在抑制所述cas核酸酶方面具有不同的活性,即优选具有不同的抑制剂强度。因此,优选地,至少一种cas抑制剂为低亲和力cas抑制剂。优选地,步骤a)为至少一个靶标位点和至少一个脱靶位点提供依赖于cas抑制剂强度的编辑效率的表示;和/或步骤b)在存在至少一种候选低亲和力cas抑制剂的情况下确定所述至少一个靶标位点和所述至少一个脱靶位点的编辑效率;如本文实施例中所示进行。优选地,编辑效率的表示由模型模拟提供,更优选地,由如本文实施例中所指定的模型模拟提供。
69.优选地,如果在比较步骤c)中发现为候选低亲和力cas抑制剂的编辑效率确定的值介于在不存在cas抑制剂的情况下确定的编辑效率的值与在存在cas抑制剂的情况下为编辑效率确定的值之间,则鉴定出低亲和力cas核酸酶抑制剂。更优选地,如果在比较步骤c)中发现为候选低亲和力cas抑制剂的编辑效率确定的值为在不存在cas抑制剂的情况下确定的编辑效率的值的0.01%至90%,优选0.1至50%,更优选0.5%至25%,还更优选1%至10%,则鉴定出低亲和力cas核酸酶抑制剂。更优选地,如果在步骤b)中确定的脱靶编辑效率为在不存在cas抑制剂的情况下确定的编辑效率的值的至多10%,优选至多5%,更优选至多2%,还更优选至多1%,则鉴定出低亲和力cas核酸酶抑制剂。最优选地,如果在步骤b)中确定的编辑效率位于步骤a)的靶标编辑效率曲线的最大斜率区域内,则鉴定出低亲和力cas核酸酶抑制剂。如技术人员应理解的,编辑效率的表示的形状取决于cas抑制剂强度、靶标位点选择和其他因素。
70.优选地,鉴定低亲和力cas核酸酶抑制剂的方法还包括确定所述候选低亲和力cas抑制剂的抑制剂强度。更优选地,在这样的情况下,如果在步骤b)中确定的抑制剂强度在相应的野生型cas抑制剂的50%至0.1%,优选20%至1%,更优选10%至2%,最优选约5%的范围内,则鉴定出低亲和力cas抑制剂。还优选地,确定所述候选低亲和力cas抑制剂的抑制剂强度包括将步骤b)中获得的靶标编辑效率和/或脱靶编辑效率与步骤a)中获得的编辑效率的表示进行比较。
71.鉴于上述内容,特别地设想以下实施方案:
72.1.一种修饰宿主细胞中的靶标位点的方法,其包括使所述宿主细胞与cas核酸酶接触,其中还使所述宿主细胞与低亲和力cas抑制剂和/或亚抑制浓度的cas抑制剂接触。
73.2.实施方案1的方法,其中靶标位点的编辑频率与任何脱靶位点的编辑频率的比为至少2,优选至少5,更优选至少7,还更优选至少10,还更优选至少15,甚至更优选至少18,最优选至少20。
74.3.实施方案1或2的方法,其中与在不使所述cas核酸酶与低亲和力cas抑制剂或亚抑制浓度的cas抑制剂接触的情况下脱靶修饰的频率相比,脱靶修饰的频率为至多1/2,优选至多1/3,更优选至多1/10,最优选至多1/15。
75.4.实施方案1至3中任一项的方法,其中所述低亲和力cas抑制剂具有相应的cas抑制剂的0.01%至90%,优选0.1至50%,更优选0.5%至25%,还更优选1%至10%的亲和力。
76.5.实施方案1至4中任一项的方法,其中所述cas核酸酶为cas9内切核酸酶。
77.6.实施方案1至5中任一项的方法,其中所述cas抑制剂为acr多肽,优选为acriia4多肽。
78.7.实施方案1至6中任一项的方法,其中所述低亲和力cas抑制剂为acriia4多肽的突变蛋白,其包含至少一个选自以下列表的突变:(i)m77a;(ii)d76a/m77a;(iii);(iv)d14a;(v)d14a/y15a;(vi)d14a/g38a;(vii)g38a;(viii)d37a/g38a;(ix)d14a/g38a;(x)氨基酸n64/q65/e66的缺失和lov-结构域的插入;(xi)氨基酸n64/q65/e66的缺失;(xii)包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(xiii)(i)至(xii)的任意组合。
79.8.实施方案1至7中任一项的方法,其中所述低亲和力cas抑制剂为包含至少一个选自以下列表的突变的acriia4多肽的突变蛋白:(i)n39a;(ii)d14a/g38a;(iii)氨基酸n64/q65/e66的缺失及包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(iv)(i)至(iii)的任意组合。
80.9.实施方案1至8中任一项的方法,其中所述使所述cas核酸酶与低亲和力cas抑制剂接触包括提供所述cas核酸酶与所述低亲和力cas抑制剂的融合多肽,优选经由接头肽。
81.10.实施方案1至9中任一项的方法,其中所述使所述cas核酸酶与低亲和力cas抑制剂接触包括提供所述cas核酸酶与所述低亲和力cas抑制剂的融合多肽,经由包含gs和/或gg的接头,优选包含ggsg(seq id no:13)的接头,更优选(ggsg)
n-接头连接,其中n为1至100的整数,优选2至50的整数,更优选3至25的整数,甚至更优选为约10,最优选为10。
82.11.实施方案1至10中任一项的方法,其中使所述cas核酸酶与亚抑制浓度的cas抑制剂接触包括使所述cas核酸酶与cas抑制剂以10∶1至1∶1,优选8∶1至1.5∶1,更优选6∶1至1.75∶1,甚至更优选5∶1至2∶1,还更优选4∶1至2.2∶1,最优选约3∶1的cas核酸酶∶cas抑制剂摩尔比接触。
83.12.实施方案1至11中任一项的方法,其中所述靶标位点为靶标基因。
84.13.实施方案1至12中任一项的方法,其中所述方法为特异性地修饰宿主细胞中的基因和/或修饰基因的表达的方法,优选特异性地修饰宿主细胞中的基因的方法。
85.14.实施方案1至13中任一项的方法,其中所述方法为体外方法。
86.15.实施方案1至14中任一项的方法,其中所述方法还包括使所述宿主细胞与至少一种指导rna接触。
87.16.一种组合物,其包含cas核酸酶和(i)低亲和力cas抑制剂和/或(ii)亚抑制浓度的cas抑制剂或者引起宿主细胞中cas核酸酶和(i)低亲和力cas抑制剂和/或(ii)亚抑制浓度的cas抑制剂的表达。
88.17.一种包含(i)cas核酸酶和(ii)低亲和力cas抑制剂的多肽或多肽复合物。
89.18.根据实施方案16的组合物或根据实施方案17的多肽或多肽复合物,其中所述低亲和力cas抑制剂对所述cas核酸酶具有相应的cas抑制剂的0.1%至90%的亲和力。
90.19.根据实施方案16或18的组合物或根据实施方案17或18的多肽或多肽复合物,其中所述cas核酸酶和所述低亲和力cas抑制剂作为融合多肽被包含。
91.20.根据实施方案16、18或19的组合物或者根据实施方案17至19中任一项的多肽或多肽复合物,其中所述低亲和力cas抑制剂具有相应的cas抑制剂的0.01%至90%,优选0.1至50%,更优选0.5%至25%,还更优选1%至10%的亲和力。
92.21.根据实施方案16或实施方案17至20中任一项的组合物或者根据实施方案17至20中任一项的多肽或多肽复合物,其中所述cas核酸酶为cas9内切核酸酶。
93.22.根据实施方案16或实施方案17至21中任一项的组合物或者根据实施方案17至
21中任一项的多肽或多肽复合物,其中所述cas抑制剂为acr多肽,优选为acriia4多肽。
94.23.根据实施方案16或实施方案17至22中任一项的组合物或者根据实施方案17至22中任一项的多肽或多肽复合物,其中所述低亲和力cas抑制剂为acriia4多肽的突变蛋白,其包含至少一个选自以下列表的突变:(i)m77a;(ii)d76a/m77a;(iii);(iv)d14a;(v)d14a/y15a;(vi)d14a/g38a;(vii)g38a;(viii)d37a/g38a;(ix)d14a/g38a;(x)氨基酸n64/q65/e66的缺失和lov-结构域的插入;(xi)氨基酸n64/q65/e66的缺失;(xii)包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(xiii)(i)至(xii)的任意组合。
95.24.根据实施方案16或实施方案17至23中任一项的组合物或者根据实施方案17至23中任一项的多肽或多肽复合物,其中所述低亲和力cas抑制剂为包含至少一个选自以下列表的突变的acriia4多肽的突变蛋白:(i)n39a;(ii)d14a/g38a;(iii)氨基酸n64/q65/e66的缺失及包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(iv)(i)至(iii)的任何组合。
96.25.根据实施方案16或实施方案17至24中任一项的组合物或者根据实施方案17至24中任一项的多肽或多肽复合物用于医学中。
97.26.根据实施方案16或实施方案17至24中任一项的组合物或者根据实施方案17至24中任一项的多肽或多肽复合物用于治疗和/或预防遗传疾病、神经变性病、癌症和/或传染病中。
98.27.一种包含根据实施方案16或实施方案17至24中任一项的组合物或者根据实施方案17至24中任一项的多肽或多肽复合物的试剂盒;其包含在外壳中。
99.28.一种用于修饰宿主细胞中的靶标位点的装置,其包括
100.(i)根据实施方案16或实施方案17至24中任一项的组合物或者根据实施方案17至24中任一项的多肽或多肽复合物;和
101.(ii)适合于使所述宿主细胞与所述组合物、多肽或多肽复合物接触的接触单元。
102.29.(i)根据实施方案16或实施方案17至24中任一项的组合物或者(ii)根据实施方案17至24中任一项的多肽或多肽复合物用于修饰宿主细胞中的靶标位点的用途。
103.30.一种提高cas核酸酶的特异性的方法,其包括
104.a)提供cas核酸酶;和
105.b)使所述cas核酸酶与低亲和力cas抑制剂或亚抑制浓度的cas抑制剂接触;和
106.c)从而提高所述cas酶的特异性。
107.31.实施方案30的方法,其中提高所述cas酶的特异性包括与在不使所述cas核酸酶与低亲和力cas抑制剂或亚抑制浓度的cas抑制剂接触的情况下的脱靶修饰相比,脱靶活性为至多1/2,优选至多1/3,更优选至多1/10,最优选至多1/15。
108.32.实施方案30或31的方法,其中使所述cas核酸酶与亚抑制浓度的cas抑制剂接触包括使所述cas核酸酶与cas抑制剂以10∶1至1∶1,优选8∶1至1.5∶1,更优选6∶1至1.75∶1,甚至更优选5∶1至2∶1,还更优选4∶1至2.2∶1,最优选约3∶1的cas核酸酶∶cas抑制剂摩尔比接触。
109.33.实施方案30至32中任一项的方法,其中所述低亲和力cas抑制剂具有相应的cas抑制剂的0.01%至90%,优选0.1至50%,更优选0.5%至25%,还更优选1%至10%的亲和力。
110.34.实施方案30至33中任一项的方法,其中所述cas核酸酶为cas9内切核酸酶。
111.35.实施方案30至34中任一项的方法,其中所述cas抑制剂为acr多肽,优选为acriia4多肽。
112.36.实施方案30至35中任一项的方法,其中所述低亲和力cas抑制剂为acriia4多肽的突变蛋白,其包含至少一个选自以下列表的突变:(i)m77a;(ii)d76a/m77a;(iii);(iv)d14a;(v)d14a/y15a;(vi)d14a/g38a;(vii)g38a;(viii)d37a/g38a;(ix)d14a/g38a;(x)氨基酸n64/q65/e66的缺失和lov-结构域的插入;(xi)氨基酸n64/q65/e66的缺失;(xii)包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(xiii)(i)至(xii)的任意组合。
113.37.实施方案30至36中任一项的方法,其中所述低亲和力cas抑制剂为包含至少一个选自以下列表的突变的acriia4多肽的突变蛋白:(i)n39a;(ii)d14a/g38a;(iii)氨基酸n64/q65/e66的缺失及包含t406a、t407a、g528a和n538e突变的lov-结构域的插入;和(iv)(i)至(iii)的任意组合。
114.38.实施方案30至37中任一项的方法,其中所述使所述cas核酸酶与低亲和力cas抑制剂接触包括提供所述cas核酸酶与所述低亲和力cas抑制剂的融合多肽,优选经由接头肽连接。
115.39.实施方案30至38中任一项的方法,其中所述使所述cas核酸酶与低亲和力cas抑制剂接触包括提供所述cas核酸酶与所述低亲和力cas抑制剂的融合多肽,经由包含gs和/或gg的接头,优选包含ggsg(seq id no:13)的接头,更优选(ggsg)
n-接头连接,其中n为1至100的整数,优选2至50的整数,更优选3至25的整数,甚至更优选为约10,最优选为10。
116.40.一种鉴定低亲和力cas核酸酶抑制剂的方法,其包括
117.a)为至少一个靶标位点和至少一个脱靶位点提供依赖于cas抑制剂强度的编辑效率的表示;
118.b)在存在至少一种候选低亲和力cas抑制剂的情况下确定所述至少一个靶标位点和所述至少一个脱靶位点的编辑效率;
119.c)将步骤b)中获得的编辑效率与步骤a)中获得的表示进行比较;和从而
120.d)鉴定低亲和力cas核酸酶抑制剂。
121.41.实施方案40的方法,其中如果在步骤b)中确定的编辑效率位于步骤a)的靶标编辑效率曲线的最大斜率区域内,则鉴定出低亲和力cas核酸酶抑制剂。
122.42.实施方案40或41的方法,其中如果在步骤b)中确定的脱靶编辑效率为相应的靶标编辑效率的至多50%,优选至多20%,更优选至多10%,还更优选至多5%,甚至更优选至多2%,最优选至多1%,则鉴定出低亲和力cas核酸酶抑制剂。
123.43.实施方案40至42中任一项的方法,其中所述方法还包括确定所述候选低亲和力cas抑制剂的抑制剂强度,并且其中如果在步骤b)中确定的抑制剂强度在相应的野生型的50%至0.1%,优选20%至1%,更优选10%至2%,最优选约5%的范围内,则鉴定出低亲和力cas抑制剂。
124.44.实施方案43的方法,其中所述确定所述候选低亲和力cas抑制剂的抑制剂强度包括将步骤b)中获得的靶标编辑效率和/或脱靶编辑效率与步骤a)中获得的编辑效率的表示进行比较。
125.45.根据实施方案40至44中任一项的方法,其中所述编辑效率的表示由模型模拟提供。
126.本说明书中引用的所有参考文献就其整个公开内容和本说明书中具体提及的公开内容通过引用并入本文。
附图说明
127.图1.通过抗-crispr蛋白的共表达对crispr在靶和脱靶效应的动力学隔离(kinetic insulation)。(a)用于cas9基因组编辑的模型的示意图。在用编码cas9和sgrna的质粒共转染后,质粒被转录为cas9-mrna和sgrna或被降解。此外,该模型描述了mrna、sgrna、cas9蛋白的周转、sgrna和cas9的结合、cas9:sgrna与靶标基因的关联以及基因编辑。dna
site
,未编辑的靶标基因座。dna
edited
,经编辑的靶标基因座。d:sgr:c,dna、sgrna和cas9的三聚体复合物。(b)高亲和力(在靶)和低亲和力(脱靶)位点处的编辑动力学建模。左:该模型将瞬时sgrna和cas9表达与细胞的基因修饰分数相关联。最终的基因编辑分数取决于cas9:sgrna复合物表达的积分(左上小图中的阴影区域)。右:编辑效率与cas9活性之间的关系(cas9:sgrna复合物的时间积分)。sgrna的靶标亲和力决定了相应基因座处的编辑效率。在非常大的cas9:sgrna积分下,无论靶标亲和力如何,基因编辑分数都会达到饱和。(c)用于表达cas9、acriia4和sgrna的构建体的示意图。(d,e)共表达温和剂量的acriia4提高基因组编辑特异性。用编码acriia4、cas9和靶向aavs1基因座的sgrna的质粒共转染细胞并孵育72小时,然后进行t7内切核酸酶测定。指示了转染过程中使用的acriia4载体剂量。22ng因此相当于cas9/sgrna载体的3倍过量。(d)代表性的凝胶图像和(e)indel频率的量化。(f)将aav介导的acriia4、cas9和靶向hbb基因座的sgrna的共表达孵育72小时,然后进行t7内切核酸酶测定。(e,f)。条指示平均编辑频率,点为来自n=2个独立实验的单个数据点。
128.图2.cascaid设计提高基因组编辑特异性。(a)cascaid构建体的示意图,其包含与用作自抑制结构域(aid)的人工弱化acriia4变体融合的cas9。(b-g)用编码所指示的cascaid变体及靶向aavs1(b,c)、emx1(d,e)和hek(f,g)基因座的sgrna的质粒共转染细胞并孵育72小时,然后进行t7内切核酸酶测定。代表性的凝胶图像(b,d,f)和indel频率的相应量化(c,e,g)。数据为平均值
±
sd,点为来自n=3个独立实验的单个数据点。ins.5,插入变体5(参见表s2)。wt,与野生型acriia4融合的cas9。
129.图3.cascaid作用的数学模型解释提高的特异性并告知实验规划。(a)使用cascaid构建体进行基因编辑的数学模型概述。该模型考虑了质粒、sgrna、cascaid mrna和蛋白质的周转、活性与抑制状态之间的转换(cascaid
inh
)、sgrna-结合(cascaid:sgrna、cascaid
inh
:sgrna)、与靶标基因的关联以及基因编辑。(b)对使用aavs1-靶向sgrna和野生型cas9或cascaid变体“ins.5”的时间分辨t7内切核酸酶测定法测量结果的示例性模型拟合。关于完整的拟合集,参见图s8。(c)与野生型cas9或所指示的cascaid变体的编辑效率的模型模拟一起示出了靶向aavs1、emx1、runx1或hek基因座的sgrna的在靶和脱靶编辑效率。该模型用aavs1的在靶和脱靶编辑效率及emx1、runx1和hek的在靶效率进行校准。使用emx1、runx1和hek的脱靶编辑测量结果来进行模型验证。(d,e)cascaid变体对在靶和脱靶编辑的动力学隔离。(d)数据点与通过模型拟合估计的抑制剂强度一起示出。对于落在在靶
和脱靶编辑的s形曲线之间的抑制剂强度,实现了动力学隔离。(e)使用经校准的模型来预测由cascaid变体产生的在靶和脱靶编辑效率之间的比率。抑制剂强度定义为相对于cascaid wt即与野生型acriia4融合的cas9的抑制率的倍数变化。(f)在靶和脱靶编辑效率之间的比率相对于在靶编辑效率的模型模拟示意了cas9保真性与在靶编辑效率之间的权衡。cascaid变体可基于最高耐受的脱靶编辑效率来选择。
130.图4.cas9、acriia4和cascaid蛋白水平的估计及相应的模型拟合。(a)为了估计瞬时转染后gfp-cas9和mcherry-acriia4的浓度,通过确定稳定地表达具有已知平均荧光团浓度和细胞体积(n=50个细胞)的gfp和mcherry的校准细胞(hela)的图像堆栈的荧光强度总和来计算测得的gfp和mcherry荧光强度与荧光团浓度之间的比例因子(39)。(b,c)用描述cascaid变体的周转及在靶和脱靶的编辑的数学模型对时间分辨估计蛋白浓度和基因编辑效率的t7测定法测量结果进行同步拟合。(b)用aavs1-靶向sgrna和(i)cas9-gfp(深绿色)或(ii)cas9-gfp和mcherry-acr(粉红色,cas9+acr、mcherry-acr;浅绿色,cas9+acr、cas9-gfp)共转染hek细胞。瞬时转染后,确定每种条件n=50个细胞的平均荧光强度。从这些中,通过应用从校准细胞中的测量结果获得的比例因子来估计平均蛋白浓度(详情参见小图a及材料和方法)。(c)cas9或cascaid变体(wt,野生型;ins.5;n39a;d14a/g38a)的t7测定法测量结果和相应的模型拟合。使用以下测量结果来进行模型拟合(由圆圈指示):(i)用野生型cas9或所指示的cascaid变体转染后aavs1的在靶和脱靶编辑效率的时间分辨测量结果,(ii)野生型cas9对所有四个靶标基因的在靶和脱靶编辑效率的测量结果,(iii)emx1、runx1和hek的在靶编辑效率的测量结果。基于模型参数的估计,预测了emx1、runx1和hek sgrna的cascaid脱靶效率。模型预测与脱靶效率的测量结果一致(由三角形指示)。
131.图5.cascaid变体对在靶和脱靶编辑事件的动力学隔离。使用校准模型来与cas9融合抑制剂的强度相关地模拟sgrna runx1和hek的在靶和脱靶编辑效率。灰线指示cascaid变体的值,从弱抑制到强抑制排序:cascaid d14a/g38a,cascaid ins.5,cascaid n39a,和cascaid野生型。在靶和脱靶编辑效率遵循s形曲线,依赖于抑制剂强度。cascaid变体

d14a/g38a’、

ins.5



n39a

的抑制剂强度在在靶编辑效率曲线的最大斜率区域中但低于脱靶编辑效率曲线的最大斜率区域,表明这些变体非常适合于在靶和脱靶编辑的隔离。
132.以下实施例将仅示意本发明。无论如何,它们不应解释为限制本发明的范围。
133.实施例1
134.材料和方法
135.质粒
136.所有载体均通过经典的限制酶克隆产生。寡核苷酸以及合成的双链dna片段(gblock)自integrated dna technologies(idt)获得。表达cas9、与gfp融合的cas9(cas9-gfp)、野生型acriia4、不同的acriia4-lov2杂交体或带有改进的f+e支架的u6启动子驱动sgrna的载体先前已有报道(bubeck et al.,nat methods 15,924-927(2018);hoffmann et al.,nucleic acids res 271,(2019));(参见addgene#113033-113039)。mcherry-acriia4载体通过使用重叠延伸pcr将mcherry编码序列与野生型acriia4的n-末端融合来创建。通过经由ecori/hindiii将编码gs接头-acriia4片段的合成dna片段克隆到载体cmv-spycas9(addgene#103033)中来创建经由40个残基gs接头与野生型acriia4融合的表达
cas9的构建体。所得构建体中的acriia4片段随后经由bamhi/hindiii被编码acriia4-lov2融合或acriia4点突变体的pcr片段替换。为了生成acriia4-lov2pcr片段,采用我们先前报道的acriia4-lov2载体作为模板(bubeck et al.,loc.cit.)。acriia4点突变体通过首先用引入一个或多于一个点突变的5
′‑
磷酸化引物扩增编码野生型acriia4(addgene#113037)的载体来产生。然后将所得载体用作模板以生成编码acriia4突变体的pcr片段。通过经由bbsi寡核苷酸克隆将靶标互补序列插入到载体paav-rsv-gfp-u6-sgrna支架(addgene#113039)中来创建sgrna表达载体。
137.在所有克隆程序中,使用q5热启动高保真dna聚合酶(new england biolabs,neb)来进行pcr,然后进行琼脂糖凝胶电泳以分析pcr产物。从凝胶切下预期大小的条带并通过使用qiaquick凝胶提取试剂盒(qiagen)来纯化dna。使用来自new england biolabs的相应酶应用制造商操作规程来进行限制性消化和连接。连接后,将质粒转化到化学感受态top10细胞中并使用qiaamp dna mini或plasmid plus midi试剂盒(均来自qiagen)提取和纯化质粒。
138.细胞培养
139.在使用之前,所有细胞系都经由商业服务(multiplexion,海德尔堡)进行了验证并检测为支原体污染阴性。细胞在加湿培养箱中保持在5%co2和37℃下并每2-4天传代一次,即当达到70-90%融合度时。hek 293t和hela细胞在补充有2mm l-谷氨酰胺、100u/ml青霉素、100μg/ml链霉素(均来自thermofisher)和10%(体积/体积)胎牛血清(biochrom ag)的1
×
dmem中培养。huh-7培养基另外补充有1mm的非必需氨基酸(thermofisher)。
140.aav裂解物产生
141.采用低传代hek 293t细胞来产生含有aav的细胞裂解物。将细胞以每孔350,000个细胞的密度接种到6孔板(cytoone)中。第二天,细胞用(i)携带aav血清型2(aav2)rep和cap基因的aav辅助质粒、(ii)为aav产生提供辅助功能的腺病毒质粒和(iii)aav载体质粒三重转染,每孔使用1.33μg的每种构建体和8μl的turbofect转染试剂(thermofisher)。aav载体质粒编码(i)靶向aavs1基因座的u6-启动子驱动sgrna以及rsv启动子驱动gfp(用作转导报告基因)、(ii)cas9或(iii)acriia4。转染后三天,将细胞收集在300μl pbs中并通过在液氮中急冻和在37℃水浴中交替来进行五次冻-融循环。以18,000
×
g离心10分钟以去除细胞碎片并将含有aav颗粒的上清液储存在4℃下直至使用。
142.t7内切核酸酶测定和靶向扩增子测序
143.表1示出了与本研究相关的基因组靶/脱靶位点:
144.对于基于转染的t7测定法,将hek 293t细胞以每孔12,500个细胞的密度和每孔100μl的培养体积接种到96孔板(eppendorf)中。第二天,使用每孔0.3μl jetprime试剂用(polyplus-transfection)转染细胞,详情如下。对于图1e中示出的实验,将s1、s2和s3细胞用(i)66ng cas9表达构建体、(ii)66ng sgrna构建体和(iii)不同剂量的acr构建体共转染,如图中所指示。为了使所有样品之间转染的dna的总量保持恒定,使用不相关的载体将dna加满至每孔200ng。对于图2中示出的实验,将细胞用(i)66ng cas9或cascaid载体、(ii)66ng sgrna表达构建体和(iii)66ng不相关的填充物(stuffer)dna共转染。
145.对于基于转导的t7测定法,将hek 293t以每孔3,500个细胞的密度接种并将hela和huh-7细胞以每孔3,000个细胞的密度接种到96孔板中。第二天,细胞用33μl cas9 aav裂
解物、33μl sgrna aav裂解物和所指示的体积的acriia4 aav裂解物共转导。转导体积总是用pbs加满至100μl的总体积。第一次转导后24小时重复转导。转染后或(第一次)转导后72小时,吸出培养基并使用补充有蛋白酶k(sigma-aldrich)的directpcr裂解试剂(viagen biotech)裂解细胞。
146.对于t7测定法,使用q5热启动高保真dna聚合酶(new england biolabs)用位于相应的在靶/脱靶位点侧翼的引物对基因组靶标基因座和相关脱靶基因座进行pcr扩增,如表2中所示。使用nexus gsx1 mastercycler(eppendorf)和以下温度步骤,将5μl pcr扩增子在缓冲液2(neb)中按1∶4稀释,然后加热到95℃并缓慢冷却至室温以让形成异源双链:95℃/5分钟;95-85℃,每秒-2℃;85-25℃,每秒-0.1℃。然后,加入0.5μl t7内切核酸酶(neb),混合样品并在37℃下孵育15分钟。接下来,加入补充有1%gelred(biotium)的凝胶上样染料(neb)并然后将样品上样到2%tris-硼酸盐-edta琼脂糖凝胶上。施加电压(100伏)40分钟以分辨dna片段。使用配备了2.8兆像素/14位科研级ccd相机(intas)的gel ix20系统来进行凝胶记录。为了从凝胶图像计算indel百分数,使用imagej凝胶分析工具对t7条带进行量化。测量峰面积并使用公式indel(%)=100
×
(1-(1-切割分数)^(1/2))计算插入和缺失的百分数(indel(%)),而切割分数=∑(切割产物条带)/∑(切割产物条带+pcr input条带)。
147.对于靶向扩增子测序,第一步pcr通过用携带5

illumina nextera测序衔接子的引物对基因组在靶/脱靶基因座进行pcr扩增来进行。用于引入条形码、在illumina miseq机器上测序及用于crispr诱导indel的质量控制和调用的下游生物信息学的第二步pcr经由crispr/cas9商业测序服务(microsynth)通过其内部渠道进行。
148.荧光显微镜和图像分析
149.以对于hela来说每孔9,000个细胞、对于hek 293t来说每孔10,000个细胞的密度将细胞和每孔300μl体积的培养基接种到8孔玻璃底μ-slide(ibidi)中。第二天,将细胞用(i)25ng cas9-gfp、25ng sgrna aavs1构建体和25ng填充物dna(pbluescript)或(ii)25ng cas9-gfp、25ng mcherry-acriia4和25ng sgrna aavs1构建体共转染,每孔使用0.2μl jetprime。在转染后12小时、18小时、24小时、48小时和72小时时,使用配备有自动co2和温度控制、uv、氩气和固态激光器以及hcx pl apo 40x油浸物镜(n/a=0.7)的leica sp8共聚焦激光扫描显微镜进行成像。对所有样品应用相同的成像设置,详情如下所述。使用488nm激发激光线记录gfp荧光并将检测波长设置为493-578nm。使用552nm激发激光线记录mcherry荧光并将检测波长设置为578-789nm。激光功率为0.25%,增益设置为800v。对于每个视场,记录40μm的z-堆栈(40个切片)并针对每个样品和时间点记录五个视场。平行地记录单平面明场图像。使先前报道的每个细胞表达已知的gfp和mcherry分子数的hela参考细胞系(kallenberger et al,sci signal 7,ra23(2014))经受相同的成像条件。
150.对于图像分析,使用imagej中的徒手选择工具使用明场通道手动分割细胞并测量每个细胞的面积。然后应用这些分割物来测量gfp和mcherry堆栈的z-投影中的平均荧光。然后使用下面的公式计算每个细胞的荧光分子数:
[0151][0152]
其中fm(样品)和fm(参考)表示荧光分子数,a(样品)和a(参考)表示细胞面积,i
(样品)和i(参考)表示荧光强度,分别是在样品细胞或参考(ref)细胞系中的特定细胞中在背景扣除之后。
[0153]
数学建模和参数估计
[0154]
为了定量地描述cas9或cascaid变体的基因编辑动力学,开发了ode模型。该模型描述了sgrna、cas9或cascaid mrna和cas9或cascaid蛋白的瞬时表达、sgrna与cas9或cascaid变体的结合、cascaid变体的激活和抑制以及通过cas9或cascaid变体和sgrna的活性复合物进行的基因编辑。使用无cascaid物种的模型来进行初始模拟,该初始模拟由9个方程组成,总共含11个参数。为了对实验数据进行同步模型拟合,定义了三种类型的模型:(i)描述质粒、mrna和蛋白质的周转的模型,其由7个方程组成,(ii)cas9模型,其由39个方程组成,(iii)cascaid模型,其含47个方程。通过对75个数据点进行模型拟合,总共估计了32个参数。下面描述模型假设和迭代改进模型的步骤。
[0155]
实验数据集包括与蛋白质周转和基因编辑相关的测量结果。然而,中间的若干反应是通过实验的方法不可得的。出于这个原因,我们试图通过简约地定义模型参数来限制参数不可识别性的问题。考虑到用于表达sgrna、cas9或cascaid变体的质粒的大小为相同的数量级,故假设所有质粒具有相同的降解速率。此外,该模型假设cas9和所有cascaid物种(cascaid、cascaid
inh
、cascaid:sgrna、cascaid
inh
:sgrna)具有相同的降解速率k
deg,c
而与其激活状态和sgrna结合无关。类似地,不同sgrna的降解由一个参数k
deg,grna
描述。如果cascaid作为与sgrna的复合物的一部分降解,则假定sgrna保留在细胞内。因此,该模型在cas9的潜在sgrna拯救作用方面具有灵活性,这与不然寿命非常短的sgrna在与cas9结合后受到保护而免于降解的观察结果一致(ma et al.,jcell biol 214,529-537(2016))。
[0156]
我们假设与其他过程如翻译或基因编辑相比,sgrna与cas9或cascaid变体的结合很快。准稳态通过将结合参数k
grna,on
固定为一个大值并有效地仅估计解离常数k
d,grna
=k
grna,off
/k
grna,on
来实现。起初,我们尝试对靶向四种不同基因的sgrna用相等的k
d,grna
值来拟合模型。由赤池信息量准则中δaic=53的差异所指示,我们意识到单独地对sgrna估计k
d,grna
会显著改进模型拟合。这意味着对cas9或cascaid变体的亲和力在sgrna之间有所不同。
[0157]
类似地,我们首先对所有靶向基因中的实验的最大编辑效率假定了相同的参数。在模型中,该参数用作未编辑基因分数的初始值d
tot
。如果转染细胞中的所有靶标位点都可被编辑,则此参数等于表达sgrna和cas9或cascaid变体的转染细胞的百分数。单独地对四个编辑基因估计此参数显著改进了模型拟合(δaic=42)。
[0158]
对于cascaid变体,定义了恒定的激活参数但单独的灭活参数。为了直接估计具有突变的acriia4的cascaid变体(

ins.5’、

n39a’、

d14a/g38a’)的抑制剂强度比率,将这些cascaid变体的抑制参数定义为cascaid wt的抑制参数(k
inh,cascaid
)与参数factor
cascaid,ins,5
、factor
cascaid,n39a
或factor
cascaid,d14aig38a
之间的乘积。
[0159]
此外,还估计了活性cas9:sgrna或cascaid:sgrna复合物与四种不同基因的靶标位点的解结合(unbinding)的各个参数。为所有基因定义了相同的结合参数k
on,target
,这与sgrna和靶标位点之间的错配影响解结合而不是结合动力学的观察结果一致(ma et al.(2016)loc.cit.)。为了解释在靶和脱靶编辑之间的差异,分别对四种基因估计了cas9:sgrna或cascaid:sgrna复合物的在靶和脱靶解结合速率之间的因素。例如,来自emx1的脱
靶的解结合速率定义为解结合速率k
emx1,off
与factor
emx1,off target
的乘积。
[0160]
如果可得到数据点的平行测定,则用平均值的标准误差对模型观测结果与实验测量结果之间的残差加权。蛋白质表达测量结果由n=50个细胞的平均值确定。在cas9和所有cascaid变体的情况下,于72小时时测量了四个平行样的aavs1编辑效率。对于emx1、runx1和hek编辑效率,测量三个平行样。在24小时和48小时时进行aavs1编辑效率的单个测量。在这种情况下,使用误差模型对残差加权。为此,用线性误差模型ε=m1y+m2对所有sem值和用平行测定测得的编辑效率y进行拟合,这些平行测定产生参数估计值m1=0.054和m2=0.681。
[0161]
使用matlab(the mathworks,natick,ma,usa)中的自定义脚本进行模型模拟。对于参数估计,使用了matlab工具箱potterswheel(www.potterswheel.de)(maiwald et al.,bioinformatics 24,2037-2043(2008))。总共进行了500次多起点局部优化,然后进行轮廓似然估计以确定参数置信区间。参数估计值、参数界限和参数置信区间列于下表5中。
[0162]
实施例2:结果
[0163]
为了研究通过微调cas9活性来隔离在靶和脱靶编辑事件的可能性,我们首先设计了一个简单的数学模型,该模型由耦合常微分方程(ode)组成。我们的模型捕获了细胞中cas9介导的编辑的主要分子步骤,即(i)转染后sgrna和cas9的瞬时表达,(ii)cas9-sgrna复合物的形成,(iii)复合物与基因组靶标基因座的结合,和(iv)靶标基因座切割(图1a,表3)。在这个简单的模型中,cas9介导的靶标切割的水平主要取决于两个参数:细胞中存在的活性cas9-sgrna复合物的时间积分和cas9-sgrna复合物对给定基因组基因座的亲和力。如对完美靶标位点所预期的,cas9-sgrna对给定基因座的高亲和力会因此导致高百分数的基因编辑细胞(图1b)。相比之下,如对脱靶基因座所预期的,较低的亲和力需要活性cas9-sgrna复合物的较大时间积分(图1b)。值得注意的是,在足够大的时间框架下,在靶以及脱靶基因座的编辑都将达到饱和。重要的是,我们的模型定性地预测,通过将(活性)cas9-sgrna复合物的量微调至特定的水平,“高亲和力”基因座处(在靶)的编辑可与“低亲和力”基因座处(脱靶)的编辑隔离(图1b)。
[0164]
我们猜测如acriia4等抗-crispr蛋白可提供将cas9活性微调至选定水平并因此检验我们的模型预测的简单手段。因此,我们用编码acriia4、cas9和先前报道的靶向人类aavs1基因座的sgrna的载体共转染hek 293t细胞,所述sgrna在两个额外的基因座处表现出特别强的脱靶编辑(图1c)。在转染过程中,我们使用了相对低的acriia4载体剂量(cas9和sgrna载体的约3至130倍过量),因为在更高的acr剂量下,在靶编辑将被完全阻断。转染后72小时,我们使用t7内切核酸酶测定法测量了aavs1基因座和两个脱靶基因座处的插入和缺失(indel)频率。与模型预测一致,我们观察到在选定的acr载体剂量下,脱靶编辑显著减少,但在靶编辑仅轻度减少(图1d和e)。
[0165]
为了测试这种效果是否独立于特定的细胞环境并与不同的递送模式相容,我们将我们的系统的不同组分(cas9、sgrna和acriia4)包装到腺相关病毒(aav)载体中(图1c),该载体为基因治疗应用的主要候选载体。对于我们的实验,我们选择了aav血清型-2,它能够有效地转导各种细胞系(grimm et al.(2008),j virol 82(12):5887)。我们用编码cas9的aav2颗粒、靶向aavs1基因座的sgrna以及不同剂量的acriia4载体感染了hek293t(人胚肾)、hela(宫颈癌)和huh-7(肝细胞癌)细胞并测量了在靶和脱靶基因座处的indel频率。同
样,在选定的低acr剂量下,我们观察到强效的在靶编辑,而脱靶编辑被有效抑制。
[0166]
虽然如上所示acr的共表达提供了一种高度灵活的提高cas9特异性而无需改变cas9或sgrna本身的策略,但这种方法对acr剂量相当敏感。而且,cas9、sgrna和acr的量在共递送到细胞群体中后会有些随机,即cas9-sgrna复合物与acr的比率将在各个细胞之间不同。我们猜测,通过经由基因融合将acr与cas9共价连接可实现对cas9活性的更稳健微调,这种方法我们称为cas9与人工抑制结构域耦合(cascaid)。在cascaid配置中,每个cas9分子都带有其自身的抑制结构域并因此以活性或非活性状态之间的平衡存在。活性或非活性状态“落户”的可能性由此取决于融合acr的强度,即通过调制acr强度,cas9活性可被微调至期望的水平(图2a)。正如人们所料,简单地将野生型acriia4与cas9融合(几乎)完全阻断了cas9活性(图2b-g,wt样品)。因此,为了能够实现预期的微调,我们采用了一组先前报道的acriia4结构域插入突变体(bubeck et al.,nat methods 15,924-927(2018))以及acriia4点突变体(basgall et al.,microbiology 164,464-474(2018)),其在与cas9共表达时显示出各种cas9抑制效力。然后,我们经由长(40个残基)甘氨酸-丝氨酸接头将这些减毒的acriia4变体与cas9 c-末端融合并使用先前采用的aavs1和hbb基因座靶向sgrna对所得的十个cascaid变体进行预筛选。许多cascaid变体不仅显示出与野生型cas9相当的在靶编辑效率,而且同时显示出大大减少的脱靶编辑。然后,我们选择了三种显示出不同的特异性增加水平的cascaid变体并使用五种不同的sgrna将它们的在靶和脱靶编辑频率与野生型cas9的在靶和脱靶编辑频率进行了比较。明显地,正如我们在t7内切核酸酶实验(图2b-g)中观察到并通过靶向扩增子测序进一步证实的那样,所有cascaid变体的基因组编辑特异性都显著提高。在若干情况下,这种提高是以在靶编辑一定程度的减少为代价的,因此表明在特异性的增加和脱靶编辑的减少之间存在权衡(图2b-g),正如我们的模型所预测的(图1a和b)。
[0167]
为了在我们的cascaid方法的背景下详细地定量表征在靶编辑效率与特异性之间的关系,我们通过纳入cascaid变体的抑制状态扩展了我们的初始模型(图3a)。特别地,该模型解释了sgrna、cas9或cascaid mrna及cas9或cascaid蛋白在转染细胞中的瞬时表达。cas9和活性以及非活性cascaid蛋白可与sgrna分子可逆地结合。cascaid被融合的acr可逆地灭活。因此,该模型有效地描述了cascaid变体的激活和灭活率之间的比率如何与cascaid:sgrna的活性复合物的时间积分相关。
[0168]
在cas9、含未修饰acriia4的cascaid以及cascaid变体

ins.5’、

n39a’和d14a/g38a’的瞬时表达后用关于编辑频率的实验数据对该模型进行了校准(图3b;关于完整的模型拟合和数据集,参见图4)。而且,用通过生命细胞荧光显微镜记录的cas9-gfp和mcherry-acriia4表达的时移测量结果对该模型进行了校准。对于参数估计,用该模型对如对aavs1靶向sgrna与不同cascaid变体以及野生型cas9的组合所观察到的时间分辨在靶和脱靶编辑效率进行拟合。在使用野生型cas9以及对不同的cascaid变体测得的在靶编辑频率时,还用该模型对针对emx1、runx1和hek基因座测得的在靶和脱靶效率进行了拟合。使用cascaid变体的相应脱靶编辑数据来进行模型验证。明显地,使用校准模型的模拟以高精度预测了cascaid验证数据集中实验测量的脱靶率(图3c、4)。
[0169]
最后,使用校准模型来定量剖析cascaid对在靶和脱靶编辑事件的动力学隔离。在靶和脱靶位点处的模拟编辑效率遵循s形曲线,依赖于cas9-融合抑制剂的强度(图3d、e和
5)。值得注意的是,对于所研究的sgrna,cascaid变体

d14a/g38a’、

ins.5



n39a

的抑制剂强度均在在靶编辑效率曲线的最大斜率区域中但低于脱靶编辑效率曲线的最大斜率区域,这解释了这些变体之所以非常适合于在靶和脱靶编辑事件的隔离的原因。根据参数估计值(表4和5),相对于含有野生型acriia4的cascaid变体,携带acriia4突变体的cascaid变体向抑制状态的转变率降低了16至19倍之间,这解释了这些变体之所以仍然能够实现强效在靶编辑的原因。为了进一步表征调整cas9的活性的能力,我们模拟了在靶和脱靶编辑效率之间的比率(图3e和f)。该比率对cas9-融合抑制剂的强度的依赖性由每个编辑基因的s形曲线反映(图3e)。值得注意的是,变体

ins.5’、

n39a’和

d14a/g38a’的抑制剂强度位于s形曲线的中上部分中(图3e)。综上所述,这些数据表明cascaid变体在以有效隔离在靶和脱靶事件为特征的cas9活性特性方面击中了期望的“甜蜜点”(图3f)。
[0170]
引用的文献:
[0171]
akcakayaet al.,nature 561:416-419(2018)
[0172]
basgall et al.,microbiology 164,464-474(2018)
[0173]
bubeck et al.,nat methods 15,924-927(2018)
[0174]
dong et al.,nature 546:436-439(2017)
[0175]
grimm et al.(2008),j virol 82(12):5887
[0176]
hoffmann et al.,nucleic acids res 271,(2019)
[0177]
kallenberger et al,sci signal 7,ra23(2014)
[0178]
kleinstiver et al.,nature 529:490-495(2016)
[0179]
kulcsar et al.,genome biol 18:190(2017),
[0180]
ma et al.,jcell biol 214,529-537(2016)
[0181]
pawluk et al.(2016),cell 167(7):1829
[0182]
rauch et al.(2017),cell 168(1-2):150
[0183]
shin et al,sci adv 3,e1701620(2017)
[0184]
[0185]
[0186]
[0187]
[0188]
[0189]
[0190]
[0191]
[0192]
[0193]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1