具有RUVC结构域的酶的制作方法

文档序号:36382470发布日期:2023-12-14 17:01阅读:38来源:国知局
具有的制作方法


背景技术:

1、cas酶以及其相关的成簇的规则间隔的短回文重复序列(crispr)向导核糖核酸(rna)似乎是原核免疫系统的普遍组分(约45%的细菌,约84%的古细菌),用于通过crispr-rna引导的核酸切割来保护此类微生物免受非自身核酸的侵害,如传染性病毒和质粒。虽然编码crispr rna元件的脱氧核糖核酸(dna)元件在结构和长度上可能相对保守,但其crispr相关(cas)蛋白是高度多样化的,含有多种核酸相互作用结构域。虽然早在1987年就观察到crispr dna元件,但crispr/cas复合物的可编程核酸内切酶切割能力直到最近才被认识到,从而引起重组crispr/cas系统在各种dna操纵和基因编辑应用中的使用。


技术实现思路

1、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:(a)核酸内切酶,所述核酸内切酶被配置成与原间隔子相邻基序(pam)序列结合,所述pam序列包括seq id no:550-567,其中所述核酸内切酶是2类ii型cas核酸内切酶;以及(b)工程化向导核糖核酸结构,所述工程化向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述核酸内切酶包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述核酸内切酶源自未培养的微生物。在一些实施例中,所述核酸内切酶尚未被工程化为与不同的pam序列结合。在一些实施例中,所述核酸内切酶不是cas9核酸内切酶、cas14核酸内切酶、cas12a核酸内切酶、cas12b核酸内切酶、cas12c核酸内切酶、cas12d核酸内切酶、cas12e核酸内切酶、cas13a核酸内切酶、cas13b核酸内切酶、cas13c核酸内切酶或cas 13d核酸内切酶。在一些实施例中,所述核酸内切酶与cas9核酸内切酶具有小于80%同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述工程化向导核糖核酸结构包括至少两种核糖核酸多核苷酸。在一些实施例中,所述工程化向导核糖核酸结构包括一个核糖核酸多核苷酸,所述核糖核酸多核苷酸包括所述向导核糖核酸序列和所述tracr核糖核酸序列。在一些实施例中,所述向导核糖核酸序列与原核、细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述向导核糖核酸序列的长度为15-24个核苷酸。在一些实施例中,所述核酸内切酶包括接近所述核酸内切酶的n或c末端的一个或多个核定位序列(nls)。在一些实施例中,所述nls包括选自seq id no:586-601的序列。在一些实施例中,所述工程化核酸酶系统进一步包括单链或双链dna修复模板,所述单链或双链dna修复模板从5'至3'包括:第一同源臂,所述第一同源臂包括位于所述靶脱氧核糖核酸序列的5'的至少20个核苷酸的序列;至少10个核苷酸的合成dna序列;以及第二同源臂,所述第二同源臂包括位于所述靶序列的3'的至少20个核苷酸的序列。在一些实施例中,所述第一同源臂或所述第二同源臂包括至少40、80、120、150、200、300、500或1,000个核苷酸的序列。在一些实施例中,所述系统进一步包括mg2+的来源。在一些实施例中,所述核酸内切酶和所述tracr核糖核酸序列源自同一门内的不同细菌物种。在一些实施例中,所述核酸内切酶包括seq id no:1-549或602-1276或其与其具有至少55%同一性的变体。

2、一方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:(a)核酸内切酶,所述核酸内切酶被配置成对包括seq id no:550-567中的任一者的原间隔子相邻基序(pam)序列具有选择性,其中所述核酸内切酶是2类ii型cas核酸内切酶。在一些实施例中,所述系统包括(b)工程化向导核酸结构,所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,所述工程化向导核酸结构包括:(i)靶向核酸序列,所述靶向核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,核酸内切酶源自未培养的微生物。在一些实施例中,所述核酸内切酶尚未被工程化以与和所述核酸内切酶的天然pam序列不同的pam序列结合。在一些实施例中,所述核酸内切酶不是cas9核酸内切酶、cas14核酸内切酶、cas12a核酸内切酶、cas12b核酸内切酶、cas 12c核酸内切酶、cas12d核酸内切酶、cas12e核酸内切酶、cas13a核酸内切酶、cas13b核酸内切酶、cas13c核酸内切酶或cas 13d核酸内切酶。在一些实施例中,核酸内切酶与cas9核酸内切酶具有小于80%同一性。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1277-1641或1683中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括与seq id no:1-549或602-1276中的任一者的pi结构域具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的pi结构域。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:259、296或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括ruvc结构域。在一些实施例中,所述ruvc结构域与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述ruvc结构域与seq id no:259、296或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述hnh结构域与seqid no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述hnh结构域与seq id no:259、296或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶被配置成对包括seq idno:553、555或566中的任一者的pam序列或其变体具有选择性。在一些实施例中,所述工程化向导核酸结构包括至少两种核糖核酸多核苷酸。在一些实施例中,所述工程化向导核酸结构包括一个核糖核酸多核苷酸,所述核糖核酸多核苷酸包括所述向导核糖核酸序列和所述tracr核糖核酸序列。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1645-1662中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:568-585或1643-1644中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1648、1650或1661中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:571、573或584中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述靶向核酸序列与原核、细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述靶向核酸序列的长度为15-24个核苷酸。在一些实施例中,所述核酸内切酶包括接近所述核酸内切酶的n或c末端的一个或多个核定位序列(nls)。所述nls包括包含seq id no:586-601中的任一者的序列或其变体。在一些实施例中,所述系统进一步包括单链或双链dna修复模板,所述单链或双链dna修复模板从5'至3'包括:第一同源臂,所述第一同源臂包括位于所述靶脱氧核糖核酸序列的5'的至少20个核苷酸的序列;至少10个核苷酸的合成dna序列;以及第二同源臂,所述第二同源臂包括位于所述靶序列的3'的至少20个核苷酸的序列。在一些实施例中,所述第一同源臂或所述第二同源臂包括至少40、80、120、150、200、300、500或1,000个核苷酸的序列。在一些实施例中,所述系统进一步包括mg2+的来源。在一些实施例中,所述核酸内切酶和所述tracr核糖核酸序列源自同一门内的不同细菌物种。在一些实施例中,所述核酸内切酶包括seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%同一性的变体。在一些实施例中,所述序列同一性是通过blastp、clustalw、muscle、mafft算法或clustalw算法使用史密斯-沃特曼同源性搜索算法参数(smith-waterman homology search algorithm parameter)来确定的。在一些实施例中,所述序列同一性是通过所述blastp同源性搜索算法使用字长(w)为3、期望值(e)为10的参数以及blosum62评分矩阵将空位罚分设置为存在11,扩展1并且使用条件组成评分矩阵调整来确定的。在一些实施例中,所述pam序列位于所述靶脱氧核糖核酸序列的3'。

3、在一些方面,本公开提供了一种核酸,所述核酸包括为在生物体中表达而优化的工程化核酸序列,其中所述核酸编码2类ii型cas核酸内切酶,所述2类ii型cas核酸内切酶被配置成对包括seq id no:550-567中的任一者的原间隔子相邻基序(pam)具有选择性。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1277-1641或1683中的任一者具有至少至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体,或者其中所述核酸内切酶进一步包括与seq id no:1-549或602-1276中的任一者的pi结构域具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的pi结构域。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:259、296或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括ruvc结构域。在一些实施例中,所述ruvc结构域与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述ruvc结构域与seq id no:259、296或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述hnh结构域与seqid no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述hnh结构域与seq id no:259、296或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶包括seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。在一些实施例中,所述生物体是细菌、古细菌、真核、真菌、植物、哺乳动物或人生物体。

4、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:(a)核酸内切酶,所述核酸内切酶与seq id no:1-549、602-1276中的任一者或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;以及(b)工程化向导核酸结构,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括靶向核酸序列,所述靶向核酸序列被配置成与靶核酸序列杂交。在一些实施例中,所述核酸内切酶包括seqid no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%同一性、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。在一些实施例中,所述核酸内切酶进一步包括ruvc结构域。在一些实施例中,所述ruvc结构域与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述ruvc结构域与seq id no:259、296或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述hnh结构域与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述hnh结构域与seq id no:259、296或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1645-1662中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seqid no:568-585或1643-1644中的任一者的非简并核苷酸具有至少80%同一性的序列。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1648、1650或1661中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:571、573或584中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,并且包括:(i)靶向核酸序列,所述靶向核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述靶向核酸序列与细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述靶向核酸序列的长度为15-24个核苷酸。

5、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:(a)工程化向导核酸结构,所述工程化向导核酸结构包括:(i)与seq id no:1645-1662中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列;或者(ii)与seq id no:568-585或1643-1644中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列;以及(b)2类ii型cas核酸内切酶,所述2类ii型cas核酸内切酶被配置成与所述工程化向导核酸结构结合。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1648、1650或1661中的任一者具有至少80%同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:571、573或584中的任一者的非简并核苷酸具有至少80%同一性的序列。在一些实施例中,所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,并且包括:(i)靶向核酸序列,所述靶向核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述靶向核酸序列与细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述靶向核酸序列的长度为15-24个核苷酸。在一些实施例中,所述核酸内切酶包括与seq id no:1-549、602-1276中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶包括根据seqid no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。

6、在一些方面,本公开提供了一种工程化向导核酸结构,所述工程化向导核酸结构包括:(a)靶向核酸序列,所述靶向核酸序列包括与靶dna分子中的靶序列互补的核苷酸序列;以及(b)蛋白质结合区段,所述蛋白质结合区段包括杂交以形成双链rna(dsrna)双链体的两个互补的核苷酸延伸段,所述两个互补的核苷酸延伸段中的一个包括tracr序列,其中所述两个互补的核苷酸延伸段用中间核苷酸彼此共价连接,并且其中所述工程化向导核糖核酸多核苷酸能够与核酸内切酶形成复合物,所述核酸内切酶与seq id no:1-549、602-1276中的任一者或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性,并将所述复合物靶向所述靶dna分子的所述靶序列。在一些实施例中,所述核酸内切酶包括seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。在一些实施例中,所述靶向核酸序列与细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述靶向核酸序列的长度为15-24个核苷酸。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1645-1662中的任一者具有至少80%同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:568-585或1643-1644中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1648、1650或1661中的任一者具有至少80%同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:571、573或584中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。

7、在一些方面,本公开提供了一种工程化载体,所述工程化载体包括本文所描述的核酸中的任何核酸。在一些实施例中,其中所述载体是质粒、微环、celid、腺相关病毒(aav)源性病毒体、慢病毒或腺病毒

8、在一些方面,本公开提供了一种细胞,所述细胞包括本文所描述的载体中的任何载体或本文所描述的核酸中的任何核酸。在一些实施例中,所述细胞是细菌、古细菌、真核、真菌、植物、哺乳动物或人细胞。

9、在一些方面,本公开提供了一种产生核酸内切酶的方法,所述方法包括培养本文所描述的细胞中的任何细胞。

10、在一些方面,本公开提供了一种用于结合、切割、标记或修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括:使所述双链脱氧核糖核酸多核苷酸与2类ii型cas核酸内切酶接触,所述2类ii型cas核酸内切酶与工程化向导核酸结构复合,所述工程化向导核酸结构被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合;其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(pam);并且其中所述pam包括根据seq id no:550-567中的任一者的序列。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1277-1641或1683中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体,或者其中所述核酸内切酶进一步包括与seq id no:1-549或602-1276中的任一者的pi结构域具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的pi结构域。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:259、296或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括ruvc结构域。在一些实施例中,所述ruvc结构域与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述ruvc结构域与seq id no:259、296或484中的任一者的ruvc结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述hnh结构域与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述hnh结构域与seq id no:259、296或484中的任一者的hnh结构域或其变体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述核酸内切酶包括seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1645-1662中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:568-585或1643-1644中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述工程化向导核酸结构包括与seq idno:1648、1650或1661中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:571、573或584中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,并且包括:(i)靶向核酸序列,所述靶向核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述靶向核酸序列与细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述靶向核酸序列的长度为15-24个核苷酸。

11、在一些方面,本公开提供了一种编辑细胞中的aavs1基因座的方法,所述方法包括使以下与所述细胞接触:(a)rna引导的核酸内切酶;以及(b)工程化向导核酸结构,其中所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,并且所述工程化向导核酸结构包括间隔子序列,所述间隔子序列被配置成与所述aavs1基因座的区杂交,其中所述工程化向导核酸结构包括与seq id no:1665-1666中的任一者的至少18个连续核苷酸或其反向补体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的靶向序列。在一些实施例中,所述工程化向导核酸结构与seq id no:1663或1664中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述工程化向导核酸结构是mg71-2-aavs1-sgrna-c3或mg71-2-aavs1-sgrna-e2。

12、在一些方面,本公开提供了一种编辑细胞中的trac基因座的方法,所述方法包括使以下与所述细胞接触:(a)rna引导的核酸内切酶;以及(b)工程化向导核酸结构,其中所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,并且所述工程化向导核酸结构包括间隔子序列,所述间隔子序列被配置成与所述trac基因座的区杂交,其中所述工程化向导核酸结构包括与seq id no:1668或1676-1682中的任一者的至少18个连续核苷酸或其反向补体具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的靶向序列。在一些实施例中,所述工程化向导核酸结构与seq id no:1667或1669-1675中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施例中,所述工程化向导核酸结构是mg73-1-trac-sgrna-g3、mg89-2-trac-sgrna-f1、mg89-2-trac-sgrna-g5、mg89-2-trac-sgrna-e5、mg89-2-trac-sgrna-f5、mg89-2-trac-sgrna-g1、mg89-2-trac-sgrna-e1、mg89-2-trac-sgrna-b1。在一些实施例中,所述工程化向导核酸结构被配置成与所述核酸内切酶形成复合物,并且包括:(i)靶向核酸序列,所述靶向核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述靶向核酸序列的长度为15-24个核苷酸。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1645-1662中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:568-585或1643-1644中的任一者的非简并核苷酸具有至少80%同一性的序列。在一些实施例中,所述工程化向导核酸结构包括与seq id no:1648、1650或1661中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的tracr序列,或者其中所述工程化向导核酸结构包括与seq id no:571、573或584中的任一者的非简并核苷酸具有至少80%同一性的序列。在一些实施例中,所述rna引导的核酸内切酶是2类、ii型cas核酸内切酶。在一些实施例中,所述核酸内切酶被配置成对包括seq id no:550-567中的任一者的pam序列具有选择性。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1277-1641或1683中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体,或者其中所述核酸内切酶进一步包括与seq id no:1-549或602-1276中的任一者的pi结构域具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的pi结构域。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶进一步包括pi结构域,所述pi结构域包括与seq id no:259、296或484中的任一者具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列或其变体。在一些实施例中,所述核酸内切酶包括seq id no:1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356或484中的任一者或其与其具有至少55%同一性、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。

13、根据以下具体实施方式,本领域的技术人员将显而易知本公开的额外方面和优势,在具体实施方式中仅示出和描述本公开的说明性实施例。如将认识到,本公开能够具有其它不同的实施例,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和说明书本质上被视为是说明性的而非限制性的。

14、通过引用并入

15、本说明书中所提到的所有公开、专利和专利申请均通过相同的程度引用结合在此,如同特定且单独地指示每个单独的公开、专利或专利申请是通过引用并入的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1