新的2类II型和V型CRISPR-CASRNA指导的内切核酸酶的制作方法

文档序号:30713215发布日期:2022-07-11 11:28阅读:735来源:国知局
新的2类II型和V型CRISPR-CASRNA指导的内切核酸酶的制作方法
cas rna指导的内切核酸酶蛋白和单一指导rna,其中所述grna和所述2类v型crispr-cas rna指导的内切核酸酶蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,其中所述grna能够与所述2类v型crispr-cas rna指导的内切核酸酶蛋白形成复合物,并且其中所述2类v型crispr-cas rna指导的内切核酸酶蛋白具有旁切活性且能够在不使用tracrrna的情况下旁切包含rna的单链多核苷酸。在一些实施方案中,所述2类v型crispr-cas rna指导的内切核酸酶蛋白包含seq id no:4的氨基酸序列或与seq id no:4有至少70%序列同一性的氨基酸序列。在一些实施方案中,所述2类v型crispr-cas rna指导的内切核酸酶蛋白能够旁切单链rna。在一些实施方案中,所述2类v型crispr-cas rna指导的内切核酸酶蛋白能够旁切单链dna/rna杂合体。
13.在另一方面,本文提供了一种工程化系统,所述工程化系统包括:(a)cas12a.1、cas12p或cas12q蛋白或者编码所述cas12a.1、cas12p或cas12q蛋白的核酸;和(b)cas12a.1、cas12p或cas12q grna或者编码cas12a.1、cas12p或cas12q grna的核酸,其中所述grna和所述cas12a.1、cas12p或cas12q蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas12a.1、cas12p或cas12q蛋白形成复合物。
14.在另一方面,本文提供了一种工程化单分子grna,所述工程化单分子grna包含seq id no:116或seq id no:117的支架序列和能够与靶标dna中的靶标序列杂合的间隔子序列。在一些实施方案中,所述靶标dna是病毒dna、植物dna、真菌dna或细菌dna。在一些实施方案中,所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。在一些实施方案中,所述靶标是冠状病毒。在一些实施方案中,所述靶标是sars-cov-2病毒。在一些实施方案中,所述靶标dna是cdna,并已通过逆转录获得。
15.在另一方面,本文提供了一种检测样品中的靶标dna的方法,所述方法包括:(a)将所述样品与以下项接触:(i)cas12a.1、cas12p或cas12q蛋白;(ii)包含能够与靶标dna中的靶标序列杂合的间隔子序列的cas12a.1、cas12p或cas12q grna;和(iii)不与所述grna的所述间隔子序列杂合的经标记检测子寡核苷酸;和(b)测量由所述cas12a.1、cas12p或cas12q蛋白切割所述经标记检测子产生的可检测信号,从而检测所述靶标dna。这种方法可用于诊断,例如检测样品中的病毒或细菌病原体。
16.在另一方面,本文提供了一种修饰靶标dna的方法,所述方法包括(a)将所述靶标dna与以下项接触:(i)cas9.1、cas9.2、cas9.3、cas9.4、cas12a.1、cas12p或cas12q蛋白或者编码它们的核苷酸;和(ii)包含能够与靶标dna中的靶标序列杂合的间隔子序列的cas9.1、cas9.2、cas9.3、cas9.4、cas12a.1、cas12p或cas12q grna。该方法可用于基因治疗应用,以及产生用于治疗递送目的的细胞和用于制备细胞系。
17.在各种实施方案中,本文提供了包含本文所述的工程化系统的任何蛋白质或多核苷酸的组合物、药物组合物、载体、宿主细胞和试剂盒。
附图说明
18.图1a至图1b显示了cas9.1和cas9.2的表达载体图谱。
19.图2a至图2c显示了cas12a.1、cas12p和cas12q的表达载体图谱。
20.图3a是新的cas9.1基因周围的crispr cas簇的示意性图示。图3b显示了cas9.1前
体crrna的正向重复的二级结构。图3c是新的cas9.2基因周围的crispr cas簇的示意性图示。图3d是新的cas9.3基因周围的crispr cas簇的示意性图示。图3e显示了cas9.3前体crrna的正向重复的二级结构。图3f是新的cas9.4基因周围的crispr cas簇的示意性图示。图3g显示了cas9.4前体crrna的正向重复的二级结构。
21.图4a显示了cas9蛋白(seq id no:137-168)的关键催化氨基酸,以及cas9蛋白家族的选定代表中的保守基序的比对。图4b显示了cas9.1(seq id no:1)以及cas9蛋白家族(seq id no:169-176)的其他所选代表的ruvc1、桥螺旋(bridge helix)、ruvcii和ruvciii结构域的比对。图4c显示了cas9.2(seq id no:2)以及cas9蛋白家族(seq id no:170-174和169)的其他所选代表的ruvc1、桥螺旋、ruvcii和ruvciii结构域的比对。图4d显示了cas9.3(seq id no:10)的ruvc1、桥螺旋、ruvcii和ruvciii结构域以及cas9蛋白家族(seq id no:169-176)的其他所选代表的比对。图4e显示了cas9.4(seq id no:11)以及cas9蛋白家族(seq id no:169-176)的其他所选代表的ruvc1、桥螺旋、ruvcii和ruvciii结构域的比对。
22.图5a是新的cas12a.1基因周围的crispr cas簇的示意性图示。图5b显示了cas12a.1前体crrna(seq id no:177)的正向重复的二级结构。图5c是新的cas12p基因周围的crispr cas簇的示意性图示。图5d显示了第一cas12p前体crrna(seq id no:178)和第二cas12p前体crrna(seq id no:179)的正向重复的二级结构。图5e是新的cas12q基因周围的crispr cas簇的示意性图示。图5f显示了cas12q前体crrna(seq id no:180和181)的正向重复的二级结构。
23.图6a显示了cas12蛋白(seq id no:182-217)的关键催化氨基酸,以及cas12a蛋白家族的选定代表中的保守基序的比对。
24.图6b显示了cas12a.1(seq id no:3)与us 20160208243的seq id no:81(seq id no:218)的比对,并且具有46.8%序列同一性;并且图6c显示了cas12a.1(seq id no:3)与us 10,253,365的seq id no:3(seq id no:219)的比对,并且具有46.5%序列同一性。
25.图6d显示了cas12p(seq id no:4)的氨基酸序列,其中ruvc基序加下划线。shmakov等人,2015提及的fncas12a序列被用作鉴定ruv基序的参考。
26.图6e显示了cas12p(seq id no:4)与cas12g1(seq id no:220)的比对。该图显示了cas12p与cas12g1的比对。
27.在下图中,用swiss模型服务器基于fn cas12a结构对cas12p蛋白的结构进行建模。图6f显示了使用swiss模型服务器进行的cas12p的结构分析。图6g显示了cas12p中的非保守氨基酸残基的空间预测。图6h显示了cas12p表面上的电荷分布的近似法。图6i显示了基于蛋白质序列的cas12p(seq id no:4)与fncas12a(seq id no:221)之间的预测结构差异。图6j显示了基于swiss模型服务器结构分析进行的cas12p(seq id no:4)和cas12a蛋白(ascas12a(seq id no:223)、lbcas12a(seq id no:224)和fncas12a(seq id no:221))的ruvciii结构域结构分析。
28.图6k显示了cas12q(seq id no:5)的氨基酸序列,其中ruvc基序加下划线。
29.图7a、图7b、图7c显示了非天然存在的正向重复(人工变体;seq id no:225-239)的预测rna二级结构,产生所述正向重复是为了改善本公开的指导物的茎环稳定性。
30.图8显示了cas12a.1和cas12p对十个pam基序的pam序列偏好的条形图,使用荧光
测定来测量cas12a.1和cas12p的性能。
31.图9a显示了本公开的具有示例性汉塔病毒靶标的ca12a.1(在图中被指定为cas12.1)和cas12p蛋白的特异性切割活性。图9b显示了cas12a.1和cas12p都表现出旁切活性,并可以切割含有ssdna的非靶标。图9c显示了cas12p表现出ssdna和rna报告子旁切,其中使用sars-cov-2灭活病毒作为样品作为靶标。
32.图10显示了在25℃下的新的cas12蛋白的活性。
33.图11显示了在各种盐浓度下的新的cas12蛋白的活性。
34.图12显示了本公开的cas12a.1和cas12p在三种不同商业缓冲液中的性能。
35.图13显示了本公开的cas12a.1和cas12p的无rpa的灵敏度曲线,将各个靶标浓度测量30分钟。
36.图14显示了对于从sars-cov-2rna逆转录的靶标dna,通过cas12a.1和cas12p得到的荧光检测量在37℃和25℃下相等,指示热稳定性和功能和室温。
37.图15显示了cas12p与lbcas12a在25℃下的差异性能。
38.图16显示了使用sars-cov-2作为靶标,cas12p与lbcas12a在25℃下的差异性能,描述于实施例10中。
39.图17显示了cas12p切割ssdna和rna报告子的能力。
40.图18显示了用于检测本文中描述的sars-cov-2的示意性工作流程。
41.图19显示了用于检测本文中描述的sars-cov-2的示意性工作流程。
42.图20显示了cas12p在30-60分钟切割活性后具有最小的背景信号。这提供了低病毒浓度的优点,并表明冻干型式的稳定性。
43.图21显示了在室温下使用cas12p的诊断测定能以纸质型式读出。
44.图22显示了在室温下使用cas12p的诊断测定可以用荧光检测器在孔板中读出。
45.图23显示了本公开的示例性冻干珠。
46.图24显示了使用cas12p/指导物,使用rna报告子,对冻干型式的患者样品和阴性对照样品进行sars-cov-2检测的结果。
47.图25显示了与示例性汉坦病毒靶标的sgrna复合的本公开ca12a.1和cas12p蛋白的特异性dsdna切割时程。时间点:0、30、60和90分钟。
48.图26显示了与示例性汉坦病毒靶标的sgrna复合的本公开ca12a.1和cas12p蛋白的特异性ssdna切割时程。(s):3

fam-ssdna靶标底物。(p):3

fam-ssdna靶标产物。(ntc):asssdna非靶标对照。时间点:0、0.5、1和5分钟。
49.图27显示了与示例性汉坦病毒靶标的sgrna复合的本公开ca12a.1和cas12p蛋白的特异性ssrna切割时程。(s):ssrna靶标底物。(tc):ssdna靶标对照。(ntc):ssrna非靶标对照。时间点:0、1和3小时。
50.图28显示了使用dna寡核苷酸作为报告子,cas12p反应的质谱数据。
51.图29显示了使用dna寡核苷酸作为报告子,cas12p反应的质谱数据。
52.图30显示了使用rna寡核苷酸作为报告子,cas12p反应的质谱数据。
53.图31显示了使用rna寡核苷酸作为报告子,cas12p反应的质谱数据。
54.图32显示了当与cas12p一起使用时,dna-rna嵌合指导物能够实现有效的旁切活性。
55.图33显示了证明cas12a.1和cas12p对ssdna而非dsdna有旁切活性的琼脂糖凝胶。
56.图34显示了在25℃和37℃下,均聚报告子切割的差异效率。结果表明,cas12p切割聚t、聚a和聚c,而cas12a.1显示出对聚c切割的偏好。
57.图35显示了cas12p而非cas12a.1的对于切割rna报告子的旁切(本文中也称为反式切割)能力。
58.图36显示了使用dna和rna作为报告子,cas12p和cas12a.1的旁切活性的动力学。
59.图37显示了使用famq dna-rna嵌合报告子,cas12p和cas12a.1的旁切。
60.图38显示了cas12a.1(seq id no:116)和cas12p(seq id no:117)的成熟指导物支架的序列和二级结构。
61.图39显示了对以下的验证:使用cas12a.1和cas12p,当与靶向sars-cov-2的n基因的间隔子联合使用时,成熟指导物支架可用以检测sar-cov-2。
具体实施方式
62.本文提供了新的2类ii型和新的v型crispr-cas rna指导的系统、制备方法和使用方法。
63.定义
64.在本文中可互换使用的术语“多核苷酸”或“核酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。因此,术语“多核苷酸”和“核酸”涵盖单链dna;双链dna;多链dna;单链rna;双链rna;多链rna;基因组dna;cdna;dna-rna杂合体;以及包含嘌呤和嘧啶碱基或其他天然的、经化学或生物化学修饰的、非天然的、或衍生化的核苷酸碱基的聚合物。
[0065]“可杂合的”或“互补的”或“基本上互补的”是指核酸(例如rna、dna)包含在适当的体外和/或体内温度和溶液离子强度的条件下,使其能够以序列特异性(反向平行)方式非共价结合(即形成watson-crick碱基对和/或g/u碱基对)、“退火”或“杂合”到另一核苷酸(即,核酸特异性结合到互补核酸)的核苷酸序列。
[0066]
应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补就能够特异性杂合。此外,多核苷酸可以在一个或多个区段上杂合,使得间插或相邻区段不参与杂合事件(例如,环结构或发夹结构,

凸起’等)。
[0067]
可以使用任何方便的方法确定核酸内的特定核酸序列段之间的互补性百分比。示例方法包括blast程序(基本局部比对检索工具)和powerblast程序(altschul等人,j.mol.biol.,1990,215,403-410;zhang和madden,genome res.,1997,7,649-656),或使用gap程序(wisconsin sequence analysis package,version 8 for unix,genetics computer group,university research park,madison wis.),例如,使用默认设置,其使用smith和waterman的算法(adv.appl.math.,1981,2,482-489)。
[0068]
术语“肽”、“多肽”和“蛋白质”在本文中可互换使用,并指任何长度的氨基酸的聚合物形式,其可包括编码和非编码氨基酸、经化学或生物化学修饰的或衍生化的氨基酸和具有经修饰的肽骨架的多肽。
[0069]“载体”或“表达载体”是复制子(如质粒、噬菌体、病毒或粘粒),另一dna区段(即“插入物”)可与其附接,以使附接区段在细胞中复制。
[0070]
可以在如下标准教科书中找到分子和细胞生物化学的一般方法:molecular cloning:a laboratory manual,第3版(sambrook等人,harbor laboratory press 2001);short protocols in molecular biology,第4版(ausubel等人编,john wiley&sons 1999);protein methods(bollag等人,john wiley&sons 1996);nonviral vectors for gene therapy(wagner等人编,academic press 1999);viral vectors(kaplift&loewy编,academic press 1995);immunology methods manual(i.lefkovits编,academic press 1997);和cell and tissue culture:laboratory procedures in biotechnology(doyle&griffiths,john wiley&sons 1998),其公开内容通过引用并入本文。
[0071]
在提供了一系列值时,应当理解的是每个中间值,到下限的第十个单位(除非上下文清晰地另外指示),该范围的上限与下限之间以及任何其他陈述的或在所陈述范围内的中间值均被涵盖在本发明之内。这些更小范围的上限和下限可以独立地被包括在更小范围之内,并且也被涵盖在本发明之内,服从于在所陈述范围内任何确切排除的限制。在所陈述的范围包括一个或两个极限时,排除了所包括极限的任一个或两个的范围也被包括在本发明之内。
[0072]
除非另外定义,否则本文中使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。本文提及的所有出版物均通过引用并入本文,以公开和描述与所述出版物相关的方法和/或材料。
[0073]
必须注意,当在本文和附带的权利要求中使用时,单数形式“一个/种(a/an)”和“所述(the)”包括复数指代物,除非上下文明确地指示其他的情况。因此,例如,参考“cas12a.1蛋白”包括多种这样的cas12a.1蛋白,并且提及“grna”或“指导rna”包括提及一个或多个grna及其本领域技术人员已知的等同物,等等。还应注意,可以起草权利要求以排除任何任选的要素。因此,本陈述旨在作为与叙述权利要求要素相关使用“单独”、“仅”等这种排外的术语或者使用“否定”限制的先行基础。
[0074]
i.2类ii型crispr-cas rna指导的系统
[0075]
本文提供了新的2类ii型crispr-cas rna指导的蛋白及其指导rna(“指导rna”在本文中可互换地称为“grna”),构成本公开的2类ii型crispr-cas rna指导的系统。如本文所用,grna可以仅包含rna核苷酸,可包含rna和dna核苷酸,或者可以仅包含dna核苷酸,并因此在称为grna时,可以包含非rna核苷酸。
[0076]
因此,本文提供了包含以下项的系统:(a)cas9.1、cas9.2、cas9.3或cas9.4蛋白或者编码所述cas9.1、cas9.2、cas9.3或cas9.4蛋白的核酸;(b)cas9.1、cas9.2、cas9.3或cas9.4 grna或者编码cas9.1、cas9.2、cas9.3或cas9.4分子rna的核酸,其中所述grna和所述cas9.1、cas9.2、cas9.3或cas9.4蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas9.1、cas9.2、cas9.3或cas9.4蛋白形成复合物。应该理解,如本文所用的“cas9.1-cas9.4”是指以下:cas9.1、cas9.2、cas9.3、cas9.4。
[0077]
这些组分转而又在下文中描述。
[0078]
a.2类ii型crispr-cas rna指导的蛋白
[0079]
本文提供了新的2类ii型和v型crispr-cas rna指导的内切核酸酶,例如,新的cas9蛋白(cas9变体)和新的cas12a蛋白(cas12a变体)以及新的cas12亚型。
[0080]
表1显示了本公开的新的cas9蛋白的蛋白质序列。在一些实施方案中,已经使用生物信息学方法推导出来自宏基因组学样品的本公开的新的cas9蛋白。
[0081]
seq id no:1代表本公开的新的cas9变体,cas9.1(长度为1038个氨基酸)。图3a是新的cas9.1基因周围的crispr cas簇的示意性图示。图4a显示了cas9蛋白的关键催化氨基酸,以及cas9蛋白家族的选定代表中的保守基序的比对。图4b显示了cas9.1以及cas9蛋白家族的其他所选代表的ruvc1、桥螺旋、ruvcii和ruvciii结构域的比对。
[0082]
seq id no:2代表本公开的新的cas9变体,cas9.2(长度为1375个氨基酸)。图3c是新的cas9.2基因周围的crispr cas簇的示意性图示。图4c显示了cas9.2和cas9蛋白家族的其他所选代表的ruvc1、桥螺旋、ruvcii和ruvciii结构域的比对。
[0083]
seq id no:10代表本公开的新的cas9变体,cas9.3(长度为1031个氨基酸)。图3d是新的cas9.3基因周围的crispr cas簇的示意性图示。图4d显示了cas9.3以及cas9蛋白家族的其他所选代表的ruvc1、桥螺旋、ruvcii和ruvciii结构域的比对。
[0084]
seq id no:11代表本公开的新的cas9变体,cas9.4(长度为1329个氨基酸)。图3f是新的cas9.4基因周围的crispr cas簇的示意性图示。图4e显示了cas9.4以及cas9蛋白家族的其他所选代表的ruvc1、桥螺旋、ruvcii和ruvciii结构域的比对。
[0085]
表1
[0086]
[0087]
[0088][0089]
如本文所用,cas9.1包括seq id no:1和与seq id no:1有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:1的氨基酸序列的蛋白质和与其有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:1的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0090]
如本文所用,cas9.2包括seq id no:2和与seq id no:2有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:2的氨基酸序列的蛋白质和与其有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、
至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:2的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0091]
如本文所用,cas9.3包括seq id no:10和与seq id no:10有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:10的氨基酸序列的蛋白质和与其有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:10的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0092]
如本文所用,cas9.4包括seq id no:11和与seq id no:11有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:11的氨基酸序列的蛋白质和与其有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:11的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0093]
在一些实施方案中,本公开的cas9蛋白是有催化活性的cas9蛋白,例如有催化活性的cas9.1、cas9.2、cas9.3或cas9.4蛋白。
[0094]
在一些实施方案中,本公开的cas9蛋白在所述靶标序列远端的位点处切割,例如,cas9.1、cas9.2、cas9.3或cas9.4.4蛋白在所述靶标序列远端的位点处切割。
[0095]
在一些实施方案中,本公开的cas9蛋白是催化灭活的cas9蛋白,例如cas9.1、cas9.2、cas9.3或cas9.4蛋白是催化灭活的(dcas9.1、dcas9.2、dcas9.3或dcas9.4蛋白)。
[0096]
在一些实施方案中,本公开的cas9蛋白是切口酶cas9蛋白,例如cas9.1切口酶、cas9.2切口酶、cas9.3切口酶或cas9.4切口酶蛋白。
[0097]
可以修饰本公开的cas9蛋白以包含适体。
[0098]
本公开的cas9蛋白可以进一步融合到结构域(例如催化结构域),以产生双重作用cas蛋白。在一些实施方案中,cas9蛋白进一步融合到碱基编辑器。
[0099]
b.用于2类ii型crispr-cas rna指导的蛋白的grna
[0100]
本公开提供靶向dna的rna,其将本公开的新的cas9蛋白的活性指向靶标dna内的特定靶标序列。如本文所提供的,这些靶向dna的rna在本文中称为“grna”或“grna”。一般而言,如本文所提供的,cas9变体grna包含第一区段(在本文中也称为“标靶-rna”、“dna靶向区段”或“dna靶向序列”)和第二区段(在本文中也称为“激活子-rna”、“激活子-rna”或“蛋白质结合序列”)。本文还提供了编码本公开的cas9 grna的核苷酸序列。
[0101]
i.标靶-rna
[0102]
本公开的cas9变体grna的标靶-rna包含如下核苷酸序列,其与靶标dna(grna的靶向序列;dna靶向序列;间隔子序列)中的序列互补。标靶-rna可互换地称为crrna。grna的标
靶-rna以序列特异性方式通过杂合(即碱基配对)与靶标dna相互作用。因此,标靶-rna的核苷酸序列可以变化,并确定在所述靶标dna内grna和所述靶标dna发生相互作用的位置。主题grna的标靶-rna可以经修饰(例如,通过基因工程)以与靶标dna内的任何所需序列杂合。
[0103]
标靶-rna的长度可以为约12个核苷酸至约100个核苷酸。例如,标靶-rna的长度可以为约12个核苷酸(nt)至约80nt、约12nt至约50nt、约12nt至约40nt、约12nt至约30nt、约12nt至约25nt、约12nt至约20nt、或约12nt至约19nt。例如,标靶-rna的长度可以为约19nt至20nt、约19nt至25nt、约19nt至30nt、约19nt至35nt、约19nt至40nt、约19nt至45nt、约19nt至50nt、约19nt至60nt、约19nt至70nt、约19nt至80nt、约19nt至90nt、约19nt至100nt、约20nt至25nt、约20nt至30nt、约20nt至35nt、约20nt至40nt、约20nt至45nt、约20nt至50nt、约20nt至60nt、约20nt至70nt、约20nt至80nt、约20nt至90nt、或约20nt至约100nt。
[0104]
通常,cas9的天然未加工的前体crrna包含正向重复和相邻间隔子(允许靶向dna分子的crrna的部分)。在一些实施方案中,使来自未加工前体crrna的正向重复和正向重复突变包含在成熟grna中可以改善grna稳定性。
[0105]
表2显示了本公开的cas9变体的天然存在的crrna的天然存在的正向重复序列。
[0106]
表2:正向重复序列
[0107][0108]
在一些实施方案中,本公开的grna包含非天然存在的工程化正向重复序列,其可以被掺入本公开的工程化grna中。
[0109]
ii.间隔子序列
[0110]
本公开的grna包含与靶标dna互补的间隔子序列。更具体地,标靶-rna的与靶标dna的靶核苷酸序列(dna靶向序列或间隔子序列)互补的核苷酸序列的长度可以为至少约12nt。例如,标靶-rna的与靶标dna的靶标序列互补的dna靶向序列的长度可以为至少约12nt、至少约15nt、至少约18nt、至少约19nt、至少约20nt、至少约25nt、至少约30nt、至少约35nt或至少约40nt。例如,标靶-rna的与靶标dna的靶标序列互补的dna靶向序列的长度可以为约12个核苷酸(nt)至约80nt、约12nt至50nt、约12nt至45nt、约12nt至40nt、约12nt至35nt、约12nt至30nt、约12nt至25nt、约12nt至20nt、约12nt至19nt、约19nt至20nt、约19nt至25nt、约19nt至30nt、约19nt至35nt、约19nt至40nt、约19nt至45nt、约19nt至50nt、约19nt至60nt、约20nt至25nt、约20nt至30nt、约20nt至35nt、约20nt至40nt、约20nt至45nt、约20nt至50nt、或约20nt至约60nt。标靶-rna的与靶标dna的核苷酸序列(靶标序列)互补的核苷酸序列(dna靶向序列)的长度可以为至少约12nt。在一些实施方案中,标靶-rna的与靶标dna的靶标序列互补的dna靶向序列的长度为20个核苷酸。在一些实施方案中,标靶-rna的与靶标dna的靶标序列互补的dna靶向序列的长度为19个核苷酸。
[0111]
标靶-rna的间隔子序列与靶标dna的靶标序列之间的互补性百分比可以是至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。在一些实施方案中,在靶标dna的互补链的靶标序列的
1-25个连续的最5'的核苷酸上,标靶-rna的dna靶向序列与靶标dna的靶标序列之间的互补性百分比为100%。在一些实施方案中,在约1-25个连续的核苷酸上,标靶-rna的dna靶向序列与靶标dna的靶标序列之间的互补性百分比为至少60%。在一些实施方案中,在靶标dna的互补链的靶标序列的1-25个连续的最5'的核苷酸上,标靶-rna的dna靶向序列与靶标dna的靶标序列之间的互补性百分比为100%,并且在其余部分上低至0%。在这种情况下,可以认为dna靶向序列的长度为1-25个核苷酸。
[0112]
在一些实施方案中,本公开的cas9 grna的间隔子序列指向哺乳动物生物中的靶标序列。在一些实施方案中,间隔子序列指向非哺乳动物生物中的靶标序列。
[0113]
在一些实施方案中,本公开的cas9 grna的间隔子序列指向作为人的序列的靶标序列。在一些实施方案中,靶标序列是非人灵长类动物的序列。
[0114]
在一些实施方案中,本公开的cas9 grna的间隔子序列指向治疗靶标的所选靶标序列。
[0115]
在一些实施方案中,本公开的cas9 grna的间隔子序列指向诊断靶标的所选靶标序列-例如,在此类实施方案中,将本公开的经标记dcas9和指向诊断靶标dna的grna与靶标dna、或包含靶标dna的细胞、或包含靶标dna的样品接触。
[0116]
iii.激活子-rna
[0117]
本公开的cas9变体grna的激活子-rna与它的同源的本公开cas9变体结合。激活子-rna可互换地称为tracrrna。grna通过上述标靶-rna将结合的cas9蛋白指导到靶标dna内的特定核苷酸序列。cas9变体grna的激活子-rna包含两段彼此互补的核苷酸。
[0118]
iv.双分子cas9 grna
[0119]
在一些实施方案中,本文提供了本公开的新的cas9蛋白的双分子(两分子)cas9 grna。这种grna包含两个单独的rna分子(激活子rna-tracrna;和靶向rna-crrna)。主题双分子grna的两个rna分子中的每一个包括彼此互补的两段核苷酸,使得两个rna分子的互补核苷酸杂合以形成grna的双链的rna双链体。
[0120]
双分子grna可以设计成允许标靶-rna与激活子-rna受控结合(即条件结合)。因为除非激活子-rna和标靶-rna两者结合在与本公开cas9变体的功能复合物中,否则双分子grna是非功能性的,所以通过使激活子-rna与标靶-rna之间的结合为诱导型,则双分子grna可以为诱导型(例如,药物诱导型)。作为一个非限制性示例,rna适体可用于调节(即,控制)激活子-rna与标靶-rna的结合。因此,激活子-rna和/或标靶-rna可包含rna适体序列。
[0121]
可以修饰双分子指导物以包含适体
[0122]
v.单分子cas9变体grna
[0123]
在一些实施方案中,本文提供了本公开的新的cas9蛋白的cas9 grna,所述cas9 grna包含单分子grna(在本文中可互换地称为sgrna)。
[0124]
因此,本文提供了一种工程化单分子grna,所述工程化单分子grna包括:
[0125]
a.能够与靶标dna中的靶标序列杂合的标靶-rna;以及
[0126]
b.能够与所述标靶-rna杂合以形成双链的rna双链体的激活子-rna,所述激活子-rna包括以下的激活子-rna,
[0127]
其中所述标靶-rna和所述激活子-rna彼此共价连接,其中所述单分子grna能够与
本公开的新的cas9蛋白形成复合物,并且其中所述标靶-rna与所述靶标序列的杂合能够将本公开的cas9蛋白靶向所述靶标dna。
[0128]
主题单分子grna包含彼此互补的两个核苷酸区段(标靶-rna和激活子-rna),可以通过间插核苷酸(“接头”或“接头核苷酸”)共价连接并杂合形成激活子-rna的双链的rna双链体(dsrna双链体),从而产生茎环结构。在一些实施方案中,标靶-rna和激活子-rna通过标靶-rna的3'端和激活子-rna的5'端共价连接。在其他实施方案中,激活子-rna通过标靶-rna的5'端和激活子-rna的3'端共价连接。
[0129]
在一些实施方案中,标靶-rna和激活子-rna以5'至3'取向排列。
[0130]
在一些实施方案中,激活子-rna和标靶-rna以5'至3'取向排列。
[0131]
在一些实施方案中,与对应的野生型tracrrna和/或crrna的序列相比,单分子grna包含一种或多种序列修饰。
[0132]
在一些实施方案中,标靶-rna和激活子-rna通过接头彼此共价连接。
[0133]
当存在时,单分子grna的接头的长度可以为约3个核苷酸至约30个核苷酸。在示例性实施方案中,单分子grna的接头是4、5、6或7nt。
[0134]
示例性单分子grna包含两段互补的核苷酸,其杂合以形成dsrna双链体。在一些实施方案中,单分子grna的两段互补的核苷酸(或编码该段的dna)之一与激活子-rna之一有至少约60%同一性。例如,单分子grna的两段互补的核苷酸(或编码该段的dna)之一与激活子-rna有至少约65%同一性、至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约98%同一性、至少约99%同一性或100%同一性。
[0135]
可以工程化激活子-rna和标靶-rna区段,同时确保grna的蛋白质结合结构域的结构是保守的。因此,可以考虑靶向dna的rna的天然存在的蛋白质结合结构域的rna折叠结构,以设计人工蛋白质结合结构域(双分子或单分子版本)。
[0136]
单分子grna中的激活子-rna的长度可以为约10个核苷酸至约100个核苷酸。例如,激活子-rna的长度可以为约15个核苷酸(nt)至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt或约15nt至约25nt。
[0137]
同样关于本公开的单分子和双分子grna,激活子-rna的dsrna双链体的长度可以为约6个核苷酸(nt)至约50bp。例如,激活子-rna的dsrna双链体的长度可以为约6nt至约40nt、约6nt至约30bp、约6nt至约25nt、约6nt至约20nt、约6nt至约15nt、约8nt至约40nt、约8nt至约30bp、约8nt至约25nt、约8nt至约20nt、或约8nt至约15nt。例如,激活子-rna的dsrna双链体的长度可以为约8nt至约10nt、约10nt至约15nt、约15nt至约18nt、约18nt至约20nt、约20nt至约25nt、约25nt至约30nt、约30nt至约35nt、约35nt至约40nt、或约40nt至约50nt。在一些实施方案中,激活子-rna的dsrna双链体的长度为8-15个碱基对。杂合以形成激活子-rna的dsrna双链体的核苷酸序列之间的互补性百分比可以是至少约60%。例如,杂合以形成激活子-rna的dsrna双链体的核苷酸序列之间的互补性百分比可以是至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%。在一些实施方案中,杂合以形成激活子-rna的dsrna双链体的核苷酸序列之间的互补性百分比为100%。
[0138]
在一些实施方案中,本公开的cas9 grna的间隔子序列(无论是单分子grna或双分
子grna)指向哺乳动物生物(例如,人或非人灵长类动物)中的靶标序列。在一些实施方案中,本公开的cas9 grna的间隔子序列指向细菌中的靶标序列。
[0139]
在一些实施方案中,本公开的cas9 grna的间隔子序列指向病毒中的靶标序列。在一些实施方案中,本公开的cas9 grna的间隔子序列指向植物中的靶标序列。
[0140]
在一些实施方案中,可以修饰本公开的单分子cas9 grna以包含适体。
[0141]
vi.grna阵列
[0142]
本公开的cas9 grna可以作为grna阵列提供。
[0143]
grna阵列包括串联排列的多于一个grna,并且可以被加工成两个或更多个单独的grna。因此,在一些实施方案中,前体cas9grna阵列包含两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、2个、3个、4个或5个)grna(例如,串联排列为前体分子)。在一些实施方案中,可以在阵列(前体grna阵列)上存在两个或更多个grna。本公开的cas9蛋白可以将前体grna阵列切割成单独的grna。
[0144]
在一些实施方案中,cas9 grna阵列包含2个或更多个grna(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、或者7个或更多个grna)。给定阵列的grna可以靶向相同靶标dna的不同靶位点(即,可以包含与之杂合的指导序列)。在一些实施方案中,前体grna阵列的两个或更多个grna具有相同的指导序列。在一些实施方案中,前体grna阵列包含靶向相同靶标dna内的不同靶位点的两个或更多个grna。在一些实施方案中,前体grna阵列包含靶向不同靶标dna的两个或更多个grna。
[0145]
ii.2类v型crispr-cas rna指导的系统
[0146]
本文提供了新的2类v型crispr-cas rna指导的蛋白及其grna,构成本公开的新的2类v型crispr-cas rna指导的系统。
[0147]
本文提供了如下工程化系统,所述工程化系统包括:2类v型crispr-cas rna指导的内切核酸酶蛋白和单一指导rna,其中所述grna和所述2类v型crispr-cas rna指导的内切核酸酶蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,其中所述grna能够与所述2类v型crispr-cas rna指导的内切核酸酶蛋白形成复合物,并且其中所述2类v型crispr-cas rna指导的内切核酸酶蛋白具有旁切活性且能够在不使用tracrrna的情况下旁切包含rna的单链多核苷酸。在一些实施方案中,所述2类v型crispr-cas rna指导的内切核酸酶蛋白包含seq id no:4的氨基酸序列或与seq id no:4有至少70%序列同一性的氨基酸序列。在一些实施方案中,所述2类v型crispr-cas rna指导的内切核酸酶蛋白能够旁切单链rna。在一些实施方案中,所述2类v型crispr-cas rna指导的内切核酸酶蛋白能够旁切单链dna/rna杂合体。
[0148]
本文还提供了以下工程化系统,所述工程化系统包括:(a)cas12a.1、cas12p或cas12q蛋白或者编码所述cas12a.1、cas12p或cas12q蛋白的核酸;和(b)cas12a.1、cas12p或cas12q grna或者编码cas12a.1、cas12p或cas12q grna的核酸,其中所述grna和所述cas12a.1、cas12p或cas12q蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas12a.1、cas12p或cas12q蛋白形成复合物。
[0149]
这些组分转而又在下文中描述。
[0150]
a.2类v型crispr-cas rna指导的蛋白
[0151]
本文提供了新的2类v型crispr-cas rna指导的内切核酸酶,例如,本公开的新的
706区与靶标dna的结合和切割有关,并且wedge iii区域的842-852区与前体crna加工有关(swarts等人,2017)。在与cas12p相比时,鉴于位置699上序列kngnpqkgy(seq id no:113)和位置844上pake(seq id no:114)的缺失,所述酶在那些区域上呈现低同源性。由于这些区域的催化相关性,可以将序列变化与关于催化看到的变化相关。预测缺失会对cas12p的二级结构产生影响。这些图显示cas12p的模型(浅灰色)和fncas12a的结构(深灰色)的叠加,缺失的序列以黑色显示。缺乏序列kngnpqy(seq id no:115)反映在环缩短上。缺乏pake序列(seq id no:114;加上环上的其他变化)减少环长度并降低cas12p在该位置上的负电荷。图6j显示了基于swiss模型服务器结构分析进行的cas12p的ruvciii结构域结构分析。shmakov等人,2015提及的fncas12a序列被用作鉴定ruv基序的参考。尽管在cas12p和原型cas12a蛋白上ruvciii区域是保守的,但cas12p在所述结构域周围的序列上有几个差异。这些变化的存在对cas12p的二级结构产生影响(如黑色所示),并且可以解释该酶的差异性rna切割活性。在图中描绘的结构模型中,研究的cas12a酶的ruvciii区域的结构和cas12p的模型的叠加。cas12p的二级结构的变化被圈出来且以黑色显示。图9b、图9c和图17显示了该新的cas12p酶的独特旁切活性。
[0158]
seq id no:5代表本公开的新的cas12,cas12q(长度为1137个氨基酸)。图5e是新的cas12q基因周围的crispr cas簇的示意性图示。图6k显示了本公开的新的cas12蛋白cas12q的cas12q序列,其中ruvc基序加划线。shmakov等人,2015提及的fncas12a序列被用作鉴定ruv基序的参考。seq id no:15显示了编码本公开的cas12q的核苷酸序列。
[0159]
表3a
[0160]
[0161]
[0162][0163]
如本文所用,cas12a.1包括seq id no:3和与seq id no:3有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:3的氨基酸序列的蛋白质和与其有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:3的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0164]
如本文所用,cas12p包括seq id no:4和与seq id no:4有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:4的氨基酸序列的蛋白质和与其有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:4的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0165]
本文还提供了包含seq id no:222的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:222的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0166]
如本文所用,cas12q包括seq id no:5和与seq id no:5有至少70%-99.5%序列同一性的蛋白质。因此,本文提供了包含seq id no:5的氨基酸序列的蛋白质和与其有至少
70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列同一性的蛋白质。本文还提供了编码包含seq id no:5的氨基酸序列的蛋白质和与其有至少70%-99.5%序列同一性的蛋白质的核酸。
[0167]
表3b显示了本公开的新的cas12蛋白的示例性核苷酸序列和示例性密码子优化的核酸序列。
[0168]
表3b
[0169]
[0170]
[0171]
[0172]
[0173]
[0174]
[0175]
[0176]
[0177][0178]
表4a显示了如本文所例示的本公开的新的cas12蛋白的结构和功能特征。表4b显示了对应的crispr阵列的天然间隔子的数量和序列。表中的空白单元格不表示不存在值/属性,而是本文尚未示例。
[0179]
表4a
[0180]
[0181][0182]
表4b
[0183]
[0184][0185]
在一些实施方案中,本公开的cas12蛋白是有催化活性的cas12蛋白,例如有催化活性的cas12a.1、cas12p或cas12q蛋白。
[0186]
在一些实施方案中,本公开的cas12蛋白在所述靶标序列远端的位点处切割,例如,cas12a.1、cas12p或cas12q蛋白在所述靶标序列远端的位点处切割。
[0187]
在一些实施方案中,本公开的cas12蛋白是催化失活的cas12蛋白,例如cas12a.1、cas12p或cas12q蛋白是催化失活的(dcas12a.1、dcas12p或dcas12q蛋白)。
[0188]
在一些实施方案中,本公开的cas12蛋白是切口酶cas12蛋白,例如cas12a.1切口酶、cas12p切口酶或cas12q切口酶蛋白。
[0189]
在一些实施方案中,可以修饰本公开的cas12蛋白以包含适体。
[0190]
在一些实施方案中,本公开的cas12蛋白可以进一步融合到结构域(例如催化结构域),以产生双重作用cas蛋白。在一些实施方案中,cas12a蛋白进一步融合到碱基编辑器。
[0191]
b.2类v型crispr-cas rna指导的蛋白的旁切活性
[0192]
除了切割靶向dna中的靶标序列的能力之外,本公开的cas12蛋白还具有旁切能力(反式切割活性),即一旦因检测到靶标dna而被激活,就混杂地切割非靶向单链dna(ssdna)或rna的能力。不受任何理论或机制的束缚,一般而言,一旦当样品包含与grna杂合的靶标序列(即样品包含靶向dna)时本公开的cas12蛋白被grna激活发生,cas12就可以成为无序地切割不包含grna的靶标序列(非靶标寡核苷酸,grna的指导序列不与之杂合)的寡核苷酸(例如ssdna、rna、嵌合rna/dna)的核酸酶。因此,当样品中存在靶向dna(双链或单链)时(例如,在一些实施方案中,超过阈值量),结果可以是样品中的单链寡核苷酸(例如ssdna、ssrna、单链嵌合rna/dna)被切割,这可以使用任何方便的检测方法(例如,使用经标记检测子dna、rna或dna/rna嵌合体)检测到。
[0193]
因此,本文提供了用于检测样品中的靶标dna(dsdna或ssdna)的方法和组合物。还提供了用于切割非靶标寡核苷酸的方法和组合物,可以利用检测子。下文进一步详细描述这些实施方案。
[0194]
c.用于2类v型crispr-cas rna指导的蛋白的grna
[0195]
本公开提供靶向dna的rna,其将本公开的新的cas12蛋白的活性指向靶标dna内的特定靶标序列。如上针对本公开的新的cas9蛋白所述,这些靶向dna的rna在本文中称为“grna”或“grna”。一般而言,如本文所提供的,cas12的grna包含含有间隔子(dna靶向序列)和cas12a“蛋白结合序列”两者(一起称为crrna)的单个区段。本文还提供了编码本公开的cas12a grna的核苷酸序列。
[0196]
i.间隔子序列
[0197]
本公开的cas12蛋白是单crrna指导的内切核酸酶(单指导rna,sgrna),而本公开的cas9蛋白由双rna系统指导,所述双rna系统由crrna和反式激活crrna(tracrrna)组成。本公开的cas12指导物的crrna包含与靶标dna中的序列(dna靶向序列或间隔子)互补的核苷酸序列。
[0198]
本公开的cas12 grna的crrna部分的长度可以为约25-50nt。在一些实施方案中,长度可以为约40-43nt。
[0199]
在计算机上由对应的crispr基因座推导出cas12a.1和cas12p的成熟指导物支架。图38显示了cas12a.1(5’aaauuucuacuguaguagau3’)(seq id no:116;分图a)和cas12p(5’agauuucuacuuuuguagau3’)(seq id no:117;分图b)的支架的二级结构。然后可以将这些成熟支架与可变靶向间隔子序列连接,从而产生sgrna。因此,在一些实施方案中,本文提供了一种工程化单分子grna,所述工程化单分子grna包含seq id no:116或seq id no:117的支架序列和能够与靶标dna中的靶标序列杂合的间隔子序列。在一些实施方案中,所述靶标dna是病毒dna、植物dna、真菌dna或细菌dna。在一些实施方案中,所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。在一些实施方案中,所述靶标是冠状病毒。在一些实施方案中,所述靶标是sars-cov-2病毒。在一些实施方案中,所述靶标dna是cdna,并已通过逆转录获得。
[0200]
cas12 grna的dna靶向间隔子序列通常以序列特异性方式通过杂合(即碱基配对)与靶标dna相互作用。因此,dna靶向序列的核苷酸序列可以变化,并确定所述靶标dna内grna和所述靶标dna发生相互作用的位置。主题cas12 grna的dna靶向序列可以经修饰(例如,通过基因工程)以与靶标dna内的所需序列杂合。
[0201]
主题cas12 grna的dna靶向序列的长度可以为约8个核苷酸至约30个核苷酸。例如,长度可以为23个核苷酸。
[0202]
crrna的dna靶向间隔子序列与靶标dna的靶标序列之间的互补性百分比可以是至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。在一些实施方案中,在靶标dna的互补链的靶标序列的1-23个连续的最5'的核苷酸上,crrna-rna的dna靶向序列与靶标dna的靶标序列之间的互补性百分比为100%。在一些实施方案中,在约1-23个连续的核苷酸上,crrna的dna靶向序列与靶标dna的靶标序列之间的互补性百分比为至少60%。在一些实施方案中,在靶标dna的互补链的靶标序列的1-23个连续的最5'的核苷酸上,crrna的dna靶向序列与靶标dna的靶标序列之间的互补性百分比为100%,并且在其余部分上低至0%。在这种情况下,可以认为dna靶向序列的长度为1-23个核苷酸。
[0203]
通常,cas12的天然未加工的前体crrna包含正向重复和相邻间隔子(允许靶向dna分子的crrna的部分)。在一些实施方案中,使来自未加工前体crrna的正向重复和正向重复突变包含在本公开的cas12 grna中,改善grna稳定性。
[0204]
表5a显示了本公开的cas12蛋白的crispr基因座(如在细菌dna中发现的)中的预测的(推定的)天然存在的正向重复序列。这些是crispr基因座contig(如在细菌dna中发现的)中的预测天然序列。本公开的grna有一部分正向重复与所述间隔子连接。
[0205]
表5a:正向重复序列
[0206][0207]
在一些实施方案中,crrna包含非天然存在的工程化的正向重复序列。表5b显示了非天然存在的工程化正向重复序列,其可以被掺入本公开的工程化grna中。
[0208]
预测的非天然存在的工程化正向重复序列的预测rna二级结构在图7a至图7c中示出。
[0209]
表5b
[0210][0211][0212]
在一些实施方案中,本公开的cas12 grna的间隔子序列指向哺乳动物生物中的靶标序列。在一些实施方案中,间隔子序列指向非哺乳动物生物中的靶标序列。
[0213]
在一些实施方案中,本公开的cas12 grna的间隔子序列指向作为人的序列的靶标序列。在一些实施方案中,靶标序列是非人灵长类动物的序列。
[0214]
在一些实施方案中,本公开的cas12 grna的间隔子序列指向哺乳动物生物(例如,
人或非人灵长类动物)中的靶标序列。
[0215]
在一些实施方案中,本公开的cas12 grna的间隔子序列指向细菌中的靶标序列。
[0216]
在一些实施方案中,本公开的cas12 grna的间隔子序列指向病毒中的靶标序列。
[0217]
在一些实施方案中,本公开的cas12 grna的间隔子序列指向植物中的靶标序列。
[0218]
可以修饰本公开的cas12 grna以包含适体。
[0219]
ii.pam特异性
[0220]
tctn和tgtn被分别鉴定为cas12a.1和cas12p的有效pam序列。
[0221]
iii.grna阵列
[0222]
在一些实施方案中,本公开的cas12 grna可以作为grna阵列提供。
[0223]
本公开的这种grna阵列包含串联排列的多于一个grna,并且可以被加工成两个或更多个单独的grna。因此,在一些实施方案中,前体cas12 grna阵列包含两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、2个、3个、4个或5个)grna(例如,串联排列为前体分子)。在一些实施方案中,可以在阵列(前体grna阵列)上存在两个或更多个grna。本公开的cas12蛋白可以将前体grna阵列切割成单独的grna。
[0224]
在一些实施方案中,cas12 grna阵列包含2个或更多个grna(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、或者7个或更多个grna)。给定阵列的grna可以靶向相同靶标dna的不同靶位点(即,可以包含与之杂合的指导序列)。在一些实施方案中,前体grna阵列的两个或更多个grna具有相同的指导序列。在一些实施方案中,前体grna阵列包含靶向相同靶标dna内的不同靶位点的两个或更多个grna。在一些实施方案中,前体grna阵列包含靶向不同靶标dna的两个或更多个grna。
[0225]
iii.使用方法-修饰和治疗剂
[0226]
a.靶标dna的修饰
[0227]
本文提供了本公开的新的cas9和cas12蛋白的用途。因此,本文提供了一种修饰靶标dna的方法,所述方法包括将靶标dna与本文所述的任一种cas9系统或cas12系统接触。这些方法可用于治疗应用
[0228]
在一些实施方案中,靶标dna是体外染色体的一部分。在一些实施方案中,靶标dna是体内染色体的一部分。
[0229]
在一些实施方案中,靶标dna是细胞中染色体的一部分。
[0230]
在一些实施方案中,靶标dna是染色体外dna。
[0231]
在一些实施方案中,靶标dna在细胞中,其中所述细胞选自由以下组成的组:古细菌细胞、细菌细胞、真核细胞、真核单细胞生物、体细胞、生殖细胞、干细胞、植物细胞、藻类细胞、动物细胞、无脊椎动物细胞、脊椎动物细胞、鱼细胞、青蛙细胞、鸟细胞、哺乳动物细胞、猪细胞、母牛细胞、山羊细胞、绵羊细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、非人灵长类动物细胞和人细胞。
[0232]
在一些实施方案中,靶标dna是寄生虫的dna。
[0233]
在一些实施方案中,靶标dna是病毒dna。
[0234]
在一些实施方案中,靶标dna是细菌dna。
[0235]
在一些实施方案中,修饰包括在靶标dna中引入双链断裂。
[0236]
在一些实施方案中,接触在允许非同源末端接合或同源定向修复的条件下发生。
[0237]
在一些实施方案中,所述方法包括将所述靶标dna与供体多核苷酸接触,其中所述供体多核苷酸、所述供体多核苷酸的一部分、所述供体多核苷酸的拷贝、或所述供体多核苷酸的拷贝的一部分整合到所述靶标dna中。
[0238]
在一些实施方案中,所述方法不包括将所述细胞与供体多核苷酸接触,其中所述靶标dna被修饰,使得所述靶标dna内的核苷酸缺失。
[0239]
b.治疗应用
[0240]
本公开提供了新的cas9蛋白、新的cas12a蛋白和新的cas12蛋白亚型、工程化系统、编码所述系统的组分的一个或多个多核苷酸、以及包含编码所述系统的组分的一个或多个多核苷酸的载体或递送系统,用于治疗方法。治疗方法可包括基因或基因组编辑,或者基因疗法。治疗方法包括使用和递送本公开的新的cas9和cas12蛋白。因此,在一些实施方案中,本文提供了一种修饰靶标dna的方法,所述方法包括将靶标dna、包含靶标dna的细胞、或具有含靶标dna的细胞的受试者与本文所述的任一种cas9系统或cas12系统接触。
[0241]
在一些实施方案中,靶标dna是体外染色体的一部分。在一些实施方案中,靶标dna是体内染色体的一部分。
[0242]
在一些实施方案中,靶标dna是细胞中染色体的一部分。
[0243]
在一些实施方案中,靶标dna是染色体外dna。
[0244]
在一些实施方案中,靶标dna在细胞中,其中所述细胞选自由以下组成的组:古细菌细胞、细菌细胞、真核细胞、真核单细胞生物、体细胞、生殖细胞、干细胞、植物细胞、藻类细胞、动物细胞、无脊椎动物细胞、脊椎动物细胞、鱼细胞、青蛙细胞、鸟细胞、哺乳动物细胞、猪细胞、母牛细胞、山羊细胞、绵羊细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、非人灵长类动物细胞和人细胞。
[0245]
在一些实施方案中,靶标dna在细胞外。
[0246]
在一些实施方案中,靶标dna在体外细胞内。
[0247]
在一些实施方案中,靶标dna在体内细胞内。
[0248]
在一些实施方案中,修饰包括在靶标dna中引入双链断裂。
[0249]
在一些实施方案中,接触在允许非同源末端接合或同源定向修复的条件下发生。
[0250]
在一些实施方案中,所述方法包括将所述靶标dna与供体多核苷酸接触,其中所述供体多核苷酸、所述供体多核苷酸的一部分、所述供体多核苷酸的拷贝、或所述供体多核苷酸的拷贝的一部分整合到所述靶标dna中。
[0251]
在一些实施方案中,所述方法不包括将所述细胞与供体多核苷酸接触,其中所述靶标dna被修饰,使得所述靶标dna内的核苷酸缺失。
[0252]
在一些实施方案中,治疗方法包括修饰包含所关注的基因的靶标序列和/或所关注的基因的调节区的靶标dna,所述方法包括向细胞中递送以下项,包括靶标dna、本公开的cas9蛋白和一个或多个cas9 grna、本公开的cas12蛋白和一个或多个cas12 grna、编码本公开的cas9蛋白的一个或多个核苷酸和一个或多个cas9 grna、或编码本公开的cas12蛋白的一个或多个核苷酸和一个或多个cas12grna。
[0253]
在一些实施方案中,所关注的基因在真核细胞内,例如,人或非人灵长类动物细胞内。
[0254]
在一些实施方案中,所关注的基因在植物细胞内。
[0255]
在一些实施方案中,递送包括向细胞递送本公开的cas9蛋白(或编码该蛋白的一个或多个核苷酸)和一个或多个cas9 grna。
[0256]
在一些实施方案中,递送包括向细胞递送本公开的cas12蛋白(或编码该蛋白的一个或多个核苷酸)和一个或多个cas12 grna。
[0257]
在一些实施方案中,递送包括向细胞递送编码本公开的cas9蛋白的一个或多个核苷酸和一个或多个cas9 grna。
[0258]
在一些实施方案中,递送包括向细胞递送编码本公开的cas12蛋白的一个或多个核苷酸和一个或多个cas12 grna。
[0259]
通过本领域技术人员已知的任何各种递送方法,可以实现向细胞中递送cas9或cas12组分。作为非限制性示例,这些组分可以与脂质组合。作为另一个非限制性示例,这些组分与颗粒组合或配制成颗粒,例如纳米粒子。
[0260]
将核酸和/或蛋白质引入宿主细胞中的方法在本领域中是已知的,并且可以使用任何方便的方法将主题核酸(例如,表达构建体/载体)引入靶标细胞(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、人细胞等)中。合适的方法包括例如病毒感染、转染、缀合、原生质体融合、脂转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(pei)介导的转染、deae-右旋糖酐介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米粒子介导的核酸递送等。
[0261]
可以引入grna,例如,作为编码grna的dna分子,或者可以直接作为rna分子(或在适用时嵌合/杂合分子)提供。
[0262]
在一些实施方案中,cas9或cas12蛋白作为编码蛋白质的核酸(例如,mrna、dna、质粒、表达载体、病毒载体等)提供。
[0263]
在一些实施方案中,cas9或cas12蛋白直接作为蛋白质(例如,没有缔合grna或有缔合grna,即核糖核蛋白复合物-rnp)提供。与grna一样,可以通过任何方便的方法将本公开的cas9或cas12蛋白引入细胞中(提供给细胞);这些方法是本领域普通技术人员已知的。作为说明性示例,本公开的cas9或cas12蛋白可以直接注射到细胞中(例如,有或没有grna或编码grna的核酸)。作为另一个示例,可以将cas9或cas12蛋白和grna的预形成复合物引入细胞(例如,真核细胞)中(例如,通过注射,通过核转染;通过与一个或多个组分缀合的蛋白转导结构域(ptd),例如,与本公开的cas9或cas12蛋白缀合,与grna缀合;等)。
[0264]
在一些实施方案中,将核酸(例如,grna;包含编码本公开的cas9或cas12蛋白的核苷酸序列的核酸;等等)和/或多肽(例如,本公开的cas9或cas12蛋白)递送至颗粒中的细胞(例如,靶宿主细胞),或与颗粒相缔合。在一些实施方案中,颗粒是纳米粒子。
[0265]
可以使用颗粒或脂质包膜同时递送本公开的cas9或cas12蛋白(或包含编码所述蛋白质的核苷酸序列的mrna)和/或grna(或编码所述grna的核酸,如一个或多个表达载体)。
[0266]
i.所关注的靶标细胞
[0267]
合适的靶标细胞(其可包含靶标dna,如基因组dna)包括但不限于:细菌细胞;古细菌细胞;单细胞真核生物的细胞;植物细胞;藻类细胞,例如,布朗葡萄藻(botryococcus braunii)、莱茵衣藻(chlamydomonas reinhardtii)、迦得拟微绿球藻(nannchloropsis gaditana)、蛋白核小球藻(chlorella pyrenoidosa)、展枝马尾藻(sargassum patens)、阿
加德环节藻(c.agardh)等;真菌细胞(例如,酵母细胞);动物细胞;无脊椎动物(例如果蝇、刺胞动物(cnidarian)、棘皮动物(echinoderm)、线虫等)的细胞;昆虫(例如,蚊子;蜜蜂;农业有害生物;等)的细胞;蛛形纲动物(例如,蜘蛛;蜱;等)的细胞;脊椎动物(例如,鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞;哺乳动物的细胞(例如,来自啮齿动物的细胞;人的细胞;非人哺乳动物的细胞;啮齿动物(例如,小鼠、大鼠)的细胞;兔形目动物(例如,兔)的细胞;有蹄类动物(例如,母牛、马、骆驼、美洲驼、骆马、绵羊、山羊等)的细胞;海洋哺乳动物(例如,鲸、海豹、象海豹、海豚、海狮等)的细胞;等等。
[0268]
任何类型的细胞都可以是所关注的细胞(例如干细胞,例如胚胎干(es)细胞、诱导型多能干细胞(ipsc)、生殖细胞(例如,卵母细胞、精子、卵原细胞、精原细胞等)、成体干细胞、体细胞(例如成纤维细胞)、造血细胞、神经元、肌肉细胞、骨细胞、肝细胞、胰腺细胞;处于任何阶段的胚胎的体外或体内胚细胞,例如1-细胞、2-细胞、4-细胞、8-细胞等阶段斑马鱼胚胎;等)。
[0269]
细胞可以来自细胞系或原代细胞。靶标细胞可以是单细胞生物和/或可以在培养物中生长。如果细胞是原代细胞,则它们可以通过任何方便的方法从个体收获。例如,白细胞可以通过单采术、白细胞单采术、密度梯度分离等方便地收获,而来自皮肤、肌肉、骨髓、脾、肝脏、胰腺、肺、肠、胃等组织的细胞可以通过活组织检查方便地收获。
[0270]
因为grna通过与靶核酸杂合提供特异性,所以在所公开的方法中的所关注的有丝分裂细胞和/或有丝分裂后细胞可包括任何生物的细胞(例如,细菌细胞、古细菌细胞、单细胞真核生物的细胞、植物细胞、藻类细胞(例如,布朗葡萄藻、莱茵衣藻、迦得拟微绿球藻、蛋白核小球藻、展枝马尾藻、阿加德环节藻等)、真菌细胞(例如,酵母细胞)、动物细胞、无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、脊椎动物(例如,鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞、哺乳动物的细胞、啮齿动物的细胞、人的细胞等)。
[0271]
植物细胞包括单子叶植物的细胞和双子叶植物的细胞。细胞可以是根细胞、叶细胞、木质部细胞、韧皮部细胞、形成层细胞、顶端分生组织细胞、薄壁细胞、厚角细胞、厚壁细胞等。植物细胞包括小麦、玉米、水稻、高粱、小米、大豆等农业作物的细胞。植物细胞包括农业水果和坚果植物的细胞、例如产杏子、橘子、柠檬、苹果、李子、梨、扁桃等的植物。
[0272]
细胞(靶标细胞)的非限制性示例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物的细胞、植物的细胞(例如,植物作物、水果、蔬菜、谷物、大豆、玉米、玉蜀黍、小麦、种子、西红柿、水稻、木薯、甘蔗、南瓜、干草、马铃薯、棉花、大麻、烟草、开花植物、球果植物、裸子植物、被子植物、蕨类、石松、金鱼藻、苔类植物、苔藓、双子叶植物、单子叶植物等的细胞)、藻类细胞(例如,布朗葡萄藻、莱茵衣藻、迦得拟微绿球藻、蛋白核小球藻、展枝马尾藻、阿加德环节藻等)、海藻(例如,海带)、真菌细胞(例如,酵母细胞、蘑菇细胞)、动物细胞、无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、脊椎动物(例如,鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞、哺乳动物的细胞(例如,有蹄类动物(例如,猪、母牛、山羊、绵羊);啮齿动物(例如,大鼠、小鼠);非人灵长类动物;人;猫科动物(例如,猫);犬科动物(例如,狗)等的细胞)等等。在一些实施方案中,细胞是不源自天然生物的细胞(例如,细胞可以是合成制造的细胞;也称为人工细胞)。
[0273]
细胞可以是体外细胞(例如,已确立的培养细胞系)。细胞可以是离体细胞(来自个体的培养细胞)。细胞可以是体内细胞(例如,个体中的细胞)。细胞可以是分离的细胞。细胞
可以是生物体内的细胞。细胞可以是生物。
[0274]
合适的细胞包括人胚胎干细胞、胎儿心肌细胞、成肌纤维细胞、间充质干细胞、自体移植的扩大心肌细胞、脂肪细胞、全能细胞、多能细胞、血液干细胞、成肌细胞、成体干细胞、骨髓细胞、间充质细胞、胚胎干细胞、实质细胞、上皮细胞、内皮细胞、间皮细胞、成纤维细胞、成骨细胞、软骨细胞、外源细胞、内源细胞、干细胞、造血干细胞、骨髓来源的祖细胞、心肌细胞、骨骼细胞、胎儿细胞、未分化细胞、多能祖细胞、单能祖细胞、单核细胞、心脏成肌细胞、骨骼成肌细胞、巨噬细胞、毛细血管内皮细胞、异种细胞、同种异体细胞和产后干细胞。
[0275]
在一些实施方案中,细胞是免疫细胞、神经元、上皮细胞和内皮细胞或干细胞。在一些实施方案中,免疫细胞是t细胞、b细胞、单核细胞、自然杀伤细胞、树突细胞或巨噬细胞。在一些实施方案中,免疫细胞是细胞毒性t细胞。在一些实施方案中,免疫细胞是辅助t细胞。在一些实施方案中,免疫细胞是调节性t细胞(treg)。
[0276]
在一些实施方案中,细胞是干细胞。干细胞包括成体干细胞。成体干细胞也称为躯体干细胞。
[0277]
成体干细胞驻留在分化组织中,但保留自我更新的特性和产生多种细胞类型的能力,通常是其中发现干细胞的组织典型的细胞类型。本领域技术人员已知躯体干细胞的许多示例,包括肌肉干细胞;造血干细胞;上皮干细胞;神经干细胞;间充质干细胞;乳腺干细胞;肠干细胞;中胚层干细胞;内皮干细胞;嗅干细胞;神经嵴干细胞;等等。
[0278]
所关注的干细胞包括哺乳动物干细胞,其中术语“哺乳动物”是指任何归类为哺乳动物的动物,包括人;非人灵长类动物;家畜和农场动物;和动物园、实验室、运动或宠物动物,如狗、马、猫、母牛、小鼠、大鼠、兔等。在一些实施方案中,干细胞是人干细胞。在一些实施方案中,干细胞是啮齿动物(例如,小鼠;大鼠)干细胞。在一些实施方案中,干细胞是非人灵长类动物干细胞。
[0279]
ii.靶标
[0280]
任何所关注的基因都可以作为修饰的靶标。
[0281]
在特定的实施方案中,靶标是癌症牵连的基因。在特定的实施方案中,靶标是免疫疾病(例如,自身免疫疾病)牵连的基因。在特定的实施方案中,靶标是神经变性疾病牵连的基因。在特定的实施方案中,靶标是神经精神疾病牵连的基因。在特定的实施方案中,靶标是肌肉疾病牵连的基因。在特定的实施方案中,靶标是心脏疾病牵连的基因。在特定的实施方案中,靶标是糖尿病牵连的基因。在特定的实施方案中,靶标是肾病牵连的基因。
[0282]
iii.前体grna阵列
[0283]
本文提供的治疗方法可包括前体grna阵列的递送。本公开的cas9或cas12蛋白可以将前体grna切割成成熟的grna,例如通过内切核糖核酸酶切割前体。本公开的cas9或cas12蛋白可以将前体grna阵列(包括串联排列的多于一个grna)切割成两个或更多个单独的grna。
[0284]
iv.使用方法-检测和诊断应用
[0285]
除了切割靶向dna中的靶标序列的能力之外,本公开的cas12蛋白还具有旁切活性(反式切割活性),即一旦因检测到靶标dna而被激活,就混杂地切割非靶向寡核苷酸(ssdna、rna、dna/rna杂合体)的能力。不受任何理论或机制的束缚,一般而言,一旦当样品
包含与grna杂合的靶标序列(即样品包含靶向dna)时本公开的cas12蛋白被grna激活发生,cas12就成为无序地切割单链寡核苷酸(即,非靶单链寡核苷酸,即grna的指导序列不杂合的单链寡核苷酸)的核酸酶。因此,当样品中存在靶向dna(双链或单链)时(例如,在一些实施方案中,超过阈值量),结果可以是切割(旁切)样品中的寡核苷酸,可以使用任何方便的检测方法(例如,使用经标记单链检测子dna、经标记检测子rna或经标记检测子dna/rna嵌合寡核苷酸)检测到该切割。
[0286]
因此,本文提供了用于检测样品中的靶标dna(dsdna或ssdna)的方法和组合物。还提供了用于切割非靶标寡核苷酸的方法和组合物(例如用作检测子)。
[0287]
如本文所用,“检测子”包括具有任何性质的单链或双链寡核苷酸,并且不与grna的指导序列(即,作为非靶标的检测子寡核苷酸)杂合。示例性检测子包括但不限于ssdna、dsdna、ssrna、ssdna/rna嵌合体、dsrna、包含ss或ds区域的rna、以及含有ss或ds寡核苷酸的rna和dna核苷酸(如本文所用,ss=单链;和ds=双链)。
[0288]
基于本公开的cas12蛋白的旁切活性的检测方法可包括:
[0289]
(a)将所述样品与以下项接触:(i)本公开的cas12蛋白;(ii)包含以下项的grna:结合所述cas12蛋白的区域以及与所述靶标dna杂合的指导序列;和(iii)不与所述grna的所述指导序列杂合的检测子;以及
[0290]
(b)测量由所述cas12蛋白切割所述检测子产生的可检测信号,从而检测所述靶标dna。
[0291]
一旦当样品包含与grna杂合的靶标dna(即样品包含靶标dna中的靶向序列)时主题cas12蛋白被grna激活发生,就可以激活cas12以充当内切核糖核酸酶,其非特异性地切割样品中存在的检测子寡核苷酸(包括非靶标ss寡核苷酸)。因此,当样品中存在靶标dna时,结果是切割样品中的检测子寡核苷酸,这可以使用任何方便的检测方法(例如,使用经标记检测子寡核苷酸)来检测。
[0292]
还提供了用于切割检测子寡核苷酸(例如,ssdna、ssrna、ssdna/rna嵌合体或包含ss和ds区域的检测子)的方法和组合物。这些方法可以包括将核酸群体(其中所述群体包含靶标dna和多个非靶标ss寡核苷酸)与以下项接触:(i)本公开的cas12蛋白;和(ii)包含以下项的grna:结合所述cas12效应蛋白的区域以及与所述靶标dna杂合的指导序列,其中所述cas12蛋白切割非靶标ss寡核苷酸
[0293]
因此,本文提供了一种检测样品中的靶标dna的方法,所述方法包括:
[0294]
(a)将所述样品与以下项接触:
[0295]
(i)本公开的cas12蛋白(例如cas12a.1、cas12p或cas12q蛋白);
[0296]
(ii)包含能够与靶标dna中的靶标序列杂合的间隔子序列的grna;以及
[0297]
(iii)不与所述grna的所述间隔子序列杂合的经标记检测子寡核苷酸;以及
[0298]
(b)测量由所述cas12蛋白切割所述经标记检测子寡核苷酸产生的可检测信号,从而检测所述靶标寡核苷酸。
[0299]
在一些实施方案中,所述方法还包括上述连同检测阳性对照样品中的阳性对照靶标dna,所述检测包括以下的另外的步骤:
[0300]
(c)将所述阳性对照样品与以下项接触:
[0301]
(i)本公开的cas12蛋白(例如cas12a.1、cas12p或cas12q蛋白);
[0302]
(ii)包含以下项的阳性对照grna:结合所述cas12a.1、cas12p或cas12q蛋白的区域以及与所述阳性对照靶标dna杂合的阳性对照间隔子序列;和
[0303]
(iii)不与所述阳性对照grna的所述阳性对照间隔子序列杂合的经标记检测子寡核苷酸;以及
[0304]
(d)测量由所述cas12蛋白切割所述经标记检测子产生的可检测信号,从而检测所述阳性对照靶标dna。
[0305]
在一些实施方案中,接触步骤可以在非细胞环境中进行,例如,在细胞外。在其他实施方案中,接触步骤可以在细胞内进行。接触步骤可以在体外细胞中进行。接触步骤可以在体内细胞中进行。检测方法的接触步骤可以在包含二价金属离子的组合物中进行。
[0306]
grna可以作为rna提供,或者作为编码本文所述的grna的核酸(例如,dna,如重组表达载体)。
[0307]
在测量步骤之前的接触可以在测量步骤之前持续任何时间段,例如5秒至2小时或更久。在一些实施方案中,在测量步骤之前,使样品接触45分钟或更短。在一些实施方案中,在测量步骤之前,使样品接触30分钟或更短。在一些实施方案中,在测量步骤之前,使样品接触10分钟或更短。在一些实施方案中,在测量步骤之前,使样品接触5分钟或更短。在一些实施方案中,在测量步骤之前,使样品接触1分钟或更短。在一些实施方案中,在测量步骤之前,使样品接触50秒至60秒。在一些实施方案中,在测量步骤之前,使样品接触40秒至50秒。在一些实施方案中,在测量步骤之前,使样品接触30秒至40秒。在一些实施方案中,在测量步骤之前,使样品接触20秒至30秒。在一些实施方案中,在测量步骤之前,使样品接触10秒至20秒。
[0308]
本文提供的检测方法可以以高灵敏度检测到靶标dna。因此,在一些实施方案中,本公开的检测方法可用于检测在包含多个dna(包括靶标dna和多个非靶标dna)的样品中存在的靶标dna,其中每5至10^9拷贝的非靶标dna存在一个或多个拷贝的靶标dna
[0309]
在一些实施方案中,检测样品中的靶标dna的检测方法的检测阈值为10nm或更小。本文使用术语“检测阈值”来描述为了进行检测,必须存在于样品中的最小量的靶标dna。因此,作为说明性示例,当检测阈值是10nm时,则当靶标dna以10nm或更大的浓度存在于样品中时,可以检测到信号。在一些实施方案中,主题组合物或方法表现出渺摩尔(am)的检测灵敏度。在一些实施方案中,主题组合物或方法表现出飞摩尔(fm)的检测灵敏度。在一些实施方案中,主题组合物或方法表现出皮摩尔(pm)的检测灵敏度。在一些实施方案中,主题组合物或方法表现出纳摩尔(nm)的检测灵敏度。
[0310]
a.靶标dna
[0311]
靶标dna可以是单链的(ssdna)或双链的(dsdna)。在单链靶标dna中没有对pam序列的任何偏好或需要。
[0312]
靶标dna的来源可以是任何来源。在一些实施方案中,靶标dna是病毒或细菌dna(例如,dna病毒或细菌的基因组dna)。因此,检测方法可以用于检测核酸群体(例如,在样品中)中病毒或细菌dna的存在。在携带rna的生物(例如,rna病毒(例如冠状病毒))的情况下,应理解,可以在包含所述携带rna的生物的样品上进行诸如逆转录的步骤,以产生cdna,并且出于本公开的目的,cdna是靶标dna。
[0313]
靶标dna的示例性非限制性来源在表6a至表6f中提供。
[0314]
表6a
[0315]
细菌抗性基因靶标kpc:水解碳青霉烯的a类β-内酰胺酶ndm:金属-β-内酰胺酶oxa:水解苯唑西林的d类β-内酰胺酶meca:pbp2a家族β-内酰胺抗性肽聚糖转肽酶vana/b:万古霉素抗性
[0316]
表6b
[0317]
病毒基因组靶标登革(denv)热病毒(亚型1、2、3和4)寨卡病毒(zika virus)基孔肯雅病毒冠状病毒
[0318]
呼吸系统靶标
[0319]
也可以靶向从与呼吸系统感染有关的病毒和细菌获得的dna。所关注的靶标清单可以包括表6c中所示的示例。
[0320]
表6c
[0321]
呼吸系统靶标腺病毒冠状病毒sars-covsars-cov-2mers-cov冠状病毒hku1冠状病毒nl63冠状病毒229e冠状病毒oc43冠状病毒hku1人偏肺病毒人鼻病毒/肠病毒甲型流感甲型流感/h1甲型流感/h3甲型流感/h1-2009乙型流感副流感病毒1副流感病毒2副流感病毒3
副流感病毒4呼吸道合胞病毒细菌:副百日咳博德特氏菌百日咳博德特氏菌衣原体肺炎支原体肺炎
[0322]
性传播疾病靶标
[0323]
也可以靶向从与性传播疾病有关的病毒和细菌获得的dna。所关注的靶标清单可以包括表6d中所示的示例。
[0324]
表6d
[0325]
性传播疾病靶标hiv(1型和2型)单纯疱疹病毒1(hsv-1)单纯疱疹病毒2(hsv-2)甲型肝炎乙型肝炎丙型肝炎细菌:苍白密螺旋体(treponema pallidum)衣原体淋病奈瑟氏菌
[0326]
其他靶标
[0327]
也可以靶向其他dna。作为另一个示例,也可以靶向用以确定怀孕妇人/怀孕动物的胚胎的性别的雄性基因,以及用以确定植物和种子的性别的雄性基因。另外的所关注的靶标的示例可以包括表6e中所示的以下项。
[0328]
表6e
[0329]
[0330][0331]
提供dna靶标的来源的其他混杂的所关注的靶标如表6f所示。
[0332]
表6f
[0333]
性别决定靶标哺乳动物和非哺乳动物的sry基因其他混杂的所关注的靶标hhprt1(次黄嘌呤磷酸核糖转移酶1)16s大肠杆菌
[0334]
表6g中提供了非限制性示例性靶标序列的列表。
[0335]
表6g
[0336]
[0337][0338]
b.样品
[0339]
术语“样品”在本文中用于指包含dna的任何样品(例如,以确定靶标dna是否存在于dna的群体中)。如上所述,dna可以是单链dna、双链dna、互补dna等。
[0340]
旨在进行检测的样品包含多个核酸。因此,在一些实施方案中,样品包含两个或更多个(例如,3个或更多个、5个或更多个、10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或5,000个或更多个)核酸(例如,dna)。检测方法可以用作非常灵敏地检测样品中存在的靶标dna(例如,在核酸(如dna)的复合物混合物中)的方式。
[0341]
在一些实施方案中,样品包含5个或更多个序列上彼此不同的dna(例如,10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或5,000个或更多个dna)。在一些实施方案中,样品包含10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、10^3个或更多个、5
×
10^3个或更多个、10^4个或更多个、5
×
10^4个或更多个、10^5个或更多个、5
×
10^5个或更多个、10^6个或更多个、5
×
10^6个或更多个、或10^7个或更多个dna。在一些实施方案中,样品包含10至20个、20至50个、50至100个、100至500个、500至10^3个、10^3至5
×
10^3个、5
×
10^3至10^4个、10^4至5
×
10^4个、5
×
10^4至10^5个、10^5至5
×
10^5个、5
×
10^5至10^6个、10^6至5
×
10^6、或5
×
10^6至10^7个、或多于10^7个dna。在一些实施方案中,样品包含5至10^7个dna(例如,序列上彼此不同)(例如,5至10^6个、5至10^5个、5至50,000个、5至30,000个、10至10^6个、10至10^5个、10至50,000个、10至30,000个、20至10^6个、20至10^5个、20至50,000个、或20至30,000个dna)。
[0342]
在一些实施方案中,样品包含彼此序列不同的20个或更多个dna。在一些实施方案中,样品包含来自细胞裂解物(例如,真核细胞裂解物、哺乳动物细胞裂解物、人细胞裂解物、原核细胞裂解物、植物细胞裂解物等)的dna。例如,在一些实施方案中,样品包含来自细胞(如真核细胞,例如哺乳动物细胞,如人细胞)的dna。
[0343]
样品可以衍生自任何来源,例如,样品可以是纯化的dna的合成组合;样品可以是
细胞裂解物、富含dna的细胞裂解物、或从细胞裂解物中分离和/或纯化的dna。样品可以来自患者(例如,用于诊断的目的)。样品可以来自渗透化细胞。样品可以来自交联细胞。样品可以在组织切片中。
[0344]
样品可包含靶标dna和多个非靶标dna。在一些实施方案中,在样品中每5至10^9拷贝的非靶标dna存在一个或多个拷贝的靶标dna。
[0345]
合适的样品包括但不限于尿液样品、血液样品、血清样品、血浆样品、淋巴液样品、脑脊液样品、唾液样品、鼻咽样品、口咽样品、鼻咽/口咽样品、抽吸物样品或活组织检查样品。因此,关于患者的术语“样品”涵盖生物来源的血液和其他液体样品,实体组织样品如活组织检查标本,或者组织培养物或源自组织培养物的细胞或这些细胞的后代。样品还可以是在采购它们之后经任何方式操纵的样品,如通过用试剂处理;洗涤;或富集某些细胞群,如癌细胞。样品可以通过使用拭子获得,例如鼻咽拭子、口咽拭子或鼻咽/口咽拭子。样品也可以是已经富集特定类型的分子(例如,dna)的样品。样品涵盖生物学样品,如临床样品,如血液、血浆、血清、抽吸物、脑脊髓液(csf),并且还包括通过手术切除获得的组织、通过活组织检查获得的组织、培养细胞、细胞上清液、细胞裂解物、组织样品、器官、骨髓等。“生物样品”包括由此衍生的生物流体(例如,癌细胞、受感染的细胞等),例如,包含获得自此类细胞的dna的样品(例如,细胞裂解物或包含dna的其他细胞提取物)。
[0346]
样品可包括多个细胞、组织、器官或无细胞流体中的任一项,或可以从多个细胞、组织、器官或无细胞流体中获得。合适的样品来源包括真核细胞、细菌细胞和古细菌细胞。合适的样品来源包括单细胞生物和多细胞生物。合适的样品来源包括单细胞真核生物;植物或植物细胞;藻类细胞;真菌细胞;动物细胞、组织或器官;无脊椎动物的细胞、组织或器官;脊椎动物的细胞、组织、流体或器官;哺乳动物(例如,人;非人灵长类动物;有蹄类动物;猫科动物;牛科动物;绵羊;山羊;等)的细胞、组织、流体或器官。合适的样品来源包括线虫、原生动物等。合适的样品来源包括寄生虫,如蠕虫、疟原虫(malarial parasite)等。
[0347]
合适的样品来源包括六个界中任一界的细胞、组织或生物。
[0348]
合适的样品来源包括从以下中采集的细胞、流体、组织或器官:生物;从生物中分离的特定细胞或一组细胞;等等。例如,在生物是植物的情况下,合适的来源包括木质部、韧皮部、形成层、叶、根等。在生物是动物的情况下,合适的来源包括特定的组织(例如,肺、肝脏、心脏、肾、脑、脾、皮肤、胎儿组织等),或特定的细胞类型(例如,神经元细胞、上皮细胞、内皮细胞、星形胶质细胞、巨噬细胞、胶质细胞、胰岛细胞、t淋巴细胞、b淋巴细胞等)。
[0349]
在一些实施方案中,样品的来源是(或怀疑是)患病细胞、流体、组织或器官。
[0350]
在一些实施方案中,样品的来源是正常(非患病)细胞、流体、组织或器官。
[0351]
在一些实施方案中,样品的来源是(或怀疑是)被病原体感染的细胞、组织或器官。例如,样品的来源可以是如下的个体,该个体可能被感染或可能未被感染,并且样品可以是从该个体采集的任何生物样品(例如,血液、唾液、活组织检查样品、血浆、血清、支气管肺泡灌洗样品、痰、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,颊拭子、宫颈拭子、鼻拭子)、间质液、滑膜液、鼻涕、泪液、血沉棕黄层、粘膜样品、上皮细胞样品(例如,上皮细胞刮擦物)等)。在一些实施方案中,样品是无细胞液体样品。
[0352]
在一些实施方案中,样品是可包含细胞(尿液、血液、血清、血浆、淋巴液、脑脊液、唾液、鼻咽样品、口咽样品、鼻咽/口咽样品、抽吸物和活组织检查样品)的液体样品。病原体
包括病毒、真菌、蠕虫、原生动物、疟原虫、寄生疟原虫(plasmodium parasites)、寄生弓形体(toxoplasma parasites)、寄生血吸虫(schistosoma parasites)等。“蠕虫”包括蛔虫、心丝虫、和食植物线虫(线虫纲(nematoda))、吸虫(吸虫纲(tematoda))、棘头纲(acanthocephala)和绦虫(绦虫纲(cestoda))。原生动物感染包括得自贾弟虫属物种(giardia spp.)、毛滴虫属物种(trichomonas spp.)、非洲锥虫病、阿米巴痢疾、巴贝西虫病、小袋虫性痢疾、恰加斯病、球虫病、疟疾和弓形虫病的感染。诸如寄生病原体/原生动物病原体等的病原体的示例包括但不限于:镰状疟原虫(plasmodium falciparum)、间日疟原虫(plasmodium vivax)、克氏锥虫(trypanosoma cruzi)和刚地弓形虫(toxoplasma gondii)。真菌病原体包括但不限于:新型隐球菌(cryptococcus neoformans)、荚膜组织胞浆菌(histoplasma capsulatum,)、粗球孢子菌(coccidioides immitis)、皮炎芽生菌(blastomyces dermatitidis)、沙眼衣原体(chlamydia trachomatis)和白色念珠菌(candida albicans)。病原性病毒包括rna或dna病毒,例如冠状病毒(例如sars-cov、sars-cov-2、mers-cov);免疫缺陷病毒(例如,hiv);流感病毒;登革热;西尼罗病毒;疱疹病毒;黄热病病毒;丙型肝炎病毒;甲型肝炎病毒;乙型肝炎病毒;乳头瘤病毒;等等。病原性病毒可包括dna病毒,如:乳多空病毒(例如,人乳头瘤病毒(hpv)、多瘤病毒);嗜肝dna病毒(例如,乙型肝炎病毒(hbv));疱疹病毒(例如,单纯疱疹病毒(hsv)、水痘带状疱疹病毒(vzv)、eb病毒(ebv)、巨细胞病毒(cmv)、疱疹嗜淋巴细胞病毒、玫瑰糠疹、卡波西肉瘤相关的疱疹病毒);腺病毒(例如,富at腺病毒(atadenovirus)、禽腺病毒、鱼腺病毒(ichtadenovirus)、哺乳动物腺病毒(mastadenovirus)、唾液酸酶腺病毒(siaenovirus));痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、羊痘病毒、假牛痘病毒、牛丘疹性口炎病毒;塔纳痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(mcv));细小病毒(例如,腺相关病毒(aav)、细小病毒b19、人博卡病毒、布法病毒、人parv4g1);双生病毒科;矮缩病毒科;藻类脱氧核糖核酸病毒科;等等。病原体可包括例如dna病毒[例如:乳多空病毒(例如,人乳头瘤病毒(hpv)、多瘤病毒);嗜肝dna病毒(例如,乙型肝炎病毒(hbv));疱疹病毒(例如,单纯疱疹病毒(hsv)、水痘带状疱疹病毒(vzv)、eb病毒(ebv)、巨细胞病毒(cmv)、疱疹嗜淋巴细胞病毒、玫瑰糠疹、卡波西肉瘤相关的疱疹病毒);腺病毒(例如,富at腺病毒(atadenovirus)、禽腺病毒、鱼腺病毒(ichtadenovirus)、哺乳动物腺病毒(mastadenovirus)、唾液酸酶腺病毒(siaenovirus));痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、羊痘病毒、假牛痘病毒、牛丘疹性口炎病毒;塔纳痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(mcv));细小病毒(例如,腺相关病毒(aav)、细小病毒b19、人博卡病毒、布法病毒、人parv4g1);双生病毒科;矮缩病毒科;藻类脱氧核糖核酸病毒科;等]、结核分枝杆菌(mycobacterium tuberculosis)、无乳链球菌(streptococcus agalactiae)、耐甲氧西林金黄色葡萄球菌(staphylococcus aureus)、嗜肺军团菌(legionella pneumophila)、化脓性链球菌(streptococcus pyogenes)、大肠杆菌(escherichia coli)、淋病奈瑟氏菌(neisseria gonorrhoeae)、脑膜炎奈瑟氏菌(neisseria meningitidis)、肺炎球菌(pneumococcus)、新型隐球菌(cryptococcus neoformans)、荚膜组织胞浆菌(histoplasma capsulatum)、乙型流感嗜血杆菌、苍白密螺旋体(treponema pallidum)、莱姆病螺旋体、铜绿假单胞菌(pseudomonas aeruginosa)、麻风分枝杆菌(mycobacterium leprae)、流产布鲁氏菌(brucella abortus)、狂犬病病毒、流感病毒、巨细胞病毒、单纯疱疹病毒i、单纯疱疹病毒ii、人血清细小样病毒、呼吸道合胞病
毒、水痘-带状疱疹病毒、乙型肝炎病毒、丙型肝炎病毒、麻疹病毒、腺病毒、人t细胞白血病病毒、eb病毒、鼠白血病病毒、腮腺炎病毒、水泡性口炎病毒、辛德毕斯病毒、淋巴细胞性脉络丛脑膜炎病毒、疣病毒、蓝舌病毒、仙台病毒、猫白血病病毒、呼肠孤病毒、脊髓灰质炎病毒、猿猴病毒40、小鼠乳腺肿瘤病毒、登革热病毒、风疹病毒、西尼罗病毒、镰状疟原虫、间日疟原虫、刚地弓形虫、兰氏锥虫(trypanosoma rangeli)、克氏锥虫、罗得西亚锥虫(trypanosoma rhodesiense)、布氏锥虫(trypanosoma brucei)、曼氏裂体吸虫(schistosoma mansoni)、日本裂体吸虫(schistosoma japonicum)、牛巴贝虫(babesia bovis)、柔嫩艾美耳球虫(eimeria tenella)、旋盘尾丝虫(onchocerca volvulus)、热带利什曼虫(leishmania tropica)、结核分支杆菌(mycobacterium tuberculosis)、旋毛虫(trichinella spiralis)、小泰勒虫(theileria parva)、泡状带绦虫(taenia hydatigena)、羊带绦虫(taenia ovis)、牛带绦虫(taenia saginata)、细粒棘球绦虫(echinococcus granulosus)、科氏中殖孔绦虫(mesocestoides corti)、关节炎支原体(mycoplasma arthritidis)、猪鼻支原体(m.hyorhinis)、口腔支原体(m.orale)、精氨酸支原体(m.arginini)、莱氏无胆甾原体(acholeplasma laidlawii)、唾液支原体(m.salivarium)和肺炎支原体(m.pneumoniae)。
[0353]
c.测量可检测信号
[0354]
检测方法通常包括测量由本公开的cas12产生的可检测信号的步骤。可检测信号可以是当切割ss寡核苷酸时产生的任何信号。检测步骤可以涉及基于荧光的检测。这种检测方法的读出可以是任何方便的读出。可能的读出的示例包括但不限于:测量的可检测荧光信号的量;对凝胶上的带(例如,代表切割产物与未切割底物的带)的视觉分析、基于视觉或传感器的关于存在或不存在颜色的检测(即颜色检测方法)、磁信号的存在或不存在(或特定量)和电信号的存在或不存在(或特定量)。
[0355]
在一些实施方案中,测量可以是定量的,例如,在检测到的信号量可用于确定样品中存在的靶标dna的量的意义上。在一些实施方案中,测量可以是定性的,例如,在可检测信号的存在或不存在可以指示靶向dna(例如,病毒、snp等)的存在或不存在的意义上。在一些实施方案中,除非所述一个或多个靶向dna(例如病毒、snp等)以超出特定阈值的浓度存在,否则将不存在可检测信号(例如,超出给定阈值水平)。在一些实施方案中,通过改良所提供的cas12蛋白的量,可以滴定检测阈值。
[0356]
本公开的组合物和方法可用于检测任何dna靶标。
[0357]
在一些实施方案中,本公开的检测方法可用于确定样品(例如,包含靶标dna和多个非靶标dna的样品)中靶标dna的量。确定样品中的靶标dna的量可以包括将从测试样品产生的可检测信号的量与从参考样品产生的可检测信号的量进行比较。确定样品中靶标dna的量可包括:测量可检测信号以产生测试测量;测量由参考样品产生的可检测信号以产生参考测量;并将测试测量与参考测量进行比较以确定样品中存在的靶标dna的量。
[0358]
在一些实施方案中,可检测信号在小于1、2、3、4、5、10、15、20、30、60、90、120、150、180、210或240分钟内是可检测到的。
[0359]
在一些实施方案中,可以通过偶联检测用核酸扩增来增加主题组合物和/或方法的灵敏度(例如,用于检测靶标dna的存在,如病毒性dna或细胞基因组dna中的snp)。
[0360]
在一些实施方案中,在与cas12接触之前,扩增样品中的核酸;在特定的实施方案
中,cas12保持在无活性状态,直到扩增已结束。在一些实施方案中,在与cas12接触的同时扩增样品中的核酸。可以使用引物进行扩增。因为涉及检测方法的整个处理时间,扩增可发生5秒或更长时间,最多240分钟或更长时间。
[0361]
本领域普通技术人员将已知各种扩增方法和组分,并且可以使用任何方便的方法。
[0362]
核酸扩增可包括聚合酶链反应(pcr)、逆转录pcr(rt-pcr)、定量pcr(qpcr)、逆转录qpcr(rt-qpcr)、等温pcr、嵌套pcr、多重pcr、不对称pcr、降落pcr、随机引物pcr、半巢式pcr、聚合酶循环组装(pca)、菌落pcr、连接酶链反应(lcr)、数字pcr、甲基化特异性pcr(msp)、在较低变性温度下的共扩增-pcr(cold-pcr)、等位基因特异性pcr、序列间特异性pcr(iss-pcr)、全基因组扩增(wga)、反向pcr和热不对称交错pcr(tail-pcr)。
[0363]
在一些实施方案中,扩增是等温扩增。因此,等温核酸扩增方法可以在实验室环境的内部或外部进行。等温扩增方法的示例包括但不限于:环介导的等温扩增(lamp)、解旋酶依赖性扩增(hda)、重组酶聚合酶扩增(rpa)、链置换扩增(sda)、基于核酸序列的扩增(nasba)、转录介导的扩增(tma)、切口酶扩增反应(near)、滚环扩增(rca)、多重置换扩增(mda),分枝(ram)、环状解旋酶依赖性扩增(chda)、单引物等温扩增(spia)、信号介导的rna扩增技术(smart)、自我持续序列复制(3sr)、基因组指数扩增反应(gear)、以及等温多重置换扩增(imda)。
[0364]
d.检测子寡核苷酸
[0365]
本公开的新的cas12蛋白具有旁切(反式切割)活性。如在cas12a.1的情况下,在结合由指导物靶向的dna时,所述蛋白质具有旁切ssdna的能力。在cas12p的情况下,所述蛋白质具有旁切包括ssdna、ssrna、嵌合ssdna/rna和其他包含rna的寡核苷酸在内的所有类型的寡核苷酸的双重能力。当使用所述测定设计检测子寡核苷酸时,考虑了这些特征。
[0366]
在一些实施方案中,检测方法包括将样品(例如,包含靶标dna和多个非靶标ssdna的样品)与以下项接触:i)本公开的cas12蛋白;ii)grna(或前体grna阵列);和iii)不与所述grna的所述指导序列杂合的检测子。例如,在一些实施方案中,检测方法包括将样品与经标记检测子(在cas12a.1的情况下为检测子ssdna,或者在cas12p的情况下为包含rna、dna和它们的组合的检测子)接触,所述检测子包含荧光发射染料对;本公开的cas12蛋白具有在激活(通过与靶标dna杂合的grna)后切割经标记检测子的能力;并且测量的可检测信号由荧光发射染料对产生。例如,在一些实施方案中,检测方法包括使样品与经标记检测子接触,所述经标记检测子包含荧光共振能量转移(fret)对或淬灭剂/荧光体对(quencher/fluor pair)或两者。在一些实施方案中,检测方法包括使样品与包含fret对的经标记检测子接触。在一些实施方案中,检测方法包括使样品与包含荧光体/淬灭剂对的经标记检测子接触。
[0367]
荧光发射染料对包括fret对或淬灭剂/荧光体对。在fret对和淬灭剂/荧光体对的两个实施方案中,其中一种染料的发射光谱重叠了所述对中另一染料的吸收光谱的区域。如本文所用,术语“荧光发射染料对”是用于涵盖“荧光共振能量转移(fret)对”和“淬灭剂/荧光体对”的通用术语。术语“荧光发射染料对”与短语“fret对和/或淬灭剂/荧光体对”可互换使用。
[0368]
在一些实施方案中(例如,当检测子包含fret对时),经标记检测子在被切割之前
产生一定量的可检测信号,并且当经标记检测子被切割时,测量的可检测信号的量减少。在一些实施方案中,经标记检测子在被切割(例如,由fret对)之前产生第一可检测信号,并且在经标记检测子被切割(例如,由淬灭剂/荧光体对)时产生第二可检测信号。因此,在一些实施方案中,经标记检测子包含fret对和淬灭剂/荧光体对。
[0369]
在一些实施方案中,经标记检测子包含fret对。
[0370]
本领域普通技术人员将已知fret供体和受体部分(fret对),并且可以使用任何方便的fret对(例如,任何方便的供体和受体部分对)。合适的fret对的示例包括但不限于表7中呈现的那些。将us10,253,365中提供的fret对通过引用以其整体并入本文。在一些实施方案中,fret对是5'6-fam和3iabkfq(iowa black(已注册)-fq)。
[0371]
表7
[0372]
fret对(供体和受体对)的示例
[0373][0374][0375]
在一些实施方案中,当经标记检测子被切割时产生可检测信号(例如,在一些实施方案中,经标记检测子包含淬灭剂/荧光体对)。
[0376]
可以使用任何荧光标记。荧光标记的示例包括但不限于:alexa染料、atto染料(例如,atto 390、atto 425、atto 465、atto 488、atto 495、atto 514、atto 520、atto 532、atto rho6g、atto 542、atto 550、atto 565、atto rho3b、atto rho11、atto rho12、
atto thio12、atto rho101、atto 590、atto594、atto rho13、atto 610、atto 620、atto rho14、atto 633、atto 647、atto 647n、atto 655、atto oxa12、atto 665、atto680、atto 700、atto 725、atto 740)、dylight染料、花青染料(例如,cy2、cy3、cy3.5、cy3b、cy5、cy5.5、cy7、cy7.5)、fluoprobes染料、sulfo cy染料、seta染料、iris染料、setau染料、srfluor染料、square染料、异硫氰酸荧光素(fitc)、酰胺荧光素(fluorescein amidite,fam)、四甲基罗丹明(tritc)、德克萨斯红、俄勒冈绿色、太平洋蓝、太平洋绿、太平洋橙、量子点和拴系荧光蛋白(tethered fluorescent protein)。
[0377]
淬灭剂部分的示例包括但不限于:暗淬灭剂、black hole(例如,bhq-0、bhq-1、bhq-2、bhq-3)、qxl淬灭剂、atto淬灭剂(例如,atto 540q、atto 580q、以及atto612q)、二甲基氨基偶氮苯磺酸(dabsyl)、iowa black rq、iowa black fq、irdye qc-1、qsy染料(例如,qsy 7、qsy 9、qsy 21)、absolutequencher、eclipse和金属簇(如金纳米粒子)等等。
[0378]
在一些实施方案中,淬灭剂部分选自:暗淬灭剂、black hole(例如,bhq-0、bhq-1、bhq-2、bhq-3)、qxl淬灭剂、atto淬灭剂(例如,atto 540q、atto 580q、以及atto 612q)、二甲基氨基偶氮苯磺酸(dabsyl)、iowa black rq、iowa black fq、irdye qc-1、qsy染料(例如,qsy 7、qsy 9、qsy 21)、absolutequencher、eclipse和金属簇。
[0379]
在一些实施方案中,可以通过测量比色读出来检测经标记检测子的切割。例如,荧光团的释出(例如,从fret对中释出,从淬灭剂/荧光体对中释出)可以导致可检测信号的波长偏移(并且因此发生色移)。因此,在一些实施方案中,可以通过色移来检测主题经标记检测子的切割。这种偏移可以表示为一种颜色(波长)的信号量的损失、另一种颜色的量的增加、一种颜色与另一颜色的配比的变化等。
[0380]
如本文所提供的,经标记检测子可以是核酸模拟物。多核苷酸模拟物包括pna、lna、cena和吗啉代核酸。
[0381]
经标记检测子还可包含一个或多个取代的糖部分。
[0382]
经标记检测子还可包含修饰的核苷酸。
[0383]
e.阳性对照
[0384]
本文提供的检测方法还可包括阳性对照靶标dna。在一些实施方案中,所述方法包括使用包含与对照靶标dna杂合的核苷酸序列的阳性对照grna。在一些实施方案中,阳性对照靶标dna以各种量提供。在一些实施方案中,阳性对照靶标dna以各种已知的浓度提供,连同对照非靶标dna。
[0385]
f.grna阵列
[0386]
在一些实施方案中,所述方法包括使样品与前体grna阵列接触,其中本公开的新的cas12蛋白质切割前体grna阵列以产生所述grna。
[0387]
在一些实施方案中,这种grna阵列包含2个或更多个grna(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、或者7个或更多个grna)。给定阵列的grna可以靶向相同靶标dna的不同靶位点(即,可以包括与相同靶标dna的不同靶位点杂合的指导序列)(例如,其可以增加检测灵敏度)和/或可以靶向不同的靶标dna(例如,单核苷酸多态性(snp)、特定病毒的不同菌株等),并且这可以用于例如检测病毒的多个菌株。在一些实施方
案中,前体grna阵列的每个grna具有不同的指导序列。
[0388]
在一些实施方案中,前体grna阵列包含靶向相同靶标dna内的不同靶位点的两个或更多个grna。例如,在一些实施方案中,这种情景可以通过激活本公开的cas9或cas12蛋白来增加检测的灵敏度(当其中的任一种与靶标dna杂合时)。因此,在一些实施方案中,主题组合物(例如,试剂盒)或方法包括两个或更多个grna(在前体grna阵列的上下文中,或者并非在前体grna阵列的上下文中,例如,grna可以是成熟的grna)。
[0389]
在一些实施方案中,前体grna阵列包含靶向不同靶标dna的两个或更多个grna。例如,当存在任何一个潜在靶标dna家族时,这种情景可以得到正信号。这种阵列可用于靶向转录物家族,例如,基于诸如单核苷酸多态性(snp)的变异(例如,用于诊断目的)。这可能对于检测是否存在许多不同的病毒株中的任一种也有用。这可能对于检测是否存在许多不同的细菌或病毒物种、菌株、分离株或变体中的任一种也有用。因此,在一些实施方案中,主题组合物(例如,试剂盒)或方法包括两个或更多个grna(在前体grna阵列的上下文中,或者并非在前体grna阵列的上下文中,例如,grna可以是成熟的grna)。
[0390]
v.物质组合物
[0391]
本文提供了包含本公开的cas9蛋白和/或cas9 grna的组合物和药物组合物,其可任选地包含药学上可接受的载剂和/或蛋白质稳定缓冲液和/或核酸稳定缓冲液。在一些实施方案中,cas9蛋白和/或cas9 grna以冻干的形式提供。
[0392]
本文提供了包含本公开的cas12蛋白和/或cas12 grna的组合物和药物组合物,其可任选地包含药学上可接受的载剂和/或蛋白质稳定缓冲液和/或核酸稳定缓冲液。在一些实施方案中,cas12蛋白和/或cas12 grna以冻干的形式提供。
[0393]
本文提供了包含本公开的grna和/或grna阵列(与一起使用本公开的cas9蛋白和/或本公开的cas12蛋白相容)以及任选地蛋白质稳定缓冲液的组合物。
[0394]
本文提供了蛋白质,所述蛋白质包含与seq id no:1、2、3、4、222、5、10、11或12有70%-99.5%同源性的氨基酸序列。本文提供了包含这些蛋白质以及任选地药学上可接受的载剂的组合物。本文提供了这些蛋白质和任选地蛋白质稳定缓冲液。
[0395]
本文提供了编码如下序列的dna多核苷酸,所述序列编码本公开的cas9或cas12蛋白中的任一种。还提供了包含这种dna多核苷酸的重组表达载体。在一些实施方案中,编码本公开的cas9或cas12的核苷酸序列可操作地与启动子连接。在一些实施方案中,编码cas9或cas12的核酸还包含核定位信号(nls),可用于在真核系统中表达。
[0396]
本文提供了包含编码本公开的grna中的任一种的序列的dna多核苷酸或rna。还提供了包含这种dna多核苷酸的重组表达载体。在一些实施方案中,编码本公开的grna的核苷酸序列可操作地与启动子连接。
[0397]
本文还提供了包含本文提供的任何重组载体的宿主细胞。
[0398]
vi.试剂盒
[0399]
本文提供了包含本文所述的cas9和cas12工程化系统的一个或多个组分的试剂盒,可用于多种应用,包括但不限于治疗和诊断应用。
[0400]
在一些实施方案中,本文提供了一种试剂盒,所述试剂盒包含:(a)cas9.1、cas9.2、cas9.3或cas9.4蛋白或者编码cas9.1、cas9.2、cas9.3或cas9.4蛋白的核酸;(b)cas9.1、cas9.2、cas9.3或cas9.4 grna或编码cas9.1、cas9.2、cas9.3或cas9.4 grna的核
酸,其中所述grna和所述cas9.1、cas9.2、cas9.3或cas9.4蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas9.1、cas9.2、cas9.3或cas9.4蛋白形成复合物。
[0401]
在一些实施方案中,本文提供了一种试剂盒,所述试剂盒包含:(a)cas12a.1、cas12p或cas12q蛋白或者编码所述cas12a.1、cas12p或cas12q蛋白的核酸;和(b)cas12a.1、cas12p或cas12q grna或者编码cas12a.1、cas12p或cas12q grna的核酸,其中所述grna和所述cas12a.1、cas12p或cas12q蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas12a.1、cas12p或cas12q蛋白形成复合物。
[0402]
在示例性实施方案中,本文提供了诊断试剂盒。在示例性实施方案中,试剂组分以冻干形式提供。在一些实施方案中,试剂组分被单独提供(冻干或未冻干),在其他实施方案中,试剂组分以预混合的形式(冻干或未冻干)提供。
[0403]
以下是如实施例10中示例的使用本公开的新的cas12蛋白(cas12a.1、cas12p和cas12q)中之一用于检测sars-cov-2(rna病毒)的示例性试剂盒试剂组分。
[0404]
(1)含有冻干反应混合物的试剂,sars-cov-2引物组以及用于疾病sasa-cov-2基因组基因的逆转录和环介导的等温扩增(rt-lamp)的酶。
[0405]
(2)含有冻干反应混合物的试剂,对照rnase p引物组以及用于人管家基因rnase p的逆转录和rt-lamp扩增的酶。
[0406]
(3)含有冻干反应混合物的试剂和用于检测sars-cov-2扩增产物的cas12p-grna rnp复合物。这种混合物还可包含经标记报告子,例如基于5’fam-3’quencher ssrna的寡核苷酸报告子或基于5’fam-3’quencher单链dna/rna嵌合体的寡核苷酸报告子。
[0407]
(4)含有冻干反应混合物的试剂和用于检测rnase p扩增产物的cas12p-grna rnp复合物。这种混合物还可包含经标记报告子,例如基于5’fam-3’quencher rna的寡核苷酸报告子。
[0408]
图23显示了在示例性试剂盒中包含的本公开的冻干珠的示例性条带。各珠可以用水重悬,并用于检测测定。示例性珠各自包含crispr蛋白(例如,cas12p)、所需靶标的grna(例如,sars-cov-2的grna)、经标记报告子、缓冲液和无核酸酶的水。
[0409]
vii.列举的实施方案
[0410]
本文提供了本公开的说明性、非限制性的列举实施方案。
[0411]
实施方案1.一种工程化系统,所述工程化系统包括:
[0412]
a.cas9.1、cas9.2、cas9.3或cas9.4蛋白或者编码所述cas9.1、cas9.2、cas9.3或cas9.4蛋白的核酸;以及
[0413]
b.cas9.1、cas9.2、cas9.3或cas9.4指导rna(grna)或者编码cas9.1、cas9.2、cas9.3或cas9.4 grna的核酸,其中所述grna和所述cas9.1、cas9.2、cas9.3或cas9.4蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas9.1、cas9.2、cas9.3或cas9.45蛋白形成复合物。
[0414]
实施方案2.如实施方案1所述的系统,所述系统包括:
[0415]
a.cas9.1、cas9.2、cas9.3、cas9.4蛋白;以及
[0416]
b.cas9.1、cas9.2、cas9.3或cas9.4 grna。
[0417]
实施方案3.如实施方案1所述的系统,所述系统包括:
[0418]
a.编码所述cas9.1、cas9.2、cas9.3或cas9.4蛋白的核酸;以及
[0419]
b.编码所述cas9.1、cas9.2、cas9.3或cas9.4 grna的核酸。
[0420]
实施方案4.如实施方案1至3中任一项所述的系统,其中所述grna是单分子grna。
[0421]
实施方案5.如实施方案1至3中任一项所述的系统,其中所述grna是双分子grna。
[0422]
实施方案6.如实施方案1至5中任一项所述的系统,其中所述cas9.1蛋白包含seq id no:1的氨基酸序列或与seq id no:1有至少70%序列同一性的氨基酸序列。
[0423]
实施方案7.如实施方案1至5中任一项所述的系统,其中所述cas9.2蛋白包含seq id no:2的氨基酸序列或与seq id no:2有至少70%序列同一性的氨基酸序列。
[0424]
实施方案8.如实施方案1至5中任一项所述的系统,其中所述cas9.3蛋白包含seq id no:10的氨基酸序列或与seq id no:10有至少70%序列同一性的氨基酸序列。
[0425]
实施方案9.如实施方案1至5中任一项所述的系统,其中所述cas9.4蛋白包含seq id no:11的氨基酸序列或与seq id no:11有至少70%序列同一性的氨基酸序列。
[0426]
实施方案10.如实施方案1至7中任一项所述的系统,其中所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。
[0427]
实施方案11.如实施方案1至7中任一项所述的系统,其中所述靶标序列是人的序列。
[0428]
实施方案12.如实施方案1至7中任一项所述的系统,其中所述靶标序列是非人灵长类动物的序列。
[0429]
实施方案13.如实施方案1至12中任一项所述的系统,其中所述cas9.1、cas9.2、cas9.3或cas9.4蛋白是有催化活性的蛋白质。
[0430]
实施方案14.如实施方案13所述的系统,其中所述cas9.1、cas9.2、cas9.3或cas9.4蛋白在所述靶标序列远端的位点处切割。
[0431]
实施方案15.如实施方案1至12中任一项所述的系统,其中所述cas9.1、cas9.2、cas9.3或cas9.4蛋白是催化失活的蛋白质。
[0432]
实施方案16.如实施方案1至12中任一项所述的系统,其中所述cas9.1、cas9.2、cas9.3或cas9.4蛋白包含切口酶活性。
[0433]
实施方案17.一种工程化系统,所述工程化系统包括:
[0434]
a.2类v型crispr-cas rna指导的内切核酸酶蛋白;以及
[0435]
b.单一指导rna(grna),
[0436]
其中所述grna和所述2类v型crispr-cas rna指导的内切核酸酶蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,其中所述grna能够与所述2类v型crispr-cas rna指导的内切核酸酶蛋白形成复合物,并且其中所述2类v型crispr-cas rna指导的内切核酸酶蛋白具有旁切活性且能够在没有tracrrna的情况下旁切包含rna的单链多核苷酸。
[0437]
实施方案18.如实施方案17所述的系统,其中所述2类v型crispr-cas rna指导的内切核酸酶蛋白包含seq id no:4的氨基酸序列或与seq id no:4有至少70%序列同一性的氨基酸序列。
[0438]
实施方案19.如实施方案17至18中任一项所述的系统,其中所述靶标序列是表6a
至表6f的任一个中提供的靶标的序列。
[0439]
实施方案20.如实施方案17至18中任一项所述的系统,其中所述靶标序列是人的序列。
[0440]
实施方案21.如实施方案17至18中任一项所述的系统,其中所述靶标序列是非人灵长类动物的序列。
[0441]
实施方案22.如实施方案17至18中任一项所述的系统,其中所述靶标序列是细菌或病毒序列。
[0442]
实施方案23.如实施方案17至22中任一项所述的系统,其中所述2类v型crispr-cas rna指导的内切核酸酶蛋白能够旁切单链rna。
[0443]
实施方案24.如实施方案17至22中任一项所述的系统,其中所述2类v型crispr-cas rna指导的内切核酸酶蛋白能够旁切单链dna/rna杂合体。
[0444]
实施方案25.一种工程化系统,所述工程化系统包括:
[0445]
a.cas12a.1、cas12p或cas12q蛋白或者编码所述cas12a.1、cas12p或cas12q蛋白的核酸;以及
[0446]
b.cas12a.1、cas12p或cas12q grna或者编码cas12a.1、cas12p或cas12q grna的核酸,
[0447]
其中所述grna和所述cas12a.1、cas12p或cas12q蛋白并非天然一起存在,其中所述grna能够与靶标dna中的靶标序列杂合,并且所述grna能够与所述cas12a.1、cas12p或cas12q蛋白形成复合物。
[0448]
实施方案26.如实施方案25所述的系统,所述系统包括:
[0449]
a.cas12a.1、cas12p或cas12q蛋白;以及
[0450]
b.cas12a.1、cas12p或cas12q grna。
[0451]
实施方案27.如实施方案25所述的系统,所述系统包括:
[0452]
a.编码所述cas12a.1、cas12p或cas12q蛋白的核酸;以及
[0453]
b.编码cas12a.1、cas12p或cas12q grna的核酸。
[0454]
实施方案28.如实施方案25至27中任一项所述的系统,其中所述cas12a.1蛋白包含seq id no:3的氨基酸序列或与seq id no:3有至少70%序列同一性的氨基酸序列。
[0455]
实施方案29.如实施方案25至27中任一项所述的系统,其中所述cas12p蛋白包含seq id no:4的氨基酸序列或与seq id no:4有至少70%序列同一性的氨基酸序列。
[0456]
实施方案30.如实施方案25至27中任一项所述的系统,其中所述cas12q蛋白包含seq id no:222的氨基酸序列或与seq id no:222有至少70%序列同一性的氨基酸序列。
[0457]
实施方案31.如实施方案25至27中任一项所述的系统,其中所述cas12q蛋白包含seq id no:5的氨基酸序列或与seq id no:5有至少70%序列同一性的氨基酸序列。
[0458]
实施方案32.如实施方案25至31中任一项所述的系统,其中所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。
[0459]
实施方案33.如实施方案25至31中任一项所述的系统,其中所述靶标序列是人的序列。
[0460]
实施方案34.如实施方案25至31中任一项所述的系统,其中所述靶标序列是非人灵长类动物的序列。
[0461]
实施方案35.如实施方案25至31中任一项所述的系统,其中所述靶标序列是细菌或病毒序列。
[0462]
实施方案36.如实施方案25至34中任一项所述的系统,其中所述cas12a.1、cas12p或cas12q蛋白是有催化活性的cas12a.1、cas12p或cas12q蛋白。
[0463]
实施方案37.如实施方案36所述的系统,其中所述cas12a.1、cas12p或cas12q蛋白在所述靶标序列远端的位点处切割。
[0464]
实施方案38.如实施方案25至34中任一项所述的系统,其中所述cas12a.1、cas12p或cas12q蛋白是催化失活的cas12a.1、cas12p或cas12q蛋白。
[0465]
实施方案39.如实施方案25至34中任一项所述的系统,其中所述cas12a.1、cas12p或cas12q蛋白包含切口酶活性。
[0466]
实施方案40.一种工程化单分子grna,所述工程化单分子grna包含:
[0467]
a.包含能够与靶标dna中的靶标序列杂合的间隔子序列的标靶-rna;以及
[0468]
b.能够与所述标靶-rna杂合以形成双链的rna双链体的激活子-rna,所述激活子-rna包括以下的激活子-rna,
[0469]
其中所述标靶-rna和所述激活子-rna彼此共价连接,其中所述单分子grna能够与cas9.1、cas9.2、cas9.3或cas9.4蛋白形成复合物,并且其中所述间隔子序列与所述靶标序列的杂合能够将所述cas9.1、cas9.2、cas9.3或cas9.4蛋白靶向所述靶标dna。
[0470]
实施方案41.如实施方案40所述的grna,其中所述标靶-rna和所述激活子-rna以5'至3'取向排列。
[0471]
实施方案42.如实施方案40所述的grna,其中所述激活子-rna和所述标靶-rna以5'至3'取向排列。
[0472]
实施方案43.如实施方案40至42中任一项所述的grna,其中所述标靶-rna和所述激活子-rna通过接头彼此共价连接。
[0473]
实施方案44.如实施方案40至43中任一项所述的grna,其中与对应的野生型tracrrna和/或crrna的序列相比,所述单分子grna包含一种或多种序列修饰。
[0474]
实施方案45.如实施方案40至44中任一项所述的grna,其中所述标靶-rna包含与所述靶标dna中的序列具有100%互补性的约10-50个核苷酸的间隔子序列。
[0475]
实施方案46.如实施方案40至44中任一项所述的grna,其中所述标靶-rna包含与所述靶标dna中的序列具有小于100%互补性的约10-50个核苷酸的间隔子序列。
[0476]
实施方案47.如实施方案40至46中任一项所述的grna,其中所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。
[0477]
实施方案48.如实施方案40至47中任一项所述的grna,其中所述cas9.1蛋白包含seq id no:1的序列或与seq id no:1有至少70%序列同一性的序列。
[0478]
实施方案49.如实施方案40至47中任一项所述的grna,其中所述cas9.2蛋白包含seq id no:2的序列或与seq id no:2有至少70%序列同一性的序列。
[0479]
实施方案50.如实施方案40至47中任一项所述的grna,其中所述cas9.3蛋白包含seq id no:10的序列或与seq id no:10有至少70%序列同一性的序列。
[0480]
实施方案51.如实施方案40-47中任一项所述的grna,其中所述cas9.4蛋白包含seq id no:11的序列或与seq id no:11有至少70%序列同一性的序列。
[0481]
实施方案52.一种工程化单分子grna,所述工程化单分子grna包含seq id no:116或seq id no:117的支架序列和能够与靶标dna中的靶标序列杂合的间隔子序列。
[0482]
实施方案53.如实施方案52所述的grna,其中所述靶标dna包括病毒dna、植物dna、真菌dna或细菌dna。
[0483]
实施方案54.如实施方案52所述的grna,其中所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。
[0484]
实施方案55.如实施方案52所述的grna,其中所述靶标是冠状病毒。
[0485]
实施方案56.如实施方案52所述的grna,其中所述靶标是sars-cov-2病毒。
[0486]
实施方案57.如实施方案52所述的grna,其中所述靶标dna是cdna,并已通过逆转录获得。
[0487]
实施方案58.一种修饰靶标dna的方法,所述方法包括将所述靶标dna与实施方案1至39所述的系统中的任一种接触,其中所述grna与所述靶标序列杂合,由此发生对所述靶标dna的修饰。
[0488]
实施方案59.如实施方案58所述的方法,其中所述靶标dna是染色体外dna。
[0489]
实施方案60.如实施方案58所述的方法,其中所述靶标dna是染色体的一部分。
[0490]
实施方案61.如实施方案58所述的方法,其中所述靶标dna是体外染色体的一部分。
[0491]
实施方案62.如实施方案58所述的方法,其中所述靶标dna是体内染色体的一部分。
[0492]
实施方案63.如实施方案58所述的方法,其中所述靶标dna在细胞外。
[0493]
实施方案64.如实施方案58所述的方法,其中所述靶标dna在细胞内。
[0494]
实施方案65.如实施方案64所述的方法,其中所述靶标dna包含基因和/或其调节区。
[0495]
实施方案66.如实施方案64或65所述的方法,其中所述细胞选自由以下组成的组:古细菌细胞、细菌细胞、真核细胞、真核单细胞生物、体细胞、生殖细胞、干细胞、植物细胞、藻类细胞、动物细胞、无脊椎动物细胞、脊椎动物细胞、鱼细胞、青蛙细胞、鸟细胞、哺乳动物细胞、猪细胞、母牛细胞、山羊细胞、绵羊细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、非人灵长类动物细胞和人细胞。
[0496]
实施方案67.如实施方案58至66中任一项所述的方法,其中所述修饰包括在所述靶标dna中引入双链断裂。
[0497]
实施方案68.如实施方案58至67中任一项所述的方法,其中所述接触在允许非同源末端接合或同源定向修复的条件下发生。
[0498]
实施方案69.如实施方案58至67中任一项所述的方法,其中将所述靶标dna与供体多核苷酸接触,其中所述供体多核苷酸、所述供体多核苷酸的一部分、所述供体多核苷酸的拷贝、或所述供体多核苷酸的一部分拷贝整合到所述靶标dna中。
[0499]
实施方案70.如实施方案58至67中任一项所述的方法,其中所述方法不包括将所述细胞与供体多核苷酸接触,或其中所述靶标dna被修饰,使得所述靶标dna内的核苷酸缺失。
[0500]
实施方案71.一种检测样品中的靶标dna的方法,所述方法包括:
[0501]
a.将所述样品与以下项接触:
[0502]
i.cas12a.1、cas12p或cas12q蛋白;
[0503]
ii.包含能够与靶标dna中的靶标序列杂合的间隔子序列的cas12a.1、cas12p或cas12q grna;以及
[0504]
iii.不与所述grna的所述间隔子序列杂合的经标记检测子;以及
[0505]
b.测量由所述cas12a.1、cas12p或cas12q蛋白切割所述经标记检测子产生的可检测信号,从而检测所述靶标dna。
[0506]
实施方案72.如实施方案71所述的方法,其中所述经标记检测子包含经标记单链dna。
[0507]
实施方案73.如实施方案71所述的方法,其中所述经标记检测子包含经标记rna。
[0508]
实施方案74.如实施方案72所述的方法,其中所述经标记rna是单链rna。
[0509]
实施方案75.如实施方案71所述的方法,其中所述经标记检测子包含经标记单链dna/rna嵌合体。
[0510]
实施方案76.如实施方案71至75中任一项所述的方法,其中所述经标记检测子包含一个或多个经修饰核苷酸。
[0511]
实施方案77.如实施方案71至76中任一项所述的方法,所述方法包括将所述样品与前体grna阵列接触,其中所述cas12a.1、cas12p或cas12q蛋白切割所述前体grna阵列以产生所述grna。
[0512]
实施方案78.如实施方案71至77中任一项所述的方法,其中所述靶标dna是单链的。
[0513]
实施方案79.如实施方案71至78中任一项所述的方法,其中所述靶标dna是双链的。
[0514]
实施方案80.如实施方案71至79中任一项所述的方法,其中所述靶标dna是病毒dna、植物dna、真菌dna或细菌dna。
[0515]
实施方案81.如实施方案80所述的方法,其中所述靶标序列是表6a至表6f的任一个中提供的靶标的序列。
[0516]
实施方案82.如实施方案81所述的方法,其中所述靶标是冠状病毒。
[0517]
实施方案83.如实施方案82所述的方法,其中所述靶标是sars-cov-2病毒。
[0518]
实施方案84.如实施方案71至83中任一项所述的方法,其中所述靶标dna是cdna,并且已通过逆转录获得。
[0519]
实施方案85.如实施方案71至79中任一项所述的方法,其中所述靶标dna来自人细胞。
[0520]
实施方案86.如实施方案85所述的方法,其中所述靶标dna是人胎儿或癌细胞dna。
[0521]
实施方案87.如实施方案71至86中任一项所述的方法,其中所述蛋白质是包含seq id no:3的氨基酸序列或与seq id no:3有至少70%序列同一性的氨基酸序列的cas12a.1。
[0522]
实施方案88.如实施方案71至86中任一项所述的方法,其中所述蛋白质是包含seq id no:4的氨基酸序列或与seq id no:4有至少70%序列同一性的氨基酸序列的cas12p。
[0523]
实施方案89.如实施方案71至86中任一项所述的方法,其中所述蛋白质是包含seq id no:222的氨基酸序列或与seq id no:222有至少70%序列同一性的氨基酸序列的
cas12p。
[0524]
实施方案90.如实施方案71至86中任一项所述的方法,其中所述蛋白质是包含seq id no:5的氨基酸序列或与seq id no:5有至少70%序列同一性的cas12q的氨基酸序列。
[0525]
实施方案91.如实施方案71至87中任一项所述的方法,其中所述样品包含来自细胞裂解物的dna。
[0526]
实施方案92.如实施方案71至87中任一项所述的方法,其中所述样品包含细胞。
[0527]
实施方案93.如实施方案71至87中任一项所述的方法,其中所述样品是尿液样品、血液样品、血清样品、血浆样品、淋巴液样品、脑脊液样品、唾液样品、鼻咽样品、口咽样品、鼻咽/口咽样品、抽吸物样品或活组织检查样品。
[0528]
实施方案94.如实施方案71至93中任一项所述的方法,所述方法包括确定所述样品中存在的所述靶标dna的量。
[0529]
实施方案95.如实施方案94所述的方法,其中所述测量可检测信号包括以下一项或多项:基于视觉的检测、基于传感器的检测、颜色检测、基于金纳米粒子的检测、荧光极化、胶体相变/分散、电化学检测和基于半导体的感测。
[0530]
实施方案96.如实施方案71至95中任一项所述的方法,其中所述经标记检测子包含经修饰核碱基、经修饰糖部分和/或经修饰核酸连接。
[0531]
实施方案97.如实施方案71至96中任一项所述的方法,所述方法还包括在阳性对照样品中检测阳性对照靶标dna,所述检测包括:
[0532]
a.将所述阳性对照样品与以下项接触:
[0533]
i.cas12a.1、cas12p或cas12q蛋白;
[0534]
ii.包含以下项的阳性对照grna:结合所述cas12a.1、cas12p或cas12q蛋白的区域以及与所述阳性对照靶标dna杂合的阳性对照间隔子序列;以及
[0535]
iii.不与所述阳性对照grna的所述阳性对照间隔子序列杂合的经标记检测子;以及
[0536]
b.测量由所述cas12a.1、cas12p或cas12q蛋白切割所述经标记检测子产生的可检测信号,从而检测所述阳性对照靶标dna。
[0537]
实施方案98.如实施方案71至97中任一项所述的方法,其中所述可检测信号在少于15、30、45、60、90、120、150、180、210或240分钟内是可检测到的。
[0538]
实施方案99.如实施方案71至98中任一项所述的方法,所述方法还包括通过以下项扩增所述样品中的所述靶标dna:环介导的等温扩增(lamp)、解旋酶依赖性扩增(hda)、重组酶聚合酶扩增(rpa)、链置换扩增(sda)、基于核酸序列的扩增(nasba)、转录介导的扩增(tma)、切口酶扩增反应(near)、滚环扩增(rca)、多重置换扩增(mda),分枝(ram)、环状解旋酶依赖性扩增(chda)、单引物等温扩增(spia)、信号介导的rna扩增技术(smart)、自我持续序列复制(3sr)、基因组指数扩增反应(gear)、或等温多重置换扩增(imda)。
[0539]
实施方案100.如实施方案71至99中任一项所述的方法,其中所述样品中的所述靶标dna以小于100um的浓度存在。
[0540]
实施方案101.一种蛋白质,所述蛋白质包含与seq id no:1、2、3、4、5、10、11或222有70%-99.5%同源性的氨基酸序列。
[0541]
实施方案102.如实施方案101所述的蛋白质,其中所述蛋白质的序列已经通过生
物信息学方式推导出来。
[0542]
实施方案103.一种组合物,所述组合物包含实施方案101所述的蛋白质中的任一种以及任选地药学上可接受的载剂。
[0543]
实施方案104.一种组合物,所述组合物包含实施方案101所述的蛋白质中的任一种,任选地包含药学上可接受的载剂、核酸稳定缓冲液和/或蛋白质稳定缓冲液。
[0544]
实施方案105.一种组合物,所述组合物包含实施方案101所述的蛋白质中的任一种,其中所述蛋白质是冻干的,并且任选地还包含以下任一项或多项:经标记检测子、逆转录酶和用于环介导的等温扩增的试剂。
[0545]
实施方案106.一种dna多核苷酸,所述dna多核苷酸包含编码实施方案101所述的蛋白质中的任一种的核苷酸序列。
[0546]
实施方案107.一种重组表达载体,所述重组表达载体包含实施方案106所述的dna多核苷酸。
[0547]
实施方案108.如实施方案107所述的重组表达载体,其中编码单一蛋白质的所述核苷酸序列与启动子可操作地连接。
[0548]
实施方案109.一种宿主细胞,所述宿主细胞包含实施方案106至108中任一项所述的dna多核苷酸。
[0549]
实施方案110.一种药物组合物,所述药物组合物包含实施方案1至39所述的工程化系统中的任一种,以及任选地药学上可接受的载剂。
[0550]
实施方案111.一种组合物,所述组合物包含实施方案1至39所述的工程化系统中的任一种,并且任选地包含核酸稳定缓冲液和/或蛋白质稳定缓冲液。
[0551]
实施方案112.一种药物组合物,所述药物组合物包含实施方案40至57所述的单分子grna中的任一种,以及任选地药学上可接受的载剂。
[0552]
实施方案113.一种组合物,所述组合物包含实施方案40至51所述的单分子grna中的任一种,以及任选地核酸稳定缓冲液和/或蛋白质稳定缓冲液。
[0553]
实施方案114.一种dna多核苷酸,所述dna多核苷酸包含编码以下任一项的核苷酸序列:实施方案3、27所述的任何核酸,或实施方案40至51所述的grna。
[0554]
实施方案115.一种重组表达载体,所述重组表达载体包含实施方案114所述的dna多核苷酸。
[0555]
实施方案116.如实施方案115所述的重组表达载体,其中编码单一grna的所述核苷酸序列与启动子可操作地连接。
[0556]
实施方案117.一种宿主细胞,所述宿主细胞包含实施方案114至116中任一项所述的dna多核苷酸。
[0557]
实施方案118.一种试剂盒,所述试剂盒包含实施方案1至39所述的工程化系统中的任一种的一个或多个组分。
[0558]
实施方案119.如实施方案118所述的试剂盒,其中一个或多个组分是冻干的。
[0559]
实施方案120.如实施方案118至119中任一项所述的试剂盒,其中所述一个或多个组分包括cas12p、经标记rna报告子和指向sars-cov-2的grna。
[0560]
实施方案121.一种从宏基因组学样品分离2类ii型或2类v型crispr-cas蛋白的方法,所述方法包括使用基于生物信息学的方法。
[0561]
实施方案122.如实施方案121所述的方法,其中所述2类ii型或2类v型crispr-cas蛋白选自由以下组成的组:seq id no:1、2、3、4、5、10、11和222。
[0562]
实施例
[0563]
以下实施例被包括在内用于说明目的,并不旨在限制本发明的范围。
[0564]
实施例1:新型ii类ii型和v型内切核酸酶的鉴定和验证
[0565]
2类ii型和v型crispr-cas基因座鉴定
[0566]
从ncbi获得了宏基因组序列,并进行编制以构建推定的crispr-cas基因座的数据库。使用crisprcasfinder软件鉴定crispr阵列。过滤标准是推定的ii类ii型和v型效应子》500aa,其与cas基因和crispr阵列相邻。使用hmm特征谱(hmm profile)采用clustal omega进行序列比对。鉴定了本文所述的新型cas9.1、cas9.2、cas9.3、cas9.4、cas12a.1、cas12p和cas12q蛋白。
[0567]
表达质粒和非编码元件的产生
[0568]
将验证cas蛋白的最低条件建立为克隆策略。通过去除采集蛋白并产生具有单个间隔子(sp1)的最小阵列来设计最小的crispr基因座。将天然sp1序列替换为具有天然存在的序列长度的已知的特异性靶标序列(gtggcagctcaaaaattggctacaaaaccagtt;seq id no:118),用于靶标检测和pam筛选测定。将crispr效应子和/或辅助蛋白的大肠杆菌密码子优化的蛋白质序列置于基于pet的表达载体(emd-millipore)中lac和iptg诱导型t7启动子的转录控制下。
[0569]
人工合成
[0570]
对于cas12a.1、cas12p、cas9.1和cas9.2,表达载体是人工合成的。由提供商(genescript)产生效应子质粒密码子优化、合成和克隆。考虑到两个推定的转录方向,在crispr阵列中加入侧翼限制性位点以克隆dna片段(idt)。以相反方向使用相同元件这样做,以产生第二构建体变体。图1a至图1b显示了cas9.1和cas9.2的表达载体图谱。图2a至图2c显示了cas12a.1、cas12p和cas12q的表达载体图谱。在表8中提供载体序列。
[0571]
表8.表达载体序列
[0572]
[0573]
[0574]
[0575]
[0576]
[0577]
[0578]
[0579]
[0580]
[0581]
[0582]
[0583]
[0584]
[0585]
[0586]
[0587]
[0588]
[0589][0590]
蛋白质表达和纯化
[0591]
cas12编码序列是密码子优化和通过genescript合成的,然后用n末端6
×
his加标记克隆到pet28a(novagen)中。将cas12表达质粒转化到大肠杆菌nico21(de3)(neb)中。对于蛋白质表达,首先将单个克隆在5-ml液体lb管中培养过夜,然后接种到400ml新鲜液体lb中(od 600 0.1)。将细胞在200rpm和37℃下振荡生长直至od 600达到0.8,然后添加iptg达0.1mm的终浓度,然后在细胞收获前将细胞进一步在37℃下培养约2小时。用蛋白酶抑制剂
混合物(promega)和5mg/ml溶菌酶将细胞重新悬浮在20ml缓冲液a(50mm tris-hcl ph 8.0,0.5m nacl,1mm dtt和5%甘油)中。在37℃下孵育15分钟后,通过10分钟10秒运行和10秒停止循环将细胞通过超声处理进行裂解。通过离心(15,000rpm,30分钟)除去细胞碎片和不溶性颗粒。离心后,将上清液加载到5ml crude histrap柱(ge healthcare)上,该柱在akta pure 25l装置(ge healthcare life sciences)上以20mm咪唑缓冲液a平衡。通过缓冲液b的步进梯度(缓冲液a加0.5m咪唑)进行洗脱。用透析缓冲液(50mm tris-hcl ph 8.0,200mm nacl,1mm dtt和5%甘油)透析洗脱物。
[0592]
指导rna(grna)和变体
[0593]
包含正向重复突变可以改善grna稳定性。来自本文提供的三种crispr cas12系统的正向重复在茎环区域内有两个a:u碱基对。增加茎环的热稳定性有望增加用于加载到其同源cas12中的、适当折叠的crrna的部分,从而增加核酸酶活性(pengpeng等人,2019)。在本公开的crispr系统的正向重复中,那些a:u碱基对被替换为c:g,以基于rna折叠的最小自由能预测来创建新的、更稳定的非天然存在的变体。
[0594]
本公开的cas蛋白的细菌dna中发现的、在crispr基因座中的预测的(推定的)天然存在的正向重复序列显示在上文的表2和5a中(显示为dna序列)。新的变体如上文的表5b中所示(表示为dna序列)。预测的二级结构如图7a至图7c中所示。预期整个正向重复序列或部分正向重复序列形成功能性非天然存在的grna,并结合本公开的cas蛋白。形成在该实施例中使用的正向重复变体和间隔子的rna由synthego合成。
[0595]
图3b、图3e、图3g、图5b、图5d和图5f示出了cas9.1、cas9.3、cas9.4、cas12a.1、cas12p和cas12q pre-crrna的重复序列的预测的二级结构(折叠)。要组装这些预测物,使用了公开可用的rnafold webserver工具。
[0596]
体外转录反应(ivt)
[0597]
根据制造商的说明使用megascript
tm t7转录试剂盒(ambion,invitrogen)进行体外转录,并根据制造商的说明用rna清洁试剂盒(new england biolab)进行清洁。使用凝胶上样缓冲液ii(ambion,invitrogen)在2%琼脂糖凝胶中使rna可视化。
[0598]
体外靶标切割测定
[0599]
下文用于体外靶标切割测定的模板序列示于表9中。
[0600]
表9
[0601]
[0602][0603]
gblock(表9中)是约100-500nt的通过idt合成的双链dna模板,其序列包括所关注的靶标。含有1ug的gblock靶标序列的特异性切割测定在缓冲液neb 3与30nm cas(cas9.1、cas9.2、cas9.3、cas9.4cas12a.1、cas12p、cas12q)、针对特异性序列的30nm crrna中在37℃下进行2小时。在70℃下将反应停止10分钟。使用pcr纯化柱(qiagen)清洁产物,并在用syber gold(invitrogen)预染色的1%琼脂糖凝胶中进行可视化。为了鉴定切割的类型(错列切割/平钝切割),在1%的琼脂糖凝胶中运行消化产物的等分试样,并且使用dna清洁浓缩试剂盒(zymo research)凝胶提取对应于切割的靶标的条带。将纯化的产物使用特异性
引物测序并通过dnastart进行分析。对于旁切活性测定,使用了缓冲液neb 3与30nm cas(cas9.1、cas9.2、cas9.3、cas9.4、cas12a.1、cas12p、cas12q)、30nm crrna和包含靶标序列的1nm ssdna激活子,在37℃下进行10、20、40和60分钟。通过添加250nm m13ssdna或m13dsdna质粒(neb)来启动反应。反应在70℃时停止10分钟。用syber gold(invitrogen)预染色的2%琼脂糖凝胶进行产物分离
[0604]
旁切活性的荧光检测
[0605]
可以进行荧光检测以确定旁切活性。以40μl反应终体积,在37℃下,将30nm cas12与30nm crrna和50nm dnasealerttm底物(idt)在缓冲液neb 2.1中进行复合。可以在荧光板读数器中在37℃下监测反应长达30分钟,在hex通道中每2分钟进行一次荧光测量(λex:536nm;λem:556nm)。可以使用在不存在靶标的情况下获得的读数来背景校正所得数据。对于dsdna/ssdna和dsrna/ssrna的旁切的fq检测,分别使用dnasealerttm(idt)和
[0606]
顺式和反式切割速度
[0607]
初始速度(v0)可以通过拟合线性回归来计算并根据以下等式针对底物浓度绘图以确定michaelis-menten常数(graphpad软件):y=(vmax
×
x)/(km+x),其中x是底物浓度,y是酶速度。周转数(kcat)由以下等式确定:kcat=vmax/et,其中et=0.1nm。
[0608]
实施例2:确定内切核酸酶活性
[0609]
研究了仅提供crrna与本公开的新型cas12a.1和cas12p是否可以在体外切割靶标dna。设计、过表达、体外纯化cas12a.1和cas12p,并使用它们与针对特异性靶标的crrna一起形成复合物。发现cas12蛋白和crna的存在足以形成用于介导dna切割的活性复合物。
[0610]
实施例3:确定pam序列特异性
[0611]
为了证明本公开的cas12a.1和cas12p的pam序列切割依赖性作用,在特定的靶标序列之后设计了十种不同的pam基序。使用这些,在测试的十个基序中,tctn和tgtn分别被鉴定为cas12a.1和cas12p的有效的pam序列。图8显示了cas12a.1和cas12p对十个pam基序的pam序列偏好的条形图,使用荧光测定来测量cas12a.1和cas12p的性能。所得的荧光数据是减去了背景的。
[0612]
实施例4:cas12a.1和cas12p的旁切活性的示范,以及它们切割ssdna和rna报告子的能力
[0613]
研究了本公开的cas12a.1和cas12p蛋白是否能够切割dsdna或rna。将cas12a.1-grna或casp-grna复合物与样品(阳性和阴性)和报告子混合,以在靶标存在下反应。在这些实施例中,使用了定制的ssdna荧光标记的报告子(5'fam-ttattatt-3iabkfq 3
’‑
idt)(seq id no:121)和商业的荧光标记的报告子rna报告子(cat n 11-04-03-03-idt)。
[0614]
图9b显示了本公开的cas12a.1和cas12p蛋白的旁切活性,使用汉坦病毒作为示例性靶标。cas12a.1和cas12p与它们各自的grna一起孵育,以靶向汉坦病毒以形成1um复合物,并在10nm的浓度下暴露于dna靶标;以1和0.5um之间的浓度向混合物中添加荧光标记的ssdna或rna报告子。对照不含特异性dna靶标。仅在靶标存在下观察到旁切活性。cas12a.1显示了ssdna的ssdna旁切,但在这些条件下不适用于rna。另一方面,cas12p表现出ssdna和rna报告子两者的旁切活性。用于本文提供的这个实施例和其他实施例的rna底物是-1底物(25个一次性试管。目录号.11-04-03-03-idt)。用于本文提供的这个
实施例和其他实施例的示例性ssdna报告子是(5'fam-ttattatt-3iabkfq 3
’‑
idt)(seq id no:121)。
[0615]
图9c显示了cas12p表现出ssdna和rna报告子旁切,其中使用sars-cov-2灭活病毒作为样品作为靶标。
[0616]
实施例5:热稳定性测试
[0617]
cas12a.1和cas12p的活性在不同温度下进行了测试。
[0618]
图10显示了cas12a.1和cas12p蛋白在25℃的活性,使用1um复合物、300nm报告子sars-cov-2(spn2靶标)在1分钟和5分钟作为读出的终点。
[0619]
图10和图14显示了cas12p在25℃和在37℃的表现一样好。
[0620]
图15显示了cas12p与lbcas12a在25℃下在通过报告子切割产生荧光信号方面的差异性能。将lbcas12a和cas12p与其各自的grna一起孵育,以靶向sars-cov-2的n基因以形成1um复合物。两者的靶标相同,并以10nm的浓度提供。将600nm ssdna报告子添加到反应混合物(50mm nacl、10mm tris-hcl、10mm mgcl2和100μg/ml bsa)中。通过荧光测量旁切并实时进行读出。图16显示了使用sars-cov-2作为靶标,cas12p与lbcas12a在25℃下的差异性能,描述于实施例10中。
[0621]
实施例6:测试多种盐浓度
[0622]
cas12a.1和cas12p的活性以多种nacl浓度进行测试;cas12a.1和cas12p显示保持了功能性。图11显示了两种蛋白质在多种nacl浓度下的活性。所得的荧光数据是减去了背景的。
[0623]
实施例7:测试多种商业缓冲液
[0624]
在多种商业缓冲液中,本公开的cas12a.1和cas12p显示出不同的性能。图12显示了本公开的cas12a.1和cas12p在三种不同商业缓冲液中的性能。所得的荧光数据是减去了背景的。
[0625]
实施例8:使用cas12a.1和cas12p检测汉坦病毒
[0626]
汉坦病毒是主要由啮齿动物传播的病毒家族,并且可以在全世界范围内在人中造成各种疾病症状。用任何汉坦病毒感染都可以在人中产生汉坦病毒病。下文描述了使用本公开的新型cas12a.1和cas12p蛋白来检测汉坦病毒。
[0627]
引物设计和crispr rna指导物选择
[0628]
下文提供了汉坦病毒基因组安第斯病毒片段s完整序列
[0629]
[0630][0631]
选择以下示例性序列作为间隔子grna的靶标,用于汉坦病毒检测:gtggcagctcaaaaattggctac(seq id no:70)(上文加下划线的)。可以选择其他序列用以靶向。
[0632]
crispr指导物设计和合成
[0633]
使用特异于汉坦病毒靶标序列的间隔子设计了grna。如下所示是指导物(包括正向重复(单下划线)+靶标互补序列(双下划线)):aaatttctactgtagtagat gtggcagctcaaaaattggctac(seq id no:249)
[0634]
对于grna的天然表达和加工,在cas表达载体中克隆了具有来自cas12a.1和cas12p的正向重复和靶互补序列的最小阵列。在表达细菌nico21(de3)感受态大肠杆菌中,体内形成crispr复合物并从细菌提取物中纯化。在其他变型中,可以体外合成指导物并与cas蛋白复合。
[0635]
将该复合物添加到含有分子报告子和荧光染料的混合物中。将待测试的样品添加到混合物中。待测试的样品可以是:从受试者直接获得的样品;从受试者获得的样品,然后稀释和/或处理;从受试者中取出的样品中的dna(可以经扩增)或rna;或者待测试的样品可以是由样品的rna制成的cdna。例如使用rpa(重组酶聚合酶扩增,例如,使用rpa twistamp basic(tabas03)),可以进一步扩增样品。
[0636]
用于形成crispr复合物的组分如表10所示,按顺序混合。制备复合物,并使其在室温下孵育10分钟。
[0637]
表10
[0638]
组分[母液][最终]体积(1x)无核酸酶的水
ꢀꢀ
15.05缓冲液neb 2.110x1x2.0rna指导物工作溶液300nm30nm2.2cas12a.1工作溶液1um30nm0.8总计
ꢀꢀ
20.0
[0639]
用于形成crispr混合物的组分如表11所示,按顺序混合。
[0640]
表11
[0641][0642][0643]
结果读出
[0644]
在荧光板读数器中在37℃下监测反应长达30分钟,在hex通道中每2分钟或在最终终点进行一次荧光测量(λex:536nm;λem:556nm)。使用在不存在靶标的情况下获得的读数来背景校正所得数据。
[0645]
图9a显示了本公开的ca12a.1和cas12p蛋白以及汉坦靶标的特异性切割活性。用汉坦靶标克隆了pgem质粒(pgem-hanta),并用于证明cas12a.1和cas12p的特异性切割活性。将cas12a.1和cas12p与其各自的grna一起在37℃下孵育2小时,以靶向汉坦靶标并暴露于ggem-hanta质粒或无靶标的ggem质粒。箭头显示,切割pgem-hanta质粒但不切割pgem,证明切割是特异于汉坦靶标的。
[0646]
使用旁切活性,能够在小于1小时内在皮摩尔浓度下检测汉坦病毒rna,如图13中所示。图13显示了本公开的cas12a.1和cas12p的无rpa的灵敏度曲线,将各个靶标浓度测量30分钟。
[0647]
实施例9:cas12p表征
[0648]
进一步表征cas12p并与lbcas12a(seq id no:122(seq id no:242,来自
us9790490))进行比较,以支持该新型cas12亚型的特征。
[0649]
图14显示了对于从sars-cov-2rna逆转录的靶标dna,通过cas12p得到的荧光检测量在37℃和25℃下相等,指示热稳定性和功能和室温。
[0650]
图15和下文显示了cas12p与lbcas12a在室温下的动力学性能。
[0651][0652]
图16进一步显示了cas12p与lbcas12a在室温下的差异性能。
[0653]
如上所述,图9a显示了本公开的ca12a.1和cas12p蛋白与示例性的汉坦病毒靶标的特异性切割活性,如上一实施例所述。图9b显示了本公开的cas12a.1和cas12p蛋白的旁切活性,使用汉坦病毒作为示例性靶标,如上一实施例所述。图9c显示了针对sars-cov-2靶标,新型cas12p蛋白的旁切活性,如实例10中描述的。
[0654]
图17显示了cas12p切割ssdna和rna报告子的能力,作为示例在各种靶标(汉坦病毒、sars-cov-2)中进行测试的。将cas12p与针对汉坦病毒或sars-cov-2病毒的grna一起孵育以形成1um复合物,并以10nm浓度暴露于dna靶标,以1和0,5um之间的浓度向混合物中添加ssdna或rna荧光标记的报告子。对照不含特异性dna靶标。旁切活性仅在ssdna和rna的靶标存在下可见。
[0655]
实施例10:使用cas12a.1检测sars-cov-2
[0656]
本文提供了使用cas12p在急性感染期间检测上呼吸道样品中的sars-cov-2的实施例。阳性结果指示存在sars-cov-2rna。可以利用与患者病史和其他诊断信息的进一步临床相关性来确定患者感染状态。
[0657]
测定
[0658]
按照用户指南中的说明,使用qiamp病毒rna迷你试剂盒(qiagen)从140μl鼻咽/口咽样品纯化rna并在60μl中洗脱。如果不立即测试rna,则将rna储存在-70℃。
[0659]
rna纯化后,使用caspr lyo-crispr sars-cov-2试剂盒检测sars-cov-2基因组rna是使用图18中总结的且在下文概述的两步程序进行的。
[0660]
步骤1:使纯化的rna接受逆转录和扩增。使用逆转录环介导的等温扩增(rt-lamp)对5μl纯化的rna进行逆转录和扩增,其中引物组专门设计用于靶向sars-cov-2病毒基因组的高度保守的n基因。
[0661]
rt-lamp反应基于总共三(3)对引物,这些引物扩增sars-cov-2rna的n基因中的特异性序列。
[0662]
通过在62℃下孵育30分钟来进行rt-lamp反应。
[0663]
步骤2:在rt-lamp反应之后,使用cas12a.1核糖核蛋白复合物(rnp复合物)进行扩增的病毒靶标的检测,该核糖核蛋白复合物包含cas12a.1+靶向步骤1的扩增的病毒n基因序列的grna(单分子指导物)。由病毒rna制成的cdna中grna靶向的序列如下:gatcgcgccccactgcgttctcc(seq id no:119)
[0664]
如果样品中存在sars-cov-2基因组rna并在rt-lamp反应期间被扩增,则来自rnp复合物的grna可以与dna靶标结合并触发cas12a.1的旁切活性,从而降解5’fam-3’quencher单链dna(ss-dna)报告子分子以导致荧光发射。荧光测量可以在具有荧光能力的
标准板读数器中进行。
[0665]
从开始到结束-从获得样品到读出结果,该测定在不到60分钟内完成。图18显示了用于检测该实施例中描述的sars-cov-2的示意性工作流程。
[0666]
包括另外的阴性对照、阳性对照和提取对照。
[0667]
阴性对照:使用无核酸酶的水来鉴定测定运行的任何潜在污染。
[0668]
阳性对照:在单独的小瓶中以2000cp/ml的浓度提供与靶标序列相同的合成序列。阳性对照证实该测定按预期进行。
[0669]
提取对照:将靶向人管家基因rnase p(例如)的引物组包含在rt-lamp反应混合物中,以确保提取过程的正确执行。
[0670]
使用的试剂以冻干形式提供,减少了操作员错误的人工来源。
[0671]
结果
[0672]
对于阴性对照(ntc),计算在终点(t=20分钟)测量的荧光(if)与运行开始时(t=0分钟)的荧光之间的比值
[0673][0674]
对于阳性对照和临床样品,计算在终点(t=20分钟)测量的样品反应荧光(if)与20分钟时对应的有效阴性模板对照反应荧光测量值之间的比值。
[0675]-对于阳性对照(pc)
[0676][0677]-对于临床样品
[0678][0679]
一旦计算出对照和样品的比值,就根据以下对照测定标准计算结果:
[0680][0681]
在这个实施例中,对于未知的临床样品:阳性样品的比值应当》3(在t=20分钟时,样品反应与阴性对照反应之间至少3倍的荧光发射增加)。
[0682]
在该实施例中,阴性样品的比值应当《3(在t=20分钟时,样品反应与阴性对照反应之间的荧光发射增加不到3倍)。为了确认阴性结果,预期rnase p应当具有》3的值(在t=20分钟时,样品反应和阴性对照反应之间荧光发射增加)。
[0683]
性能评估-分析灵敏度、检测限
[0684]
检测限(lod)研究确立了至少95%的时间可以检测到的最低sars-cov-2浓度(基因组拷贝(cp)/μl输入)。
[0685]
为了确定lod,将整个灭活的sars-cov-2的连续稀释液掺入阴性鼻咽样品中并根据上述程序处理。
[0686]
lod是通过测试三(3)个不同稀释度(10拷贝/μl、5拷贝/μl、2.5拷贝/μl)的三(3)个重复来确定的,并且对应于最低浓度(5拷贝/μl),在此浓度3/3重复被测试为阳性。通过在每个浓度的二十(20)个重复中以0.5x-1x

1.5x-2x的初步lod进行测试来确认该初步lod(5拷贝/μl)。lod是最低浓度,在此浓度至少19/20个重复被测试为针对靶标为阳性。
[0687]
lod确认为7.5拷贝/μl,检出率为95%(19/20)。结果总结在下表中:
[0688]
表12
[0689]
重复比值结果1》3阳性2》3阳性3》3阳性4》3阳性5》3阳性6》3阳性7》3阳性8》3阳性9》3阳性10》3阳性11》3阳性12《3阴性13》3阳性14》3阳性15》3阳性16》3阳性17》3阳性18》3阳性19》3阳性20》3阳性
[0690]
性能评估-分析灵敏度、包容性
[0691]
通过将sars-cov-2测定引物和grna与gisaid中截至2020年5月16日可用的4703条sars-cov-2序列的比对进行比较来证明包容性。通过仅考虑全基因组序列(》29000bp)并通过消除具有模糊测序数据(n)和动物来源的低质量序列来进一步完善数据集。该计算机分析表明,使用的引物和grna序列与所有可用的循环sars-cov-2序列具有99.9%的同源性。
[0692]
性能评估-分析特异性
[0693]
测定2是基于一组引物和设计用于特异性检测sars-cov-2的独特grna。
[0694]
为了评估分析特异性,首先使用ncbi blast工具进行了计算机分析,以确认任何引物/grna序列与呼吸道的正常和病原性生物之间不存在任何潜在的交叉反应性。
[0695]
结果总结在表13中:
[0696]
表13
[0697][0698][0699]
这些结果表明,只有少数微生物的基因组序列与测定中包含的sars-cov-2引物或grna中至少一者之间具有》80%的同源性。
[0700]
为了确认计算机评估,在体外检查相同的病原体以检查潜在的交叉反应性和干扰。
[0701]
在提取程序的裂解步骤期间,通过将基因组dna/rna或灭活菌株以表15中所示的浓度掺入sars-cov-2阴性鼻咽样品中,对总共22种病原体进行分析,并使用在此描述的测定进行测试。一式三份测试每种病原体。为了丢弃任何假阴性结果,对每个样品并行运行
rnasep测定,
[0702]
还对与试剂盒中包含的sars-cov-2引物或grna显示》80%同源性的微生物进行了干扰分析。为了检测任何潜在的干扰,在3x lod sars-cov-2(22.5cp/μl)的存在下,按照用于交叉反应性测试相同的方案进行分析。
[0703]
测试的病原体的所有阴性结果均由rnasep测定中的阳性结果证实。
[0704]
表14
[0705][0706][0707]
总之,基于计算机和体外分析,预计测定中包括的引物/grna与呼吸道中最常见的病原体之间没有交叉反应性或干扰。
[0708]
临床评估
[0709]
使用鼻咽拭子作为来自具有上呼吸道感染体征和症状的男性和女性成年患者的临床样品,对该测定进行临床评估。
[0710]
收集总共30个阳性样品和30个阴性样品以评估性能,并使用qiamp病毒rna迷你试剂盒进行rna提取测试,然后按照所述程序进行测试(在表15中指出的“基于cas12a.1的测定”)。还使用rt-pcr测试作为比较方法对所有样品进行测试,以获得阳性和阴性百分比一致性值。结果呈现在表15中,并显示了用比较器方法得到的100%阳性百分比一致性(ppa)和100%阴性百分比一致性(npa)。
[0711]
表15
[0712][0713]
实施例11:使用cas12p检测sars-cov-2
[0714]
本文提供了使用cas12p在急性感染期间检测上呼吸道样品中的sars-cov-2的实施例。阳性结果指示存在sars-cov-2rna。可以利用与患者病史和其他诊断信息的进一步临床相关性来确定患者感染状态。
[0715]
测定
[0716]
将鼻咽/鼻拭子插入500ul裂解缓冲液中,涡旋2分钟,将100ul裂解的样品转移到1,5ml容量管中并在95℃下加热5分钟。
[0717]
在样品处理后,使用caspr direct lyo-crispr sars-cov-2试剂盒检测sars-cov-2基因组rna是使用图19中总结的且在下文概述的两步程序进行的。
[0718]
步骤1:使裂解的样品经受逆转录和扩增。使用逆转录环介导的等温扩增(rt-lamp)对10μl裂解的样品进行逆转录和扩增,其中引物组专门设计用于靶向sars-cov-2病毒基因组的两个高度保守的n基因和一个高度保守的orf1ab基因。
[0719]
rt-lamp反应基于总共三(9)对引物,这些引物扩增sars-cov-2rna的n基因中的两个特异性序列和orf1ab基因中的一个特异性序列。
[0720]
通过在62℃下孵育60分钟来进行rt-lamp反应。
[0721]
步骤2:在rt-lamp反应之后,使用cas12p核糖核蛋白复合物(rnp复合物)进行扩增的病毒靶标的检测,该核糖核蛋白复合物包含cas12p+靶向步骤1的扩增的病毒n和orf1ab基因序列的三个grna(单分子指导物)。由病毒rna制成的cdna中grna靶向的序列如下:gatcgcgccccactgcgttctcc(seq id no:119)、auggcaccuguguaggucaacca(seq id no:120)和ugugcugacucuaucauuauugg(seq id no:123)。
[0722]
如果样品中存在sars-cov-2基因组rna并在rt-lamp反应期间被扩增,则来自rnp复合物的grna可以与dna靶标结合并触发cas12p的旁切活性,从而降解5’fam-3’quencher单链报告子分子以导致荧光发射。荧光测量可以在具有荧光能力的标准板读数器中进行。
[0723]
从开始到结束-从获得样品到读出结果,该测定在不到75分钟内完成。图18和图19显示了检测sars-cov-2的示意性工作流程。
[0724]
包括另外的阴性对照、阳性对照和提取对照。
[0725]
阴性对照:使用无核酸酶的水来鉴定测定运行的任何潜在污染。
[0726]
阳性对照:在单独的小瓶中以2000cp/ml的浓度提供与靶标序列相同的合成序列。阳性对照证实该测定按预期进行。
[0727]
提取对照:将靶向人管家基因rnase p(例如)的引物组包含在rt-lamp反应混合物中,以确保提取过程的正确执行。
[0728]
使用的试剂以冻干形式提供,减少了操作员错误的人工来源。
[0729]
结果
[0730]
对于阴性对照(ntc),计算在终点(t=5分钟)测量的荧光(if)与运行开始时(t=0
分钟)的荧光之间的比值。
[0731][0732]
对于阳性对照和临床样品,计算在终点(t=5分钟)测量的样品反应荧光(if)与5分钟时对应的有效阴性模板对照反应荧光测量值之间的比值。
[0733][0734]
一旦计算出对照和样品的比值,就根据以下对照测定标准计算结果:
[0735]
表16
[0736][0737]
在这个实施例中,对于未知的临床样品:阳性样品的比值应当≥2.5(在t=5分钟时,样品反应与阴性对照反应之间至少2.5倍的荧光发射增加)。
[0738]
在该实施例中,阴性样品的比值应当≤2.5(在t=5分钟时,样品反应与阴性对照反应之间的荧光发射增加不到2.5倍)。为了确认阴性结果,预期rnase p应当具有≥2.5的值(在t=5分钟时,样品反应和阴性对照反应之间荧光发射增加)。
[0739]
性能评估-分析灵敏度、检测限
[0740]
检测限(lod)研究确立了至少95%的时间可以检测到的最低sars-cov-2浓度(基因组拷贝(cp)/μl输入)。
[0741]
为了确定lod,将整个灭活的sars-cov-2的连续稀释液掺入带有阴性鼻基质的裂解缓冲液中并根据上述程序处理。
[0742]
lod是通过测试三(3)个不同稀释度(25拷贝/μl、12.5拷贝/μl、6.125拷贝/μl)的三(5)个重复来确定的,并且对应于最低浓度(25拷贝/μl),在此浓度3/3重复被测试为阳性。在二十(20)个重复中确认了该初步lod(25拷贝/μl)。lod是最低浓度,在此浓度至少20/20个重复被测试为针对靶标为阳性。
[0743]
lod确认为25拷贝/μl,检出率为100%(20/20)。结果总结在下表中:
[0744]
表17
[0745][0746][0747]
性能评估-分析灵敏度、包容性
[0748]
通过将sars-cov-2测定引物和grna与gisaid中截至2020年5月16日可用的4703条sars-cov-2序列的比对进行比较来证明包容性。通过仅考虑全基因组序列(》29000bp)并通过消除具有模糊测序数据(n)和动物来源的低质量序列来进一步完善数据集。该计算机分析表明,所有使用的引物和grna序列与所有可用的循环sars-cov-2序列
[0749]
具有100%的同源性。
[0750]
性能评估-分析特异性
[0751]
测定2是基于一组引物和设计用于特异性检测sars-cov-2的grna。
[0752]
为了评估分析特异性,首先使用ncbi blast工具进行了计算机分析,以确认任何引物/grna序列与呼吸道的正常和病原性生物之间不存在任何潜在的交叉反应性。
[0753]
结果总结在表18中:
[0754]
表18
[0755]
[0756][0757]
这些结果表明,只有少数微生物的基因组序列与测定中包含的sars-cov-2引物或grna中至少一者之间具有》80%的同源性。
[0758]
为了确认计算机评估,在体外检查相同的病原体以检查潜在的交叉反应性和干扰。
[0759]
通过将基因组dna/rna或灭活菌株以表19中所示的浓度掺入sars-cov-2阴性裂解的样品中,对总共22种病原体进行分析,并使用在此描述的测定进行测试。一式三份测试每种病原体。为了丢弃任何假阴性结果,对每个样品并行运行rnasep测定,
[0760]
还对与试剂盒中包含的sars-cov-2引物或grna显示》80%同源性的微生物进行了干扰分析。为了检测任何潜在的干扰,在3x lod sars-cov-2(75cp/μl)的存在下,按照用于交叉反应性测试相同的方案进行分析。
[0761]
测试的病原体的所有阴性结果均由rnasep测定中的阳性结果证实。
[0762]
表19
[0763]
[0764][0765]
总之,基于计算机和体外分析,预计测定中包括的引物/grna与呼吸道中最常见的病原体之间没有交叉反应性或干扰。
[0766]
临床评估
[0767]
使用鼻咽拭子作为来自具有上呼吸道感染体征和症状的男性和女性成年患者的临床样品,对该测定进行临床评估。
[0768]
收集共47个阳性样品和43个阴性样品以评估性能。还使用rt-pcr测试作为比较方法对所有样品进行测试,以获得阳性和阴性百分比一致性值。结果呈现在表20中,并显示了用比较器方法得到的97.9%阳性百分比一致性(ppa)和100%阴性百分比一致性(npa)。
[0769]
表20
[0770][0771][0772]
图20显示了cas12p在30-60分钟切割活性后具有最小的背景信号。这提供了低病毒浓度的优点,并表明冻干型式的稳定性。图21显示了在室温下使用cas12p的诊断测定能以纸质型式读出。图22显示了在室温下使用cas12p的诊断测定可以用荧光检测器在孔板中读出。
[0773]
实施例12:使用cas12p和rna指导物检测sars-cov-2
[0774]
使用带有基于rna的报告子的冻干珠来检测患者和对照样品中的sars-cov-2rna。用于该实施例,使用实施例11中描述的样品的子集。将cas12p与它们各自的sgrna预孵育并在冻干过程之前添加经标记rna报告子。预扩增的rt-lamp产物用作输入。rt-lamp反应的输入是来自患者和阴性对照鼻咽拭子的裂解样品。图19显示了使用rna报告子,使用cas12p/指导物复合物检测来自样品的sars-cov-2的工作流程。图24显示了使用cas12p和rna报告子在37℃下以30分钟对冻干型式的患者样品和阴性对照样品进行sars-cov-2检测的结果(n=16)。
[0775]
实施例13:检测特异性切割活性
[0776]
图25:研究了本公开的cas12a.1和cas12p在与其指导物复合时是否能够切割dsdna。在这些实施例中,靶标是被克隆到来自promega(目录号a1360)的商业easy载体中的汉坦病毒dsdna序列(100pb)。阴性对照包括空easy载体。阳性对照包括通过用来自neb的ndei限制性内切核酸酶(目录号r0111l)切割线性化的easy载体/汉坦dsdna靶标。程序如下:在商业nebuffer
tm 2.1(目录号b7202s)中在室温下进行15分钟,将100nm的cas12a.1或cas12p与100nm的sgrna复合以靶向汉坦序列。包括未与其指导物复合的、具有cas酶的对照。然后,在20ul的最终反应体积中加入5ng/ul靶标。将反应在37℃或25℃孵育0、30、60或90分钟,并通过添加50mm edta结束。然后,将样品以12000g离心10分钟并与来自neb的6x凝胶加载染料(目录号b7024s)混合。在0.8%tbe琼脂糖凝胶中分析样品。使用来自neb的快速dna阶梯(fast dna ladder)(目录号n3238s)评估物质的分子量。电泳后,凝胶用来自invitrogen的sybr
tm
金核酸凝胶染料(目录号s11494)的新鲜溶液染色30分钟并在versadoc
tm
成像系统(bio-rad)上成像。图1显示了测定的结果。cas12a.1可以在37℃下90分钟后使全部质粒线性化,而cas12p只持续了60分钟就达到了相当的结果。
[0777]
图26:研究了本公开的cas12a.1和cas12p在与其指导物复合时是否能够切割ssdna。在这些实施例中,靶标包括靶向汉坦病毒的、来自idt的70个核苷酸长度的定制ssdna荧光标记序列(3

fam-ssdna)(5
′‑
tca ttt aga aag tag ata ttg att gat ttt agc gaa agc caa ttt ttg agc tgc cac tga tgt aaa agt t-3
′‑
6-fam;seq id no:124)。阴性对照包括也靶向汉坦病毒的、来自idt的120个核苷酸长度的定制反义ssdna序列(asssdna)(5
′‑
gct atc tta atc ctt aat cta tcc tca aac gtt cta tta atg gcc gtg tca atc aat atc tac ttt cta aat gaa act ttt aca tca gtg gca gct caa aaa ttg gct ttc gct aaa atc-3

;seq id no:125)。程序如下:在商业nebuffer
tm 2.1(目录号b7202s)中在室温下进行15分钟,将10pmol的cas12a.1或cas12p与10pmol的sgrna复合以靶向汉坦序列。包括未与其指导物复合的、具有cas酶的对照。然后,在10ul的最终反应体积中加入10pmol的3

fam-ssdna或可选的asssdna。将反应在37℃孵育0、0.5、1或5分钟,并通过添加来自invitrogen的2x novex
tm tbe-urea样品缓冲液(目录号lc6876)然后在95℃下加热3分钟结束反应。将样品以12000g离心10分钟,并在来自bio-rad的15%mini-tbe-urea凝胶(目录号4566056)上分析。使用来自idt的寡核苷酸长度标准品(目录号51-05-15-02)评估物质的分子量。在versadoc
tm
成像系统(bio-rad)上首先成像凝胶,然后用来自invitrogen的sybr
tm
金核酸凝胶染料(目录号s11494)的新鲜溶液染色30
分钟,以可视化asssdna的非荧光标记序列和非荧光标记的阶梯(ladder)。图2显示了测定的结果。cas12a.1和cas12p显示了3

fam-ssdna底物(s)的特异性ssdna切割,产生约40个核苷酸长度产物(p)。这两种cas酶无法切割asssdna序列(ntc)。反应发生在几秒到几分钟的时间范围内。
[0778]
图27:研究了本公开的cas12a.1和cas12p在与其指导物复合时是否能够切割ssrna。在这些实施例中,靶标包括通过体外转录(ivt)获得并靶向汉塔病毒的ssrna序列。阴性对照包括来自idt的65个核苷酸长度的定制非靶标ssrna序列(5
′‑
taa gcg ccc ttg cgc ttt ccc cag cct tcg ggt tgg ttg cct ttt agt gca agg gcg cgatta tt-3

;seq id no:126)。阳性对照包括靶向汉坦病毒的、来自idt的120个核苷酸长度的定制ssdna序列(5
′‑
gat ttt agc gaa agc caa ttt ttg agc tgc cac tga tgt aaa agt ttc att tag aaa gta gat att gat tgacac ggc cat taa tag aac gtt tgagga tag att aag gat taa gat agc-3

;seq id no:127)。程序如下:在商业nebuffer
tm 2.1(目录号b7202s)中在室温下进行15分钟,将150nm的cas12a.1或cas12p与150nm的sgrna复合以靶向汉坦序列。包括未与其指导物复合的、具有cas酶的对照。然后,在10ul的最终反应体积中加入5ng/ul的ssrna或可选的非靶标ssrna或ssdna。将反应在37℃孵育0、1或3小时并通过添加来自invitrogen的2x novex
tm tbe-urea样品缓冲液(目录号lc6876)然后在65℃下加热3分钟结束反应。将样品以12000g离心10分钟,并在来自bio-rad的15%tbe-urea凝胶(目录号4566056)上分析。使用来自neb的低范围ssrna阶梯(目录号n0364s)评估物质的分子量。凝胶用来自invitrogen的sybr
tm 金核酸凝胶染料(目录号s11494)的新鲜溶液染色30分钟并在versadoc
tm
成像系统(bio-rad)上成像。图3显示了测定的结果。cas12a.1和cas12p都没有证明特异性ssrna切割活性。
[0779]
实施例14:cas12p非特异性核酸酶活性的表征
[0780]
maldi-tof ms实验说明:采用基质辅助激光解吸/电离飞行时间质谱(maldi-tof ms)来监测cas12p酶的非特异性核酸酶活性产生的产物。使用受保护的dna(c*c*c*c*c*c*c*c*c*c*c*c*c*c*c*c*c*c*ttatt;seq id no:128)和rna(rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rc*rururaruru;seq id no:129)报告子来确保最小的长度并最小化可能的水解产物的数量。c和rc碱基上的符号(*)表示存在可抵抗核酸酶降解的硫代磷酸酯键。采用对应的报告子进行crispr反应时,复合物的最终浓度为在含有1x结合缓冲液(50mm nacl,10mm tris-hcl,10mm mgcl2,1mm dtt,100g/ml bsa,ph 7.9)的溶液中75nm cas12p:75nm sgrna:20nm激活子:2.5um dna报告子或75nm cas12p:75nm sgrna:10nm激活子:1.25um rna报告子。将反应对于dna报告子在1小时内在25℃下孵育或对于rna报告子在6小时内在37℃下孵育(反应的t1,图28和图30)。通过在添加报告子前加热crispr反应,将反应的时间零(t0,图29和图31)作为阴性对照。在斯坦福大学的perseptive biosystems(abi)-voyager-de rp-maldi-tof质谱仪上纯化和分析反应。对于每个反应,生成列表,其中包含所有可能的dna/rna切割产物和所有预期的突出端的预测的m/z(质荷比),如joyner等人2012年提出的那样。通过使用perl脚本,将观察到的m/z与上述列表相关联。相对于反应的主要信号,计算峰的相对强度。dna报告子水解产生独特的切割产物(图28),同时rna报告子的水解产生多个片段,包括3'氢氧化物和磷酸盐末端(图30)。在所有情况下,主要的水解物质是在受保护序列和3'氢氧化物末端后含有两个核苷酸的水解物质。
ttattatt-3iabkfq3(seq id no:121),dna-rna嵌合报告子(/56-fam/tt raruru att/3iabkfq/,/56-fam/tt atru raruru/3iabkfq/或rnasealert(cat n 11-04-03-03-idt))的溶液中稀释至37.5nm cas12p:37.5nm sgrna:10nm激活子或75nm cas12a.1:75nm sgrna:10nm激活子的终浓度来启动反应。将反应在荧光板读数器(m2)中孵育长达40分钟,每1分钟进行一次荧光测量(λex:535nm;λem:595nm)。背景校正的荧光值是通过减去在没有靶标质粒的情况下进行的反应获得的荧光值来计算的。误差条表示平均值
±
s.d.,其中n=3个重复。图37显示了这些数据的结果。
[0793]
尽管已经结合其具体实施方式描述了本发明,但前述说明旨在说明而非限制由所附权利要求书的范围定义的本发明范围。其他方面、优点和修改在以下权利要求的范围内。
[0794]
实施例17:cas12a.1和cas12p成熟指导物表征和验证
[0795]
成熟指导物的支架序列是从对应的crispr基因座以计算机方式推断的。图38显示了cas12a.1(5’aaauuucuacuguaguagau 3’)(seq id no:116;分图a)和cas12p(5’agauuucuacuuuuguagau3’)(seq id no:117;分图b)的成熟指导物支架的二级结构。这些在下面得到验证。
[0796]
在体外评估了cas12a.1和cas12p的成熟指导物支架。在该实施例中使用这些成熟的支架序列以及靶向来自sars-cov-2病毒的n基因的间隔子。在40μl反应中,通过将cas12p或cas12a.1复合物在含有1
×
结合缓冲液(50mm nacl,10mm tris-hcl,10mm mgcl2,1mm dtt,100g/ml bsa,ph 7.9)和600nm的ssdna famq报告子底物(ssdna 5’6-fam ttattatt-3iabkfq3(seq id no:121))的溶液中稀释至37.5nm cas12p:37.5nm sgrna:10nm激活子或75nm cas12a.1:75nm sgrna:10nm激活子的终浓度来启动反应。将反应在荧光板读数器(m2)中孵育长达20分钟,每1分钟进行一次荧光测量(λex:535nm;λem:595nm)。背景校正的荧光值是通过减去在没有靶标质粒的情况下进行的反应获得的荧光值来计算的。误差条表示平均值
±
s.d.,其中n=3个重复(图39)。该图中的数据表明,这些成熟支架序列提供了sars-cov-2的crispr介导的检测。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1