本公开涉及用于转录激活的试剂和方法,并且特别涉及转录激活因子中的异源反式激活因子域用于靶向转录激活的用途。引言蛋白质编码基因的转录通过以序列特异性方式结合dna的转录因子(tf)、从启动子启动转录的rna聚合酶ii机制以及调节染色质结构并充当tf与rna pol ii之间的桥梁的多种染色质相关因子和复合物的协调相互作用来协调(cramer,2019)。人类基因组编码参与转录调节各个阶段的数千种蛋白质,并且诸如chip-seq等方法的现成可用性揭示了不同条件下数百种因子的基因组结合位点(the encode project consortium等人,2020)。与此同时,系统研究已经表征或推断了约四分之三的人类tf的dna结合特异性(badis等人,2009;jolma等人,2013;lambert等人,2018;najafabadi等人,2015;weirauch等人,2014)。类似地,相互作用蛋白质组学方法发现了许多染色质相关蛋白,并且表征了人类细胞中转录调节复合物的组成(gao等人,2012;huttlin等人,2020;lambert等人,2019;li等人,2015;marcon等人,2014;mashtalir等人,2018)。然而,由于这些方法提供的因果见解有限,tf和染色质相关因子是否以及如何促进转录激活或阻遏(或通过其它方式调节染色质状态)仍然很大程度上未知。例如,chip-seq实验中观察到的绝大多数基因组结合位点与转录事件没有因果关系。也就是说,给定转录调节因子的敲低或敲除不会影响所述调节因子所结合的大多数基因的转录。另一方面,基于序列的转录调节因子注释一直具有挑战性,因为大多数转录效应功能是由简并线性基序而不是折叠和保守的蛋白质域编码的(arnold等人,2018;erijman等人,2020;sigler,1988;staller等人,2021)。人工募集,也称为激活因子旁路,是在限定背景下表征不同蛋白质转录效应的有效方法(ptashne和gann,1997;sadowski等人,1988)。在这种方法中,通过将蛋白质融合至特征明确的tf(例如gal4或tetr)的dna结合域,将蛋白质或其片段异位募集至报告基因。限定背景减轻了内源基因调节带来的挑战,在内源基因调节中,多种因子协同结合调节元件,阻碍了因果推理。传统上,人工募集已用于鉴定个体转录调节因子中的转录激活因子或反式激活域(tad)(ptashne和gann,1997)。然而,最近的研究通过将果蝇或酵母中的大量调节因子单独系连至报告基因来表征其转录效应(keung等人,2014;stampfel等人,2015)。由于阵列格式的可扩展性有限,这些研究侧重于已知的调节因子,而不是潜在的新因子。此外,经典模式生物缺乏若干对哺乳动物基因表达至关重要的调节机制和层次,例如增强子(酵母)或dna甲基化(酵母和果蝇)。最近,tycko和其同事实施了一种无偏的合并筛选策略来表征注释的人类蛋白质域的转录激活潜力(tycko等人,2020)。此研究强调了无偏方法在鉴定新型转录调节因子方面的价值,例如变异krab域在转录激活而不是阻遏中的意想不到的作用。然而,由于大多数转录激活域是由无序区域编码(arnold等人,2018;dyson和wright,2005),因此以域为中心的筛选可能会遗漏很大一部分反式激活因子。因此,尽管人们对转录调节复合物的组成和其基因组结合模式的了解有所增加,但仍缺乏对tf和多种染色质相关因子引起的下游效应的完整了解。
背景技术:
技术实现思路
1、如本文所述,本发明人建立了一个平台来以无偏的方式系统地鉴定和表征人类蛋白质的转录调节潜力。通过以合并形式筛选13,000多种蛋白质,鉴定了数百种有效的激活因子,其中许多激活因子先前注释不充分。在命中当中系统地发现了反式激活域,包括一些不符合激活域的规范“酸性斑点”模型的域。此外,相互作用蛋白质组学与化学抑制剂相结合,描述了新型和已知转录激活因子的辅因子特异性,强调了即使具有几乎相同的dna结合特异性的高度相关的tf也可通过不同的辅因子复合物激活转录。
2、本发明人在本文描述了人类细胞中转录激活因子的首次系统筛选。鉴定了数百种转录激活因子,如所预期,其富含序列特异性转录因子和其它染色质相关蛋白。
3、本文显示的结果表明,只有非常有限数量的tf是强转录激活因子。这在已知的人类tf的dna结合特异性和染色质占据的背景下是有意义的(jolma等人,2013;the encodeproject consortium等人,2020;yan等人,2013)。大多数tf识别短(约6-10bp)基序,并与基因组中的数千个位点相关。然而,大多数结合事件与转录输出无关。强转录激活域与dna结合域的有限序列特异性相结合,会导致大量基因的虚假激活,可能会阻碍细胞适应性。本文鉴定的许多最强激活因子不是dna结合转录因子,而是其它染色质相关蛋白。
4、新颖且高效的人类反式激活域的发现也具有治疗意义。源自病毒蛋白的组分,例如vp16反式激活域或三联vpr激活因子可引发体内免疫反应并导致临床不良反应。从完全人类组分中设计合成转录调节因子预计将在治疗应用中具有优势(israni等人,2021)。此外,本文还显示,组合来自多种不同人类蛋白质的激活域可产生“超级激活因子”,其即使在基因组的高度压缩区域中也能够稳健地上调基因。
5、一个方面包括一种异源转录激活因子,其包含:
6、dna靶向域,任选地无酶活性的crispr-cas蛋白、锌指dna结合域、tet阻遏物或转录激活因子样效应物(tale)dna结合域;和
7、效应域,其包含:
8、至少一种反式激活域(tad)或其功能变体,所述tad选自表1至6中的任一者、任选地表2或表6中列出的tad,或
9、选自表1-6中的任一者、任选地表1或表3中列出的tad的至少两种tad或其任一者的功能变体,优选地选自表4或表5或表6中列出的tad的至少一种tad或其功能变体,
10、其中dna靶向域和效应域可操作地连接。
11、一个方面包括编码本文所述的效应域的分离的核酸
12、一个方面包括编码本文所述的异源转录激活因子的分离的核酸。
13、一个方面包括表达构建体,其包含可操作地连接至一个或多个启动子和一个或多个转录终止位点的本文所述的核酸。
14、一个方面包括包含本文所述的核酸或表达构建体的载体,任选地其中该载体是腺病毒或慢病毒载体。
15、一个方面包括包含本文所述的转录激活因子、核酸、表达构建体或载体的细胞。
16、一个方面包括转录激活系统,其包含:本文所述的异源转录激活因子,其中dna靶向域包含crispr-cas蛋白和至少一种grna。
17、一个方面包括激活细胞中靶基因的转录的方法,所述方法包括:a)将本文所述的转录激活因子、核酸、表达构建体或载体引入至细胞中;以及b)在合适的条件下培养细胞,以使得效应域激活靶基因的转录。
18、一个方面包括筛选方法,所述方法包括:a)将转录激活因子、一种或多种核酸、一种或多种表达构建体或一种或多种本文所述的载体引入至多个细胞中,其中dna靶向域包含crispr-cas蛋白和多种grna;或将多种grna引入至本文所述的细胞群中,其中dna靶向域包含crispr-cas蛋白;b)培养所述多个细胞,以使得一种或多种grna与crispr-cas蛋白缔合并将转录激活因子引导至crispr靶位点,以使得效应域激活靶基因的转录;c)任选地用一定量的测试药物或毒素进行处理;d)任选地培养所述多个细胞一段时间以允许grna丢失或富集;以及e)收集所述多个细胞或其子集。
19、一个方面包括包含本文所述的转录激活因子、核酸、表达构建体、载体或细胞的组合物。
20、一个方面包括试剂盒,其包括小瓶和本文所述的异源转录激活因子、核酸、表达构建体、载体、细胞或组合物,以及任选的以下中的一者或多者:诱导剂、grna或grna表达构建体。
21、前面的章节仅作为实例提供,并且不意图限制本公开和所附权利要求的范围。根据本发明的权利要求、描述和实施例,本领域普通技术人员将理解与本公开的组合物和方法相关的附加目的和优点。例如,本公开的各个方面和实施方案可以以多种组合使用,本说明书明确地考虑了所有这些组合。这些额外的优势、目的和实施方案明确地包括在本公开的范围内。本文中用于说明本公开背景的出版物和其它材料,以及在特定情况下用于提供与实践相关的附加细节的出版物和其它材料通过引用并入,并且为了方便起见,在所附的参考文献章节中列出。