模块化结合蛋白的制作方法

文档序号:20955474发布日期:2020-06-02 20:23阅读:203来源:国知局
本发明涉及模块化结合蛋白及其产生和用途。
背景技术
::医学(尤其是癌症研究)的优先领域是扩展‘成药(druggable)’蛋白质组,其目前仅限于狭窄的分子靶标类别。例如,蛋白质-蛋白质相互作用(ppi)是所有生物过程的基础,并且代表了一大部分的潜在药物靶标,但是它们不容易适合于常规小分子抑制。串联重复序列蛋白的框架具有合理设计的巨大范围(kobe&kajava2000,longo&blaber,2014,rowling等人,2015)。串联重复序列蛋白的关键特征是相对较小的尺寸、模块性和无需二硫键的极高的稳定性(因此重组产生)。个别共有设计的重复序列是自相容的,并且可以按任何顺序放在一起;因此,功能也是模块化的,这意味着可以独立设计多种功能并且以组合的方式掺入单个分子中(wo2017106728)。新型重复序列蛋白功能(例如darpin(tamaskovic等人,2012))已经基于这些蛋白质的天然类型的ppi界面开发出来,即跨越许多重复序列单元以便为靶标创建扩展的高亲和力结合界面。已经将突变引入细胞溶质受体过氧化物酶体生成蛋白(peroxin)5的三角形四肽(tpr)重复序列的表面残基中(sampathkumar等人(2008)j.mol.biol.,381,867-880)。显示肽配体与过氧化物酶体生成蛋白5的结合是由位于几个不同的tpr重复序列中的残基介导的。还已经报道了含有tpr的蛋白质驱动蛋白-1与不同的货物蛋白的相互作用(zhu等人plosone201273e33943)。已经通过将突变引入锚蛋白重复序列中修饰了锚蛋白重复序列蛋白的特异性和稳定性(li等人(2006)biochemistry4515168-15178)。技术实现要素:诸位发明人发现,可以通过在模块化支架上展示肽基结合基序(如短线性基序(slim))来产生能够与一种或多种靶分子结合的模块化蛋白。这些模块化结合蛋白可以用作例如单功能或多功能蛋白治疗剂。本发明的一个方面提供了一种模块化结合蛋白,其包含;(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)一个或多个结合结构域,每个所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端。在一些优选的实施方案中,所述模块化结合蛋白可以包含结合第一靶分子的第一结合结构域和结合第二靶分子的第二结合结构域。所述第一或第二靶分子之一可以是e3泛素连接酶。本发明的另一个方面提供了一种产生模块化结合蛋白的方法,其包括;将编码结合结构域的第一核酸插入编码通过重复序列间环连接的两个或更多个重复序列结构域的第二核酸中,以产生编码如本文所述的模块化结合蛋白的嵌合核酸;以及表达所述嵌合核酸以产生所述模块化结合蛋白。本发明的另一个方面提供了一种产生与第一靶分子和第二靶分子结合的模块化结合蛋白的方法,其包括;编码通过重复序列间环连接的两个或更多个重复序列结构域的核酸;以及将编码与第一靶分子结合的第一结合结构域的第一核苷酸序列和编码与第二靶分子结合的第二结合结构域的第二核苷酸序列掺入所述核酸中,以产生编码包含所述第一和第二结合结构域的模块化结合蛋白的核酸,其中所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端;以及表达所述核酸以产生所述蛋白质。在一些优选的实施方案中,所述第一或第二靶分子之一是e3泛素连接酶。本发明的另一个方面提供了一种包含模块化结合蛋白的文库,所述文库中的每种模块化结合蛋白包含;(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)一个或多个结合结构域,每个所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端,其中在所述文库的结合结构域中的至少一种氨基酸残基是多样化的。本发明的另一个方面提供了一种包含模块化结合蛋白的第一和第二子文库的文库,所述第一和第二子文库中的每种模块化结合蛋白包含;(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)包含至少一种多样化氨基酸残基的结合结构域,其中所述第一子文库的模块化结合蛋白中的所述结合结构域与第一靶分子结合并且位于以下一个位置中:(i)所述模块化结合蛋白的重复序列间环;(ii)所述模块化结合蛋白的n末端或(iii)所述模块化结合蛋白的c末端,并且所述第二子文库的模块化结合蛋白中的所述结合结构域与第二靶分子结合并且位于以下另一个位置中:(i)所述模块化结合蛋白的重复序列间环;(ii)所述模块化结合蛋白的n末端或(iii)所述模块化结合蛋白的c末端。本发明的另一个方面提供了一种产生模块化结合蛋白的文库的方法,其包括;(a)提供编码模块化结合蛋白的多样化群体的核酸群体,所述模块化结合蛋白包含(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)一个或多个结合结构域,每个所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端,其中所述群体中的结合结构域是多样化的,以及(b)表达所述核酸群体以产生所述多样化群体,从而产生模块化结合蛋白的文库。本发明的另一个方面提供了一种筛选文库的方法,其包括;(a)提供模块化结合蛋白的文库,所述文库中的每种模块化结合蛋白包含;(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)位于所述蛋白质的重复序列间环中、在所述蛋白质的n末端或在所述蛋白质的c末端的结合结构域,其中在所述文库的结合结构域中的至少一种氨基酸残基是多样化的,(b)针对展示结合活性的模块化结合蛋白筛选所述文库,以及(c)鉴定所述文库中展示所述结合活性的一种或多种模块化结合蛋白。下面更详细描述本发明的其他方面和实施方案。附图说明图1示出了含有环嫁接的或螺旋嫁接的结合基序的共有设计的三角形四肽(ctpr)蛋白的热稳定性:2重复序列rtpr(其中赖氨酸残基已经被精氨酸残基替代的ctpr)蛋白的热变性(通过圆二色性监测):rtpr2(菱形)、含有环结合模块的rtpr2(圆形)和含有螺旋结合模块的rtpr2(正方形)。所有样品都是在10mm磷酸钠缓冲液(ph7.4)、150mmnacl中的20μm。图2示出了含有增加数量的结合模块(与空白模块交替)的增加长度的ctpr蛋白的热稳定性:含有1、2、3和4个环(包含端锚聚合酶结合序列)的tpr蛋白的热变性曲线(通过圆二色性监测):1tbp-ctpr2、2tbp-ctpr4、3tbp-ctpr6、4tbp-ctpr8。所有样品都是在10mm磷酸钠缓冲液(ph7.4)、150mmnacl中的20μm。图3示出了螺旋嫁接的例子。图3a(i)示出了结合至kras(kirsten大鼠肉瘤)的sos1(无七的儿子(son-of-sevenless)同源物1)的晶体结构(pdb1nvu,margarit等人cell(2003)112(5):685-95),并且(ii)示出了嫁接到ctpr2蛋白的n末端的螺旋上的sos1螺旋。示出了sos-rtpr2的建模结构,并且给出了螺旋的序列,其中关键kras结合残基为灰色并且与ctpr螺旋形成界面的残基为黑色。(iii)示出了与kras复合的sos-tpr2的建模结构。图3b示出了通过竞争性荧光偏振(fp)测量的sos-tpr2与kras的结合。预先形成了mant-gtp与kras之间的复合物,然后将0.1-300μmsos-rtpr2滴定到复合物中,将mant-gtp从kras中移出,导致fp降低。ec50是3μm。图4示出了螺旋嫁接的另一个例子。图4a示出了与p53-tpr2复合的mdm2(小鼠双微体2同系物)n末端结构域的建模结构,所述p53-tpr2包含嫁接到ctpr2蛋白的c末端的螺旋上的p53的mdm2结合螺旋。图4b示出了p53-tpr2与mdm2n末端结构域之间相互作用的itc分析。将mdm2的n末端结构域滴定到含有10μmp53-tpr2的细胞中。图5示出了单价和多价环嫁接的ctpr的例子。图5a示出了一系列端锚聚合酶结合环嫁接的ctpr2蛋白(tbp-ctpr2)与端锚聚合酶的底物结合arc4(锚蛋白重复序列簇)结构域之间相互作用的itc分析。随着结合模块的数量增加,结合亲和力和解离常数均增强。图5b示出了多价tbp-ctpr蛋白的天然凝胶分析(使用在tris-甘氨酸缓冲液(ph8.0)中的天然凝胶,蛋白质浓度40μm),所述多价tbp-ctpr蛋白被表达为具有折叠子(foldon)三聚结构域的融合构建体(boudko等人2002;meier等人2004)。纯化1tbp-ctpr2、2tbp-ctpr4和4tbp-ctpr8(均缺少折叠子结构域)并且作为单体对照跑胶。具有折叠子结构域的构建体以比其单体对应物高得多的分子量跑胶。图6示出了包含10个残基的skp2结合序列的环嫁接的ctpr的例子,所述10个残基的skp2结合序列衍生自嫁接到ctpr蛋白的环中的p27(ctpr-p27)。图6a显示ha-ctpr2-p27能够免疫共沉淀来自hek293t细胞的flag-skp2。图6b显示大肠杆菌(e.coli)表达和纯化的tpr5-p27在体外抑制p27泛素化。图7示出了环嫁接的ctpr的另一个例子。图7a示出了(左)keap1(kelch样ech相关蛋白1)kelch结构域与含有衍生自蛋白nrf2(核因子(红系细胞衍生2)样2)的环嫁接的keap1结合序列的ctpr2蛋白(nrf-ctpr2)之间相互作用的itc分析。未观察到空白cptr2蛋白的结合(右)。图7b显示nrf-ctpr2的三种变体((nrf-ctpr2(i)、nrf-ctpr2(ii)、nrf-ctpr2(iii))可以免疫共沉淀来自hek293t细胞的keap1。图8示出了通过表面重修(通过在表面位点引入精氨酸残基)实现的rtpr的细胞内递送的活细胞成像。在37℃、5%co2下,将pc3(左)和u2os(右)细胞与10μmfitc标记的表面重修的tbp-rtpr2一起孵育3小时。dic(微分干涉对比)和共焦图像的叠加。在较低的蛋白质浓度下也观察到细胞内荧光。图9示出了通过设计的异双功能rtpr诱导的靶蛋白β-连环蛋白的降解。图9a示出了用单独的ha标签化的β-连环蛋白质粒或者ha标签化的β-连环蛋白质粒与两种不同的异双功能rtpr质粒(lrh1-tpr-p27和轴蛋白-tpr-p27,设计为同时与β-连环蛋白和e3连接酶scfskp2结合)之一一起转染的细胞中的β-连环蛋白水平。图9b示出了在不同的异双功能rtpr存在下的β-连环蛋白水平的定量分析,所述异双功能rtpr设计为同时与β-连环蛋白和e3连接酶scfskp2或e3连接酶mdm2结合。使用imagej,使用相对于肌动蛋白条带归一化的通过western印迹检测到的对应于ha标签化的β-连环蛋白的条带的密度测定法进行分析。所用的阴性对照是单功能tpr或空白(无功能)tpr。图10示出了不同的模块化结合蛋白形式的例子。模块化结合蛋白可以包含:两个在n和c末端具有螺旋靶结合肽和螺旋e3结合肽的重复序列结构域(图10a);三个在c末端具有螺旋e3结合肽并且在n末端的第一重复序列间环中具有靶结合结构域的重复序列结构域(图10b);三个在n末端有螺旋靶结合肽并且在n末端的第二重复序列间环中具有e3结合结构域的重复序列结构域(图10c);四个在n末端的第一和第三重复序列间环中具有靶结合结构域和e3结合结构域的重复序列结构域(图10d)。图11示出了具有四个位于交替的重复序列间环中的结合结构域的模块化结合蛋白的示意图。结合位点彼此成90°排列。图12示出了这样工程化使得交替的重复间环中的结合结构域结合靶标上的相邻表位的模块化结合蛋白的示意图。图13示出了包含tpr重复序列结构域、设计为结合靶β-连环蛋白的lrh1衍生的结合结构域和设计为与e3泛素连接酶mdm2结合的p53衍生的n末端结合结构域的异双功能模块化结合蛋白的建模结构。图14示出了为了产生模块化结合蛋白,包含重复序列结构域和末端螺旋结合结构域的模块以及包含重复序列结构域和重复序列间环结合结构域的模块的组合组装示意图。图15示出了不同的模块化结合蛋白形式的例子。(i)示出了空白蛋白质;(ii)示出了插入一个或多个重复序列间环中的结合肽。(iii)示出了在一个或两个末端的螺旋结合肽;(iv)是环和螺旋结合肽的组合;(v)和(vi)示出了如何实现多价的例子。图16示出了除了在先前几轮筛选中已经鉴定的模块之外,通过包含具有多样化结合结构域的模块的模块化结合蛋白的逐步筛选进行的模块化结合蛋白的组装示意图。图17示出了设计的多价端锚聚合酶结合tpr蛋白对wnt信号传导的影响。使用lipofectamine2000,将hek293t细胞用tpr编码质粒转染。tpr蛋白含有1-4个拷贝的嫁接到一个或多个重复序列间环上的端锚聚合酶结合肽(tbp)。例如,2tbp-ctpr4是包含4个tpr模块的蛋白质,其中一个tbp嫁接到第一与第二tpr之间的环上,并且另一个tbp嫁接到第三与第四tpr之间的环上。‘折叠子’指示三聚体的tpr-折叠子融合蛋白。图18示出了脂质体包封的tpr蛋白的尺寸和电荷的表征。图19示出了通过脂质体包封,tpr蛋白进入细胞的递送。膜融合后,fitc染料标记的脂质体将细胞膜染色(红色图),然后将ritc标记的tpr蛋白货物递送到细胞质中。绿色图和红色-绿色合并显示蛋白质已经进入细胞并且在细胞质中扩散分布。图20显示脂质体包封的tpr蛋白在所用浓度下对hek293t细胞无毒。图21示出了设计的异双功能tpr蛋白(通过脂质体包封递送)对wnt信号传导的影响。tpr蛋白含有端锚聚合酶结合肽和scfskp2结合肽以指导端锚聚合酶泛素化和随后的降解。将细胞用脂质体处理2小时。图22示出了设计的异双功能tpr蛋白(通过脂质体包封递送)对wnt信号传导的影响。tpr蛋白含有β-连环蛋白结合肽和scfskp2结合肽以指导β-连环蛋白泛素化和随后的降解。如图所示,将细胞用包封32μg蛋白质的脂质体处理可变的时间(2-8h)。图23示出了设计的异双功能tpr蛋白对hek293t细胞中的kras水平的影响。tpr蛋白含有kras的结合序列(非螺旋肽序列,称为kbl,嫁接到rtpr的重复序列间环上)和嫁接到另一个重复序列间环上的衍生自p27的降解决定子。如所指示的,将细胞用50ng或500ng的tpr编码质粒瞬时转染,并且用kras质粒或空载体作为对照。转染后24小时,将细胞裂解,并且通过western印迹评价kras水平。深灰色是用单功能tpr质粒(仅含有降解决定子)转染处理的细胞。图24示出了靶向内源性kras的异双功能tpr蛋白对cma(分子伴侣介导的自噬)途径的影响。tpr蛋白含有kras的结合序列(衍生自无七的儿子同系物1(sos)的嫁接螺旋或rtpr环中展示的非螺旋肽序列(称为‘kbl’)),并且在构建体的n末端或c末端使用两种不同的分子伴侣介导的自噬肽(称为‘cma_q’或‘cma_k’)靶向用于降解。将构建体或空载体(浅灰色)瞬时转染到hek293t或dld1(结直肠癌细胞系)中。转染后24小时,将细胞裂解,并且通过western印迹评价kras水平。与空载体对照相比,那些导致kras显著降低的构建体显示为白色。图25示出了为了优化对靶标的结合亲和力,在连接结合结构域与重复序列间环的接头序列中变化的例子。所示的例子是nrf-tpr,一种设计为与keap1结合的tpr蛋白(参见原始专利申请的图7)。将甘氨酸残基引入接头中以提供柔性和增加的空间采样。当与共有样接头序列相比时,发现这种更具柔性的接头序列(标记为‘柔性的’)的引入增加了nrf-tpr蛋白的结合亲和力。改变接头序列的电荷含量(标记为‘带电的’)和通过改变接头序列的氨基酸组成来改变环的构象特性(标记为‘cider优化的’)(基于cider程序的预测(holehouse等人biophys.j.112,16-21(2017))也影响了keap1结合亲和力。具体实施方式本发明涉及包含多个重复序列结构域的模块化结合蛋白。这些重复序列结构域通过重复序列间环在多肽链中彼此连接。一个或多个结合结构域位于模块化结合蛋白的一个或多个重复序列间环中和/或模块化结合蛋白的n或c末端螺旋中。结合结构域可以针对相同的或不同的靶分子,并且模块化结合蛋白可以是多功能的和/或多价的。可以通过调节结合位点的位置以及重复序列结构域的数量和形状来精确且可预测地调谐嫁接的结合位点的几何展示。如本文所述的模块化结合蛋白在一系列治疗和诊断应用中可能是有用的。重复序列结构域是形成定义的二级结构的30至100个氨基酸的重复序列结构元件。多个重复序列结构域以模块化方式依次堆叠以形成稳定的蛋白质,其可以例如具有螺线管或螺旋管结构。重复序列结构域可以是合成的,或者可以是来自串联重复序列蛋白的天然存在的重复序列或其变体。重复序列结构域可以具有螺线管重复序列的结构。螺线管重复序列的结构是本领域熟知的(参见例如kobe&kajavatrendsinbiochemicalsciences2000;25(10):509-15)。例如,重复序列结构域可以具有α/α或α/310(螺旋-转角-螺旋或hth)结构,例如三角形四肽重复序列结构;α/α/α(螺旋-转角-螺旋-转角-螺旋或hthth)结构,例如犰狳重复序列结构;β/β/α/α结构;α/β或310/β结构,例如富亮氨酸重复序列(lrr)结构;β/β/β结构,例如igf1rl、hpr或pelc重复序列结构;或β/β结构,例如serralysin或egf重复序列结构。合适的重复序列结构域可以包含锚蛋白家族(clan)(pfam:cl0465)的结构域,如锚蛋白(pf00023),其可以包含由两条β链和两个α螺旋构成的30-34个氨基酸的重复序列;富亮氨酸重复序列(lrr)家族(pfam;cl0022)的结构域,如lrr1(pf00560),其可以包含由α/β马蹄形折叠构成的20-30个氨基酸的重复序列;pec裂解酶样(cl0268)家族的结构域,如pec裂解酶c(pf00544),其可以包含右旋β螺旋;β-roll(cl0592)家族的结构域,如溶血素型钙结合重复序列(pf000353),其可以包含形成通过ca2+离子稳定的由两条短链各自的β链转角的超螺旋构成的β-roll的短重复序列单元(9聚体);psi家族(cl0630)的结构域,如三叶(trefoil)(pf00088);以及三角形四肽家族(cl0020)的结构域,如tpr-1(pr00515),其可以包含由螺旋-转角-螺旋构成的24至90个氨基酸的重复序列。合适的重复序列结构域可以使用pfam数据库鉴定(参见例如finn等人nucleicacidsresearch(2016)databaseissue44:d279-d285)。在一些优选的实施方案中,重复序列结构域可以具有α/α-螺线管重复序列结构域的结构,如螺旋-转角-螺旋。螺旋-转角-螺旋结构域包含两个反平行的12-45个氨基酸的α螺旋。合适的螺旋-转角-螺旋结构域包括三角形四肽样重复序列结构域。三角形四肽样重复序列可以包括tpr家族(cl0020)的结构域,例如和arm结构域(参见例如犰狳(armadillo);pf00514;huber等人cell1997;90:871-882)、heat结构域(huntingtin,ef3,pp2a,tor1;pf02985;参见例如groves等人.cell.96(1):99-110)、ppr结构域(三角形五肽重复序列pf01535;参见例如small(2000)trendsbiochem.sci.25(2):46-7)、tale结构域(tal(转录激活因子样)效应子;pf03377;参见例如zhang等人naturebiotechnology.29(2):149-53)和tpr1结构域(三角形四肽重复序列-1;pf00515;参见例如blatch等人bioessays.21(11):932-9)。其他合适的螺旋-转角-螺旋结构域可以是合成的,例如如披露于brunette等人,nature2015528580-584中的dhr1至dhr83。在一些优选的实施方案中,螺旋-转角-螺旋支架可以是三角形四肽重复序列结构域(tpr)(d’andrea&regan,2003)或其变体。tpr重复序列结构域可以包括天然存在的或合成的tpr结构域。合适的tpr重复序列结构域是本领域熟知的(参见例如parmeggiani等人,j.mol.biol.427563-575)并且可以具有如下氨基酸序列:aeawynlgnayykqgdyqkaieyyqkalel-x1x2x3x4,其中x1-4独立地是任何氨基酸,优选地x1和x2分别是d和p,或者可以是此序列的变体。其他tpr重复序列结构域序列示于下表4-6中。优选的tpr结构域可以包括ctpr、rtpra、rtprb和ktprb结构域,例如具有表4或表6所示的序列或者表4或表6所示的序列的变体的结构域。在一些实施方案中,tpr重复序列结构域可以是人tpr重复序列结构域,优选地来自血液中的人蛋白的tpr重复序列结构域。来自人血的tpr重复序列结构域在体内可能具有降低的免疫原性。合适的人血tpr重复序列结构域可以包括来自ifit1、ifit2或ifit3的重复序列结构域。在血浆蛋白质组数据库中鉴定的人血重复序列结构域的其他例子示于表5中。可以例如通过使用标准序列分析工具(例如altschul等人nucleicacidsres.25:3389-3402l;altschul等人febsj.272:5101-5109)搜索与tpr重复序列结构域具有高序列一致性的序列来从血浆蛋白质组数据库(nanjappa等人nuclacidsres2014年1月;42(databaseissue):d959-65)鉴定合适的人血重复序列结构域。本文列出的参考重复序列结构域或结合位点序列的变体可以包含与参考序列具有至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少98%序列同一性的氨基酸序列。特定的氨基酸序列变体可以因插入、添加、取代或缺失1个氨基酸、2、3、4、5、6、7、8、9或10个或多于10个氨基酸而不同于上面显示的重复序列结构域。tpr重复序列结构域的优选的变体可以包含一个或多个保守残基,例如在位置7处的leu、在位置8处的gly或ala、在位置11处的tyr、在位置20处的ala、在位置27处的ala、在位置28和30处的leu或ile以及在位置32处的pro中的1、2、3、4、5、6个或更优选地全部。序列相似性和同一性通常参考算法gap(wisconsinpackage,accelerys,美国圣地亚哥)来定义。gap使用needleman和wunsch算法对两个完整的序列进行比对,这最大化匹配的数量并且最小化空位的数量。通常,使用默认参数,空位产生罚分=12,并且空位延伸罚分=4。可以优选地使用gap,但是可以使用其他算法,例如blast(其使用altschul等人(1990)j.mol.biol.215:405-410的方法)、fasta(其使用pearson和lipman(1988)pnasusa85:2444-2448的方法)或smith-waterman算法(smith和waterman(1981)j.molbiol.147:195-197)或altschul等人(1990)同上的tblastn程序,通常采用默认参数。特别地,可以使用psi-blast算法(nucl.acidsres.(1997)253389-3402)。可以在本文所述的相关序列的全长上进行序列比较。例如,重复序列结构域可以包含一个或多个点突变以促进疏水性结合结构域的嫁接。例如,重复序列结构域中的芳香族残基可以取代为极性或带电残基。可以按合理的方式鉴定合适的取代,例如使用重复序列结构域序列的隐马尔可夫图来鉴定在共有芳香族位置中天然存在的非芳香族残基。用于嫁接疏水性结合结构域的合适的tpr重复序列结构域可以具有如下氨基酸序列:aeawynlgnayyrqgdyqraieyyqralel-x1x2x3x4,其中x1-4独立地是任何氨基酸,优选地x1和x2分别是d和p。在一些实施方案中,重复序列结构域中的赖氨酸残基可以被精氨酸残基替代,以防止泛素化和随后的降解。当模块化结合蛋白包含e3泛素连接酶结合结构域(例如在蛋白水解靶向嵌合体(protac)中)时,这可能特别有用。例如,合适的tpr重复序列结构域可以具有如下氨基酸序列:aealnnlgnvyreqgdyqraieyyqralel-x1x2x3x4,其中x1-4独立地是任何氨基酸,优选地x1和x2分别是d和p。在优选的实施方案中,模块化结合蛋白可以包含2、3、4、5、6、7、8、9、10个或多于10个重复序列结构域。优选地,模块化结合蛋白包含2至5个重复序列结构域。具有较少重复序列结构域的模块化结合蛋白可以展示出增加的细胞渗透。例如,具有2-3个重复序列结构域的模块化结合蛋白在结合细胞内靶分子中可能是有用的。具有较多重复序列结构域的模块化结合蛋白可以展示出增加的稳定性和功能性。例如,具有4个或更多个重复序列结构域的模块化结合蛋白在结合细胞外靶分子中可能是有用的。具有6个或更多个重复序列结构域的模块化结合蛋白在产生长线性分子中可能是有用的,用于以二价或多价形式靶向或组装细胞外复合物。在其他实施方案中,可以通过具有n和c末端结合结构域的单个重复序列结构域赋予足够的稳定性和功能性。例如,模块化结合蛋白可以包含:(i)重复序列结构域,以及(ii)在重复序列结构域的n和c末端的结合结构域。模块化结合蛋白的重复序列结构域可能缺少结合活性,即模块化结合蛋白的结合活性是由结合结构域介导的,不是由重复序列结构域内的残基介导的。结合结构域是与靶分子特异性结合的连续氨基酸序列。能够嫁接到末端螺旋或重复序列间环上的合适的结合结构域是本领域熟知的,并且包括选自文库的肽序列、抗原表位、天然蛋白质-蛋白质相互作用(螺旋的、延伸的或转角样的)和短线性基序(slim)。病毒slim(其劫持宿主机器)可能特别有用,因为它们可以展示出高结合亲和力(davey等人(2011)trendsbiochem.sci.36,159-169)。靶分子的合适的结合结构域可以选自文库(例如使用噬菌体或核糖体展示),或者可以使用合理的方法或计算设计(例如使用复合物的晶体结构或相互作用)来鉴定或设计。在一些实施方案中,可以使用标准序列分析工具(例如davey等人nucleicacidsres.2011年7月1日;39(webserverissue):w56-w60)来鉴定氨基酸序列中的结合结构域。结合结构域的长度可以是5至25个氨基酸,优选地8至15个氨基酸,尽管在一些实施方案中,可以采用更长的结合结构域。模块化结合蛋白的结合结构域和重复序列结构域是异源的,即在天然存在的蛋白质中,结合结构域不与重复序列结构域相关,并且在模块化结合蛋白中,结合结构域和重复序列结构域通过重组方式人为地相关。本文所述的模块化结合蛋白可以包含1至n+1个结合结构域,其中n是模块化结合蛋白中重复序列结构域的数量。结合结构域的数量是由模块化结合蛋白的所需功能性和化合价来决定的。例如,一个结合结构域可以适于单功能模块化结合蛋白,并且两个或更多个结合结构域可以适于双功能或多功能模块化结合蛋白。模块化结合蛋白可以是单价的。靶分子可以被单价模块化结合蛋白中的单个结合结构域结合。模块化结合蛋白可以是多价的。靶分子可以被多价模块化结合蛋白中的两个或更多个相同或不同的结合结构域结合。模块化结合蛋白可以是单特异性的。单特异性模块化结合蛋白中的结合结构域可以全部与相同的靶分子结合,更优选地与靶分子的相同位点或表位结合。模块化结合蛋白可以是多特异性的。多特异性模块化结合蛋白中的结合结构域可以与不同的靶分子结合。例如,双特异性模块化结合蛋白可以包含一个或多个与第一靶分子结合的结合结构域和一个或多个与第二靶分子结合的结合结构域,并且三特异性模块化结合蛋白可以包含一个或多个与第一靶分子结合的结合结构域、一个或多个与第二靶分子结合的结合结构域和一个或多个与第三靶分子结合的结合结构域。双特异性模块化结合蛋白可以同时与两种不同的靶分子结合。这在使第一和第二靶分子紧密接近中可能是有用的。当靶分子位于不同的细胞上时,靶分子与模块化结合蛋白的同时结合可以使细胞紧密接近,例如以促进或增强细胞的相互作用。例如,与肿瘤特异性抗原和t细胞抗原(如cd3)结合的模块化结合蛋白在使t细胞接近肿瘤细胞中可能是有用的。当靶分子来自不同的生物途径时,这在实现协同作用中可能是有用的并且还可用于最小化抗性。三特异性模块化结合蛋白可以同时与三种不同的靶分子结合。在一些实施方案中,靶分子之一可以是e3泛素连接酶。例如,三特异性模块化结合蛋白可以与来自第一生物途径的第一靶分子和来自第二生物途径的第二靶分子以及e3泛素连接酶结合。这在实现协同作用中可能是有用的并且还可用于最小化抗性。结合结构域可以位于模块化结合蛋白的重复序列间环中。重复序列间结合结构域可以包含5至25个氨基酸残基,优选地8至15个氨基酸。然而,由于对环间结合结构域的尺寸没有内在限制,因此在一些实施方案中可以使用多于25个氨基酸残基的较长序列。在一些实施方案中,可以将非结构化的结合结构域插入重复序列间环中。模块化结合蛋白中的一个或多个、两个或更多个、三个或更多个、四个或更多个或者五个或更多个重复序列间环可以包含结合结构域。结合结构域可以位于模块化结合蛋白的连续的重复序列间环上,或者可以在模块化结合蛋白的重复序列间环中具有不同的分布。例如,包含结合结构域的重复序列间环在模块化蛋白中可以由缺少结合结构域的一个或多个、两个或更多个、三个或更多个或者四个或更多个重复序列间环分开。结合结构域可以直接或经由一个或多个另外的残基或接头与重复序列间环连接。例如,当结合结构域需要构象柔性以便与靶分子结合时,或者当与最小结合结构域相邻的氨基酸残基有利地影响结合界面的微环境时,另外的残基或接头可能是有用的。另外的残基或接头可以位于结合结构域的n末端、结合结构域的c末端或两者。例如,含有结合结构域的重复序列间环的序列可以是[x1-i]-[x1-n]-[x1-z],其中每个由x表示的残基独立地是任何氨基酸并且可以是与也由x表示的任何其他残基相同的氨基酸或不同的氨基酸,[x1-n]是结合结构域,n是1至100,[x1-i]是接头并且i独立地是1至10之间的任何数字。在一些实施方案中,d可以优选地位于接头[x1-i]的第一位置,p可以优选地位于接头[x1-i]的第二位置,d可以优选地位于街头[x1-z]的最后位置和/或p可以优选地位于接头[x1-z]的倒数第二位置。优选的重复序列间环序列的例子可以包括dp-[x1-n]-px;dpxx-[x1-n]-xxpx;dpxx-[x1-n]-xpxx;dpxx-[x1-n]-pxxx;pxx-[x1-i]-[x1-n]-[x1-i]-xxpx、dpxx-[x1-i]-[x1-n]-[x1-i]-xpxx、dpxx-[x1-i]-[x1-n]-[x1-i]-pxxx、dpxx-[x1-i]-[x1-n]-xpxx、dpxx-[x1-i]-[x1-n]-xpxx、dpxx-[x1-i]-[x1-n]-xpxx、dpxx-[x1-n]-[x1-i]-xxpx、dpxx-[x1-n]-[x1-i]-xpxx和dpxx-[x1-n]-[x1-i]-pxxx。用于将结合结构域与重复序列间环连接的残基或接头的精确序列取决于结合结构域并且可以使用标准技术针对任何目的结合结构域容易地确定。例如,例如当结合结构域需要采用特定构象时,小的非疏水性氨基酸(如甘氨酸)可以用于提供柔性和增加的空间采样,或者例如,当结合结构域短时,脯氨酸残基可以用于增加刚性。在一些优选的实施方案中,重复序列间结合结构域可以是非疏水性的。例如,结合结构域中至少40%的氨基酸可以是带电的(例如d、e、r或k)或极性的(例如q、n、h、t、y、c或w)。可替代地,可以例如通过用带电或极性残基替代芳香族残基来修饰重复序列结构域以容纳疏水性结合结构域。结合结构域可以位于模块化结合蛋白的一个或两个末端。在一些实施方案中,位于n或c末端的结合结构域可以包含α螺旋结构,并且可以包含全部或部分的与相邻重复序列结构域堆叠的半重复序列(即全部或部分的单个α螺旋)。末端结合结构域的α螺旋与相邻重复序列结构域形成稳定的相互作用,并且其是稳定的而且是折叠的。与相邻重复序列结构域的正确界面相互作用仅需要在结构上定义α螺旋的几个位置。定义了在一些这些位置中的残基(tyr(i)-ile(i+4)-tyr(i+7)-leu(i+11)用于n末端α螺旋,并且ala(i)-leu(i+4)-ala/val(i+7)用于c末端螺旋),但是可以修饰α螺旋的剩余位置以形成螺旋结合结构域。螺旋结合结构域可以位于蛋白质的n末端。n末端结合结构域可以是螺旋的并且可以包含全部或部分的序列xn-(x)15-x1x2xx,优选地全部或部分的序列xn-xyxxxixxyxxxlxx-x1x2xx,其中每个由x表示的残基独立地是任何氨基酸并且可以是与也由x表示的序列中的任何其他残基相同的氨基酸或不同的氨基酸,x1独立地是任何氨基酸(优选地d),x2独立地是任何氨基酸(优选地p),并且n是0或任何数字。在一些实施方案中,n末端结合结构域中的y、i和/或l残基可以取代为具有相似特性的氨基酸残基(即保守取代)。螺旋结合结构域可以位于蛋白质的c末端。c末端结合结构域可以是螺旋的并且可以包含全部或部分的序列xn-(x)15-x1x2xx,优选地全部或部分的序列x1x2xx-xxaxxxlxx[a或v]xxxxx-xn,其中x独立地是任何氨基酸并且可以是与也由x表示的序列中的任何其他残基相同的氨基酸或不同的氨基酸,x1独立地是任何氨基酸(优选地d),x2独立地是任何氨基酸(优选地p),并且n是0或任何数字。在一些实施方案中,c末端结合结构域中的a、l和/或v残基可以取代为具有相似特性的氨基酸残基(即保守取代)。末端结合结构域的最小长度是由形成与靶分子结合的螺旋所需的残基数量来决定的。末端结合结构域没有内在的最大长度,并且n可以是任何数字。在其他实施方案中,位于n或c末端的结合结构域可以包含非螺旋结构。例如,作为专性n末端或c末端结构域的结合结构域(例如由于末端氨基或羧基介导结合相互作用)可以位于所述一个或多个重复序列结构域的开始或末端。在一些实施方案中,结合结构域中的一个或多个位置可以是多样化的或随机化的。包含一个或多个多样化的或随机化的残基的模块化结合蛋白可以形成如下所述的文库。在一些实施方案中,n和c末端结合结构域可以是非疏水性的。例如,结合结构域中至少20%的氨基酸可以是带电的(例如d、e、r或k)或极性的(例如q、n、h、t、y、c或w)。可替代地,为了容纳疏水性结合结构域,可以例如通过用带电或极性残基替代芳香族残基来修饰重复序列结构域的螺旋转角螺旋支架。如本文所述的模块化结合蛋白可以按任何排列或组合包含结合结构域。例如,结合结构域可以位于模块化结合蛋白的n和c末端以及任选地模块化结合蛋白的一个或多个重复序列间环处;位于模块化结合蛋白的n末端和任选地模块化结合蛋白的一个或多个环处;位于模块化结合蛋白的c末端和任选地模块化结合蛋白的一个或多个环处;或者位于模块化结合蛋白的一个或多个重复序列间环中。结合结构域在模块化结合蛋白内的位置可以通过例如使用建模来鉴定用于两种靶分子彼此呈递(例如用于e3泛素连接酶的底物呈递)的最佳排列的合理设计来确定;和/或通过例如使用具有不同结合结构域排列的模块化结合蛋白的群体进行筛选以鉴定赋予靶分子最佳相互作用的排列来确定。本文所述的模块化结合蛋白的合适的靶分子包括生物大分子,如蛋白质。靶分子可以是受体、酶、抗原、寡糖、寡核苷酸、整合膜蛋白、转录因子、转录调控子、g蛋白偶联受体(gpcr)或任何其他目的靶标。难以用小分子(如ppi)靶向的蛋白质、在神经退行性疾病中积累的蛋白质以及在疾病病症(如癌症)中过表达的蛋白质可能是特别合适的靶分子。靶分子可以包括α-突触核蛋白;β-淀粉样蛋白;tau;超氧化物歧化酶;亨廷顿蛋白;β-连环蛋白;kras;超级增强子和其他类型的转录调控子的组分,如n-myc、c-myc、notch、极光激酶a(auroraa)、ews-fli1(尤文氏肉瘤朋友白血病整合物1(ewing’ssarcoma-friendleukemiaintegration1))、tel-aml1、tal1(t细胞急性淋巴细胞白血病蛋白1)和sox2((性别决定区y)-框2);端锚聚合酶;磷酸酶,如pp2a;表观遗传编写者(writer)、读取者(reader)和清除者(eraser),如组蛋白去乙酰化酶和组蛋白甲基转移酶;brd4和其他溴区结构域蛋白;和激酶,如plk1(polo样激酶1)、c-abl(艾贝尔森鼠白血病病毒致癌基因同系物1)和bcr(断裂点簇集区)-abl。在一些实施方案中,模块化结合蛋白可以例如通过抑制或拮抗其活性或与另一分子结合或通过将其标签化用于泛素化和蛋白酶体降解或用于经由自噬而降解来中和靶分子的生物活性。在其他实施方案中,模块化结合蛋白可以激活靶分子的生物活性。在一些实施方案中,靶分子可以是β-连环蛋白。与β-连环蛋白特异性结合的合适的结合结构域是本领域熟知的,并且包括衍生自以下的β-连环蛋白结合结构域:轴蛋白(例如gaypeyildihvyrvqlel及其变体)、bcl-9(例如sqeqlehryrslitlydiqlml及其变体)、tcf7l2(例如qelgdndelmhfsyestqd及其变体)、icat(例如yayqraiveymlrlms及其变体)、lrh-1(例如yeqaiaayldalmc及其变体)或apc(例如scseelealealelde及其变体)。在一些实施方案中,靶分子可以是kras。与kras特异性结合的合适的结合结构域是本领域熟知的,并且包括来自sos-1的kras结合结构域(例如fegialtnylkaleg及其变体)和通过噬菌体展示鉴定的kras结合结构域(参见例如sakamoto等人biochem.biophys.res.comm.(2017)484605-611)。在一些实施方案中,靶分子可以是端锚聚合酶。与端锚聚合酶特异性结合的合适的结合结构域是本领域熟知的,并且包括来自轴蛋白的端锚聚合酶结合结构域(例如reagdgee和hlqreagdgeefrs或其变体)。在一些实施方案中,靶分子可以是ews-fli1。与ews-fli1特异性结合的合适的结合结构域是本领域熟知的,并且包括esap1肽tmrgkkkrtran及其变体。其他合适的序列可以通过噬菌体展示来鉴定(参见例如erkizan等人cellcycle(2011)10,3397-408)。在一些实施方案中,靶分子可以是极光激酶-a。与极光激酶-a特异性结合的合适的结合结构域是本领域熟知的,并且包括来自tpx2的极光激酶-a结合结构域如sysydapsdfinfss(bayliss等人mol.cell(2003)12,851-62)和来自n-myc的极光激酶-a结合序列如n-myc残基19-47或61-89(参见例如richards等人pnas(2016)113,13726-31)。在一些实施方案中,靶分子可以是n-myc或c-myc。与n-myc或c-myc特异性结合的合适的结合结构域是本领域熟知的,并且包括来自极光激酶-a的螺旋结合序列(参见例如richards等人pnas(2016)113,13726-31)。在一些实施方案中,靶分子可以是wdr5(含有wd重复序列的蛋白5)。与wdr5特异性结合的合适的结合结构域是本领域熟知的,并且包括mll1(混合谱系白血病蛋白1)的wdr5相互作用基序(win)(参见例如song&kingstonj.biol.chem.(2008)283,35258-64;patel等人j.biol.chem.(2008)283,32158-61),例如epplnphgsaraevhlrks及其变体。在一些实施方案中,靶分子可以是brd4或溴区结构域蛋白。与brd4特异性结合的合适的结合结构域是本领域熟知的,并且包括衍生自组蛋白配体的序列。在一些实施方案中,靶分子可以是hdac(组蛋白去乙酰化酶)。与hdac特异性结合的合适的结合结构域是本领域熟知的,并且包括衍生自smrt和将hdac招募至特异性转录调控复合物的其他蛋白质的结合序列或衍生自组蛋白的结合序列(参见例如watson等人nat.comm.(2016)7,11262;dowling等人biochem.(2008)47,13554-63)。在一些实施方案中,靶分子可以是notch。与notch特异性结合的合适的结合结构域是本领域熟知的,并且包括来自maml1(主导控制样蛋白1(mastermindlikeprotein1))的n末端的结合序列,例如savmerlrrrielcrrhhst及其变体(参见例如moellering等人nature(2009)462,182-8)。在一些实施方案中,靶分子可以是cdk(周期蛋白依赖性激酶)。与cdk特异性结合的合适的结合结构域是本领域熟知的,并且包括基于底物的肽,例如衍生自周期蛋白a的cdk2序列,如tytkkqvlrmehlvlkvltfdl及其变体(参见例如gondeau等人j.biol.chem.(2005)280,13793-800;mendoza等人cancerres.(2003)63,1020-4)。在一些实施方案中,靶分子可以是plk1(polo样激酶1)。与plk1特异性结合的合适的结合结构域是本领域熟知的,并且包括与底物结合pbd(polo盒结构域)结合的优化的底物衍生序列,如magpmqseplmgakk及其变体。在一些实施方案中,靶分子可以是tau。与tau特异性结合的合适的结合结构域是本领域熟知的,并且包括衍生自α微管蛋白和β微管蛋白的tau结合序列,如kdyeevgvdsve和yqqyqdatadeqg及其变体(参见例如maccioni等人emboj.(1988)7,1957-63;rivas等人pnas(1988)85,6092-6)。在一些实施方案中,靶分子可以是bcr-abl。与bcr-abl特异性结合的合适的结合结构域是本领域熟知的,并且包括优化的底物衍生序列,如eaiyaapfakkk及其变体。在一些实施方案中,靶分子可以是pp2a(蛋白磷酸酶2a)。与pp2a特异性结合的合适的结合结构域是本领域熟知的,并且包括结合b56调控亚基的序列,如lqtiqeee及其变体(参见例如hetz等人mol.cell(2016),63686-95)。在一些实施方案中,靶分子可以是eed(胚胎外胚层发育蛋白)。与eed特异性结合的合适的结合结构域是本领域熟知的,并且包括来自辅因子ezh2(zeste同系物增强子2)的螺旋结合序列,如fssnrqkilerteilnqewkqrriqpv及其变体(参见例如kim等人nat.chem.biol.(2013)9,643-50)。在一些实施方案中,靶分子可以是mcl-1(诱导髓性白血病细胞分化蛋白)。与mcl-1特异性结合的合适的结合结构域是本领域熟知的,并且包括来自bcl2的序列,例如kaletlrrvgdgvqrnhetaf及其变体(参见例如stewart等人nat.chem.biol.(2010)6,595-601)。在一些实施方案中,靶分子可以是ras。合适的ras结合结构域是本领域熟知的,并且包括通过噬菌体展示鉴定的ras结合肽,如rrrrcplyisydpvcrrrr及其变体(参见例如sakamoto等人bbrc(2017)484,605-11)。在一些实施方案中,靶分子可以是gsk3(糖原合酶激酶3)。合适的gsk3结合结构域是本领域熟知的,并且包括底物竞争性结合序列如keappappqdp、lsrrpdyr、rreggmsrpadvdg和yrraavppspslsrhsspsqdedeee及其变体(参见例如ilouz等人j.biol.chem.281(2006),30621-30630;plotkin等人j.pharmacol.exp.ther.(2003)305,974-980)。在一些实施方案中,靶分子可以是ctbp(c末端结合蛋白)。合适的ctbp结合结构域是本领域熟知的,并且包括从环肽文库筛选中鉴定的序列,如sgwtvvrmy及其变体(参见例如birts等人chem.sci.(2013)4,3046-57)。靶分子的可用于如本文所述的模块化结合蛋白中的合适的结合结构域的例子示于表2和表7中。在一些优选的实施方案中,如本文所述的模块化结合蛋白可以包含e3泛素连接酶的结合结构域。合适的e3泛素连接酶的例子包括mdm2、scfskp2、btb-cul3-rbx1、apc/c、siah、chip、cul4-ddb1、scf家族、β-trcp、fbw7和fbx4。e3泛素连接酶的合适的结合结构域(降解决定子)是本领域熟知的并且可以是5至20个氨基酸。例如,mdm2的合适的结合结构域可以包括来自p53的结合结构域(例如faaywnllsayg)和或其变体。scfskp2的合适的结合结构域可以包括来自p27的结合结构域(例如agsneqepkkrs)及其变体。keap1-cul3的合适的结合结构域可以包括来自nrf2的结合结构域(例如dpetgel)或其变体。spop-cul3的合适的结合结构域可以包括来自puc的结合结构域(例如lacdevtsttsssta)或其变体。apc/c的合适的结合结构域可以包括称为abba(例如slssafhvfedgnken)、ken(例如sedkenvpp)或dbox(例如prlplgdvsnn)的降解决定子或其变体。在一些情况下,可以使用这些降解决定子的组合(模仿在一些天然底物中发现的二分或三分降解决定子)。siah的合适的结合结构域可以包括来自phyl的结合结构域(例如lrpvamvrptv)或其变体。chip(hsc70相互作用蛋白的羧基末端)的合适的结合结构域可以包括肽序列,如asrmeevd(来自hsp90c末端)和gptieevd(来自hsp70c末端)或其变体。β-trcp的合适的结合结构域可以包括降解决定子序列基序(包括磷酸模拟氨基酸),如ddgyfd或其变体。fbx4的合适的结合结构域可以包括衍生自trf1的序列,如mpifwkahrmskmgtg或其变体(参见例如lee等人chembiochem(2013)14,445-451)。fbw7的合适的结合结构域可以包括降解决定子序列基序(包括磷酸模拟氨基酸),如lpsglleppqd。ddb1-cul4的合适的结合结构域可以包括衍生自hbx(乙肝病毒x蛋白)和来自其他病毒的相似蛋白质以及衍生自包括螺旋基序的dcaf(ddb1-cul4相关因子)的序列,如ilpkvlhkrtlgl、nfvswhanrqlgm、ntveyftsqqvtg和nitrdlirrqike(参见例如li等人nat.struct.mol.biol.(2010)17,105-111)。e3泛素连接酶的可用于如本文所述的模块化结合蛋白中的合适的结合结构域的例子示于表3中。包含e3泛素连接酶的结合结构域的模块化结合蛋白也可以包含靶分子的结合结构域。模块化结合蛋白与靶分子和e3泛素连接酶两者的结合可以导致靶分子被e3泛素连接酶泛素化。然后泛素化的靶分子被蛋白酶体降解。这允许通过模块化结合蛋白对分子进行蛋白水解的特异性靶向。对于同时结合靶蛋白和泛素连接酶的异双功能小分子(protac;蛋白水解靶向嵌合体),已经显示了靶蛋白的泛素化和随后的降解(参见例如bondeson等人nat.chem.biol.2015;deshaies2015;lu等人2015)。在一些实施方案中,模块化结合蛋白可以缺少赖氨酸残基,使得它避免了被e3泛素连接酶泛素化。结合e3泛素连接酶和靶分子的模块化结合蛋白的例子示于表1和表8中。合适的模块化结合蛋白可以包含结合靶蛋白(如β连环蛋白)的n末端结合结构域和结合e3泛素连接酶的c末端结合结构域。例如,n末端结合结构域可以是衍生自bcl9的β连环蛋白结合序列,并且c末端结合结构域可以是衍生自p53的mdm2结合序列。可替代地,模块化结合蛋白可以包含结合靶蛋白(如β连环蛋白)的c末端结合结构域和结合e3泛素连接酶的n末端结合结构域(参见图10a)。另一种合适的模块化结合蛋白可以包含三个重复序列结构域、结合靶蛋白(如β连环蛋白)的位于重复序列间环中的结合结构域和结合e3泛素连接酶的c末端结合结构域。例如,重复序列间环结合结构域可以衍生自apc(腺瘤性结肠息肉病)的磷酸化区域,并且c末端结合结构域可以是衍生自p53的mdm2结合序列。可替代地,模块化结合蛋白可以包含结合e3泛素连接酶的位于重复序列间环中的结合结构域和结合靶蛋白(如β连环蛋白)的c末端结合结构域(参见图10b)。另一种合适的模块化结合蛋白可以包含三个重复序列结构域、结合靶蛋白(如β连环蛋白)的n末端结合结构域和结合e3泛素连接酶的位于模块间环中的结合结构域。例如,n末端结合结构域可以是衍生自lrh1(肝受体同系物1)的β连环蛋白结合序列,并且模块间环结合结构域可以是衍生自p27的skp2靶向区域的序列。可替代地,模块化结合蛋白可以包含结合e3泛素连接酶的n末端结合结构域和结合靶蛋白(如β连环蛋白)的位于模块间环中的结合结构域(参见图10c)。另一种合适的模块化结合蛋白可以包含四个重复序列结构域、结合e3泛素连接酶的位于重复序列间环中的第一结合结构和结合靶分子的位于重复序列间环中的第二结合结构域。第一和第二重复序列间环可以由缺少结合结构域的重复序列间环分开。例如,第一结合结构域可以位于从n末端的第一重复序列间环重复序列间环中,并且第二结合结构域可以位于从n末端的第三重复序列间环中,反之亦然。在一些优选的实施方案中,如本文所述的模块化结合蛋白可以包含表8所示的氨基酸或其变体。在其他优选的实施方案中,如本文所述的模块化结合蛋白可以包含与靶选择性自噬途径(如分子伴侣介导的自噬(cma))的组分结合的结合结构域。因此,模块化结合蛋白和与其结合的靶分子被自噬途径识别,随后靶分子被降解。cma途径的合适的组分包括70kda热休克同源蛋白(hsc70,hspa8,基因id:3312)。合适的结合结构域是本领域熟知的(dicej.f.(1990).trendsbiochem.sci.15,305-309),并且包括lys-phe-glu-arg-gln(kferq)及其变体,如cma_q和cma_k,如本文所述。已经证明这些结构域能够将异源蛋白质靶向自噬途径(fan,x.等人;(2014)natureneuroscience17,471-480)。除了重复序列结构域和结合结构域之外,模块化结合蛋白还可以包含一个或多个赋予另外的功能的另外的结构域,如靶向结构域、细胞内转运结构域、稳定结构域或寡聚化结构域。另外的结构域可以例如位于模块化结合蛋白的n或c末端或重复序列之间的环中。靶向结构域在将模块化结合蛋白靶向体内的特定目的地(如靶组织、细胞、膜或细胞内细胞器)中可能是有用的。合适的靶向结构域包括嵌合抗原受体(car)。细胞内转运结构域可以促进模块化结合蛋白通过细胞膜进入细胞,例如以结合细胞内靶分子。合适的细胞内转移结构域是本领域熟知的(参见例如bechara等人febsletters5871(2013)1693-1702),并且包括细胞穿透肽(cpp),如触角足(antennapedia)(43-58)、tat(48-60)、钙黏素(615-632)和聚arg。稳定结构域可以增加模块化结合蛋白在体内的半衰期。合适的稳定结构域是本领域熟知的,并且包括fc结构域、血清白蛋白、非结构化肽(如xten98或pas99)和聚乙二醇(peg)。寡聚化结构域可以促进多蛋白复合物的形成,例如以增加对多价靶标的亲合力。合适的寡聚化结构域包括‘折叠子’结构域,即t4次要纤维蛋白(fibritin)的天然三聚结构域(meier等人,j.mol.biol.(2004)344(4):1051-69)。除了重复序列结构域、结合结构域和任选地一个或多个另外的结构域之外,模块化结合蛋白还可以包含细胞毒剂或治疗剂和/或或可检测标记。合适的细胞毒剂包括例如化疗剂,如甲氨蝶呤、澳瑞他汀(auristatin)阿霉素、多柔比星、美法仑、丝裂霉素c、奥唑米星(ozogamicin)、苯丁酸氮芥、美登素、恩坦辛(emtansine)、道诺霉素或其他插入剂;细菌、真菌、植物或动物来源的酶活性毒素,如白喉a链、白喉毒素的非结合活性片段、外毒素a链、蓖麻毒素a链、相思豆毒素a链、蒴莲根毒素(modeccin)a链、α-鹅膏蕈碱、α-八叠球菌、油桐(aleuritesfordii)蛋白、微管菌素(tubulysins)、香石竹毒蛋白、美洲商陆(phytolacaamericana)蛋白(papi、papii和pap-s)、苦瓜(momordicacharantia)抑制剂、麻疯树毒蛋白、巴豆毒蛋白、肥皂草(sapaonariaofficinalis)抑制剂、多花白树毒蛋白、丝林霉素(mitogellin)、局限曲菌素(restrictocin)、酚霉素(phenomycin)、伊诺霉素(enomycin)、吡咯并苯二氮卓和单端孢霉烯族化合物(tricothecenes)及任何这些的片段。合适的细胞毒剂还可以包括放射性同位素。多种放射性核素可用于放射性缀合的模块化结合蛋白的产生,所述放射性核素包括但不限于90y、125i、131i、123i、111in、131in、105rh、153sm、67cu、67ga、166ho、177lu、186re、188re和212bi。还可以使用模块化结合蛋白与一种或多种小抗癌分子(例如毒素,如卡奇霉素(calicheamicin)、美登木素生物碱、单端孢霉烯(trichothene)和cc1065以及这些毒素的具有毒素活性的衍生物)的缀合物。合适的治疗剂可以包括细胞因子(例如il2、il12和tnf)、趋化因子、促凝血因子(例如组织因子)、酶、脂质体和免疫反应因子。可检测标记可以是产生或可以被诱导产生信号的任何分子,包括但不限于荧光剂、放射性标记、酶、化学发光剂或光敏剂。因此,可以通过检测荧光或发光、放射性、酶活性或光吸收来检测和/或测量结合。可以使用本领域已知的常规化学方法将可检测标记附接到模块化结合蛋白。标记可以通过多种方法产生可通过外部方式(例如通过目测、电磁辐射、热和化学试剂)检测的信号。标记还可以结合至结合模块化结合蛋白的另一种特异性结合成员,或者结合至支持物。在一些实施方案中,模块化结合蛋白可以被配置用于在颗粒或分子复合物(如细胞、核糖体或噬菌体)上展示,例如用于筛选和选择。合适的模块化结合蛋白还可以包含展示部分(如噬菌体外壳蛋白),以促进在颗粒或分子复合物上展示。噬菌体外壳蛋白可以与模块化结合蛋白融合或共价连接。如本文所述的模块化结合蛋白可以通过重组方式产生。例如,产生如本文所述的模块化结合蛋白的方法可以包括表达编码所述模块化结合蛋白的核酸。可以在宿主细胞中表达核酸,然后可以从细胞培养物中分离和/或纯化所表达的模块化结合蛋白。在一些实施方案中,方法可以包括;将编码结合结构域的第一核酸插入编码两个或更多个重复序列结构域的第二核酸中,以产生编码模块化结合蛋白的嵌合核酸,所述模块化结合蛋白包含位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端的结合结构域;以及,表达所述嵌合核酸以产生所述模块化结合蛋白。本文所述的方法在产生与第一靶分子和第二靶分子结合的模块化结合蛋白中可能是有用的。例如,方法可以包括;提供编码通过重复序列间环连接的两个或更多个重复序列结构域的核酸,每个重复序列结构域;以及将编码与第一靶分子结合的第一结合结构域的第一核苷酸序列和编码与第二靶分子结合的第二结合结构域的第二核苷酸序列掺入所述核酸中,以产生编码包含所述第一和第二结合结构域的模块化结合蛋白的核酸,其中所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端;以及表达所述核酸以产生所述蛋白质。第一和第二靶分子之一可以是e3泛素连接酶。例如,方法可以包括;提供编码通过重复序列间环连接的两个或更多个重复序列结构域的核酸,每个重复序列结构域;以及将编码与靶分子结合的第一结合结构域的第一核苷酸序列和编码与e3泛素连接酶结合的第二结合结构域的第二核苷酸序列掺入所述核酸中,以产生编码包含所述第一和第二结合结构域的模块化结合蛋白的核酸,其中所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端;以及表达所述核酸以产生所述蛋白质。作为本发明的一个方面,提供了编码如本文所述的模块化结合蛋白的分离的核酸。核酸可以包含在表达载体内。可以选择或构建合适的载体,其含有适当的调控序列,包括启动子序列、终止子片段、聚腺苷酸化序列、增强子序列、标记基因和其他适当的序列。优选地,载体含有适当的调控序列以驱动核酸在宿主细胞中的表达。驱动异源核酸编码序列在表达系统中的表达的合适的调控序列是本领域熟知的,并且包括组成型启动子(例如病毒启动子,如cmv或sv40)和诱导型启动子(如tet-on受控启动子)。载体还可以包含诸如复制起点和可选择标记等序列,所述序列允许其在细菌宿主(如大肠杆菌)和/或真核细胞中进行选择和复制以及表达。许多适于在细胞培养中表达重组模块化结合蛋白及其后续分离和纯化的技术和方案是本领域已知的(参见例如protocolsinmolecularbiology,第二版,ausubel等人编辑johnwiley&sons,1992;recombinantgeneexpressionprotocols编辑rstuan(1997年3月)humanapressinc)。作为本发明的一个方面,还提供了包含编码如本文所述的模块化结合蛋白的核酸或含有这种核酸的载体的宿主细胞。合适的宿主细胞包括细菌、哺乳动物细胞、植物细胞、丝状真菌、酵母和杆状病毒系统以及转基因植物和动物。蛋白质在原核细胞中的表达在本领域中是完善的。常见的细菌宿主是大肠杆菌。也可以通过在培养的真核细胞中表达来产生模块化结合蛋白。本领域可用于表达模块化结合蛋白的哺乳动物细胞系包括中国仓鼠卵巢(cho)细胞、hela细胞、幼仓鼠肾细胞、ns0小鼠黑素瘤细胞、yb2/0大鼠骨髓瘤细胞、人胚肾细胞(例如hek293细胞)、人胚胎视网膜细胞(例如perc6细胞)等。如本文所述的模块化结合蛋白可以用于产生文库。为了鉴定和分离具有特异性结合活性的模块化结合蛋白,可以筛选合适的文库。文库可以包含模块化结合蛋白,所述文库中的每种模块化结合蛋白包含:(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)一个或多个结合结构域,每个所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端,其中在所述文库的结合结构域中的至少一种氨基酸残基是多样化的。文库的模块化结合蛋白的结合结构域中一个或多个位置的残基可以是多样化的或随机化的,即在群体的不同分子中,位于所述一个或多个位置的残基可以是不同的。例如,文库的模块化结合蛋白的n或c末端的螺旋结合结构域内的1至12个位置可以是多样化的或随机化的。另外,结合结构域的非限制性xn序列可以含有另外的多样性。可替代地或另外地,文库的模块化结合蛋白的重复序列间结合结构域内的1至n个位置可以是多样化的或随机化的,其中n是结合结构域中的氨基酸数量。在一些实施方案中,可以分别筛选结合结构域,并且由包含在不同轮次筛选中鉴定的结合结构域的重复序列结构域逐步组装模块化结合蛋白。例如,文库可以包含模块化结合蛋白,所述文库中的每种模块化结合蛋白包含:(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)一个或多个在所述文库的每种模块化结合蛋白中具有相同氨基酸的恒定结合结构域和一个或多个多样化结合结构域,优选地一个在所述文库的每种模块化结合蛋白质具有不同氨基酸的多样化结合结构域,所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端。在所述文库的多样化结合结构域中的至少一种氨基酸残基可以是多样化的。文库可以通过如下方法产生,所述方法包括:(a)提供编码模块化结合蛋白的多样化群体的核酸群体,所述模块化结合蛋白包含(i)两个或更多个重复序列结构域;(ii)连接所述两个或更多个重复序列结构域的重复序列间环;以及(iii)一个或多个结合结构域,每个所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端,其中每种模块化结合蛋白中结合结构域的一个或多个残基在所述文库中是多样化的,以及(b)表达所述核酸群体以产生所述多样化群体,从而产生模块化结合蛋白的文库。核酸群体可以通过如下方法提供,所述方法包括将编码多样化结合结构域的第一核酸群体插入编码通过重复序列间环连接的所述两个或更多个重复序列结构域的第二核酸群体中,任选地其中所述第一和第二核酸与编码多达10个氨基酸的接头的第三核酸群体连接。核酸可以被含在载体(例如表达载体)中。合适的载体包括基于噬菌体的或基于噬菌粒的噬菌体展示载体。可以使用无细胞体外翻译系统(如核糖体)在细胞中或在溶液中重组表达核酸以产生文库。在一些优选的实施方案中,文库在系统中表达,在所述系统中,模块化结合蛋白的功能使得能够分离其编码核酸。例如,可以将模块化结合蛋白展示在颗粒或分子复合物上以使得能够进行选择和/或筛选。在一些实施方案中,可以将模块化结合蛋白的文库展示在珠、无细胞核糖体、噬菌体、原核细胞或真核细胞上。可替代地,所编码的模块化结合蛋白可以提供于乳液内,在所述乳液中,模块化结合蛋白的活性引起可识别的变化。可替代地,所编码的模块化结合蛋白可以在细胞内或在细胞附近表达,在所述细胞中,模块化结合蛋白的活性引起表型改变或报告基因表达的改变。优选地,核酸在原核细胞(如大肠杆菌)中表达。例如,核酸可以在原核细胞中表达以产生重组结合蛋白的文库,所述文库展示在噬菌体的表面上。合适的原核噬菌体展示系统是本领域熟知的,并且描述于例如kontermann,r&dubel,s,antibodyengineering,springer-verlagnewyork,llc;2001,isbn:3540413545、wo92/01047、us5969108、us5565332、us5733743、us5858657、us5871907、us5872215、us5885793、us5962255、us6140471、us6172197、us6225447、us6291650、us6492160和us6521404。噬菌体展示系统允许产生大型文库,例如具有108个或更多个、109个或更多个或者1010个或更多个成员的文库。在其他实施方案中,细胞可以是真核细胞,如酵母、昆虫、植物或哺乳动物细胞。如本文所述的多样化序列是在群体成员之间变化的序列,即所述序列在群体的不同成员中是不同的。多样化序列可以是随机的,即多样化序列中每个位置的氨基酸或核苷酸的身份可以随机选自天然存在的氨基酸或核苷酸的完全集或其子集。可以使用本领域技术人员已知的方法将多样性引入结合结构域中,所述方法是例如寡核苷酸定向诱变22,molecularcloning:alaboratorymanual:第3版,russell等人,2001,coldspringharborlaboratorypress以及其中的参考文献)。多样化序列可以是连续的或者可以分布在结合结构域内。用于将多样化序列引入结合结构域中的合适的方法是本领域详细描述的,并且包括寡核苷酸定向诱变(参见molecularcloning:alaboratorymanual:第3版,russell等人,2001,coldspringharborlaboratorypress以及其中的参考文献)。例如,可以使用由使用核苷酸的部分或完全随机化产生的或由使用密码子混合物(例如使用三核苷酸)产生的寡核苷酸混合物来产生多样化。可替代地,可以使用高通量基因合成方法合成并且组合多样化寡核苷酸群体以产生精确定义且受控的结合结构域群体。可替代地,可以使用“掺杂”技术,其中原始核苷酸占优势,一种或多种替代核苷酸以较低的频率存在。优选地,文库是展示文库。可以将文库中的模块化结合蛋白展示在颗粒或分子复合物的表面上,所述颗粒或分子复合物是例如珠(例如,塑料或树脂珠)、核糖体、细胞或病毒,包括可复制的遗传包装,如酵母、细菌或噬菌体(例如fd、m13或t7)颗粒、病毒、细胞(包括哺乳动物细胞)或共价的核糖体或其他体外展示系统。用于产生展示文库(如噬菌体展示文库)的技术是本领域熟知的。每个颗粒或分子复合物可以包含编码由颗粒展示的模块化结合蛋白的核酸。在一些优选的实施方案中,将文库中的模块化结合蛋白展示在病毒颗粒(如噬菌体)的表面上。文库中的每种模块化结合蛋白还可以包含噬菌体外壳蛋白以促进展示。每个病毒颗粒可以包含编码展示在颗粒上的模块化结合蛋白的核酸。合适的病毒颗粒包括噬菌体,例如丝状噬菌体,如m13和fd。用于产生和筛选噬菌体展示文库的合适的方法是本领域熟知的。噬菌体展示描述于例如wo92/01047以及美国专利us5969108、us5565332、us5733743、us5858657、us5871907、us5872215、us5885793、us5962255、us6140471、us6172197、us6225447、us6291650、us6492160和us6521404。可以针对展示结合活性(例如与靶分子结合)的模块化结合蛋白筛选如本文所述的文库。可以直接测量或者可以通过由结合产生的激动或拮抗作用间接测量结合。筛选方法可以包括;(a)提供模块化结合蛋白的文库,所述文库中的每种模块化结合蛋白包含;(i)两个或更多个重复序列结构域;(ii)连接所述重复序列结构域的重复序列间环;以及(iii)一个或多个结合结构域,每个所述结合结构域位于所述模块化结合蛋白的重复序列间环中或在所述模块化结合蛋白的n或c末端,其中所述一个或多个结合结构域的一个或多个残基在所述文库中是多样化的,(b)针对展示结合活性的模块化结合蛋白筛选所述文库,以及(c)鉴定所述文库中展示所述结合活性的一种或多种模块化结合蛋白。在一些实施方案中,文库中的模块化结合蛋白可以包含一个具有至少一种多样化氨基酸残基的结合结构域。便利地,文库中的模块化结合蛋白包含两个重复序列结构域。可以针对与靶分子结合的结合结构域筛选文库。以此方式鉴定的结合结构域可以按模块化方式组装以产生如本文所述的多特异性的模块化结合蛋白。例如,可以针对与第一靶分子结合的第一结合结构域筛选第一文库,并且可以针对与第二靶分子结合的第二结合结构域筛选第二文库。第一和第二结合结构域在模块化结合蛋白中位于不同的位置中,即它们既不是n末端结合结构域、c末端结合结构域也不是重复序列间结合结构域。从第一和第二文库中鉴定分别与第一和第二靶分子结合的第一和第二结合结构域。然后可以将已鉴定的第一和第二结合结构域掺入与第一和第二靶分子结合的模块化结合蛋白中。在具有至少一种多样化氨基酸残基的第一多样化结合结构域的文库中,第一文库可以包含模块化结合蛋白。可以从第一文库中鉴定与靶分子结合的第一结合结构域。包含第一结合结构域的模块化结合蛋白可以用于产生第二文库,所述第二文库包含具有至少一种多样化氨基酸残基的第二多样化结合结构域。例如,来自第一文库的模块化结合蛋白可以通过在n或c末端添加第二多样化结合结构域或通过在重复序列间环中添加包含第二多样化结合结构域的另外的重复序列结构域来修饰。可以从第二文库中鉴定与相同或不同靶分子结合的第二结合结构域。包含第一和第二结合结构域的模块化结合蛋白可以用于产生第三文库,所述第三文库包含具有至少一种多样化氨基酸残基的第三多样化结合结构域。例如,来自第二文库的模块化结合蛋白可以通过在n或c末端添加第三多样化结合结构域或通过在重复序列间环中添加包含第三多样化结合结构域的另外的重复序列结构域来修饰。可以从第三文库中鉴定结合与第一和/或第二结合结构域相同的靶分子或不同靶分子的第三结合结构域。以这种方式,可以依次组装含有多个结合结构域的模块化结合蛋白(参见图16)。对每个结合结构域使用分开的文库允许对每个结合结构域的大量不同变体进行独立地筛选,然后进行组合。例如,可以将108-1012个第一结合结构域变体的噬菌体文库与108-1012个第二结合结构域变体的噬菌体文库和108-1012个第三结合结构域变体的噬菌体文库组合。在一些实施方案中,可以将108-1012个n末端结合结构域变体的噬菌体文库与108-1012个c末端结合结构域变体的噬菌体文库组合以产生具有n和c末端结合结构域的模块化结合蛋白。筛选文库的结合活性可以包括提供靶分子并且鉴定或选择与靶标结合的文库成员,或者在细胞群体中表达文库并且鉴定或选择引起细胞表型的文库成员。可以回收所述一种或多种已鉴定的或选择的模块化结合蛋白,并且使其经受进一步的选择和/或筛选。可以通过任何合适的技术确定结合。例如,可以在结合条件下使文库与靶分子接触足以使靶分子与文库相互作用并且与其至少一个成员形成结合反应复合物的一段时间。结合条件是与靶分子的已知天然结合功能相容的那些条件。那些相容条件是维持靶分子的生物活性,从而维持分子参与其预选结合相互作用的能力的缓冲液、ph和温度条件。通常,那些条件包括通常与目的靶分子相关的ph和离子强度的水性生理溶液。文库可以按异质或均质混合物的形式与靶分子接触。因此,文库成员可以处于固相中,而靶分子存在于液相中。可替代地,靶分子可以处于固相中,而文库成员存在于液相中。仍进一步地,文库成员和靶分子两者都可以处于液相中。用于确定模块化结合蛋白与靶分子的结合的合适的方法是本领域熟知的,并且包括elisa、基于珠的结合测定(例如使用链霉亲和素包被的与生物素化的靶分子缀合的珠)、表面等离子体共振、流式细胞术、western印迹、免疫细胞化学、免疫沉淀和亲和色谱法。可替代地,可以采用基于生物化学的或基于细胞的测定,如基于荧光的或基于发光的报告物测定。为了鉴定展示结合活性的模块化结合蛋白,可以进行多轮淘选。例如,可以从文库中回收或分离富集了结合活性的模块化结合蛋白群体,并且使其经受一轮或多轮进一步筛选结合活性,以产生一个或进一步富集的群体。可以从所述一个或多个进一步富集的群体中鉴定展示结合活性的模块化结合蛋白,并且对其进行回收、分离和/或进一步研究。在一些实施方案中,可以通过检测由模块化结合蛋白与靶分子(如配体、受体或酶)的结合产生的激动或拮抗来确定结合。例如,可以通过在报告细胞中表达文库并且鉴定具有改变的基因表达或表型的一个或多个报告细胞来筛选文库。用于筛选模块化结合蛋白的重组群体的合适的功能筛选技术是本领域熟知的。展示结合活性的模块化结合蛋白可以被进一步工程化以改善活性或特性或引入新的活性或特性,例如结合特性如亲和力和/或特异性、体内特性如溶解性、血浆稳定性或细胞渗透或活性如增加的靶分子中和和/或靶分子的特异性活性的调控或分析特性。模块化结合蛋白也可以被工程化以改善稳定性、溶解性或表达水平。可以采用另外轮的筛选以鉴定展示改善的特性或活性的模块化结合蛋白。例如,可以从文库中回收或分离富集了与靶分子的结合的模块化结合蛋白群体,并且使其经受一轮或多轮进一步筛选改善的或新的特性或活性,以产生一个或进一步富集的群体。任选地,这可以重复一次或多次。可以从所述一个或多个进一步富集的群体中鉴定展示改善的特性或活性的模块化结合蛋白,并且对其进行回收、分离和/或进一步研究。如本文所述的模块化结合蛋白可以被包封在脂质体中,例如用于递送到细胞中。优选的脂质体包括融合脂质体。合适的融合脂质体可以例如以1:1(w/w)的比率包含阳离子脂质如1,2-二油酰基-3-三甲基铵丙烷(dotap)和中性脂质如二油酰基磷脂酰乙醇胺(dope)。任选地,脂质体可以例如以相对于中性和阳离子脂质的0.1:1:1(w/w)的比率还包含芳香族脂质,如dio(3,3'-二十八烷基氧杂羰花青高氯酸盐)、dir(1,1’-二十八烷基-3,3,3',3'-四甲基吲哚三羰花青碘化物)、n-(4,4-二氟-5,7-二甲基-4-硼杂-3a,4a-二氮杂-对称引达省(sindacene)-3-丙酰基)-1,2-二十六酰基-sn-甘油基-3-磷酸乙醇胺(三乙基铵盐)(bodipyfl-dhpe)和2-(4,4-二氟-5-甲基-4-硼-杂3a,4a-二氮杂-对称引达省-3-十二酰基)-1-十六酰基-sn-甘油基-3-磷酸胆碱(bodipy-c12hpc)。用于将蛋白质包封在脂质体中并且将它们递送到细胞中的合适的技术是本领域中确定的(参见例如,kube等人langmuir(2017)331051-1059;等人(2018)int.j.mol.sci.19346)。本文所述的方法可以包括例如在有机溶剂(如氯仿)中将如本文所述的模块化结合蛋白或编码核酸与脂质溶液混合,并且将溶剂蒸发以产生包封模块化结合蛋白的脂质体。作为本发明的一个方面,提供了包含如本文所述的模块化结合蛋白的脂质体包封物。如本文所述的模块化结合蛋白或编码核酸可以与药学上可接受的赋形剂混合。作为本发明的一个方面,提供了药物组合物,其包含如本文所述的模块化结合蛋白或核酸和药学上可接受的赋形剂。如本文所用的术语“药学上可接受的”涉及在合理的医学判断范围内适合用于与受试者(例如,人)的组织接触使用而没有过多的毒性、刺激性、过敏反应或其他问题或并发症,与合理的益处/风险比相称的化合物、材料、组合物和/或剂型。在与配制品的其他成分相容的意义上,每种载体、赋形剂等也必须是“可接受的”。合适的载体、赋形剂等可见于在标准药物文本,例如remington’spharmaceuticalsciences,第18版,mackpublishingcompany,easton,pa.,1990。药物组合物可以方便地以单位剂型提供,并且可以通过药学领域中熟知的任何方法制备。此类方法包括使模块化结合蛋白与可构成一种或多种辅助成分的载体结合的步骤。通常,通过如下方式制备药物组合物:使活性化合物与液体载体或细碎的固体载体或两者均匀且紧密地结合,然后(如果必要的话)使产物成形。药物组合物可以呈如下形式:液体、溶液、悬浮液、乳剂、酏剂、糖浆剂、片剂、锭剂、颗粒剂、粉剂、胶囊剂、扁囊剂、丸剂、安瓿、栓剂、阴道栓、软膏剂、凝胶剂、糊剂、乳膏剂、喷雾剂、雾剂、泡沫剂、洗剂、油、大丸剂、糖饵剂或气溶胶。不论是全身地/外周地还是在所需作用部位,可以通过任何常规给予途径向受试者给予模块化结合蛋白、编码核酸或包含模块化结合蛋白或编码核酸的药物组合物,所述给予途径包括但不限于口服(例如通过摄食);外用(包括例如经皮、鼻内、经眼、经颊和舌下);经肺(例如通过使用例如气溶胶的吸入或吹入疗法,例如通过嘴或鼻);经直肠;经阴道;肠胃外,例如通过注射,包括皮下、皮内、肌内、静脉内、动脉内、心内、鞘内、脊柱内、囊内、囊下、眶内、腹膜内、气管内、表皮下、关节内、蛛网膜下和胸骨内;通过例如皮下或肌内植入贮库。适于口服给予(例如,通过摄食)的药物组合物可以提供为离散单元(如胶囊剂、扁囊剂或片剂),每个单元均含有预定量的活性化合物;提供为粉剂或颗粒剂;提供为在水性或非水性液体中的溶液或悬浮液;或提供为水包油液体乳剂或油包水液体乳剂;提供为大丸剂;提供为冲剂;或提供为糊剂。适于肠胃外给予(例如通过注射,包括皮肤、皮下、肌内、静脉内和皮内)的药物组合物包括水性和非水性的等渗的无热原的无菌注射溶液,其可以含有抗氧化剂、缓冲液、防腐剂、稳定剂、抑菌剂和使配制品与预期接受者的血液等渗的溶质;以及水性和非水性的无菌悬浮液,其可以包括悬浮剂和增稠剂及设计为将化合物靶向细胞、组织或器官的脂质体或其他微粒系统。用于此类配制品的合适的等渗媒介物的例子包括氯化钠注射液、林格氏溶液或乳酸林格氏注射液。通常,活性化合物在液体中的浓度为从约1ng/ml至约10μg/ml,例如从约10ng/ml至约1μg/ml。可以将配制品提供在单位剂量或多剂量密封的容器(例如,安瓿和小瓶)中,并且可以储存在冷冻干燥(冻干)条件下,仅需要恰在使用前添加无菌液体载体(例如注射用水)。应当理解,模块化结合蛋白的适当剂量可以因患者而异。确定最佳剂量将通常涉及平衡诊断益处水平与给予的任何风险或有害副作用。所选的剂量水平将取决于多种因素,包括但不限于给予途径,给予时间,显像剂的排泄速率,需要对比剂的量,组合使用的其他药物、化合物和/或材料,以及患者的年龄、性别、体重、病症、一般健康状况和既往病史。显像剂的量和给予途径最终将由医师决断,尽管通常剂量将是为了在某个部位(如肿瘤、目的组织或整个身体)达到显像剂的浓度,其允许成像而不会造成实质性有危害或有害副作用。可以按一种剂量连续地或间歇地(例如,以适当的间隔以分剂量)实现体内给予。确定最有效的给予方式和剂量的方法是本领域技术人员熟知的,并且将随用于疗法的配制品、疗法的目的、所治疗的靶细胞和正在接受治疗的受试者而变化。可以用由医师选择的剂量水平和模式来进行单次或多次给予。本文所述的模块化结合蛋白可以用于人或动物受试者(例如人)的诊断或治疗方法。靶分子的模块化结合蛋白可以用于治疗与靶分子相关的障碍。本发明的其他方面和实施方案提供了术语“包含”(“comprising”)由术语“由……组成”(“consistingof”)替代的上述方面和实施方案;以及术语“包含”(“comprising”)由术语“基本上由……组成”(“consistingessentiallyof”)替代的上述方面和实施方案。应当理解,除非上下文另外要求,否则本申请相互公开了上述以上方面和实施方案中的任何一个与彼此的所有组合。类似地,除非上下文另外要求,否则本申请单独地或与任何其他方面一起公开了优选的和/或任选的特征的所有组合。通过阅读本公开,以上实施方案的修改、其他实施方案及其修改对于本领域技术人员将是清楚的,因此,这些均在本发明的范围内。将本说明书中提及的所有文件和序列数据库条目出于所有目的通过引用以其整体并入本文。在本文中使用的情况下,将“和/或”视为对两个指定特征或组分中的每一个与或不与另一个的具体公开。例如,将“a和/或b”视为(i)a、(ii)b和(iii)a和b中的每一个的具体公开,就像每个在本文中分别列出一样。现在将通过举例方式并且参考上述附图来说明本发明的某些方面和实施方案。实验1.方法1.1从大肠杆菌进行大规模蛋白质纯化(his标签化的)通过热激将prsetb(his标签)构建体转化到化学感受态大肠杆菌c41细胞中,并且在lb-amp板上铺板。使菌落在含有氨苄青霉素(50微克/ml)的2ty培养基中在37℃、220rpm下生长,直到在600nm处的光密度(o.d.)达到0.6。然后将培养物用iptg(0.5mm)在20℃下诱导16-20h或在37℃下诱导4h。通过在3000g下离心(4℃,10min)沉淀细胞并且在裂解缓冲液(10mm磷酸钠(ph7.4)、150mmnacl、1片sigmafast蛋白酶抑制剂混合物(无edta,每100ml的溶液)中重悬,然后在15000psi下在emulsiflexc5均质器上裂解。通过在4℃下在15,000g下离心45min沉淀细胞碎片。在将细胞裂解物的上清液在4℃下分批结合至珠持续1小时之前,将50%床体积的ni-nta珠(gehealthcare)(5ml)用磷酸盐缓冲液(10mm磷酸钠(ph7.4)、150mmnacl)洗涤一次。用含有30mm咪唑的磷酸盐缓冲液(40ml)将装载的珠洗涤三次,以防止裂解物蛋白质与珠的非特异性相互作用。将样品使用具有300mm咪唑的磷酸盐缓冲液洗脱,并且使用预先在磷酸盐缓冲液(10mm磷酸钠(ph7.4)、150mmnacl)中平衡的hiload16/60superdexg75柱(gelife-science)通过尺寸排阻色谱法纯化并且在等度条件下将蛋白质分离。在nupage蛋白质凝胶(invitrogen)上检查纯度,并且将发现超过95%纯的级分合并。将经纯化的蛋白质快速冷冻,并且储存在-80℃下直至进一步使用。通过测量在280nm处的吸光度并且使用expasyprotparam计算出的每种变体的消光系数(gasteiger等人2005)来确定浓度。使用质谱法(maldi)确认分子量和纯度。1.2从大肠杆菌进行大规模蛋白质纯化(热处理)本文所述的所有模块化结合蛋白都具有非常好的热稳定性,其解链温度高于80℃。这意味着可以通过将细胞裂解物在65℃下孵育20min来将模块化结合蛋白与大肠杆菌蛋白质分离。极少数的大肠杆菌蛋白质能在此类温度下生存,因此它们将解折叠并且聚集。通过离心除去聚集的蛋白质,剩下80%-90%纯的所需蛋白质的样品。我们所有的构建体都是可逆折叠的,因此可以通过诸如丙酮或盐沉淀等方法进一步纯化,以除去dna和其他污染物。此方法无需昂贵的亲和纯化方法(如抗体或his标签)即允许生产大量功能蛋白质,并且可扩展至工业生产和生物反应器。1.3小规模纯化his标签化的蛋白质以进行高通量测试将质粒转化到大肠杆菌c41细胞中并且铺板过夜。将含有50微克/ml的氨苄青霉素的15ml的2ty培养基(roche)放在多个50ml管中。挑选几个菌落并且各自重悬于15ml培养物中。为了充足的通气,重要的是仅松散地拧紧50ml管的盖子。使细胞在37℃下生长,直到od600为0.6,然后用0.5mmiptg诱导过夜。将细胞在3000g(埃彭道夫离心机5804)下沉淀,然后重悬于1ml的细胞裂解试剂中。可替代地,使用超声与溶菌酶和dna酶i组合处理。使裂解物在12000g下旋转1分钟,以沉淀任何不溶的蛋白质和细胞碎片。将上清液添加到100μl床体积的预先洗涤的ni-nta琼脂糖珠中。分批进行随后的亲和纯化,每次通过用1ml的缓冲液洗涤珠4次(可替代地,可以使用qiagenni-nta旋转柱)。第一次洗涤液含有在所选缓冲液中的10%溶液和30mm咪唑。在这里,我们使用50mm磷酸钠缓冲液(ph6.8)、150mmnacl。连续三次洗涤液具有在所选缓冲液中的30mm咪唑。彻底洗涤珠,以除去溶液中存在的洗涤剂。使用1ml的含有300mm咪唑的所选缓冲液,在单个步骤中将蛋白质从珠上洗脱。和咪唑的组合以及以小珠体积进行的重复洗涤产生了>95%纯的蛋白质。使用nap-5一次性凝胶过滤柱(gehealthcare)除去咪唑。1.4竞争荧光偏振(fp)为了测定设计的sos-tpr蛋白与kras的结合,使用经纯化的krasq61h突变体和(2'-(或-3')-o-(n-甲基邻氨基苯酰基)鸟苷5'-三磷酸(一种荧光版本的gtp,也称为mant-gtp)进行竞争fp。在黑色96孔板(cls3993sigma)中,使用针对krasq61h和mant-gtp(1μm)的1:1复合物的2倍系列稀释液滴定sos-tpr。在弱光条件下制备板并且在室温下孵育。使用360nm的激发滤光片和440nm的发射滤光片,在clariostar酶标仪上进行读数。1.5等温滴定量热法(itc)使用vp-itc(microcal)在25℃下进行itc。将1tbp-ctpr2、2tbp-ctpr4、3tbp-ctpr6和tnks2arc4透析到10mm磷酸钠缓冲液(ph7.4)、150mmnacl、0.5mmtcep中。将经透析的tnks2arc4(200μm)滴定到含有20μm的1tbp-ctpr2的样品细胞中。对2tbp-ctpr4和3tbp-ctpr6进行了相似的实验。起初用5μl的注射量,将tnks2arc4注射到细胞中,然后进行29次10μl的注射。将参考功率设定为15μcal/s,初始延迟为1000s并且搅拌速度为485rpm。使用仪器软件单位点结合模型拟合数据。1.6细胞培养将hek293t细胞在补充有10%胎牛血清和青霉素/链霉素(lifetech)的杜氏改良伊格尔培养基(sigmaaldrich)中在37℃和5%co2空气供应下培养。1.7细胞转染将hek293t接种在6孔组织培养板(500,000个细胞/孔)中,并且第二天根据制造商的方案,使用lipofectamine2000转染试剂(invitrogen)转染。1.8β-连环蛋白水平western印迹测定使用lipofectamine2000,在6孔板的hek293t细胞中,仅转染ha-β-连环蛋白(1μg)以及与多种protac(1μg)一起转染。转染48小时后,在200μl的laemmli缓冲液中将细胞裂解。将样品在95℃下煮沸20min后,将蛋白质通过sds-page解析并且转移到pvdf膜上,并且使用抗ha(c29f4,cellsignalingtechnologies)和抗肌动蛋白(a2066,sigma-aldrich)抗体进行免疫印迹。使用imagej,通过相对于肌动蛋白水平归一化的对应于ha-β-连环蛋白的条带的密度测定法评价β-连环蛋白水平的变化。1.9脂质体配制品和细胞毒性测定为了制备蛋白质的脂质体配制品(lfp),将脂质(dotap(阳离子):dope(中性):dir(芳香族)=1:1:0.1w/w)溶解于氯仿中,并且在真空下将溶剂蒸发过夜。将所得的混合脂质饼用含有27μm蛋白质的10mmhepes(ph7.4)水合,使得总脂质浓度是4mg/ml。将此混合物涡旋2分钟,然后在室温下超声20分钟。将包封蛋白质的脂质体储存在4℃下,直至进一步使用。为了制备空脂质体(el,无蛋白质的空脂质体),将脂质饼用无蛋白质的10mmhepes(ph7.4)水合。将atp测定用于研究是否存在任何与el和lfp相关的细胞毒性。在通常的程序中,在24孔细胞培养板中,使2x105个hek293t细胞/孔在500μl的补充有10%胎牛血清的杜氏改良伊格尔培养基(dmem)中生长24小时。将细胞与脂质体(el/lfp)-培养基(无fbs的dmem)混合物(具有不同体积(0-60μl)的el和lfp)在37℃下一起孵育15分钟。用1xpbs洗涤两次后,添加500μl的celltiter-试剂(promega)并且按照制造商的方案使用酶标仪测量发光。将未处理的细胞用作对照。从一式三份的样品中获得数据,并且从两个独立的实验计算标准偏差。1.10topflash测定通过将hek293t细胞用获自表达wnt3a的l细胞的wnt条件培养基处理8天来激活wnt途径。为了进行所述测定,将105个hek293t细胞/孔接种于24孔板nunclondelta表面板(nunc)中,并且在37℃、5%co2下孵育过夜。第二天,将细胞用100ng的topflashtcf7l2萤火虫萤光素酶质粒、10ng的cmv海肾质粒(作为内部对照)和100ng的相应的tpr构建体转染。根据制造商的方案(invitrogen),将质粒与0.5μl的lipofectamine2000转染试剂混合。允许转染的细胞恢复8h,然后将它们用wnt条件培养基(1:2终浓度)再处理16h。按照制造商的说明,使用双萤光素酶报告物测定系统(promega)进行topflash测定(korinek等人,1997science275(5307):1784-7)。使用clariostar酶标仪,从单个样品中依次测量萤火虫萤光素酶和海肾萤光素酶的活性。将萤火虫发光活性除以cmv诱导的海肾活性,从一式三份的样品中获得相对萤光素酶值,并且计算标准偏差。1.11使用脂质体包封将设计的tpr蛋白递送到细胞中的topflash测定在24孔细胞培养板的每个孔中,使105个hek293t细胞在500μl的补充有10%胎牛血清的杜氏改良伊格尔培养基(dmem)中生长过夜。对于topflash报告物测定,在24孔板中,将100ng/孔的topflash质粒和10ng/孔的cmv海肾质粒(作为内部对照)用于转染细胞。根据制造商的方案(invitrogen),用lipofectamine2000转染试剂转染细胞。允许转染的细胞恢复8小时,并且通过添加获自l细胞的wnt3a条件培养基激活wnt信号传导。wnt途径激活后16小时,通过脂质体处理将蛋白质递送到细胞中。将细胞与脂质体(lfp)-培养基(无fbs的dmem)混合物在37℃下一起孵育15分钟,然后进行一次pbs洗涤。更换wnt3a条件培养基,并且将细胞孵育可变的持续时间(2-8小时)。孵育后,按照制造商的说明,使用双萤光素酶报告物测定系统(promega)进行topflash测定(korinek等人,1997)。通过将萤火虫萤光素酶值(来自topflash)除以海肾萤光素酶值(来自cmv海肾),从一式三份的样品(来自两个独立的实验)中获得相对萤光素酶值,并且计算标准偏差。1.12.测量设计的nrf-tpr蛋白与keap1的结合的竞争荧光偏振(fp)测定为了测量设计的nrf-tpr蛋白与keap1的结合,使用384孔黑色不透明optiplate微板和clariostar酶标仪进行竞争fp。将nrf-tpr蛋白滴定到含有fitc标记的nrf2肽和keap1蛋白的混合物的溶液中。在进行读数之前,将制备的板在室温下孵育30分钟。2.结果三角形四肽重复序列(tpr)是34个残基的基序,其可以串联地重复以产生模块化蛋白。本文将tpr用作螺旋-转角-螺旋串联重复序列阵列的例子,但是可以使用任何串联重复序列阵列。包含tpr的rtpr蛋白衍生自共有tpr序列(ctpr)。发现两个重复序列足以产生68个氨基酸的高度稳定的小蛋白质(rtpr2)。评估了两种类型的工程化策略的生物物理特性;环插入和末端螺旋嫁接。监测随升高的温度变化的三个不同的rtpr模块在222nm处的摩尔椭圆率(螺旋二级结构含量的量度)。绝对摩尔椭圆率随温度升高而降低表明结构的丧失和蛋白质的解折叠。即使在记录的最高温度(85℃)下,没有插入的rtpr2蛋白也没有完全变性(图1)。在两个重复序列之间具有20个残基的非结构化环的rtpr2示出了向较低的解链温度的小偏移(图1),但是所述蛋白质在高达55℃时仍保持完全折叠。这远高于生理相关温度。具有另外的n末端螺旋的rtpr2示出了绝对摩尔椭圆率的增加,这表明另外的螺旋结构域是折叠的。此外,与环插入不同,螺旋结构域能够稳定rtpr2模块,将过渡中点移至90℃以上(图1)。这些结果显示,两种工程化策略产生了能够承受高温的折叠的并且稳定的模块化小蛋白质。tpr支架的关键特征是其模块化性质。此模块性允许我们串联展示任何数量的结合模块,以获得针对一种、两种或更多种靶标的二价和多价以及多功能分子。这些蛋白质的稳定性显示为模块化的。测量了包含串联地重复的tbp-ctpr2(具有与蛋白质端锚聚合酶结合的环插入的两个重复序列的ctpr(guettler等人2011))的蛋白质的稳定性。含有tbp-ctpr2的蛋白质具有两个、四个、六个和八个重复序列,并且它们分别展示一个、两个、三个和四个结合环。发现蛋白质的螺旋含量(通过222nm处的摩尔椭圆率监测)与重复序列的数量成比例增加,稳定性也一样,这表明它们表现的类似于经典的螺旋重复序列蛋白(图2)。这些结果证明双功能或多功能模块化结合蛋白具有高的热稳定性。2.1.具有单一结合功能的蛋白质嫁接到α螺旋上的展示2.1.1sos1-tpr,一种设计为与癌蛋白kras结合的螺旋嫁接的结合模块首先,我们将与kras相互作用的sos1的螺旋(margarit等人2003cell1125685-695)映射到七残基(heptad)分布上。我们将七残基位置与由leshchiner等人(pnas2015112(6)1761-1766)产生的装订的sos1螺旋肽匹配,并且设定肽的装订侧以与剩余的tpr蛋白形成疏水界面(图3a)。螺旋的长度很重要。n末端溶剂化ctpr螺旋终止于序列dpnn,其形成短环,这导致下一个重复序列。因此,ctpr介导的结合螺旋的“装订”(约束)通过残基tyr(i)-ile(i+4)-tyr(i+7)-leu(i+11)而发生,从而完全装订15个残基的螺旋。我们在嫁接的螺旋与相邻的重复序列之间创建了疏水界面,并且允许在嫁接的螺旋的c末端形成dpnn环。然后,我们将最终序列嫁接到ctprb螺旋的晶体结构上,以进一步验证相互作用。使用haddock软件将我们设计的kras结合蛋白sos1-tpr与kras对接(devries&bonvin2011;devries等人2010)。haddock是数据驱动的对接算法,其使用关于相互作用的已知信息进行计算。最初将sos1-kras(pdb:1nvu)的晶体结构(margarit等人2003)用于设计装订的肽。提取出主动残基(主要相互作用残基)和被动残基(接近活性残基),并将其输入计算中。自从最初的工作,我们已经发现对接不是验证新螺旋模块所必需的。所述设计策略具有扎实的基于α螺旋的几何形状的理论,并且只要已经嫁接关键的结合残基,设计就会成功。因此,发现这些tpr重复序列是展示结合螺旋的特殊支架,因为它们沿螺旋的相反方向线性生长,从而避免了与靶蛋白的任何空间冲突。接下来,我们使用mant-gtp(2'-/3'-o-(n'-甲基邻氨基苯酰基)尿苷-5'-o-三磷酸)(一种gtp荧光类似物)的荧光偏振的变化监测了kras结合(图3b)。mant-gtp的荧光取决于其环境的疏水性(在360nm处激发,在440nm处发射)。先前观察到与kras结合后,荧光强度和荧光偏振增强(leshchiner等人2015)。然后将sos-tpr2滴定到预先形成的mant-gtp-kras复合物中。随着sos-tpr2的浓度增加,偏振明显降低,这表明在sos-trp2与kras结合后,mant-gtp发生位移(图3b)。拟合数据给出3.4μm的ec50。相比之下,空白蛋白ctpr3对荧光偏振没有影响。2.1.2p53-tpr,一种设计为与mdm2结合的螺旋嫁接的结合模块许多降解决定子(底物内被e3泛素连接酶识别的区域)是非结构化的。然而,p53通过α螺旋与mdm2e3结合(图4a)。许多团体已经开发了p53螺旋的装订版本以及环状肽和嫁接的卷曲螺旋,并且在一些情况下,已经对序列进行了优化以给出纳摩尔亲和力(参见例如,ji等人2013;lee等人2014;kritzer等人2006)。p53螺旋具有有利的几何形状,以嫁接到ctpr支架的c末端溶剂化螺旋上,而且此外,两个螺旋具有30%的序列同一性。使用等温滴定量热法(itc)获得p53-ctpr2与mdm2(n末端结构域)结合的证明。将mdm2滴定到含有10μm的p53-tpr2的溶液中。itc测量结合时释放的热量。观察到高亲和力相互作用,解离常数大约为50nm(图4b)。2.2.具有单一结合功能的蛋白质嫁接到重复序列间环中的展示2.2.1tpb2-tpr,一种设计为与癌蛋白端锚聚合酶结合的环模块首先,我们将slim“3bp2”(与作为在许多癌症中被上调的多结构域聚adp-核糖聚合酶(guettler等人2011)的蛋白质端锚聚合酶的底物结合锚蛋白重复序列簇(arc)结合的序列)引入到ctpr支架上。在折叠结构域中嫁接slim导致蛋白水解抗性的增加;示出了通过进一步的合理工程化、计算机(insilico)方法和/或定向进化来扩大相互作用面的潜力;控制几何排列;以及双价或多价相互作用。我们使用itc测试了1tbp-ctpr2、2tbp-ctpr4和3tbp-ctpr6与端锚聚合酶arc4结构域的结合(图5a)。此技术对于这些相互作用特别有用,因为它可以测量相互作用的化学计量(n)。我们证明,n随着结合环的数量而增加,这意味着结合至一种tbp-ctpr的端锚聚合酶分子与蛋白质中的环一样多。因此,对于结合配偶体,所有环都是易接近的。此外,结合亲和力随着指示亲合力作用的重复序列的数量而增加,并且解离速率随之降低。这种类型的多价分子对于全长端锚聚合酶尤其有用,因为它具有四个能够结合3bp2肽的arc结构域。通过将结合模块融合到t4次要纤维蛋白的折叠子结构域上寡聚化所述结合模块进一步提高了此系统中的多价(图5b)。此三聚结构域包含c末端螺旋(如p53-ctpr的c末端螺旋),以折叠子结构域(一种能够均三聚的短β片层肽)结束。已经显示折叠子结构域高度稳定并且是独立折叠的(boudko等人2002;meier等人2004)。以这种方式,可以按指定的几何形状排列多个结合模块,以抑制由于其与具有高亲合力的其他多价网络相互作用的自然趋势而不能通过单价相互作用靶向的复杂的多价分子。2.2.2将多价引入单一结合功能tpr中的效果我们测试了含有可变数量的与蛋白质端锚聚合酶结合的“3bp2”基序的多价ctpr蛋白(1tbp-ctpr2、2tbp-ctpr4和3tbp-ctpr6等)的功能。通过将tpr融合到t4次要纤维蛋白的折叠子结构域(1tbp-ctpr2-折叠子、2tbp-ctpr4-折叠子等)上寡聚化所述tpr进一步提高了多价。端锚聚合酶在许多癌症中被上调,并且通过下调β-连环蛋白发挥其作用。因此,使用β-连环蛋白报告物基因测定(topflash测定)来测定tbp嫁接的tpr的抑制作用。如使用wnt信号传导测定所提及的,增加功能单元的数量增加了蛋白质的抑制作用(图17)。2.2.3skp2-rtpr,一种设计为与e3泛素连接酶scfskp2结合的环模块skp2是scfskp2泛素连接酶的底物识别亚基。我们插入rtpr环中的skp2结合序列是基于先前公开的衍生自底物p27的降解决定子肽序列,所述底物p27和与cks1(辅助蛋白)复合的skp2结合(hao等人2005)。我们仅使用了此肽的10个残基。尽管理想地,skp2结合序列将包括磷酸苏氨酸(因为此残基与skp2和cks1形成了一些关键接触),但是我们反而探索了我们是否可以在不影响结合亲和力的情况下用磷酸模拟物(谷氨酸)替代磷酸苏氨酸。我们使用免疫共沉淀发现,所得的p27-tpr蛋白能够与skp2结合(图6a),并且它能够在体外高效抑制p27的泛素化,这表明解离常数大约为30nm(图6b)。由于所述肽在其skp2/cks1结合状态下采用转角样构象,因此将其限制在rtpr支架内导致结合亲和力大大增强,这超过了用磷酸模拟物替代磷酸苏氨酸引起的亲和力的任何损失。2.2.4nrf-tpr,一种设计为与e3泛素连接酶keap1-cul3结合的环模块keap1是keap1-cul3泛素连接酶的底物识别亚基。我们插入ctpr环中的keap1结合序列是基于先前公开的衍生自keap1底物nrf2的降解决定子肽序列。我们使用免疫共沉淀发现,所得的nrf-tpr蛋白能够与keap1结合(图7a),并且如通过itc分析测量的,所述相互作用在低纳摩尔范围内具有高亲和力(图7b)。2.3.工程化rtpr支架用于递送到细胞中将我们的rtpr序列与替代共有tpr序列(parmeggiani等人2015)组合,我们包括了另外的溶剂暴露的精氨酸残基,因为先前已经显示这种‘表面重修’或‘增压’促进蛋白质进入细胞中(chapman&mcnaughton2016;thompson等人2012)。图8显示,此方法成功地将荧光标记的表面重修的tbp-rtpr2蛋白递送到两种不同的细胞系中。2.4.指导蛋白质泛素化和随后的降解的异双功能tpr的设计在许多癌症和神经退行性疾病中,wnt/β-连环蛋白信号传导途径失调,因此β-连环蛋白是重要的药物靶标。存在大量已知的β-连环蛋白的似乎适于嫁接到tpr支架上的结合序列(螺旋的和非螺旋的),因此我们将它选为我们设计诱导蛋白质降解的异双功能tpr的第一靶标。我们选择mdm2和scfskp2作为e3泛素连接酶进行测试,因为我们已经成功生成了与它们结合的单功能tpr(图4和图6)。我们生成了一些异双功能分子的结构模型,并且将这些结构模型用作对β-连环蛋白向e3的所得呈递看起来是否适当的粗略评估。然后,我们生成了小的质粒文库,所述质粒编码包含三个或四个用β-连环蛋白结合模块和两个e3连接酶结合模块的不同组合功能化的tpr的蛋白质。我们使用lipofectamine2000在hek293t细胞中单独转染ha标签化的β-连环蛋白质粒或将ha标签化的β-连环蛋白质粒与多种异双功能tpr质粒之一一起转染。转染48小时后,将细胞裂解,将样品煮沸,并且将蛋白质通过sds-page解析,并且使用抗ha和抗肌动蛋白抗体进行免疫印迹。通过相对于肌动蛋白水平归一化的对应于ha-β-连环蛋白的条带的密度测定法评价β-连环蛋白水平的变化(图9)。结果显示,许多异双功能分子能够将β-连环蛋白水平降低多达70%。相比之下,空白tpr和单功能tpr都不会对β-连环蛋白水平产生任何影响。一系列不同的因素有助于这些异双功能分子进行的有效泛素化和靶标降解,因此筛选单功能模块的不同组合以及可能还有介入空白模块的不同长度的能力。2.5使用递送媒介物将模块化tpr蛋白引入细胞中我们将设计的tpr蛋白包封在由阳离子、中性和芳香族脂质制成的融合脂质体中,并且我们证明,它们由此被递送到细胞中(图18和图19)。空脂质体和包封tpr蛋白的脂质体对细胞无毒(图20)。2.6指导蛋白质泛素化和随后的降解的异双功能tpr的其他例子异双功能tpr蛋白被设计为靶向端锚聚合酶(图21)、β-连环蛋白(图22)或kras(图23)用于泛素化和降解。使用脂质体包封,将靶向端锚聚合酶或β-连环蛋白的tpr蛋白递送到细胞中,并且使用topflash测定来测定对wnt信号传导的影响。结果显示,设计的异双功能tpr蛋白能够抑制wnt信号传导。对于kras,我们使用lipofectamine2000在hek293t细胞中单独转染kras质粒或将kras质粒与tpr质粒之一一起转染。转染后24小时,将细胞裂解,并且通过western印迹评价kras水平。结果显示,设计的异双功能tpr能够降低kras水平。2.7指导kras经由分子伴侣介导的自噬(cma)而降解的异双功能tpr异双功能tpr蛋白被设计为靶向内源性kras用于经由cma而降解(图24)。使用lipofectamine2000,将tpr构建体或空载体(浅灰色)瞬时转染到hek293t或dld1(结直肠癌细胞系)中。转染后24小时,将细胞裂解,并且通过western印迹评价kras水平。与空载体对照相比导致kras水平降低的设计的异双功能tpr显示为白色。2.8将结合结构域与重复序列间环连接的接头序列的变化为了优化靶标对nrf-tpr(一种设计为与蛋白质keap1结合的tpr蛋白)的结合亲和力,改变了将结合结构域与重复序列间环连接的接头序列(参见图7)。将甘氨酸残基引入接头中以提供柔性和增加的空间采样。当与共有样接头序列相比时,发现这种更具柔性的接头序列(标记为‘柔性的’)的引入增加了nrf-tpr蛋白的结合亲和力。改变接头序列的电荷含量(标记为‘带电的’)和通过改变接头序列的氨基酸组成来改变环的构象特性(标记为‘cider优化的’)(基于cider程序的预测(holehouse等人biophys.j.112,16-21(2017))也影响了keap1结合亲和力(图25)。表1通过muscle(3.8)进行的clustal多序列比对表4迄今为止在异双功能ctpr和rtpr中使用的所有ctpr和rtpr的dna序列的多重比对表5ctpra,大肠杆菌表达密码子优化的gcagaagcatggtataatctgggtaatgcatattacaaacagggcgattatcagaaagccatcgagtattatcaaaaagcactggaactggacccgnnnnnnaeawynlgnayykqgdyqkaieyyqkaleldpxxctpra,智人(h.sapiens)表达密码子优化的gccgaggcctggtacaatctgggcaacgcctactacaagcagggcgactaccagaaggccatcgagtattatcagaaggccctggaactggaccccnnnnnnaeawynlgnayykqgdyqkaieyyqkaleldpxxrtpra-i,智人表达密码子优化的gccgaggcctggtacaacctgggcaacgcctactaccggcagggcgactaccagcgggccatcgagtactaccagagagccctggaactggaccctnnnnnnaeawynlgnayyrqgdyqraieyyqraleldpxxrtpra-ii,智人表达密码子优化的gccgaagcttggtataatctggggaatgcctattacagacagggggattatcagcgcgccattgaatattatcagcgggctctggaactggatcctnnnnnnaeawynlgnayyrqgdyqraieyyqraleldpxxrtpra-i,大肠杆菌表达密码子优化的gcagaagcatggtataatctgggtaatgcatattatcgccagggtgattatcagcgtgccattgaatattatcaacgtgcactggaactggacccgnnnnnnaeawynlgnayyrqgdyqraieyyqraleldpxxrtpra-ii,大肠杆菌表达密码子优化的gccgaggcctggtataaccttggcaacgcctattatcgtcaaggcgactaccagagagcaatcgaatattaccagcgtgcgttagaattagatccgnnnnnnaeawynlgnayyrqgdyqraieyyqraleldpxxrtpra-iii,大肠杆菌表达密码子优化的gcagaagcatggtataatctgggcaatgcatattatcgtcagggtgattatcagcgtgccatcgaatattatcaacgtgcactggaactggacccgnnnnnnaeawynlgnayyrqgdyqraieyyqraleldpxxrtpra-iv,大肠杆菌表达密码子优化的gccgaggcctggtacaacctgggtaacgcctattatcgccaaggcgactaccagcgtgcaattgagtactaccaacgtgccctggaactggaccctnnnnnnaeawynlgnayyrqgdyqraieyyqraleldpxxctprb,大肠杆菌表达密码子优化的gcagaagcactgaataatctgggtaatgtttatcgtgaacagggcgattatcagaaagccatcgaatattatcaaaaagcgctggaactggacccgnnnnnnaealnnlgnvyreqgdyqkaieyyqkalel-dpxxctprb,智人表达密码子优化的gccgaggctctgaacaacctgggcaacgtgtacagagagcagggcgactaccagaaggccatcgagtattatcagaaggccctggaactggaccccnnnnnnaealnnlgnvyreqgdyqkaieyyqkalel-dpxxrtprb,大肠杆菌表达密码子优化的gcagaagcactgaataatctgggtaatgtttatcgtgaacagggcgattatcagcgtgccattgaatattatcaacgtgcgctggaattagatccgnnnnnnaealnnlgnvyreqgdyqraieyyqralel-dpxxrtprb,智人表达密码子优化的gccgaggctctgaacaacctgggcaacgtgtacagagagcagggcgactaccagcgggccatcgagtattatcagagagccctggaactggaccccnnnnnnaealnnlgnvyreqgdyqraieyyqraleldpxxrtprc,大肠杆菌表达密码子优化的gcagaagcactgcgtaatctgggtcgtgtttatcgtcgtcagggtcgttatcagcgtgcaattgaatattatcgtcgcgcactggaattagatccgnnnnnnaealrnlgrvyrrqgryqraieyyrraleldpxxrtprc,智人表达密码子优化的gccgaggctctgagaaatctgggcagagtgtacagacggcagggcagataccagcgggccatcgagtattaccgcagagccctggaactggaccccnnnnnnaealrnlgrvyrrqgryqraieyyrraleldpxx表6rtpr和ctpr序列蛋白质靶标互补位结构rscb编号治疗领域nrp1/2rasqyfssyla环2qqn抗血管生成nrp1/2aredfrnrrlwyvmdy螺旋2qql抗血管生成il18kasgysftdyfiy螺旋2yxt抗炎il15yrdrrrps环2xqb抗炎甲状腺刺激激素受体sgsssdigsnyvs环2xwtegf受体qqwsshift环3c09癌症egf受体asrdydyagryfdy螺旋3c09癌症il23qnghsfpft环3d85抗炎il23yinpyndgtk螺旋3d85抗炎il23arnwdvay螺旋3d85抗炎淋巴细胞功能相关抗原1(lfa-1)sgysftghwmn螺旋3eoa抗免疫淋巴细胞功能相关抗原1(lfa-1)mihpsdsetr螺旋3eoa抗免疫淋巴细胞功能相关抗原1(lfa-1)argiyfygttyfdy螺旋3eoa抗免疫c3bsgfsftssvs螺旋3g6j抗炎c3bliypyngfn螺旋3g6j抗炎fgf受体3aasgftftstgis螺旋3grw多发性骨髓瘤fgf受体3artygiydlyvdyte螺旋3grw多发性骨髓瘤il2srdygyyfd螺旋3iu3抗炎il2gysftrywmh螺旋3iu3抗炎her2qwwwwpst环3n85乳腺癌her2asgfsiwwswih螺旋3n85乳腺癌膜型丝氨酸蛋白酶1ydnnqrps环3nps癌转移膜型丝氨酸蛋白酶1tfhirryrsgyydkmdh螺旋3nps癌转移β-分泌酶argpfspwvmdy螺旋3r1g阿尔茨海默病vegf-rtrhdgtnfd螺旋3s35抗血管生成vegf-rqqakafppt环3s37抗血管生成lrp5/6受体sghvnavknygy螺旋3sob骨质流失hepsin蛋白酶wintetgs螺旋3t2n前列腺癌因子dwintytge螺旋4d9r抗炎因子dgytftnygmn螺旋4d9r抗炎表71.轴蛋白-rtpr-abbamgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggslssafhvfedgnkenggpnaeawynlgnayyrqgdyqraieyyqraleldpnn2.轴蛋白-rtpr-dboxmgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggprlplgdvsnnggpnaeawynlgnayyrqgdyqraieyyqraleldpnn3.轴蛋白-rtpr-kenmgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggprlplgdvsnnggpnaeawynlgnayyrqgdyqraieyyqraleldpnn4.轴蛋白-rtpr-nrf2mgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggprlplgdvsnnggpnaeawynlgnayyrqgdyqraieyyqraleldpnn5.轴蛋白-rtpr-siahmgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpgglrpvamvrptvggpnaeawynlgnayyrqgdyqraieyyqraleldpnn6.轴蛋白-rtpr-spopmgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpgglacdevtsttssstaggpnaeawynlgnayyrqgdyqraieyyqraleldpnn7.轴蛋白-rtpr-p27mgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldpnn8.轴蛋白-rtpr-p53mgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnfaaywnllsayg10.bcl9-rtpr-abbamgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggdpetgelggpnaeawynlgnayyrqgdyqraieyyqraleldpnn11.bcl9-rtpr-dbox-v1mgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggprlplgdvsnnggpnaeawynlgnayyrqgdyqraieyyqraleldpnn12.bcl9-rtpr-dbox-v2mgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpggprlplgdvsnnggpnaeawynlgnayyrqgdyqraieyyqraleldpnn13.bcl9-rtpr-kenmgsgaypeyildihvyrvqleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggslssafhvfedgnkenggpnaeawynlgnayyrqgdyqraieyyqraleldpnn14.bcl9-rtpr-nrf2mgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggdpetgelggpnaeawynlgnayyrqgdyqraieyyqraleldpnn15.bcl9-rtpr-p27mgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldpnn16.bcl9-rtpr-p53mgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnfaaywnllsayg17.bcl9-rtpr-siahmgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpgglrpvamvrptvggpnaeawynlgnayyrqgdyqraieyyqraleldpnn18.bcl9-rtpr-spopmgssqeqlehryrslitlydiqlmldpnnaeawynlgnayyrqgdyqraieyyqraleldpgglacdevtsttssstaggpnaeawynlgnayyrqgdyqraieyyqraleldpnn19.tcf7l2-rtpr-nrf2mgsaeawynlgnayyrqgdyqraieyyqraleldpggqelgdndelmhfsyestqdggpnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggdpetgelggpnaeawynlgnayyrqgdyqraieyyqraleldpnn20.tcf7l2-rtpr-p27mgsaeawynlgnayyrqgdyqraieyyqraleldpggqelgdndelmhfsyestqdggpnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldpnn21.p27-rtpr-tcf7l2mrgshhhhhhglvprgsaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpggqelgdndelmhfsyestqdggpnaeawynlgnayyrqgdyqraieyyqraleldprs22.tcf7l2-rtpr-p53mgsaeawynlgnayyrqgdyqraieyyqraleldpggqelgdndelmhfsyestqdggpnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnfaaywnllsayg23.icat-rtpr-p27mgsyayqraiveymlrlmsdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldpnn24.icat-rtpr-p53mgsyayqraiveymlrlmsdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnfaaywnllsayg25.lrh1-rtpr-abbamgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggsedkenvppggpnaeawynlgnayyrqgdyqraieyyqraleldpnn26.lrh1-rtpr-dboxmgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggprlplgdvsnnggpnaeawynlgnayyrqgdyqraieyyqraleldpnn27.lrh1-rtpr-kenmgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggsedkenvppggpnaeawynlgnayyrqgdyqraieyyqraleldpnn28.lrh1-rtpr-nrf2mgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggdpetgelggpnaeawynlgnayyrqgdyqraieyyqraleldpnn29.lrh1-rtpr-p27mgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldpnn30.lrh1-rtpr-p53mgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnfaaywnllsayg31.lrh1-rtpr-siahmgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpgglrpvamvrptvggpnaeawynlgnayyrqgdyqraieyyqraleldpnn32.lrh1-rtpr-spopmgsyeqaiaayldalmcdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpgglacdevtsttssstaggpnaeawynlgnayyrqgdyqraieyyqraleldpnn33.apc-rtpr-nrf2mgsaeawynlgnayyrqgdyqraieyyqraleldpggscseelealealeldeggpnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpggdpetgelggpnaeawynlgnayyrqgdyqraieyyqraleldpnn34.apc-rtpr-p27mgsaeawynlgnayyrqgdyqraieyyqraleldpggscseelealealeldeggpnaeawynlgnayyrqgdyqraieyyqraleldpnn35.p27-rtpr-apcmrgshhhhhhglvprgsaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpggscseelealealeldeggpnaeawynlgnayyrqgdyqraieyyqraleldprs36.apc-rtpr-p53mgsaeawynlgnayyrqgdyqraieyyqraleldpggqelgdndelmhfsyestqdggpnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldpnnfaaywnllsayg37.1tbp-ctpr2mgsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprs38.2tbp-ctpr4mgsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprs39.3tbp-ctpr6mgsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprs40.4tbp-ctpr8mgsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprsaeawynlgnayykqgdyqkaieyyqkaleldpnnreagdgeedprsaeawynlgnayykqgdyqkaieyyqkaleldprs41.1tbp-ctpr2-折叠子(折叠子序列以粗体显示)42.2tbp-ctpr4-折叠子(折叠子序列以粗体显示)43.3tbp-ctpr6-折叠子(折叠子序列以粗体显示)44.4tbp-ctpr8-折叠子(折叠子序列以粗体显示)45.kbl-rtpr-cma_qmgsipnpllgldgsaeawynlgnayyrqgdyqraieyyqraleldpnnplyisydpaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpnnqrffe46.cma_q-kbl-rtprmgsqrffegsaeawynlgnayyrqgdyqraieyyqraleldpnnplyisydpaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpnn47.cma_k-kbl-rtprmgskferqgsaeawynlgnayyrqgdyqraieyyqraleldpnnplyisydpaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpnn48.sos-rtpr-cma_kmgsfegialtnylkalegdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldprskferq49.sos-rtpr-cma_qmgsfegialtnylkalegdpnnaeawynlgnayyrqgdyqraieyyqraleldprsipnpllgldkferq50.sos-rtpr-p27mgsfegialtnylkalegdpnnaeawynlgnayyrqgdyqraieyyqraleldpnnaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrspdaeawynlgnayyrqgdyqraieyyqraleldprs51.kbl-rtpr-p27mgsaeawynlgnayyrqgdyqraieyyqraleldpnnplyisydpaeawynlgnayyrqgdyqraieyyqraleldprsaeawynlgnayyrqgdyqraieyyqraleldpnnagsneqepkkrsaeawynlgnayyrqgdyqraieyyqraleldpnn表8参考文献bondeson,d.p.,mares,a.,smith,i.e.d.,ko,e.,campos,s.,miah,a.h.,mulholland,k.e.,routly,n.,buckley,d.l.,gustafson,j.l.,etal.(2015).catalyticinvivoproteinknockdownbysmall-moleculeprotacs.nat.chem.biol.11,611–617.boudko,s.p.,londer,y.y.,letarov,a.v,sernova,n.v,engel,j.,andmesyanzhinov,v.v(2002).domainorganization,foldingandstabilityofbacteriophaget4fibritin,asegmentedcoiled-coilprotein.eur.j.biochem.269,833–841.brunette,t.j.,parmeggiani,f.,huang,p.-s.,bhabha,g.,ekiert,d.c.,tsutakawa,s.e.,hura,g.l.,tainer,j.a.,baker,d.(2015)exploringtherepeatproteinuniversethroughcomputationalproteindesign.nature528,580-584.chapman&mcnaughton,b.r.(2016).scratchingthesurface:resurfacingproteinstoendownewpropertiesandfunction.cellchem.biol.23,543-553.d’andrea,l.d.,andregan,l.(2003).tprproteins:theversatilehelix.trendsbiochem.sci.28,655–662.deshaies,r.j.(2015).proteindegradation:primetimeforprotacs.nat.chem.biol.11,634–635.devries,s.j.,andbonvin,a.m.j.j.(2011).cport:aconsensusinterfacepredictoranditsperformanceinprediction-drivendockingwithhaddock.plosone6,e17695.devries,s.j.,vandijk,m.,andbonvin,a.m.j.j.(2010).thehaddockwebserverfordata-drivenbiomoleculardocking.nat.protoc.5,883–897.guettler,s.,larose,j.,petsalaki,e.,gish,g.,scotter,a.,pawson,t.,rottapel,r.,andsicheri,f.(2011).structuralbasisandsequencerulesforsubstraterecognitionbytankyraseexplainthebasisforcherubismdisease.cell147,1340–1354.güthe,s.,kapinos,l.,a.,meier,s.,grzesiek,s.,andkiefhaber,t.(2004).veryfastfoldingandassociationofatrimerizationdomainfrombacteriophaget4fibritin.j.mol.biol.337,905–915.hao,b.,zheng,n.,schulman,b.a.,wu,g.,miller,j.j.,pagano,m.,pavletich,n.p.(2005).structuralbasisofthecks1-dependentrecognitionofp27(kip1)bythescf(skp2)ubiquitinligase.mol.cell20,9-19.kobe,b.&kajava,a.v.(2000).whenproteinfoldingissimplifiedtoproteincoiling:thecontinuumofsolenoidproteinstructures.trendsinbiochem.sci.25,509-515.lee,j.-h.,kang,e.,lee,j.,kim,j.,lee,k.h.,han,j.,kang,h.y.,ahn,s.,oh,y.,shin,d.,etal.(2014).proteingraftingofp53tadontoaleucinezipperscaffoldgeneratesapotenthdmdualinhibitor.nat.commun.5,3814.leshchiner,e.s.,parkhitko,a.,bird,g.h.,luccarelli,j.,bellairs,j.a.,escudero,s.,opoku-nsiah,k.,godes,m.,perrimon,n.,andwalensky,l.d.(2015).directinhibitionofoncogenickrasbyhydrocarbon-stapledsos1helices.proc.natl.acad.sci.u.s.a.112,1761–1766.longo,l.m.&blaber,m.(2014).symmetricproteinarchitectureinproteindesign:to-downsymmetricdeconstruction.methodsmol.biol.1216,161-82.lu,j.,qian,y.,altieri,m.,dong,h.,wang,j.,raina,k.,hines,j.,winkler,j.d.,crew,a.p.,coleman,k.,etal.(2015).hijackingthee3ubiquitinligasecereblontoefficientlytargetbrd4.chem.biol.22,755–763.margarit,s.m.,sondermann,h.,hall,b.e.,nagar,b.,hoelz,a.,pirruccello,m.,bar-sagi,d.,andkuriyan,j.(2003).structuralevidenceforfeedbackactivationbyras.gtpoftheras-specificnucleotideexchangefactorsos.cell112,685–695.meier,s.,guthe,s.,kiefhaber,t.andgrzesiek,s.(2004).foldon,thenaturaltrimerizationdomainoft4fibritin,dissociatesintoamonomerica-stateformcontainingastablebeta-hairpin:atomicdetailsoftrimerdissociationandlocalbeta-hairpinstabilityfromresidualdipolarcouplings.j.mol.biol344,1051-1069.parmeggiani,f.,huang,p.-s.,vorobiev,s.,xiao,r.,park,k.,caprari,s.,su,m.,seetharaman,j.,mao,l.,janjua,h.,montelione,g.t.,hunt,j.,baker,d.(2015)ageneralcomputationalapproachforrepeatproteindesign.j.mol.biol.427,563-575.rowling,p.j.,sivertssson,e.m.,perez-riba,a.,main,e.r.,itzhaki,l.s.(2015)biochem.soc.trans.43881-888.tamaskovic,r.,simon,stefan,n.,scwhill,pluckthun,a.(2012).designedankyrinrepeatproteins(darpins):fromresearchtotherapy.methodsinenzym.503,101-134.thompson,d.b.,cronican,j.j.,liu,d.r.(2012).engineeringandidentifyingsuperchargedproteinsformacromoleculedeliveryintomammaliancells.methodsenzymol.503,293-319.当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1