突变受体以及它们在基于核受体的诱导型基因表达系统中的应用的制作方法

文档序号:813997阅读:248来源:国知局
专利名称:突变受体以及它们在基于核受体的诱导型基因表达系统中的应用的制作方法
技术领域
本发明涉及生物技术或遗传工程领域。具体地,本发明涉及基因表达领域。更具体地,本发明涉及包含置换突变的新型核受体,和它们在基于核受体的诱导型基因表达系统中的应用,以及使用这种诱导型基因表达系统在宿主细胞内调节基因表达的方法。
背景技术
本文引用了各种公开物,它们的公开内容以其整体并入本文,作为参考。然而,本文中对任何文献的引用不应该解释为承认所引用的文献是相对于本申请的“现有技术”。在遗传工程领域,基因表达的精确控制对于研究、操纵和控制发育和其他生理过程而言是有价值的工具。基因表达是复杂的生物过程,涉及大量特定的蛋白质-蛋白质相互作用。引发基因表达,从而产生RNA,是蛋白合成所必需的第一步,为此,转录激活子必需被带到控制基因转录的启动子的附近。通常,转录激活子本身与具有至少一个DNA结合结构域的蛋白缔合,所述DNA结合结构域与存在于基因的启动子区域中的DNA结合位点结合。因此,为了使得基因表达发生,包含DNA结合结构域以及与该DNA结合域具有适当距离的反式激活结构域的蛋白必须被带入基因的启动子区域的正确位置。传统的转基因方法利用细胞型特异性的启动子来驱动设计的转基因的表达。含有该转基因的DNA构建物首先被整合入宿主基因组。当被转录激活子激发时,该转基因在给定的细胞类型中表达。在细胞中调控外来基因的表达的另一手段通过诱导型启动子进行。这样的诱导型启动子的应用例子包括PRl-a启动子、原核阻遏物-操纵子系统、免疫抑制-亲免素(immunophilin)系统和高等真核转录激活系统,例如蜕皮类固醇激素受体系统,下文对它们进行了描述。病原体攻击之后,来自烟草的PRl-a启动子在系统性获得性抗性应答期间得以诱导。因为PRl-a常常是对内源性物质和外部因素如病原体、UV-B辐射和污染物产生应答,所以PRl-a的应用可能受到限制。基于由热激、干扰素和重金属诱导的启动子的基因调控系统已被描述(Wurn et al.,1986,Proc. Natl. Acad. Sci.USA83:5414-5418 ;Arnheiter et al.,1990,Cell62:51-61 ;Filmus et al. , 1992, NucleicAcidsResearch20:27550-27560)。然而,由于这些系统对非目标基因的表达有影响,所以它们也有局限性。这些系统也是有遗漏性的。原核阻遏物-操纵子系统利用细菌阻遏蛋白和阻遏蛋白与之结合的独特操纵子DNA序列。大肠杆菌(Escherichia coli)细菌的四环素(“Tet”)和乳糖(“Lac”)阻遏物-操纵子系统已经用于植物和动物来控制基因表达。在Tet系统中,四环素结合TetR阻遏蛋白,导致构象变化,从而将该阻遏蛋白从操纵子上释放下来,其结果是允许发生转录。在Lac系统中,在对存在的乳糖或合成的类似物如异丙基_β -D-硫代半乳糖苷的应答中,Iac操纵子被激活。不幸的是,此类系统的应用受到配体即四环素和乳糖的不稳定的化学特性、它们的毒性、它们的天然存在性或者诱导或阻遏所需要的相对高的水平的限制。由于类似的原因,此类系统在动物中的应用受到限制。免疫抑制分子诸如FK506、雷帕霉素和环孢菌素A能够结合亲免素FKBP12、亲环素(cyclophilin)等。利用这些信息,已经设计出一般性的策略来使任何两个蛋白集合在一起,这仅仅是通过将FK506置于这两种蛋白的每一种上,或通过将FK506置于一个蛋白上而将环孢菌素A置于另一个蛋白上。合成的FK506同型二聚体(FK1012)或通过融合FK506-环孢菌素(FKCsA)而形成的化合物然后可以用于诱导这些分子的二聚体化(Spencer et al. , 1993, Science262:1019-24 ;Belshaw et al. , 1996Proc Natl Acad Sci USA93:4604-7)。与FKBP12融合的Gal4DNA结合结构域和与亲环素融合的VP16激活子结构域,以及FKCsA化合物被用于显示异源二聚作用和在含有Gal4结合位点的启动子的控制之下对报告基因的激活作用。不幸的是,该系统包括可能具有不期望的副作用的免疫抑制齐U,因此限制了其用于各种哺乳动物基因开关应用。高等真核生物转录激活系统例如类固醇激素受体系统也已得到应用。类固醇激素受体是核受体超家族的成员,发现于脊椎动物和无脊椎动物的细胞中。不幸的是,激活受体的类固醇化合物在调控基因表达中的应用特别是在植物和动物中的应用受到限制,原因是这些类固醇化合物在这些生物中参与许多其他的天然生物途径。为了克服这些困难,已经开发出了使用昆虫蜕皮素受体(EcR)的替代系统。昆虫的生长、蜕皮和发育受到蜕皮素类固醇激素(蜕皮激素)和保幼激素的调控(Dhadialla, et al. , 1998, Annu. Rev. Entomol. 43:545-569)。在昆虫中1 兑皮激素的分子革巴标至少由脱皮激素受体(EcR)和超气门蛋白(USP,ultraspiracle protein)组成。EcR是核类固醇受体超家族的成员,其特征为标志DNA(signature DNA)和配体结合结构域以及激活结构域(Koelle et al. 1991,Cell, 67:59-77)。EcR受体对许多蜕皮类固醇化合物,例如松甾酮(ponasterone)A和幕黎留酮(muristerone) A具有应答性。近来,已经描述了具有蜕皮类固醇激动剂活性的非固醇类化合物,包括商业上可获得的杀虫剂双苯酰肼和甲氧虫酰肼(methoxyfenozide),它们由Rohm and Haas Company在全球销售(参见国际专利申请PCT/EP96/00686和美国专利5,530, 028)。两种类似物对其他生物都是非常安全的。昆虫蜕皮激素受体(EcR)与哺乳动物RXR的昆虫同源物超气门(USP)形成异源二聚体,结合蜕皮类固醇和蜕皮激素受体应答元件,并激活蜕皮激素应答基因的转录(Riddiford et al. , 2000) 0 EcR/USP/配体复合物在昆虫发育和繁殖期间发挥重要作用。EcR是类固醇激素受体超家族的成员,具有五个模块结构域(modular domain), A/B(反式 激活)、C (DNA结合,异源二聚体化)、D (铰链,异源二聚体化)、E (配体结合,异源二聚体化和反式激活)以及F(反式激活)结构域。这些结构域中的一些例如A/B、C和E当与其他蛋白融合时保留它们的功能。紧密调控的诱导型基因表达系统或基因开关(“gene switchs”)可用于各种应用,如基因疗法、在细胞中大规模生产蛋白、基于细胞的高通量筛选分析、功能基因组学和调控转基因植物和动物的性状。第一种基于EcR的基因开关使用黑腹果蚬(Drosophila melanogaster)EcR(DmEcR)和小家鼠(Mus musculus) RXR(MmRXR),并且显示,在哺乳动物细胞系和转基因小鼠中这些受体在存在蜕皮类固醇,松留酮A的情况下反式激活报告基因(Christopherson et al., 1992; No et al.,1996)。后来,Suhr et al.,1998 显不,非 1 兑皮类固醇蜕皮激素激动剂,双苯酰肼,在哺乳动物细胞中通过家蚕(Bombyx mori) EcR(BmEcR),在不存在外源异源二聚体伴侣的情况下,高水平地诱导对报告基因的反式激活作用。国际专利申请 PCT/US97/05330(W097/38117)和 PCT/US99/08381 (W099/58155)公开了调节外源基因的表达的方法,其中,包含该外源基因和蜕皮激素应答元件的DNA构建物被包含蜕皮激素受体的第二 DNA构建物激活,蜕皮激素受体在其配体存在的情况下,和可选地在能够充当沉默伴侣的受体存在的情况下,与蜕皮激素应答元件结合,从而诱导基因表达。选择的蜕皮激素受体分离自黑腹果蝇。通常,此类系统需要存在有沉默伴侣,优选类视黄醇X受体(RXR),以便提供最佳的激活作用。在哺乳动物细胞中,昆虫蜕皮激素受体(EcR)与类视黄醇X受体(RXR)形成异源二聚体,并以配体依赖型方式调控目标基因的表达。国际专利申请PCT/US98/14215(W099/02683)公开了分离自蚕蛾家蚕的蜕皮激素受体在哺乳动物系统中具有功能,无需外源的二聚体伴侣。美国专利6,265,173 BI公开了类固醇/甲状腺受体超家族的各种成员能够与黑腹果蝇超气门受体(USP)或其包含至少USP的二聚化结构域的片段结合,用于基因表达系统。美国专利5,880,333公开了用于植物中的黑腹果蝇EcR和超气门(USP)异源二聚体系统,其中反式激活结构域和DNA结合结构域位于两个不同的杂合蛋白上。不幸的是,这些基于USP的系统在动物细胞中是组成型的,因此,对于调控报告基因表达是没有效果的。在这些例子中的每一个中,反式激活结构域和DNA结合结构域(或者如在国际专利申请PCT/US98/14215中的天然EcR,或者如在国际专利申请PCT/US97/05330中的修饰的EcR),被整合入单个的分子,其他的异源二聚体伴侣,USP或者RXR,则以它们天然的状态使用。上述基于EcR的基因调控系统的缺点包括,在不存在配体的情况下具有相当明显的背景活性,且不能将这些系统用于植物和动物(参见美国专利5,880,333)。因此,本技术领域需要改进的基于EcR的系统,以精确地调节外源基因在植物和动物中的表达。此种改进的系统将可以用于各种应用,如基因疗法、大规模生产蛋白和抗体、基于细胞的高通量筛选分析、功能基因组学和调节在转基因动物中的性状。对于某些应用例如基因疗法,具有诱导型基因表达系统可能是有利的,这些表达系统恰当地对合成的非蜕皮类固醇配体产生应答,同时对天然蜕皮类固醇不敏感。因此,改进的系统是简单的,缜密的,依赖于相对便宜的且容易获得的和对宿主毒性低的配体,它们将被证明可用于调控生物系统。之前,申请人已经说明了基于蜕皮激素受体的诱导型基因表达系统一其中通过将反式激活结构域和DNA结合结构域置于两个不同的蛋白上使得它们相互分开——导致在配体不存在的情况下背景活性大大减少,并且在配体存在的情况下相比背景其活性显著增加(在审申请PCT/US01/09050,其整体并入本文作为参考)。相比申请PCT/US97/05330和PCT/US98/14215中公开的两种系统,该双杂合系统是明显改进的诱导型基因表达调节系统。该双杂合系统利用了一对相互作用的蛋白将转录激活结构域带到相对于DNA结合结构域更为有利的位置的能力,这样,当DNA结合结构域结合到基因上的DNA结合位点时,反式激活结构域更有效地激活启动子(参见例如美国专利5,283,173)。简言之,该双杂合基因表达系统包含两个基因表达盒;第一个编码融合到核受体多肽的DNA结合结构域,第二个编码融合到不同的核受体多肽的反式激活结构域。在配体存在的情况下,第一多肽和第二多肽的相互作用有效地将DNA结合结构域束缚于反式激活结构域。因为DNA结合结构域和反式激活结构域位于两个不同的分子上,在配体不存在的情况下的背景活性大大降低。与蜕皮类固醇配体例如松甾酮A( “PonA”)或幕黎甾酮A( “MurA”)相比,双杂合系统对于非蜕皮类固醇配体例如二酰肼也具有改进的敏感性。也就是说,相比蜕皮类固醇,非蜕皮类固醇配体在较低浓度下提供较高的活性。此外,因为基于EcR基因开关的反式激活常常是细胞系依赖性的,所以更容易对开关系统进行调整,以针对每一应用获得最大的反式激活能力。而且,该双杂合系统避免了由于RXR的过表达引起的一些副作用,当未修饰的RXR用作开关伴侣时,经常发生RXR的过表达。在优选的双杂合系统中,EcR或RXR的天然DNA结合结构域和反式激活结构域被除掉,结果,这些杂交分子鲜有机会与存在于细胞 中的其他类固醇激素受体相互作用,从而减少了副作用。EcR是核受体超家族的成员,归为亚家族1,H组(在本文中称为“H组核受体(Group H nuclear receptor) ”)。在E (配体结合)结构域中,各组的成员共有40-60%的氨基酸同一性(Laudet et al. , A Unified Nomenclature System for the Nuclear ReceptorSubfamily, 1999;CelI 97:161-163)。除了蜕皮激素受体,该核受体亚家族1,H组的其他成员包括遍在受体(UR)、孤独受体I (0R-1)、类固醇激素核受体I (NER-I)、RXR相互作用蛋白-15(RIP-15)、肝脏X受体β (LXRi3)、类固醇激素受体样蛋白(RLD-I)、肝脏X受体(LXR)、肝脏X受体a (LXR α )、类法尼醇X受体(FXR)、受体相互作用蛋白14 (RIP-14)和法呢醇受体(HRR-I)。为了开发出改进的基于H组核受体的诱导型基因表达系统——其中配体结合性或配体特异性被改变,申请人创造了在配体结合结构域(LBD)中包含置换的氨基酸残基的置换突变型EcRs。同源建模和分子对接方法被用来预测介导蜕皮类固醇和非蜕皮类固醇与EcR LBD结合的关键残基。在配体结合和反式激活分析中评价这些置换突变型EcRs。如本文介绍,申请人的新型置换突变型核受体和它们在基于核受体的诱导型基因表达系统中的应用,提供了在原核和真核宿主细胞中的改进的诱导型基因表达系统,其中,如果需要,根据用途可以对配体灵敏性和反式激活的程度加以选择。发明详述申请人:在此描述了包含置换突变的H组核受体(本文称之为“置换突变体(substitution mutant) ” )的构建,所述突变发生在参与配体与H组核受体配体结合结构域的结合的氨基酸残基处,所述突变影响H组核受体的配体灵敏性和诱导程度,而且证明了这些置换突变型核受体在调节基因表达的方法中有用的。具体地,申请人已经开发出新型的基于核受体的诱导型基因表达系统,该系统包括含有置换突变的H组核受体配体结合结构域。申请人已经表明,这样的置换突变的作用可以增加或降低配体结合活性或配体敏感性,配体可以是蜕皮类固醇特异性的或非蜕皮类固醇特异性的。因此,申请人的发明提供了可用于调节感兴趣的基因在宿主细胞中的表达的基于H组核受体的诱导型基因表达系统。在特别有利的实施方案中,申请人的发明提供了基于蜕皮激素受体的诱导型基因表达系统,其仅仅对蜕皮类固醇配体或非蜕皮类固醇配体产生应答。此外,本发明也提供了改进的非蜕皮类固醇配体应答性的基于蜕皮激素受体的诱导型基因表达系统。因此,申请人的新型的诱导型基因表达系统和其在宿主细胞中调节基因表达的方法中的应用克服了现有诱导型表达系统的局限,并为技术人员提供了控制基因表达的有效手段。本发明可以用于各种用途中,如基因疗法、蛋白和抗体的大规模生产、基于细胞的高通量筛选分析、正交配体筛选分析、功能基因组学、蛋白质组学、代谢组学和在转基因生物中性状的调控,在这些情形中对基因表达水平进行控制是被期望的。申请人的发明的优点在于它提供了调控基因表达和调整表达水平以适应使用者的需要的手段。 定义在本公开中,使用了许多术语和缩写。下面提供了定义,应该有助于理解本发明的范围和实践。在具体的实施方案中,术语“大约”或“近似”是指在给定的值或范围的20%、优选10%、更优选5%和甚至更优选1%范围内。术语“基本上无”是指当组合物中按重量计约75%的蛋白、DNA、载体(取决于A和B所属的物质种类)是“A”时,包含“A” (其中“A”是单一的蛋白、DNA分子、载体、重组宿主细胞等)的该组合物基本上无“B”(其中“B”包括一种或多种污染蛋白、DNA分子、载体等)。优选地,按组合物中A+B物质的重量计算,“A”占至少约90%,最优选地按重量计算占至少约99%。而且,优选地,基本上无污染的组合物仅仅包含单一分子量的物质,该物质具有感兴趣的物质活性或特征。对于本发明的目的而言,术语“分离的”是指已从其原始环境(其自然存在的环境)中移出的生物物质(核酸或蛋白质)。例如,以自然状态存在于植物或动物中的多核苷酸不是分离的,然而,与其中自然存在的相邻核酸分离开的同样的多核苷酸被认为是“分离的”。术语“纯化的”并不要求该物质以绝对纯、不存在其他化合物的形式存在。它只是一个相对的定义。在将起始材料或天然材料纯化至少一个数量级、优选2或3个数量级,优选4或5个数量级之后,多核苷酸便为“纯化的”状态。“核酸”是由共价连接的称之为核苷酸的亚基组成的聚合化合物。核酸包括多核糖核酸(RNA)和多脱氧核糖核酸(DNA),两者都可以是单链或双链的。DNA包括但是不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。DNA可以是线性的、环状的或超螺旋的。“核酸分子”是指核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”),或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯聚合形式,或其任何磷酸酯类似物,如硫代磷酸酯和硫酯,其为或者单链形式或者双链螺旋。可以是双链DNA-DNA、DNA-RNA和RNA-RNA螺旋体。术语核酸分子,特别是DNA或RNA分子,仅指该分子的一级和二级结构,并不将之限于任何特定的三级结构形式。因此,该术语包括在线性或环状DNA分子(例如限制性片段)、质粒和染色体等中发现的双链DNA。在论述特定的双链DNA分子的结构时,序列可以根据常规惯例进行描述,仅给出沿着DNA的非转录链(S卩,与mRNA具有序列同源性的链)从5’至3’方向的序列。“重组DNA分子”是指经过分子生物学操作的DNA分子。术语“片段”将被理解为指长度比参考核酸短并且在共同部分包含与参考核酸相同的核苷酸序列的核苷酸序列。如果合适的话,根据本发明的这样的核酸片段可以被包含在更大的多核苷酸中,该片段是该更大的多核苷酸的组成成分。这样的片段包括长度在本发明的核酸的至少 6、8、9、10、12、15、18、20、21、22、23、24、25、30、39、40、42、45、48、50、51、54、57、60、63、66、70、75、78、80、90、100、105、120、135、150、200、300、500、720、900、1000 或1500个连续核苷酸范围内的寡核苷酸,或可选地由这样的寡核苷酸组成。如本文中使用地,“分离的核酸片段”是指单链或双链的RNA或DNA聚合物,可选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以包括cDNA、基因组DNA或合成的DNA中的一个或多个片段。“基因”是指编码多肽的核苷酸的装配物,包括cDNA和基因组DNA核酸。“基因”也 指表达特定蛋白或多肽的核酸片段,包括编码序列之前(5’非编码序列)和之后(3’非编码序列)的调控序列。“天然基因”是指天然发现的具有它自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因,其包含在天然条件下不在一起的调控序列和/或编码序列。因此,嵌合基因可以包含不同来源的调控序列和编码序列,或相同来源但以与天然发现的不同的方式排列的调控序列和编码序列。嵌合基因可以包括不同来源的编码序列,和/或不同来源的调控序列。“内源基因”是指在生物体的基因组中的天然位置的天然基因。“外来”基因或“异源”基因是指在正常情况下不在宿主生物体中的基因,而是通过基因转移导入宿主生物体的基因。外来基因可以包括插入到非天然生物中的天然基因或嵌合基因。“转基因”是通过转化程序被导入到基因组中的基因。“异源’DNA是指不是天然位于细胞或细胞染色体位点的DNA。优选地,异源DNA包括对该细胞而言为外来的基因。术语“基因组”包括染色体以及线粒体、叶绿体和病毒DNA或RNA。当在合适的温度和溶液离子强度条件下,单链形式的核酸分子能够与其他核酸分子退火,那么该核酸分子便与另一核酸分子如cDNA、基因组DNA或RNA是可杂交的(参见Sambrook et al.,1989infra)。杂交条件和洗漆条件是众所周知的,并在 Sambrook, J. , Fritsch, E. F.和 Maniatis,T.Molecular Cloning: A LaboratoryManual, Second Edition,Cold Spring Harbor Laboratory Press,Cold SpringHarbor (1989)中列举出,特别是在其中的第11章和表11. I (该文献整体并入本文作为参考)。温度和离子强度条件决定了杂交的“严格性”。可以调整严格性条件以筛选中等程度类似的片段例如来自关系远的生物的同源序列,至高度相似的片段例如来自关系近的生物的同样功能的酶的基因。对于同源核酸的初筛,可以使用低严格性的杂交条件,对应于55°C的Tm,例如5XSSC、0. 1%SDS、0. 25%牛奶,无甲酰胺;或30%甲酰胺、5XSSC、0. 5%SDS)。中度严格性杂交条件对应于较高的Tm,例如40%甲酰胺、5X或6XSCC。高度严格性杂交条件对应于最高的Tm,例如50%甲酰胺、5X或6 X SCC0杂交要求两条核酸含有互补序列,尽管取决于杂交的严格性,碱基之间还是可能会发生错配。术语“互补”被用于描述能够相互杂交的核苷酸碱基之间的关系。例如,对于DNA,腺嘌呤与胸腺嘧啶互补,胞嘧啶与鸟嘌呤互补。因此,本发明也包括与公开或使用于此的全序列以及那些基本上类似的核酸序列互补的分离的核酸片断。在本发明的特定实施方案中,通过使用包括Tm为55°C的杂交步骤的杂交条件并利用上述的条件,检测多核苷酸。在优选的实施方案中,! 为60°C,在更优选的实施方案中,Tm为63 °C,在更为优选的实施方案中,Tm为65V。杂交后的洗涤也决定严格性条件。一组优选的条件使用一系列的洗涤步骤以6XSSC、0. 5%SDS室温中进行15分钟起始,然后2 X SSC、0. 5%SDS在45°C进行30分钟,重复洗涤;然后O. 2XSSC、0. 5%SDS在50°C进行30分钟,重复两次。更优选的一组严格性条件使用更高的温度,其中洗涤步骤与上述步骤相同,除了在O. 2XSSC、0. 5%SDS中进行最后两次30分钟洗涤的温度增加到60°C。另一组优选的高严格性条件是在65°C,在O. I X SSC,
O.P/oSDS中进行最后2次洗涤。杂交要求两条核酸含有互补序列,尽管取决于杂交的严格性,碱基之间还是可能会错配。 使核酸杂交的合适的严格性取决于核酸的长度和互补程度,这些是本领域熟知的变量。两条核苷酸序列之间的相似性或同源性程度越大,具有那些序列的核酸杂合子的Tm值越大。核酸杂交的相对稳定性(对应于较高的Tm)按照下列次序降低RNA:RNA、DNA:RNA、DNA:DNAο对于长度大于100个核苷酸的杂合子,已经推导出计算Tm的公式(参见Sambrooket al.,supra, 9. 50-0. 51)。对于较短核酸即寡核苷酸的杂交,错配的位置变得更加重要,寡核苷酸的长度决定其特异性(参见Sambrook et al.,supra, 11. 7-11. 8)。在本发明特定的实施方案中,利用包括在小于500mM盐和至少37°C的杂交步骤以及在2X SSPE和至少63°C的洗涤步骤的杂交条件来检测多核苷酸。在优选的实施方案中,杂交条件包括小于200mM盐和至少37°C的杂交步骤。在更优选的实施方案中,杂交条件包括2 X SSPE和63°C的杂交和洗涤步骤。在一个实施方案中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸;更优选至少约20个核苷酸;最优选地长度为至少30个核苷酸。而且,技术人员将认识到,温度和洗涤溶液的盐浓度可以根据各种因素例如探针长度作必要的调整。术语“探针”是指单链核酸分子,其可以与互补的单链目标核酸进行碱基配对,形成双链分子。如在此所使用,术语“寡核苷酸”是指通常至少18个核苷酸的核酸,其可以与基因组DNA分子、cDNA分子、质粒DNA或mRNA分子杂交。寡核苷酸可以被标记,例如用32P-核苷酸或已经与标记物例如生物素共价偶联的核苷酸进行标记。标记的寡核苷酸可以用作探针来检测核酸的存在。寡核苷酸(其中之一或两者可以被标记)可以用作PCR引物,用于克隆全长核酸或核酸片段,或者用于检测核酸的存在。寡核苷酸也可以用于与DNA分子形成三螺旋。一般而言,寡核苷酸通过合成制得,优选在核酸合成仪上合成。因此,寡核苷酸可以用非天然存在的磷酸酯类似键例如硫酯键等制备。“引物”是指在合适的条件下与目标核酸序列杂交从而产生可以充当DNA合成起点的双链核酸区域的寡核苷酸。这样的引物可以用于聚合酶链式反应。“聚合酶链式反应”缩写为PCR,是指酶促扩增特定核酸序列的体外方法。PCR涉及一系列反复的温度循环,每一循环包括三个阶段对模板核酸变性以分开目标分子的链,将单链PCR寡核苷酸引物与模板核酸退火,用DNA聚合酶延伸退火的引物。PCR提供了检测目标分子存在与否的手段,并且在定量或半定量条件下,可以确定目标分子在原始核酸库中的相对数量。“逆转录-聚合酶链式反应”的缩写是RT-PCR,是指由RNA分子或多个RNA分子酶法产生目标cDNA分子或多个分子,然后如上所述酶法扩增目标cDNA分子或多个分子内的特定核酸序列或多个序列的体外方法。RT-PCR也提供了检测目标分子存在与否的手段,并且在定量或半定量条件下,可以确定目标分子在起始核酸库中的相对数量。DNA “编码序列”是双链DNA序列,该序列当置于合适的调控序列的控制下时在细 胞中以体外或体内的方式被转录并翻译成多肽。“合适的调控序列”是指位于编码序列的上游(5’非编码序列)、之内或下游(3’非编码序列)的核苷酸序列,它们影响相关联的编码序列的转录、RNA加工或稳定性或翻译。调控序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应物结合位点和茎-环结构。编码序列的边界由5’(氨基)端的起始密码子和3’(羧基)端的翻译终止密码子确定。编码序列可以包括但是不限于原核序列、mRNA产生的cDNA、基因组DNA序列、甚至合成的DNA序列。如果编码序列欲在真核细胞中表达,多腺苷酸化信号序列和转录终止序列通常将位于该编码序列的3’端。“开放阅读框”缩写为0RF,是指一定长度的核酸序列,其是DNA、cDNA或者RNA,包括翻译起始信号或起始密码子,例如ATG或AUG,和终止密码子,并且潜在地能够翻译成多肽序列。术语“头对头”在此被用于描述两条多核苷酸序列彼此之间的定向。当一条多核苷酸的编码链的5’端与另一条多核苷酸的编码链的5’端相邻时,这两条多核苷酸以头对头的方向定位,因此,各条多核苷酸的转录方向以远离另一条多核苷酸的5’端的方式进行。术语“头对头”可以缩写为(5’)_对_(5’),也可以用符号(一一)或(3’ 一 5’5’ 一 3’)表
/Jn ο术语“尾对尾”在此被用于描述两条多核苷酸序列彼此之间的定向。当一条多核苷酸的编码链的3’端与另一条多核苷酸的编码链的3’端相邻时,这两条多核苷酸以尾对尾的方向定位,因此,各条多核苷酸的转录方向朝着另一条多核苷酸的方向进行。术语“尾对尾”可以缩写为(3’)_对_(3’),也可以用符号(一一)或(5’ 一3’3’ 一5’)表示。术语“头对尾”在此被用于描述两条多核苷酸序列彼此之间的定向。当一条多核苷酸的编码链的5’端与另一条多核苷酸的编码链的3’端相邻时,这两条多核苷酸以头对尾的方向定位,因此,各条多核苷酸的转录方向以与另一条多核苷酸相同的方向进行。术语“头对尾”可以缩写为(5’)_对_(3’),也可以用符号(一一)或(5’ 一3’5’ 一3’)表示。术语“下游”是指位于参考核苷酸序列3’端的核苷酸序列。特别地,下游核苷酸序列通常涉及转录起始点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。术语“上游”是指位于参考核苷酸序列5’端的核苷酸序列。特别地,上游核苷酸通常涉及位于编码序列或转录起始点的5’侧的序列。例如,大部分的启动子位于转录起始位点的上游。术语“限制性核酸内切酶”和“限制性酶”是指结合并切割双链DNA内的特定核苷酸序列的酶。
“同源重组”是指将外来DNA序列插入另一 DNA分子,例如将载体插入染色体。优选地,载体靶向于特定的染色体位点进行同源重组。对于特异性的同源重组,载体将含有与染色体的序列同源的足够长的区域,以允许载体进行互补性结合并整合入染色体。较长的同源区域和较高的序列相似性程度,可以提高同源重组的效率。本领域已知的若干方法可以用于增殖本发明的多核苷酸。一旦建立合适的宿主系统和生长条件,可以定量增殖和制备重组表达载体。如在此所描述,可以使用的表达载体包括但是不限于下述载体或它们的衍生物人或动物病毒例如牛痘病毒或腺病毒;昆虫病毒例如杆状病毒;酵母载体;噬菌体载体(例如λ噬菌体载体)以及质粒和粘粒DNA载体,以这些为例。“载体”是指用于克隆核酸和/或将核酸转移入宿主细胞的任何工具。载体可以是另一 DNA片段可以连接到其上从而使得该被连接的片段可以被复制的复制子。“复制子”是指作为在体内的自主DNA复制单元而发挥功能,即能够在它自己的控制下进行复制的任何遗传元件(例如质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于体外、离体或体内 将核酸导入细胞的病毒和非病毒工具。本领域已知的大量载体可以被用于操作核酸、将应答元件和启动子整合入基因等。可能的载体包括例如质粒或修饰的病毒,包括例如细菌噬菌体,如λ衍生物,或质粒如pBR322或pUC质粒衍生物,或Bluescript载体。例如,通过将合适的DNA片段连接入具有互补粘性末端的选择载体,可以将对应于应答元件和启动子的DNA片段插入合适的载体中。可选择地,DNA分子的末端可以通过酶法修饰,或者可以通过将核苷酸序列(接头)连接到该DNA末端产生任何位点。这样的载体可以进行工程改造,以含有选择性标记基因,用于选择已经将该标记整合入细胞基因组的细胞。这样的标记允许鉴定和/或选择整合并表达由该标记编码的蛋白的宿主细胞。病毒载体,特别是逆转录病毒载体,已经在细胞以及活的动物对象中用于各种各样的基因传递应用中。可以使用的病毒载体包括但不限于逆转录病毒、腺相关病毒、痘病毒、杆状病毒、牛痘病毒、单纯疱疹病毒、EB病毒、腺病毒、双生病毒和花椰菜花叶病毒载体。非病毒载体包括质粒、脂质体、带电荷脂质(cytofectins)、DNA-蛋白质复合体和生物聚合物。除了核酸外,载体还可以包括一个或多个调控区域,和/或选择性标记,这些标记可用于选择、测定和监控核酸转移结果(转移到哪些组织,表达的持续时间等)。术语“质粒”是指额外的染色体元件,它们常常携带不是作为细胞的中心代谢的一部分的基因,并且常常是环状双链DNA分子的形式。这样的元件可以是来自任何来源的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,线性、环状或超螺旋的,单链或双链DNA或RNA,其中许多核苷酸序列已经被连接入或重组入独特的结构中,该结构能够将针对所选的基因产物的启动子片段和DNA序列以及合适的3’端非翻译序列导入细胞。“克隆载体”是“复制子”,为核酸优选DNA的单元长度,它按顺序复制,并包含复制起点,例如质粒、噬菌体或粘粒,其上可以连接另一核酸片段从而复制该被连接的片段。克隆载体可以具有在一种细胞类型中复制并在另一细胞类型中表达的能力(“穿梭载体”)。载体可以通过本领域已知的方法导入期望的宿主细胞,例如转染、电穿孔、微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白(参见例如 Wu et al·,1992,J. Biol. Chem. 267:963-967 ;Wu 和 Wu, 1988,J.Biol. Chem. 263:14621-14624 ;和 Hartmut et al.,1990 年 3 月 15 日提交的加拿大专利申请 2,012,311)。本发明的多核苷酸也可以通过脂转染体内导入。在过去10年中,使用脂质体体外包囊和转染核酸一直在增加。设计用来限制脂质体介导的转染所遇到的困难和危险的合成阳离子脂质,可以用于制备脂质体,用于体内转染编码标记的基因(Feigner etal. , 1987, Proc. Natl. Acad. Sci. U. S. A. 84: 7413 ;Mackey, et al. , 1988, Proc. Natl. Acad.Sci. U.S. A. 85:8027-8031 ;和 Ulmer et al.,1993,Science259:1745-1748)。使用阳离子脂质可以促进带负电荷的核酸的包囊,还可以促进与带负电的细胞膜的融合(Feigner andRingold, 1989,Science337:387-388)。国际专利出版物 TO95/18863 和 TO96/17823 以及美国专利5,459,127描述了可用于转移核酸的特别有用的脂质化合物和组合物。利用脂转染将外源基因体内导入特定的器官具有某些实践优点。脂质体对特定细胞的分子靶向代表了一个方面的益处。明显的是,针对特定的细胞类型进行转染在具有细胞异质性的组织例如胰腺、肝脏、肾脏和脑中将是特别优选的。脂质可以用化学的方法偶联到其他分子以用于靶向的目的(Mackey,et al.,1988,supra)。被靶向的肽例如激素或神经递质以及蛋白质例如抗体或非肽分子可以通过化学方法偶联到脂质体。
其他分子也可用于帮助进行核酸的体内转染,例如阳离子寡肽(例如W095/21931)、衍生自DNA结合蛋白的肽(例如W096/25508)或阳离子聚合物(例如W095/21931)。将载体作为裸DNA质粒体内导入也是可能的(参见美国专利5,693,622、5,589,466和5,580, 859)。也可以使用受体介导的DNA传递方法(Curiel etal.,1992,Hum. Gene Ther. 3:147-154 ;和 Wu 和 Wu, 1987,J. Biol. Chem. 262:4429-4432)。术语“转染”是指细胞摄取外源或异源RNA或DNA。当外源或异源RNA或DNA已被引入细胞内时,该细胞便被这样的RNA或DNA “转染”。当转染的RNA或DNA影响表型变化时,该细胞便被外源或异源RNA或DNA “转化”。转化RNA或DNA可以被整合入(共价连接入)构成细胞基因组的染色体DNA。“转化”是指将核酸片段转移入宿主生物的基因组,产生遗传上稳定的遗传。含有转化的核酸片段的宿主生物称为“转基因”或“重组”或“转化的”生物。术语“遗传区域”将指包含编码多肽的基因的核酸分子区域或核苷酸序列。此外,包含本发明的多核苷酸的重组载体可以包括一个或多个用于在细胞宿主中复制的起点(在该细胞宿主中多核苷酸的扩增或表达被谋求)、标记或选择性标记。术语“选择性标记”是指鉴定性因子,通常是抗生素或化学品抗性基因、比色标记、酶、荧光标记和类似物,其中抗性基因能够基于标记基因的效应,即对抗生素的抗性、对除草剂的抗性进行选择,其中,所述效应被用于追踪感兴趣的核酸的遗传性,和/或鉴定遗传有感兴趣的核酸的细胞或生物。本技术领域已知并被使用的选择性标记基因的例子包括提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨磷除草剂、磺胺和类似物的抗性的基因;用作表型标记的基因,即花色素苷调控基因、异戊烯转移酶基因和类似物。术语“报道基因”是指编码能够基于该报道基因的效应而被鉴定的鉴定性因子的核酸,其中所述效应被用于追踪感兴趣的核酸的遗传性,鉴定遗传有感兴趣的核酸的细胞或生物,和/或测定基因表达诱导或转录。本技术领域已知并被使用的报道基因的例子包括荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰基转移酶(CAT)、β_半乳糖苷酶(LacZ)、β-葡糖醛酸酶(Gus)和类似物。选择性标记基因也可以考虑用作报道基因。“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。一般而言,编码序列位于启动子序列的3’端。启动子可以整体源自天然基因,或由源自天然发现的不同启动子的不同元件组成,或甚至包括合 成的DNA片段。本领域技术人员应该理解的是,不同的启动子可以指导基因在不同的组织或细胞类型中,或在发育的不同阶段,或应答于不同的环境或生理条件进行表达。导致基因在大多数细胞类型中在大多数的时间被表达的启动子通常称为“组成型启动子”。导致基因在特定的细胞类型中被表达的启动子通常称为“细胞特异性启动子”或“组织特异性启动子”。导致基因在特定的发育或细胞分化阶段被表达的启动子通常称为“发育特异性启动子”或“细胞分化特异性启动子”。在将细胞暴露于诱导启动子的药剂、生物分子、化学品、配体、光或类似物,或用这些物质对细胞进行处理之后,被诱导并导致基因被表达的启动子通常被称为“诱导型启动子”或“调控型启动子”。还应该认识的是,因为在大多数情况下,调控序列的准确界限还没有完全限定,所以不同长度的DNA片段可能具有相同的启动子活性。“启动子序列”是能够结合细胞中RNA聚合酶,并启动下游(3’方向)编码序列的转录的DNA调控区域。为了定义本发明的目的,启动子序列的范围被界定为其3’端至转录起始位点,并向上游(5’方向)延伸,包括以高于背景的可检测水平启动转录所必需的最小数目的碱基或元件。在启动子序列内,将发现转录起始位点(该位点例如可以通过用核酸酶SI作图方便地确定)和负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。 当RNA聚合酶将编码序列转录成mRNA,然后mRNA进行反式RNA剪接(如果该编码序列含有内含子的话),并翻译成由该编码序列编码的蛋白时,该编码序列便在细胞中处于转录和翻译控制序列的“控制之下”。“转录和翻译控制序列”是DNA调控序列,例如启动子、增强子、终止子、和类似物,其使得编码序列能够在宿主细胞中表达。在真核细胞中,多腺苷酸化信号是控制序列。术语“应答元件”是指一个或多个顺式作用DNA元件,其赋予启动子通过与第一嵌合基因的DNA结合结构域的相互作用介导的应答性。该DNA元件可以在其序列中具有回文结构(精确的或不精确的),或由被可变数目的核苷酸隔开的序列基序或半位点组成。半位点可以是相似的或相同的,并以同向重复或反向重复排列,或以单个半位点或相邻半位点串联形成的多聚体排列。取决于应答元件将要被整合入的细胞或生物的属性,该应答元件可以包含分离自不同生物的最小的启动子。在配体存在或不存在的情况下,第一杂合蛋白的DNA结合结构域结合于应答元件的DNA序列,从而在该应答元件的调控下启动或抑制下游基因的转录。天然蜕皮激素受体的应答元件的DNA序列的例子包括RRGG/TTCANTGAC/ACYY(参见 Cherbas L. , et. al. , (1991), Genes Dev. 5, 120-131) ;AGGTCAN(n)AGGTCA,其中Νω可以是一个或多个间隔核苷酸(参见D’Avino PP. , et. al. , (1995), Mol.Cell. Endocrinol, 113,1-9);和 GGGTTGAATGAATTT (参见 Antoniewski C. , et. al. , (1994).Mol. Cell Biol.14,4465-4474)。术语“可操作性连接”是指核酸序列连接在单个核酸片段上,从而一条核酸序列的功能受到其他核酸序列的影响。例如,当启动子能够影响编码序列的表达时(即,编码序列在启动子的转录控制之下),则启动子可操作性地与编码序列连接。编码序列可以以有义或反义方向与调控序列可操作性地连接。
如本文中所用,术语“表达”是指衍生自核酸或多核苷酸的有义(mRNA)或反义RNA的转录和稳定积聚。表达也可以指mRNA翻译成蛋白或多肽。术语“盒”、“表达盒”和“基因表达盒”是指可以在特定的限制性位点或通过同源重组插入核酸或多核苷酸的DNA片段。DNA片段包含编码感兴趣的多肽的多核苷酸,该盒和限制性位点经过设计以确保能够将该盒插入正确的转录和翻译阅读框。“转化盒”是指包含编码感兴趣的多肽的多核苷酸并且除了所述多核苷酸外还具有帮助转化特定宿主细胞的元件的特定载体。本发明的盒、表达盒、基因表达盒和转化盒也可以包含增强编码感兴趣的多肽的多核苷酸在宿主细胞中的表达的元件。这些元件可以包括但不限于启动子、最小启动子、增强子、应答元件、终止子序列、多腺苷酸化序列和类似元件。对于本发明的目的,术语“基因开关”是指与启动子相关联的应答元件和基于 EcR的系统的组合,其在一种或多种配体存在的情况下,调节整合有该应答元件和启动子的基因的表达。术语“调节”是指诱导、减少或抑制核酸或基因表达,分别导致蛋白或多肽生产的诱导、减少或抑制。本发明的质粒或载体还可以包含适于驱使基因在宿主细胞中表达的至少一个启动子。术语“表达载体”是指被设计成使得插入的核酸序列在转化入宿主后能够表达的载体、质粒或媒介。克隆的基因,即,插入的核酸序列,通常被置于控制元件例如启动子、最小启动子、增强子或类似控制元件的控制之下。启动控制区域或启动子可用于驱使核酸在期望的宿主细胞中表达,它们数量众多,并且为本领域技术人员所熟悉。事实上,能够驱动这些基因的任何启动子都适合于本发明,包括但不限于病毒启动子、细菌启动子、动物启动子、哺乳动物启动子、合成启动子、组成型启动子、组织特异性启动子、发育特异性启动子、诱导型启动子、光调控启动子;CYC1、HIS3、GAL1、GAL4、GAL10、ADH1、PGK、PH05、GAPDH、ADC1、TRPU URA3、LEU2、ENO, TPI、碱性磷酸酶启动子(用于在酵母属(Saccharomyces)中的表达);A0X1启动子(用于在毕赤酵母(Pichia)中的表达);β -内酰胺酶、lac、aa、tet、trp、1PL> 1PE> T7、tac和c启动子(用于在大肠杆菌(Escherichia coli)中的表达);光调控的、种子特异性的、花粉特异性的、子房特异性的、发病机理或疾病相关的、花椰菜花叶病毒35S、CMV35S最小、木薯叶脉花叶病毒(CsVMV)、叶绿素a/b结合蛋白、核酮糖1,5- 二磷酸羧化酶、芽枝特异性的、根特异性的、几丁质酶、应激诱导型的、水稻东格鲁杆状病毒、植物超级启动子(plant super-promoter)、马铃薯亮氨酸氨肽酶、硝酸盐还原酶、甘露氨酸合成酶、胭脂氨酸合成酶、泛蛋白、玉米醇溶蛋白和花色苷启动子(用于在植物细胞中的表达);本领域已知的动物和哺乳动物启动子包括但不限于SV40早期(SV40e)启动子区域、包含在劳斯肉瘤病毒(RSV)的3’长末端重复(LTR)中的启动子、腺病毒(Ad)的ElA或主要晚期启动子(MLP)基因的启动子、巨细胞病毒(CMV)早期启动子、单纯疱疹病毒(HSV)胸苷激酶(TK)启动子、杆状病毒IEl启动子、延伸因子la (EFl)启动子、磷酸甘油酸激酶(PGK)启动子、泛蛋白(Ubc)启动子、白蛋白启动子、小鼠金属硫蛋白的调控序列L启动子和转录控制区、遍在启动子(HPRT、波形蛋白、a-肌动蛋白、微管蛋白和类似物)、中间纤维的启动子(结蛋白、神经纤丝蛋白、角蛋白、GFAP和类似物)、治疗性基因的启动子(MDR、CFTR或VIII类因子和类似物的启动子)、发病或疾病相关启动子,以及显示出组织特异性并已用于转基因动物的启动子,例如在胰腺腺泡细胞中具有活性的弹性蛋白酶I基因控制区;在胰腺β细胞中具有活性的胰岛素基因控制区;在淋巴细胞中具有活性的免疫球蛋白基因控制区;在睾丸、乳房、淋巴和肥大细胞中具有活性的小鼠乳腺肿瘤病毒控制区域;在肝脏中具有活性的白蛋白基因、Apo Al和Apo AII控制区;在肝脏中具有活性的α-甲胎蛋白基因控制区;在肝脏中具有活性的α I-抗胰蛋白酶基因控制区;在骨髓细胞中具有活性的β_球蛋白基因控制区;在脑的少突胶质细胞中具有活性的髓磷脂碱蛋白基因控制区;在骨骼肌中具有活性的肌球蛋白轻链-2基因控制区,以及在下丘脑中具有活性的促性腺激素释放激素基因控制区,丙酮酸激酶启动子,绒毛蛋白启动子,脂肪酸结合肠蛋白的启动子,平滑肌细胞α-肌动蛋白的启动子和类似物。此外,通过加入增强子或调控序列和类似物,这些表达序列可以被修饰。可以用于本发明的实施方案的增强子包括但不限于SV40增强子、巨细胞病毒(CMV)增强子、延伸因子I(EFl)增强子、酵母增强子、病毒基因增强子和类似物。终止控制区,S卩,终止子或多腺苷酸化序列,也可以来自对于优选的宿主而言为天然的各种基因。可选地,终止位点并非必需,然而,最优选的情况是包括终止位点。在本发明 优选的实施方案中,终止控制区域可以包括或来自合成序列、合成的多腺苷酸化信号、SV40晚期多腺苷酸化信号、SV40多腺苷酸化信号、牛生长激素(BGH)多腺苷酸化信号、病毒终止子序列或类似物。术语“3’非编码序列”或“3’非翻译区(UTR) ”是指位于编码序列下游(3’)的DNA序列,并且可以包含多腺苷酸化[多(A)]识别序列和编码能够影响mRNA加工或基因表达的调控信号的其他序列。多腺苷酸化信号通常是通过将多腺苷酸序列束加入到mRNA前体的3’末端来表征的。“调控区域”是指调控第二核酸序列的表达的核酸序列。调控区域可以包括在自然情况下负责表达特定核酸的序列(同源区域),或可以包括负责表达不同的蛋白或甚至合成蛋白的不同来源的序列(异源区域)。特别地,序列可以是以特异性或非特异性方式和以诱导型或非诱导型方式刺激或抑制基因转录的原核、真核或病毒基因序列或衍生的序列。调控区域包括复制起点、RNA剪接位点、启动子、增强子、转录终止序列和指导多肽进入目标细胞的分泌途径的信号序列。“异源来源”的调控区域是与被表达的核酸并不天然连接的调控区域。异源调控区域包括来自不同种的调控区域、来自不同基因的调节区域、杂合调控序列和在天然情况下并不存在而是由本领域普通技术人员设计出的调控区域。“RNA转录物”是指经RNA聚合酶催化由DNA序列转录而得的产物。当RNA转录物是DNA序列的精确互补的拷贝时,它被称为初级转录物,或者它可以是对初级转录物进行转录后加工所产生的RNA序列,这被称为成熟RNA。“信使RNA (mRNA) ”是指无内含子并可以被细胞翻译成蛋白的RNA。“cDNA”是指与mRNA互补并源自mRNA的双链DNA。“有义” RNA是指包括mRNA并因此可以被细胞翻译成蛋白的RNA转录物。“反义RNA”是指与目标初级转录物或mRNA的全部或部分互补并且阻断目标基因表达的RNA转录物。反义RNA的互补性可以在特定的基因转录物的任何部分,即,在5’非编码序列、3’非编码序列或编码序列。“功能RNA”是指反义RNA、核酶RNA或不被翻译但对细胞进程有影响的其他RNA。“多肽”是由共价连接的氨基酸残基组成的聚合化合物。氨基酸具有下述通用结构
H
I
wm2根据侧链R,氨基酸被分为七组(1)脂肪族侧链,(2)含有羟基(OR)基团的侧链,
(3)含有硫原子的侧链,(4)含有酸性基团或酰胺基团的侧链,(5)含有碱性基团的侧链,
(6)含有芳香环的侧链,和(7)脯氨酸,一种侧链与氨基基团稠合的亚氨酸。本发明的多肽优选包含至少大约14个氨基酸。“蛋白质”是在活细胞中发挥结构或功能作用的多肽。 “分离的多肽”或“分离的蛋白”是基本上没有那些在其天然状态下通常与其相随的化合物(例如,其他蛋白或多肽、核酸、碳水化合物、脂类)的多肽或蛋白。“分离的”并不旨在排除与其他化合物形成的人工或合成的混合物,或并不排除存在有不干扰生物活性以及例如因不彻底的纯化、加入稳定剂或混合形成药学上可接受的制剂而可能存在的杂质。将被理解的是,“置换突变多肽”或“置换突变体”是指与野生型或天然存在的多肽相比包含至少一个(I)野生型或天然存在的氨基酸用不同的氨基酸取代的突变多肽。置换突变多肽可以仅仅包含一个(I)野生型或天然存在的氨基酸置换,并可以称为“点突变”或“单点突变”多肽。作为选择,与野生型或天然存在的多肽相比,置换突变多肽可以包含两个
(2)或更多个野生型或天然存在的氨基酸用2个或更多个氨基酸进行的置换。根据本发明,与野生型或天然存在的H组核受体配体结合结构域多肽相比,包含置换突变的H组核受体配体结合结构域多肽包含至少一个(I)野生型或天然存在的氨基酸用不同的氨基酸进行的取代。在置换突变多肽包含两个(2)或更多个野生型或天然存在的氨基酸的置换时,一种情况是该置换可以对等同数量的删除的野生型或天然存在的氨基酸进行置换,即,2个野生型或天然存在的氨基酸用2个非野生型或非天然存在的氨基酸替换,另一种情况是对非等同数量的删除的野生型氨基酸进行置换,即,2个野生型氨基酸用I个非野生型氨基酸替换(置换+删除突变),或2个野生型氨基酸用3个非野生型氨基酸替换(置换+插入突变)。置换突变可以用缩写命名系统进行描述,以指出该氨基酸残基和在参考多肽序列中所处的编号以及新的置换的氨基酸残基。例如,多肽的第20个氨基酸残基被置换的置换突变体可以缩写为"x20z",其中"X"表示将被替换的氨基酸,"20"表示该氨基酸残基在多肽中的位置或编号,〃z〃表示新的替换的氨基酸。因此,缩写为"E20A"或〃Glu20Ala〃的置换突变体表示该突变体在多肽的位置20用丙氨酸残基(本技术领域通常缩写为"A"或"Ala")替换谷氨酸(本技术领域通常缩写为"E"或"Glu")。突变或突变体可以是任何改变,包括但不限于置换、删除、插入或其任何组合。可以用本领域已知的任何诱变技术进行置换突变,包括但不限于体外定点诱变(Hutchinson, C.,et al.,1978,J. Biol. Chem. 253 : 6551 ;Zoller 和Smith, 1984,DNA3:479-488 ;Oliphant et al.,1986,Gene44:177 ;Hutchinson etal.,1986,Proc. Natl. Acad. Sci. U. S. A. 83:710),使用 γαIi 接头(Pharmacia),限制性内切核酸酶消化/片段删除和置换,PCR介导的/寡核苷酸介导的诱变,和类似方法。定点诱变优选基于PCR的技术(参见Higuchi, 1989,"Using PCR to EngineerDNA〃,PCR Technology:Principles and Applications for DNA Amplification, H.Erlich, ed. , Stockton Press,第 6 章,第 61-70 页)。本发明的多肽的“片段”将理解为指氨基酸序列比参考多肽的氨基酸序列短的多肽,并且其在这些参考多肽的整个部分内,包含相同的氨基酸序列。如果合适的话,这样的片段可以被包括在更大的多肽内,而所述片段是该更大多肽的一部分。本发明多肽的这样的片段的长度可以为至少 2、3、4、5、6、8、10、13、14、15、16、17、18、19、20、21、22、25、26、30、35、40、45、50、100、200、240 或 300 个氨基酸。多肽或蛋白的“变体”是源自多肽或蛋白并保留该多肽或蛋白的至少一种生物学特性的任何类似物、片段、衍生物或突变体。多肽或蛋白的不同变体可以存在于自然界中。这些变体可以是由编码蛋白的结构基因的核苷酸序列中的差异表征的等位基因突变体,或可以涉及差异性剪接或翻译后修饰。技术人员可以制备具有单个或多个氨基酸置换、删除、添加或替代的变体。这些变体可以包括(a)其中一个或多个氨基酸残基被保守的或非保 守的氨基酸置换的变体;(b)其中一个或多个氨基酸被加入到多肽或蛋白的变体;(c)其中一个或多个氨基酸包括取代基团的变体;和(d)其中多肽或蛋白与另一多肽例如血清白蛋白融合的变体;等等。获得这些变体的技术是本领域普通技术人员所知晓的,包括遗传技术(抑制、剔除、突变等)、化学技术和酶技术。变体多肽优选包含至少大约14个氨基酸。“异源蛋白”是指并非细胞天然产生的蛋白。“成熟蛋白”是指翻译后加工得到的多肽,S卩,初级翻译产物中存在的任何前肽或肽原已从其中被去除的一种多肽。“前体”蛋白是指mRNA的初级翻译产物;即,前肽和肽原依然存在。前肽和肽原可以是但不限于胞内定位信号。术语“信号肽”是指分泌的成熟蛋白前面的氨基端多肽。信号肽与成熟蛋白割裂开,因此成熟蛋白中没有信号肽。信号肽具有将分泌的蛋白引导并转运通过细胞膜的功能。信号肽也称作信号蛋白。“信号序列”被包括在将被表达在细胞表面的蛋白的编码序列的开始位置。该序列编码成熟多肽的N-端的信号肽,信号肽指导宿主细胞转运多肽。术语“转运信号序列”在此用来指代这类信号序列。可以发现转运信号序列与真核和原核细胞中天然的各种蛋白相连,并常常在两类生物中具有功能。术语“同源性”是指两个多核苷酸或两个多肽部分之间的同一性百分比。利用本领域已知的技术可以测定一个部分与另一部分的序列之间的一致性。例如,通过比对序列信息并使用容易获取的计算机程序,对两个多肽分子之间的序列信息直接进行比较,可以确定同源性。作为选择,通过在同源区域之间形成稳定的双链体的条件下对多核苷酸进行杂交,然后用单链特异性核酸酶消化并测定消化的片段的大小,可以确定同源性。如在此所使用,术语“同源”所有的语法形式和拼写变化形式是指拥有“共同进化起源”的蛋白之间的关系,包括来自超家族(例如免疫球蛋白超家族)的蛋白和来自不同种的同源蛋白(例如肌球蛋白轻链等)(Reeck et al.,1987,Cell50:667.)。这样的蛋白(和它们的编码基因)具有序列同源性,正如它们高度的序列相似性所反映。然而,在通常的用法和本申请中,当用副词例如“高度的”来修饰术语“同源”时,该术语可以指序列相似性而不是共同的进化起源。
因此,术语“序列相似性”所有的语法形式是指可以或不必享有共同进化起源的蛋白的核酸或氨基酸序列之间的同一性或一致性程度(参见Reeck et al.,1987,Cell50:667)。在特定的实施方案中,当在限定长度的DNA序列范围内有至少大约50%(优选至少大约75%、最优选地至少大约90或95%)的核苷酸匹配时,这两个DNA序列“实质上同源”或“实质上相似”。通过使用可从序列数据库中获取的标准软件进行序列比较,或在例如针对特定系统所限定的严格条件下进行的Southern杂交试验中,可以鉴定基本上同源的序列。限定合适的杂交条件是在本领域的技术范围之内。参见Sambrook et al.,1989,supra。如本文所使用地,术语“实质上相似”是指这样的核酸片段,其中一个或多个核苷酸碱基的变化导致一个或多个氨基酸的置换,但是并不影响由该DNA序列编码的蛋白的功能特性。“实质上相似”同样指这样的核酸片段,其中一个或多个核苷酸碱基的变化并不影响该核酸片段通过反义或共抑制技术介导改变基因表达的能力。“实质上相似”也指对本发 明的核酸片段进行的修饰,例如删除或插入一个或多个核苷酸碱基,这并不实质上影响到所得转录物的功能特性。因此可以理解的是,本发明所包含的不仅仅是这些特定的示例性序列。各种提议的修饰都完全在本领域的常规技术的范围内,测定被编码的产物的生物学活性的保留也是如此。此外,技术人员认识到本发明所包含的实质上相似的序列也由它们在严格条件(O. 1XSSC,0. 1%SDS,65°C 和用 2 X SSC, O. 1%SDS 洗涤,再用 O. I X SSC, O. 1%SDS 洗涤)下与在此示例的序列的杂交能力来限定。本发明的实质上相似的核酸片段是那些其DNA序列与在此报告的核酸片段的DNA序列具有至少70%同一性的核酸片段。本发明的优选的实质上相似的核酸片段是那些其DNA序列与在此报告的核酸片段的DNA序列具有至少80%同一性的核酸片段。更优选的核酸片段与在此报告的核酸片段的DNA序列具有至少90%同一性。甚至更优选的是与在此报告的核酸片段的DNA序列具有至少95%同一性的核酸片段。当大约40%以上的氨基酸相同,或60%以上氨基酸相似(功能上相同)时,这两个氨基酸序列“实质上同源”或“实质上相似”。优选地,通过使用例如GCG(Genetics ComputerGroup, Program Manual for the GCG Package, Version 7,Madison, Wisconsin)pileup 程序进行比对,鉴定相似或同源的序列。术语“对应于”用于本文是指相似的或同源的序列,无论该确切的位置与同其进行相似性或同源性测量的分子相同或不同。核酸或氨基酸序列比对可以包括空位。因此,术语“对应于”是指序列相似性,而不是氨基酸残基或核苷酸碱基的编号。氨基酸或核苷酸序列的“实质部分”包括多肽足够的氨基酸序列或基因足够的核苷酸序列,从而足以推测性地鉴定那个多肽或基因,这通过本领域技术人员对序列进行手工评价来进行,或者通过使用算法诸如BLAST (Basic Local Alignment Search Tool ;Altschul, S. F. , et al. , (1993) J. Mol. Biol. 215:403-410 ;也参见www. ncbi. nlm. nih. gov/BLAST/)进行计算机自动化序列比较和鉴定来进行。一般而言,为了推测性地鉴定与已知的蛋白或基因同源的多肽或核酸序列,10个或更多个连续氨基酸或30个或更多个核苷酸的序列是必需的。而且,对于核苷酸序列,包含20-30个连续核苷酸的基因特异性寡核苷酸探针可以用于序列依赖性的基因鉴定方法(例如Southern杂交)和基因分离方法(例如细菌菌落或噬菌体噬菌斑的原位杂交)。此外,12-15个碱基的短的寡核苷酸可以用作PCR的扩增引物 ,以便获得包含所述引物的特定核酸片段。因此,核苷酸序列的“实质部分”包含足够的序列,足以特异性地鉴定和/或分离包含该序列的核酸片段。如本领域所知道的,术语“同一性百分比”是指两条或更多多肽序列之间或两条或更多多核苷酸序列之间的关系,正如通过比较序列所确定的。在该技术领域,“同一性”也指多肽或多核苷酸序列之间的序列相关性程度,这种情况时,可以通过这些序列的链之间的匹配来测定。“同一性”和“相似性”可以用已知的方法容易地计算,包括但不限于描述于下述文献中的方法Computational Molecular Biology (Lesk, A. Μ. , ed. ) Oxford UniversityPress, New York(1988) ;Biocomputing:Informatics and Genome Projects(Smith, D.ff. ,ed. ) Academic Press, New York(1993) ;Computer Analysis of Sequence Data, PartI(Griffin, A. M.和 Griffin, H. G.,eds. ) Humana Press, New Jersey (1994) ;SequenceAnalysis in Molecular Biology(vonHeinje, G. , ed. ) Academic Press (1987);和Sequence Analysis Primer(Gribskov, M.和 Devereux, J.,eds. ) Stockton Press, NewYork(1991) 0测定同一性的优选方法被设计以便得到测试序列之间的最佳匹配。测定同一性和相似性的方法编入公开可获得的计算机程序中。可以应用LASERGENE bioinformaticscomputing suite 的Megalign 程序(DNASTAR Inc. ,Madison, WI)进行序列比对并计算同一性百分比。可以应用带有默认参数(GAP PENALTY= I O, GAP LENGTH PENALTY= 10)的Clustal比对方法(Higgins和Sharp (1989) CABIOS. 5:151-153)进行多序列比对。使用Clustal方法的配对比对的默认参数可以被选择KTUPLE1,GAP PENALTY=3, WIND0ff=5和DIAGONALSSAVED=50术语“序列分析软件”是指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可以通过商业途经获得或独立开发。典型的序列分析软件将包括但不限于GCG程序组(Wisconsin Package Version9.0,Genetics Computer Group (GCG),Madison, WI)、BLASTP, BLASTN, BLASTX (Altschulet al.,J. Mol. Biol. 215:403-410 (1990)和 DNASTAR(DNASTAR,Inc. 1228S.ParkSt. Madison, WI53715USA)。在本申请的上下文中,应该理解,当序列分析软件用于分析时,分析的结果将基于所参考的程序的“默认值”,除非另外指出。如本文中所使用的,“默认值”指当第一次预置时软件最初加载的任何一组值或参数。“合成基因”可以由使用本领域技术人员已知的程序化学合成的寡核苷酸构建模块装配而成。这些构建模块被连接起来并退火,从而形成基因片段,然后将基因片段酶法装配以构建整个基因。“化学合成”,当涉及DNA序列时,是指核苷酸组分在体外被装配。使用充分建立的程序可以完成DNA的人工化学合成,或者使用许多商业上可得的机器中的一种可以进行自动化化学合成。因此,基于为了反映出宿主细胞的密码子偏爱性的核苷酸序列优化,基因可以被修改以获得最佳的基因表达。如果使密码子使用偏向于宿主所喜好的那些密码子,技术人员将有可能成功地进行基因表达。基于对来自序列信息可获得的宿主细胞的基因的调查,可以确定优选的密码子。如本文所使用,当a)给定的系统中的每一个系统被其各自的配体以选定的浓度调节,导致该系统的基因的表达程度发生可测量的变化;和b)不论实际进行的调节是同时进行还是顺序进行,所述变化在统计学上与在细胞、组织或生物体中同时可操作的所有其他系统的表达变化明显不同时,这两个或更多个分别可操作的基因调控系统便认为是“正交的”。优选地,对各个可操作的基因调控系统的调节产生比在细胞、组织或生物体中的所有其他可操作的系统大至少2倍的基因表达变化。更优选地,变化为至少5倍以上。甚至更优选地,变化为至少10倍以上。还有更优选地,变化为至少100倍以上。甚至还有更优选地,变化为至少500倍以上。理想地,每一个给定的系统被选定浓度的各自的配体调节,导致该系统的基因的表达程度发生可测量的变化,而在细胞、组织或生物体中可操作的所有其他系统的表达没有可测量的变化。在这样的情况下,该多重诱导型基因调控系统可以认为是“完全正交的”。本发明可用于搜索正交配体和基于正交受体的基因表达系统,诸如在共同在审的美国专利申请09/965,697中所描述的那些,该申请整体并入本文作为参考。本发明的基因表达调节系统申请人:在此已经鉴定了参与配体与H组核受体配体结合结构域结合的氨基酸残基,所述氨基酸残基影响配体敏感性和基于蜕皮激素受体的诱导型基因表达系统的诱导程度。申请人在此描述了在这些关键残基处包含置换突变(本文称为“置换突变体”)的H组核受体的构建,并且证明了这些置换突变核受体可用于调节基因表达的方法。如本文所呈现,申请人的新型置换突变核受体和它们在基于核受体的诱导型基因表达系统中的应用,在原核和真核宿主细胞中提供了改进的诱导型基因表达系统,在其中,如果需要,根据用途,可以对配体敏感性和反式激活的程度加以选择。因此,本发明涉及新型的置换突变型H组核受体多核苷酸和多肽、包含这样的突变的H组核受体多核苷酸和多肽的基于核受体的诱导型基因表达系统,以及使用这样的基于核受体的诱导型基因表达系统在宿主细胞中调控基因表达的方法。特别地,本发明涉及包含至少一个基因表达盒的基因表达调节系统,该基因表达盒能够在宿主细胞中被表达,包括编码多肽的多核苷酸,所述多肽包括含有置换突变的H组核受体配体结合结构域。优选地,包含置换突变的H组核受体配体结合结构域来自蜕皮激素受体、遍在受体、孤独受体I、NER-1、类固醇激素核受体I、类视黄醇X受体相互作用蛋 白-15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、类法尼醇X受体、受体相互作用蛋白14和法呢醇受体。更优选地,包含置换突变的H组核受体配体结合结构域来自蜕皮激素受体。在特定的实施方案中,基因表达调节系统包含基因表达盒,该基因表达盒包含编码多肽的多核苷酸,所述多肽包括反式激活结构域,识别应答元件的DNA结合结构域,所述应答元件与其表达待被调节的基因相连接;以及含有置换突变的H组核受体配体结合结构域。基因表达调节系统还可以包括第二基因表达盒,包括i)被第一基因表达盒的被编码多肽的DNA结合结构域识别的应答元件;ii)被第一基因表达盒的被编码多肽的反式激活结构域激活的启动子;和iii)其表达待被调节的基因。在另一特定的实施方案中,基因表达调节系统包括基因表达盒,该表达盒包含a)编码多肽的多核苷酸,所述多肽包含反式激活结构域、识别应答元件的DNA结合结构域,所述应答元件与其表达待被调节的基因连接;所述多肽还包含含有置换突变的H组核受体配体结合结构域,和b)第二核受体配体结合结构域,选自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域、超气门蛋白配体结合结构域和包含两个多肽片段的嵌合配体结合结构域,其中第一多肽片段来自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域,第二多肽片段来自不同的脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域。基因表达调节系统还可以包括第二基因表达盒,包含i)被第一基因表达盒的被编码多肽的DNA结合结构域识别的应答元件;ii)被第一基因表达盒的被编码多肽的反式激活结构域激活的启动子;和iii)其表达待被调节的基因。在另一特定的实施方案中,基因表达调节系统包含第一基因表达盒和第二基因表达盒,第一基因表达盒包含编码第一多肽的多核苷酸,所述第一多肽包含识别应答兀件的DNA结合结构域和核受体配体结合结构域,所述应答元件与其表达待被调节的基因连接,第二基因·表达盒包含编码第二多肽的多核苷酸,所述第二多肽包含反式激活结构域和核受体配体结合结构域,其中,核受体配体结合结构域中的一个是包含置换突变的H组核受体配体结合结构域。在优选的实施方案中,第一多肽基本上无反式激活结构域,第二多肽基本上无DNA结合结构域。对于本发明的目的,“基本上无”指讨论中的蛋白不含有足够的讨论中的结构域的序列,以赋予激活或结合活性。基因表达调节系统还可以包括第三基因表达盒,包含i)被第一基因表达盒的第一多肽的DNA-结合结构域识别的应答元件;ii)被第二基因表达盒的第二多肽的反式激活结构域激活的启动子;和iii)其表达待被调节的基因。当只有一个核受体配体结合结构域是包含置换突变的H组配体结合结构域时,另一个核受体配体结合结构域可以来自任何其他的核受体,其与包含置换突变的H组配体结合结构域形成二聚体。例如,当包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域时,另一个核受体配体结合结构域(“伴侣”)可以来自蜕皮激素受体、脊椎动物类视黄醇X受体(RXR)、无脊椎动物RXR、超气门蛋白(USP),或包含至少两个不同的核受体配体结合结构域多肽片段的嵌合核受体,所述多肽片段选自脊椎动物RXR、无脊椎动物RXR和RXR(参见共同在审专利申请PCT/US01/09050、US60/294, 814和US60/294,819,在此整体引入作为参考)。“伴侣”核受体配体结合结构域还可以包括截短突变、剔除突变、置换突变或其他修饰。优选地,脊椎动物RXR配体结合结构域来自人Homo sapiens、小家鼠Musmusculus、褐家鼠 Rattus norvegicus、原鸡 Gallus gallus、猪 Sus scrofa domestica、非洲爪蟾 Xenopus laevis、斑马鱼 Danio rerio、被囊动物 Polyandrocarpa misakiensis 或7jC母 Tripedalia cysophora RXR0优选地,无脊椎动物RXR配体结合结构域来自飞幢Locusta migratoria RXR多妝(〃LmRXR〃)、美洲花蝶 Amblyomma americanum RXR 同源物 I (〃AmaRXRl〃)、美洲花蝶Amblyomma americanum RXR 同源物 2 ("AmaRXRZ")、招潮蟹 Celuca pugilator RXR 同源物("CpRXR〃)、甲虫黄粉虫 Tenebrio moIitor RXR 同源物(〃TmRXR〃)、蜜蜂 Apis melliferaRXR同源物("AmRXR")、桃蚜Myzus persicae RXR同源物("MpRXR")、或非-双翅昆虫/非-鳞翅昆虫RXR同源物。优选地,嵌合RXR配体结合结构域包括至少两个多肽片段,选自脊椎动物种RXR多肽片段、无脊椎动物种RXR多肽片段和非双翅昆虫/非鳞翅昆虫无脊椎动物种RXR同源多肽片段。用于本发明的嵌合RXR配体结合结构域可以包括至少两个不同的物种的RXR多肽片段,或当物种相同的时候,这两个或更多个多肽片段可以来自该物种RXR多肽片段的两个或更多个不同的同种型。
在优选的实施方案中,嵌合RXR配体结合结构域包含至少一个脊椎动物种RXR多肽片段和一个无脊椎动物种RXR多肽片段。在更优选的实施方案中,嵌合RXR配体结合结构域包含至少一个脊椎动物种RXR多肽片段和一个非双翅昆虫/非鳞翅昆虫无脊椎动物种RXR同源物多肽片段。在特定的实施方案中,其表达待被调节的基因是宿主细胞的同源基因。在另一特定的实施方案中,其表达待被调节的基因是宿主细胞的异源基因。如下所述的用于本发明的配体与核受体的配体结合结构域组合,核受体又结合到与基因连接的应答元件,这时便提供了对基因的表达进行外部临时调控的手段。本发明的各种成分相互结合的结合机制或顺序,即,例如,配体与配体结合结构域、DNA结合结构域与应答元件、反式激活结构域与启动子等的结合机制或顺序等,并不是关键的。在特定的例子中,配体与H组核受体的配体结合结构域和它的核受体配体结合结 构域伴侣的结合使得能够进行基因的表达或抑制。该机制并不排除配体结合H组核受体(GHNR)或它的伴侣和形成活性同源二聚体复合体的可能(例如GHNR+GHNR或伴侣+伴侣)。优选地,受体结构域中的一个或多个是可变的,从而产生杂合基因开关。典型地,DBD、LBD和反式激活结构域这三个结构域中的一个或多个可以选自与其他结构域的来源不同的来源,以便优化杂合基因和所得到的杂合蛋白在所选择的宿主细胞或生物中的反式激活活性、配体互补结合性和特定应答元件的识别。此外,应答元件本身可以进行修饰,或者用其他DNA结合蛋白结构域的应答元件或合成的应答元件替换,以适应杂合受体,所述其他的DNA结合蛋白例如酵母的 GAL-4 蛋白(参见 Sadowski, et al. (1988), Nature, 335:563-564)或大肠杆菌的LexA蛋白(参见Brent和Ptashne (1985),Cell, 43:729-736),而所述合成的应答元件对与经过设计、修饰和选择以进行特异性相互作用的蛋白的目标相互作用具有特异性(参见例如 Kim, et al. (1997),Proc. Natl. Acad. Sci.,USA, 94:3616-3620)。双杂合系统的另一优点是它们允许根据期望的最终结果对用于驱动基因表达的启动子进行选择。这样的双重控制在基因疗法领域,特别当产生的是毒性蛋白时特别重要,这是因为可以对表达的时机以及发生表达的细胞进行控制。当可操作性地连接到合适的启动子的基因被导入对象的细胞时,借助于本发明的系统的存在,该外源基因的表达得以控制。启动子可以以组成型或诱导型的方式被调控,或者可以是组织特异性的(即,仅在特定的细胞类型中表达)或对生物体的某些发育阶段具有特异性。蜕皮激素受体是核受体超家族的成员,归入亚家族1,H组(本文称为“H组核受体”)。每一组的成员在E(配体结合)结构域中享有40-60%的氨基酸同一性(Laudetet al. , A Unified Nomenclature System for the Nuclear Resceptor Subfamily,1999 ;Cell97:161-163)。除了蜕皮激素受体,该核受体亚家族1,H组的其他成员包括遍在受体(UR)、孤独受体I (0R-1)、类固醇激素核受体I (NER-I)、类视黄醇X受体相互作用蛋白-15(RIP-15)、肝脏X受体β (LXRi3)、类固醇激素受体样蛋白(RLD-I)、肝脏X受体(LXR)、肝脏X受体a (LXR α )、类法呢醇X受体(FXR)、受体相互作用蛋白14 (RIP-14)和法呢醇受体(HRR-I)。申请人:已经开发了 CfEcR同源模型,并已经应用这个同源模型与公开的Chironomous tetans 脱皮激素受体(“CtEcR”)同源模型(ffurtz et al. , 2000)来鉴定参与结合蜕皮类固醇和非蜕皮类固醇的关键残基。已经显示,合成的非蜕皮类固醇、二酰肼以高亲和力结合鳞翅类EcRs,并诱导这些昆虫发生早熟性不完全蜕皮(Wing et al.,1988),这些化合物中的一些目前作为杀虫剂出售。EcRs的配体结合腔(cavity)或“袋(pocket)”已经进化以配合蜕皮类固醇例如20-羟基蜕皮激素(20E)的长主架结构。与蜕皮类固醇相t匕,二酰肼具有紧密的结构,仅仅占据EcR结合袋的底部部分。这使得结合袋的顶部具有一些关键残基,它们与蜕皮类固醇而不与非蜕皮类固醇例如二酰肼接触。申请人在此描述了在这些结合袋残基处包含有置换突变的突变型 蜕皮激素受体的构建,并已经鉴定了若干类具有改变的配体结合特征和反式激活特征的置换突变蜕皮激素受体。考虑到蜕皮激素受体与其他H组核受体的密切相关性,申请人鉴定的蜕皮激6素受体配体结合结构域置换突变在被导入其他H组核受体的配体结合结构域的类似位置以修改它们的配体结合性或配体敏感性时,也有望发挥作用。使用本技术领域常规的方法例如序列分析、通过同源建模和结合分析来分析结合袋的方法,本领域技术人员能够鉴定出序列和功能上的类似氨基酸位置。申请人的新型的置换突变H组核受体多核苷酸和多肽可用于基于核受体的诱导型基因调节系统,用于各种应用中,包括基因治疗、在宿主细胞中表达感兴趣的蛋白、产生转基因生物以及基于细胞的分析。特别地,申请人在此描述了新型的基因表达调节系统,该系统包括含有置换突变的H组核受体配体结合结构域。该基因表达系统可以是基于“单开关”的基因表达系统,其中反式激活结构域、DNA结合结构域和配体结合结构域在一个编码多肽上。可选择地,基因表达调节系统可以是基于“双开关”或“双杂合”的基因表达调节系统,其中反式激活结构域、DNA结合结构域位于两个不同的编码多肽上。申请人已经首次证明了,置换突变的核受体可以在原核和真核细胞中用作基于核受体的诱导型基因表达系统的成分,以改变配体结合活性和/或配体特异性。如上所述,申请人的发现是意想不到而且令人惊奇的。本发明的基于蜕皮激素受体的基因表达调节系统可以是异源二聚体或同源二聚体。功能EcR复合体通常指异源二聚体蛋白复合体,由类固醇受体家族的两个成员组成,它们是获自各种昆虫的蜕皮激素受体蛋白和超气门(USP)蛋白或USP的脊椎动物同源物,类视黄醇 X 受体蛋白(参见 Yao,et al. (1993)Nature366:476-479 ;Yao, et al. , (1992)Cell71:63-72)。然而,复合体也可以是下面详细描述的同源二聚体。功能性蜕皮类固醇受体复合体也可以包括额外的蛋白例如亲免素。类固醇受体蛋白质家族的其他成员,称为转录因子(例如DHR38或β FTZ-1),也可以是EcR、USP和/或RXR的配体依赖型或非配体依赖型的伴侣。此外,可以需要其他的辅因子,例如通常称为辅激活物(也称为适体或介体)的蛋白质。这些蛋白并不以序列特异性的方式结合DNA,也不参与基础转录。它们可以通过各种机制对转录激活施加它们的影响,包括通过影响染色质结构,或通过介导激活物-起始复合体相互作用,来刺激激活物的DNA结合。这样的辅激活物的例子包括RIP140、TIFl、RAP46/Bag-1、ARA70、SRC-l/NCoA-l、TIF2/GRIP/NCoA_2、ACTR/AIBl/RAC3/pCIP,以及乏主辅激活物C应答元件B结合蛋白、CBP/p300(参见综述Glass et al. , Curr. Opin.Cell Biol. 9:222-232, 1997)。而且,可能需要通常称为辅阻遏物(也称为阻遏物、沉默子或沉默介体)的蛋白辅因子,以便在不存在配体的情况下有效地抑制转录激活。这些辅阻遏蛋白可以与未配体化的蜕皮激素受体相互作用,以沉默对应答元件的活性。目前的证据显示,与配体的结合改变了受体的构象,这导致辅阻遏物的释放和上述辅激活物的招募,从而废止它们的沉默活性。辅阻遏物的例子包括N-CoR和SMRT (参见综述Horwitz et al. MolEndocrinol. 10:1167-1177, 1996)。这些辅因子在细胞或生物中可以是内源性的,或者可以作为将以调控或非调控的方式被表达的转基因外源性地加入。在一些环境中,蜕皮激素受体蛋白、USP或RXR的同型二聚体复合物也可以发挥功能。蜕皮激素受体复合体典型地包括核受体超家族成员的蛋白,其中超家族中的所有成员的一般特征是存在氨基端的反式激活结构域、DNA结合结构域(“DBD”)和通过铰链区与DBD隔开的配体结合结构域(“LBD”)。如在此所使用,术语“DNA结合结构域”包括DNA结合蛋白的最小的多肽序列,至全长的DNA结合蛋白,只要该DNA结合域具有与特定应答元件缔合的功能即可。核受体超家族的成员也被表征为存在四个或五个结构域:A/B、C、D、E,在一些成员中存在 F (参见美国专利 4,981,784 和 Evans, Science240:889-895 (1988))。〃A/B"结构域对应于反式激活结构域,〃C"对应于DNA结合结构域,"D"对应于铰链区,"E〃对应于配体结合结构域。该家族的一些成员也可能在LBD的羧基末端一侧具有另一反式激活结构域,即对应于"F"。DBD的特征是存在两个半胱氨酸锌指结构,在它们之间是两个氨基酸基序,P-box 和D-box,其赋予了对蜕皮激素应答元件的特异性。这些结构域可以是天然的、经修饰的,或异源的受体蛋白的不同结构域的嵌合物。如同类固醇受体家族的亚群,EcR受体也拥有负责异源二聚化特性的尚未充分限定的区域。因为核受体的结构域在天然状态下是模块化的,所以LBD、DBD和反式激活结构域可以相互变换。整合有来自蜕皮激素受体复合体的成分的基因开关系统是已知的。然而,在这些已知的系统中,凡是使用EcR的时候,它都是在同一个分子上与天然的或修饰的DNA结合结构域和反式激活结构域连接。USP或RXR通常用作沉默伴侣。申请人之前已经说明,当DNA结合结构域和反式激活结构域在同一个分子上时,在没有配体时具有高的背景活性,也说明了当DNA结合结构域和反式激活结构域在不同的分子上,即分别在异型二聚体或同型二聚体复合物的各个伴侣上时,这样的背景活性显著降低(参见PCT/US01/09050)。本发明的基因表达盒本发明的新型的基于核受体的诱导型基因表达系统包含至少一个基因表达盒,该基因表达盒能够在宿主细胞中被表达,其中该基因表达盒包含编码多肽的多核苷酸,所述多肽包括含有置换突变的H组核受体配体结合结构域。因此,申请人的发明也提供了用于本发明的基因表达系统的新型基因表达盒。在一个特定的实施方案中,能够在宿主细胞中表达的基因表达盒包含编码多肽的多核苷酸,所述多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的H组核受体配体结合结构域的多肽山)包含DNA结合结构域和含有置换突变的H组核受体配体结合结构域的多肽;c)包含反式激活结构域和含有置换突变的H组核受体配体结合结构域的多肽。在另一特定的实施方案中,本发明提供了能够在宿主细胞中表达的基因表达盒,其中该基因表达盒包含编码杂合多肽的多核苷酸,所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的H组核受体配体结合结构域的杂合多肽;b)包含DNA结合结构域和含有置换突变的H组核受体配体结合结构域的杂合多肽;和c)包含反式激活结构域和含有置换突变的H组核受体配体结合结构域的杂合多肽。本发明的杂合多肽包含至少两个多肽片段,其中每个多肽片段来自不同的来源,即,不同的多肽、不同的核受体、不同的物种等。本发明的杂合多肽包含至少两个多肽结构域,其中每个多肽结构域来自不同的来源。在特定的实施方案中,含有置换突变的H组核受体配体结合结构域来自蜕皮激素受体、遍在受体、孤独受体I、NER-1、类固醇激素核受体I、类视黄醇X受体相互作用蛋白-15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、类法呢醇X受体、受体相互作用蛋白14和法呢醇受体。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。因此,本发明也提供了包含编码多肽的多核苷酸的基因表达盒,所述多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的多肽;b)包含DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的多肽;和
c)包含反式激活结构域和含有置换突变的蜕皮激素受体配体结合结构域的多肽。优选地,该基因表达盒包含编码杂合多肽的多核苷酸,所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的杂合多肽;b)包含DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的杂合多肽;和c)包含反式激活结构域和含有置换突变的蜕皮激素受体配体结合结构域的杂合多肽,其中被编码的杂合多肽包含至少两个多肽片段,其中每个多肽片段来自不同的来源。蜕皮激素受体(EcR)配体结合结构域(LBD)可以来自无脊椎动物EcR,优选地选自节肢动物纲的EcR。优选地,EcR选自鳞翅类EcR、双翅类EcR、直翅类EcR、同翅类EcR和半翅类EcR。更优选地,用于本发明的EcR配体结合结构域来自云杉蚜虫云杉色卷蛾(Choristoneura fumiferana) EcR(〃CfEcR〃)、甲虫黄粉虫(Tenebrio molitor)EcR("TmEcR")、烟草天蛾(Manduca sexta) EcR("MsEcR")、Heliothies virescensEcR("HvEcR")、摇蚊(Chironomus tentans) EcR("CtEcR")、香蛾家香(Bombyx mori)EcR("BmEcR")、斜视小眉眼蝶(squinting bush brown)Bicyclus anynana EcR("BanEcR")、buckeye Junonia coenia EcR(〃JcEcR〃)、果蚬黑腹果蚬 EcR(〃DmEcR〃)、蚊子埃及伊蚊(Aedes aegypti) EcR("AaEcR")、HH 妮 Lucilia capitata("LcEcR")、HH 妮 Luciliacuprina EcR("LucEcR")、 HH 妮 Calliphora viciniaEcR("CvEcR")、地中海果妮Ceratitis capitata EcR(〃CcEcR〃)、虫皇虫 Locusta migratoriaEcR(〃LmEcR〃)、虫牙虫 Myzuspersicae EcR("MpEcR")、招潮蟹 Celuca pugiIatorEcR("CpEcR")、美洲花蝶(Amblyommaamericanum) EcR(〃AmaEcR〃)、白粉風 Bamecia argentifoli EcR(〃BaEcR〃)或叶 !单Nephotetix cincticeps EcR("NcEcR")。更优选地,LBD 来自 CfEcR、DmEcR 或 AmaEcR。在特定的实施方案中,LBD来自截短的EcR多肽。EcR多肽的截短导致删除了至少
1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、I15、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260 或 265 个氨基酸。优选地,EcR 多肽的截短导致删除了多肽结构域的至少一部分。更优选地,EcR多肽的截短导致删除了至少一个完整的多肽结构域。在特定的实施方案中,EcR多肽的截短导致删除了至少Α/B结构域、C结构域、D结构域、F结构域、A/B/C结构域、A/B/1/2-C结构域、A/B/C/D结构域、A/B/C/D/F结构域、A/B/F结构域、A/B/C/F结构域、部分E结构域或部分F结构域。也可以组合删除若干完整和/或部分结构域。
在特定的实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致置换a) SEQ ID勵1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 或 238 ;b)SEQ ID NO: I 的氨基酸残基 96 和 119 ;
c)SEQ ID NO: I的氨基酸残基110和128 ;d) SEQ ID NO: I的氨基酸残基52和110 ;e) SEQID NO: I的氨基酸残基107、110和127 ;或f) SEQ ID NO: I氨基酸残基52、107和127。在另一实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致SEQ ID NO: I的氨基酸残基107和127的置换和氨基酸259的插入。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致下述的置换a)等同于或类似于SEQ ID NO: I的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基;b)等同于或类似于SEQ ID NO: I的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基;c)等
同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸54的位置置换以色氨酸或苏氨酸;e)等同于或类似于SEQ ID NO: I的氨基酸92的位置置换以亮氨酸或谷氨酸;f)等同于或类似于SEQ ID NO: I的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基;h)等同于或类似于SEQ ID NO: I的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺;i)等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基;j)等同于或类似于SEQ IDNO: I的氨基酸119的位置置换以苯丙氨酸;k)等同于或类似于SEQ ID NO: I的氨基酸120的位置置换以色氨酸或蛋氨酸;1)等同于或类似于SEQ ID NO: I的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸;m)等同于或类似于SEQ ID NO: I的氨基酸128的位置置换以苯丙氨酸;n)等同于或类似于SEQ ID NO: I的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸;ο)等同于或类似于SEQ ID NO: I的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基;P)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基;q)等同于或类似于SEQID NO: I的氨基酸234的位置置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸;r)等同于或类似于SEQ ID NO: I的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸;s)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸96的位置置换以苏氨酸;t)等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸128的位置上置换以苯丙氨酸残基;u)等同于或类似于SEQ ID NO: I的氨基酸52的位置置换以缬氨酸残基和等同于或类似于SEQID NO: I的氨基酸110的位置置换以脯氨酸残基;v)等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基;或《)等同于或类似于SEQ IDNO: I的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO: I的氨基酸52的位置置换以缬氨酸残基。在另一实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基,和在等同于或类似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。在特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域,所述结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致产生选自下列的置换突变SEQ ID勵1上发生的?48¥44814481^448队F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、 W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V 和 V107I/Y127E/A1IOP置换突变。在另一特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域,所述结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致产生置换突变SEQ ID N0:1的V107I/Y127E,其进一步包括插入突变SEQ IDNO: I 的 G259(V107I/Y127E/G259)。在另一特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域多肽,所述结构域多肽由在杂交条件下与包含密码子突变的多核苷酸杂交的多核苷酸编码,所述密码子突变导致产生选自下述的置换突变SEQ ID NO: I 上发生的 F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、Al 10E、Al ION、Al 10W、NI 19F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P.V107I/Y127E/T52V 和 V107I/Y127E/A110P,所述杂交条件包括在少于 500mM 盐和至少37°C中的杂交步骤,和在2XSSPE、至少63°C的洗涤步骤。在优选的实施方案中,杂交条件包括小于200mM盐和至少37°C的杂交步骤。在另一优选实施方案中,杂交条件包括2 X SSPE和63°C的杂交和洗涤步骤。在另一特定的实施方案中,H组核受体配体结合结构域包含置换突变,置换突变的位置等同于或类似于a) SEQ ID NO: I的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 或 238 ;b)SEQ IDNO: I 的氨基酸残基 96 和 119 ;c)SEQ IDNO: I的氨基酸残基110和128 ;d) SEQ IDNO: I的氨基酸残基52和110 ;e)SEQ ID NO: I的氨基酸残基107、110和127 ;或f) SEQ ID NO: I的氨基酸残基52、107和127。在另一实施方案中,H组核受体配体结合结构域包括等同于或类似于SEQ ID NO: I的氨基酸残基107和127的位置的置换突变和氨基酸残基259位置的插入突变。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。
优选地,H组核受体配体结合结构域包括下述置换a)等同于或类似于SEQIDNO: I的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基山)等同于或类似于SEQ ID NO: I的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸54的位置置换以色氨酸或苏氨酸残基;e)等同于或类似于SEQ ID N0:1的氨基酸92的位置置换以亮氨酸或谷氨酸残基;f)等同于或类似于SEQ ID NO: I的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基;h)等同于或类似于SEQ ID NO: I的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺;i)等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基;j)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸残基;k)等同于或类似于SEQID NO: I的氨基酸120的位置置换以色氨酸或蛋氨酸残基;I)等同于或类似于SEQ ID NO: I的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸残基;m)等同于或类似于SEQ ID NO: I的氨基酸128的 位置置换以苯丙氨酸残基;n)等同于或类似于SEQ ID NO: I的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸残基;ο)等同于或类似于SEQ ID NO: I的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基;P)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基;q)等同于或类似于SEQ ID NO: I的氨基酸234的位置上置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸残基;r)等同于或类似于SEQ ID NO: I的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸残基;s)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸残基和等同于或类似于SEQID NO: I的氨基酸96的位置置换以苏氨酸;t)等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸128的位置置换以苯丙氨酸残基;u)等同于或类似于SEQ ID NO: I的氨基酸52的位置置换以缬氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基;v)等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基;或4等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸52的位置置换以缬氨酸残基。在另一实施方案中,H组核受体配体结合结构域包括在等同于或类似于SEQ ID NO: I的氨基酸107的位置置换异亮氨酸残基、在等同于或类似于SEQ ID NO: I的氨基酸127的位置置换谷氨酸残基,和在等同于或类似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域多肽,其中所述置换突变选自SEQ IDN0:1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、AllON、AllOW、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、T52V/A110P、V128F/A110P、V107I/Y127E/T125V和V107I/Y127E/A110P置换突变。在另一实施方案中,包含置换突变的H组核受体配体结合结构域是包含SEQ ID N0:1中的置换突变V107I/Y127E的蜕皮激素受体配体结合结构域多肽,其进一步包括插入突变SEQ ID N0:1中的G259(V107I/Y127E/G259)。DNA结合结构域可以是已知的应答元件的任何DNA结合结构域,包括合成的和嵌合的DNA结合结构域,或其类似物、组合或修饰。优选地,DBD是GAL4DBD、LexA DBD、转录因子DBD、H组核受体成员DBD、类固醇/甲状腺激素核受体超家族成员DBD或细菌LacZ DBD0更优选地,DBD 是 EcR DBD [SEQ IDN0:4(多核苷酸)或 SEQ ID NO: 5 (多肽)]、GAL4DBD [SEQID NO: 6 (多核苷酸)或 SEQ ID N0:7(多肽)]或 LexA DBD [(SEQ ID NO: 8 (多核苷酸)或SEQ ID N0:9(多肽))。 反式激活结构域(缩写为〃AD〃或"TA")可以是任何H组核受体成员AD、类固醇/甲状腺激素核受体AD、合成或嵌合AD、多谷氨酰胺AD、碱性或酸性氨基酸AD、VP16AD、GAL4AD.NF- κ B AD、BP64AD、B42酸性激活结构域(B42AD)、p65反式激活结构域(p65AD)或其类似物、组合或修饰。在特定的实施方案中,AD是合成的或嵌合的AD,或获自EcR、糖皮质激素受体、VP16、GAL4、NF- κ B或B42酸性激活结构域AD。优选地,AD是EcRAD [SEQ IDNO: 10 (多核苷酸)或 SEQID N0:11(多肽)]、VP16AD[SEQ ID NO: 12 (多核苷酸)或 SEQ IDN0:13(多肽)]、B42AD[SEQ ID NO: 14 (多核苷酸)或 SEQ ID 勵15(多肽)]或 p65AD[SEQIDNO: 16 (多核苷酸)或 SEQ ID N0:17(多肽)]。在特定的实施方案中,基因表达盒编码杂合多肽,该杂合多肽包含a]由包含SEQID NO:4, SEQ ID N0:6或SEQ ID N0:8的核酸序列的多核苷酸编码的DNA结合结构域,或
b]由包含 SEQ ID NO: 10,SEQ ID NO: 12,SEQ ID NO: 14 或 SEQID NO: 16 的核酸序列的多核苷酸编码的反式激活结构域;以及包含由本发明的多核苷酸编码的置换突变的H组核受体配体结合结构域。优选地,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域,其由本发明的多核苷酸编码。在另一特定的实施方案中,基因表达盒编码杂合多肽,该杂合多肽包含a)包含SEQ ID NO:5, SEQ ID N0:7或SEQ ID NO:9的氨基酸序列的DNA结合结构域;或b)包含SEQ ID NO: 11、EQ ID NO: 13、SEQ ID NO: 15 或 SEQ ID NO: 17 的氨基酸序列的反式激活结构域;和本发明的包含置换突变的H组核受体配体结合结构域。优选地,包含置换突变的H组核受体配体结合结构域是包含本发明的置换突变的蜕皮激素受体配体结合结构域。本发明也提供了基因表达盒,该基因表达盒包括i)应答元件,其含有被包含DNA结合结构域的多肽识别的区域;ii)启动子,其被包含反式激活结构域的多肽激活;和iii)基因,其表达待被调节。应答元件(“RE”)可以是已知的DNA结合结构域的任何应答元件或其类似物、组合或修改。在本发明中可以利用单个RE,或可以使用多个RE,其或者是相同RE的多个拷贝,或者是两个或更多个不同的RE。在特定的实施方案中,RE是来自GAL4的RE( “GAL4RE”)、LexA, H组核受体RE、类固醇/甲状腺激素核受体RE或识别合成的DNA结合结构域的合成RE。优选地,RE是包含SEQ IDNO: 18的多核苷酸序列的蜕皮激素应答元件(EcRE)、包含SEQID NO: 19的多核苷酸序列的GAL4RE或包含SEQ ID NO:20的多核苷酸序列的LexA RE(操纵子,“op”) ( “2XlexAopRE”)。本发明的类固醇/甲状腺激素核受体DNA结合结构域、激活结构域或应答元件可以获自类固醇/甲状腺激素核受体,其选自甲状腺激素受体a (TRci )、甲状腺受体l(c-erbA-l)、甲状腺激素受体β (TR3)、视黄酸受体a (RARa )、视黄酸受体β (RAR β,HAP)、视黄酸受体Y (RAR Y)、视黄酸受体Y-样(RARD)、过氧化物酶体增殖物激活受体ct (PPARa )、过氧化物酶体增殖物激活受体β (PPAR0 )、过氧化物酶体增殖物激活受体S (PPARS,NUC-1)、过氧化物酶体增殖物激活相关受体(FFAR)、过氧化物酶体增殖物激活受体Y (PPARY)、由甲状腺激素受体α的非编码链编码的孤独受体(REVERBa )、v-erb A相关受体(EAR-1)、v-erb相关受体(EAR-IA),Y)、由甲状腺激素受体β的非编码链编码的孤独受体(REVERB β )、v-erb相关受体(EAR-1 β )、孤独核受体BD73 (BD73)、rev-erbA相关受体(RVR)、锌指蛋白126 (HZF2)、蜕皮激素诱导蛋白E75 (E75)、蜕皮激素诱 导蛋白E78(E78)、果蝇受体78(DR_78)、类视黄醇相关孤独受体a (RORa)、类视黄醇Z受体a (RZRa )、类视黄醇相关孤独受体β (R0Rβ )、类视黄醇Z受体β (RZRβ )、类视黄醇相关孤独受体Y (R0R Y )、类视黄醇Z受体Y (RZR Y )、类视黄醇相关孤独受体(TOR)、激素受体3(HR-3)、果蝇激素受体3(DHR-3)、天娥(Manduca)激素受体(MHR-3)、螟(Galleria)激素受体 3(GHR-3)、线虫(C. elegans)核受体 3 (CNR-3)、卷蛾(Choristoneura)激素受体3(CHR-3)、线虫核受体14(CNR-14)、蜕皮激素受体(ECR)、遍在受体(UR)、孤独核受体(0R-1)、NER-1、受体相互作用蛋白15(RIP-15)、肝脏X受体β (LXRi3)、类固醇激素受体样蛋白(RLD-I)、肝脏X受体(LXR)、肝脏X受体a (LXR α )、类法呢醇X受体(FXR)、受体相互作用蛋白14(RIP-14)、HRR-I、维生素D受体(VDR)、孤独核受体(0NR-1)、孕烷X受体(PXR)、类固醇和异生素受体(SXR)、甲苯酸盐X受体(BXR)、核受体(MB-67)、组成型雄烷受体I (CAR-I)、组成型雄烷受体a (CARa )、组成型雄烷受体2 (CAR-2)、组成型雄烷受体β (CAR^)、果蝇激素受体96(DHR-96)、核激素受体I (NHR-I)、肝细胞核因子4 (HNF-4)、肝细胞核因子4G(HNF-4G)、肝细胞核因子4B (HNF-4B)、肝细胞核因子4D (HNF-4D, DHNF-4)、类视黄醇X受体a (RXRa)、类视黄醇X受体β (RXR^)、Η-2区域II结合蛋白(H-2RIIBP)、核受体辅调蛋白-I (RCoR-I)、类视黄醇X受体Y (RXR Y)、超气门(USP)、2C1核受体、绒毛膜因子I (CF-I)、睾丸受体2(TR-2)、睾丸受体2-11 (TR2-11)、睾丸受体4(TR4)、TAK-I、果蝇激素受体(DHR78)、Tailless (TLL)、tailless同源物(TLX)、XTLL、鸡卵蛋白上游启动子转录因子I (COUP-TFI)、鸡卵蛋白上游启动子转录因子A(COUP-TFA)、EAR-3、SVP-44、鸡卵蛋白上游启动子转录因子II (C0UP-TFII)、鸡卵蛋白上游启动子转录因子B(COUP-TFB)、ARP-1, SVP-40、SVP、鸡卵蛋白上游启动子转录因子III (C0UP-TFIII)、鸡卵蛋白上游启动子转录因子G(COUP-TFG)、SVP-46、EAR-2、雌激素受体a (ERa )、雌激素受体β (ER0 )、雌激素相关受体I (ERRl)、雌激素相关受体a (ERRa )、雌激素相关受体2(ERR2)、雌激素相关受体β (ERR β)、糖皮质激素受体(GR)、盐皮质激素受体(MR)、孕酮受体(PR)、雄激素受体(AR)、神经生长因子诱导基因B(NGFI-B)、与Nur-77类似的核受体(TRS)、N10、孤独受体(NUR-77)、人类早期应答基因(NAK-I)、Nurr相关因子I (NURR-I)、人类即时早期应答基因(NOT)、再生肝核受体I (RNR-I)、造血锌指3 (HZF-3) ,Nur相关蛋白-I (TINOR)、核孤独受体I (NOR-1)、NORl相关受体(MINOR)、果蝇激素受体38 (DHR-38)、线虫核受体8 (CNR-8)、C48D5、类固醇生成因子I (SFl)、endozepine样肽(ELP)、果蝇ftz因子I (FTZ-Fl)、肾上腺4结合蛋白(AD4BP)、肝受体同源物(LRH-I)、Ftz-Fl-相关孤独受体A (xFFrA)、Ftz-Fl-相关孤独受体B(xFFrB)、与LRH-I相关的核受体(FFLR)、与LRH-I相关的核受体(PHR)、甲胎蛋白转录因子(FTF)、生殖细胞核因子(GCNFM)、类视黄醇受体相关睾丸关联受体(RTR)、knirps (KNI)、knirps相关(KNRL)、胚胎生殖腺(EGON)、配体依赖型核受体的果蝇基因(EAGLE)、与trithorax (三胸腔)类似的核受体(0DR7)、Trithorax、剂量敏感型性别逆转肾上腺发育不全先天性关键区域染色体X基因(DAX-I)、肾上腺发育不全先天性和促性腺激素分泌不足性性腺机能减退(AHCH)和短杂二聚体伴侣(SHP)。对于本发明的目的,核受体和H组核受体也包括合成的和嵌合的核受体和H组核受体以及它们的类似物。用于申请人的基因表达盒的感兴趣的基因可以是内源性基因或异源性基因。期望的基因或蛋白的核酸或氨基酸序列信息可以从众多公共数据库中的一个数据库中查找,例 如GENBANK、EMBL、Swiss-Prot和PIR,或从众多生物学相关期刊出版物查找。因此,本领域技术人员能够获得实质上所有已知基因的核酸序列信息。然后此信息可以用于构建期望的构建物,从而将感兴趣的基因插入到在此描述的申请人方法所使用的基因表达盒中。用于申请人的基因表达盒的感兴趣的基因的例子但是包括但不限于编码治疗上有益的多肽或产物的基因,所述多肽或产物可以用于治疗病症、疾病、紊乱、功能障碍、遗传缺陷,例如单克隆抗体、酶、蛋白酶、细胞因子、干扰素、胰岛素、促红细胞生成素、凝血因子、其他血液因子或成分,用于基因治疗的病毒载体、用于疫苗的病毒、药物开发的靶标、功能基因组学和蛋白质组学分析和应用,等等。本发明的多核苷酸本发明的新型的基于核受体的诱导型基因表达系统包含至少一个基因表达盒,该基因表达盒包含编码含有置换突变的H组核受体配体结合结构域的多核苷酸。这些基因表达盒、它们包含的多核苷酸和它们编码的多肽,可用作基于核受体的基因表达系统的成分,以在宿主细胞内调节基因的表达。因此,本发明提供了编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸。在特定的实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致在下述位置的氨基酸残基的置换,所述位置等同于或类似于a)SEQ ID NO: I 的氨基酸残基 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238 ;b)SEQ ID NO: I的氨基酸残基96和119 ;c) SEQ ID NO: I的氨基酸残基110和128 ;d) SEQ ID NO: I的氨基酸残基52和110 ;e) SEQ ID NO: I的氨基酸残基107、110和127;或f)SEQ ID NO: I的氨基酸残基52、107和127。在另一实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致在等同于或类似于SEQIDNO: I的氨基酸残基107和127的位置的置换和氨基酸259的插入。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致下列置换a)等同于或类似于SEQ ID NO: I的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基;b)等同于或类似于SEQ ID NO: I的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸54的位置置换以色氨酸或苏氨酸;e)等同于或类似于SEQ ID NO: I的氨基酸92的位置置换以亮氨酸或谷氨酸;f)等同于或类似于SEQ ID NO: I的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基;h)等同于或类似于SEQ ID NO: I的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺;i)等同于或类似于SEQ ID ΝΟ:1的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基;j)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸;k)等同于或类似于SEQ IDNO: I的氨基酸120的位置置换以色氨酸或蛋氨酸;1)等同于或类似于SEQ ID NO: I的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸;m)等同于或类似于SEQ ID NO: I的氨基酸128的位置置换以苯丙氨酸;n)等同于或类似于SEQ ID NO: I的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸;o)等同于或类似于SEQ ID NO: I的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸 残基;P)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基;q)等同于或类似于SEQID NO: I的氨基酸234的位置置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸;r)等同于或类似于SEQ ID NO: I的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸;s)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸96的位置上置换以苏氨酸;t)等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸和等同于或类似于SEQ IDNO: I的氨基酸128的位置置换以苯丙氨酸;u)等同于或类似于SEQID NO: I的氨基酸52的位置上置换以缬氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基;v)等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸;或w)等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO: I的氨基酸52的位置置换以缬氨酸。在另一实施方案中,H组核受体配体结合结构域由包含密码子突变的多核苷酸编码,所述密码子突变导致在等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基,和在等同于或类似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域,其由包含密码子突变的多核苷酸编码,所述密码子突变产生选自如下的置换突变SEQ ID NO: I的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、Al10E、AllON、AllOW、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V 和 V107I/YI27E/A110P置换突变。在另一实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域,其由包含密码子突变的多核苷酸编码,所述密码子突变导致产生置换突变SEQ ID N0:1的V107I/Y127E,其进一步包括插入突变SEQ ID NO: I的 G259 (V107I/Y127E/G259)。
在另一特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域,其由在杂交条件下与含有密码子突变的多核苷酸杂交的多核苷酸编码,所述密码子突变产生置换突变,所述置换突变选自SEQ ID NO: I的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、AllON、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P,所述杂交条件包括在小于500mM盐和至少37°C的杂交步骤,和在2 X SSPE、至少63 °C的洗涤步骤。在优选的实施方案中,杂交条件包括小于200mM盐和至少37°C的杂交步骤。在另一优选实施方案中,杂交条件包括2 X SSPE和63V的杂交和洗涤步骤。本发明也提供了编码多肽的分离的多核苷酸,所述多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的多肽;b)包含DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的多肽;和c)包含反式激活结构域和本发明的包含置换突变的H组核受体配体结合结构域的多肽。在特定的实施方案中,分离的多核苷酸编码杂合多肽,所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的杂合多肽山)包含DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的杂合多肽;和(3)包含反式激活结构域和本发明的包含置换突变的H组核受体配体结合结构域的杂合多肽。本发明也涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中,所述置换突变影响H组核受体配体结合结构域的配体结合活性或配体敏感性。在另一特定的实施方案中,本发明涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中,所述置换突变降低H组核受体配体结合结构域的非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地,分离的多核苷酸包含导致产生氨基酸残基置换的密码子突变,所述氨基酸残基的置换发生的位置等同于或类似于SEQ ID N0:1 的氨基酸残基 48、51、52、54、92、95、96、109、120、125、219、223、234 或 238。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致下述置换a)等同于或类似于SEQ ID NO: I的氨基酸残基48或109的位置置换以天冬酰胺残基;b)等同于或类似于SEQ IDNO: I的氨基酸残基51、92、96或238的位置置换以亮氨酸残基;c)等同于或类似于SEQ ID N0:1的氨基酸残基52、92、96、125或238的位置置换以谷氨酸残基;d)等同于或类似于SEQ ID勵1的氨基酸残基54、95、96、120、219或234的位置置换以色氨酸残基;
e)等同于或类似于SEQ ID N0:1的氨基酸残基51、52、120、234或238的位置置换以蛋氨酸残基;f)等同于或类 似于SEQ IDN0:1的氨基酸残基219的位置置换以丙氨酸残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基48、219或223的位置置换以赖氨酸残基;h)等同于或类似于SEQ ID NO: I的氨基酸残基234的位置置换以异亮氨酸、精氨酸或色氨酸残基;i)等同于或类似于SEQ ID NO: I的氨基酸残基219或238的位置置换以酪氨酸残基;j)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以缬氨酸残基;k)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以甘氨酸或谷氨酰胺残基;或I)等同于或类似于SEQ ID NO: I的氨基酸残基52或223的位置置换以精氨酸残基。甚至更优选地,分离的多核苷酸包括密码子突变,所述密码子突变导致产生置换突变SEQ ID NO: I的F48N、F48K、I51L、I51M、T52E、T52M、T52R、T52G、T52Q、M54W、M92L、M92E、R95W、V96W、V96E、V96L、F109N、Y120M、Y120W、M125E、M125V、M219A、M219K、M219W、M219Y、L223K、L223R、L234M、L234I、L234R、L234W、W238E、W238Y、W238L 或 W238M。此外,本发明也涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中,所述置换突变增强H组核受体配体结合结构域的配体结合活性或对配体的敏感性。在特定的实施方案中,本发明涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中,所述置换突变通常增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性。优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致等同于或类似于a) SEQ ID NO: I的氨基酸残基96或b) SEQ ID NO: I的氨基酸残基96和119的位置上的氨基酸残基发生置换。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致下列置换a)等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以丝氨酸残基;或《等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以苏氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基119的位置置换以苯丙氨酸残基。甚至更优选地,分离的多核苷酸编码包含密码子突变,所述密码子突变导致置换突变SEQIDNO: I 的 V96T 或 N119F/V96T。在另一特定的实施方案中,本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致在等同于或类似于a) SEQID NO: I的氨基酸残基48、52、54、109、110、125、132或223 ;或b)SEQ ID NO: I的氨基酸残基52和110的位置上的氨基酸残基发生置换。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致下述置换a)等同于或类似于SEQ IDNO: I的氨基酸残基48的位置置换以酪氨酸、色氨酸、精氨酸或亮氨酸残基山)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以亮氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基54的位置置换以苏氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基109的位置置换以蛋氨酸残基;e)等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以脯氨酸、谷氨酸或天冬酰胺残基;f)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以异亮氨酸、天冬酰胺或甘氨酸残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以谷氨酸残基;h)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以酪氨酸残基;或i)等同于或类似于SEQID NO: I的氨基酸52的位置置换以缬氨酸残基以及等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对 SEQ IDNO: I 产生下述置换突变F48Y、F48W、F48L、F48R、T52L、M54T、F109M、A110P、A110E、A110N、M125I、M125G、M125N、L132E、L223Y 或 T52V/A110P。在另一特定的实施方案中,本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇二酰肼和非蜕皮类固醇四氢喹啉结合活性,或非蜕皮类固醇二酰肼和非蜕皮类固醇四氢喹啉的敏感性。优选地,分离的多核苷酸包括密码子突变,所述密码子突变导致在等同于或类似于a) SEQ ID NO: I的氨基酸残基107和127 ;或b) SEQ ID NO: I的氨基酸残基107、110和127的位置上的氨基酸残基发生置换。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致下述置换a)等同于或类似于SEQ ID N0:1的氨基酸残基107 的位置置换以异亮氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基;或《等同于或类似于SEQ ID NO: I的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对SEQ ID勵:1产生下述置换突变¥1071/Y127E 或 V107I/Y127E/A110P。在另一特定的实施方案中,本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中所述置换突变总体上增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性和非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地,分离的多核苷酸包括密码子突变,所述密码子突变导致在等同于或类似于a)SEQ ID N0:l的氨基酸残基109、132或W238P;b)SEQ ID NO: I的氨基酸残基52、107和127 ;或c)SEQ ID NO: I的氨基酸残基107和127的位置上的氨基酸残基发生置换,以及SEQ ID NO: I的氨基酸259位置发生插入突变。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基109的位置置换以色氨酸残基山)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以缬氨酸或蛋氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基238的位置置换以脯氨酸残基;
d)等同于或类似于SEQ ID NO: I的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ IDNO: I的氨基酸残基132的位置置换以缬氨酸残基;或e)等同于或类似于SEQ ID N0:1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基259的位置插入甘氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对SEQ ID NO: I产生下述置换突变F109W、L132M、L132V、W238P、V107I/Y127E/T52V 或 V107I/Y127E/259G。在另一个实施方案中,分离的多核苷酸包含密码子突变,该密码子突变对SEQ ID NO: I产生置换突变V107I/Y127E,还包括在SEQ ID NO: I中产生插入突变G259 (V107I/Y127E/G259)。
在另一特定的实施方案中,本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇四氢喹啉结合活性或非蜕皮类固醇四氢喹啉敏感性。优选地,分离的多核苷酸包括密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基110或128的位置上的氨基酸残基;或b)等同于或类似于SEQ ID NO: I的氨基酸残基110和128的位置上的氨基酸残基发生置换。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以色氨酸残基山)等同于或类似于SEQ ID NO: I的氨基酸残基128的位置置换以苯丙氨酸残基;或c)等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基128的位置置换以苯丙氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对SEQ ID勵:1产生下述置换突变4110胃、¥128卩或V128F/A110P。
·
在另一特定的实施方案中,本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致在等同于或类似于SEQID NO: I的氨基酸残基52、95、109、125或132的位置上的氨基酸残基产生置换突变。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以脯氨酸残基;b)等同于或类似于SEQ ID N0:1的氨基酸残基95的位置置换以组氨酸或蛋氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基109的位置置换以亮氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以亮氨酸、色氨酸、精氨酸、半胱氨酸或脯氨酸残基;或6)等同于或类似于SEQID NO: I的氨基酸残基132的位置置换以蛋氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对SEQ ID NO: I产生下述置换突变T52P、T52W、R95H、R95M、F109L、M125L、M125W、M125R、M125C、Μ125Ρ 或 L132M。在另一特定的实施方案中,本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸,其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。更优选地,分离的多核苷酸包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基48的位置置换以赖氨酸或精氨酸残基;b)等同于或类似于SEQID NO: I的氨基酸残基52的位置置换以甘氨酸、谷氨酰胺、蛋氨酸、精氨酸或色氨酸残基;
c)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以异亮氨酸、甘氨酸、天冬酰胺、丝氨酸或缬氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以谷氨酸残基;e)等同于或类似于SEQ ID NO: I的氨基酸残基219的位置置换以赖氨酸、色氨酸或酪氨酸残基;f)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以精氨酸或酪氨酸残基;或8)等同于或类似于SEQ ID NO: I的氨基酸残基238的位置置换以亮氨酸或蛋氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对SEQ IDNO: I 产生下述置换突变F48K、F48R、T52G、T52Q、T52M、T52R、T52W、M125I、M125G、M125N、M125S、M125V、L132E、M219K、M219W、M219Y、L223R、L223Y、W238L 或 W238M。此外,本发明涉及包含可操作性地与转录调控元件连接的本发明多核苷酸的表达载体。优选地,编码包含置换突变的核受体配体结合结构域的多核苷酸与表达控制序列可操作性连接,从而允许在胜任表达的宿主细胞中表达该核受体配体结合结构域。该表达控制序列可以包含在期望进行表达的宿主细胞中具有功能的启动子。载体可以是质粒DNA分子或病毒载体。优选的病毒载体包括逆转录病毒、腺病毒、腺相关病毒、疱疫病毒和牛痘病毒。本发明进一步涉及复制缺陷型重组病毒,在它的基因组中包含编码含有上述置换突变的核受体配体结合结构域的多核苷酸。因此,本发明也涉及包含这样的表达载体的分离的宿主细胞,其中转录调控元件在该宿主细胞中是可操作性的。本发明也涉及由本发明的多核苷酸编码的分离的多肽。本发明的多肽本发明新型的基于核受体的诱导型基因表达系统包含含有多核苷酸的至少一个基因表达盒,所述多核苷酸编码包含含有置换突变的H组核受体配体结合结构域的多肽。因此,本发明也提供分离的多肽,其含有本发明的包含置换突变的H组核受体配体结合结构域。
在另一特定的实施方案中,H组核受体配体结合结构域在等同于或类似于a) SEQID NO: I 的氨基酸残基 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238 ;b) SEQ ID NO: I的氨基酸残基96和119 ;c) SEQ ID NO: I的氨基酸残基110和128 ;d)SEQ ID NO: I 的氨基酸残基52 和 110 ;e) SEQ ID NO: I 的氨基酸残基 107、110和 127 ;或f)SEQ ID NO: I的氨基酸残基52、107和127的位置包含置换突变。在另一实施方案中,H组核受体配体结合结构域包含在等同于或类似于SEQ ID NO: I的氨基酸残基107和127的位置的置换突变,和在SEQ ID NO: I的氨基酸259的插入。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。优选地,H组核受体配体结合结构域包含下述置换a)等同于或类似于SEQIDNO: I的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基山)等同于或类似于SEQ ID NO: I的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸54的位置置换以色氨酸或苏氨酸残基;e)等同于或类似于SEQ ID N0:1的氨基酸92的位置置换以亮氨酸或谷氨酸;f)等同于或类似于SEQ ID NO: I的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基;h)等同于或类似于SEQID NO: I的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺;i)等同于或类似于SEQID NO: I的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基;j)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸;k)等同于或类似于SEQ ID NO: I的氨基酸120的位置置换以色氨酸或蛋氨酸;1)等同于或类似于SEQ ID NO: I的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸;m)等同于或类似于SEQ ID NO: I的氨基酸128的位置置换以苯丙氨酸;n)等同于或类似于SEQ ID NO: I的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸;ο)等同于或类似于SEQ ID NO: I的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基;P)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基;q)等同于或类似于SEQ ID NO: I的氨基酸234的位置置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸;r)等同于或类似于SEQ ID NO: I的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸;s)等同于或类似于SEQ ID NO: I的氨基酸119的位置置换以苯丙氨酸和等同于或类似于SEQ ID NO: I的氨基酸96的位置置换以苏氨酸;t)等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸和等同于或类似于SEQ ID NO: I的氨基酸128的位置置换以苯丙氨酸;u)等同于或类似于SEQID NO: I的氨基酸52的位置置换以缬氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸残基;v)等同于或类似于SEQ ID NO: I的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸110的位置置换以脯氨酸;或w)等同于或类似于SEQ ID ΝΟ:1的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO: I的氨基酸52的位置置换以缬氨酸。在另一实施方案中,H组核受体配体结合结构域包括在等同于或类似于SEQ ID ΝΟ:1的氨基酸107的
位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸127的位置置换以谷氨酸残基,和在等同于或类似于SEQ ID NO: I的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域多肽,其中所述置换突变选自SEQ IDNOil的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P置换突变。在另一实施方案中,包含置换突变的H组核受体配体结合结构域是包含置换突变SEQ ID N0:1的V107I/Y127E的蜕皮激素受体配体结合结构域多肽,该多肽还包含插入突变SEQID NO: I的G259(V107I/Y127E/G259)。本发明也提供了分离的多肽,所述多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的分离的多肽;b)包含DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的分离的多肽;和(3)包含反式激活结构域和本发明的包含置换突变的H组核受体配体结合结构域的分离的多肽。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。本发明也提供了分离的杂合多肽,所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的含有置换突变的H组核受体配体结合结构域的分离的杂合多肽;b)包含DNA结合结构域和本发明的含有置换突变的H组核受体配体结合结构域的分离的杂合多肽;和(3)包含反式激活结构域和本发明的含有置换突变的H组核受体配体结合结构域的分离的杂合多肽。在优选的实施方案中,H组核受体配体结合结构域来自蜕皮激素受体。本发明也提供了包含含有置换突变的H组核受体配体结合结构域的分离的多肽,所述置换突变影响H组核受体配体结合结构域的配体结合活性或配体敏感性。
特别地,本发明涉及包含含有置换突变的配体结合结构域的分离的H组核受体多肽,所述置换突变降低H组核受体配体结合结构域的配体结合活性或配体敏感性。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,所述置换突变降低H组核受体配体结合结构域的非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地,分离的多肽包含在等同于或类似于SEQID N0:1 的氨基酸残基48、51、52、54、92、95、96、109、120、125、219、223、234或 238 的位置上的氨基酸残基置换。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ IDNO: I的氨基酸残基48或109的位置置换以天冬酰胺残基;b)等同于或类似于SEQID NO: I的氨基酸残基51、92、96或238的位置置换以亮氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基52、92、96、125或238的位置置换以谷氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基54、95、96、120或219的位置置换以色氨酸残基;e)等同于或类似于SEQ ID N0:1的氨基酸残基51、52、120、234或238的位置置换以蛋氨酸残基;f)等同于或类似于SEQ IDN0:1的氨基酸残基219的位置置换以丙氨酸残基;g)等同于 或类似于SEQ ID NO: I的氨基酸残基48、219或223的位置置换以赖氨酸残基;h)等同于或类似于SEQ ID NO: I的氨基酸残基234的位置置换以异亮氨酸、精氨酸或色氨酸残基;i)等同于或类似于SEQ ID NO: I的氨基酸残基219或238的位置置换以酪氨酸残基;j)等同于或类似于SEQ ID N0:1的氨基酸残基52或223的位置置换以精氨酸残基;k)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以缬氨酸残基;或I)等同于或类似于SEQ IDNO: I的氨基酸残基52的位置置换以甘氨酸或谷氨酰胺残基。甚至更优选地,分离的多肽包括密码子突变,所述密码子突变导致SEQ ID NO: I产生置换突变F48N、I51L、I51M、T52E、T52M、T52R、T52G、T52Q、M54W、M92L、M92E、R95W、V96W、V96E、V96L、FM125V、M219A、M219K、M219W、M219Y、L223K、L223R、L234M、L234I、L234W、L234R、W238E、W238L、W238M 或 W238Y。此外,本发明还涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,所述置换突变增强H组核受体配体结合结构域的配体结合活性或配体敏感性。在特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,所述置换突变总体上增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性。优选地,分离的多肽包含在等同于或类似于a) SEQ ID NO: I的氨基酸残基96或b) SEQ ID NO: I的氨基酸残基96和119的位置上的氨基酸残基置换。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)在等同于或类似于SEQ IDNO: I的氨基酸残基96的位置置换以丝氨酸残基;或幻在等同于或类似于SEQ ID NO: I的氨基酸残基96的位置置换以苏氨酸残基和在等同于或类似于SEQ ID NO: I的氨基酸残基119的位置置换以苯丙氨酸残基。甚至更优选地,分离的多肽包括密码子突变,所述密码子突变导致SEQ ID NO: I中产生置换突变V96T或N119F/V96T。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,所述置换突变总体上增强H组核受体配体结合结构域的二酰肼结合活性或二酰肼敏感性。优选地,分离的多肽包含在等同于或类似于a) SEQ ID NO: I的氨基酸残基48、52、54、109、110、125、132或 223 或b)SEQID NO: I 的氨基酸残基 52 和 110 的位置上的氨基酸残基置换。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基48的位置置换以酪氨酸、色氨酸、精氨酸或亮氨酸残基;b)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以亮氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基54的位置置换以苏氨酸残基;e)等同于或类似于SEQ ID NO: I的氨基酸残基109的位置置换以蛋氨酸残基;f)等同于或类似于SEQ IDNO: I的氨基酸残基110的位置置换以脯氨酸、谷氨酸或天冬酰胺残基;g)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以异亮氨酸、甘氨酸或天冬酰胺残基;h)等同于或类似于SEQ ID NO: I的氨基酸残基52 的位置置换以缬氨酸残基和等同于或类似于SEQID NO: I的氨基酸残基110的位置置换以脯氨酸残基;i)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以谷氨酸残基;或j)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以酪氨酸残基。甚至更优选地,分离的多肽包括密码子突变,所述密码子突变导致 SEQ IDNO: I 产生置换突变F48Y、F48W、F48L、F48R、T52L、M54T、F109M、A110P、A110E、A110N、M125I、M125G、M125N、L132E、L223Y 或 T52V/A110P。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,所述置换突变总体上增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性和非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地,分离的多肽包含在等同于或类似于a) SEQ IDN0:1的氨基酸残基109、132或W238P的位置上的氨基酸残基置换;b)SEQ IDN0:1的氨基酸残基52、107和127的位置上的氨基酸残基置换;或c) SEQ ID NO: I的氨基酸残基107和127的位置上的氨基酸残基置换,以及SEQ ID NO: I的氨基酸259的插入突变。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基109的位置置换以色氨酸残基山)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以缬氨酸或蛋氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基238的位置置换以脯氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以缬氨酸残基;或e)等同于或类似于SEQ ID N0:1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基259的位置插入甘氨酸残基。甚至更优选地,分离的多核苷酸包含密码子突变,该密码子突变对SEQ ID NO: I产生下述置换突变F109W、L132M、L132V、W238P或V107I/Y127E/T52V。在另一个实施方案中,分离的多肽包含密码子突变,该密码子突变对SEQ ID N0:1产生置换突变V107I/Y127E,还包括在 SEQ ID NO: I 中产生插入突变G259(V107I/Y127E/G259)。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,其中所述置换突变总体上增强H组核受体配体结合结构域的二酰肼和四氢喹啉结合活性或二酰肼和四氢喹啉敏感性。优选地,分离的多肽包含置换突变,所述置换突变导致在等同于或类似于a) SEQ ID NO: I的氨基酸残基107和127 ;或b) SEQ IDNOil的氨基酸残基107、110和127的位置上的氨基酸残基置换。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基107的位置置换以异亮氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基;或幻等同于或类似于SEQ ID NO: I的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基127的位置置换以谷氨酸残基。甚至更优选地,分离的多肽包含密码子突变,该密码子突变对SEQ ID N0:1产生下述置换突变V107I/Y127E或V107I/Y127E/A110P。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇四氢喹啉结合活性或非蜕皮类固醇四氢喹啉敏感性。优选地,分离的多肽包含密码子突变,所述密码子突变导致替换a)等同于或类似于SEQ IDN0:1的氨基酸残基110或128的位置上的氨基酸残基;或b)等同于或类似于SEQID NO: I的氨基酸残基110和128的位置上的氨基酸残基。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID NO: I的氨基酸残基110的位置置换以色氨酸残基;b)等同于或类似于SEQ ID NO: I的氨基酸残基128的位置置换以苯丙氨酸残基;或c)等同于或类似于SEQ IDNO: I的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO: I的氨基酸残基128的位置置换以苯丙氨酸残基。甚至更优选地,分离的多肽包含密码子突变,该密码 子突变对SEQ ID NO: I产生下述置换突变A110W、V128F或V128F/A110P。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。优选地,分离的多肽包括密码子突变,所述密码子突变导致对等同于或类似于SEQ ID NO: I的氨基酸残基52、95、109、125或132的位置上的氨基酸残基产生置换。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ ID N0:1的氨基酸残基52的位置置换以脯氨酸残基;b)等同于或类似于SEQ ID NO: I的氨基酸残基95的位置置换以组氨酸或蛋氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基109的位置置换以亮氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以亮氨酸、色氨酸、精氨酸、半胱氨酸或脯氨酸残基;或6)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以蛋氨酸残基。甚至更优选地,分离的多肽包含密码子突变,该密码子突变对 SEQ ID NO: I 产生下述置换突变T52P、R95H、R95M、F109L、M125L、M125W、M125R、M125C、M125P 或 L132M。在另一特定的实施方案中,本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽,其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。更优选地,分离的多肽包含密码子突变,所述密码子突变导致a)等同于或类似于SEQ IDNO: I的氨基酸残基48的位置置换以赖氨酸或精氨酸残基;b)等同于或类似于SEQ ID NO: I的氨基酸残基52的位置置换以甘氨酸、谷氨酰胺、蛋氨酸、精氨酸或色氨酸残基;c)等同于或类似于SEQ ID NO: I的氨基酸残基125的位置置换以异亮氨酸、甘氨酸、天冬酰胺、丝氨酸或缬氨酸残基;d)等同于或类似于SEQ ID NO: I的氨基酸残基132的位置置换以谷氨酸残基;e)等同于或类似于SEQ ID NO: I的氨基酸残基219的位置置换以赖氨酸、色氨酸或酪氨酸残基;f)等同于或类似于SEQ ID NO: I的氨基酸残基223的位置置换以精氨酸或酪氨酸残基;或g)等同于或类似于SEQ ID NO: I的氨基酸残基238的位置置换以亮氨酸或蛋氨酸残基。甚至更优选地,分离的多肽包含密码子突变,该密码子突变对SEQ ID NO: I产生下述置换突变F48K、F48R、T52G、T52Q、T52M、T52R、T52W、M125I、M125G、M125N、M125S、M125V、L132E、M219K、M219W、M219Y、L223R、L223Y、W238L 或 W238M。
本发明也涉及包含本发明的分离的多肽的组合物。本发明的调节基因表达的方法申请人:的发明也涉及在宿主细胞中使用本发明的基因表达调节系统来调节基因表达的方法。具体地,申请人的发明提供了在宿主细胞中调节基因表达的方法,该方法包括步骤a)将本发明的基因表达调节系统导入宿主细胞;和b)将配体导入宿主细胞,在配体导入宿主细胞之后,该基因的表达被调节,其中待调节的基因是基因表达盒的成分,所述基因表达盒包括i)应答元件,其包含被基因表达系统的DNA结合结构域识别的区域;ii)被基因表达系统的反式激活结构域激活的启动子;和iii)其表达待被调节的基因。本发明也提供了在宿主细胞中调节基因表达的方法,该方法包括步骤a)将本发明的基因表达调节系统导入宿主细胞;b)将本发明的基因表达盒导入宿主细胞,其中所述 基因表达盒包含i)应答元件,其包含被基因表达系统的DNA结合结构域识别的区域;ii)被基因表达系统的反式激活结构域激活的启动子;和iii)其表达待被调节的基因;和c)将配体引入宿主细胞;因此,一旦所述配体被导入所述宿主细胞,基因的表达被调节。申请人:的发明也提供了在含有基因表达盒的宿主细胞中调节基因表达的方法,所述基因表达盒包含应答元件,其包含基因表达调节系统的第一杂合多肽的DNA结合结构域与之结合的区域;被基因表达调节系统的第二杂合多肽的反式激活结构域激活的启动子;和其表达待被调节的基因;其中所述方法包括步骤a)将本发明的基因表达调节系统导入宿主细胞;和b)将配体导入宿主细胞;因此,一旦所述配体被导入所述宿主细胞,基因的表达被调节。使用申请人的方法在宿主细胞中表达的感兴趣的基因可以是内源性基因或异源性基因。期望的基因或蛋白的核酸或氨基酸序列信息可以从众多公共数据库,例如GENBANK, EMBL, Swiss-Prot和PIR,或者从大量的生物学相关期刊出版物获得。因此,本领域技术人员能够获得几乎所有已知基因的核酸序列信息。这样的信息然后可以用于构建期望的构建物,用来将感兴趣的基因插入到在此描述的申请人的方法所使用的基因表达盒中。使用申请人的方法在宿主细胞中表达的感兴趣的基因的例子包括但不限于在植物中生产的抗原如疫苗,酶如α -淀粉酶、植酸酶、葡聚糖酶、木糖酶和木聚糖酶,对昆虫、线虫、真菌、细菌、病毒和非生物应激具有抗性的基因,营养物、药物、维生素,改变氨基酸内容、除草剂抗性、对冷、干旱和热的耐受性的基因,工业产品、油、蛋白质、碳水化合物、抗氧化剂、雄性不育植物、花、燃料、其他表现性状,编码治疗上理想的多肽或产物的基因,所述多肽或产物可以用于治疗病症、疾病、紊乱、功能障碍、遗传缺陷,如单克隆抗体、酶、蛋白酶、细胞因子、干扰素、胰岛素、促红细胞生成素、凝血因子、其他血液因子或成分,用于基因治疗的病毒载体、用于疫苗的病毒、药物开发的靶标、功能基因组学和蛋白质组学分析和应
田坐坐川 寸寸ο可接受的配体是当本发明的基因表达系统的DNA结合结构域在配体存在的情况下与应答元件的结合导致激活或抑制基因表达时,调节基因表达的任何配体。优选的配体包括蜕皮类固醇,例如蜕皮激素、20-羟基蜕皮激素、松留酮Α、幕黎留酮A和类似物,9-顺-视黄酸、视黄酸的合成类似物、N, N’-二酰肼,例如在美国专利6,013,836 ;5,117,057 ;5,530,028 ;5,378,726 和美国专利申请 10/775,883 和 10/787,906 中公开的那些;二苯甲酰烷基氰肼,例如在欧洲专利申请461,809中公开的那些;N-烷基-N,N’- 二芳酰肼,例如在美国专利5,225,443中公开的那些;N_酰基-N-烷基羰基肼,例如在欧洲专利申请234,994中公开的那些;N-芳酰基-N-烷基-N’ -芳酰肼,例如在美国专利4,985,461中公开的那些;四氢喹啉,例如在国际专利申请PCT/US03/00915中公开的那些;这些专利或专利申请中的每一个都并入本文作为参考,其他类似的物质包括3,5- 二-叔丁基-4-轻 基-N-异丁基-苯甲酰胺、8-0-乙酰哈帕苷、氧固醇、22 (R)羟基胆固醇、24(S)羟基胆固醇、25-环氧胆固醇、T0901317、5- α -6- α -环氧胆固醇-3-硫酸酯(ECHS)、7_酮胆固醇_3_硫酸酯、法呢醇、胆汁酸、1,I-二膦酸酯、保幼激素III和类似物。在优选的实施方案中,用于申请人的调节基因表达的方法的配体是下式的化合物
I4
, OO _/
I ..........\||j I
K2"R1其中E是含有叔碳的支链(C4-C12)烷基或支链(C4-C12)烯基,或含有叔碳的氰基(C3-C12)烧基;R1 是 H、Me、Et、i-Pr、F、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH,CH2OMe、CH2CN、CN、C0CHU-丙炔基、2-丙炔基、乙烯基、OH、OMe, OEt、环丙基、CF2CF3^ CH=CHCN、烯丙基、叠氮、SCN 或 SCHF2 ;R2 是 H、Me、Et、n_Pr、i_Pr、甲酰基、CF3、CHF2, CHCl2, CH2F, CH2Cl、CH2OH, CH2OMe,CH2CN, CN、C0CHU-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe, OEt、OtPr、OAc、NMe2,NEt2, SMe、SEt、SOCF3, OCF2CF2H, COEt、环丙基、CF2CF3, CH=CHCN、烯丙基、叠氮、OCF3> OCHF2,0-i-Pr、SCN、SCHF2, SOMe, NH-CN,或与R3以及连接R2和R3的苯基碳连接形成次乙二氧基、其中氧与苯基碳相邻的二氢呋喃环(dihydrofuryl ring)、或其中氧与苯基碳相邻的二氢批喃环(dihydropyryl ring);R3是H、Et,或与R2以及连接R2和R3的苯基碳连接形成次乙二氧基、其中氧与苯基碳相邻的二氢呋喃环、或其中氧与苯基碳相邻的二氢吡喃环;R4、R5 和 R6 独立地是 H、Me、Et、F、Cl、Br、甲酰基、CF3> CHF2、CHC12、CH2F、CH2Cl,CH2OH, CN、C0CH, I-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe 或 Set。在另一优选的实施方案中,用于申请人的调节基因表达的方法的配体是下式的化合物
_ I I xF Jfi 0
R2
其中
权利要求
1.基因表达调节系统,包括基因表达盒,所述基因表达盒能够在宿主细胞中被表达,所述基因表达盒包含编码多肽的多核苷酸,所述多肽包含 i)反式激活结构域; )识别应答元件的DNA结合结构域,所述应答元件与其表达待被调节的基因连接;和 iii)H组核受体配体结合结构域,其包括至少一个突变,所述突变的位置在等同于或类似于选自下述的氨基酸残基处a) SEQ ID NO: I 的 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一个;b)SEQ ID NO: I 的 96 和 119 ;c)SEQID NO: I 的 110 和 128 ;d) SEQ ID NO: I 的 52 和 110 ;e)SEQ ID NO: I 的 107、110 和 127 ;f)SEQ ID NO: I 的 52、107 和 127 ;和 g) SEQ ID NO: I 的 107、127 和 259,或它们的任何组合。
2.根据权利要求I的基因表达调节系统,进一步包括第二个核受体配体结合结构域,其选自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域、超气门蛋白配体结合结构域,和包含两个多肽片段的嵌合配体结合结构域,其中第一多肽片段来自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域,第二多肽片段来自不同的脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域。
3.基因表达调节系统,包括 a)第一基因表达盒,其能够在宿主细胞中被表达,包含编码第一多肽的多核苷酸,所述第一多肽包括 i)识别应答元件的DNA结合结构域,所述应答元件与其表达待被调节的基因连接;和 )核受体配体结合结构域;以及 b)第二基因表达盒,其能够在宿主细胞中被表达,包括编码第二多肽的多核苷酸,所述第二多肽包括 i)反式激活结构域;和 )核受体配体结合结构域, 其中,所述核受体配体结合结构域中的一个是含有至少一个突变的H组核受体配体结合结构域,其中所述突变的位置在等同于或类似于选自下述的氨基酸残基处a)SEQ IDNO: I 的 48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一个;b) SEQ ID NO: I 的 96 和 119 ;c) SEQ ID NO: I 的 110 和 128 ;d) SEQ ID NO: I 的 52和 110 ;e)SEQ ID NO: I 的 107、110 和 127 所有这三个;f) SEQ ID NO: I 的 52、107 和 127 所有这三个;和g)SEQ ID NO: I的107、127和259所有这三个,或它们的任何组合。
4.根据权利要求I或3的基因表达调节系统,其中所述H组核受体配体结合结构域来自H组核受体,该H组核受体选自蜕皮激素受体、遍在受体、孤独受体1、NER-1、类固醇激素核受体I、类视黄醇X受体相互作用蛋白-15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、类法呢醇X受体、受体相互作用蛋白14和法呢醇受体。
5.根据权利要求4的基因表达调节系统,其中所述H组核受体配体结合结构域由包含至少一个突变的多核苷酸编码,所述至少一个突变导致至少一个氨基酸残基突变,其中所述氨基酸残基的位置等同于或类似于a) SEQ ID ΝΟ:1的氨基酸残基48、51、52、54、92、95、/96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一个;b)SEQ ID NO: I 的氨基酸残基96和119 ;c)SEQ ID NO: I的氨基酸残基110和128 ;d) SEQ ID NO: I的氨基酸残基52和110 ;e) SEQ ID NO: I的所有三个氨基酸残基107、110和127 ;f) SEQ ID NO: I的所有三个氨基酸残基52、107和127 ;或g) SEQ ID NO: I的所有三个氨基酸残基107、127和259,或它们的任何组合。
6.根据权利要求5的基因表达调节系统,其中所述包含置换突变的H组核受体配体结合结构域是蜕皮激素受体配体结合结构域。
7.根据权利要求6的基因表达调节系统,其中所述突变选自SEQID ΝΟ:1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、15IN、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V.V107I/Y127E/G259 和 V107I/Y127E/A110P。
8.根据权利要求I或3的基因表达调节系统,其中所述DNA结合结构域选自蜕皮激素受体DNA结合结构域、GAL4DNA结合结构域和LexA DNA结合结构域。
9.根据权利要求I或3的基因表达调节系统,其中所述反式激活结构域选自蜕皮激素受体反式激活结构域、VP16反式激活结构域、B42酸性激活物反式激活结构域和p65反式激活结构域。
10.分离的多核苷酸,其编码包含至少一个突变的H组核受体配体结合结构域,其中所述分离的多核苷酸包含至少一个突变,所述至少一个突变导致至少一个氨基酸残基突变,其中所述氨基酸残基突变的位置等同于或类似于a)SEQ ID勵:1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一个;b) SEQID NO: I的氨基酸残基96和119 ;c) SEQ ID NO: I的氨基酸残基110和128 ;d) SEQ ID NO: I的氨基酸残基52和110 ;e) SEQ ID NO: I的所有三个氨基酸残基107、110和127 ;f) SEQ IDNO: I的所有三个氨基酸残基52、107和127 ;或g) SEQ ID NO: I的所有三个氨基酸残基107、127和259,或它们的任何组合。
11.根据权利要求10的分离的多核苷酸,其中所述突变导致选自SEQID ΝΟ:1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、151N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V.V107I/Y127E/G259 和 V107I/Y127E/A110P 的突变。
12.表达载体,包含可操作性地连接到转录调控元件的权利要求10的分离的多核苷酸。
13.分离的宿主细胞,包含权利要求12的表达载体,其中所述转录调控元件在所述宿主细胞中是可操作性的。
14.分离的多肽,由权利要求10的分离的多核苷酸编码。
15.分离的多肽,包含H组核受体配体结合结构域,所述H组核受体配体结合结构域包含至少一个突变,其中所述突变的位置等同于或类似于a) SEQ ID NO: I的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234 和 238 中的至少一个;b)SEQ ID NO: I的氨基酸残基96和119 ;c) SEQ ID NO: I的氨基酸残基110和128 ;d) SEQID NO: I的氨基酸残基52和110 ;e) SEQ ID NO: I的所有三个氨基酸残基107、110和127 ;f) SEQ ID NO: I的所有三个氨基酸残基52、107和127 ;*g)SEQ ID NO: I的所有三个氨基酸残基107、127和259,或它们的任何组合。
16.根据权利要求15的分离的多肽,其中所述突变选自SEQID NO: I的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、NI 19F/V96T、V128F/A1IOP,T52V/A110P、V107I/Y127E/T52V.V107I/Y127E/G259 和 V107I/Y127E/A110P。
17.在宿主细胞中调节基因表达的方法,包括下述步骤 a)将权利要求I或权利要求3的基因表达调节系统导入所述宿主细胞;和 b)将配体导入所述宿主细胞; 其中待被调节的基因是基因表达盒的组成部分,所述基因表达盒包括 i)被DNA结合结构域识别的应答元件; )被反式激活结构域激活的启动子;和 iii)其表达待被调节的基因; 由此,一旦所述配体被导入所述宿主细胞,b)iii)的基因的表达被调节。
18.根据权利要求17的方法,其中所述配体选自 a)下式化合物
19.根据权利要求18的方法,进一步包括将第二配体导入所述宿主细胞,其中所述第二配体是9-顺-视黄酸,或视黄酸的合成类似物。
20.分离的宿主细胞,包含权利要求I或权利要求3的基因表达调节系统。
21.非人生物,包含权利要求20的宿主细胞。
全文摘要
本发明涉及生物技术或遗传工程领域。具体地,本发明涉及基因表达领域。更具体地,本发明涉及新型的置换突变型受体,和它们在基于核受体的诱导型基因表达系统中的应用,以及在宿主细胞中调节基因表达的方法,可用于各种应用,如基因疗法、大规模生产蛋白质和抗体、基于细胞的高通量筛选分析、功能基因组学和调控转基因生物的性状。
文档编号A61K31/47GK102776218SQ20121027049
公开日2012年11月14日 申请日期2005年5月2日 优先权日2004年4月30日
发明者M·B·库玛, S·R·帕里 申请人:因特莱克森公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1