突变受体以及它们在基于核受体的诱导型基因表达系统中的应用的制作方法

文档序号：3475607阅读：1342来源：国知局

专利名称：突变受体以及它们在基于核受体的诱导型基因表达系统中的应用的制作方法
技术领域：
本发明涉及生物技术或遗传工程领域。具体地，本发明涉及基因表达领域。更具体地，本发明涉及包含置换突变的新型核受体，和它们在基于核受体的诱导型基因表达系统中的应用，以及使用这种诱导型基因表达系统在宿主细胞内调节基因表达的方法。
背景技术：
本文引用了各种公开物，它们的公开内容以其整体并入本文，作为参考。然而，本文中对任何文献的引用不应该解释为承认所引用的文献是相对于本申请的“现有技术”。在遗传工程领域，基因表达的精确控制对于研究、操纵和控制发育和其他生理过程而言是有价值的工具。基因表达是复杂的生物过程，涉及大量特定的蛋白质-蛋白质相互作用。引发基因表达，从而产生RNA，是蛋白合成所必需的第一步，为此，转录激活子必需被带到控制基因转录的启动子的附近。通常，转录激活子本身与具有至少一个DNA结合结构域的蛋白缔合，所述DNA结合结构域与存在于基因的启动子区域中的DNA结合位点结合。因此，为了使得基因表达发生，包含DNA结合结构域以及与该DNA结合域具有适当距离的反式激活结构域的蛋白必须被带入基因的启动子区域的正确位置。传统的转基因方法利用细胞型特异性的启动子来驱动设计的转基因的表达。含有该转基因的DNA构建物首先被整合入宿主基因组。当被转录激活子激发时，该转基因在给定的细胞类型中表达。在细胞中调控外来基因的表达的另一手段通过诱导型启动子进行。这样的诱导型启动子的应用例子包括PR1-a启动子、原核阻遏物-操纵子系统、免疫抑制-亲免素(immunophilin)系统和高等真核转录激活系统，例如蜕皮类固醇激素受体系统，下文对它们进行了描述。病原体攻击之后，来自烟草的PR1-a启动子在系统性获得性抗性应答期间得以诱导。因为PR1-a常常是对内源性物质和外部因素如病原体、UV-B辐射和污染物产生应答，所以PR1-a的应用可能受到限制。基于由热激、干扰素和重金属诱导的启动子的基因调控系统已被描述(Wurn et al.，1986，Proc.Natl.Acad.Sci.USA 835414-5418；Arnheiter et al.，1990，Cell 6251-61；Filmus et al.，1992，NucleicAcids Research 2027550-27560)。然而，由于这些系统对非目标基因的表达有影响，所以它们也有局限性。这些系统也是有遗漏性的。原核阻遏物-操纵子系统利用细菌阻遏蛋白和阻遏蛋白与之结合的独特操纵子DNA序列。大肠杆菌(Escherichia coli)细菌的四环素(“Tet”)和乳糖(“Lac”)阻遏物-操纵子系统已经用于植物和动物来控制基因表达。在Tet系统中，四环素结合TetR阻遏蛋白，导致构象变化，从而将该阻遏蛋白从操纵子上释放下来，其结果是允许发生转录。在Lac系统中，在对存在的乳糖或合成的类似物如异丙基-β-D-硫代半乳糖苷的应答中，lac操纵子被激活。不幸的是，此类系统的应用受到配体即四环素和乳糖的不稳定的化学特性、它们的毒性、它们的天然存在性或者诱导或阻遏所需要的相对高的水平的限制。由于类似的原因，此类系统在动物中的应用受到限制。免疫抑制分子诸如FK506、雷帕霉素和环孢菌素A能够结合亲免素FKBP12、亲环素(cyclophilin)等。利用这些信息，已经设计出一般性的策略来使任何两个蛋白集合在一起，这仅仅是通过将FK506置于这两种蛋白的每一种上，或通过将FK506置于一个蛋白上而将环孢菌素A置于另一个蛋白上。合成的FK506同型二聚体(FK1012)或通过融合FK506-环孢菌素(FKCsA)而形成的化合物然后可以用于诱导这些分子的二聚体化(Spencer et al.，1993，Science 2621019-24；Belshawet al.，1996 Proc Natl Acad Sci USA 934604-7)。与FKBP12融合的Ga14 DNA结合结构域和与亲环素融合的VP16激活子结构域，以及FKCsA化合物被用于显示异源二聚作用和在含有Ga14结合位点的启动子的控制之下对报告基因的激活作用。不幸的是，该系统包括可能具有不期望的副作用的免疫抑制剂，因此限制了其用于各种哺乳动物基因开关应用。高等真核生物转录激活系统例如类固醇激素受体系统也已得到应用。类固醇激素受体是核受体超家族的成员，发现于脊椎动物和无脊椎动物的细胞中。不幸的是，激活受体的类固醇化合物在调控基因表达中的应用特别是在植物和动物中的应用受到限制，原因是这些类固醇化合物在这些生物中参与许多其他的天然生物途径。为了克服这些困难，已经开发出了使用昆虫蜕皮素受体(EcR)的替代系统。昆虫的生长、蜕皮和发育受到蜕皮素类固醇激素(蜕皮激素)和保幼激素的调控(Dhadialla，et al.，1998，Annu.Rev.Entomol.43545-569)。在昆虫中蜕皮激素的分子靶标至少由蜕皮激素受体(EcR)和超气门蛋白(USP，ultraspiracle protein)组成。EcR是核类固醇受体超家族的成员，其特征为标志DNA(signature DNA)和配体结合结构域以及激活结构域(Koelle et al.1991，Cell，6759-77)。EcR受体对许多蜕皮类固醇化合物，例如松甾酮(ponasterone)A和幕黎甾酮(muristerone)A具有应答性。近来，已经描述了具有蜕皮类固醇激动剂活性的非固醇类化合物，包括商业上可获得的杀虫剂双苯酰肼和甲氧虫酰肼(methoxyfenozide)，它们由Rohm and HaasCompany在全球销售(参见国际专利申请PCT/EP96/00686和美国专利5,530,028)。两种类似物对其他生物都是非常安全的。昆虫蜕皮激素受体(EcR)与哺乳动物RXR的昆虫同源物超气门(USP)形成异源二聚体，结合蜕皮类固醇和蜕皮激素受体应答元件，并激活蜕皮激素应答基因的转录(Riddiford et al.，2000)。EcR/USP/配体复合物在昆虫发育和繁殖期间发挥重要作用。EcR是类固醇激素受体超家族的成员，具有五个模块结构域(modulardomain)，A/B(反式激活)、C(DNA结合，异源二聚体化)、D(铰链，异源二聚体化)、E(配体结合，异源二聚体化和反式激活)以及F(反式激活)结构域。这些结构域中的一些例如A/B、C和E当与其他蛋白融合时保留它们的功能。紧密调控的诱导型基因表达系统或基因开关(“gene switchs”)可用于各种应用，如基因疗法、在细胞中大规模生产蛋白、基于细胞的高通量筛选分析、功能基因组学和调控转基因植物和动物的性状。第一种基于EcR的基因开关使用黑腹果蝇(Drosophila melanogaster)EcR(DmEcR)和小家鼠(Mus musculus)RXR(MmRXR)，并且显示，在哺乳动物细胞系和转基因小鼠中这些受体在存在蜕皮类固醇，松甾酮A的情况下反式激活报告基因(Christopherson et al.，1992；No et al.，1996)。后来，Suhr et al.，1998显示，非蜕皮类固醇蜕皮激素激动剂，双苯酰肼，在哺乳动物细胞中通过家蚕(Bombyx mori)EcR(BmEcR)，在不存在外源异源二聚体伴侣的情况下，高水平地诱导对报告基因的反式激活作用。国际专利申请PCT/US97/05330(WO 97/38117)和PCT/US99/08381(WO99/58155)公开了调节外源基因的表达的方法，其中，包含该外源基因和蜕皮激素应答元件的DNA构建物被包含蜕皮激素受体的第二DNA构建物激活，蜕皮激素受体在其配体存在的情况下，和可选地在能够充当沉默伴侣的受体存在的情况下，与蜕皮激素应答元件结合，从而诱导基因表达。选择的蜕皮激素受体分离自黑腹果蝇。通常，此类系统需要存在有沉默伴侣，优选类视黄醇X受体(RXR)，以便提供最佳的激活作用。在哺乳动物细胞中，昆虫蜕皮激素受体(EcR)与类视黄醇X受体(RXR)形成异源二聚体，并以配体依赖型方式调控目标基因的表达。国际专利申请PCT/US98/14215(WO 99/02683)公开了分离自蚕蛾家蚕的蜕皮激素受体在哺乳动物系统中具有功能，无需外源的二聚体伴侣。美国专利6,265,173 B1公开了类固醇/甲状腺受体超家族的各种成员能够与黑腹果蝇超气门受体(USP)或其包含至少USP的二聚化结构域的片段结合，用于基因表达系统。美国专利5,880,333公开了用于植物中的黑腹果蝇EcR和超气门(USP)异源二聚体系统，其中反式激活结构域和DNA结合结构域位于两个不同的杂合蛋白上。不幸的是，这些基于USP的系统在动物细胞中是组成型的，因此，对于调控报告基因表达是没有效果的。在这些例子中的每一个中，反式激活结构域和DNA结合结构域(或者如在国际专利申请PCT/US98/14215中的天然EcR，或者如在国际专利申请PCT/US97/05330中的修饰的EcR)，被整合入单个的分子，其他的异源二聚体伴侣，USP或者RXR，则以它们天然的状态使用。上述基于EcR的基因调控系统的缺点包括，在不存在配体的情况下具有相当明显的背景活性，且不能将这些系统用于植物和动物(参见美国专利5,880,333)。因此，本技术领域需要改进的基于EcR的系统，以精确地调节外源基因在植物和动物中的表达。此种改进的系统将可以用于各种应用，如基因疗法、大规模生产蛋白和抗体、基于细胞的高通量筛选分析、功能基因组学和调节在转基因动物中的性状。对于某些应用例如基因疗法，具有诱导型基因表达系统可能是有利的，这些表达系统恰当地对合成的非蜕皮类固醇配体产生应答，同时对天然蜕皮类固醇不敏感。因此，改进的系统是简单的，缜密的，依赖于相对便宜的且容易获得的和对宿主毒性低的配体，它们将被证明可用于调控生物系统。之前，申请人已经说明了基于蜕皮激素受体的诱导型基因表达系统——其中通过将反式激活结构域和DNA结合结构域置于两个不同的蛋白上使得它们相互分开——导致在配体不存在的情况下背景活性大大减少，并且在配体存在的情况下相比背景其活性显著增加(在审申请PCT/US01/09050，其整体并入本文作为参考)。相比申请PCT/US97/05330和PCT/US98/14215中公开的两种系统，该双杂合系统是明显改进的诱导型基因表达调节系统。该双杂合系统利用了一对相互作用的蛋白将转录激活结构域带到相对于DNA结合结构域更为有利的位置的能力，这样，当DNA结合结构域结合到基因上的DNA结合位点时，反式激活结构域更有效地激活启动子(参见例如美国专利5,283,173)。简言之，该双杂合基因表达系统包含两个基因表达盒；第一个编码融合到核受体多肽的DNA结合结构域，第二个编码融合到不同的核受体多肽的反式激活结构域。在配体存在的情况下，第一多肽和第二多肽的相互作用有效地将DNA结合结构域束缚于反式激活结构域。因为DNA结合结构域和反式激活结构域位于两个不同的分子上，在配体不存在的情况下的背景活性大大降低。与蜕皮类固醇配体例如松甾酮A(“PonA”)或幕黎甾酮A(“MurA”)相比，双杂合系统对于非蜕皮类固醇配体例如二酰肼也具有改进的敏感性。也就是说，相比蜕皮类固醇，非蜕皮类固醇配体在较低浓度下提供较高的活性。此外，因为基于EcR基因开关的反式激活常常是细胞系依赖性的，所以更容易对开关系统进行调整，以针对每一应用获得最大的反式激活能力。而且，该双杂合系统避免了由于RXR的过表达引起的一些副作用，当未修饰的RXR用作开关伴侣时，经常发生RXR的过表达。在优选的双杂合系统中，EcR或RXR的天然DNA结合结构域和反式激活结构域被除掉，结果，这些杂交分子鲜有机会与存在于细胞中的其他类固醇激素受体相互作用，从而减少了副作用。EcR是核受体超家族的成员，归为亚家族1，H组(在本文中称为“H组核受体(Group H nuclear receptor)”)。在E(配体结合)结构域中，各组的成员共有40-60％的氨基酸同一性(Laudet et al.，A Unified Nomenclature System for the NuclearReceptor Subfamily，1999；Cell 97161-163)。除了蜕皮激素受体，该核受体亚家族1，H组的其他成员包括遍在受体(UR)、孤独受体1(OR-1)、类固醇激素核受体1(NER-1)、RXR相互作用蛋白-15(RIP-15)、肝脏X受体β(LXRβ)、类固醇激素受体样蛋白(RLD-1)、肝脏X受体(LXR)、肝脏X受体α(LXRα)、类法尼醇X受体(FXR)、受体相互作用蛋白14(RIP-14)和法呢醇受体(HRR-1)。为了开发出改进的基于H组核受体的诱导型基因表达系统——其中配体结合性或配体特异性被改变，申请人创造了在配体结合结构域(LBD)中包含置换的氨基酸残基的置换突变型EcRs。同源建模和分子对接方法被用来预测介导蜕皮类固醇和非蜕皮类固醇与EcR LBD结合的关键残基。在配体结合和反式激活分析中评价这些置换突变型EcRs。如本文介绍，申请人的新型置换突变型核受体和它们在基于核受体的诱导型基因表达系统中的应用，提供了在原核和真核宿主细胞中的改进的诱导型基因表达系统，其中，如果需要，根据用途可以对配体灵敏性和反式激活的程度加以选择。
发明详述申请人:在此描述了包含置换突变的H组核受体(本文称之为“置换突变体(substitution mutant)”)的构建，所述突变发生在参与配体与H组核受体配体结合结构域的结合的氨基酸残基处，所述突变影响H组核受体的配体灵敏性和诱导程度，而且证明了这些置换突变型核受体在调节基因表达的方法中有用的。具体地，申请人已经开发出新型的基于核受体的诱导型基因表达系统，该系统包括含有置换突变的H组核受体配体结合结构域。申请人已经表明，这样的置换突变的作用可以增加或降低配体结合活性或配体敏感性，配体可以是蜕皮类固醇特异性的或非蜕皮类固醇特异性的。因此，申请人的发明提供了可用于调节感兴趣的基因在宿主细胞中的表达的基于H组核受体的诱导型基因表达系统。在特别有利的实施方案中，申请人的发明提供了基于蜕皮激素受体的诱导型基因表达系统，其仅仅对蜕皮类固醇配体或非蜕皮类固醇配体产生应答。此外，本发明也提供了改进的非蜕皮类固醇配体应答性的基于蜕皮激素受体的诱导型基因表达系统。因此，申请人的新型的诱导型基因表达系统和其在宿主细胞中调节基因表达的方法中的应用克服了现有诱导型表达系统的局限，并为技术人员提供了控制基因表达的有效手段。本发明可以用于各种用途中，如基因疗法、蛋白和抗体的大规模生产、基于细胞的高通量筛选分析、正交配体筛选分析、功能基因组学、蛋白质组学、代谢组学和在转基因生物中性状的调控，在这些情形中对基因表达水平进行控制是被期望的。申请人的发明的优点在于它提供了调控基因表达和调整表达水平以适应使用者的需要的手段。
定义在本公开中，使用了许多术语和缩写。下面提供了定义，应该有助于理解本发明的范围和实践。在具体的实施方案中，术语“大约”或“近似”是指在给定的值或范围的20％、优选10％、更优选5％和甚至更优选1％范围内。术语“基本上无”是指当组合物中按重量计约75％的蛋白、DNA、载体(取决于A和B所属的物质种类)是“A”时，包含“A”(其中“A”是单一的蛋白、DNA分子、载体、重组宿主细胞等)的该组合物基本上无“B”(其中“B”包括一种或多种污染蛋白、DNA分子、载体等)。优选地，按组合物中A+B物质的重量计算，“A”占至少约90％，最优选地按重量计算占至少约99％。而且，优选地，基本上无污染的组合物仅仅包含单一分子量的物质，该物质具有感兴趣的物质活性或特征。对于本发明的目的而言，术语“分离的”是指已从其原始环境(其自然存在的环境)中移出的生物物质(核酸或蛋白质)。例如，以自然状态存在于植物或动物中的多核苷酸不是分离的，然而，与其中自然存在的相邻核酸分离开的同样的多核苷酸被认为是“分离的”。术语“纯化的”并不要求该物质以绝对纯、不存在其他化合物的形式存在。它只是一个相对的定义。在将起始材料或天然材料纯化至少一个数量级、优选2或3个数量级，优选4或5个数量级之后，多核苷酸便为“纯化的”状态。“核酸”是由共价连接的称之为核苷酸的亚基组成的聚合化合物。核酸包括多核糖核酸(RNA)和多脱氧核糖核酸(DNA)，两者都可以是单链或双链的。DNA包括但是不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。DNA可以是线性的、环状的或超螺旋的。“核酸分子”是指核糖核苷(腺苷、鸟苷、尿苷或胞苷；“RNA分子”)，或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷；“DNA分子”)的磷酸酯聚合形式，或其任何磷酸酯类似物，如硫代磷酸酯和硫酯，其为或者单链形式或者双链螺旋。可以是双链DNA-DNA、DNA-RNA和RNA-RNA螺旋体。术语核酸分子，特别是DNA或RNA分子，仅指该分子的一级和二级结构，并不将之限于任何特定的三级结构形式。因此，该术语包括在线性或环状DNA分子(例如限制性片段)、质粒和染色体等中发现的双链DNA。在论述特定的双链DNA分子的结构时，序列可以根据常规惯例进行描述，仅给出沿着DNA的非转录链(即，与mRNA具有序列同源性的链)从5′至3′方向的序列。“重组DNA分子”是指经过分子生物学操作的DNA分子。术语“片段”将被理解为指长度比参考核酸短并且在共同部分包含与参考核酸相同的核苷酸序列的核苷酸序列。如果合适的话，根据本发明的这样的核酸片段可以被包含在更大的多核苷酸中，该片段是该更大的多核苷酸的组成成分。这样的片段包括长度在本发明的核酸的至少6、8、9、10、12、15、18、20、21、22、23、24、25、30、39、40、42、45、48、50、51、54、57、60、63、66、70、75、78、80、90、100、105、120、135、150、200、300、500、720、900、1000或1500个连续核苷酸范围内的寡核苷酸，或可选地由这样的寡核苷酸组成。如本文中使用地，“分离的核酸片段”是指单链或双链的RNA或DNA聚合物，可选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以包括cDNA、基因组DNA或合成的DNA中的一个或多个片段。“基因”是指编码多肽的核苷酸的装配物，包括cDNA和基因组DNA核酸。“基因”也指表达特定蛋白或多肽的核酸片段，包括编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。“天然基因”是指天然发现的具有它自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因，其包含在天然条件下不在一起的调控序列和/或编码序列。因此，嵌合基因可以包含不同来源的调控序列和编码序列，或相同来源但以与天然发现的不同的方式排列的调控序列和编码序列。嵌合基因可以包括不同来源的编码序列，和/或不同来源的调控序列。“内源基因”是指在生物体的基因组中的天然位置的天然基因。“外来”基因或“异源”基因是指在正常情况下不在宿主生物体中的基因，而是通过基因转移导入宿主生物体的基因。外来基因可以包括插入到非天然生物中的天然基因或嵌合基因。“转基因”是通过转化程序被导入到基因组中的基因。“异源”DNA是指不是天然位于细胞或细胞染色体位点的DNA。优选地，异源DNA包括对该细胞而言为外来的基因。术语“基因组”包括染色体以及线粒体、叶绿体和病毒DNA或RNA。当在合适的温度和溶液离子强度条件下，单链形式的核酸分子能够与其他核酸分子退火，那么该核酸分子便与另一核酸分子如cDNA、基因组DNA或RNA是可杂交的(参见Sambrook et al.，1989 infra)。杂交条件和洗涤条件是众所周知的，并在Sambrook，J.，Fritsch，E.F.和Maniatis，T.Molecular CloningA LaboratoryManual，Second Edition，Cold Spring Harbor Laboratory Press，Cold Spring Harbor(1989)中列举出，特别是在其中的第11章和表11.1(该文献整体并入本文作为参考)。温度和离子强度条件决定了杂交的“严格性”。可以调整严格性条件以筛选中等程度类似的片段例如来自关系远的生物的同源序列，至高度相似的片段例如来自关系近的生物的同样功能的酶的基因。对于同源核酸的初筛，可以使用低严格性的杂交条件，对应于55℃的Tm，例如5×SSC、0.1％SDS、0.25％牛奶，无甲酰胺；或30％甲酰胺、5×SSC、0.5％SDS)。中度严格性杂交条件对应于较高的Tm，例如40％甲酰胺、5×或6×SCC。高度严格性杂交条件对应于最高的Tm，例如50％甲酰胺、5×或6×SCC。杂交要求两条核酸含有互补序列，尽管取决于杂交的严格性，碱基之间还是可能会发生错配。术语“互补”被用于描述能够相互杂交的核苷酸碱基之间的关系。例如，对于DNA，腺嘌呤与胸腺嘧啶互补，胞嘧啶与鸟嘌呤互补。因此，本发明也包括与公开或使用于此的全序列以及那些基本上类似的核酸序列互补的分离的核酸片断。在本发明的特定实施方案中，通过使用包括Tm为55℃的杂交步骤的杂交条件并利用上述的条件，检测多核苷酸。在优选的实施方案中，Tm为60℃，在更优选的实施方案中，Tm为63℃，在更为优选的实施方案中，Tm为65℃。杂交后的洗涤也决定严格性条件。一组优选的条件使用一系列的洗涤步骤以6×SSC、0.5％SDS室温中进行15分钟起始，然后2×SSC、0.5％SDS在45℃进行30分钟，重复洗涤；然后0.2×SSC、0.5％SDS在50℃进行30分钟，重复两次。更优选的一组严格性条件使用更高的温度，其中洗涤步骤与上述步骤相同，除了在0.2×SSC、0.5％SDS中进行最后两次30分钟洗涤的温度增加到60℃。另一组优选的高严格性条件是在65℃，在0.1×SSC，0.1％SDS中进行最后2次洗涤。杂交要求两条核酸含有互补序列，尽管取决于杂交的严格性，碱基之间还是可能会错配。使核酸杂交的合适的严格性取决于核酸的长度和互补程度，这些是本领域熟知的变量。两条核苷酸序列之间的相似性或同源性程度越大，具有那些序列的核酸杂合子的Tm值越大。核酸杂交的相对稳定性(对应于较高的Tm)按照下列次序降低RNA:RNA、DNA:RNA、DNA:DNA。对于长度大于100个核苷酸的杂合子，已经推导出计算Tm的公式(参见Sambrook et al.，supra，9.50-0.51)。对于较短核酸即寡核苷酸的杂交，错配的位置变得更加重要，寡核苷酸的长度决定其特异性(参见Sambrook et al.，supra，11.7-11.8)。在本发明特定的实施方案中，利用包括在小于500mM盐和至少37℃的杂交步骤以及在2×SSPE和至少63℃的洗涤步骤的杂交条件来检测多核苷酸。在优选的实施方案中，杂交条件包括小于200mM盐和至少37℃的杂交步骤。在更优选的实施方案中，杂交条件包括2×SSPE和63℃的杂交和洗涤步骤。在一个实施方案中，可杂交核酸的长度为至少约10个核苷酸。优选地，可杂交核酸的最小长度为至少约15个核苷酸；更优选至少约20个核苷酸；最优选地长度为至少30个核苷酸。而且，技术人员将认识到，温度和洗涤溶液的盐浓度可以根据各种因素例如探针长度作必要的调整。术语“探针”是指单链核酸分子，其可以与互补的单链目标核酸进行碱基配对，形成双链分子。如在此所使用，术语“寡核苷酸”是指通常至少18个核苷酸的核酸，其可以与基因组DNA分子、cDNA分子、质粒DNA或mRNA分子杂交。寡核苷酸可以被标记，例如用32P-核苷酸或已经与标记物例如生物素共价偶联的核苷酸进行标记。标记的寡核苷酸可以用作探针来检测核酸的存在。寡核苷酸(其中之一或两者可以被标记)可以用作PCR引物，用于克隆全长核酸或核酸片段，或者用于检测核酸的存在。寡核苷酸也可以用于与DNA分子形成三螺旋。一般而言，寡核苷酸通过合成制得，优选在核酸合成仪上合成。因此，寡核苷酸可以用非天然存在的磷酸酯类似键例如硫酯键等制备。“引物”是指在合适的条件下与目标核酸序列杂交从而产生可以充当DNA合成起点的双链核酸区域的寡核苷酸。这样的引物可以用于聚合酶链式反应。“聚合酶链式反应”缩写为PCR，是指酶促扩增特定核酸序列的体外方法。PCR涉及一系列反复的温度循环，每一循环包括三个阶段对模板核酸变性以分开目标分子的链，将单链PCR寡核苷酸引物与模板核酸退火，用DNA聚合酶延伸退火的引物。PCR提供了检测目标分子存在与否的手段，并且在定量或半定量条件下，可以确定目标分子在原始核酸库中的相对数量。“逆转录-聚合酶链式反应”的缩写是RT-PCR，是指由RNA分子或多个RNA分子酶法产生目标cDNA分子或多个分子，然后如上所述酶法扩增目标cDNA分子或多个分子内的特定核酸序列或多个序列的体外方法。RT-PCR也提供了检测目标分子存在与否的手段，并且在定量或半定量条件下，可以确定目标分子在起始核酸库中的相对数量。DNA“编码序列”是双链DNA序列，该序列当置于合适的调控序列的控制下时在细胞中以体外或体内的方式被转录并翻译成多肽。“合适的调控序列”是指位于编码序列的上游(5′非编码序列)、之内或下游(3′非编码序列)的核苷酸序列，它们影响相关联的编码序列的转录、RNA加工或稳定性或翻译。调控序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应物结合位点和茎-环结构。编码序列的边界由5’(氨基)端的起始密码子和3’(羧基)端的翻译终止密码子确定。编码序列可以包括但是不限于原核序列、mRNA产生的cDNA、基因组DNA序列、甚至合成的DNA序列。如果编码序列欲在真核细胞中表达，多腺苷酸化信号序列和转录终止序列通常将位于该编码序列的3’端。“开放阅读框”缩写为ORF，是指一定长度的核酸序列，其是DNA、cDNA或者RNA，包括翻译起始信号或起始密码子，例如ATG或AUG，和终止密码子，并且潜在地能够翻译成多肽序列。术语“头对头”在此被用于描述两条多核苷酸序列彼此之间的定向。当一条多核苷酸的编码链的5’端与另一条多核苷酸的编码链的5’端相邻时，这两条多核苷酸以头对头的方向定位，因此，各条多核苷酸的转录方向以远离另一条多核苷酸的5’端的方式进行。术语“头对头”可以缩写为(5′)-对-(5′)，也可以用符号(←→)或(3′←5′5′→3′)表示。术语“尾对尾”在此被用于描述两条多核苷酸序列彼此之间的定向。当一条多核苷酸的编码链的3’端与另一条多核苷酸的编码链的3’端相邻时，这两条多核苷酸以尾对尾的方向定位，因此，各条多核苷酸的转录方向朝着另一条多核苷酸的方向进行。术语“尾对尾”可以缩写为(3′)-对-(3′)，也可以用符号(→←)或(5′→3′3′←5′)表示。术语“头对尾”在此被用于描述两条多核苷酸序列彼此之间的定向。当一条多核苷酸的编码链的5’端与另一条多核苷酸的编码链的3’端相邻时，这两条多核苷酸以头对尾的方向定位，因此，各条多核苷酸的转录方向以与另一条多核苷酸相同的方向进行。术语“头对尾”可以缩写为(5′)-对-(3′)，也可以用符号(→→)或(5′→3′5′→3′)表示。术语“下游”是指位于参考核苷酸序列3’端的核苷酸序列。特别地，下游核苷酸序列通常涉及转录起始点之后的序列。例如，基因的翻译起始密码子位于转录起始位点的下游。术语“上游”是指位于参考核苷酸序列5’端的核苷酸序列。特别地，上游核苷酸通常涉及位于编码序列或转录起始点的5’侧的序列。例如，大部分的启动子位于转录起始位点的上游。术语“限制性核酸内切酶”和“限制性酶”是指结合并切割双链DNA内的特定核苷酸序列的酶。“同源重组”是指将外来DNA序列插入另一DNA分子，例如将载体插入染色体。优选地，载体靶向于特定的染色体位点进行同源重组。对于特异性的同源重组，载体将含有与染色体的序列同源的足够长的区域，以允许载体进行互补性结合并整合入染色体。较长的同源区域和较高的序列相似性程度，可以提高同源重组的效率。本领域已知的若干方法可以用于增殖本发明的多核苷酸。一旦建立合适的宿主系统和生长条件，可以定量增殖和制备重组表达载体。如在此所描述，可以使用的表达载体包括但是不限于下述载体或它们的衍生物人或动物病毒例如牛痘病毒或腺病毒；昆虫病毒例如杆状病毒；酵母载体；噬菌体载体(例如λ噬菌体载体)以及质粒和粘粒DNA载体，以这些为例。“载体”是指用于克隆核酸和/或将核酸转移入宿主细胞的任何工具。载体可以是另一DNA片段可以连接到其上从而使得该被连接的片段可以被复制的复制子。“复制子”是指作为在体内的自主DNA复制单元而发挥功能，即能够在它自己的控制下进行复制的任何遗传元件(例如质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于体外、离体或体内将核酸导入细胞的病毒和非病毒工具。本领域已知的大量载体可以被用于操作核酸、将应答元件和启动子整合入基因等。可能的载体包括例如质粒或修饰的病毒，包括例如细菌噬菌体，如λ衍生物，或质粒如pBR322或pUC质粒衍生物，或Bluescript载体。例如，通过将合适的DNA片段连接入具有互补粘性末端的选择载体，可以将对应于应答元件和启动子的DNA片段插入合适的载体中。可选择地，DNA分子的末端可以通过酶法修饰，或者可以通过将核苷酸序列(接头)连接到该DNA末端产生任何位点。这样的载体可以进行工程改造，以含有选择性标记基因，用于选择已经将该标记整合入细胞基因组的细胞。这样的标记允许鉴定和/或选择整合并表达由该标记编码的蛋白的宿主细胞。病毒载体，特别是逆转录病毒载体，已经在细胞以及活的动物对象中用于各种各样的基因传递应用中。可以使用的病毒载体包括但不限于逆转录病毒、腺相关病毒、痘病毒、杆状病毒、牛痘病毒、单纯疱疹病毒、EB病毒、腺病毒、双生病毒和花椰菜花叶病毒载体。非病毒载体包括质粒、脂质体、带电荷脂质(cytofectins)、DNA-蛋白质复合体和生物聚合物。除了核酸外，载体还可以包括一个或多个调控区域，和/或选择性标记，这些标记可用于选择、测定和监控核酸转移结果(转移到哪些组织，表达的持续时间等)。术语“质粒”是指额外的染色体元件，它们常常携带不是作为细胞的中心代谢的一部分的基因，并且常常是环状双链DNA分子的形式。这样的元件可以是来自任何来源的自主复制序列、基因组整合序列、噬菌体或核苷酸序列，线性、环状或超螺旋的，单链或双链DNA或RNA，其中许多核苷酸序列已经被连接入或重组入独特的结构中，该结构能够将针对所选的基因产物的启动子片段和DNA序列以及合适的3’端非翻译序列导入细胞。“克隆载体”是“复制子”，为核酸优选DNA的单元长度，它按顺序复制，并包含复制起点，例如质粒、噬菌体或粘粒，其上可以连接另一核酸片段从而复制该被连接的片段。克隆载体可以具有在一种细胞类型中复制并在另一细胞类型中表达的能力(“穿梭载体”)。载体可以通过本领域已知的方法导入期望的宿主细胞，例如转染、电穿孔、微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白(参见例如Wu et al.，1992，J.Biol.Chem.267963-967；Wu和Wu，1988，J.Biol.Chem.26314621-14624；和Hartmut et al.，1990年3月15日提交的加拿大专利申请2,012,311)。本发明的多核苷酸也可以通过脂转染体内导入。在过去10年中，使用脂质体体外包囊和转染核酸一直在增加。设计用来限制脂质体介导的转染所遇到的困难和危险的合成阳离子脂质，可以用于制备脂质体，用于体内转染编码标记的基因(Felgner et al.，1987，Proc.Natl.Acad.Sci.U.S.A.847413；Mackey，et al.，1988，Proc.Natl.Acad.Sci.U.S.A.858027-8031；和Ulmer et al.，1993，Science 2591745-1748)。使用阳离子脂质可以促进带负电荷的核酸的包囊，还可以促进与带负电的细胞膜的融合(Felgner and Ringold，1989，Science 337387-388)。国际专利出版物WO95/18863和WO96/17823以及美国专利5,459,127描述了可用于转移核酸的特别有用的脂质化合物和组合物。利用脂转染将外源基因体内导入特定的器官具有某些实践优点。脂质体对特定细胞的分子靶向代表了一个方面的益处。明显的是，针对特定的细胞类型进行转染在具有细胞异质性的组织例如胰腺、肝脏、肾脏和脑中将是特别优选的。脂质可以用化学的方法偶联到其他分子以用于靶向的目的(Mackey，et al.，1988，supra)。被靶向的肽例如激素或神经递质以及蛋白质例如抗体或非肽分子可以通过化学方法偶联到脂质体。其他分子也可用于帮助进行核酸的体内转染，例如阳离子寡肽(例如WO95/21931)、衍生自DNA结合蛋白的肽(例如WO96/25508)或阳离子聚合物(例如WO95/21931)。将载体作为裸DNA质粒体内导入也是可能的(参见美国专利5,693,622、5,589,466和5,580,859)。也可以使用受体介导的DNA传递方法(Curiel et al.，1992，Hum.Gene Ther.3147-154；和Wu和Wu，1987，J.Biol.Chem.2624429-4432)。术语“转染”是指细胞摄取外源或异源RNA或DNA。当外源或异源RNA或DNA已被引入细胞内时，该细胞便被这样的RNA或DNA“转染”。当转染的RNA或DNA影响表型变化时，该细胞便被外源或异源RNA或DNA“转化”。转化RNA或DNA可以被整合入(共价连接入)构成细胞基因组的染色体DNA。“转化”是指将核酸片段转移入宿主生物的基因组，产生遗传上稳定的遗传。含有转化的核酸片段的宿主生物称为“转基因”或“重组”或“转化的”生物。术语“遗传区域”将指包含编码多肽的基因的核酸分子区域或核苷酸序列。此外，包含本发明的多核苷酸的重组载体可以包括一个或多个用于在细胞宿主中复制的起点(在该细胞宿主中多核苷酸的扩增或表达被谋求)、标记或选择性标记。术语“选择性标记”是指鉴定性因子，通常是抗生素或化学品抗性基因、比色标记、酶、荧光标记和类似物，其中抗性基因能够基于标记基因的效应，即对抗生素的抗性、对除草剂的抗性进行选择，其中，所述效应被用于追踪感兴趣的核酸的遗传性，和/或鉴定遗传有感兴趣的核酸的细胞或生物。本技术领域已知并被使用的选择性标记基因的例子包括提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨磷除草剂、磺胺和类似物的抗性的基因；用作表型标记的基因，即花色素苷调控基因、异戊烯转移酶基因和类似物。术语“报道基因”是指编码能够基于该报道基因的效应而被鉴定的鉴定性因子的核酸，其中所述效应被用于追踪感兴趣的核酸的遗传性，鉴定遗传有感兴趣的核酸的细胞或生物，和/或测定基因表达诱导或转录。本技术领域已知并被使用的报道基因的例子包括荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰基转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸酶(Gus)和类似物。选择性标记基因也可以考虑用作报道基因。“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。一般而言，编码序列位于启动子序列的3’端。启动子可以整体源自天然基因，或由源自天然发现的不同启动子的不同元件组成，或甚至包括合成的DNA片段。本领域技术人员应该理解的是，不同的启动子可以指导基因在不同的组织或细胞类型中，或在发育的不同阶段，或应答于不同的环境或生理条件进行表达。导致基因在大多数细胞类型中在大多数的时间被表达的启动子通常称为“组成型启动子”。导致基因在特定的细胞类型中被表达的启动子通常称为“细胞特异性启动子”或“组织特异性启动子”。导致基因在特定的发育或细胞分化阶段被表达的启动子通常称为“发育特异性启动子”或“细胞分化特异性启动子”。在将细胞暴露于诱导启动子的药剂、生物分子、化学品、配体、光或类似物，或用这些物质对细胞进行处理之后，被诱导并导致基因被表达的启动子通常被称为“诱导型启动子”或“调控型启动子”。还应该认识的是，因为在大多数情况下，调控序列的准确界限还没有完全限定，所以不同长度的DNA片段可能具有相同的启动子活性。“启动子序列”是能够结合细胞中RNA聚合酶，并启动下游(3’方向)编码序列的转录的DNA调控区域。为了定义本发明的目的，启动子序列的范围被界定为其3’端至转录起始位点，并向上游(5’方向)延伸，包括以高于背景的可检测水平启动转录所必需的最小数目的碱基或元件。在启动子序列内，将发现转录起始位点(该位点例如可以通过用核酸酶S1作图方便地确定)和负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。当RNA聚合酶将编码序列转录成mRNA，然后mRNA进行反式RNA剪接(如果该编码序列含有内含子的话)，并翻译成由该编码序列编码的蛋白时，该编码序列便在细胞中处于转录和翻译控制序列的“控制之下”。“转录和翻译控制序列”是DNA调控序列，例如启动子、增强子、终止子、和类似物，其使得编码序列能够在宿主细胞中表达。在真核细胞中，多腺苷酸化信号是控制序列。术语“应答元件”是指一个或多个顺式作用DNA元件，其赋予启动子通过与第一嵌合基因的DNA结合结构域的相互作用介导的应答性。该DNA元件可以在其序列中具有回文结构(精确的或不精确的)，或由被可变数目的核苷酸隔开的序列基序或半位点组成。半位点可以是相似的或相同的，并以同向重复或反向重复排列，或以单个半位点或相邻半位点串联形成的多聚体排列。取决于应答元件将要被整合入的细胞或生物的属性，该应答元件可以包含分离自不同生物的最小的启动子。在配体存在或不存在的情况下，第一杂合蛋白的DNA结合结构域结合于应答元件的DNA序列，从而在该应答元件的调控下启动或抑制下游基因的转录。天然蜕皮激素受体的应答元件的DNA序列的例子包括RRGG/TTCANTGAC/ACYY(参见Cherbas L，et.al.，(1991)，Genes Dev.5，120-131)；AGGTCAN(n)AGGTCA，其中N(n)可以是一个或多个间隔核苷酸(参见D′Avino PP.，et.al.，(1995)，Mol.Cell.Endocrinol，113，1-9)；和GGGTTGAATGAATTT(参见Antoniewski C.，et.al.，(1994).Mol.Cell Biol.14，4465-4474)。术语“可操作性连接”是指核酸序列连接在单个核酸片段上，从而一条核酸序列的功能受到其他核酸序列的影响。例如，当启动子能够影响编码序列的表达时(即，编码序列在启动子的转录控制之下)，则启动子可操作性地与编码序列连接。编码序列可以以有义或反义方向与调控序列可操作性地连接。如本文中所用，术语“表达”是指衍生自核酸或多核苷酸的有义(mRNA)或反义RNA的转录和稳定积聚。表达也可以指mRNA翻译成蛋白或多肽。术语“盒”、“表达盒”和“基因表达盒”是指可以在特定的限制性位点或通过同源重组插入核酸或多核苷酸的DNA片段。DNA片段包含编码感兴趣的多肽的多核苷酸，该盒和限制性位点经过设计以确保能够将该盒插入正确的转录和翻译阅读框。“转化盒”是指包含编码感兴趣的多肽的多核苷酸并且除了所述多核苷酸外还具有帮助转化特定宿主细胞的元件的特定载体。本发明的盒、表达盒、基因表达盒和转化盒也可以包含增强编码感兴趣的多肽的多核苷酸在宿主细胞中的表达的元件。这些元件可以包括但不限于启动子、最小启动子、增强子、应答元件、终止子序列、多腺苷酸化序列和类似元件。对于本发明的目的，术语“基因开关”是指与启动子相关联的应答元件和基于EcR的系统的组合，其在一种或多种配体存在的情况下，调节整合有该应答元件和启动子的基因的表达。术语“调节”是指诱导、减少或抑制核酸或基因表达，分别导致蛋白或多肽生产的诱导、减少或抑制。本发明的质粒或载体还可以包含适于驱使基因在宿主细胞中表达的至少一个启动子。术语“表达载体”是指被设计成使得插入的核酸序列在转化入宿主后能够表达的载体、质粒或媒介。克隆的基因，即，插入的核酸序列，通常被置于控制元件例如启动子、最小启动子、增强子或类似控制元件的控制之下。启动控制区域或启动子可用于驱使核酸在期望的宿主细胞中表达，它们数量众多，并且为本领域技术人员所熟悉。事实上，能够驱动这些基因的任何启动子都适合于本发明，包括但不限于病毒启动子、细菌启动子、动物启动子、哺乳动物启动子、合成启动子、组成型启动子、组织特异性启动子、发育特异性启动子、诱导型启动子、光调控启动子；CYC1、HIS3、GAL1、GAL4、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI、碱性磷酸酶启动子(用于在酵母属(Saccharomyces)中的表达)；AOX1启动子(用于在毕赤酵母(Pichia)中的表达)；β-内酰胺酶、lac、ara、tet、trp、lpL、lPR、T7、tac和trc启动子(用于在大肠杆菌(Escherichia coli)中的表达)；光调控的、种子特异性的、花粉特异性的、子房特异性的、发病机理或疾病相关的、花椰菜花叶病毒35S、CMV 35S最小、木薯叶脉花叶病毒(CsVMV)、叶绿素a/b结合蛋白、核酮糖1，5-二磷酸羧化酶、芽枝特异性的、根特异性的、几丁质酶、应激诱导型的、水稻东格鲁杆状病毒、植物超级启动子(plant super-promoter)、马铃薯亮氨酸氨肽酶、硝酸盐还原酶、甘露氨酸合成酶、胭脂氨酸合成酶、泛蛋白、玉米醇溶蛋白和花色苷启动子(用于在植物细胞中的表达)；本领域已知的动物和哺乳动物启动子包括但不限于SV40早期(SV40e)启动子区域、包含在劳斯肉瘤病毒(RSV)的3’长末端重复(LTR)中的启动子、腺病毒(Ad)的E1A或主要晚期启动子(MLP)基因的启动子、巨细胞病毒(CMV)早期启动子、单纯疱疹病毒(HSV)胸苷激酶(TK)启动子、杆状病毒IE1启动子、延伸因子1α(EF1)启动子、磷酸甘油酸激酶(PGK)启动子、泛蛋白(Ubc)启动子、白蛋白启动子、小鼠金属硫蛋白的调控序列L启动子和转录控制区、遍在启动子(HPRT、波形蛋白、α-肌动蛋白、微管蛋白和类似物)、中间纤维的启动子(结蛋白、神经纤丝蛋白、角蛋白、GFAP和类似物)、治疗性基因的启动子(MDR、CFTR或VIII类因子和类似物的启动子)、发病或疾病相关启动子，以及显示出组织特异性并已用于转基因动物的启动子，例如在胰腺腺泡细胞中具有活性的弹性蛋白酶I基因控制区；在胰腺β细胞中具有活性的胰岛素基因控制区；在淋巴细胞中具有活性的免疫球蛋白基因控制区；在睾丸、乳房、淋巴和肥大细胞中具有活性的小鼠乳腺肿瘤病毒控制区域；在肝脏中具有活性的白蛋白基因、Apo AI和Apo AII控制区；在肝脏中具有活性的α-甲胎蛋白基因控制区；在肝脏中具有活性的α1-抗胰蛋白酶基因控制区；在骨髓细胞中具有活性的β-球蛋白基因控制区；在脑的少突胶质细胞中具有活性的髓磷脂碱蛋白基因控制区；在骨骼肌中具有活性的肌球蛋白轻链-2基因控制区，以及在下丘脑中具有活性的促性腺激素释放激素基因控制区，丙酮酸激酶启动子，绒毛蛋白启动子，脂肪酸结合肠蛋白的启动子，平滑肌细胞α-肌动蛋白的启动子和类似物。此外，通过加入增强子或调控序列和类似物，这些表达序列可以被修饰。可以用于本发明的实施方案的增强子包括但不限于SV40增强子、巨细胞病毒(CMV)增强子、延伸因子1(EF1)增强子、酵母增强子、病毒基因增强子和类似物。终止控制区，即，终止子或多腺苷酸化序列，也可以来自对于优选的宿主而言为天然的各种基因。可选地，终止位点并非必需，然而，最优选的情况是包括终止位点。在本发明优选的实施方案中，终止控制区域可以包括或来自合成序列、合成的多腺苷酸化信号、SV40晚期多腺苷酸化信号、SV40多腺苷酸化信号、牛生长激素(BGH)多腺苷酸化信号、病毒终止子序列或类似物。术语“3′非编码序列”或“3′非翻译区(UTR)”是指位于编码序列下游(3′)的DNA序列，并且可以包含多腺苷酸化[多(A)]识别序列和编码能够影响mRNA加工或基因表达的调控信号的其他序列。多腺苷酸化信号通常是通过将多腺苷酸序列束加入到mRNA前体的3’末端来表征的。“调控区域”是指调控第二核酸序列的表达的核酸序列。调控区域可以包括在自然情况下负责表达特定核酸的序列(同源区域)，或可以包括负责表达不同的蛋白或甚至合成蛋白的不同来源的序列(异源区域)。特别地，序列可以是以特异性或非特异性方式和以诱导型或非诱导型方式刺激或抑制基因转录的原核、真核或病毒基因序列或衍生的序列。调控区域包括复制起点、RNA剪接位点、启动子、增强子、转录终止序列和指导多肽进入目标细胞的分泌途径的信号序列。“异源来源”的调控区域是与被表达的核酸并不天然连接的调控区域。异源调控区域包括来自不同种的调控区域、来自不同基因的调节区域、杂合调控序列和在天然情况下并不存在而是由本领域普通技术人员设计出的调控区域。“RNA转录物”是指经RNA聚合酶催化由DNA序列转录而得的产物。当RNA转录物是DNA序列的精确互补的拷贝时，它被称为初级转录物，或者它可以是对初级转录物进行转录后加工所产生的RNA序列，这被称为成熟RNA。“信使RNA(mRNA)”是指无内含子并可以被细胞翻译成蛋白的RNA。“cDNA”是指与mRNA互补并源自mRNA的双链DNA。“有义”RNA是指包括mRNA并因此可以被细胞翻译成蛋白的RNA转录物。“反义RNA”是指与目标初级转录物或mRNA的全部或部分互补并且阻断目标基因表达的RNA转录物。反义RNA的互补性可以在特定的基因转录物的任何部分，即，在5’非编码序列、3’非编码序列或编码序列。“功能RNA”是指反义RNA、核酶RNA或不被翻译但对细胞进程有影响的其他RNA。“多肽”是由共价连接的氨基酸残基组成的聚合化合物。氨基酸具有下述通用结构根据侧链R，氨基酸被分为七组(1)脂肪族侧链，(2)含有羟基(OR)基团的侧链，(3)含有硫原子的侧链，(4)含有酸性基团或酰胺基团的侧链，(5)含有碱性基团的侧链，(6)含有芳香环的侧链，和(7)脯氨酸，一种侧链与氨基基团稠合的亚氨酸。本发明的多肽优选包含至少大约14个氨基酸。“蛋白质”是在活细胞中发挥结构或功能作用的多肽。“分离的多肽”或“分离的蛋白”是基本上没有那些在其天然状态下通常与其相随的化合物(例如，其他蛋白或多肽、核酸、碳水化合物、脂类)的多肽或蛋白。“分离的”并不旨在排除与其他化合物形成的人工或合成的混合物，或并不排除存在有不干扰生物活性以及例如因不彻底的纯化、加入稳定剂或混合形成药学上可接受的制剂而可能存在的杂质。将被理解的是，“置换突变多肽”或“置换突变体”是指与野生型或天然存在的多肽相比包含至少一个(1)野生型或天然存在的氨基酸用不同的氨基酸取代的突变多肽。置换突变多肽可以仅仅包含一个(1)野生型或天然存在的氨基酸置换，并可以称为“点突变”或“单点突变”多肽。作为选择，与野生型或天然存在的多肽相比，置换突变多肽可以包含两个(2)或更多个野生型或天然存在的氨基酸用2个或更多个氨基酸进行的置换。根据本发明，与野生型或天然存在的H组核受体配体结合结构域多肽相比，包含置换突变的H组核受体配体结合结构域多肽包含至少一个(1)野生型或天然存在的氨基酸用不同的氨基酸进行的取代。在置换突变多肽包含两个(2)或更多个野生型或天然存在的氨基酸的置换时，一种情况是该置换可以对等同数量的删除的野生型或天然存在的氨基酸进行置换，即，2个野生型或天然存在的氨基酸用2个非野生型或非天然存在的氨基酸替换，另一种情况是对非等同数量的删除的野生型氨基酸进行置换，即，2个野生型氨基酸用1个非野生型氨基酸替换(置换+删除突变)，或2个野生型氨基酸用3个非野生型氨基酸替换(置换+插入突变)。置换突变可以用缩写命名系统进行描述，以指出该氨基酸残基和在参考多肽序列中所处的编号以及新的置换的氨基酸残基。例如，多肽的第20个氨基酸残基被置换的置换突变体可以缩写为″x20z″，其中″x″表示将被替换的氨基酸，″20″表示该氨基酸残基在多肽中的位置或编号，″z″表示新的替换的氨基酸。因此，缩写为″E20A″或″Glu20Ala″的置换突变体表示该突变体在多肽的位置20用丙氨酸残基(本技术领域通常缩写为″A″或″Ala″)替换谷氨酸(本技术领域通常缩写为″E″或″Glu″)。突变或突变体可以是任何改变，包括但不限于置换、删除、插入或其任何组合。可以用本领域已知的任何诱变技术进行置换突变，包括但不限于体外定点诱变(Hutchinson，C.，et al.，1978，J.Biol.Chem.2536551；Zoller和Smith，1984，DNA 3479-488；Oliphant et al.，1986，Gene 44177；Hutchinson et al.，1986，Proc.Natl.Acad.Sci.U.S.A.83710)，使用TAB接头(Pharmacia)，限制性内切核酸酶消化/片段删除和置换，PCR介导的/寡核苷酸介导的诱变，和类似方法。定点诱变优选基于PCR的技术(参见Higuchi，1989，″Using PCR to Engineer DNA″，PCRTechnologyPrinciples and Applications for DNA Amplification，H.Erlich，ed.，Stockton Press，第6章，第61-70页)。本发明的多肽的“片段”将理解为指氨基酸序列比参考多肽的氨基酸序列短的多肽，并且其在这些参考多肽的整个部分内，包含相同的氨基酸序列。如果合适的话，这样的片段可以被包括在更大的多肽内，而所述片段是该更大多肽的一部分。本发明多肽的这样的片段的长度可以为至少2、3、4、5、6、8、10、13、14、15、16、17、18、19、20、21、22、25、26、30、35、40、45、50、100、200、240或300个氨基酸。多肽或蛋白的“变体”是源自多肽或蛋白并保留该多肽或蛋白的至少一种生物学特性的任何类似物、片段、衍生物或突变体。多肽或蛋白的不同变体可以存在于自然界中。这些变体可以是由编码蛋白的结构基因的核苷酸序列中的差异表征的等位基因突变体，或可以涉及差异性剪接或翻译后修饰。技术人员可以制备具有单个或多个氨基酸置换、删除、添加或替代的变体。这些变体可以包括(a)其中一个或多个氨基酸残基被保守的或非保守的氨基酸置换的变体；(b)其中一个或多个氨基酸被加入到多肽或蛋白的变体；(c)其中一个或多个氨基酸包括取代基团的变体；和(d)其中多肽或蛋白与另一多肽例如血清白蛋白融合的变体；等等。获得这些变体的技术是本领域普通技术人员所知晓的，包括遗传技术(抑制、剔除、突变等)、化学技术和酶技术。变体多肽优选包含至少大约14个氨基酸。“异源蛋白”是指并非细胞天然产生的蛋白。“成熟蛋白”是指翻译后加工得到的多肽，即，初级翻译产物中存在的任何前肽或肽原已从其中被去除的一种多肽。“前体”蛋白是指mRNA的初级翻译产物；即，前肽和肽原依然存在。前肽和肽原可以是但不限于胞内定位信号。术语“信号肽”是指分泌的成熟蛋白前面的氨基端多肽。信号肽与成熟蛋白割裂开，因此成熟蛋白中没有信号肽。信号肽具有将分泌的蛋白引导并转运通过细胞膜的功能。信号肽也称作信号蛋白。“信号序列”被包括在将被表达在细胞表面的蛋白的编码序列的开始位置。该序列编码成熟多肽的N-端的信号肽，信号肽指导宿主细胞转运多肽。术语“转运信号序列”在此用来指代这类信号序列。可以发现转运信号序列与真核和原核细胞中天然的各种蛋白相连，并常常在两类生物中具有功能。术语“同源性”是指两个多核苷酸或两个多肽部分之间的同一性百分比。利用本领域已知的技术可以测定一个部分与另一部分的序列之间的一致性。例如，通过比对序列信息并使用容易获取的计算机程序，对两个多肽分子之间的序列信息直接进行比较，可以确定同源性。作为选择，通过在同源区域之间形成稳定的双链体的条件下对多核苷酸进行杂交，然后用单链特异性核酸酶消化并测定消化的片段的大小，可以确定同源性。如在此所使用，术语“同源”所有的语法形式和拼写变化形式是指拥有“共同进化起源”的蛋白之间的关系，包括来自超家族(例如免疫球蛋白超家族)的蛋白和来自不同种的同源蛋白(例如肌球蛋白轻链等)(Reeck et al.，1987，Cell 50667.)。这样的蛋白(和它们的编码基因)具有序列同源性，正如它们高度的序列相似性所反映。然而，在通常的用法和本申请中，当用副词例如“高度的”来修饰术语“同源”时，该术语可以指序列相似性而不是共同的进化起源。因此，术语“序列相似性”所有的语法形式是指可以或不必享有共同进化起源的蛋白的核酸或氨基酸序列之间的同一性或一致性程度(参见Reeck et al.，1987，Cell 50667)。在特定的实施方案中，当在限定长度的DNA序列范围内有至少大约50％(优选至少大约75％、最优选地至少大约90或95％)的核苷酸匹配时，这两个DNA序列“实质上同源”或“实质上相似”。通过使用可从序列数据库中获取的标准软件进行序列比较，或在例如针对特定系统所限定的严格条件下进行的Southern杂交试验中，可以鉴定基本上同源的序列。限定合适的杂交条件是在本领域的技术范围之内。参见Sambrook et al.，1989，supra。如本文所使用地，术语“实质上相似”是指这样的核酸片段，其中一个或多个核苷酸碱基的变化导致一个或多个氨基酸的置换，但是并不影响由该DNA序列编码的蛋白的功能特性。“实质上相似”同样指这样的核酸片段，其中一个或多个核苷酸碱基的变化并不影响该核酸片段通过反义或共抑制技术介导改变基因表达的能力。“实质上相似”也指对本发明的核酸片段进行的修饰，例如删除或插入一个或多个核苷酸碱基，这并不实质上影响到所得转录物的功能特性。因此可以理解的是，本发明所包含的不仅仅是这些特定的示例性序列。各种提议的修饰都完全在本领域的常规技术的范围内，测定被编码的产物的生物学活性的保留也是如此。此外，技术人员认识到本发明所包含的实质上相似的序列也由它们在严格条件(0.1×SSC，0.1％SDS，65℃和用2×SSC，0.1％SDS洗涤，再用0.1×SSC，0.1％SDS洗涤)下与在此示例的序列的杂交能力来限定。本发明的实质上相似的核酸片段是那些其DNA序列与在此报告的核酸片段的DNA序列具有至少70％同一性的核酸片段。本发明的优选的实质上相似的核酸片段是那些其DNA序列与在此报告的核酸片段的DNA序列具有至少80％同一性的核酸片段。更优选的核酸片段与在此报告的核酸片段的DNA序列具有至少90％同一性。甚至更优选的是与在此报告的核酸片段的DNA序列具有至少95％同一性的核酸片段。当大约40％以上的氨基酸相同，或60％以上氨基酸相似(功能上相同)时，这两个氨基酸序列“实质上同源”或“实质上相似”。优选地，通过使用例如GCG(Genetics Computer Group，Program Manual for the GCG Package，Version 7，Madison，Wisconsin)pileup程序进行比对，鉴定相似或同源的序列。术语“对应于”用于本文是指相似的或同源的序列，无论该确切的位置与同其进行相似性或同源性测量的分子相同或不同。核酸或氨基酸序列比对可以包括空位。因此，术语“对应于”是指序列相似性，而不是氨基酸残基或核苷酸碱基的编号。氨基酸或核苷酸序列的“实质部分”包括多肽足够的氨基酸序列或基因足够的核苷酸序列，从而足以推测性地鉴定那个多肽或基因，这通过本领域技术人员对序列进行手工评价来进行，或者通过使用算法诸如BLAST(Basic LocalAlignment Search Tool；Altschul，S.F.，et al.，(1993)J. Mol.Biol.215403-410；也参见www.ncbi.nlm.nih.gov/BLAST/)进行计算机自动化序列比较和鉴定来进行。一般而言，为了推测性地鉴定与已知的蛋白或基因同源的多肽或核酸序列，10个或更多个连续氨基酸或30个或更多个核苷酸的序列是必需的。而且，对于核苷酸序列，包含20-30个连续核苷酸的基因特异性寡核苷酸探针可以用于序列依赖性的基因鉴定方法(例如Southern杂交)和基因分离方法(例如细菌菌落或噬菌体噬菌斑的原位杂交)。此外，12-15个碱基的短的寡核苷酸可以用作PCR的扩增引物，以便获得包含所述引物的特定核酸片段。因此，核苷酸序列的“实质部分”包含足够的序列，足以特异性地鉴定和/或分离包含该序列的核酸片段。如本领域所知道的，术语“同一性百分比”是指两条或更多多肽序列之间或两条或更多多核苷酸序列之间的关系，正如通过比较序列所确定的。在该技术领域，“同一性”也指多肽或多核苷酸序列之间的序列相关性程度，这种情况时，可以通过这些序列的链之间的匹配来测定。“同一性”和“相似性”可以用已知的方法容易地计算，包括但不限于描述于下述文献中的方法Computational MolecularBiology(Lesk，A.M.，ed.)Oxford University Press，New York(1988)；BiocomputingInformatics and Genome Projects(Smith，D.W.，ed.)Academic Press，New York(1993)；Computer Analysis of Sequence Data，Part I(Griffin，A.M.和Griffin，H.G，eds.)Humana Press，New Jersey(1994)；Sequence Analysis in Molecular Biology(vonHeinje，G，ed.)Academic Press(1987)；和Sequence Analysis Primer(Gribskov，M.和Devereux，J.，eds.)Stockton Press，New York(1991)。测定同一性的优选方法被设计以便得到测试序列之间的最佳匹配。测定同一性和相似性的方法编入公开可获得的计算机程序中。可以应用LASERGENE bioinformatics computing suite的Megalign程序(DNASTAR Inc.，Madison，WI)进行序列比对并计算同一性百分比。可以应用带有默认参数(GAP PENALTY＝10、GAP LENGTH PENALTY＝10)的Clustal比对方法(Higgins和Sharp(1989)CABIOS.5151-153)进行多序列比对。使用Clustal方法的配对比对的默认参数可以被选择KTUPLE 1，GAP PENALTY＝3，WINDOW＝5和DIAGONALS SAVED＝5。术语“序列分析软件”是指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可以通过商业途经获得或独立开发。典型的序列分析软件将包括但不限于GCG程序组(Wisconsin Package Version 9.0，GeneticsComputer Group(GCG)，Madison，WI)、BLASTP、BLASTN、BLASTX(Altschul et al.，J. Mol.Biol.215403-410(1990)和DNASTAR(DNASTAR，Inc.1228 S.Park St.Madison，WI 53715 USA)。在本申请的上下文中，应该理解，当序列分析软件用于分析时，分析的结果将基于所参考的程序的“默认值”，除非另外指出。如本文中所使用的，“默认值”指当第一次预置时软件最初加载的任何一组值或参数。“合成基因”可以由使用本领域技术人员已知的程序化学合成的寡核苷酸构建模块装配而成。这些构建模块被连接起来并退火，从而形成基因片段，然后将基因片段酶法装配以构建整个基因。“化学合成”，当涉及DNA序列时，是指核苷酸组分在体外被装配。使用充分建立的程序可以完成DNA的人工化学合成，或者使用许多商业上可得的机器中的一种可以进行自动化化学合成。因此，基于为了反映出宿主细胞的密码子偏爱性的核苷酸序列优化，基因可以被修改以获得最佳的基因表达。如果使密码子使用偏向于宿主所喜好的那些密码子，技术人员将有可能成功地进行基因表达。基于对来自序列信息可获得的宿主细胞的基因的调查，可以确定优选的密码子。如本文所使用，当a)给定的系统中的每一个系统被其各自的配体以选定的浓度调节，导致该系统的基因的表达程度发生可测量的变化；和b)不论实际进行的调节是同时进行还是顺序进行，所述变化在统计学上与在细胞、组织或生物体中同时可操作的所有其他系统的表达变化明显不同时，这两个或更多个分别可操作的基因调控系统便认为是“正交的”。优选地，对各个可操作的基因调控系统的调节产生比在细胞、组织或生物体中的所有其他可操作的系统大至少2倍的基因表达变化。更优选地，变化为至少5倍以上。甚至更优选地，变化为至少10倍以上。还有更优选地，变化为至少100倍以上。甚至还有更优选地，变化为至少500倍以上。理想地，每一个给定的系统被选定浓度的各自的配体调节，导致该系统的基因的表达程度发生可测量的变化，而在细胞、组织或生物体中可操作的所有其他系统的表达没有可测量的变化。在这样的情况下，该多重诱导型基因调控系统可以认为是“完全正交的”。本发明可用于搜索正交配体和基于正交受体的基因表达系统，诸如在共同在审的美国专利申请09/965,697中所描述的那些，该申请整体并入本文作为参考。
本发明的基因表达调节系统
申请人在此已经鉴定了参与配体与H组核受体配体结合结构域结合的氨基酸残基，所述氨基酸残基影响配体敏感性和基于蜕皮激素受体的诱导型基因表达系统的诱导程度。申请人在此描述了在这些关键残基处包含置换突变(本文称为“置换突变体”)的H组核受体的构建，并且证明了这些置换突变核受体可用于调节基因表达的方法。如本文所呈现，申请人的新型置换突变核受体和它们在基于核受体的诱导型基因表达系统中的应用，在原核和真核宿主细胞中提供了改进的诱导型基因表达系统，在其中，如果需要，根据用途，可以对配体敏感性和反式激活的程度加以选择。因此，本发明涉及新型的置换突变型H组核受体多核苷酸和多肽、包含这样的突变的H组核受体多核苷酸和多肽的基于核受体的诱导型基因表达系统，以及使用这样的基于核受体的诱导型基因表达系统在宿主细胞中调控基因表达的方法。特别地，本发明涉及包含至少一个基因表达盒的基因表达调节系统，该基因表达盒能够在宿主细胞中被表达，包括编码多肽的多核苷酸，所述多肽包括含有置换突变的H组核受体配体结合结构域。优选地，包含置换突变的H组核受体配体结合结构域来自蜕皮激素受体、遍在受体、孤独受体1、NER-1、类固醇激素核受体1、类视黄醇X受体相互作用蛋白-15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、类法尼醇X受体、受体相互作用蛋白14和法呢醇受体。更优选地，包含置换突变的H组核受体配体结合结构域来自蜕皮激素受体。在特定的实施方案中，基因表达调节系统包含基因表达盒，该基因表达盒包含编码多肽的多核苷酸，所述多肽包括反式激活结构域，识别应答元件的DNA结合结构域，所述应答元件与其表达待被调节的基因相连接；以及含有置换突变的H组核受体配体结合结构域。基因表达调节系统还可以包括第二基因表达盒，包括i)被第一基因表达盒的被编码多肽的DNA结合结构域识别的应答元件；ii)被第一基因表达盒的被编码多肽的反式激活结构域激活的启动子；和iii)其表达待被调节的基因。在另一特定的实施方案中，基因表达调节系统包括基因表达盒，该表达盒包含a)编码多肽的多核苷酸，所述多肽包含反式激活结构域、识别应答元件的DNA结合结构域，所述应答元件与其表达待被调节的基因连接；所述多肽还包含含有置换突变的H组核受体配体结合结构域，和b)第二核受体配体结合结构域，选自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域、超气门蛋白配体结合结构域和包含两个多肽片段的嵌合配体结合结构域，其中第一多肽片段来自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域，第二多肽片段来自不同的脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域。基因表达调节系统还可以包括第二基因表达盒，包含i)被第一基因表达盒的被编码多肽的DNA结合结构域识别的应答元件；ii)被第一基因表达盒的被编码多肽的反式激活结构域激活的启动子；和iii)其表达待被调节的基因。在另一特定的实施方案中，基因表达调节系统包含第一基因表达盒和第二基因表达盒，第一基因表达盒包含编码第一多肽的多核苷酸，所述第一多肽包含识别应答元件的DNA结合结构域和核受体配体结合结构域，所述应答元件与其表达待被调节的基因连接，第二基因表达盒包含编码第二多肽的多核苷酸，所述第二多肽包含反式激活结构域和核受体配体结合结构域，其中，核受体配体结合结构域中的一个是包含置换突变的H组核受体配体结合结构域。在优选的实施方案中，第一多肽基本上无反式激活结构域，第二多肽基本上无DNA结合结构域。对于本发明的目的，“基本上无”指讨论中的蛋白不含有足够的讨论中的结构域的序列，以赋予激活或结合活性。基因表达调节系统还可以包括第三基因表达盒，包含i)被第一基因表达盒的第一多肽的DNA-结合结构域识别的应答元件；ii)被第二基因表达盒的第二多肽的反式激活结构域激活的启动子；和iii)其表达待被调节的基因。当只有一个核受体配体结合结构域是包含置换突变的H组配体结合结构域时，另一个核受体配体结合结构域可以来自任何其他的核受体，其与包含置换突变的H组配体结合结构域形成二聚体。例如，当包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域时，另一个核受体配体结合结构域(“伴侣”)可以来自蜕皮激素受体、脊椎动物类视黄醇X受体(RXR)、无脊椎动物RXR、超气门蛋白(USP)，或包含至少两个不同的核受体配体结合结构域多肽片段的嵌合核受体，所述多肽片段选自脊椎动物RXR、无脊椎动物RXR和RXR(参见共同在审专利申请PCT/US01/09050、US60/294,814和US60/294,819，在此整体引入作为参考)。“伴侣”核受体配体结合结构域还可以包括截短突变、剔除突变、置换突变或其他修饰。优选地，脊椎动物RXR配体结合结构域来自人Homo sapiens、小家鼠Musmusculus、褐家鼠Rattus norvegicus、原鸡Gallus gallus、猪Sus scrofa domestica、非洲爪蟾Xenopus laevis、斑马鱼Danio rerio、被囊动物Polyandrocarpa misakiensis或水母Tripedalia cysophora RXR。优选地，无脊椎动物RXR配体结合结构域来自飞蝗Locusta migratoriaRXR多肽(″LmRXR″)、美洲花蜱Amblyomma americanum RXR同源物1(″AmaRXR1″)、美洲花蜱Amblyomma americanum RXR同源物2(″AmaRXR2″)、招潮蟹Celuca pugilator RXR同源物(″CpRXR″)、甲虫黄粉虫Tenebrio molitor RXR同源物(″TmRXR″)、蜜蜂Apis mellifera RXR同源物(″AmRXR″)、桃蚜Myzuspersicae RKR同源物(″MpRXR″)、或非-双翅昆虫/非-鳞翅昆虫RXR同源物。优选地，嵌合RXR配体结合结构域包括至少两个多肽片段，选自脊椎动物种RXR多肽片段、无脊椎动物种RXR多肽片段和非双翅昆虫/非鳞翅昆虫无脊椎动物种RXR同源多肽片段。用于本发明的嵌合RXR配体结合结构域可以包括至少两个不同的物种的RXR多肽片段，或当物种相同的时候，这两个或更多个多肽片段可以来自该物种RXR多肽片段的两个或更多个不同的同种型。在优选的实施方案中，嵌合RXR配体结合结构域包含至少一个脊椎动物种RXR多肽片段和一个无脊椎动物种RXR多肽片段。在更优选的实施方案中，嵌合RXR配体结合结构域包含至少一个脊椎动物种RXR多肽片段和一个非双翅昆虫/非鳞翅昆虫无脊椎动物种RXR同源物多肽片段。在特定的实施方案中，其表达待被调节的基因是宿主细胞的同源基因。在另一特定的实施方案中，其表达待被调节的基因是宿主细胞的异源基因。如下所述的用于本发明的配体与核受体的配体结合结构域组合，核受体又结合到与基因连接的应答元件，这时便提供了对基因的表达进行外部临时调控的手段。本发明的各种成分相互结合的结合机制或顺序，即，例如，配体与配体结合结构域、DNA结合结构域与应答元件、反式激活结构域与启动子等的结合机制或顺序等，并不是关键的。在特定的例子中，配体与H组核受体的配体结合结构域和它的核受体配体结合结构域伴侣的结合使得能够进行基因的表达或抑制。该机制并不排除配体结合H组核受体(GHNR)或它的伴侣和形成活性同源二聚体复合体的可能(例如GHNR+GHNR或伴侣+伴侣)。优选地，受体结构域中的一个或多个是可变的，从而产生杂合基因开关。典型地，DBD、LBD和反式激活结构域这三个结构域中的一个或多个可以选自与其他结构域的来源不同的来源，以便优化杂合基因和所得到的杂合蛋白在所选择的宿主细胞或生物中的反式激活活性、配体互补结合性和特定应答元件的识别。此外，应答元件本身可以进行修饰，或者用其他DNA结合蛋白结构域的应答元件或合成的应答元件替换，以适应杂合受体，所述其他的DNA结合蛋白例如酵母的GAL-4蛋白(参见Sadowski，et al.(1988)，Nature，335563-564)或大肠杆菌的LexA蛋白(参见Brent和Ptashne(1985)，Cell，43729-736)，而所述合成的应答元件对与经过设计、修饰和选择以进行特异性相互作用的蛋白的目标相互作用具有特异性(参见例如Kim，et al.(1997)，Proc.Natl.Acad.Sci.，USA，943616-3620)。双杂合系统的另一优点是它们允许根据期望的最终结果对用于驱动基因表达的启动子进行选择。这样的双重控制在基因疗法领域，特别当产生的是毒性蛋白时特别重要，这是因为可以对表达的时机以及发生表达的细胞进行控制。当可操作性地连接到合适的启动子的基因被导入对象的细胞时，借助于本发明的系统的存在，该外源基因的表达得以控制。启动子可以以组成型或诱导型的方式被调控，或者可以是组织特异性的(即，仅在特定的细胞类型中表达)或对生物体的某些发育阶段具有特异性。蜕皮激素受体是核受体超家族的成员，归入亚家族1，H组(本文称为“H组核受体”)。每一组的成员在E(配体结合)结构域中享有40-60％的氨基酸同一性(Laudet et al.，A Unified Nomenclature System for the Nuclear Resceptor Subfamily，1999；Cell 97161-163)。除了蜕皮激素受体，该核受体亚家族1，H组的其他成员包括遍在受体(UR)、孤独受体1(OR-1)、类固醇激素核受体1(NER-1)、类视黄醇X受体相互作用蛋白-15(RIP-15)、肝脏X受体β(LXRβ)、类固醇激素受体样蛋白(RLD-1)、肝脏X受体(LXR)、肝脏X受体α(LXRa)、类法呢醇X受体(FXR)、受体相互作用蛋白14(RIP-14)和法呢醇受体(HRR-1)。申请人:已经开发了CfEcR同源模型，并已经应用这个同源模型与公开的Chironomous tetans蜕皮激素受体(“CtEcR”)同源模型(Wurtz et al.，2000)来鉴定参与结合蜕皮类固醇和非蜕皮类固醇的关键残基。已经显示，合成的非蜕皮类固醇、二酰肼以高亲和力结合鳞翅类EcRs，并诱导这些昆虫发生早熟性不完全蜕皮(Winget al.，1988)，这些化合物中的一些目前作为杀虫剂出售。EcRs的配体结合腔(cavity)或“袋(pocket)”已经进化以配合蜕皮类固醇例如20-羟基蜕皮激素(20E)的长主架结构。与蜕皮类固醇相比，二酰肼具有紧密的结构，仅仅占据EcR结合袋的底部部分。这使得结合袋的顶部具有一些关键残基，它们与蜕皮类固醇而不与非蜕皮类固醇例如二酰肼接触。申请人在此描述了在这些结合袋残基处包含有置换突变的突变型蜕皮激素受体的构建，并已经鉴定了若干类具有改变的配体结合特征和反式激活特征的置换突变蜕皮激素受体。考虑到蜕皮激素受体与其他H组核受体的密切相关性，申请人鉴定的蜕皮激素受体配体结合结构域置换突变在被导入其他H组核受体的配体结合结构域的类似位置以修改它们的配体结合性或配体敏感性时，也有望发挥作用。使用本技术领域常规的方法例如序列分析、通过同源建模和结合分析来分析结合袋的方法，本领域技术人员能够鉴定出序列和功能上的类似氨基酸位置。申请人的新型的置换突变H组核受体多核苷酸和多肽可用于基于核受体的诱导型基因调节系统，用于各种应用中，包括基因治疗、在宿主细胞中表达感兴趣的蛋白、产生转基因生物以及基于细胞的分析。特别地，申请人在此描述了新型的基因表达调节系统，该系统包括含有置换突变的H组核受体配体结合结构域。该基因表达系统可以是基于“单开关”的基因表达系统，其中反式激活结构域、DNA结合结构域和配体结合结构域在一个编码多肽上。可选择地，基因表达调节系统可以是基于“双开关”或“双杂合”的基因表达调节系统，其中反式激活结构域、DNA结合结构域位于两个不同的编码多肽上。申请人已经首次证明了，置换突变的核受体可以在原核和真核细胞中用作基于核受体的诱导型基因表达系统的成分，以改变配体结合活性和/或配体特异性。如上所述，申请人的发现是意想不到而且令人惊奇的。本发明的基于蜕皮激素受体的基因表达调节系统可以是异源二聚体或同源二聚体。功能EcR复合体通常指异源二聚体蛋白复合体，由类固醇受体家族的两个成员组成，它们是获自各种昆虫的蜕皮激素受体蛋白和超气门(USP)蛋白或USP的脊椎动物同源物，类视黄醇X受体蛋白(参见Yao，et al.(1993)Nature 366476-479；Yao，et al.，(1992)Cell 7163-72)。然而，复合体也可以是下面详细描述的同源二聚体。功能性蜕皮类固醇受体复合体也可以包括额外的蛋白例如亲免素。类固醇受体蛋白质家族的其他成员，称为转录因子(例如DHR38或β FTZ-1)，也可以是EcR、USP和/或RXR的配体依赖型或非配体依赖型的伴侣。此外，可以需要其他的辅因子，例如通常称为辅激活物(也称为适体或介体)的蛋白质。这些蛋白并不以序列特异性的方式结合DNA，也不参与基础转录。它们可以通过各种机制对转录激活施加它们的影响，包括通过影响染色质结构，或通过介导激活物-起始复合体相互作用，来刺激激活物的DNA结合。这样的辅激活物的例子包括RIP140、TIF1、RAP46/Bag-1、ARA70、SRC-1/NCoA-1、TIF2/GRIP/NCoA-2、ACTR/AIB1/RAC3/pCIP，以及乏主辅激活物C应答元件B结合蛋白、CBP/p300(参见综述Glass et al.，Curr.Opin.Cell Biol.9222-232，1997)。而且，可能需要通常称为辅阻遏物(也称为阻遏物、沉默子或沉默介体)的蛋白辅因子，以便在不存在配体的情况下有效地抑制转录激活。这些辅阻遏蛋白可以与未配体化的蜕皮激素受体相互作用，以沉默对应答元件的活性。目前的证据显示，与配体的结合改变了受体的构象，这导致辅阻遏物的释放和上述辅激活物的招募，从而废止它们的沉默活性。辅阻遏物的例子包括N-CoR和SMRT(参见综述Horwitz et al.Mol Endocrinol.101167-1177，1996)。这些辅因子在细胞或生物中可以是内源性的，或者可以作为将以调控或非调控的方式被表达的转基因外源性地加入。在一些环境中，蜕皮激素受体蛋白、USP或RXR的同型二聚体复合物也可以发挥功能。蜕皮激素受体复合体典型地包括核受体超家族成员的蛋白，其中超家族中的所有成员的一般特征是存在氨基端的反式激活结构域、DNA结合结构域(“DBD”)和通过铰链区与DBD隔开的配体结合结构域(“LBD”)。如在此所使用，术语“DNA结合结构域”包括DNA结合蛋白的最小的多肽序列，至全长的DNA结合蛋白，只要该DNA结合域具有与特定应答元件缔合的功能即可。核受体超家族的成员也被表征为存在四个或五个结构域A/B、C、D、E，在一些成员中存在F(参见美国专利4,981,784和Evans，Science 240889-895(1988))。″A/B″结构域对应于反式激活结构域，″C″对应于DNA结合结构域，″D″对应于铰链区，″E″对应于配体结合结构域。该家族的一些成员也可能在LBD的羧基末端一侧具有另一反式激活结构域，即对应于″F″。DBD的特征是存在两个半胱氨酸锌指结构，在它们之间是两个氨基酸基序，P-box和D-box，其赋予了对蜕皮激素应答元件的特异性。这些结构域可以是天然的、经修饰的，或异源的受体蛋白的不同结构域的嵌合物。如同类固醇受体家族的亚群，EcR受体也拥有负责异源二聚化特性的尚未充分限定的区域。因为核受体的结构域在天然状态下是模块化的，所以LBD、DBD和反式激活结构域可以相互变换。整合有来自蜕皮激素受体复合体的成分的基因开关系统是已知的。然而，在这些已知的系统中，凡是使用EcR的时候，它都是在同一个分子上与天然的或修饰的DNA结合结构域和反式激活结构域连接。USP或RXR通常用作沉默伴侣。申请人之前已经说明，当DNA结合结构域和反式激活结构域在同一个分子上时，在没有配体时具有高的背景活性，也说明了当DNA结合结构域和反式激活结构域在不同的分子上，即分别在异型二聚体或同型二聚体复合物的各个伴侣上时，这样的背景活性显著降低(参见PCT/US01/09050)。
本发明的基因表达盒
本发明的新型的基于核受体的诱导型基因表达系统包含至少一个基因表达盒，该基因表达盒能够在宿主细胞中被表达，其中该基因表达盒包含编码多肽的多核苷酸，所述多肽包括含有置换突变的H组核受体配体结合结构域。因此，申请人的发明也提供了用于本发明的基因表达系统的新型基因表达盒。在一个特定的实施方案中，能够在宿主细胞中表达的基因表达盒包含编码多肽的多核苷酸，所述多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的H组核受体配体结合结构域的多肽；b)包含DNA结合结构域和含有置换突变的H组核受体配体结合结构域的多肽；c)包含反式激活结构域和含有置换突变的H组核受体配体结合结构域的多肽。在另一特定的实施方案中，本发明提供了能够在宿主细胞中表达的基因表达盒，其中该基因表达盒包含编码杂合多肽的多核苷酸，所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的H组核受体配体结合结构域的杂合多肽；b)包含DNA结合结构域和含有置换突变的H组核受体配体结合结构域的杂合多肽；和c)包含反式激活结构域和含有置换突变的H组核受体配体结合结构域的杂合多肽。本发明的杂合多肽包含至少两个多肽片段，其中每个多肽片段来自不同的来源，即，不同的多肽、不同的核受体、不同的物种等。本发明的杂合多肽包含至少两个多肽结构域，其中每个多肽结构域来自不同的来源。在特定的实施方案中，含有置换突变的H组核受体配体结合结构域来自蜕皮激素受体、遍在受体、孤独受体1、NER-1、类固醇激素核受体1、类视黄醇X受体相互作用蛋白-15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、类法呢醇X受体、受体相互作用蛋白14和法呢醇受体。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。因此，本发明也提供了包含编码多肽的多核苷酸的基因表达盒，所述多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的多肽；b)包含DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的多肽；和c)包含反式激活结构域和含有置换突变的蜕皮激素受体配体结合结构域的多肽。优选地，该基因表达盒包含编码杂合多肽的多核苷酸，所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的杂合多肽；b)包含DNA结合结构域和含有置换突变的蜕皮激素受体配体结合结构域的杂合多肽；和c)包含反式激活结构域和含有置换突变的蜕皮激素受体配体结合结构域的杂合多肽，其中被编码的杂合多肽包含至少两个多肽片段，其中每个多肽片段来自不同的来源。蜕皮激素受体(EcR)配体结合结构域(LBD)可以来自无脊椎动物EcR，优选地选自节肢动物纲的EcR。优选地，EcR选自鳞翅类EcR、双翅类EcR、直翅类EcR、同翅类EcR和半翅类EcR。更优选地，用于本发明的EcR配体结合结构域来自云杉蚜虫云杉色卷蛾(Choristoneura fumiferana)EcR(″CfEcR″)、甲虫黄粉虫(Tenebrio molitor)EcR(″TmEcR″)、烟草天蛾(Manduca sexta)EcR(″MsEcR″)、Heliothies virescens EcR(″HvEcR″)、摇蚊(Chironomus tentans)EcR(″CtEcR″)、蚕蛾家蚕(Bombyx mori)EcR(″BmEcR″)、斜视小眉眼蝶(squinting bush brown)Bicyclusanynana EcR(″BanEcR″)、buckeye Junonia coenia EcR(″JcEcR″)、果蝇黑腹果蝇EcR(″DmEcR″)、蚊子埃及伊蚊(Aedes aegypti)EcR(″AaEcR″)、丽蝇Lucilia capitata(″LcEcR″)、丽蝇Lucilia cuprina EcR(″LucEcR″)、丽蝇Calliphora viciniaEcR(″CvEcR″)、地中海果蝇Ceratitis capitata EcR(″CcEcR″)、蝗虫Locusta migratoriaEcR(″LmEcR″)、蚜虫Myzus persicae EcR(″MpEcR″)、招潮蟹Celuca pugilatorEcR(″CpEcR″)、美洲花蜱(Amblyomma americanum)EcR(″AmaEcR″)、白粉虱Bamecia argentifoli EcR(″BaEcR″)或叶蝉Nephotetix cincticeps EcR(″NcEcR″)。更优选地，LBD来自CfEcR、DmEcR或AmaEcR。在特定的实施方案中，LBD来自截短的EcR多肽。EcR多肽的截短导致删除了至少1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260或265个氨基酸。优选地，EcR多肽的截短导致删除了多肽结构域的至少一部分。更优选地，EcR多肽的截短导致删除了至少一个完整的多肽结构域。在特定的实施方案中，EcR多肽的截短导致删除了至少A/B结构域、C结构域、D结构域、F结构域、A/B/C结构域、A/B/1/2-C结构域、A/B/C/D结构域、A/B/C/D/F结构域、A/B/F结构域、A/B/C/F结构域、部分E结构域或部分F结构域。也可以组合删除若干完整和/或部分结构域。在特定的实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致置换a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238；b)SEQ ID NO1的氨基酸残基96和119；c)SEQ ID NO1的氨基酸残基110和128；d)SEQ ID NO1的氨基酸残基52和110；e)SEQ ID NO1的氨基酸残基107、110和127；或f)SEQ ID NO1氨基酸残基52、107和127。在另一实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致SEQ ID NO1的氨基酸残基107和127的置换和氨基酸259的插入。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致下述的置换a)等同于或类似于SEQ IDNO1的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸54的位置置换以色氨酸或苏氨酸；e)等同于或类似于SEQ ID NO1的氨基酸92的位置置换以亮氨酸或谷氨酸；f)等同于或类似于SEQ ID NO1的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基；h)等同于或类似于SEQ IDNO1的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基；j)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸；k)等同于或类似于SEQ ID NO1的氨基酸120的位置置换以色氨酸或蛋氨酸；1)等同于或类似于SEQ ID NO1的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸；m)等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸；n)等同于或类似于SEQ ID NO1的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸；o)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基；p)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基；q)等同于或类似于SEQ ID NO1的氨基酸234的位置置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸；r)等同于或类似于SEQ ID NO1的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸；s)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸残基和等同于或类似于SEQ ID NO1的氨基酸96的位置置换以苏氨酸；t)等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO1的氨基酸128的位置上置换以苯丙氨酸残基；u)等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸残基和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基；v)等同于或类似于SEQ IDNO1的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基；或w)等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸残基。在另一实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基，和在等同于或类似于SEQ ID NO1的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。在特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域，所述结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致产生选自下列的置换突变SEQ ID NO1上发生的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P置换突变。在另一特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域，所述结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致产生置换突变SEQ ID NO1的V107I/Y127E，其进一步包括插入突变SEQ IDNO1的G259(V107I/Y127E/G259)。在另一特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域多肽，所述结构域多肽由在杂交条件下与包含密码子突变的多核苷酸杂交的多核苷酸编码，所述密码子突变导致产生选自下述的置换突变SEQ ID NO1上发生的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P，所述杂交条件包括在少于500mM盐和至少37℃中的杂交步骤，和在2×SSPE、至少63℃的洗涤步骤。在优选的实施方案中，杂交条件包括小于200mM盐和至少37℃的杂交步骤。在另一优选实施方案中，杂交条件包括2×SSPE和63℃的杂交和洗涤步骤。在另一特定的实施方案中，H组核受体配体结合结构域包含置换突变，置换突变的位置等同于或类似于a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238；b)SEQ IDNO1的氨基酸残基96和119；c)SEQ ID NO1的氨基酸残基110和128；d)SEQ IDNO1的氨基酸残基52和110；e)SEQ ID NO1的氨基酸残基107、110和127；或f)SEQ ID NO1的氨基酸残基52、107和127。在另一实施方案中，H组核受体配体结合结构域包括等同于或类似于SEQ ID NO1的氨基酸残基107和127的位置的置换突变和氨基酸残基259位置的插入突变。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。优选地，H组核受体配体结合结构域包括下述置换a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸54的位置置换以色氨酸或苏氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸92的位置置换以亮氨酸或谷氨酸残基；f)等同于或类似于SEQ ID NO1的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基；h)等同于或类似于SEQ ID NO1的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基；j)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸残基；k)等同于或类似于SEQ ID NO1的氨基酸120的位置置换以色氨酸或蛋氨酸残基；l)等同于或类似于SEQ ID NO1的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸残基；m)等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸残基；n)等同于或类似于SEQ ID NO1的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸残基；o)等同于或类似于SEQID NO1的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基；p)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基；q)等同于或类似于SEQ ID NO1的氨基酸234的位置上置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸残基；r)等同于或类似于SEQ ID NO1的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸残基；s)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸残基和等同于或类似于SEQ ID NO1的氨基酸96的位置置换以苏氨酸；t)等同于或类似于SEQ IDNO1的氨基酸110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸残基；u)等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸残基和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基；v)等同于或类似于SEQ IDNO1的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基；或w)等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸残基。在另一实施方案中，H组核受体配体结合结构域包括在等同于或类似于SEQ ID NO1的氨基酸107的位置置换异亮氨酸残基、在等同于或类似于SEQ ID NO1的氨基酸127的位置置换谷氨酸残基，和在等同于或类似于SEQ ID NO1的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域多肽，其中所述置换突变选自SEQID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、T52V/A110P、V128F/A110P、V107I/Y127E/T125V和V107I/Y127E/A110P置换突变。在另一实施方案中，包含置换突变的H组核受体配体结合结构域是包含SEQ ID NO1中的置换突变V107I/Y127E的蜕皮激素受体配体结合结构域多肽，其进一步包括插入突变SEQ ID NO1中的G259(V107I/Y127E/G259)。DNA结合结构域可以是已知的应答元件的任何DNA结合结构域，包括合成的和嵌合的DNA结合结构域，或其类似物、组合或修饰。优选地，DBD是GAL4DBD、LexA DBD、转录因子DBD、H组核受体成员DBD、类固醇/甲状腺激素核受体超家族成员DBD或细菌LacZ DBD。更优选地，DBD是EcR DBD[SEQ IDNO4(多核苷酸)或SEQ ID NO5(多肽)]、GAL4 DBD[SEQ ID NO6(多核苷酸)或SEQ ID NO7(多肽)]或LexA DBD[(SEQ ID NO8(多核苷酸)或SEQ ID NO9(多肽))。反式激活结构域(缩写为″AD″或″TA″)可以是任何H组核受体成员AD、类固醇/甲状腺激素核受体AD、合成或嵌合AD、多谷氨酰胺AD、碱性或酸性氨基酸AD、VP16AD、GAL4 AD、NF-κB AD、BP64 AD、B42酸性激活结构域(B42AD)、p65反式激活结构域(p65AD)或其类似物、组合或修饰。在特定的实施方案中，AD是合成的或嵌合的AD，或获自EcR、糖皮质激素受体、VP16、GAL4、NF-κB或B42酸性激活结构域AD。优选地，AD是EcRAD[SEQ ID NO10(多核苷酸)或SEQID NO11(多肽)]、VP16 AD[SEQ ID NO12(多核苷酸)或SEQ ID NO13(多肽)]、B42AD[SEQ ID NO14(多核苷酸)或SEQ ID NO15(多肽)]或p65 AD[SEQ IDNO16(多核苷酸)或SEQ ID NO17(多肽)]。在特定的实施方案中，基因表达盒编码杂合多肽，该杂合多肽包含a]由包含SEQ ID NO4、SEQ ID NO6或SEQ ID NO8的核酸序列的多核苷酸编码的DNA结合结构域，或b]由包含SEQ ID NO10、SEQ ID NO12、SEQ ID NO14或SEQ ID NO16的核酸序列的多核苷酸编码的反式激活结构域；以及包含由本发明的多核苷酸编码的置换突变的H组核受体配体结合结构域。优选地，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域，其由本发明的多核苷酸编码。在另一特定的实施方案中，基因表达盒编码杂合多肽，该杂合多肽包含a)包含SEQ ID NO5、SEQ ID NO7或SEQ ID NO9的氨基酸序列的DNA结合结构域；或b)包含SEQ ID NO11、EQ ID NO13、SEQ ID NO15或SEQ ID NO17的氨基酸序列的反式激活结构域；和本发明的包含置换突变的H组核受体配体结合结构域。优选地，包含置换突变的H组核受体配体结合结构域是包含本发明的置换突变的蜕皮激素受体配体结合结构域。本发明也提供了基因表达盒，该基因表达盒包括i)应答元件，其含有被包含DNA结合结构域的多肽识别的区域；ii)启动子，其被包含反式激活结构域的多肽激活；和iii)基因，其表达待被调节。应答元件(“RE”)可以是已知的DNA结合结构域的任何应答元件或其类似物、组合或修改。在本发明中可以利用单个RE，或可以使用多个RE，其或者是相同RE的多个拷贝，或者是两个或更多个不同的RE。在特定的实施方案中，RE是来自GAL4的RE(“GAL4RE”)、LexA、H组核受体RE、类固醇/甲状腺激素核受体RE或识别合成的DNA结合结构域的合成RE。优选地，RE是包含SEQID NO18的多核苷酸序列的蜕皮激素应答元件(EcRE)、包含SEQ ID NO19的多核苷酸序列的GAL4RE或包含SEQ ID NO20的多核苷酸序列的LexA RE(操纵子，“op”)(“2XlexAopRE”)。本发明的类固醇/甲状腺激素核受体DNA结合结构域、激活结构域或应答元件可以获自类固醇/甲状腺激素核受体，其选自甲状腺激素受体α(TRα)、甲状腺受体1(c-erbA-1)、甲状腺激素受体β(TRβ)、视黄酸受体α(RARα)、视黄酸受体β(RARβ，HAP)、视黄酸受体γ(RARγ)、视黄酸受体γ-样(RARD)、过氧化物酶体增殖物激活受体α(PPARα)、过氧化物酶体增殖物激活受体β(PPARβ)、过氧化物酶体增殖物激活受体δ(PPARδ，NUC-1)、过氧化物酶体增殖物激活相关受体(FFAR)、过氧化物酶体增殖物激活受体γ(PPARγ)、由甲状腺激素受体α的非编码链编码的孤独受体(REVERBα)、v-erb A相关受体(EAR-1)、v-erb相关受体(EAR-1A)，γ)、由甲状腺激素受体β的非编码链编码的孤独受体(REVERBβ)、v-erb相关受体(EAR-1β)、孤独核受体BD73(BD73)、rev-erbA相关受体(RVR)、锌指蛋白126(HZF2)、蜕皮激素诱导蛋白E75(E75)、蜕皮激素诱导蛋白E78(E78)、果蝇受体78(DR-78)、类视黄醇相关孤独受体α(RORα)、类视黄醇Z受体α(RZRα)、类视黄醇相关孤独受体β(RORβ)、类视黄醇Z受体β(RZRβ)、类视黄醇相关孤独受体γ(RORγ)、类视黄醇Z受体γ(RZRγ)、类视黄醇相关孤独受体(TOR)、激素受体3(HR-3)、果蝇激素受体3(DHR-3)、天娥(Manduca)激素受体(MHR-3)、螟(Galleria)激素受体3(GHR-3)、线虫(C.elegans)核受体3(CNR-3)、卷蛾(Choristoneura)激素受体3(CHR-3)、线虫核受体14(CNR-14)、蜕皮激素受体(ECR)、遍在受体(UR)、孤独核受体(OR-1)、NER-1、受体相互作用蛋白15(RIP-15)、肝脏X受体β(LXRβ)、类固醇激素受体样蛋白(RLD-1)、肝脏X受体(LXR)、肝脏X受体α(LXRα)、类法呢醇X受体(FXR)、受体相互作用蛋白14(RIP-14)、HRR-1、维生素D受体(VDR)、孤独核受体(ONR-1)、孕烷X受体(PXR)、类固醇和异生素受体(SXR)、甲苯酸盐X受体(BXR)、核受体(MB-67)、组成型雄烷受体1(CAR-1)、组成型雄烷受体α(CARα)、组成型雄烷受体2(CAR-2)、组成型雄烷受体β(CARβ)、果蝇激素受体96(DHR-96)、核激素受体1(NHR-1)、肝细胞核因子4(HNF-4)、肝细胞核因子4G(HNF-4G)、肝细胞核因子4B(HNF-4B)、肝细胞核因子4D(HNF-4D，DHNF-4)、类视黄醇X受体α(RXRα)、类视黄醇X受体β(RXRβ)、H-2区域II结合蛋白(H-2RIIBP)、核受体辅调蛋白-1(RCoR-1)、类视黄醇X受体γ(RXRγ)、超气门(USP)、2C1核受体、绒毛膜因子1(CF-1)、睾丸受体2(TR-2)、睾丸受体2-11(TR2-11)、睾丸受体4(TR4)、TAK-1、果蝇激素受体(DHR78)、Tailless(TLL)、tailless同源物(TLX)、XTLL、鸡卵蛋白上游启动子转录因子I(COUP-TFI)、鸡卵蛋白上游启动子转录因子A(COUP-TFA)、EAR-3、SVP-44、鸡卵蛋白上游启动子转录因子II(COUP-TFII)、鸡卵蛋白上游启动子转录因子B(COUP-TFB)、ARP-1、SVP-40、SVP、鸡卵蛋白上游启动子转录因子III(COUP-TFIII)、鸡卵蛋白上游启动子转录因子G(COUP-TFG)、SVP-46、EAR-2、雌激素受体α(ERα)、雌激素受体β(ERβ)、雌激素相关受体1(ERR1)、雌激素相关受体α(ERRα)、雌激素相关受体2(ERR2)、雌激素相关受体β(ERRβ)、糖皮质激素受体(GR)、盐皮质激素受体(MR)、孕酮受体(PR)、雄激素受体(AR)、神经生长因子诱导基因B(NGFI-B)、与Nur-77类似的核受体(TRS)、N10、孤独受体(NUR-77)、人类早期应答基因(NAK-1)、Nurr相关因子1(NURR-1)、人类即时早期应答基因(NOT)、再生肝核受体1(RNR-1)、造血锌指3(HZF-3)、Nur相关蛋白-1(TINOR)、核孤独受体1(NOR-1)、NOR1相关受体(MINOR)、果蝇激素受体38(DHR-38)、线虫核受体8(CNR-8)、C48D5、类固醇生成因子1(SF1)、endozepine样肽(ELP)、果蝇ftz因子1(FTZ-F1)、肾上腺4结合蛋白(AD4BP)、肝受体同源物(LRH-1)、Ftz-F1-相关孤独受体A(xFFrA)、Ftz-F1-相关孤独受体B(xFFrB)、与LRH-1相关的核受体(FFLR)、与LRH-1相关的核受体(PHR)、甲胎蛋白转录因子(FTF)、生殖细胞核因子(GCNFM)、类视黄醇受体相关睾丸关联受体(RTR)、knirps(KNI)、knirps相关(KNRL)、胚胎生殖腺(EGON)、配体依赖型核受体的果蝇基因(EAGLE)、与trithorax(三胸腔)类似的核受体(ODR7)、Trithorax、剂量敏感型性别逆转肾上腺发育不全先天性关键区域染色体X基因(DAX-1)、肾上腺发育不全先天性和促性腺激素分泌不足性性腺机能减退(AHCH)和短杂二聚体伴侣(SHP)。对于本发明的目的，核受体和H组核受体也包括合成的和嵌合的核受体和H组核受体以及它们的类似物。用于申请人的基因表达盒的感兴趣的基因可以是内源性基因或异源性基因。期望的基因或蛋白的核酸或氨基酸序列信息可以从众多公共数据库中的一个数据库中查找，例如GENBANK、EMBL、Swiss-Prot和PIR，或从众多生物学相关期刊出版物查找。因此，本领域技术人员能够获得实质上所有已知基因的核酸序列信息。然后此信息可以用于构建期望的构建物，从而将感兴趣的基因插入到在此描述的申请人方法所使用的基因表达盒中。用于申请人的基因表达盒的感兴趣的基因的例子但是包括但不限于编码治疗上有益的多肽或产物的基因，所述多肽或产物可以用于治疗病症、疾病、紊乱、功能障碍、遗传缺陷，例如单克隆抗体、酶、蛋白酶、细胞因子、干扰素、胰岛素、促红细胞生成素、凝血因子、其他血液因子或成分，用于基因治疗的病毒载体、用于疫苗的病毒、药物开发的靶标、功能基因组学和蛋白质组学分析和应用，等等。
本发明的多核苷酸
本发明的新型的基于核受体的诱导型基因表达系统包含至少一个基因表达盒，该基因表达盒包含编码含有置换突变的H组核受体配体结合结构域的多核苷酸。这些基因表达盒、它们包含的多核苷酸和它们编码的多肽，可用作基于核受体的基因表达系统的成分，以在宿主细胞内调节基因的表达。因此，本发明提供了编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸。在特定的实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致在下述位置的氨基酸残基的置换，所述位置等同于或类似于a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238；b)SEQ ID NO1的氨基酸残基96和119；c)SEQ ID NO1的氨基酸残基110和128；d)SEQ ID NO1的氨基酸残基52和110；e)SEQ ID NO1的氨基酸残基107、110和127；或f)SEQ IDNO1的氨基酸残基52、107和127。在另一实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致在等同于或类似于SEQ ID NO1的氨基酸残基107和127的位置的置换和氨基酸259的插入。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致下列置换a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸54的位置置换以色氨酸或苏氨酸；e)等同于或类似于SEQ ID NO1的氨基酸92的位置置换以亮氨酸或谷氨酸；f)等同于或类似于SEQ ID NO1的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基；h)等同于或类似于SEQ ID NO1的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基；j)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸；k)等同于或类似于SEQ ID NO1的氨基酸120的位置置换以色氨酸或蛋氨酸；1)等同于或类似于SEQ ID NO1的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸；m)等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸；n)等同于或类似于SEQ ID NO1的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸；o)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基；p)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基；q)等同于或类似于SEQID NO1的氨基酸234的位置置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸；r)等同于或类似于SEQ ID NO1的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸；s)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸残基和等同于或类似于SEQ ID NO1的氨基酸96的位置上置换以苏氨酸；t)等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸和等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸；u)等同于或类似于SEQID NO1的氨基酸52的位置上置换以缬氨酸残基和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基；v)等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸；或w)等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸。在另一实施方案中，H组核受体配体结合结构域由包含密码子突变的多核苷酸编码，所述密码子突变导致在等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基，和在等同于或类似于SEQ ID NO1的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域，其由包含密码子突变的多核苷酸编码，所述密码子突变产生选自如下的置换突变SEQ ID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V和V107I/YI27E/A110P置换突变。在另一实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域，其由包含密码子突变的多核苷酸编码，所述密码子突变导致产生置换突变SEQ ID NO1的V107I/Y127E，其进一步包括插入突变SEQ ID NO1的G259(V107I/Y127E/G259)。在另一特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域，其由在杂交条件下与含有密码子突变的多核苷酸杂交的多核苷酸编码，所述密码子突变产生置换突变，所述置换突变选自SEQ ID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N1 19F/)96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P，所述杂交条件包括在小于500mM盐和至少37℃的杂交步骤，和在2×SSPE、至少63℃的洗涤步骤。在优选的实施方案中，杂交条件包括小于200mM盐和至少37℃的杂交步骤。在另一优选实施方案中，杂交条件包括2×SSPE和63℃的杂交和洗涤步骤。本发明也提供了编码多肽的分离的多核苷酸，所述多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的多肽；b)包含DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的多肽；和c)包含反式激活结构域和本发明的包含置换突变的H组核受体配体结合结构域的多肽。在特定的实施方案中，分离的多核苷酸编码杂合多肽，所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的杂合多肽；b)包含DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的杂合多肽；和c)包含反式激活结构域和本发明的包含置换突变的H组核受体配体结合结构域的杂合多肽。本发明也涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中，所述置换突变影响H组核受体配体结合结构域的配体结合活性或配体敏感性。在另一特定的实施方案中，本发明涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中，所述置换突变降低H组核受体配体结合结构域的非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地，分离的多核苷酸包含导致产生氨基酸残基置换的密码子突变，所述氨基酸残基的置换发生的位置等同于或类似于SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、120、125、219、223、234或238。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致下述置换a)等同于或类似于SEQ ID NO1的氨基酸残基48或109的位置置换以天冬酰胺残基；b)等同于或类似于SEQ IDNO1的氨基酸残基51、92、96或238的位置置换以亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基52、92、96、125或238的位置置换以谷氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基54、95、96、120、219或234的位置置换以色氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸残基51、52、120、234或238的位置置换以蛋氨酸残基；f)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以丙氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基48、219或223的位置置换以赖氨酸残基；h)等同于或类似于SEQ ID NO1的氨基酸残基234的位置置换以异亮氨酸、精氨酸或色氨酸残基；i)等同于或类似于SEQ ID NO1的氨基酸残基219或238的位置置换以酪氨酸残基；j)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以缬氨酸残基；k)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以甘氨酸或谷氨酰胺残基；或1)等同于或类似于SEQ ID NO1的氨基酸残基52或223的位置置换以精氨酸残基。甚至更优选地，分离的多核苷酸包括密码子突变，所述密码子突变导致产生置换突变SEQ ID NO1的F48N、F48K、I51L、I51M、T52E、T52M、T52R、T52G、T52Q、M54W、M92L、M92E、R95W、V96W、V96E、V96L、F109N、Y120M、Y120W、M125E、M125V、M219A、M219K、M219W、M219Y、L223K、L223R、L234M、L234I、L234R、L234W、W238E、W238Y、W238L或W238M。此外，本发明也涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中，所述置换突变增强H组核受体配体结合结构域的配体结合活性或对配体的敏感性。在特定的实施方案中，本发明涉及编码含有置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中，所述置换突变通常增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性。优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致等同于或类似于a)SEQ ID NO1的氨基酸残基96或b)SEQ ID NO1的氨基酸残基96和119的位置上的氨基酸残基发生置换。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致下列置换a)等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以丝氨酸残基；或b)等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以苏氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基119的位置置换以苯丙氨酸残基。甚至更优选地，分离的多核苷酸编码包含密码子突变，所述密码子突变导致置换突变SEQ IDNO1的V96T或N119F/V96T。在另一特定的实施方案中，本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致在等同于或类似于a)SEQ ID NO1的氨基酸残基48、52、54、109、110、125、132或223；或b)SEQ IDNO1的氨基酸残基52和110的位置上的氨基酸残基发生置换。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致下述置换a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以酪氨酸、色氨酸、精氨酸或亮氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基54的位置置换以苏氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基109的位置置换以蛋氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸、谷氨酸或天冬酰胺残基；f)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以异亮氨酸、天冬酰胺或甘氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以谷氨酸残基；h)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以酪氨酸残基；或i)等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸残基以及等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变F48Y、F48W、F48L、F48R、T52L、M54T、F109M、A110P、A110E、A110N、M125I、M125G、M125N、L132E、L223Y或T52V/A110P。在另一特定的实施方案中，本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇二酰肼和非蜕皮类固醇四氢喹啉结合活性，或非蜕皮类固醇二酰肼和非蜕皮类固醇四氢喹啉的敏感性。优选地，分离的多核苷酸包括密码子突变，所述密码子突变导致在等同于或类似于a)SEQ ID NO1的氨基酸残基107和127；或b)SEQ ID NO1的氨基酸残基107、110和127的位置上的氨基酸残基发生置换。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致下述置换a)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基；或b)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变V107I/Y127E或V107I/Y127E/A110P。在另一特定的实施方案中，本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中所述置换突变总体上增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性和非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地，分离的多核苷酸包括密码子突变，所述密码子突变导致在等同于或类似于a)SEQ ID NO1的氨基酸残基109、132或W238P；b)SEQ ID NO1的氨基酸残基52、107和127；或c)SEQ ID NO1的氨基酸残基107和127的位置上的氨基酸残基发生置换，以及SEQ ID NO1的氨基酸259位置发生插入突变。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基109的位置置换以色氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以缬氨酸或蛋氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基238的位置置换以脯氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以缬氨酸残基；或e)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基259的位置插入甘氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变F109W、L132M、L132V、W238P、V107I/Y127E/T52V或V107I/Y127E/259G。在另一个实施方案中，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生置换突变V107I/Y127E，还包括在SEQ ID NO1中产生插入突变G259(V107I/Y127E/G259)。在另一特定的实施方案中，本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇四氢喹啉结合活性或非蜕皮类固醇四氢喹啉敏感性。优选地，分离的多核苷酸包括密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基110或128的位置上的氨基酸残基；或b)等同于或类似于SEQ ID NO1的氨基酸残基110和128的位置上的氨基酸残基发生置换。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以色氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基128的位置置换以苯丙氨酸残基；或c)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基128的位置置换以苯丙氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变A110W、V128F或V128F/A110P。在另一特定的实施方案中，本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致在等同于或类似于SEQ ID NO1的氨基酸残基52、95、109、125或132的位置上的氨基酸残基产生置换突变。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以脯氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基95的位置置换以组氨酸或蛋氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基109的位置置换以亮氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以亮氨酸、色氨酸、精氨酸、半胱氨酸或脯氨酸残基；或e)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以蛋氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变T52P、T52W、R95H、R95M、F109L、M125L、M125W、M125R、M125C、M125P或L132M。在另一特定的实施方案中，本发明涉及编码包含置换突变的H组核受体配体结合结构域的分离的多核苷酸，其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。更优选地，分离的多核苷酸包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以赖氨酸或精氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以甘氨酸、谷氨酰胺、蛋氨酸、精氨酸或色氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以异亮氨酸、甘氨酸、天冬酰胺、丝氨酸或缬氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以谷氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以赖氨酸、色氨酸或酪氨酸残基；f)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以精氨酸或酪氨酸残基；或g)等同于或类似于SEQ ID NO1的氨基酸残基238的位置置换以亮氨酸或蛋氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变F48K、F48R、T52G、T52Q、T52M、T52R、T52W、M125I、M125G、M125N、M125S、M125V、L132E、M219K、M219W、M219Y、L223R、L223Y、W238L或W238M。此外，本发明涉及包含可操作性地与转录调控元件连接的本发明多核苷酸的表达载体。优选地，编码包含置换突变的核受体配体结合结构域的多核苷酸与表达控制序列可操作性连接，从而允许在胜任表达的宿主细胞中表达该核受体配体结合结构域。该表达控制序列可以包含在期望进行表达的宿主细胞中具有功能的启动子。载体可以是质粒DNA分子或病毒载体。优选的病毒载体包括逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和牛痘病毒。本发明进一步涉及复制缺陷型重组病毒，在它的基因组中包含编码含有上述置换突变的核受体配体结合结构域的多核苷酸。因此，本发明也涉及包含这样的表达载体的分离的宿主细胞，其中转录调控元件在该宿主细胞中是可操作性的。本发明也涉及由本发明的多核苷酸编码的分离的多肽。
本发明的多肽
本发明新型的基于核受体的诱导型基因表达系统包含含有多核苷酸的至少一个基因表达盒，所述多核苷酸编码包含含有置换突变的H组核受体配体结合结构域的多肽。因此，本发明也提供分离的多肽，其含有本发明的包含置换突变的H组核受体配体结合结构域。在另一特定的实施方案中，H组核受体配体结合结构域在等同于或类似于a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234或238；b) SEQ ID NO1的氨基酸残基96和119；c)SEQ ID NO1的氨基酸残基110和128；d)SEQ ID NO1的氨基酸残基52和110；e)SEQ ID NO1的氨基酸残基107、110和127；或f)SEQ ID NO1的氨基酸残基52、107和127的位置包含置换突变。在另一实施方案中，H组核受体配体结合结构域包含在等同于或类似于SEQ ID NO1的氨基酸残基107和127的位置的置换突变，和在SEQ ID NO1的氨基酸259的插入。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。优选地，H组核受体配体结合结构域包含下述置换a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以天冬酰胺、精氨酸、酪氨酸、色氨酸、亮氨酸或赖氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基51的位置置换以蛋氨酸、天冬酰胺或亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以亮氨酸、脯氨酸、蛋氨酸、精氨酸、色氨酸、甘氨酸、谷氨酰胺或谷氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸54的位置置换以色氨酸或苏氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸92的位置置换以亮氨酸或谷氨酸；f)等同于或类似于SEQ ID NO1的氨基酸残基95的位置置换以组氨酸、蛋氨酸或色氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以亮氨酸、丝氨酸、谷氨酸或色氨酸残基；h)等同于或类似于SEQ ID NO1的氨基酸109的位置置换以色氨酸、脯氨酸、亮氨酸、蛋氨酸或天冬酰胺；i)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以谷氨酸、色氨酸或天冬酰胺残基；j)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸；k)等同于或类似于SEQ ID NO1的氨基酸120的位置置换以色氨酸或蛋氨酸；l)等同于或类似于SEQ ID NO1的氨基酸125的位置置换以谷氨酸、脯氨酸、亮氨酸、半胱氨酸、色氨酸、甘氨酸、异亮氨酸、天冬酰胺、丝氨酸、缬氨酸或精氨酸；m)等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸；n)等同于或类似于SEQ ID NO1的氨基酸132的位置置换以蛋氨酸、天冬酰胺、谷氨酸或缬氨酸；o)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以丙氨酸、赖氨酸、色氨酸或酪氨酸残基；p)等同于或类似于SEQ IDNO1的氨基酸残基223的位置置换以赖氨酸、精氨酸或酪氨酸残基；q)等同于或类似于SEQ ID NO1的氨基酸234的位置置换以蛋氨酸、精氨酸、色氨酸或异亮氨酸；r)等同于或类似于SEQ ID NO1的氨基酸238的位置置换以脯氨酸、谷氨酸、亮氨酸、蛋氨酸或酪氨酸；s)等同于或类似于SEQ ID NO1的氨基酸119的位置置换以苯丙氨酸和等同于或类似于SEQ ID NO1的氨基酸96的位置置换以苏氨酸；t)等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸和等同于或类似于SEQ ID NO1的氨基酸128的位置置换以苯丙氨酸；u)等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸残基和等同于或类似于SEQ IDNO1的氨基酸110的位置置换以脯氨酸残基；v)等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸110的位置置换以脯氨酸；或w)等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸和等同于或类似于SEQ ID NO1的氨基酸52的位置置换以缬氨酸。在另一实施方案中，H组核受体配体结合结构域包括在等同于或类似于SEQ ID NO1的氨基酸107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸127的位置置换以谷氨酸残基，和在等同于或类似于SEQ ID NO1的氨基酸259的位置插入甘氨酸残基。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。在另一特定的实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变的蜕皮激素受体配体结合结构域多肽，其中所述置换突变选自SEQID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、I51M、I51N、I51L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V和V107I/Y127E/A110P置换突变。在另一实施方案中，包含置换突变的H组核受体配体结合结构域是包含置换突变SEQ ID NO1的V107I/Y127E的蜕皮激素受体配体结合结构域多肽，该多肽还包含插入突变SEQID NO1的G259(V107I/Y127E/G259)。本发明也提供了分离的多肽，所述多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的分离的多肽；b)包含DNA结合结构域和本发明的包含置换突变的H组核受体配体结合结构域的分离的多肽；和c)包含反式激活结构域和本发明的包含置换突变的H组核受体配体结合结构域的分离的多肽。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。本发明也提供了分离的杂合多肽，所述杂合多肽选自a)包含反式激活结构域、DNA结合结构域和本发明的含有置换突变的H组核受体配体结合结构域的分离的杂合多肽；b)包含DNA结合结构域和本发明的含有置换突变的H组核受体配体结合结构域的分离的杂合多肽；和c)包含反式激活结构域和本发明的含有置换突变的H组核受体配体结合结构域的分离的杂合多肽。在优选的实施方案中，H组核受体配体结合结构域来自蜕皮激素受体。本发明也提供了包含含有置换突变的H组核受体配体结合结构域的分离的多肽，所述置换突变影响H组核受体配体结合结构域的配体结合活性或配体敏感性。特别地，本发明涉及包含含有置换突变的配体结合结构域的分离的H组核受体多肽，所述置换突变降低H组核受体配体结合结构域的配体结合活性或配体敏感性。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，所述置换突变降低H组核受体配体结合结构域的非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地，分离的多肽包含在等同于或类似于SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、120、125、219、223、234或238的位置上的氨基酸残基置换。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ IDNO1的氨基酸残基48或109的位置置换以天冬酰胺残基；b)等同于或类似于SEQID NO1的氨基酸残基51、92、96或238的位置置换以亮氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基52、92、96、125或238的位置置换以谷氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基54、95、96、120或219的位置置换以色氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸残基51、52、120、234或238的位置置换以蛋氨酸残基；f)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以丙氨酸残基；g)等同于或类似于SEQ ID NO1的氨基酸残基48、219或223的位置置换以赖氨酸残基；h)等同于或类似于SEQ ID NO1的氨基酸残基234的位置置换以异亮氨酸、精氨酸或色氨酸残基；i)等同于或类似于SEQ ID NO1的氨基酸残基219或238的位置置换以酪氨酸残基；j)等同于或类似于SEQ ID NO1的氨基酸残基52或223的位置置换以精氨酸残基；k)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以缬氨酸残基；或1)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以甘氨酸或谷氨酰胺残基。甚至更优选地，分离的多肽包括密码子突变，所述密码子突变导致SEQ ID NO1产生置换突变F48N、I51L、I51M、T52E、T52M、T52R、T52G、T52Q、M54W、M92L、M92E、R95W、V96W、V96E、V96L、F109N、Y120M、Y120W、M125E、M125V、M219A、M219K、M219W、M219Y、L223K、L223R、L234M、L234I、L234W、L234R、W238E、W238L、W238M或W238Y。此外，本发明还涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，所述置换突变增强H组核受体配体结合结构域的配体结合活性或配体敏感性。在特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，所述置换突变总体上增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性。优选地，分离的多肽包含在等同于或类似于a)SEQ ID NO1的氨基酸残基96或b)SEQ ID NO1的氨基酸残基96和119的位置上的氨基酸残基置换。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)在等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以丝氨酸残基；或b)在等同于或类似于SEQ ID NO1的氨基酸残基96的位置置换以苏氨酸残基和在等同于或类似于SEQ ID NO1的氨基酸残基119的位置置换以苯丙氨酸残基。甚至更优选地，分离的多肽包括密码子突变，所述密码子突变导致SEQ ID NO1中产生置换突变V96T或N119F/V96T。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，所述置换突变总体上增强H组核受体配体结合结构域的二酰肼结合活性或二酰肼敏感性。优选地，分离的多肽包含在等同于或类似于a)SEQ ID NO1的氨基酸残基48、52、54、109、110、125、132或223或b)SEQID NO1的氨基酸残基52和110的位置上的氨基酸残基置换。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以酪氨酸、色氨酸、精氨酸或亮氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以亮氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基54的位置置换以苏氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸残基109的位置置换以蛋氨酸残基；f)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸、谷氨酸或天冬酰胺残基；g)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以异亮氨酸、甘氨酸或天冬酰胺残基；h)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以缬氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸残基；i)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以谷氨酸残基；或j)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以酪氨酸残基。甚至更优选地，分离的多肽包括密码子突变，所述密码子突变导致SEQ IDNO1产生置换突变F48Y、F48W、F48L、F48R、T52L、M54T、F109M、A110P、A110E、A110N、M125I、M125G、M125N、L132E、L223Y或T52V/A110P。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，所述置换突变总体上增强H组核受体配体结合结构域的蜕皮类固醇结合活性或蜕皮类固醇敏感性和非蜕皮类固醇二酰肼结合活性或非蜕皮类固醇二酰肼敏感性。优选地，分离的多肽包含在等同于或类似于a)SEQ IDNO1的氨基酸残基109、132或W238P的位置上的氨基酸残基置换；b)SEQ IDNO1的氨基酸残基52、107和127的位置上的氨基酸残基置换；或c)SEQ ID NO1的氨基酸残基107和127的位置上的氨基酸残基置换，以及SEQ ID NO1的氨基酸259的插入突变。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基109的位置置换以色氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以缬氨酸或蛋氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基238的位置置换以脯氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以缬氨酸残基；或e)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基259的位置插入甘氨酸残基。甚至更优选地，分离的多核苷酸包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变F109W、L132M、L132V、W238P或V107I/Y127E/T52V。在另一个实施方案中，分离的多肽包含密码子突变，该密码子突变对SEQ ID NO1产生置换突变V107I/Y127E，还包括在SEQ ID NO1中产生插入突变G259(V107I/Y127E/G259)。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，其中所述置换突变总体上增强H组核受体配体结合结构域的二酰肼和四氢喹啉结合活性或二酰肼和四氢喹啉敏感性。优选地，分离的多肽包含置换突变，所述置换突变导致在等同于或类似于a)SEQ ID NO1的氨基酸残基107和127；或b)SEQ ID NO1的氨基酸残基107、110和127的位置上的氨基酸残基置换。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基；或b)等同于或类似于SEQ ID NO1的氨基酸残基107的位置置换以异亮氨酸残基、等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基127的位置置换以谷氨酸残基。甚至更优选地，分离的多肽包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变V107I/Y127E或V107I/Y127E/A110P。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，其中所述置换突变总体上增强H组核受体配体结合结构域的非蜕皮类固醇四氢喹啉结合活性或非蜕皮类固醇四氢喹啉敏感性。优选地，分离的多肽包含密码子突变，所述密码子突变导致替换a)等同于或类似于SEQID NO1的氨基酸残基110或128的位置上的氨基酸残基；或b)等同于或类似于SEQ ID NO1的氨基酸残基110和128的位置上的氨基酸残基。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以色氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基128的位置置换以苯丙氨酸残基；或c)等同于或类似于SEQ ID NO1的氨基酸残基110的位置置换以脯氨酸残基和等同于或类似于SEQ ID NO1的氨基酸残基128的位置置换以苯丙氨酸残基。甚至更优选地，分离的多肽包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变A110W、V128F或V128F/A110P。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。优选地，分离的多肽包括密码子突变，所述密码子突变导致对等同于或类似于SEQ ID NO1的氨基酸残基52、95、109、125或132的位置上的氨基酸残基产生置换。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以脯氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基95的位置置换以组氨酸或蛋氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基109的位置置换以亮氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以亮氨酸、色氨酸、精氨酸、半胱氨酸或脯氨酸残基；或e)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以蛋氨酸残基。甚至更优选地，分离的多肽包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变T52P、R95H、R95M、F109L、M125L、M125W、M125R、M125C、M125P或L132M。在另一特定的实施方案中，本发明涉及包含含有置换突变的H组核受体配体结合结构域的分离的多肽，其中所述置换突变对非蜕皮类固醇二酰肼配体产生差异性的应答。更优选地，分离的多肽包含密码子突变，所述密码子突变导致a)等同于或类似于SEQ ID NO1的氨基酸残基48的位置置换以赖氨酸或精氨酸残基；b)等同于或类似于SEQ ID NO1的氨基酸残基52的位置置换以甘氨酸、谷氨酰胺、蛋氨酸、精氨酸或色氨酸残基；c)等同于或类似于SEQ ID NO1的氨基酸残基125的位置置换以异亮氨酸、甘氨酸、天冬酰胺、丝氨酸或缬氨酸残基；d)等同于或类似于SEQ ID NO1的氨基酸残基132的位置置换以谷氨酸残基；e)等同于或类似于SEQ ID NO1的氨基酸残基219的位置置换以赖氨酸、色氨酸或酪氨酸残基；f)等同于或类似于SEQ ID NO1的氨基酸残基223的位置置换以精氨酸或酪氨酸残基；或g)等同于或类似于SEQ ID NO1的氨基酸残基238的位置置换以亮氨酸或蛋氨酸残基。甚至更优选地，分离的多肽包含密码子突变，该密码子突变对SEQ ID NO1产生下述置换突变F48K、F48R、T52G、T52Q、T52M、T52R、T52W、M125I、M125G、M125N、M125S、M125V、L132E、M219K、M219W、M219Y、L223R、L223Y、W238L或W238M。本发明也涉及包含本发明的分离的多肽的组合物。
本发明的调节基因表达的方法
申请人的发明也涉及在宿主细胞中使用本发明的基因表达调节系统来调节基因表达的方法。具体地，申请人的发明提供了在宿主细胞中调节基因表达的方法，该方法包括步骤a)将本发明的基因表达调节系统导入宿主细胞；和b)将配体导入宿主细胞，在配体导入宿主细胞之后，该基因的表达被调节，其中待调节的基因是基因表达盒的成分，所述基因表达盒包括i)应答元件，其包含被基因表达系统的DNA结合结构域识别的区域；ii)被基因表达系统的反式激活结构域激活的启动子；和iii)其表达待被调节的基因。本发明也提供了在宿主细胞中调节基因表达的方法，该方法包括步骤a)将本发明的基因表达调节系统导入宿主细胞；b)将本发明的基因表达盒导入宿主细胞，其中所述基因表达盒包含i)应答元件，其包含被基因表达系统的DNA结合结构域识别的区域；ii)被基因表达系统的反式激活结构域激活的启动子；和iii)其表达待被调节的基因；和c)将配体引入宿主细胞；因此，一旦所述配体被导入所述宿主细胞，基因的表达被调节。申请人:的发明也提供了在含有基因表达盒的宿主细胞中调节基因表达的方法，所述基因表达盒包含应答元件，其包含基因表达调节系统的第一杂合多肽的DNA结合结构域与之结合的区域；被基因表达调节系统的第二杂合多肽的反式激活结构域激活的启动子；和其表达待被调节的基因；其中所述方法包括步骤a)将本发明的基因表达调节系统导入宿主细胞；和b)将配体导入宿主细胞；因此，一旦所述配体被导入所述宿主细胞，基因的表达被调节。使用申请人的方法在宿主细胞中表达的感兴趣的基因可以是内源性基因或异源性基因。期望的基因或蛋白的核酸或氨基酸序列信息可以从众多公共数据库，例如GENBANK、EMBL、Swiss-Prot和PIR，或者从大量的生物学相关期刊出版物获得。因此，本领域技术人员能够获得几乎所有已知基因的核酸序列信息。这样的信息然后可以用于构建期望的构建物，用来将感兴趣的基因插入到在此描述的申请人的方法所使用的基因表达盒中。使用申请人的方法在宿主细胞中表达的感兴趣的基因的例子包括但不限于在植物中生产的抗原如疫苗，酶如α-淀粉酶、植酸酶、葡聚糖酶、木糖酶和木聚糖酶，对昆虫、线虫、真菌、细菌、病毒和非生物应激具有抗性的基因，营养物、药物、维生素，改变氨基酸内容、除草剂抗性、对冷、干旱和热的耐受性的基因，工业产品、油、蛋白质、碳水化合物、抗氧化剂、雄性不育植物、花、燃料、其他表现性状，编码治疗上理想的多肽或产物的基因，所述多肽或产物可以用于治疗病症、疾病、紊乱、功能障碍、遗传缺陷，如单克隆抗体、酶、蛋白酶、细胞因子、干扰素、胰岛素、促红细胞生成素、凝血因子、其他血液因子或成分，用于基因治疗的病毒载体、用于疫苗的病毒、药物开发的靶标、功能基因组学和蛋白质组学分析和应用，等等。可接受的配体是当本发明的基因表达系统的DNA结合结构域在配体存在的情况下与应答元件的结合导致激活或抑制基因表达时，调节基因表达的任何配体。优选的配体包括蜕皮类固醇，例如蜕皮激素、20-羟基蜕皮激素、松甾酮A、幕黎甾酮A和类似物，9-顺-视黄酸、视黄酸的合成类似物、N，N1-二酰肼，例如在美国专利6,013,836；5,117,057；5,530,028；5,378,726和美国专利申请10/775,883和10/787,906中公开的那些；二苯甲酰烷基氰肼，例如在欧洲专利申请461,809中公开的那些；N-烷基-N，N1-二芳酰肼，例如在美国专利5,225,443中公开的那些；N-酰基-N-烷基羰基肼，例如在欧洲专利申请234,994中公开的那些；N-芳酰基-N-烷基-N1-芳酰肼，例如在美国专利4,985,461中公开的那些；四氢喹啉，例如在国际专利申请PCT/US03/00915中公开的那些；这些专利或专利申请中的每一个都并入本文作为参考，其他类似的物质包括3，5-二-叔丁基-4-羟基N-异丁基-苯甲酰胺、8-O-乙酰哈帕苷、氧固醇、22(R)羟基胆固醇、24(S)羟基胆固醇、25-环氧胆固醇、T0901317、5-α-6-α-环氧胆固醇-3-硫酸酯(ECHS)、7-酮胆固醇-3-硫酸酯、法呢醇、胆汁酸、1，1-二膦酸酯、保幼激素III和类似物。在优选的实施方案中，用于申请人的调节基因表达的方法的配体是下式的化合物其中E是含有叔碳的支链(C4-C12)烷基或支链(C4-C12)烯基，或含有叔碳的氰基(C3-C12)烷基；R1是H、Me、Et、i-Pr、F、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、CoCH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF2CF3、CH＝CHCN、烯丙基、叠氮、SCN或SCHF2；R2是H、Me、Et、n-Pr、i-Pr、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、CoCH、1-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe、OEt、O-n-Pr、OAc、NMe2、NEt2、SMe、SEt、SOCF3、OCF2CF2H、COEt、环丙基、CF2CF3、CH＝CHCN、烯丙基、叠氮、OCF3、OCHF2、O-i-Pr、SCN、SCHF2、SOMe、NH-CN，或与R3以及连接R2和R3的苯基碳连接形成次乙二氧基、其中氧与苯基碳相邻的二氢呋喃环(dihydrofuryl ring)、或其中氧与苯基碳相邻的二氢吡喃环(dihydropyryl ring)；R3是H、Et，或与R2以及连接R2和R3的苯基碳连接形成次乙二氧基、其中氧与苯基碳相邻的二氢呋喃环、或其中氧与苯基碳相邻的二氢吡喃环；R4、R5和R6独立地是H、Me、Et、F、Cl、Br、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CN、CoCH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe或Set。在另一优选的实施方案中，用于申请人的调节基因表达的方法的配体是下式的化合物
其中在另一优选的实施方案中，用于申请人的调节基因表达的方法的配体是下式的化合物
其中在另一优选的实施方案中，用于申请人的调节基因表达的方法的配体是下式的化合物
其中在另一优选的实施方案中，用于申请人的调节基因表达的方法的配体是蜕皮激素、20-羟基蜕皮激素、松甾酮A、幕黎甾酮A、氧固醇、22(R)羟基胆固醇、24(S)羟基胆固醇、25-环氧胆固醇、T0901317、5-α-6-α-环氧胆固醇-3-硫酸酯(ECHS)、7-酮胆固醇-3-硫酸酯、法呢醇、胆汁酸、1，1-二膦酸酯或保幼激素III。在另一优选的实施方案中，除了上述第一配体外，第二配体可以用于申请人的调节基因表达的方法。优选地，该第二配体是9-顺-视黄酸或视黄酸的合成类似物。
本发明的宿主细胞和非人类生物
如上所述，本发明的基因表达调节系统可以用于在宿主细胞中调节基因表达。在转基因宿主细胞中进行的表达可以用于表达各种感兴趣的基因。申请人的发明提供了对在原核和真核宿主细胞中的基因表达的调节。在转基因宿主细胞中进行的表达可用于表达各种感兴趣的多肽，包括但不限于植物中产生的抗原如疫苗，酶如α-淀粉酶、植酸酶、葡聚糖酶、木糖酶和木聚糖酶，对昆虫、线虫、真菌、细菌、病毒和非生物应激具有抗性的基因，抗原、营养物、药物、维生素，改变氨基酸内容、除草剂抗性、对冷、干旱和热的耐受性的基因，工业产品、油、蛋白质、碳水化合物、抗氧化剂、雄性不育植物、花、燃料、其他表现性状、治疗性多肽、通路中间物；用于调节宿主中已存在的通路以合成之前所述宿主无法合成的新产物；用于基于细胞的分析；功能基因组学分析、生物治疗性蛋白生产、蛋白质组学分析，等等。此外，基因产物可以用于赋予宿主更高的生长产量，或赋予将被利用的其它生长模式。因此，申请人的发明提供包含本发明的基因表达系统的分离的宿主细胞。本发明也提供了包含本发明的基因表达盒的分离的宿主细胞。申请人的发明也提供包含本发明的多核苷酸或多肽的分离的宿主细胞。本发明也涉及用本发明的表达载体转染的宿主细胞。宿主细胞可以是细菌细胞、真菌细胞、线虫细胞、昆虫细胞、鱼类细胞、植物细胞、鸟类细胞、动物细胞或哺乳动物细胞。在另一实施方案中，本发明涉及产生含有置换突变的核受体配体结合结构域的方法，其中该方法包括在允许表达编码含有置换突变的核受体配体结合结构域的多核苷酸的条件下，在培养基中培养上述宿主细胞；从培养物中分离含有置换突变的核受体配体结合结构域。在特定的实施方案中，分离的宿主细胞是原核宿主细胞或真核宿主细胞。在另一特定的实施方案中，分离的宿主细胞是无脊椎动物宿主细胞或脊椎动物宿主细胞。优选地，宿主细胞选自细菌细胞、真菌细胞、酵母细胞、线虫细胞、昆虫细胞、鱼类细胞、植物细胞、鸟类细胞、动物细胞和哺乳动物细胞。更优选地，宿主细胞是酵母细胞、线虫细胞、昆虫细胞、植物细胞、斑马鱼细胞、鸡细胞、仓鼠细胞、小鼠细胞、大鼠细胞、兔细胞、猫细胞、狗细胞、牛细胞、羊细胞、奶牛细胞、猪细胞、马细胞、绵羊细胞、猿细胞、猴细胞、猩猩细胞或人细胞。优选的宿主细胞的例子包括但不限于真菌或酵母各种，例如曲霉属(Aspergillus)、木霉属(Trichoderma)、酵母属(Saccharoinyces)、毕赤酵母属(Pichia)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)，或细菌各种，例如在Synechocystis、Synechococcus、沙门氏菌属(Salmonella)、杆菌属(bacillus)、不动杆菌属(Acinetobacter)、红球菌属(Rhodococcus)、链霉菌属(Streptomyces)、埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、甲基单胞菌属(Methylomonas)、甲基杆菌属(Methylobacter)、产碱菌属(Alcaligenes)、Synechocystis、Anabaena、硫杆菌属(thiobacillus)、甲烷杆菌属(Methanobacterium)和克雷伯氏菌属(klebsiella)中的种；植物种，选自苹果、拟南芥、珍珠粟、香蕉、大麦、豆、甜菜、黑绿豆、鹰嘴豆、辣椒、黄瓜、茄子、蚕豆、玉米、瓜、粟、绿豆、燕麦、秋葵、黍、木瓜、花生、豌豆、胡椒、木豆、菠罗、菜豆、马铃薯、南瓜、水稻、高梁、大豆、笋瓜、甘蔗、甜菜、向日葵、甘薯、茶、番茄、烟草、西瓜和小麦；动物；和哺乳动物宿主细胞。在特定的实施方案中，宿主细胞是酵母细胞，选自酵母属、毕赤酵母属和假丝酵母属宿主细胞。在另一特定的实施方案中，宿主细胞是Caenorhabdus elegans线虫细胞。在另一特定的实施方案中，宿主细胞是昆虫细胞。在另一特定的实施方案中，宿主细胞是植物细胞，选自苹果、拟南芥、珍珠粟、香蕉、大麦、豆、甜菜、黑绿豆、鹰嘴豆、辣椒、黄瓜、茄子、蚕豆、玉米、瓜、粟、绿豆、燕麦、秋葵、黍、木瓜、花生、豌豆、胡椒、木豆、菠罗、菜豆、马铃薯、南瓜、水稻、高梁、大豆、笋瓜、甘蔗、甜菜、向日葵、甘薯、茶、番茄、烟草、西瓜和小麦细胞。在另一特定的实施方案中，宿主细胞是斑马鱼细胞。在另一特定的实施方案中，宿主细胞是鸡细胞。在另一特定的实施方案中，宿主细胞是哺乳动物细胞，选自仓鼠细胞、小鼠细胞、大鼠细胞、兔细胞、猫细胞、狗细胞、牛细胞、山羊细胞、母牛细胞、猪细胞、马细胞、绵羊细胞、猴细胞、猩猩细胞和人细胞。宿主细胞转化是本技术领域熟知的，并可以用各种方法完成，这些方法包括但不限于电穿孔、病毒感染、质粒/载体转染、非病毒载体介导的转染、农杆菌(Agrobacterium)介导的转染、粒子轰击和类似方法。期望的基因产物的表达涉及在合适的条件下培养转化的宿主细胞，和诱导转化的基因的表达。原核和真核细胞的培养条件和基因表达方案是本技术领域熟知的(参见实施例的一般方法部分)。可以根据专用于该基因产物的实验方案收获细胞并分离基因产物。此外，可以对调节被插入的多核苷酸的表达或以期望的特定方式修饰和加工多肽产物的宿主细胞进行选择。不同的宿主细胞具有特征性的且特异性的翻译和翻译后蛋白质加工和修饰机制[例如，蛋白质的糖基化作用、切割(例如信号序列的切割)]。可以选择合适的细胞系或宿主系统以确保对被表达的外来蛋白进行期望的修饰和加工。例如，在细菌系统中进行的表达可以用于产生非糖基化的核心蛋白产物。然而，细菌中表达的多肽可能无法正确折叠。酵母中进行的表达可以产生糖基化的产物。在真核细胞中进行的表达能够增加异源蛋白的“天然”糖基化和折叠的可能性。而且，在哺乳动物细胞中进行的表达能够为重构或构建多肽活性提供工具。此外，不同的载体/宿主表达系统可以不同程度地影响加工反应，例如蛋白质水解切割。申请人:的发明也涉及含有本发明的分离的宿主细胞的非人类生物体。在特定的实施方案中，非人类生物体为原核生物或真核生物。在另一特定的实施方案中，非人类生物体是无脊椎动物生物或脊椎动物生物。优选地，非人类生物体选自细菌、真菌、酵母、线虫、昆虫、鱼、植物、鸟类、动物和哺乳动物。更优选地，非人类生物体是酵母、线虫、昆虫、植物、斑马鱼、鸡、仓鼠、小鼠、大鼠、兔、猫、狗、牛、山羊、奶牛、猪、马、绵羊、猿、猴或猩猩。在特定的实施方案中，非人类生物体是酵母，选自酵母属、毕赤酵母属和假丝酵母属。在另一特定的实施方案中，非人类生物体是Caenorhabdus elegans线虫。在另一特定的实施方案中，非人类生物体是植物，选自苹果、拟南芥、珍珠粟、香蕉、大麦、豆、甜菜、黑绿豆、鹰嘴豆、辣椒、黄瓜、茄子、蚕豆、玉米、瓜、粟、绿豆、燕麦、秋葵、黍、木瓜、花生、豌豆、胡椒、木豆、菠罗、菜豆、马铃薯、南瓜、水稻、高梁、大豆、笋瓜、甘蔗、甜菜、向日葵、甘薯、茶、番茄、烟草、西瓜和小麦。在另一特定的实施方案中，非人类生物体是Mus inusculus小鼠。测量基因表达/转录
申请人的本发明方法的一个有用的量度是测量细胞的转录状态，包括RNA优选地mRNA的身份和丰度。通过若干已有的基因表达技术中的任何技术测量cDNA丰度，可以方便地进行这样的测量。核酸阵列技术是测定差异mRNA表达的有用技术。这样的技术包括例如寡核苷酸芯片和DNA微阵列。这些技术依赖于对应于不同的基因或cDNA的DNA片段或寡核苷酸，它们固定在固体支持物上并杂交于探针，其由从细胞、组织或整个生物体抽提的总mRNA制备，并转变为cDNA。寡核苷酸芯片是应用照相平版印刷技术在基质上合成的寡核苷酸的阵列。已经制出能够分析多达1700个基因的芯片。DNA微阵列是自动化地印制在显微镜载片上的DNA样品的阵列，典型地是PCR产物的阵列。每一个基因通过全长或部分长度的目标DNA序列而被分析。带有多达10,000个基因的微阵列现在可以商业化地常规制备。这两种技术之间主要的差异是，寡核苷酸芯片通常利用25聚体寡核苷酸，它允许区分短的DNA分子，而微阵列的大约1000个碱基对的更大的DNA目标可以更灵敏地区分复杂的DNA混合物。申请人:的本发明方法的另一个有用的量度是通过用本技术领域熟知的方法测量细胞中存在的组成型蛋白种类的丰度来测定细胞的翻译状态。当希望对与各种生理功能相关的基因进行鉴定时，可以采用某一分析方法，在该分析方法中，测量诸如细胞生长、凋亡、衰老、分化、粘附、与特异分子结合、与另一细胞结合、细胞组织、器官形成、胞内转运、转运易化、能量转化、代谢、肌发生、神经形成和/或造血作用的功能的变化。此外，可以利用选择性标记或报道基因表达来测量使用申请人的发明时的基因表达调节。检测基因表达的产物的其他方法是本技术领域熟知的，包括Southern印迹(DNA检测)、点或狭线印迹(DNA、RNA)、Northern印迹(RNA)、RT-PCR(RNA)、Western印迹(多肽检测)和ELISA(多肽)分析。尽管不太优选，标记的蛋白可以用于检测该标记蛋白与之杂交的特定核酸序列。在一些情况下，有必要扩增核酸序列的数量。这可以通过使用许多合适的方法中的一种或多种方法来进行，这些方法包括例如聚合酶链式反应(″PCR″)、连接酶链式反应(″LCR″)、链置换扩增(″SDA″)、基于转录的扩增，等等。按照已知的技术进行PCR，其中，例如，在杂交条件下，在热稳定DNA聚合酶存在的条件下处理核酸样品，应用一对寡核苷酸引物，一条引物与待检测的特定序列的一条链(模板链)杂交。引物与待与之杂交的特定序列的每条模板链充分互补。合成每条引物的延伸产物，该延伸产物与它所杂交的核酸模板链互补。由每一引物合成的延伸产物也可以作为使用同样的引物进一步合成延伸产物的模板。足够数量的延伸产物合成轮次之后，样品可以如上所述地进行分析，以评价是否存在待被检测的序列或多个序列。
配体筛选分析
本发明也涉及筛选在细胞中诱导或抑制含有置换突变的核受体配体结合结构域的反式激活作用的化合物的方法，该方法通过在配体存在的条件下将核受体配体结合结构域与候选分子接触，并检测报道基因活性来实施。候选化合物可以是核受体配体结合结构域的激动剂或者拮抗剂。在优选的实施方案中，核受体配体结合结构域由细胞中的多核苷酸表达，反式激活活性(即，报道基因的表达或遏制)或化合物结合活性被测量。因此，除了根据核受体配体结合结构域的结构合理地设计激动剂和拮抗剂外，本发明考虑使用本领域已知的各种筛选分析方法来鉴定核受体配体结合结构域的特异性配体的其它方法。可以用本领域已知的任何筛选技术来筛选H组核受体配体结合结构域的激动剂或拮抗剂。例如，含有本发明的基于核受体的基因表达系统的合适细胞系可以用编码可操作性地连接到诱导型或阻遏型启动子的标记基因的基因表达盒转染。然后将转染的细胞暴露于含有候选激动剂或拮抗剂化合物的测试溶液，然后分析标记基因的表达或抑制。与未暴露于该测试溶液的对照细胞相比，有更多的标记基因表达则表明在该测试溶液中存在激动剂化合物。相反地，与未暴露于该测试溶液的对照细胞相比，更少的基因表达则表明在该测试溶液中存在拮抗剂化合物。本发明考虑在体外筛选小分子配体或配体类似物和模拟物，以及在体外筛选结合本发明的H组核受体配体结合结构域并对其产生激动作用或拮抗作用的天然配体。例如，可以使用本发明的分析方法筛选天然产物文库，以获得对基于核受体的基因表达系统活性具有激动作用或拮抗作用的分子。使用例如X-射线结晶术、中子衍射、核磁共振光谱和其他结构测定技术来测定蛋白质的结构特征，可以进一步利于拮抗剂的鉴定和筛选。这些技术使得可以合理地设计或鉴定激动剂和拮抗剂。另一方法是使用重组噬菌体来产生大的文库。使用“噬菌体方法”[Scott和Smith，1990，Science 249386-390(1990)；Cwirla，et al.，Proc.Natl.Acad. Sci.，876378-6382(1990)；Devlin et al.，Science，249404-406(1990)]，可以构建非常大的文库(106-108个化学实体)。第二种方法主要使用化学方法，其中的例子是Geysen方法[Geysen et al.，Molecular Immunology 23709-715(1986)；Geysen et al.J.Immunologic Method 102259-274(1987)]和Fodor等的方法[Science251767-773(1991)]。Furka等[14thInternational Congress of Biochemistry，Volume 5，Abstract FR013(1988)；Furka，Int.J. Peptide Protein Res.37487-493(1991)]，Houghton[美国专利4,631,211，1986年12月出版]和Rutter等[美国专利5,010,175，1991年4月23日出版]描述了产生可以作为激动剂或拮抗剂被测试的多肽混合物的方法。在另一方面，合成文库[Needels et al.，Proc.Natl.Acad.Sci.USA 9010700-4(1993)；Ohlmeyer et al.，Proc.Natl.Acad.Sci.USA 9010922-10926(1993)；Lam et al.，国际专利公布号WO 92/00252；Kocis et al.，国际专利公布号WO 9428028，这些文献中的每一个以其整体并入本文作为参考]，以及类似物可以用于筛选本发明的候选配体。可以用表达本发明的核受体配体结合结构域的重组细胞进行筛选，或者可选择地，使用纯化的蛋白，例如重组产生的纯化的蛋白进行筛选，如上所述。例如，标记的、可溶性的核受体配体结合结构域可以用于筛选文库，如前述参考文献中所述。在一个实施方案中，本发明的H组核受体配体结合结构域可以被直接标记。在另一实施方案中，被标记的次级试剂可以用于检测本发明的核受体配体结合结构域与感兴趣的分子例如粘附到固体相支持物上的感兴趣的分子之间的结合。可以通过酶标记在原位形成发色团来检测结合。适宜的酶包括但不限于碱性磷酸酶和辣根过氧化物酶。在进一步的实施方案中，可以利用双色分析法，双色分析法使用两种发色底物，而两种酶标记位于不同的感兴趣的受体分子上。用双色分析法可以鉴定交叉反应活性的配体和单一反应活性的配体。用于本发明的其他标记包括有色乳胶珠、磁珠、荧光标记(例如荧光异硫氰酸酯(FITC)、藻红蛋白(PE)、德克萨斯红(TR)、若丹明、游离或螯合的镧系盐，特别是Eu3+，包括一些新的荧光团)、化学发光分子、放射性同位素或磁共振成像标记。双色分析法可以用在不同波长处进行发射的两个或更多个有色乳胶珠或荧光团来进行。标记的分子或细胞可以通过视觉检测或通过机械/光学手段进行检测。机械/光学手段包括荧光活化拣选，即，类似于FACS，以及显微操作移除工具。通过参考下面的非限制性的实施例，可以更好地理解本发明，这些非限制性的实施例作为本发明的示例给出。
实施例
申请人已经开发出CfEcR同源模型，并且已经使用该同源模型与公开的Chironomous tetans蜕皮激素受体(“CtEcR”)同源模型(Wurtz et al.，2000)一起鉴定参与结合蜕皮类固醇和非蜕皮类固醇的关键残基。已经显示，合成的非类固醇，二酰肼，以高亲和力结合鳞翅类EcRs，并诱导这些昆虫发生早熟性不完全蜕皮(Wing et al.，1988)，这些化合物中的若干目前作为杀虫剂在市场上出售。EcRs的配体结合腔已经进化，从而能够适应蜕皮类固醇例如20E的长主架结构。与蜕皮类固醇相比，二酰肼具有紧密的结构，仅仅占据EcR结合袋的底部。这使得与蜕皮类固醇接触但不与非蜕皮类固醇例如二酰肼接触的一些关键残基保持在结合袋的顶部。申请人对与蜕皮类固醇和/或非蜕皮类固醇接触的残基进行了置换突变，并测定了突变对配体结合的影响。申请人在本文中描述了在这些残基中的若干残基处的置换突变，并已根据它们的结合和反式激活特征鉴定出若干类置换突变受体。申请人新颖的置换突变核受体多核苷酸和多肽可以用于基于核受体的诱导型基因调节系统，用于各种应用中，包括基因疗法、在宿主细胞中表达感兴趣的蛋白、产生转基因生物和基于细胞的分析。
一般方法
本文中应用的标准的重组DNA和分子克隆技术是本技术领域众所周知的，并描述于下述文献中，Sambrook，J.，Fritsch，E.F.和Maniatis，T.MolecularCloningA Laboratory Manual；Cold Spring Harbor Laboratory PressCold SpringHarbor，N.Y.(1989)(Maniatis)；T.J.Silhavy，M.L.Bennan和L.W.Enquist，Experiments with Gene Fusions，Cold Spring Harbor Laboratory，Cold Spring Harbor，N.Y.(1984)；以及Ausubel，F.M.et al.，Current Protocols in Molecular Biology，Greene Publishing Assoc.and Wiley-Interscience(1987)。适合于维持和培养细菌培养物的材料和方法是本技术领域熟知的。适用于下述实施例的技术可以参见Manual of methods for General Bacteriology(PhillippGerhardt，R.G.E.Murray，Ralph N.Costilow，Eugene W.Nester，Willis A.Wood，NoelR.Krieg和G.Briggs Phillips eds)，American Society for Microbiology，Washington，DC.(1994))；或Thomas D.Brock in BiotechnologyA Textbook of IndustrialMicrobiology，Second Edition，Sinauer Associates，Inc.，Sunderland，MA(1989)。除非另外说明，用于培养和维持宿主细胞的所有试剂、限制性酶和材料获自AldrichChemicals(Milwaukee，WI)、DIFCO Laboratories(Detroit，MI)、GIBCO/BRL(Gaithersburg，MD)或Sigma Chemical Company(St.Louis，MO)。使用可由Genetics Computer Group Inc.获得的程序组(Wisconsin PackageVersion 9.0，Genetics Computer Group(GCG)，Madison，WI)，可以对遗传序列进行处理。当使用GCG程序“Pileup”时，可以使用空位产生默认值12、空位延伸默认值4。当使用CGC“Gap”或“Bestfit”程序时，可以使用默认空位产生罚值50、默认空位延伸罚值3。在GCG程序参数未提示输入的任何情况下，在这些或任何其他GCG程序中，可以使用默认值。缩写的含意如下“h”指小时，“min”指分钟，“sec”指秒，“d”指天，“μtL”指微升，“mL”指毫升，“L”指升，“μM”指微摩尔浓度，“mM”指毫摩尔浓度，“μg”指微克，“mg”指毫克，“A”指腺嘌呤或腺苷，“T”指胸腺嘧啶或胸苷，“G”指鸟嘌呤或鸟苷，“C”指胞嘧啶或胞苷，“xg”指重力倍数，“nt”指核苷酸，“aa”指氨基酸，“bp”指碱基对，“kb”指千碱基对，“k”指千，“μ”微，“℃”指摄氏度。
实施例1
此实施例描述了用于基于核受体的诱导型基因表达系统的若干基因表达盒的构建，所述基因表达盒含有本发明新颖的置换突变型H组核受体多核苷酸和多肽。申请人构建了基于云杉蚜虫云杉色卷蛾EcR(“CfEcR”)的基因表达盒。制备的受体构建物包含EcR或人(Homo sapiens)RXRβ-LmRXR嵌合体的配体结合结构域；和GAL4 DNA结合结构域(DBD)或VP16反式激活结构域(AD)。报道基因构建物包含报道基因荧光素酶，该荧光素酶可操作性地与含有Gal4 DBD所结合的GAL4应答元件的合成的启动子构建物相连。将这些受体构建物和报道基因构建物的各种组合共转染入哺乳动物细胞，如下面实施例2-5中所述。基因表达盒使用本领域可利用的标准克隆方法，如下地构建基于蜕皮激素受体的基因表达盒(开关)。下面是用于本文描述的实施例的每种开关的制备和组成的简要描述。1.1-GAL4CfEcR-DEF/VP16-βRXREF-LmRXREF将云杉蚜虫云杉色卷蛾EcR的野生型D、E和F结构域(″CfEcR-DEF″；SEQ ID NO21)与GAL4 DNA结合结构域(″Gal4DNABD″或″Gal4DBD″；SEQ ID NO6)融合，并置于CMV启动子(SEQ ID NO2)的控制之下。将人RXRβ的EF结构域的螺旋1至8(″HsRXRβ-EF″；SEQ ID NO3的核苷酸1-465)和飞蝗(Locusta migratoria)超气门蛋白的EF结构域的螺旋9至12(″LmRXR-EF″；SEQ ID NO23的核苷酸403-630)与VP16的反式激活结构域(″VP16AD″；SEQ ID NO12)融合，并置于SV40e启动子(SEQ ID NO22)的控制之下。将5个共有GAL4应答元件结合位点(″5XGAL4RE″；含有5个拷贝的GAL4RE，GAL4RE包含SEQ ID NO19)与合成的TATA最小启动子(SEQ ID NO24)融合，并置于荧光素酶报道基因(SEQ ID NO25)的上游。1.2-GAL4/突变CfEcR-DEF/VP16-βRXREF-LmRXREF除了用包含含有选自下面表1的置换突变的配体结合结构域的突变CfEcR-DEF替换野生型CfEcR-DEF外，按照与上述开关1.1相同的方式制备该构建物。
表1云杉色卷蛾蜕皮激素受体(″CfEcR″)配体结合结构域(LBD)的置换突变体
含有置换突变的蜕皮激素受体配体结合结构域的构建
在对EcR配体结合性进行修饰的尝试中，在三类不同的生物的EcRs中，对EcR配体结合结构域内根据分子建模分析预测为对配体结合重要的残基进行突变。表1示出了CfEcR(鳞翅类EcR)(SEQ ID NO1)的配体结合结构域内被突变并检测了蜕皮类固醇和非蜕皮类固醇结合的改变的氨基酸残基。利用PCR介导的定点诱变，在EcR cDNA中构建在表1中列出的每一种氨基酸置换突变。除了生成许多单突变点突变外，也生成了两个不同的双点突变CfEcRs一个含有V128F和A110P置换(V128F/A110P)，第二个含有N119F和V96T置换(N119F/V96T)。也生成了三个不同的三点突变CfEcRs一个含有V107I、Y127E和A110P置换(V107I/Y127E/A110P)，第二个含有V107I、Y127E和T52V置换(V107I/Y127E/T52V)，第三个含有V107I和Y127E置换以及甘氨酸(G)插入(V107I/Y127E/259G)(SEQ ID NO1)。使用Quikchange定点诱变试剂盒(Stratagene，La Jolla，CA)，并利用下述反应条件和循环参数，进行PCR定点诱变。使用1×反应缓冲液(由制造商提供)、50ngdsDNA模板、125ng正向引物(FP)、125ng反向互补引物(RCP)和1μLdNTP混合物(由制造商提供)，在50μL的最终反应体积中进行PCR定点诱变。表2给出了用于产生每种EcR突变体的正向引物和反向互补引物。应用的循环参数的组成如下95℃变性30秒，1个循环；然后95℃变性30秒，55℃退火1分钟，68℃延伸22分钟，共16个循环。
表2.用于构建置换突变CfEcR配体结合结构域的PCR引物然后将每种生成的编码突变EcR配体结合结构域的PCR核酸产物与GAL4 DNA结合结构域融合，如上述实施例1.2所述。通过将GAL4/突变EcR受体构建物与VP16/βRXREF-LmRXREF和pFRLuc一起转染入NIH3T3细胞，在各种配体存在的情况下测试GAL4/突变EcR受体构建物的活性。通过PCR将额外的甘氨酸插入EcR置换突变体V107I/Y127E[CfECR(VY)]的C-末端，生成Ga14-CfEcR-DEF(VYG)突变体。实质上，这是在两个步骤中完成的PCR扩增CfEcR-DEF(VYG)；和用PCR扩增的CfEcR-DEF(VYG)置换在载体GAL4-CfEcR DEF(VY)pBIND 1-9中的CfEcR(VY)。用载体GAL4-CfEcR DEF(VY)pBIND 1-9作为模板和下述PCR引物，扩增CfEcR-DEF区域(携带额外的甘氨酸)。
5EcR-wtGGAATTCCCGGGGATCCGGCCTGAGTGCGTAGTACCC(SEQ ID NO175)3EcR-甘氨酸CTCTCTGCGGCCGCCTATCCGAGATTCGTGGGGGACTCGAGGATAG(SEQ IDNO176)
分离PCR产物，并用Not I(在3′末端切割；包括在3′PCR引物中)和XmaI(在5′末端切割；存在于5′PCR引物中)消化。将该产物与用下述方法制备的载体连接用Xma I和Not I消化GAL4-CfEcR DEF(VY)pBIND 1-9(此消化的结果是移去载体中的CfEcR-DEF(VY))。在1％琼脂糖凝胶上分离片段，并纯化迁移较慢的载体DNA。在载体与上述CfEcR-DEF(VYG)片段连接之后，将连接反应物转化入细菌。使用上述引物进行菌落PCR来选择阳性菌落。通过测序确认选出的克隆中的VYG突变。
实施例2
此实施例描述了在对蜕皮类固醇配体的应答中显示出增加的活性的蜕皮类固醇应答性CfEcR配体结合结构域置换突变体的鉴定。在鉴定CfEcR中增加蜕皮类固醇配体活性的置换突变的尝试中，申请人应用PCR定点诱变试剂盒对预测为对蜕皮类固醇结合至关重要的氨基酸残基进行突变，并产生了GAL4/突变CfEcR-DEF cDNA基因表达盒，如上面的实施例1所述。制备与上面实施例中描述的各种开关构建物所对应的突变和野生型cDNA，并在GAL4驱动的荧光素酶报道基因分析中进行测试，如下所述。转染将DNA如下地转染入小鼠NIH3T3细胞(ATCC)。培养和维持细胞的标准方法参见下面的内容。收获细胞，并铺于96孔板上，每孔2,500个细胞，于50μL含有10％胎牛血清(FBS)的生长培养基中。二十四小时之后，细胞用35μL无血清生长培养基处理，该生长培养基含有二甲基亚砜(DMSO；对照)或配体的DMSO溶液。然后用SuperfectTM(Qiagen Inc.)转染试剂转染细胞。对于每一个孔，将0.625μL SuperfectTM与14.2μL无血清生长培养基混合。将0.16μg报道基因构建物和0.04μg的每一种受体构建物加入到转染试剂混合物。将转染混合物中的内含物在旋涡混合器中混合，并在室温中静置30分钟。温育结束时，将15μL转染混合物加入到细胞。在5％FBS中，将细胞维持在37℃和5％CO2中48小时。配体蜕皮类固醇配体松甾酮A和20-羟基蜕皮激素从Sigma ChemicalCompany和Invitrogen购得。非蜕皮类固醇二酰肼配体N-(2-乙基-3-甲氧苯甲酰)-N′-(3，5-二甲基苯甲酰)N′-叔丁基肼(RG-102240，GS-E配体)是合成的稳定的蜕皮类固醇配体，由Rohm and Haas Company合成。非蜕皮类固醇，二酰肼配体RG-101691、RG-102362、RG-115840、RG-115853、RG-115855、RG-115859和RG-115898由RheoGene Inc.合成。RG-101691、RG-102362、RG-115840、RG-115859和RG-115898的合成描述于下。RG-115853和RG-115855的合成描述于共同在审的美国专利申请10/775,883中。非蜕皮类固醇四氢喹啉配体RG-120499和RG-120500由RheoGene，Inc.合成，并描述于共同在审的美国专利申请10/460,820中。将所有配体溶于DMSO中。
配体合成
3，5-二甲基-苯甲酸N-叔丁基-N′-(3-乙基-2-甲基-苯甲酰)-酰肼(RG-101691)的制备
将3-氨基-2-甲基苯甲酸(6.16g)在浓HBr中回流加热30分钟。混合物冷却到0℃，在0℃用NaNO2溶液(2.8g，于5.6mL H2O中)处理。将所得的重氮盐溶液缓慢加入到在3.2mL浓HBr中的预热的(60-70℃)CuBr(3.8g)溶液中。加入之后，混合物在室温中搅拌过夜并过滤。回收的滤饼首先用水洗涤，然后用10％HCl洗涤，在空气中干燥产生6.93g浅紫色粉末固体3-溴-2-甲基苯甲酸。将该物质溶解于乙酸乙酯，用5％HCl洗涤两次，经Na2SO4干燥，并且首先在室温中从4∶1己烷∶乙酸乙酯再结晶，然后在冷藏条件进行再结晶。1H NMR(DMSO，200MHz)，δ(ppm)7.72(dd，2H)，7.2(t，1H)，2.5(s，3H)。
将3-溴-2-甲基苯甲酸(7.03g，32.7mmol)在10mL SOCl2(98mmol)和一滴DMF中回流3小时。真空去除过量的SOCl2。将残留物溶解于20mL CH2Cl2，并加入到20mL CH2Cl2中的冰冷的2-氨基-2-甲基-丙烷-1-醇(8.74g，9.36mL)溶液中。混合物室温中搅拌18小时，并在真空中去除溶剂得到油状残留物。在1小时的时间里，向该残留物加入SOCl2(7.4mL，100mL，3eq.)，混合物再搅拌30分钟，然后倒入150mL醚中。形成油状的不混溶相，弃除醚。将油与100mL 20％NaOH混合，并用3×150mL的醚萃取3次。合并醚萃取物，经MgSO4干燥，并在真空中去除溶剂得到黄色油。用4∶1己烷∶醚作为洗脱剂在硅胶上进行层析，得到4.87g无色的油2-(3-溴-2-甲基-苯基)-4，4-二甲基-4，5-二氢-唑。(Rf＝0.25(4∶1己烷∶醚)。1H NMR(CDCl3，200MHz)，δ(ppm)7.62(m，2H)，7.1(t，1H)，4.1(s，2H)，2.6(s，3H)，1.4(s，6H)。
在配备有磁力搅拌、温度计和回流冷凝器的100mL圆底烧瓶中，在氮气氛下将2-(3-溴-2-甲基-苯基)-4，4-二甲基-4，5-二氢-唑(3.4g，12.7mmol)溶解于30mL乙醚中。加入Ni(dPPP)Cl2(100mg)，混合物在冰浴中冷却至0℃。加入溴化乙基镁(5.5mL，3M，于醚中)，将反应混合物在0℃搅拌30分钟，在室温中搅拌2.5小时，最后回流2小时。然后将混合物冷却到0℃，用饱和NH4Cl水溶液淬灭。移去有机层，水层用醚萃取。合并有机相，并经MgSO4干燥。真空中去除溶剂得到2.84g 2-(3-乙基-2-甲基-苯基)-4，4-二甲基-4，5-二氢-唑，1H NMR(CDCl3，200MHz)，δ(ppm)7.5(d，2H)，7.2(m，2H)，4.1(s，2H)，2.7(m，2H)，2.45(s，3H)，1.4(s，6H)，1.2(t，3H)，Rf＝0.25(4∶1己烷∶醚)，含有大约5％原始的芳基溴化物。将该唑啉悬浮于100mL的6N HCl，并在剧烈搅拌下回流5小时。使混合物冷却到室温，随之结晶出3-乙基-2-甲基-苯甲酸1.74g，熔点(m.p.)96-98℃，1H NMR(CDCl3，200MHz)，δ(ppm)7.85(d，1H)，7.4(d，1H)，7.22(t，1H)，2.7(q，2H)，2.6(s，3H)，1.21(t，3H)。对水相进行醚萃取，回收得到另外的110mg。
将3-乙基-2-甲基-苯甲酸(0.517g)在3mL亚硫酰氯和一滴DMF中回流数小时。真空去除亚硫酰氯，得到0.89g(4.48mmol)3-乙基-2-甲基-苯甲酰氯。将该酰基氯溶解于5mL CH2Cl2中，并与5mLNaOH水溶液(0.30g，7.5mmol)同时但独立地缓慢加入到溶解于10mL CH2Cl2的预冷至-5℃的3，5-二甲基-苯甲酸N-叔丁基-酰肼(0.96g，4.36mmol)溶液中。在加入期间，温度保持在5℃以下。使混合物缓慢加温到室温，并搅拌过夜。移去有机层，并用CH2Cl2萃取水层。合并有机萃取物，干燥，真空中去除溶剂得到1.5g粗产物。该残留物在回流下用100mL己烷提取，从油状残留物移出热的提取物，并使其冷却到室温，随之结晶出3，5-二甲基-苯甲酸N-叔丁基-N′-(3-乙基-2-甲基-苯甲酰)-酰肼(0.56g，熔点167-169℃，1H NMR(CDCl3，200MHz)，δ(ppm)7.43(s，1H)，7.18(m，1H)，7.1(s，2H)，7.03(s，1H)，7.0(m，1H)，6.35(d，1H)，2.58(q，2H)，2.3(s，6H)，1.95(s，3H)，1.6(s，9H)，1.15(t，3H)。油状残留物经溶解并结晶生成第二批不太纯的物质，0.21g。
3，5-二甲基-苯甲酸N-叔丁基-N′-(3-异丙基-2-甲基-苯甲酰)-酰肼(RG-102362)的制备
在配备有磁力搅拌并维持于氮气氛下的干燥3颈250mL圆底烧瓶中，加入5.0g 2-(3-溴-2-甲基-苯基)-4，4-二甲基-4，5-二氢-唑、60mL无水THF和100mgNi(dPPP)Cl2。将混合物冷却到15℃，加入氯化异丙基镁(11mL，2M，于乙醚中)。出现温和的放热现象，并且混合物微微变暗。反应在室温搅拌过夜，此时，1H NMR显示完成50％。加入大约75mg Ni(dPPP)Cl2并回流3小时，并没有导致反应进一步进行。将混合物冷却到15℃，加入13mL氯化异丙基镁(2M，于乙醚中)和100mg镍催化剂，混合物室温中搅拌过夜。用饱和NH4Cl水溶液终止反应，移去有机层，萃取水层，合并有机相并干燥。真空中去除溶剂，得到3.84g粗产物，为黄色的油。用4∶1己烷∶醚作为洗脱剂在硅胶上进行柱层析，得到0.79g无色的油2-(3-异丙基-2-甲基-苯基)-4，4-二甲基-4，5-二氢-唑。1H NMR(CDCl3，200MHz)，δ(ppm)7.5(d，1H)，7.37(d，1H)，7.22(t，1H)，4.13(s，2H)，3.23(m，1H)，2.5(s，3H)，1.45(s，6H)，1.22(d，6H)。将该唑啉悬浮于34mL的6N HCl，并在油浴中回流6小时。使混合物冷却，并用CH2Cl2提取。提取物经Na2SO4干燥，蒸发得到0.76g 3-异丙基-2-甲基-苯甲酸，其纯度适合用于下一步骤。1H NMR(CDCl3，300MHz)，δ(ppm)7.8(d，1H)，7.48(d，1H)，7.3(t，1H)，3.3(m，1H)，2.55(s，3H)，1.2(d，6H)。
将3-异丙基-2-甲基-苯甲酸(0.75g)在大约3mL亚硫酰氯和一滴DMF中回流数小时，真空去除亚硫酰氯，得到3-异丙基-2-甲基-苯甲酰氯。将该酰基氯溶解到5mL CH2Cl2中，并与5mLNaOH水溶液(0.265g，6.6mmol)同时但独立地缓慢加入到溶解于10mL CH2Cl2的预冷至-5℃的3，5-二甲基-苯甲酸N-叔丁基-酰肼(0.973g，4.4mmol)中。在加入的期间，温度保持在5℃以下。使混合物缓慢加温到室温，并搅拌过夜。移去有机层，并用CH2Cl2萃取水层。合并有机萃取物，干燥，真空去除溶剂，得到1.61g粗产物，为黄色的油。用4∶1己烷∶乙酸乙酯作为洗脱剂在硅胶上对该物质进行层析，随后在1∶1己烷∶醚中磨碎，在60℃的真空炉中尽力去除醚后，得到3，5-二甲基-苯甲酸N-叔丁基-N′-(3-异丙基-2-甲基-苯甲酰)-酰肼。(0.35g，熔点182.5℃.1H NMR(CDCl3，200MHz)，δ(ppm)7.6(s，1H)，7.25(d，1H)，7.1(s，2H)，7.05(s，1H)，7.0(m，1H)，6.3(d，1H)，3.1(m，1H)，2.3(s，6H)，1.95(s，3H)，1.6(s，9H)，1.18(m，6H)。
3，5-二甲基-苯甲酸N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-N-(1-乙基-2，2-二甲基-丙基)-酰肼(RG-115858)的制备
在250mL圆底烧瓶中，将2.38g(18mmol)肼基甲酸叔丁酯溶解于50mLCH2Cl2，并冷却至0℃。配制K2CO3水溶液(4.15g K2CO3/35mL H2O)，加入到反应混合物中，再次将其冷却到0℃。将3.63g(16mmol)5-乙基-2，3-二氢-苯并[1，4]二英-6-碳酰氯溶解于40mLCH2Cl2，并在15分钟的时间里，由分液漏斗逐滴加入。反应混合物室温中搅拌3天。将反应混合物转移至带有CH2Cl2和H2O的分液漏斗。水相用CH2Cl2充分萃取。然后CH2Cl2萃取物用0.5N HCl提取，干燥并蒸发。残留物在真空炉中进一步干燥，产生5.15g棕褐色固体N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-肼羧酸叔丁酯。TLC(1∶1乙酸乙酯∶己烷)给出的结果是Rf＝0.43的单个点，NMR表明产物非常纯1H NMR(CDCl3，500MHz)δ(ppm)7.5(br，1H)，7.0(br，1H)，6.75(d，2H)，4.28(br，4H)，2.76(m，2H)，1.5(s，9H)，1.18(t，3H)。
将5.15g(16mmol)的N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-肼羧酸叔丁酯加入到200mL圆底烧瓶中。加入大约20mL三氟乙酸，并将反应混合物在室温中搅拌24小时。然后加入大约40mL水，之后伴随搅拌缓慢加入冷的10％NaOH/H2O，直至酸被中和(pH～14)。将反应混合物转移至分液漏斗，并通过温和振荡(小心气体逸出)用乙酸乙酯提取。乙酸乙酯提取物经干燥并蒸发得到5.51g浅黄色的粘性半固体。将该物质置于50℃真空炉中约1小时，得到4.62g的5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸酰肼。最好用纯的三氟乙酸进行t-Boc切割，使用辅助溶剂总是会产生低得多的产量。1H NMR(CDCl3，500MHz)δ(ppm)7.0(br，1H)，6.83(m，1H)，6.71(m，1H)，4.28(br s，4H)，2.76(m，2H)，1.6(br，2H)，1.17(t，3H)。
将1.12g(5.1mmol)5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸酰肼、1.37g(12mmol)2，2二甲基戊酮-3、30mL乙醇和20滴冰乙酸回流6小时，产生5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸(1-乙基-2，2-二甲基-亚丙基)-酰肼，该物质被原位使用。向冷却的反应混合物，加入3mL冰乙酸和0.63g(10mmol)NaCNBH3。反应在室温中搅拌24小时。加入25mL水，在旋转蒸发器上去除大部分的醇。然后加入10％NaOH/H2O，直到反应混合物变为碱性。产物用乙酸乙酯萃取，然后干燥并蒸发得到1.61g残留物。在硅胶上进行柱层析，用25％乙酸乙酯/己烷洗脱，获得纯的5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸N′-(1-乙基-2，2-二甲基-丙基)-酰肼(大约0.77g)。TLCRf＝0.53，1∶1乙酸乙酯∶己烷)。1H NMR(CDCl3，500MHz)δ(ppm)7.1(br s，1H)，6.8(d，1H)，6.7(d，1H)，4.27(m，4H)，2.8(m，2H)，2.4(m，1H)，1.7(m，1H)，1.3(m，1H)，1.2(t，3H)，1.15(t，3H)，0.97(s，9H)。
将0.214g(0.70mmol)5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸N′-(1-乙基-2，2-二甲基-丙基)-酰肼、151mg(0.9mmol)的3，5二甲基苯甲酰氯、7mL 25％K2CO3/H2O和7mL CH2Cl2加入到20mL瓶中，在室温中搅拌24小时。将反应混合物转移到分液漏斗，加入稀NaHCO3和CH2Cl2。分离CH2Cl2层，水层用CH2Cl2萃取两次。CH2Cl2萃取物经MgSO4干燥，并蒸发产生0.59g白色残留物。通过柱层析和用15mL 20％乙酸乙酯/己烷洗脱进行纯化，产生大约350mg 3，5-二甲基-苯甲酸N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-N-(1-乙基-2，2-二甲基-丙基)-酰肼(经TLC检测纯度为95％Rf＝0.56，1∶1乙酸乙酯∶己烷)。1H NMR(CDCl3，500MHz)δ(ppm)7.05(s，1H)，7.0(s，2H)，6.6(d，1H)，6.27(d，1H)，4.65(d，1H)，4.25(s，4H)，2.9(m，1H)，2.3(s，6H)，2.0(m，1H)，1.55-1.7(m，2H)，1.25(m，3H)，0.9-1.2(3s，9H)，0.9(t，3H)。
3，5-二甲氧基-4-甲基-苯甲酸N-(1-叔丁基-3，4，4-三甲基-戊-2-烯基)-N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-酰肼(RG115898)的制备
在250mL圆底烧瓶中，将2.38g(18mmol)肼基甲酸叔丁酯溶解于50mLCH2Cl2，并冷却至0℃。制备K2CO3水溶液(4.15g K2CO3/35mL H2O)，加入到反应混合物中，再次将其冷却到0℃。将3.63g(16mmol)5-乙基-2，3-二氢-苯并[1，4]二英-6-碳酰氯溶解于40mL CH2Cl2，并在15分钟的时间里，由分液漏斗逐滴加入。反应混合物室温中搅拌3天。将反应混合物转移至带有CH2Cl2和H2O的分液漏斗。水相用CH2Cl2充分萃取。然后CH2Cl2萃取物用0.5N HCl提取，干燥并蒸发。残留物在真空炉中进一步干燥，产生5.15g棕褐色固体N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-肼羧酸叔丁酯。TLC(1∶1乙酸乙酯∶己烷)给出的结果是Rf＝0.43的单个点，NMR表明产物非常纯1H NMR(CDCl3，500MHz)δ(ppm)7.5(br，1H)，7.0(br，1H)，6.75(d，2H)，4.28(br，4H)，2.76(m，2H)，1.5(s，9H)，1.18(t，3H)。
将5.15g(16mmol)N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-肼羧酸叔丁酯加入到200mL圆底烧瓶中。加入大约20mL三氟乙酸，并将反应混合物在室温搅拌24小时。然后加入大约40mL水，之后伴随搅拌缓慢加入冷的10％NaOH/H2O，直至酸被中和(pH～14)。将反应混合物转移至分液漏斗，并通过温和振荡(小心气体逸出)用乙酸乙酯提取。乙酸乙酯提取物经干燥并蒸发得到5.51g浅黄色的粘性半固体。然后将该物质置于50℃真空炉中约1小时，得到4.62g 5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸酰肼。最好用纯的三氟乙酸进行t-Boc切割，使用辅助溶剂总是会产生低得多的产量。1H NMR(CDCl3，500MHz)δ(ppm)7.0(br，1H)，6.83(m，1H)，6.71(m，1H)，4.28(br s，4H)，2.76(m，2H)，1.6(br，2H)，1.17(t，3H)。
将2，2，5，6，6-五甲基-庚-4-烯-3-酮(1.48g，8.1mmol)溶解于正丁醇(20mL)中。然后，加入5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸酰肼(1.80g，8.1mmol)和10滴冰乙酸。反应混合物回流20小时(这是完全反应所需要的)并通过TLC监控。向中间产物5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸(1-叔丁基-3，4，4-三甲基-亚戊-2-烯基)-酰肼的溶液加入1.8mL冰乙酸和1.02g(16.2mmol)氰基硼氢化钠。反应回流3小时。冷却反应，加入50mL水和10％NaOH水溶液，直到反应变为碱性(pH＝大约14)。在旋转蒸发器上去除大部分的醇，用EtOAc提取残留物。干燥含水提取物并浓缩至恒定重量，产生4g粘性物质。在硅胶上进行柱层析，获得2.3g纯5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸N′-(1-叔丁基-3，4，4-三甲基-戊-2-烯基)-酰肼(黄色的油，Rf＝0.30，在含有25％EtOAc的正己烷中，收率73％)。1H NMR(400MHz，CDCl3)δ(ppm)7.42(br，1H)，6.80(d，J＝8.4Hz，1H)，6.71(d，J＝8.4Hz，1H)，6.17(br，1H)，5.30(dd，J＝0.8，10Hz，1H)，4.33-4.29(m，4H)，3.68(d，J＝10Hz，1H)，2.80(m，2H)，1.72(s，3H)，1.21(s，3H)，1.12(s，9H)，1.05(s，9H)。
将5-乙基-2，3-二氢-苯并[1，4]二英-6-羧酸N′-(1-叔丁基-3，4，4-三甲基-戊-2-烯基)-酰肼(150mg，0.39mmol)和3，5-二甲氧基-4-甲基苯甲酰氯(83mg，0.39mmol)溶解于5mL CH2Cl2。加入5mL 25％K2CO3，反应混合物室温中搅拌过夜。反应通过TLC监控。分离各相，加入辅助操作所需的额外的CH2Cl2和/或水。干燥CH2Cl2层，真空中去除溶剂，得到210mg粗产物。通过硅胶柱层析和用含有10-25％乙酸乙酯的己烷的梯度洗脱步骤来纯化该物质，得到3，5-二甲氧基-4-甲基-苯甲酸N-(1-叔丁基-3，4，4-三甲基-戊-2-烯基)-N′-(5-乙基-2，3-二氢-苯并[1，4]二英-6-羰基)-酰肼RG115898(83mg，Rf＝0.19，在含有25％EtOAc的正己烷中，收率38％)。1H NMR(400MHz，DMSO-d6)δ(ppm)10.19(s，1H)，6.75(d，J＝8.0Hz，1H)，6.69(s，2H)，6.61(d，J＝8.0Hz，1H)，5.43(d，J＝10.0Hz，1H)，5.41(d，14.4Hz，1H)，4.30-4.20(m，4H)，3.80(s，6H)，2.21-2.15(m，1H)，2.01(s，3H)，1.81(m，1H)，1.76-1.64(m，1H)，1.06(s，9H)，1.00(s，9H)，0.70(t，J＝7.6Hz，3H)。
3，5-二甲基-苯甲酸N-(1-叔丁基-戊基)-N′-(4-乙基-苯甲酰)-酰肼(RG-115840)的制备
将2，2-二甲基-庚-3-醇(0.23mol)溶解于配备有磁力搅拌条的500mL圆底烧瓶中的350mL CH2Cl2中。该烧瓶用冰部分地冷却。加入76.6g(0.355mol)氯铬酸吡啶盐，同时剧烈搅拌。反应变黑并微微变热。室温中搅拌反应混合物24小时。溶液从黑色泥状物滗去，黑色泥状物用己烷冲洗。合并有机提取物并在硅胶上直接进行层析。(注意已发现只有硅土可以捕获并除去还原的未反应的铬化合物)。产物2，2-二甲基-庚-3-酮用CH2Cl2/己烷洗脱，随后在10％乙酸乙酯/己烷级分中，得到29.19g产物，收率88％。1H NMR(CDCl3，500MHz)δ(ppm)2.48(t，2H)，1.54(m，2H)，1.28(m，2H)，1.13(s，9H)，0.90(m，3H)。
4-乙基-苯甲酸N′-(1-叔丁基-戊基)-酰肼的制备
将4-乙基-苯甲酸酰肼(1.64g，10mmol)溶解于12.5mL甲醇中。然后加入一滴乙酸，再加入1.55g 2，2-二甲基-庚-3-酮。室温中搅拌混合物数天，在这时加入2.1mL乙酸和667mg NaBH3CN。搅拌大约7小时后，真空去除甲醇。残留产物用大约20mL水稀释，并用二氯甲烷提取。提取物经MgSO4干燥，固体过滤，真空去除溶剂，得到1.8g粗产物。通过在硅胶上进行柱层析，用100％己烷-100％乙醚梯度洗脱，纯化该物质。回收4-乙基-苯甲酸N′-(1-叔丁基-戊基)-酰肼，收率为45％(1.32g)。
将4-乙基-苯甲酸N′-(1-叔丁基-戊基)-酰肼(145.2mg，0.5mmol)溶解于5mL二氯甲烷中，并加入1.5mmol PS-NMM(804mg，一种-SO2NH(CH2)3-吗啉官能化聚苯乙烯树脂，可获自Argonaut Technologies，San Carlos，CA)。混合物用3ml二氯甲烷稀释，产生可搅拌的悬浮液。加入3，5-二甲基苯甲酰氯(0.5mmol，74mL)，并过夜搅拌混合物。第二天，将1mmol(775mg)的AP-NCO树酯(异氰酸酯官能化树脂，可获自Argonaut Technologies，San Carlos，CA)和1mmol(401.6mg)的AP-三胺(聚苯乙烯-CH2NHCH2CH2NH(CH2CH2NH2)2树脂，可获自Argonaut Technologies，San Carlos，CA)与3mL二氯甲烷一起加入，以清除剩余的起始材料。混合物搅拌4小时，过滤掉树脂，并干燥滤液，得到191mg粗产物，其在TLC分析中显示为一个点。用100％己烷-100％乙醚梯度，在硅胶上进行急骤层析来纯化该物质。产量50mg(大约23％)3，5-二甲基-苯甲酸N-(1-叔丁基-戊基)N′-(4-乙基-苯甲酰)-酰肼。1H NMR(CDCl3，400MHz)δ(ppm)7.8+7.5(br/br，1H)，7.4-6.9(m，7H)，4.7+3.6(m/m，1H)，2.65(m，2H)，2.38+2.28(s/s，6H)，1.9+1.75(br，2H)，1.4-1.2(br，m，7H)，1.1(br s，9H)，0.95(br s，3H)。报道物分析加入配体之后40小时收获细胞。将125μL被动裂解缓冲液(Promega Corporation的Dual-luciferaseTM报道物分析系统的一部分)加入到24孔板的每个孔中。将板置于旋转振荡器上15分钟。20μL的裂解物被分析。遵照制造商的说明书，用Promega Corporation的Dual-luciferaseTM报道物分析系统测量荧光素酶活性。用配体处理过的细胞的相对光单位(“RLU”)除以DMSO处理的细胞(未处理的对照)的RLU，计算出诱导倍数(FI，Fold induction)活性。
实施例3
此实施例描述了CfEcR配体结合结构域置换突变体的鉴定，所述突变体总体上对蜕皮类固醇产生应答，在对蜕皮类固醇的应答中显示出增加的活性。在鉴定增加蜕皮类固醇活性的CfEcR置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对氨基酸残基进行突变并产生了GAL4/突变CfEcR-DEF cDNA基因表达盒，如实施例1所述。制备了上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2描述的GAL4驱动的虫荧光素酶报告物分析中进行测试。鉴定了特定的氨基酸残基，当它们被置换时，产生对蜕皮类固醇配体的应答显示出增加的活性的突变蜕皮激素受体。在SEQ ID NO1的氨基酸残基119处进行的氨基酸置换对突变的CfEcR-DEF受体的活性的影响列于表3a中，表示为相对于Gal4/野生型CfEcR-DEF(WT)开关活性的增加倍数。在SEQ ID NO1的氨基酸残基96处进行的氨基酸置换以及在氨基酸残基96和119处进行的双氨基酸置换对突变的CfEcR-DEF受体的活性的影响列于表3b中，表示为EC50和相对最大诱导倍数(Rel Max FI)。使用三参数逻辑模型由剂量响应数据计算EC50。相对于GS-E配体(RG-102240；3，5-二甲基-苯甲酸N-叔丁基-N’-(2-乙基-3-甲氧基-苯甲酰)-酰肼)在所有浓度中观察到的最大诱导倍数，测试配体(本发明的实施方案)在所有浓度中观察到的最大诱导倍数被确定为相对Max FI。
表3a.显示出增加的蜕皮类固醇活性的CfEcR-DEF突变体相对于WT的增加倍数 N119F1.6nM GS-E配体(RG-102240)1.228nM GS-E配体(RG-102240) 0.7340nM GS-E配体(RG-102240) 0.06200nM GS-E配体(RG-102240)0.011μM GS-E配体(RG-102240) 0.085μM GS-E配体(RG-102240) 0.591.6nM PonA 1.338nM PonA 1.740nM PonA 9.42200nM PonA 6.501μM PonA 3.00表3b.显示出增加的蜕皮类固醇活性的CfEcR-DEF突变体如表3a和3b中所看到的，当CfEcR配体结合结构域在SEQ ID NO1的氨基酸残基96或119处发生突变以及在SEQ ID NO1的氨基酸96和119处发生双突变时，蜕皮类固醇的活性显著增加，这表明这些残基是CfEcR配体结合袋中重要的残基。
实施例4
此实施例描述了其他CfEcR配体结合结构域置换突变体的鉴定，所述突变体总体上对非蜕皮类固醇二酰肼产生应答，对二酰肼配体的应答显示出增加的活性。在鉴定增加二酰肼配体活性的CfEcR置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对经预测为对蜕皮类固醇结合至关重要的氨基酸残基进行突变，并产生了GAL4/突变CfEcR-DEF cDNA基因表达盒，如实施例1所述。制备上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2所述的GAL4-驱动的荧光素酶报告物分析中进行测试。鉴定了特定的氨基酸残基，当它们被置换时，产生对非蜕皮类固醇二酰肼配体的应答显示出增加的活性的突变蜕皮激素受体。在SEQ ID NO1的氨基酸残基48、52、54、109、110、125、132和223处进行的氨基酸置换，以及在SEQ IDNO1的氨基酸残基52和110处进行的双氨基酸置换对突变的CfEcR-DEF受体的活性的影响，以EC50和相对最大诱导倍数列于表4a和4b中。使用三参数逻辑模型由剂量响应数据计算EC50。相对于GS-E配体(3，5-二甲基-苯甲酸N-叔丁基-N’-(2-乙基-3-甲氧基-苯甲酰)-酰肼)在所有浓度中观察到的最大诱导倍数，测试配体(本发明的实施方案)在所有浓度中观察到的最大诱导倍数被确定为相对Max FI。
表4a.显示出增加的二酰肼配体活性的CfEcR突变体
表4b.显示出增加的二酰肼配体活性的CfEcR突变体如表4a和4b中所看到的，当CfEcR配体结合结构域在SEQ ID NO1的氨基酸残基48、52、54、109、110、125、132和223处发生突变以及在SEQ ID NO1的氨基酸52和110处发生双突变时，二酰肼的活性显著增加，这表明这些残基是CfEcR的配体结合袋中的重要残基。
实施例5
此实施例描述了其他CfEcR配体结合结构域置换突变体的鉴定，所述突变体总体上对二酰肼和蜕皮类固醇产生应答，对二酰肼配体和蜕皮类固醇的应答显示出增加的活性。在鉴定增加二酰肼配体活性和蜕皮类固醇配体活性的CfEcR置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对氨基酸残基进行突变，并生成了GAL4/突变CfEcR-DEF cDNA基因表达盒，如上面实施例1所述。制备上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2所述的GAL4-驱动的荧光素酶报告物分析中进行测试。在SEQ ID NO1的氨基酸残基109、132、238处进行的氨基酸置换，或在SEQ ID NO1的氨基酸残基52、107和127处进行的氨基酸置换，或在氨基酸残基107、127处进行氨基酸置换并且在SEQ ID NO1末端加入甘氨酸对突变的CfEcR-DEF受体的活性的影响，列于表5中。
表5.显示出增加的二酰肼和蜕皮类固醇活性的CfEcR突变体如表5中所看到的，当CfEcR配体结合结构域在氨基酸残基48、51、52、54、96、120、125、128、132、234和238处发生突变时，二酰肼和蜕皮类固醇的活性均增加，这表明这些残基是CfEcR的配体结合袋中的重要残基。
实施例6
此实施例描述了其他CfEcR配体结合结构域置换突变体的鉴定，所述突变体总体上对二酰肼和四氢喹啉产生应答，对二酰肼和四氢喹啉配体的应答显示出增加的活性。在鉴定增加二酰肼配体活性和四氢喹啉配体活性的CfEcR置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对预测的氨基酸残基进行突变，并生成了GAL4/突变CfEcR-DEF cDNA基因表达盒，如实施例1所述。制备上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2所述的GAL4-驱动的荧光素酶报告物分析中进行测试。在SEQ IDNO1的氨基酸残基107、110和127处进行的三突变，和在SEQ ID NO1的氨基酸残基107和127处进行的双突变对突变的CfEcR-DEF受体的活性的影响，列于表6中。
表6.显示出增加的二酰肼和四氢喹啉活性的CfEcR突变体如表6中所看到的，当CfEcR配体结合结构域在氨基酸残基107、110和127处以及在107和127处发生突变时，非蜕皮类固醇，二酰肼和四氢喹啉的活性均增加，这表明这些残基是CfEcR的配体结合袋中的重要残基。
实施例7
表7描述了相对于DMSO对照，各种浓度的二酰肼GSTM-E配体对各种CfEcR突变体的最大诱导倍数的影响。
表7.GSTM-E配体与DMSO对照对CfEcR突变体的最大诱导倍数的影响
实施例8
此实施例描述了其他CfEcR配体结合结构域置换突变体的鉴定，所述突变体在对二酰肼配体的应答中显示出降低的活性。在鉴定降低二酰肼配体活性的CfEcR置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对经预测为对二酰肼结合至关重要的氨基酸残基进行突变，并生成了GAL4/突变CfEcR-DEFcDNA基因表达盒，如实施例1所述。制备上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2所述的GAL4-驱动的荧光素酶报告物分析中进行测试。在SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、120、125、219、223、234或238处进行的氨基酸突变对突变的CfEcR-DEF受体的活性的影响，列于表8a和8b中。
表8a.显示出降低的二酰肼活性的CfEcR突变体
表8b.显示出降低的二酰肼活性的CfEcR突变体如表8a和8b中所看到的，当CfEcR配体结合结构域在SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、120、125、219、223、234或238处发生突变时，二酰肼的活性显著降低，这表明这些残基是CfEcR的配体结合袋中的重要残基。
实施例9
此实施例描述了其他CfEcR配体结合结构域置换突变体的鉴定，所述突变体总体上对四氢喹啉产生应答，在对四氢喹啉配体的应答中显示出增加的活性。在鉴定增加四氢喹啉配体活性的CfEcR置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对特定的氨基酸残基进行了突变，并生成了GAL4/突变CfEcR-DEF cDNA基因表达盒，如实施例1所述。制备上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2所述的GAL4-驱动的荧光素酶报告物分析中进行测试。在SEQ ID NO1的氨基酸残基110或128处进行的氨基酸置换，或在SEQ ID NO1的氨基酸残基110和128处进行的双氨基酸置换对突变的CfEcR-DEF受体的活性的影响，列于表9中。
表9.显示出增加的四氢喹啉活性的CfEcR突变体如表9中所看到的，当CfEcR配体结合结构域在SEQ ID NO1的氨基酸残基110或128处发生突变，或在SEQ ID NO1的氨基酸残基110和128处发生双突变时，四氢喹啉的活性显著增加，这表明这些残基是CfEcR的配体结合袋中的重要残基。
实施例10
此实施例描述了其他CfEcR配体结合结构域置换突变体的鉴定，所述突变体对二酰肼配体具有差异性的应答性。这些突变体的二酰肼活性总体上降低；然而它们对特定的二酰肼配体具有选择性的应答性。在鉴定CfEcR中的置换突变的努力中，申请人应用PCR介导的定点诱变试剂盒，对特定的氨基酸残基进行了突变，并生成了GAL4/突变CfEcR-DEF cDNA基因表达盒，如实施例1所述。制备上面实施例1.1和1.2中描述的与各种开关构建物相对应的突变和野生型cDNA，并在实施例2所述的GAL4-驱动的荧光素酶报告物分析中进行测试。在SEQ IDNO1的氨基酸残基52、95、109、125或132处进行的氨基酸置换对突变的CfEcR-DEF受体的活性的影响，列于表10a和10b中。
表10a.显示出降低的二酰肼活性和在对二酰肼RG-115855的应答中显示出增加的活性的CfEcR突变体
表10b.显示出降低的RG-102240二酰肼活性和在对其他二酰肼的应答中显示出增加的活性的CfEcR突变体如表10a和10b中所看到的，当CfEcR配体结合结构域在SEQ ID NO1的氨基酸残基52、95、109、125或132处发生突变时，二酰肼的活性受到不同的影响，这表明这些残基是CfEcR的配体结合袋中的重要残基。本发明的范围并不由在此描述的特定实施方案来限定。事实上，由前面的描述及附图
可知，除了在此描述的之外对本发明的各种修改对于本领域技术人员来说将是显而易见的。这样的修改都旨在落入随附的权利要求书的范围之内。应该进一步理解的是，赋予核酸或多肽的所有碱基大小或氨基酸大小，和所有分子量或分子质量值都是近似的，并且是以描述性的方式给出。
序列表<110> 瑞欧基因公司(RheoGene，Inc.)<120> 突变受体以及它们在基于核受体的诱导型基因表达系统中的应用<130> A01508-PCT<140> PCT/US2005/015089<141> 2005-05-02<150> US60/567,294<151> 2004-04-30<150> US11/118,855<151> 2005-04-29<150> US60/609,424<151> 2004-09-13<160> 176<170> PatentIn version 3.3<210> 1<211> 259<212> PRT<213> 云杉色卷蛾(Choristoneura fumiferana)<400> 1Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln1 5 10 15Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln20 25 30Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe35 40 45Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu50 55 60Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln65 70 75 80Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val85 90 95Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Ash100 105 110Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val115 120 125Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu130 135 140Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp145 150 155 160Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr165 170 175Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser
180 185 190Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu195 200 205Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys210 215 220Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val225 230 235 240Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr245 250 255Asn Leu Gly<210> 2<211> 1022<212> DNA<213> 巨细胞病毒(Cytomegalovirus)<400> 2tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta60ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc120aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg180gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc240gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat300agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc360ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga420cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg480gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac540caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt600caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg660cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata720agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac780agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt840gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa900ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact960cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020ag 1022<210> 3<211> 720<212> DNA<213> 人(Homo sapiens)<400> 3gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag60agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac120
cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg180aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca240ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc300atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga360gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac420aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc480tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac540tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct600gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt660gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga720<210> 4<211> 198<212> DNA<213> 云杉色卷蛾<400> 4tgtctggtat gcggggacag agcctccgga taccactaca atgcgctcac gtgtgaaggg60tgtaaagggt tcttcagacg gagtgttacc aaaaatgcgg tttatatttg taaattcggt120cacgcttgcg aaatggacat gtacatgcga cggaaatgcc aggagtgccg cctgaagaag180tgcttagctg taggcatg 198<210> 5<211> 66<212> PRT<213> 云杉色卷蛾<400> 5Cys Leu Val Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu1 5 10 15Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn20 25 30Ala Val Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr35 40 45Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val50 55 60Gly Met65<210> 6<211> 441<212> DNA<213> 酿酒酵母(Saccharomyces cerevisiae)<400> 6atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag60tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac120tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg180ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat300aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta360acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt420caaagacagt tgactgtatc g 441<210> 7<211> 147<212> PRT<213> 酿酒酵母<400> 7Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu1 5 10 15Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu20 25 30Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro35 40 45Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu50 55 60Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile65 70 75 80Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu85 90 95Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala100 105 110Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser115 120 125Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu130 135 140Thr Val Ser145<210> 8<211> 606<212> DNA<213> 大肠杆菌(Escherichia coli)<400> 8atgaaagcgt taacggccag gcaacaagag gtgtttgatc tcatccgtga tcacatcagc60cagacaggta tgccgccgac gcgtgcggaa atcgcgcagc gtttggggtt ccgttcccca120aacgcggctg aagaacatct gaaggcgctg gcacgcaaag gcgttattga aattgtttcc180ggcgcatcac gcgggattcg tctgttgcag gaagaggaag aagggttgcc gctggtaggt240cgtgtggctg ccggtgaacc acttctggcg caacagcata ttgaaggtca ttatcaggtc300gatccttcct tattcaagcc gaatgctgat ttcctgctgc gcgtcagcgg gatgtcgatg360aaagatatcg gcattatgga tggtgacttg ctggcagtgc ataaaactca ggatgtacgt420
aacggtcagg tcgttgtcgc acgtattgat gacgaagtta ccgttaagcg cctgaaaaaa480cagggcaata aagtcgaact gttgccagaa aatagcgagt ttaaaccaat tgtcgtagat540cttcgtcagc agagcttcac cattgaaggg ctggcggttg gggttattcg caacggcgac600tggctg 606<210> 9<211> 202<212> PRT<213> 大肠杆菌<400> 9Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg1 5 10 15Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala20 25 30Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys35 40 45Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg50 55 60Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly65 70 75 80Arg Val Ala Ala Gly Glu Pro Leu Leu Ala Gln Gln His Ile Glu Gly85 90 95His Tyr Gln Val Asp Pro Ser Leu Phe Lys Pro Asn Ala Asp Phe Leu100 105 110Leu Arg Val Ser Gly Met Ser Met Lys Asp Ile Gly Ile Met Asp Gly115 120 125Asp Leu Leu Ala Val His Lys Thr Gln Asp Val Arg Asn Gly Gln Val130 135 140Val Val Ala Arg Ile Asp Asp Glu Val Thr Val Lys Arg Leu Lys Lys145 150 155 160Gln Gly Asn Lys Val Glu Leu Leu Pro Glu Asn Ser Glu Phe Lys Pro165 170 175Ile Val Val Asp Leu Arg Gln Gln Ser Phe Thr Ile Glu Gly Leu Ala180 185 190Val Gly Val Ile Arg Asn Gly Asp Trp Leu195 200<210> 10<211> 420<212> DNA<213> 云杉色卷蛾<400> 10atgagacgcc gctggtccaa caacgggggc ttccagacgc tgcgaatgct cgaggagagc60
tcgtccgaag tgacgtcgtc ctcagctctg ggtctgccgg ccgcgatggt tatgtctccg120gagtcgctcg cctcgccaga gtacggcggg ctcgagctct ggggatacga cgatgggttg180tcatacaaca cggcgcagtc cttgctgggc aatacttgca cgatgcagca gcagcaacag240acgcagccgc tgccgtcgat gccgttgcct atgccgccga ccacgccgaa gtctgaaaac300gagtctattt cctcaggccg tgaggaactg tcgccagctt caagtataaa tgggtgcagt360acagatggcg aggcacgacg tcagaagaag ggccctgcgc cccgtcagca agaggaactg420<210> 11<211> 140<212> PRT<213> 云杉色卷蛾<400> 11Met Arg Arg Arg Trp Ser Asn Asn Gly Gly Phe Gln Thr Leu Arg Met1 5 10 15Leu Glu Glu Ser Ser Ser Glu Val Thr Ser Ser Ser Ala Leu Gly Leu20 25 30Pro Ala Ala Met Val Met Ser Pro Glu Ser Leu Ala Ser Pro Glu Tyr35 40 45Gly Gly Leu Glu Leu Trp Gly Tyr Asp Asp Gly Leu Ser Tyr Asn Thr50 55 60Ala Gln Ser Leu Leu Gly Asn Thr Cys Thr Met Gln Gln Gln Gln Gln65 70 75 80Thr Gln Pro Leu Pro Ser Met Pro Leu Pro Met Pro Pro Thr Thr Pro85 90 95Lys Ser Glu Asn Glu Ser Ile Ser Ser Gly Arg Glu Glu Leu Ser Pro100 105 110Ala Ser Ser Ile Asn Gly Cys Ser Thr Asp Gly Glu Ala Arg Arg Gln115 120 125Lys Lys Gly Pro Ala Pro Arg Gln Gln Glu Glu Leu130 135 140<210> 12<211> 271<212> DNA<213> 单纯疱疹病毒7<400> 12atgggcccta aaaagaagcg taaagtcgcc cccccgaccg atgtcagcct gggggacgag60ctccacttag acggcgagga cgtggcgatg gcgcatgccg acgcgctaga cgatttcgat120ctggacatgt tgggggacgg ggattccccg gggccgggat ttacccccca cgactccgcc180ccctacggcg ctctggatat ggccgacttc gagtttgagc agatgtttac cgatgccctt240ggaattgacg agtacggtgg ggaattcccg g 271<210> 13<211> 90
<212> PRT<213> 单纯疱疹病毒7<400> 13Met Gly Pro Lys Lys Lys Arg Lys Val Ala Pro Pro Thr Asp Val Ser1 5 10 15Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His20 25 30Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp35 40 45Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala50 55 60Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu65 70 75 80Gly Ile Asp Glu Tyr Gly Gly Glu Phe Pro85 90<210> 14<211> 307<212> DNA<213> 酿酒酵母<400> 14atgggtgctc ctccaaaaaa gaagagaaag gtagctggta tcaataaaga tatcgaggag60tgcaatgcca tcattgagca gtttatcgac tacctgcgca ccggacagga gatgccgatg120gaaatggcgg atcaggcgat taacgtggtg ccgggcatga cgccgaaaac cattcttcac180gccgggccgc cgatccagcc tgactggctg aaatcgaatg gttttcatga aattgaagcg240gatgttaacg ataccagcct cttgctgagt ggagatgcct cctaccctta tgatgtgcca300gattatg 307<210> 15<211> 102<212> PRT<213> 酿酒酵母<400> 15Met Gly Ala Pro Pro Lys Lys Lys Arg Lys Val Ala Gly Ile Asn Lys1 5 10 15Asp Ile Glu Glu Cys Asn Ala Ile Ile Glu Gln Phe Ile Asp Tyr Leu20 25 30Arg Thr Gly Gln Glu Met Pro Met Glu Met Ala Asp Gln Ala Ile Asn35 40 45Val Val Pro Gly Met Thr Pro Lys Thr Ile Leu His Ala Gly Pro Pro50 55 60Ile Gln Pro Asp Trp Leu Lys Ser Asn Gly Phe His Glu Ile Glu Ala65 70 75 80Asp Val Asn Asp Thr Ser Leu Leu Leu Ser Gly Asp Ala Ser Tyr Pro
85 90 95Tyr Asp Val Pro Asp Tyr100<210> 16<211> 807<212> DNA<213> 人<400> 16cccatggaat tccagtacct gccagataca gacgatcgtc accggattga ggagaaacgt60aaaaggacat atgagacctt caagagcatc atgaagaaga gtcctttcag cggacccacc120gacccccggc ctccacctcg acgcattgct gtgccttccc gcagctcagc ttctgtcccc180aagccagcac cccagcccta tccctttacg tcatccctga gcaccatcaa ctatgatgag240tttcccacca tggtgtttcc ttctgggcag atcagccagg cctcggcctt ggccccggcc300cctccccaag tcctgcccca ggctccagcc cctgcccctg ctccagccat ggtatcagct360ctggcccagg ccccagcccc tgtcccagtc ctagccccag gccctcctca ggctgtggcc420ccacctgccc ccaagcccac ccaggctggg gaaggaacgc tgtcagaggc cctgctgcag480ctgcagtttg atgatgaaga cctgggggcc ttgcttggca acagcacaga cccagctgtg540ttcacagacc tggcatccgt cgacaactcc gagtttcagc agctgctgaa ccagggcata600cctgtggccc cccacacaac tgagcccatg ctgatggagt accctgaggc tataactcgc660ctagtgacag gggcccagag gccccccgac ccagctcctg ctccactggg ggccccgggg720ctccccaatg gcctcctttc aggagatgaa gacttctcct ccattgcgga catggacttc780tcagccctgc tgagtcagat cagctcc807<210> 17<211> 269<212> PRT<213> 人<400> 17Pro Met Glu Phe Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile1 5 10 15Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys20 25 30Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg35 40 45Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro50 55 60Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu65 70 75 80Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala85 90 95Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala100 105 110
Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val115 120 125Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro130 135 140Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln145 150 155 160Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr165 170 175Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe180 185 190Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu195 200 205Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly210 215 220Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly225 230 235 240Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala245 250 255Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser260 265<210> 18<211> 34<212> DNA<213> 人工序列<220>
<223> 1X蜕皮激素应答元件(EcRE)<400> 18tcgagagaca agggttcaat gcacttgtcc aatg 34<210> 19<211> 19<212> DNA<213> 人工序列<220>
<223> GAL4应答元件<400> 19ggagtactgt cctccgagc 19<210> 20<211> 36<212> DNA<213> 人工序列<220>
<223> 2xLexAop应答元件<400> 20ctgctgtata taaaaccagt ggttatatgt acagta 36
<210> 21<211> 1008<212> DNA<213> 云杉色卷蛾<400> 21cggcctgagt gcgtagtacc cgagactcag tgcgccatga agcggaaaga gaagaaagca60cagaaggaga aggacaaact gcctgtcagc acgacgacgg tggacgacca catgccgccc120attatgcagt gtgaacctcc acctcctgaa gcagcaagga ttcacgaagt ggtcccaagg180tttctctccg acaagctgtt ggagacaaac cggcagaaaa acatccccca gttgacagcc240aaccagcagt tccttatcgc caggctcatc tggtaccagg acgggtacga gcagccttct300gatgaagatt tgaagaggat tacgcagacg tggcagcaag cggacgatga aaacgaagag360tcggacactc ccttccgcca gatcacagag atgactatcc tcacggtcca acttatcgtg420gagttcgcga agggattgcc agggttcgcc aagatctcgc agcctgatca aattacgctg480cttaaggctt gctcaagtga ggtaatgatg ctccgagtcg cgcgacgata cgatgcggcc540tcagacagtg ttctgttcgc gaacaaccaa gcgtacactc gcgacaacta ccgcaaggct600ggcatggcct acgtcatcga ggatctactg cacttctgcc ggtgcatgta ctctatggcg660ttggacaaca tccattacgc gctgctcacg gctgtcgtca tcttttctga ccggccaggg720ttggagcagc cgcaactggt ggaagagatc cagcggtact acctgaatac gctccgcatc780tatatcctga accagctgag cgggtcggcg cgttcgtccg tcatatacgg caagatcctc840tcaatcctct ctgagctacg cacgctcggc atgcaaaact ccaacatgtg catctccctc900aagctcaaga acagaaagct gccgcctttc ctcgaggaga tctgggatgt ggcggacatg960tcgcacaccc aaccgccgcc tatcctcgag tcccccacga atctctag1008<210> 22<211> 309<212> DNA<213> 猿病毒40<400> 22ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt60agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca120tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa180ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag240aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag300gcctaggct309<210> 23<211> 635<212> DNA<213> 飞蝗(Locusta migratoria)<400> 23tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag60cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat120ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg180cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca240cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga300
cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc360gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac420ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg480aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta540agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc600tgatggagat gcttgaatca ccttctgatt cataa 635<210> 24<211> 6<212> DNA<213> 人工序列<220>
<223> 合成的启动子<400> 24tatata 6<210> 25<211> 1653<212> DNA<213> 萤火虫(Photinus pyralis)<400> 25atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatcctct agaggatgga 60accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt cgaaatgtcc 180gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgaacatt 360tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga ttaccaggga 480tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa ttcctctgga 600tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt cagattctcg 660catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct tcaggattac 840aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa aagcactctg 900attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc acctctttcg 960aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg acaaggatat 1020gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat tatgtccggt 1200tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg cttgaagtct 1320
ttaattaaat acaaaggata tcaggtggcc cccgctgaat tggaatcgat attgttacaa1380caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc cggtgaactt1440cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat1500tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac1560gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata1620aaggccaaga agggcggaaa gtccaaattg taa 1653<210> 26<211> 541<212> PRT<213> 云杉色卷蛾<400> 26Met Arg Arg Arg Trp Ser Asn Asn Gly Gly Phe Gln Thr Leu Arg Met1 5 10 15Leu Glu Glu Ser Ser Ser Glu Val Thr Ser Ser Ser Ala Leu Gly Leu20 25 30Pro Ala Ala Met Val Met Ser Pro Glu Ser Leu Ala Ser Pro Glu Tyr35 40 45Gly Gly Leu Glu Leu Trp Gly Tyr Asp Asp Gly Leu Ser Tyr Asn Thr50 55 60Ala Gln Ser Leu Leu Gly Asn Thr Cys Thr Met Gln Gln Gln Gln Gln65 70 75 80Thr Gln Pro Leu Pro Ser Met Pro Leu Pro Met Pro Pro Thr Thr Pro85 90 95Lys Ser Glu Asn Glu Ser Ile Ser Ser Gly Arg Glu Glu Leu Ser Pro100 105 110Ala Ser Ser Ile Asn Gly Cys Ser Thr Asp Gly Glu Ala Arg Arg Gln115 120 125Lys Lys Gly Pro Ala Pro Arg Gln Gln Glu Glu Leu Cys Leu Val Cys130 135 140Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu Thr Cys Glu Gly145 150 155 160Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn Ala Val Tyr Ile165 170 175Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr Met Arg Arg Lys180 185 190Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val Gly Met Arg Pro195 200 205Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu Lys210 215 220
Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr Val225 230 235 240Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro Glu245 250 255Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys Leu260 265 270Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn Gln275 280 285Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln290 295 300Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln Ala305 310 315 320Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr Glu325 330 335Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu340 345 350Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu Lys355 360 365Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr Asp370 375 380Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr Arg385 390 395 400Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu Leu405 410 415His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His Tyr420 425 430Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu Glu435 440 445Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr Leu450 455 460Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser Val465 470 475 480Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu Gly485 490 495Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg Lys500 505 510Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser His515 520 525
Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu530 535 540<210> 27<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 27gtcggacact ccctaccgcc agatcacag 29<210> 28<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 28ctgtgatctg gcggtaggga gtgtccgac 29<210> 29<211> 31<212> DNA<213> 人工<220>
<223> 引物<400> 29gtcggacact ccctggcgcc agatcacaga g31<210> 30<211> 31<212> DNA<213> 人工<220>
<223> 引物<400> 30ctctgtgatc tggcgccagg gagtgtccga c31<210> 31<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 31gtcggacact cccttgcgcc agatcacag 29<210> 32<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 32ctgtgatctg gcgcaaggga gtgtccgac 29
<210> 33<211> 33<212> DNA<213> 人工<220>
<223> 引物<400> 33gaggctgaca ctcccaaccg ccagatcaca gag 33<210> 34<211> 33<212> DNA<213> 人工<220>
<223> 引物<400> 34ctctgtgatc tggcggttgg gagtgtcagc ctc 33<210> 35<211> 29<212> DNA<2l3> 人工<220>
<223> 引物<400> 35gtcggacact ccccgccgcc agatcacag 29<210> 36<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 36ctgtgatctg gcggcgggga gtgtccgac 29<210> 37<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 37gtcggacact cccaagcgcc agatcacag 29<210> 38<211> 29<212> DNA<213> 人工<220>
<223> 引物<400> 38ctgtgatctg gcgcttggga gtgtccgac 29<210> 39<211> 32<212> DNA<213> 人工
<220>
<223>引物<400>39ctcccttccg ccagaacaca gagatgacta tc 32<210>40<211>32<212>DNA<213>人工<220>
<223>引物<400>40gatagtcatc tctgtgttct ggcggaaggg ag 32<210>41<211>28<212>DNA<213>人工<220>
<223>引物<400>41ctcccttccg ccagctcaca gagatgac28<210>42<211>28<212>DNA<213>人工<220>
<223>引物<400>42gtcatctctg tgagctggcg gaagggag28<210>43<211>30<212>DNA<213>人工<220>
<223>引物<400>43cactcccttc cgccagatga cagagatgac 30<210>44<211>30<212>DNA<213>人工<220>
<223>引物<400>44gtcatctctg tcatctggcg gaagggagtg 30<210>45<211>35<212>DNA<213>人工<220>
<223>引物
<400>45cccttccgcc agatcatgga gatgactatc ctcac35<210>46<211>35<212>DNA<213>人工<220>
<223>引物<400>46gtgaggatag tcatctccat gatctggcgg aaggg35<210>47<211>33<212>DNA<213>人工<220>
<223>引物<400>47cttccgccag atcagagaga tgactatcct cac 33<210>48<211>33<212>DNA<213>人工<220>
<223>引物<400>48gtgaggatag tcatctctct gatctggcgg aag 33<210>49<211>37<212>DNA<213>人工<220>
<223>引物<400>49ctcccttccg ccagatctgg gagatgacta tcctcac 37<210>50<211>37<212>DNA<213>人工<220>
<223>引物<400>50gtgaggatag tcatctccca gatctggcgg aagggag 37<210>51<211>35<212>DNA<213>人工<220>
<223>引物<400>51cccttccgcc agatcctaga gatgactatc ctcac35
<210>52<211>35<212>DNA<213>人工<220>
<223>引物<400>52gtgaggatag tcatctctag gatctggcgg aaggg35<210>53<211>37<212>DNA<213>人工<220>
<223>引物<400>53ctcccttccg ccagatcgag gagatgacta tcctcac 37<210>54<211>37<212>DNA<213>人工<220>
<223>引物<400>54gtgaggatag tcatctcctc gatctggcgg aagggag 37<210>55<211>31<212>DNA<213>人工<220>
<223>引物<400>55cttccgccag atcccagaga tgactatcct c31<210>56<211>31<212>DNA<213>人工<220>
<223>引物<400>56gaggatagtc atctctggga tctggcggaa g31<210>57<211>33<212>DNA<213>人工<220>
<223>引物<400>57cttccgccag atcggagaga tgactatcct cac 33<210>58<211>33<212>DNA<213>人工
<223>引物<400>58gtgaggatag tcatctctcc gatctggcgg aag 33<210>59<211>33<212>DNA<213>人工<220>
<223>引物<400>59cttccgccag atccaagaga tgactatcct cac 33<210>60<211>33<212>DNA<213>人工<220>
<223>引物<400>60gtgaggatag tcatctcttg gatctggcgg aag 33<210>61<211>35<212>DNA<213>人工<220>
<223>引物<400>61cccttccgcc agatcgtaga gatgactatc ctcac35<210>62<211>35<212>DNA<213>人工<220>
<223>引物<400>62gtgaggatag tcatctctac gatctggcgg aaggg35<210>63<211>33<212>DNA<213>人工<220>
<223>引物<400>63cgccagatca cagagtggac tatcctcacg gtc 33<210>64<211>33<212>DNA<213>人工<220>
<223>引物
<400>64gaccgtgagg atagtccact ctgtgatctg gcg 33<210>65<211>31<212>DNA<213>人工<220>
<223>引物<400>65ccagatcaca gagacgacta tcctcacggt c31<210>66<211>31<212>DNA<213>人工<220>
<223>引物<400>66gaccgtgagg atagtcgtct ctgtgatctg g31<210>67<211>30<212>DNA<213>人工<220>
<223>引物<400>67gctcaagtga ggtactgatg ctccgagtcg 30<210>68<211>30<212>DNA<213>人工<220>
<223>引物<400>68cgactcggag catcagtacc tcacttgagc 30<210>69<211>32<212>DNA<213>人工<220>
<223>引物<400>69gctcaagtga ggtagagatg ctccgagtcg cg 32<210>70<211>32<212> DNA<213>人工<220>
<223>引物<400>70cgcgactcgg agcatctcta cctcacttga gc 32
<210>71<211>33<212>DNA<213>人工<220>
<223>引物<400>71gaggtaatga tgctccacgt cgcgcgacga tac 33<210>72<211>33<212>DNA<213>人工<220>
<223>引物<400>72gtatcgtcgc gcgacgtgga gcatcattac ctc 33<210>73<211>39<212>DNA<213>人工<220>
<223>引物<400>73gtgaggtaat gatgctcatg gtcgcgcgac gatacgatg39<210>74<211>39<212>DNA<213>人工<220>
<223>引物<400>74catcgtatcg tcgcgcgacc atgagcatca ttacctcac39<210>75<211>36<212>DNA<213>人工<220>
<223>引物<400>75gtgaggtaat gatgctctgg gtcgcgcgac gatacg 36<210>76<211>36<212>DNA<213>人工<220>
<223>引物<400>76cgtatcgtcg cgcgacccag agcatcatta cctcac 36<210>77<211>30<212>DNA<213>人工
<220>
<223>引物<400>77gtaatgatgc tccgactcgc gcgacgatac 30<210>78<211>30<212>DNA<213>人工<220>
<223>引物<400>78gtatcgtcgc gcgagtcgga gcatcattac30<210>79<211>37<212>DNA<213>人工<220>
<223>引物<400>79gaggtaatga tgctccgatg ggcgcgacga tacgatg 37<210>80<211>37<212>DNA<213>人工<220>
<223>引物<400>80catcgtatcg tcgcgcccat cggagcatca ttacctc 37<210>81<211>32<212>DNA<213>人工<220>
<223>引物<400>81ggtaatgatg ctccgatccg cgcgacgata cg 32<210>82<211>32<212>DNA<213>人工<220>
<223>引物<400>82cgtatcgtcg cgcggatcgg agcatcatta cc 32<210>83<211>32<212>DNA<213>人工<220>
<223>引物
<400>83ggtaatgatg ctccgagagg cgcgacgata cg 32<210>84<211>32<212>DNA<213>人工<220>
<223>引物<400>84cgtatcgtcg cgcctctcgg agcatcatta cc32<210>85<211>32<212>DNA<213>人工<220>
<223>引物<400>85ggtaatgatg ctccgaaccg cgcgacgata cg 32<2l0>86<211>32<212>DNA<213>人工<220>
<223>引物<400>86cgtatcgtcg cgcggttcgg agcatcatta cc 32<210>87<211>30<212>DNA<213>人工<220>
<223>引物<400>87gcggcctcag acagtattct gttcgcgaac 30<210>88<211>30<212>DNA<213>人工<220>
<223>引物<400>88gttcgcgaac agaatactgt ctgaggccgc 30<210>89<211>34<212>DNA<213>人工<220>
<223>引物<400>89ctcagacagt gttctgtggg cgaacaacca agcg 34
<210>90<211>34<212>DNA<213>人工<220>
<223>引物<400>90cgcttggttg ttcgcccaca gaacactgtc tgag 34<210>91<211>33<212>DNA<213>人工<220>
<223>引物<400>91ctcagacagt gttctgcccg cgaacaacca agc 33<210>92<211>33<212>DNA<213>人工<220>
<223>引物<400>92gcttggttgt tcgcgggcag aacactgtct gag 33<210>93<211>32<212>DNA<213>人工<220>
<223>引物<400>93cagacagtgt tctgttggcg aacaaccaag cg 32<210>94<211>32<212>DNA<213>人工<220>
<223>引物<400>94cgcttggttg ttcgccaaca gaacactgtc tg 32<210>95<211>35<212>DNA<213>人工<220>
<223>引物<400>95cctcagacag tgttctgatg gcgaacaacc aagcg35<210>96<211>35<212>DNA<213>人工
<220>
<223>引物<400>96cgcttggttg ttcgccatca gaacactgtc tgagg35<210>97<211>35<212>DNA<213>人工<220>
<223>引物<400>97cctcagacag tgttctgaac gcgaacaacc aagcg35<210>98<211>35<212>DNA<213>人工<220>
<223>引物<400>98cgcttggttg ttcgcgttca gaacactgtc tgagg35<210>99<211>32<212>DNA<213>人工<220>
<223>引物<400>99cagacagtgt tctgttcccg aacaaccaag cg 32<210>100<211>32<212>DNA<213>人工<220>
<223>引物<400>100cgcttggttg ttcgggaaca gaacactgtc tg 32<210>101<211>35<212>DNA<213>人工<220>
<223>引物<400>101gacagtgttc tgttcgagaa caaccaagcg tacac35<210>102<211>35<212>DNA<213>人工<220>
<223>引物
<400>102gtgtacgctt ggttgttctc gaacagaaca ctgtc35<210>103<211>42<212>DNA<213>人工<220>
<223>引物<400>103cagacagtgt tctgttcaac aacaaccaag cgtacactcg cg42<210>104<211>42<212>DNA<213>人工<220>
<223>引物<400>104cgcgagtgta cgcttggttg ttgttgaaca gaacactgtc tg42<210>105<211>39<212>DNA<213>人工<220>
<223>引物<400>105cagacagtgt tctgttctgg aacaaccaag cgtacactc39<210>106<211>39<212>DNA<213>人工<220>
<223>引物<400>106gagtgtacgc ttggttgttc cagaacagaa cactgtctg39<210>107<211>37<212>DNA<213>人工<220>
<223>引物<220>
<221>misc_feature<222>(16)..(18)<223>n是a，c，g或t<400>107gcgtacactc gcgacnnnta ccgcaaggct ggcatgg 37<210>108<211>37<212>DNA<213>人工<220>
<223>引物<220>
<221>misc_feature<222>(20)..(22)<223>n是a，c，g或t<400>108ccatgccagc cttgcggtan nngtcgcgag tgtacgc 37<210>109<211>31<212>DNA<213>人工<220>
<223>引物<400>109cactcgcgac aactggcgca aggctggcat g31<210>110<211>31<212>DNA<213>人工<220>
<223>引物<400>110catgccagcc ttgcgccagt tgtcgcgagt g31<210>111<211>34<212>DNA<213>人工<220>
<223>引物<400>111cactcgcgac aacatgcgca aggctggcat ggcc 34<210>112<211>34<212>DNA<213>人工<220>
<223>引物<400>112ggccatgcca gccttgcgca tgttgtcgcg agtg 34<210>113<211>28<212>DNA<213>人工<220>
<223>引物<400>113caaggctggc ccggcctacg tcatcgag28<210>114<211>28<212>DNA<213>人工
<220>
<223>引物<400>114ctcgatgacg taggccgggc cagccttg28<210>115<211>26<212>DNA<213>人工<220>
<223>引物<400>115caaggctggc agggcctacg tcatcg 26<210>116<211>26<212>DNA<213>人工<220>
<223>引物<400>116cgatgacgta ggccctgcca gccttg 26<210>117<211>29<212>DNA<213>人工<220>
<223>引物<400>117gcaaggctgg cgaggcctac gtcatcgag 29<210>118<211>29<212>DNA<213>人工<220>
<223>引物<400>118ctcgatgacg taggcctcgc cagccttgc 29<210>119<211>26<212>DNA<213>人工<220>
<223>引物<400>119caaggctggc ctggcctacg tcatcg 26<210>120<211>26<212>DNA<213>人工<220>
<223>引物
<400>120cgatgacgta ggccaggcca gccttg 26<210>121<211>32<212>DNA<213>人工<220>
<223>引物<400>121ccgcaaggct ggctgcgcct acgtcatcga gg 32<210>122<211>32<212>DNA<213>人工<220>
<223>引物<400>122cctcgatgac gtaggcgcag ccagccttgc gg 32<210>123<211>29<212>DNA<213>人工<220>
<223>引物<400>123ccgcaaggct ggcggggcct acgtcatcg 29<210>124<211>29<212>DNA<213>人工<220>
<223>引物<400>124cgatgacgta ggccccgcca gccttgcgg 29<210>125<211>29<212>DNA<213>人工<220>
<223>引物<400>125ccgcaaggct ggcatagcct acgtcatcg 29<210>126<211>29<212>DNA<213>人工<220>
<223>引物<400>126cgatgacgta ggctatgcca gccttgcgg 29
<210>127<211>27<212>DNA<213>人工<220>
<223>引物<400>127gcaaggctgg cgtggcctac gtcatcg 27<210>128<211>27<212>DNA<213>人工<220>
<223>引物<400>128cgatgacgta ggccacgcca gccttgc 27<210>129<211>29<212>DNA<213>人工<220>
<223>引物<400>129gcaaggctgg ctgggcctac gtcatcgag 29<210>130<211>29<212>DNA<213>人工<220>
<223>引物<400>130ctcgatgacg taggcccagc cagccttgc 29<210>131<211>29<212>DNA<213>人工<220>
<223>引物<400>131caaggctggc atggccgagg tcatcgagg 29<210>132<211>29<212>DNA<213>人工<220>
<223>引物<400>132cctcgatgac ctcggccatg ccagccttg 29<210>133<211>40<212>DNA<213>人工
<220>
<223>引物<220>
<221>misc_feature<222>(17)..(19)<223>n是a，c，g或t<400>133ggctggcatg gcctacnnna tcgaggatct actgcacttc 40<210>134<211>40<212>DNA<213>人工<220>
<223>引物<220>
<221>misc_feature<222>(22)..(24)<223>n是a，c，g或t<400>134gaagtgcagt agatcctcga tnnngtaggc catgccagcc 40<210>135<211>36<212>DNA<213>人工<220>
<223>引物<400>135gcctacgtca tcgaggatat gctgcacttc tgccgg 36<210>136<211>36<212>DNA<213>人工<220>
<223>引物<400>136ccggcagaag tgcagcatat cctcgatgac gtaggc 36<210>137<211>36<212>DNA<213>人工<220>
<223>引物<400>137gcctacgtca tcgaggataa cctgcacttc tgccgg 36<210>138<211>36<212>DNA<213>人工<220>
<223>引物
<400>138ccggcagaag tgcaggttat cctcgatgac gtaggc 36<210>139<211>30<212>DNA<213>人工<220>
<223>引物<400>139cgtcatcgag gatgtactgc acttctgccg 30<210>140<211>30<212>DNA<213>人工<220>
<223>引物<400>140cggcagaagt gcagtacatc ctcgatgacg 30<210>141<211>34<212>DNA<213>人工<220>
<223>引物<400>141gcctacgtca tcgaggatga actgcacttc tgcc 34<210>142<211>34<212>DNA<213>人工<220>
<223>引物<400>142ggcagaagtg cagttcatcc tcgatgacgt aggc 34<210>143<211>35<212>DNA<213>人工<220>
<223>引物<400>143gcatgcaaaa ctccaacaag tgcatctccc tcaag35<210>144<211>35<212>DNA<213>人工<220>
<223>引物<400>144cttgagggag atgcacttgt tggagttttg catgc35
<210>145<211>37<212>DNA<213>人工<220>
<223>引物<400>145gcatgcaaaa ctccaactgg tgcatctccc tcaagct 37<210>146<211>37<212>DNA<213>人工<220>
<223>引物<400>146agcttgaggg agatgcacca gttggagttt tgcatgc 37<210>147<211>45<212>DNA<213>人工<220>
<223>引物<400>147ctcggcatgc aaaactccaa ctattgcatc tccctcaagc tcaag 45<210>148<211>45<212>DNA<213>人工<220>
<223>引物<400>148cttgagcttg agggagatgc aatagttgga gttttgcatg ccgag 45<210>149<211>34<212>DNA<213>人工<220>
<223>引物<400>149catgcaaaac tccaacgcgt gcatctccct caag 34<210>150<211>34<212>DNA<213>人工<220>
<223>引物<400>150cttgagggag atgcacgcgt tggagttttg catg 34<210>151<211>36<212>DNA<213>人工
<220>
<223>引物<400>151ctccaacatg tgcatctcca agaagctcaa gaacag 36<210>152<211>36<212>DNA<213>人工<220>
<223>引物<400>152ctgttcttga gcttcttgga gatgcacatg ttggag 36<210>153<211>36<212>DNA<213>人工<220>
<223>引物<400>153ctccaacatg tgcatctccc gcaagctcaa gaacag 36<210>154<211>36<212>DNA<213>人工<220>
<223>引物<400>154ctgttcttga gcttgcggga gatgcacatg ttggag 36<210>155<211>36<212>DNA<213>人工<220>
<223>引物<400>155ctccaacatg tgcatctcct acaagctcaa gaacag 36<210>156<211>36<212>DNA<213>人工<220>
<223>引物<400>156ctgttcttga gcttgtagga gatgcacatg ttggag 36<210>157<211>32<212>DNA<213>人工<220>
<223>引物
<400>157gctgccgcct ttcatggagg agatctggga tg 32<210>158<211>32<212>DNA<213>人工<220>
<223>引物<400>158catcccagat ctcctccatg aaaggcggca gc 32<210>159<211>34<212>DNA<213>人工<220>
<223>引物<400>159gctgccgcct ttcattgagg agatctggga tgtg 34<210>160<211>34<212>DNA<213>人工<220>
<223>引物<400>160cacatcccag atctcctcaa tgaaaggcgg cagc 34<210>161<211>31<212>DNA<213>人工<220>
<223>引物<400>161ctgccgcctt tccgagagga gatctgggat g31<210>162<211>31<212>DNA<213>人工<220>
<223>引物<400>162catcccagat ctcctctcgg aaaggcggca g31<210>163<211>34<212>DNA<213>人工<220>
<223>引物<400>163gctgccgcct ttctggg8gg agatctggga tgtg 34
<210>164<211>34<212>DNA<213>人工<220>
<223>引物<400>164cacatcccag atctcctccc agaaaggcgg cagc 34<210>165<211>31<212>DNA<213>人工<220>
<223>引物<400>165ctcgaggaga tcccggatgt ggcaggacat g31<210>166<211>31<212>DNA<213>人工<220>
<223>引物<400>166catgtcctgc cacatccggg atctcctcga g31<210>167<211>32<212>DNA<213>人工<220>
<223>引物<400>167cctcgaggag atcgaggatg tggcaggaca tg 32<210>168<211>32<212>DNA<213>人工<220>
<223>引物<400>168catgtcctgc cacatcctcg atctcctcga gg 32<210>169<211>31<212>DNA<213>人工<220>
<223>引物<400>169ctcgaggaga tcttggatgt ggcaggacat g31<210>170<211>31<212>DNA<213>人工
<220>
<223>引物<400>170catgtcctgc cacatccaag atctcctcga g31<210>171<211>34<212>DNA<213>人工<220>
<223>引物<400>171cctcgaggag atcatggatg tggcaggaca tgtc 34<210>172<211>34<212>DNA<213>人工<220>
<223>引物<400>172gacatgtcct gccacatcca tgatctcctc gagg 34<210>173<211>34<212>DNA<213>人工<220>
<223>引物<400>173cctcgaggag atctacgatg tggcaggaca tgtc 34<210>174<211>34<212>DNA<213>人工<220>
<223>引物<400>174gacatgtcct gccacatcgt agatctcctc gagg 34<210>175<211>37<212>DNA<213>人工<220>
<223>引物<400>175ggaattcccg gggatccggc ctgagtgcgt agtaccc 37<210>176<211>46<212>DNA<213>人工<220>
<223>引物
<400>176ctctctgcgg ccgcctatcc gagattcgtg ggggactcga ggatag4权利要求
1.基因表达调节系统，包括基因表达盒，所述基因表达盒能够在宿主细胞中被表达，所述基因表达盒包含编码多肽的多核苷酸，所述多肽包含i)反式激活结构域；ii)识别应答元件的DNA结合结构域，所述应答元件与其表达待被调节的基因连接和iii)H组核受体配体结合结构域，其包括至少一个突变，所述突变的位置在等同于或类似于选自下述的氨基酸残基处a)SEQ ID NO1的48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234和238中的至少一个；b)SEQ ID NO1的96和119；c)SEQ ID NO1的110和128；d)SEQ ID NO1的52和110；e)SEQ ID NO1的107、110和127；f)SEQ ID NO1的52、107和127；和g)SEQ ID NO1的107、127和259，或它们的任何组合。
2.根据权利要求1的基因表达调节系统，进一步包括第二个核受体配体结合结构域，其选自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域、超气门蛋白配体结合结构域，和包含两个多肽片段的嵌合配体结合结构域，其中第一多肽片段来自脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域，第二多肽片段来自不同的脊椎动物类视黄醇X受体配体结合结构域、无脊椎动物类视黄醇X受体配体结合结构域或超气门蛋白配体结合结构域。
3.基因表达调节系统，包括a)第一基因表达盒，其能够在宿主细胞中被表达，包含编码第一多肽的多核苷酸，所述第一多肽包括i)识别应答元件的DNA结合结构域，所述应答元件与其表达待被调节的基因连接和ii)核受体配体结合结构域；以及b)第二基因表达盒，其能够在宿主细胞中被表达，包括编码第二多肽的多核苷酸，所述第二多肽包括i)反式激活结构域；和ii)核受体配体结合结构域，其中，所述核受体配体结合结构域中的一个是含有至少一个突变的H组核受体配体结合结构域，其中所述突变的位置在等同于或类似于选自下述的氨基酸残基处a)SEQ ID NO1的48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234和238中的至少一个；b)SEQ ID NO1的96和119；c)SEQ IDNO1的110和128；d)SEQ ID NO1的52和110；e)SEQ ID NO1的107、110和127所有这三个；f)SEQ ID NO1的52、107和127所有这三个；和g)SEQ ID NO1的107、127和259所有这三个，或它们的任何组合。
4.根据权利要求1或3的基因表达调节系统，其中所述H组核受体配体结合结构域来自H组核受体，该H组核受体选自蜕皮激素受体、遍在受体、孤独受体1、NER-1、类固醇激素核受体1、类视黄醇X受体相互作用蛋白-15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、类法呢醇X受体、受体相互作用蛋白14和法呢醇受体。
5.根据权利要求4的基因表达调节系统，其中所述H组核受体配体结合结构域由包含至少一个突变的多核苷酸编码，所述至少一个突变导致至少一个氨基酸残基突变，其中所述氨基酸残基的位置等同于或类似于a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234和238中的至少一个；b)SEQ ID NO1的氨基酸残基96和119；c)SEQ IDNO1的氨基酸残基110和128；d)SEQ IDNO1的氨基酸残基52和110；e)SEQ IDNO1的所有三个氨基酸残基107、110和127；f)SEQ ID NO1的所有三个氨基酸残基52、107和127；或g)SEQ ID NO1的所有三个氨基酸残基107、127和259，或它们的任何组合。
6.根据权利要求5的基因表达调节系统，其中所述包含置换突变的H组核受体配体结合结构域是蜕皮激素受体配体结合结构域。
7.根据权利要求6的基因表达调节系统，其中所述突变选自SEQ ID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、151M、15IN、151L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V、V107I/Y127E/G259和V107I/Y127E/A110P。
8.根据权利要求1或3的基因表达调节系统，其中所述DNA结合结构域选自蜕皮激素受体DNA结合结构域、GAL4 DNA结合结构域和LexA DNA结合结构域。
9.根据权利要求1或3的基因表达调节系统，其中所述反式激活结构域选自蜕皮激素受体反式激活结构域、VP16反式激活结构域、B42酸性激活物反式激活结构域和p65反式激活结构域。
10.分离的多核苷酸，其编码包含至少一个突变的H组核受体配体结合结构域，其中所述分离的多核苷酸包含至少一个突变，所述至少一个突变导致至少一个氨基酸残基突变，其中所述氨基酸残基突变的位置等同于或类似于a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234和238中的至少一个；b)SEQ ID NO1的氨基酸残基96和119；c)SEQ ID NO1的氨基酸残基110和128；d)SEQ ID NO1的氨基酸残基52和110e)SEQ ID NO1的所有三个氨基酸残基107、110和127；f)SEQ ID NO1的所有三个氨基酸残基52、107和127；或g)SEQ ID NO1的所有三个氨基酸残基107、127和259，或它们的任何组合。
11.根据权利要求10的分离的多核苷酸，其中所述突变导致选自SEQ ID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、151M、151N、151L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V、V107I/Y127E/G259和V107I/Y127E/A110P的突变。
12.表达载体，包含可操作性地连接到转录调控元件的权利要求10的分离的多核苷酸。
13.分离的宿主细胞，包含权利要求12的表达载体，其中所述转录调控元件在所述宿主细胞中是可操作性的。
14.分离的多肽，由权利要求10的分离的多核苷酸编码。
15.分离的多肽，包含H组核受体配体结合结构域，所述H组核受体配体结合结构域包含至少一个突变，其中所述突变的位置等同于或类似于a)SEQ ID NO1的氨基酸残基48、51、52、54、92、95、96、109、110、119、120、125、128、132、219、223、234和238中的至少一个；b)SEQ ID NO1的氨基酸残基96和119；c)SEQ ID NO1的氨基酸残基110和128；d)SEQ ID NO1的氨基酸残基52和110；e)SEQ ID NO1的所有三个氨基酸残基107、110和127；f)SEQ ID NO1的所有三个氨基酸残基52、107和127；或g)SEQ ID NO1的所有三个氨基酸残基107、127和259，或它们的任何组合。
16.根据权利要求15的分离的多肽，其中所述突变选自SEQ ID NO1的F48Y、F48W、F48L、F48N、F48R、F48K、151M、151N、151L、T52M、T52V、T52L、T52E、T52P、T52R、T52W、T52G、T52Q、M54W、M54T、M92L、M92E、R95H、R95M、R95W、V96L、V96W、V96S、V96E、F109W、F109P、F109L、F109M、F109N、A110E、A110N、A110W、N119F、Y120W、Y120M、M125P、M125R、M125E、M125L、M125C、M125W、M125G、M125I、M125N、M125S、M125V、V128F、L132M、L132N、L132V、L132E、M219K、M219W、M219Y、M219A、L223K、L223R、L223Y、L234M、L234I、L234R、L234W、W238P、W238E、W238Y、W238M、W238L、N119F/V96T、V128F/A110P、T52V/A110P、V107I/Y127E/T52V、V107I/Y127E/G259和V107I/Y127E/A110P。
17.在宿主细胞中调节基因表达的方法，包括下述步骤a)将权利要求1或权利要求3的基因表达调节系统导入所述宿主细胞；和b)将配体导入所述宿主细胞；其中待被调节的基因是基因表达盒的组成部分，所述基因表达盒包括i)被DNA结合结构域识别的应答元件；ii)被反式激活结构域激活的启动子；和iii)其表达待被调节的基因；由此，一旦所述配体被导入所述宿主细胞，b)iii)的基因的表达被调节。
18.根据权利要求17的方法，其中所述配体选自a)下式化合物其中E是含有叔碳的支链(C4-C12)烷基或支链(C4-C12)烯基，或含有叔碳的氰基(C3-C12)烷基R1是H、Me、Et、i-Pr、F、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、CoCH、1-丙炔基、2-丙炔基、乙烯基、OH、OMe、OEt、环丙基、CF2CF3、CH＝CHCN、烯丙基、叠氮、SCN或SCHF2；R2是H、Me、Et、n-Pr、i-Pr、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CH2OMe、CH2CN、CN、CoCH、1-丙炔基、2-丙炔基、乙烯基、Ac、F、Cl、OH、OMe、OEt、O-n-Pr、OAc、NMe2、NEt2、SMe、SEt、SOCF3、OCF2CF2H、COEt、环丙基、CF2CF3、CH＝CHCN、烯丙基、叠氮、OCF3、OCHF2、O-i-Pr、SCN、SCHF2、SOMe、NH-CN，或与R3以及连接R2和R3的苯基碳连接形成次乙二氧基、其中氧与苯基碳相邻的二氢呋喃环、或其中氧与苯基碳相邻的二氢吡喃环；R3是H、Et，或与R2以及连接R2和R3的苯基碳连接形成次乙二氧基、其中氧与苯基碳相邻的二氢呋喃环、或其中氧与苯基碳相邻的二氢吡喃环；R4、R5和R6独立地是H、Me、Et、F、Cl、Br、甲酰基、CF3、CHF2、CHCl2、CH2F、CH2Cl、CH2OH、CN、CoCH、1-丙炔基、2-丙炔基、乙烯基、OMe、OEt、SMe或SEt；b)下式化合物其中R1是CH2CH3、CH3或CH3；R2是OCH3、CH2CH3或i-Pr；和R3和R4是CH3；c)下式化合物其中R1和R2是F；和R3是3-F-4-CH3-Ph或3-CH3-4-F-Ph；和d)蜕皮激素、20-羟基蜕皮激素、松甾酮A、幕黎甾酮A、氧固醇、22(R)羟基胆固醇、24(S)羟基胆固醇、25-环氧胆固醇、T0901317、5-α-6-α-环氧胆固醇-3-硫酸酯、7-酮胆固醇-3-硫酸酯、法呢醇、胆汁酸、1，1-二膦酸酯或保幼激素III。
19.根据权利要求18的方法，进一步包括将第二配体导入所述宿主细胞，其中所述第二配体是9-顺-视黄酸，或视黄酸的合成类似物。
20.分离的宿主细胞，包含权利要求1或权利要求3的基因表达调节系统。
21.非人生物，包含权利要求20的宿主细胞。
全文摘要
本发明涉及生物技术或遗传工程领域。具体地，本发明涉及基因表达领域。更具体地，本发明涉及新型的置换突变型受体，和它们在基于核受体的诱导型基因表达系统中的应用，以及在宿主细胞中调节基因表达的方法，可用于各种应用，如基因疗法、大规模生产蛋白质和抗体、基于细胞的高通量筛选分析、功能基因组学和调控转基因生物的性状。
文档编号C07K14/435GK1964622SQ200580018417
公开日2007年5月16日申请日期2005年5月2日优先权日2004年4月30日
发明者S·R·帕里, M·B·库玛申请人:瑞欧基因公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.R.帕里;M.B.库玛
技术所有人：瑞欧基因公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、赵老师：1.电化学离子储存和分离技术 2.工业结晶
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。