可转导的dna结合蛋白的制作方法

文档序号:3555812阅读:531来源:国知局
专利名称:可转导的dna结合蛋白的制作方法
相关申请的交叉参考本申请要求申请日为2003年6月10日的U.S.S.N.60/477,459的优先权,该申请的全文内容并入本文参考。
背景技术
本发明涉及DNA结合蛋白。结合DNA的许多转录因子具有包括一个DNA结合结构域和一个效应子结构域的模块结构。有许多类型的DNA结合结构域。锌指结构域是真核细胞转录因子中最丰富类型的DNA结合结构域之一。因为锌指结构域是模块化的,因此这些结构域对于产生有益性质的人工DNA结合蛋白是理想的。
发明概述本发明揭示了包括一个蛋白质转导结构域(PTD)的外源嵌合的锌指蛋白可被有效地转导进培养的哺乳动物细胞中,在此其调节特异性靶基因。因此,包括PTD的人工转录因子可用于产生调节内源基因的蛋白质药物及改变细胞体外和体内行为的蛋白质药物。蛋白质药物的一个优势是其具有限定的制备过程。它们的浓度及由此的作用可以被仔细控制和限制。
由于锌指结构域螯合锌离子,在本发明之前还不清楚锌指结构域是否可转移穿过生物膜并保持其功能性。在转移期间所述结构域的伸展可导致锌离子释放和丧失。相反,折叠状态可防止转移。另外,锌指结构域在胞外环境暴露于氧化条件可导致半胱氨酸残基之间有害的二硫键形成,从而丧失DNA结合活性。我们现已发现锌指结构域事实上可以转移穿过生物膜。另外,我们发现在转移后这些结构域具有功能并可以调节细胞中的内源基因。
因此,一方面,本发明特征在于一种蛋白质(例如嵌合蛋白和/或分离的蛋白),其包括a)一个锌指结构域,及b)一个异源蛋白质转导结构域。所述蛋白质可包括多个锌指结构域,例如2、3、4、5、或6个锌指结构域,或者至少2、3、4、5或6个锌指结构域。在一个实施方案中,所述蛋白质包括一批锌指结构域。
所述蛋白质还可包括一或多个如下特征核定位信号,二聚化结构域,细胞靶向结构域,细胞表面蛋白结合结构域,纯化柄(purification handle)和效应子结构域。所述蛋白质还可以包括一或多个非肽主链键或者一个人工氨基酸。所述细胞靶向结构域可包括一个免疫球蛋白可变结构域,生长因子,病毒蛋白的细胞结合结构域,或者胞外蛋白的结合结构域。所述纯化柄可包括一个没有半胱氨酸并可以螯合金属的氨基酸序列,如五-或六-组氨酸。
在一个实施方案中,所述锌指结构域是天然存在的,例如是人锌指结构域。在另一个实施方案中,其不是天然存在的。例如,可以人源化锌指结构域,例如通过将许多非DNA接触残基改变为与人锌指结构域中相应残基相同而人源化。在一个实施方案中,所述蛋白质转导结构域和锌指结构域是同一多肽链的成分。所述蛋白质转导结构域和锌指结构域可以间隔至少10、20或50个氨基酸。例如它们可以由一或多个如下结构间隔柔性接头,位点特异性蛋白酶的蛋白酶切割位点(例如位点特异性胞内蛋白酶),或者功能性结构域。
在另一个实施方案中,它们是单独的多肽链的成分。例如,所述链可以通过可还原的键(例如二硫键)或者通过另一种在进入细胞后被裂解的键而附着。
在一个实施方案中,所述蛋白质转导结构域包括一个病毒序列,例如来自天然感染人的病毒例如HIV病毒的序列。蛋白质转导结构域例如是HIV TAT蛋白质转导结构域,例如氨基酸序列YGRKKRRQRRR(SEQ ID NO1)。所述病毒序列的长度可以是5-50或者8-20个氨基酸。在另一个实施方案中,所述蛋白质转导结构域包括哺乳动物序列,例如来自人蛋白质的序列。在另一个实施方案中,所述蛋白质转导结构域包括一个人工序列,例如从展示文库中鉴别为转导结构域的序列。在一个实施方案中,所述蛋白质转导结构域是细胞特异性转导结构域。术语“异源”是指所述蛋白质转导结构域与锌指结构域不是衍生自同样的蛋白质。例如,所述锌指结构域可以是人工的,而所述蛋白质转导结构域可以衍生自例如病毒蛋白。
在一个实施方案中,所述蛋白质在与细胞外表接触后可调节至少一个内源基因在细胞中的转录。所述蛋白质可通过例如在细胞表面或者在小泡形成后穿过细胞的质膜而内在化。例如,所述蛋白质在与细胞外表接触后可调节细胞中的至少一个内源基因、但少于细胞中1%、0.01%或0.001%的基因的转录。由所述蛋白质调节的基因的数目可以例如使用核酸微阵列确定。在许多具体的情况中,所述蛋白质与没有所述蛋白质转导结构域但其它都相同的蛋白质调节同样的基因。
典型地,所述蛋白质在不存在另一种因子例如一种人工因子如细胞透化剂(例如洗涤剂)的情况中可从胞外环境转移进入哺乳动物细胞。
在一个实施方案中,所述蛋白质包括一个条件化的结构域,其调节蛋白质的另一个结构域的功能,由此所述功能依赖于外源化合物的存在与否。例如,所述条件化的结构域结合一种小分子例如类固醇、FK506、等等。“小分子”是分子量低于4kDa的分子。例如,所述条件化的结构域可包括FK506结合结构域。
在一个实施方案中,所述蛋白质在一个分析中可被转导进入至少50、75、80、90或95%的培养的人胚肾(HEK)293细胞中,其中细胞密度是3×105/ml,所述蛋白质存在于胞外培养基中,浓度为100μg/ml,或者浓度低于100μg/ml、50μg/ml、5μg/ml或0.5μg/ml。
在一个相关的实施方案中,本发明特征在于一种分离的蛋白质,其包括a)一个人工DNA结合结构域,其与细胞内一个天然存在的靶位点结合,亲和性(Kd)为低于75、50、25、20、10、5、2.5、1、0.5或0.05nM;b)一个异源蛋白质转导结构域,其可导致分离的蛋白质穿过细胞的外膜进入细胞中;及c)一个核定位信号。
本发明特征还在于药物组合物,其包括本发明所述的一个可转导的蛋白质和一种药物可接受的载体。所述组合物可进一步包括稳定所述组合物的氧化还原潜力的制剂,例如还原剂如二硫苏糖醇(DTT)或β-巯基乙醇,所用量为有效降低蛋白质的锌指结构域的半胱氨酸残基之间二硫键形成。例如,所述组合物可包括谷胱甘肽。在一个实施方案中,所述组合物进一步包括锌,例如锌盐如氯化锌或乙酸锌。锌的有益浓度包括1μM-5 mM,1μM-500μM,1μM-200μM,0.05μM-50μM及0.5μM-30μM。在另一个实施方案中,所述组合物基本上没有锌,例如锌的浓度低于0.5 mM。
所述可转导的蛋白质可以在大肠杆菌或者另一种原核细胞中作为内含体或者作为分泌的蛋白而表达。在另一个实施例中,所述可转导的蛋白质在真核细胞中表达,例如在哺乳动物细胞、植物细胞或酵母细胞中表达。所述可转导的蛋白质可以例如使用至少一或两个纯化步骤纯化,例如至少两个层析步骤,例如一个亲和层析步骤和一个离子交换层析步骤。所述蛋白质可以是足够纯的,从而在人组织培养细胞(例如,HEK293)中可稳定至少0.5、1、2、3、6、12、24、48或60小时。如果所述蛋白质在所需时间后可检测到,例如不易发生实质上的降解,则可以称其为是稳定的。所述蛋白质可以是至少足够纯的,从而当将大约10μg蛋白质加样于泳道中时其是在考马斯凝胶上唯一可检测的条带。
本发明的特征还在于一种方法,包括将药物组合物施用给对象,例如药物组合物的量是有效改变对象细胞中基因表达的量或者是导致对象中表型改变的量。所述方法可包括(例如使用医学装置或静脉内输送系统)分次或连续施用多剂量的组合物,例如至少2、3、6、10或20个剂量。当使施用多剂量的组合物时,所述剂量可以间隔例如至少12、24、48、60、72或96小时,例如可以间隔24-96小时,或者间隔至少120小时。例如,所述方法可用于在对象中降低血管发生,例如在患有或疑似患有致瘤性疾患的对象中。所述蛋白质可特异性结合VEGF-A基因中的一个位点,并且可进一步包括一个阻抑结构域,例如可阻抑VEGF-A基因的结构域。所述方法还可用于治疗U.S.S.N.10/3 14,609和10/669,861中描述的任何疾患,例如使用所述美国专利中描述的与蛋白质转导结构域物理结合的锌指蛋白进行。这种蛋白质可以例如间隔如上所述的时间例如以多剂量施用。
另一方面,本发明特征在于一种调节内源基因的方法。所述方法包括将细胞与一种多肽接触,所述多肽包括a)一个DNA结合结构域(例如一或多个锌指结构域),及b)一个异源蛋白质转导结构域。所述方法可进一步包括在接触后12、24、48、60、72或96小时检测所述多肽。所述细胞可以在体外或体内。
本发明特征还在于一种核酸,其包括编码本文所述多肽的编码序列。例如,所述编码序列编码包括如下结构的多肽a)一个锌指结构域,及b)与所述锌指结构域异源的蛋白质转导结构域。所述多肽例如在N末端还可包括一个信号序列以指导所编码的多肽分泌。所述信号序列可包括例如信号肽酶的加工位点以除去该信号序列。在另一个例子中,所述核酸包括一个以上的编码序列,例如,第一个编码序列编码包括DNA结合阵列的第一个多肽链,第二个编码序列编码包括蛋白质转导结构域的第二个多肽链。本发明特征还在于一种宿主细胞,其含有包括编码本文所述多肽的编码序列的核酸。例如,所述编码序列编码包括如下结构的一种多肽a)锌指结构域,及b)与所述锌指结构域异源的蛋白质转导结构域。所述多肽也可包括一个信号序列,所述宿主细胞在例如信号肽处理后能够分泌所述多肽,从而释放嵌合的DNA结合蛋白。所述宿主细胞在产生包含于药物组合物中的多肽中是有益的。宿主细胞也可自身用作治疗剂。例如,宿主细胞(例如相容的成纤维细胞或造血细胞)可以导入对象中,从而为所述对象提供一种嵌合的DNA结合蛋白。
也可以将一种编码多肽的核酸输送给予细胞例如对象的细胞,所述多肽包含一个信号序列、多个锌指结构域和一个蛋白质转导结构域。所述核酸可以可操纵地与一个组织特异性启动子例如上皮细胞启特异性启动子、B或T细胞特异性启动子等连接。本领域已知输送核酸的方法。见例如Hollingsworth(1999)Lancet.1999 Apr;353 Suppl1SI19-20;Kremer(1995)British Medical Bulletin 51(1)31-44和Anderson(1992)Science 256808-813所述。
另一方面,本发明特征在于一种调节基因表达的方法。所述方法包括(1)提供包括如下结构的蛋白质a)特异性识别基因相关的靶位点的DNA结合结构域,及b)与所述DNA结合结构域异源的蛋白质转导结构域,及(2)将所述蛋白质与细胞在使得该蛋白质进入细胞并调节基因表达的条件下接触。在一个实施方案中,所述DNA结合结构域可包括一或多个锌指结构域。所述蛋白质可包括一个效应子结构域。所述蛋白质可包括本文所述的其它特征。在一个实施方案中,蛋白质的使用量可以低于100μg/ml、50μg/ml、0.5μg/ml或5ng/ml。
在一个实施方案中,在接触后,基因的表达被改变(例如增加或降低)至少0.5、1、2、2.5、5、10、20或100倍。一些蛋白质可改变多个基因的表达。在一些情况中,这些基因中有一些或全部基因也与所述靶位点结合。所述靶位点可以在基因转录起始位点的10、5、3或1 kb或者500、300或200 bp内,例如位于起始位点的上游或下游。在一个实施方案中,靶位点与基因调节位点例如内源因子结合的位点重叠至少一个碱基对。靶位点也可以存在于内含子或编码区域中。在某些实施方案中,了解蛋白质结合的特殊靶位点不是必需的。例如,可以使用其它特异性和功能性测试以表明蛋白质可以调节基因的表达。
在一个实施方案中,所述方法进一步包括评价细胞。例如,可以评价细胞的基因表达情况。在另一个实例中,评价细胞的表型,例如依赖于基因的表达或阻抑的表型。
在一个实施方案中,所述方法进一步包括将细胞导入对象中。例如,如果所述蛋白质降低MHC蛋白的表达,则该细胞可用于暂时移植入对象中而不必关注MHC相容性。
另一方面,本发明的特征在于一种调节细胞表型的方法。所述方法包括(1)提供包括如下结构的蛋白质a)DNA结合结构域,及b)与所述DNA结合结构域异源的蛋白质转导结构域,及(2)将所述蛋白质与细胞在使得该蛋白质进入细胞并调节细胞表型状态的条件下接触。在一个实施方案中,DNA结合结构域可包括一或多个锌指结构域。所述蛋白质可包括一个效应子结构域。所述蛋白质可包括本文描述的其它特征。在一个实施方案中,使用的蛋白质的量可以是少于100μg/ml、50μg/ml、0.5μg/ml或5ng/ml。在一个实施方案中,提供步骤包括了使用表型筛选鉴别所述蛋白是可调节细胞表型的蛋白质。
在一个实施方案中,在接触后,细胞的可定量的性状被改变(例如增加或降低)至少0.5、1、2、2.5、5、10、20或100倍。在一个实施方案中,所述方法进一步包括评价细胞。例如,可以评价细胞的一或多个基因或者一或多个蛋白质的表达情况。在另一个实例中,评价细胞的表型,例如依赖于基因的表达或阻抑的表型。
在一个实施方案中,所述方法进一步包括将细胞导入对象中。例如,如果所述蛋白质降低MHC蛋白质表达,则该细胞可用于暂时移植进对象中而不管MHC相容性如何。在另一个实例中,如果所述蛋白质增加胰岛素表达,则该蛋白质可修饰对象中的细胞从而增加对象中的胰岛素水平,或者由该蛋白质修饰的细胞可以施用给对象从而增加胰岛素水平。
另一方面,本发明特征在于一种治疗患有或处于患有致瘤性疾患危险中的对象的方法。所述方法包括施用给对象一种组合物,所述组合物包括可调节(例如抑制)促癌基因例如癌基因或VEGF-A的一种可转导的蛋白质。例如,所述可转导的蛋白质包括一个DNA结合结构域如一批锌指结构域、一个蛋白质转导结构域及任选一个效应子结构域。所述蛋白质可以有效降低致瘤性疾患危险、降低肿瘤生长、降低血管发生或者改善致瘤性疾患的至少一种症状的量施用。所述降低可以是可检测到或统计学显著的降低。例如,所述对象是人,例如成人或青少年。例如,所述对象可以患有癌或肉瘤。
另一方面,本发明特征在于一种改变对象细胞中基因表达的方法。所述方法包括提供一种嵌合的DNA结合蛋白,其包含一个DNA结合结构域和一个异源的蛋白质转导结构域,所述DNA结合蛋白能调节对象细胞中内源基因的转录;及施用给对象第一次剂量的所述DNA结合蛋白。所述方法可进一步包括施用给对象第二次剂量的所述DNA结合蛋白。例如,第一次和第二次剂量间隔至少大约6、12、18、24、48、96或120小时。在一个实施方案中,第一次剂量比第二次剂量低至少10、25、40、50或80%。在另一个实施方案中,第一次剂量与第二次剂量相同。在又一个实施方案中,第一次和第二次给予剂量相同。
在一个实施方案中,所述对象患有或疑似患有致瘤性疾患,所述DNA结合蛋白进一步包含一个效应子结构域,从而所述DNA结合蛋白调节对象细胞中调节血管发生的基因(例如VEGF-A)的转录。
另一方面,本发明特征在于一种方法,其包括将细胞与一剂量的DNA结合蛋白接触,所述DNA结合蛋白包含一个DNA结合结构域和一个蛋白质转导结构域。所述蛋白质能调节细胞中内源基因的转录,所用剂量有效调节内源基因转录至少6、12、18、24、48、96或120小时。所述方法可进一步包括在接触后至少6、12、18、24、48、96或120小时,将细胞与第二次剂量的所述DNA结合蛋白接触。
另一方面,本发明特征在于一种哺乳动物细胞,其含有一种外源多肽但没有编码该外源多肽的核酸,其中所述外源多肽包括一个DNA结合结构域和一个与所述DNA结合结构域异源的蛋白质转导结构域。所述外源多肽在导入细胞后可具有调节细胞中选定的一亚组(subset)内源基因转录的功能至少6、12、24、36、48或96小时(例如12-96或48-96小时)。在一个实施方案中,所述DNA结合结构域包括锌指结构域,例如多个锌指结构域。例如,所述锌指结构域是天然存在的锌指结构域,例如人锌指结构域。所述哺乳动物细胞可以是人细胞,例如成纤维细胞、造血细胞、神经元细胞、内皮细胞或上皮细胞。所述哺乳动物细胞可以特征在于一种表型性状,如果哺乳动物细胞不包括所述外源多肽则该表型性状不存在或改变。例如,哺乳动物细胞的增殖状态可依赖于外源多肽。所述哺乳动物细胞可存在于哺乳动物对象中(例如作为哺乳动物自身细胞之一或者作为外源导入的细胞)或者是培养物中。例如,所述哺乳动物细胞可存在于人体。哺乳动物培养细胞例如是HEK293细胞。在另一个实例中,所述哺乳动物细胞是用于治疗对象的原代细胞。在一个实施方案中,所述外源多肽阻抑MHC蛋白的表达。
另一方面,本发明特征在于一种非人哺乳动物,其包括一或多种修饰的细胞。细胞通过导入包括DNA结合结构域和与所述DNA结合结构域异源的蛋白质转导结构域的多肽而被修饰。修饰的细胞不含有编码该多肽的核酸。例如,哺乳动物可以已经用包括外源多肽的药物组合物或者与该外源多肽接触的细胞处理。所述外源多肽在导入细胞后在细胞中可发挥功能至少6、8、12、20、24、36、48或96小时。所述多肽可以是本文所述的一种多肽。
另一方面,本发明特征在于一种方法,包括提供一种核酸,其包括编码包括与特异性DNA位点以低于75、50、25、20、10、5、2.5、1、0.5或0.05nM的亲和性结合的DNA结合结构域的多肽的第一个序列;及修饰所述核酸从而包括编码包括蛋白质转导结构域的多肽的第二个序列,从而第一个和第二个序列在框内并编码一种融合多肽,所述融合多肽包括所述DNA结合结构域和蛋白质转导结构域。
所述方法可用于制备可转导的转录因子修饰步骤可包括如下一或多个步骤连接、体外或体内重组及PCR扩增。例如,修饰步骤包括使用与第一个序列的一个区域或其互补区域和第二个序列的一个区域或其互补区域退火的寡核苷酸进行PCR扩增。
所述方法可进一步包括将修饰的核酸导入细胞(例如原核细胞或真核细胞)中并在修饰的核酸表达及融合蛋白产生的条件下保持细胞。
所述方法可进一步包括将融合多肽与不包括修饰的核酸的细胞接触。所述方法可进一步包括从细胞的其它成分例如细胞膜中纯化融合多肽。所述方法可进一步包括分离细胞周围的培养基,并任选处理该培养基以获得比在培养基中更浓缩的形式的多肽。所述方法可进一步包括将所述融合多肽与除了水之外的药物可接受的载体组合。所述组合物可进一步包括水。
另一方面,本发明特征在于一种制备可转导的DNA结合多肽的方法。所述方法包括提供含有核酸的一种宿主细胞,所述核酸包括1)编码多肽的编码序列,所述多肽包括a)锌指结构域,及b)异源蛋白质转导结构域,及2)与所述编码序列可操纵地连接的启动子;在多肽合成的条件下在宿主细胞中表达该核酸;及从宿主细胞或宿主细胞周围的培养基中分离该多肽。
另一方面,本发明特征在于一种核酸文库,其包括多个核酸,其中每个核酸均编码包括锌指结构域和蛋白质转导结构域的多肽。所述多个核酸的位置可改变,从而各个核酸编码具有彼此不同的锌指结构域的多肽。例如,所述多个核酸包括至少102、104、106或108个不同成员。在一个实施方案中,所述多个核酸的成员可编码包括了锌指结构域中不同DNA接触残基的多肽。由多个核酸编码的多肽可包括本文所述其它特征。
另一方面,本发明特征在于一个多肽文库,所述文库包括多个多肽,多个多肽中的每个多肽均包括(a)与其它多肽不同的锌指结构域及(b)蛋白质转导结构域。例如,所述多个多肽包括至少102、104、106或108个不同成员。所述多个多肽可包括本文所述其它特征。在一个实施方案中,所述多个多肽的成员具有锌指结构域中不同的DNA接触残基。在一相关方面,所述文库包括多个多肽,每个多肽均包括(a)与其它多肽不同的DNA结合结构域及(b)蛋白质转导结构域。
本发明特征还在于一种选择锌指蛋白的方法。所述方法可包括提供一个多肽文库(例如本文所述可转导的多肽);将文库的多个多肽与一或多个细胞接触从而所述多个多肽进入细胞中,该细胞不包括编码进入各个细胞中的多肽的核酸;及评价所述一或多个细胞的性质。
在一个实施方案中,每个多肽均与不同的细胞接触,并评价每个不同细胞的性质。例如,评价步骤可包括与微阵列杂交、RT-PCR、Northern分析或Western分析。
另一方面,本发明特征在于一种评价可转导的DNA结合蛋白的方法,所述方法包括提供一种可转导的DNA结合蛋白;将所述可转导的DNA结合蛋白施用给对象;并监测对象。可以监测所述对象受可转导的DNA结合蛋白影响的参数。例如,可以通过评价对象中的一或多个细胞、组织或部位而监测对象。在一个实施方案中,监测步骤包括对对象进行成像。例如,将可转导的DNA结合蛋白例如用可通过非侵入性成像检测到的标记例如MRI可检测标记进行标记。
另一方面,本发明特征在于一种改变(例如增加或降低)真核细胞中基因表达的方法。所述方法包括将真核细胞与嵌合的DNA结合蛋白接触,所述嵌合蛋白包含锌指结构域和蛋白质转导结构域。所述蛋白质能调节内源基因在细胞中的转录。所述真核细胞典型是一种哺乳动物细胞,例如人、啮齿类动物、牛或犬细胞。细胞可以是培养的细胞,例如在组织培养物中维持的细胞。在一些情况中,细胞得自对象或位于对象中,例如人。例如,所述接触可以在体外或体内进行。
在一个实施方案中,所述嵌合DNA结合蛋白包含多个锌指结构域。所述蛋白质可包括多个锌指结构域,例如2、3、4、5、或6个锌指结构域,或者至少2、3、4、5、或6个锌指结构域。在一个实施方案中,所述蛋白质包括一批锌指结构域。
所述蛋白质还可包括一或多个如下特征核定位信号,二聚化结构域,细胞靶向结构域,细胞表面蛋白结合结构域,纯化柄和效应子结构域。所述蛋白质还可包括一或多个非肽主链键或者一个人工氨基酸。细胞靶向结构域可包括免疫球蛋白可变结构域,生长因子,病毒蛋白的细胞结合结构域,或者胞外蛋白的细胞结合结构域。
在一个实施方案中,蛋白质转导结构域包括来自天然感染人的病毒例如HIV病毒的病毒序列。蛋白质转导结构域例如是HIV TAT蛋白质转导结构域,例如氨基酸序列为YGRKKRRQRRR(SEQ IDNO1)。病毒序列长度可以是5-50,或8-20个氨基酸。在另一个实施方案中,蛋白质转导结构域包括哺乳动物序列,例如来自人蛋白的序列。在另一个实施方案中,蛋白质转导结构域包括一个人工序列,例如从展示文库中鉴别是转导结构域的序列。例如,蛋白质转导结构域可包括一个具有SEQ ID NO69-72任一氨基酸序列的修饰的tat蛋白质转导结构域或者一个由6-12个精氨酸残基组成的聚精氨酸寡肽。
内源基因可以是任何内源基因,例如jun B原癌基因、蛋白激酶C、凝集素、脑特异性Na-依赖性无机磷酸盐协同转运蛋白、细胞视黄酸结合蛋白1、细胞视黄酸结合蛋白2、钙粘着蛋白13、H-钙粘着蛋白(心)、血管内皮生长因子(VEGF-A)、色素上皮衍生因子(PEDF)、分化相关基因-1(Drg-1)、转录因子E2F、早期生长应答-1(EGR-1)、蛋白质酪氨酸磷酸酶1B(PTP-1B)、A20、Fas、黑素瘤分化相关基因-7(MDA-7)、衰老蛋白-1(presenilin-1,PS-1)、血管紧张素转化酶、血管生成素-2、b-分泌酶(BACEl)、mmp3、CHFR(checkpoint withforkhead associated and ring finger)、过氧化物酶体增殖剂激活受体γ(PPAR-γ)、TNF-相关凋亡诱导配体(TRAIL)、Ku-80、共济失调毛细血管扩张突变(ATM)、BRCA、CC-趋化因子受体5(CCR5)、脑衍生神经营养因子(BDNF)、肿瘤坏死因子α诱导的蛋白质-3(TNFAIP3)(A20)、c-myc、缺氧诱导因子-1α(HIF-1α)、caspase-3、细胞间粘着分子I型(ICAM-1)、血管紧张素II受体1(AT-1R)、血小板衍生生长因子、胰岛素样生长因子-I和-II、神经生长因子、aFGF、bFGF、上皮生长因子、TGF-α、TGF-β、红细胞生成素、血小板生成素、粘蛋白、生长激素、胰岛素原、胰岛素A链、胰岛素B链、甲状旁腺素、促甲状腺素、甲状腺素、促卵泡激素、降钙素、因子VIII、造血生长因子、脑啡肽酶、Mullerian抑制物质、促性腺激素相关肽、组织因子蛋白、抑制素、活化素、干扰素-α、干扰素-β、干扰素-γ、M-CSF、GM-CSF、G-CSF、IL-1、IL-2、IL-3、IL-4、IL-12和IL-13。
在一个实施方案中,嵌合的DNA结合蛋白特异性结合靶基因。在另一个实施方案中,嵌合的DNA结合蛋白特异性结合转录起始位点的1000、500、300、100、70、50、20或10个碱基对内例如上游或下游的位点。在另一个实施方案中,嵌合的DNA结合蛋白特异性结合TATA盒(TATA box)的1000、500、300、100、70、50、20或10个碱基对内的位点。在又一个实施方案中,嵌合的DNA结合蛋白特异性结合100、80、70、50、30、20或10个碱基对内的位点或者与在内源基因的调节区域内天然存在的转录因子结合的位点重叠的位点。在一个实施方案中,嵌合的DNA结合蛋白增加内源基因的表达,例如增加至少25、50、80、100、150、200或500%。在另一个实施方案中,嵌合的DNA结合蛋白降低内源基因的表达,例如降低至低于80、70、60、50、40、30、20、10、5或2%。
在另一个实施方案中,监测步骤包括确定对象中可转导的DNA结合蛋白的半衰期。在另一个实施方案中,监测步骤包括确定对象中一或多种细胞的转录图谱(profile)。在另一个实施方案中,监测步骤包括确定对象中一或多种细胞的蛋白质表达或修饰状态图谱。
术语“解离常数”是指多肽与一个28个碱基对的双链DNA结合的平衡解离常数(Kd),所述双链DNA包括一个针对所分析多肽的靶位点。例如,如果多肽有三个指状DNA结合结构域,则该DNA将包括所述多肽特异性识别的9bp或更大的靶位点。解离常数是使用纯化的蛋白质在室温通过凝胶迁移分析(gel shift analysis)确定的,所述纯化的蛋白质在20mM Tris pH 7.7,120mMNaCl,5mM MgCl2,20μM ZnSO4,10%甘油,0.1%Nonidet P-40,5mM DTT和0.10mg/mLBSA(牛血清白蛋白)中是结合的。其它详细描述在以下实施例中及Rebar and Pabo(1994)Science 263671-673中提供。与大于28个碱基对的位点结合的多肽可以使用较大的双链DNA分析。解离常数例如包括低于10-7M、10-8M、10-9M、10-10M、10-11M或10-12M的常数。
术语“杂交体”和“嵌合体”是指非天然存在的多肽,其包含衍生自如下的氨基酸序列(i)至少两个不同的天然存在的序列,或者同一天然存在的序列的不相邻的区域,其中不相邻的区域在杂交体中使其相邻;(ii)至少一个人工序列(即非天然存在的序列)及至少一个天然存在的序列;或者(iii)至少两个人工序列(相同或不同。
当描述一个序列时,术语“天然存在的”是指一个序列(例如核酸或氨基酸序列)存在于天然生物体即未通过分子生物学技术修饰的生物体的细胞中。例如,转基因小鼠不是天然生物体,但是未通过分子生物学技术修饰的高度近亲交配的小鼠认为是天然的。当描述一个序列时,术语“病毒”是指天然存在的病毒即未通过分子生物学技术修饰的病毒的序列。本发明的一个实施方案包括这样的蛋白质,其包括来自人(Homo sapiens)、鼠(Mus musculus)、拟南芥(Arabdopsisthaliana)、黑腹果蝇(Drosophila melanogaster)、大肠杆菌(Escherichiacoli)、酿酒酵母(Saccharomyces cerevisiae)或水稻(Oryza sativa)的锌指结构域。
“人工序列”是通过人工方式构建的序列。人工序列例如包括通过定点诱变或随机诱变产生的天然存在的序列的突变体及从头设计的序列。
术语“融合体”是指包括被融合成分的一条多肽链。融合蛋白例如包括一个DNA结合结构域和一个蛋白质转导结构域。融合成分不需要直接连接。例如,另一个序列(例如接头或功能性结构域)可位于融合的元件之间。
术语“外源多肽”或“外源蛋白质”是指人工导入细胞中的多肽或蛋白质。
术语“分离的”描述了一种组合物,其从样品(例如天然样品或细胞,例如重组细胞)中或者从中可获得分离的组合物的合成反应中除去了至少一种成分的至少90%。如果感兴趣的物种或物种群基于重量一重量分别是至少5、10、25、50、75、80、90、95、98、或99%纯的,则本文描述的人工或天然产生的组合物可以是具有至少一定程度纯度的组合物。
术语“可转导的”描述了一种化合物,其可穿过生物膜并进入至少一个哺乳动物细胞。术语“蛋白质转导结构域”和“PTD”是指可穿过生物膜特别是细胞膜的氨基酸序列。当PTD附着于异源多肽时,其可增强该异源多肽穿过生物膜的转移。术语“PTD”不是指促进化合物通过位于核被膜上的孔而转运的核定位信号。
术语“多肽”是指三或多个氨酸通过肽键连接在一起的聚合物。多肽可包括一或多个非天然的氨基酸。典型地,多肽仅包括天然氨基酸。术语“肽”是指长度为3-32个氨基酸之间的多肽。“蛋白质”可包括一或多个多肽链。因此,术语“蛋白质”涵盖了多肽和肽。蛋白质或多肽也可以包括一或多个修饰,例如天然修饰或人工修饰。术语“结构域”是指多肽内的功能单位。结构域的三级结构可以折叠的或不折叠的。
术语“外源的”是指将一种制剂提供给不存在该制剂的物质。“内源基因”是指细胞中的任何基因,包括例如通过病毒导入的病毒基因,及染色体基因,例如在未修饰的细胞中存在的天然存在的染色体基因。本发明所述的方法和组合物可用于调节天然存在的内源基因,特别是未修饰的细胞中的那些。另外,调节内源基因的方法也可扩展用于调节外源基因,例如调节通过人工导入细胞中的基因如报道基因和工程重组核酸。
术语“文库”是指不同分子的集合。文库可以多种形式贮存。例如,该集合中的每个成员可以与其它成员例如集合中的所有其它成员一起存在于一个容器中。在另一个实例中,该集合的每个成员与集合中的其它成员是分离的。例如,文库成员可以被阵列化(arrayed)或单独贮存在孔或小瓶内。一个文库可包括具有特殊性质的多个成员。这种文库也可包括其它成员,例如不具有这种特殊性质的另外的众多成员。计算机数据库也可以贮存文库信息,特别是文库成员信息。
本文引用的所有专利、专利申请和参考文献均以全文并入参考。如下专利申请均以全文并入参考WO01/60970(Kim et al.);U.S.Serial No.10/223,765,filed August 19,2002;U.S.Serial No.10/314,669,filed December 9,2002;U.S.Serial No.60/431,892,filed December9,2002;及U.S.Serial No.60/453,111,filed March 7,2003,U.S.S.N.60/477,459。本发明的一或多个实施方案的详细内容在附图和以下的说明书中阐明。本文描述的任何特征可以与本文也描述的其它相容特征组合使用。本发明的其它特征、目的和优势通过说明书和附图及权利要求书将显而易见。
附图描述

图1示出了在Ni-NTA亲和层析后,纯化的TAT-F435-KOX蛋白质的凝胶。
图2示出了在离子交换层析后,纯化的TAT-F435-KOX蛋白质的凝胶。
图3示出了TAT-F435-p65或TAT-F435-KRAB对内源VEGF表达的激活或阻抑作用。
图4示出了在H460细胞中TAT-F435-KOX对VEGF-A蛋白质产生的阻抑作用。
图5示出了Ni-NTA纯化的TAT-F435-KOX的稳定性,其中A代表应用在培养基中温育的蛋白质的Western印迹结果;及B代表应用蛋白酶抑制剂混合物(cocktail)处理后再在培养基中温育的蛋白质的Western印迹结果。
图6示出了应用在转导后在不同时间点从H460细胞中检测到的TAT-F435-KOX蛋白质的Western印迹结果。
详细描述本发明提供了可穿过生物膜的部分人工DNA结合蛋白。在一个实施方案中,这些蛋白质可用作治疗剂被输送至胞外环境。然后该蛋白质进入细胞并产生希望的治疗作用。这些可转导的DNA结合蛋白典型地包括一个蛋白质转导结构域(PTD)。
本发明包括论证了可转导的DNA结合蛋白能进入细胞并调节基因表达的实际结果。因此,可转导的DNA结合蛋白可用作蛋白质制剂,特别是输送给细胞的蛋白质药物。这些蛋白质可通过任何可应用的途径或通过多个途径输送。因此,可转导的DNA结合蛋白如PTD-ZFP融合蛋白可用于治疗疾病、疾患及其它病变。另外,这些蛋白质可用作体外和体内的研究工具。
在一个实施方案中,可转导的DNA结合蛋白包括至少一个锌指结构域,例如天然存在的锌指结构域。例如,可以设计包括天然存在的锌指结构域的人工锌指蛋白从而调节哺乳动物细胞中的内源VEGF。
在一个实施方案中,可转导的DNA结合蛋白靶向于选定的细胞、组织或器官。
蛋白质转导结构域“蛋白质转导结构域”或“PTD”是可穿过生物膜特别是细胞膜的氨基酸序列。当附着于异源多肽时,PTD可增强该异源多肽穿过生物膜的转移作用。PTD典型地共价附着于(例如通过肽键)异源DNA结合结构域。例如,PTD和异源DNA结合结构域可以例如在一个共有开放读框或者在共有基因的一或多个外显子中由一个核酸编码。PTD例如可包括10-30个氨基酸,并且可以形成两亲性螺旋。许多PTD的特征是碱性的。例如,碱性PTD可包括至少4、5、6或8个碱性残基(例如精氨酸或赖氨酸)。PTD也可能增强多肽转移进入缺少细胞壁的细胞或者进入特殊物种的细胞例如真核细胞,例如脊椎动物细胞,例如哺乳动物细胞,如人、猿猴、鼠、牛、马、猫或绵羊细胞。
可例如使用柔性接头将PTD与人工转录因子连接。柔性接头可包括一或多个甘氨酸残基以可以自由旋转。例如,PTD与转录因子的DNA结合结构域可以间隔至少10、20或50个氨基酸。PTD可以位于DNA结合结构域的N或C末端。位于特定结构域的N或C末端不需要与该特定的结构域相邻。例如,DNA结合结构域N末端的PTD可以与该DNA结合结构域由一个间隔区(spacer)和/或其它类型的结构域间隔。
PTD可以是化学合成的,然后用或不用接头肽与单独制备的DNA结合结构域化学缀合。
人工转录因子也可包括多个PTD,例如多个不同的PTD或者一个PTD的至少两个拷贝。
PTD例如包括如下来自触角足(Antennapedia)蛋白、单纯疱疹病毒VP22蛋白和HIV TAT蛋白的片段。
Tat来自人类免疫缺陷病毒I型(HIV-1)的Tat蛋白当外源加入时具有明显的进入细胞的能力(Frankel A.D.and Pabo C.O.(1988)Cell 551189-1193,Mann D.A and Frankel A.D.(1991)EMBO J.101733-1739,Fawell et al.(1 994)Proc.Natl.Acad.Sci.USA 91664-668)。最小的Tat PTD包括人类免疫缺陷病毒Tat蛋白的第47-57位残基YGRKKRRQRRR(SEQ ID NO1)这个肽序列在此称作“TAT”。已经示出这个肽在体外和体内成功介导超过100 kDa的异源肽和蛋白质导入哺乳动物细胞中(Ho etal.(2001)Cancer Res 61(2)474-7)。Schwarze等示出当将与TAT融合的120 kDa的β-半乳糖苷酶经腹膜内注射进小鼠时,在所有类型的细胞和组织甚至包括在一般认为由于血脑屏障的存在而很难进入的脑中均发现该融合蛋白(Schwarze et al.(1999)Science 285(5433)1466-7)。
触角足触角足同源域也包括一个肽,即PTD。Derossi et al.(1994)J.Bio.Chem.26910444-10450。这个也称作Penetratin的肽包括氨基酸序列AKIWFQNRRMKWKKEN(SEQ ID.NO2)VP22HSV VP22蛋白也包括一个PTD。这个PTD位于VP22 C末端的34个氨基酸残基DAATATRGRSAASRPTERPRAPARSASRPRRPVE(SEQ ID NO3)见例如,Elliott and O′Hare(1997)Cell 88223-234和U.S.6,184,038。
人PTD在一个实施方案中,该PTD得自人或其它哺乳动物蛋白。哺乳动物PTD例如在WO 03/059940(人SIM-2)和WO 03/059941(Mph)中描述。
细胞特异性PTD一些PTD是特异于特定的细胞类型或状态的。细胞特异性PTD例如是U.S.Published Application 2002-0102265中描述的Hn1合成的肽。Hn1通过人头颈鳞状癌细胞内在化并可用于将一个人工转录因子靶向于癌,例如头部或颈部的癌。HN1合成的肽的序列包括TSPLNIHNGQKL(SEQ ID NO4)或者密切相关的序列。U.S.Published Application 2002-0102265也描述了使用噬菌体展示鉴别可发挥细胞特异性PTD功能的其它肽和蛋白质的一般方法。将来自New England BioLabs(Beverly,Mass.)的展示随机肽的噬菌体展示文库如M13噬菌体肽文库PhD-12与靶细胞例如癌细胞在生长培养基中一起温育。内在化的噬菌体通过用TX-100(1%)在37℃裂解30分钟而回收,并在宿主大肠杆菌菌株中扩增。尽管TX-100不裂解细胞核,但避免使用能破坏核膜的离子洗涤剂,因为它们可以使噬菌体失活。分离的噬菌体然后针对非靶细胞如正常的人成纤维细胞进行反选择。对只进入靶细胞的噬菌体进行测序和再测试。见U.S.6,451,527描述了另一种方法。
合成的PTD修饰最小的Tat PTD(第47-57位氨基酸)以优化蛋白质转导潜力(Ho et al.(2001)Cancer Res 61(2)474-7)。用培养的T淋巴细胞测试与一系列合成的PTD偶联的FITC。一些合成的PTD与Tat PTD相比示出增强的蛋白质转导作用。这些PTD包括YARKARRQARR(SEQ ID NO69)YARAARRAARR(SEQ ID NO70)YARAARRAARA(SEQ ID NO71)YARAAARQARA(SEQ ID NO72)特别是当为小鼠i.p.注射时,与合成的PTD(YARAAARQARA;SEQ ID NO72)缀合的FITC示出增强的全血细胞摄取。
在一些情况中,由大约6-12个精氨酸残基组成的聚精氨酸肽也可以介导蛋白质转导。关于聚精氨酸的其它信息见例如Rothbard JB etal.Nat Med.2000 6(11)1253-7;Wender PA et al.Proc Natl Acad Sci US A.2000 97(24)13003-8所述。
关于PTD的其它信息也见U.S.2003-0082561;U.S.2002-0102265;U.S.2003-0040038;Schwarze et al.(1999)Science 2851569-1572;Derossi et al.(1996)J.Biol.Chem.27118188;Hancock etal.(1991)EMBO J.104033-4039;Buss et al.(1988)Mol.Cell.Biol.83 960-3963;Derossi et al.(1 998)Trends in Cell Biology 884-87;Lindgren et al.(2000)Trends in Pharmacological Sciences 2199-103;Kilic et al.(2003)Stroke 341304-10;Asoh et al.(2002)Proc Natl AcadSci USA 99(26)17107-12;和Tanaka et al.(2003)J Immunol.170(3)1291-8所述。
除了PTD之外,可以使用细胞摄取信号(cellular uptake signal)。这种信号包括由细胞受体或其它表面蛋白特异性识别的氨基酸序列。细胞摄取信号与细胞之间的相互作用导致包括该细胞摄取信号的人工转录因子的内在化。一些PTD也通过与细胞受体或其它表面蛋白的相互作用而发挥功能。
分析蛋白质转导可利用许多分析确定一个氨基酸序列是否能发挥PTD功能。例如,氨基酸序列可以与报道蛋白如β-半乳糖苷酶融合以形成融合蛋白。将这种融合蛋白与培养细胞接触。洗涤该细胞,然后分析报道蛋白活性。这种分析的特异实施方案见实施例2(1)所述。
另一种分析检测了包括质询氨基酸序列和另一个可检测序列例如表位标记的融合蛋白的存在情况。将这种融合蛋白与培养细胞接触。洗涤细胞然后通过Western或免疫荧光分析,从而检测细胞中可检测序列的存在情况。这个分析的特异实施方案见实施例2(2)所描述。
另有其它分析可用于检测包括推定的PTD质询氨基酸序列、DNA结合结构域及任选一个效应子结构域的融合蛋白的转录调节活性。例如,可分析与这种融合蛋白接触的细胞中mRNA或蛋白质的存在或水平,例如使用微阵列、质谱分析和高通量技术进行。
人工转录因子的成分人工转录因子可包括一个包括一或多个DNA结合结构域例如多个锌指结构域的DNA结合区域。所述转录因子也可包括一个核定位信号和一个效应子结构域,例如转录调节结构域。
DNA结合结构域已知许多蛋白质结构高亲和性及高特异性结合核酸。这些结构在众多不同的蛋白质中重复使用以特异性控制核酸功能(识别双链DNA的结构基序的综述见例如Pabo and Sauer(1992)Annu.Rev.Biochem.611053-95;Patikoglou and Burley(1997)Annu.Rev.Biophys.Biomol.Struct.26289-325;Nelson(1995)Curr OpinGenet Dev.5180-9)。DNA结合结构域例如包括螺旋—环—螺旋结构域,螺旋—转角—螺旋结构域,同源域,及锌指结构域。鉴别有益的DNA结合结构域的方法在下文论述。
锌指锌指结构域(或ZFD)是大约30个氨基酸残基的小多肽结构域,其中有4个残基,半胱氨酸或组氨酸是适当间隔的,由此它们可与锌离子配位(综述参见例如Klug and Rhodes(1987)TrendsBiochem.Sci.12464-469(1987);Evans and Hollenberg(1988)Cell 521-3;Payre and Vincent(1988)FEBS Lett.234245-250;Miller et al.(1985)EMBO J.41609-1614;Berg(1988)Proc.Natl.Acad.Sci.U.S.A.8599-102;Rosenfeld and Margalit(1993)J.Biomol.Struct.Dyn.11557-570)。因此,锌指结构域可以根据配位锌离子的残基的相同性而分类,例如分为Cys2-His2类、Cys2-Cys2类、Cys2-CysHis类等等。Cys2-His2锌指的锌配位残基典型地如下间隔C-X2-5-C-X3-Xa-X5-ψ-X2-H-X3-5-H(SEQ ID NO5),其中ψ(psi)是一个疏水性残基(Wolfe et al.(1999)Annu.Rev.Biophys.Biomol.Struct.3183-212),X代表任何氨基酸,Xa是任何氨基酸(例如苯丙氨酸或酪氨酸),下标数字表示氨基酸的数目,下标经连字符相连的两个数字表示间插氨基酸(intervening amino acids)的典型范围。典型地,间插氨基酸折叠形成包装α螺旋的反平行β折叠,尽管反平行β折叠可能较短、不理想或不存在。所述折叠位于锌配位侧链,从而它们位于适合配位锌离子的四面体构象中。这个折叠决定了DNA双螺旋中适合特异性识别碱基对的构象中的碱基接触残基的位置。
为方便起见,将锌指结构域的主要DNA接触残基编号基于如下实例编号-1、2、3和6-1 1 2 3 4 5 6C-X2-5-C-X3-Xa-X-R-X-D-E-Xb-X-R-H-X3-5-H(SEQ ID NO6)如上所示,DNA接触残基是Arg(R)、Asp(D)、Glu(E)和Arg(R)。上述基序可缩写为RDER。如本文所用,这种缩写是指从第一个半胱氨酸(上述SEQ ID NO6的起始残基)之前的第二个残基至最后的金属螯合组氨酸(SEQ ID NO6的最后残基)的一特定多肽序列的缩写。在上述及其它基序中,Xa通常是芳族的,Xb通常是疏水性的。当两个不同序列具有相同基序时,数字可用于表示每个序列(例如RDER1或RDER2)。
在一些明确的情况中,4个字母的缩写是指一般的基序。换句话说,该基序特指在第-1、2、3和6位的氨基酸,而其它位可以是任何氨基酸,典型但非必需是非半胱氨酸的氨基酸。在基序前的小写字母“m”可用于明确该缩写是指一个基序。例如,mRDER是指一个基序,其中R在-1位,D在第2位,E在第3位,R在第6位。
锌指DNA结合蛋白可包括两或多个锌指结构域,典型包括至少三个锌指结构域。例如,该蛋白质可包括至少4、5、6、8、12或更多个锌指结构域。在一个实施方案中,锌指结构域是三或多个锌指结构域的串联阵列。串联阵列包括互相在10个氨基酸以内并且不由其它类型的功能结构域间隔的结构域。
锌指结构域存在于从酵母至较高等植物至人的物种中。据估计,仅在人基因组中就有至少几千个锌指结构域,可能至少4500个。天然存在的锌指结构域可以从锌指蛋白中鉴别或分离。锌指蛋白的非限制性实例包括CF2-II;Kruppel;WT1;碱性核蛋白;BCL-6/LAZ-3;红细胞Kruppel样转录因子;转录因子Sp1、Sp2、Sp3和Sp4;转录阻抑物YY1;EGR1/Krox24;EGR2/Krox20;EGR3/Pilot;EGR4/AT133;Evi-1;GLI1;GLI2;GLI3;HIV-EP1/ZNF40;HIV-EP2;KR1;ZfX;ZfY和ZNF7。
激活结构域一种类型的效应子结构域是转录激活结构域。当转录激活结构域募集到基因的调节区域时其增加基因转录量。激活结构域例如包括酵母的Gal4激活结构域和单纯疱疹病毒的VP16结构域。结构域激活转录的能力可以通过将该结构域与已知的DNA结合结构域融合,然后确定与由已知DNA结合结构域识别的位点可操纵地连接的报道基因是否由该融合蛋白激活而确定。
激活结构域例如是如下p65的结构域YLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQ(SEQID NO7)Gal4激活结构域的序列例如如下所示NFNQSGNIADSSLSFTFTNSSNGPNLITTQTNSQALSQPIASSNVHDNFMNNEITASKIDDGNNSKPLSPGWTDQTAYNAFGITTGMFNTTTMDDVYNYLFDDEDTPPNPKKEISMAYPYDVPDYAS(SEQ ID NO8)在细菌中,激活结构域功能可以通过一种结构域模拟,该结构域募集野生型RNA聚合酶α亚基C末端结构域或者突变的α亚基C末端结构域,例如与蛋白质相互作用结构域融合的C末端结构域。
阻抑结构域如果需要,阻抑结构域(例如代替激活结构域)可以与DNA结合结构域融合。真核细胞阻抑结构域例如包括Kid、UME6、ORANGE、groucho和WRPW的阻抑结构域(见例如Dawsonet al.(1995)Mol.Cell Biol.156923-31)。结构域阻抑转录的能力可以通过将该结构域与已知的DNA结合结构域融合,然后确定与由已知DNA结合结构域识别的位点可操纵地连接的报道基因是否被该融合蛋白阻抑而确定。
阻抑结构域例如是UME6蛋白的如下结构域NSASSSTKLDDDLGTAAAVLSNMRSSPYRTHDKPISNVNDMNNTNALGVPASRPHSSSFPSKGVLRPILLRIHNSEQQPIFESNNSTACI(SEQ ID NO9)阻抑结构域再例如是Kid蛋白的结构域VSVTFEDVAVLFTRDEWKKLDLSQRSLYREVMLENYSNLASMAGFLFTKPKVISLLQQGEDPW(SEQ ID NO10)KOX阻抑结构域这个结构域包括人Kox1蛋白(锌指蛋白10;NCBI蛋白质数据库AAH24182;GI18848329)的“KRAB”结构域,即Kox1的第2-97位氨基酸DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVEREIHQETHPDSETAFEIKSSV(SEQ IDNO11)其它嵌合转录因子包括既非激活结构域也不是阻抑结构域。而是这种转录因子通过替代或者另外竞争结合的内源转录因子(例如激活子或阻抑物)而可改变转录。
其它类型的效应子结构域包括与如下一或多种活性相关的结构域组蛋白修饰(例如乙酰化、去乙酰化、遍在化)、染色质结构包装、DNA裂解、拓扑异构酶活性及DNA甲基化状态(例如甲基化或去甲基化)。
设计的转录因子的其它特征接头DNA结合结构域可以通过多种接头连接。接头的用途和设计为本领域所熟知。一个特别有益的接头是由核酸编码的肽接头。因此,可以构建一种合成的基因,其编码第一个DNA结合结构域,肽接头,及第二个DNA结合结构域。可以重复这种设计以构建大的合成的多结构域DNA结合蛋白。PCT WO99/45132和Kim et al.((1998)Proc.Natl.Acad.Sci.USA 952812-7)描述了适于连接锌指结构域的肽接头的设计。为利用锌指结构域,在锌指之间天然存在的肽可用作接头以将锌指连接在一起。一个典型的这种天然存在的接头是Thr-Gly-(Glu或Gln)-(Lys或Arg)-Pro-(Tyr或Phe)。
可利用另外的肽接头形成随机卷曲、α-螺旋或β-折叠三级结构。形成合适的柔性接头的多肽为本领域所熟知(见例如,Robinson et al.(1998)Proc Natl Acad Sci U S A.955929-34)。柔性接头典型地包括甘氨酸,因为这个氨基酸没有侧链,具有独特的转动自由度。丝氨酸或苏氨酸可以散布于接头中以增加亲水性。另外,可利用能与DNA的磷酸主链相互作用的氨基酸以增加结合亲和性。这种氨基酸的明智使用可以平衡亲和性增加与序列特异性丧失。如果作为接头需要刚性扩展,则可以使用α-螺旋接头,如Pantoliano et al.(1991)Biochem.3010117-10125所述的螺旋接头。接头也可以通过计算机建模而设计(见例如,U.S.4,946,778)。分子建模的软件可商购(例如购自MolecularSimulations,Inc.,San Diego,CA)。任选将接头优化为例如降低抗原性和/或增加稳定性,使用蛋白质工程领域中实践的标准诱变技术及合适的生物物理学试验及本发明所述功能分析进行。如上所述,柔性接头也可用于将PTD与DNA结合结构域连接或者与人工DNA结合蛋白的其它结构域连接。
除了肽接头之外的另一种接头是使用其它类型化学键的接头。因此,PTD与DNA结合结构域可以通过合成的非肽接头连接。包括PTD的多肽在合成反应中可以与包括DNA结合结构域的多肽偶联。可以使用同或异双功能交联剂。在一个实施方案中,合成的接头在细胞中被裂解。例如,合成的接头可包括一个可还原的硫醇键。合成的接头例如包括 BM[PEO]3(1,8-双-马来酰亚胺基三甘醇(BM[PEO]3(1,8-bis-Maleimidotriethyleneglycol)),OCOES(双[2-(琥珀酰亚胺基氧基羰氧)乙基]砜)(Bis[2-(succinimidooxy-carbonyloxy)ethyl]sulfone),及DSG(二琥珀酰亚胺基戊二酸酯)。
二聚化结构域连接DNA结合结构域的另一种方法是使用二聚化结构域,特别是异源二聚化结构域(见例如,Pomerantz et al.(1998)Biochemistry 37965-970)。在这个实施方案中,DNA结合结构域存在于单独的多肽链中。例如,第一个多肽编码DNA结合结构域A,接头和结构域B,而第二个多肽编码结构域C,接头和结构域D。一或这两种多肽均也可包括PTD。
技术人员可以从许多充分鉴定的二聚化结构域中选择一个二聚化结构域。如果不需要同源二聚体,则可以使用异源二聚化的结构域。特别合适的二聚化结构域是卷曲螺旋基序,例如二聚化平行或反平行卷曲螺旋。也可以利用优先形成异源二聚体的卷曲螺旋序列(Lumb etal.(1995)Biochemistry 348642-8648)。另一种二聚化结构域是其中二聚化由小分子或信号事件触发的结构域。例如,FK506的二聚体形式可用于使两个FK506结合蛋白(FKBP)结构域二聚化。可以利用这种二聚化结构域提供额外的调节水平。
如果半胱氨酸被工程化至二聚化界面的相对位置,则二聚化可以通过二硫键稳定。在DNA结合结构域通过二硫键连接之处,一个多肽上的PTD可用于将配偶体多肽从胞外环境转导至细胞中。一旦进入细胞,则该二硫键可被还原,并且二聚化可以通过其它相互作用例如非共价相互作用而稳定。
新的DNA结合蛋白的设计可以理性构建一种人工DNA结合蛋白,从而通过混和及匹配特征的锌指结构域而识别靶序列。锌指结构域可以使用多种方法分离和鉴定。一种已知的构建人工DNA结合蛋白的方法包括使用噬菌体展示以选择具有改变的DNA结合特异性的锌指结构域(Greisman andPabo(1997)Science 275657-61)。选择与靶序列相互作用的结构域并用于产生与靶序列结合的DNA结合蛋白。
Bae KH et al.(2003)Nat Biotechnol.2 1(3)275-80描述了一种评价细胞中DNA结合结构域特异性的方法及使用这种细胞分析的信息构建新的DNA结合蛋白的方法。WO01/60970和WO03/016571也描述了设计DNA结合蛋白的方法。锌指结构域的模块结构促进其重排以构建新的DNA结合蛋白。天然存在的Zif268蛋白中的锌指结构域串联排列,可以横跨DNA双螺旋。每个结构域均独立地识别一个不同的3-4个碱基对的DNA片段。通过连接三或多个锌指结构域,可以工程化特异性识别9bp或更长的DNA序列的DNA结合蛋白。
锌指结构域的数据库可以利用WO01/60970中描述的单杂交体选择系统(one-hybrid selection system)对于每个可能的3或4个碱基对结合位点或代表性数目的这种结合位点鉴别一或多个锌指结构域。这种方法的结果可以累积在一起形成锌指结构域与其优选的3或4个碱基对结合位点之间的一系列关联关系。这种关联关系例如表1中提供。
结果也可以贮存在机器中作为数据库,例如关系数据库、电子数据表或文本文件。这种数据库的每个记录均使一个锌指结构域的表示符与表示结构域的一或多个优选结合位点的序列的一组字符之间发生关联。数据库记录可包括结合每个位点的锌指结构域的相关亲和性的指征。在一些实施方案中,数据库记录也可包括表示编码特定锌指结构域的核酸的物理位置的信息。这种物理位置可以是例如冷冻器中贮存的微滴定平板的特定孔。
可以设定数据库,由此可以例如使用SQL操作环境、脚本语言(如PERL或Microsoft Excelmacro)或者程序语言进行查询或过滤。这种数据库使得使用者可以鉴别识别特定的3或4个碱基对结合位点的一或多个锌指结构域。数据库及其它信息如可贮存在数据库服务器上的信息也可以设定,从而可以使用命令及设备可翻译的其它信号与每个设备通话。基于计算机的系统可以在数字电子电路或者在计算机硬件、固件、软件或者在这些组合中执行。本发明的设备例如数据库服务器可以在确实收录于机器可读的贮存设备中的计算机程序产品中由可编程处理器执行;且可以通过执行指示程序通过操作输入数据及产生输出来进行本发明的功能而由可编程处理器进行所述方法。执行环境的一个非限制性例子包括运行Windows XP或Windows NT 4.0(Microsoft)或更高版本或者Solaris 2.6或更高版本(SunMicrosystems)操作系统的计算机。
锌指结构域也可以在多个不同的融合蛋白中测试以核实其特异性。另外,可利用极小量结构域的特殊结合位点可以是另外的选择筛选的靶位。这种选择的文库可以通过诱变结合相似的但独特的位点的锌指结构域而制备。每个可能的结合位点的锌指结构域的完全矩阵不是必需的,因为结构域可以相对于靶结合位点交错排列以最佳利用可利用的结构域。这种交错排列可以通过将结合位点分解为最有益的3或4个碱基对结合位点,也可以通过改变锌指结构域之间的接头长度而完成。为了在设计的多肽中掺入选择性和高亲和性,可以使对于希望的位点具有高度特异性的锌指结构域的两侧具有较高的亲和性结合但特异性较低的其它结构域。本发明描述的体内筛选方法可用于测试人工装配的锌指蛋白及其衍生物的体内功能、亲和性和特异性。另外,所述方法可用于优化这种装配的蛋白质,例如通过产生变化的接头组合物、锌指结构域模块、锌指结构域组合物文库等等而进行。
分解靶位点将9bp或更长的靶DNA序列分解成3或4bp的片段。鉴别识别每个分解的3或4bp片段的锌指结构域(例如从上述数据库中鉴别)。更长的靶序列,例如20 bp-500 bp的序列也是合适的靶,在其中可以鉴别9bp、12bp和15bp的亚序列。特别地,适于分解成数据库中充分描述的位点的亚序列可作为初始设计靶。
可使用评分系统以评估特别设计的嵌合的锌指蛋白识别细胞中靶位点的可能性。得分可以是每个锌指成分与其优选的亚位点的亲和性、其特异性及其在先前设计的蛋白质中成效的函数。
计算机程序可使用计算机系统和软件访问上述机器可读数据库,分解一个靶位点,并输出一或多个嵌合锌指蛋白设计。
这些技术可在可编程机器如移动或固定计算机及包括一处理器、一处理器可读存储介质和一或多个输出装置的类似装置上执行的程序中执行。每一程序可在高水平过程程序设计语言或面向对象的程序设计语言中执行以与机器系统通讯。计算机语言的一些举例描述性例子包括C、C++、Java、Fortran和Visual Basic。
每一种这种程序可被储存在一存储介质或装置上,例如,光盘只读存储器(CD-ROM)、硬盘、磁盘或一通用或特殊目的可编程机器可读的类似的介质或装置,用以当存储介质或装置被计算机阅读以进行本文中的程序时配置和操作机器。系统也可作为配置有程序的机读存储介质执行,其中如此配置的存储介质使机器以特异的预定方式操作。
计算机系统可与一内部网络或外部网络连接。例如,计算机系统可以例如使用HTTP、HTTPS或XML协议接受远程用户系统的请求。所述请求可以是一已知靶基因的标识符或是代表一靶核酸序列的字符串。在前者情况下,计算机系统可访问序列数据库如GenBank以调取该靶基因的调节区的核酸序列。调节区的序列或直接接受的靶核酸序列然后被解析成亚位点,例如如上所述设计嵌合锌指蛋白。
系统可将结果传输给远程用户。或者,系统可控制一机器人以物理取出编码所设计的嵌合锌指蛋白的核酸。在这一方案中,构建一编码嵌合锌指蛋白的核酸的文库并例如作为冷冻的纯化的DNA或冷冻的携带核酸的细菌菌株而储存。机器人通过访问文库的特异地址而应答来自计算机系统的信号。取出的核酸然后可以被加工、包装并递送给客户。或者,取出的核酸可被导入细胞中并进行分析。随后计算机系统可通过网络与客户通讯以报告分析结果。
从选定的模块中构建蛋白质一旦设计了含有多个锌指结构域的嵌合多肽序列,可以合成编码设计的多肽序列的核酸序列。构建合成基因的方法在本领域中是常规的。这种方法包括从定做合成的寡核苷酸中基因构建,PCR介导的克隆,及mega-引物PCR。可以将额外的序列与编码设计的多肽序列的核酸连接在一起。该额外的序列可提供调节功能或者编码具有希望功能的氨基酸序列的序列。本文描述了这种额外序列的实例。
PTD融合体文库也可以通过产生包括多个多肽(每个多肽均包括锌指结构域和PTD)的多肽文库以评价多种组合的锌指结构域。该文库可以通过评价每个蛋白质改变细胞参数例如基因表达或可辨别的表型的能力而筛选。
表型筛选或选择也可以筛选编码不同组合的锌指结构域的核酸的文库以鉴别包括产生希望的表型作用的功能性DNA结合结构域的多肽。于2002年12月9日提交的U.S.Serial No.10/3 14,669描述了通过筛选或选择鉴别有益的锌指蛋白的方法实例。通常,制备编码包括不同组合的锌指结构域和效应子结构域的多肽的核酸的文库,并将其导入细胞中。在表达该文库成员后,分离相对于参考细胞(例如未转化的细胞或者用载体核酸转化的细胞)表型改变的细胞。回收细胞中的文库核酸并鉴定。然后可以对核酸进行修饰以产生编码包括DNA结合结构域和PTD的多肽的核酸。
锌指结构域实例人工转录因子可包括锌指结构域的嵌合体。在一个实施方案中,一或多个锌指结构域是天然存在的。WO01/60970、WO03/016571和U.S.Serial No.10/223,765中描述了许多人锌指结构域的实例。也见下表1所示。最后一列中列出的每个结构域的结合特异性可用于设计具有特殊特异性的转录因子。
表1
已经描述了产生有益的DNA结合结构域的特殊组合的锌指结构域。见例如WO 01/60970、WO 03/016571、U.S.Serial No.10/314,669和U.S.Serial No.60/431,892所述。
U.S.Serial No.60/431,892和10/732,620描述了可以结合VEGF基因的调节序列并调节VEGF基因转录的DNA结合结构域。F121和F475是结合VEGF基因的调节序列的DNA结合结构域的两个实例。
F475蛋白例如可包括如下氨基酸序列YKCGQCGKFYSQVSHLTRHQKIHTGEKPFQCKTCQRKFSRSDHLKTHTRTHTGEKPYICRKCGRGFSRKSNLIRHQRTHTGEK(SEQ ID NO67)F121蛋白例如可包括如下氨基酸序列YKCEECGKAFRQSSHLTTHKIIHTGEKPYKCMECGKAFNRRSHLTRHQRIHTGEKPFQCKTCQRKFSRSDHLKTHTRTHTGEK(SEQ ID NO68)也可以使用包括具有与F475和F121的锌指结构域的DNA接触残基相同的DNA接触残基的至少两个锌指结构域(例如两或三个结构域,以相同的各自顺序)的锌指结构域的DNA结合结构域。
锌指蛋白的进一步实例包括下表2中所描述的那些表2
表2中描述的那些结构域中优选的锌指蛋白是F475、F121、F435、F547、F2825、F109、F2604、F2605、F2607、F2615、F2633、F2634、F2636、F2644、F2646、F2650和F2679。
这种蛋白质例如包括那些包括第3栏中至少2、3或4个特异性结构域的蛋白质,或者那些包括具有第2栏中至少2、3或4个相同基序的锌指结构域的蛋白质。其它例子是与上述蛋白质竞争结合例如VEGF-A基因中靶位点的蛋白质。
U.S.Serial No.10/314,669描述了这样的DNA结合结构域,其可调节(1)分泌蛋白质(例如胰岛素)的产生,(2)应激抗性,(3)分化状态(例如神经元或成骨分化),及(4)增殖。
功能分析和应用可转导的DNA结合蛋白的功能可以在体外或体内分析。人工转录因子的功能分析例如包括体外结合分析、SELEX、体内报道基因调节和转录图谱。
分析结合位点偏爱(preference)每个结构域的结合位点偏爱可以通过生物化学分析如EMSA、DNase足迹试验、表面等离子共振、SELEX或柱结合分析而证实。结合底物可以是涵盖靶位点的合成的寡核苷酸。所述分析也可以包括非特异性DNA作为竞争者,或者特异性DNA序列作为竞争者。特异性竞争者DNA可包括具有1、2或3个核苷酸突变的识别位点。因此,可以使用一种生物化学分析以不仅测定结构域与给定位点的亲和性,而且还测定其与该位点相对于其它位点的亲和性。Rebar and Pabo(1994)Science 263671-673描述了一种从EMSA获得锌指结构域的表观Kd常数的方法。
在一个特异的实例中,将编码锌指蛋白的DNA片段插入pGEX-4T2(Pharmacia Biotech)的SalI和NotI位点之间。锌指蛋白在大肠杆菌菌株BL21中表达为与GST(谷胱甘肽-S-转移酶)连接的融合蛋白。该融合蛋白使用谷胱甘肽亲和层析(Pharmacia Biotech,Piscataway,NJ)纯化,然后用凝血酶消化,切割GST部分与锌指蛋白之间的连接位点。
将不同量的锌指蛋白与放射性标记的探针DNA在20mM Tris pH7.7,120mM NaCl,5mM MgCl2,20μM ZnSO4,10%甘油,0.1%NonidetP-40,5mM DTT和0.10mg/mL BSA(牛血清白蛋白)中在室温温育1小时,然后将反应混合物进行凝胶电泳。放射性信号通过PHOSPHORIMAGERTM分析(Molecular Dynamics)定量,解离常数(Kd)如(Rebar and Pabo(1994)Science 263671-673)所述确定。
不论DNA结合结构域是否与PTD结合(例如共价附着),均可以确定其DNA结合亲和性。对于一些实施分案,将在存在PTD时该结构域的DNA结合亲和性与没有PTD时的亲和性进行对比是有益的。结合亲和性低于50、10、5或1nM的DNA结合结构域是特别有益的。可将靶位点与具有70-90%相同性的非靶位点辨别开来的DNA结合结构域也是有益的。这种结构域可以至少2、5、10或100倍的系数进行辨别。
SELEXSELEX(指数富集配体的系统进化,Systematic Evolutionof Ligands by EXponential enrichment)是一种扩增由DNA结合结构域特异性识别的核酸的方法。首先,制备模板寡核苷酸,其包括长度为20个核苷酸的随机区域,在其末端两侧具有保守的序列。将该模板寡核苷酸通过用DNA聚合酶的Klenow片段及与保守的3’末端退火的引物进行延伸而转变为双链DNA。然后将双链的DNA群体与DNA结合结构域一起温育。例如,可以将与GST融合的100μg的蛋白质与10pmol的双链模板DNA在100μl结合缓冲液(25mM Hepes pH 7.9,40mM KCl,3mM MgCl2,1mM DTT)中在室温混和1小时。然后向该混合物中加入GST-树脂(10μl)。在室温温育30分钟后,将树脂用含有2.5%脱脂乳的结合缓冲液洗涤3次。结合的双链模板寡聚物通过将该树脂与100μl的1M KCl在室温温育10分钟而解离。洗脱物通过PCR扩增。扩增的核酸可用于另外的SELEX循环。例如,在克隆和测序之前可以进行8次SELEX循环。对锌指蛋白应用SELEX见例如2002年12月9日提交的U.S.Serial No.60/431,892所述。
细胞分析可转导的DNA结合蛋白的功能可以使用报道基因在体内分析。将报道基因工程化为包括DNA结合蛋白在调节位置特异性识别的DNA靶位点,所述位置例如是Kim and Pabo((1997)JBiolChem 27229795-29800)所述构建体中的Zif268位点。在可转导的DNA结合蛋白与细胞接触后,评价荧光素酶报道基因活性。也见实施例4所述。也可以在细胞中表达可转导的DNA结合蛋白以特异性分析该蛋白质的DNA结合和转录调节功能,然后使用其它分析评价该蛋白质是否可以转导进细胞中。
也可以评价可转导的DNA结合蛋白调节内源基因的能力,通过分析在细胞与可转导的DNA结合蛋白接触后或者可转导的DNA结合蛋白在细胞中表达后内源基因的的转录进行。分析内源基因转录的方法包括Northern分析、RT-PCR和转录图谱(如下述)。
再一种评价可转导的DNA结合蛋白调节内源基因的能力的方法是将可转导的DNA结合蛋白与细胞接触,并评价细胞的参数,例如已知受到内源基因影响的参数。例如,可以将结合VEGF启动子的可转导的DNA结合蛋白与细胞接触,然后评价细胞产生VEGF的能力。
稳定性可利用多种方法确定细胞中可转导的DNA结合蛋白的稳定性。例如,蛋白质可以被标记(例如用放射性同位素),然后与细胞接触。细胞中存在的标记的量可以以时间的函数监测。在每个时间点之前可以洗涤细胞以除去由蛋白质降解释放的标记。或者,可以在每个时间点制备接触的细胞样品并在凝胶上电泳以精确检测全长蛋白质。在另一种方法中,在不同时间点检测未标记的蛋白质,例如使用特异性识别蛋白质的抗体进行。所述蛋白质可包括一个表位标记。
为产生稳定的蛋白质,检查氨基酸序列的降解信号(例如PEST信号)或遍在化位点也是有益的。这些信号和位点可以加以修饰以增加蛋白质的稳定性。在一些特殊的实施方案中,希望有一种不稳定的蛋白质,在这种情况中这种信号和位点可以被保留或者有意导入。
嵌合的锌指蛋白的调节性质的概括可以鉴定嵌合的锌指蛋白以确定其调节细胞如哺乳动物细胞的内源基因的能力。首先将编码嵌合的锌指蛋白的核酸与一个阻抑或激活结构域融合,然后导入感兴趣的细胞中。在适当温育及诱导编码核酸表达后,从细胞中收集mRNA并使用核酸微阵列分析。
核酸微阵列可以通过多种方法制备,例如,光刻法(见例如U.S.5,510,270)、机械方法(例如直通流量方法(directed-flow methods),如U.S.5,384,261所述)及基于针(pin based)的方法(例如U.S.5,288,514)。在每个地址可以用独特的捕获探针合成阵列,每个捕获探针适于检测针对特定表达基因的一种核酸。
可以通过常规方法分离mRNA,例如,包括DNase处理以除去基因组DNA及与固体基质(solid substrate)偶联的oligo-dT杂交(例如,如Current Protocols in Molecular Biology,John Wiley & Sons,N.Y所述)。洗涤基质,并洗脱mRNA。然后例如通过U.S.4,683,202所述的RT-PCR将分离的mRNA反转录并任选地扩增。核酸可在扩增或反转录过程中例如通过掺入标记的核苷酸而被标记。优选的标记的例子包括荧光标记,例如红色荧光染料Cy5(Amersham)或绿色荧光染料Cy3(Amersham)。或者,核酸可以用生物素进行标记,并且在与标记的链霉抗生物素蛋白例如链霉抗生物素蛋白-藻红蛋白(MolecularProbes)杂交后被检测。
标记的核酸然后与阵列接触。另外,对照核酸或参考核酸可以与同一阵列接触。对照核酸或参考核酸可用不同于样品核酸的标记例如具有不同的最大发射的标记进行标记。标记的核酸在杂交条件下与阵列接触。洗涤阵列,然后成像以检测阵列每一地址的荧光。
来自阵列成像的信息可被用于产生一图谱。例如,在一个地址的杂交程度由一数值代表并储存在例如一个矢量、一维矩阵或一维阵列中。矢量x具有阵列的每一地址的值。例如,在一特定地址的杂交程度的数值被储存为变量xa。数值可以被调整,例如根据局部背景水平、样品量和其它变化。还从参考样品制备核酸并与同一或不同阵列杂交。矢量y与矢量y相同构建。可以例如使用是两个矢量的函数的数学方程比较样品表达图谱和参考图谱。比较可以被评价为无向量值,例如代表两个图谱的相似性的评分。两个矢量之一或两者可用一矩阵转化以将加权值加至由阵列检测的不同基因。
表达数据可储存在数据库中,例如一相关数据库如SQL数据库(例如Oracle或Sybase数据库环境)。数据库可以有多个表。例如,原始表达数据可储存在一个表中,其中每一栏相应于一个被检测的基因,例如一个地址或一个阵列,每一行相应于一个样品。另一个表可储存标识符和样品信息,例如所用阵列的批号、日期和其它质量控制信息。
被相似调节的基因可通过聚类(clustering)表达数据而鉴别以便鉴别共调节的基因。这种聚类可以指示一组由嵌合锌指蛋白协同调节的基因。基因聚类可以使用层次聚类(hierarchical clustering)(参见例如,Sokal and Michener(1958)Univ.Kans.Sci.Bull.381409),贝叶斯聚类、k-means聚类和自组织图谱(参见Tamayo et al(1999)Proc.Natl.Acad.Sci.USA 962907)。
样品表达图谱与参考表达图谱(例如对照细胞)的相似性也可以例如通过比较样品表达水平的log与预期或参考表达值的log并通过图谱中所有基因预测值的加权因子而调整所述比较来确定。
基因调节的靶细胞中的一或多个基因可以是基因调节的靶。例如,病原体所需的基因可被阻抑,癌生长所需的基因可被阻抑,弱表达的或编码不稳定蛋白质的基因可被激活和过表达,等等。特异的靶基因的例子包括编码如下蛋白质的基因细胞表面蛋白(例如糖基化表面蛋白)、癌相关蛋白、肿瘤抑制因子、细胞因子、趋化因子、肽激素、神经递质、细胞表面受体、细胞表面受体激酶、七次跨膜受体、病毒受体和共同受体、胞外基质结合蛋白、细胞结合蛋白、病原体抗原(例如细菌抗原、疟疾抗原等等)。另外的蛋白靶包括酶如烯醇化酶、细胞色素P450s、酰基转移酶、甲基化酶、TIM桶(barrel)酶、异构酶、酰基转移酶等等。
更特异性的实例包括整联蛋白,细胞附着分子或CAM如钙粘着蛋白,选择蛋白,N-CAM,E-CAM,U-CAM,I-CAM等等);蛋白酶(例如枯草杆菌蛋白酶、胰蛋白酶、胰凝乳蛋白酶;纤溶酶原激活物,如尿激酶或人组织类型纤溶酶原激活物);铃蟾肽;因子IX,凝血酶;CD-4;血小板衍生生长因子;胰岛素样生长因子-I和-II;神经生长因子;成纤维细胞生长因子(例如aFGF和bFGF);上皮生长因子(EGF);VEGFa;色素上皮衍生因子(PEDF);转化生长因子(TGF,例如TGF-α和TGF-β;胰岛素样生长因子结合蛋白;脑衍生神经营养因子(BDNF);红细胞生成素;血小板生成素;粘蛋白;人血清白蛋白;凝集素;生长激素(例如人生长激素);胰岛素原;胰岛素A-链;胰岛素B-链;甲状旁腺素;促甲状腺素;甲状腺素;促卵泡激素;降钙素;心房肽A、B或C;促黄体生成激素;胰高血糖素;因子VIII;造血生长因子;肿瘤坏死因子(例如TNF-α和TNF-β);脑啡肽酶;jun B原癌基因;蛋白激酶C;脑特异性Na依赖性无机磷酸协同转运蛋白;细胞视黄酸结合蛋白1;细胞视黄酸结合蛋白2;分化相关基因-1(Drg-1);转录因子E2F;早期生长应答-1(EGR-1);蛋白酪氨酸磷酸酶1B(PTP-1B);Fas;黑素瘤分化相关基因-7(MDA-7);衰老蛋白-1(PS-1);血管紧张素转化酶;血管生成素-2;b-分泌酶(BACE1);mmp3;CHFR;过氧化物酶体增殖剂激活受体γ(PPAR-γ);TNF-相关凋亡诱导配体(TRAIL);Ku-80;共济失调毛细血管扩张突变(ATM);BRCA;CC-趋化因子受体5(CCR5);肿瘤坏死因子α诱导蛋白-3(TNFAIP3);c-myc,缺氧诱导因子-1α(HIF-1α);caspase-3;细胞间粘着分子I型(ICAM-1);血管紧张素II受体1(AT-1R);Mullerian抑制物质;促性腺激素相关肽;组织因子蛋白;抑制素;活化素;激素或生长因子受体;类风湿因子;骨诱导因子(osteoinductive factor);干扰素,例如干扰素-α、β、γ;集落刺激因子(CSF),例如M-CSF、GM-CSF和G-CSF;白细胞介素(IL),例如IL-1,IL-2,IL-3,IL-4,IL-12和IL-13等;衰变加速因子;和免疫球蛋白。在一些实施方案中,靶蛋白质与一种疾病如癌症、感染性疾病或心血管疾病相关。
一些靶基因可以由导入细胞中的外源基因组或其它核酸编码,例如逆转录病毒的基因组、基因治疗载体、DNA病毒等等。
产生可转导的转录因子可以使用标准的重组核酸方法以表达可转导的DNA结合蛋白。在一个实施方案中,编码可转导的蛋白质的核酸序列被克隆进一个核酸表达载体中,该载体例如具有转录和翻译的合适信号及加工序列和调节序列。在另一个实施方案中,所述蛋白质可以使用自动有机合成方法合成。产生蛋白质的合成方法见例如Methods in Enzymology,Volume 289Solid-Phase Peptide Synthesis by Gregg B.Fields(Editor),Sidney P.Colowick,Melvin I.Simon(Editor),Academic Press;(November 15,1997)ISBN0121821900所述。
表达可转导的蛋白的表达载体可包括调节序列,包括例如与编码可转导的蛋白质的序列可操纵地连接的启动子。可以使用的可诱导的启动子的非限制性实例包括类固醇激素应答启动子(例如蜕皮激素应答启动子、雌激素应答启动子和糖皮质激素(glutacorticoid)应答启动子),四环素“Tet-On”和“Tet-Off”系统,及金属应答启动子。构建体可以导入合适的宿主细胞中,例如细菌细胞、酵母细胞、昆虫细胞或者组织培养细胞。构建体也可以导入胚胎干细胞中以产生转基因生物体作为模型对象。本领域技术人员已知大量的合适载体和启动子,并且可以商购以产生本发明的重组构建体。
可以使用已知方法构建含有本发明的多核苷酸及合适的转录/翻译控制信号的载体。这些方法包括体外重组DNA技术,合成技术及体内重组/遗传重组。见例如Sambrook & Russell,Molecular CloningA Laboratory Manual,3rdEdition,Cold Spring Harbor Laboratory,N.y(2001)和Ausubel et al.,Current Protocols in Molecular Biology(GreenePublishing Associates and Wiley Interscience,N.Y.(1989)所述技术。
适于产生可转导的蛋白质的宿主细胞包括细菌细胞和真核细胞(例如真菌、昆虫、植物和哺乳动物细胞)。宿主细胞可以通过任何合适方法破坏,包括冷冻-解冻循环、超声处理、机械破坏,或者使用细胞溶解剂。Scopes(1994)Protein PurificationPrinciples and Practice,New YorkSpringer-Verlag提供了许多纯化重组(及非重组)蛋白质的一般方法。所述方法可包括例如离子交换层析、大小排阻层析、亲和层析、选择性沉淀、透析、和疏水性相互作用层析。这些方法适于设计可转导的蛋白质的纯化方案。如果可转导的蛋白质包括一个纯化柄如表位标记或金属螯合序列,则可以使用亲和层析高度纯化蛋白质。
产生的蛋白质的量可以通过直接(例如使用Western分析)或间接(例如通过分析来自细胞的物质的特异性DNA结合活性,例如通过EMSA)检测可转导的DNA结合蛋白而评价。蛋白质可以在纯化之前、在纯化的任何阶段期间、或者在纯化之后进行检测。在一些实施方案中,可不必纯化或完全纯化。
除了在蛋白质转导中应用之外,可转导的DNA结合蛋白可以在对象细胞或对象生物体中产生,以调节内源基因。可转导的DNA结合蛋白可以如上述构型,以结合所述内源基因的一个区域并提供转录激活或阻抑功能。如Kang和Kim(如前)所述,编码设计的蛋白质的核酸的表达可以与一个可诱导启动子可操纵地连接。通过调节启动子的诱导剂的浓度,内源基因的表达可以浓度依赖性方式调节。
在另一个实例中,可转导的DNA结合蛋白是作为分泌的蛋白质由一个细胞产生的,由此该蛋白质可扩散并进入另一个细胞中,引起基因调节改变。所述扩散可以在对象中发生,例如从对象的一个细胞扩散至另一个细胞。
细胞靶向部分可转导的DNA结合蛋白可包括特异于一或多种细胞类型(例如一或多种特殊分化的细胞或受影响的细胞)或一或多种细胞状态(例如增殖状态)的细胞靶向部分。例如,细胞靶向部分可以特异于疾病状态、分化状态或增殖状态。细胞靶向部分例如包括蛋白质如抗体或细胞受体识别肽。
可以由细胞靶向部分特异性识别的一些抗原包括肿瘤或癌细胞特异性抗原。抗原例如包括肿瘤相关糖蛋白(TAG72)、癌胚抗原(CEA)、180kDa糖蛋白多形性上皮粘蛋白HMFG1(PEM或MUC1)、上皮膜抗原(EMA),上皮生长因子受体(EGFR),HER2/c-erb-B2,前列腺特异性膜抗原(PSMA),CD33和CD20。抗体片段可以通过噬菌体展示技术或者通过免疫制备。产生、修饰、分析和使用抗体的多种方法在AntibodiesA Laboratory Manual,Harlow and Lane(eds.),ColdSpring Harbor Laboratory Press,1988;AltingMees et al.,″MonoclonalAntibody Expression LibrariesA Rapid Alternative to Hybridomas″,Strategies in Molecular Biology 31-9(1990);及Larrick et al.,Biotechnology,7394(1989)中描述。
在一个实施方案中,细胞靶向部分包括一种肿瘤寻靶(tumorhoming)肽。肿瘤寻靶肽例如在PCT/US00/01602和US PublishedApplication No.200 1-0046498中描述。
在另一个实施方案中,细胞靶向部分包括与细胞特异性蛋白质相互作用的一种天然存在多肽。例如,所述天然存在的多肽可包括生长激素、细胞因子或与细胞表面蛋白例如细胞表面受体特异性相互作用的其它蛋白质的所有或部分结构域。
药物组合物另一方面,本发明提供了组合物,例如药物可接受的组合物,其包括可转导的人工DNA结合蛋白,例如可转导的人工锌指蛋白或者本文所述的另一种蛋白质,与药物可接受的载体一起配制。如本文所用,“药物组合物”涵盖了诊断组合物以及治疗组合物。
如本文所用,“药物可接受的载体”包括生理学相适合的任何和所有溶剂、分散介质、包衣、抗菌剂和抗真菌剂、等张和吸收延缓剂等。通常地,载体适于经静脉内、肌内、皮下、胃肠外、脊髓或表皮施用(例如通过注射或灌注)。根据施用途径,可转导的DNA结合蛋白可以在一种材料中包被以保护该化合物免于被酸作用及可失活该化合物的其它天然条件作用。
“药物可接受的盐”是指保持亲代化合物希望的生物学活性并且无任何不希望的毒性作用的盐(见例如Berge,S.M.,et al.(1977)J.Pharm.Sci.661-19)。这种盐例如包括酸加成盐和碱加成盐。酸加成盐包括得自无毒性无机酸的盐,如盐酸、硝酸、磷酸、硫酸、氢溴酸、氢碘酸、亚磷酸,以及无毒性有机酸的盐,如脂肪族单羧酸和二羧酸、苯基取代的链烷酸、羟基链烷酸、芳香酸、脂肪族和芳族磺酸等。碱加成盐包括得自碱土金属如钠、钾、镁、钙等的盐,以及得自无毒性有机胺如N,N′-二苄基乙二胺,N-甲基葡糖胺,氯普鲁卡因,胆碱,二乙醇胺,乙二胺,普鲁卡因等。
在一个实施方案中,可转导的人工DNA结合蛋白可以配制为持续释放剂型。例如,可转导的DNA结合蛋白可以在基质例如脂质-蛋白质-糖基质中被包囊化以输送给个体。被包囊化的可转导的DNA结合蛋白可以成形为小颗粒,大小为5微米至50纳米。脂质—蛋白质—糖颗粒典型包括一种表面活性剂或磷脂或相似的疏水性或两亲性分子;蛋白质;简单和/或复杂的糖;及可转导的人工DNA结合蛋白。在一个实例中,脂质是二棕榈酰磷脂酰胆碱(DPPC),蛋白质是白蛋白,糖是乳糖。在另一个实例中,一种合成的聚合物取代了脂质—蛋白质—糖颗粒中的至少一个成分,例如是脂质、蛋白质和/或糖。用于产生LPSP的化合物可以是天然存在的,并因此具有改良的生物适合性。所述颗粒可以使用本领域已知技术包括喷雾干燥技术制备。见例如U.S.Published application 2002-0150621。
药物组合物可以是多种形式。这些包括例如液体、半固体、和固体剂型,如液体溶液(例如可注射的和可灌输的溶液),分散液或悬浮液,片剂,药丸,粉末,脂质体和栓剂。剂型可依赖于指定的施用模式和治疗应用。组合物可包括阴离子或负电荷载体,例如以稳定该组合物。例如,组合物可包括poly-A-polyT DNA双链体的小片段。
典型的组合物是可注射或可灌输溶液形式,如与用于给人对象施用抗体的那些组合物相似的组合物。典型的施用模式是胃肠外(例如静脉内、皮下、腹膜内、肌内)。在一个实施方案中,可转导的人工DNA结合蛋白通过静脉内灌输或注射而施用。在另一个实施方案中,可转导的人工DNA结合蛋白通过肌内或皮下注射施用。其它的施用途径例子包括口服、经表皮组织(例如皮肤)或粘膜(例如眼)给药和吸入。其它施用途径也可以。
本文所用短语“胃肠外施用”是指除了肠道和局部施用之外的施用模式,通常通过注射施用,包括但非限于静脉内、肌内、动脉内、鞘内、囊内、眼内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下、脊髓内、硬膜外、及胸内(intrasternal)注射和灌输。
药物组合物典型地必须是无菌的并且在生产和贮存条件下是稳定的。也可以对药物组合物进行测试以确保其符合施用的管理和产业标准。例如,制品中内毒素水平可以根据USP 24/NF 19方法使用Limulus阿米巴样细胞裂解物分析(例如使用Bio Whittaker lot#7L3790的试剂盒,敏感度0.125 EU/mL)进行测试。药物组合物的无菌状态可以根据USP 24/NF 19方法使用巯基乙酸培养基确定。例如,将所述制品接种于巯基乙酸培养基上并在35℃温育14或更多天。定时检查该培养基以检测微生物的生长。
组合物可以配制成溶液、微乳状液、分散液、脂质体,或者适合高药物浓度的其它有序结构。无菌注射溶液可以通过将活性化合物(即可转导的DNA结合蛋白)以需要量掺入合适的溶剂(如果需要,溶剂中具有上述一种成分或其组合)中,随后过滤灭菌而制备。通常,分散液是通过将活性化合物掺入含有基本分散培养基和需要的上述其它成分的无菌运载体中而制备。在制备无菌注射溶液的无菌粉末的情况中,典型的的制备方法包括真空干燥和冷冻干燥,产生粉末状的活性成分以及从先前灭菌过滤的溶液中的任何额外需要的成分。溶液的适当流动性可以例如通过使用包衣如卵磷脂、在分散液的情况中通过维持需要的颗粒大小及通过使用表面活性剂而维持。可注射组合物的延长吸收可以通过在组合物中包括一种延缓吸收的制剂如单硬脂酸盐和明胶而实现。
可转导的人工DNA结合蛋白可以通过本领域已知的多种方法施用,尽管对于许多应用而言,施用途径/模式是静脉内注射或灌输。例如,对于治疗性应用,可转导的人工DNA结合蛋白可以通过静脉内灌输施用,速度为低于30、20、10、5、3、1或0.1mg/分钟,达到大约1-100mg/m2、7-25mg/m2或者0.5-15mg/m2的剂量。施用途径和/或模式根据希望的结果而变化。在某些实施方案中,活性化合物可以用保护该化合物免于迅速释放的载体制备,如控制释放制剂,包括植入体及微包囊化输送系统。可以使用可生物降解的、生物相适合的聚合物,如乙烯乙酸乙烯酯、聚酐、聚羟基乙酸、胶原、聚原酸酯和聚乳酸。制备这种制剂的许多方法取得了专利权或是通常已知的。见例如Sustained and Controlled Release Drug Delivery Systems,J.R.Robinson,ed.,Marcel Dekker. Inc.,New York,1978。
在某些实施方案中,可转导的DNA结合蛋白可以口服施用,例如使用惰性稀释剂或可吸收的可食用载体。所述化合物(及其它成分,如果需要的话)也可以封进硬或软壳明胶胶囊中、压制成片剂、或者直接掺入对象的饮食中。对于口腔治疗性施用,所述化合物可以混和赋形剂并以可吸收的片剂、口腔贴片、药片(troche)、胶囊、酏剂、悬浮液、糖浆、糯米纸囊剂等剂型使用。为通过除了胃肠外施用之外的途径施用化合物,可以将化合物用一种材料包被或与所述化合物一起施用以防止化合物失活。
药物组合物可以用本领域已知的医学装置施用。例如,药物组合物可以用无针皮下注射装置施用,如U.S.5,399,163所揭示的装置。可以使用的熟知的植入物和模块例如包括U.S.4,487,603揭示的以控制速度分发药物的一种可植入的微灌输泵;U.S.4,486,194揭示的通过皮肤施用药物的一种治疗装置;U.S.4,447,233揭示的以精确的灌输速度输送药物的一种医用灌输泵;U.S.4,447,224揭示的持续输送药物的一种可变流量可植入灌输设备;U.S.4,439,196揭示的具有多个腔室的渗透性药物输送系统;及U.S.4,475,196揭示的渗透性药物输送系统。本领域还已知许多其它的这种植入物、输送系统和模块。
在一个实施方案中,可转导的DNA结合蛋白经静脉内施用,进入神经元细胞例如脑细胞中。例如,可转导的DNA结合蛋白与一种结合神经元细胞例如脑细胞的蛋白质例如神经胶质细胞系衍生神经营养因子(GNDF)物理结合。在另一个实施方案中,将可转导的DNA结合蛋白与一种造血细胞例如淋巴细胞例如T细胞接触,其调节该细胞中基因表达。例如,所述蛋白质可由于调节特异性胞毒性T细胞中的基因表达,例如用以治疗感染性疾病和癌症。
在某些实施方案中,可以配制可转导的人工DNA结合蛋白以保证在体内的正确分布。例如,血脑屏障(BBB)排外许多高亲水性的化合物。为保证可转导的人工DNA结合蛋白可以穿过BBB(如果希望),可以在例如脂质体中配制。生产脂质体的方法见例如U.S.4,522,811;5,374,548和5,399,331。脂质体可包括被选择性转运进特异的细胞或器官的一或多个部分,由此增强药物的靶向输送(见例如,V.V.Ranade(1989)J.Clin.Pharmacol.29685)。
调整剂量方案以提供最佳的希望应答(例如治疗应答)。例如,可以一次施用大丸剂,可以随着时间而分多次施用,或者可以根据治疗情形的要求适当降低或增加剂量。特别有益的是配制便于施用的剂量单位形式和均一剂量的胃肠外组合物。本文所用剂量单位形式是指适合作为治疗对象的单元剂量(unitary dosage)的自然分立单位;每个单位均含有经计算产生希望治疗作用的预定量的活性化合物及需要的药物载体。剂量单位的说明书的规定可以根据或者直接依赖于(a)活性化合物的独特特性和要达到的特定治疗作用,及(b)个体对配制的这种活性化合物的治疗敏感性的固有限制。
剂量值可以根据要减轻或预防的病变的类型和严重性加以变化。进一步应理解对于任何特殊的对象,应根据个体需要和施用或监督施用所述组合物人员的专业判断随时调整特异的剂量方案,本文所述剂量范围只是举例说明而非限制要求保护的组合物的保护范围或实践。
药物组合物可包括“治疗有效量”或“预防有效量”的可转导的人工DNA结合蛋白。“治疗有效量”是指在此剂量在必需的时间达到希望的治疗结果的量。组合物的治疗有效量可以根据许多因素如个体的疾病状态、年龄、性别和体重,以及可转导的DNA结合蛋白在个体中激发希望的应答的能力而变化。治疗有效量也是提供有益的治疗作用的量,典型地是其中组合物的有益作用超过任何毒性或不利作用。例如,可转导的人工DNA结合蛋白可抑制一种可测定的参数,例如癌细胞的生长速度。可测定的参数可以在任何对象中评价,例如在预测在人体中的效力的动物模型系统中评价,或者在人对象例如患者、对照对象等等中评价。或者,组合物的这种性质可以通过检测化合物产生希望的作用的能力而评价,例如抑制细胞生长或改变(例如增加或降低)蛋白质如细胞因子或生长因子的水平的能力。本领域技术人员已知许多这种可测定参数的分析试验。
“预防有效量”是指以此剂量在必需的时间有效达到希望的预防结果的量。典型地,由于预防剂量是在疾病发生之前或早期在对象中使用,因此预防有效量将低于治疗有效量。
也在本发明范围内的是试剂盒,其包括可转导的人工DNA结合蛋白及用于例如治疗、预防或诊断使用的说明书。在一个实施方案中,治疗应用说明书包括建议的剂量和/或施用给具有疾病、疾患或病症的患者的模式。试剂盒可进一步含有至少一种额外的试剂,如诊断或治疗剂,例如本文所述的诊断或治疗剂,和/或一或多种额外的可转导制剂,以适于一或多种单独的药物制品的形式配制。
在一个实施方案中,可转导的人工DNA结合蛋白与改善其在循环(例如血液、血清、淋巴)或其它组织中的稳定和/或保留的一个部分物理结合。该部分可使循环半衰期改善至少2、4或6倍。例如,可转导的人工DNA结合蛋白可以与一种聚合物结合,所述聚合物例如是基本无抗原性的聚合物如聚环氧烷或聚环氧乙烷。合适的聚合物在重量方面有很大的不同。通常选择分子数目平均重量为大约200-大约35,000的聚合物。可以使用分子量为大约1,000-大约15,000或者大约2,000-大约12,500的聚合物。在一个实施方案中,聚合物通过可逆键而附着,所述可逆键当可转导的DNA结合蛋白进入细胞时被破坏。例如,二硫键或其它硫醇键在细胞中可被还原以从可转导的DNA结合蛋白中分离出该聚合物。
例如,可转导的人工DNA结合蛋白可以与一种水溶性聚合物缀合,所述聚合物例如是亲水性聚乙烯聚合物,例如聚乙烯醇和聚乙烯吡咯烷酮。这种聚合物的非限制性列表包括聚环氧烷均聚物如聚乙二醇(PEG)或聚丙二醇,聚氧乙烯化多醇,及其共聚物和嵌段共聚物,条件是保持该嵌段共聚物的水溶性。其它有益的聚合物包括聚氧化烯如聚氧乙烯、聚氧化丙烯、及聚氧乙烯和聚氧化丙烯的嵌段共聚物(Pluronics);聚甲基丙烯酸酯;卡波姆(carbomers);分支或不分支的多糖,杂多糖如乳糖,支链淀粉,淀粉,羟乙基淀粉,直链淀粉、葡聚糖硫酸酯,葡聚糖,糊精,糖原,或者酸性粘多糖的多糖亚单位,例如透明质酸;糖醇的聚合物如聚山梨糖醇和聚甘露醇;肝素或heparon。其它化合物也可以附着于同样的聚合物,例如标记或靶向剂。
在一个实施方案中,聚合物在交联之前通常是水溶性的。通常地,在交联后,产物是水溶性的,例如表现为至少大约0.01mg/ml、0.1mg/ml或1mg/ml的水溶性。另外,聚合物在缀合物形式不应该是高度免疫原性的,而且如果缀合物想要以静脉内灌注或注射这种途径施用时,该聚合物也不应具有与静脉内灌注或注射不相适合的粘性。该聚合物的分子量可以是直至大约500,000D,例如至少大约20,000D、30,000D或40,000D。
共价交联可用于将可转导的人工DNA结合蛋白附着于一种聚合物,例如与N末端氨基基团及在赖氨酸残基上发现的ε氨基基团,以及其它氨基、亚氨基、羧基、巯基、羟基或其它亲水性基团交联。可以附着于可转导的人工DNA结合蛋白的功能化PEG聚合物可得自例如Shearwater Polymers,Inc.(Huntsville,Ala.)。
可转导的人工DNA结合蛋白与一种聚合物的缀合物可以从未反应的起始物中分离,例如通过凝胶过滤或者离子交换层析例如HPLC进行。异源物种的缀合物以相同方式彼此纯化。不同物种(例如含有一或两个PEG残基)的解离也是可能的,因为未反应的氨基酸的离子性质不同。见例如WO 96/34015。
贮存可以使用多种方法贮存纯化的可转导的锌指蛋白。例如,该蛋白质可以在存在如下一或多种制剂的情况中贮存(i)冷冻保护剂(例如甘油,例如5-12%的甘油),(ii)锌,例如1μM-5mM,1μM-500μM,1μM-200μM,0.05μM-50μM及0.5μM-30μM的锌,及(iii)还原剂(例如DTT,例如大约0.05-5mM,例如0.5-2mM)。所述蛋白质可以例如在4℃或更低,例如-20℃或更低,例如在大约-60℃至-90℃的温度下贮存。
治疗可调节内源基因的可转导的DNA结合蛋白,特别是可调节VEGF-A基因的蛋白质具有治疗和预防作用。例如,可转导的锌指蛋白可以施用给例如在体外或回体(ex vivo)培养的细胞,或体内施用给对象的细胞,以治疗、预防和/或诊断多种疾病,如癌症,特别是转移癌,炎症疾患及与血管发生增加相关的其它疾病。
如本文所用,术语“治疗”是指应用或施用锌指蛋白,从而该蛋白质进入细胞并调节对象例如患者细胞中基因表达,或者将该制剂用于或施用给分离的组织或细胞,例如对象例如患有疾病(例如本文所述疾病)、具有疾病症状或者易患疾病的患者的细胞系,以治愈、治疗、减轻、解除、改变、补救、改善、改进、或影响疾病、疾病症状或易患病的体质。
在一个实施方案中,“治疗细胞”或“治疗组织”是指降低细胞的至少一个活性,例如VEGF-A产生、血管发生刺激、增殖,或者降低细胞,例如过度增殖的细胞或者在组织如肿瘤中或附近的细胞的其它活性。这种降低可包括细胞或组织(例如转移组织)的活性或者细胞的数目或组织的大小、组织的血液供应量或程度的统计学显著的降低。活性降低例如是细胞迁移(例如通过胞外基质迁移)减少,血管形成减少或者细胞分化降低。另一个实例是直接或间接降低炎症或炎症指征的活性。
如本文所用,有效治疗疾病的可转导的锌指蛋白的量或者“治疗有效量”是指蛋白质在一次或多次剂量施用给对象的基础上有效治疗细胞的量。
如本文所用,有效预防疾病的可转导的锌指蛋白的量或者蛋白质的“预防有效量”是指蛋白质在一次或多次剂量施用给对象的基础上,防止或延缓疾病如癌症、基于血管发生的疾病或炎症疾病发生或复发的量。
如本文所用,术语“对象”包括人和非人动物。对象例如包括患有特征在于异常细胞增殖或细胞分化的疾病的人患者。术语“非人动物”包括所有非人脊椎动物,例如非哺乳动物(如鸡、两栖类动物、爬行动物)和哺乳动物如非人灵长类动物、羊、狗、牛、猪等。
在一个实施方案中,所述对象是人。在一个实施方案中,可转导的锌指蛋白的组合物可以施用给非人哺乳动物(例如灵长类动物,猪或小鼠),以进行兽医学研究或者作为人体疾病的动物模型。对于后者,这种动物模型可用于评价组合物的治疗效力(例如测试剂量和施用时程)。
在一个实施方案中,本发明提供了一种治疗致瘤性疾患的方法。所述方法可包括将对象的细胞与足以治疗或预防致瘤性疾患的量的可转导的锌指蛋白例如调节VEGF-A的锌指蛋白接触的步骤。所述蛋白质包括一个蛋白质转导结构域。例如,所述疾病可以是癌细胞、肿瘤细胞或转移瘤细胞所致。本发明的方法可用于培养的细胞,例如在体外或回体。例如,癌细胞或转移癌细胞(例如肾、尿道上皮、结肠、直肠、肺、乳腺、子宫内膜、卵巢、前列腺或肝癌细胞或转移癌细胞)可以在体外在培养基中培养,所述接触步骤可以通过向培养基中加入锌指蛋白而实现。所述方法可以对对象(例如人)中存在的细胞(例如癌细胞或转移癌细胞)进行,作为体内(例如治疗或预防)方案的一部分。对于体内实施方案,所述接触步骤是在对象体内完成的,包括在有效调节对象细胞中VEGF-A基因的条件下施用给对象可转导的锌指蛋白。
本发明的方法可用于治疗癌症。如本文所用,“癌”、“过度增殖”、“恶性”和“致瘤性”可互换使用,是指特征在于快速增殖或肿瘤的异常状态或状况的那些细胞。这些术语包括所有类型的癌性生长或致瘤性过程,转移的组织或恶性转化的细胞、组织或器官,不管其组织病理学类型或侵润阶段如何。“病原性过度增殖”细胞发生在特征在于恶性肿瘤生长的疾病状态。
术语“瘤形成”的普通医学含义是指“新细胞生长”,导致对正常生长控制的应答丧失,例如致瘤性细胞生长。“增生”是指细胞经历异常的高速生长。然而,如本文所用,术语瘤形成和增生可以互换使用,因为在此这两个术语通常是指细胞经历异常的细胞生长速度。瘤形成和增生包括可以是良性、癌前或恶性“肿瘤”。
癌症例如包括但非限于实体瘤,软组织瘤和转移病变。实体瘤例如包括多个器官系统的、如影响肺、乳腺、淋巴、胃肠道(例如结肠)、生殖泌尿道(例如肾、尿道上皮细胞)、咽、前列腺、卵巢的恶性肿瘤,例如肉瘤、腺癌和癌瘤,以及腺癌,包括恶性肿瘤如大多数结肠癌、直肠癌、肾细胞癌、肝癌、非小细胞肺癌、小肠癌等等。上述癌的转移病变也可以使用本发明的方法或组合物治疗或预防。
本发明所述方法可用于治疗多个器官系统的恶性肿瘤,如影响肺、乳腺、淋巴、胃肠道(例如结肠)和生殖泌尿道、前列腺、卵巢、咽的肿瘤,以及腺癌,包括大多数的结肠癌,肾细胞癌,前列腺癌和/或睾丸肿瘤,非小细胞肺癌,小肠癌和食管癌。术语“癌”是由本领域技术人员公认的,是指上皮或内分泌组织的恶性肿瘤,包括呼吸系统癌,胃肠系统癌,泌尿生殖系统癌,睾丸癌,乳腺癌,前列腺癌,内分泌系统癌和黑素瘤。癌例如包括绒毛膜癌及子宫颈、肺、前列腺、乳腺、子宫内膜、头颈、结肠和卵巢组织中形成的那些癌。该术语还包括癌肉瘤,例如包括癌瘤性和肉瘤样组织组成的恶性肿瘤。“腺癌”是指衍生自腺组织的或者其中肿瘤细胞形成可识别的腺体结构的癌。术语“肉瘤”是由本领域技术人员公认的,是指间充质衍生的恶性肿瘤。
该方法也可用于调节(例如增加或抑制)示出表达VEGF-A的造血细胞的增殖。例如,该方法可用于抑制增生的/致瘤性细胞的增殖。
施用可转导的锌指蛋白的方法在“药物组合物”中描述。使用的分子的合适剂量依赖于对象的年龄和体重及所用的特殊药物。
可转导的锌指蛋白可以与标记偶联,例如以在其输送至对象中后成像。合适的标记包括MRI-可检测标记或放射性标记。
可转导的锌指蛋白可以单独或者组合治疗癌症的一或多种现有手段施用,包括但非限于手术、放疗和化疗。例如,可转导的锌指蛋白可以与另一种抗血管发生剂一起施用。抗血管发生剂包括2ME2,制管张素,Angiozyme,抗VEGF RhuMAb,Apra(CT-2584),Avicine,Benefin,BMS275291,羧基氨基咪唑(Carboxyamidotriazole),CC4047,CC5013,CC7085,CDC801,CGP-41251(PKC 412),CM101,Combretastatin A-4前体药物,EMD 121974,血管内皮抑素(Endostatin),Flavopiridol,染料木黄酮(GCP),绿茶提取物,IM-862,ImmTher,干扰素α,白细胞介素-12,Iressa(ZD1839),马立马司他(Marimastat),Metastat(Col-3),Neovastat,奥曲肽(Octreotide),紫杉醇(Paclitaxel),青霉胺,光敏素(Photofrin),Photopoint,PI-88,Prinomastat(AG-3340),PTK787(ZK22584),R0317453,Solimastat,Squalamine,SU 101,SU 5416,SU-6668,Suradista(FCE 26644),苏拉明(Suramin)(Metaret),四硫钼酸盐(Tetrathiomolybdate),沙利度胺(Thalidomide),TNP-470和Vitaxin,其它的抗血管发生剂由Kerbel,J.Clin.Oncol.19(18s)45s-51s,2001所述。
为治疗致瘤性疾患,该蛋白质可组合一或多种如下制剂施用给患者其它治疗剂例如包括泰素(taxol),细胞松弛素B,短杆菌肽D,溴化乙锭,吐根碱,丝裂霉素,表鬼臼毒吡喃葡糖苷,鬼臼噻吩甙(tenoposide),长春新碱,长春花碱,秋水仙碱,阿霉素,道诺红菌素,二羟基炭疽菌素二酮(dihydroxy anthracin dione),米托蒽醌(mitoxantrone),光神霉素,放射菌素D,1-去氢睾酮,糖皮质激素,普鲁卡因,丁卡因(tetracaine),利多卡因(lidocaine),心得安(propranolol),嘌呤霉素,maytansinoids,例如maytansinol或DM1(见U.S.Pat.No.5,208,020),CC-1065(见U.S.Pat.Nos.5,475,092,5,585,499,5,846,545)卡奇霉素(calicheamicin),及其类似物和同系物。术语“组合”是指不同的制剂基本上同时(一起或相继)给予。如果相继给予,在开始施用第二种化合物时,优选两种制剂的第一种在治疗部位仍以有效浓度可检测到。
可转导的锌指蛋白特别是可调节VEGF-A基因(例如降低其表达)的锌指蛋白可以单独施用,或者与治疗炎症疾病或疾患的一或多种现有手段组合施用。炎症疾病或疾患例如包括急性和慢性免疫和自身免疫疾病,如但非限于类风湿性关节炎(RA),青少年型慢性关节炎(JCA),银屑病,移植物抗宿主病(GVHD),硬皮病,糖尿病,变态反应;哮喘,与异源移植相关的急性或慢性免疫疾病,如但非限于肾移植,心脏移植,骨髓移植,肝移植,胰腺移植,小肠移植,肺移植和皮肤移植;慢性炎症病变,如但非限于肉样瘤病,慢性炎症性肠道疾病,溃疡性结肠炎和Crohn′s病变或疾病;血管炎症病变,如但非限于弥散性血管内凝血,动脉粥样硬化,Kawasaki′s病和血管炎综合征,如但非限于结节性多动脉炎,Wegener′s肉芽肿病,Henoch-Schonlein紫癜,巨细胞性关节炎及肾的显微血管炎;慢性活动性肝炎;Siogren′s综合征;银屑病关节炎;肠病性关节炎;反应性关节炎及与炎症性肠病相关的关节炎;及眼葡萄膜炎。
炎症性肠道疾病(IBD)包括一般的慢性、复发性肠道炎症。IBD指两种独特的疾病,即Crohn′s病和溃疡性结肠炎(UC)。IBD的临床症状包括间歇性直肠出血、绞痛性腹部疼痛、体重降低、和腹泻。临床指标也可用于监测IBD如溃疡性结肠炎的临床活性指标。也见例如Walmsley et al.Gut.1998 Jul;43(1)29-32和Jowett et al.(2003)Scand J Gastroenterol.38(2)164-71所述。
可转导的锌指蛋白可用于治疗或预防前述疾病或疾患之一。例如,该蛋白质可以以有效改善相应疾病或疾患的至少一个症状的量施用(局部或系统施用)。该蛋白质也可以改善炎症,例如炎症指征,例如局部温度、肿胀(例如测定的)、红肿、局部或全身白细胞计数、嗜中性粒细胞的存在与否、细胞因子水平等等。可以例如在施用该蛋白质之前、期间或之后评价对象的一或多个炎症指征,例如上述指征。
可转导的锌指蛋白特别是可调节VEGF-A基因(例如增加其表达)的锌指蛋白可单独施用或者与治疗创伤的一或多种现有手段例如促进创伤愈合的手段组合施用。例如,VEGF-A的激活通常可增加新血管和毛细管的形成。该蛋白质也可用于改善手术、烧伤、外伤、溃疡、骨折及需要增加血管发生的其它疾病。
可转导的锌指蛋白特别是可调节VEGF-A基因(例如增加其表达)的锌指蛋白可单独施用或者与治疗心血管疾病例如缺血性心脏病、外周动脉疾病或者冠心病的一或多种现有手段组合施用。施用锌指蛋白的方法也可以用于治疗糖尿病视网膜病变(diabeticretinopathy)或者患有心肌梗塞的患者。
可转导的DNA结合蛋白的一些方面通过如下特异性和非限制性实施例1TAT-ZFP融合蛋白的构建、表达和纯化编码嵌合的3或4个指状蛋白的核酸如下制备。使用载体P3(Toolgen,Inc.)在哺乳动物细胞中表达嵌合的锌指蛋白。P3通过修饰pcDNA3载体(Invitrogen,San Diego CA.)而构建。将具有相适合的突出端的合成寡核苷酸双链体连接进用HindIII和XhoI消化的pcDNA3载体中。该双链体含有编码血凝素(HA)标记及核定位信号的核酸。该双链体还包括BamHI、EcoRI和NotI及BglII限制位点和一个终止密码子。另外,所得载体的SV40起点中的XmaI位点通过XmaI消化而破坏,填充消化的限制位点的突出端,并与该末端再连接。
如下是构建编码具有上表2所列多个锌指结构域的嵌合的锌指蛋白的质粒的一个示例方法。首先,将编码单个锌指结构域的一个插入体插入含有编码单个锌指结构域的序列的载体(P3载体)中。这个克隆的结果是产生编码具有两个锌指结构域的锌指蛋白的质粒。由两个锌指结构域组成的锌指结构域插入体通过上述方法制备并克隆进具有一或两个锌指结构域的AgeI/NotI线性化的载体P3中,获得含有由三或四个锌指结构域组成的嵌合的锌指蛋白基因的质粒。
如下所述将编码预装配的ZFP的核酸插入pTAT质粒中(见例如Dowdy et al.(1999)Science 2851569-1572)。首先,将KpnI限制位点通过PCR加入ZFP编码序列中,使用在5’序列含有KpnI位点的正向引物。插入体和载体(pTAT)通过用KpnI和XhoI消化而制备。在连接后,对pTAT-ZFP构建体测序。在插入pTAT-ZFP质粒后,产生编码多肽的一个序列,其包括(从N至C末端)ATG(起始密码子)、六组氨酸标记、HIV Tat PTD序列、核定位信号(NLS)及一列具有功能结构域(p65、KRAB或KOX)的锌指结构域。
将大肠杆菌BL21(DE3)细胞用pTAT-ZFP质粒转化并在选择培养基中生长直至达到OD为0.3-0.4。然后将细胞用1mM IPTG诱导3小时。TAT-ZFP蛋白质样品使用Ni-NTA琼脂糖(Qiagen)根据厂商指导制备。简而言之,离心BL21细胞,并将细胞沉淀用裂解缓冲液(100mM NaH2PO4,10mM Tris-Cl,8M尿素,pH8.0)裂解,使用5次10秒超声处理,其中超声处理10秒后暂停30秒(Fischer Scientific550)。贮存未纯化的溶解产物以进行系列实验或者使用亲和柱纯化裂解物。将裂解物用Ni-NTA琼脂糖(Qiagen)温育40分钟,在洗涤溶液(100mM NaH2PO4,10mM Tris-Cl,8M尿素,pH6.3)中洗涤两次。然后将蛋白质在洗脱缓冲液(100mM NaH2PO4,10mM Tris-Cl,8M尿素,pH 4.5)中洗脱并在PBS中透析。纯化的蛋白质在-70℃贮存在10%甘油中。
在纯化的每个步骤中获得的流通物(flow-through)及纯化的TAT-ZFP在SDS-PAGE凝胶上用考马斯蓝染色分析。洗脱的蛋白质以~35kDa条带为主迁移带并且是高度纯化的。见图1和图2。
实施例2TAT-ZFP融合蛋白转导进哺乳动物细胞培养物中(1)评价TAT融合蛋白的转导效力为确定TAT融合蛋白输送进培养的细胞中的效力,使用纯化的TAT-lacZ蛋白。遗传工程化的TAT-lacZ融合体通过将lacZ开放读框DNA插入pTAT-HA质粒中而产生。见例如Dowdy et al.(1999)Science2851569-1572所述,然后将其转化进BL21(DE3)LysS细菌(Novagen)中。TAT-lacZ融合蛋白的表达由1mM IPTG诱导3小时,离心BL21(DE3)LysS细胞并将细胞沉淀用裂解缓冲液(100mM NaH2PO4,10mMTris Cl,8M尿素,pH 8.0)裂解,使用5次10秒超声处理,其中10秒超声随后暂停30秒(Fischer Scientific 550)。将裂解物与Ni-NTA琼脂糖(Qiagen)温育40分钟,在洗涤溶液(100mM NaH2PO4,10mMTris-Cl,8M尿素,pH 6.3)中洗涤两次。然后将蛋白质在洗脱缓冲液(100mM NaH2PO4,10mM Tris-Cl,8M尿素,pH 4.5)中洗脱,并在PBS中透析。然后将纯化的蛋白质在-70℃贮存在10%甘油中。将人胚肾(HEK)293细胞以3×105/ml密度种植在24孔培养平板中,温育24小时,之后与TAT融合蛋白接触。然后,将得自表达TAT-lacZ的大肠杆菌培养物的总裂解物以100μg/ml-800μg/ml浓度加入培养基中,并在37℃温育4小时。将细胞用PBS洗涤两次并用2%多聚甲醛固定,然后用X-gal染色。观测到的染色强度是剂量依赖性的。在甚至最低的浓度(100μg/ml)也观测到大约100%的细胞的转导效力。这些结果表明TAT-结构域可以将高分子量的蛋白质(~120 kD)如lacZ转导进细胞中。
(2)TAT-ZFP融合蛋白转导进培养的细胞中测试纯化的TAT-ZFP融合蛋白转导进HEK 293细胞中。将HEK293细胞以3×105/ml密度在24孔平板中预培养24小时,然后向培养基中加入20μg的TAT-ZFP。收获细胞,用PBS洗涤3次,然后加入冰冷的裂解缓冲液。将样品进行SDS-PAGE并将凝胶转移至HYBOND-PTM膜(Amersham Pharmacia Biotech)上。使用小鼠抗HA抗体作为初级抗体,抗小鼠IgG-HRP作为二级抗体进行Western分析,并通过ECLTM(Amersham Pharmacia Biotech)显色。Western印迹清楚示出TAT-ZFP融合蛋白在HEK293细胞内部检测到。
实施例3TAT-ZFP介导的报道基因活性和内源基因表达的调节为证实转导的TAT-ZFP融合蛋白在细胞中发挥转录因子的功能,用含有特异于测试的TAT-ZFP的ZFP结合序列的一系列萤火虫荧光素酶报道基因转染细胞。在这个实施例中,使用结合VEGF启动子的ZFP。在2003年12月9日提交的U.S.Serial No.60/431,892中,报道了这些蛋白质可调节内源VEGF基因。
如下制备转染的细胞。将人胚肾293细胞保持在补加了100单位/ml青霉素、100μg/ml链霉素和10%胎牛血清(FBS)的Dulbecco′smodified Eagle培养基(DMEM)中。为进行荧光素酶分析,将104个细胞/孔在96孔平板中预培养。293细胞用25ng的报道基因质粒转染,使用LIPOFECTAMINETM转染试剂盒(Life Technologies,Rockville,MD)进行。报道基因质粒包括在pGL3-basic(Promega)中与荧光素酶基因融合的天然VEGF启动子。
将细胞温育24小时,然后将其与包括含有TAT-ZFP蛋白的裂解物的培养基接触另外24小时。培养基包括40μg或80μg裂解物。在这次24小时后,使用Dual荧光素酶分析试剂盒(Promega),使用TD-20/20发光计(Turner Designs Inc.,Sunnyvale,CA)分析细胞的报道基因表达情况。
与用相应的仅有TAT的蛋白质(即不包括锌指结构域的蛋白质)的裂解物转导的对照培养物相比,TAT-F475-KRAB裂解物抑制了报道基因活性1.5倍(当使用40μg时)和2.0倍(80μg)。观测到的抑制归因于序列特异性DNA结合,因为TAT-F83-KRAB的裂解物具有与TAT-F475-KRAB不同的DNA结合特异性,不抑制报道基因活性。这个实验中使用的嵌合的锌指结构域F83作为阴性对照,因为在我们的前期研究中其不改变包括天然人VEGF启动子序列的荧光素酶报道基因的表达(Bae et al.Nat Biotechnol.2003,21(3)275-80)。相似地,TAT-mF475-KRAB的裂解物不抑制报道基因活性。mF475包括使得在第二个和第三个锌指结构域中丧失DNA结合能力的突变(精氨酸突变为丙氨酸)。这些表明报道基因表达的调节归因于特异性锌指蛋白而不是TAT蛋白质转导结构域。
这些结果表明TAT-F475-KRAB的tat结构域将蛋白质有效地转导进细胞中,转导的蛋白质可以序列特异性方式调节其靶基因在这种细胞中的转录。
实施例4包括转录调节结构域的蛋白质的转录我们接下来研究了包括转录调节结构域的蛋白质是否也可以转导进细胞中。制备包括蛋白质转导结构域、一批锌指结构域及p65转录激活物结构域或者KRAB转录阻抑物结构域的蛋白质。编码TAT-ZFP融合蛋白的质粒从大肠杆菌BL21(DE3)转化体中表达,如实施例1所示。将这些蛋白质与用含有F475锌指识别的天然人VEGF启动子序列(Bae et al.Nat Biotechnol.2003,21(3)275-80)的荧光素酶报道基因构建体瞬时转染的293细胞接触。与用对照裂解物(包括不具有锌指结构域的Tat蛋白)转导的细胞相比,TAT-F475-p65的裂解物导致报道基因活性增加2.5倍(±0.48)。纯化的TAT-F121-KRAB导致报道基因活性降低2.1倍(±0.14)。
实施例5转导的DNA结合蛋白对内源基因的调节我们也评价了转导的DNA结合蛋白是否可调节内源VEGFmRNA表达。将包括TAT-F475-KRAB蛋白或TAT-F121-KRAB的裂解物加入预培养24小时的3×105293细胞培养物中(12孔培养平板)。接触后4小时,将含有裂解物的培养基用新鲜培养基更换。与裂解物接触后24小时收获细胞。根据厂商(Life Technologies)指导制备TRIZOLTM-裂解物从细胞中提取总细胞RNA。
用4μg总RNA进行逆转录反应,使用oligo-dT作为mRNA第一链合成引物及使用SUPERSCRIPTTM第一链合成系统(LifeTechnologies)提供的MMLV逆转录酶进行。为分析mRNA数量,将1μl从RT反应产生的每个第一链cDNA使用VEGF特异性引物扩增。RNA的起始量标准化为使用GAPDH-特异性引物通过特异性扩增计算的甘油醛-3-磷酸脱氢酶(GAPDH)mRNA浓度。监测VEGF和GAPDH cDNA的扩增并使用QUANTITECTTMSYBR试剂盒(Qiagen,Valencia,CA)及ROTORGENE2000TM实时循环仪(Corbett,Sydney,Australia)进行实时分析。mRNA浓度使用反应中包括的标准物的系列稀释液定量。
与包括TAT结构域但不包括锌指结构域的对照蛋白质相比,TAT-F475-KRAB和TAT-F121-KRAB都分别使内源VEGF mRNA水平抑制了3.1(±0.4)倍和1.7(±0.01)倍。这个结果表明转导的ZFP在细胞中可发挥人工转录因子的功能。
我们还研究了转导的TAT-ZFP蛋白是否影响其它内源基因的调节。我们对比了对于稳定表达F121-KRAB和突变体变体mF121-KRAB的细胞使用DNA微阵列获得的转录图谱结果。mF121-KRAB(QSHT-ASHR-ADHT)相对于F121(QSHT-RSHR-RDHT)在接触DNA的氨基酸位置包括两个氨基酸取代(Arg取代为Ala)。期望这个突变改变或破坏DNA结合的特异性。
转录图谱证实VEGF mRNA由F121-KRAB下调。另外,图谱表明F121-KRAB导致一组基因包括膜联蛋白A3和细胞周期蛋白A基因的激活。mF121-KRAB处理的细胞的转录图谱未示出膜联蛋白A3和细胞周期蛋白A基因激活,VEGF mRNA表达也无改变。通过RT-PCR获得相同的结果。这些结果首次表明与TAT PTD融合并在大肠杆菌中表达的嵌合的锌指蛋白可以成功转导进哺乳动物细胞中,在转导后可以发挥转录调节物的功能。
实施例6TAT-ZFP融合蛋白根据效应子结构域而发挥转录激活物或阻抑物的功能我们观测到给定的DNA结合结构域根据与该DNA结合结构域可操纵地连接的效应子结构域的特性而发挥转录激活物或阻抑物的功能。例如,TAT-F435根据其与p65激活结构域融合还是与KRAB阻抑结构域融合而可以激活或抑制内源VEGF-A表达。将BL21(DE3)LysS细菌(Novagen)用编码TAT-F435-KRAB或TAT-F435-p65的质粒转化。从转化体中表达融合蛋白TAT-F435-KRAB或TAT-F435-p65。见实施例1所述。在使用TAT-F435-p65的实验中,由于其低表达水平,使用含有TAT-F435-p65蛋白的100μg的细菌裂解物处理293细胞。将细胞与裂解物温育3小时,然后将培养基用新鲜培养基更换。然而,与不表达TAT-F435-p65的细菌裂解物处理的细胞相比,在转导后48小时通过分泌的VEGF测定,这样处理足以使VEGF表达增加2.5(±0.5)倍(见图3A)。
在单独的实验中,将400μg/ml纯化的TAT-F435-KRAB蛋白暴露于293细胞(12孔平板)3小时。将细胞在新鲜培养基中进一步温育48小时。收获培养上清和细胞以分析VEGF蛋白的产量及VEGFmRNA的量。我们观测到与PBS处理的对照培养物相比,通过RT-PCR方法(标准化为GAPDH mRNA量)测定TAT-F435-KRAB使VEGFmRNA水平抑制3.1(±0.35)倍(见图3B)。与PBS处理的对照培养物相比,TAT-F435-KRAB处理的培养物中VEGF产量也降低2.7(±0.2)倍(见图3C)。
实施例7TAT-F435-KOX蛋白降低VEGF-A在人肺癌细胞系H460中的表达
VEGF-A在高度血管化的致瘤性细胞系中是过表达的,所述细胞系如非小细胞肺癌细胞系H460及人结肠癌细胞系HCT116和HM-7。VEGF-A在这些细胞中的表达与其在HEK293F细胞中的表达相比高5-10倍。为测试可转导的锌指蛋白作为癌症治疗剂的一般适应性,我们评价了TAT-F435-KOX蛋白阻碍驱动VEGF-A在H460细胞中异常过表达的癌症特异性转录过程的能力。我们的观测结果还证实TAT-ZFP-KOX及相关构型可用于设计可转导的蛋白质从而调节内源基因。
我们用TAT-F435-KOX蛋白处理H460细胞。TAT-F435-KOX蛋白降低VEGF-A蛋白的表达水平,与对照相比降低大约3倍。将H460细胞暴露于40μg/孔的TAT-F435-KOX蛋白3小时。随后,在不同时间点测定分泌的VEGF-A蛋白的浓度。处理的细胞周围的培养基中VEGF-A浓度相对于未处理的对照在转导12小时后降低大约3.8倍,在转导后24小时降低大约3.4倍,在转导后48小时降低大约1.9倍。见图4所示。这些结果表明TAT-F435-KOX可阻抑VEGF-A在癌细胞中的表达。TAT-F435-KOX的调节作用在一次体外处理后持续至少48小时。TAT-F435-KOX当以10μg/孔剂量在H460细胞系中使用时具有相似作用。
实施例8TAT-F435-KOX蛋白的稳定性我们研究了在无细胞培养基中TAT-F435-KOX蛋白的稳定性。将TAT-F435-KOX蛋白用Ni-NTA柱纯化。然后将蛋白质在DMEM(10%FBS,1%NEAA)中在37℃温育。使用HA特异性抗体通过Western印迹分析在不同时间点针对TAT-F435-KOX蛋白评价该混合物。
Western印迹示出TAT-F435-KOX蛋白(使用Ni-NTA柱一步纯化)被快速清除,并且不太可能长期保持其活性。见图5A所示。为研究通过这种方法纯化的蛋白质的清除是否是蛋白酶活性所致,将TAT-F435-KOX蛋白用蛋白酶抑制剂混合物(P8849,Sigma)处理,之后加入培养基中。蛋白酶抑制剂的处理在培养条件下显著改善TAT-F435-KOX蛋白的稳定性。见图5B所示。
将这些观测结果与使用至少两个柱纯化的相同蛋白质的性能进行对比。在这种情况中,在Ni-NTA亲和柱后,蛋白质在离子交换柱上进一步纯化。
然后评价该蛋白质在H460人结肠癌细胞中的稳定性,使用大约50000个细胞和80μg的TAT-F435-Kox进行。将细胞用TAT-F435-KOX蛋白的这种二级制品处理3小时。将培养基用新鲜的生长培养基更换。然后在处理后的不同时间点收获细胞。对照细胞用TAT-F435-KOX蛋白温育少于5分钟,之后收获。
为保证通过Western印迹检测的蛋白质不是未进入细胞的残余在培养基中的残留TAT-F435-KOX蛋白,将细胞经胰蛋白酶消化以除去与细胞表面结合的蛋白质,并在制备细胞裂解物之前彻底洗涤。将80μg每种裂解物在SDS-PAGE凝胶上电泳,转移至HYBOND-PTM膜(Amersham Pharmacia Biotech、)上并与抗体接触以进行检测。在这些细胞裂解物中检测到完整的TAT-F435-KOX蛋白。特别地,观测到通过Ni-NTA亲和柱和离子交换柱相继纯化的蛋白质(TAT-F435-KOX)在细胞中稳定至少48小时。见图6所示。
TAT-F435-KOX蛋白(及本文所述其它可转导的蛋白质)可以从内含体中表达和纯化或者作为可溶蛋白表达。将从内含体中纯化的TAT-F435-KOX蛋白的性质与使用可溶表达系统产生的相同蛋白质的性质进行对比。来自内含体或其它系统的锌指蛋白在存在锌时可以再折叠。例如,蛋白质可以被变性(例如在离液剂如尿素中),然后用具有锌的缓冲液如PBS(加上20μM ZnCl2,lmM DTT)透析。透析可以每2小时更换一次缓冲液(4升),例如共进行4次更换来进行。该程序典型在4℃进行。
对于可溶表达,将编码TAT-F435-KOX的核酸序列亚克隆进入修饰的pET43.1B质粒(Novagen)中。这个质粒包括编码六组氨酸标记的序列。该蛋白质在大肠杆菌菌株BL21(DE3)中被表达为His6-NusA-TAT-F435-KOX的融合蛋白。将该融合蛋白在Ni-NTA柱上纯化。NusA结构域通过凝血酶切割而除去,因为在TAT结构域的N末端有一个相关(cognate)凝血酶切割位点。释放的TAT-F435-KOX可以在离子交换柱上进一步纯化。
将293F细胞用从内含体中纯化的TAT-F435-KOX蛋白及从可溶表达系统中纯化的相同蛋白质进行处理。这两种蛋白质均抑制VEGF-A蛋白的产生。然而,抑制程度中的差异不明显。
本文描述了本发明的许多实施方案。然而,应理解在不偏离本发明的精神和范围的前提下可进行多种修改。因此,其它实施方案包含在如下权利要求书的范围内。
序列表<110>图尔金株式会社<120>可转导的DNA结合蛋白<130>PCA40631-TGI<150>US 60/477,459<151>2003-06-10<160>72<170>PatentIn version 3.2<210>1<211>11<212>PRT<213>HIV<400>1Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg1 5 10<210>2<211>16<212>PRT<213>Drosophila melanogaster<400>2Ala Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys Glu Asn1 5 10 15<210>3<211>34<212>PRT<213>HSV<400>3Asp Ala Ala Thr Ala Thr Arg Gly Arg Ser Ala Ala Ser Arg Pro Thr1 5 10 15Glu Arg Pro Arg Ala Pro Ala Arg Ser Ala Ser Arg Pro Arg Arg Pro20 25 30Val Glu<210>4<211>12<212>PRT<213>synthetic<400>4
Thr Ser Pro Leu Asn Ile His Asn Gly Gln Lys Leu1 5 10<210>5<211>26<212>PRT<213>Artificial Sequence<220>
<223>coordinating residue<220>
<221>VARIANT<222>11<223>Xaa=Phe or Tyr<220>
<221>VARIANT<222>17<223>Xaa=hydrophobic residue<220>
<221>VARIANT<222>2-6,8-10,12-16,18-19,21-25<223>Xaa=any amino acid<400>5Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10 15Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa His20 25<210>6<211>26<212>PRT<213>Artificial Sequence<220>
<223>purified polypeptide<220>
<221>VARIANT<222>11<223>Xaa=Phe or Tyr<220>
<221>VARIANT<222>17<223>Xaa=hydrophobic residue<220>
<221>VARIANT<222>2-6,8-10,12,14,18,21-25<223>Xaa=any amino acid<400>6Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Glu1 5 10 15Xaa Xaa Arg His Xaa Xaa Xaa Xaa Xaa His20 25
<210>7<211>260<212>PRT<213>human<400>7Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys1 5 10 15Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser20 25 30Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser35 40 45Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe50 55 60Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val65 70 75 80Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro85 90 95Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met100 105 110Val Ser Ala Leu A1a Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro115 120 125Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala130 135 140Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp145 150 155 160Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe165 170 175Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn180 185 190Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu195 200 205Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Ala Gln Arg Pro Pro Asp210 215 220Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu225 230 235 240Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala245 250 255Leu Leu Ser Gln260
<210>8<211>127<212>PRT<213>Saccharomyces cerevisiae<400>8Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr1 5 10 15Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn20 25 30Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn35 40 45Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn50 55 60Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala65 70 75 80Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val85 90 95Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys100 105 110Glu Ile Ser Met Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser115 120 125<210>9<211>90<212>PRT<213>Saccharomyces cerevisiae<400>9Asn Ser Ala Ser Ser Ser Thr Lys Leu Asp Asp Asp Leu Gly Thr Ala1 5 10 15Ala Ala Val Leu Ser Asn Met Arg Ser Ser Pro Tyr Arg Thr His Asp20 25 30Lys Pro Ile Ser Asn Val Asn Asp Met Asn Asn Thr Asn Ala Leu Gly35 40 45Val Pro Ala Ser Arg Pro His Ser Ser Ser Phe Pro Ser Lys Gly Val50 55 60Leu Arg Pro Ile Leu Leu Arg Ile His Asn Ser Glu Gln Gln Pro Ile65 70 75 80Phe Glu Ser Asn Asn Ser Thr Ala Cys Ile85 90
<210>10<211>63<212>PRT<213>HOMO SAPIENS<400>10Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr Arg Asp Glu1 5 10 15Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg Glu Val Met20 25 30Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe Leu Phe Thr35 40 45Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp Pro Trp50 55 60<210>11<211>96<212>PRT<213>HOMO SAPIENS<400>11Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys1 5 10 15Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr20 25 30Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn35 40 45Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg50 55 60Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln65 70 75 80Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val85 90 95<210>12<211>23<212>PRT<213>HOMO SAPIENS<400>12Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu1 5 10 15Arg Arg His Gly Arg Thr His20<210>13
<211>23<212>PRT<213>HOMO SAPIENS<400>13Tyr Gln Cys Asn Ile Cys Gly Lys Cys Phe Ser Cys Asn Ser Asn Leu1 5 10 15His Arg His Gln Arg Thr His20<210>14<211>23<212>PRT<213>HOMO SAPIENS<400>14Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys1 5 10 15Arg Arg His Cys Ile Leu His20<210>15<211>23<212>PRT<213>HOMO SAPIENS<400>15Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu1 5 10 15Asn Arg His Arg Arg Thr His20<210>16<211>23<212>PRT<213>HOMO SAPIENS<400>16Tyr Lys Cys Lys Glu Cys Gly Lys Ala Phe Asn His Ser Ser Asn Phel 5 10 15Asn Lys His His Arg Ile His20<210>17<211>23<212>PRT<213>HOMO SAPIENS<400>17
Phe Lys Cys Pro Val Cys Gly Lys Ala Phe Arg His Ser Ser Ser Leu1 5 10 15Val Arg His Gln Arg Thr His20<210>18<211>24<212>PRT<213>HOMO SAPIENS<400>18Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Ile Ser Ser Asn Leu1 5 10 15Gln Arg His Val Arg Asn Ile His20<210>19<211>23<212>PRT<213>HOMO SAPIENS<400>19Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Ile Gly Ser Asn Leu1 5 10 15Asn Val His Arg Arg Ile His20<210>20<211>23<212>PRT<213>HOMO SAPIENS<400>20Tyr Gly Cys His Leu Cys Gly Lys Ala Phe Ser Lys Ser Ser Asn Leu1 5 10 15Arg Arg His Glu Met Ile His20<210>21<211>23<212>PRT<213>HOMO SAPIENS<400>21Tyr Lys Cys Lys Glu Cys Gly Gln Ala Phe Arg Gln Arg Ala His Leu1 5 10 15Ile Arg His His Lys Leu His
20<210>22<211>23<212>PRT<213>HOMO SAPIENS<400>22Tyr Lys Cys His Gln Cys Gly Lys Ala Phe Ile Gln Ser Phe Asn Leu1 5 10 15Arg Arg His Glu Arg Thr His20<210>23<211>23<212>PRT<213>HOMO SAPIENS<400>23Phe Gln Cys Asn Gln Cys Gly Ala Ser Phe Thr Gln Lys Gly Asn Leu1 5 10 15Leu Arg His Ile Lys Leu His20<210>24<211>23<212>PRT<213>HOMO SAPIENS<400>24Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Ser Ser His Leu1 5 10 15Arg Arg His Glu Lys Thr His20<210>25<211>23<212>PRT<213>HOMO SAPIENS<400>25Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu1 5 10 15Thr Arg His Gln Lys Ile His20<210>26<211>23
<212>PRT<213>HOMO SAPIENS<400>26Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Cys Ser His Leu1 5 10 15Arg Arg His Glu Lys Thr His20<210>27<211>23<212>PRT<213>HOMO SAPIENS<400>27Tyr Ala Cys His Leu Cys Ala Lys Ala Phe Ile Gln Cys Ser His Leu1 5 10 15Arg Arg His Glu Lys Thr His20<210>28<211>23<212>PRT<213>HOMO SAPIENS<400>28Tyr Val Cys Arg Glu Cys Gly Arg Gly Phe Arg Gln His Ser His Leu1 5 10 15Val Arg His Lys Arg Thr His20<210>29<211>23<212>PRT<213>HOMO SAPIENS<400>29Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu1 5 10 15Thr Thr His Lys Ile Ile His20<210>30<211>23<212>PRT<213>HOMO SAPIENS<400>30
Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu1 5 10 15Asn Val His Lys Arg Thr His20<210>31<211>23<212>PRT<213>HOMO SAPIENS<400>31Tyr Met Cys Ser Glu Cys Gly Arg Gly Phe Ser Gln Lys Ser Asn Leu1 5 10 15Ile Ile His Gln Arg Thr His20<210>32<211>23<212>PRT<213>HOMO SAPIENS<400>32Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu1 5 10 15Thr Lys His Lys Lys Ile His20<210>33<211>23<212>PRT<213>HOMO SAPIENS<400>33Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu1 5 10 15Ile Arg His Gln Arg Thr His20<210>34<211>23<212>PRT<213>HOMO SAPIENS<400>34Tyr Val Cys Arg Glu Cys Arg Arg Gly Phe Ser Gln Lys Ser Asn Leu1 5 10 15Ile Arg His Gln Arg Thr His20
<210>35<211>23<212>PRT<213>HOMO SAPIENS<400>35Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu1 5 10 15Thr Arg His Lys Lys Ser His20<210>36<211>23<212>PRT<213>HOMO SAPIENS<400>36Tyr Glu Cys Asn Thr Cys Arg Lys Thr Phe Ser Gln Lys Ser Asn Leu1 5 10 15Ile Val His Gln Arg Thr His20<210>37<211>23<212>PRT<213>HOMO SAPIENS<400>37Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu1 5 10 15Thr Val His Gln Lys Ile His20<210>38<211>23<212>PRT<213>HOMO SAPIENS<400>38Tyr Lys Cys Asp Glu Cys Gly Lys Asn Phe Thr Gln Ser Ser Asn Leu1 5 10 15Ile Val His Lys Arg Ile His20<210>39<211>23
<212>PRT<213>HOMO SAPIENS<400>39Tyr Glu Cys Asp Val Cys Gly Lys Thr Phe Thr Gln Lys Ser Asn Leu1 5 10 15Gly Val His Gln Arg Thr His20<210>40<211>23<212>PRT<213>HOMO SAPIENS<400>40Tyr Glu Cys Val Gln Cys Gly Lys Gly Phe Thr Gln Ser Ser Asn Leu1 5 10 15Ile Thr His Gln Arg Val His20<210>41<211>23<212>PRT<213>HOMO SAPIENS<400>41Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu1 5 10 15Ile Arg His Gln Arg Thr His20<210>42<211>23<212>PRT<213>HOMO SAPIENS<400>42Tyr Glu Cys Gln Asp Cys Gly Arg Ala Phe Asn Gln Asn Ser Ser Leu1 5 10 15Gly Arg His Lys Arg Thr His20<210>43<211>23<212>PRT<213>HOMO SAPIENS<400>43
Tyr Glu Cys Asn Glu Cys Gly Lys Phe Phe Ser G1n Ser Ser Ser Leu1 5 10 15Ile Arg His Arg Arg Ser His20<210>44<211>23<212>PRT<213>HOMO SAPIENS<400>44Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Asn Gln Ser Ser Thr Leu1 5 10 15Thr Arg His Lys Ile Val His20<210>45<211>23<212>PRT<213>HOMO SAPIENS<400>45Tyr Glu Cys Asn Glu Cys Gly Lys Ala Phe Ala Gln Asn Ser Thr Leu1 5 10 15Arg Val His Gln Arg Ile His20<210>46<211>23<212>PRT<213>HOMO SAPIENS<400>46Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu1 5 10 15Thr Gln His Arg Arg Ile His20<210>47<211>23<212>PRT<213>HOMO SAPIENS<400>47Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu1 5 10 15Thr Arg His Arg Arg Ile His20
<210>48<211>23<212>PRT<213>HOMO SAPIENS<400>48His Lys Cys Leu Glu Cys Gly Lys Cys Phe Ser Gln Asn Thr His Leu1 5 10 15Thr Arg His Gln Arg Thr His20<210>49<211>25<212>PRT<213>HOMO SAPIENS<400>49Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Asn Arg His Lys Lys Arg His20 25<210>50<211>25<212>PRT<213>HOMO SAPIENS<400>50Tyr His Cys Asp Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Thr Arg His Tyr Arg Lys His20 25<210>51<211>25<212>PRT<213>HOMO SAPIENS<400>51Tyr Arg Cys Ser Trp Glu Gly Cys Glu Trp Arg Phe Ala Arg Ser Asp1 5 10 15Glu Leu Thr Arg His Phe Arg Lys His20 25<210>52<211>25<212>PRT
<213>HOMO SAPIENS<400>52Phe Ser Cys Ser Trp Lys Gly Cys Glu Arg Arg Phe Ala Arg Ser Asp1 5 10 15Glu Leu Ser Arg His Arg Arg Thr His20 25<210>53<211>25<212>PRT<213>HOMO SAPIENS<400>53Phe Ala Cys Ser Trp Gln Asp Cys Asn Lys Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Ala Arg His Tyr Arg Thr His20 25<210>54<211>25<212>PRT<213>HOMO SAPIENS<400>54Tyr His Cys Asn Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp1 5 10 15Glu Leu Thr Arg His Tyr Arg Lys His20 25<210>55<211>24<212>PRT<213>HOMO SAPIENS<400>55Phe Leu Cys Gln Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu1 5 10 15Thr Arg His Met Lys Lys Ser His20<210>56<211>23<212>PRT<213>HOMO SAPIENS<400>56Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu
1 5 10 15Lys Thr His Thr Arg Thr His20<210>57<211>23<212>PRT<213>HOMO SAPIENS<400>57Phe Ala Cys Glu Val Cys Gly Val Arg Phe Thr Arg Asn Asp Lys Leu1 5 10 15Lys Ile His Met Arg Lys His20<210>58<211>25<212>PRT<213>HOMO SAPIENS<400>58Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp1 5 10 15Lys Leu Asn Arg His Lys Lys Arg His20 25<210>59<211>23<212>PRT<213>HOMO SAPIENS<400>59Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu1 5 10 15Thr Arg His Gln Arg Ile His20<210>60<211>23<212>PRT<213>HOMO SAPIENS<400>60Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu1 5 10 15Ile Arg His Gln Arg Thr His20
<210>61<211>23<212>PRT<213>HOMO SAPIENS<400>61Tyr Leu Cys Ser Glu Cys Asp Lys Cys Phe Ser Arg Ser Thr Asn Leu1 5 10 15Ile Arg His Arg Arg Thr His20<210>62<211>23<212>PRT<213>HOMO SAPIENS<400>62Tyr Glu Cys Lys Glu Cys Gly Lys Ala Phe Ser Ser Gly Ser Asn Phe1 5 10 15Thr Arg His Gln Arg Ile His20<210>63<211>23<212>PRT<213>HOMO SAPIENS<400>63Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu1 5 10 15Asn Val His Arg Arg Ile His20<210>64<211>23<212>PRT<213>HOMO SAPIENS<400>64Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu1 5 10 15Arg Arg His Glu Thr Thr His20<210>65<211>23<212>PRT<213>HOMO SAPIENS
<400>65Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu1 5 10 15Ile Arg His Gln Arg Ile His20<210>66<211>23<212>PRT<213>HOMO SAPIENS<400>66Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu1 5 10 15Thr Arg His Lys Arg Ile His20<210>67<211>83<212>PRT<213>SYNTHETIC<400>67Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu1 5 10 15Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys20 25 30Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr35 40 45Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg50 55 60Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr65 70 75 80Gly Glu Lys<210>68<211>83<212>PRT<213>SYNTHETIC<400>68Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met20 25 30Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln35 40 45Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg50 55 60Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr65 70 75 80Gly Glu Lys<210>69<211>11<212>PRT<213>Synthetic<400>69Tyr Ala Arg Lys Ala Arg Arg Gln Ala Arg Arg1 5 10<210>70<211>11<212>PRT<213>Synthetic<400>70Tyr Ala Arg Ala Ala Arg Arg Ala Ala Arg Arg1 5 10<210>71<211>11<212>PRT<213>Synthetic<400>71Tyr Ala Arg Ala Ala Arg Arg Ala Ala Arg Ala1 5 10<210>72<211>11<212>PRT<213>Synthetic<400>72Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala1 5 10
权利要求
1.一种嵌合蛋白,其包括a)多个锌指结构域;及b)一个异源蛋白质转导结构域,其有效地将所述蛋白转移穿过细胞膜。
2.权利要求1的嵌合蛋白,其中所述蛋白质转导结构域位于所述多个锌指结构域的N末端或C末端。
3.权利要求1的嵌合蛋白,其中所述多个锌指结构域包括3-6个锌指结构域。
4.权利要求1的嵌合蛋白,其中所述嵌合蛋白特异性结合VEGF-A基因中的一个位点,并可以调节VEGF-A基因在细胞中的转录。
5.权利要求1的嵌合蛋白,其中所述嵌合蛋白特异性结合基因中的一个位点并可以调节该基因在细胞中的转录,该基因编码选自如下一组的蛋白质jun B原癌基因、蛋白激酶C、凝集素、脑特异性Na-依赖性无机磷酸盐协同转运蛋白、细胞视黄酸结合蛋白1、细胞视黄酸结合蛋白2、钙粘着蛋白13、H-钙粘着蛋白(心)、血管内皮生长因子(VEGF-A)、色素上皮衍生因子(PEDF)、分化相关基因-1(Drg-1)、转录因子E2F、早期生长应答-1(EGR-1)、蛋白质酪氨酸磷酸酶1B(PTP-1B)、A20、Fas、黑素瘤分化相关基因-7(MDA-7)、衰老蛋白-1(PS-1)、血管紧张素转化酶、血管生成素-2、b-分泌酶(BACE1)、mmp3、CHFR(checkpoint with forkhead associated and ringfinger)、过氧化物酶体增殖剂激活受体γ(PPAR-γ)、TNF-相关凋亡诱导配体(TRAIL)、Ku-80、共济失调毛细血管扩张突变(ATM)、BRCA、CC-趋化因子受体5(CCR5)、脑衍生神经营养因子(BDNF)、肿瘤坏死因子α诱导的蛋白质-3(TNFAIP3)(A20)、c-myc、缺氧诱导因子-1α(HIF-1α)、caspase-3、细胞间粘着分子I型(ICAM-1)、血管紧张素II受体1(AT-1R)、血小板衍生生长因子、胰岛素样生长因子-I和-II、神经生长因子、aFGF、bFGF、上皮生长因子、TGF-α、TGF-β、红细胞生成素、血小板生成素、粘蛋白、生长激素、胰岛素原、胰岛素A链、胰岛素B链、甲状旁腺素、促甲状腺素、甲状腺素、促卵泡激素、降钙素、因子VIII、造血生长因子、脑啡肽酶、Mullerian抑制物质、促性腺激素相关肽、组织因子蛋白、抑制素、活化素、干扰素-α、干扰素-β、干扰素-γ、M-CSF、GM-CSF、G-CSF、IL-1、IL-2、IL-3、IL-4、IL-12和IL-13。
6.权利要求1的嵌合蛋白,其中所述多个锌指结构域包括其DNA接触残基相应于表2一行中一组基序的DNA接触残基的结构域。
7.权利要求1的嵌合蛋白,其中所述多个锌指结构域包括其DNA接触残基相应于选自下组的一组基序的DNA接触残基的结构域mQSHR-mRDHT-mRSNR;mQSHT-mRSHR-mRDHT;mQSHR-mRDHT-mRSHR;mRSHR-mRDHT-mVSNV;mQSHV-mRDHR-mRDHT;mRDER-mQSSR-mQSHT-mRSNR;mDSAR-mRSNR-mRDHT-mVSSR;mQSHT-mDSAR-mRSNR-mRDHT;mRDHT-mVSNV-mQSHT-mDSAR;mRSHR-mDSCR-mQSHT-mDSCR;mQSNR-mQSHR-mRDHT-mRSNR;mCSNR-mRDHT-mRSNR-mRSHR;mRSHR-mQSHT-mRSHR-mRDER;mQSNR-mRSHR-mQSSR-mRSHR;mQSHT-mDSCR-mRDHT-mCSNR;mQSHT-mWSNR-mRSHR-mWSNR;及mVSNV-mRSHR-mRDER-mQSNV。
8.权利要求1的嵌合蛋白,其进一步包括核定位信号。
9.权利要求1的嵌合蛋白,其中所述多个锌指结构域的至少一个具有天然存在的锌指结构域的序列。
10.权利要求9的嵌合蛋白,其中所述多个锌指结构域的至少一个是人的。
11.权利要求1的嵌合蛋白,其中所述蛋白质转导结构域包括病毒序列或者人序列。
12.权利要求1的嵌合蛋白,其中所述蛋白质转导结构域包括HIV tat蛋白质转导结构域,HSV VP22蛋白质,或者触角足同源域。
13.权利要求12的嵌合蛋白,其中所述HIV tat蛋白质转导结构域包括氨基酸序列YGRKKRRQRRR(SEQ ID NO1)。
14.权利要求1的嵌合蛋白,其中所述蛋白质转导结构域包括修饰的或合成的蛋白质转导结构域。
15.权利要求1的嵌合蛋白,其中所述蛋白质转导结构域包括具有SEQ ID NO69-72任一个氨基酸序列的修饰的tat蛋白质转导结构域,由6-12个精氨酸残基组成的聚精氨酸寡肽,或者具有SEQ IDNO4的氨基酸序列的HN1合成肽。
16.权利要求1的嵌合蛋白,其中所述嵌合蛋白在与细胞膜接触后可调节细胞中的至少一个内源基因。
17.权利要求1的嵌合蛋白,其中所述嵌合蛋白可调节细胞中的至少一个内源基因、但少于细胞中的1%的基因的转录。
18.权利要求1的嵌合蛋白,其中所述嵌合蛋白可调节细胞中的至少一个内源基因、但少于细胞中的0.01%的基因的转录。
19.权利要求1的嵌合蛋白,其中所述嵌合蛋白在没有细胞透化剂时可从胞外环境转移进入哺乳动物细胞中。
20.权利要求1的嵌合蛋白,其中所述蛋白质转导结构域及多个锌指结构域是同一多肽链的成分。
21.权利要求1的嵌合蛋白,其进一步包括一个细胞靶向结构域。
22.权利要求21的嵌合蛋白,其中所述细胞靶向结构域包括免疫球蛋白可变结构域、生长因子、病毒蛋白的细胞结合结构域或者胞外蛋白的细胞结合结构域。
23.权利要求1的嵌合蛋白,其进一步包括细胞表面蛋白结合结构域。
24.权利要求1的嵌合蛋白,其进一步包括纯化柄。
25.权利要求24的嵌合蛋白,其中所述纯化柄包括一种可以螯合金属的氨基酸序列。
26.权利要求1的嵌合蛋白,其中所述多个锌指结构域的每一个均结合了一个锌原子。
27.权利要求1的嵌合蛋白,其进一步包括转录激活结构域。
28.权利要求27的嵌合蛋白,其中所述转录激活结构域包括p65或VP16激活结构域。
29.权利要求1的嵌合蛋白,其进一步包括转录阻抑结构域。
30.权利要求29的嵌合蛋白,其中所述转录阻抑结构域包括Kid或KOX阻抑结构域。
31.权利要求1的嵌合蛋白,其中所述蛋白质在一种分析中可以被转导进至少50%的培养的人胚肾(HEK)293细胞中,在该分析中,所述细胞密度是3×105细胞/ml,所述蛋白质以100μg/ml的浓度存在于胞外培养基中。
32.权利要求1的嵌合蛋白,其中所述嵌合蛋白在人组织培养细胞中可稳定至少0.5小时。
33.一种药物组合物,其包括权利要求1的嵌合蛋白;一种药物可接受的载体。
34.权利要求33的组合物,其进一步包括一种还原剂,所述还原剂的量可有效降低所述蛋白的锌指结构域的半胱氨酸残基之间形成二硫键。
35.权利要求34的组合物,其中所述还原剂包括谷胱甘肽或DTT。
36.权利要求34的组合物,其中当所述组合物与细胞培养基组合时,所述蛋白在细胞培养基中可稳定至少12小时。
37.权利要求34的组合物,其进一步包括大约1μM-500μM的氯化锌。
38.权利要求33的组合物,其用于治疗患有或疑似患有致瘤性疾患、炎症疾患或者基于血管发生的疾患的对象,且所述嵌合蛋白进一步包括一个效应子结构域,由此所述嵌合蛋白调节所述对象细胞中VEGF-A的转录。
39.一种包括编码一种多肽的编码序列的核酸,所述多肽包括a)锌指结构域,及b)位于所述锌指结构域N末端的异源蛋白质转导结构域。
40.一种改变对象细胞中基因表达的方法,所述方法包括给予对象一种嵌合的DNA结合蛋白,其包括多个锌指结构域和一个异源蛋白质转导结构域,所述DNA结合蛋白能调节对象细胞中内源基因的转录。
41.权利要求40的方法,其中所述嵌合蛋白以第一次剂量给予,所述方法进一步包括给予对象第二次剂量的所述嵌合蛋白。
42.权利要求41的方法,其中第一次和第二次剂量间隔至少大约48小时。
43.权利要求41的方法,其中第一次剂量比第二次剂量至少低25%。
44.权利要求40的方法,其中所述内源基因是VEGF-A。
45.权利要求44的方法,其中对象患有或疑似患有致瘤性疾患、炎症疾患或者基于血管发生的疾患,且所述DNA结合蛋白进一步包括一个效应子结构域,由此所述DNA结合蛋白调节对象细胞中的VEGF-A的转录。
46.一种改变真核培养细胞中基因表达的方法,所述方法包括将所述细胞与一定剂量的嵌合DNA结合蛋白接触,所述嵌合蛋白包括多个锌指结构域和一个蛋白质转导结构域,所述蛋白能调节细胞中内源基因的转录,其中所述剂量有效调节内源基因的转录达至少48小时。
47.权利要求46的方法,其进一步包括在接触后至少48小时,将细胞与第二次剂量的DNA结合蛋白接触。
48.权利要求46的方法,其中所述内源基因是VEGF-A。
49.一种含有外源多肽但不含有编码所述外源多肽的核酸的真核细胞,其中所述外源多肽包括多个锌指结构域和一个蛋白质转导结构域,所述蛋白质转导结构域对于所述DNA结合结构域而言是异源的,所述外源多肽在外源多肽导入细胞后具有调节细胞中选定的一亚组内源基因的转录的功能达至少12小时。
50.权利要求49的真核细胞,其中所述多个锌指结构域包括天然存在的锌指结构域。
51.权利要求49的真核细胞,其中所述多个锌指结构域包括人锌指结构域。
52.权利要求49的真核细胞,其中外源多肽在细胞中保持功能至少48小时。
53.一种制备可转导的DNA结合多肽的方法,所述方法包括提供含有一种核酸的宿主细胞,所述核酸包括1)编码一种多肽的编码序列,所述多肽包括a)锌指结构域;及b)异源蛋白质转导结构域;及2)与所述编码序列可操纵地连接的启动子;在合成所述多肽的条件下在宿主细胞中表达所述核酸;及从宿主细胞或从宿主细胞周围的培养基中分离所述多肽。
54.权利要求53的方法,其中所述分离包括纯化内含体。
55.权利要求53的方法,其中所述分离包括亲和层析和离子交换层析。
56.权利要求53的方法,其进一步包括将所述分离的多肽与一种药物可接受的载体组合,从而制备药物组合物。
57.一种改变真核细胞中基因表达的方法,所述方法包括将真核细胞与一种嵌合的DNA结合蛋白接触,所述嵌合蛋白包括多个锌指结构域和一个蛋白质转导结构域,所述蛋白能调节细胞中内源基因的转录。
58.权利要求57的方法,其中所述真核细胞是哺乳动物细胞。
59.权利要求57的方法,其中所述真核细胞是人细胞。
60.权利要求57的方法,其中所述细胞是培养的细胞。
61.权利要求57的方法,其中所述细胞得自对象或在对象体内。
62.权利要求61的方法,其中所述对象是人。
63.权利要求57的方法,其中所述嵌合的DNA结合蛋白包括多个锌指结构域。
64.权利要求57的方法,其中所述蛋白质转导结构域包括病毒序列或人序列。
65.权利要求64的方法,其中所述蛋白质转导结构域包括HIV tat蛋白质转导结构域、HSV VP22蛋白或触角足同源域。
66.权利要求65的方法,其中所述HIV tat蛋白质转导结构域包括氨基酸序列YGRKKRRQRRR(SEQ ID NO1)。
67.权利要求57的方法,其中所述蛋白质转导结构域包括修饰的或合成的蛋白质转导结构域。
68.权利要求57的方法,其中所述蛋白质转导结构域包括具有SEQ ID NO69-72任一氨基酸序列的修饰的tat蛋白质转导结构域,由6-12个精氨酸残基组成的聚精氨酸寡肽,或者具有SEQ ID NO4氨基酸序列的HN1合成肽。
69.权利要求57的方法,其中所述蛋白质转导结构域和所述多个锌指结构域是同一多肽链的成分。
70.权利要求57的方法,其中所述嵌合的DNA结合蛋白进一步包括细胞靶向结构域。
71.权利要求70的方法,其中所述细胞靶向结构域包括免疫球蛋白可变结构域、生长因子、病毒蛋白的细胞结合结构域或者胞外蛋白的细胞结合结构域。
72.权利要求57的方法,其中所述内源基因是编码选自如下一组的蛋白质的基因jun B原癌基因、蛋白激酶C、凝集素、脑特异性Na-依赖性无机磷酸盐协同转运蛋白、细胞视黄酸结合蛋白1、细胞视黄酸结合蛋白2、钙粘着蛋白13、H-钙粘着蛋白(心)、血管内皮生长因子(VEGF-A)、色素上皮衍生因子(PEDF)、分化相关基因-1(Drg-1)、转录因子E2F、早期生长应答-1(EGR-1)、蛋白质酪氨酸磷酸酶1B(PTP-1B)、A20、Fas、黑素瘤分化相关基因-7(MDA-7)、衰老蛋白-1(PS-1)、血管紧张素转化酶、血管生成素-2、b-分泌酶(BACE1)、mmp3、CHFR、过氧化物酶体增殖剂激活受体γ(PPAR-γ)、TNF-相关凋亡诱导配体(TRAIL)、Ku-80、共济失调毛细血管扩张突变(ATM)、BRCA、CC-趋化因子受体5(CCR5)、脑衍生神经营养因子(BDNF)、肿瘤坏死因子α诱导的蛋白质-3(TNFAIP3)(A20)、c-myc、缺氧诱导因子-1α(HIF-1α)、caspase-3、细胞间粘着分子I型(ICAM-1)、血管紧张素II受体1(AT-1R)、血小板衍生生长因子、胰岛素样生长因子-I和-II、神经生长因子、aFGF、bFGF、上皮生长因子、TGF-α、TGF-β、红细胞生成素、血小板生成素、粘蛋白、生长激素、胰岛素原、胰岛素A链、胰岛素B链、甲状旁腺素、促甲状腺素、甲状腺素、促卵泡激素、降钙素、因子VIII、造血生长因子、脑啡肽酶、Mullerian抑制物质、促性腺激素相关肽、组织因子蛋白、抑制素、活化素、干扰素-α、干扰素-β、干扰素-γ、M-CSF、GM-CSF、G-CSF、IL-1、IL-2、IL-3、IL-4、IL-12和IL-13。
73.权利要求57的方法,其中所述嵌合的DNA结合蛋白特异性结合转录起始位点的1000、500、300或100个碱基对内的位点。
74.权利要求57的方法,其中所述嵌合的DNA结合蛋白特异性结合TATA盒的1000、500、300或100个碱基对内的一个位点。
75.权利要求57的方法,其中所述嵌合的DNA结合蛋白特异性结合位于内源基因的调节区域中与天然存在的转录因子结合的位点20个碱基对内的一个位点或者特异性结合内源基因的调节区域中与天然存在的转录因子结合的位点重叠的一个位点。
76.权利要求57的方法,其中所述嵌合的DNA结合蛋白增加内源基因的表达。
77.权利要求57的方法,其中所述嵌合的DNA结合蛋白降低内源基因的表达。
78.权利要求57的方法,其中所述细胞是致瘤性细胞。
79.包括一种核酸的宿主细胞,所述核酸包括一个编码序列和一个与所述编码序列可操纵地连接的启动子,其中所述编码序列编码包括一个信号序列、多个锌指结构域和一个蛋白质转导结构域的一种多肽。
80.一种改变内源基因表达的方法,所述方法包括将包括一个编码序列和一个与所述编码序列可操纵地连接的启动子的核酸导入一或多个细胞中,其中所述编码序列编码一种嵌合蛋白,所述嵌合蛋白包括一个信号序列、多个锌指结构域和一个蛋白质转导结构域,由此所述细胞表达所述核酸并产生和分泌所述嵌合蛋白,从而所述嵌合蛋白可进入其它细胞中并调节这些细胞中内源基因的表达。
81.权利要求80的方法,其中被导入所述核酸的细胞在对象体内。
全文摘要
本发明揭示了一种嵌合蛋白,其包括a)多个锌指结构域;及b)一个异源蛋白质转导结构域,有效地将所述蛋白质转移穿过细胞膜。所述嵌合蛋白可被有效地转导进培养的真核细胞中,在其中调节特异性靶基因。因此,人工转录因子包括PTD可用于产生调节内源基因的蛋白质药物及改变细胞在体外和体内行为的蛋白质药物。
文档编号C07K14/435GK1836048SQ200480022922
公开日2006年9月20日 申请日期2004年6月10日 优先权日2003年6月10日
发明者金晋秀, 申铉哲, 权兴善 申请人:图尔金株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1