用于gnn的锌指结合结构域的制作方法

文档序号：1115473阅读：854来源：国知局

专利名称：用于gnn的锌指结合结构域的制作方法
技术领域：
本发明领域为结合靶核苷酸的锌指蛋白。更具体地说，本发明涉及特异性结合式5’-(GNN)-3’靶核苷酸的锌指α螺旋域中的氨基酸残基序列。
背景技术：
1967年确立了控制基因表达的主要机制涉及以序列特异性方式结合DNA的蛋白质开关模式(Ptashne，M.(1967)Nature(London)214，323-4)。已描述了各种结构家族的DNA结合蛋白。尽管存在大量的结构多样性，但是在真核生物中Cys2-His2锌指基元是最常用的核酸结合基元。在酵母和人类均观测到这样的相同结果。最早在DNA和RNA结合转录因子TFIIIA中鉴定了Cys2-His2锌指基元(Miller，J.，McLachlan，A.D.& Klug，A.(1985)Embo J 4，1609-14)，它可能是构建序列特异性蛋白的理想结构支架。一个锌指域包括约30个氨基酸，它具有由疏水性相互作用和一个锌离子的螯合作用稳定的简单ββα折叠(Miller，J.，McLachlan，A.D.& Klug，A.(1985)Embo J 4，1609-14，Lee，M.S.，Gippert，G.P.，Soman，K.V.，Case，D.A.& Wright，P.E.(1989)Science245，635-7)。锌指域α螺旋插入(presentation)DNA大沟使得允许发生序列特异性的碱基接触。每个锌指域通常识别DNA的三个碱基对(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180，Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.&Berg，J.M.(1996)Natrue Structural Biology 3，940-945)，虽然螺旋插入变化使得可以识别更长的位点(Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.(1993)Nature(London)366，483-7，Wuttke，D.S.，Foster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol.Biol.273，183-206)。大多数转录因子依赖于蛋白域的二聚作用以增加对更长DNA序列或位置(address)的蛋白-DNA接触，与此不同，锌指域的简单共价串联重复使得该基元可以识别更长的非对称性DNA序列。
我们最近描述了含有6个锌指结构域而且结合18个碱基对连续DNA序列的多指锌指蛋白(Liu，Q.，Segal，D.J.，Ghiara，J.B.& BarbasIII，C.F.(1997)PNAS 94，5525-5530)。识别18bps DNA足以描述所有已知基因组中的独特DNA位置(address)，这种独特的DNA位置是使用多指蛋白作高度特异性基因开关的要求。实际上在模型系统中采用这些多指蛋白已经证实对基因激活和抑制的控制(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)PNAS 94，5525-5530)。
因为每个锌指结构域通常结合3个碱基对序列，所以一个完整识别表(alphabet)需要特征鉴定64个结构域。可指导构建这些结构域的现存资料得自以下3种类型的研究结构测定(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180，Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)NatureStructural Biology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.(1993)Nature(London)366，483-7.，11，Wuttke，D.S.，Foster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol.Biol.273，183-206.，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.& Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943，Narayan，V.A.，Kriwacki，R.W.&Caradonna，J.P.(1997)J.Biol.Chem.272，7801-7809)、定点诱变(Isalan，M.，Choo，Y.& Klug，A.(1997)Proc.Natl.Acad.Sci U.S.A.94，5617-5621，Nardelli，J.，Gibson，T.J.，Vesque，C.& Chamay，P.(1991)Nature349，175-178，Nardelli，J.，Gibson，T.& Charnay，P.(1992)Nucleic AcidsRes.20，4137-44，Taylor，W.E.，Suruki，H.K.，Lin，A.H.T.，Naraghi-Arani，P.，Igarashi，R.Y.，Younessian，M.，Katkus，P.& Vo，N.V.(1995)Biochemistry 34，3222-3230，Desjarlais，J.R.& Berg，J.M.(1992)ProteinsStruct.，Funct.，Genet.12，101-4，Desjarlais，J.R.& Berg，J.M.(1992)Proc Natl Acad Sci USA 89，7345-9)以及噬菌体展示选择(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Wahington，D.C.)275，657-661.23，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。所有这些研究明显有助于我们了解锌指/DNA识别，但是每一种研究均有其局限性。结构研究鉴定了各种各样的蛋白/DNA相互作用，但是还不能解释是否其它相互作用可能更好。此外，尽管观测到允许序列特异性识别的相互作用，但是关于其它序列如何排除在识别之外知之甚少。对现有蛋白的诱变已经部分阐明了这些问题，但是所述资料总是受限于可特征鉴定的突变体数目。随机文库的噬菌体展示以及选择克服了一定的突变体数量限制，但是提供确保特异性和亲和性均驱动选择的合适选择压力是困难的。几个实验室的实验研究(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，1113-7，Greisman，H.A.&Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695.25，Jamieson，A.C.，Wang，H.& Kim，S.-H(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33)，包括我们自己的实验(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)证实可以设计或选择该识别表的几种成员。然而，在这些早期研究中几乎没有以严格而系统的方式研究这些结构域与其靶DNA的特异性和亲和性。
自从Jacob和Monod研究了阻抑物的化学性质，而且提出用其可以刺激或抑制细胞内各种蛋白的合成的方案，具体的实验性控制基因表达成为一个令人感兴趣的课题(Jacob，F.& Monod，J.(1961)J.Mol.Biol.3，318-356)。目前已经确证，主要通过称为转录因子的蛋白作用在转录水平调节基因组，转录因子以序列特异性方式结合DNA。通常这些蛋白因子以复杂的联合方式起作用，使得可以对基因表达进行时序控制、空间控制以及环境应答性控制(Ptashne，M.(1997)NatureMedicine 3，1069-1072)。转录因子常常既通过将蛋白定位到基因组特定位点的DNA结合域发挥作用，又通过在所述位点或其附近刺激(激活)或抑制转录的辅助效应结构域发挥作用(Cowell，I.G.(1994)TrendsBiochem.Sci.19，38-42)。效应结构域如激活域VP16(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)和阻抑结构域KRAB(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-4513)通常是模块式的，而且当它们与其它DNA结合蛋白融合时仍然保持其活性。鉴于通过将转录因子导向基因组的特定位点可容易地控制基因，所以设计适合结合任何特定序列的DNA结合蛋白成为使人畏惧的挑战。
本发明公开内容基于对Cys2-His2类结合核酸锌指蛋白的独特结构特征的认识。Cys2-His2锌指结构域由约30个氨基酸长度的简单ββα折叠组成。通过疏水性相互作用以及保守的Cys2-His2残基对一个锌离子的螯合作用获得该折叠的线构稳定性(Lee，M.S.，Gippert，G.P.，Soman，K.V.，Case，D.A.& Wright，P.E.(1989)Science 245，635-637)。通过源自所述结构域的α螺旋的特定氨基酸侧链的接触达到识别核酸，所述接触通常结合3个碱基对的DNA序列(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure 4，1171-1180)。与其它核酸识别基元不同，多锌指结构域的简单共价键连接使得可以识别更长的非对称DNA序列。对天然锌指蛋白的研究表明，3个锌指结构域可结合9bp连续DNA序列(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17.，Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。尽管识别9bp序列不足以指定(specify)甚至大肠杆菌这样的小基因组内的独特位点，但是含有6个锌指结构域的多指蛋白可指定对18-bp的识别(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。就开发基因控制通用系统而言，18-bp位置足以指定在所有已知基因组中的单一位点。尽管本质上还不了解这类多指蛋白，但是最近已经证实其在活的人体细胞中的基因活化和抑制中的效能(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。
发明概述一方面，本发明提供分离纯化的锌指-核苷酸的结合多肽，它包括SEQ ID NO1-16中任一种的氨基酸残基序列。在一个相关方面，本发明进一步提供含有2至约12个这种锌指-核苷酸结合多肽的组合物。所述组合物优选包含2至约6个多肽。在一个优选的实施方案中，所述锌指-核苷酸结合多肽最好通过具有SEQ ID NO 111序列的氨基酸残基接头有效连接。本发明组合物特异性结合含有序列5’-(GNN)n-3’的核苷酸靶，其中在所有N不能是C的条件下每个N均为A、C、G或T，而且n优选为2-6。多肽或组合物可进一步有效链接一种或多种转录调节因子例如转录激活剂或转录抑制剂或阻抑物。本发明还提供分离纯化的编码本发明多肽或组合物的多核苷酸以及含有所述多核苷酸的表达载体。
再一方面，本发明提供调节核苷酸序列功能的方法，所述核苷酸序列含有序列5’-(GNN)n-3’，其中n为1-6的整数，所述方法包括所述核苷酸序列暴露于有效量的本发明组合物，该组合物与一种或多种转录调节因子有效连接。5’-(GNN)n-3’序列可见于所述核苷酸的转录区或启动子区或见于表达的序列标记。
本发明公开的内容证实简单有效的快速产生基因开关的通用策略。构建并特征鉴定特异性识别新的9-bp序列或者18-bp(首次)序列的多指蛋白，该多指蛋白含有一系列识别64成员锌指表的5’-(GNN)n-3’亚组序列的已知锌指结构域。制备并证实有效的转录因子既控制基因活化又控制基因抑制。采用单纯疱疹病毒VP16活化域(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)和其基本活化域的重组四聚体重复实现基因活化。采用以下3个人源效应子域可实现基因阻抑或沉默krüppel结合盒(KRAB)(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-4513)、ERF阻抑结构域(ERD)(Sgouras，D.N.，Athanasiou，M.A.，Beal，G.J.，Jr.，Fisher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)和mSIN3相互作用结构域(SID)(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.& Eisenman，R.N.(1996)Mol.Cell.Biol.16，5772-5781)。在人上皮细胞中利用荧光素酶报道基因测定，数据表明设计用于靶向原癌基因erbB-2/HER-2的启动子的人工转录调节剂可以特异性方式消除或激活基因表达。通过对基因转录物的寻靶首次实现基因活化或抑制，说明从表达的序列标记(EST)获得的信息足以构建基因开关。本文所述的新方法和材料有希望在基因治疗、转基因生物、功能基因组学(functional genomics)以及细胞生物学和分子生物学的其它领域具有各种用途。
附图简述在构成本说明书的一部分的附图中，

图1(以6个为一组显示)显示本发明锌指-核苷酸结合多肽各区的结合特异性。
发明详述I.发明本发明提供锌指-核苷酸结合多肽、含有一种或多种这种多肽的组合物以及应用这种多肽和组合物调节基因表达。
II.化合物本发明化合物是分离的锌指-核苷酸结合多肽，该多肽结合GNN核苷酸序列并调节所述核苷酸序列的功能。所述多肽可增强或抑制基因转录并可结合到DNA或RNA。锌指-核苷酸结合多肽是指衍生形式的野生型锌指蛋白多肽或重组产生的锌指蛋白多肽。多肽可以是一种杂种多肽，例如它含有一种蛋白的锌指结构域和与其连接的第二种蛋白的锌指结构域。所述结构域可以是野生型或突变型结构域。多肽包括截短形式的野生型锌指蛋白。可由其产生多肽的锌指蛋白实例包括TFIIIA和zif268。
本发明锌指-核苷酸结合多肽在所述多肽的α螺旋结构域中含有一个独特的七聚体(7个氨基酸残基的连续序列)，该七聚体序列决定与靶核苷酸的结合特异性。该七聚体序列可位于α螺旋结构域的任何位置，但是按本领域常规残基编码所述七聚体优选从位置-1延伸至位置6。本发明多肽可包括本领域已知的任何β折叠和构架序列以构成锌指蛋白的一部分。制备了许多锌指-核苷酸结合多肽并测试了它们对含有GNN三联体的靶核苷酸的结合特异性。研究结果总结于图1。在图1中，右侧栏表示每种肽的GNN三联体结合特异性，最高的特异性列于第一个并以粗体表示。在图1中，括号内表示SEQ ID NO。对于每种具体GNN(例如示于图1右侧栏的GAA)靶，所述序列按与所述三联体的特异性降低的顺序排列。
如图1所示，所述数据表明，实际上在特定靶的所有克隆中观测到明显保守的全部3个主要DNA接触位置(-1，3和6)。尽管以前选择小得多的全文库后在这些位置上观测到其中许多残基，但是本文所观测到保守程度明显高于以前的研究(Choo，Y.& Klug，A.(1994)ProcNatl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Wahington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。本发明揭示，锌指结构域的-1、3和6的3个螺旋位置足以详细描述所述结构域的DNA结合特异性的现有技术的观点是不正确的。
已经证实噬菌体选择通常只在这些位置中的1个或2个位置显示共有选择。最大序列变异发生于位置1和5的残基，所述残基不会在Zif268/DNA结构中产生碱基接触，而且以前预期它们并不明显协助识别(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.&Pabo，C.O.(1996)Structure(London)4，1171-1180)。位置1和5的变异还预示着，其它位置的保守性是因为其与所述DNA的相互作用而不是简单地因为其它原因所引起的偶然性扩增单一克隆所致。还观测到位置2的保守性残基同一性。位置-2的保守作用多少有点人为原因；NNK文库的该残基恒定为丝氨酸。该残基在Zif268结构中与DNA主链接触。两个文库均在位置4含有恒定的亮氨酸，亮氨酸是稳定该结构域折叠的疏水核心中的一个重要残基。
给人们留下深刻印象的是，观测到保守氨基酸识别不同靶的相同的核苷酸。例如实际上总是选择位置3的Asn(Asn3)识别中间位置的腺嘌呤，无论是在GAG、GAA、GAT还是在GAC的序列中。无论邻近位置如何，总是分别选择Gln-1和Arg-1识别3’位置的腺嘌呤或鸟嘌呤。大量结构研究文献证明Gln或Asn是以酰胺侧链为基础识别腺嘌呤，同样识别鸟嘌呤的Arg胍侧链接触3’或5’鸟嘌呤(Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)Nature Structural Biology 3，940-945.，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.&Rhodes，D.(1993)Nature(London)366，483-7)。然而更常见的是，选择2个或3个氨基酸识别核苷酸。选择His3或Lys3(在较低程度上为Gly3)识别中间的鸟嘌呤。选择Ser3和Ala3识别中间的胸腺嘧啶。选择Thr3、Asp3和Glu3识别中间的胞嘧啶。在位置-1选择Asp和Glu识别3’胞嘧啶，而选择Thr-1和Ser-1识别3’胸腺嘧啶。
将选定的Zif268变异体亚克隆入细菌表达载体，而且过量表达所述蛋白(锌指-2蛋白，此后用淘选它们的亚位点表示)。重要的是研究可溶性蛋白而不是噬菌体融合蛋白，因为已知这两种蛋白在其结合特性方面可能明显不同(Crameri，A.，Cwirla，S.& Stemmer，W.P.(1996)Nat.Med.2，100-102)。使用多靶ELISA测定方法测试所述蛋白识别16个5’-GNN-3’锌指-2亚位点中每一个的能力。该测定法提供极其严格的特异性测试，因为总是存在6个“非特异性”位点，它们只是由于9核苷酸靶中的一个核苷酸而不同于所述“特异性”位点。许多噬菌体选择的锌指-2蛋白具有高度特异性，而其它蛋白显示不同程度的交叉反应性。某些多肽实际上与亚位点结合更佳，而不是选定的位点。
试图利用定点诱变修饰识别螺旋以提高结合特异性。用我们的选择数据和结构资料指导突变设计。作为迄今进行的最全面的研究，对100多个突变蛋白进行了特征鉴定，试图努力增强我们对DNA识别规律的认识。尽管预测螺旋位置1和5在DNA识别中不起直接作用，但是最好的特异性改善总是涉及这些位置的修饰。观测到这些残基与磷酸主链接触，以非序列特异性方式产生结合。去除非特异性接触提高特异性接触对所述复合物总体稳定性的重要性，由此增强特异性。例如，用较小的不带电荷残基取代位置1和5的非典型电荷残基就可提高多肽与靶三联体GAC、GAA和GAG的特异性。
另一类修饰涉及同时改变结合残基和非结合残基。通过修饰His3Lys和Thr5Val消除多肽与GGG和锌指-2亚位点GAG的交叉反应性。值得注意的是，淘选期间一致选择His3识别中间的鸟嘌呤，即使Lys3更好地区别A和G。提示该蛋白的淘选条件可能通过参数如亲和力较通过特异性选择更佳。在Zif68结构中，His3与中间鸟嘌呤的N7产生一个氢键(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180)。也可以与腺嘌呤的N7产生此氢键，而且实际上Zif268不能区别该位置的G和A(Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。在靶向GGA，GGC和GGT的多肽中，发现His3只指定中间的鸟嘌呤，虽然淘选GGC和GGT时选择Lys3。同样，通过修饰Lys1Ser和Ser3Glu降低靶向GTG的多肽的多重交叉反应性，使亲和力降低5倍。已经在Zif268的结合位点选择研究中证实，Glu3与胞嘧啶的特异性非常高(Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。没有结构研究表明Glu3与中间胸腺嘧啶相互作用，在我们的研究或任何其它研究中从未选择Glu3识别中间的胸腺嘧啶(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。尽管如此，Ser3Glu修饰有利于识别中间胸腺嘧啶而不是胞嘧啶。这些实例说明了依赖以前的结构和选择数据了解构成特异性的基础的结构因素的局限性。还应该强调的是，不能通过现有的“识别密码”预测涉及位置1和5的修饰性改进(Desjarlais，J.R.& Berg，J.M.(1992)ProcNatl Acad Sci USA 89，7345-9.Suzuki，M.，Gerstein，M.& Yagi，N.(1994)Nucleic Acids Res.22，3397-405，Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.U.S.A.91，11168-72，Choo，Y.& Klug，A.(1997)Curr.Opin.Struct.Biol.7，117-125)，所述“识别密码”通常只考虑位置-1、2、3和6。只有通过联合选择和定点诱变，我们才能开始充分了解锌指/DNA识别的复杂性。
从选择和诱变组合的资料来看，对多数核苷酸的特异性识别最好利用基元而不是一个氨基酸完成。例如联合采用Arg-1、Ser1和Asp2(RSD基元)可实现对3’鸟嘌呤的最佳指定。通过利用Val5和Arg6指定5’鸟嘌呤，可用仅在3位残基不同(Lys3与GGG、Asn3与GAG、Glu3与GTG以及Asp3与GGG)的通用螺旋结构(SRSD-X-LVR)实现对亚位点GGG、GAG、GTG和GCG的识别。同样，用最终克隆的Thr-1、Ser1和Gly2(TSG基元)指定3’胸腺嘧啶。此外，可用Asp-1、Pro1和Gly2(DPG基元)指定3’胞嘧啶，除亚位点为GCC外；该亚位点不能接受Pro1。在2个克隆中用Gln-1、Ser1、Ser2(QSS基元)指定3’腺嘌呤。研究所述基元位置1和2的残基与各3’碱基的关系，如本文所述发现它们对特定3’碱基提供最佳特异性。
多靶ELISA测定法假定，所有蛋白优选5’位置的鸟嘌呤，因为所有蛋白含有Arg6，而且由结构研究已知该残基接触该位置的鸟嘌呤(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，NekludoVa，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180，Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.&Berg，J.M.(1996)Nature Structural Biology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc NatlAcad Sci USA 93，13577-82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.(1993)Nature(London)366，483-7，Wuttke，DS.，Foster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol.Biol.273，183-206，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.&Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943)。本文利用5’结合位点特征测定证实该相互作用((Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.U.S.A.91，11168-72)；图2，白色条框)。将每种蛋白用于16种寡核苷酸靶的合并物，其中锌指-2亚位点的5’核苷酸固定为G、A、T或C，中间核苷酸和3’核苷酸是随机的。所有蛋白优选GNN合并物，基本上无交叉反应。
纯化蛋白的亲和力研究证实多靶ELISA测定的结果。如果交叉反应性在ELISA测定中最小，则单个核苷酸错配通常导致亲和力降低100倍以上。还需要用锌指蛋白证实特异性的此程度。一般来说，选择或设计结合中间位置和3’位置含有G或A的亚位点的蛋白的亲和力最高，其次为结合在中间位置或3’位置只有一个G或A的亚位点的蛋白，再次为结合仅含有T或C的亚位点的蛋白。前面一组与其靶的亲和力较Zif268高(10nM)，后一组与其靶的亲和力多少有点降低，而且几乎所有蛋白的亲和力低于亲代C7蛋白的亲和力。结合亲和力和结合特异性并没有相关性，说明特异性不仅源自特异性蛋白-DNA接触，而且源自仅包括正确核苷酸的相互作用。
在靶亚位点为GNG的所有蛋白中，Asp2总是与Arg-1共选择。现在应该知道的是，对此存在2个原因。根据对Zif268的结构研究(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180)，已知锌指2的Asp2与Arg-1产生一对支柱性氢键以及一定的水性接触，所述氢键稳定Arg-1/3’鸟嘌呤相互作用。然而，Asp2的羧酸盐还与胞嘧啶的N4产生一个氢键，所述胞嘧啶与锌指-1亚位点的5’鸟嘌呤进行碱基配对。与该位置的T配对的腺嘌呤碱基可产生针对胞嘧啶观测到的类似接触。这种相互作用特别重要，因为它使锌指2的识别亚位点从3个核苷酸(GNG)扩展为4个核苷酸(GNG(G/T))(Isalan，M.，Choo，Y.& Klug，A(1997)Proc.Natl.Acad.Sci.U.S.A.94，5617-5621.，Jamieson，A.C.，Wang，H.&Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo Y.(1998)Biochemistry 37，12026-33)。这种现象称为“靶位点重叠”，而且具有3个重要结果。首先，因为我们的锌指-1亚位点含有5’鸟嘌呤，所以当锌指-2亚位点为GNG时，选择我们的文库优选Asp2。第二，它可限制在该研究中使用的文库用于对GNN或TNN锌指-2亚位点的选择，因为这些文库的指3含有一个Asp2，它可帮助指定锌指-2 5’核苷酸为G或T。在指2含有Thr6的Zif268和C7中，指3的Asp2增强识别5’位置(T/G)GG的对G或T的识别。这种相互作用还可以解释为什么以前的噬菌体展示研究(都使用基于Zif268的文库)发现选择主要限于GNN识别(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA91，11163-7.，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H & Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33，Wu，H.，Yang，W.-P & Barbas III，C.F.(1995)PNAS 92，344-348)。
最后，靶位点重叠潜在地限制这些锌指用作模块构件(modularbuilding blocks)。由结构资料已知，存在其中靶位点重叠非常广泛的某些锌指，例如GLI和YY1中的锌指以及类似于Zif268而且仅具有中度重叠的其它锌指。在我们的最后一组蛋白中，结合GGG、GAG、GTG和GCG的多肽中发现Asp2。见于位置2的其它残基的重叠潜力大部分是未知的，然而结构研究提示，见于该位置的其它许多残基可能参与这样的亚位点交叉的接触。含有Asp2的指可能限制模块性，因为它们要求每个GNG亚位点后为T或G。
下表1总结了对GNN靶三联体16个实施方案具有最高选择性的序列(SEQ ID NO；1-16)。
表1

上表数据显示，锌指结构域能够以精确特异性识别所有可能的GNN三联体序列。优化的锌指结构域能够通过亲和力降低100倍以上区别单个碱基不同。尽管见于优化蛋白的关键接触位置-1、3和6的许多氨基酸是与简单识别密码一致的氨基酸，但是发现优化的特异性识别对这些残基的邻近位置残基敏感。发现位置1、2和5的残基对特异性识别是重要的。此外，所述数据首次证实，对3’碱基的高度特异性识别要求位置-1、1和2的序列基元而不是位置1残基的简单相同。这些残基可能为所述螺旋在识别特异性碱基和排除其它碱基方面的相互作用提供合适的立体化学环境，最终结果是高度特异性的相互作用。如果这些结构域在其与DNA和其它锌指结构域相互作用中是模块式的，则它们具有广泛的用途。利用靶位点重叠的可能限制作用可达到此目的，即应该靶向5’-(GNN)n-3’型序列。此外，所公开的结构域的现成重组可产生具有已知特异性的多指蛋白，而不需要在其制备中产生噬菌体展示文库。这些多指蛋白已用于激活和阻抑人erbB-2启动子在活细胞中驱动的转录。本文所述锌指结构域家族可能足以构建166或17×106种结合5’-(GNN)6-3’型DNA序列的新型蛋白。
通过截短或延长野生型锌指蛋白，或通过定点诱变作为野生型衍生多肽的变异体或组合上述程序以衍生或产生锌指-核苷酸结合多肽衍生物。术语“截短的”是指含有的锌指数少于天然锌指结合蛋白总锌指数的锌指-核苷酸结合多肽或缺失非需要序列的锌指-核苷酸结合多肽。例如天然TFIIIA含有9个锌指，截短的锌指-核苷酸结合蛋白TFIIIA可以为只有1-3个锌指的多肽。延长是指其上加有额外锌指模块的锌指多肽。例如TFIIIA可以通过添加3个锌指结构域扩展至12个指。此外，截短的锌指-核苷酸结合多肽可以含有一个以上的野生型多肽的锌指模块，因此产生“杂种”锌指-核苷酸结合多肽。
术语“诱变的”是指利用任何已知方法对编码所述蛋白的DNA进行的随机或定点诱变获得的锌指衍生的核苷酸结合多肽。例如可对TFIIIA进行诱变以取代一个或多个重复共有序列的非保守残基。也可以诱变截短的锌指-核苷酸结合蛋白。
可以按照本发明截短、延长和/或诱变以抑制含有锌指-核苷酸结合基元的核苷酸序列的功能的已知锌指-核苷酸结合多肽的实例包括TFIIIA和Zif268。其它锌指-核苷酸结合蛋白是本领域技术人员周知的。
可用本领域周知的各种标准技术制备本发明多肽(参见例如1995年1月18日提交的美国专利申请第08/676,318号，其全部内容通过引用结合到本文中)。在有利于富集序列特异性蛋白的条件下制备并选择锌指蛋白的噬菌体展示文库。识别许多序列的锌指结构域需要噬菌体选择资料和结构信息指导的定点诱变进行精确定位(refinement)。
鼠Cys2-His2锌指蛋白Zif268用于构建噬菌体展示文库(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。Zif268是在结构上最充分特征鉴定的锌指蛋白(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washinton，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180，Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。主要接触所述DNA的单链上的3个核苷酸的α螺旋N末端残基介导该蛋白3个锌指结构域中每个结构域的DNA识别。该3指蛋白的操纵基因结合位点(operator binding site)是5’-GCGTGGGCG-3’(下划线是指-2亚位点)。Zif268和其它相关锌指-DNA复合物的结构研究(Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)Nature StructuralBiology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.(1993)Nature(London)366，483-7，Wuttke，D.S.，Foster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol.Biol.273，183-206.，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.& Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943，Narayan，V.A.，Kriwacki，R.W.&Caradonna，J.P.(1997)J.Biol.Chem.272，7801-7809)表明，α螺旋3个主要位置-1、3和6的残基参与特异性碱基接触。通常α螺旋位置-1的残基接触所述指亚位点的3’碱基，而位置3和6的残基分别接触中间的碱基和5’碱基。
为了选择识别5’-GNN-3’亚组序列的一系列锌指结构域，以噬菌体展示载体pComb3H构建2个高度不同的锌指文库(Barbas III，C.F.，Kang，A.S.，Lerner，R.A.& Benkovic，S.J.(1991)Proc.Natl.Acad.Sci.USA 88，7978-7982.，Rader，C.& Barbas III，C.F.(1997)Curr.Opin.Biotechnol.8，503-508)。2个文库均涉及Zif268变异体C7指2的α螺旋中的残基随机化作用(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。用NNK掺杂策略通过随机化位置-1、1、2、3、5、6构建文库1，而采用随机化位置-2、-1、1、2、3、5、6的VNS掺杂策略构建文库2。NNK掺杂策略允许所有氨基酸组合在32个密码子中，而VNS策略在其24个密码子组中排除了Tyr、Phe、Cys和所有终止密码子。所述文库分别包括4.4×109和3.5×109成员，每个文库均能识别5’-GCGNNNGCG-3’型序列。NNK文库的大小保证它能够以99％置信度进行研究，而VNS文库高度多样性，但是多少有点不完整。然而这些文库明显大于以前报道的锌指文库(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33)。用溶液结合方案以16个5’-GCGGNNGCG-3’生物素化发夹DNA靶对锌指展示-噬菌体进行7轮选择。通过加入竞争DNA增加每轮的严格性。提供剪切的鲱鱼精子DNA，以对与DNA非特异性结合的噬菌体进行选择。通过提供5’-GCGNNNGCG-3’型DNA作特异性竞争物获得序列特异性的严格选择压力。加入过量的5’-GCGGNNGCG-3’型DNA以对一个或两个碱基改变的DNA的结合提供更严格的选择，与生物素化靶相比。用链霉抗生物素蛋白包被珠回收结合单个生物素化DNA靶序列的噬菌体。在某些情况下重复所述选择过程。本发明资料表明，这些结构域是功能模块，而且可与另一个模块重组产生多指蛋白，所述多指蛋白能够能够以亚纳摩尔亲和力结合18-bp序列。本文所述锌指结构域家族足以构建17×106结合5’-(GNN)6-3’DNA序列家族的新型蛋白。
本发明包括编码锌指-核苷酸结合多肽的核苷酸序列。可以通过几种方法获得编码本发明锌指-核苷酸结合多肽(包括天然、截短和延长的多肽)的DNA序列。例如可用本领域周知的杂交方法分离所述DNA。所述方法包括但不限于(1)用探针与基因组文库或cDNA文库杂交，检测共有的核苷酸序列；(2)用抗体筛选表达文库，检测共同结构特征；和(3)用聚合酶链反应(PCR)合成。可用本领域已知的方法获得本发明的RNA序列(参见例如Current Protocols in MolecularBiology，Ausubel等编辑，1989)。
用以下方法可获得编码本发明的锌指-核苷酸结合多肽的特异性DNA序列(1)从基因组DNA分离双链DNA序列；(2)化学制备提供目的多肽必需密码子的DNA序列；和(3)通过对分离自真核供体细胞的mRNA进行逆转录，体外合成双链DNA序列。在后一种情况下，最后制得mRNA的双链DNA互补物，一般称为cDNA。在制备用于重组方法的特异性DNA序列的这3种方法中，最少用分离基因组DNA。当因为存在内含子最好是微生物表达哺乳动物多肽时，尤其如此。
为了获得锌指衍生-DNA结合多肽，当已知目的多肽产物的完整氨基酸残基序列时，通常合成DNA序列是优选方法。当目的多肽的完整氨基酸残基序列未知时，直接合成DNA序列是不可能的，优选方法是制备cDNA序列。分离目的cDNA序列的标准方法有制备质粒携带的cDNA文库，反转录mRNA获得cDNA文库，所述mRNA在高水平遗传表达的供体细胞中是丰余的。当联合使用聚合酶链反应技术时，甚至可以克隆表达极少的产物。在已知所述多肽氨基酸序列的重要部分时，在对变性为单链形式的克隆拷贝cDNA进行DNA/DNA杂交方法中，可制备标记的单链或双链DNA或RNA探针序列，该探针序列与推测存在于靶cDNA中的序列相同(Jay等，Nucleic AcidResearch 112325，1983)。
另一方面，本发明提供的包含治疗有效量锌指-核苷酸结合多肽或治疗有效量编码锌指-核苷酸结合多肽的核苷酸序列和药学上可接受的载体的药用组合物。
本文使用的术语“药学上可接受的”、“生理上可耐受的”及其符合语法规则的不同表述，当它们是指组合物、载体、稀释剂和试剂时，它们可以交换使用，而且表示所述物质可以给予人类或而不会产生妨碍给予所述组合物程度的不需要的生理作用，例如恶心、头晕、肠胃不适等。
含有溶解或分散其中的活性成分的药用组合物制剂是本领域周知的。通常这类组合物制成可无菌注射的液体溶液或悬浮液、水溶液或非水溶液，也可制成适用于使用前配制成溶液或悬浮液、液体的固体形式。所述制剂也可以是乳化制剂。
以适用于本文所述治疗法的量将所述活性成分与赋形剂混合，所述赋形剂是药学上可接受的而且与所述活性成分亲和。合适的赋形剂例如水、盐水、葡萄糖、甘油、乙醇等以及它们的组合。此外，如果需要的话，所述组合物可以含有少量辅助物质，例如湿润剂或乳化剂，以及增强所述活性成分疗效的pH缓冲剂等。
本发明治疗性药用组合物可以包含其中组分的药学上可接受的盐。药学上可接受的盐包括与无机酸(例如盐酸或磷酸)或有机酸(例如乙酸、酒石酸、扁桃酸等)形成的酸加成盐(与所述多肽的游离氨基形成)。与游离羧基形成的盐也可以衍生自无机碱，例如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁，以及也可以衍生自有机碱，例如异丙胺、三甲胺、2-乙氨基乙醇、组氨酸、普鲁卡因等。
生理学上耐受的载体是本领域周知的。典型的液体载体为无菌水溶液，除了所述活性成分和水之外它不含任何其它物质，或者它含有生理pH的缓冲剂，例如磷酸钠或生理盐水或此二者如磷酸缓冲盐溶液。水溶液载体还可以含有一种以上的缓冲盐以及盐，例如氯化钠和氯化钾、葡萄糖、丙二醇、聚乙二醇以及其它溶质。液体组合物除了水相之外还可以含有液体相。这样的其它典型液体相为甘油、植物油如棉籽油、有机酯如油酸乙酯以及水-油乳液。
III.组合物另一方面，本发明提供多种锌指-核苷酸结合多肽，其有效结合方式使得可以特异性结合定义为5’-(GNN)n-3’的核苷酸靶基元，其中n是大于1的整数。最好n是2至6左右的整数。
下文的实施例和1995年1月18日提交的美国专利申请第08/676,318号描述了锌指-核苷酸结合多肽的连接方法。优选用寡肽接头连接各个多肽。这样的接头最好类似于见于天然锌指蛋白的接头。用于本发明的优选接头为氨基酸残基序列TGEKP(SEQ ID NO111)。
为了检测制备这样的组合物及其用于基因控制的效能，选择人erbB-2基因作模型。特异性识别该基因5’非翻译区的18bp序列的多指蛋白与KRAB、ERD或SID阻抑结构域融合转化为转录阻抑物。通过与单纯疱疹VP16激活结构域或称为VP64的VP16基本激活结构域的四聚体重复融合制备转录激活物。该资料首次表明，使设计蛋白导向基因转录区的单一位点可以实现基因阻抑和基因活化。
选择人类erbB-2基因作为模型靶，以开发锌指为基础的转录开关。ErbB受体家族成员在人类恶性肿瘤发生中起作重要的作用。具体来说，在多个部位(包括乳腺、卵巢、肺、胃和唾液腺)发病率高的人类腺癌中，由于基因扩增和/或转录失调引起erbB-2过量表达(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184)。ErbB-2的表达增加导致组成型激活其固有的酪氨酸激酶，而且已经证实erbB-2表达增加使培养细胞转化。许多临床研究表明，患有ErbB-2表达水平增高的肿瘤的患者的预后较差(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184)。erbB-2除了涉及人类癌症之外，它在成年哺乳动物以及哺乳动物胚胎发育中均起作重要的生物学作用(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184，Altiok，N.，Bessereau，J.-L.& Changeux，J.-P.(1995)EMBO J.14，4258-4266，Lee，K.-F.，Simon，H.，Chen，H.，Bates，B.，Hung，M-C.&Hauser，C.(1995)Nature 378，394-398)。
所以erbB-2启动子是开发人工转录调节物的有趣实验案例。已经详细特征鉴定了该启动子，并证实它较复杂，它含有TATA依赖性和TATA非依赖性转录起始位点(Ishii，S.，Imamoto，F.，Yamanashi，Y.，Toyoshima，K.& Yamamoto，T.(1987)Proc.Natl.Acad.Sci.USA 84，4374-4378)。尽管早期的研究表明多指蛋白可用作特异性激活或抑制转录的转录调节物，但是这些蛋白结合人工启动子上游至蛋白结合位点的6个串联重复序列(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。此外，该研究应用其结合特异性未提高的多指蛋白。在本文中，我们测试了由预定构件装配的多指蛋白结合天然erbB-2启动子单一位点的效能。如上所述制备并特征鉴定结合16个5’-GNN-3’三联体中每一个的锌指结构域家族。我们关注产生此识别结构域家族的一个原因是，大多数生物的启动子区的碱基组成相对富含GC。因此，如果用这组明确的锌指结构域易于装配成识别5’-(GNN)x-3’位点的蛋白，则能够快速并特异地对许多基因进行调节。含有6个锌指结构域并识别18bp DNA的蛋白应该足以界定所有已知基因组中的单一位置。erbB-2启动子区的检测显示2个5’-(GNN)6-3’位点和1个5’-(GNN)9-3’位点。其中一个位点本文鉴定为e2c，它属于erbB-2基因的5’非翻译区，将其选择为制备基因特异性转录开关的靶位点。对GenBank数据库的BLAST序列相似性检索证实，该序列是erbB-2独特序列。e2c靶序列位于2个主要转录起始位点下游邻近区域，使得可以通过抑制转录起始或延长检测阻抑作用。e2c靶位点的有趣特征是，它存在于一段短的序列中，该序列在人类、大鼠和小鼠erbB-2基因之间是保守的(White，M.R.-A.& Hung，M.-C.(1992)Oncogene 7，677-683)。所以，对该位点的寻靶使得可以在用于人类疾病之前用动物模型研究此策略。
为了制备具有需要DNA-结合特异性的多指蛋白，本研究集中于装配预定锌指结构域，它与Greisman和Pabo提出的序贯选择策略相反(Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)。这种策略需要对各个需要蛋白序贯制备和选择6个锌指文库，使大多数实验室无法利用这种实验方法而且极其费时。此外，因为在此策略中难以应用特异性负选择以排除结合其它可选序列，所以可能产生相对非特异的蛋白，见最近的报道(Kim，J.-S.& Pabo，C.O.(1997)J.Biol.Chem.272，29795-29800)。
研究制备识别9bp DNA序列的3指蛋白的2种不同策略的一般适用性。每个策略均以锌指结构域的模块性质为基础，而且利用识别5’-GNN-3’三联体的锌指结构域家族。在第一个策略中，用PCR装配策略将预定的指2(F2)结构域变异体融合在一起，从而制备识别5’-(GNN)6-3’erbB-2靶位点e2c的半位点(HS)1和2的2种三指蛋白。为了检测该方法的普遍性，用相同的方法制备3种另外的识别5’-(GNN)3-3’型序列的三指蛋白。以与麦芽糖结合蛋白(MBP)的融合物制备纯化锌指蛋白。ELISA分析提示，顺序连接的F2蛋白能够协调作用以特异性识别需要的9-bp DNA靶序列。所示5种蛋白中的每种蛋白能够区分靶和非靶5’-(GNN)3-3’序列。
通过电泳迁移率变动分析测定每种蛋白对其靶的亲和力。这些研究证实所述锌指肽与Zif268和Kd值3-70nM的其它天然转录因子具有相当的亲和力。在本文中，Zif268与其操纵基因的Kd是10nM。必须注意的是，因为仍待解释的原因，一个研究小组报道天然Zif268蛋白的Kd值范围为6nM-10pM，有600倍的变化(Pavletich，N.P.&Pabo，C.O.(1991)Science 252，809-17.，Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)。大多数研究报道Zif268-DNA相互作用的Kd值为3-10nM，Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.USA 91，11163-11167，Hamilton，T.B.，Borel，F.& Romaniuk，P.J.(1998)Biochemistry 37，2051-2058)。因此，为了比较本文报道的结果与其它报道结果，应该比较相对Kds，即(突变体Kd)/(Zif268Kd)，其中2个值均来自相同报道。现有资料相对优于用噬菌体展示制备的新型三指蛋白的其它研究，其中报道所述三指蛋白的亲和力比Zif268弱10-200倍(Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661，Choo，Y.，Sanchez-Garcia，I.& Klug，A.(1994)Nature 372，642-5)。
在第二种策略中，作为顺序连接F2结构域变异体的替代方法，通过“螺旋嫁接(helix grafting)”制备对2个e2c 5’-(GNN)3-3’半位点特异性的三指蛋白。锌指结构域的构架残基，即那些支持识别螺旋形式的残基在不同蛋白中是不同的。我们预测构架残基在亲和性和特异性方面具有作用。为了嫁接螺旋，将DNA识别螺旋的位置-2到6的氨基酸嫁接入Zif268(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17)或SplC构架(Desjarlais，J.R. & Berg，J.M.(1993)Proc.Natl.Acad.Sci.USA 90，2256-60)。SplC蛋白是设计的共有蛋白，其对螯合剂的稳定性提高。通过基于PCR的快速基因装配策略制备DNA模板，由此模板表达所述蛋白。在每种情况下，对MBP融合蛋白的ELISA分析表明，保有用F2构架构建物观测到的DNA结合特异性和亲和性。
如上所述，识别9bp DNA序列不足以指定复杂基因组中的独特位点。相反，识别18bp连续DNA序列的6指蛋白能够确定人类基因组中的单一位点，因此实现了产生基因特异性转录开关的重要先决条件。通过简单的限制酶消化并用F2、Zif268和Sp1C构架模板DNA克隆，由三指构建物制备结合erbB-2靶序列e2c的六指蛋白。对纯化MBP融合蛋白的ELISA分析表明，各六指蛋白能够识别特异性靶序列，与非靶5’-(GNN)6-3’位点或串联重复的Zif268靶位点几乎没有交叉反应性。
用凝胶移位分析测定每种蛋白对e2c DNA靶位点的亲和性。用F2构架构建的E2C(F2)六指蛋白观测到中等大小的Kd值25nM，仅为其组成成分三指蛋白2-3倍。在我们先前对六指蛋白的研究中，我们观测到六指蛋白对其DNA配体的亲和力与其三指组成成分相比，增强约70倍(Lir，Q.，Segal，D.J.，Ghiara，J.B. & Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。E2C(F2)肽亲和力没有明显增加提示串联连接的F2结构域不理想。可能六指蛋白的F2结构域周期性在延长序列上与DNA的周期性不匹配，而且该蛋白的主要结合能部分可能用于解旋DNA(Shi，Y. & Berg，J.M.(1996)Biochemistry 35，3845-8)。与F2结构域蛋白相反，与其原三指蛋白组分相比，E2C(Zif)和E2C(Sp1)六指蛋白的亲和力增加40-70倍，Kd值分别为1.6nM和0.5nM。重要的是，这些蛋白的2个三指蛋白均参与结合，因为任何一个半位点突变均导致亲和力降低约100倍。多数已知转录因子以纳摩尔亲和力结合其特异性DNA配体，提示正常生存期的蛋白/DNA复合物控制基因表达。因此，不需要亲和力增加的锌指蛋白，而且锌指蛋白亲和力增加可能是不利的，尤其是还增加与非特异性DNA的结合时。
一般认为锌指结构域本质上是模块性的，每个锌指识别3-bp亚位点(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17)。我们能够重组锌指结构域成为任何需要序列，获得识别结构5’-(GNN)x-3’延长序列的多指蛋白，就支持这种观点。然而，应该指出的是，至少在某些情况下，锌指结构域似乎可指定重叠的4bp位点而不是单独的3bp位点。在Zif268时，除了位于螺旋位置-1、3和6残基之外其它残基也参与接触DNA(Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.&Pabo，C.O.(1996)Structure 4，1171-1180)。具体来说，F2的螺旋位置2的天冬氨酸在识别中起作几种作用，并产生多种接触。天冬氨酸侧链的羧基与位置-1的精氨酸形成氢键结合，稳定其与靶位点的3’-鸟嘌呤的相互作用。该天冬氨酸还参加与鸟嘌呤的互补胞嘧啶的水介导性接触。此外，观测到所述羧基直接接触指1结合位点5’-鸟嘌呤碱基的互补链上胞嘧啶碱基的N4。正是这种相互作用形成靶位点重叠的化学基础。事实上，对4个5’-GCG GNG GCG-3’序列选择Zif268F2文库时，得到位置-1为精氨酸，位置2为天冬氨酸，类似于天然Zif268的残基。因为e2c靶序列(5’-GGG GCC GGA GCC GCA GTG-3’)(SEQID NO112)后面是A而不是G，所以预期对于e2c特异性六指蛋白的指1存在潜在的靶位点重叠问题。但是在Zif-和SplC-构架的六指蛋白中，根据其与靶位点e2c-a和e2c-g的亲和力非常相似指示，似乎在位置2上含有天冬氨酸的GTG-特异性指1同样好地识别序列5’-GTGA-3’和5’-GTGG-3’。
上述本发明多核苷酸或组合物能够与一种或多种转录调节因子有效连接。调节因子例如转录激活物或转录抑制物或阻抑物是本领域周知的。有效连接多肽与这类因子的方法也是本领域周知的。下文详细讨论典型优选的这类因子及其调节基因表达的应用。
II.用途在一个实施方案中，本发明方法包括调节(抑制)含锌指核苷酸结合基元的核苷酸序列的作用的方法，该方法包括使锌指核苷酸结合基元与有效量结合所述基元的锌指核苷酸结合多肽接触。在所述核苷酸序列是启动子时，所述方法包括抑制转录反式激活含锌指-DNA结合基元的启动子。术语“抑制”是指例如抑制与启动子有效连接的结构基因的转录激活水平，所述启动子含有锌指-核苷酸结合基元。另外，锌指-核苷酸结合多肽衍生物可结合结构基因或RNA序列中的基元。
术语“有效量”包括使先前激活的启动子失活的量或使含锌指-核苷酸结合基元启动子失活的量，或阻断结构基因转录或RNA翻译的量。锌指衍生-核苷酸结合多肽需要量为替代现成蛋白/启动子复合物中的天然锌指-核苷酸结合蛋白的必需量，或与天然锌指-核苷酸结合蛋白竞争而本身与启动子形成复合物的必需量。同样，阻断结构基因或RNA的需要量分别为结合并阻止RNA聚合酶从所述基因阅读的量或抑制翻译的量。所述方法最好在细胞内进行。通过功能性失活启动子或结构基因抑制转录或翻译。通过本文所述的机理之一例如逆转录病毒载体或脂质体、或本领域周知的其它方法能够传递有效量抑制蛋白，使其结合或“接触”含锌指-核苷酸结合蛋白基元的细胞核苷酸序列。
术语“调节”是指抑制、增强或诱导一种功能。例如本发明的锌指-核苷酸结合多肽可通过结合启动子内的基元，因此增强或抑制与该启动子核苷酸序列有效连接的基因转录，从而调节启动子序列。或者调节可以包括抑制基因转录，其中锌指-核苷酸结合多肽结合结构基因，并阻止DNA依赖性RNA聚合酶从该基因开始阅读，由此抑制基因转录。结构基因可以例如是正常细胞基因或癌基因。另一方面，调节可以包括抑制转录物的翻译。
基因启动子区包括通常位于结构基因5’的调节元件。如果需要激活基因，称为转录因子的蛋白结合到该基因的启动子区。该装配类似于“开”，使酶能够从DNA转录第二个遗传区段为RNA。在多数情况下，产生的RNA分子用作合成特定蛋白质的模板；有时RNA本身就是终产物。
所述启动子区可以是正常细胞启动子或例如癌启动子(onco-promoter)。癌启动子一般是病毒性启动子。例如逆转录病毒的长末端重复序列(LTR)是可以成为本发明锌指结合多肽变异体的靶的启动子区。慢病毒组成员的启动子是病毒启动子区实例，所述慢病毒组成员包括病原体如人嗜T淋巴细胞病毒(HTLV)1和2或人类免疫缺陷病毒(HIV)1或2，本发明锌指结合多肽可以靶向所述病毒启动子区进行转录调节。
为了测试应用锌指蛋白作基因特异性转录调节物的原理，使E2C(Sp1)六指蛋白与多个效应结构域融合。使3个人源阻抑物结构域中任何一个与锌指蛋白连接产生转录阻抑物。用ERF阻抑结构域(ERD)制备第一种阻抑蛋白(Sgouras，D.N.，Athanasiou，M.A.，Beal，G.J.，Jr.，Fisher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)，ERF阻抑结构域定义为ets2阻抑因子(ERF)的氨基酸473-530。该结构域介导ERF对ets家族转录因子活性的拮抗作用。将该结构域与锌指蛋白的C末端融合构建合成阻抑物。用Krüppel-结合盒(Krüppel-associatedbox，KRAB)结构域制备第二种阻抑蛋白(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-4513)。该阻抑结构域通常见于锌指蛋白的N末端，而且推测它通过与RING指蛋白KAP-1相互作用(Friedman，J.R.，Fredericks，W.J.，Jensen，D.E.，Speicher，D.W.，Huang，X.-P，Neilson，E.G.& Rauscher III，F.J.(1996)Genes & Dev.10，2067-2078)，以不依赖于距离和方向的方式对TATA依赖性转录发挥阻抑作用(Pengue，G.& Lania，L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020)。我们利用位于锌指蛋白KOX1的氨基酸1-97的KRAB结构域(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci USA 91，4509-4513)。在这种情况下，构建与六指蛋白的N末端融合物。最后，为了探索组蛋白去乙酰化用于阻抑的作用，将MadmSIN3相互作用结构域(SID)的氨基酸1-36与锌指蛋白N末端融合(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.&Eisenman，R.N.(1996)Mol.Cell..Biol.16，5772-5781)。这种小结构域位于转录因子Mad的末端，它作用于mSIN3，mSIN3再作用于辅阻抑物N-CoR和组蛋白去乙酰化酶mRPD1，从而介导其转录抑制作用(Heinzel，T.，Lavinsky，R.M.，Mullen，T.-M.，Ssderstrsm，M.，Laherty，C.D.，Torchia，J.，Yang，W.-M.，Brard，G.，Ngo，S.D.&其他人，e.(1997)Nature 387，43-46)。为了检测基因特异性激活，将锌指蛋白与单纯疱疹病毒VP16蛋白的氨基酸413-489(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)或VP16基本活化结构域DALDDFDLDML(SEQ ID NO113)的人工四聚体重复(Seipel，K.，Georgiev，O.& Schaffner，W.(1992)EMBO J.11，4961-4968)(称为VP64)融合制备转录激活物。
制备包含与荧光素酶报道基因连接的erbB-2启动子片段的报道构建物以测试我们设计的转录调节物的比活。靶报道质粒含有自ATG起始密码子的核苷酸-758至-1，而对照报道质粒含有核苷酸-1571至-24，因此仅保留了包括在位置-24至-7内的E2C结合位点的一个核苷酸。当瞬时转染入HeLa细胞时，两个启动子片段均具有相似活性，与以前的观测结果一致(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)。为了测试锌指-阻抑结构域融合构建物对erbB-2启动子活性的影响，用各锌指表达载体和荧光素酶报道构建物瞬时共转染HeLa细胞(图5A)。观测到每个构建物的明显阻抑作用。ERD和SID融合蛋白分别产生约50％和80％的阻抑作用。最有效的阻抑物是KRAB融合蛋白。该蛋白完全阻抑erbB-2启动子活性。所观测到的残余活性为弱启动子pGL3报道物(promoter-less pGL3 reporter)的背景水平。相反，没有一种蛋白明显抑制缺乏E2C靶位点的对照erbB-2报道构建物，证实E2C(Sp1)蛋白与其靶位点特异性结合才真正介导阻抑作用。缺乏任何效应子结构域的锌指蛋白表达产生弱阻抑，约30％的阻抑，说明于SID和KRAB构建物观测到阻抑作用主要由其效应子结构域产生，而不是单纯的DNA-结合。此观测结果强有力地说明，阻抑机制是有效抑制了转录起始而不是延长。RNA聚合酶II一旦开始转录，似乎聚合酶作用可容易地从DNA移去锌指蛋白。
应用2个相同报道构建物研究基因特异性多指蛋白用于介导转录激活的效用。发现VP16融合蛋白刺激转录增加至约5倍，而VP64融合蛋白产生27倍激活。鉴于锌指蛋白结合基因转录区的事实，基于单一VP16的转录激活物对启动子活性的明显刺激作用是例外情况。这又再次证实，在RNA聚合酶II途径中锌指蛋白仅仅是结合、即使亚纳摩尔亲和力的锌指蛋白的结合也不一定负面影响基因表达。
本文资料表明，用识别5’-GNN-3’位点的预定结构域能够快速制备可结合新型9-和18-bp DNA靶位点的锌指蛋白。该信息足以制备166或17×106新型六指蛋白，每个锌指蛋白均能结合18bp DNA序列。构建新型锌指蛋白的这种快速方法学优于其它学者提出的序贯产生并选择锌指结构域(Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)，该方法利用提示在靶向5’-GNN-3’位点的蛋白中可避免可能的上述靶重叠问题的结构信息。应用复杂而充分研究的erbB-2启动于和活的人体细胞的资料证实，当这些蛋白提供合适效应结构域时，在这些实验中它们可用于刺激或激活表达以及产生各级水平的阻抑至背景水平。这些研究提示，作为转录抑制物的KRAB结构域明显强于ERD或SID结构域，既能够抑制该启动子的TATA依赖性转录起始又能够抑制TATA非依赖性转录起始。以前没有直接比较过这些阻抑结构域。利用预定锌指结构域构建与效应结构域连接的多指蛋白的本发明策略明显优于试图仅通过竞争或干扰参与转录复合物的蛋白抑制转录的策略(Kim，J.-S.& Pabo，C.O.(1997)J.Biol.Chem.272，29795-29800，Kim，J.-S.，Kim，J.，Cepek，K.L.，Sharp，P.A.& Pabo，C.O.(1997)Proc.Natl.Acad.Sci.USA 94，3616-3620)。使用具有远距离作用潜力的效应结构域使得可以将这些基因开关用于调节未特征鉴定的基因和启动子。因为可用我们的PCR装配策略以高通量方式制备这些转录调节物，所以我们认为评价其潜在实际用途是适当的。以这种方式制备的新型DNA结合蛋白在基于DNA的诊断应用中具有潜在效用。为了研究基因功能，我们认为既能激活基因转录又能阻抑基因转录、必要的话能够以阶梯水平激活以及阻抑基因转录，有助于鉴定基因功能。因为这些蛋白通过反式作用发挥其控制作用，所以可以在杂合转基因动物使功能性基因失活或激活。这可以使在整体动物使基因失活需要的时间明显减少，而且可以扩大失活技术适用的生物类型。这些蛋白也可用于基因治疗以抑制产生病毒基因产物或激活参与抗病的基因。有意义的是，制备这些蛋白的简便性将有助于科学团体研究这些设想。
以下实施例举例说明本发明的优选实施方案，而不是以任何方式限制本说明书或权利要求书。
实施例1利用噬菌体展示进行选择基本上按以前方法(Shi，Y.& Berg，J.M.(1996)Biochemistry 35，3845-8)通过PCR重叠延伸构建锌指文库。如前所述(Pengue，G.& Lania，L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020，Friedman，J.R.，Fredericks，W.J.，Jensen，D.E.，Speicher，D.W.，Huang，X.-P.，Neilson，E.G.& Rauscher III，F.J.(1996)Genes & Dev.10，2067-2078)培养以及沉淀噬菌体，不同的是用ER2537细胞(New England Biolabs)繁殖噬菌体，并在生长培养基中加入90μM氯化锌。将沉淀的噬菌体再悬浮于锌缓冲液A(ZBA；10mM Tris，pH 7.5/90mM KCl，1mM氯化镁，90μM氯化锌)/1％BSA/5mM DTT中。加入72nM生物素化发夹靶寡核苷酸之前，使结合反应物(500μlZBA/5mM DTT/1％Blotto(BioRad)/寡核苷酸竞争物/4μg剪切鲱鱼精DNA(Sigma)/100μl过滤的噬菌体(约1013集落形成单位)在室温下温育30分钟。再在恒速轻轻混合下继续温育3.5小时。用500μl ZBA/1％BSA洗涤链霉抗生物素蛋白包被的磁珠(50μl；Dynal)2次，然后用500μl ZBA/5％Blotto/抗体-展示(不相关)的噬菌体(约1012集落形成单位)在室温下封闭约4小时。结合结束时，用结合反应物置换封闭溶液，并在室温下温育1小时。用500μl ZBA/5mMDTT/2％吐温20在1小时内将珠子洗涤10次，然后用不含吐温20的该溶液洗涤1次。用10μg/μl胰蛋白酶洗脱结合噬菌体30分钟。
发夹靶核苷酸的序列为5’-生物素-GGACGCN’N’N’CGCGGGTTTTCCCGCGNNNGCGTCC-3’(SEQ IDNO114)，其中NNN是3-核苷酸指2-靶序列，而N’N’N’为其互补碱基。每轮选择包含7.2nM的相似非生物素化寡核苷酸(其中靶序列是TGG(compTGG))，以对污染的亲本噬菌体进行选择。此外，非生物素化寡核苷酸的2个合并物用作竞争物一个含有全部64种可能的3-核苷酸靶序列(compNNN)，另一个除了目前的选择靶(compGNN)之外包含所有GNN靶序列。通常如下使用这些合并物第一轮，无compNNN或compGNN；第二轮，7.2nM compGNN；第三轮，10.8nM compGNN；第四轮，1.8μM compNNN，25nM compGNN；第五轮，2.7μM compNNN，90nM compGNN；第六轮，2.7μM compNNN，250nM compGNN；第七轮，3.6μM compNNN，250nM compGNN。
实施例2多靶特异性测定将含锌指编码序列的pComb3H(Pengue，G.& Lania，L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020，Heinzel，T.，Lavinsky，R.M.，Mullen，T.-M.，Ssderstrsm，M.，Laherty，C.D.，Torchia，J.，Yang，W.-M.，Brard，G.，Ngo，S.D.&其他人，e.(1997)Nature 387，43-46)噬菌粒RFDNA的片段亚克隆入修饰的pMAL-c2(New England Biolabs)细菌表达载体，并将其转化入XL1-Blue(Stratagene)中。用蛋白融合及纯化系统(New England Biolabs)由IPTG诱导的培养物制备含过量表达的麦芽糖结合蛋白-锌指融合蛋白的冻融提取物。在96孔ELISA板的各孔中加入0.2μg链霉抗生物素蛋白(Pierce)，以37℃温育1小时，然后用水洗涤2次。同样加入生物素化靶寡核苷酸(0.025μg)。加入ZBA/3％BSA封闭，但是在温育后不洗涤各孔。之后所有温育在室温下进行。用1×结合缓冲液(ZAB/1％BSA/5mM DTT/0.12μg/μl剪切鲱鱼精子DNA)连续2倍稀释提取物8次。将样品温育1小时，然后用水洗涤10次。将小鼠抗麦芽糖结合蛋白单克隆抗体(Sigma)的ZBA/1％BSA加于各孔处理30分钟，然后用水洗涤10次。将缀合碱性磷酸酶的山羊抗小鼠IgG单克隆抗体(Sigma)加于各孔处理30分钟，然后用水洗涤10次。加入碱性磷酸酶底物(Sigma)，用SOFTmax 2.35(Molecular Devices)定量OD405。
实施例3凝胶迁移率变动分析用蛋白融合及纯化系统(New England Biolabs)将融合蛋白纯化至90％以上的均一性，其中例外的是ZAB/5mM DTT用作柱缓冲液。根据考马斯亮蓝染色的15％SDS-PAGE凝胶，与BSA标准品比较，确定蛋白纯度和浓度。用[32P]于其5’或3’端标记靶寡核苷酸，并凝胶纯化。连续3倍稀释11次的蛋白在20μl结合反应物(1×结合缓冲液/10％甘油/约1pM靶寡核苷酸)中于室温下温育3小时，然后用0.5×TBE缓冲液在5％聚丙烯酰胺凝胶上分离。用PhosphorImager和ImageQuant软件(Molecular Dynamics)定量干燥凝胶，通过斯卡查德分析确定KD。
实施例4利用需要的DNA结合特异性制备多指蛋白本文报道的研究应用附图(accompanying manuscript)中定义的指2(F2)变异体pmGAC、pmGAG、pGCA、pGCC、pmGGA、pmGGC、pmGGG和pGTG(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)。为了制备编码多指蛋白的DNA，用PCR从选定或设计的F2变异体扩增F2编码区，并通过PCR重叠延伸装配。或者分别由8或6个重叠寡核苷酸合成编码具有Zif268或SplC构架的三指蛋白的DNA。SplC构架构建物用于本报道所述的所有报道分析，其制备如下如果为E2C-HS1(Sp1)时，将寡核苷酸SPE2-3(5’-GCG AGC AAG GTC GCG GCA GTC ACT AAA AGA TTTGCC GCA CTC TGG GCA TTT ATA CGG TTT TTC ACC-3’)(SEQ IDNO115)和SPE2-4(5’-GTG ACT GCC GCG ACC TTG CTC GCC ATCAAC GCA CTC ATA CTG GCG AGA AGC CAT ACA AAT GTC CAGAAT GTG GC-3’)(SEQ ID NO116)各0.4pmole与寡核苷酸SEP2-2(5’-GGT AAG TCC TTC TCT CAG AGC TCT CAC CTG GTG CGCCAC CAG CGT ACC CAC ACG GGT GAA AAA CCG TAT AAA TGCCCA GAG-3’)(SEQ ID NO117)和SPE2-5(5’-ACG CAC CAG CTTGTC AGA GCG GCT GAA AGA CTT GCC ACA TTC TGG ACA TTTGTA TGG C-3’)(SEQ ID NO118)各40pmole按标准PCR混合物混合，循环25次(94℃30秒，60℃30秒，72℃30秒)。然后利用相同的循环条件以引物SPE2-1(5’-GAG GAG GAG GAG GTG GCCCAG GCG GCC CTC GAG CCC GGG GAG AAG CCC TAT GCT TGTCCG GAA TGT GGT AAG TCC TTC TCT CAG AGC-3’)(SEQ ID NO119)和SPE2-6(5’-GAG GAG GAG GAG CTG GCC GGC CTG GCCACT AGT TTT TTT ACC GGT GTG AGT ACG TTG GTG ACG CACCAG CTT GTC AGA GCG-3’)(SEQ ID NO120)各40pmole扩增等份此预装配反应物。应用仅在识别螺旋编码区不同的一组类似的寡核苷酸以相同方式制备E2C-HS2(Sp1)DNA。所有装配的三指编码区用限制性内切核酸酶Sfil消化，并将其克隆入pMal-CSS中，pMal-CSS是细菌表达载体pMal-C2的衍生物(New England Biolabs)。利用三指编码区侧翼序列包含的Xmal和BsrFl限制性位点将编码具有各不同构架的六指蛋白的DNA装配在pMal-CSS中。用大肠杆菌菌株XL1-blue表达各锌指蛋白，用附图所述的ELISA和凝胶变动分析(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)研究结合性质。
实施例5构建锌指效应结构域融合蛋白为了构建锌指效应结构域融合蛋白，用Taq DNA聚合酶由重叠寡核苷酸装配编码ets阻抑因子(ERF)阻抑结构域(ERD)的氨基酸473-530(Sgouras，D.N.，Athanasiou，M.A.，Beal，G.J.，Jr.，Fisher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)、KOX1的KRAB结构域的氨基酸1-97(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci USA 91，4509-4513)或Mad mSIN3作用结构域(SID)的氨基酸1-36(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.& Eisenman，R.N.(1996)Mol.Cell.Biol.16，5772-5781)的DNA。利用PCR由pcDNA3/C7-C7-VP16(10)扩增VP16转录活化结构域的氨基酸413-489的编码区(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)。用2对互补寡核苷酸制备VP64 DNA，VP64 DNA编码VP16基本活化结构域的四聚体重复，其中VP16基本活化结构域包含氨基酸437-447(Seipel，K.，Georgiev，O.& Schaffner，W.(1992)EMBO J.11，4961-4968)。用标准克隆方法将所得的片段与锌指编码区融合，这样所获得的每个构建物含有内部SV40核定位信号以及C末端HA十肽标记。将融合构建物克隆在原核表达载体pcDNA3(Invitrogen)中。
实施例6构建荧光素酶报道质粒用TaqExpand DNA聚合酶混合物(Boehringer Mannheim)通过PCR从人骨髓基因组DNA扩增包含自ATG起始密码子的核苷酸-758至-1的erbB-2启动子片段，并于萤火虫荧光素酶基因上游将其克隆入pGL3basic(Promega)中。通过Hind3消化从pSVOALΔ5’/erbB-2(N-N)(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)切下包含核苷酸-1571至-24的人erbB-2启动子片段，并将其于萤火虫荧光素酶基因上游亚克隆入pGL3basic中。
实施例7荧光素酶测定融合40-60％的HeLa细胞用于所有转染。一般来说，用脂质转染胺试剂(Gibco BRL)在6孔板的孔内，用400ng报道质粒(pGL3-启动子构建物或用作阴性对照的pGL3basic)、50ng效应质粒(pcDNA3中的锌指构建物或用作阴性对照的空pcDNA3)和200ng内标质粒(phrAct-βGal)转染细胞。转染后约48小时制备细胞提取物。用MicroLumatLB96P发光计(EG&G Berthold)以荧光素酶检测试剂(Promega)检测荧光素酶活性、用Galacto-Light(Tropix)检测βGal活性。荧光素酶活性根据βGal活性归一化。
实施例8HeLa细胞erbB-2基因的调节对erbB-2基因施以调节。erbB-2基因通常在人类癌症、尤其是乳腺癌和卵巢癌中过量表达，ErbB-2水平升高与患者的预后较差相关(N.E.Hynes和D.F.Stem，Biochim.Biophys.Acta 1198，165(1994))。为了调节天然erbB-2基因，使用称为E2C-KRAB的合成阻抑蛋白和称为E2C-VP64的反式激活蛋白(R.R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))。两种蛋白均含有相同设计的锌指蛋白E2C，识别原癌基因erbB-25’非翻译区中的18-bp DNA序列5’-GGG GCC GGA GCC GCA GTG-3’(SEQ ID NO121)。由6个预定模块锌指结构域构建这种DNA-结合蛋白(D.J.Segal，B.Dreier，R.R.Beerli，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 96，2758(1999))。阻抑蛋白含有Kox-1 KRAB结构域(J.F.Margolin等，Proc.Natl.Acad.Sci.USA 91，4509(1994))，而反式激活物VP64含有衍生自单纯疱疹病毒蛋白VP16的基本活化结构域的四聚体重复(K.Seipel，O.Georgiev，W.Schaffner，EMBO J.11，4961(1992))，。
使用人宫颈癌细胞系HeLa衍生物HeLa/tet-off(M.Gossen和H.Bujard，Proc.Natl.Acad.Sci.USA 89，5547(1992))。因为HeLa细胞是上皮来源，所以它们表达ErbB-2而且非常适用于研究erbB-2基因寻靶。HeLa/tet-off细胞产生四环素控制的反式激活物，从而可以通过从生长培养基去除四环素或其衍生物多西环素(Dox)诱导四环素反应元件(TRE)控制的目的基因。我们应用该系统将我们的转录因子置于化学控制之下。因此，构建pRevTRE/E2C-SKD和pRevTRE/E2C-VP64质粒(由pcDNA3为基础的表达质粒经PCR扩增E2C(Sp1)-KRAB和E2C(Sp1)-VP64编码区(R.R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))，并利用BamH1和Cla1限制位点将其亚克隆入pRevTRE(Clontech)以及利用BamH1和Not1限制位点亚克隆入pMX-IRES-GFP[X.Liu等，Proc.Natl.Acad.Sci.USA 94，10669(1997)]。通过测序证实PCR扩增的保真性)，将其转染入HeLa/tet-off细胞，独立分离20个稳定克隆并各自分析Dox依赖性靶基因调节(利用Lipofectamine Plus试剂(Gibco BRL)将pRevTRE/E2C-KRAB和pRevTRE/E2C-VP64构建物转染入HeLa/tet-off细胞系(M.Gossen和H.Bujard，Proc.Natl.Acad.Sci.USA 89，5547(1992))。在存在2μg/ml Dox下于含潮霉素的培养基中选择2周后，分离稳定克隆并分析对ErbB-2表达的Dox依赖性调节。基本上按所述[D.Graus-Porta，R.R.Beerli，N.E.Hynes，Mol.Cell.Biol.15，1182(1995)]进行蛋白质印迹分析、免疫沉淀、RNA印迹分析和流式细胞分析)。用蛋白质印迹分析初步分析ErbB-2蛋白水平，作为erbB-2启动子活性的结果。其中相当部分克隆表明，去除Dox 4天时存在对ErbB-2表达的调节，即在E2C-KRAB克隆中向下调节ErbB-2表达而在E2C-VP64克隆中向上调节ErbB-2表达。ErbB-2蛋白水平与其特定mRNA变化水平有关，说明对ErbB-2表达的调节是由于阻抑或激活转录所致。在E2C-VP64克隆中额外表达的ErbB-2蛋白与天然表达蛋白无法区分并且具有生物活性，因为表皮生长因子(EGF)容易诱导其酪氨酸磷酸化。因为其EGF诱导的酪氨酸磷酸化，在没有Dox的情况下，E2C-KRAB克隆#27的ErbB-2水平低于检测水平。所以，还用流式细胞仪分析ErbB-2表达，提示在E2C-KRAB克隆#27未检测到ErbB-2表达，与ErbB-2在E2C-VP64克隆#18中的明显向上调节(5.6倍)形成鲜明的对比。因此，对erbB-2基因的调节程度为从完全阻抑(E2C-KRAB克隆#27)至差不多6倍的激活(E2C-VP64克隆#18)。未观测到对相关的ErbB-1蛋白表达的明显作用，说明对ErbB-2表达的调节不是因为一般的向下或向上调节转录的所致。与这些利用6个锌指结构域靶向18bp DNA序列的转录因子的效能相比，用3个锌指结构域制备的结合E2C靶序列的任一9bp半位点的转录激活物不能激活ebrB-2荧光素酶报道物的转录。这些结果提示，需要特异性和亲和力提高的六指蛋白以对基因调节产生明显作用。
实施例9在逆转录病毒载体pMX-IRES-GFP中导入E2C-KRAB和E2C-VP64蛋白编码区为了在几种其它细胞系中表达E2C-KRAB和E2C-VP64蛋白，将其编码区导入逆转录病毒载体pMX-IRES-GFP中。由pcDNA3为基础的表达质粒经PCR扩增E2C(Sp1)-KRAB和E2C(Sp1)-VP64编码区(RR.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))，并利用BamH1和Cla1限制位点将其亚克隆入pRevTRE(Clontech)以及利用BamH1和Not1限制位点亚克隆入pMX-IRES-GFP[X.Liu等，Proc.Natl.Acad.Sci.USA 94，10669(1997)]。通过测序证实PCR扩增的保真性。此载体表达一个双顺反子信使用于翻译锌指蛋白以及从内核糖体结合位点(IRES)翻译绿色荧光蛋白(GFP)。因为两个编码区共有同一个mRNA，所以其表达彼此密切相关，GFP表达是锌指蛋白表达的一个指标。然后应用由这些质粒制备的病毒感染人类癌细胞系A431(用脂质转染胺Plus试剂(GibcoBRL)将pMX-IRES-GFP/E2C-KRAB和pMX-IRES-GFP/E2C-VP64质粒瞬时转染入兼性包装细胞系Phoenix Ampho中，2天后，在存在8μg/ml聚凝胺(polybrene)的情况下用培养上清液感染靶细胞。感染3天后收获细胞用于分析)。感染3天后，用流式细胞仪测量ErbB-2表达。重要的是，约59％E2C-KRAB病毒处理细胞基本上为ErbB-2阴性，而约27％E2C-VP64病毒处理细胞中的ErbB-2水平升高。GFP荧光对ErbB-2荧光作图提示存在2个细胞群，一个细胞群为GFP阴性的正常ErbB-2水平的细胞群，另一个为GFP阳性的ErbB-2水平改变的细胞群。通过检测相关ErbB-1和ErbB-3蛋白的表达水平研究基因寻靶的特异性。未检测到这些蛋白的明显改变，说明erbB-2基因寻靶是特异性的，而不是基因表达的一般变化或效应结构域的过量表达的非特异性结果。尤其值得注意的是，对erbB-3缺乏任何明显的调节作用，这是因为其5’-UTR含有18bp序列5’-GGa GCC GGA GCC GgA GTc-3’(SEQ ID NO122)，该序列与设计的E2C靶序列只有3个碱基不匹配(15bp相同-小写字母表示不同)(M.H.Kraus，W.Issing，T.Miki，N.C.Popescu，S.A.Aaronson，Proc.Natl.Acad.Sci.USA 86，9193(1989))。
实施例10对非人类灵长类细胞erbB-2基因的调节作用
erbB-2的5’-UTR中的锌指靶序列位于在许多物种中保守的28bp序列段中。为了研究对erbB-2基因在非人类灵长类细胞中表达的调节作用，用双顺反子E2C-KRAB逆转录病毒感染COS-7成纤维细胞，并用流式细胞仪进行分析。与在人类细胞中一样，以GFP标记指示的阻抑蛋白表达与缺失EbrB-2蛋白密切相关。同样，通过用编码E2C-KRAB和E2C-VP64的逆转录病毒感染NIH/3T3细胞评价在小鼠细胞中的基因寻靶。然后用蛋白质印迹分析而不是流式细胞仪(因为单克隆抗体缺乏与鼠ErbB-2胞外结构域的反应性)监测ErbB-2表达水平。在此再次观测到用E2C-KRAB校正感染细胞时完全没有转录。然而，与人类细胞系不同的是，E2C-VP64诱导的ErbB-2向上调节在NIH/3T3细胞中非常温和，校正感染效率时约为1.8倍。这种差异的可能解释是人和小鼠启动子的结构不同。小鼠erbB-2启动子与人的启动子不同，它没有TATA盒(M.R.White和M.C.Hung，Oncogene 7，677(1992))。VP16激活的转录至少部分是其与TFIID相互作用介导的，TFIID是也含有TATA-结合蛋白的多蛋白复合物(C.J.Ingles，M.Shales，W.D.Cress，S.J.Triezenberg，J.Greenblatt，Nature 351，588(1991))。似乎原因是缺乏TATA盒时E2C-VP64蛋白激活转录的效率较低。这些资料提示，虽然DNA结合位点就序列和在靶细胞中的相对位置而言是可能保守的，但是由于邻近序列效应可能需要优化效应结构域以使效率最大化。尽管如此，虽然本文所述的人工转录因子的效力可能不同，但是它们能够在衍生自不同物种的细胞中对erbB-2基因的转录加以调节，为研究基因在各种生物中的作用提供策略。
实施例11特异性诱导ErbB-2过量表达肿瘤细胞的G1累积ErbB-2过量表达导致组成型激活其本身酪氨酸激酶活性(P.P.DiFiore等，Science 237，178(1987))，而且证实ErbB-2在过量表达所述受体的肿瘤细胞中的向下调节导致生长抑制(R.M.Hudziak等，Mol.Cell.Biol.9，1165(1989)；J.Deshane等，Gene Tger.1，332(1994)；J.M.Daly等，Cancer Res.57，3804(1997))。看来生长抑制的机制是阻止所述细胞从细胞周期的G1期进入S期(R.M.Neve，H.Sutterluty，N.Pullen，H.A.Lane，J.M.Daly，W.Krek，N.E.Hynes，出版中)。因此，我们研究了我们设计的转录阻抑物在erbB-2过量表达的肿瘤细胞中的表达是否导致G1期阻滞。因此用E2C-KRAB逆转录病毒感染SKBR3乳腺癌细胞，并用流式细胞仪分析与ErbB-2表达水平有关的细胞周期分布(22)。观测到2个细胞群约40％细胞未感染而且其ErbB-2水平正常，而感染细胞约60％，3天后的受体水平降低约7倍。与正常受体水平的细胞相比，绝大部分ErbB-2表达水平降低的细胞处于细胞周期的G1期。为了确定于SKBR3细胞观测到的G1累积是ErbB-2过量表达肿瘤细胞特异性的，用其ErbB-2水平不高的T47D乳腺癌细胞系进行了相似的分析(图4B)。事实上，用E2C-KRAB逆转录病毒感染T47D细胞并使其进行流式细胞分析时，发现ErbB-2水平正常的细胞群和ErbB-2水平降低的细胞群的DNA含量没有差别。所以，我们设计的阻抑蛋白能够特异性诱导ErbB-2过量表达肿瘤细胞的G1累积。能够抑制细胞周期过程，因此抑制ErbB-2过量表达肿瘤细胞生长的能力说明，我们所设计的转录因子具有用于基因治疗癌症的潜力。
序列表<110>Novartis AG<120>用于GNN的锌指结合结构域<130>30746/A<140>
<141>
<160>122<170>PatentIn Ver.2.1<210>1<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>1Gln Ser Ser Asn Leu Val Arg1 5<210>2<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>2Asp Pro Gly Asn Leu Val Arg1 5<210>3<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>3Arg Ser Asp Asn Leu Val Arg1 5<210>4<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>4Thr Ser Gly Asn Leu Val Arg1 5<210>5<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>5Gln Ser Gly Asp Leu Arg Arg1 5<210>6<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>6Asp Cys Arg Asp Leu Ala Arg1 5<210>7<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>7Arg Ser Asp Asp Leu Val Lys1 5<210>8<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>8Thr Ser Gly Glu Leu Val Arg1 5<210>9<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>9Gln Arg Ala His Leu Glu Arg1 5<210>10<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>10Asp Pro Gly His Leu Val Arg1 5<210>11<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>11Arg Ser Asp Lys Leu Val Arg1 5<210>12<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>12Thr Ser Gly His Leu Val Arg1 5
<210>13<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>13Gln Ser Ser Ser Leu Val Arg1 5<210>14<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>14Asp Pro Gly Ala Leu Val Arg1 5<210>15<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>15Arg Ser Asp Glu Leu Val Arg1 5
<210>16<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>16Thr Ser Gly Ser Leu Val Arg1 5<210>17<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>17Gln Arg Ser Asn Leu Val Arg1 5<210>18<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>18Gln Ser Gly Asn Leu Val Arg1 5<210>19<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>19Gln Pro Gly Asn Leu Val Arg1 5<210>20<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>20Asp Pro Gly Asn Leu Lys Arg1 5<210>21<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>21Arg Ser Asp Asn Leu Arg Arg1 5<210>22<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>22Lys Ser Ala Asn Leu Val Arg1 5<210>23<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>23Arg Ser Asp Asn Leu Val Lys1 5<210>24<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>24Lys Ser Ala Gln Leu Val Arg1 5<210>25<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>25Gln Ser Ser Thr Leu Val Arg1 5<210>26<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>26Gln Ser Gly Thr Leu Arg Arg1 5<210>27<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>27Gln Pro Gly Asp Leu Val Arg1 5<210>28<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>28Gln Gly Pro Asp Leu Val Arg1 5
<210>29<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>29Gln Ala Gly Thr Leu Met Arg1 5<210>30<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>30Gln Pro Gly Thr Leu Val Arg1 5<210>31<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>31Gln Gly Pro Glu Leu Val Arg1 5
<210>32<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>32Gly Cys Arg Glu Leu Ser Arg1 5<210>33<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>33Asp Pro Ser Thr Leu Lys Arg1 5<210>34<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>34Asp Pro Ser Asp Leu Lys Arg1 5<210>35<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>35Asp Ser Gly Asp Leu Val Arg1 5<210>36<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>36Asp Ser Gly Glu Leu Val Arg1 5<210>37<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>37Asp Ser Gly Glu Leu Lys Arg1 5<210>38<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>38Arg Leu Asp Thr Leu Gly Arg1 5<210>39<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>39Arg Pro Gly Asp Leu Val Arg1 5<210>40<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>40Arg Ser Asp Thr Leu Val Arg1 5<210>41<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>41Lys Ser Ala Asp Leu Lys Arg1 5<210>42<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>42Arg Ser Asp Asp Leu Val Arg1 5<210>43<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>43Arg Ser Asp Thr Leu Val Lys1 5<210>44<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>44Lys Ser Ala Glu Leu Lys Arg1 5
<210>45<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>45Lys Ser Ala Glu Leu Val Arg1 5<210>46<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>46Arg Gly Pro Glu Leu Val Arg1 5<210>47<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>47Lys Pro Gly Glu Leu Val Arg1 5
<210>48<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>48Ser Ser Gln Thr Leu Thr Arg1 5<210>49<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>49Thr Pro Gly Glu Leu Val Arg1 5<210>50<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>50Thr Ser Gly Asp Leu Val Arg1 5<210>51<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>51Ser Ser Gln Thr Leu Val Arg1 5<210>52<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>52Thr Ser Gln Thr Leu Thr Arg1 5<210>53<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>53Thr Ser Gly Glu Leu Lys Arg1 5<210>54<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>54Gln Ser Ser Asp Leu Val Arg1 5<210>55<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>55Ser Ser Gly Thr Leu Val Arg1 5<210>56<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>56Thr Pro Gly Thr Leu Val Arg1 5<210>57<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>57Thr Ser Gln Asp Leu Lys Arg1 5<210>58<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>58Thr Ser Gly Thr Leu Val Arg1 5<210>59<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>59Gln Ser Ser His Leu Val Arg1 5<210>60<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>60Gln Ser Gly His Leu Val Arg1 5
<210>61<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>61Gln Pro Gly His Leu Val Arg1 5<210>62<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>62Glu Arg Ser Lys Leu Ala Arg1 5<210>63<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>63Asp Pro Gly His Leu Ala Arg1 5
<210>64<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>64Gln Arg Ala Lys Leu Glu Arg1 5<210>65<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>65Gln Ser Ser Lys Leu Val Arg1 5<210>66<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>66Asp Arg Ser Lys Leu Ala Arg1 5<210>67<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>67Asp Pro Gly Lys Leu Ala Arg1 5<210>68<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>68Arg Ser Asp Lys Leu Thr Arg1 5<210>69<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>69Arg Ser Asp His Leu Thr Arg1 5<210>70<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>70Lys Ser Ala Lys Leu Glu Arg1 5<210>71<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>71Thr Ala Asp His Leu Ser Arg1 5<210>72<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>72Thr Ala Asp Lys Leu Ser Arg1 5<210>73<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>73Thr Pro Gly His Leu Val Arg1 5<210>74<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>74Thr Ser Ser His Leu Val Arg1 5<210>75<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>75Thr Ser Gly Lys Leu Val Arg1 5<210>76<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>76Gln Pro Gly Glu Leu Val Arg1 5
<210>77<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>77Gln Ser Gly Glu Leu Val Arg1 5<210>78<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>78Gln Ser Gly Glu Leu Arg Arg1 5<210>79<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>79Asp Pro Gly Ser Leu Val Arg1 5
<210>80<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>80Arg Lys Asp Ser Leu Val Arg1 5<210>81<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>81Arg Ser Asp Val Leu Val Arg1 5<210>82<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>82Arg His Asp Ser Leu Leu Arg1 5<210>83<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>83Arg Ser Asp Ala Leu Val Arg1 5<210>84<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>84Arg Ser Ser Ser Leu Val Arg1 5<210>85<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>85Arg Ser Ser Ser His Val Arg1 5<210>86<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>86Arg Ser Asp Glu Leu Val Lys1 5<210>87<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>87Arg Ser Asp Ala Leu Val Lys1 5<210>88<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>88Arg Ser Asp Val Leu Val Lys1 5<210>89<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>89Arg Ser Ser Ala Leu Val Arg1 5<210>90<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>90Arg Lys Asp Ser Leu Val Lys1 5<210>91<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>91Arg Ser Ala Ser Leu Val Arg1 5<210>92<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>92Arg Ser Asp Ser Leu Val Arg1 5
<210>93<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>93Arg Ile His Ser Leu Val Arg1 5<210>94<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>94Arg Pro Gly Ser Leu Val Arg1 5<210>95<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>95Arg Gly Pro Ser Leu Val Arg1 5
<210>96<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>96Arg Pro Gly Ala Leu Val Arg1 5<210>97<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>97Lys Ser Ala Ser Leu Val Arg1 5<210>98<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>98Lys Ser Ala Ala Leu Val Arg1 5<210>99<211>7<212>PRT
<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>99Lys Ser Ala Val Leu Val Arg1 5<210>100<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>100Thr Ser Gly Ser Leu Thr Arg1 5<210>101<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>101Thr Ser Gln Ser Leu Val Arg1 5<210>102<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>102Thr Ser Ser Ser Leu Val Arg1 5<210>103<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>103Thr Pro Gly Ser Leu Val Arg1 5<210>104<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>104Thr Ser Gly Ala Leu Val Arg1 5<210>105<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽
<400>105Thr Pro Gly Ala Leu Val Arg1 5<210>106<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>106Thr Gly Gly Ser Leu Val Arg1 5<210>107<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>107Thr Ser Gly Glu Leu Val Arg1 5<210>108<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>108Thr Ser Gly Glu Leu Thr Arg1 5
<210>109<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>109Thr Ser Ser Ala Leu Val Lys1 5<210>110<211>7<212>PRT<213>人工序列<220>
<223>人工序列说明核苷酸结合多肽<400>110Thr Ser Ser Ala Leu Val Arg1 5<210>111<211>5<212>PRT<213>人工序列<220>
<223>人工序列说明肽接头<400>111Thr Gly Glu Lys Pro1 5<210>112
<211>18<212>DNA<213>人工序列<220>
<223>人工序列说明e2c靶序列<400>112ggggccggag ccgcagtg18<210>113<211>11<212>PRT<213>人工序列<220>
<223>人工序列说明VP16基本活化结构域<400>113Asp Ala Leu Asp Asp phe Asp Leu Asp Met Leu1 5 10<210>114<211>34<212>DNA<213>人工序列<220>
<223>人工序列说明发夹靶寡核苷酸<400>114ggacgcnnnc gcgggttttc ccgcgnnngc gtcc34<210>115<211>66<212>DNA<213>人工序列<220>
<223>人工序列说明寡核苷酸SPE2-3
<400>115gcgagcaagg tcgcggcagt cactaaaaga tttgccgcac tctgggcatt tatacggttt 60ttcacc66<210>116<211>74<212>DNA<213>人工序列<220>
<223>人工序列说明寡核苷酸SPE2-4<400>116gtgactgccg cgaccttgct cgccatcaac gcactcatac tggcgagaag ccatacaaat 60gtccagaatg tggc 74<210>117<211>81<212>DNA<213>人工序列<220>
<223>人工序列说明寡核苷酸SPE2-2<400>117ggtaagtcct tctctcagag ctctcacctg gtgcgccacc agcgtaccca cacgggtgaa 60aaaccgtata aatgcccaga g81<210>118<211>58<212>DNA<213>人工序列<220>
<223>人工序列说明寡核苷酸SPE2-5<400>118acgcaccagc ttgtcagagc ggctgaaaga cttgccacat tctggacatt tgtatggc 58<210>119
<211>87<212>DNA<213>人工序列<220>
<223>人工序列说明寡核苷酸SPE2-1<400>119gaggaggagg aggtggccca ggcggccctc gagcccgggg agaagcccta tgcttgtccg 60gaatgtggta agtccttctc tcagagc 87<210>120<211>81<212>DNA<213>人工序列<220>
<223>人工序列说明寡核苷酸SPE2-6<400>120gaggaggagg agctggccgg cctggccact agttttttta ccggtgtgag tacgttggtg 60acgcaccagc ttgtcagagc g 81<210>121<211>18<212>DNA<213>人工序列<220>
<223>人工序列说明部分erbB-25’UTR<400>121ggggccggag ccgcagtg 18<210>122<211>18<212>DNA<213>人工序列<220>
<223>人工序列说明部分erbB-35’UTR
<400>122ggagccggag ccggagtc18
权利要求
1.一种分离并纯化的锌指-核苷酸结合多肽，它包含具有SEQ IDNO1-3、5-7、9-11和13-15中任一序列的核苷酸结合区。
2.一种分离并纯化的锌指-核苷酸结合多肽，它包含具有SEQ IDNO17-110中任一序列的核苷酸结合区。
3.一种组合物，它包含2至12种权利要求1所述多肽。
4.权利要求3的组合物，它包含2至6种多肽。
5.权利要求3或4的组合物，其中所述多肽是有效连接的多肽。
6.权利要求3-5任一项的组合物，其中所述多肽利用具有SEQID NO111序列的接头连接。
7.权利要求3-6任一项的组合物，其中各所述多肽与不同核苷酸序列结合。
8.权利要求3-7任一项的组合物，它与包含序列5’-(GNN)n-3’的核苷酸结合，其中各个N为A、C、G或T，前提是所有N不能均为C而其中n为2-6。
9.权利要求1的组合物，它还与一种或多种转录调节因子有效连接。
10.权利要求2的组合物，它还与一种或多种转录调节因子有效连接。
11.权利要求3-8任一项的组合物，它还与一种或多种转录调节因子有效连接。
12.一种组合物，它包含权利要求2的2至12种多肽。
13.权利要求12的组合物，它包含2至6种多肽。
14.权利要求12或13的组合物，其中所述多肽是有效连接的多肽。
15.权利要求12-14任一项的组合物，其中所述多肽利用具有SEQ ID NO111序列的接头连接。
16.权利要求12-15任一项的组合物，其中各所述多肽与不同核苷酸序列结合。
17.权利要求12-16任一项的组合物，它与包含序列5’-(GNN)n-3’的核苷酸结合，其中各个N为A、C、G或T，前提是所有N不能均为C而其中n为2-6。
18.权利要求12的多肽，它还与一种或多种转录调节因子有效连接。
19.一种分离并纯化的多核苷酸，它编码权利要求1的多肽。
20.一种分离并纯化的多核苷酸，它编码权利要求2的多肽。
21.一种分离并纯化的多核苷酸，它编码权利要求3-8任一项的组合物。
22.一种分离并纯化的多核苷酸，它编码权利要求12-17任一项的组合物。
23.一种表达载体，它含有权利要求19的多核苷酸。
24.一种表达载体，它含有权利要求20的多核苷酸。
25.一种表达载体，它含有权利要求21的多核苷酸。
26.一种表达载体，它含有权利要求22的多核苷酸。
27.权利要求3-8任一项的组合物在制备用于调节核苷酸序列表达的药物中的用途，所述核苷酸序列包含序列5’-(GNN)n-3’，其中n为1-6的整数。
28.权利要求27的用途，其中所述序列5’-(GNN)n-3’位于所述核苷酸序列的转录区中。
29.权利要求27的用途，其中所述序列5’-(GNN)n-3’位于所述核苷酸序列的启动子区中。
30.权利要求27的用途，其中所述序列5’-(GNN)n-3’位于表达的序列标记中。
31.权利要求27的用途，其中所述组合物与一种或多种转录调节因子有效连接。
32.权利要求12-17任一项的组合物在制备用于调节核苷酸序列表达的药物中的用途，所述核苷酸序列包含序列5’-(GNN)n-3’，其中n为1-6的整数。
33.权利要求32的用途，其中所述序列5’-(GNN)n-3’位于所述核苷酸序列的转录区中。
34.权利要求32的方法，其中所述序列5’-(GNN)n-3’位于所述核苷酸序列的启动子区中。
35.权利要求33的方法，其中所述序列5’-(GNN)n-3’位于表达的序列标记中。
36.权利要求32的方法，其中所述组合物与一种或多种转录调节因子有效连接。
37.一种用于治疗与ErbB-2过量表达有关的癌症的药物，它包括权利要求3-8任一项的组合物。
38.权利要求3-8任一项的组合物在制备用于治疗与ErbB-2过量表达有关的癌症的药物中的用途。
39.一种用于治疗与ErbB-2过量表达有关的癌症的药物，它包括权利要求12-17任一项的组合物。
40.权利要求12-17任一项的组合物在制备用于治疗与ErbB-2过量表达有关的癌症的药物中的用途。
41.一种用于治疗与基因过量表达有关的癌症的药物，所述基因可被权利要求3-8任一项的组合物调节，所述药物包括权利要求3-8任一项的组合物。
42.权利要求3-8任一项的组合物在制备用于治疗与基因过量表达有关的癌症的药物中的用途，所述基因可被权利要求3-8任一项的组合物调节。
43.一种用于治疗与基因过量表达有关的癌症的药物，所述基因可被权利要求12-17任一项的组合物调节，所述药物包括权利要求12-17任一项的组合物。
44.权利要求12-17任一项的组合物在制备用于治疗与基因过量表达有关的癌症的药物中的用途，所述基因可被权利要求12-17任一项的组合物调节。
全文摘要
提供与含有一个三联体或GNN三联体的靶核苷酸具有结合特异性的锌指核苷酸结合多肽。还提供含有所述多肽的组合物以及这类多肽和组合物用于调节核苷酸功能的用途。
文档编号A61K38/17GK1896099SQ200610095819
公开日2007年1月17日申请日期1999年10月14日优先权日1998年10月16日
发明者C·F·巴巴斯申请人:斯克里普斯研究学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：C.F.巴巴斯
技术所有人：斯克里普斯研究学院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。