生产纳米结构的材料及其应用的制作方法

文档序号:3549109阅读:394来源:国知局
专利名称:生产纳米结构的材料及其应用的制作方法
技术领域
本发明属于纳米结构,即,在宏观和微观结构的建造中有用的纳米大小的结构。本发明尤其是指基于T4噬菌体尾丝蛋白及其变异体的纳米结构。
背景技术
尽管大多数的金属和陶瓷材料的强度源于他们的组分分子和微晶表面之间的理论粘合强度,但这种强度很大程度上限于材料的晶体或玻璃样结构中的裂缝。这些裂缝通常原材料自身就存在或在制作过程中有所发展,并且他们由于暴露在外界应力下而经常扩大。
纳米技术领域的出现使得传统材料的局限性更为突出。设计和生产很小的能满足复杂功能的结构(即,纳米大小)的能力依靠应用合适材料的使用,这些材料制作起来可预料,可重复,并且具有每个新用途所要求的特性。
生物系统可作为尖端纳米技术的一个范例。活细胞制造蛋白质并把他们装配成完善的结构,能够抵抗正常环境中的破坏。在某些情况下,错综复杂的结构是由一个自我组装的过程产生的,它的指令预先设定于作为组成成分的多肽中。最后,蛋白质须经校对过程以保证高水平的质量控制。
因此,在本领域中对于方法和组合物来说就需要有一定要求,从而利用蛋白质的这些独特性质以形成人工纳米结构的元素。需要的是设计这样的材料其特征能经改造以适合纳米规模技术的特定需要。而且既然大多数宏观结构材料,陶瓷、金属、纤维等的亚单位是基于纳米结构亚单位的结合,那么如果用没有裂缝、位、相精确、均一性好的,如此令人满意的亚单位来制作,当然会提高宏观结构的强度和一致性,这是因为其结构表面更规则,它能在更为广泛的范围内更紧密地相互作用,这是相对其他尺寸较大,异质性较强的材料而言的。
发明概述一方面,本发明为纳米结构提供了分离的蛋白建造块,包括修饰过的T4噬菌体尾丝蛋白。gp34、36、37蛋白以不同方式修饰以便形成具有不同特点的新的杆状结构。可删除特定的内部多肽序列而不影响形成二聚体及与他们的天然尾丝对应物相组配的能力。可选择地,可以这样修饰,以使它们只和其他修饰过的而非天然的尾丝对应物相作用,显示出与它们配体之间的温度敏感型的相互作用;或包含能够使它们与异源结合部分相互作用的附加功能基团。
本发明也包括融合蛋白,这些蛋白包含来自2个或更多个不同的尾丝蛋白的序列。形成一种角连接的gp35蛋白,被修饰后可形成区别于天然平均角度137°(±7°)或156°(±12°)的平均角度,显示出与其对应物之间温度敏感型的相互作用。
另一方面,本发明提供包括天然的和修饰的T4噬菌体尾丝蛋白的纳米结构。纳米结构可以是一维杆状结构,二维多边形, 开放(open)或封闭(closed)的折叠片,或三维开放的笼状物或封闭的实体结构。
附图简述

图1A和图1B是T4噬菌体颗粒(图1A)和T4噬菌体尾丝蛋白(图1B)的图解。
图2显示杆状结构单位的图解。
图3A-3D是如下几部分的图解多单位杆状结构沿X轴的一维连接(图3A);闭合型的简单折叠片(图3B);闭合型的砖房型折叠片(图3C);以及开放型的砖房型折叠片(图3D)。
图4显示用以构建多孔的和致密的折叠片(顶和底)的两个基本单位,当它们交叉层叠的时候,就形成如图所示的一套层叠的笼状结构。
图5显示一个呈120°角的角形结构。
图6显示T4噬菌体基因34、35、36和37的DNA序列(SEQ ID NO1)。
图7显示T4噬菌体基因34(SEQ ID NO2,ORFX SEQ IDNO3),35(SEQ ID NO4),36(SEQ ID NO5)及37(SEQ ID NO6)基因产物的氨基酸序列(以单字符表示)。氨基酸序列(每一对的下线)是和核苷酸序列(每对的上线)呈线性对应的。应当指出的是从基因35(从NCBI数据库)推导出来的蛋白序列据信并不准确。
图8A-8B显示从一个自组装形成二聚体的分子形成一个P37二聚体启动因子(图8A);从一个自组装形成三聚体的分子形成一个P37三聚体启动因子(图8B)。
图9显示从一个自组装二聚体的启动因子形成多聚体(P37-36)n。
发明详述所有专利,专利申请和说明书中引用的参考文献在此全部引入作为参考,在不一致的情况下,以本公开内容为准,包括定义。
虽然本发明用T4噬菌体尾丝蛋白的术语来描述,但它必须被理解成本发明也适用于其他T-偶数噬菌体的尾丝蛋白,例如,T4家族(例如,T4,TuIa,TuIb)的尾丝蛋白,T2家族(T2,T6,K3,OX2,M1等等)的尾丝蛋白。
定义“纳米结构”此处定义为这样的结构不论其大小、形状如何,只要由纳米大小的蛋白组分组装而成。
“嵌合体”此处定义为嵌合蛋白,这些蛋白中至少氨基末端和羧基末端区域来源于不同原始多肽,不论此原始多肽是自然存在或是已由诱变而被修饰。
“同源二聚体”此处定义为两个基本上一致的蛋白亚基的组装物,它们形成一种特定的三维结构。
“gp”是指一种单体多肽,而“P”表示同型寡聚物。P34,P36和P37可能是同源二聚体或同源三聚体。
“基本上由”一个特定的氨基酸序列组成的一种分离的多肽此处定义为一个含有特定序列的多肽或序列内包含保守替换的多肽。保守替换,本领域普通技术人员知道,这种替换是指一种酸性残基替代另一种酸性残基,一种碱性残基替代另一种碱性残基,或一种疏水残基代替另一种疏水残基。当特定残基的缺少不会在使用本发明的实践中对多肽的结构或功能产生明显影响时,这种在氨基末端或羧基末端缺少一个或多个但总共不超过5个氨基酸的多肽也包括在内。
本发明属于一种新型的蛋白构建块,其大小在纳米水平,其对构建微观和宏观结构是有用的。若是不被理论限制的话,可以相信此基本单元是一种由两个相同的具有交叉-β构型的蛋白亚单位组成的同源二聚体,尽管一种三聚体结构也可能包括在内。因此,显而易见,在此所用的“同源二聚体”或“二聚化作用”的有关说法将在许多例子中可被演绎推论到“同源三聚体”或“三聚作用”。这些又长又硬,而且稳固的杆状单元能通过偶合元件与其他杆状结构组合,偶合元件可通过遗传操作或体外方式连进去。这种装置能使一种杆状结构的末端可能与其它杆状结构或相似杆状结构的不同末端相连结。杆状结构长度的选择性,连接物角度的多样性,以及他们的柔韧性允许形状各异的结构在原位自组装。用这种方式这些单元能够自我组合成预定的一维,二维或立体的较大的结构。这种自我组合可以控制以形成构象精确、强度均一的结构,因为此结构的成分是无裂隙的生物产品。此杆状结构也可经遗传和化学的修饰以形成预定的针对其他化学本体的特异性结合位点,从而使复杂结构的形成成为可能。
本发明的一个重要方面是此蛋白单元能被设计成包含不同长度的杆状结构,可被进一步修饰以包含一些特征,这些特征以预定方式改变表面属性和/或影响他们与其它相同或不同单元连结的能力。并且,此自我组合方式的能力可通过产生嵌合蛋白得以扩展,此嵌合蛋白综合了其不同成员的性质。此设想的特征通过操作编码这些蛋白的基因结构而得以实现。
如下所述,本发明的组成和方法得益于天然蛋白的性质,即,由本发明得出的结构,在水介质中,紧密、结实、稳定、耐热、抗蛋白酶,并且能做成生物可降解性的。可以用微生物容易地生产大量的单元。并且,为了组装更简化,大量的组分和部件可以被贮存起来在需要的时候使用。
此蛋白亚单位的序列是以大肠杆菌的T4噬菌体尾丝蛋白的组分为基础的。可以理解为此规则和技术也适用于其它T-偶数噬菌体的尾丝蛋白或其他有关的有相似的尾和/或纤维结构的噬菌体。
T4噬菌体尾丝的结构(见图1)以图解方式描述如下(N=氨基末端,C=羧基末端N[P34]C-N[gp35]C-N[P36]C-N[P37]C.P34,P36和P37都是紧密的,杆状蛋白同源二聚体,此二聚体是由两个相同的β折叠片以的相同方向组成的,它们通过邻近片段之间的疏水作用面对面融合起来,这些邻近片段具有通过杆状结构长轴180°的旋转对称。(如果P34、P36和P37是同源三聚体,此结构将会改变)。相比较而言,gp35是一种单体多肽,它特异地连接P36的N-末端;而后再连接到P34的C-末端,形成两个杆状结构之间的成角度的连结。T4感染大肠杆菌期间,两个gp37单体二聚化形成P37同源二聚体,据信此二聚化过程开始于P37C-末端附近并且需要二个大肠杆菌伴侣蛋白。(本发明中所用的一种位于C-末端附近具有温度敏感性突变的gp37变异体,只需要一种伴侣分子即gp57,即可发生二聚化作用)。一旦发生二聚化作用,P37的N-末端即可启动两个gp36单体聚合成一种P36杆状结构的聚合作用。在P36C-端和P37N-端之间的连结是紧密牢固的,却是非共价键。然后P36的N-端与gp35单体连接;这种相互作用使P36稳定,并且形成此尾丝的肘。最后,pg35与P34(就是它利用了gp57进行的二聚化作用)的C-端连结。因此,尾丝自组装是通过特定亚单位预定的顺序进行相互作用来调节的,而由当初待组装成分的形成所引发的结构成熟过程允许与新的亚单位发生相互作用(先前则不允许)。这将导致从这些组分的随机混合物中产生出一种具有精确规格的结构。
依据本发明,编码这些蛋白的基因可以被修饰以生成具有不同长度、不同末端组合的杆状结构。从这一点来说天然蛋白的性质尤其具有优势。首先,此β-折叠由反平行β-束组成,左(L)右(R)边缘有β-转角。第二,此氨基酸侧链在折叠平面上下交错出现。第一种特性允许弯曲被延伸以形成介于左表面和右表面之间的对称及特异性的结合位点,以及其它结构的结合位点。另外,β-折叠片的核心部分可通过遗传学操作缩短或延长,例如通过在折叠片的同一侧缘拼接编码β-转角的DNA区域以形成不包含插入多肽的新的弯曲,或以类似方式在转角处拼接以插入多肽片段。第二个性质允许伸出β-折叠片表面上下方的氨基酸侧链通过遗传置换或化学偶合方式进行修饰。重要的是,完成以上所述的所有修饰并不破坏杆状结构的结构完整性。本领域的技术人员知道,这些性质使得单元的设计具有很大的灵活性,可以装配出一系列的结构。其中的一部分将在下文加以详述。结构单元本发明中杆状结构的功能类似于建筑中木质的2×4中间柱或钢梁。在这种情况下,此表面在分子水平是严格可重复性的,从而能够符合与相似或不同的杆状结构单元的特定位点的特异结合。这些表面也可经修饰以增强或减弱其亲水性,包括正电或负电基团,可以设计一些突起以特异结合于其他单元,或结合到具有两个接受位点的中间连接结构上。杆状结构的表面和杆状结构单位的图解如附图2所示。杆的三维定义为x,指从后(B)向前(F)的方向,y指从下(D)向上(U)方向;z指从左(L)到右(R)方向。
单个的杆状结构单元最容易沿着X轴相互连接形成一维的多单位杆状结构(图3A),但是亚基沿其他两个方向有规则地结合亦可形成一个长形的结构,与x轴方向相比,其交叉部分不同。
二维构建是指杆状结构沿任意2个轴相互作用形成的折叠片。1)闭合型单折叠片由杆状结构的表面沿任意两个轴方向(图3B)精确重叠而形成。2)闭合的砖房样折叠片是通过单元之间这样的相互作用而形成在一个方向上是精确的表面重叠,在另一个方向上则是某种特殊类型的重叠(图3C)。在这种情况下必有两套不同的互补连结,二者之间相距有严格的1/2个单元长度。如果它们被放在中间(例如,每套距末端1/4单位长度),那么,每个连接点将在单元上面或下面的中心点。如果它们相互抵消了,那么此连接也同样将互相抵消。在这种构造中,互补作用部位可用·和··来简要表示。如果每个作用部位自身都是对称的,则交错的行能与杆状结构在两个方向上进行相互作用。如果它们不对称,则只能与方向与这相同或相反的相互作用行发生作用,如此折叠片将由单一向的杆状结构或顺反层叠的杆状结构组成。3)开放砖房型折叠片(或网)产生于当这些单元被分离到相距大半个单位时(图3D)。开口(或微孔)的大小取决于相互作用部位之间距离(dx)和这些位点分散于表面上的距离(dy)。
三维结构需在三个表面上都存在适配的立体相互作用,方可形成实体。1)闭合实体由三个方向上精确重叠的单位组装而成(如,闭合型简单折叠片的精确重叠)。以同样方式,闭合砖型折叠片可由折叠片的精确重叠,形成封闭实体,或通过置换作用使砖房形结构具有三维特性。这要求在该单元的所有3对平行面上都有适当的成套的连接。2)多孔实体由开放性砖型折叠以不同方式连接而成。例如,如果单元在第三维空间精确重叠就会形成伴有尺度精确的小孔列阵图的实体,孔沿纵轴方向与纸面垂直。换句话说,就是需要一种闭合表面,在Z轴方向(即,从上往下方向,U→>D方向)有一定厚度的层叠。一种简单的封闭折叠片撂在开孔的砖房折叠片上以封闭那些小孔。如果开放砖房型折叠片的重叠部分是1/4单位,那么长度为3/4个单位的杆状结构将用以制造此折叠片。于是在第3维即Z轴方向就需要连接了。用以聚合形成这些交错片层的两类单位,及片层本身,如图4所示。
以上所有的结构由简单的线性杆状结构组成。另一种结构单元,角单元将使可能结构的类型和方向增多。此角单元以180°以外的角度连结两个杆状结构,类似于一个角状铁的作用,其平均角度和刚性水平内化在此连结结构当中。例如,附图5所示的结构有一个120°角,a和b处分别有一个特定结合位点。以下是几个结构实例,是以角连接形成结构的例子。
1)开放型砖房状折叠片通过加上与折叠片垂直的角得以在杆状结构长轴方向垂直的方向上扩展和加强。这样,一种三维网状结构就形成了。以90°角与杆状结构末端的连接形成的角几乎在折叠片的平面内,新的杆状结构又可以加到这些角上(这些角必须与它相连接的原始折叠片平面也成一定角度),形成新的折叠片。这些折叠片接近平行,与相邻的上面的或下面的片垂直。
2)六边形是由杆状结构和呈120°角的角连接的混合物制成。这样,就有了两套专门的连结。每套由此杆状结构两端之一和角上的两个互补位点之一组成。从六边形有一个方向(顺或逆时针)这个意义上讲,这是一个线性结构,连结此六边形的边就能把此六边形制成一种二维的开放网结构(即,一种二维蜂窝状结构)。将下面的六边形的顶端和上面的六边形的底面接合就能制成一种六边形截面的管状结构。如果把它们的边也连接起来,就能形成一种开放三维多重六边形管3)螺旋形六边形管与六边形形成类似,只是第六个结构单位没有与第一单位连结起来以封闭此六边形。取而代之,此末端从六边形平面上转移出来,第七和更靠后的单位接上去形成一种六棱形管,如果在螺旋线的单位之间有很少或没有附着力的话,此结构就能形成一种弹簧样的结构,如果有一种力量保持并列单位靠近的话,此六棱形管状结构会是一种很紧密的杆状结构。
对本领域的技术人员来说,本发明的组成和方法也适用于其它多边形结构,例如八边形结构,以及开放实体,象由三角形形成的四面体、二十面体,由正方形和长方形形成的盒状物。结构的范围仅受限于角单位类型以及通过工程方法在杆状结构单位的不同轴上实现的替换。例如,其它自然存在的角已发现于T7噬菌体的尾丝上,此尾丝有一个90°角(Steven等.J.Md.Biol.200352-365,1988)。
杆状结构蛋白的设计和生产用来构建本发明的纳米结构的蛋白亚单位基于四种多肽,这四种多肽包括T4噬菌体尾丝蛋白即gp34,gp35,gp36和gp37。编码这些蛋白的基团已被克隆,它们的DNA和蛋白序列已被测定(基因36和37见Oiver等.分子生物学杂志,153545-568,1981)。g34,35,36和37的DNA和氨基酸序列在图6和图7中说明。
完整的T4噬菌体颗粒感染大肠杆菌细胞,gp34,gp35,gp36和gp37会自然发生。接下来在细菌细胞的细胞质中进行的合成,此gp34,36和37单体形成同源二聚体,此二聚体能够组装形成成熟噬菌体颗粒。因此,大肠杆菌可用作有效率和方便的工厂,这个工厂可进行如下所述的蛋白亚单位的合成和二聚化作用。
在本发明的实际操作过程中,编码目的蛋白的基因(天然的,修饰的,或重组的)被整合进本领域中所熟知的DNA表达载体中。这些环形质粒通常包含选择性标记基因(通常使转化菌具备抗生素的耐受性)以及允许质粒在大肠杆菌进行高拷贝数复制的序列,在紧接着可诱导型启动子和核糖体结合位点的下游有一个多克隆位点。适用于本发明可作为商品购买得到的载体的例子包括pET系统(Novagen,Inc,Madison.WI)和超级连接物载体pSE280和pSE384(Invitrogen、SanDiego、CA)策略是1)构建目的基因并将它克隆到多克隆位点;2)用重组质粒转化大肠杆菌细胞;3)诱导克隆基因的表达;4)检测蛋白产物的合成;以及最后5)检测功能同源二聚体的形成。有时,目的蛋白的二聚化需要其他蛋白的参与,则有关基因也被克隆到同一质粒中。例如,在表达野生型或经修饰的gp37时,也同时表达细菌伴侣分子基因57;当表达野生型或修饰型gp36时,也包括gp37基因的野生型或修饰型版本的表达。修饰后的gp37应有二聚化的能力,含有一个充当gp36二聚化伴侣作用的N-末端。本方法促进单体基因产物的形成,在缺失通常存在于T4感染细胞中的其他的噬菌体诱导蛋白的情况下,本方法也能使单体成熟为同源二聚的杆状结构以上所说策略的第1-4步通过DNA重组技术和细菌蛋白表达领域中常用的方法来完成。例如,在步骤1中,在多克隆位点用限制酶剪切,紧接着进行片段连接,这些方法被用于gp34,36及37杆状结构片段内部缺失突变的构建(见如下实施例1)。或者,用单一或多个限制性酶切,接着用核酸外切酶消化(EXO-SIZE,New England Biolabs,Beverly,MA)被用来从最初切点处的一端或两端造成DNA序列的缺失;当再接上连接步骤时,此过程产生一套巢式的缺失突变,缺失的范围逐渐增大。同样,也用这些基本技术重组两个不同的尾丝基因的DNA片段,以生产编码融合蛋白(在本说明书中称“嵌合体”)的嵌合基因。总的来说,将用这项最新技术提供待用的N-或C-末端,产生新的末端组合,以形成不同杆状结构片段新类型的连接。这种类型嵌合体的一个代表,gp37-36的融合,将在实施例2中进行叙述。生产这类蛋白(步骤2)优选的宿主是大肠杆菌菌株BL21(DE3)和BL21(DE3/pLgsS)(可自Novagen,Madison,WI购得),当然其他兼容性recA菌株,如HMS174(DE3)和HMS174(DE3/pLgsS)也可以用。重组质粒的转化(步骤2)也是用常规方法完成的(Sombrook,J,分子克隆,冷泉港实验室,冷泉港,NY;这也是本发明中常规DNA重组技术的依据)。转化子的筛选是根据它们对抗生素的抗性,例如,氨苄青霉素或卡那霉素。诱导克隆的尾丝基因表达(步骤3)的方法取决于所用的特定启动子。优选的启动子是plac(载体上有一个1aciq,以减少本底表达),可以加异丙基硫代半乳糖苷IPTG对它进行调控,第二个优选启动子是pT7φ10,它是T7RNA聚合酶特异性的,不被大肠杆菌RNA聚合酶识别。对利福霉素有抗性的T7 RNA聚合酶,是整合在大肠杆菌BL21染色体上的溶源性缺陷型λDE。BL21(DE3)上的T7聚合酶被质粒上的1aciq基因超限抑制,可用IPTG进行诱导和调控。
通常情况下,细菌转化子的培养物在有诱导剂存在的情况下孵育数小时,在此期间,目的蛋白的合成受到监测。在本例中,提取细菌细胞的抽提物,以检测T4尾丝蛋白,如,用聚丙烯酰胺凝胶电泳(SDS-PAGE)。
一旦被修饰的蛋白在细菌提取液中被检测到,就有必要查明此蛋白是否形成适宜的同源二聚体(步骤4)。这最初是经过检测此蛋白是否能被特异性的抗此蛋白的成熟二聚化物的抗血清识别来完成的。
尾丝特异性抗血清按下述方法制备(Edgar.R.S.andLielansis,I.,遗传521187,1965;Ward et al,分子生物学杂志5415,1970)。简而言之,整个T4噬菌体被用作一种免疫原;可选择地制备的抗血清用无尾噬菌体颗粒选择性的吸收,从而除去针对尾丝蛋白以外的所有抗体。接下来的步骤中抗血清的不同等分试样分别用缺少一种特定尾丝蛋白的提取液吸收。例如,一种提取液只包含尾丝成分P34,gp35和gp36(来自用缺少一种功能性gp37基因的突变体T4感染的细胞),如果这种提取液被用作吸收,则制得的抗血清将只能识别成熟P37和二聚化P36-P37。一种替代的方法,可被用来制备单独的抗血清,这种用分别含有远端的半截尾丝或P34,gp35和P37的提取物进行吸收的办法制备的抗血清仅能识别成熟的(例如同型二聚化的)P34和P36。另一种办法是用纯化的尾丝组分制备抗体,例如P34和gp35-P36-P37。抗gp35-P36-P37的抗体随即能被P36-P37吸收以产生抗gp-35,用P37和gp35进行吸收以产生抗-P36。抗-P37,抗gp-35和抗-P34用提纯的P37,gp35和P34用作免疫原也能被直接生产出来。另一方面是生产抗不同尾丝成分或其片断的特异性单克隆抗体。
在下述所有检测尾丝蛋白是否正确二聚化的方法中都要用到亚单位或尾部分的特异性抗体。1)筛选那些能表达成熟尾丝蛋白的菌落所用的方法是通过直接将此菌落,或被溶解或未被溶解培养物样品二者之一转移到硝酸纤维素滤膜,如果有必要就在滤膜上裂解这些细菌细胞,进而用特异性抗体孵育。接着使用在本领域广泛使用的方法(例如,第二抗体结合一种生色酶或放射标记的葡萄球菌蛋白A)检测这些免疫复合物的形成。这种方法特别适用于筛选大量菌落,例如,如上所述的由EXO-SIZE缺失产生的菌落。2)表达相关蛋白的细菌细胞首先利用35S-蛋氨酸进行代谢性标记,随即制备提取物,然后用抗血清孵育。通过与固相化的蛋白A孵育,离心收集免疫复合物,而后它们可能通过聚丙烯酰胺凝胶电泳得以区分。
尾丝蛋白的内部缺失使噬菌体失去感染能力,为了解它是否仍保留着二聚化及和其他完整的对应物组合的能力,用了一个替代的竞争抑制试验进行检测,试验应用了体外的互补系统。1)如上所述的一种细菌提取液包含被修饰的目的蛋白,此提取液与另一种由目的基因突变了的T4噬菌体感染的细胞制备的提取液混合。2)孵育几小时后,加入第三种提取液,此提取液包含被检测蛋白的野生型版本,然后继续孵育几小时。3)最后,经过感染大肠杆菌和确定得出的噬菌斑数来确定提取物中感染性噬菌体颗粒的效价。一种经修饰的尾丝蛋白被正确地二聚化,它能够与它的对应物连接,这种尾丝蛋白在步骤1中以无功能方式整合在尾丝中,从而在步骤2中阻止了此蛋白的野生型版本的整合;结果是得到的噬菌体样品效价下降。相反,如果此经修饰蛋白不能二聚化,那么就形成正确的N-末端或C-末端,在步聚1中此蛋白就不会整合进噬菌体颗粒,从而不会与步骤2中的完整噬菌体颗粒竞争组装;噬菌体效价就会与步骤1中没有加入经修饰的蛋白(阴性对照)时观察到的效价相等。
另一种检测方法是检测嵌合体的内部缺失尾丝蛋白是否保留了二聚化能力和与它们合适对应物相结合的能力,此方法是用体内试验进行的。此试验检测到这些嵌合体和缺失蛋白具有与正常噬菌体部分竞争组装的能力,因而用野生型噬菌体感染在其中嵌合体或缺失蛋白已得到重组表达的同一宿主细胞,结果释放野生型噬菌体的数目会减少。这样,一种表达在细胞中被诱导,这种表达来自编码此嵌合体或缺失蛋白的表达载体,在这种情况下,细胞用野生型噬菌体感染的。野生型噬菌体的产生受到抑制证实了重组嵌合体或蛋白与噬菌体的正确的尾丝蛋白组装的能力上面所述方法在设计和制造不同类型被修饰尾丝蛋白时被单独或联合起来使用。例如,对大量菌落进行的初筛,能确定表达了正确二聚化蛋白的阳性菌落,此菌落随即经过体外互补试验被逐一检测出来。
本发明包含的新蛋白的非限定性实例包括1)内部缺失的gp34,36和37多肽(见下文中的实施例1);2)C-末端截短的gp37融合到N-末端截短的gp37的N-末端;3)gp36和gp37的融合蛋白,其中gp37以N-末端连到gp36(即与天然顺序相反);此处称为“gp37-36嵌合体”(见下文实施例2),4)gp34和gp36的融合蛋白,其中gp36以N-末端连到gp34(即与天然顺序相反),此处命名为“gp36-34嵌合体”;
5)一种gp36的变异体,它的C端发生突变以致于使它缺失了与野生型P37的N端相互作用(以及与之发生二聚化作用)的能力,此处命名为“gp36*”;6)一种gp37的变异体,它的N端发生突变以致使它形成了一种缺少与野生型gp36的C-端相互作用的能力的P37,此处称“*P37”;7)gp36*和*P37的变异体能相互作用,但不能与gp36或P37相互作用。
8)一种“P37-36嵌合体”的变异体,其gp36部分是从5)中的突变体得到的,即,“P37-36*”。(5-8,见如下实例3)9)一种“P37-36嵌合体”的变异体,其gp37部分是从上面6)中的突变体得到的,即“*P37-36”。
10)一种P37-36嵌合体的变异体,*P37-36*,其gp36和gp37部分是从7)中变异体得来的。
11)gp36和gp34的融合蛋白,其中gp36序列是将N-端连到gp34,其二聚体在此称为“P36-34嵌合体”。
12)gp35的变异体形成不同于137°或158°(天然的角度)的平均角,例如,当野生型gp35蛋白与P34及P36-P37二聚体结合形成137°角,和/或显示出比天然多肽更大或更小的柔韧性的情况下,gp35变异体形成的平均角就会小于约125°或大于约145°。
13)gp34,35,36和37的变异体表现出与它们的同源对应物相互作用时的温度敏感性或其它的变异体特异性相互作用。
14)gp37的变异体,其多肽的C-末端结构域经修饰后含有确定整个分子特异性识别性质的序列。例如,来自识别生物素的亲和素蛋白的序列,来自免疫球蛋白的重链能识别葡萄球菌蛋白A的序列,来自单克隆抗体的Fab段的重链部分的序列,若和它们各自的Fab对应轻链部分结合则可形成一个抗原结合位点,能识别特异抗体的免疫反应性序列,或结合特异金属离子的序列。这些配体可以固相化以便于提纯和/或装配。
在特定的实施方案中,本发明的嵌合体包括两部分,一部分由第一种尾丝蛋白的至少前10(N-端)个氨基酸组成,第二部分由第二种尾丝蛋白的至少后10(C-末端)个氨基酸组成,这两部分通过肽链连接起来。第一和第二种尾丝蛋白可能是同一种或不同种蛋白。在另外一个实施方案中,嵌合体包括一个尾丝蛋白的前10~16个氨基酸部分融合到第二个尾丝蛋白的最后10~16个氨基酸部分。从另外一个实施方案中,每个氨基酸部分至少有此尾丝蛋白的20个氨基酸。此嵌合体包括互相融合的几部分,即非全长的尾丝蛋白相互融合。从优选的角度,此嵌合体的第一个尾丝蛋白部分来源于gp37,第二个尾丝蛋白部分来源于gp36。这样的嵌合体(gp37-36嵌合体)在寡聚化形成P37-36后,可与其它相同的寡聚物聚合。gp36-34嵌合体经寡聚作用形成P36-34后可与gp35结合,形成的这个单位能多聚化。在另外一个实施方案中,第一部分来自gp37,第二部分来自gp34。从优选的角度,本发明中的嵌合体是由插入或缺失尾丝蛋白β-结构的一个β转角来完成的。最优选地,插入一个尾丝序列,或融合到另一个尾丝蛋白序列上(优选通过重组DNA水平的操作以产生所想要的编码蛋白),以便在β-折叠同一边的β-转角中的序列相互交联。
除了上述嵌合体外,本发明的纳米结构还包含尾丝蛋白的缺失型,它们的一端被截短,如缺失分子的氨基端或羧基端(至少5到10个氨基酸)。这种氨基端截短的分子如截短的gp37,gp34或gp36,可用于纳米结构的“封顶”(“cap”),因为,一旦掺入,它们将终止聚合。这些分子更好的形式是包含尾丝蛋白的一个片段,而这种尾丝蛋白缺少氨基末端10,20或60个氨基酸。
为了按需要改变杆状组份蛋白的长度,相同或不同尾丝蛋白的部分序列可插入尾丝嵌合体中以延长杆状分子,或从嵌合体中删除以缩短杆状分子。将单独的杆状结构组份装配成纳米结构本发明的蛋白在大肠杆菌中如上述方式表达导致了大量蛋白的合成,并允许同一细胞中不同成分的同时表达和装配。重组蛋白的大规模生产方法较简单,技术广为人知,有许多标准操作程序可用来从细菌培养液中回收天然及修饰尾丝蛋白。
在一个优选实施方案中,基因36上有一个琥珀型突变的T4噬菌体在(不含琥珀型抑制)SU°细菌品系中生长,天然(非重组)gp35可用标准方法从培养基中纯化。
g34,P36-P37,p37及它们的嵌合体从大肠杆菌培养基中纯化出来后是成熟的二聚体。GP35及其变异体纯化出来后是单体。纯化由以下步骤或其组合而完成,使用标准方法1)分子筛层折,离子交换,和/或疏水基质层折;2)制备超离心以及3)亲和层折,使用特异性抗体或其它特异性结合部分作固定配体。如P37的C-末端区与大肠杆菌B的脂多糖结合。其它T4类噬菌体有P37类似物,可结合其它细胞表面成分如OmpF或TSX蛋白。或者,蛋白质通过工程改造使其带有异源区域,此异源区可作配体或结合位点,相关对应物固定于固相基质用于亲和纯化。如生物素可作为异源区,它可结合到链霉亲和素包被的固相载体上。
或者,几种成分在同样的细菌细胞中共表达,在仅限于体内的装配以后,使用上面列举的方法,纯化了更大纳米结构的装配部件。
然后,纯化的各组分在体外条件下组合。装配成所需纳米结构,温度在约4~37℃之间,pH在约5~9之间。对一个特定的纳米结构,装配的最佳条件(如盐和金属离子的种类及浓度)可容易地由常规试验确定,如单独变动各可变因素,并监测正确产物的形成状况。
可替换地制备一或多种细菌粗提液,混合之,装配反应在纯化之前进行。
在某些情况下,一种或多种纯化的组分可自动装配成所需结构;这一过程不需启动因子。其它情况中,启动因子是必需的,它可在杆状或折叠片分子的聚合中起成核作用。这为装配过程的定位(如启动因子是固定或定位的)及调控最终结构的大小提供了便利。如含有一个功能性P36羟基末端的杆状结构组分需一个功能性P37氨基末端,以化学计量方式启动杆状结构的形成;这样,改变启动因子和杆状结构组份的相对数量,即可调节杆状聚合物的平均长度。如果比例是n,杆状结构的平均长度约为(P37-36)n--N-末端P37-P37C-末端。
在另外一些情况中,最终的纳米结构由两种或多种成份组成,它们不能单独自我装配,而只能相互结合。这种情况下,可以筹划变更装配循环以得到有精确结构的终产物(见下面的实施例6B)。
使用了固定化启动因子,则阶段性装配以后易于从基质上除去聚合结构。为此目的,设计了特殊的启动因子,使其与第一个杆状结构组份的作用受热影响而可逆(见以下例5)。这样,聚合物可容易地与结合在基质上的启动因子分离,于是允许1)可容易地制备均一成份或装配部件的贮存液。2)在聚合的启动、生长、释放的多轮循环中,基质结合的启动因子可重复使用。
在一个通过gp34(或P34)连于固相基质的纳米结构的装配实例中,将纳米结构脱离进入溶液的一种方法是使用突变gp34(温度敏感型),它可用于在较高温度下使纳米结构脱离(如40℃)。这一种突变gp34,命名为T4tsB45,在其羧基端有突变,这样P34在30℃时可连接在尾丝末端,但在体外40℃存在1%SDS情况下,可从中脱离出来(不象野生型T4那样在这些条件下都能稳定结合)。这一技术目前已获报道并具实用性(Seed,1980,T4噬菌体近侧一半尾丝的研究哲学博士论文,加利福利亚技术研究所)。
能催化蛋白质正确稳定二级(20)结构(最低能量状态)的形成的蛋白质叫分子伴侣,(经常地,特别在球蛋白中,三级结构可促进这种稳定性,如β-折叠可能通过在β-套筒(barrel)中相互作用或与α-螺旋作用而稳定)。一般来说,分子伴侣可阻止不正确的链内或链间相互作用,这些相互作用可导致不利的、相对不稳定的折叠的中间体的产生,阻止或延缓正确折叠。在T4噬菌体尾丝的形态发生中有两种广为人知的辅助蛋白,gp57和gp58,有时叫分子伴侣,它们对蛋白多聚体的正确装配是必需的,但并不出现在终结构中。
通常的分子伴侣系统(如groEL/ES)和基因产物的特定寡肽相互作用,以阻止它们与同一或不同多肽链的其它寡肽部分的不正确作用,否则会形成次稳定的折叠中间体而延缓或阻止多肽链正确折叠成天然状态(能量较低状态)。
Gp57,主要结合一些膜蛋白,具有并列(及排列)和/或起动2或3个相同gp37分子折叠的功能。排列的肽链锁合成粱(可相互稳定其初生β-结构),并不需要与gp57进一步作用。Gp57在T4的装配中,不仅在gp37的寡聚化中起作用,在gp34和gp12的寡聚化中也有功能。体外自装配成粱结构的组份除了使用体内生成的启动因子如预先形成的嵌合或天然寡聚单位来起动嵌合体的聚合外,能自我装配的分子(尤其是肽类),可做成融合蛋白,融合到本发明的尾丝变体的氨基端或羧基端(嵌合体,缺失/插入构建体),这样就并列其末端,也可在体外利于它们的无辅助折叠,生成寡聚的,稳定的β-折叠杆状(粱)单位,纵然没有正常折叠所需的分子伴侣(例如,gp57)及宿主细胞膜蛋白。
拿P37作为gp36-37寡聚和多聚的启动因子来说明,一般来说,gp37正确折叠成P37启动因子需噬菌体感染的细胞膜及两种伴侣蛋白分子gp38和gp57。在一个优选实施方案中,通过突变可以不必使用gp38,ts3813(gp37转变区下游紧邻的7残基重复突变体)可抑制基因38(WOOD.W,B,F.A.Eiserling和R.A Crowther,1994,长尾丝基因、蛋白、结构和装配在T4噬菌体分子生物学(编者JimD.Karam)美国微生物学协会华盛顿区,第282~290页)。如果一个能自我装配成二聚体,三聚体或其他寡聚体单体的部分(“自装配组分”)融合到C-末端缺失的gp37的转变区域的上游或下游[转变区是T4类尾丝蛋白中一个保守的17个氨基酸残基区,蛋白结构在此区窄成一根纤细的尾丝,参见henning等1994年的T-偶数型大肠杆菌噬菌体的受体识别在T4噬菌体的分子生物学杂志中,karam(编者),美国微生物学协会,华盛顿区,第291-298页;wood等1994年的长尾丝基因、蛋白、结构和装配在T4噬菌体的分子生物学中,编者karam,美国微生物学协会,华盛顿区,282~290页],自装配分子表达后,它们将平行聚集,使融合gp37肽链并列,使它们在无其他伴侣分子的情况下在体外折叠。
如果P37是二聚体(图8A),自装配部分可以是自体二聚肽段,象亮氨酸拉链,由酵母转录因子GCN4的250~281残基组成(E.K.O.shea,R。RutkowsKi和p.s.kim,《科学》243538,1989)也可是自体二聚的突变亮氨酸拉链肽pIL,其中a位用异亮氨酸代替,d位用亮氨酸替代(Harbury P.B.,T.zhang,P.S.Kim和T.Alper.1993.《GCN4亮氨酸拉链突变体中二、三、四链卷曲螺旋的相互转变》《科学》262期,1401~1407页)。如果P37是三聚体(图8B),自装配部分可以是自体三聚的突变亮氨酸拉链PII,其中a和d位都由异亮氨酸替代(Harbury P.B.等ibid)。可替代地,胶原蛋白也可用作自装配部分,如Bella等所述CJ.Bella,M.Eaton,B.Brodsky和H.M.Berman1994胶原蛋白类肽1.9A分辨率的晶体及分子结构。科学226期,75~81页)。它们可以通过靠近中心部位插入的特异性非重复丙氨酸残基而并列聚合。
在没有常规的启动因子情况下,自装配部分可用作多聚反应的启动因子。例如为嵌合单体的寡聚和多聚反应生成启动因子,gp37-36,gp37-36-C2如图9所可用作启动因子。(C2指二聚体形成肽链融合到gp36部分的羧基端。如果粱结构是二聚结构用C2,否则用C3-三聚体形成肽链融合到gp36羧基端)。更进一步可利用大肠杆菌Cac的阻遏蛋白氨基端,靠着每个方向相互靠近的两个螺旋,使二聚体(或其多聚体)的末端相连形成四聚体,是氨基端还是羧基端相连取决于自装配肽段放置在哪一端。它们也可连接氨基端和羧基端。任何情况下,它们单独只能形成二聚体,二聚体的每端都可通过加入合适的嵌合体单体而延长(如图9中较简单情况所示)。
在一个可替代的实施方案中,自装配部分可融合到嵌合体的氨基端。在一个特的实施方案中,自装配部分融合到T-偶数样尾丝蛋白至少10氨基酸部分上。
也可使用能自装成异源寡聚体的自装配部分。例如粱的多聚反应由二聚β-交叉表面所指导,加入异源二聚体,它的表面不会促进进一步的聚集,这样可以很方便地封闭倒数第二个亚基而终止聚合。如果自装配部分两类螺旋区之间的作用力大于它们本身之间的作用力,那么所有的二聚体都将是异源二聚体。Jun和Fos氨基末端的亮氨酸拉链就是如此。
这种异源二聚体更有利的一面是它能使聚合反应阶段化,这样一次只组成一个单位(或二维排列的一个表面)。如假定A表面和B表面亲和但本身之间无作用(〔A←→B〕用来代表这种作用)。混合A/A和B/B0(B0连在基质上,以便于纯化)。这样就会形成B0/B-A/A。洗掉A/A,加入B/B,将组成B0/B-A/A-B/B0。加入A/A0。将组建成B0/B-A/A-B/B-A/A0,这样任何杆束也加不进来了。当然还有许多其他可能性。应用本发明的纳米结构的用途多样,包括需高度规则、精确定位的纤丝、笼或实体的应用,这些东西有特异作用位点,使它们能与其他物质相互作用。
在一个实施方案中,三维六边形排列的管可用作分子筛或分子滤器,提供了精确直径的规则垂直孔,用来按颗粒大小选择分离。这种滤器能用于溶液消毒(如除菌或病毒)或作为一组按分子大小截留的滤器。在这种情况下,孔道的蛋白组分可作修饰以提供特殊表面性质(即亲水性和疏水性,结合特殊配体的能力等)。这种过滤装置的优越性在于孔径的均一性和直线性及孔道对基质的高比例。
在另一个实施方案中,一维长纤丝可掺入如纸或水泥或塑料中以增加湿态或干态的弹力。
在又一个实施方案中,不同排列的纳米结构可浸入纸或织物中,作为防伪标志。在这种情况中,一种简单的显色抗体反应(如商业化的试剂盒)即可验证特质来源。或者,这种纳米结构排列可结合染料或其他物质,在整合前后,使纸张或织物着色或改变其外表或其它方面的性质。试剂盒本发明也提供制造纳米结构的试剂盒,试剂盒在一或多个容器中包含本发明的嵌合体及缺失体。如一种这样的试剂盒里包含一或多种盛有纯品gp35和纯品gp36-34嵌合体的容器。另一种这样的试剂盒里包含纯品gp37-36嵌合体。
以下的例子不限范围地说明本发明。
在以下的实施例中,所有的限制酶、核酸酶、连接酶等都可从各种商业渠道购得,如新英格兰Biolab公司(NEB).Beverly.M.A;生命技术公司(GIBCO-BRL),Gaithorsburg MD;及Boehringer Mannheim公司.(BMC),Indiannapolis,IN.实施例1内部缺失P37的设计、构建和表达gp37的编码基因有两个BglII限制酶切位点,第一个切点位于293核苷酸后,第二个位于1486核苷酸后(核苷酸从起始甲硫氨酸密码子ATG开始计数)。这样,用BglII消化gp37编码DNA片段,切除掉中间片段(从核苷酸294到1485),再连接5′和3′片段,这样形成了内部缺失的gp37,用ΔP37表示,其中精氨酸98和丝氨酸497相连。
限制酶消化混合液含有gp37质粒DNA(1μg/μl)2μlNEB缓冲液2(10x) 1μlH2O 0μlBglII(10U/μl) 1μlgp37质粒指基因37插入在PT7-5质粒的多克隆位点中,在合适的核糖体结合位点及基因57下游,基因57产物对gp37二聚化起分子伴侣作用。37℃保温反应1小时。然后,加入89μl的T4 DNA连接酶缓冲液及1μl T4 DNA连接酶,反应在16℃延续4小时。再加入2μl StuI限制酶37℃继续保温1小时(StuI限制酶切,可消化在第一步中未被BglII切动的残余质粒,使其转染效率下降100倍)。
反应混合物使用标准方法转入从Novagen获得的大肠杆菌BL21品系。转化混合物涂于含100μg/μl氨苄的琼脂培养基上,平板37℃培养过夜。
挑出过夜培养出的克隆,提取质粒DNA,用BglII如上所述消化。消化物用1%琼脂糖凝胶电泳分离。琼脂电泳后出现一条新的4.2kb的DNA片段,证实了缺失是成功的,这条新片段是基因37未缺失的部分,这部分依然留在质粒上,并经由连接而重新形成BglII切点。原基因中两个BglII位点之间的1.2kb DNA片段已不再连在质粒中,而在胶里也不出现了。
如上述已作了缺失的质粒转入大肠杆菌BL21(DE3)品系。转化菌在30℃培养直到菌体密度(A600)达到0.6,加入IPTG到终浓度0.4mM,30℃继续保温2小时,然后培养液用冰浴冷却。取20μl培养液,加入20μl2ד破碎”缓冲液,其中含1%十二烷基磺酸钠,甘油及示踪染料。15μl的这种溶液上10%聚丙烯酰胺凝胶;另15μl等分试样先沸水浴3分钟,再上同一凝胶。电泳后,固定,染色。水煮样品泳道上有一条分子量65000~70000道尔顿的蛋白条带,证实了缺失型gp37的表达。未煮样品泳道上高分了量条带的强度,或65000~70000道尔顿条带的消失程度可表示二聚化程度。
缺失型肽链二聚化的能力可直接由其被P37抗血清所识别的能力来判断,P37抗血清只和成熟的P37二聚体反应。此反应有标准蛋白免疫印迹操作规程。
另一种评价缺失P37肽链(也称ΔP37)功能性二聚体化的方法是检测其对T4 37-噬菌体的体内互补能力。首先诱导ΔP37表达,然后用突变T4感染,检测后代噬菌体。
如上所述制备ΔP37,发现它能在体内与T4 37-噬菌体互补。实施例2gp36-37嵌合体的设计,构建和表达一开始构建的质粒中,编码gp37的基因克隆在gp36基因上游紧邻部位(即5′端)。质粒用HaeIII消化,删掉了从724核苷酸到3′末端的整个gp37 DNA 3′端下游区,同时也删掉了从5′末端到349核苷酸的gp36DNA 5′端。反应混合液同于实施例1;除了质粒不同,酶是haeIII之外。使用T4DNA连接酶连接,细菌转化,酶切分析同于实施例1。在这处例子中,插入的基因37-36的中间部分的切除揭示插入了新的346个在阅读框内的密码子,它只被HaeIII切了一次(725核苷酸后)。产生的质粒在大肠杆菌BL21(DE3)中如实施例1那样表达。
出现了一种约35000道尔顿的蛋白产物,证实了gp37-36嵌合体的成功表达。gp37的氨基端头242个氨基酸融合到了gp36的羧基端的末尾104个氨基酸(从118~221)。这种嵌合体的用途取决于二聚化及末端相连的能力,即,这种肽链的羧基端可和T4噬菌体的P37二聚体的氨基端作用形成附加二聚体,这种肽链二聚体的氨基端可和其他嵌合体的二聚体作用。可通过评估加入ΔP37是否启动二聚化和多聚化来验证这种性质。另外,以ΔP37启动二聚化之后可用针对P36二聚体的多克隆抗体来检测P36。
Gp37-36嵌合体用如上所述类似步骤制备,其中的限制性内切酶HaeIV换成TaqI。简言之,就是将基因37和基因36均以TaqI消化,前者消化下来的5′端产物片段和后者消化下来的3′端片段连接起来。这样形成的产物即编码gp37-36嵌合体,其中gp37的1~48氨基酸融合到了gp36的100~221氨基酸上,。构建体在大肠杆菌BL21(DE3)中表达,测得嵌合蛋白大小为18KD。发现此嵌合体如果在野生型T4噬菌体感染前即诱导表达则可抑制野生型T4的生长(通过体外噬菌体抑制试验分析得到)。实施例3GP37-36杂合体的突变以产生互体的抑制因子此项构建的目的是生产一种可以二聚化的P37-36嵌合体的两种变异体一种是在多肽的N-端进行了突变(A,记为*P37-36),另一种在多肽的C-端进行了突变(B,记为P37-36*)。要求是突变了的*P36 N-端不能和野生型P36 C-末端,而只能和突变了的*P36 N-端形成聚合物。基本原理是A和B自身均不能独立地多聚化(而亲本P37-36蛋白却能够),它们只能按一定顺序相结合(即,P37-36*+*P37-P36-→P37-36*--*P37-36)。
第二种构建,*P37-P36*是通过*P37-36和P37-36*的体外重组形成的。在有P37起始因子存在的情况下,将*gp37-36*和gp37-36单体混合,gp37-36会二聚化进而多聚化形成(P37-36)n;同样地,*P37仅催化*gp37-36*多聚化形成(*P37-36*)n。假使是这样的话,这两种嵌合体的大小会不相同,一级结构也不相同,可能导致不同的侧链基团相互作用,能够引发基于P37结合特异性而产生在不同表面上的结合。
用来进行试验的菌株是一个大肠杆菌的SU°菌株(是指缺乏抑制琥珀突变能力的菌株)。当用基因35,36及37携带琥珀突变的T4噬菌体的突变体感染此菌株时,噬菌体的复制是不完全的,因为尾丝蛋白不能合成。当在此菌株中首先转化进一个能引导野生型gp35、gp36和gp37基因表达的质粒,并用IPTG诱导,随即用突变噬菌体感染,这样就能产生感染的噬菌体颗粒;这一点可由“缺刻”的来证明。缺刻的菌落并不圆,周边也不光滑,有部分缺口。这是由于单个噬菌体对微菌落的攻击造成的,它进行复制并且抑制缺口部分细菌的生长。
此构建的目的是将基因36的3′-端部分(相当于gp36的C-末端区域)以随机掺杂的寡核苷酸进行诱变。随机掺杂的寡核苷酸的合成是在寡核苷酸的化学合成过程中,在给定的位点加进极少量(到百分之几)其他三种核苷酸,如此在最后的寡核苷酸混合物中就混有占很小比例的一部分,在特定部位出现错误核苷酸。将此种寡核苷酸整合进质粒将导致它们随机突变(Hutchison等,酶学方法.202~356页,1991)。
经过诱变的质粒群体(当然亦包括未经修饰的基因36和37),又经转化进SU°细菌中,随即如上所述用突变的T4噬菌体感染。如此这样,非“缺刻”菌落的出现表明突变了的gp36C-末端不再和野生型P37相互作用以形成功能性尾丝。在这些“非缺刻”菌落中发现候选的gp36*表型,经如上所述的灵敏的免疫特异性检验,检查是否缺乏二聚化的N-末端,而阳性菌落将作为下一步质粒的来源。
数个经过以上突变的质粒经过回收,再进行另一轮诱变,这一次是用寡聚核苷酸库将随机突变引入同一个质粒上gp37的N-端区域。同样,诱变质粒(此时已不是两次诱变的)转化进大肠杆菌的supo菌株,转化子用T4噬菌体的突变体感染。此阶段,筛选细菌平板,以寻找再次出现的缺刻的菌落。此期缺刻的菌落的出现表明,由于*P37突变抑制了无功能的gp36*突变,噬菌体得以复制。也就是说,这些菌落必须含有新的*P37多肽,此多肽获得了与同一质粒编码的P36*蛋白相互作用的能力。
如此就用如实施例2所述的同样方法构建了*P37-36和P37-36*(如上的A和B)配对的嵌合抑制因子。这样的话,则*P37起了野生型P37的作用,而P36*代替了野生型P36。*P37-36*嵌合体的制备可通过剪切*P37-36及P37-36*并把它们按重组顺序连接即可。*P37-36*可以和P37-36混和,在有对方存在的情况下各自独立地完成聚合,互不干扰。在这些嵌合体的杆状结构样核心部分经过了不同的修饰时,这一性质是十分有用的。实施例4gp36-34嵌合体的设计、构建和表达此构建所用的起始质粒中含有基因57,而基因gp36则直接克隆在基因gp34的上游(即5′端)。质粒经NdeI消化,它在基因36的219碱基和基因34的2594碱基处切断质粒,如此切除了gp36部分的C-末端的最后148个密码子和gp34部分N-末端的初始865个密码子。反应混合物同实施例1所述,仅仅质粒DNA不同,所用的酶是NdeI(NEB)。用T4DNA连接酶连接,细菌转化,限制性酶切分析也与实施例1同样操作。这样就产生了一个新的杂合基因,编码497个氨基酸的蛋白质(gp36的73个N-末端氨基酸,gp34的424个C-末端氨基酸,序号是866~1289)。
另一种做法,用SphI于基因34的648碱基对处剪切起始质粒,用Exo-size Deletion Kit(NEB)按上述办法产生缺失突变体。
所构建的产物按实施例1所述的办法在大肠杆菌BL21(DE3)中表达。蛋白产物中出现55000道尔顿大小的新蛋白,证明gp36-34嵌合体获得了成功的表达。优选地,此同源二聚体多肽的氨基末端具备和gp35蛋白相互作用的能力,同时其羧基末端也会和其他与之接触的gp35分子相互作用。二聚体的正确形成可以通过抗-p36抗体的反应来检测,或通过gp35的结合,抑或用实施例2中叙述的体外噬菌体抑制试验来检测。实施例5分离自组装用的温度敏感型蛋白温度敏感型结构可以在纳米结构中应用于a)在低温时启动嵌合体多聚化(例如,gp36-37),随后在高温下灭活启动因子并与之分离;b)启动p36和gp35之间角度的形成(例如,gp35的变异体具有温度敏感型的与p36N-末端或P34C-末端的结合位点,一种P36变异体与gp35形成温度敏感型的结合,而一种P34变异体具有一个温度依赖型的C-末端结合位点。)温度敏感性可以是可逆的,当恢复较低的温度以后允许合适的末端重新结合,它也可以是不可逆的。
为了生产一种gp37的变异体,它允许p36-37结合物的热诱导解离,按如上所述的办法掺杂的用寡核苷酸对gp37 DNA的5′端进行了随机诱变。然后将诱变的DNA片段重组进T4噬菌体,所用的办法是用一个携带处于诱变区域两端的两个琥珀突变的T4噬菌体感染含有诱变DNA的细胞。在一轮低倍性感染之后,在较低的温度30℃下于大肠杆菌su°中筛选非琥珀型噬菌体。这些噬菌斑的后代在缓冲液中重悬,加热到60℃攻击。在此温度下,野生型尾丝保持结构和功能的完整性,而温度敏感型的则释放出末端的P37单元,使得那些噬菌体成为非感染性的。
在此期,野生型噬菌体通过以下方式除去1)用敏感性细菌吸附野生型噬菌体,而后,沉淀(或过滤)吸附了野生型噬菌体的细菌;或2)将裂解物与抗-P37抗体反应,而后通过固相化的蛋白A除去吸附的野生型噬菌体。两种方法均让无感染性的突变噬菌体颗粒留在上清液中或滤过液中,它们都可以被回收。缺失P37末端部分(或许还包括余下的尾丝部分)的无感染性噬菌体随后用6M尿素处理,将其和细菌的原生质体混合,以容许低倍性的感染,于是它们得以在低温下复制并释放出子代。另外一种办法,感染性噬菌体可以通过在体外将突变噬菌体和野生型P37于30℃孵育的方法得以重组;孵育后即按照常规方案感染完整的细菌细胞。此后一种感染方式需要特异性地选择突变噬菌体,其中P36-P37的温度依赖型结合为可逆性的。
不管用哪种方法,噬菌体种群均须经过如上的多轮筛选,而后通过噬菌斑纯化的方法在30℃条件下分离单个的噬菌体颗粒。最后,这些候选的突变体要按以下特征逐项评价1)在较高温度下(40-60℃)孵育后失去感染能力,可以测得滴度的下降;2)在高温下孵育后丢失P37,由检测到P37特异性抗体与噬菌体颗粒结合力的下降而得知;3)由电镜观测到,高温孵育后尾丝发生形态改变。
突变体分离后,表型也经过进一步确定之后,P37基因经过了测序,如果突变位于特定区域或残基,将针对那些序列进行位点特异性诱变以优化目标特征。
最后,突变基因37被克隆进表达质粒,如实施例1一样,在大肠杆菌中分别表达。突变的P37二聚体从细菌提取物中纯化出来,用于体外的组装反应中。
用类似的模式,也可以分离gp35的突变体多肽,此多肽显示出与P36的N-末端或P34的C-末端的温度敏感型相互作用。在与P34的温度敏感型相互作用中,噬菌体经高温孵育,导致其尾丝远端的那一半的完整脱落(即gp35-P36-P37)。实验方案中全部的差别在于1)在整个gp35基因上进行了随机突变;2)野生型噬菌体(及远端的一半尾丝来自温度敏感型突变体者)与高温下已经失活的温度敏感型突变噬菌体(但仍然连接着尾丝近端的那一半)进行了分离,分离的方法是用任何一种抗尾丝蛋白远端部分抗体,接着以葡萄球菌A-蛋白珠子沉淀远端的那一半尾丝以及含完整尾丝的噬菌体颗粒;3)留在上清中的突变噬菌体通过与含有野生型的完整半根远端尾丝的细菌抽提物在低温下共同孵育,得以恢复了活动;4)全部的温度敏感型基因,在30℃条件下生长的35个突变体,通过在60℃条件下灭活而后在30℃重孵育可以检测出可逆性的温度敏感性。灭活是针对浓缩的噬菌体悬浮物进行的,而在30℃的重孵育则分别针对稀释前及稀释后。如果未经稀释的噬菌体能够成功地复活,但稀释后却不能,这表明它们的gp35是可逆的温度敏感型。
为了产生一个携带有温度敏感型的gp35-P36连接物的基因36的突变,基因36的C-末端经过了如上所述的诱变,突变体也进行了可逆性筛选。另一个选择是诱变gp35以产生这样一个基因35的突变体,其中的gp35-P36连接在60℃将解离。若是这样的话,可以用抗-gp35抗体共孵育的方法沉淀没有P36-P37的噬菌体,以达到使之与野生型噬菌体以及远端的半截尾丝(P36-P37)分离,由于gp35的变异体仍将保持与P34的结合。实施例6一维杆状结构的装配A.简单装配实施例2中描述的P37-36嵌合体可以自组装,但需要一个P37启动因子结合第一个杆状结构单位。所以,一个P37或ΔP37二聚体可以结合到固体基质中或在溶液中呈游离形式作为启动因子。如果启动因子是连接到固相基质则优选用温度敏感型的P37二聚体。加入含有gp37-36或纯化的gp37-36嵌合体的提取物,会延长线性多聚体的自组装的长度。在基质结合的情况下,最后的几个杆状结构会在高温下(40-60℃,取决于特定的温度敏感型P37突变体的性质)简短孵育之后得以释放。
启动因子针对gp37-36的比例也可以变化,杆状结构的大小分布也可以用以下任一办法测得1)大小排阻层析法;2)溶液粘稠度的增大;及3)电镜下的直接测量。
B.逐步的组装例3中描述的P37-36的变异体*P37-36和P37-36*不能自发多聚化,这就使得可以按照如下方案依照一定的长度对杆状结构进行逐步的组装。
1.将启动因子P37(优选温度敏感型)结合到基质上。
2.加过量*gp37-36使之结合到P37的N-末端,并象P37-36同源寡聚体一样寡聚化。
3.洗掉未反应的*gp36-37,并用gp37-36*冲洗。
4.洗掉未反应的gp37-36*,并用过量*gp37-36冲洗。
5.重复步骤2-4,n-1次。
6.从基质上释放组装产物,方法如上所述,在高温下简短孵育。
每次反应中蛋白杆状结构线性长度的范围取决于异源嵌合物单元的长度以及加入反应物的轮次(n)。此方法的优点是杆结构长度的绝对可重复性能够保证,以及每次试验中其大小分布趋势的同一性、稳定性。实施例7多边形的逐步装配下边的组装方案中用gp35作为角连接物以形成多边形。在此项实验当中,设定以gp35形成的角为137°。杆状结构单元包括实施例4中能够自身多聚化的P36-34嵌合体。P36-34同源二聚体由一个同时表达gp36-34和gp57细菌克隆生产。gp57能够在gp36-34的同源二聚化作用以形成P36-34的过程中起伴侣作用。
1.启动因子不完整的半截远端尾丝P36-37通过P37C-末端连接到固体基质。实施例5中所述的温度敏感型gp35随后加进去以形成完整的启动因子。
2.加入过量的P36-34嵌合体以结合单个的P36-34。通过gp35结合到基质上,未结合的嵌合体则洗去。
3.旋即加入过量野生型(即非温度敏感型)gp35。孵育之后,洗去未结合者。
4.将步骤2和3重复7-8次。
5.于高温下简短孵育以从基质上释放组装产物。
释放出的多聚杆状结构,8个单位长,将形成一个规则的八边形,它的边包括P36-34二聚体,它的边包括野生型gp35单体。然则,这样的8单位形成的多聚体也可能呈螺旋形连接。当一个单位未闭合时,却在它的末端连上另一个,它就更不能闭合了,而螺旋则可以在两端延伸。第一个接头的方向也已经决定了螺旋的手性。十个(或七个)单位的杆状结构更易于形成螺旋形结构而不是多边形,由于它们的自然角是144°(或128.6°)。闭合形成规则多边形的可能性不光取决于gp35的平均角度,还取决于它的柔性,它可能通过遗传或环境修饰的办法进一步操作。
以此方案形成的多边形的类型取决于杆状结构单位的长度和角连接物形成的角。例如,可以在第2步中改用不同大小的杆状结构单位。另外,可以用形成的角度不同于自然角度170°的gp35的变异体多肽,以形成不同的规则多边形。而且,对一个给定的各角相等,边数为偶数的多边形,只要两半部分对称,每一半的边长大小则是任意的。
序列表(1)总的信息(I)申请人 Goldberg,Edward B.(II)发明的题目生产纳米结构的材料及其用途(III)序列数6(IV)通讯地址(A)收信人Pennie和Edmonds(B)街 道美国1155街道(C)城 市纽约(D)州纽约(E)国 家美国(F)邮 区10036(V)计算机可读形式(A)媒体类型Floppy盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件Patent In Release#1.0版本#1.25(VI)当前申请数据(A)申请号待定(B)提交日期1995年10月13日(C)分类(VIII)委托/代理人信息
(A)姓名Misrock,S.Lesli(B)登记号18,872(C)参考/存档号8471-0005-999(IX)电讯信息(A)电话(212)790-9090(B)传真212-869-8864(C)电报66441 PENNIE(2)序列ID NO1的信息(I)序列特征(A)长度8855碱基对(B)类型核酸(C)链型单(D)拓扑学线性(II)分子类型DNA(基因组)(III)假设无(IV)反义序列无(VI)最初来源(A)生物体噬菌体T4(VII)直接来源(B)克隆尾丝基因(XI)序列描述序列ID NO1TAGGAGCCCG GGAGAATGGC CGAGATTAAA AGAGAATTCA GAGCAGAAGA TGGTCTGGAC60GCAGGTGGTG ATAAAATAAT CAACGTAGCT TTAGCTGATC GTACCGTAGG AACTGACGGT 120GTTAACGTTG ATTACTTAAT TCAAGAAAAC ACAGTTCAAC AGTATGATCC AACTCGTGGA 180TATTTAAAAG ATTTTGTAAT CATTTATGAT AACCGCTTTT GGGCTGCTAT AAATGATATT 240CCAAAACCAG CAGGAGCTTT TAATAGCGGA CGCTGGAGAG CATTACGTAC CGATGCTAAC 300TGGATTACGG TTTCATCTGG TTCATATCAA TTAAAATCTG GTGAAGCAAT TTCGGTTAAC 360ACCGCAGCTG GAAATGACAT CACGTTTACT TTACCATCTT CTCCAATTGA TGGTGATACT 420ATCGTTCTCC AAGATATTGG AGGAAAACCT GGAGTTAACC AAGTTTTAAT TGTAGCTCCA 480GTACAAAGTA TTGTAAACTT TAGAGGTGAA CAGGTACGTT CAGTACTAAT GACTCATCCA 540AAGTCACAGC TAGTTTTAAT TTTTAGTAAT CGTCTGTGGC AAATGTATGT TGCTGATTAT 600AGTAGAGAAG CTATAGTTGT AACACCAGCG AATACTTATC AAGCGCAATC CAACGATTTT 660ATCGTACGTA GATTTACTTC TGCTGCACCA ATTAATGTCA AACTTCCAAG ATTTGCTAAT 720CATGGCGATA TTATTAATTT CGTCGATTTA GATAAACTAA ATCCGCTTTA TCATACAATT 780GTTACTACAT ACGATGAAAC GACTTCAGTA CAAGAAGTTG GAACTCATTC CATTGAAGGC 840CGTACATCGA TTGACGGTTT CTTGATGTTT GATGATAATG AGAAATTATG GAGACTGTTT 900GACGGGGATA GTAAAGCGCG TTTACGTATC ATAACGACTA ATTCAAACAT TCGTCCAAAT 960GAAGAAGTTA TGGTATTTGG TGCGAATAAC GGAACAACTC AAACAATTGA GCTTAAGCTT 1020CCAACTAATA TTTCTGTTGG TGATACTGTT AAAATTTCCA TGAATTACAT GAGAAAAGGA 1080CAAACAGTTA AAATCAAAGC TGCTGATGAA GATAAAATTG CTTCTTCAGT TCAATTGCTG 1140CAATTCCCAA AACGCTCAGA ATATCCACCT GAAGCTGAAT GGGTTACAGT TCAAGAATTA 1200GTTTTTAACG ATGAAACTAA TTATGTTCCA GTTTTGGAGC TTGCTTACAT AGAAGATTCT 1260GATGGAAAAT ATTGGGTTGT ACAGCAAAAC GTTCCAACTG TAGAAAGAGT AGATTCTTTA 1320AATGATTCTA CTAGAGCAAG ATTAGGCGTA ATTGCTTTAG CTACACAAGC TCAAGCTAAT 1380GTCGATTTAG AAAATTCTCC ACAAAAAGAA TTAGCAATTA CTCCAGAAAC GTTAGCTAAT 1440CGTACTGCTA CAGAAACTCG CAGAGGTATT GCAAGAATAG CAACTACTGC TCAAGTGAAT 1500CAGAACACCA CATTCTCTTT TGCTGATGAT ATTATCATCA CTCCTAAAAA GCTGAATGAA 1560AGAACTGCTA CAGAAACTCG TAGAGGTGTC GCAGAAATTG CTACGCAGCA AGAAACTAAT 1620GCAGGAACCG ATGATACTAC AATCATCACT CCTAAAAAGC TTCAAGCTCG TCAAGGTTCT 1680GAATCATTAT CTGGTATTGT AACCTTTGTA TCTACTGCAG GTGCTACTCC AGCTTCTAGC 1740CGTGAATTAA ATGGTACGAA TGTTTATAAT AAAAACACTG ATAATTTAGT TGTTTCACCT 1800AAAGCTTTGG ATCAGTATAA AGCTACTCCA ACACAGCAAG GTGCAGTAAT TTTAGCAGTT 1860GAAAGTGAAG TAATTGCTGG ACAAAGTCAG CAAGGATGGG CAAATGCTGT TGTAACGCCA 1920GAAACGTTAC ATAAAAAGAC ATCAACTGAT GGAAGAATTG GTTTAATTGA AATTGCTACG 1980CAAAGTGAAG TTAATACAGG AACTGATTAT ACTCGTGCAG TCACTCCTAA AACTTTAAAT 2040GACCGTAGAG CAACTGAAAG TTTAAGTGGT ATAGCTGAAA TTGCTACACA AGTTGAATTC 2100GACGCAGGCG TCGACGATAC TCGTATCTCT ACACCATTAA AAATTAAAAC CAGATTTAAT 2160AGTACTGATC GTACTTCTGT TGTTGCTCTA TCTGGATTAG TTGAATCAGG AACTCTCTGG 2220GACCATTATA CACTTAATAT TCTTGAAGCA AATGAGACAC AACGTGGTAC ACTTCGTGTA 2280GCTACGCAGG TCGAAGCTGC TGCGGGAACA TTAGATAATG TTTTAATAAC TCCTAAAAAG 2340CTTTTAGGTA CTAAATCTAC TGAAGCGCAA GAGGGTGTTA TTAAAGTTGC AACTCAGTCT 2400GAAACTGTGA CTGGAACGTC AGCAAATACT GCTGTATCTC CAAAAAATTT AAAATGGATT 2460GCGCAGAGTG AACCTACTTG GGCAGCTACT ACTGCAATAA GAGGTTTTGT TAAAACTTCA 2520TCTGGTTCAA TTACATTCGT TGGTAATGAT ACAGTCGGTT CTACCCAAGA TTTAGAACTG 2580TATGAGAAAA ATAGCTATGC GGTATCACCA TATGAATTAA ACCGTGTATT AGCAAATTAT 2640TTGCCACTAA AAGCAAAAGC TGCTGATACA AATTTATTGG ATGGTCTAGA TTCATCTCAG 2700TTCATTCGTA GGGATATTGC ACAGACGGTT AATGGTTCAC TAACCTTAAC CCAACAAACG 2760AATCTGAGTG CCCCTCTTGT ATCATCTAGT ACTGGTGAAT TTGGTGGTTC ATTGGCCGCT 2820AATAGAACAT TTACCATCCG TAATACAGGA GCCCCGACTA GTATCGTTTT CGAAAAAGGT 2880CCTGCATCCG GGGCAAATCC TGCACAGTCA ATGAGTATTC GTGTATGGGG TAACCAATTT 2940GGCGGCGGTA GTGATACGAC CCGTTCGACA GTGTTTGAAG TTGGCGATGA CACATCTCAT 3000CACTTTTATT CTCAACGTAA TAAAGACGGT AATATAGCGT TTAACATTAA TGGTACTGTA 3060ATGCCAATAA ACATTAATGC TTCCGGTTTG ATGAATGTGA ATGGCACTGC AACATTCGGT 3120CGTTCAGTTA CAGCCAATGG TGAATTCATC AGCAAGTCTG CAAATGCTTT TAGAGCAATA 3180AACGGTGATT ACGGATTCTT TATTCGTAAT GATGCCTCTA ATACCTATTT TTTGCTCACT 3240GCAGCCGGTG ATCAGACTGG TGGTTTTAAT GGATTACGCC CATTATTAAT TAATAATCAA 3300TCCGGTCAGA TTACAATTGG TGAAGGCTTA ATCATTGCCA AAGGTGTTAC TATAAATTCA 3360GGCGGTTTAA CTGTTAACTC GAGAATTCGT TCTCAGGGTA CTAAAACATC TGATTTATAT 3420ACCCGTGCGC CAACATCTGA TACTGTAGGA TTCTGGTCAA TCGATATTAA TGATTCAGCC 3480ACTTATAACC AGTTCCCGGG TTATTTTAAA ATGGTTGAAA AAACTAATGA AGTGACTGGG 3540CTTCCATACT TAGAACGTGG CGAAGAAGTT AAATCTCCTG GTACACTGAC TCAGTTTGGT 3600AACACACTTG ATTCGCTTTA CCAAGATTGG ATTACTTATC CAACGACGCC AGAAGCGCGT 3660ACCACTCGCT GGACACGTAC ATGGCAGAAA ACCAAAAACT CTTGGTCAAG TTTTGTTCAG 3720GTATTTGACG GAGGTAACCC TCCTCAACCA TCTGATATCG GTGCTTTACC ATCTGATAAT 3780GCTACAATGG GGAATCTTAC TATTCGTGAT TTCTTGCGAA TTGGTAATGT TCGCATTGTT 3840CCTGACCCAG TGAATAAAAC GGTTAAATTT GAATGGGTTG AATAAGAGGT ATTATGGAAA 3900AATTTATGGC CGAGATTTGG ACAAGGATAT GTCCAAACGC CATTTTATCG GAAAGTAATT 3960CAGTAAGATA TAAAATAAGT ATAGCGGGTT CTTGCCCGCT TTCTACAGCA GGACCATCAT 4020ATGTTAAATT TCAGGATAAT CCTGTAGGAA GTCAAACATT TAGGCGCAGG CCTTCATTTA 4080AGAGTTTTTG ACCCTTCCAC CGGAGCATTA GTTGATAGTA AGTCATATGC TTTTTCGACT 4140TCAAATGATA CTACATCAGC TGCTTTTGTT AGTTTTCATG AATTCTTTGA CGAATAATCG4200AATTGTTGCT ATATTAACTA GTGGAAAGGT TAATTTTCCT CCTGAAGTAG TATCTTGGTT4260AAGAACCGCC GGAACGTCTG CCTTTCCATC TGATTCTATA TTGTCAAGAT TTGACGTATC4320ATATGCTGCT TTTTATACTT CTTCTAAAAG AGCTATCGCA TTAGAGCATG TTAAACTGAG4380TAATAGAAAA AGCACAGATG ATTATCAAAC TATTTTAGAT GTTGTATTTG ACAGTTTAGA4440AGATGTAGGA GCTACCGGGT TTCCAAGAAG AACGTATGAA AGTGTTGAGC AATTCATGTC4500GGCAGTTGGT GGAACTAATA ACGAAATTGC GAGATTGCCA ACTTCAGCTG CTATAAGTAA4560ATTATCTGAT TATAATTTAA TTCCTGGAGA TGTTCTTTAT CTTAAAGCTC AGTTATATGC4620TGATGCTGAT TTACTTGCTC TTGGAACTAC AAATATATCT ATCCGTTTTT ATAATGCATC4680TAACGGATAT ATTTCTTCAA CACAAGCTGA ATTTACTGGG CAAGCTGGGT CATGGGAATT4740AAAGGAAGAT TATGTAGTTG TTCCAGAAAA CGCAGTAGGA TTTACGATAT ACGCACAGAG4800AACTGCACAA GCTGGCCAAG GTGGCATGAG AAATTTAAGC TTTTCTGAAG TATCAAGAAA4860TGGCGGCATT TCGAAACCTG CTGAATTTGG CGTCAATGGT ATTCGTGTTA ATTATATCTG4920CGAATCCGCT TCACCTCCGG ATATAATGGT ACTTCCTACG CAAGCATCGT CTAAAACTGG4980TAAAGTGTTT GGGCAAGAAT TTAGAGAAGT TTAAATTGAG GGACCCTTCG GGTTCCCTTT5040TTCTTTATAA ATACTATTCA AATAAAGGGG CATACAATGG CTGATTTAAA AGTAGGTTCA5100ACAACTGGAG GCTCTGTCAT TTGGCATCAA GGAAATTTTC CATTGAATCC AGCCGGTGAC5160GATGTACTCT ATAAATCATT TAAAATATAT TCAGAATATA ACAAACCACA AGCTGCTGAT5220AACGATTTCG TTTCTAAAGC TAATGGTGGT ACTTATGCAT CAAAGGTAAC ATTTAACGCT5280GGCATTCAAG TCCCATATGC TCCAAACATC ATGAGCCCAT GCGGGATTTA TGGGGGTAAC5340GGTGATGGTG CTACTTTTGA TAAAGCAAAT ATCGATATTG TTTCATGGTA TGGCGTAGGA5400TTTAAATCGT CATTTGGTTC AACAGGCCGA ACTGTTGTAA TTAATACACG CAATGGTGAT5460ATTAACACAA AAGGTGTTGT GTCGGCAGCT GGTCAAGTAA GAAGTGGTGC GGCTGCTCCT5520ATAGCAGCGA ATGACCTTAC TAGAAAGGAC TATGTTGATG GAGCAATAAA TACTGTTACT5580GCAAATGCAA ACTCTAGGGT GCTACGGTCT GGTGACACCA TGACAGGTAA TTTAACAGCG5640CCAAACTTTT TCTCGCAGAA TCCTGCATCT CAACCCTCAC ACGTTCCACG ATTTGACCAA5700ATCGTAATTA AGGATTCTGT TCAAGATTTC GGCTATTATT AAGAGGACTT ATGGCTACTT5760TAAAACAAAT ACAATTTAAA AGAAGCAAAA TCGCAGGAAC ACGTCCTGCT GCTTCAGTAT5820TAGCCGAAGG TGAATTGGCT ATAAACTTAA AAGATAGAAC AATTTTTACT AAAGATGATT5880CAGGAAATAT CATCGATCTA GGTTTTGCTA AAGGCGGGCA AGTTGATGGC AACGTTACTA5940TTAACGGACT TTTGAGATTA AATGGCGATT ATGTACAAAC AGGTGGAATG ACTGTAAACG6000GACCCATTGG TTCTACTGAT GGCGTCACTG GAAAAATTTT CAGATCTACA CAGGGTTCAT6060TTTATGCAAG AGCAACAAAC GATACTTCAA ATGCCCATTT ATGGTTTGAA AATGCCGATG6120GCACTGAACG TGGCGTTATA TATGCTCGCC CTCAAACTAC AACTGACGGT GAAATACGCC6180TTAGGGTTAG ACAAGGAACA GGAAGCACTG CCAACAGTGA ATTCTATTTC CGCTCTATAA 6240ATGGAGGCGA ATTTCAGGCT AACCGTATTT TAGCATCAGA TTCGTTAGTA ACAAAACGCA 6300TTGCGGTTGA TACCGTTATT CATGATGCCA AAGCATTTGG ACAATATGAT TCTCACTCTT 6360TGGTTAATTA TGTTTATCCT GGAACCGGTG AAACAAATGG TGTAAACTAT CTTCGTAAAG 6420TTCGCGCTAA GTCCGGTGGT ACAATTTATC ATGAAATTGT TACTGCACAA ACAGGCCTGG 6480CTGATGAAGT TTCTTGGTGG TCTGGTGATA CACCAGTATT TAAACTATAC GGTATTCGTG 6540ACGATGGCAG AATGATTATC CGTAATAGCC TTGCATTAGG TACATTCACT ACAAATTTCC 6600CGTCTAGTGA TTATGGCAAC GTCGGTGTAA TGGGCGATAA GTATCTTGTT CTCGGCGACA 6660CTGTAACTGG CTTGTCATAC AAAAAAACTG GTGTATTTGA TCTAGTTGGC GGTGGATATT 6720CTGTTGCTTC TATTACTCCT GACAGTTTCC GTAGTACTCG TAAAGGTATA TTTGGTCGTT 6780CTGAGGACCA AGGCGCAACT TGGATAATGC CTGGTACAAA TGCTGCTCTC TTGTCTGTTC 6840AAACACAAGC TGATAATAAC AATGCTGGAG ACGGACAAAC CCATATCGGG TACAATGCTG 6900GCGGTAAAAT GAACCACTAT TTCCGTGGTA CAGGTCAGAT GAATATCAAT ACCCAACAAG 6960GTATGGAAAT TAACCCGGGT ATTTTGAAAT TGGTAACTGG CTCTAATAAT GTACAATTTT 7020ACGCTGACGG AACTATTTCT TCCATTCAAC CTATTAAATT AGATAACGAG ATATTTTTAA 7080CTAAATCTAA TAATACTGCG GGTCTTAAAT TTGGAGCTCC TAGCCAAGTT GATGGCACAA 7140GGACTATCCA ATGGAACGGT GGTACTCGCG AAGGACAGAA TAAAAACTAT GTGATTATTA 7200AAGCATGGGG TAACTCATTT AATGCCACTG GTGATAGATC TCGCGAAACG GTTTTCCAAG 7260TATCAGATAG TCAAGGATAT TATTTTTATG CTCATCGTAA AGCTCCAACC GGCGACGAAA 7320CTATTGGACG TATTGAAGCT CAATTTGCTG GGGATGTTTA TGCTAAAGGT ATTATTGCCA 7380ACGGAAATTT TAGAGTTGTT GGGTCAAGCG CTTTAGCCGG CAATGTTACT ATGTCTAACG 7440GTTTGTTTGT CCAAGGTGGT TCTTCTATTA CTGGACAAGT TAAAATTGGC GGAACAGCAA 7500ACGCACTGAG AATTTGGAAC GCTGAATATG GTGCTATTTT CCGTCGTTCG GAAAGTAACT 7560TTTATATTAT TCCAACCAAT CAAAATGAAG GAGAAAGTGG AGACATTCAC AGCTCTTTGA 7620GACCTGTGAG AATAGGATTA AACGATGGCA TGGTTGGGTT AGGAAGAGAT TCTTTTATAG 7680TAGATCAAAA TAATGCTTTA ACTACGATAA ACAGTAACTC TCGCATTAAT GCCAACTTTA 7740GAATGCAATT GGGGCAGTCG GCATACATTG ATGCAGAATG TACTGATGCT GTTCGCCCGG 7800CGGGTGCAGG TTCATTTGCT TCCCAGAATA ATGAAGACGT CCGTGCGCCG TTCTATATGA 7860ATATTGATAG AACTGATGCT AGTGCATATG TTCCTATTTT GAAACAACGT TATGTTCAAG 7920GCAATGGCTG CTATTCATTA GGGACTTTAA TTAATAATGG TAATTTCCGA GTTCATTACC 7980ATGGCGGCGG AGATAACGGT TCTACAGGTC CACAGACTGC TGATTTTGGA TGGGAATTTA 8040TTAAAAACGG TGATTTTATT TCACCTCGCG ATTTAATAGC AGGCAAAGTC AGATTTGATA 8100GAACTGGTAA TATCACTGGT GGTTCTGGTA ATTTTGCTAA CTTAAACAGT ACAATTGAAT 8160CACTTAAAAC TGATATCATG TCGAGTTACC CAATTGGTGC TCCGATTCCT TGGCCGAGTG 8220ATTCAGTTCC TGCTGGATTT GCTTTGATGG AAGGTCAGAC CTTTGATAAG TCCGCATATC8280CAAAGTTAGC TGTTGCATAT CCTAGCGGTG TTATTCCAGA TATGCGCGGG CAAACTATCA8340AGGGTAAACC AAGTGGTCGT GCTGTTTTGA GCGCTGAGGC AGATGGTGTT AAGGCTCATA8400GCCATAGTGC ATCGGCTTCA AGTACTGACT TAGGTACTAA AACCACATCA AGCTTTGACT8460ATGGTACGAA GGGAACTAAC AGTACGGGTG GACACACTCA CTCTGGTAGT GGTTCTACTA8520GCACAAATGG TGAGCACAGC CACTACATCG AGGCATGGAA TGGTACTGGT GTAGGTGGTA8580ATAAGATGTC ATCATATGCC ATATCATACA GGGCGGGTGG GAGTAACACT AATGCAGCAG8640GGAACCACAG TCACACTTTC TCTTTTGGGA CTAGCAGTGC TGGCGACCAT TCCCACTCTG8700TAGGTATTGG TGCTCATACC CACACGGTAG CAATTGGATC ACATGGTCAT ACTATCACTG8760TAAATAGTAC AGGTAATACA GAAAACACGG TTAAAAACAT TGCTTTTAAC TATATCGTTC8820GTTTAGCATA AGGAGAGGGG CTTCGGCCCT TCTAA 8855(2)SEQ ID NO2的信息(I)序列特征(A)长度1289氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(vi)最初来源(A)生物体噬菌体T4(vii)直接来源(B)克隆p34氨基酸(xi)SEQUENCE DESCRIPTIONSEQ ID NO2Met Ala Glu Ile Lys Arg Glu Phe Arg Ala Glu Asp Gly Leu Asp Ala1 5 10 15Gly Gly Asp Lys Ile Ile Asn Val Ala Leu Ala Asp Arg Thr Val Gly20 25 30Thr Asp Gly Val Asn Val Asp Tyr Leu Ile Gln Glu Asn Thr Val Gln35 40 45Gln Tyr Asp Pro Thr Arg Gly Tyr Leu Lys Asp Phe Val Ile Ile Tyr50 55 60Asp Asn Arg Phe Trp Ala Ala Ile Asn Asp Ile Pro Lys Pro Ala Gly65 70 75 80Ala Phe Asn Ser Gly Arg Trp Arg Ala Leu Arg Thr Asp Ala Asn Trp85 90 95Ile Thr Val Ser Ser Gly Ser Tyr Gln Leu Lys Ser Gly Glu Ala Ile100 105 110Ser Val Asn Thr Ala Ala Gly Asn Asp Ile Thr Phe Thr Leu Pro Ser115 120 125Ser Pro Ile Asp Gly Asp Thr Ile Val Leu Gln Asp Ile Gly Gly Lys130 135 140Pro Gly Val Asn Gln Val Leu Ile Val Ala Pro Val Gln Ser Ile Val145 150 155 160Asn Phe Arg Gly Glu Gln Val Arg Ser Val Leu Met Thr His Pro Lys165 170 175Ser Gln Leu Val Leu Ile Phe Ser Asn Arg Leu Trp Gln Met Tyr Val180 185 190Ala Asp Tyr Ser Arg Glu Ala Ile Val Val Thr Pro Ala Asn Thr Tyr195 200 205Gln Ala Gln Ser Asn Asp Phe Ile Val Arg Arg Phe Thr Ser Ala Ala210 215 220Pro Ile Asn Val Lys Leu Pro Arg Phe Ala Asn His Gly Asp Ile Ile225 230 235 240Asn Phe Val Asp Leu Asp Lys Leu Asn Pro Leu Tyr His Thr Ile Val245 250 255Thr Thr Tyr Asp Glu Thr Thr Ser Val Gln Glu Val Gly Thr His Ser260 265 270Ile Glu Gly Arg Thr Ser Ile Asp Gly Phe Leu Met Phe Asp Asp Asn275 280 285Glu Lys Leu Trp Arg Leu Phe Asp Gly Asp Ser Lys Ala Arg Leu Arg290 295 300Ile Ile Thr Thr Asn Ser Asn Ile Arg Pro Asn Glu Glu Val Met Val305 310 315 320Phe Gly Ala Asn Asn Gly Thr Thr Gln Thr Ile Glu Leu Lys Leu Pro325 330 335Thr Asn Ile Ser Val Gly Asp Thr Val Lys Ile Ser Met Asn Tyr Met340 345 350Arg Lys Gly Gln Thr Val Lys Ile Lys Ala Ala Asp Glu Asp Lys Ile355 360 365Ala Ser Ser Val Gln Leu Leu Gln Phe Pro Lys Arg Ser Glu Tyr Pro370 375 380Pro Glu Ala Glu Trp Val Thr Val Gln Glu Leu Val Phe Asn Asp Glu385 390 395 400Thr Asn Tyr Val Pro Val Leu Glu Leu Ala Tyr Ile Glu Asp Ser Asp405 410 415Gly Lys Tyr Trp Val Val Gln Gln Asn Val Pro Thr Val Glu Arg Val420 425 430Asp Ser Leu Asn Asp Ser Thr Arg Ala Arg Leu Gly Val Ile Ala Leu435 440 445Ala Thr Gln Ala Gln Ala Asn Val Asp Leu Glu Asn Ser Pro Gln Lys450 455 460Glu Leu Ala Ile Thr Pro Glu Thr Leu Ala Asn Arg Thr Ala Thr Glu465 470 475 480Thr Arg Arg Gly Ile Ala Arg Ile Ala Thr Thr Ala Gln Val Asn Gln485 490 495Asn Thr Thr Phe Ser Phe Ala Asp Asp Ile Ile Ile Thr Pro Lys Lys
500 505 510Leu Asn Glu Arg Thr Ala Thr Glu Thr Arg Arg Gly Val Ala Glu Ile515 520 525Ala Thr Gln Gln Glu Thr Asn Ala Gly Thr Asp Asp Thr Thr Ile Ile530 535 540Thr Pro Lys Lys Leu Gln Ala Arg Gln Gly Ser Glu Ser Leu Ser Gly545 550 555 560Ile Val Thr Phe Val Ser Thr Ala Gly Ala Thr Pro Ala Ser Ser Arg565 570 575Glu Leu Asn Gly Thr Asn Val Tyr Asn Lys Asn Thr Asp Asn Leu Val580 585 590Val Ser Pro Lys Ala Leu Asp Gln Tyr Lys Ala Thr Pro Thr Gln Gln595 600 605Gly Ala Val Ile Leu Ala Val Glu Ser Glu Val Ile Ala Gly Gln Ser610 615 620Gln Gln Gly Trp Ala Asn Ala Val Val Thr Pro Glu Thr Leu His Lys625 630 635 640Lys Thr Ser Thr Asp Gly Arg Ile Gly Leu Ile Glu Ile Ala Thr Gln645 650 655Ser Glu Val Asn Thr Gly Thr Asp Tyr Thr Arg Ala Val Thr Pro Lys660 665 670Thr Leu Asn Asp Arg Arg Ala Thr Glu Ser Leu Ser Gly Ile Ala Glu675 680 685Ile Ala Thr Gln Val Glu Phe Asp Ala Gly Val Asp Asp Thr Arg Ile690 695 700Ser Thr Pro Leu Lys Ile Lys Thr Arg Phe Asn Ser Thr Asp Arg Thr705 710 715 720Ser Val Val Ala Leu Ser Gly Leu Val Glu Ser Gly Thr Leu Trp Asp725 730 735His Tyr Thr Leu Asn Ile Leu Glu Ala Asn Glu Thr Gln Arg Gly Thr740 745 750Leu Arg Val Ala Thr Gln Val Glu Ala Ala Ala Gly Thr Leu Asp Asn755 760 765Val Leu Ile Thr Pro Lys Lys Leu Leu Gly Thr Lys Ser Thr Glu Ala770 775 780Gln Glu Gly Val Ile Lys Val Ala Thr Gln Ser Glu Thr Val Thr Gly785 790 795 800Thr Ser Ala Asn Thr Ala Val Ser Pro Lys Asn Leu Lys Trp Ile Ala805 810 815Gln Ser Glu Pro Thr Trp Ala Ala Thr Thr Ala Ile Arg Gly Phe Val820 825 830Lys Thr Ser Ser Gly Ser Ile Thr Phe Val Gly Asn Asp Thr Val Gly835 840 845Ser Thr Gln Asp Leu Glu Leu Tyr Glu Lys Asn Ser Tyr Ala Val Ser850 855 860Pro Tyr Glu Leu Asn Arg Val Leu Ala Asn Tyr Leu Pro Leu Lys Ala865 870 875 880Lys Ala Ala Asp Thr Asn Leu Leu Asp Gly Leu Asp Ser Ser Gln Phe885 890 895Ile Arg Arg Asp Ile Ala Gln Thr Val Asn Gly Ser Leu Thr Leu Thr900 905 910Gln Gln Thr Asn Leu Ser Ala Pro Leu Val Ser Ser Ser Thr Gly Glu915 920 925Phe Gly Gly Ser Leu Ala Ala Asn Arg Thr Phe Thr Ile Arg Asn Thr930 935 940Gly Ala Pro Thr Ser Ile Val Phe Glu Lys Gly Pro Ala Ser Gly Ala945 950 955 960Asn Pro Ala Gln Ser Mer Ser Ile Arg Val Trp Gly Asn Gln Phe Gly965 970 975Gly Gly Ser Asp Thr Thr Arg Ser Thr Val Phe Glu Val Gly Asp Asp980 985 990Thr Ser His His Phe Tyr Ser Gln Arg Asn Lys Asp Gly Asn Ile Ala995 l0001005Phe Asn Ile Asn Gly Thr Val Met Pro Ire Asn Ile Asn Ala Ser Gly101010151020Leu Met Asn Val Asn Gly Thr Ala Thr Phe Gly Arg Ser Val Thr Ala1025103010351040Asn Gly Glu Phe Ile Ser Lys Ser Ala Asn Ala Phe Arg Ala Ile Asn104510501055Gly Asp Tyr Gly Phe Phe Ile Arg Asn Asp Ala Ser Asn Thr Tyr Phe106010651070Leu Leu Thr Ala Ala Gly Asp Gln Thr Gly Gly Phe Asn Gly Leu Arg107510801085Pro Leu Leu Ile Asn Asn Gln Ser Gly Gln Ile Thr Ile Gly Glu Gly109010951100Leu Ile Ile Ala Lys Gly Val Thr Ile Asn Ser Gly Gly Leu Thr Val1105111011151120Asn Ser Arg Ile Arg Ser Gln Gly Thr Lys Thr Ser Asp Leu Tyr Thr112511301135Arg Ala Pro Thr Ser Asp Thr Val Gly Phe Trp Ser Ile Asp Ile Asn114011451150Asp Ser Ala Thr Tyr Asn Gln Phe Pro Gly Tyr Phe Lys Met Val Glu115511601165Lys Thr Asn Glu Val Thr Gly Leu Pro Tyr Leu Glu Arg Gly Glu Glu117011751180Val Lys Ser Pro Gly Thr Leu Thr Gln Phe Gly Asn Thr Leu Asp Ser1185119011951200Leu Tyr Gln Asp Trp Ile Thr Tyr Pro Thr Thr Pro Glu Ala Arg Thr120512101215Thr Arg Trp Thr Arg Thr Trp Gln Lys Thr Lys Asn Ser Trp Ser Ser
122012251230Phe Val Gln Val Phe Asp Gly Gly Asn Pro Pro Gln Pro Ser Asp Ile123512401245Gly Ala Leu Pro Ser Asp Asn Ala Thr Met Gly Asn Leu Thr Ile Arg125012551260Asp Phe Leu Arg Ile Gly Asn Val Arg Ile Val Pro Asp Pro Val Asn1265127012751280Lys Thr Val Lys Phe Glu Trp Val Glu1285(2)SEQ ID NO3的信息(I)序列特征(A)长度65氨基酸(B)类型65氨基酸(D)拓扑学线性(ii)分子类型蛋白质(vi)最初来源(A)生物体噬菌体T4(vii)直接来源(B)克隆ORF X氨基酸(xi)SEQUENCE DESCRIPTIONSEQ ID NO3Met Glu Lys Phe Met Ala Glu Ile Trp Thr Arg Ile Cys Pro Asn Ala1 5 10 15Ile Leu Ser Glu Ser Asn Ser Val Arg Tyr Lys Ile Ser Ile Ala Gly20 25 30Ser Cys Pro Leu Ser Thr Ala Gly Pro Ser Tyr Val Lys Phe Gln Asp35 40 45Asn Pro Val Gly Ser Gln Thr Phe Arg Arg Arg Pro Ser Phe Lys Ser50 55 60Phe65(2)SEQ ID NO4的信息(I)序列特征(A)长度29 5氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(vi)最初来源(A)生物体噬菌体T4(vii)直接来源(B)克隆p35氨基酸(xi)SEQUENCE DESCRIPTIONSEQ ID NO4Met Leu Phe Arg Leu Gln Met Ile Leu His Gln Leu Leu Leu Leu Val1 5 10 15Phe Met Asn Ser Leu Thr Asn Asn Arg Ile Val Ala Ile Leu Thr Ser20 25 30Gly Lys Val Asn Phe Pro Pro Glu Val Val Ser Trp Leu Arg Thr Ala35 40 45Gly Thr Ser Ala Phe Pro Ser Asp Ser Ile Leu Ser Arg Phe Asp Val50 55 60Ser Tyr Ala Ala Phe Tyr Thr Ser Ser Lys Arg Ala Ile Ala Leu Glu65 70 75 80His Val Lys Leu Ser Asn Arg Lys Ser Thr Asp Asp Tyr Gln Thr Ile85 90 95Leu Asp Val Val Phe Asp Ser Leu Glu Asp Val Gly Ala Thr Gly Phe100 105 110Pro Arg Arg Thr Tyr Glu Ser Val Glu Gln Phe Met Ser Ala Val Gly115 120 125Gly Thr Asn Asn Glu Ile Ala Arg Leu Pro Thr Ser Ala Ala Ile Ser130 135 140Lys Leu Ser Asp Tyr Asn Leu Ile Pro Gly Asp Val Leu Tyr Leu Lys145 150 155 160Ala Gln Leu Tyr Ala Asp Ala Asp Leu Leu Ala Leu Gly Thr Thr Asn165 170 175Ile Ser Ile Arg Phe Tyr Asn Ala Ser Asn Gly Tyr Ile Ser Ser Thr180 185 190Gln Ala Glu Phe Thr Gly Gln Ala Gly Ser Trp Glu Leu Lys Glu Asp195 200 205Tyr Val Val Val Pro Glu Asn Ala Val Gly Phe Thr Ile Tyr Ala Gln210 215 220Arg Thr Ala Gln Ala Gly Gln Gly Gly Met Arg Asn Leu Ser Phe Ser225 230 235 240Glu Val Ser Arg Asn Gly Gly Ile Ser Lys Pro Ala Glu Phe Gly Val245 250 255Asn Gly Ile Arg Val Asn Tyr Ile Cys Glu Ser Ala Ser Pro Pro Asp260 265 270Ile Met Val Leu Pro Thr Gln Ala Ser Ser Lys Thr Gly Lys Val Phe275 280 285Gly Gln Glu Phe Arg Glu Val290 295(2)SEQ ID NO5的信息(I)序列特征(A)长度221氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(vi)最初来源(A)生物体噬菌体T4(vii)直接来源
(B)CLONEp36 amino acid(xi)SEQUENCE DESCRIPTIONSEQ ID NO5Met Ala Asp Leu Lys Val Gly Ser Thr Thr Gly Gly Ser Val Ile Trp1 5 10 15His Gln Gly Asn Phe Pro Leu Asn Pro Ala Gly Asp Asp Val Leu Tyr20 25 30Lys Ser Phe Lys Ile Tyr Ser Glu Tyr Asn Lys Pro Gln Ala Ala Asp35 40 45Asn Asp Phe Val Ser Lys Ala Asn Gly Gly Thr Tyr Ala Ser Lys Val50 55 60Thr Phe Asn Ala Gly Ile Gln Val Pro Tyr Ala Pro Asn Ile Met Ser65 70 75 80Pro Cys Gly Ile Tyr Gly Gly Asn Gly Asp Gly Ala Thr Phe Asp Lys85 90 95Ala Asn Ile Asp Ile Val Ser Trp Tyr Gly Val Gly Phe Lys Ser Ser100 105 110Phe Gly Ser Thr Gly Arg Thr Val Val Ile Asn Thr Arg Asn Gly Asp115 120 125Ile Asn Thr Lys Gly Val Val Ser Ala Ala Gly Gln Val Arg Ser Gly130 135 140Ala Ala Ala Pro Ile Ala Ala Asn Asp Leu Thr Arg Lys Asp Tyr Val145 150 155 160Asp Gly Ala Ile Asn Thr Val Thr Ala Asn Ala Asn Ser Arg Val Leu165 170 175Arg Ser Gly Asp Thr Met Thr Gly Asn Leu Thr Ala Pro Asn Phe Phe180 185 190Ser Gln Asn Pro Ala Ser Gln Pro Ser His Val Pro Arg Phe Asp Gln195 200 205Ile Val Ile Lys Asp Ser Val Gln Asp Phe Gly Tyr Tyr210 215 220(2)SEQ ID NO6的信息(I)序列特征(A)长度1026氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(vi)最初来源(A)生物体噬菌体T4(vii)直接来源(B)克隆p37氨基酸(xi)SEQUENCE DESCRIPTIONSEQ ID NO6Met Ala Thr Leu Lys Gln Ile Gln Phe Lys Arg Ser Lys Ile Ala Gly1 5 10 15Thr Arg Pro Ala Ala Ser Val Leu Ala Glu Gly Glu Leu Ala Ile Asn20 25 30Leu Lys Asp Arg Thr Ile Phe Thr Lys Asp Asp Ser Gly Asn Ile Ile35 40 45Asp Leu Gly Phe Ala Lys Gly Gly Gln Val Asp Gly Asn Val Thr Ile50 55 60Asn Gly Leu Leu Arg Leu Asn Gly Asp Tyr Val Gln Thr Gly Gly Met65 70 75 80Thr Val Asn Gly Pro Ile Gly Ser Thr Asp Gly Val Thr Gly Lys Ile85 90 95Phe Arg Ser Thr Gln Gly Ser Phe Tyr Ala Arg Ala Thr Asn Asp Thr100 105 110Ser Asn Ala His Leu Trp Phe Glu Asn Ala Asp Gly Thr Glu Arg Gly115 120 125Val Ile Tyr Ala Arg Pro Gln Thr Thr Thr Asp Gly Glu Ile Arg Leu130 135 140Arg Val Arg Gln Gly Thr Gly Ser Thr Ala Asn Ser Glu Phe Tyr Phe145 150 155 160Arg Ser Ile Asn Gly Gly Glu Phe Gln Ala Asn Arg Ile Leu Ala Ser165 170 175Asp Ser Leu Val Thr Lys Arg Ile Ala Val Asp Thr Val Ile His Asp180 185 190Ala Lys Ala Phe Gly Gln Tyr Asp Ser His Ser Leu Val Asn Tyr Val195 200 205Tyr Pro Gly Thr Gly Glu Thr Asn Gly Val Asn Tyr Leu Arg Lys Val210 215 220Arg Ala Lys Ser Gly Gly Thr Ile Tyr His Glu Ile Val Thr Ala Gln225 230 235 240Thr Gly Leu Ala Asp Glu Val Ser Trp Trp Ser Gly Asp Thr Pro Val245 250 255Phe Lys Leu Tyr Gly Ile Arg Asp Asp Gly Arg Met Ile Ile Arg Asn260 265 270Ser Leu Ala Leu Gly Thr Phe Thr Thr Asn Phe Pro Ser Ser Asp Tyr275 280 285Gly Asn Val Gly Val Met Gly Asp Lys Tyr Leu Val Leu Gly Asp Thr290 295 300Val Thr Gly Leu Ser Tyr Lys Lys Thr Gly Val Phe Asp Leu Val Gly305 310 315 320Gly Gly Tyr Ser Val Ala Ser Ile Thr Pro Asp Ser Phe Arg Ser Thr325 330 335Arg Lys Gly Ile Phe Gly Arg Ser Glu Asp Gln Gly Ala Thr Trp Ile340 345 350Met Pro Gly Thr Asn Ala Ala Leu Leu Ser Val Gln Thr Gln Ala Asp355 360 365Asn Asn Asn Ala Gly Asp Gly Gln Thr His Ile Gly Tyr Asn Ala Gly
370 375 380Gly Lys Met Asn His Tyr Phe Arg Gly Thr Gly Gln Met Asn Ile Asn385 390 395 400Thr Gln Gln Gly Met Glu Ile Asn Pro Gly Ile Leu Lys Leu Val Thr405 410 415Gly Ser Asn Asn Val Gln Phe Tyr Ala Asp Gly Thr Ile Ser Ser Ile420 425 430Gln Pro Ile Lys Leu Asp Asn Glu Ile Phe Leu Thr Lys Ser Asn Asn435 440 445Thr Ala Gly Leu Lys Phe Gly Ala Pro Ser Gln Val Asp Gly Thr Arg450 455 460Thr Ile Gln Trp Asn Gly Gly Thr Arg Glu Gly Gln Asn Lys Asn Tyr465 470 475 480Val Ile Ile Lys Ala Trp Gly Asn Ser Phe Asn Ala Thr Gly Asp Arg485 490 495Ser Arg Glu Thr Val Phe Gln Val Ser Asp Ser Gln Gly Tyr Tyr Phe500 505 510Tyr Ala His Arg Lys Ala Pro Thr Gly Asp Glu Thr Ile Gly Arg Ile515 520 525Glu Ala Gln Phe Ala Gly Asp Val Tyr Ala Lys Gly Ile Ile Ala Asn530 535 540Gly Asn Phe Arg Val Val Gly Ser Ser Ala Leu Ala Gly Asn Val Thr545 550 555 560Met Ser Asn Gly Leu Phe Val Gln Gly Gly Ser Ser Ile Thr Gly Gln565 570 575Val Lys Ile Gly Gly Thr Ala Asn Ala Leu Arg Ile Trp Asn Ala Glu580 585 590Tyr Gly Ala Ile Phe Arg Arg Ser Glu Ser Asn Phe Tyr Ile Ile Pro595 600 605Thr Asn Gln Asn Glu Gly Glu Ser Gly Asp Ile His Ser Ser Leu Arg610 615 620Pro Val Arg Ile Gly Leu Asn Asp Gly Met Val Gly Leu Gly Arg Asp625 630 635 640Ser Phe Ile Val Asp Gln Asn Asn Ala Leu Thr Thr Ile Asn Ser Asn645 650 655Ser Arg Ile Asn Ala Asn Phe Arg Met Gln Leu Gly Gln Ser Ala Tyr660 665 670Ile Asp Ala Glu Cys Thr Asp Ala Val Arg Pro Ala Gly Ala Gly Ser675 680 685Phe Ala Ser Gln Asn Asn Glu Asp Val Arg Ala Pro Phe Tyr Met Asn690 695 700Ile Asp Arg Thr Asp Ala Ser Ala Tyr Val Pro Ile Leu Lys Gln Arg705 710 715 720Tyr Val Gln Gly Asn Gly Cys Tyr Ser Leu Gly Thr Leu Ile Asn Asn725 730 735Gly Asn Phe Arg Val His Tyr His Gly Gly Gly Asp Asn Gly Ser Thr740 745 750Gly Pro Gln Thr Ala Asp Phe Gly Trp Glu Phe Ile Lys Asn Gly Asp755 760 765Phe Ile Ser Pro Arg Asp Leu Ile Ala Gly Lys Val Arg Phe Asp Arg770 775 780Thr Gly Asn Ile Thr Gly Gly Ser Gly Asn Phe Ala Asn Leu Asn Ser785 790 795 800Thr Ile Glu Ser Leu Lys Thr Asp Ile Met Ser Ser Tyr Pro Ile Gly805 810 815Ala Pro Ile Pro Trp Pro Ser Asp Ser Val Pro Ala Gly Phe Ala Leu820 825 830Met Glu Gly Gln Thr Phe Asp Lys Ser Ala Tyr Pro Lys Leu Ala Val835 840 845Ala Tyr Pro Ser Gly Val Ile Pro Asp Met Arg Gly Gln Thr Ile Lys850 855 860Gly Lys Pro Ser Gly Arg Ala Val Leu Ser Ala Glu Ala Asp Gly Val865 870 875 880Lys Ala His Ser His Ser Ala Ser Ala Ser Ser Thr Asp Leu Gly Thr885 890 895Lys Thr Thr Ser Ser Phe Asp Tyr Gly Thr Lys Gly Thr Asn Ser Thr900 905 910Gly Gly His Thr His Ser Gly Ser Gly Ser Thr Ser Thr Asn Gly Glu915 920 925His Ser His Tyr Ile Glu Ala Trp Asn Gly Thr Gly Val Gly Gly Asn930 935 940Lys Met Ser Ser Tyr Ala Ile Ser Tyr Arg Ala Gly Gly Ser Asn Thr945 950 955 960Asn Ala Ala Gly Asn His Ser His Thr Phe Ser Phe Gly Thr Ser Ser965 970 975Ala Gly Asp His Ser His Ser Val Gly Ile Gly Ala His Thr His Thr980 985 990Val Ala Ile Gly Ser His Gly His Thr Ile Thr Val Asn Ser Thr Gly995 10001005Asn Thr Glu Asn Thr Val Lys Asn Ile Ala Phe Asn Tyr Ile Val Arg101010151020Leu Ala102权利要求
1.一种分离的基本上由从氨基末端数缺乏氨基酸99-496(SEQ IDNO6)的T4噬菌体的gp37尾丝蛋白组成的多肽,其中所说多肽具有形成二聚体和与T4噬菌体的P36蛋白寡聚物相互作用的能力。
2.一种分离的基本上由T4噬菌体的gp36蛋白与gp37蛋白形成的融合蛋白组成的多肽,其中gp37(SEQ ID NO6)的氨基酸残基1-242以正确的阅读框架与gp36(SEQ ID NO5)的氨基酸残基18-221融合。
3.权利要求2的多肽,其中该种多肽的多数羧基末端具有如下能力能与T4噬菌体的P37蛋白寡聚物的氨基末端相互作用,进而形成一种连接的寡聚物,该多肽寡聚物的氨基末端能够与T4噬菌体的gp36多肽的羧基末端相互作用。
4.一种分离的基本上由两个来自T4噬菌体的gp37多肽组成的多肽寡聚物,其中该寡聚物的氨基末端不能与T4噬菌体的gp36多肽的羧基末端相互作用。
5.一种分离的基本上由T4噬菌体的P37蛋白组成的多肽寡聚物,其中该寡聚物的氨基末端不能与T4噬菌体的gp36多肽的羧基末端相互作用。
6.一种分离的基本上由T4噬菌体的gp36蛋白的变异体组成的多肽,其中该多肽不能与T4噬菌体的P37蛋白寡聚物的氨基末端相互作用。
7.一种分离的基本上由一种T4噬菌体的gp36蛋白和gp34蛋白形成的融合蛋白组成的多肽,其中gp36(SEQ ID NO5)氨基酸残基1-73在适当的阅读杠架下以其氨基末端与gp34(SEQ ID NO5)的氨基酸残基866-1289融合在一起。
8.权利要求7多肽的寡聚物,其中所说二聚体的氨基末端能够与T4噬菌体的gp35蛋白相互作用。
9.一种分离的基本上由T4噬菌体的gp35蛋白的变异体组成的多肽,其中该多肽在使T4噬菌体的P34与P36-P37蛋白寡聚物连结起来时形成了一个小于大约125°的角,在这种条件下,野生gp35蛋白在与该寡聚物连接时形成了一个137°的角。
10.一种分离的基本上由T4噬菌体的gp35蛋白的一种变异体组成的多肽,其中该多肽在与T4噬菌体的P34与P36-P37蛋白寡聚物连接起来时形成了一个大于约145°的角,在这种条件下其中野生型gp35蛋白在与该寡聚物连接时形成了一个137°的角。
11.一种分离的基本上由T4噬菌体的gp35蛋白的一种变异体组成的多肽,其中该多肽与T4噬菌体的P34蛋白寡聚物的相互作用在40-60℃条件下是不稳定的。
12.一种分离的基本上由T4噬菌体的P37蛋白的一种变异体组成的多肽寡聚物,其中该寡聚物与T4噬菌体的P36蛋白寡聚物的相互作用在40-60℃条件下是不稳定的。
13.一种分离的基本上由T4噬菌体的P37蛋白的一种变异体组成的多肽寡聚物,其中该寡聚物的羧基末端区域被修饰以便赋予整个多肽与一种固定化配体特异结合能力。
14.权利要求13的多肽,其中所说的配体选自生物素,免疫球蛋白,或二价金属离子。
15.一种包含多个融合蛋白的纳米结构,所说的融合蛋白由两部分组成,第一部分至少由尾丝蛋白的前10个N-端氨基酸组成,第二部分至少由中另一种尾丝蛋白的后10个C-端氨基酸组成,这两部分通过一种肽键融合在一起,其中此尾丝蛋白选自T-偶数类噬菌体的gp34,gp35,gp36和gp37蛋白,其中第一种尾丝蛋白可以与第二种尾丝蛋白相同,也可以不同。
16.权利要求15的纳米结构,其中第一种和第二种尾纤维蛋白不同。
17.权利要求15的纳米结构,还包含一种能自我组装成二聚体或三聚体的分子,该分子至少与一种T偶数类尾丝蛋白的10氨基酸部分融合。
18.权利要求17的纳米结构,其中该分子具有亮氨酸拉链结构。
19.树利要求15的纳米结构,其中该纳米结构包含一种线性一维的杆状结构。
20.权利要求15的纳米结构,其中该纳米结构包含一种多边形结构。
21.权利要求15的纳米结构,其中该纳米结构包含一种三维笼状或实体结构。
22.权利要求15的纳米结构,其中该纳米结构包含一种平面的开放或封闭的片状结构。
23.一种分离的融合蛋白,基本上由两部组成,一部分来自一种T-偶数类噬菌体的gp37蛋白,它至少由此gp37蛋白的前10到60个N-末端氨基酸组成,这部分和第二部分相融合,第二部分来自一种T-偶数类噬菌体的gp36蛋白,它至少由此gp36蛋白的最后10到60个C-末端氨基酸组成。
24.一种分离的融合蛋白,基本上由两部分组成,一部分来自一种T-偶数类噬菌体的gp37蛋白,它至少由此gp37蛋白的前10个N-末端氨基酸组成,这一部分与第二部分相融合,第二部分来自一种T-偶数类噬菌体的gp36蛋白,它至少由此gp36蛋白最后10个C-末端氨基酸组成。
25.一种分离的融合蛋白,基本由两部分组成,一部分来自一种T-偶数类噬菌体的gp37蛋白,它至少由此gp37蛋白的前20个N-末端氨基酸组成,这一部分与第二部分相融合,第二部分来自一种T-偶数类噬菌体的gp36蛋白,它至少由此gp36蛋白的最后20个C-末端氨基酸组成。
26.一种分离的融合蛋白,基本由两部分组成,一部分来自一种T-偶数类噬菌体的gp36蛋白,它至少由此gp36蛋白的前10-60个N-末端氨基酸组成,这一部分与第二部分融合,第二部分来自一种T-偶数类噬菌体的gp34蛋白,它至少由此gp34蛋白的最后10-60个C-末端氨基酸组成。
27.一种分离的蛋白,至少包括20个相邻的氨基酸,这些氨基酸来自一种T-偶数类噬菌体的gp37,gp36,或gp34蛋白,此分离的蛋白至少缺少5个此蛋白氨基末端或羧基末端氨基酸。
28.一种分离的编码权利要求1的多肽的DNA。
29.一种分离的编码权利要求2的多肽的DNA。
30.一种分离的编码权利要求4的多肽的DNA。
31.一种分离的编码权利要求5的多肽的DNA。
32.一种分离的编码权利要求6的多肽的DNA。
33.一种分离的编码权利要求7的多肽的DNA。
34.一种分离的编码权利要求9的多肽的DNA。
35.一种分离的编码权利要求10的多肽的DNA。
36.一种分离的编码权利要求11的多肽的DNA。
37.一种分离的编码权利要求12的多肽的DNA。
38.一种分离的编码权利要求13的多肽的DNA。
39.一种分离的编码权利要求23的多肽的DNA。
40.一种分离的编码权利要求25的多肽的DNA。
41.一种分离的编码权利要求26的多肽的DNA。
42.一种分离的编码权利要求27的多肽的DNA。
43.一种制备多边形纳米结构的方法,包括使权利要求26的蛋白与提纯的T-偶数类噬菌体的gp35蛋白接触。
44.一种制备纳米结构的方法,包括使多个权利要求23的蛋白质相互接触。
45.一种在一个或多个容器中包含有权利要求23的融合蛋白的试剂盒。
46.一种在一个或多个容器中包含有权利要求25的融合蛋白的试剂盒。
47.一种在一个或多个容器中包含有权利要求26的融合蛋白的试剂盒。
48.一种试剂盒,在一个或多个容器中包含有权利要求26的融合蛋白和一种分离的T-偶数类噬菌体的gp35蛋白。
49.权利要求23的蛋白,其中T偶数类噬菌体是T4。
50.权利要求26蛋白,其中T偶数类噬菌体是T4。
51.一种分离的基本上由T4噬菌体的gp36蛋白的一种变异体组成的多肽,其中该多肽与T4噬菌体的P37蛋白寡聚物之间的相互作用在40-60℃条件下不稳定。
52.一种分离的基本上由T4噬菌体的gp36蛋白的一种变异体组成的多肽,其中该多肽与T4噬菌体的gp35蛋白之间的相互作用在40-60℃条件下不稳定。
53.一种分离的基本上由T4噬菌体的gp34蛋白的一种变异体组成的多肽,其中该多肽与T4噬菌体的gp35蛋白之间的相互作用在40-60℃条件下不稳定。
全文摘要
本发明属于纳米结构,即在微观和宏观结构的建造中有用的纳米大小的结构。本发明尤其是指基于T4噬菌体尾丝蛋白及其变异体的纳米结构。
文档编号C07K19/00GK1168676SQ95196597
公开日1997年12月24日 申请日期1995年10月13日 优先权日1994年10月13日
发明者爱德华B·戈德伯格 申请人:爱德华B·戈德伯格
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1