随机多肽文库构建方法

文档序号:3546169阅读:755来源:国知局
专利名称:随机多肽文库构建方法
技术领域
本发明涉及一种新的随机多肽文库构建方法,具体地,本发明涉及利用自然界存在的所有核酸资源而构建随机多肽文库的方法以及由此构建的多肽文库。更具体地,本发明涉及利用自然界存在的天然产物—各物种的基因组DNA而构建随机多肽文库的方法以及由此构建的多肽文库。
第二类合成方法是利用重组DNA技术在体内表达可溶的融合蛋白或是病毒的衣壳融合蛋白。第二类合成方法许多都要用到M13噬菌体。1989年,Parmley,S.F.和Smith,G.P.,(1989,Adv.Exp.Med.Biol.251215-218)认为将合成的短序列DNA片段克隆进M13噬菌体的pIII蛋白可以产生一个有代表性的抗原库。他们认为因为线性抗原表位通常为6个氨基酸,所以应该可以用随机重组的DNA文库来表达所有可能的6肽以分离出结合抗体的抗原表位。
Scott和Smith(Scott,J.K.and Smith,G.P.,1 990,Science 249386-390)在M13噬菌体表面构建和表达了一个六肽的抗原文库。他们首先将用BglI酶切的33bp长的寡聚核苷酸片段插入到用SfiI酶切的噬菌体中(fUSE5 RF)。这个33bp长的寡聚核苷酸片段包含一个随机的简并序列(NNK)6,在这里N代表G,A,T和C而K代表G和T。Cwirla等(Cwirla,S.E.,et al.,1990,Proc.Natl.Acad.Sci.USA 876378-6382)也介绍了一个类似的在M13fd噬菌体基因pIII中表达一个融合6肽文库的方法。Dower和Cwirla(Dower,Cwirla 1991)介绍了一个类似的表达5-8个随机氨基酸文库的方法。
Devlin等(1990,Science,249404-406)用合成寡聚核苷酸的方法构建了一个15个简并密码子的多肽库(NNS),这里S代表G或C。
Christian和其同事(Christian,R.B.,et al.,1992,J.Mol.Biol.227711-718)介绍了一种表达10肽文库的方法,他们首先合成一段包含简并密码子(NN(G/T))10的寡聚DNA,同时这段寡聚DNA在3’端有一自我互补的序列。这样就形成了一个发卡结构,在T4 DNA聚合酶的作用下,以发卡结构的3’端为引物可以合成一段完整的互补链。这个双链DNA用SfiI酶切其两端后用上述Scott和Smith的方法可以克隆进fUSE5载体中。
Lenstra,(1992,J.Immunol.Meth.152149-157)介绍了一种非常费力的建库方法,这种方法用17或23bp的寡聚核苷酸退火形成8个核苷酸长的回文序列,它被克隆进β-半乳糖苷酶基因的3’端,在细菌表达载体中表达融合蛋白。DNA首先在Klenow DNA聚合酶的作用下被补成双链,平末端连进载体后用HindIII内切酶切割,产生的片段克隆到C-末端缺陷的β-半乳糖苷酶基因的3’端,这样可以产生107个重组子。菌落裂解后,转移到硝酸纤维素膜上(104/膜),用几个不同的单克隆抗体进行免疫筛选。经过几轮重复筛选,分离到了许多目的克隆。
由以上介绍可知,现有的建库方法都需要人工合成多肽(体外)或寡聚核苷酸(体内)。体外人工合成多肽设计起来虽然较简单,但是要用到昂贵的仪器和复杂的方法,工作费时费力,而且还需要较大的财力支持。用合成寡聚核苷酸在体内表达多肽的方法较好的解决了上述问题,它巧妙简洁而且所需费用大大减少,但是它也有一些固有的缺点,如寡聚核苷酸序列设计起来较复杂,需要考虑简并密码子、终止密码子以及尽量不要形成回文结构等;在实验进行过程中还有退火、补平末端和酶切连接等过程,这些都对实验的成功性造成很大影响。此外,用以上方法所简建的随机多肽库的长度基本上限定在6-8个氨基酸,并且一种方法只能构建一种长度的文库。
因此,寻找一种消除了以上所说的弊端、实验程序简化同时又保持了所建文库的复杂性的新的构建随机多肽文库的方法是非常需要的。
图2是实施例1所述本发明的构建随机多肽文库的方法的一个实施方案中人基因组DpnII酶切电泳图,图中M泳道是DL2000分子量标记(购自大连TaKaRa公司),1泳道是人基因组酶切产物。
图3是实施例1所述本发明的构建随机多肽文库的方法的一个实施方案中所构建的文库的PCR鉴定电泳图,图中M泳道是DL2000分子量标记,1泳道是PCR产物。
又比如,如果用另外一种识别3个核苷酸的限制性内切酶(如CviJI)切割另外一个物种酵母的基因组DNA(1.7×107bp),理论上产生平均长度为64bp(43=64)的DNA片段共2.66×105条(1.7×107/64),这样长的DNA可以编码约21.3(64/3≈21.3)个氨基酸,而每64个氨基酸密码子中有3个终止密码子,所以每个片段中应有3个终止密码子。因此,这样的DNA片段连在表达载体上翻译的时候,会随机终止(因为终止密码子的分布是随机的)。这样就产生了平均长度在21.33个氨基酸残基的,长度不一、序列各异的随机多肽库。
用本方法构建的随机多肽库的材料并不限于上述所说的情况,例如所用的基因组并不限于人类的,可以包括自然界所有的核酸资源,例如其它动物、植物、微生物的基因组以及mRNA、cDNA等甚至人工合成的核酸。所用的酶也不限于识别4个核苷酸的限制性内切酶,应包括所有的限制性内切酶,而不论它们识别序列的个数,如包括可识别3个核苷酸的限制性内切酶CviJI和CviTI,识别5个,6个,7个,8个或更多个核苷酸的限制性内切酶等等。同时还包括两种或更多限制性内切酶的组合。例如同时使用DpnII和EcoRI或更多限制性内切酶。
本发明方法可采用任何生物(包括所有动物,植物和微生物)组织或细胞,选择基因组DNA越复杂的生物,得到的文库越复杂。
本发明方法原则上可以选用任何限制性内切酶如DpnII、Sau3A、MboI等。但是识别序列是4个,甚至3个核苷酸的限制性内切酶或它们的组合,如同时使用DpnII和CviJI是优选的,因为其最能充分利用基因组DNA,所制备的文库复杂性最高。
本发明方法可以选用任何表达载体,包括但不限于质粒、噬菌体载体、噬菌粒等。另外,可以选用任何能导致蛋白表达的多克隆位点。
本发明方法中多肽的表达方式可以是体内的,也可以是体外的。
本发明方法中所用的转化方法包括但不限于电击转化(如化学转化等)。
本发明方法可以选用任何可用于制备文库的宿主菌。
构建好的文库可以通过对文库的DNA序列分析鉴定文库所表达多肽的复杂性。
根据本发明方法获得的文库具有如下特征a.不等长限制性内切酶消化基因组DNA产生的DNA片段长度不一。
b.同源文库中所有的DNA片段都源于所用的同一种生物或几种生物DNA片段的组合。
c.接口序列文库内的每个克隆具有相同的,本文库所用内切酶连接后的特征序列。
d.如果认为基因组DNA序列是随机DNA序列,文库表达的多肽平均长度为21.33个氨基酸残基。
e.对于同样的基因组DNA材料,用不同的限制性内切酶消化可以产生完全没有交叉覆盖的新的随机多肽文库。对于不同的基因组DNA材料,用相同的限制性内切酶消化也可以产生新的随机多肽文库。DNA材料的生物亲缘越远,文库的交叉覆盖越小。
f.其中所述限制性内切酶可以是其中的一种,也可以是两种或更多限制性内切酶的组合。
g.利用世界上现有的DNA资源,避免合成随机寡聚核苷酸。
h.可以是具有以上特性的文库的混合文库混合文库中的克隆具备未混合之前母文库的以上特征。
本发明的随机多肽文库所特有的功能如下a.具有其它随机多肽文库的功能。
b.不等长的随机多肽文库具有等长短随机多肽文库所不具有的长结构域,功能域。
c.并且,不等长的随机多肽文库具有等长长随机多肽文库所不具有的短结构域,功能域。有利于确定结构功能域的最小必要序列。
d.既能够用于鉴定蛋白-蛋白相互作用,也能用于鉴定蛋白-核酸相互作用本发明的新的建库方法消除了现有技术中的弊端,首先它利用的是自然界存在的天然产物—各物种的基因组DNA,因此它不需要人工合成;第二由于基因组DNA本身的复杂性(尤其是高等生物),因此也保证了用这样的方法所建文库的复杂性;第三由于基因组DNA是双链产物,所以本方法不需要退火、补平末端等过程,而是直接的酶切和连接,这样大大简化了实验程序;第四用本方法构建的文库多肽的长短不一、序列各异,平均长度为21个氨基酸,因此这样的文库应用范围更广,可以满足不同实验的需要,具有多功能性,是更广泛意义上的随机多肽文库。
以下参照实施例和附图
描述本发明,应理解的是所述实施例仅是描述性而非限制性的。实施例1用人血细胞基因组DNA构建随机多肽文库本例中采用人血细胞分离基因组DNA,所用表达载体为质粒pGADT7(购自Clontech公司),所用限制性内切酶DpnII购自NewEnglish Biolab公司,BamHI购自大连TaKaRa公司。所用宿主菌为大肠杆菌XL1-Blue(购自stratagene公司)具体建库步骤如下1、提取人血细胞基因组DNA;取新鲜血液20ml以1300g离心15分钟,弃上层血浆,用巴斯德吸管将淡黄层小心移至另一管中并再次离心。将第二次离心的淡黄层重悬于15ml抽提缓冲液中,于37℃温育1小时。之后加蛋白酶至终浓度为100μg/ml,用一玻棒温和的将酶混入粘滞的溶液中。将裂解细胞的悬液置于50℃水浴中3小时,不时旋动该粘滞溶液。将溶液冷却至室温,如有必要将溶液倾入离心管,加等体积碱性酚,缓慢的来回颠倒离心管10分钟,小心混合两相,如此时两相未能混合形成乳浊液,则将离心管置于一旋转器上1小时,于室温以1500g离心15分钟,使两相分开。用大口径移液管将粘稠的水相移至一洁净的离心管中,用酚重复抽提两次。第三次酚抽提后用全部水相于4℃4L,50mM Tris·Cl(pH8.0)、10mM EDTA(pH8.0)溶液透析4次,直至透析液的OD270小于0.05。测定DNA样品在260nm和280nm处的光吸收A260与A280之比小于1.8。计算DNA样品浓度(浓度多少1.2ug/ul)。2、人血细胞基因组DNA的单酶切及酶切产物的回收纯化在500μl的离心管中建立酶切反应体系如下人血细胞基因组DNA 10μl(5μg),10X DpnII酶切缓冲液2μl,无菌双蒸水6μl,DpnII(10u/μl)2μl,共20μl,37℃反应过夜。将所述酶切产物用酚/氯仿抽提两遍,然后加入1/10体积的3M NaAc溶液,并加入两倍体积的冰冷无水乙醇,-20℃沉淀1小时;之后12000rpm,4℃离心15分钟;将所得沉淀用70%冰冷乙醇漂洗两遍;将沉淀溶于适量无菌双蒸水中备用。取少量酶切样品进行电泳,结果如图2所示,所切片段的分子量从100bp到2000bp都有,理论上酶切片段的平均长度是256bp,而实际上酶切片段长度跨度较大,这从客观上也增加了文库的复杂性。3、质粒载体的制备及单酶切根据分子克隆实验手册所述,用碱裂解法制备质粒pGADT7。之后用DpnII的同尾酶BamHI对质粒pGADT7进行单酶切反应,在500μl的离心管中建立酶切反应体系如下质粒pGADT7 10μl(3μg),10X BamHI酶切缓冲液2μl,无菌双蒸水7μl,BamHI(10u/μl)1μl,共20μl,37℃反应过夜。用常规方法经CIAP将质粒酶切产物去磷酸化。4、连接反应将上述制得的基因组DNA酶切产物和质粒酶切产物在T4 DNA连接酶的作用下连接,在500μl的离心管中建立酶切反应体系如下10X连接缓冲液1μl,去磷酸化质粒1μl,酶切后基因组DNA 7μl,T4 DNA连接酶1μl,共10μl,16℃反应过夜5、电感受态细胞制备1)划线培养XL1-Blue细胞(含四环素20μg/ml)2)培养3ml的LB,37℃,250rpm摇培过夜。
3)将3ml过夜培养的LB培养液注入1升的LB培养基中,250rpm摇培至OD值为0.5,约需3-4小时。
4)将这1升培养液分装至4个500ml的离心瓶中,4℃,5000rpm,离心10min。
5)将沉淀重悬在100ml冰冷的无菌双蒸水中,并将重悬物合并在2个离心瓶中(即每瓶将包含200ml的重悬物)。
6)4℃,5000rpm,离心10min7)将沉淀重悬在100ml冰冷的无菌双蒸水中,并将它们合并到一个离心瓶中并且再一次4℃,5000rpm,离心10min。
8)将沉淀重悬在100ml冰冷的10%灭菌甘油中,如上再次离心,最终重悬在2ml冰冷的10%灭菌甘油中,得到无离子、高浓度的电感受态细胞。6、电击转化
在电感受态细胞40μl中加入2-3μl上述连接混合物,用电转仪(Bio-Rad,Gene Pluser II system)进行常规电转化,条件为2.5kv。在LB/氨苄青霉素平板上筛选转化子菌落。收集所得菌落,加25%无菌甘油于-70℃保存。7、文库的鉴定取50μl上述文库菌液,置于6ml新鲜的LB(+Amp)培养基中,于37℃,250rpm摇培4小时;离心,收集菌体,用碱裂解法提取质粒。文库质粒采用PCR进行鉴定,,利用pGADT7载体上插入位点两端的序列为上、下游引物(MATCHMAKER 5’AD LD-Insert ScreeningAmplimer5’-CTATTCGATGATGAAGATACCCCACCAAACCC-3’;MATCHMAKER 3’AD LD-Insert Screening Amplimer5’-GTGAACTTGCGGGGTTTTTTCAGTATCTACGATT-3’),鉴定文库中外源片段的连入情况。从PCR产物电泳图谱(图3)可知,连入片段大小大多数在100bp和250bp附近,而且数量很多,这可能有两种情况1)连入片段大小在100bp和250bp附近,但每种分子都互不相同,也就是文库的复杂性较大;2)虽然连入片段大小在100bp和250bp附近,但大部分是同一种分子,只是由于在模板中它们的拷贝数较多,所以在PCR中得到了优先扩增,如果是这样,则文库的复杂性较小。
总之,用本发明的这种构建随机多肽文库的方法已经初步建立了一个随机多肽文库,这说明这种方法是切实可行的。实施例2随机多肽文库的应用实施例1获得的随机多肽库可以用来筛选PDZ结构域的配体C末端的氨基酸序列。PDZ结构域是细胞蛋白中一种重要的结构域,其配体与其相互作用的特点是,配体蛋白的C末端与PDZ相互作用。具体方法如下1)用碱裂解法提取实施例1获得的随机多肽文库的质粒;2)酵母双杂交,即,将1)中所得质粒与连入外源PDZ结构域基因的pGADT7质粒共同转化酵母细胞;3)挑选阳性克隆,测序,得到所有和此PDZ蛋白结合的C末端的氨基酸序列,经过生物信息学检索得到与此PDZ相结合的所有结合蛋白的全序列。
权利要求
1.构建随机多肽文库的方法,包括如下步骤1)获得任何来源的核酸,所述核酸选自从任一物种的细胞或组织提取的基因组DNA或mRNA,cDNA或其它合成的核酸;2)利用一或多种限制性内切酶切割所获得的核酸;3)将所述切割的核酸与合适的载体连接;4)将连接混合物转化进合适的宿主进行表达,从而获得随机多肽文库。
2.根据权利要求1的方法,其中所述核酸是选自包括动物、植物、微生物以及人的任一物种的基因组DNA。
3.根据权利要求1的方法,其中所述限制性内切酶的识别序列由3、4、5、6、7、8个或更多个核苷酸组成。
4.根据权利要求3的方法,其中所述限制性内切酶的识别序列由3个核苷酸组成。
5.根据权利要求3的方法,其中所述限制性内切酶的识别序列由4个核苷酸组成。
6.根据权利要求3的方法,其中所述限制性内切酶是DpnII、Sau3A或MboI。
7.根据权利要求1的方法,其中同时使用DpnII和EcoRI。
8.根据权利要求1的方法,其中所述载体选自质粒、噬菌体载体、噬菌粒或任何其他基因工程中所用的载体。
9.根据权利要求8的方法,其中所述载体是质粒pGADT7。
10.由权利要求1-9任一项所述的方法构建的随机多肽文库。
11.权利要求10的随机多肽文库包括但不限于应用在蛋白质和多肽功能的研究以及药物的开发。
全文摘要
本发明涉及一种新的随机多肽文库构建方法,更具体地,本发明涉及利用自然界存在的所有核酸资源而构建随机多肽文库的方法以及由此构建的多肽文库。用本方法构建的文库多肽的长短不一、序列各异,平均长度为21个氨基酸,因此这样的文库应用范围更广,可以满足不同实验的需要,具有多功能性,是更广泛意义上的随机多肽文库。
文档编号C07K14/00GK1458166SQ02120209
公开日2003年11月26日 申请日期2002年5月16日 优先权日2002年5月16日
发明者高友鹤, 黄海明 申请人:中国医学科学院基础医学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1