适配器定向展示系统的制作方法

文档序号:410886阅读:258来源:国知局
专利名称:适配器定向展示系统的制作方法
技术领域
本发明处于展示技术领域。特定地,本发明涉及用于基因包装上外源性展示的适配器定向展示系统的产生。本发明所包含之组合物和方法尤其适用于自多肽的大量清单中来识别展现期望的特性的个体。
背景技术
在基因包装(genetic package)表面上的多肽展示代表一种用于在实验室中执行分子进化的强大的方法学。构建庞大分子多样性文库的能力与选择具有期望的特性的分子的能力使得此技术可应用于许多问题。噬菌体展示起点的注明日期为二十世纪中期,当时乔治.史密斯(George Smith)首次在噬菌体M13病毒颗粒的表面上通过将外源性序列融合为噬菌体外壳蛋白质(Science(1985)2281315-1317)来显现蛋白质的外源性片段。两个创造性概念自史密斯的最初试验中呈现出来。第一,该实验建议可构建多肽的大量多样性清单,其中个别噬菌体颗粒展示独特多肽。第二,该实验确认了在表型和基因型之间的直接物理连接。即,展示期望的多肽的噬菌体亦含有对多肽进行编码的脱氧核糖核酸(DNA),可迅速地将DNA分离以进行随后的分析。麦卡费提(McCafferty)和拉德那(Ladner)将该等概念延伸至多肽的荧幕清单,例如在噬菌体颗粒表面上所展示的单链抗体(美国专利第5,969,108号和第5,837,500号)。其后,噬菌体展示已成为蛋白质工程的一种广泛技术。
展示系统的范围已基于乔治.史密斯的发现得到发展。该等系统可广泛分为两类。第一种产生系统是单载体系统。在该系统中的载体含有整个噬菌体基因包装,其中插入一个具有外壳蛋白质基因的外源性序列框架(in-frame)。因为所得噬菌体颗粒携带整个噬菌体基因包装,所以其相对不稳定且不易传染。第二个产生系统通常指噬菌体中央系统,其具有两组分(1)携带已融合为噬菌体外壳蛋白质的外源性序列的噬菌体载体和由噬菌体所获得的复制起点,以允许将噬菌体中间部分包裹为噬菌体颗粒;和(2)携带所有其它噬菌体包裹所需序列的辅助噬菌体载体。该辅助载体通常为有复制缺陷的载体,例如由香港商安法玛亚股份有限公司(Amersham Pharmacia Biotech)所制造的辅助载体和由斯特拉塔根(Stratagen)所生产的其衍生物VCSM13。在以该辅助噬菌体对细菌细胞进行双重感染(superinfection)时,可产生新颖包裹噬菌体,该噬菌体携带噬菌体载体且展示外源性序列。
同样地,先前的噬菌体中间系统需要将外源性序列融合为至少一部分噬菌体外表面序列(例如外壳序列)。虽然已报道了基因VI、VII和IX融合,最常用的融合或展示位点在M13噬菌体的基因HI和VIII中。然而,该等融合系统具有许多明显的限制。首先的和重要的,外壳蛋白质的显现对宿主细胞是有毒的,因此必须对该外壳融合的严格调控进行监控。虽然如此,不可避免的促进剂(promoter)泄漏可导致具有多样性文库的个体的损失。维持文库的稳定性对于产生具有至少109组成(complexity)的分子(例如抗原结合单元)的大量多样性清单尤其关键。第二,某些外壳蛋白质例如基因III产物(pIII)的显现可提供宿主细胞,该宿主细胞可抵抗产生后代噬菌体颗粒所需的辅助噬菌体的感染。第三,包含基因III和基因II噬菌体展示系统的融合格式将插入点限制在该外表面序列的第五端。因此必须将该外源性多肽连接至该外表面蛋白质的氨基末端(N-terminus)。从而,含有所有阅读框的编码序列片段的cDNA文库由于内部终止码对于阅读框的频繁破坏而不能由该等融合系统充分展示。此外,由于在融合和正常型外表面蛋白质(通常由辅助载体所提供)之间的重组,该融合系统不稳定。最后,由于噬菌体中间载体含有至少一部分该外表面序列,因此大的外源性序列由于大载体的低转化效率而不能有效地显现。然而,转化效率是产生高组合文库的关键因子。
已经描述了对于融合噬菌体中间系统所做的各种改进。WO 91/17271提出构建一个噬菌体展示系统,在该系统中可经由“标记(tag)”和“标记配位体(tag ligand)”的相互作用来展示该外源性序列。该系统含有携带与标记序列相结合的外源性序列的噬菌体染色体组载体。相同的载体携带在框架内与外壳蛋白质基因相融合的标记配位体序列。在以该载体来感染宿主细胞时,据推测将产生可显现该外源性序列的噬菌体颗粒。然而,WO 91/17271所揭示的内容不能提供可使得该总体思路得以进行的教导。例如WO 91/17271既不能证实任一序列已经由“标记”和“配位体”的相互作用在噬菌体颗粒的表面上得到展示;亦不能证实该蛋白质(若显现)保持生物活性。此外,由于所提出的系统在相同的载体中使用携带所有噬菌体外壳蛋白质基因的噬菌体染色体组载体,该系统不可避免地继承上述所有限制和缺点。
克莱姆(Crameri)等人设计了一个展示cDNA产物的系统,在该系统中插入临近该外源性序列的Fos原癌基因(oncogene)以在噬菌体中间载体上展示,且插入临近在相同的载体(参见克莱姆等人的(1993)Gene 13769-75)上的基因III的Jun原癌基因。将该两个融合序列置于两个独立促进剂的控制下。克莱姆方法开发了在fos和jun蛋白质之间的优选相互作用由于该Fos外源性多肽已经显现且分泌于该胞质间间隙(periplasmic space)中,其形成与pIII-Jun的络合物(complex),在以M13KO7辅助噬菌体来产生双重感染时,则将该络合物包裹于该噬菌体颗粒中。尽管在此系统中的该外源性序列未直接与外表面序列连接,在相同载体的独立促进剂下该噬菌体外壳蛋白质pIII的组成性表达仍导致对于宿主细胞的实质毒性。
与克莱姆系统相似的另一变体(variant)为在WO 01/05950中所述的半胱氨酸偶合性(cysteine-coupled)展示系统。通过在两种半胱氨酸残基之间形成二硫键来调节(mediate)该外源性多肽的附着和展示,其中一种残基包含在该外源性序列中且另一种插入于该外表面序列中。在WO 01/05950中所述的单载体系统携带两个独立的由促进剂控制的表达盒(expression cassette)一个表达盒显现该外源性序列,且另一个显现该外壳蛋白质pIII。在WO 01/05950中所述的双载体系统包含携带一个外源性序列的噬菌体中间载体和显现该外壳蛋白质pIII的质粒(plasmid)。该两种载体用于相互转染(co-transfect)大肠杆菌细胞。在以该辅助噬菌体M13KO7来产生双重感染时,将该噬菌体中间和/或该质粒包裹于所得噬菌体颗粒中。尽管此系统避免了包含连接至外表面蛋白质的外源性蛋白质的融合表达,由于该外壳蛋白质pIII在该单载体或该双载体系统中的组成性表达,该系统仍未能使外壳蛋白质对于宿主细胞的毒性降至最小。此外,在WO 01/05950中所述的双载体系统不可避免地产生携带外表面序列的具有错包裹(mispackaged)载体的噬菌体颗粒,且在产生该辅助噬菌体的感染时未产生该外源性基因。错包裹是众所周知的与双载体系统相关的问题。已表明该丸剂-补充(pill-supplementing)质粒载体已错包裹于辅助噬菌体颗粒中(罗托(Rondot) 等人的(2000)Nature 1975-78)。
最终,上述先前噬菌体展示系统与其它展示系统(例如细菌展示系统)不一致。为了直接在细菌细胞上呈现相同的噬菌体-展示外源性序列,必须首先将该外源性序列次亚克隆(subclone)于细菌展示载体中。
因此,仍然相当需要用于基因包装上外源性展示的改性组合物和方法。理想的系统将避免先前所报道系统的缺点。本发明满足了该等需要且同样提供了相关优点。

发明内容
本发明的主要方面是使多肽展示不经由肽键(peptide bond)来连接至基因包装的任何外表面序列的系统设计。该实验设计提供了史无前例的对于基因包装(例如噬菌体颗粒)上具有期望的特性蛋白质的显现和/或选择的适应性(flexibility)。该噬菌体-展示系统的技术优点得以增加。首先,该系统避免了与该外表面蛋白质通过该表达载体的表达相关的所有缺点。如上所述,该等缺点包括(1)由于该外表面序列的组成性表达而产生的对于该宿主细胞的高毒性;(2)宿主细胞对于产生后代噬菌体颗粒所需辅助噬菌体的感染的抵抗性;(3)由于氨基末端融合产物的单向性(unidirectional)展示而产生的对于待展示蛋白质的定向(orientation)限制;和(4)由于在该融合外表面序列和通常由辅助载体来提供的该正常型外表面序列之间的重组所产生的该融合产物的不稳定性。第二,该系统排除了携带该外表面序列的错包裹质粒的可能性,但未排除待亚克隆的基因;该等质粒是用于WO 01/05950所述的双载体系统中。尽管避免了先前展示系统的该等和其它固有缺点,本系统进一步提供了对于每个基因包装呈现多肽的一个复制(copy)(单价展示)或多个复制(多价展示)的适应性。基于多肽与所特别关心分子的结合能力,本系统尤其适用于显现和筛选(screening)多肽(例如抗原结合单元)的大量多样性清单。由本系统所展示的多肽是功能性的。
因此,本发明提供用于在基因包装的外表面上展示外源性多肽的适配器定向展示系统。该系统包含(a)包含可对在框架内融合为第一适配器序列的外源性多肽进行编码的编码序列的表达载体,其中该载体缺乏对基因包装的任何功能性外表面蛋白质进行编码的外表面序列;(b)包含对包裹基因包装所必需的外表面蛋白质进行编码的外表面序列的辅助载体,其中至少一个外表面蛋白质在框架内融合为第二适配器,在合适的宿主细胞中产生多肽时,第一和第二适配器产生作用以经由第一和第二适配器之间的成对相互作用来引起多肽展示。
所使用的基因包装可以是病毒、细胞和孢子。在一具体实施例中,本系统是噬菌体展示系统。该外表面序列对噬菌体的功能性外壳蛋白质进行编码。该优选外表面序列对噬菌体(例如丝状噬菌体)的功能性外壳蛋白质进行编码。优选外表面序列选自丝状噬菌体的基因III、基因VI、基因VII、基因VIII和基因IX。
在本系统的另一具体实施例中是一细菌展示系统。不在表达载体中却在细菌辅助载体中的该外表面序列对细菌外表面蛋白质进行编码。优选外表面蛋白质选自Lpp-OmpA、TraT、Pal、Oprl、Inp和AIDA-I。
用于构建本展示系统的第一和第二适配器可以是同源二聚(homodimerization)序列或异源二聚(heterodimerization)序列。优选同源二聚序列是能够形成二硫键的两种成对半胱氨酸残基。优选异源二聚序列包括在生理缓冲条件下和/或生理机体温度下基本上不能形成同源二聚体的序列,例如由异源二聚体受体GABAB受体1和2所衍生的序列。其它优选适配器可采用卷曲螺旋二级结构。
本发明亦提供用于在基因包装的外表面上展示多肽的辅助载体。该载体包含包裹该基因包装所必需的外表面序列,其中至少一个该表面呈现序列在框架内融合为适配器,在合适的宿主细胞中产生多肽时,该适配器产生作用以引起多肽展示。一方面,该辅助载体是细菌辅助载体(参看例如图26)。另一方面,该辅助载体是噬菌体辅助载体(本文亦称作“超辅助噬菌体载体”)。优选噬菌体辅助载体包括(但不限于)图5A所示的GM-辅助噬菌体载体、图13A所示的CM-超辅助噬菌体载体和图19A所示的GMCT-超辅助噬菌体载体。
本发明进一步提供用于在基因包装中或其外表面上产生多肽的表达载体。该表达载体包含可对在框架内融合为第一适配器的多肽进行编码的编码序列,其中该载体缺乏可对该基因包装的任何功能性外表面蛋白质进行编码的外表面序列,且在基因包装外表面上的多肽展示是经由第一适配器和第二适配器之间的非共价成对相互作用来调节,其中第二适配器融合为外表面序列。一方面,该表达载体是噬菌体中间。该噬菌体展示系统的说明性噬菌体中间是图9A中所示的pABMX14、图15A中所示的pABMX15和图25A中所示的pAMBX22。
本发明亦包括试剂盒和该系统的个别组分,该试剂盒包含该适配器定向展示系统且该系统包括表达和辅助载体。本发明进一步提供包含该载体的宿主细胞。
在一独立具体实施例中,本发明提供可在其外表面(external surface)上展示融合多肽的基因包装。该融合多肽包含一待展示且在框架内与第一适配器融合的多肽序列,在合适的宿主细胞中产生该融合多肽时,第一适配器产生作用以经由在第一适配器和连接至外表面蛋白质的第二适配器之间的非共价成对相互作用来促成该融合多肽的展示。该基因包装可以是病毒、细胞和孢子。
在另一具体实施例中,本发明提供一个包含许多基因包装的选择性文库,至少一个基因包装如上所述。
在另一具体实施例中,本发明提供一种通过使本适配器定向展示系统在合适的宿主细胞中转录(transcribe)且转译(translate)来展示基因包装外表面上的多肽的方法。本发明所产生的选择性文库亦涵盖于本发明。
本发明进一步提供探测在测试剂(test agent)和在基因包装上所展示的外源性多肽之间的特定相互作用的存在的方法。该方法包含下述步骤(a)提供通过上述方法所制备的可展示外源性多肽的基因包装;(b)在适于产生稳定多肽-试剂(polypeptide-agent)络合物的条件下使该基因包装与该测试剂相接触;和(c)探测该稳定多肽-试剂络合物在基因包装上的形成,从而探测特定相互作用的存在。一方面,该外源性多肽选自抗原结合多肽、细胞表面受体、受体配位体、细胞固定蛋白质(cytosolic protein)、分泌性蛋白质(secreted protein)和核蛋白质(nuclear protein)。一优选方面,该外源性多肽是抗原-结合单元。该测试剂可以由蛋白质、碳水化合物、脂类和其组合构成。优选测试剂是抗原或配位体。
最后,本发明提供获得具有期望的特性的多肽的方法。该方法包含(a)提供由本发明方法所制作的选择性文库;和(b)筛选该选择性文库以获得至少一个展示具有期望的特性的多肽的基因包装。一方面,期望的特性是与所关心试剂的结合特性。另一方面,该步骤(若筛选该选择性文库)进一步包含将展示具有期望的特性的多肽的基因包装分离。该步骤可进一步包括由对具有期望的特性的多肽进行编码的基因包装获得核苷酸序列。具有期望的特性的多肽可以是下述类型蛋白质中的一种抗原结合单元、细胞表面受体、受体配位体、细胞固定蛋白质、分泌性蛋白质和核蛋白质。
本文所用缩写的说明1.Nsc非单一链(Non-single chain)2.Sc单链(Sing-chain)3.Abu抗原-结合单元4.Abus(多个)抗原-结合单元4.L chain轻链5.H chain重链6.VL轻链可变区7.VH重链可变区


图1是本适配器定向展示系统的实验设计示意图。所述展示系统不仅允许可溶外源性多肽在合适的宿主细胞中的表达,而且容许该外源性序列在基因包装外表面上的展示。该系统具有两种组分表达载体和辅助载体。该表达载体仅在宿主细胞(例如大肠杆菌细菌)中的引入导致了在由适配器在框架内融合(指定“适配器1”,参看图1的中央面板)的该外源性多肽的细菌周质(bacterial periplasm)中的表达和分泌。由辅助噬菌体载体对细菌细胞所造成的双重感染允许经由第一和第二适配器之间的成对相互作用来在该噬菌体颗粒上展示该外源性多肽,该辅助噬菌体载体携带由第二适配器(指定“适配器2”,参看左面板)在框架内融合的噬菌体外表面序列。可将多样性DNA序列插入此表达载体中以构建一个表达文库。辅助噬菌体的双重感染产生多样性噬菌体展示文库。同样地,由包裹辅助细菌载体的该噬菌体中间颗粒对该细菌细胞所造成的感染,允许经由第一和第二适配器之间的成对相互作用在细菌上展示该外源性多肽,该辅助细菌载体携带由第二适配器(指定“适配器2”,参看右面板)在框架内融合的细菌外表面序列。可用类似的方式来构建选择性细菌展示文库。
图2展示由噬菌体ELISA来筛选抗卡那霉素、KO7kpn辅助噬菌体阳性克隆的结果。对48个复制体进行筛选以用于噬菌体繁殖。C2、B3、B7、B9、A12代表KO7kpn辅助噬菌体阳性克隆。FL和F2代表亲本(parent)M13KO7噬菌体的两个阳性控制。
图3是该KO7kpn辅助噬菌体载体的示意图。图3B描述在辅助性噬菌体载体中所获得的该基因III引导序列(leader sequence)的核苷酸和氨基酸序列。在该引导序列的下游引入一个KpnI限制性位点,而不改变基因III的编码区。
图4是载体pABMC6的示意图。该载体含有KpnI位点、局部基因HI引导序列、GR2编码序列和置于基因III序列5′的Myc-标记。
图5A是GM-超辅助噬菌体的示意图。图5B描述跨越KpnI位点和BgIII位点的片段的核苷酸和氨基酸序列。图5C描述在GR2-Myc区域中的胰蛋白酶剪切位点(cleavage site)(Tryp)。
图6是噬菌体外壳蛋白质的抗Myc(anti-Myc)免疫印迹(免疫印迹)的复制(reproduction)。结果指示了GM-超辅助噬菌体颗粒的组合(assembly)。线(Lane)1和7代表在kDa中的分子量标志(marker)。线2-5展示GM-超辅助噬菌体的四个复制体,该辅助噬菌体显现该GR2-Myc-pIII融合。不携带该GR2-Myc-pIH融合序列的线6展示M13KO7辅助噬菌体的阴性控制。
图7描述ELISA分析结果,其是应用抗Myc抗体来探测组装于GM-超辅助噬菌体颗粒中的GR2-Myc-pIII融合蛋白质。对图6中所示的噬菌体克隆6、18和20进行测试。所包含KO7辅助噬菌体是阴性控制。
图8描述ELISA分析结果,其是应用抗Myc抗体来证实来自于超辅助噬菌体的GR2-Myc区域应用增加剂量的胰蛋白酶所进行的成功剪切。M13KO7辅助噬菌体起到阴性控制的作用。
图9A是载体pABMX14的示意图。图9B展示pABMX14的完整核苷酸序列。该载体含有用于抗生素选择(AMP)的氨苄青霉素抗药性(ampicillin-resistance)基因、质粒复制起点(replication origin)(ColE1 ori)、f1噬菌体复制起点(f1 ori)和推动下游序列plac-RBS-pelB-GR1-DH(HA和6xHis标记)表达的lac促进剂/lac O1。该NcoI/XbaI或NcoI/NotI或XbaI/NotI限制位点可用于插入外源性序列以在细菌细胞中展示或产生可溶性蛋白质。
图10描述噬菌体结合分析结果,其中在以GM-超辅助噬菌体或M13KO7辅助噬菌体对细菌TG1细胞产生双重感染时可产生噬菌体颗粒。细菌TG1细胞含有用于scFv适配器(scFv-adapter)1融合的表达的pABMX14-Aml噬菌体中间载体。与各自抗原相结合的剂量依赖(dose-dependent)噬菌体仅在发生GM-超辅助噬菌体的感染而不是阴性控制M13KO7噬菌体的感染时才可以观察到。结果证实功能性scFv在噬菌体颗粒上应用pABMX14噬菌体中间和GM-超辅助噬菌体载体所产生的展示。
图11中左面板是噬菌体外壳蛋白质的抗Myc免疫印迹的复制。线1代表7阴性控制,其中该噬菌体颗粒在含有由M13KO7辅助噬菌体来双重感染的噬菌体中间载体pABMX14-Aml的TG1细胞中产生。线2代表由噬菌体中间pABMX14-Aml载体和GM-超辅助噬菌体载体所产生的噬菌体颗粒。可探测到该外源性序列scFv。线3代表阴性控制,其中仅使用GM-超辅助噬菌体载体。抗Myc抗体仅在线2中探测到一个经由GR1与GR2的成对相互作用所形成的与该scFv-GR1-DH/GR2-Myc-pIII络合物一致的带(band)。与线2中的游离GR2-Myc-pIII相比,可展示近似两倍(twice as much)的scFv-GR1-DH/GR2-Myc-pin络合物。此预示每个噬菌体颗粒平均携带该scFv-GR1融合的多个复制。在线3中探测到一个与二聚pIII-Myc-GR2一致的带。pIII-Myc-GR2二聚体的形成是由于在该GABAB受体2适配器序列下游引入的一对半胱氨酸残基(the pair of cysteine residues)。GABAB受体2适配器序列本身缺乏在生理机体温度和/或生理缓冲条件下(Kammerer等人(1999),『生物化学』(Biochemistry)3813263-13269)形成同源二聚体的倾向。
在以抗HA抗体(参看图11的右面板)再次探查相同印迹(blot)时,由线2中的抗HA抗体探测到一个与该scFv-GR1-DH/GR2-Myc-pIII络合物一致的带。此确认了在发生GM-超辅助噬菌体的双重感染时所产生的scFv-GR1-DH融合的展示。
图12是载体pABMC13的示意图。该载体含有一个包含局部gIII引导序列的DNA片段,该片段具有KpnI位点、Ala-Cys-Gly-Gly编码序列和置于基因III的5′的Myc-标记。
图13A是CM-超辅助噬菌体载体的示意图。图13B描述跨越KpnI位点和BgIII位点的片段的核苷酸和氨基酸序列。该载体含有一个对Ala-Cys-Gly-Gly进行编码的核苷酸序列,Ala-Cys-Gly-Gly是由置于基因III的5′的Myc-标记来融合。此外,该载体包含由基因HI引导序列和该Cys-Myc编码区在侧面相接的琥珀终止码(amber stop codon)。琥珀密码子的引入允许噬菌体仅在抑制菌株(suppressor bacterial strain)中产生。
图14描述ELISA分析结果,其是应用抗Myc抗体来探测组装于该CM-超辅助噬菌体颗粒中的Cys-Myc-pIII融合。线1代表阴性控制M13KO7辅助噬菌体。线2-6代表CM-超辅助噬菌体的五个复制体。线7代表阳性控制GM-超辅助噬菌体。
图15A是载体pABMX15的示意图。图15B展示pABMX15的完整核苷酸序列。该载体含有用于噬菌体选择(AMP)的氨苄青霉素抗药性基因、质粒复制起点(ColE1 ori)、f1噬菌体复制起点(f1 ori)和推动下游序列plac-RBS-pelB-HA-Cys的表达的lac促进剂/lac O1。该NcoI/XbaI或NcoI/NotI或XbaI/NotI限制位点可用于插入外源性序列以在细菌细胞中展示或产生可溶性蛋白质。
图16描述噬菌体结合分析结果,其中在以CM-超辅助噬菌体或M13KO7(亦表示“KO7”)辅助噬菌体对细菌TG1细胞产生双重感染时可产生噬菌体颗粒。细菌TG1细胞含有用于scFv-HA-Cys融合的表达的pABMX15-Aml噬菌体中间载体。结果证实了功能性scFv在噬菌体颗粒上应用pABMX15噬菌体中间和CM-超辅助噬菌体载体所产生的展示。在线3-6中所示的1至100感染复数(MIO)范围内的scFv展示水平无显著变化。线1和2代表KO7辅助噬菌体的两个阴性控制。如线2所示,在采用阴性控制M13KO7辅助噬菌体时不能探测到scFv-HA-Cys。
图17中左面板是噬菌体外壳蛋白质的抗Myc免疫印迹的复制。线1代表阴性控制,其中仅采用KO7噬菌体。线2代表阴性控制,其中仅应用CM-超辅助噬菌体载体。线3代表阴性控制,其中在以KO7来产生双重感染时不能探测到通过噬菌体中间pABMX15所显现的scFv-HA-Cys融合。线4代表噬菌体克隆,其中在以CM-超辅助噬菌体载体来产生双重感染时可成功展示通过噬菌体中间pABMX15所显现的scFv-HA-Cys融合。抗Myc抗体仅在线4中可探测到一个经由成对(paring)半胱氨酸的成对相互作用所形成的与scFv-HA-S-S-Myc-pIII络合物一致的带。此结果指出scFv-HA-Cys的展示仅在该噬菌体中间是通过CM-超辅助噬菌体而不是M13KO7噬菌体来保护时才发生。由于在两种半胱氨酸残基之间建立的在pIII序列的5′终端所引入的二硫键,所以可在线2和线4中探测到pIII-Myc二聚体。
在以抗HA抗体(参看图17的右面板)再次探查相同的印迹时,可由在线4而不是控制线(control lane)1-3中的抗HA抗体探测到一个与该scFv-HA-S-S-Myc-pIII络合物一致的带。此确认了在产生GM-超辅助噬菌体保护时所引起的scFv-HA-S融合的展示。
图18是载体pABMC12的示意图。除载体pABMC6的核苷酸序列外,载体pABMC12含有包含编码序列的DNA片段(用于可融合为GR2-Myc编码序列的基因III的C-末端部分)和与序列(RBS)-OmpA引导序列(可融合为基因III序列)相结合的核糖体。
图19A是GMCT-超辅助噬菌体载体的示意图。图19B描述跨越KpnI位点和BgIII位点的片段的核苷酸和氨基酸序列。该载体含有对KO7kpn噬菌体载体中的工程基因HI(融合为适配器GR2)的另外复制进行编码的核苷酸序列和结合了序列-OmpA引导序列(与KO7基因HI序列相临近)的核糖体。
图20描述噬菌体结合分析结果,其中在以GMCT-超辅助噬菌体或控制M13KO7辅助噬菌体对细菌TG1细胞产生双重感染时可产生噬菌体颗粒。该TG1细胞含有用于scFv-GR1-DH融合的表达的pABMX14-Aml噬菌体中间载体。结果证实了功能性scFv应用pABMX14噬菌体中间和该GMCT-超辅助噬菌体载体(线2-5)在噬菌体颗粒上所产生的展示。在1至100感染复数(MIO)范围内scFv展示水平无显著变化。线1代表阴性控制,其中在发生KO7辅助噬菌体的双重感染时不能展示scFv。
图21中左面板是噬菌体外壳蛋白质的抗Myc免疫印迹的复制。线1代表阴性控制,其中仅应用KO7噬菌体来保护pABMX14噬菌体中间。线2代表噬菌体克隆,其中在以GMCT-超辅助噬菌体载体来产生双重感染时可成功展示由噬菌体中间pABMX14所显现的scFv抗体。线3代表另一阴性控制,其中仅应用GMCT-超辅助噬菌体。抗Myc抗体仅在线2中可探测到一个经由GR1和GR2的成对相互作用所形成的与该scFv-GR1/GR2-Myc-CT(HI)络合物一致的带。此结果指出scFv-GR1的展示仅在该噬菌体中间是由GMCT-超辅助噬菌体而不是由KO7辅助噬菌体来保护时才发生。
在以抗HA抗体(参看图21的右面板)再次探查相同的印迹时,可由在线2而不是控制线1或3中的抗HA抗体探测到与该scFv-GR1/GR2-Myc-CT(III)络合物一致的带。此确认了在产生GMCT-超辅助噬菌体的保护时所引起的scFv-HA-S融合的展示。
图22A描述载体pABMD1和pABMD2的示意图。图22B描述跨越lac促进剂/lac O1和SalI位点的核苷酸和氨基酸序列。
图23描述GABAB受体1和2的C-末端序列。通过在该序列的C-末端添加“ValGlyGlyCys”间隔(spacer)来引入外源性半胱氨酸残基。
图24是描述各种抗原结合单元的示意图。
图25A是细菌表达载体pABMX22的示意图。图25B描述pABMX22的完整核苷酸序列。该载体含有用于噬菌体选择(AMP)的氨苄青霉素抗药性基因、质粒复制起点(ColE1 ori)、f1噬菌体复制起点(f1 ori)和推动下游序列plac-RBS-p8L-GR1-HA的表达的lac促进剂/lac O1。该MluI/XbaI或MluI/NotI或XbaI/NotI限制位点可用于插入外源性序列以在细菌细胞上展示。
图26A是细菌辅助载体pABMbd-1的示意图。图26B描述pABMbd-1的完整核苷酸序列。该载体含有用于噬菌体选择(Cam)的氯霉素抗药性基因、质粒复制起点(ColE1 ori)、f1噬菌体复制起点(f1 ori)和推动下游序列plac-RBS-pelB-Lpp-0mpA-GR2的表达的lac促进剂/lac O1。
图27描述由随机选自于最终淘筛的个别克隆所产生的AM3噬菌体ELISA结果。每个条代表一个特别AM3变体在OD405处的读数(reading)。位置A13和A14分别为阴性控制和阳性控制。
图28描述由Ni-NTA柱所产生的AM3 scFv净化结果。在10%SDS-PAGE凝胶上对冲洗片段的25ul等分试样进行分析,并且随后产生库马西蓝变(Coomassie blue stain)。M蛋白质标记;1WT克隆#1的片断#2;2WT克隆#1的片断#3;3WT克隆#2的片断#2;4WT克隆#2的片断#3。
图29描述AM3 scFv抗体应用凝胶过滤色谱法的净化结果。应用休珀代克斯(Superdex)75柱将由Ni-NTA所净化的scFv抗体(Ni-NTA purified scFvantibody)进行色谱分离。如图所示,将单体scFv自混合物中的蛋白质剩余部分中分离出来。
图30描述与应用生物传感器(BiaCore)的正常型AM2相比的该AM3变体的结合动力学分析。Sensorgram展示所有的4个AM3变体,该等变体具有相对于野生型(wild type)显著较低的离解速率和较高的结合亲和力。该曲线的斜率表示所选择的抗体与(初相)的组合和自抗原(末期相)中的分离有多快。
具体实施例方式
本揭示内容以辨识引用的方式引用各种出版物、专利和已出版的专利说明书。因此,该等出版物、专利和已出版专利说明书的揭示内容以引用的方式并入本揭示内容。
普通技术除非另外指出,本发明的实践将采用在本技术的技能中的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、染色体组和重组体DNA的传统技术。参看例如『肽和蛋白质的噬菌体展示』(PHAGE DISPLAY OFPEPTIDES AND PROTEINS)(B.K.Kay等人,1996);『噬菌体展示实验室手册』(PHAGE DISPLAY,A LABORATORY MANUAL)(C.F.Barbas III等人,2001);(萨姆布鲁克(Sambrook)、弗瑞特斯(Fritsch)和玛尼阿蒂斯(Maniatis)),『分子克隆实验室手册』(MOLECULAR CLONINGALABORATORY MANUAL),第2版(1989);CURRENT PROTOCOLS INMOLECULAR BIOLOGY(F.M.Ausubel等人eds.,(1987));the series METHODS INENZYMOLOGY(Academic Press,Inc.)PCR 2A PRACTICAL APPROACH(M.J.MacPherson、B.D.Hames和G.R.Taylor eds.(1995)),Harlow和Lane,eds.(1988)ANTIBODIES,ALABORATORY MANUAL和ANIMAL CELL CULTURE(R.I.Freshney,ed.(1987))。
除非上下文明确指出其它方面,本说明书和权利要求书中所用的单数形式“一(a)”、“一个(an)”和“该(the)”包含复数引用。例如,术语“一种细胞(a cell)”可包含许多细胞及其混合物。
定义术语“多肽”、“肽”和“蛋白质”在本文中可交替使用来表示任一长度的氨基酸聚合物。该聚合物可以是直链、环状或分支的,其可包含改性(modified)氨基酸并且可以由非氨基酸中断。该术语亦涵盖已改性的氨基酸聚合物,该等+聚合物已经由例如硫酸化作用、糖基化作用、脂化作用、乙酰化作用、磷酸化作用(phosphorylation)、碘化作用、甲基化作用、氧化作用、蛋白水解过程、磷酸化作用(phosphorylation)、异戊二烯基化作用(prenylation)、外消旋作用、硒基化作用(selenoylation)、氨基酸的转移核糖核酸(transfer-RNA)调节附加物为蛋白质(例如精氨酰化作用(arginylation)、泛醌化(ubiquitination))或其它任何操作,例如与标记组分的结合作用。本文所用的术语“氨基酸”指天然的和/或非天然的或合成氨基酸,其包含甘氨酸和D或L光学异构体和氨基酸类似物和多肽模拟物(peptidomimetics)。
由指定蛋白质“获得”的多肽或氨基酸序列表示该多肽的起点。较佳地,该多肽具有实质上与在该序列中编码的多肽的序列相同的氨基酸序列或其部分,或可在免疫学上采用在该序列中编码的多肽来确认的序列,其中该部分由至少10-20个氨基酸(较佳地由至少20-30个氨基酸,更佳地由至少30-50个氨基酸)组成。此术语亦包含由指定核酸序列来显现的多肽。
与自然界中存在蛋白质相比,“嵌合”蛋白质含有至少一个包含该序列中不同位置处的区域的融合多肽。该等区域通常可存在于个别蛋白质中并且在该融合多肽中集合;或其通常可存在于相同蛋白质中但位于该融合多肽中的新颖装置中。可通过例如化学合成或创造并翻译多核苷酸(其中肽区域是以期望的关系来编码)来制造嵌合蛋白质。
本文所用的“多元体蛋白质”表示含有多个独立多肽的球形蛋白质或相互结合以形成体外或体内单一球形蛋白质的蛋白质链。该多元体蛋白质可由多个相同类型的多肽组成以形成“异源多聚体”。或者,该多元体蛋白质可由多个不同序列的多肽组成以形成“异源多聚体”。因此,“异源多聚体”是包含至少一个第一多肽和第二多肽的分子,其中该第二多肽由于至少一种氨基酸残基而与第一多肽不同。该异源多聚体可包含由第一和第二多肽所形成的“异源二聚体”或可形成较高次序第三结构(其中存在多于两个多肽)。用于该异源多聚体的示范性结构包含异源二聚体(例如Fv和Fab片段、联体、GABAB受体1和2络合物)、三聚G-蛋白质、异源四聚物(例如F(ab′)2片段)和其它寡聚结构。
“配位体”表示可由受体的该配位体-结合区域来限制的分子。该分子可在化学上合成或可存在于自然界。
“激动剂”是可刺激信号分子例如受体的生物活性的分子。
“拮抗剂”是可限制受体的生物活性的分子。
通过“成对相互作用”是指两个适配器可相互作用并结合以形成稳定络合物。该稳定络合物必须足够长期以允许在基因包装的外表面上包裹多肽。该络合物或二聚体必须能够经受在形成瞬间和探测该展示多肽的瞬间之间存在或引入的任何条件,该等条件是所执行的分析或反应的函数。
“单价展示”表示每个基因包装的外源性多肽的单一复制的表达。在单价噬菌体展示系统中,噬菌体颗粒的集合平均为每个噬菌体颗粒携带零至一个外源性多肽。相反,“多价展示”表示每个基因包装的该外源性多肽的多个复制的表达。因此,在多价噬菌体展示系统中,噬菌体颗粒的集合平均携带多个外源性多肽。
本文所用的术语“抗体”表示免疫球蛋白分子和其免疫活性部分,例如含有可特定地与抗原结合(“发生免疫反应”)的抗原结合位点的分子。在结构上,自然存在的最简单抗原(例如IgG)含有由二硫键相互连接的四个多肽链、两个重(H)链和两个轻(L)链。该免疫球蛋白代表一大系列含有多种分子类型的分子,例如IgD、IgG、IgA、IgM和IgE。该术语“免疫球蛋白分子”包含(例如)融合抗体或已改变的抗体和其片断。已展示出抗体的抗原结合功能可由自然存在抗体的片断来执行。该等片断被共同称作“抗原结合单元”(“抗原结合单元”)。基于其分子结构,可将抗原结合单元广泛划分为“单链”(“Sc”)和“非单链”(“Nsc”)类型。
术语“抗体”和“抗原结合单元”亦涵盖包含无脊椎动物和脊椎动物的多种物种起源的免疫球蛋白分子。应用于抗体或抗原结合单元的术语“人类”表示由人类基因或其片断所显现的免疫球蛋白分子。应用于非人类(例如啮齿动物或灵长类动物)抗体的术语“母乳化的”是含有由非人类免疫球蛋白所获得的最小序列的融合免疫球蛋白、免疫球蛋白链或其片断。一般地,母乳化抗体是人类免疫球蛋白(受体抗体),其中将该受体的互补决定区(CDR)残基由来自于非人类物种(供体抗体)的CRR的残基代替,例如由具有期望的特性、亲和力和能力的耗子、老鼠、兔子或灵长类动物的CDR残基来代替。例如,将人类免疫球蛋白的Fv骨架区(FR)残基由相应的非人类残基来代替。此外,该母乳化抗体可包含既不是在受体抗体亦不是在该输入CDR或框架序列中所发现的残基。在人类机体中引入该等改进是为了进一步使抗体效能改进和最优化并使免疫原性最小化。通常,该母乳化抗体将包含几乎所有(至少一个,通常两个)可变区域,其中所有或几乎所有CDR区域均与非人类免疫球蛋白中的区域相符合并且所有或几乎所有FR区域是人类免疫球蛋白序列的区域。该母乳化抗体亦可包含至少一部分免疫球蛋白恒定区(Fc),其通常为人类免疫球蛋白恒定区。
“非单一链抗原结合单元”(“Nsc Abus”)是包含轻链多肽和重链多肽的异源多聚体。非单一链抗原结合单元的实例包括(但不限于)(1)由本文所展示的异源二聚序列来稳定的ccFv片段(图24);(2)任何其它包含至少一个如本文所述ccFv片段的单价和多价分子;(3)由该VL、VH、CL和CH1区域组成的Fab片段;(4)由该VH和CH1区域组成的Fd片段;(5)由抗体单臂(single arm)的VL和VH区域组成的Fv片段;(6)F(ab′)2片段,其是包含两个通过该铰链区的双硫桥来连接的Fab片段的二价片段;(7)联体;和(8)任何其它在Little等人(2000)的『今日免疫学』(Immunology Today)中所述的非单一链抗原结合单元。
如上所注,非单一链抗原结合单元可以是“单价”或“多价”。尽管前者的每个抗原结合单元具有一个结合位点,后者含有可结合多个相同或不同类型抗原的多个结合位点。基于结合位点的数目,一个非单一链抗原结合单元可以是二价(具有两个抗原结合位点)、三价(具有三个抗原结合位点)、四价(具有四个抗原结合位点)等。
以其结合特性为基础,可将多价非单一链抗原结合单元进一步分类。一个“单特异性”非单一链抗原结合单元是可结合一种或多种相同类型抗原的分子。一个“多特异性”非单一链抗原结合单元是具有可用于至少两种不同抗原的结合特性的分子。尽管该等分子通常仅结合两种不同抗原(例如双特异性抗原结合单元),具有另外特性的抗体(例如三特异性抗体)若在本文中使用则涵盖于此表达。双特异性抗原结合单元的实例包括一个臂对准肿瘤细胞抗原并且另一臂对准细胞毒素触发分子的单元,例如抗FcγRI/抗CD15、抗p185HER2/FcγRIII(CD16)、抗CD3/抗恶性(malignant)B-细胞(1D10)、抗CDS/抗p185HER2、抗CD3/抗p97、抗CD3/抗肾细胞癌、抗CD3/抗OVCAR-3、抗CD3/L-D1(抗结肠癌)、抗CD3/抗黑素细胞刺激激素类似物、抗EGF受体/抗CD3、抗CD3/抗CAMA1、抗CD3/抗CD19、抗CD3/MoV18、抗神经细胞附着分子(NCAM)/抗CD3、抗叶酸盐结合蛋白质(FBP)/抗CD3、抗淘筛癌连带(anti-pan carcinoma associated)抗原(AMOC-31)/抗CD3;一个臂特定地与肿瘤抗原结合并且一个臂与毒素结合的双特异性抗原结合单元,例如抗毒性蛋白/抗Id-1、抗CD22/抗毒性蛋白、抗CD7/抗毒性蛋白、抗CD38/抗毒性蛋白、抗CEA/抗蓖麻蛋白A链、抗干扰素α(IFN-α)/抗融合瘤独特型、抗CEA/抗长春花属生物碱;用于转换酶活性前体药物的BsAbs,例如抗CD30/抗碱性磷酸酶(其可催化丝裂霉素磷酸盐前体药物转化为丝裂霉素醇);可用作纤维溶(fibrmolytic)剂的双特异性抗原结合单元,例如抗纤维蛋白/抗组织血纤维蛋白溶酶原活化剂(tPA)、抗纤维蛋白/抗尿激酶型纤溶酶原激活物(uPA);用于将免疫络合物指向于细胞表面受体的双特异性抗原结合单元,例如抗低密度脂蛋白(LDL)/抗Fc受体(例如FeγRI、FcγRII或FcγRIII);用于感染性疾病的治疗的双特异性抗原结合单元,例如抗CD3/抗单纯疱疹病毒(HSV)、抗T细胞受体CD3络合物/抗流行性感冒、抗FcγR/抗HIV;用于体外或体内肿瘤探测的双特异性抗原结合单元,例如抗CEA/抗EOTUBE、抗CEA/抗DPTA、抗pl85HER2/抗半抗原;疫苗辅剂BsAbs;和作为诊断工具的双特异性抗原结合单元,例如抗兔子免疫球蛋白G/抗铁蛋白、抗辣根过氧化物酶(HRP)/抗激素、抗生长抑制素/抗P物质、抗HRP/抗FITC、抗CEA/抗β-半乳糖苷酶。三特异7性抗体的实例包含抗CD3/抗CD4/抗CD37、抗CD3/抗CD5/抗CD37和抗CD3/抗CD8/抗CD37。
单链抗原结合单元(“Sc Abu”)表示单体抗原结合单元。尽管该Fv片段的该两个区域是由两个独立基因来编码,可制造一个合成连接器以能够通过重组体方法将其制造为单一蛋白质链(例如在Bird等人(1988)的Science 242423-426和Huston等人(1988)的PNAS 855879-5883中所述的单一链Fv(“scFv”))。
“抗原结合单元的清单”指多种抗原结合单元,其中至少有两个展现不同结合特性。抗原结合单元的遗传多样性清单表示多种抗原结合单元,其大多数(否则所有)抗原结合单元展现关于其各自的独特结合特性。遗传多样性清单通常具有至少106至1013(较佳地在107至109之间,更佳地在108至1010之间,最佳地在108至1011之间)个不同抗原结合单元的组成。
若抗体或抗原结合单元以比其与其它基准抗原(包含多肽或其它物质)结合时更大的亲合力或抗体亲抗原性来结合,则其与抗原“特定地结合”或“发生免疫反应”。
在抗原结合单元存在于宿主细胞的外表面时,使其在宿主细胞的表面上展示。可将所展示的抗原结合单元直接附着于宿主细胞的外表面上或可通过宿主细胞边界基因包装(例如噬菌体颗粒)将其间接附着于宿主细胞上。
本文所用的“外表面序列”表示对基因包装的“外表面蛋白质”进行编码的核苷酸序列。该等蛋白质形成一个可将基因包装的基因包装形成胶囊的蛋白质外壳。通常,该外表面蛋白质引导基因包装使其组合在该基因包装的外表面上的待展示多肽,例如噬菌体或细菌。
应用于基因或蛋白质的术语“野生型”表示“自然存在的”、“天然的”基因或蛋白质。该等术语包括可在细胞或基因包装中自然发现的大型的并经过加工的多核苷酸和多肽。术语“正常型外表面蛋白质”表示可形成天然存在基因包装的外壳的蛋白质,无论其是病毒、细胞或孢子。关于丝状噬菌体,其正常型蛋白质是基因III蛋白质(pIII)、基因VI蛋白质(pVI)、基因VII蛋白质(pVII)、基因VIII蛋白质(pVIII)和基因IX蛋白质(pIX)。
本文所用的“抗原”表示由抗体认可并特定地结合的物质。抗原可包括肽、蛋白质、糖蛋白、多糖和脂类及其部分和组合。
本文所用的术语“表面抗原”表示细胞的质膜组分。其涵盖构成该质膜的完整的和周边的膜蛋白质、糖蛋白、多糖和脂类。“完整膜蛋白质”是横跨膜的蛋白质,其通过细胞的该质膜的双层脂质延伸。典型的完整膜蛋白质由至少一个“膜生成片段”组成,其通常包含疏水性氨基酸残基。周边膜蛋白质不在该双层脂质的疏水性内部中延伸且通过与其它膜蛋白质的非共价链相互作用来与膜表面结合。
应用于细胞蛋白质的术语“膜”、“细胞质内的(cytosolic)”、“核”和“分泌(secreted)”详细说明该细胞外的和/或亚细胞的位置,其中主要地、占优势地或优选地将该细胞蛋白质定位。
“细胞表面受体”代表膜蛋白质的子集,其能够与其各自配位体相结合。细胞表面受体是固定在该细胞质膜上的或插入该细胞质膜中的分子。其构成蛋白质、糖蛋白、多糖和脂类的一大系列,不仅可作为该质膜的结构组分而且可作为常规成分,例如控制多种生物功能的信号分子。
“异源二聚体受体”涵盖由两种蛋白质副族组成的细胞蛋白质,其可显现与配位体的结合亲合力。该两种蛋白质副族是不同的分子,其通过至少一种氨基酸残基在氨基酸序列中变化。非限制的说明性异源二聚体受体是与生长因子(例如heregulin)、神经传递质(例如γ-氨基丁酸)和其它有机或无机小分子(例如盐皮质激素、糖皮质激素)相结合的受体。优选异源二聚体受体是核激素受体(Belshaw等人(1996)Proc.Natl.Acad.Sci.U.S.A 93(10)4604-4607)、erbB3和erbB2受体络合物和G蛋白质偶合受体,其包括(但不限于)类鸦片物质(Gomes等人(2000)J.Neuroscience 20(22)RC110)、毒蕈碱型受体、多巴胺受体、血清素、腺苷/多巴胺和GABAB系列受体。
“区域”表示蛋白质部分,其在物理上或机能上与该蛋白质或肽的其它部分相区别。物理性定义的区域包括格外地疏水或亲水的氨基酸序列,例如与膜相关的或与细胞质相关的序列。区域亦可由产生自(例如)基因复制的内部同系物来定义。机能性定义的区域具有一个(多个)不同生物功能。例如,受体的配位体结合区域是结合配位体的区域。抗原结合区域表示与该抗原相结合的抗原结合单元或抗体的部分。功能性定义的区域不需要由连续的氨基酸序列来编码。功能性定义的区域可包含一种或多种物理定义的区域。例如,受体通常划分为细胞外配位体结合域、横跨膜的区域和细胞内效应域。“膜固着域”指可调节膜组合的蛋白质部分。通常,该膜固着域由疏水性氨基酸残基组成。或者,该膜固着域可由改性氨基酸(例如附着于脂肪酸链上的氨基酸)组成,改性氨基酸反过来可将该蛋白质锚定于膜上。
“宿主细胞”包括可作为或已作为本载体的受体的个别细胞或细胞培养。宿主细胞包括单一宿主细胞的后代。由于天然的、偶然的或故意的突变,其后代不必要与最初亲本细胞完全相同(在所有DNA补码的形态学或染色体组中)。宿主细胞包括在体内感染本发明载体的细胞。
“细胞株”或“细胞培养”表示在体外生长或维持的细菌、植物、昆虫或更高真核细胞。细胞的后代可以不与该亲本细胞完全相同(在形态学上、遗传上或表现上)。
“成分明确载体”表示包含培养细胞的存活和/或生长所必需的营养和激素需求的载体,因此该载体的组分是已知的。通常,成分明确载体已由生长和/或存活所必需的营养和生长因子的附加物来阐明。典型地,成分明确载体提供至少一种来自于下述种类中的一种或多种的组分a)所有必需氨基酸和通常由二十种氨基酸加上半胱氨酸所组成的基本集;b)通常以碳水化合物(例如葡萄糖)的形式存在的能源;c)必需的低浓度的维生素和/或其它有机化合物;d)游离脂肪酸;和e)定义为无机化合物或自然存在的元素的微量元素,其浓度通常是必需的在微摩尔范围内的极低浓度。成分明确载体亦可视情况以一种或多种来自于下述任何种类的组分来补充a)一种或多种促有丝分裂剂;b)盐和缓冲剂,例如钙、镁和磷酸盐;c)核苷和碱,例如腺苷和胸腺嘧啶核苷、次黄嘌呤;和d)蛋白质和组织水解物。
本文所用的术语“独立的”表示由组分、细胞和别的方面中分离,其中多核苷酸、肽、多肽、蛋白质、抗体或其片段实质上通常相互结合。所属领域的技术人员很容易明白,非天然存在的多核苷酸、肽、多肽、蛋白质、抗体或其片段不需要通过“分离”来与天然存在的对应部分相区别。此外,“浓缩的”、“独立的”、或“稀释的”多核苷酸、肽、多肽、蛋白质、抗体或其片段可与其天然存在的对应部分相区分,其中每体积分子的浓度或数目比天然存在的对应部分更“浓缩”或较少“独立”。
可在纯碱中测量富集作用,例如与每体积溶液的重量;或可与存在于原料混合物中的第二潜在妨碍物质相比来测量。本发明具体实施例的增加富集作用日益更佳。因此,(例如)2-折叠富集为较佳,10-折叠富集为更佳,100-折叠富集为较佳,1000-折叠富集为最佳。亦可在分离状态通过人造组合过程,例如通过化学合成或重组体表达来提供物质。
“连接的(Linked)”和“融合的(fused)”或“融合(fusion)”在本文中可交替使用。该等术语表示两种化学元素或组分通过包括化学结合或重组体构件的任何构件来结合在一起。“在框架内融合”表示结合两种或两种以上开放阅读框(OFRs)来形成连续的更长的开放阅读框,以维持最初开放阅读框的恰当阅读框。因此,所得重组体融合蛋白质是含有两种或两种以上片段的单一蛋白质,该等片段与通过最初开放阅读框(其片段实质上通常不是如此结合)来编码的多肽一致。尽管该阅读框因此在融合片段内是连续的,该等片段仍可以在物理上或空间上通过(例如)在框架内结合的序列(例如“灵活性连接器(flexon)”)来分离。
本文所用的“灵活性连接器”表示灵活性多肽连接器(或对多肽进行编码的核酸序列),其通常包含具有小侧链的氨基酸(例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸和丝氨酸)。在该融合的一个或多个位点之间所合并的灵活性连接器可以通过使其采取相互相对独立的构造来促进其功能性。
在上下文中的多肽“直链序列”或“序列”是多肽中的氨基酸在氨基至羧基终点方向上的次序,其中该序列中的相互临近的残基在该多肽的初始结构中是连续的。“局部序列”是多肽的部分的直链序列,已知其包含在一个或两个方向上的另外残基。
“异源的”表示由在遗传上完全不同的来自于所比较实体的剩余部分的实体中获得。例如自其天然编码序列中移除并在操作上连接至与天然序列不同的编码序列上的促进剂是异种促进剂。应用于多核苷酸、多肽的术语“异源的”表示该多核苷酸或多肽是由在遗传上完全不同的来自于所比较实体的剩余部分的实体中获得。例如,异源多核苷酸或抗原可由不同物种起源、不同细胞类型和不同个体的细胞的相同类型中获得。
术语“多核苷酸”、“核酸”、“核苷酸”和“寡核苷酸”可交替使用。其指任一长度的脱氧核糖核苷酸或核糖核苷酸或其类似物的核苷酸的多聚体形式。多核苷酸可以具有任意三维结构且可以执行任意已知或未知功能。下述是多核苷酸的非限制性实例基因或基因片段的编码或非编码区域、由连接分析所定义的(多个)基因座、编码顺序、基因内区、信使核糖核酸(mRNA)、转译RNA、核醣RNA、核酶、cDNA、重组体多核苷酸、分支多核苷酸、质粒、载体、任一序列的分离DNA、任一序列的分离RNA、核酸蛋白质和底漆。多核苷酸可包含改性核苷酸,例如甲基化核苷酸和核苷酸类似物。若存在,则可在该聚合物集合之前或之后对于该核苷酸结构作出改进。核苷酸的序列可由非核苷酸组分打断。多核苷酸可在聚合作用后进一步改性,例如通过与标记组分的结合来改性。
应用于多核苷酸的“重组体”表示该多核苷酸是克隆、限制和/或结合步骤和可引起构建的其它程序的各种组合的产物,该产物与在自然界发现的多核苷酸不同。
术语“基因”或“基因片段”在本文中可交替使用。其表示含有至少一个能够在转录和翻译后对特别蛋白质进行编码的开放阅读框的多核苷酸。基因或基因片段可以是染色体组或cDNA,只要该多核苷酸含有至少一个可覆盖整个编码区域或其片段的开放阅读框。
“可操作性连接”或“操作性地连接”指一个并列,其中所述组分的关系是允许其以预计方式运行。例如,若该促进剂序列可促进该编码序列的转录,则促进剂序列可操作性地与编码序列连接。
“融合基因”是由至少两种连接在一起的异种多核苷酸组成的基因。
基因“数据库”表示一系列储存数据,其代表包含核苷酸和肽序列的序列集合,该序列反过来代表生物机转物质的集合。
本文所用的“表达”指将多核苷酸转录为mRNA的过程和/或将转录的mRNA(亦称作“转录产物”)随后转录为肽、多肽或蛋白质的过程。该转录产物和该编码多肽共同表示基因产物。若该多核苷酸是由染色体组DNA获得,则表达可包括在真核细胞中的mRNA的接合。
“载体”是核酸分子(较佳地是自我复制核酸分子),其将插入的核酸分子传输至宿主细胞中和/或宿主细胞之间。该术语包括主要用于将DNA或RNA插入细胞中的载体、主要用于DNA或RNA复制的载体复制、和用于该DNA或RNA的转录和/或翻译的表达载体。其亦包含可提供多个上述功能的载体。
“表达载体”是多核苷酸,在引入适当的宿主细胞时,可将其转录或翻译为多肽。“表达系统”通常意味着由可用于产生期望的表达产物的表达载体所组成的合适的宿主细胞。“复制子”表示含有复制起点(通常称作起点序列)的多核苷酸,其允许该多核苷酸在适当的宿主细胞中复制。复制子的实例包括游离基因(例如质粒)和染色体(例如核或线粒体染色体)。
“信号转导"是将刺激和抑制信号传输至细胞中以引起细胞内反应的过程。“信号转导路径的调整基因”表示可调整与该相同物种信号转导路径相比对的一种或多种细胞蛋白质的活性的化合物。
本发明的适配器定向展示系统本发明的主要方面是展示系统的设计,该设计允许在外源性多肽的基因包装上或在随机或预定多肽的文库上所产生的展示,可经由肽键将其与任何功能性外表面序列分开。本系统避免了与该表达载体的外表面蛋白质相关的所有缺点。该实验性设计尤其适用于提供和/或选择由基因包装(例如病毒、细胞和孢子)所提供的具有期望的特性的蛋白质。
本展示系统包含两种组分(1)携带所关心的外源性基因的表达载体,其对在基因包装外表面上待展示的多肽进行编码;和(2)促进所特别关心的多肽的展示的辅助载体。与先前所报告的展示系统相区别,本系统具有下述独特特点。首先,该表达载体包含一个对在框架内以第一适配器融合的待展示外源性多肽进行编码的编码序列。第二,该表达载体缺乏对该基因包装的任何功能性外表面蛋白质进行编码的外表面序列。第三,该辅助载体包含对该基因包装进行包裹所必需的所有外表面序列,该等外表面序列中的至少一个在框架内融合为第二适配器序列,且其中该外源性多肽的展示是通过在第一和第二适配器之间的成对相互作用来调节。
在一个具体实施例中,本发明提供包含噬菌体中间表达载体和具有前述特征的噬菌体辅助载体的噬菌体展示系统。在另一具体实施例中,本发明提供细菌展示系统,其中该细菌表达载体和该细菌辅助载体可展现所主张的特点。该噬菌体和细菌展示系统的实验性设计可延伸至真核表达系统的构建,例如哺乳动物细胞展示系统的构建。
本发明的噬茵体展示系统如上所注,先前所报道的噬菌体展示系统具有许多明显的缺点。例如,通常所应用的基因III和基因VIII系统可产生数个固有缺点。其中(1)由于与该基因包装的某些外表面蛋白质相融合的外源性多肽的显现所产生的对宿主细胞的毒性;(2)因为将该外源性多肽包裹到该基因包装上所必需的外表面蛋白质的某些区域,所以产生对于待展示的外源性多肽的尺寸和定位的严格限制;和(3)由于在该融合和通常由辅助载体所提供的正常型外表面蛋白质之间的重组所产生的融合产物的不稳定性。最近所报道的“半胱氨酸偶合性”展示系统(WO 01/05950)避免了外表面蛋白质融合经由肽键的表达,但仍未能使该等蛋白质对宿主细胞的毒性最小化。此外,一个特别的设计,也就是在WO 01/05950中所述的两载体系统不可避免地在该辅助噬菌体的感染上产生错包裹载体。错包裹载体含有该外表面序列但不含有外源性基因。本噬菌体展示系统避免了该等缺点并提供其它相关优点。
本设计的一个主要方面是将该外源性多肽与噬菌体包裹所必需的该外表面蛋白质进行分离。因此,携带外源性多肽的该噬菌体中间载体(表达载体)不含有任何对功能性外表面蛋白质进行编码的序列。该外源性多肽在该噬菌体颗粒表面上的提出是通过两个适配器的成对相互作用来调节。一个适配器是在框架内与通过该噬菌体中间载体来编码的该外源性多肽的融合,且另一个是在框架内与至少一个由该辅助噬菌体所编码的外表面蛋白质的融合。在使携带噬菌体中间载体的宿主细胞由辅助噬菌体来感染时,该编码外源性多肽是经由在各自适配器之间的成对相互作用与该外表面蛋白质所形成的络合物。然后将该络合物包裹入该噬菌体表面外壳中,而留下在其外表面上所曝露的该外源性多肽。
本发明的噬菌体中间载体的一般特性将数个因子应用于噬菌体展示系统的构建。首先,噬菌体中间载体不含有对基因包装的任何功能性外表面蛋白质进行编码的序列,其中多肽将在该基因包装上展示。“功能性”表示该编码外表面蛋白质保持促进或引导该基因包装在其外表面上对所关心的多肽进行组合的能力。将要由该表达载体中所排除的精确外表面序列将取决于噬菌体包裹的选择。
本文所用的术语“噬菌体”涵盖由蛋白质外壳所组成的病毒,病毒性复制所需的病毒性基因包装将在该外壳中进行压缩。该病毒性基因包装可由单一或双束的、直链或环状的DNA或RNA组成。该噬菌体可感染许多宿主细胞,该等宿主细胞包含(但不限于)原核生物,例如细菌细胞。已将许多丝状或非丝状噬菌体的基因包装排列顺序。典型的丝状噬菌体包括M13、f1、fd、If1、Ike、Xf、Pf1和Pf3。在丝状噬菌体种类中,MB是最特征化的物种。已知其三维结构,且已正确理解其外壳蛋白质的功能。特定地,该M13基因包装对五个外壳蛋白质(也就是pIII、VIII、VI、VII和IX)进行编码。为了构建该噬菌体展示系统基于M13的表达载体,必须将所有外壳编码序列删除或改变以使得该编码蛋白质产物不能影响外源性多肽在噬菌体颗粒外表面上的提出。对于功能性外表面蛋白质所做的合适的改进可导致(1)功能性信号肽的损失,该信号肽可将该外表面蛋白质的细胞内易位引导至该细菌细胞的周质中,其中然后将该信号肽裂开;(2)该外壳蛋白质区域的功能的损失,该功能可将成熟多肽锚定于该细菌细胞膜和/或噬菌体外壳中;(3)该外壳蛋白质区域的功能损失,该功能可特定地将该宿主细菌的F-纤毛结合至该噬菌体受体;和/或(4)内部终止码的引入,以防止任何功能性外壳蛋白质的表达。已描绘了在一些外壳蛋白质中的该等和其它区域(例如pIII)(参看例如美国专利第5,969,108)。其它紧密相关的膜的外表面蛋白质(例如f1和fd丝状噬菌体)亦为此项技术中已知(参看例如凯(Kay)等人(1996)的『肽和蛋白质的噬菌体展示实验室手册』(Phage Display of Peptides and ProtiensA Laboratory Manual,美国学术出版社(Academic Press),圣地牙哥有限公司(Inc.San Diego))。较佳地,在基于M13的表达载体中所提出的该唯一噬菌体序列含有噬菌体中间的复制和包裹所必需的f1起点。对于构建基于M13的表达载体的逐步说明将在实例1-4中详细说明。因此,所属领域的技术人员之一采用适当的实验可以很容易地构建具有所主张的特征的表达载体。
可用相似方法来构建其它丝状噬菌体。Pf3是另一熟知的丝状噬菌体,其可感染对IncP-1质粒进行锚定的假单胞菌属aerugenosa细胞。Pf3的整个基因包装已经排列顺序,且已将复制和包裹所包含的基因信号特征化(Luiten等人(1985)J.Virology 56(1)268-276)。Pf3的主要外壳蛋白质的独特处在于其不具有信号肽来引导其分泌。该序列已负载残基ASP7、ARG37、LYS40和PHE44-COO-,该序列的终点与已曝露氨基酸的终点一致。用于Pf3噬菌体的139bp DNA的病毒性链复制起点已经确定(Luiten等人(1991)J.Bacteriol 173(13)4007-4012)。为了构建基于Pf3的表达载体,必须将该Pf3外壳编码序列删除或改变以使其无法对功能性主要外壳蛋白质进行编码。优选表达载体仅含有用于其复制和包裹的Pf3噬菌体复制起点。
将相同的方法应用于由非丝状噬菌体所得到的噬菌体中间载体的构建。此类噬菌体的非限制性典型部分是细菌噬菌体_X174、ё、T4和T7。细菌噬菌体_X174是非常小的二十面体病毒,其已由遗传学、生物化学和电子显微镜学进行全面研究。_X174的三种基因产物存在于成熟病毒的外面F(衣壳)、G(主要的鞘蛋白质,每个病毒60个复制)和H(主要的鞘蛋白质,每个病毒12个复制)。G蛋白质包含175种氨基酸,而H包含328种氨基酸。F蛋白质与该病毒的单链DNA相互作用。蛋白质F、G和H是由在该病毒性感染细胞中的单一mRNA来翻译。因此,基于此类非丝状噬菌体的典型表达载体缺乏F、G和H蛋白质的所有编码序列。其它替代的表达载体包含已改变的F-、G-或H-编码序列,该等编码序列不产生功能性F、G和H蛋白质。
本发明的辅助噬菌体载体的一般特性本噬菌体展示系统的第二组分是辅助载体,其功能为对缺乏任何功能性外表面序列的该表达载体进行补充。与先前所述的缺乏一个必需的外壳蛋白质编码序列的或含有一个对该基因包装的有缺陷外壳蛋白质进行编码的序列的辅助载体(美国专利第5,969,108)不同,该辅助载体提供包裹该基因包装所必需的所有外表面序列。再次应用的精确外表面序列取决于该噬菌体包裹的选择。
如上所述,可在此技术中获得在多种噬菌体上的大量结构和生物化学的信息。对复制和包裹多种类型基因包装所必需的结构蛋白质和酶进行编码的该等基因序列已经确定,且将其广泛应用于构建先前的展示系统(美国专利第6248516号、5969108号、5885793号、5837500号、5571698号、5223409号和5514548号、WO9005144、EP0368684、WO09201047、WO09311236和WO09708320)。该等序列通常可应用于构建可展现另外独特特性的辅助载体。
特定地,该辅助噬菌体载体通常包含对于辅助噬菌体和噬菌体中间载体的压缩负责的所有外表面序列。一方面,该辅助噬菌体载体包含对下述丝状噬菌体之一的所有外壳蛋白质进行编码的外表面序列M13、f1、fd、If1、Ike、Xf、Pf1和Pf3。基于M13的辅助噬菌体载体的优选外壳编码序列是gIII、gVIII、gVI、gVII、gIX或其功能性等价物。在另一具体实施例中,辅助噬菌体载体含有非丝状噬菌体的外壳编码序列,该丝状噬菌体选自细菌噬菌体_X174、ё、T4和T7。除了该等结构蛋白质,辅助噬菌体载体通常对其它由噬菌体衍生的酶进行编码,该酶反过来在该噬菌体载体和辅助噬菌体上携带的复制的噬菌体起点上起作用以“辅助”复制和包裹该噬菌体中间载体。本发明的优选M13辅助载体是有缺陷复制,以确保该噬菌体中间载体的优选包裹。较佳地,超过90%的该包裹载体是噬菌体中间载体;更佳地,超过99%的该包裹载体是噬菌体中间载体。优选M13辅助噬菌体载体进一步包含对蛋白质I、II、IV、V、X或其功能性等价物进行编码的序列。本文所用的外表面蛋白质的功能性等价物包括用于改性外表面蛋白质的译码,改性外表面蛋白质保持该正常型外表面蛋白质的功能性。功能性等价外表面蛋白质包括增强、减少或不明显影响相应正常型蛋白质的特性的蛋白质。这些等价物可以是具有保守氨基酸替换物的多肽、包含融合和突变体的类似物。优选M13辅助载体可抗干扰。典型的抗干扰辅助载体是M13KO7(香港商安法玛亚股份有限公司(Amersham PharmaciaBiotech))和其衍生物例如VCSM13(Stratagene)。这两个抗干扰辅助载体提供包裹噬菌体颗粒所必需的该噬菌体序列。
只要存在噬菌体包裹所必需的外表面序列,本发明的辅助噬菌体载体就可含有给定外表面序列的一个或多个复制。每个必需的外表面序列的一个复制通常用于产生一个“多价”噬菌体展示系统。相反,给定外表面序列或其功能性等价物的多个复制的结合潜在地产生一个“单价”噬菌体展示系统。单价展示可以区分所展示的以适度亲合力和以高亲和力与目标结合的多肽。其亦有助于以亲合力为基础通过消除该“抗体亲抗原性”影响来选择多肽(例如抗体),其中可显现低亲合力抗体的多个复制的噬菌体将具有与显现较高亲合力抗体的一个复制的噬菌体相同的明显亲合力。然而,多价展示提供可替代的优点。其尤其适用于结合多肽的选择的最初阶段。在筛选的早期,其作为潜在的引导常常更适于积聚广谱性多肽,而不是识别单一高亲合力候选物。然后可应用单价展示或其它方法将经由最初筛选所获得的多肽根据其亲合力来排序。本发明提供单价展示系统的一个典型辅助噬菌体载体(图5A)。在以所得辅助噬菌体来感染细菌细胞时,该包裹的噬菌体中间颗粒展现比游离pIII多两-折叠的外源性多肽/pIII络合物,此表示该包裹的噬菌体具有多个复制(参看实例2、图11)的化合价。本发明亦提供M13辅助噬菌体载体,该载体携带KO7基因III外表面序列的复制和基因HI(图19A和实例4)的C终端部分的复制。后者对功能性等价物进行编码,该等价物可与用于包裹的正常型pIII竞争。所得辅助噬菌体预期可产生单价展示系统。
尤其较佳的辅助载体可支持单价和多价展示。可通过将在外表面序列的第一和第二复制之间的抑制性可移置终止码合并来构建该辅助载体,例如M13噬菌体的基因III。抑制性密码子可在抑制条件下对该密码子(例如基因III)的核苷酸序列下游进行翻译,但在非抑制性条件下可对该密码子的末端进行翻译。在抑制性条件下生长时(例如在抑制剂细菌链中),该辅助噬菌体可展示该外表面蛋白质的与用于包裹的第一复制进行竞争的第二复制;同时存在单价噬菌体展示。然而,在非抑制性细菌链中生长时,相同辅助噬菌体不显现该外表面序列的第二复制,因此产生多价展示系统。同样地,作为适宜的“开关”,该抑制性密码子可控制任一形式的两种不同条件下的展示。抑制性可译终止码的实例是琥珀、赭石和猫眼石密码子。
本发明适配器的一般特性构建该噬菌体展示系统的进一步考虑是选择一对适配器序列,该对适配器序列对能够成对相互作用的两适配器进行编码。然而该适配器序列之一是与由该噬菌体中间载体所携带的该外源性序列插入框架中,另一序列是与该辅助噬菌体载体的至少一个外表面蛋白质在框架内融合。通过“成对相互作用”表示该两适配器可相互作用且相互结合以形成稳定络合物。该稳定络合物必须具有足够长持久性以允许该多肽在该基因包装的外表面上包裹。该络合物或二聚体必须能够承受在形成瞬间和所展示多肽的探测瞬间之间所存在或引入的任何条件,该等条件是所执行的分析或反应的函数。对于在周质中(periplasmically)组合的噬菌体(例如M13),络合物或二聚体在停留于该细菌周质中时必须足够稳定,其中该络合物或二聚体是与该噬菌体基因包装一起包裹。只要该稳定络合物或二聚体满足此限制的其它需要,其就可以是不可逆或可逆。因此,在反应混合物中可形成瞬时络合物或二聚体,但若其随即分解且产生在基因包装的外表面上无法探测的多肽,则其不能构成稳定络合物。
在第一和第二适配器之间的成对相互作用可以是共价或非共价相互作用。非共价相互作用包含每一离去的稳定连接,但无法形成共价键。非共价相互作用的非限制性实例包含两亲性肽的离子键、氢键结合、范·德瓦耳斯力、空间交错。相反,共价相互作用可形成共价键,其包括(但不限于)在两个半胱氨酸残基之间的二硫键、在两个含碳分子之间的C-C键、分别在碳和含氧或含氢的分子之间的C-O或C-H、以及在含氧和含磷分子之间的O-P键。
可应用于构建该展示系统的表达和辅助载体的适配器序列可由多种来源获得。通常,任何包含在稳定多聚物中的蛋白质序列是候选适配器序列。同样地,该等序列可以由任何同型多元体或异源多元体蛋白质络合物获得。典型的同型多元体蛋白质是同源二聚受体(例如由血小板所获得的生长因子)、同源二聚体BB(PDGF)、同源二聚转录因子(例如Max同源二聚体、NF-kappaB p65(RelA)同源二聚体)和生长因子(例如神经营养素同源二聚体)。异源多元体蛋白质的非限制性实例是蛋白质激酶和含SH2区域的蛋白质(Cantley等人(1993)Cell 72767-778;Cantley等人(1995)J.Biol.Chem.270(44)26029-26032)的络合物、异源二聚转录因子和异源二聚受体。
优选异源二聚转录因子是a-Pal/Max络合物和Hox/Pbx络合物。Hox代表一大系列转录因子,胚胎发生期间将该前-后轴图案化时包含该等因子。Hox蛋白质与具有已保存的三α螺旋异源区域的DNA结合。为了结合至特定DNA序列,Hox蛋白质需要存在异源伴侣,例如该Pbx异源区域。为了理解Hox-Pbx络合物的形成如何发生且该络合物如何与DNA结合,Wolberger等人解答了HoxB1-Pbx1-DNA三重络合物的该2.35_晶体结构。该结构展示每个蛋白质的异源区域与临近识别序列是在DNA的对边上结合。异源二聚经由在HoxB1的同源区域的六氨基酸六元肽氨基末端和在Pbx1中的穴之间的接触发生,Pbx1是在螺旋3和螺旋1、2之间形成。该Pbx1同源区域的C-终端延伸形成α螺旋,该螺旋对螺旋1进行压缩以形成较大的四螺旋同源区域(Wolberger等人(1999)Cell 96587-597;Wolberger等人J Mol Biol.291521-530)。
大量异源二聚受体已经确认。其包括(但不限于)与生长因子(例如heregulin)、神经递质(例如γ-Arninobutyric acid)和其它有机或无机小分子(例如矿质类固醇皮质激素、糖皮质激素)相结合的受体。优选异源二聚受体是核激素受体(Belshaw等人(1996)Proc.Natl.Acad.Sci.U.S.A 93(10)4604-4607)、erbB3和erbB2受体络合物和G蛋白质偶合受体,该偶合受体包括(但不限于)鸦片样物质(Gomes等人(2000)J.Neuroscience 20(22)RC110;Jordan等人(1999)Nature 399697-700)、毒蕈碱型、多巴胺、血清素、腺苷/多巴胺和GABAB系列受体。对于大多数已知异源二聚受体,已发现其C-终端序列可调节异源二聚的形成。
与使L和H链成为二聚体有关的抗体链的序列亦可用作适配器来构建本展示系统。该等序列包括(但不限于)L或H链的恒定区序列。此外,适配器序列可由抗体结合位点序列和其结合抗体获得。在此情况下,该对适配器之一含有抗体结合位点氨基酸,该适配器已得到其它含有相应抗原残基的适配器的认可(例如可稳定地联合)。
基于大量关于多族基因的遗传学和生物化学资料,所属领域的技术人员之一采取适当的试验将能够选择和获得合适的用于构建本展示系统的适配器序列。
若需要,由新颖的异源多元体蛋白质所得的序列则能用作适配器。在此情况下采取适当的试验,与异源多元体的形成有关的候选序列的确认可由任何遗传学或生物化学的分析来测定。此外,计算机建模和检索技术进一步促进异源多元体序列的测定,该异源多元体序列是基于在相关和不相关基因中所显现的普通区域的序列同源。允许同源检索的程序的非限制性实例是Blast(http//www.ncbi.nhn.nih.gov/BLAST/)、Fasta(Genetics Computing Group package,Madison,Wisconsin)、DNA Star、Clustlaw、TOFFEE、COBLATH、Genthreader和MegAlign。任何含有与目标受体或其片段相关的DNA序列的序列数据库均可用于分析。通常所应用的数据库包括(但不限于)GenBank、EMBL、DDBJ、PDB、SWISS-PROT、EST、STS、GSS和HTGS。
基于其物理特性,可进一步将由异源二聚序列所获得的本适配器特征化。优选异源二聚序列展现成对亲合力,此导致主要形成了异源二聚体和实质上排除了同源二聚体。较佳地,该主要形成可产生异源多元体库,该异源多元体库含有至少60%异源二聚体(更佳地至少80%异源二聚体,较佳地在85-90%之间的异源二聚体,且较佳地在90-95%之间的异源二聚体,且最佳地在96-99%之间的异源二聚体),该等异源二聚体可以在生理缓冲条件下和/或生理机体温度下形成。在本发明的某些具体实施例中,该适配器对的至少一个异源二聚序列基本上无法在生理缓冲条件下和/或生理机体温度下形成同源二聚体。“基本上无法”表示该选择的异源二聚序列在单独测试时(如Kammerer等人(1999)『化学生物化学』(Biochemistry)3813263-13269所详述的)在体外沉淀试验中或在体外两种混合酵母的分析(参看例如White等人Nature(1998)396679-682)中不长生可探测剂量的同源二聚体。此外,个别异源二聚序列可在宿主细胞中显现,且宿主细胞中的同源二聚体的存在可由多种蛋白质分析来证明,该等蛋白质分析包括(但不限于)SDS-PAGE、免疫印记法(免疫印记法)和免疫沉淀反应。该体外分析必须在生理缓冲条件下(或较佳地在生理机体温度下)来进行。通常,生理缓冲剂含有盐的生理浓度和在经调整过的约6.5至约7.8(并且较佳地在约7.0至约7.5)范围内变化的中性pH值。在Sambrook等人(1989)如上中列举了多种生理缓冲剂,因此本文不再详述。优选生理条件见Kammerer等人的如上所述。
展现上述物理特性的说明性适配器对是GABAB-R1/GABAB-R2受体。此两个受体基本上无法在生理条件下(例如在体内)和在生理机体温度下形成同源二聚体。由Kuner等人和White等人(Science(1999)28374-77;Nature(1998)396679-682)所做的研究已证实GABAB-R1和GABAB-R2在体内的该异源二聚特性。实际上,White等人能够基于该异源二聚受体对的排外特性由酵母细胞中克隆GABAB-R2。由Kammerer等人的如上所做的体外研究已展示GABAB-R1和GABAB-R2的C-终端序列在生理机体温度下分析时均无法在生理缓冲条件下形成同源二聚体。特定地,Kammerer等人已由沉淀试验证实该GABAB受体1和2的异源二聚序列在单独测试时在生理调价下和在生理机体温度(例如在37℃)下沉淀分子质量的该单体。在以当量克分子的剂量混合时,GABAB受体1和2的异源二聚序列以与该两序列(参看Kammerer等人的表1)的异源二聚体相应的分子质量沉淀。然而,在将该GABAB-R1和GABAB-R2的C-终端序列连接至半胱氨酸残基时,同源二聚体可经由二硫键的形成而发生。
适配器可进一步基于其二级结构来特征化。优选适配器由采用卷曲螺旋结构的两性肽组成。该螺旋卷曲螺旋是在蛋白质中的一个主要子组齐聚序列。初步序列分析展示所有蛋白质残基的大约2-3%形成卷曲螺旋(Wolf等人(1997)Protein Sci-61179-1189)。适当特征化的含卷曲螺旋的蛋白质包括该细胞骨架系的组员(例如α-角蛋白、波形蛋白纤维(vimentin))、细胞骨架系运动原系(cytoskeletal motor family)(例如肌球蛋白、驱动蛋白和动力蛋白)、病毒性膜蛋白质(例如Ebola或HTV的膜蛋白质)、DNA结合蛋白质和细胞表面受体(例如GABAB受体1和2)。本发明的卷曲螺旋适配器可广泛分为两类,也就是左旋和右旋卷曲螺旋。该左旋卷曲螺旋是由“七个一组”重复表示的“abcdefg”来特征化表示,同时伴随优选定位于该第一(a)和第四(d)位置的非极性残基。在此两个位置处的残基通常组成与其它链互锁的“球形突出物和孔”的之字形图案以形成密合疏水性核。相反,覆盖该卷曲螺旋周边的第二(b)、第三(c)和第六(f)位置处较佳地充满残基。充满氨基酸的实例包括碱性残基(例如赖氨酸、精氨酸、组氨酸)和酸性残基(例如门冬氨酸、谷氨酸、天门冬酰胺)和谷氨酰胺。适于设计异源二聚卷曲螺旋的未充满的或非极性的氨基酸包括(但不限于)甘氨酸、丙氨酸、缬氨酸、]亮氨酸、异亮氨酸、丝氨酸和苏氨酸。未充满残基通常形成疏水性核,包括充满残基的中螺旋状(inter-helical)和内螺旋状盐桥甚至在核心位置也可用于稳定全面螺线卷曲螺旋结构(Burkhard等人(2000)J.Biol.Chan.27511672-11677)。尽管可采用卷曲螺旋的改变的长度,该卷曲螺旋较佳地含有二至十个“七个一组”的重复。更佳地,该适配器含有三至八个“七个一组”的重复,甚至更佳地含有四至五个“七个一组”的重复。
在设计最佳卷曲螺旋适配器时,可应用多种可预知肽的二级结构的现有计算机软件程序。将COILS算法应用于一种说明性计算机分析,该算法可将一个氨基酸序列与在已知两链卷曲螺线的数据库中的序列相比,且可预知高概率卷曲螺旋伸缩性(Kammerer等人(1999)『化学生物化学』(Biochemistry)3813263-13269)。
包含在多元体形成中的多种卷曲螺旋可用作本展示系统中的适配器。优选卷曲螺旋是由异源二聚受体获得。因此,本发明包含由GABAB受体1和2所获得的卷曲螺旋适配器。一方面,该卷曲螺旋适配器包含GABAB受体1和GABAB受体2的该C-终端序列。另一方面,该适配器是由至少30种氨基酸残基的两种不同多肽组成,其中之一基本上与图23(GR1)中所描述的可比长度的直链序列相同,且另一个基本上与图23(GR2)中所描述的可比长度的直链肽序列相同。
另一类优选卷曲螺旋适配器是亮氨酸拉链。该亮氨酸拉链已在本技术中定义为含有4-5个通过六种氨基酸(Maniatis和Abel,(1989)Nature 34124)互相分离的亮氨酸残基的约35种氨基酸的伸展。已发现亮氨酸拉链存在于多种真核DNA结合蛋白质中,例如GCN4、C/EBP、c-fos基因产物(Fos)、c-jun基因产物(Jun)和c-Myc基因产物。在该等蛋白质中,亮氨酸拉链造成二聚界面,其中含亮氨酸拉链的蛋白质可形成稳定同源二聚体和/或异源二聚体。由两个原癌基因(proto-oncogenes)(c-fos和c-jun)来编码的该蛋白质产物的分子类型分析已展示了优选异源二聚体形成的情况(Gentz等人(1989)Science2431695;Nalcabeppu等人(1988)Cell 55907;Cohen等人(1989)GenesDev.3173)。亦已经展示包含Fos和Jun的亮氨酸拉链区域的合成肽可调节异源二聚体形成,且在该合成肽的氨基端各自包括一种半胱氨酸残基以允许分子间二硫结合,异源二聚体形成发生于同源二聚的实质排除。
本发明的亮氨酸拉链适配器具有通用结构式,其作为“七个一组”重复(亮氨酸-X1-X2-X3-X4-X5-X6)n,其中X可以是传统的20种氨基酸中的任一种,但最有可能是具有α-螺旋形成潜力的氨基酸,例如丙氨酸、缬氨酸、天门冬胺酸、谷氨酸和赖氨酸,且n可以是2或更大,尽管其通常是3至10(较佳地4至8,更佳地4至5)。优选序列是Fos或Jun亮氨酸拉链。
若两个序列均展现实质氨基酸或核苷酸序列同源,则本文所用的肽的直链序列与另一直链序列“基本相同”。通常实质上相同的序列在同源区域的结盟后,相互是至少约60%相同。较佳地,该序列是至少约70%相同;更佳地,其是至少约80%相同;更佳地,其是至少约90%相同;更佳地,该等序列是至少约95%相同;最佳地,该等序列是100%相同。
在确定多肽序列是否基本相同时,一个保存与其相比的多肽的功能性的序列是尤其较佳。功能性可通过不同标准来建立,例如与配对(pairing)适配器形成稳定络合物的能力和促进在框架内与该适配器融合的多肽的展示的能力。
适配器包括改性的亮氨酸拉链和与本文所例示的多肽序列功能性相同的GABAB异源二聚序列。提供改性的对于成对适配器的稳定性和/或展示效率的改性多肽是较佳的。改性多肽的实例包括具有氨基酸残基的保守取代的多肽,和氨基酸的一种或多种删除或添加,该等删除或添加明显有害地改变异源二聚特性。只要维持该成对相互作用,取代作用可自将一种或多种氨基酸残基替代或修改为一个区域的完整再设计来变化。氨基酸取代作用(若存在)是较佳的保守取代,其不会有害地影响肽的折叠或功能特性。可进行保守取代的功能性描述氨基酸的组是甘氨酸/丙氨酸;缬氨酸/异亮氨酸/亮氨酸;天冬酰胺/谷氨酰胺;天门冬胺酸/谷氨酸;丝氨酸/苏氨酸/蛋氨酸;赖氨酸/精氨酸(argimne)和苯丙氨酸/酪氨酸/色氨酸。本发明的多肽可以是糖基化或未糖基化形式,可将其柱状平移(post-translationally)(例如乙酰化作用和磷酸化作用)改性或可将其综合(例如标签组的附着)改性。
本发明的适配器序列可应用传统重组体方法和/或化学合成来获得。应用良好建立的限制和结合技术,将适当的适配器序列自各种DNA来源中删去且在框架内与外源性基因序列和外表面序列分别结合以产生表达和辅助载体。
较佳地,以将所得外源性融合多肽上的结构界面(若有)最小化的方式将第一适配器插入于该表达载体中。然而第一适配器可融合为该外源性基因序列的5′或3′,图9A描述一种优选噬菌体中间载体,其中该适配器序列(例如由GABAB受体1所获得的异源二聚序列)在框架内融合为该外源性基因序列的3′末端。
相似地,在展示噬菌体外壳的完整性未破坏的位置处,将第二适配器序列插入于该辅助载体中。若不打断编码区域,则该适配器序列可融合为外表面序列的5′或3′末端。图5和19描述两种优选辅助噬菌体载体,其中该适配器序列(例如由GABAB受体2所获得的异源二聚序列)在框架内置于该外表面序列、基因HI或其功能性部分的5′末端。
本发明的细菌展示系统本发明亦提供包含下述两种组分的细菌展示系统(1)携带所关心的外源性基因的细菌表达载体,其可对在细菌细胞或细菌孢子的外表面上的待展示的外源性多肽进行编码;和(2)促进所特别关心的多肽的展示。与先前所述的细菌系统(其中该外源性多肽作为与细菌外表面蛋白质的融合来展示)不同,该细菌系统具有下述独特特征。首先,该细菌表达载体包含对待展示的该外源性多肽进行编码的编码序列,该序列在框架内以第一适配器来融合。第二,该细菌表达载体缺乏对细菌或细菌孢子的功能性外表面蛋白质进行编码的外表面序列。第三,该辅助载体包含对该基因包装进行包裹所必需的所有外表面序列,该等外表面序列中的至少一个是在框架内融合为第二适配器序列,且其中外源性多肽的展示是通过在第一和第二适配器之间的成对相互作用来调节。
上述用于构建噬菌体展示系统的通用原则和实验设计同样可应用于产生细菌展示系统。尽管细菌表达载体缺少对任何功能性外表面蛋白质进行编码的序列,辅助细菌载体含有补偿该不足所必需的外表面序列。
辅助细菌载体通常包含对具有下述两个区域的外表面蛋白质进行编码的外表面序列(1)将待分泌的蛋白质经由双层脂质引导至周质的信号肽;和(2)能够将外表面蛋白质定位于细菌细胞该外表面上的膜移位区域。显现的外表面蛋白质首先传输至周质,其中引导肽已裂开。在外表面蛋白质是作为与适配器的融合来显现时,适配器促进外源性多肽的移位,在与外源性多肽中所含有的成对(paring)适配器结合时,适配器亦存在与在细菌外表面上的周质中。
先前研究已展示大量细菌表面蛋白质编码序,其能用于构建辅助细菌表达载体。细菌表面蛋白质的非限制性实例是LamB(Bremer等人Proc.Natl Acad.Sci U.S.A.(1984)813830-34;Gene(1987)52165-73);OmpA(Prog BiophysMolec Biol(1987)4989-115);OmpC(Misra等人(1988)J.Bacteriol 170528-33);OmpF(Pages等人Biochemimie(1990)72169-76);PhoE(van derLey等人J.Biol.Chem.26112222-5);pilin(So等人Curr Top in Microbiol&Immunol(1985)11813-28);pldA(de Geus等人EMBO J.(1984)3(8)1799-1802)、BtuB、FepA、FhuA、IutA、FecA和FhuE(Gudmundsdottir等人(1989)J.Bacteriol 171(12)6526-33);GIP锚定蛋白质INP(Kim等人(1999)Lett Appl Microbiol 29(5)292-297)和β-自传送蛋白质AIDA(Veiga等人(1999)Mol Microbiol 331232-1243)和其它外膜脂蛋白(例如TratT、Pal、Oprl、OsmB、N1pB和BlaZ)。多种停留于细菌孢子的表面上的外壳蛋白质亦已经确定。其相关基因序列已随后分离。例如Donovan等人报告Bacillus subtilis孢子外壳CotD和CotC基因的确认(Donovan等人(1987)J.Mol.Biol.1961-10)。该等和其它表面蛋白质的特征化已在下述文献中详述Pierre Cornelis等人(2000)Curr.Opin.Biotech.L1(5)450-454;Lang等人(2000)Int.J.Med.Microbiol.290579-585;Daugherty等人(1999)Protein Engineering 12(7)613-621;美国专利第5,837,500号和第5,348,867号及其中所应用的文献。
该等或其它细菌外表面蛋白质的信号肽和膜置换已为此项技术中已知。该信号肽通常含有该蛋白质的最初5至30种氨基末端氨基酸。该膜置换区域通常包含一种或多种极易由计算机辅助传统序列分析来确认的膜生成片段。应用传统合成和重组体技术,所属领域的技术人员之一能够容易地获得适当的多肽和核苷酸。若须要,外表面蛋白质的该信号肽可以在框架内附着于另一外表面蛋白质的该膜置换区域,反之亦然。已展示该嵌合体可在细菌外表面(美国专利第5,837,500号)上显现。同样地,上述细菌外表面蛋白质的任一种信号肽引导肽可以在框架内连接至任何天然细菌外表面蛋白质的该膜置换区域。同样地,上述外表面蛋白质中的任一种的置换区域能在框架内融合为细菌或其它起点的任何蛋白质的信号肽,已知该信号肽能够引导该融合至该细菌周质。
本发明的细菌表达载体缺乏对任何功能性细菌外表面蛋白质进行编码的序列。在构建该表达载体时,任何上述外表面序列均是候选待排除序列。本文所使用的术语“功能性”表示该编码外表面蛋白质保持促进或引导该基因包装在其外表面上对所关心多肽进行组合的能力。“功能”的损失可有助于将产生下述情况的改进(1)功能性信号肽的损失,该功能性信号肽可将该外表面蛋白质的细胞内置换引导至该细菌细胞的[周质]内,其中该信号肽然后将裂开;(2)膜移位区域的功能损失,该膜移位区域可将成熟多肽移位于该细菌细胞膜上;和/或(3)内部终止码的引入,其可以防止任何功能性外表面蛋白质的表达。
作为在该噬菌体展示系统中所用的序列,连接至表达和辅助载体的两个适配器序列具有相同的结构和功能特征。可应用于构建该噬菌体展示系统的任何适配器序列同样适用于产生该细菌展示系统。因此,用于选择和制备该成对适配器的标准和程序不在此部分重复。
合适的细菌基因包装包括所有细菌株,其能够在培养物中生长且可将其设计为可在外表面上展示外源性多肽且与亲合力选择一致。优选基因包装是革兰氏(gram)-负细菌。优选物种的非限制性实例包括鼠伤寒沙门氏杆菌(Salmonella typhimurium)、枯草杆菌(Bacillus subtilis)、绿脓杆菌(Pseudomonas aeruginosa)、霍乱弧菌(Vibrio cholerae)、肺炎克氏杆菌(Klebsiella pneumonia)、生殖性奈瑟氏菌(Neisseria gonoirhoeae)、脑膜炎双球菌(Neisseria meningitidis)、多类杆菌(Bacteroides nodosus)、牛莫拉氏菌(Moraxella bovis),且尤其是埃希氏大肠杆菌(Escherichia coli)。
细菌孢子具有基因包装期望的特性。孢子比植物细菌细胞更能抗化学和物理试剂,且因此允许使用多种测试条件。例如,该种类杆菌的细菌可形成完全抗热、辐射、干燥和有毒化学物质(Losick等人Ann.Rev.Genet.(1986)20625-669)破坏的内生孢子。此外,该杆菌孢子既不能积极产生代谢变化,亦不能改变在其表面上的蛋白质。该现象有助于扩大该外壳蛋白质的分子间交联。其它适用于基因包装的孢子是外生孢子,例如阿维链霉菌孢子。
构建该噬菌体和细菌展示系统的其它考虑本发明的载体一般包含显现该外源性多肽所必需的转录或翻译控制序列。合适的转录或翻译控制序列包括(但不限于)复制起点、促进剂、强化因子、抑制结合区域、转录起始位点、核糖体结合位点、翻译起始位点和用于转录和翻译的终端位点。
复制的起点(通常指一个ori序列)允许该载体在合适的宿主细胞中复制。其选择将取决于所应用的宿主细胞和/或基因包装的类型。其中该宿主细胞是原核生物且该基因包装是噬菌体颗粒,该表达载体通常包含两个ori序列、在原核生物中的该载体的自主引导复制和该噬菌体颗粒的其它支持包裹。优选原核ori能够在细菌细胞中引导载体复制。此类ori的非限制性实例包括pMB1、pUC和其它大肠杆菌起点。该噬菌体颗粒的优选ori支持包裹包括(但不限于)f1ori、Pf3噬菌体复制ori。
本文所用的“促进剂”是在某些条件下能够结合RNA多聚酶且能够引起来自于该促进剂的编码区域定位下游(在3′方向)的转录。其可以是可构成的或可诱导的。通常,该促进剂序列是通过转录开始位点限制于其3′终点且向上(5′方向)延伸以包括在上述可探测的水平处引起转录所必需的最少数目的碱或元素。其中该促进剂序列和对RNA多聚酶负责的蛋白质结合区域是转录起始位点。真核促进剂将常常(但不总是)含有“TATA”部分和“CAT”部分。
促进剂的选择将在很大程度上取决于宿主细胞,其中引入该载体。对于原核细胞,多种稳固促进剂在此技术中是已知的。优选促进剂是lac促进剂、Trc促进剂、T7促进剂和pBAD促进剂。
用于其它原核细胞的合适的促进剂包括用于3-磷酸甘油酸盐活化酶或其它糖酵解酶的促进剂,例如烯醇化酶、甘油醛-3-磷酸盐脱氢酶、环活化酶、丙酮酸脱羧酶、磷酸果糖激酶、葡萄糖-6-磷酸盐异构酶、3-磷酸甘油酸盐变位酶、丙酮酸盐活化酶、丙糖磷酸异构酶、磷酸葡糖异构酶和葡糖激酶。具有由生长条件所控制的转录的另外优点的其它促进剂是用于醇脱氢酶2、异氰酸铬(isocytochrome)C、酸性磷酸酶、与氮素代谢相结合的降解酶、上述甘油醛-3-磷酸盐脱氢酶、和对麦芽糖和半乳糖利用负责的酶的促进剂区域。
在构建该载体时,亦将与该外源性序列相关的该终止序列插入于期望的转录的该序列的3′末端以提供该mRNA的多腺苷酸和/或转录终止信号。该终止序列较佳地含有一种或多种转录终止序列(例如多腺苷酸序列)且亦可由另外DNA序列来加长以进一步破坏转录通读。本发明的优选终止序列(或终止位点)具有跟随转录终止序列的基因,该终止序列可以是其自身终止序列或异源终止序列。该等终止序列的实例包括与各种多腺苷酸序列偶合的终止码,该等多腺苷酸序列在该此技术中已知、广泛应用且在下面例示。该终止剂包含一个基因,其有利于应用一个对探测性或选择性标记进行编码的基因;从而提供一个可探测和/或选择该终止剂序列的存在和/或不存在(和相应的该转录单元的失活和/或激活构件)的构件。
除了上述元素外,该等载体可含有一个选择性标记(例如对以该载体来转换的宿主细胞的存活或生长所必需的蛋白质进行编码的基因),尽管该标记基因可在共同引入该宿主细胞中的另一聚核苷酸序列上进行。只有选择性基因已引入其中的宿主细胞才能在选择性条件下存活和/或生长。典型选择基因对下列(多种)蛋白质进行编码(a)赋予对于抗生素或其它毒素(例如氨必西林、卡那霉素、新链丝菌素、G418、氨甲蝶呤等)的抵抗性;(b)补充营养缺陷的缺乏;或(c)供应络合物介质无法得到的关键性营养素。适当的标记基因的选择将取决于该宿主细胞且用于不同宿主的适当的基因在此项技术中是已知的。
在一优选具体实施例中,该载体是往复载体,能够在至少两种不相关表达载体中复制。为了促进该复制,该载体通常含有复制的至少两个起点,其在各自表达系统中有效。典型地,往复载体能够在真核表达系统和原核表达系统中复制。此使得能够在真核宿主(该表达细胞类型)中探测该载体且能够在原核宿主(该放大细胞类型)中放大该载体。尽管此技术中已知的任何合适的起点只要可引导该载体的复制就可应用,但较佳地,复制的一个起点是由SV40获得且另一个是由pBR322获得。如果该载体是往复载体,那么该载体较佳地含有至少两个选择性标记,一个用于表达细胞类型,一个用于放大细胞类型。只要其在所利用的表达系统中起作用,任何此技术中已知的选择性标记或本文中所述的就可应用。
本发明所包含的载体可应用重组体克隆方法和/或通过化学合成来获得。我们已熟知大量重组体克隆技术,例如PCR、限制性核酸内切酶消化和结合,且本文不必详述。所属领域的技术人员之一亦可应用本文或在公共或私有数据库中所提供的序列以通过此技术可用的任何合成构件来获得期望的载体。另外,应用已知限制和结合技术,适当的序列可自多种DNA来源中切离或在操作性关系中与本发明相应的待显现的该外源性序列结合。
由本展示系统所显现的该外源性序列可以是任何长度的异源序列。“异源”表示由与来自于其所对应整体的剩余物在基因上不同的整体所获得。例如,该异源序列可以是通常不在该基因包装(例如细菌细胞或噬菌体颗粒)中显现的基因。或者,该异源序列可以是该基因包装本来的基因,但其与除该天然序列之外的编码序列相连接,该基因自然地且可操作地与该编码序列连接。此外,该异源序列可对随机或预定多肽进行编码。
由本系统显现的该外源性序列亦可以基于下述特征中的一种或多种来特征化在特别生物学过程中所包含的物种起点、发展起点、初期结构相似性,其与特别疾病或疾病标记、组织、子组织或细胞特定表达图案及该显现基因产物的子细胞定位相结合或相冲突。
一方面,该外源性序列可以是任何在与该基因包装不同的实体(例如植物细胞、动物细胞或酵母细胞)中显现的序列。
另一方面,在多细胞动物中形成外胚层、中胚层或内胚层时,或在植物的叶、茎、芽的发展中,该外源性序列具有特定发展起点,例如在胚胎或成熟有机体中的起点。
另一方面,该外源性序列属于一族基因或一子组基因,其共用初始结构相似。结构相似可由上述计算机软件的辅助来识别。基因族的非限制性实例包括对蛋白酶;蛋白酶抑制剂;细胞表面受体;蛋白质活化酶(例如酪氨酸、丝氨酸/苏氨酸或组氨酸活化酶);三聚G蛋白质;细胞激素;PH-;SH2-;SH3-;含蛋白质的PDZ-区域;和由the Institute for Genomic Research(TIGR)、IncytePharmaceuticals Inc.、Human Genome Sciences Inc.、Monsanto和Celera所发行的任何基因族来进行编码的基因族。
另一方面,该外源性序列包含于特定生物学过程中,其包含(但不限于)细胞周期调节、细胞区别、趋药性(chemotaxsis)、细胞死、细胞游动性和细胞骨架基因重排。另一方面,包含于本发明的该外源性序列与特别疾病或与特定疾病标记相关。该等序列包括(但不限于)与自身免疫疾病、肥胖症、高血压、糖尿病、神经元和/或肌肉变性疾病、心脏病、内分泌紊乱和其任何组合相关的序列。
另一方面,该外源性序列涵盖展现严格表达图案的序列。此种类的非限制性典型基因转录不包括普遍存在的已显现基因转录,而包括在一种或多种植物组织(包括叶、种子、块茎、茎、根和芽)中有差别地显现的基因转录;或是在包括心脏、肝脏、前列腺、肺、肾、骨髓、血液、皮肤、膀胱、大脑、肌肉、神经和所选组织的动物机体组织中所显现的基因转录,其由各种类型的癌症(恶性或非恶性)所影响且由囊肿性纤维化或多囊肾疾病所影响。非普遍存在的展示序列的另外实例是将蛋白质产物定位于某些子细胞位置细胞外矩阵、核、细胞质、细胞骨架、原生质和/或细胞内膜状结构,其包括(但不限于)涂覆的坑、高尔基体(Golgi)装置、内质网、核内体、溶酶体核线粒体。
本展示系统可包含基因包装的选择性文库。该等基因包装可显现相同或不同外源性序列。一方面,基因包装的文库对一定量的随机或预定多肽进行编码。另一方面,该文库对一定量的由特定宿主起点、组织起点、发展标记或特别疾病状态所获得的cDNA进行编码。
一特别优选文库对一定量的抗原结合单元进行编码。该抗原结合单元可以是单体或多元体。单体抗原结合单元通常指单链抗原结合单元(Sc Abus),而该多元体抗原结合单元在本文中指非单链抗原结合单元(Nsc Abus)。
由本系统所展示的该非单链抗原结合单元可以是“单价”或“多价”。所展示的多价抗原结合单元可进一步表征为“单特异性”或“多特定”抗原结合单元。为了展示多元体抗原结合单元,必须应用两组表达载体,包含该轻链(L)可变区域的一组和包含该重链(H)可变区域的另一组。尽管所显现的抗体区域是通过较佳地在框架内与该抗体区域融合的异源二聚序列来实现二聚作用,所显现的抗体区域之一必须另外包含能够与该辅助载体所提供的另一适配器成对相互作用的适配器。
应用包括(但不限于)融合、PCR和DNA序列的传统技术,极易获得与现有抗体的L或H链的各种区域相关的核苷酸序列且对其进行编序。产生单克隆抗体的杂交瘤细胞是抗体核苷酸序列的优选来源。产生一列单克隆抗体的大量杂交瘤细胞可以由公共或私有仓库来获得。最大的储存剂是美国菌种保藏中心(American Type Culture Collection)(http//www.atcc.org),其提供良好特征化的杂交瘤细胞株的多样性收集。或者,抗体核苷酸可由免疫或非免疫啮齿动物或人类来获得,且形成有机体,例如脾和外周血液淋巴细胞。下述文献中对应用于萃取和合成抗体核苷酸的特定技术进行了描述Orlandi等人(1989)Proc.Natl.Acad.Sci.U.S.A 863833-3837;Larrick等人(1989)Biochem.Biophys.Res.Commun.1601250-1255;Sastry等人(1989)Proc.Natl.Acad.Sci.,U.S.A.865728-5732和第5,969,108号美国专利。
通过(例如)以用于人类重链和轻链恒定区的编码序列来取代其同源非人类序列亦可对该抗体核苷酸序列进行改性,反之亦然。以此方式来制备可保持原始抗体的结合特性的嵌合抗体。
若须要,该外源性序列可包含用于半族的序列编码,该等半族可促进该蛋白质产物的表达和净化的探测。该等半族的实例是此项技术中已知且包括对指示器蛋白质进行编码的半族,例如β-半乳糖激酶、β-内酰胺酶、氯霉素乙酰基转移酶(CAT)、莹光素酶、绿色荧光蛋白质(GFP)和其衍生物。其它促进净化的序列可对单抗原决定簇例如Myc、HA(由流行性感冒病毒血细胞凝集素获得)、His-6、FLAG或免疫球蛋白Fc部分、谷胱甘肽S转移酶(GST)和麦芽糖结合蛋白质(MBP)进行编码。
本发明的宿主细胞本发明提供包含上述表达和/或辅助载体的宿主细胞。该通过许多适当的构件中的任一构件可将该表达载体引入合适的原核或真核宿主细胞中,该构件包括电穿孔、基因枪法;脂质体法、感染(其中该载体是与一个感染试剂产生偶合);应用氯化钙、氯化铷、磷酸钙、DEAE-右旋糖酐或其它物质的转染。依据宿主细胞的特征,所属领域的技术人员之一极易实施此技术中已良好建立的一种或多种适当构件。
一旦引入于合适的宿主细胞中,该外源性序列的表达可应用此技术中已知的任何核酸或蛋白质分析来测定。例如,应用补充该外源性序列的任何区域的探针,可由传统融合分析(例如Northern blot analysis)、扩大程序(例如RT-PCR)、SAGE(美国专利第5,695,937号)和基于分析的技术(参看例如美国专利第5,405,783号、第5,412,087号和第5,445,934)来对该外源性序列的已转录mRNA的存在进行探测和/或量化。
该外源性序列的表达亦可通过对所显现的蛋白质产物进行检查来测定。此技术中可应用多种用于蛋白质分析的技术。其包括(但不限于)放射免疫测定法(radioimmunoassays)、ELISA(酶连免疫吸附分析)、“夹层”免疫测定、免疫放射测定法(immunoradiometric assays)、现场免疫测定法(应用例如胶态金、酶或放射性同位素示踪)、免疫印记法分析、免疫沉淀反应分析、萤光免疫检验法和PAGE-SDS。
本发明的宿主细胞尤其可用作该外源性序列、载体的仓库或用于产生和筛选期望的多肽(例如基于其结合特性的抗原结合单元)的载体。
本发明的适配器定向展示系统的应用本发明的适配器定向展示系统具有几种特定用途。首先,该系统允许在合适的宿主细胞中产生可溶性单体和多元体外源性多肽。第二,该系统允许单体和多元体多肽在所选基因包装上的展示。本展示系统亦可用以创造用于多种用途的随机或预定多肽、全长蛋白质和蛋白质区域的文库。例如,所展示的文库可用以测定抗原决定部位和模拟位(mimotopes)的位置、识别多种目标蛋白质的对抗体和激动剂、设计抗体、优化抗体特性和创造新颖结合活性。
因此,本发明提供可探测在测试剂和在基因包装上所展示的外源性多肽之间的特定相互作用的存在的方法。该方法包含下述步骤(a)提供本展示系统的基因包装,该基因包装呈现该外源性多肽;(b)将该基因包装在适于产生稳定多肽-剂络合物的条件下与测试剂接触;和(c)探测在该基因包装上的稳定多肽-剂络合物的形成,从而探测该特定相互作用的存在。
为了本发明,将“测试剂”规定为包括(但不限于)生物学或化学化合物,例如简单或复杂有机或无机分子、蛋白质、碳水化合物、脂类、聚核苷酸或其组合。可合成一大系列化合物,例如寡聚物,例如寡肽和寡核苷酸和基于各种核结构的合成有机化合物,上述化合物亦包含于术语“试剂”中。此外,各种天然来源可提供用于筛选的化合物,例如植物或动物萃取物及类似物。应了解尽管不总是明确规定该试剂是单独使用或与另一试剂组合使用,作为由本发明筛选所证实的试剂,其具有相同或不同生物学活性。优选试剂是候选诊断程序和/或疗法,例如能够调节细胞的信号转导路径的试剂。在一独立具体实施例中,本发明提供获得具有期望的特性的多肽的方法。该方法包含下述步骤(a)提供本展示系统的选择性文库;和(b)筛选该选择性文库以获得至少一个展示具有期望的特性的多肽的基因包装。该方法可进一步包含分离该基因包装的步骤,其展示具有期望的特性的多肽。该基因包装的分离可包含由对期望的多肽进行编码的基因包装中获得核苷酸序列。期望的特性涵盖了多肽特定地与所关心的试剂进行结合的能力。具有期望的特性的所选多肽可属于一种或多种类别的下述分子,即抗原结合单元、细胞表面受体、受体配位体、细胞溶质(cytosolic)蛋白质、分泌性蛋白质、核内蛋白和其功能性主题。待测试的特定试剂和待展示的外源性多肽的文库的选择将取决于该筛选分析的期望的目的。
展现期望的结合特性或亲合力的抗体的分离噬菌体和细菌展示的最强大的应用之一是抗体设计。已展示scFv抗原结合单元可在噬菌体颗粒和细菌细胞的表面上显现,且不存在结合特性和亲合力(McCafferty等人(1990)Nature 348552-554;Daugherty等人(1999)proteinEngineering 12(7)613-621)的明显损失。亦已证实功能性Nsc Abus(例如Fab片段)可在噬菌体表面上显现。现在,许多不同抗原的抗体已应用噬菌体展示技术进行了成功分离。
因为该系统允许提供抗原结合单元的大量不同清单,所以本噬菌体展示系统尤其适用于本申请案。该噬菌体展示系统在许多方面可模拟天然免疫系统。抗原结合单元的抗原驱动刺激可通过自抗原结合单元的噬菌体所展示的文库中选择高亲合力结合剂来获得。在发展B细胞中的H和L链基因进行重组期间所发生的大量链置换可通过将DNA和蛋白质的克隆H和L链进行混合和通过位点特定重组(Geoffory等人(1994)Gene 151109-113)的应用来模拟。体细胞突变亦可通过在噬菌体-展示抗原结合单元的CDR区域中引入突变来匹配。
具有期望的结合特性或亲合力的该抗原结合单元可应用一种称作“淘筛”(Parmley and Smith(1988)Gene 73305-318)的亲合力选择形式来确定。首先将抗原结合单元的文库以所关心的抗原来培养,继而对具有界定噬菌体的抗原进行捕集。然后可将以此方式所回收的该噬菌体放大且再次对其进行选择以与该抗原结合,从而对与所关心抗原相结合的噬菌体进行富集。通常,可在一星期内完成三至四次选择,其导致一至一百种结合噬菌体的分离。因此在试验中显现期望的抗原结合单元的稀有噬菌体可顺利地由多于108种不同个体中选择出。然后由个体噬菌体克隆的核苷酸序列来推导结合抗原结合单元的一级结构。在所展示的抗原结合单元中采用人类VH和VL区域时,本展示系统可以进行人类抗体的选择,而不进一步操纵非人类抗原结合单元。
包含具有改性结合特性或亲合力的Abus的新颖蛋白质的产生应用本展示系统可获得展示多肽的具有用于目标蛋白质的高亲合力和特性的复制性基因包装(例如抗原结合单元)。该基因包装携带结合多肽和对结合产物进行编码的多核苷酸。多核苷酸的存在促进了结合蛋白质的重组体表达和随后操作。例如,用于该结合蛋白质的多核苷酸编码可由盒式诱变发生、易于出错的PCR或滑移来进行诱变处理以产生已改变的序列的精确清单,已改变的序列类似于亲本多核苷酸。在筛选新颖结合蛋白质的精确清单时,可确定展现改性结合特性或亲合力的蛋白质。
测定抗原决定部位的位置传统上,抗原的抗原决定部位位置测定极大地取决于物理化学分析。这些方法包括(1)分裂具有各种蛋白酶的净化抗原,识别反应性片段,且对其排序;(2)化学改进实验,其中残基与抗原结合单元的相互作用可保护改进;(3)合成一系列与该抗原的一级结构相应的肽;和(4)应用NMR或X射线结晶学来引导物理表征。所有方法是劳动密集且通常不由高处理量分析来检验。噬菌体或细菌展示可提供用于对该抗原的抗原决定部位进行定位的高效和稳固替换物。对该抗原的部分进行编码的DNA片段可由该表达载体显现为外源性多肽。然后可由该抗体来测试基因包装(例如噬菌体、细菌细胞或孢子)以确定与该抗体反应的展示片段。此展示技术已广泛用于此技术中且已展示可成功确定多种分子的抗原的抗原决定部位。
测定单克隆和多克隆Abus的结合抗原决定部位的位置亦可应用本展示系统来提交用于测定该抗原结合位点的特性的位置的随机肽文库。随机肽文库可代表一个序列来源,抗原决定部位和模拟位可在运行上由其来定义。以该文库可确定且获得用于抗原抗体相互作用的肽竞争物,并且因此测定多种抗原结合单元的可达到的和/或功能性位点。
信号转换路径的受体和其它调节子的识别配位体亦可采用本展示系统以识别用于受体的配位体。该过程通常继续从属于一定量将测试配位体显现为该受体的基因包装,继而识别限制于该受体的基因包装。或者,该受体可在基因包装中呈现。然后将限制于测试配位体的受体分离。关于肽配位体的确认,随机肽文库是优选的用于执行该分析的启动(staring)物质。相同的方法可应用于识别细胞的信号转录路径的其它调节子。
细胞的活性是由可刺激或抑制细胞内情形的外部信号来调节。将刺激或抑制信号传输至细胞中以引起细胞内反应的方法是指信号转换。适当的信号转换对于适当的细胞功能是必要的。在过去的十年中,多种细胞信号分子已经确认、克隆和表征。该信号蛋白质的非限制性实例包括细胞表面受体、蛋白质活化酶(例如酪氨酸、丝氨酸/苏氨酸或组氨酸活化酶)、三聚G-蛋白质、细胞浆(cytokines)、SH2-、SH3-、PH-、PDZ-、含蛋白质的死区(death-domain)和由Human Genome Sciences Inc.、Celera、the Institute for Genomic Research(TIGR)和Incyte Pharmaceuticals,Inc所发行的基因或蛋白质族中的任一种。已经说明了由信号蛋白质的经常生长(ever-growing)族所调节的信号转换情形的串连且已发现其可在多种生物学反应中执行中央作用。其中有细胞周期调节、细胞区别、细胞死、趋药性(chemotaxsis)、细胞游动性和细胞骨架基因重排(Cantley等人(1991)Cell 64281-302;Liscovitch等人(1994)Cell 77329-334)。已经发现在信号转换路径的各种组分中的缺点可说明大量疾病,其包括多种形式的癌症、血管病和神经疾病。实质上,能够调节信号路径(例如信号转换路径的调节子)的试剂已作为潜在诊断和/或治疗药而得到长期公认。
本发明的调节子是以其下述能力来特征化(1)与存在于本基因包装上的细胞内信号蛋白质结合;或(2)在通常与该信号蛋白质相关的细胞蛋白质存在时,为了与所展示的信号蛋白质结合而竞争。该等调节子可以是目标信号蛋白质的激动剂或对抗体。
显现cDNA文库本展示系统尤其适用于显现cDNA文库。如上所注,先前所报道的包括基因III和基因VIII噬菌体展示系统的融合系统将插入点限制于该外表面序列的5′末端。因此必须将该外源性多肽连接至该外表面蛋白质的氨基末端。因此,由于内部终止码对于阅读框的分裂,含有所有阅读框的编码序列的片段的cDNA文库不能由融合系统全面显现。然而,由于该外源性序列未在框架内与该外表面蛋白质融合,该系统无法承受单向克隆的这个缺点。
cDNA展示可以是定义蛋白质-蛋白质相互作用的有效技术。cDNA文库的表达和筛选可极大地促进基于所显现的产物与所特别关心的已知蛋白质结合的能力的新颖基因的确认。cDNA-编码蛋白质可在该基因包装的表面上显现,然后可对其进行测试,经由如上所述的生物淘筛浓缩对在体外的特别固定目标进行测试。
所展示的外源性多肽或随机或预定多肽的文库可特定地与测试剂结合的能力可由此技术中所建立的多种程序井来测试。通常,应用亲合力色谱学来较佳地执行选择。该方法通常继续将该基因包装与测试剂涂覆板(test-agent-coated plates)、柱矩阵、细胞或与在溶液中的生物素化(biotinylated)试剂结合,继而进行捕集。对限制于该固体相的该基因包装进行洗涤且然后以可溶性半抗原、酸或碱来洗提。或者,该测试剂的增强浓度可用以自该亲合力矩阵中分离该基因包装。关于具有对测试抗原的极高亲合力或抗体亲抗原性的特定抗原结合单元,有效洗提可需要如WO 92/01047所述的高pH值或温和还原溶液。
为了避免在回收具有期望的结合特性的限制多肽时的潜在困难,可在该适配器和外源性多肽之间引入蛋白酶分裂位点。可应用于此目的的分裂位点包括(但不限于)因子X、胰蛋白酶和凝血酶识别位点。在将该基因包装与亲合力矩阵结合且洗涤该非特定包裹之后,展示具有期望的亲合力的剩余包裹可通过以蛋白酶在适于在分裂位点进行消化的条件下对该抗原亲合力矩阵进行洗涤来收集。该消化将自该基因包装(例如噬菌体颗粒)中释放该外源性多肽。
上述可代替的程序是获得已保持强结合噬菌体或细菌颗粒的该亲合力矩阵,且提取其核酸,例如通过在SDS溶液中沸腾。所提取的核酸可用于直接转换大肠杆菌宿主细胞,或者该外源性序列可由PCR应用合适的引物来放大。
选择的效率有可能依据几种因子的组合,其包括在洗涤时的分裂动力学,一级在单一噬菌体或细菌上的多个复制能否立即与在固体载体上的测试剂结合。例如,具有快速列界动力学(和弱结合亲合力)的抗体应该通过在该固体载体上使用短期洗涤、多价展示和抗原高涂覆密度来保持。相反地,具有慢分裂动力学的抗原结合单元的选择应该通过使用长期洗涤、多价噬菌体和抗原的低涂覆密度来支持。
或者,对于给定试剂的特定结合可以由细胞分类来评估。该技术包括在基因包装(例如黏着于待分类的宿主细胞的噬菌体颗粒)上提供该外源性多肽,然后将目标细胞标定于偶合至探测半族的测试剂,继而将标定细胞与在细胞分类器中的未标定细胞进行分离。一种成熟的细胞分离方法是荧光激活细胞分类(FACS)。在单一文件中在良好溪流中使流动的细胞通过激光束,且然后测定由该荧光标签所结合的每个细胞的荧光。
在必要时,外源性多肽的清单可由不相干测试剂来预选择以反向选择非期望的多肽。例如,抗原结合单元的清单可由不相干抗原来反向选择。为了分离,该清单亦可以是由相关试剂(例如抗突变抗原结合单元(anti-idiotypic Abus))来预选择。本展示系统使得具有期望的特性的抗原结合单元可快速分离。可预期多种已分离的抗原结合单元将难以或不可能通过传统杂交瘤细胞或转基因(transgenic)动物技术来获得。
对于已洗提的抗原结合单元所做的随后分析可包含用于对该L和H链的氨基酸序列进行描绘的蛋白质排序。基于所推导出的氨基酸序列,对抗体多肽进行编码的该cDNA然后可由包含PCR、文库筛选、在现有核酸数据库中的同源搜索及其组合的重组体克隆方法来获得。通常所采用的数据库包括(但不限于)GenBank、EMBL、DDBJ、PDB、SWISS-PROT、EST、STS、GSS和HTGS。
包含本发明的载体的试剂盒本发明亦涵盖在合适的包裹中含有该表达和辅助载体的试剂盒。
每个试剂盒必定包含将载体传输至可能存在的宿主细胞中的试剂。促进载体的传输的试剂的选择可以根据所用的特别转染或感染方法而变化。该等试剂盒亦可含有适用于产生用于外源性序列和该蛋白质产物的探测的标记聚核苷酸探针或蛋白质探针。每个试剂可由适于库存储存(inventory storage)的固体形式或溶解/悬浮于液体缓冲剂中的形式提供,且随后当执行该实验时,其适于交换或添加于该反应介质中。提供合适的包裹。该试剂盒可视情况提供适用于该程序的另外组分。该等选择性组分包括(但不限于)缓冲剂、捕获试剂、发展试剂(developing reagents)、标签、反应表面、探测构件、控制样品、指令和说明信息。
本展示系统、宿主细胞和基因包装的发展和用途的进一步说明在下述实例部分中提供。该等实例是对所属领域技术人员的实践者的指导,且不表示任何方式的限制。
实例实例1KO7kpn辅助噬菌体的制备和应用A.KO7kpn载体的构建该KO7kpn载体是通过根据下述程序来对良好特征化的载体(即M13KO7(来自于Amersham Pharmacia))进行修改来构建。所得载体与KO7相同,除了已将一独特KpnI限制位点插入于该基因III引导序列,而不破坏该基因III编码区域(参看图3A和3B)。
通过基于PCR的发生定位突变,将该KpnI位点引入至KO7辅助噬菌体载体的基因III引导序列中。KO7基因包装的放大係通过PCR并利用下述含有KpnI位点的引物来完成p3KNl5′-TTTAGTGGTACCTTTCTATTCTCACTCCGCTG-3′和p3KN25′-TAGAAAGGTACCACTAAAG GAATTGCGAATAA-3′。该等引物共用对基因III引导序列的序列同源性。
在含有100ng的KO7载体DNA、20pmol的每种引物、250uM的dNTP和1X pfu缓冲剂和pfu DNA多聚酶(Stratagene)的100ul反应混合物中来执行PCR。使该反应混合物最初处于约96℃的条件下且然后如下所述在温度循环器中经受15PCR循环变性96℃、30秒钟退火5.5℃、30秒钟伸展72℃、10分钟放大之后,将其产物凝胶净化、用KpnI切开且通过电穿孔来与转换TG1细菌细胞结合。冷冻(sleet)细菌细胞以产生卡那霉素抗药性。具体而言,在96-井微量滴定盘中使抗卡那霉素(KanR)菌落在含有70ug/ml卡那霉素的2xYT介质中生长,且通过噬菌体ELISA分析将上清液用于筛选以消除由PCR误差所引起的功能丧失突变。简要地,如下进行该噬菌体ELISA在4℃过夜将含有噬菌体颗粒的100ul上清液应用于该ELISA板的外壳井。室温下在PBS缓冲剂中以5%牛奶冻结30分钟后,将结合于ELISA盘上的噬菌体颗粒在室温下进一步用100ul的HRP-共轭抗-M13抗体(Amersham Pharmcia)培养1小时。通过含有0.05%Tween 20的PBS来洗除该游离抗M13抗体。然后添加基体ABTS[2,2′连氮基-双(3-乙基苯噻唑啉-6-磺酸)]。通过在405nm的吸光度来测定该HRP活性。图2展示用于抗卡那霉素、阳性噬菌体复制体的噬菌体ELISA筛选结果。对48个复制体进行筛选以用于噬菌体繁殖。该复制体C2、B3、B7、B9和A12呈噬菌体阳性。由TG1培养物来制备摘取自克隆B7、B9和A12的DNA。含有Acc65I(KpnI的同裂酶)和BamHI的载体DNA的双重降解展示600 bp的DNA片段,其证明KpnI位点存在于所有的三个KO7kpn载体复制体中。
B.KO7kpn噬菌体繁殖将含有产生自B9复制体的KO7kpn辅助噬菌体的KanRTGl上清液在2xYT琼指平板上种菌划线(streaked)。将与0.5ml的TG1培养物(OD600=0.5)相混合的4ml软琼脂浇注于该板上。在37℃过夜培养之后形成噬菌体斑。采集单个噬菌体斑且将其用于培养10ml含有70ug/ml卡那霉素的2x YT培养物。在37℃以250rpm持续摇动的方式培养2小时之后,将该培养物转移至容纳含有500ml的70ug/ml卡那霉素的2x YT的2升烧瓶中。经由持续摇动过夜培养该培养物。然后应用聚乙二醇(PEG)/NaCl将在supematant中的噬菌体沉淀,且在磷酸盐缓冲盐水(PBS)中再次悬浮。由OD268测量来确定噬菌体浓度。通常OD268的1单位读数指示出上清液含有近似5×1012噬菌体/ml。所产生的用于KO7kpn辅助噬菌体的已记录的噬菌体近似是1-2×1012/ml,其与该M13KO7辅助噬菌体非常相似。
C.用于噬菌体展示的KO7Kpn辅助噬菌体的应用在显现scFv-pIII融合的噬菌体展示载体pABMD1(图22)中亚克隆scFv抗体AM2的编码序列。将携带展示载体的TG1细胞生长至OD600=0.6,且在MOI=10由KO7kpn辅助噬菌体双重感染。在30℃过夜将感染的TG1细胞在2x YT/Amp/Kan中生长。通过来自于培养物上清液的PEG/NaCl将该噬菌体中间颗粒沉淀两次,且在PBS中再次悬浮。将展示于噬菌体上的scFv-pIII融合经由噬菌体ELISA分析来探测。简要地,首先在4℃过夜将0.2ug的AM2-抗原涂覆于96-井ELISA板上。在5%牛奶/PBS阻断之后,将在2%牛奶/PBS中的噬菌体溶液置于该ELISA板上1小时。通过以HRP-共轭抗-M13抗体进行培养来探测与抗原相结合的噬菌体。将基板ABTS[2,2′连氮基-双(3-乙基苯噻唑啉-6-磺酸)]用于HRP活性的测量。由携带pABMD1-AM2/KO7kpn载体的TG1细胞所产生的噬菌体中间展示出极强的抗原结合活性,此展示scFv抗体AM2通过KO7kpn辅助噬菌体的功能性展示。该系列实验用作构建和展示本展示系统所采用的试剂的阳性控制。
实例2包含GM-超辅助噬菌体载体的适配器定向展示系统的制备A.GM-超辅助噬菌体载体的构建通过以合成DNA片段置换在载体pABMD1(图22A)的XbaI和Bg1II位点之间的序列来构建pABMC6载体,该DNA片段对具有KpnI位点和用于GR2区域(人类GABAB受体2的该卷曲螺旋区域)的编码序列和Myc-标记(图4)的局部基因III引导序列进行编码。将用于GR2-Myc区域的序列直接与在pABMD1载体中的pIII编码序列融合,且由DNA序列来证实。
GM-超辅助噬菌体载体通过以具有相应的对来自于pABMC6载体的局部pIII引导和适配器2-pIII融合蛋白质进行编码的片段置换对在KO7Kpn辅助载体中的局部pIII引导(氨基酸残基11-19)和局部pIII蛋白质(氨基酸残基1-197)进行编码的该KpnI/BamHI片段来构建。所得GM-超辅助噬菌体载体(图5)包含工程基因III融合,其中GR2区域和Myc-标记序列(用于探测工程pIII蛋白质)在框架内与基因III(图5B)融合。
将B9 KO7kpn辅助噬菌体复制体(参看实例1)用于构建GM-超辅助噬菌体载体。在KO7kpn噬菌体载体中亚克隆工程基因III片段之后,在96-井微量滴定盘中使20个抗卡那霉素复制体在含有70ug/ml卡那霉素的2x YT介质中生长。将上清液用于由如实例1所述的噬菌体ELISA分析所进行的噬菌体筛选。19个复制体能够产生噬菌体颗粒。
为了证实GM-超辅助噬菌体已用GR2-Myc-pIII融合蛋白质来包裹,执行应用抗-Myc抗体(来自于BD Pharmingen的9E10)抗体的免疫印记法来探测工程pIII融合。简要地,将来自于四个复制体(克隆6、9、18和20)的1-4x1011噬菌体颗粒在样品缓冲剂(2%SDS,5%的β-巯基乙醇,10%甘油,0.67M的Trice-HCl,pH值为6.8)中加热10分钟。对该变性的样品进行SDS-PAGE。然后将SDS凝胶中的蛋白质转移至PVDF膜,随后以在5%牛奶/PBS中的2ug/ml的9E10抗体来探查该PVDF膜。由抗鼠抗体-AP共轭和BCHVNBT AP基板(Sigma)来探测Myc-标记蛋白质。如图6所示,通过该抗-Myc抗体来探测在所有四个复制体中的单一蛋白质键。在阴性控制M13KO7辅助噬菌体中没有探测出Myc键。该实验证实GR2-Myc-pIII融合蛋白质是在超辅助噬菌体颗粒中组合。GR2-Myc-pIII融合的组合进一步由ELISA分析(参看图7)来确认。
我们已熟知M13噬菌体对于胰蛋白酶有抵抗性。用于蛋白酶分裂位点的筛选揭示了在GM-超辅助噬菌体(图5C)的GR2-Myc区域中有七个胰蛋白酶分裂位点。为了测试GR2-Myc区域能否通过胰蛋白酶自该噬菌体表面分裂,将来自于克隆18的GM-超辅助噬菌体在37℃曝露于不同浓度的胰蛋白酶中30分钟,且然后添加胰蛋白酶抑制剂以使该反应停止。图8展示该Myc-标记可通过5ug/ml胰蛋白酶完全移除。该M13KO7辅助噬菌体起到阴性控制的作用。
B.GM-超辅助噬菌体的产生应用含有如上所述的GM-超辅助噬菌体颗粒的上清液来进行噬菌体斑分析。采集单一噬菌体斑且将其用于培养10ml含有70ug/ml卡那霉素的2x YT培养物。在37℃在250rpm以持续摇动的方式培养2小时以后,将该培养物转移至容纳500ml含有70ug/ml卡那霉素的2x YT的2升烧瓶中,以用于大规模产生噬菌体颗粒。应用聚乙二醇(PEG)/NaCl沉淀在TG1上清液中的噬菌体,且在磷酸盐缓冲盐水(PBS)中再次悬浮。由OD268测量来确定噬菌体浓度。该OD OD268测量指示出该培养物含有近似2×1011/ml的GM-超辅助噬菌体颗粒。由胰蛋白酶自噬菌体表面所移除的GR2-Myc区域可通过1至3个折叠来增加噬菌体传染性。
C.用于展示抗原结合单元的GM-超辅助噬菌体的应用在适配器定向展示系统中,所关心的该外源性多肽是作为与成对适配器(指定“适配器2”)相互作用的适配器(指定适配器1)的融合来显现,该成对适配器在框架内与外表面蛋白质融合。在两适配器之间的该成对相互作用促进该外源性多肽的展示。该噬菌体中间载体pABMX14是显现在框架内与适配器1融合的外源性多肽的表达载体之一。该载体pABMX14(图9A和9B)是由pBluescript SK(+)获得。在该lac促进剂之后立即由具有一组引物(pBS-Ska5′-GGAATTGTGAGCGGATAACAATTTACCGGTCACACAGGAAACAGCTATGACCATG-3′和pBS-SKb5′-CATGGTCATAGCTGTTTCCTGTGTGACCGGTAAATTGTTATCCGCTCACAAT TCC-3′)的基于PCR位点引导诱变发生来引入一独特AgeI限制位点,且通过切削和钝端结合来删去XhoI位点和KpnI位点。将由AgeI在5′和由SalI位点在3′侧面相切的合成DNA片段在工程pBluescript SK(+)中复制,该片段含有核多糖体结合序列序列RBS、pelB引导和用于由GABAB受体1(GR1是适配器1)和HA-(His)6-标记(指DH-标记)所获得的适配器的编码序列。该lac Z促进剂推动了GR1融合的表达且因此允许以细菌细胞所显现的可溶性外源性多肽的产生。
为了证实功能性蛋白质可应用本发明来展示,在pABMX14载体中亚克隆单链抗体AM1。将所得PABMX14-AM1转换为TG1细胞,且以4或40或100感染复数(MOI)将该等细胞与GM-超辅助噬菌体双重感染。如实例1所述产生并净化噬菌体颗粒。应用以AM1抗原涂覆的板将展示于该噬菌体表面上的单链抗体以噬菌体ELISA来探测。第二抗体是HRP-共轭抗M13抗体。ELISA结果展示由所有三个MOI感染所产生的该噬菌体中间颗粒能够特定地与AM1-抗原结合,其指示出单链抗体在噬菌体表面(图10)上功能性展示。可以观察到一个取决于剂量的结合。当噬菌体浓度达到1012/ml时,结合是饱和的。由携带pABMX14-AM1/M13KO7载体的TG1所产生的控制噬菌体中间不与甚至在高浓度(例如1013/ml)下的AM1-抗原相结合。噬菌体颗粒亦应用抗-Myc和抗-HA抗体通过免疫印记法来分析。通过在非还原条件(例如无(3-巯基乙醇))下加热在SDS样品缓冲剂中的噬菌体颗粒来使其改性。图11展示,scFv抗体只能在与GM-超辅助噬菌体而不是控制M13KO7辅助噬菌体发生感染时才能展示。抗-Myc印迹亦揭示出大约是游离GR2-Myc-pIII两倍的scFv-GR1-DH/GR2-Myc-pIII络合物在线2中的噬菌体颗粒中组合。每个噬菌体颗粒含有pIII外壳蛋白质的5个复制体。此展示每个噬菌体颗粒平均携带scFv-GR1融合的多个复制体。
实例3包含CM-超辅助噬菌体载体的适配器定向展示系统的制备A.CM-超辅助噬菌体载体的构建通过以合成DNA片段来置换在载体pABMD1(图22)的XbaI位点和BglII位点之间的序列来构建pABMC13载体,该DNA片段包含5′至3′基因引导序列、KpnI位点、用于Ala-Cys-Gly-Gly和Myc-标记(图12)的编码序列。此合成序列在框架内与在pABMD1载体中的基因III连接。
CM-超辅助噬菌体载体通过对在KO7Kpn辅助载体中的局部pIII引导(氨基酸残基11-19)和局部pIII蛋白质(氨基酸残基1-197)进行编码的KpnI/BamHI片段来构建,KO7Kpn辅助载体具有相应的对来自于该pABMC6载体的局部pIII引导和适配器2-pIII融合蛋白质进行编码的片段。所得CM-超辅助噬菌体载体(图13A)对与置于pIII的氨基末端的Cys-myc区域融合的工程pIII衣壳进行编码(图13B)。此外,将琥珀终止码标记置于Cys-myc编码序列和基因III之间。该终止码允许在抑制细菌株而不是非抑制株中繁殖整个噬菌体颗粒。
将B9 KO7kpn辅助噬菌体复制体用于构建CM-超辅助噬菌体载体。在KO7kpn噬菌体载体中亚克隆工程基因III片段之后,在96-井微量滴定盘中使24个抗卡那霉素复制体在含有70ug/ml卡那霉素的2x YT介质中生长。将上清液用于由如实例1所述的噬菌体ELISA分析所进行的噬菌体筛选。23个复制体能够产生噬菌体颗粒。
为了证实CM-超辅助噬菌体能够包裹在该噬菌体颗粒中显现的Cys-Myc-pIII融合,应用抗-Myc抗体来执行ELISA分析。来自于所选五个复制体的CM-超辅助噬菌体在其表面上均展示Myc-标记。Myc-标记在KO7辅助噬菌体阴性控制(图14)中不能探测。
B.CM-超辅助噬菌体的产生根据如上所述的程序应用含有CM-超辅助噬菌体颗粒的上清液来进行噬菌体斑形成分析。简要地,采集单一噬菌体斑且将其用于培养10ml含有70ug/ml卡那霉素的2x YT培养物。在37℃在250rpm以持续摇动的方式培养2小时以后,将该培养物添加至容纳500ml含有70ug/ml卡那霉素的2x YT的2升烧瓶中过夜培养。应用聚乙二醇(PEG)/NaCl来沉淀在TG1上清液中的噬菌体,且在磷酸盐缓冲盐水(PBS)中再次悬浮。由OD268测量来确定该噬菌体浓度。所产生的用于CM-超辅助噬菌体的噬菌体近似是1-2×1012/ml培养物,其与M13KO7和KO7kpn辅助噬菌体非常相似。Myc-标记可由胰蛋白酶自噬菌体表面移除。由于置于工程基因HI中的琥珀终止码,在非抑制细菌株TOP10F′中不产生明显剂量的CM-超辅助噬菌体颗粒。
C.用于展示抗原结合单元的CM-超辅助噬菌体的应用噬菌体中间载体pABMX15是显现在框架内融合为适配器的外源性多肽(单链抗体AM1)的另一说明性表达载体。载体pABMX15(图15A和15B)是通过以对HA-标记和Gly-Gly-Cys进行编码的合成DNA片段来置换pABMD2(应用NotI和SalI为位点)的fd基因III片段自pABMD2(图22)来构建。
为了证实功能性蛋白质可应用CM-超辅助噬菌体载体来展示,在pABMX15载体中亚克隆该单链抗体AM1。将所得PABMX15-AM1转换为TG1细胞,且以1或10或50或100感染复数(MOI)将该等细胞与GMCT-超辅助噬菌体双重感染。如实例1所述产生并净化噬菌体颗粒。应用以AM1抗原涂覆的板将展示于该噬菌体表面上的单链抗体以噬菌体ELISA来探测。在每个井中添加2×1012噬菌体。第二抗体是HRP-共轭抗M13抗体。该ELISA结果展示由所有四个MOI感染所产生的该噬菌体中间颗粒能够特定地与AM1-抗原结合,其指示功能性单链抗体在该噬菌体表面(图16)上展示。由携带pABMX15-AM1/M13KO7载体的TG1所产生的该控制噬菌体中间不与AM1-抗原结合。该噬菌体颗粒亦用于免疫印记法分析。该噬菌体颗粒亦适用于通过在非还原条件(例如无(3-巯基乙醇))下在SDS样品缓冲剂中加热来对该噬菌体颗粒变性。如图17所示,该scFv抗体只能由由CT-超辅助噬菌体而不是M13KO7辅助噬菌体来展示。
图17亦指示了比scFv更多的游离pIII在噬菌体颗粒上展示(参看左面板的线4)。这是单价展示的表示。相反,实例2所述的GM-超辅助噬菌体展示系统产生了比游离pIII更多的AM1 scFv(参看左面板图11的线2)。在该scFv序列中的GABAB受体1的该适配器序列的包含物,和在GM-超辅助载体中的适配器序列GABAB受体2的结合增强了该成对相互作用。
实例4包含GMCT-超辅助噬菌体载体的适配器定向展示系统的制备A.GMCT-超辅助噬菌体载体的构建pABMC12载体是由载体pABMC6所构建,其中Not1-BglII片段是以含有编码序列的合成DNA片段来置换,该编码序列是用于Myc标记、基因III的CT区域(氨基酸217-405)、核糖体结合位点(RBS)和OmpA引导序列(图22A和B)。
通过以pABMC12载体所得的相关片段来置换在KO7kpn辅助载体中的KpnI/BamHI片段来构建GMCT超辅助噬菌体载体。所得GMCT超辅助噬菌体载体(图19A)对工程pIII衣壳的另外复制体进行编码,其包含GR2区域、myc标记序列(用于工程pIII蛋白质的探测)和pIII的CT区域。在该工程基因III的下游,来自于该细菌蛋白质OmpA的核糖体结合序列(RBS)和引导序列融合为由pAMBD1所获得的基因III序列。将含基因III的序列的两个复制体置于初始基因III促进剂(图19B所示)的控制下。进行噬菌体ELISA分析以筛选如实例3所述的噬菌体-阳性复制。已发现十分之三的复制体可以产生噬菌体颗粒。将克隆3用于大规模噬菌体制备。
B.GMCT超辅助噬菌体的产生根据如上所述的程序来进行噬菌体斑形成分析。所产生的用于GM-超辅助噬菌体的该噬菌体大约为8×10n/ml培养物,其与M13KO7和KO7kpn辅助噬菌体相似。GR2-Myc区域可由胰蛋白酶自噬菌体的表面移除。
C.用于显现抗原结合单元的GMCT-超辅助噬菌体的应用噬菌体中间载体pABMX14与GMCT超辅助(UltrHelperelper)噬菌体组合可用于噬菌体展示。将单链抗体AM1亚克隆至pABMX14载体(指pABMX14-AML)中。将PABMX14-AM1转变为TG1细胞,且以1或10或50或100感染复数(MOI)将该等细胞与GMCT-超辅助噬菌体双重感染。如实例1所述产生并净化噬菌体颗粒。使用以AM1抗原涂覆的板将展示于该噬菌体表面上的单链抗体以噬菌体ELISA来探测。第二抗体是HRP-共轭抗M13抗体。该ELISA结果证实由所有四个MOI感染所产生的噬菌体中间颗粒具有相似的与AM1-抗原结合的活性,其标志着单链抗体在该噬菌体表面(图20)上功能性展示。由携带pABMX14-AM1/M13KO7载体的TG1所产生的控制噬菌体中间不展现与AM1-抗原结合的可探测性。噬菌体颗粒亦用于免疫印记法分析。如图21所示,在与GMCT-超辅助噬菌体而不是M13KO7辅助噬菌体发生感染时,可展示该scFv抗体。
实例5展示期望的的经淘筛多肽的噬菌体的富集在用于产生可溶性多肽的pABMX14或pABMX15载体中可复制各种DNA序列。该表达文库可在与该超辅助噬菌体(用于pABMX14的GM和GMCT;用于pABMX15的CM)发生感染时用于展示编码多肽。展示于噬菌体上的该特定蛋白质或肽可由来自于各种文库的淘筛的几圈来富集。淘筛过程如下所述。简要地,在4℃过夜以在1-10ug/ml的浓度的特定抗原来涂覆96-井盘。在以PBS洗涤和以5%牛奶/PBS来阻断后,添加1011-12噬菌体且在室温下培养2小时。在以PBST和PBS所进行的几次洗涤后,以10ug/ml胰蛋白酶对结合噬菌体洗提30分钟,所有超辅助噬菌体具有融合为pIII蛋白质的可分裂的Myc-标记。在我们的实验中,胰蛋白酶洗提比100mM三乙胺(通常用于传统噬菌体淘筛)更有效。在重复几次该过程之后,展示期望的多肽的噬菌体可富集。
实例6细菌辅助载体的制备和应用A.表达载体和细菌辅助载体的构建通过以具有对GR1适配器和HA-标记进行编码的合成DNA片段置换在载体pABMD1(图22A)的HindIII位点和SalI位点之间的序列来构建表达载体pABMX22。如图25A所示,该载体含有抗氨必西林基因,该基因可用于抗生素选择(AMP)、质粒复制起点(ColE1 ori)、该f1噬菌体复制起点(f1 ori)和由下游序列plac-RBS-p8L-GR1-HA-标记的表达所获得的该lac促进剂/lac 01。MluI/XbaI或MluI/NotI或XbaI/NotI限制位点可用于在细菌细胞中插入用于可溶性蛋白质的展示或产生的外源性序列。完整的载体序列如图25B所示。
由来自于Stratagene的pBC-KS(+)载体来获得细菌辅助载体pABMbd-1(图26A用于载体图谱且图26B用于完整载体序列)。以合成的由在5′的MluI位点(具有可与BssHII相比的粘性末端)和在3′的BssHII位点来侧面相接的DNA片段来置换用于在pBC-KS(+)中的两个BssHII位点之间的多重复制位点的序列,该序列含有核多糖体结合序列RBS、pelB引导序列、用于嵌合外膜序列的编码序列,该外膜序列含有大肠杆菌主要外膜脂蛋白(Lpp)和初始9种氨基酸和外膜蛋白质OpmA的氨基酸46-159和适配器GR2序列。该lacZ促进剂可驱动Lpp-0mpA-GR2融合的表达,其将隐藏于细菌细胞的周质中间(periplasmid)中。pABMbd-1载体含有用于抗生素选择的抗氯霉素基因(Cam)、用于质粒复制的ColE1 ori起点和用于噬菌体中间包裹的该f1噬菌体复制起点(f1 ori)。
B.携带细菌辅助载体的噬菌体中间颗粒的产生将该pABMbd-1辅助载体转化为细菌TG1细胞。采集单一pABbd-1菌落且将其应用于培养具有50ug/ml氯霉素的15ml的2x YT培养物。在OD600达到0.8之后,在37℃由在MOI 10中的KO7Kpn辅助噬菌体对该细菌细胞感染1小时。将该感染TG1细胞在容纳500ml含有氯霉素和卡那霉素的2x YT的2升烧瓶中过夜培养。然后应用聚乙二醇(PEG)/NaCl将在上清液中的噬菌体中间颗粒沉淀,且在磷酸盐缓冲盐水(PBS)中再次悬浮。由测量OD268来测定该噬菌体中间载体浓度。然后将包裹pABMbd-1辅助载体的噬菌体中间颗粒用于适配器定向细菌展示。
C.用于展示抗原结合单元的细菌表达和辅助载体的应用在pABMX22载体中复制scFv抗体基因AM2。含有此表达载体的该TG1细菌细胞成长为OD600=0.8且与对细菌辅助载体pABMbd-1进行包裹的该噬菌体中间颗粒发生感染。在30℃时使含有表达载体和辅助载体的该TG1细胞在含有氨苄青霉素/凸轮的2x YT中过夜生长,然后采集并以PBS来洗涤。因为展示的蛋白质是以HA-标记来标记,所以抗HA标记抗体可用于探测在细菌表面上所展示的蛋白质。为了进行FACS分析试验,悬浮于PBS中的细胞首先以抗HA标记抗体来培养,然后以荧光素FITC-标签抗鼠抗体来培养。在以PBS来洗涤后,应用FACS分类器将以3-5×107/ml悬浮于PBS中的细胞以氢化荧光素强度基础来计数。ELISA分析亦用于探测在细菌表面上所展示的蛋白质。首先,在4℃过夜将AM2-抗原涂覆于ELISA板上。在以抗原培养2小时后,限制于ELISA板的该等细胞以如上所述的抗-HA抗体和HRP-共轭抗鼠抗体来探测。
在用于产生可溶性抗体片段的pABMX22载体中可复制各种抗体序列。在与包裹细菌辅助载体pABMbd-1的噬菌体中间颗粒发生感染时,此表达文库可用于产生选择性细菌展示文库。展示抗体的该细菌细胞与该FITC-标签抗原培养,且应用FACS分类器在荧光强度的基础上分类。分类之后,将选择的细胞在2x YT液体培养基中以AMP过夜生长。随后在新鲜介质中次培养该等细胞,且与用于展示的细菌辅助载体发生感染。然后将展示细胞用于另一次FACS分类选择。
实例7具有改性亲合力的抗原结合单元的繁殖和识别如上所注,本展示系统尤其适用于具有改性亲合力或特性的抗原结合单元的繁殖和识别。在各种所揭示的系统中,本适配器定向噬菌体展示系统提供用于筛选具有改性亲合力的抗原结合单元的坚固平台。
我们已选择设计现有抗原结合单元(即AM3 scFv抗体),其序列和相应抗原已经在先前有所描绘。该过程(下文指“抗体亲合力成熟”)开始产生以GMCT载体格式的AM3 ScFv抗体。AM3 scFv抗体的框架结构由VH和VL区域组成,每个区域在所述载体pABMX14(参看图9A)的相应位置处亚克隆。为了促进AM3抗体结合亲合力,将VH的CDR3构建为在多重位置含有氨基酸残基的各种代替的文库。该文库是通过在其两端的变质DNA寡接限制位点的标准有机合成来制备以影响在PCR放大和限制消化后在AM3 scFv基因中其位置处的亚克隆。该文库具有近似107(例如含有近似107AM3抗体变体)的多样性。在DNA结合后,将该文库在TG1组分细胞中电结合(electroporated)。然后通过GMCT超辅助噬菌体来收集和保护该转化株。随后如上述实例来收集该噬菌体颗粒。
为了筛选或“淘筛”所构建的适配器展示文库,我们首先在4℃过夜将重组体抗原固定在0.05M的NaHCO3(pH值为9.6的缓冲剂)中的Nunc Maxisorb96-井盘上。将含有1012个在PBS缓冲剂中以2%牛奶来稀释的噬菌体颗粒的文库噬菌体的等分试样添加于涂覆该抗原的井中。在37℃结合2小时以后,洗涤该井且根据本文所述方法来洗提噬菌体。将洗提的噬菌体用于感染TG1细胞,且然后由GMCT超辅助噬菌体来保护。在30℃过夜生长后,将该噬菌体在TG1细胞中放大且准备为另一次淘筛来采集。为了通过GMCT噬菌体文库来选择高亲合力结合剂,应用该文库对具有不同分裂条件的淘筛的所有多重连续圈来进行。
在最终淘筛之后,随机采集个别复制体且进一步通过应用相同重组体抗原的ELISA来分析。以96-井微量滴定盘的格式通过上述程序来执行ELISA。如图27所示,所有选择的复制体必定与该抗原进行反应(例如结合)。
然后随机采集在上述ELSIA中展示阳性反应性的该等复制体,将其用于排序且测定在VH的CDR3上的残基的位置,其中对许多代表性复制体进行处理以用于蛋白质表达。关于AM3抗体,所有scFv是通过由Invitrogen LifeTechnologies所述的Pichia表达系统来显现。根据Qiagen′s manual book将来自于培养物上清液的可溶性His-标记scFvs直接由Ni-NTA琼脂糖柱(2ml)来净化。自Ni-NTA柱中所洗提的萃取物的等分试样是通过SDS-PAGE和库马西蓝变来分析。如图28所示,作为主要蛋白质键的30KD scFv在萃取物#2和#3中探测。为了移除scFv和其它物质的同源二聚体,将萃取物#2和#3组合且进一步经受凝胶过滤色谱(HiLoad 16/60 Superdex 75柱,Amersham-pharmacia biotech)。
图29展示30KD单体scFv蛋白质与同源二聚体scFv和其它物质经由凝胶过滤色谱来良好分离。随后将净化的单体scFv蛋白质用于AM3抗体对于应用BiaCore(表面等离子体共鸣(surface plasmon resonance))来固定的蛋白质抗原的结合动力学进行分析。如图30所示,选自于该文库的所有四个AM3变体(X107,X110-112)与正常型相比展示明显较慢分裂速率(Koff)和较高的结合亲合力。例如用于X112的Koff是2.88X10-4S-1,且用于WT的Koff是2.77X10-3 S-1。该X112抗体与正常型抗体相比具有几乎10倍较慢的分裂速率。这些结果进一步证实本噬菌体适配器定向展示系统在抗体工程中的适用性和技术优越性。
序列表<110>阿布马科西斯公司<120>适配器定向显示系统<130>13403.0005.00PC00<140>未指定<141>2002-11-02<160>24<170>Patentln version 3.1<210>1<211>57<212>DNA<213>噬菌体M13<400>1gtgaaaaaat tattattcgc aattccttta gttgttcctt tctattctca ctccgct 57<210>2<211>19<212>PRT<213>噬菌体M13<400>2Val Lys Lys Leu Leu Phe Ala He Pro Leu Val Val Pro Phe Tyr Ser15 10 15His Ser Ala<210>3<211>57<212>DNA<213>噬菌体M13<400>3gtgaaaaaat tattattcgc aattccttta gtggtacctt tctattctca ctccgct57<210>4<211>222<212>DNA<213>模拟序列<220>
<223>包括噬菌体基因III引导序列、GABAB受体2区域和Myc区域的合成物<400>4ttagtggtac ctttctattc tcactccgct acatcccgcc tggagggcct acagtcagaa 60aaccatcgcc tgcgaatgaa gatcacagag ctggataaag acttggaaga ggtcaccatg 120cagctgcagg acgtcggagg ttgcgcggcc gcagaacaaa aactcatctc agaagaggat 180ctgagatctg gaggcggtac tgttgaaagt tgtttagcaa aa222<210>5<211>74<212>PRT<213>模拟序列<220>
<223>包括噬菌体基因III引导序列、GABAB受体2区域和Myc区域的合成物<400>5Leu Val Val Pro Phe Tyr Ser His Ser Ala Thr Ser Arg Leu Glu Gly15 10 15Leu Gln Ser Glu Asn His Arg Leu Arg Met Lys Ile Thr Glu Leu Asp20 25 30Lys Asp Leu Glu Glu Val Thr Met Gln Leu Gln Asp Val Gly Gly Cys35 40 45Ala Ala Ala Glu Gln Lys Leu He Ser Glu Glu Asp Leu Arg Ser Gly50 55 60Gly Gly Thr Val Glu Ser Cys Leu Ala Lys65 70<210>6<211>56<212>PRT<213>模拟序列<220>
<223>包括噬菌体基因III引导序列、GABAB受体2区域和Myc区域的合成物<400>6Thr Ser Arg Leu Glu Gly Leu Gln Ser Glu Asn His Arg Leu Arg Met1 5 10 15Lys Ile Thr Glu Leu Asp Lys Asp Leu Glu Glu Val Thr Met Gln Leu20 2530Gln Asp Val Gly Gly Cys Ala Ala Ala Glu Gln Lys Leu Ile Ser Glu35 4045Glu Asp Leu Arg Ser Gly Gly Gly50 55<210>7<211>3093<212>DNA<213>模拟序列<220>
<223>包括氨苄青霉素基因序列、ColE1复制起点、f1复制起点、Plac促进剂、GABAB受体1区域和组胺酸标记的合成物<400>7gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat60gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttaccg gttctttaag120gaggaattaa aaaatgaaat acctattgcc tacggcagcc gctggattgt tattactcgc180ggcccagccg gccatggcgg ccctgcaggc ctctagagcg gccgctggag gtgaggagaa240gtcccggctg ttggagaagg agaaccgtga actggaaaag atcattgctg agaaagagga300gcgtgtctct gaactgcgcc atcaactcca gtctgtagga ggttgtagat cttatccata360cgacgtacca gactacgcag gaggtcatca ccatcatcac cattaatgag tcgacctcga420ccaattcgcc ctatagtgag tcgtattaca attcactggc cgtcgtttta caacgtcgtg480actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca540
gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga600atggcgaatg ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc660gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt720cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag780ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt840cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt900tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt960cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt1020aacaaaaatt taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt1080tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta1140tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat1200gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt1260ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg1320agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga1380agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg1440tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt1500tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg1560cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg1620aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga1680tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc1740tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc1800ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc1860ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg1920cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac1980gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc2040actgattaag cattggtaac tgtcagacca agtttactra tatatacttt agattgattt2100aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac2160caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa2220aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc2280accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt2340aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg2400ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc2460agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt2520accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga2580gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct2640tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg2700cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca2760cctct9actt gagcgtcgat ttttgtgatg ctcgtcag9g gggcg9agcc tat9gaaaaa2820cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt2880ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga2940taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga3000gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca3060cgacaggttt cccgactgga aagcgggcag tga 3093<210>8
<211>192<212>DNA<213>噬菌体M13<400>8ttagtggtac ctttctattc tcactccgct taggcttgcg gtggtgcggc cgcagaacaa 60aaactcatct cagaagagga tctgagatct agatctggag gcggtactgt tgaaagttgt 120ttagcaaaac ctcatacaga aaattcattt actaacgtct ggaaagacga caaaacttta 180gatcgttacg ct 192<210>9<211>64<212>PRT<213>噬菌体M13<220>
<221>MISC_FEATURE<222>(11)..(11)<223>*=stop<400>9Leu Val Val Pro Phe Tyr Ser His Ser Ala * Ala Cys Gly Gly Ala1 5 10 15Ala Ala Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Arg Ser Arg Ser20 25 30Gly Gly Gly Thr Val Glu Ser Cys Leu Ala Lys Pro His Thr Glu Asn35 40 45Ser Phe Thr Asn Val Trp Lys Asp Asp Lys Thr Leu Asp Arg Tyr Ala50 55 60<210>10<211>2962<212>DNA<213>模拟序列<220>
<223>hemagglutinin tag包括氨苄青霉素基因序列、ColE1复制起点、f1复制起点、Plac促进剂、流感病毒血细胞凝集素标记的合成物<400>10gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat60gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttaccg gttcttttaa120ctttagtaag gaggaattaa aaaatgaaat acctattgcc tacggcagcc gctggattgt180tattactcgc ggcccagccg gccatggcgg ccctgcaggc ctctagagcg gccgcttacc240cgtacgacgt tccggactac gcaggtggct gctgataagt cgacctcgac caattcgccc300tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac360cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat420agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg480gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc540gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc600acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt660agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg720
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt780ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta840taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt900aacgcgaatt ttaacaaaat attaacgctt acaatttagg tggcactttt cggggaaatg960tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga10209acaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac1080atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc1140cagaaacgct ggtgaaagta aaagatgctg aagatca9tt gggtgcacga gtgggttaca1200tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc1260caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg1320ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac1380cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca1440taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg1500agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac1560cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg1620caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat1680taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg1740ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg1800cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc1860aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc1920attggtaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt1980tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt2040aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt2100gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag2160cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca2220gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca2280agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg2340ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg2400cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct2460acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga2520gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc2580ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg2640agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg2700cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt2760tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc2820gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac2880gcaaaccgcc tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc2940ccgactggaa agcgggcagtga 2962<210>11<211>903<212>DNA<213>噬菌体M13<400>11ttagtggtac ctttctattc tcactccgct acatcccgcc tggagggcct acagtcagaa60
aaccatcgcc tgcgaatgaa gatcacagag ctggataaag acttggaaga ggtcaccatg120cagctgcagg acgtcggagg ttgcgcggcc gcagaacaaa aactgatctc agaagaggat180ctgacgcgtg ctggcggcgg ctctggtggt ggttctggtg gcggctctga gggtggcggc240tctgagggtg gcggttctga gggtggcggc tctgagggtg gcggttccgg tggcggctcc300ggttccggtg attttgatta tgaaaaaatg gcaaacgcta ataagggggc tatgaccgaa360aatgccgatg aaaacgcgct acagtctgac gctaaaggca aacttgattc tgtcgctact420gattacggtg ctgctatcga tggtttcatt ggtgacgttt ccggccttgc taatggtaat480ggtgctactg gtgattttgc tggctctaat tcccaaatgg ctcaagtcgg tgacggtgat540aattcacctt taatgaataa tttccgtcaa tatttacctt ccctccctca atcggttgaa600tgtcgccctt ttgtctttgg cgctggtaaa ccatatgaat tttctattga ttgtgacaaa660ataaacttat tccgtggtgt ctttgcgttt cttttatatg ttgccacctt tatgtatgta720ttttctacgt ttgctaacat actgcgtaat aaggagtctt aataaggcgc gccacaattt780cacagtaagg aggtttaata aatgaaaaag acagctattg cgattgcagt ggcactggct840ggtttcgcta ccgtagcgca ggctagatct ggaggcggta ctgttgaaag tt9tttagca900aaa 903<210>12<211>287<212>PRT<213>噬菌体M13<400>12Leu Val Val Pro Phe Tyr Ser His Ser Ala Thr Ser Arg Leu Glu Gly1 5 1015Leu Gln Ser Glu Asn His Arg Leu Arg Met Lys Ile Thr Glu Leu Asp20 25 30Lys Asp Leu Glu Glu Val Thr Met Gln Leu Gln Asp Val Gly Gly Cys35 40 45Ala Ala Ala Glu Gln Lys Leu He Ser Glu Glu Asp Leu Thr Arg Ala50 55 60Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Glu Gly Gly Gly65 70 7580Ser Glu G1y Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser85 90 95Gly Gly Gly Ser Gly Ser Gly Asp Phe Asp Tyr Glu Lys Met Ala Asn100 105 110Ala Asn Lys Gly Ala Met Thr Glu Asn Ala Asp Glu Asn Ala Leu Gln115 120 125Ser Asp Ala Lys Gly Lys Leu Asp Ser Val Ala Thr Asp Tyr Gly Ala130 135 140Ala Ile Asp Gly Phe Ile Gly Asp Val Ser Gly Leu Ala Asn Gly Asn145 150 155 160Gly Ala Thr Gly Asp Phe Ala Gly Ser Asn Ser Gln Met Ala Gln Val165 170 175Gly Asp Gly Asp Asn Ser Pro Leu Met Asn Asn Phe Arg Gln Tyr Leu180 185 190
Pro Ser Leu Pro Gln Ser Val Glu Cys Arg Pro Phe Val Phe Gly Ala195 200 205Gly Lys Pro Tyr Glu Phe Ser Ile Asp Cys Asp Lys Ile Asn Leu Phe210 215 220Arg Gly Val Phe Ala Phe Leu Leu Tyr Val Ala Thr Phe Met Tyr Val225 230 235 240Phe Ser Thr Phe Ala Asn Ile Leu Arg Asn Lys Glu Ser Met Lys Lys245 250255Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala260 265270Gln Ala Arg Ser Gly Gly Gly Thr Val Glu Ser Cys Leu Ala Lys275 280 285<210>13<211>272<212>DNA<213>模拟序列<220>
<223>包括lac促进剂、噬菌体基因VIII引导序列、流感病毒血细胞凝集素标记和噬菌体基因III序列的合成物<400>13aattgtgagc ggataacaat ttaccggttc ttttaacttt agtaaggagg aattaaaaaa60tgaaaaagtc tttagtcctc aaagcctccg tagccgttgc taccctcgtt ccgatgctaa120gcttcgcttc tagagcggcc gcttatccat acgacgtacc agactacgca ggaggtcatc180accatcatca ccattagaga tctggaggcg gtactgttga aagttgttta gcaaaagcta240acatactgcg taataaggag tcttaagtcg ac 272<210>14<211>69<212>PRT<213>模拟序列<220>
<223>包括流感病毒血细胞凝集素标记、组胺酸标记和噬菌体基因III序列的合成物<220>
<221>MISC_FEATURE<222>(46)..(69)<223>*=stop<400>14Met Lys Lys Ser Leu Val Leu Lys Ala Ser Val Ala Val Ala Thr Leu1 510 15Val Pro Met Leu Ser Phe Ala Ser Arg Ala Ala Ala Tyr Pro Tyr Asp20 25 30Val Pro Asp Tyr Ala Gly Gly His His His His His His Xaa Arg Ser35 4045Gly Gly Gly Thr Val Glu Ser Cys Leu Ala Lys Ala Asn Ile Leu Arg50 55 60Asn Lvs Glu Ser*65<210>15<211>146<212>DNA<213>Homo Sapien<400>15
tctagaggtg gaggaggtga ggagaagtcc cggctgttgg agaaggagaa ccgtgaactg60gaaaagatca ttgctgagaa agaggagcgt gtctctgaac tgcgccatca actccagtct120gtaggaggtt gttaataggg cgcgcc 146<210>16<211>44<212>PRT<213>Homo Sapien<400>16Ser Arg Gly Gly Gly Gly Glu Glu Lys Ser Arg Leu Leu Glu Lys Glu1510 15Asn Arg Glu Leu Glu Lys Ile He Ala Glu Lys Glu Glu Arg Val Ser20 25 30Glu Leu Arg His Gln Leu Gln Ser Val Gly Gly Cys35 40<210>17<211>140<212>DNA<213>Homo Sapien<400>17tctcgaggag gtggtggaac atcccgcctg gagggcctac agtcagaaaa ccatcgcctg60cgaatgaaga tcacagagct ggataaa9ac ttggaagagg tcaccatgca gctgcaggac120gtcggaggtt gcgcggccgc140<210>18<211>47<212>PRT<213>Homo Sapien<400>18Ser Arg Gly Gly Gly Gly Thr Ser Arg Leu Glu Gly Leu Gin Ser Glu1 5 1015Asn His Arg Leu Arg Met Lys He Thr Glu Leu Asp Lys Asp Leu Glu20 25 30Glu Val Thr Met Gln Leu Gln Asp Val Gly Gly Cys Ala Ala Ala35 40 45<210>19<211>32<212>DNA<213>噬菌体M13<400>19tttagtggta cctttctatt ctcactccgc tg 32<210>20<211>32<212>DNA<213>噬菌体M13<400>20tagaaaggta ccactaaagg aattgcgaat aa 32<210>21<211>55
<212>DNA<213>模拟序列<220>
<223>合成引物<400>21ggaattgtga gcggataaca atttaccggt cacacaggaa acagctatga ccatg55<210>22<211>55<212>DNA<213>模拟序列<220>
<223>合成引物<400>22catggtcata gctgtttcct gtgtgaccgg taaattgtta tccgctcaca attcc55<210>23<211>3057<212>DNA<213>模拟序列<220>
<223>包括氨苄青霉素基因序列、ColE1复制起点、f1复制起点、lac促进剂、GABAB受体1区域和流感病毒血细胞凝集素标记的合成物<400>23gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat60gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttaccg gttctttaag120gaggaattaa aaaatgaaaa agtctttagt cctcaaagcc tccgtagccg ttgctaccct180cgttccgatg ctaagcttcg ctggtgagga aaagtcccgt ctgctggaga aagagaaccg240tgaactggaa aagatcattg ctgagaaaga ggagcgtgtt tctgaactgc gccatcaact300gcagtctgta ggcggttgca cgcgttctag agcggccgct tacccgtacg acgttccgga360ctacgcatga taagtcgacc tcgaccaatt cgccctatag tgagtcgtat tacaattcac420tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc480ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc540cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa600gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc660ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag720ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca780aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc840gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa900cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct960attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa1020cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt1080tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca1140ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt1200ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga1260tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa1320
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 1380gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 1440acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 1500tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 1560caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 1620gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 1680cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 1740tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 1800agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 1860tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 1920ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 1980acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 2040ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 2100gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 2160gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2220ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 2280gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 2340ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 2400cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 2460cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 2520ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 2580tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 2640cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 2700ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 2760aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 2820ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 2880tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 2940gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 3000gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtga 3057<210>24<211>3817<212>DNA<213>模拟序列<220>
<223>包括Cam基因序列、ColE1复制起点、f1复制起点、lac促进剂、GABAB受体2区域和Lpp-OmpA基因序列的合成物<400>24gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat 60gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 120ctatgaccat gattacgcca agcgcgttta actttagtaa ggaggaatta aaaaatgaaa 180tacctgctgc cgaccgcagc cgcgggtttg ctgttactgg cggcccagcc ggctatggcg 240atgaaagcta ctaaactggt actgggcaac ccgtatgttg gctttgaaat gggttacgac 300tggttaggtc gtatgccgta caaaggcagc gttgaaaacg gtgcatacaa agctcagggc 360gttcaactga ccgctaaact gggttaccca atcactgacg acctggacat ctacactcgt 420
ctgggtggca tggtatggcg tgcagacact aaatccaacg tttatggtaa aaaccacgac480accggcgttt ctccggtctt cgctggcggt gttgagtacg cgatcactcc tgaaatcgct540acccgtctgg aataccagtg gacgaacaac atcggtgacg cacacaccat cggcactcgt600ccggacggag gtacatcccg cctggagggc ctacagtcag aaaaccatcg cctgcgaatg660aagatcacag agctggataa agacttggaa gaagtcacca tgcagctgca agacgttggc720ggttgctaat gagcgcgctc actggccgtc gttttacaac gtcgtgactg ggaaaaccct780ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc840gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatgggac900gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct960acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg1020ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt1080gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca1140tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga1200ctcttgttcc aaactggaac aacactcaac cctatctc9g tctattcttt tgatttataa1260gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac1320gcgaatttta acaaaatatt aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc1380gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac1440aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt1500tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag1560aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg1620aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa1680tgatgagcac ttttcgaccg aataaatacc tgtgacggaa gatcacttcg cagaataaat1740aaatcctggt gtccctgttg ataccgggaa gccctgggcc aacttttggc gaaaatgaga1800cgttgatcgg cacgtaagag gttccaactt tcaccataat gaaataagat cactaccggg1860cgtatttttt gagttgtcga gattttcagg agctaaggaa gctaaaatgg agaaaaaaat1920cactggatat accaccgttg atatatccca atggcatcgt aaagaacatt ttgaggcatt1980tcagtcagtt gctcaatgta cctataacca gaccgttcag ctggatatta cggccttttt2040aaagaccgta aagaaaaata agcacaagtt ttatccggcc tttattcaca ttcttgcccg2100cctgatgaat gctcatccgg aattacgtat ggcaatgaaa gacggtgagc tggtgatatg2160ggatagtgtt cacccttgtt acaccgtttt ccatgagcaa actgaaacgt tttcatcgct2220ctggagtgaa taccacgacg atttccggca gtttctacac atatattcgc aagatgtggc2280gtgttacggt gaaaacctgg cctatttccc taaagggttt attgagaata tgtttttcgt2340ctcagccaat ccctgggtga gtttcaccag ttttgattta aacgtggcca atatggacaa2400cttcttcgcc ccgttttcac catgggcaaa tattatacgc aaggcgacaa ggtgctgatg2460ccgctggcga ttcaggttca tcatgccgtt tgtgatggct tccatgtcgg cagaatgctt2520aatgaattac aacagtactg cgatgagtgg cagggcgggg cgtaattttt ttaaggcagt2580tattggtgcc cttaaacgcc tggttgctac gcctgaataa gtgataataa gcggatgaat2640ggcagaaatt cgaaagcaaa ttcgacccgg tcgtcggttc agggcagggt cgttaaatag2700ccgcttatgt ctattgctgg tttaccggtt tattgactac cggaagcagt gtgaccgtgt2760gcttctcaaa tgcctgaggc cagtttgctc aggctctccc cgtggaggta ataattgacg2820atatgatcct ttttttctga tcaaaaagga tctaggtgaa gatccttttt gataatctca2880tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga2940tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa3000aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga3060
aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt3120taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt3180taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat3240agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct3300tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca3360cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag3420agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc3480gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga3540aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca3600tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag3660ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg3720aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct3780ggcacgacag gtttcccgac tggaaagcgg gcagtga 381权利要求
1.一种用于在基因包装的外表面上展示外源性多肽的适配器定向展示系统,其包含(a)包含编码序列的表达载体,该编码序列可对在框架内融合为第一适配器的外源性多肽进行编码,其中该载体缺乏对该基因包装的任何功能性外表面蛋白质进行编码的外表面序列;(b)包含外表面序列的辅助载体,该外表面序列可对包裹该基因包装所必需的外表面蛋白质进行编码,其中至少一个该外表面蛋白质在框架内融合为第二适配器,在合适的宿主细胞中产生多肽时,所述第一和第二适配器起作用以使得多肽经由第一和第二适配器之间的成对相互作用来展示。
2.如权利要求1所述的适配器定向展示系统,其中该系统是噬菌体展示系统。
3.如权利要求1所述的适配器定向展示系统,其中该系统是细菌展示系统。
4.如权利要求1所述的适配器定向展示系统,其中该基因包装选自病毒、细胞和孢子。
5.如权利要求2所述的适配器定向展示系统,其中外表面序列对噬菌体的功能性外壳蛋白质进行编码。
6.如权利要求2所述的适配器定向展示系统,其中噬菌体是丝状噬菌体。
7.如权利要求2所述的适配器定向展示系统,其中该外表面序列选自丝状噬菌体的基因III、基因VI、基因VII、基因VIII和基因IX。
8.如权利要求3所述的适配器定向展示系统,其中该外表面序列对细菌外表面蛋白质进行编码。
9.如权利要求3所述的适配器定向展示系统,其中该细菌外表面蛋白质选自Lpp-OmpA、TraT、Pal、Oprl、Inp和AIDA-I。
10.如权利要求1所述的适配器定向展示系统,其中该第一和第二适配器是同源二聚序列。
11.如权利要求1所述的适配器定向展示系统,其中该同源二聚序列由一对半胱氨酸残基组成。
12.如权利要求1所述的适配器定向展示系统,其中该第一和第二适配器是异源二聚序列。
13.如权利要求1所述的适配器定向展示系统,其中该第一和第二适配器形成卷曲螺旋二聚体。
14.如权利要求13所述的适配器定向展示系统,其中该第一和第二适配器是亮氨酸拉链。
15.如权利要求13所述的适配器定向展示系统,其中该第一和第二适配器包含可调节该受体的异源二聚的异源二聚受体序列。
16.如权利要求13所述的适配器定向展示系统,其中该第一和第二适配器分别包含GABAB受体1和GABAB受体2的异源二聚序列。
17.如权利要求13所述的适配器定向展示系统,其中该第一和第二适配器分别包含GABAB受体2和GABAB受体1的异源二聚序列。
18.如权利要求1所述的适配器定向展示系统,其中该辅助载体进一步包含外表面序列的至少一个另外复制,该外表面序列与(b)中的融合外表面序列竞争包裹。
19.如权利要求2所述的适配器定向展示系统,其中该表达载体选自图9A中所示的pABMX14和图15A中所示的pABMX15。
20.如权利要求2所述的适配器定向展示系统,其中该噬菌体辅助载体选自图5A中所示的GM-超辅助噬菌体载体、图13A中所示的CM-超辅助噬菌体载体和图19A中所示的GMCT-超辅助噬菌体载体。
21.一种用于在基因包装的外表面上展示多肽的辅助载体,其包含对该基因包装进行包裹所必需的外表面序列,其中至少一个该表面呈现序列在框架内融合为适配器,在合适的宿主细胞中产生多肽时,该适配器起作用以引起该多肽的展示。
22.如权利要求21所述的辅助载体,其中该载体是噬菌体辅助载体。
23.如权利要求21所述的辅助载体,其中该载体是细菌辅助载体。
24.如权利要求21所述的辅助载体,其中该基因包装选自病毒、细胞和孢子。
25.如权利要求22所述的辅助载体,其中该外表面序列对噬菌体的功能性外壳蛋白质进行编码。
26.如权利要求22所述的辅助载体,其中该噬菌体是丝状噬菌体。
27.如权利要求22所述的辅助载体,其中该外表面序列选自丝状噬菌体的基因III、基因VI、基因VII、基因VIII和基因IX。
28.如权利要求23所述的辅助载体,其中该外表面序列对细菌外表面蛋白质进行编码。
29.如权利要求23所述的辅助载体,其中该细菌外表面蛋白质选自Lpp-OmpA、TraT、Pal、Oprl、Inp和AIDA-I。
30.如权利要求21所述的辅助载体,其中由多肽在框架内融合的该适配器经由与第二适配器的成对相互作用来引起该多肽的展示。
31.如权利要求21所述的辅助载体,其中该适配器在不存在外表面蛋白质表达的情况下经由噬菌体中间载体或质粒来引起该多肽的展示。
32.如权利要求21所述的辅助载体,其中两个适配器是异源二聚序列。
33.如权利要求21所述的辅助载体,其中两个适配器是同源二聚序列。
34.如权利要求21所述的辅助载体,其中两个适配器是同源二聚序列。
35.如权利要求34所述的辅助载体,其中该同源二聚序列是由一对半胱氨酸残基组成。
36.如权利要求32所述的辅助载体,其中两个适配器形成卷曲螺旋二聚体。
37.如权利要求36所述的辅助载体,其中两个适配器是亮氨酸拉链。
38.如权利要求36所述的辅助载体,其中两个适配器包含可调节该受体的异源二聚的异源二聚受体序列。
39.如权利要求36所述的辅助载体,其中两个适配器分别包含GABAB受体1和GABAB受体2的异源二聚序列。
40.如权利要求36所述的辅助载体,其中该两个适配器分别包含GABAB受体2和GABAB受体1的异源二聚序列。
41.一种用于在基因包装中或在其外表面上产生多肽的表达载体,其包含对在框架内融合为第一适配器的多肽进行编码的编码序列,其中该载体缺乏对该基因包装的任何功能性外表面蛋白质进行编码的外表面序列,且在该基因包装外表面上的多肽表达是经由第一和第二适配器之间的非共价成对相互作用来调节,其中第二适配器融合为外表面蛋白质。
42.如权利要求41所述的表达载体,其中该载体是噬菌体中间载体。
43.如权利要求41所述的表达载体,其中该载体是细菌表达载体。
44.如权利要求41所述的表达载体,其中该基因包装选自病毒、细胞和孢子。
45.如权利要求41所述的表达载体,其中该外表面序列是噬菌体外壳-编码基因序列。
46.如权利要求41所述的表达载体,其中该外表面序列对细菌外表面蛋白质进行编码。
47.如权利要求41所述的表达载体,其中第一和第二适配器是同源二聚序列。
48.如权利要求41所述的表达载体,其中第一和第二适配器是异源二聚序列。
49.如权利要求41所述的表达载体,其中第一和第二适配器形成卷曲螺旋二聚体。
50.如权利要求49所述的表达载体,其中第一和第二适配器是亮氨酸拉链。
51.如权利要求41所述的表达载体,其中第一和第二适配器包含对该受体的异源二聚进行调节的异源二聚受体。
52.如权利要求51所述的表达载体,其中第一和第二适配器分别包含GABAB受体1和GABAB受体2的异源二聚序列。
53.如权利要求51所述的表达载体,其中第一和第二适配器分别包含GABAB受体2和GABAB受体1的异源二聚序列。
54.一种在合适的基因包装中的试剂盒,其包含如权利要求1所述的适配器定向展示系统。
55.一种在合适的基因包装中的试剂盒,其包含如权利要求21所述的辅助载体。
56.一种在合适的基因包装中的试剂盒,其包含如权利要求41所述的表达载体。
57.一种宿主细胞,其包含如权利要求1所述的适配器定向展示系统。
58.一种宿主细胞,其包含如权利要求21所述的辅助载体。
59.一种宿主细胞,其包含如权利要求41所述的表达载体。
60.一种用于在基因包装的外表面上展示多肽的方法,其包含在合适的宿主细胞中转录和翻译如权利要求1所述的适配器定向展示系统。
61.一种根据权利要求60所述方法在基因包装的外表面上展示的多肽。
62.一种在其外表面上展示融合多肽的基因包装,该融合多肽包含一待展示且在框架内由第一适配器融合的多肽序列,在合适的宿主细胞中产生该融合多肽时,第一适配器起作用以经由该第一适配器和连接至外表面蛋白质的第二适配器之间的非共价成对相互作用来展示该融合多肽。
63.如权利要求62所述的基因包装,其中该基因包装选自病毒、细胞和孢子。
64.一种选择性文库,其包含多个基因包装,至少一个基因包装是如权利要求63所述的基因包装。
65.一种选择性文库,其包含多个基因包装,其中至少一项是根据权利要求60所述方法在其外表面上展示多肽。
66.一种探测测试剂和在基因包装上所展示的外源性多肽之间的特定相互作用的存在的方法,该方法包含(a)提供根据权利要求60所述方法所制备的展示该外源性多肽的基因包装;(b)在适于产生稳定多肽-剂络合物的条件下将该基因包装与该测试剂接触;和(c)探测该稳定多肽-剂络合物在该基因包装上的形成,从而探测特定相互作用的存在。
67.如权利要求66所述的方法,其中该外源性多肽选自抗原结合单元、细胞表面受体、受体配位体、细胞固定蛋白质、分泌蛋白质和核蛋白质。
68.如权利要求66所述的方法,其中该外源性多肽是抗原结合单元。
69.如权利要求66所述的方法,其中该测试剂选自蛋白质、多糖、脂类和其组合。
70.如权利要求66所述的方法,其中该测试剂是抗原。
71.如权利要求66所述的方法,其中该测试剂是配位体。
72.一种获得具有期望的特性的多肽的方法,其包含(a)提供如权利要求65所述的选择性文库;和(b)筛选该选择性文库以获得至少一个展示具有期望的特性的多肽的基因包装。
73.如权利要求72所述的方法,其中期望的特性是对于所关心试剂的结合特性。
74.如权利要求72所述的方法,其中筛选该选择性文库进一步包含将展示具有期望的特性的多肽的该基因包装分离。
75.如权利要求72所述的方法,其中分离该基因包装进一步包含由对具有期望的特性的该多肽进行编码的该基因包装获得核苷酸序列。
76.如权利要求72所述的方法,其中具有期望的特性的多肽选自抗原结合单元、细胞表面受体、受体配位体、细胞固定蛋白质、分泌蛋白质和核蛋白质。
全文摘要
本发明提供适配器定向展示系统(adapter-directed display system),其是用于在宿主细胞中显现外源性多肽和/或在基因包装的外表面上展示外源性多肽。本系统尤其适用于展示单体和多元体多肽的遗传多样性清单(repertoire)。本发明亦提供表达载体、辅助载体和包含本展示系统的组分的试剂盒。本发明亦提供可展示所特别关心的外源性多肽的基因包装。本发明进一步提供应用本展示系统的方法。
文档编号C12N15/09GK1630722SQ02821950
公开日2005年6月22日 申请日期2002年11月1日 优先权日2001年11月2日
发明者王采力, 钟平宇, 王新伟 申请人:阿布马科西斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1