噬菌体展示多肽的选择性翻译后修饰的制作方法

文档序号:432744阅读:366来源:国知局
专利名称:噬菌体展示多肽的选择性翻译后修饰的制作方法
技术领域
本发明涉及蛋白质化学领域,例如翻译生物化学(translation biochemistry) 领域。本发明涉及制备噬菌体的组合物和方法,所述噬菌体包含具有非天然氨 基酸的展示多肽,而该非天然氨基酸可用作选择性共价翻译后修饰的靶点,从 而得到翻译后修饰的噬菌体。
背景技术
在历史上,对蛋白质结构和功能的研究依赖于利用天然氨基酸反应性 基团的可用反应化学方法。不幸的是,从细菌到人类的每种已知生物编码 相同的二十种常见氨基酸编码的(罕见的例外是硒代半胱氨酸(参见,例如, A.Bock等,(1991), Molecular Microbiology 5: 515-20)和吡咯赖氨酸(参见, 例如,G.Srinivasan等,(2002), Science 296: 1459-62)。 R-基团选择的限制 性约束了对蛋白质结构和功能的研究,即天然氨基酸的化学特性限制了所 述研究。
天然氨基酸数量有限约束了进行高度靶向的翻译后蛋白质修饰而排除(exclusion)蛋白质中所有其它氨基酸的能力。本领域目前使用的大多数修饰
反应涉及在亲核和亲电子反应伴侣之间形成耙向蛋白质氨基酸侧链中天然
产生的亲核残基的共价键,例如,a-卤代酮与组氨酸或半胱氨酸侧链的反
应。在这些情况中,选择性由蛋白质中亲核残基的数目和可接近性决定。 不幸的是,天然产生的蛋白质通常含有弱定位的(例如,不可接近的)反应位 点或多个反应靶点(例如,赖氨酸、组氨酸和半胱氨酸残基),导致修饰反应 的选择性不佳、难以利用亲核/亲电子试剂进行高度耙向的修饰。此外,修 饰位点通常局限于赖氨酸、组氨酸或半胱氨酸的天然产生的亲核侧链。在 其它位点进行修饰困难或不可能。
现已尝试了用合成试剂和探针选择性修饰蛋白质,和将蛋白质共价连接于
表面的其它方法。这些方法包括半合成(Muir, 万/oc/zem. 2003, 72,
249-289)、利用选择性标记半胱氨酸和赖氨酸残基的亲电试剂(Chilkoti等, 5/oc,'wg她CTzem. 1994, 5, 504-507; Rosendahl等,5/oco"乂wgafe CTzem. 2005, /<5, 200-207)和利用化学方法氨酰化的tRNA通过体外生物合成将含有反应性 侧链的氨基酸引入蛋白质(Bain等,J爿肌C/ em. Soc. 1989,川,8013-8014; Ellman等,M"/w&五"2ymo/. 1991, 202, 301-336)。各方法的缺点在于缺乏耙 标特异性或其它的不实用性。
克服现有遗传学成分有限的方案之一是将具有不同化学特性的氨基酸加 入遗传密码中。利用诸如真细菌大肠杆菌(五乂0//)等宿主细胞的体内蛋白质生物 合成机制,用"正交"tRNA分子和相应的新型"正交"氨酰-tRNA合成酶将 非天然氨基酸加入蛋白质证明此方法可行。该方法描述于各种资料,例如,Chin 等,5We"ce (2003) 301:964-967; Zhang等,Jc"d [/JJ, 2004, /W:8882-8887; Anderson等,Prac.廳,2004,雄7566陽7571; Wang等,(2001) Science 292:498-500; Chin等,(2002) Journal of the American Chemical Society 124:9026-9027; Chin禾口 Schultz , (2002) ChemBioChem 11:1135-1137; Chin等,(2002) PNAS United States of America 99:11020-11024; Wang和Schultz, (2002) Chem. Comm., 1-10; Wang和Schultz,"遗传密码的 孝广展"(Expanding the Genetic Code), y4"gew "cfte C/zemz.e 五c ., 44(l):34-66(2005); Xie禾B Schultz,"扩展的遗传密码"(An Expanding Genetic Code), Melody 36:227-238 (2005)。也可参见名为"产生正交tRNA-氨酰-tRNA合成酶 对的方法和组合物"(METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL TRNA-AMINOACYL TRNA SYNTHETASE PARIS)的国际公开WO 2002/086075;名为"非天然氨基酸的
WO 2002/085923 ;名为"扩展真核遗传密码"(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO 2004/094593; 2004年7月7日提交的 WO 2005/019415; 2004年7月7日提交的WO 2005/007870;和2004年7月7 日提交的WO 2005/007624;和2005年9月20日提交的国际公布号 WO2006/034332。
噬菌体展示技术是已发现可应用于各种生物学科的可扩展且广泛使用的 技术。参见,例如Smith和Petrenko, C/zem. i ev., 97:391-410 (1997); Sidhu, 说7no/ecw/or18:57-63 (2001); Rodi禾口 Makowski, Cwrewf O/n.m.o" /" 伤ofec/mo/ogv 10:87-93 (1999);和Willats,尸/a^ Mo/ecw/w 5"/ogy 50:837-854 (2002)。例如,已证实噬菌体展示对于从多肽大文库中分离高亲和力配体和受 体非常有用。其优点在于通过重组方法可方便地产生大文库,可反复扩增文库 成员使之富集,通过DNA测序能测定一级结构。然而,与蛋白质相似,噬菌 体展示的肽文库通常也局限于常见的20种氨基酸构建区段,从而限制了翻译 后修饰可靶向的官能团。此外,翻译后修饰噬菌体展示多肽的方法提出了甚至 更高的挑战,在该方法中修饰反应采用能维持蛋白质活性和噬菌体活力的生理 相容条件(Leieux和Bertozzi (1998) 7Y57EC7/, M:506)。
在扩大噬菌体展示应用范围的尝试中,Noren及其同事利用天然硒代半胱 氨酸乳白抑制型tRNA将硒代半胱氨酸掺入噬菌体展示的肽(Sandman等,J ^肌 C/zem. (2000) 122:960-961)。 Roberts等试图用化学氨基酰化的琥珀抑制型 tRNA(Noren等,Sc/ewce (1989) 244:182-188)将该方法推广至利用体外mRNA 展示的含其它非天然氨基酸的肽文库(Li等, / C/ze脱&c, , (2002) 124:9972)。然而,产生大量这种tRNA不实际,并且它们按化学计量使用。为修饰和研究蛋白质结构和功能,本领域需要将非天然氨基酸掺入噬菌体 展示多肽的新方案,其中所展示多肽中的非天然氨基酸在展示于噬菌体上的同 时可以选择性靶向以进行翻译后修饰。本领域需要开发蛋白质修饰反应的新方 案,该方案能以高度选择性方式修饰噬菌体所展示的蛋白质,此外应使得对噬 菌体所展示蛋白质的修饰能在修饰反应后维持噬菌体活力的生理条件下进行。 本领域需要能在噬菌体所展示蛋白质上产生耙向蛋白质修饰的新方法,其中所 述修饰是高度特异性的,例如多肽中的天然氨基酸无一经历交叉反应或副反应 的修饰。阅读下文可明白本文所述的发明满足了这些及其它需要。
发明概述
本领域需要能以高度选择性方式修饰蛋白质,例如噬菌体所展示蛋白质的 化学反应。本领域目前采用的选择性修饰蛋白质的大多数反应选择性不佳且局 限于天然氨基酸残基。本发明提供了这些问题的解决方法。
本发明提供将非天然氨基酸程序性、位点特异性地生物合成掺入噬菌体所 展示蛋白质中的系统,该系统通过操纵正交翻译系统使之与重组噬菌体表达试 剂联合起作用。本发明提供随后靶向修饰掺入噬菌体展示多肽中的那些非天然 氨基酸残基的方法。本发明提供用于产生翻译后修饰的噬菌体的新组合物(例 如,包含各种翻译后修饰的噬菌体)和新方法。
本文提供的噬菌体生产系统所利用的正交翻译系统利用大肠杆菌宿主细 胞将非天然氨基酸选择性掺入噬菌体展示的多肽中,随后通过选择性修饰该非 天然氨基酸残基来修饰那些多肽。证明了修饰噬菌体展示多肽中的非天然氨基
酸残基的各种化学方法,包括[3+2]环加成反应和施陶丁格(Staudinger)连 接。通过非天然氨基酸耙标与噬菌体所展示蛋白质偶联的物质的性质不作 具体限定,可以是任何所需的实体。
本发明提供展示融合多肽的噬菌体,其中所述多肽包含至少一个翻译后修 饰的非天然氨基酸残基。各种反应性非天然氨基酸可用于所展示的多肽中。例 如,所述非天然氨基酸可以是芳基-叠氮化物非天然氨基酸(如对-叠氮基-L-苯丙 氨酸)或炔基非天然氨基酸(如对-炔丙基氧苯丙氨酸(para-propargyloxyphenylalanine^所述噬菌体可以是丝状噬菌体,例如M13-衍生的噬菌体。
噬菌体展示的多肽通常是含有噬菌体衣壳蛋白质(或其一部分或变体)和 感兴趣氨基酸序列的融合多肽。在一些实施方式中,将融合多肽设计成掺入了 位点特异性蛋白酶,例如凝血因子Xa、凝血因子XIa、激肽释放酶(Kallikvein)、 凝血酶、凝血因子XIIa、胶原酶或肠激酶能特异性切割的肽接头蛋白酶识别 序列。
采用各种类型的修饰反应来修饰含有非天然氨基酸的噬菌体展示多肽。例 如,可采用叠氮化物-炔[3+2]环加成反应(产生三唑连接键)或施陶丁格连 接反应。因为芳基-叠氮化物和炔基非天然氨基酸的独特反应化学性质,可 以极高的选择性修饰其所掺入的噬菌体展示的蛋白质。在一些情况中,非 天然氨基酸反应基团的优点在于就体内系统而言完全是外来的,从而能提 高反应选择性。采用施陶丁格反应维持病毒感染力是有利的。
可任选将本发明修饰的噬菌体固定于固体支持物上。在一些实施方式中, 噬菌体包含噬菌体多肽文库,其中该噬菌体表达了多种多肽。噬菌体的这种多 元性(plurality)也是本发明的特征之一。可以纯化或分离本发明噬菌体。
在其它实施方式中,本发明提供产生上述翻译后修饰的噬菌体的方法。这 些方法的步骤一般包括(a)提供包含所展示多肽的噬菌体,所述多肽含有至 少一个非天然氨基酸残基,所述残基是芳基-叠氮化物非天然氨基酸残基(如对-
叠氮基-L-苯丙氨酸)或炔基非天然氨基酸(如对-炔丙基氧苯丙氨酸);和(b)使所 述噬菌体在所述非天然氨基酸残基经历共价修饰的条件下反应,从而产生翻译 后修饰的噬菌体。这些修饰反应可采用叠氮化物-炔[3+2]环加成反应或施陶 丁格连接反应。当采用施陶丁格修饰反应时,得到的修饰噬菌体可以是有 活力的病毒体。
更具体地说,可通过以下步骤提供未修饰的噬菌体(i)提供真细菌宿主 细胞,其包含(A)编码该噬菌体的核酸分子,其中编码感兴趣的融合多肽的多 核苷酸部分包含至少一个选择者密码子(selector codon); (B)在所述宿主细胞 中编码正交氨酰-tRNA合成酶(O-RS)的核酸分子;(C)在宿主细胞中编码正交 tRNA (O-tRNA)的核酸分子,其中所述O-RS在宿主细胞中用非天然氨基酸优先氨基酰化O-tRNA,并且所述O-tRNA识别所述选择者密码子;和(D)芳基-叠氮化物或炔基非天然氨基酸;和(ii)培养该宿主细胞,从而产生所述多核苷 酸亚序列编码的多肽,其中芳基-叠氮化物或炔基非天然氨基酸在翻译过程对 选择者密码子起反应而掺入该多肽,并产生包含所述多核苷酸亚序列编码的多 肽的噬菌体,其中芳基-叠氮化物或炔基非天然氨基酸掺入所述多肽。在一些 方面,还提供了大肠杆菌宿主细胞。
这些方法所用的正交tRNA及合成酶不作具体限定。在一些实施方式中, 宿主细胞包含编码衍生自詹氏甲烷球菌(Mer/za"ococcw /fl"Masc/n7)氨酰 -tRNA合成酶,例如詹氏甲烷球菌酪氨酰-tRNA合成酶的O-RS。在一些实 施方式中,所用的O-tRNA是琥珀抑制型tRNA。
还有其它实施方式涵盖了可用其它非天然氨基酸靶向噬菌体以进行翻译 后修饰,其中利用包含抑制型tRNA和突变合成酶的正交翻译系统将该非天然 氨基酸掺入噬菌体。
在一些方面,所包含的多肽含有至少一个翻译后修饰的非天然氨基酸 残基的任何噬菌体是本发明的噬菌体,其中所述至少一个非天然氨基酸残 基能进行靶向共价修饰。在一些方面,噬菌体在翻译后修饰后是有活力的。 可以此方式掺入噬菌体的反应性氨基酸可以包括对-炔丙基氧苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-乙酰基-L-苯丙氨酸、间-乙酰基-L-苯丙氨酸、对-(3-氧代丁酰基)-L-苯丙氨酸、对-(2-氨基-l-羟乙基)-L-苯丙氨酸、对-异丙基硫 代羰基-L-苯丙氨酸和对-乙基硫代羰基-L-苯丙氨酸。
定义
在详细描述本发明前,应该知道本发明不局限于具体的生物系统,本 发明当然可以有各种变化。还应知道本文所用的术语只是为了描述具体的 实施方式,而非限制性的。除非另有明确指出,本说明书和随附的权利要 求书中使用的单数形式"一个"、"一种"和"该"也包括复数对象。因 此,例如述及"一个细胞"包括两个或多个细胞的组合;"一个多核苷酸" 实际上包括该多核苷酸的多份拷贝。除了此处和以下说明书的其余部分所定义的,本文所用的所有技术和 科学术语都与本发明所属领域普通技术人员常规理解的意义相同。
正交:本文所用的术语"正交"指与某细胞或翻译系统的内源性相应分
子相比,某分子(例如,正交tRNA(0-tRNA)和/或正交氨酰tRNA合成酶(O-RS)) 与该细胞内源性组分起作用的效率降低,或不能与该细胞的内源性组分起作 用。就tRNA和氨酰-tRNA合成酶而言,正交指与和内源性tRNA合成酶起作 用的内源性tRNA相比,正交tRNA不能与内源性tRNA合成酶起作用或起作 用的效率降低;或者与和内源性tRNA起作用的内源性tRNA合成酶相比,正 交氨酰tRNA合成酶与内源性tRNA不起作用或起作用的效率降低,所述效率 降低例如,小于20%的效率,小于10%的效率,小于5%的效率,或小于1% 的效率。正交分子缺乏细胞中功能正常的内源性互补分子。例如,与内源性 RS氨酰化内源性tRNA相比,细胞的任何内源性RS氨酰化细胞中正交tRNA 的效率降低或者甚至降为0。在另一例子中,与内源性RS氨酰化内源性tRNA 相比,正交RS氨酰化感兴趣细胞中任何内源性tRNA的效率降低或者降为0。 可将能与第一正交分子起作用的第二正交分子引入细胞。例如,正交tRNA/RS 配对包括引入的互补组份,与对照,例如相应的tRNA/RS内源性配对或活性 正交配对(如酪氨酰正交tRNA/RS配对)相比,它们在细胞中共同起作用的效率 是,例如45%效率、50%效率、60%效率、70%效率、75%效率、80%效率、90% 效率、95%效率或99%效率,或更高。
正交酪氨酰-tRNA:本文所用的术语正交酪氨酰-tRNA(酪氨酰-O-tRNA) 是与感兴趣翻译系统正交的tRNA,其中所述tRNA是(1)与天然酪氨酰 -tRNA相同或基本类似;(2)通过天然或人工诱变衍生自天然酪氨酰tRNA; (3)由考虑了(1)或(2)的野生型或突变型酪氨酰tRNA序列的方法所产生;(4) 与野生型或突变型酪氨酰tRNA同源;(5)与图l或2中称为酪氨酰tRNA 合成酶底物的任何示例性tRNA同源;或(6)图l或2中称为酪氨酰tRNA 合成酶底物的任何示例性tRNA的保守变体。酪氨酰tRNA可携带氨基酸, 或处于非负载状态。还应知道"酪氨酰-O-tRNA"任选被关联(cognate)合成 酶分别加载(氨酰化)除酪氨酸或亮氨酸以外的氨基酸,例如非天然氨基酸。应该知道,实际上本发明酪氨酰-O-tRNA可有利地用于在翻译期间对选择
者密码子起反应而基本上可将任何氨基酸(无论天然或人工的)掺入延伸的 多肽内。
正交酪氨酰氨基酸合成酶:本文所用的正交酪氨酰氨基酸合成酶(酪氨
酰-O-RS)是在感兴趣翻译系统内用氨基酸优先氨酰化酪氨酰-O-tRNA的合 成酶。酪氨酰-O-RS加载到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸, 无论是天然的还是人工的,并且不限于本文所述的。该合成酶任选与天然 酪氨酰氨基酸合成酶相同或同源,或者与

图1或2中称为O-RS的合成酶相 同或同源(参见,SEQIDNO:4-10)。例如,所述O-RS可以是图1的酪氨酰 -O-RS的保守变体,和/或与图1中O-RS的序列至少有50%、 60%、 70%、 80%、 90%、 95%、 98%、 99%或以上相同。
关联物(cognate):术语"关联物"指共同起作用的组分,例如正交tRNA 和正交氨酰-tRNA合成酶。这些组分也可称为"互补的"。
优先氨酰化:在本文中用于述及正交翻译系统,当某表达系统中O-RS使 O-tRNA带上氨基酸的效率高于其使任何内源性tRNA带上氨基酸的效率时, 该O-RS"优先氨酰化"关联O-tRNA。即,当翻译系统中存在摩尔比大致相等 的O-tRNA与任何给定的内源性tRNA时,O-RS使O-tRNA带上氨基酸的频 率高于它使内源性tRNA带上氨基酸的频率。当翻译系统中存在等摩尔浓度的 O-tRNA与内源性tRNA时,通过O-RS带上氨基酸的O-tRNA与通过O-RS带 上氨基酸的内源性tRNA的相对比例优选较高,最好导致O-RS仅使或几乎仅 使O-tRNA带上氨基酸。当存在等摩尔浓度的O-tRNA与O-RS时,通过O-RS 带上氨基酸的O-tRNA与通过O-RS带上氨基酸的内源性tRNA的相对比例大 于l:l,优选至少约2:1,更优选5:1,更优选10: 1,更优选20:1,更优选50: 1,更优选75:1,更优选95:1、 98:1、 99:1、 100:1、 500:1、 1,000:1、 5,000: 1或更高。
当(a)与内源性tRNA相比,O-RS优先氨酰化O-tRNA,和(b)与O-RS 用任何天然氨基酸氨酰化O-tRNA相比,氨酰化对非天然氨基酸特异时,O-RS "用非天然氨基酸优先氨酰化O-tRNA" 。 g卩,当包含O-RS和O-tRNA的翻译系统中存在等摩尔量的非天然和天然氨基酸时,O-RS将非天然氨基酸加载
到O-tRNA上的频率高于加载天然氨基酸的频率。带有非天然氨基酸的O-tRNA 与带有天然氨基酸的O-tRNA的相对比例优选较高。O-RS最好使O-tRNA仅 仅,或者几乎仅仅带上非天然氨基酸。当翻译系统中存在等摩尔浓度的天然和 非天然氨基酸时,使O-tRNA带上非天然氨基酸与使O-tRNA带上天然氨基酸 的相对比例大于l:l,优选至少约2:1,更优选5:1,更优选10: 1,更优选20: 1,更优选50: 1,更优选75: 1,更优选95: 1、 98: 1、 99: 1、 100: 1、 500: 1、 1,000: 1、 5,000: 1或更高。
选择者密码子:术语"选择者密码子"指翻译过程中为O-tRNA所识别而 不为内源性tRNA所识别的密码子。O-tRNA反密码子环识别mRNA上的选择 者密码子并在多肽的此位置掺入其氨基酸,例如非天然氨基酸。选择者密码子 可包括,例如无义密码子,如终止密码子(如,琥珀、赭石和乳白密码子);四 碱基或四碱基以上密码子;罕用密码子;衍生自天然或非天然碱基对的密码子, 等等。
抑制型tRNA:抑制型tRNA是例如通过提供对选择者密码子起反应而将 氨基酸掺入多肽链的机制来改变给定翻译系统中信使RNA(mRNA)阅读的 tRNA。例如,抑制型tRNA可读通如终止密码子(如,琥珀、赭石和乳白密码 子)、四碱基密码子、罕用密码子等。
抑制活性:本文所用的术语"抑制活性"总体上指tRNA(例如,抑制型tRNA) 能翻译读通在其它情况中可导致翻译终止或错译(例如,移码)的密码子(例如, 作为选择者密码子的琥珀密码子或四个或以上碱基的密码子)的能力。抑制型 tRNA的抑制活性可表达为与第二抑制型tRNA,或与对照系统,例如缺乏O-RS 的对照系统相比,观察到的翻译读通活性的百分比。
本发明提供了能定量测定抑制活性的各种方法。具体O-tRNA和O-RS对 感兴趣的选择者密码子(例如,琥珀密码子)的抑制百分比是指,与阳性对照构 建物相比,在感兴趣的翻译系统中,在编码表达测试标记的核酸中含有选择者 密码子的给定表达测试标记(例如,LacZ)的活性的百分比,所述感兴趣的翻译 系统包含O-RS和O-tRNA,所述阳性对照缺乏O-tRNA、 O-RS和选择者密码子。因此,例如,如果在给定翻译系统中观察到缺乏选择者密码子的活性阳性 对照标记构建物的活性为X(其单位与具体的标记试验相关),则含有选择者密 码子的测试构建物的抑制百分比是在与阳性对照标记的表达基本相同的环境
条件下(除了测试标记构建物在也含有O-tRNA和O-RS的翻译系统中表达外), 该测试标记构建物显示的X百分比。表达该测试标记的翻译系统一般还包含被 O-RS和O-tRNA所识别的氨基酸。可任选通过将测试标记与"背景"或"阴 性"对照标记构建物比较来校正抑制百分比的测量值,所述"背景"或"阴性" 对照标记构建物含有与测试标记相同的选择者密码子,但其所在的系统不含 O-tRNA、 O-RS和/或被O-tRNA禾卩/或O-RS所识别的相关氨基酸。该阴性对照 可用于标准化抑制百分比测量值以消除感兴趣的翻译系统中标记的背景信号 影响。
可通过本领域已知的许多试验来测定抑制效率。例如,可采用,半乳糖苷 酶报道试验,如可将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者 密码子)连同含有本发明的O-tRNA的质粒引入合适生物(例如,可利用正交组 分的生物)的细胞。还可引入关联合成酶(为多肽或表达时能编码该关联合成酶 的多核苷酸)。细胞在培养基中生长至所需密度,例如至OD,约为0.5,进行 P-半乳糖苷酶试验,例如用贝塔弗鲁尔(BetaFluorTM) |3-半乳糖苷酶试验试剂盒 (诺瓦金公司(Novagen))。可将抑制百分比计算为样品相对于可比较对照,例如, 与衍生的lacZ构建物的观察值的活性百分比,该衍生的lacZ构建物在所需位 置具有相应的有义密码子而非选择者密码子。
翻译系统:术语"翻译系统"指将氨基酸掺入延伸中的多肽链(蛋白质)的 各组分。翻译系统的组分可包括,例如核糖体、tRNA、合成酶、mRNA等。 本发明的0-tRNA和/或0-RS可加入休外或体内翻译系统或是其一部分,例如 存在于非真核细胞,如细菌(如大肠杆菌)中,或存在于真核细胞中,如酵母菌 细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。
非天然氨基酸:本文所用的术语"非天然氨基酸"指不在20种常见天然 氨基酸或硒代半胱氨酸或吡咯赖氨酸之列的任何氨基酸,修饰的氨基酸和/或氨 基酸类似物。例如,本发明可利用非天然氨基酸对-叠氮基-L-苯丙氨酸。衍生自:本文所用的术语"衍生自"指分离自特定分子或生物,或是用特 定分子或生物的信息制得的某组份。例如,衍生自第二多肽的多肽含有与该第 二多肽的氨基酸序列相同或基本上类似的氨基酸序列。以多肽为例,可通过, 例如天然产生的诱变、人工定向诱变或人工随机诱变获得衍生的种类。用于衍 生多肽的诱变可以是有意定向或有意随机的,或各方法的结合。诱变多肽以产 生衍生自第一(多肽)的不同多肽可以是随机的(例如,聚合酶失真所致),而鉴 定衍生的多肽可通过例如本文所述的合适筛选方法进行。诱变多肽通常需 要操作编码该多肽的多核苷酸。
阳性选择或筛选标记:本文所用的术语"阳性选择或筛选标记"指当存在 该标记时(例如被表达或激活等),可鉴定出具有特征的细胞,例如具有阳性选 择标记的细胞,从而区别于不具有该特征的细胞。
阴性选择或筛选标记:本文所用的术语"阴性选择或筛选标记"指当存在 该标记时(例如被表达或激活等)可鉴定不含有所选特性或特征的细胞(例如,与 确实具有该特性或特征的细胞相比)。
报道分子:本文所用的术语"报道分子"是指可用于鉴定和/或选择感 兴趣系统的靶组分的组分。例如,报道分子可以包括蛋白质,如能赋予抗 生素抗性或敏感性的酶(如P-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光
筛选标记(如绿色荧光蛋白(如GFP)、 YFP、 EGFP、 RFP等)、冷光标记(如 萤火虫萤光素酶蛋白)、亲和力筛选标记,或者正或负可选择标记基因如 lacZ、 p-gal/lacZ(卩-半乳糖苷酶)、ADH(乙醇脱氢酶)、his3、 ura3、 leu2、 lys2等。
真核生物:本文所用的术语"真核生物"指属于真核生物界(Kingdom Eucarya)的生物。真核生物通常因其以下特征而区别于原核生物典型的多细 胞组织(但不都是多细胞,例如酵母),存在以膜分界的核与其它以膜分界的细 胞器,线性遗传物质(即,线性染色体),不存在操纵子,存在内含子、信使(RNA) 加帽和poly-AmRNA,以及其它生物化学特征,如不同的核糖体结构。真核生 物包括,例如动物(如哺乳动物、昆虫、爬行动物、鸟等),纤毛虫,植物(如单 子叶植物、双子叶植物、藻类等)、真菌、酵母菌、鞭毛虫类、微孢子虫、原生动物等。
原核生物:本文所用的术语"原核生物"指属于原核生物界(也称为原核
生物(Procarya))的生物。原核生物通常因其以下特征而区别于真核生物单细 胞组织,通过出芽或分裂的无性生殖,缺乏以膜分界的核与其它以膜分界的细 胞器,环状染色体,存在操纵子,不存在内含子、信使(RNA)加帽和poly-A mRNA,以及其它生物化学特征,如核糖体结构不同。原核生物包括真细菌和 古细菌(rchaea)(有时称为"古细菌(Archaebacteria)")亚界。在原核生物界有时 将蓝细菌(蓝绿藻)与支原体分为不同类别。
细菌:本文所用的术语"细菌"和"真细菌"指不同于古细菌的原核生物。 类似地,古细菌指不同于真细菌的原核生物。可根据许多形态和生物化学标准 区分真细菌和古细菌。例如,可采用核糖体RNA序列、RNA聚合酶结构的差 异,存在或不存在内含子,抗生素敏感性,存在或不存在细胞壁肽聚糖和其它 细胞壁组分,膜脂质的分枝与不分枝结构,存在/不存在组蛋白和组蛋白样蛋白, 从而将某生物指定为真细菌或古细菌。
真细菌的例子包括大肠杆菌C^c/7en'c/z/" co//)、嗜热栖热菌(7T^mws ^ermo; /n7w力、嗜热脂肪芽孢杆菌CSflc/〃w WearaAwmo; /n7ws)等)。古细菌的例 子包括詹氏甲烷球菌(M"/ awcoccM /flM"氾cW)(A扔、梅氏甲烷八叠球菌 (A/eAawo犯rc/"a maze/)(Af/n)、 嗜热碱甲烷杆菌(A/ef/za"o6a"e/-/wm // emzoflwto^"o/ /z/c訓)(M)、海沼甲焼球菌(Me/Aa"ococcws ma一"/wcfe)、 甲院嗜 热菌(Me&a"op,ws A:awcf/en')、盐细菌(//a/o6a"en'wm)(例如沃氏富盐菌 (//a/o/erax w/cwz//)和盐细菌种iVACW)、闪烁古生球菌(^"c/weog/o6w /w/gWM)(4/)、激烈火球菌(尸;;racocc船/whasM)(尸力、极端嗜热古菌Cfyococcw Aor汰6^W)(尸A)、 好氧火球菌(尸^roZ acw/, aera/7/w7騰)、尸少rococcwj aZ jw/、 硫 磺矿硫化叶菌0^//0/06^ ^//aton'cws)(&)、 totot/a//、嗜热泉生古细
菌(^ewra/ jrw/w /^r"ix)(/4/ )、嗜酸热原体(77zcwo/ /aywa "c/cfo/ /2f/w/n)禾口火山热原
保守性变体:就翻译组分而言,本文所用的术语"保守性变体"指在功能
上类似于和该保守性变体相似的基本组分,例如O-tRNA或O-RS,但与参比O-tRNA或O-RS相比,序列中有变异的某翻译组份,例如保守性变体O-tRNA 或保守性变体O-RS。例如,O-RS或该O-RS的保守性变体可用非天然氨基 酸如含有N-乙酰半乳糖胺部分的氨基酸氨酰化关联O-tRNA。在该例子中, 所述O-RS及保守性变体O-RS的氨基酸序列不相同。所述保守性变体在序 列中可具有例如一处变异、两处变异、三处变异、四处变异或五处或更多处变 异,只要该保守性变体仍与相应的O-tRNA或O-RS互补。
在一些实施方式中,保守性变体O-RS与衍生其的O-RS相比,含有一 个或多个保守性氨基酸取代。在一些实施方式中,保守性变体O-RS与衍生 其的O-RS相比,含有一个或多个保守性氨基酸取代,此外还保留了O-RS 的生物学活性;例如,保守性变体O-RS保留了衍生其的亲本O-RS分子至 少10%,或者至少20%,至少30%,或至少40%的生物学活性。在一些优 选的实施方式中,所述保守性变体O-RS保留了衍生其的亲本O-RS分子至 少50%的生物学活性。保守性变体O-RS的保守性氨基酸取代可出现在该 O-RS的任何结构域内,包括氮基酸结合袋。
选择或筛选试剂:本文所用的术语"选择或筛选试剂"指当其存在时可从 某群体中选择/筛选某些组分的试剂。例如,选择或筛选试剂可以是但不限于, 如营养物、抗生素、某波长的光、抗体、表达的多核苷酸等。选择试剂可根据 例如浓度、强度等而不同。
起反应:本文所用的术语"起反应"指本发明的O-tRNA识别选择者密码 子并介导与该tRNA偶联的非天然氨基酸掺入延伸中的多肽链的过程。
编码:本文所用的术语"编码"指用多聚大分子或序列链中的信息来指导
不同于该第一分子或序列链的第二种分子或序列链产生的任何过程。本文所用 的该术语应用广泛,可用于各种领域。在一些方面,术语"编码"描述了半保
留DNA复制的过程,其中双链DNA分子的一条链用作模板通过依赖DNA的 DNA合成酶来编码新合成的互补姊妹链。
在另一方面,术语指用一种分子的信息来指导产生化学性质不同 于该第一分子的第二种分子的任何过程。例如,DNA分子可编码RNA分子(例 如,通过依赖DNA的RNA聚合酶参与的转录过程)。RNA分子也可编码多肽,例如翻译过程。当术语"编码"用于描述翻译过程时,其含义也延伸至编码氨
基酸的三联密码子。在一些方面,RNA分子可编码DNA分子,例如通过依赖 RNA的DNA合成酶参与的逆转录过程。在另一方面,DNA分子可编码多肽, 应该知道该情况用"编码"同时包括转录和翻译过程。
叠氮基:本文所用的术语"叠氮基"指具有以下通式的化学基团-N3:
R-N=N+=N.
该叠氮基通常与碳原子相连。
例如,非天然氨基酸对-叠氮基-L-苯丙氨酸(图3 ,结构2)包含叠氮基部分。 叠氮基染料也是具有叠氮取代基的染料分子(参见,例如图16中的叠氮基染 料10和11)。术语"叠氮化物"指含有叠氮基的化合物(例如,苄基叠氮、 叠氮钠等)。芳基-叠氮化物是含有叠氮基部分的芳族分子,例如非天然氨基 酸对-叠氮基-L-苯丙氨酸是芳基-叠氮化物。
您本文所用的术语"炔"(有时也称为"乙炔")指具有以下通式的在两 个碳原子之间含有三键的化学结构
C三C一R
其中R是任何原子或结构。当用作取代基时,该炔部分称为"炔基"。 炔基碳原子经spZ杂化,形成只与两个其它原子结合的键;这些键之一是单键, 而第二键是三键。例如,氨基酸对-炔丙基氧苯丙氨酸(pPRO-Phe)含有炔基。 参见图15,结构9。由于自然界中氨基酸上不存在炔基取代基,任何炔基氨 基酸都是非天然氨基酸。图5,结构6也提供了炔衍生的荧光素染料的化学结 构。
多肽:"多肽"是任何长度的任何氨基酸寡聚物(天然或非天然的,或它 们的组合),其通常(但不限于)由共价肽键相连。多肽可以是任何来源,例如天 然多肽、重组分子遗传学技术产生的多肽、细胞或翻译系统的多肽、或通过不 含细胞的合成方法产生的多肽。多肽以其氨基酸序列表征,例如其组分氨基酸 的一级结构。本文所用的"多肽的氨基酸序列"不限于全长序列,而可以是部 分或完整的序列。此外,不通过具有或不具有特定的生物学活性来限定多肽。 本文所用的术语"蛋白质"是多肽的同义词。术语"肽"指小的多肽,例如但不限于长度为2-25个氨基酸。
翻译后修饰:本文所用的"翻译后修饰"是共翻译时或在多肽完全翻译后, 在细胞内或无细胞的系统中发生的多肽修饰。翻译后修饰可以在体内天然发 生,在许多情况中,需要翻译后修饰以使天然多肽具有生物学活性。已知体内 存在各种翻译后修饰,包括例如糖基化和/或磷酸化,并且通常受内源性细胞组 分,例如细胞蛋白质的调节。多肽可经历多种类型的翻译后修饰,这些修饰可 位于该多肽分子内的任何地方。
已知的翻译后修饰包括但不限于乙酰化、酰化、ADP-核糖基化、酰胺 化、核黄素的共价连接、血红素分子的共价连接、核苷酸或核苷酸衍生物的共 价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、 二硫键形成、脱甲基化、共价交联的形成、半胱氨酸的形成、焦谷氨酸的形
成、甲酰化、y-羧基化、糖基化、GPI锚定形成、羟基化、碘化、甲基化、
肉豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊烯化、外消旋化、硒化、
硫酸化、转移-RNA介导氨基酸加入蛋白质(例如精氨酰化)、和泛素化 (ubiquitination)。技术人员熟知这些修饰,科学文献中详细描述了这些修饰, 例如Creighton, T. E.,《蛋白质结构和分子特性》(Proteins—Structure And Molecular Properties),第2版,W.H.弗里曼公司(W. H. Freeman and Company),纽约Wold, F.,"翻译后蛋白质修饰前景和展望" (Posttranslational Protein Modifications: Perspectives and Prospects),干ll于《蛋 白质的翻译后共价修饰》(Posttranslational Covalent Modification of Proteins), Johnson, B.C.编,学识出版社(Academic Press),纽约(1983), 第l-12页;Seifter等,"蛋白质修饰和非蛋白辅助因子的分析"(Analysis for protein modifications and nonprotein cofactors), Meth. Enzymol. 182:626-646 (1990),和Rattan等,Ann. N.Y Acad. Sci. 663:48-62 (1992)。
固体支持物:本文所用的术语"固体支持物"指排列基本上固定的基质, 其可以功能化,从而能直接或间接合成、连接或固定多肽(例如,或者含有多 肽的噬菌体)。该术语"固体支持物"还包括诸如"树脂"或"固相"等术语。 固体支持物可以由聚合物构成,例如有机聚合物,如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和 接枝物。固体支持物可以是无机的,例如玻璃、二氧化硅、硅、可控多孔玻璃 (CPG)、反相二氧化硅或任何还是的材料。除了本文所述的那些,术语"固体 支持物"还应包括接受了任何类型的涂层或经过任何其它类型的次级处理,例 如L-B膜(Langmuir-Blodgett film)、 自装配单层(self-assembled monolayer) (SAM)、溶胶凝胶(sol-gel)的任何固体支持物。
阵列:本文所用的"阵列"或"微阵列"是例如存在于固体支持物上和/ 或容器布置中的元件(例如,噬菌体展示的多肽)配置。虽然阵列通常认为是具 有特定空间物理关系的物理元件,但本发明还可利用不具有直接空间组织的 "逻辑"阵列。例如,可利用计算机系统追踪处于物理上迥异的部分中的一个 或几个感兴趣组分的位置。计算机系统通过提供阵列成员的物理位置的"查询" 表来产生逻辑阵列。因此,即使移动中的组分也可以是逻辑阵列的一部分,只 要该阵列的成员可以指定并定位。这是相关联的,例如当本发明阵列处于流动 的微观系统中,或当其存在于一个或多个微量滴定盘中时。
有时某些阵列形式称为"芯片"或"生物芯片"。阵列包含的可寻址位置 可以是低密度数量,例如2-约10,中密度,例如约100或更多的位置,或高 密度数量,例如1000或更多。芯片阵列形式通常是规则的几何形状,从而有 利于加工、处理、安置、堆放、试剂引入、检测和保存。然而,它可以是不规 则的。在一种典型形式中,阵列配置成行列形式,该阵列上成员组的各位置之 间的间隔固定。或者,这些位置可以是集束的(bundled)、混合的或均匀掺合的, 从而能平衡处理或取样。阵列可包含多个可寻址位置,其配置使得各位置对于 高通量处理、机器人递送、掩蔽或试剂的取样在空间上可寻址。还可将阵列配 置成有利于通过任何具体的方法检测或定量测定,包括但不限于通过激光照射 扫描、共聚焦或反射光聚集(confocal or deflective light gathering)、 CCD检测
和化学发光。本文所述的"阵列"形式包括但不限于阵列(S卩,多重芯片的
阵列)、微芯片、微阵列、装配在一块芯片上的微阵列、连接在微孔平板上的 生物分子阵列或感兴趣系统所用的任何其它合适形式。
共价键:本文所用的共价键是原子之间含有共用电子的键。共价键是"化学键"的同义词。非共价键是除共价键以外的任何键。非共价键的一种类型是 离子键。离子键是带相反电荷的化学部分之间的吸引作用。在离子键中,电子 不共用,而是不均匀地转移,从而导致电荷分布不均匀及正/负电荷吸引。
附图简述
图1提供了本发明所用多核苷酸和多肽序列的例子。
图2提供了詹氏甲烷球菌酪氨酰-tRNA合成酶突变体的氨基酸序列的 例子,所述突变体可使正交tRNA带上非天然氨基酸对-叠氮基-L-苯丙氨酸。
图3提供了五种非天然氨基酸(l-5编号)的结构和相应的名称即O-甲基 -酪氨酸(1)、对-叠氮基-L-苯丙氨酸(2)、对-乙酰基-L-苯丙氨酸(3)、对-苯甲酰基-L-苯丙氨酸(4)和3-(2-萘基)丙氨酸(5)。
图4提供了显示M13-SBP噬菌体产量(以PFU/mL表示)依赖于存在相应 非天然氨基酸的实验结果。
图5提供了炔-衍生荧光素染料的化学结构(结构6)。
图6提供了利用抗-荧光素(I)或抗-PIII(II)第一抗体进行蛋白质(Western) 印迹分析后的化学发光图像,其中样品在M13KE-SBP噬菌体的[3 +2]环加成 反应后构成反应材料,其中噬菌体在有对-叠氮基-L-苯丙氨酸2存在时在菌株 TTS/RS中制备(a)或在XLl-蓝中制备(b)。
图7提供了噬菌体链霉亲和素结合ELISA的吸光度值。检测492 nm的吸 光度。
图8提供了图7所示噬菌体链霉亲和素结合ELISA的图示结果。在有3 存在下在菌株TTS/RS中制备的0)M13KE; (□) M13KE-SBP噬菌体;在有 2存在下在TTS/RS中制备的(O) M13KE-SBP噬菌体;在XLl-蓝中制备的 (x)M13KE-SBP噬菌体。
图9提供了噬菌体回收的富集因子测定的结果。
图10图示了涉及噬菌体展示多肽(噬菌体Ph-Az)与膦7或8的施陶丁格偶 联反应,所述多肽含有对-叠氮基-L-苯丙氨酸残基。
图11提供了与膦7和8进行施陶丁格偶联连接后,对噬菌体Ph-Az和Ph-Q进行蛋白质印迹分析的化学发光图像。该分析利用抗-荧光素第一抗体 (1-4道)或抗-PIII第一抗体(5-8道)。
图12提供了含有对-叠氮基-L-苯丙氨酸2的Z-结构域蛋白与膦7进行施 陶丁格连接所得反应产物的MALDI-TOF分析。峰A和B分别属于偶联和反 应产物;小峰&、 b2、 a,和b,衍生自基质加成物以及从A和B中除去甲硫氨 酸。
图13提供了含有pAzPhe的Z-结构域蛋白与膦8进行施陶丁格连接所得 反应产物的MALDI-TOF光谱分析。
图14提供了含有对-叠氮基-L-苯丙氨酸2的Z-结构域蛋白与膦7以及掺 杂了比较量的真正的对-叠氮基-L-苯丙氨酸2 Z结构域突变体的施陶丁格连接 所得反应产物的MALDI-TOF分析。
图15提供了非天然炔基氨基酸对-炔丙基氧苯丙氨酸(pPRO-Phe;根据 IUPAC命名也称为2-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸)的化学结构(9)。图 15也提供了室温下在有铜存在下通过叠氮基和炔的[3 + 2]环加成反应不可逆 地形成三唑结构的通用反应化学方法。
图16提供了两种叠氮基-功能化染料的化学结构(10和11)。染料10含有 丹酰基荧光团,染料ll含有荧光素荧光团。
发明详述
需要能以高度选择性方式修饰噬菌体所展示蛋白质的化学反应。还需要这 种反应能在生理相容条件下操纵,从而能保留蛋白质的活性和噬菌体活力。本 领域目前用于选择性修饰蛋白质,例如噬菌体所展示蛋白质的大多数反应包括 在亲核和亲电配对(partners)之间形成共价键,所述配对靶向氨基酸侧链中的天 然亲核残基。在这些情况中,选择性取决于蛋白质中亲核残基的数量与可接近 性。不幸的是,天然蛋白质含有的反应位点往往位置不佳(例如,不可接近)或 含有多个反应靶标(例如,赖氨酸、组氨酸和半胱氨酸残基),导致修饰反应选 择性差,从而难以利用亲核/亲电试剂进行高度靶向的蛋白质修饰。此外,修饰 位点通常局限于赖氨酸、组氨酸或半胱氨酸的天然亲核侧链。难于或不可能在其它位点修饰。
本发明提供了这些问题的解决方法。本发明提供的系统通过操纵正交翻译 系统与重组噬菌体表达试剂共同起作用而将具有新特性的非天然氨基酸程序 性、位点特异性地生物合成掺入噬菌体展示的蛋白质。本发明提供的方法随后 耙向修饰掺入噬菌体展示多肽中的那些非天然氨基酸残基。在本文中,我们描 述了产生翻译后修饰的噬菌体的新组合物(例如,含有各种翻译后修饰的噬菌 体)和新方法。
本发明提供的噬菌体生产系统利用正交翻译系统,该系统利用大肠杆菌宿 主细胞将非天然氨基酸选择性惨入噬菌体展示的多肽,随后通过选择性修饰非 天然氨基酸残基来修饰那些多肽。本文涵盖并说明了修饰噬菌体展示多肽中非 天然氨基酸残基的各种化学方法,包括[3 +2]环加成和施陶丁格连接。
在大肠杆菌宿主细胞中,本发明所用的正交翻译系统包含识别选择者密码
子的正交tRNA和使该正交tRNA特异性负载非天然氨基酸的正交氨酰-tRNA 合成酶。通过工程改造编码感兴趣蛋白质的多核苷酸,使之在所需位点含有选 择者密码子,从而传导掺入非天然氨基酸的信号,可以将非天然氨基酸掺入感 兴趣的噬菌体所展示蛋白质中的任何所需位置。
本文描述了许多非天然氨基酸掺入噬菌体展示的多肽。这些氨基酸包括 O-甲基-酪氨酸、对-叠氮基-L-苯丙氨酸、对-乙酰基-L-苯丙氨酸、对-苯甲酰基 -L-苯丙氨酸和3-(2-萘基)丙氨酸。芳基-叠氮化物氨基酸,例如对-叠氮基-L-苯 丙氨酸为特异性和区域选择性(regiosdectWe)翻译后修饰提供了有吸引力的靶 位。也包括将包含炔基的非天然氨基酸,例如对-炔丙基氧苯丙氨酸用于噬菌 体展示的多肽中作为翻译后修饰的靶位。在本发明的一些实施方式中,采用能 维持噬菌体活力的较为温和与生理相容的体外或体内反应条件对噬菌体展示 多肽中的非天然氨基酸进行翻译后修饰。
由于芳基-叠氮化物和炔基非天然氨基酸独特的反应化学特性,可以极高 的选择性修饰其所掺入的噬菌体所展示蛋白质。在一些情况中,非天然氨基酸 反应基团的优点是其对于体内系统完全是外来的,从而能提高反应选择性。
通过非天然氨基酸靶位与噬菌体所展示蛋白质偶联的物质的特性不作具体限定,可以是任何所需实体,例如,染料、荧光团、交联剂、糖衍生 物、聚合物(例如,聚乙二醇衍生物)、光交联剂、细胞毒性化合物、亲和标 记、生物素衍生物、树脂、珠、第二种蛋白或多肽(或更多种)、多核苷酸(例
如,DNA、 RNA等)、金属螯合剂、辅因子、脂肪酸、碳水化合物等。本
文描述了衍生的荧光素或丹酰基荧光团染料作为偶联物质的实验应用。然 而,本发明不限于利用这些偶联物质,而是包括各种偶联物质,例如上述 那些。
噬菌体展示
噬菌体展示技术是在各种生物学科中广泛应用的技术。噬菌体展示特别可 用于肽(即,多肽)文库筛选方案。各种应用包括亲和选择(例如,靶受体选择), 表位作图及模拟,鉴定新受体和天然配体,发现药物,发现表位用于疫苗开发
和诊断及研究DNA-结合蛋白质。各种文献描述了噬菌体展示技术可用的许多 方法、试剂和变体噬菌体基因组(和变体噬菌体基因)。参见,例如Smith和 Petrenko, CTzew. i ev. , 97:391-410 (1997); Sidhu, 5/mo/ecw/or五wg/"ee〃'wg 18:57-63 (2001); Rodi禾口 Makowski, Cwre"Z / 10:87-93 (1999);禾口 Willats,尸/a"f Mo/ecw/w 50:837-854 (2002)。
本文所述实验利用新英格兰生物实验室公司(New England BioLabs, Inc.) 的丝状M13KE噬菌体系统。M13KE是M13mp19的衍生物,其设计用于在噬 菌体展示应用中表达N-末端PIII融合肽(Zwick等,(1998) ^"a/. , 264:87-97)。在M13KE中构建的文库是五价的(即,成熟病毒体中的所有5 份pIII拷贝携带该融合肽)。与亲代M13mpl9相比,Acc65 I/Kpn I和Eag I 位点引入到了 pill前导肽切割位点的侧翼,删除了多克隆位点(MCS)中的 Acc65 I/Kpn I位点。噬菌体展示的随机肽文库如下所示构建使延伸引物 与编码该随机肽文库及pIII前导序列一部分的合成寡核苷酸退火,用DNA 聚合酶延伸,用Acc65 I禾n Eag I消化(Noren禾P Noren, (2001) M"/zocfe 23:169-178)。将得到的切割双链体插入用同一酶消化的M13K。
虽然,本文提供的例子利用M13KE噬菌体系统,但本发明不限于该特定 系统。技术人员实际上知道可采用其它噬菌体展示试剂和方法,这些试剂和方法也可用于本发明的组合物和方法。这些替代试剂和方法未脱离本发明的范 围,本发明应包括这些替代试剂和方法。
通常将多肽与噬菌体衣壳(外壳)蛋白、或衣壳蛋白的片段、突变体或其它
变体融合来展示感兴趣的多肽。这些衣壳蛋白包括pin、 pvi、 pvn、 pvm和
pix。为说明(但不是限制)本发明,本文的实施例描述了含有噬菌体pin外壳蛋
白氨基酸序列的噬菌体所展示融合多肽的制备。本发明不应限于利用pin多肽
序列来展示感兴趣的融合蛋白。
在一些噬菌体系统中,可将接头蛋白酶识别信号序列经工程改造插入衣壳
融合多肽,从而促进融合蛋白部分的切割和/或释放。已知各种蛋白酶信号序列,
包括但不限于凝血因子Xa、凝血因子XIa、激肽释放酶、凝血酶、凝血因 子XIIa、胶原酶或肠激酶。本发明可用任何合适蛋白酶识别信号和相应的 蛋白酶。
类似地,为说明(但不是限制)本发明,本文证明可将非天然氨基酸部分掺 入含有链霉亲和素结合肽(SBP)的噬菌体展示的模型融合蛋白中,然后进行翻 译后修饰。非天然氨基酸的掺入不应限于这种模型蛋白质。由本文可以看出, 对于治疗和研究目的所用的各种蛋白质,将非天然氨基酸掺入感兴趣的任何给 定的噬菌体所展示蛋白质是有利的。
本发明还提供含有多肽的噬菌体,所述多肽含有至少一个翻译后修饰的非 天然氨基酸,所述噬菌体是纯化的或分离的。例如,可采用PEG沉淀和/或离 心来纯化和/或分离噬菌体。参见实施例3。本领域还知道其它噬菌体沉淀和纯 化/分离技术,例如采用亲和纯化方案,如免疫亲和。
噬菌体展示文库和阵列
噬菌体展示含有翻译后修饰的非天然氨基酸的多肽有各种用途。对噬菌体 展示多肽的应用的讨论见各种文献,例如Smith禾卩Petrenko, O em. Z ev., 97:391-410 (1997)。
在一些实施方式中,噬菌体展示多肽含有翻译后修饰的非天然氨基酸,所 述多肽是携带相同或不同编码多肽、或相同多肽的变体(均含有至少一个非天 然氨基酸)的多种噬菌体的成员。在一些实施方式中,当噬菌体展示不同多肽序列时,所展示的多肽构成文库,例如感兴趣编码序列的随机突变体文库。
当含有翻译后修饰的非天然氨基酸的噬菌体展示多肽构成文库时,通常应 用选择步骤从所展示的候选多肽组合中选择所需多肽种类(或编码该多肽种类 的核酸)。选择可包括根据某些用户定义的标准选择噬菌体所产生多肽的初始 群体,从而得到"适合性"提高的亚群。在大多数情况中,输入第一轮选择的 文库的初始数量非常大,所选择的亚群是初始群的一部分,其中更合适的克隆
被过度体现(over r印resented)。通过感染新鲜的细菌宿主细胞可"扩增"该群 体,因此,在新的扩增储备物中,该亚群中的各噬菌体得到扩增。然后可对扩 增的群体再进行几轮选择以获得更合适的起始肽亚组。
通常有两种选择参数是关键性的,在一定程度上可操纵这两种参数以提高 选择效率。首先,严谨性是适合性较高的多肽相对适合性较低的肽的优先程度; 第二,产率是通过选择的具有给定适合性的颗粒分数。选择的最终目的通常是 分离适合性最佳的肽。然而,选择最适合的多肽必须与适当的严谨性相平衡, 从而能获得合理的产率。如果将严谨性设置得太高,特异性选择的噬菌体的产 率将低于非特异性分离的噬菌体的背景,并丧失区分高适合性的能力。
施加于噬菌体所展示的多肽群的最常用选择压力之一是对靶受体的亲和 力。通常采用生物化学普遍使用的标准亲和纯化技术的些许改进实施亲和选 择。因此,例如,使受体连接于固体支持物并使噬菌体混合物流过固定的受体。 文库中少量的噬菌体展示多肽与受体结合并被捕捉到基质的表面上,进而洗去 未结合的噬菌体。最后,用能减弱受体-肽相互作用的溶液洗脱结合的噬菌体, 产生富集有受体结合克隆的噬菌体"洗脱液"群。洗脱的噬菌体仍具有感染性, 通过简单地感染新鲜的细菌宿主细胞而增殖,从而产生能输入另一轮亲和选择 的"扩增的"洗脱液。分别扩增和表征最终洗脱液的噬菌体克隆。通过确定病 毒DNA中的相应编码序列能简单地测定负责结合靶受体的肽的氨基酸序列。
可根据对靶受体的亲和力之外的适合性标准来选择噬菌体产生的多肽。例 如,可根据所需的生物学活性(例如,酶活性、提高的酶活性、或对某些试剂 或阻遏物显示耐受性)选择携带所展示文库的噬菌体。
这些噬菌体选择方法可有许多改进,本领域技术人员知道这种改进。此外,
26许多出版物涉及噬菌体文库筛选方法这一主题。
在一些实施方式中,可将展示含有非天然氨基酸的多肽的噬菌体固定在合 适支持物上。在这方面,掺入噬菌体展示多肽中的非天然氨基酸可以任选用作 反应性部分,从而与固定相偶联,例如采用[3 + 2]环加成反应或施陶丁格连接 反应。
可以固定噬菌体(或噬菌体文库)的固体支持物的性质不作限定。例如,可 以将噬菌体固定于固体支持物上,所述固体支持物包括聚苯乙烯碟、不可渗透 的塑料珠、尼龙或硝化纤维素膜、顺磁性珠和可渗透的琼脂糖凝胶珠。在一些 实施方式中,将固定的噬菌体布置成某种特定的关系,即它们形成阵列。对于 利用非天然氨基酸与固体支持物形成连接键,以及固体支持物的形式和阵列的
讨论可参见名为"蛋白质阵列"的国际公布WO 2004/058946。
正交翻译系统组分
在本发明的某些方面,将非天然氨基酸对-叠氮基-L-苯丙氨酸(参见图3, 结构2)掺入感兴趣的噬菌体展示多肽。当将非天然氨基酸掺入噬菌体展示多肽 时,其可用作[3 + 2]环加成反应和施陶丁格修饰反应的化学靶位,从而能翻译 后修饰噬菌体展示的多肽。
本文提供了掺入此非天然氨基酸的正交组分。图1提供了 7种突变型詹氏 甲垸球菌酪氨酰-tRNA合成酶(参见SEQ ID NO: 4-10),所述合成酶使正交 抑制型tRNA负载对-叠氮基-L-苯丙氨酸,然后在翻译期间对选择者密码子 起反应掺入该对-叠氮基-L-苯丙氨酸。SEQ ID NO: 1提供了本发明所用的正 交抑制型tRNA。
以下文献也披露了用于掺入对-叠氮基-L-苯丙氨酸的合适正交tRNA和氨 酰-tRNA合成酶Chin等,J ^w. C/zem. Soc. , (2002) 124:9026-9027;和名 为"产生正交tRNA氨酰-tRNA合成酶配对的方法和组合物"(METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS)的国际公布WO 2002/086075; 名为"非天然氨基酸的体内掺入"(IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS)的WO 2002/085923;各份文献处于所有目的以引用的方式全文纳入本文。此外,现有技术和本文也提供了合成其它正
交tRNA和正交氨酰tRNA合成酶(序列未专门列举)的指南。
在本发明的其它方面,掺入感兴趣的噬菌体展示多肽中的非天然炔基氨基
酸也用作翻译后修饰的靶位。例如,为此目的了利用非天然炔基氨基酸对-炔 丙基氧苯丙氨酸(pPRO-Phe;参见图15的结构9)。炔基氨基酸可用作[3+ 2] 环加成的靶位。例如以下文献提供了掺入此非天然氨基酸的正交组分Deiters 等,Aowgam.c cS: Afc&c/"a/ C/^w'"715:1521-1524 (2005)禾卩2005年 9月20日提交的国际公布号WO2006/034332。 「3 + 21环加成反应
可将非天然氨基酸侧链(例如,芳基-叠氮化物氨基酸或炔基氨基酸上的) 掺入感兴趣的噬菌体展示蛋白质,然后通过慧思根(Huisgen) [3 + 2]环加成 反应对其进行特异性且区域选择性的修饰(参见,Padwa,刊于《综合有机合 成》(Compre/^腦've 6Vgam'c iSy"f/zes/s), [Trost, B. M.编]Pergamon: Oxford, 1991,第4巻,第1069-1109页;Huisgen,刊于《1,3-两极环加成化学》 /ar Cyc/oaoW"/o" C7z,/"o;), [Padwa, A.编]威立公司(Wiley):纽 约,1984;第1-176页)。[3 + 2]环加成反应的通用化学反应如图15所示,其 中叠氮基与炔基反应。该反应不可逆,其形成三唑连接键。
如图15所示,在[3+2]环加成反应中,与叠氮取代基或炔基取代基相连的 R基团不作具体限定。在一些方面,叠氮基形成掺入噬菌体展示多肽中的芳基 -叠氮化物非天然氨基酸,例如对-叠氮基-L-苯丙氨酸的一部分(参见实施例4)。 在这种形式中,炔基部分与某试剂相连(例如,图5,结构6所示的炔基衍生荧 光素染料),随后可与噬菌体所展示的多肽反应从而形成翻译后修饰的噬菌体。 与炔基相连的R基团的性质不作具体限定。
还可采用形式相反的[3 + 2]环加成反应。在这种情况中,炔基是掺入噬菌 体展示的多肽中的炔基非天然氨基酸,例如对-炔丙基氧苯丙氨酸(参见图15, 结构9)的一部分。在这种形式中,叠氮基与某试剂相连(例如,图15,结构10 和11所示的叠氮基衍生的丹酰基和荧光素染料),随后可与噬菌体所展示的多 肽反应从而形成翻译后修饰的噬菌体。与叠氮基相连的R基团的性质不作具体限定。
炔基和叠氮基的化学性质的优点在于就体内蛋白质中存在的内源性官能 团的化学性质而言,其完全是外来的。当室温下,在有铜(I)存在的水性介质(对 于修饰生物学样品足够温和的条件沖进行[3 +2]环加成反应时,其以完全区域
选择性的方式进行(Rostovtsev等,(2002)j"gew. c&m.j^/. , 47:2596), 并可用于选择性修饰引入了炔基或叠氮基官能团的噬菌体所展示蛋白质,例如 利用正交翻译系统(Deiters等,(2003) /^w. CTzem. Soc. , "5:11782; Wang 等,(2003) / v4w. C/zem. Soc. , "5:3192; Link禾口 Tirrell, (2003) 爿m. C/zem. Soc., 125:11164)。因为该方法涉及环加成而不是亲核取代,可以极高的选择 性修饰蛋白质。该反应的优点在于通过向反应混合物中加入催化量的Cu(I)盐, 能在室温,水性条件下以优良的区域选择性(1,4 〉 1,5)进行(Tornoe等,(2002) CTzem., 67:3057-3064; Rostovtsev等,(2002)C/zem.,/"a £c/., 化2596-2599)。
为说明(但不是限制)本发明,本文的实施例描述了用叠氮基或炔基部分衍 生的丹酰基和荧光素染料的应用,这些染料可用于[3+2]环加成反应中。然而, 本领域技术人员应知道,在[3 + 2]环加成反应中,本发明不限于利用这些衍生 染料。实际上,该化学方法能用任何分子在翻译后修饰噬菌体展示的多肽(从 而能在翻译后修饰噬菌体),所述分子能用叠氮基或炔基衍生。本领域技术人 员能合成任何感兴趣分子的叠氮基或炔基衍生物。例如,许多教材和方法描述 了如何合成叠氮基化合物。 一般参考可参见Patai, Saul,"叠氮基化学"(The chemistry of the azido group), 干U于《官能团化学》(T7ze C7zem&^y o/ Fww"/o"a/Grow/w),伦敦,纽约,交互科学出版社(Interscience Publishers), 1971。
在其它方面,本发明提供利用聚乙二醇的叠氮基衍生物(叠氮基-PEG)制备 PEG化的噬菌体展示多肽的组合物和方法,所述叠氮基衍生物与含炔基的噬菌 体展示多肽用于[3 + 2]环加成偶联反应中。叠氮基聚乙二醇的通用结构是
N3-CH2-(CH2-0-CH2)n-CH2OR
其中R是H或CH3,n是例如50-10,000、75-5,000、 100-2,000、 100-1,000之间的整数,等等。在本发明的各种实施方式中,叠氮基聚乙二醇的分子
量为,例如约5,000-约100,000 Da (即,约5 kDa-约100 kDa)、约20,000-约50, OOODa、约20,000-约10,000 Da(例如,20,000 Da),等等。本领域技 术人员熟知合成叠氮基聚乙二醇的技术。例如,含有亲电基团的聚乙二醇 分子(例如,溴化物或A^-羟基琥珀酰亚胺酯)可与含有叠氮基的亲核分子 (例如,叠氮钠或3-叠氮基丙胺)从而产生叠氮基聚乙二醇。
当通过三唑连接键与含炔基的噬菌体所展示蛋白质生物偶联时,本发 明可用叠氮基-PEG。用聚乙二醇衍生(PEG化)蛋白质治疗剂常能提高该蛋 白质的药代动力学和药效学特性,从而提高效率并尽可能降低给药频率。 例如,Deiters等,"位点特异性PEG化含有非天然氨基酸的蛋白质" (Site-specific PEGylation of proteins containing unnatural amino acids), Bioorganic & Medicinal Chemistry Letters 14:5743-5745 (2004)讨论并说明了 PEG化蛋白质治疗剂的各种优点。
此外,还包括与制备含有非天然炔基氨基酸的噬菌体展示多肽有关的其它 优点,所述氨基酸还含有酯键。例如,利用含酯键的炔基氨基酸产生PEG化 多肽能通过该酯键的体内或体外皂化作用而减缓多肽的释放。利用多聚支持物 (叠氮基树脂)替代叠氮基-PEG分子也能进行蛋白质亲和纯化。三唑共价键能经 受非常强的洗涤步骤,利用酯炔基氨基酸能在碱处理后释放噬菌体展示的蛋白 质。这种亲和纯化方法明显不再需要待纯化的感兴趣蛋白质上有人工标签(例 如,六组氨酸)或表位存在。根据所用的非天然氨基酸,切割步骤后可从亲和 树脂释放基本上野生型(天然)的多肽。
可以合成含酯键的非天然炔基氨基酸,并将其掺入蛋白质。参见,例如 2005年9月20日提交的国际公布号WO2006/034332所述的酯键炔基氨基酸。 通过[3 + 2]环加成生物偶联后,可通过体内或体外的皂化作用切割酯键; 一种 应用是例如,PEG化的噬菌体展示蛋白质中肽部分的缓慢释放。
在其它方面,本发明提供利用聚乙二醇的炔基衍生物(炔基-PEG)制备PEG 化的噬菌体展示多肽的组合物和方法,所述炔基衍生物与掺入噬菌体展示多肽 中的含叠氮基非天然氨基酸用于[3 + 2]环加成偶联反应中。施陶丁格反应
施陶丁格连接曾用于在细胞和体内系统中选择性修饰细胞表面碳水化合
物(Saxon和Bertozzi, Sc/e"ce 2000, 2S7, 2007-2010; Prescher等,A^w" 2004, WO, 873-877)。该反应在水性条件下的产率优良,对于叠氮基的选择性高。施 陶丁格连接还用于选择性修饰含有以叠氮基高丙氨酸(azidohomoalanine)取代 甲硫氨酸残基的蛋白质(Kiick等,ZVoc.胸/. 2002,肌
7566-7571)。然而,该施陶丁格连接方法本身有局限性,因为蛋白质中每一个 甲硫氨酸残基以及整个蛋白质组均被叠氮基高丙氨酸(常与天然氨基酸竞争)取 代。
本发明提供产生翻译后修饰的噬菌体的方法,其中所述噬菌体包含的展示 多肽含有芳基-叠氮化物非天然氨基酸,例如对-叠氮基-L-苯丙氨酸。然后采用 施陶丁格连接反应有效且特异性地修饰该非天然氨基酸,从而产生翻译后修饰 的噬菌体。图10显示了含有对-叠氮基-L-苯丙氨酸残基的噬菌体展示多肽(来 自噬菌体Ph-Az)与两种不同光谱探针膦分子(结构7和8)的施陶丁格连接反应 示意图。实施例6详细解释了该方法。
为说明(但不是限制)本发明,本文的实施例描述了适当衍生用于施陶丁格 连接反应的两种光谱探针的应用。然而,本领域技术人员应知道,本发明不限 于这些衍生的膦分子在施陶丁格反应中的应用。施陶丁格反应化学方法能用可 适当衍生的任何分子翻译后修饰噬菌体展示的多肽(进而翻译后修饰了噬菌 体)。本领域技术人员肯定能合成可用于偶联的任何具体感兴趣分子的合适衍生物。
正交tRNA/氨酰-tRNA合成酶
理解与正交tRNA和正交氨酰-tRNA合成酶配对有关的活性有助于理 解本发明的新组合物和方法。正交tRNA和氨酰-tRNA合成酶技术的讨论 可见,例如,国际公布WO 2002/085923、 WO 2002/086075、 WO 204/09459、 WO 2005/019415、 WO 2005/007870禾。WO 2005/007624。也可参见Wang 和Schultz,"扩展遗传密码"(Expanding the Genetic Code), j"gewflf"&e C/zem/e/W. £d, 44(1): 34-66 (2005),其内容通过引用全文纳入。为在遗传密码中加入额外的反应性非天然氨基酸,需要包含氨酰-tRNA
合成酶和适当tRNA的新正交配对,它们能在宿主翻译机制中有效起作用,
但与所述翻译系统"正交",即它可不依赖该于翻译系统的内源性合成酶
和tRNA而起作用。正交配对的所需特征包括仅能解码或识别不由任何内源性 tRNA解码的一种特定密码子(例如选择者密码子)的tRNA,和只能利用一种特 定非天然氨基酸优先氨酰化其关联tRNA(或"使之负载")的氨酰-tRNA合成 酶。内源性合成酶通常不氨酰化O-tRNA。例如,在大肠杆菌中,正交配对包 括不与任何内源性tRNA(例如,大肠杆菌中有40种)交叉反应的氨酰-tRNA合 成酶及不被任何内源性合成酶(例如,大肠杆菌中有21种)氨酰化的正交 tRNA。
本发明提供含有非天然氨基酸的噬菌体展示多肽,其中所述非天然氨基酸 (和由此得到的噬菌体)经翻译后修饰。通过使正交配对适于在大肠杆菌中将非 天然氨基酸遗传编码入蛋白质中以实现将非天然氨基酸掺入蛋白质,其中所述 正交组分不与宿主细胞的翻译系统的内源性大肠杆菌组分交叉反应,但能识别 所需的非天然氨基酸并对选择者密码子(例如琥珀无义密码子,TAG)起反应而 将其掺入蛋白质。本发明提供的正交组分包括衍生自詹氏甲烷球菌酪氨酰 -tRNA合成酶的正交氨酰-tRNA合成酶和突变型酪氨酰tRNAcuA琥珀抑制 物,它们在真细菌宿主细胞中作为正交配对。在此系统中,突变型氨酰-tRNA 合成酶用其各自的非天然氨基酸而不是常见的20种氨基酸来氨酰化抑制型 麵A。
本发明提供含有非天然氨基酸的噬菌体展示多肽及其产生方法,其中所述 非天然氨基酸(和由此得到的噬菌体)经翻译后修饰。这些方法利用可用于将非 天然氨基酸掺入噬菌体展示的蛋白质的正交tRNA-氨酰tRNA合成酶配对 (例如O-tRNA/0-RS配对)。O-tRNA/O-RS配对能介导将非天然氨基酸,如 图3或图15所示非天然氨基酸掺入由某多核苷酸编码的蛋白质,其中所述 多核苷酸含有例如在体内被O-tRNA识别的选择者密码子。所述O-tRNA 的反密码子环识别mRNA上的选择者密码子并将其非天然氨基酸掺入多肽 的该位点。 一般,本发明的正交氨酰-tRNA合成酶只用一种特定的非天然氨基酸优先氨酰化其O-tRNA(或使之负载)。
将非天然氨基酸位点特异性地掺入噬菌体所展示蛋白质的能力有利于 通过翻译后修饰来研究蛋白质,以及能够工程改造具有新特性的蛋白质。 例如,表达含有一种或多种非天然氨基酸的蛋白质有助于通过特异性标记 来研究蛋白质,改变酶的催化功能,提高生物学活性或降低与基底的交叉 反应性,使某种蛋白质与其它蛋白质、小分子或生物分子交联,降低或消
除蛋白质降解,延长蛋白质的体内半衰期(例如,使引入的反应位点PEG化
或作其它修饰)等。
正交tRNA/正交氨酰-tRNA合成酶及其配对
适合产生含有一种或多种非天然氨基酸的蛋白质的正交翻译系统通常 描述于以下国际
发明者P·舒尔茨, 曹萝麟, 丰 田 申请人:斯克利普斯研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1