整合包含BCN基团的氨基酸到多肽中的方法与流程

文档序号:15198309发布日期:2018-08-19 02:09阅读:1379来源:国知局

本发明涉及经(延伸的)遗传密码的生物正交基团的位点特异性整合。特别地,本发明涉及经在遗传整合的氨基酸基团如亲二烯体和化学基团如四嗪之间的加速的反电子需求diels-alder反应,将化学基团整合到多肽中。



背景技术:

经遗传编码延伸的生物正交基团的位点特异性整合为具有任意探针的位点特异的标记蛋白提供了强大的通用策略。然而,可被遗传编码的生物正交官能团的缓慢反应性限制了这一策略的利用。

对于化学生物学家而言,具有不同探针的蛋白的快速且位点特异性标记仍是个很大的挑战;酶介导的标记方法可以是快速的,但在研究中,却使用了将扰动引入到蛋白中的蛋白或肽的融合,并可能限制了可标记的位点,而许多可遗传编码组分的“生物正交”反应太慢以至于在用于研究许多生物过程的时间尺度上影响了蛋白的定量的和位点特异性得标记。

迫切需要在不同背景下的具有用户定义的探针的位点特异性标记蛋白的通用方法。

包含降冰片烯和反式环辛烯的有张力(strained)的烯烃和四嗪之间的反电子需求diels-alder反应已成为一类重要的快速生物正交反应1-4。据报道,某些这些反应的速度非常快3,4

最近,已报道了使用这些反应的特异性标记蛋白的三种方法:

-一种在两步法中接受反式环辛烯底物的硫辛酸连接酶变体已被用于标记带有13个氨基酸硫辛酸连接酶标签的蛋白5

-一种四嗪已在特异性位点上经遗传编码延伸引入在大肠杆菌中表达的的蛋白,并与有张力的反式环辛烯二乙酰荧光素进行衍生6

-已证示了有张力的烯烃(包含降冰片烯的氨基酸)的整合,其是通过遗传编码延伸和体外、大肠杆菌中和哺乳动物细胞中的用四嗪荧光基团的位点特异性荧光标记7。最近还报道了包含降冰片烯的氨基酸的整合8,9

已报道了包含反式环辛烯的氨基酸(tco)(2)的低效整合,其在固定的细胞中具有一些荧光标记的检测9

最近在有机溶剂中的模型反应进行的工作表明bcn(最初描述于与叠氮化物进行的张力促进的反应中)10和四嗪之间的反应可以非常快速地进行11。然而,与简单的用叠氮化物、硝酮12-16和四嗪9,17进行的环辛炔的非常慢的反应不同,此反应还未在水性介质中进行探索或还未探索作为化学选择性路径以标记大分子。

本发明意图克服与现有技术相关的问题。



技术实现要素:

在本领域中存在一些将四嗪化合物附着到多肽上的技术。然而,这些技术的反应速率很慢。此外,这些技术使得产生多种化学物质作为反应产物。这可能导致一些问题,如染料基团间可变的分子距离,其可能使荧光共振能量转移(fret)分析产生问题。这对治疗性分子的生产也可能是不利的,因为产物的异质性是本领域中的一个缺点。

本发明人已提供了一种具有双环[6.1.0]壬-4-炔-9-基甲醇(bcn)基团的新的氨基酸。这显著地增加了反应速度,这是有利的。此外,这允许进行单产物加成反应。这导致了均一的产物,这是一个优势。这也在产物中消除了异构体变体(空间异构体),这在一系列如本文所表明的应用中提供了技术优势。此外,bcn加成反应的产物不是差向异构的,而来自(例如)降冰片烯和/或tco反应的产物会产生差向异构体。因此,本发明的一个优势在于其还避免了差向异构体的问题。

因此,在一个方面中,本发明提供了包括具有双环[6.1.0]壬-4-炔-9-基甲醇(bcn)基团的氨基酸的多肽。这具有在加入(例如)四嗪化合物后提供单反应产物的优势。可替代的技术如降冰片烯加成或tco加成得到的产物是包含不同的异构体如区域或立体异构体的混合物。这一优势的一个原因在于分子的bcn部分具有镜面对称,使得产物是相同的,而对于tco/降冰片烯而言,分子的那一部分是手性的,使得可以附着到双键的“顶面”或“底面”,导致在产物中存在不同的异构体。

因此,当用于将其它的基团如四嗪化合物附着到多肽上时,本发明的优点在于提供了产物的均一性。

适当地,所述bcn基团作为赖氨酸的残基存在。

在另一个方面中,本发明涉及一种生产包含bcn基团的多肽的方法,所述方法包括将包含bcn基团的氨基酸遗传整合到多肽中。

适当地,生产所述多肽包括:

(i)提供编码多肽的核酸,该核酸包含编码具有bcn基团的氨基酸的正交密码子;

(ⅱ)在能够识别所述正交密码子的正交trna合成酶/trna对存在的情况下翻译所述核酸,并将具有bcn基团的氨基酸整合到多肽链上。

适当地,所述包含bcn基团的氨基酸是bcn赖氨酸。

适当地,所述正交密码子包括琥珀密码子(tag),所述trna包括mbtrnacua。适当地,所述具有bcn基团的氨基酸包括双环[6.1.0]壬-4-炔-9-基甲醇(bcn)赖氨酸。适当地,所述trna合成酶包含具有突变y271m、l274g和c313a的pylrs合成酶(bcnrs)。

适当地,所述具有bcn基团的氨基酸所整合的位置对应于野生型多肽中的赖氨酸残基的位置。其优势在于,使包含bcn的多肽与作为其来源的野生型多肽之间保持最接近的可能的结构关系。

在另一个方面中,本发明涉及一种如上所述的多肽,其包括单个bcn基团。因此,适当地,多肽包含单个bcn基团。这优势在于,可保持可能作用于bcn基团的任何其它化学修饰的特异性。例如,当在目标多肽中仅存在单个bcn基团时,有助于避免如下可能的问题,即部分修饰(如其中仅多肽中的部分bcn基团随后被修饰)或在相同多肽上的可替代的bcn基团之间变化的反应微环境(其可导致在多肽的不同位置的不同的bcn基团之间的不平等的反应性)。

bcn基团整合的关键优势在于其允许一系列非常有用的其它化合物如标记能够容易地且特异性地附着到bcn基团上。

在另一个方面中,本发明涉及一种如上所述的多肽,其中所述bcn基团连接到四嗪基团上。

在另一个方面中,本发明涉及一种如上所述的多肽,其中所述四嗪基团进一步连接到荧光团上。

适当地,所述荧光团包括荧光素、四甲罗丹明(tamra)或硼吡咯甲烷(bodipy)。

在另一个方面中,本发明涉及一种包含bcn基团的新的非天然氨基酸。

在另一个方面中,本发明涉及一种包含双环[6.1.0]壬-4-炔-9-基甲醇(bcn)的氨基酸。

在另一个方面中,本发明涉及一种氨基酸,其是双环[6.1.0]壬-4-炔-9-基甲醇(bcn)赖氨酸。

适当地,如上所述的bcn赖氨酸具有如下结构:

在另一个方面中,本发明涉及一种生产包含四嗪基团的多肽的方法,所述方法包括:提供如上所述的多肽,将所述多肽与四嗪化合物相接触,并孵育以允许通过反电子需求diels-alder环加成反应,将四嗪连接到bcn基团上。

适当地,四嗪选自图1的6至17。

适当地,反应的准一级速率常数至少为80m-1s-1

适当地,四嗪选自图1的6、7、8和9且反应的准一级速率常数至少为80m-1s-1

这种化学反应具有反应速度的优势。

适当地,允许所述反应进行10分钟或更少。

适当地,允许所述反应进行1分钟或更少。

适当地,允许所述反应进行30秒或更少。

值得注意的是,某些反应环境可能会影响反应时间。最适当地,最短时间如30秒或更少可应用于体外反应。

在体内或在真核生物培养条件如组织培养基或其它适合真核细胞的介质中的反应可能需要反应超过30秒以达到最大标记。熟练的操作者可以基于本文所提供的指导通过试错法来确定最佳反应时间。

适当地,所述四嗪化合物是选自图1的11和17的四嗪化合物。

在另一个方面中,本发明涉及一种包含突变y271m、l274g和c313a的pylrstrna合成酶。

适当地,所述pylrstrna合成酶的序列对应于包含突变y271m、l274g和c313a的mbpylrstrna合成酶的序列。

在另一个方面中,本发明涉及本发明的pylrstrna合成酶将包含双环[6.1.0]壬-4-炔-9-基甲醇(bcn)的氨基酸整合到多肽中的用途。

在另一个方面中,本发明涉及一种将包含双环[6.1.0]壬-4-炔-9-基甲醇(bcn)的氨基酸整合到多肽中的方法,其包含使用本发明的pylrstrna合成酶以整合所述氨基酸。

在另一个方面中,本发明涉及一种如上所述的均质的重组多肽。适当地,所述多肽由如上所述的方法进行制备。

还公开的是根据如本文所述的方法生产的多肽。并且作为这些新方法的产物,这样的多肽具有包括bcn的技术特征。

突变具有本领域中的正常含义,并且可以是指所涉及的残基、基序或结构域的取代、截短或缺失。可以在多肽水平上产生突变,例如通过合成具有突变序列的多肽,或者可以在核苷酸水平上产生突变,例如通过制备编码突变序列的核酸,该核酸随后可被翻译以产生突变多肽。其中,没有氨基酸被指定为给定突变位点的替换氨基酸,适当地,使用所述位点的随机化。作为缺省突变,可以使用丙氨酸(a)。适当地,在特定位点使用的突变如本文所列。

适当地,片段的长度至少为10个氨基酸,适当地至少为25个氨基酸,适当地至少为50个氨基酸,适当地至少为100个氨基酸,适当地至少为200个氨基酸,适当地至少为250个氨基酸,适当地至少为300个氨基酸,适当地至少为313个氨基酸,或适当地为目标多肽的大部分。

在此,我们证明了双环[6.1.0]壬-4-炔-9-基甲醇(bcn)和四嗪之间的荧光反应。这些反应的速率快于许多“生物正交”反应的速率3-7个数量级。我们描述了氨酰-trna合成酶/trna对和其用于将包含bcn的氨基酸,1,和包含反式环辛烯的氨基酸2(其与四嗪的反应也非常迅速)有效地位点特异性整合到大肠杆菌和哺乳动物细胞中表达的蛋白的用途。我们证明了在第一可测量的时间点(几秒钟或几分钟后)在体外、大肠杆菌中和活哺乳动物细胞中包含1和2的蛋白的位点特异性荧光标记。此外,我们证明了对于蛋白质组的四嗪标记的特异性,以及对于现有的“生物正交”反应,这一方法的优势(其组分可被编码)。开发的方法可在动物中用于位点特异性蛋白标记,并且发现其可用于标记和成像研究。

一种包含具有亲二烯体基团的氨基酸的多肽,其特征在于所述亲二烯体基团包含双环[6.1.0]壬-4-炔-9-基甲醇(bcn)基团。

我们描述了双环壬炔和反式环辛烯的遗传编码,其通过荧光diels-alder反应在体外和在活哺乳动物细胞中用于位点特异性蛋白标记。

本发明的方法可以在体内或体外实施。

在一个实施方式中,适当地,本发明的方法不用于人体或动物体。适当地,本发明的方法是体外方法。适当地,方法不需要人体或动物体的存在。适当地,方法不是人体或动物体的诊断、治疗或手术方法。

亲二烯体/反式-环辛烯(tco)方面

在一个宽的方面中,本发明涉及包含具有能够与四嗪基团反应的亲二烯体基团的氨基酸的多肽。

适当地,所述亲二烯体基团作为赖氨酸的残基存在。

在一个实施方式中,本发明涉及一种生产含有亲二烯体基团的多肽的方法,所述方法包括将含有亲二烯体基团的氨基酸遗传整合到多肽中。

适当地,生产此多肽包含:

(i)提供编码多肽的核酸,该核酸包含编码具有亲二烯体基团的氨基酸的正交密码子;

(ⅱ)在能够识别所述正交密码子的正交trna合成酶/trna对存在的情况下翻译所述核酸,并将具有亲二烯体基团的氨基酸整合到多肽链上。适当地,所述含有亲二烯体基团的氨基酸是亲二烯体赖氨酸。

适当地,所述正交密码子包括琥珀密码子(tag),所述trna包含mbtrnacua,所述具有亲二烯体基团的氨基酸包括含有反式-环辛烯-4-醇(tco)的氨基酸,以及所述trna合成酶包含具有突变y271a、l274m和c313a(tcors)的pylrs合成酶。

适当地,所述pylrstrna合成酶的序列对应于含有突变y271a、l274m和c313a(tcors)的mbpylrstrna合成酶的序列。在另一个方面中,本发明涉及本发明的pylrstrna合成酶用于将含有反式-环辛烯-4-醇(tco)的氨基酸整合到多肽中的用途。

在另一个方面中,本发明涉及一种将含有反式-环辛烯-4-醇(tco)的氨基酸整合到多肽中的方法,其包含使用本发明的pylrstrna合成酶以整合该氨基酸。

除非上下文另有说明,本文所讨论的将四嗪化合物连接到非天然氨基酸相关的方面,同样也用于tco氨基酸,因为它们作用于bcn氨基酸。

我们报道了非常快速的荧光的bcn与一系列四嗪在室温水性条件下的反应。bcn-四嗪反应的速率常数高于降冰片烯与相同的四嗪的反应500至1000倍。tco-四嗪反应的速率常数高于bcn与相同的四嗪的反应10-15倍。有张力的烯烃和四嗪之间的反应可能会导致非对映体和区域异构体以及来自二氢哒嗪异构化的异构体的混合物3,4

相反地,bcn四嗪反应导致形成单一的产物。这可能是应用中的一种优势,其中同质在探针附着的取向中可能是重要的,这包括单分子光谱和fret法。

我们描述了氨酰-trna合成酶/trna对及其引导1和2高效地位点特异性地整合到大肠杆菌和哺乳动物细胞中的蛋白的用途。

我们已证实,蛋白的特异性定量标记使用编码的氨基酸1和2可以在数秒钟内完成,而此过程使用编码的降冰片烯时需要数十分钟至数小时7,使用利用铜催化的点击化学并使用炔烃探针的编码的叠氮化物时需要数十小时21。虽然我们未观察到整合到哺乳动物细胞表面上的egfr中的叠氮化物与环辛炔的标记7,以及egfr中编码的降冰片烯的标记仅允许与四嗪在2小时后标记7,但使用纳摩尔浓度的四嗪-染料缀合物在所测量的第一时间点(2min)观察到了整合1和2的egfr的强且饱和的标记。这些实验证明,在小分子实验中所表征的快速的bcn-四嗪和tco-四嗪连接在不同环境的蛋白标记中转化为实质性进步。虽然我们已证明了这种方法在体外、在大肠杆菌中和在活哺乳动物细胞中的优势,使用pylrs/trnacua对29在线虫(c.elegans)中整合非天然氨基酸的能力表明,可能将如本文所述的标记方法拓展用于在动物中进行位点特异性蛋白标记。

遗传整合和多肽生产

在根据本发明的方法中,所述遗传整合优选使用正交的或延伸的遗传密码,其中一个或多个特异的正交密码子被分配以编码具有bcn基团的特异的氨基酸残基,使得其可以通过使用正交trna合成酶/trna对进行遗传整合。原则上,正交trna合成酶/trna对可以是任何能够使trna携带包含bcn基团的氨基酸且能够将含有bcn基团的氨基酸整合到响应正交密码子的多肽链中的对。

正交密码子可能是正交密码子琥珀、赭石、蛋白石或四联体密码子。简单地,密码子必须对应于用于携带含有bcn基团的氨基酸的正交trna。优选正交密码子是琥珀密码子。

值得注意的是,本文所示的具体实施例使用了琥珀密码子和相应的trna/trna合成酶。如上所述,这些是可以变化的。或者,为了使用其它密码子而不引起使用或选择能够与含有bcn基团的氨基酸作用的可替代的trna/trna合成酶对的麻烦,trna的反密码子区域可以简单地与所需的所选密码子的反密码子区域交换。反密码子区域不涉及trna的携带或整合功能,也不涉及trna合成酶的识别,因此这样的交换完全在熟练的操作者的范围内。

因此,如果需要,可以使用可替代的正交trna合成酶/trna对。

优选地,正交合成酶/trna对是巴氏甲烷八叠球菌(methanosarcinabarkeri)ms吡咯赖氨酸trna合成酶(mbpylrs)和其同源琥珀抑制子trna(mbtrnacua)。

巴氏甲烷八叠球菌pylt基因编码mbtrnacuatrna。

巴氏甲烷八叠球菌pyls基因编码mbpylrstrna合成酶蛋白。当特定的氨基酸残基使用数字编号指代时,编号采用mbpylrs(巴氏甲烷八叠球菌吡咯赖氨酰-trna合成酶)氨基酸序列作为参考序列(即由公开可获得的登录号为q46e77的野生型巴氏甲烷八叠球菌pyls基因所编码):

此处标注的所述序列在下文称为seqidno.1。

如果需要,本领域技术人员可以通过突变以适应mbpylrstrna合成酶蛋白,以优化所使用的bcn氨基酸。突变的需要取决于所使用的bcn氨基酸。一个实例是,当bcn氨基酸不被mbpylrstrna合成酶蛋白处理时,可能需要突变mbpylrstrna合成酶。

可以通过将突变引入到mbpylrstrna合成酶上来进行此类突变,例如在mbpylrstrna合成酶的如下的一个或多个位置上:m241、a267、y271、l274和c313。

一个实例是,当所述具有bcn基团的氨基酸包含双环[6.1.0]壬-4-炔-9-基甲醇(bcn)赖氨酸。适当地,所述trna合成酶包含pylrs合成酶,如具有突变y271m、l274g和c313a(bcnrs)的mbpylrs。

一个实例是,当所述具有亲二烯体基团的氨基酸包含含有反式-环辛烯-4-醇(tco)的氨基酸。合适地,所述trna合成酶包含pylrs合成酶,如具有突变y271a、l274m和c313a(tcors)的mbpylrs。

trna合成酶

本发明的trna合成酶可以变化。虽然具体的trna合成酶的序列可能已经用于实施例中,本发明并不意图仅限于这些实施例。

原则上,可以在本发明中使用任何提供相同的trna携带(氨酰化)功能的trna合成酶。

例如,trna合成酶可以来自任何合适的物种,如来自阿克雅(archea),如来自巴氏甲烷八叠球菌ms(methanosarcinabarkerims);巴氏甲烷八叠球菌属fusaro(methanosarcinabarkeristr.fusaro);马氏甲烷八叠球菌go1(methanosarcinamazeigo1);嗜乙酸甲烷八叠球菌c2a(methanosarcinaacetivoransc2a);嗜热甲烷八叠球菌(methanosarcinathermophila)或布氏甲烷八叠球菌(methanococcoidesburtonii)。或者trna合成酶可以来自细菌,如来自哥本哈根脱亚硫酸菌dcb-2(desulfitobacteriumhafniensedcb-2);哥本哈根脱亚硫酸菌y51(desulfitobacteriumhafniensey51);哥本哈根脱亚硫酸菌pcp1(desulfitobacteriumhafniensepcp1);醋酸氧化脱硫肠状菌dsm771(desulfotomaculumacetoxidansdsm771)。

来自这些生物体的示例性序列是公开可获得的序列。提供如下实例作为吡咯赖氨酸trna合成酶的示例性序列:

>巴氏甲烷八叠球菌ms/1-419/

巴氏甲烷八叠球菌ms

版本q6wrh6.1gi:74501411

mdkkpldvlisatglwmsrtgtlhkikhhevsrskiyiemacgdhlvvnnsrscrtarafrhhkyrktckrcrvsdedinnfltrstesknsvkvrvvsapkvkkampksvsrapkplensvsakastntsrsvpspakstpnssvpasapapsltrsqldrveallspedkislnmakpfrelepelvtrrkndfqrlytndredylgklerditkffvdrgfleikspilipaeyvermginndtelskqifrvdknlclrpmlaptlynylrkldrilpgpikifevgpcyrkesdgkehleeftmvnfcqmgsgctrenlealikefldyleidfeivgdscmvygdtldimhgdlelssavvgpvsldrewgidkpwigagfglerllkvmhgfknikrasrsesyyngistnl

>巴氏甲烷八叠球菌f/1-419/

巴氏甲烷八叠球菌属fusaro

版本yp_304395.1gi:73668380

mdkkpldvlisatglwmsrtgtlhkikhyevsrskiyiemacgdhlvvnnsrscrtarafrhhkyrktckrcrvsdedinnfltrstegktsvkvkvvsapkvkkampksvsrapkplenpvsakastdtsrsvpspakstpnspvptsapapsltrsqldrveallspedkislniakpfreleselvtrrkndfqrlytndredylgklerditkffvdrdfleikspilipaeyvermginndtelskqifrvdknlclrpmlaptlynylrkldrilpdpikifevgpcyrkesdgkehleeftmvnfcqmgsgctrenleslikefldyleidfeivgdscmvygdtldimhgdlelssavvgpvpldrewgidkpwigagfglerllkvmhgfknikrasrsesyyngistnl

>马氏甲烷八叠球菌/1-454

马氏甲烷八叠球菌go1

版本np_633469.1gi:21227547

mdkkplntlisatglwmsrtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl

>嗜乙酸甲烷八叠球菌/1-443

嗜乙酸甲烷八叠球菌c2a

版本np_615128.2gi:161484944

mdkkpldtlisatglwmsrtgmihkikhhevsrskiyiemacgerlvvnnsrssrtaralrhhkyrktcrhcrvsdedinnfltktseekttvkvkvvsaprvrkampksvarapkpleataqvplsgskpapatpvsapaqapapstgsasatsasaqrmansaaapaapvptsapaltkgqldrlegllspkdeisldsekpfrelesellsrrkkdlkriyaeerenylgklereitkffvdrgfleikspilipaeyvermginsdtelskqvfridknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenleaiiteflnhlgidfeiigdscmvygntldvmhddlelssavvgpvpldrewgidkpwigagfglerllkvmhgfknikraarsesyyngistnl

>嗜热甲烷八叠球菌/1-478

嗜热甲烷八叠球菌,版本dq017250.1gi:67773308

mdkkplntlisatglwmsrtgklhkirhhevskrkiyiemecgerlvvnnsrscraaralrhhkyrkickhcrvsdedlnkfltrtnedksnakvtvvsapkirkvmpksvartpkplentapvqtlpsesqpapttpisasttapaststtapapasttapapasttapasasttistsampastsaqgttkfnyisggfprpipvqasapaltksqidrlqgllspkdeisldsgtpfrklesellsrrrkdlkqiyaeerehylgklereitkffvdrgfleikspilipmeyiermgidndkelskqifrvdnnfclrpmlapnlynylrklnralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenleaiikdfldylgidfeivgdscmvygdtldvmhgdlelssavvgpvpmdrdwginkpwigagfglerllkvmhnfknikrasrsesyyngistnl

>布氏甲烷八叠球菌/1-416

布氏甲烷八叠球菌dsm6242,版本yp_566710.1gi:91774018

mekqlldvlvelngvwlsrsgllhgirnfeittkhihietdcgarftvrnsrssrsarslrhnkyrkpckrcrpadeqidrfvkktfkekrqtvsvfsspkkhvpkkpkvaviksfsistpspkeasvsnsiptpsisvvkdevkvpevkytpsqierlktlmspddkipiqdelpefkvlekeliqrrrddlkkmyeedredrlgklerditeffvdrgfleikspimipfeyiermgidkddhlnkqifrvdesmclrpmlapclynylrkldkvlpdpirifeigpcyrkesdgsshleeftmvnfcqmgsgctrenmealideflehlgieyeieadncmvygdtidimhgdlelssavvgpipldrewgvnkpwmgagfglerllkvrhnytnirrasrselyyngintnl

>哥本哈根脱亚硫酸菌_dcb-2/1-279

哥本哈根脱亚硫酸菌dcb-2

版本yp_002461289.1gi:219670854

mssfwtkvqyqrlkelnasgeqlemgfsdalsrdrafqgiehqlmsqgkrhleqlrtvkhrpalleleeglakalhqqgfvqvvtptiitksalakmtigedhplfsqvfwldgkkclrpmlapnlytlwrelerlwdkpirifeigtcyrkesqgaqhlneftmlnltelgtpleerhqrledmarwvleaagirefelvtessvvygdtvdvmkgdlelasgamgphfldekweivdpwvglgfglerllmiregtqhvqsmarslsyldgvrlnin

>哥本哈根脱亚硫酸菌_y51/1-312

哥本哈根脱亚硫酸菌y51

版本yp_521192.1gi:89897705

mdridhtdskfvqagetpvlpatfmfltrrdpplssfwtkvqyqrlkelnasgeqlemgfsdalsrdrafqgiehqlmsqgkrhleqlrtvkhrpalleleeglakalhqqgfvqvvtptiitksalakmtigedhplfsqvfwldgkkclrpmlapnlytlwrelerlwdkpirifeigtcyrkesqgaqhlneftmlnltelgtpleerhqrledmarwvleaagirefelvtessvvygdtvdvmkgdlelasgamgphfldekweivdpwvglgfglerllmiregtqhvqsmarslsyldgvrlnin

>哥本哈根脱亚硫酸菌pcp1/1-288

哥本哈根脱亚硫酸菌

版本ay692340.1gi:53771772

mfltrrdpplssfwtkvqyqrlkelnasgeqlemgfsdalsrdrafqgiehqlmsqgkrhleqlrtvkhrpalleleeklakalhqqgfvqvvtptiitksalakmtigedhplfsqvfwldgkkclrpmlapnlytlwrelerlwdkpirifeigtcyrkesqgaqhlneftmlnltelgtpleerhqrledmarwvleaagirefelvtessvvygdtvdvmkgdlelasgamgphfldekweifdpwvglgfglerllmiregtqhvqsmarslsyldgvrlnin

>醋酸氧化脱硫肠状菌/1-277

醋酸氧化脱硫肠状菌dsm771

版本yp_003189614.1gi:258513392

msflwtvsqqkrlselnaseeeknmsfsstsdreaaykrvemrlineskqrlnklrhetrpaicalenrlaaalrgagfvqvatpvilskkllgkmtitdehalfsqvfwieenkclrpmlapnlyyilkdllrlwekpvrifeigscfrkesqgsnhlneftmlnlvewglpeeqrqkriselaklvmdetgideyhlehaesvvygetvdvmhrdielgsgalgphfldgrwgvvgpwvgigfglerllmveqggqnvrsmgksltyldgvrlni

在通过突变trna合成酶已经提供了特定的trna携带(氨酰化)功能时,简单地使用另一种如选自上述中一种的野生型trna序列可能是不恰当的。这种情况下,重要的是保持同样的trna携带(氨酰化)功能。这可以通过把示范的trna合成酶中的突变转移到如选自上述中一种的备用的trna合成酶骨架上来实现。

通过这种方式,能将所选择的突变转移到相应的trna合成酶序列上,如来自示范的巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌序列以外的其它生物体的相应的pyls序列。

通过与已知的trna合成酶如示范的巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌的序列比对,可选择目标trna合成酶蛋白/骨架。

现通过参照pyls(吡咯赖氨酸trna合成酶)序列来阐述该问题,但所述原理同样适用于感兴趣的特定trna合成酶。

例如,图6提供了所有pyls序列的比对。这些序列可能出现低的整体百分比序列同一性。因此,重要的是例如通过将所述序列和已知trna合成酶进行序列比对(而不是简单地用低的序列同一性评分)对序列进行研究,以确保所用的序列的确是trna合成酶。

因此,适当地,当考虑序列同一性时,它被适当地认为是跨越如图6所示的trna合成酶。适当地,百分比同一性可以如图6所定义。图7显示trna合成酶之间序列同一性的图。适当地,百分比同一性可以如图7所定义。

关注催化区域可能是有用的。图8比对的仅仅是催化区域。这样做的目的是提供由其可以定义高百分比同一性的trna催化区域,以捕获/鉴别适合接受所引入的突变的骨架,从而产生相同的trna携带(氨酰化)功能,例如新的或非天然的氨基酸识别。

因此,适当地,当考虑序列同一性时,适当地,它被认为是跨越如图8所示的催化区域。适当地,百分比同一性可以如图8所定义。图9显示了催化区域之间序列同一性的图。适当地,百分比同一性可以如图9所定义。

通过定点突变(mutagenesis)编码trna合成酶骨架的核苷酸序列,可以将突变“转移”或“植入”到可选的trna合成酶骨架上。该技术在本领域里是众所熟知的。实质上,选择骨架pyls序列(例如用上面所讨论的活性位点比对)且将所选择的突变转移到(即安置在)相应的/同源位置。

当使用数字地址指代特定的氨基酸残基时,除非明显另外指明,否则编号使用mbpylrs(巴氏甲烷八叠球菌吡咯赖氨酸-trna合成酶)的氨基酸序列作为参考序列(即由公开可获得的登录号为q46e77的野生型巴氏甲烷八叠球菌pyls基因所编码):

入本领域广泛理解地使用该序列来定位目标残基。这并不总是一个严格的计数练习——必须注意环境或对齐。例如,如果目标蛋白的长度稍有不同,该序列中对应于(例如)l266的正确残基的定位可能需要将序列对齐,并挑出相当或相应的残基,而不是简单地取用目标序列的第266位残基。这完全在本领域技术人员的能力范围内。

本文所用的突变表示法是本领域的标准表示法。例如,l266m是指与野生型序列的第266位的l对应的氨基酸被替换为m。

其它trna骨架之间突变的植入现可参照示范性的巴氏甲烷八叠球菌和马氏甲烷八叠球菌的序列进行描述,但相同的原则可平等地用于植入到其它骨架或从其它骨架植入。

例如,mbackrs是用于ack的整合的工程化的合成酶。

亲本蛋白/骨架:巴氏甲烷八叠球菌pyls

突变:l266v、l270i、y271f、l274a、c317f

mbpckrs:用于pck的整合的工程化的合成酶。

亲本蛋白/骨架:巴氏甲烷八叠球菌pyls

突变:m241f、a267s、y271c、l274m

通过把这些突变植入至马氏甲烷八叠球菌pyls中能得到具有相同底物特异性的合成酶。在图10中可以看出两个合成酶的序列同源性。因此,可以通过将来自mb骨架的突变植入至mmtrna骨架上而产生下列合成酶:

mmackrs:引入突变l301v、l305i、y306f、l309a、c348f至马氏甲烷八叠球菌pyls;

mmpckrs:引入突变m276f、a302s、y306c、l309m至马氏甲烷八叠球菌pyls。

下面给出这些植入突变的示范性合成酶的全长序列。

>mb_pyls/1-419

mdkkpldvlisatglwmsrtgtlhkikhhevsrskiyiemacgdhlvvnnsrscrtarafrhhkyrktckrcrvsdedinnfltrstesknsvkvrvvsapkvkkampksvsrapkplensvsakastntsrsvpspakstpnssvpasapapsltrsqldrveallspedkislnmakpfrelepelvtrrkndfqrlytndredylgklerditkffvdrgfleikspilipaeyvermginndtelskqifrvdknlclrpmlaptlynylrkldrilpgpikifevgpcyrkesdgkehleeftmvnfcqmgsgctrenlealikefldyleidfeivgdscmvygdtldimhgdlelssavvgpvsldrewgidkpwigagfglerllkvmhgfknikrasrsesyyngistnl

>mb_ackrs/1-419

mdkkpldvlisatglwmsrtgtlhkikhhevsrskiyiemacgdhlvvnnsrscrtarafrhhkyrktckrcrvsgedinnfltrstesknsvkvrvvsapkvkkampksvsrapkplensvsakastntsrsvpspakstpnssvpasapapsltrsqldrveallspedkislnmakpfrelepelvtrrkndfqrlytndredylgklerditkffvdrgfleikspilipaeyvermginndtelskqifrvdknlclrpmvaptifnyarkldrilpgpikifevgpcyrkesdgkehleeftmvnffqmgsgctrenlealikefldyleidfeivgdscmvygdtldimhgdlelssavvgpvsldrewgidkpwigagfglerllkvmhgfknikrasrsesyyngistnl

>mb_pckrs/1-419

mdkkpldvlisatglwmsrtgtlhkikhhevsrskiyiemacgdhlvvnnsrscrtarafrhhkyrktckrcrvsdedinnfltrstesknsvkvrvvsapkvkkampksvsrapkplensvsakastntsrsvpspakstpnssvpasapapsltrsqldrveallspedkislnmakpfrelepelvtrrkndfqrlytndredylgklerditkffvdrgfleikspilipaeyverfginndtelskqifrvdknlclrpmlsptlcnymrkldrilpgpikifevgpcyrkesdgkehleeftmvnfcqmgsgctrenlealikefldyleidfeivgdscmvygdtldimhgdlelssavvgpvsldrewgidkpwigagfglerllkvmhgfknikrasrsesyyngistnl

>mm_pyls/1-454

mdkkplntlisatglwmsrtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl

>mm_ackrs/1-454

mdkkplntlisatglwmsrtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmvapnifnyarkldralpdpikifeigpcyrkesdgkehleeftmlnffqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl

>mm_pckrs/1-454

mdkkplntlisatglwmsrtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyierfgidndtelskqifrvdknfclrpmlspnlcnymrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl

同样的原则同样适用于其它突变和/或其它骨架。

可有利地对用这种方式产生的具有植入的多肽进行测试,以确保保留了期望的功能/底物特异性。

可以将编码用于上述方法的目标多肽的多核苷酸整合到重组的可复制载体中。该载体可用于在可相容的宿主细胞中复制该核酸。因此,在进一步的实施方式中,本发明提供了通过将本发明的多核苷酸引入到可复制载体、将该载体引入到可相容的宿主细胞并在使载体复制的条件下培养上述宿主细胞来生产本发明的多核苷酸的方法。所述载体可从宿主细胞中回收。适当地,宿主细胞包括如大肠杆菌的细菌。

优选地,本发明的多核苷酸在载体中与控制序列有效地连接,所述控制序列能够使宿主细胞表达编码序列,即所述载体为表达载体。术语“有效地连接”指的是所描述的组分处于允许其以预期的方式发挥作用的关系中。“有效地连接”到编码序列的调节序列以在与控制序列相容的条件下实现编码序列的表达的方式连接。

本发明的载体可被转化或转染到所描述的合适的宿主细胞中,以表达本发明的蛋白。该方法包括在使载体表达编码所述蛋白的编码序列的条件下培养转化有上述表达载体的宿主细胞,和任选地回收所表达的蛋白质。

载体可以是,例如提供有复制起点、任选的用于表达所述多核苷酸的启动子和任选的所述启动子的调节子的质粒或病毒载体。载体可包含一个或多个选择性标记基因,例如细菌质粒情况下的氨苄青霉素抗性基因。可以使用载体以例如转染或转化宿主细胞。

有效地连接到编码本发明的蛋白的序列上的控制序列包括启动子/增强子和其它表达调控信号。可选择这些控制序列以使其与经设计使表达载体用于其中的宿主细胞相容。术语启动子在本领域中是熟知的,包括在大小和复杂度上从最小启动子到包括上游元件和增强子的启动子的范围内的核酸区域。

本发明的另一个方面是一种方法,如一种体外方法,其将含有bcn的氨基酸遗传地且位点特异性地整合至所选择的蛋白质中,适当地,在真核细胞中。所述方法中的遗传整合的一个优势是其避免了一旦形成就要将含有bcn氨基酸的蛋白递送到细胞中的需要,这是因为在本实施方式中,所述蛋白可以直接在靶细胞中合成。方法包括如下步骤:

i)在编码蛋白的核苷酸序列的所期望的位点用正交密码子如琥珀密码子引入或替代一个特定的密码子

ⅱ)在细胞中引入正交trna合成酶/trna对的表达系统,如吡咯赖氨酰(pyrollysyl)-trna合成酶/trna对

ⅲ)使具有根据本发明的含有bcn的氨基酸的细胞在培养基中生长。

步骤(i)在蛋白的遗传序列的所期望的位点上用正交密码子如琥珀密码子承担或替代特定的密码子。这可以简单地通过引入具有编码蛋白的核苷酸序列的构建体(如质粒)来完成,其中将期望将含有bcn的氨基酸引入/替换的位点进行变化以包含正交密码子如琥珀密码子。这完全在本领域技术人员的能力之内且下述给出了此类的实施例。

步骤(ii)需要一个正交表达系统以在所期望的位置(如琥珀密码子)特异性整合含有bcn的氨基酸。因此,需要特异的正交trna合成酶如正交吡咯赖氨酰-trna合成酶和特异的相应的正交trna对,其一起能够使所述trna携带含有bcn的氨基酸。本文提供了此类的实施例。

蛋白表达与纯化

包含本发明的多核苷酸的宿主细胞可以用于表达本发明的蛋白质。可以在合适的允许表达本发明的蛋白的条件下培养宿主细胞。本发明的蛋白表达可以是组成型的,这使得其不断地产生,或者是可诱导的,这需要刺激以启动表达。在诱导表达的情况下,可以在需要时启动蛋白的生产,例如向培养基添加诱导物质如地塞米松或iptg。

可以通过各种本领域已知的技术从宿主细胞中提取本发明的蛋白质,包括酶、化学和/或渗透裂解和物理破坏。

可以通过本领域已知的标准技术如制备性色谱、亲和纯化或任何其它合适的技术来纯化本发明的蛋白质。

定义

术语“包括”(包含、含有)应被理解为具有本领域常规的含义,即包括规定的特征或一组特征,但该术语不排除还存在任何其它的规定的特征或一组特征。

附图说明

图1示出了本研究所使用的非天然氨基酸1至5和四嗪衍生物(6-17)的结构式。tamra-x、硼荧tmr-x、硼荧-fl和cfda是荧光团的通用名称;它们的结构式示于补充附图s4)。

图2示出了bcn-四嗪反应的动力学和光谱特征。a)反应的停流动力学;插图示出了四嗪7与5-降冰片烯-2-醇(nor)的缀合物,标注了不同的时间尺度;条件:c7=0.05mm、cbcn=cnor=5mm于meoh/h2o(55/45)中,25℃。b)7和bcn的反应的二级速率常数k。c)11与bcn的荧光反应。

图3示出了在大肠杆菌中使用bcnrs/trnacua或tcors/trnacua对的非天然氨基酸的高效、遗传编码的整合。a)sfgfp-his6的氨基酸依赖的过表达在150位上具有琥珀密码子。用抗his6抗体检测裂解物中的所表达的蛋白。b)用考马斯亮蓝染色的凝胶显示了纯化的蛋白。c-e)氨基酸整合的质谱:sfgfp-1-his6,实际:28017.54da,计算:28017.62da;sfgfp-2-his6,实际:27993.36da,计算:27992.82da;如本文所述,在3存在下所产生的sfgfp-his6,实际:28019.34da,计算:28019.63da。所有质谱中较小的灰色峰表示131da的损失,其对应于n-末端甲硫氨酸的蛋白水解裂解。

图4示出了重组蛋白与四嗪-荧光团的快速且特异的标记。a)具有1、2和4的sfgfp与四嗪-染料缀合物11(10eq)的特异性标记,如由sds-page和凝胶内荧光所表示的。对于在仅3存在的情况下所产生的sfgfp-his6,可以见到非常弱的亚化学计量标记。b)通过esi-ms证明了sfgfp-1与11的定量标记(生物缀合之前(蓝色谱,实际:28018.1±2da,计算:28017.6da)和生物缀合之后(红色谱,实际28824.2±2da,计算:28823.2da))。c)通过esi-ms证明了sfgfp-2与11的定量标记(生物缀合之前(蓝色谱,实际:27993.2±2da,计算:27992.8da)和生物缀合之后(红色谱,实际28799.4±2da,计算:28799.1da))。d)通过ms可以检测sfgfp-his6(在3存在的情况下表达的)与11未标记。e)含有位点特异性整合的氨基酸1和2的蛋白质的非常快速标记。sfgfp-1(左)和sfgfp-2(中)在其用于装载凝胶的数秒钟内与11定量标记,而在相同条件下,完全标记sfgfp-4需要1h(右)。

图5示出了在哺乳动物细胞中将1和2位点特异性整合到蛋白质中,以及11的细胞表面和细胞内哺乳动物蛋白质的快速且特异性的标记。a)western印迹证实了全长mcherry(tag)egfp-ha的表达依赖于1或2的存在,并且trnacua、bcnrs、tcors是flag标记的。b)活哺乳动物细胞中的细胞表面蛋白的特异和超快速标记。在128位具有1、2或5的egfr-gfp显示为转染细胞的膜上的绿色荧光(左组)。用11(400nm)处理细胞导致包含1或2的egfr的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。加入11后2分钟对细胞进行成像。c)活哺乳动物细胞中核蛋白的特异且快速标记。jun-1-mcherry显示为转染细胞的细胞核中的红色荧光(左组)。用可渗透细胞的四嗪染料17(200nm)处理细胞导致jun-1-mcherry的选择性标记(中组)。右组示出了合并的红色和绿色荧光。未观察到具有jun-5-mcherry的细胞的标记。

图6示出了pyls序列的比对。

图7示出了pyls序列的序列同一性。

图8示出了pyls序列的催化结构域的比对(从350至480;从图6的比对编号)。

图9示出了pyls序列的催化结构域的序列同一性。

图10示出了基于巴氏甲烷八叠球菌pyls或马氏甲烷八叠球菌pyls的具有植入的突变的合成酶的比对。红色星号表示突变位置。

图11示出了方案1。我们在体外、在大肠杆菌中和在哺乳动物细胞中证明了非天然氨基酸1和2的合成、遗传编码和荧光标记。

图12(补充附图s1)示出了lc/ms迹线(254nm),其显示了在meoh中,相应的四嗪(6、7、9和8)与2当量的bcn(外/内混合物~4/1)的反应中,哒嗪产物(6-bcn、7-bcn、9-bcn、8-bcn)的形成。所有质量以道尔顿形式给出。在室温下孵育反应10至30分钟后获得hplc迹线。转换成哒嗪产物的总体产率为>98%。

图13(补充附图s2)示出了使用停流装置通过uv-光谱测定各个四嗪与bcn的反应的速率常数k。(a)bcn加成(100eq=5mm)产生的化合物6在320nm处的uv吸光度的响应;将数据拟合至单指数方程,测量k'值(左组);每个测量进行三至五次,并将所观察到的速率k'的平均值对bcn的浓度作图,以从曲线的斜率中获得速率常数k。对所有四个四嗪,进行完整测量组,一式两份(中组和右组),值的平均值报告于补充表1中。,四嗪7、9和8的(b-d)如(a)一样。条件:c四嗪=0.05mm于9/1的h2o/meoh中,cbcn=0.5至5mm于meoh中,导致最终在55/45的meoh/h2o混合物中。所有实验于25℃记录。

图14(补充附图s3)示出了使用停流设备通过uv-光谱测定四嗪6和7与tco的反应中的速率常数k。(a)tco加成(100eq=5mm)产生的化合物6在320nm处的uv吸光度的响应;通过将数据拟合到两个单指数方程之和中,测定快速单指数方程的k'值(左组);每个测量进行三至五次,并将所观察到的速率k'对tco的浓度作图,以从曲线的斜率获得速率常数k。对两个四嗪,进行完整测量组,至少一式两份(中组和右组),值的平均值报告于补充表1中。四嗪7(b)如(a)一样。条件:c四嗪=0.05mm于9/1的h2o/meoh中,ctco=0.5至5mm于meoh中,导致最终在55/45的meoh/h2o混合物中。所有实验于25℃记录。

图15(补充附图s4)示出了在本研究中所使用的各种四嗪荧光团的结构式。可以在参考文献2中找到这些四嗪-荧光团的合成和特征化的细节。

图16(补充附图s5)示出了在与9-羟甲基双环[6.1.0]壬炔(bcn)的反应中“开启”的四嗪-荧光团的荧光。将水中的2mm相应的四嗪-荧光团溶液(2mm于dmso中)与300当量的bcn反应。在添加bcn之前和之后30min记录发射光谱。激发波长:tamra-染料和硼荧-tmr-x:550nm;硼荧-fl:490nm。

图17(补充附图s6)示出了在150位具有琥珀密码子的sfgfp-his6的氨基酸依赖性表达。使用抗-his6抗体检测裂解物中表达的蛋白。使用氨基酸1的纯化的外型或内型非对映体表明外型形式优选通过bcnrs/trnacua整合至sfgfp中。

图18(补充附图s7)示出了sfgfp-1与各种四嗪的标记反应的lc-ms特征。黑色峰表示在标记前sfgfp-1的实际质量,彩色峰是sfgfp-1与6、7、9和8反应后的实际质量。所有的质量以道尔顿形式给出。与所有四嗪的标记是特异性的且定量的。反应条件:向~10μm的sfgfp-1溶液(于20mmtris-hcl、100mmnacl、2mmedta中,ph7.4)添加10当量的相应的四嗪(于甲醇中的1mm储备液),并将反应混合物在室温下孵育10至30分钟。

图19(补充附图s8)示出了lc-ms显示了sfgfp-1与四嗪荧光团缀合物12、16、13和14的特异性和定量标记。红峰表示在标记前sfgfp-1的实际质量,彩色峰是sfgfp-1与12(a)、16(b)、13(c)和14(d)反应之后的实际质量。以道尔顿形式给出预期和实际的质量值。与所有的四嗪-荧光团的标记是特异性且定量的。反应条件:向~10μm的sfgfp-1溶液(于20mmtris-hcl、100mmnacl、2mmedta中,ph7.4)添加10当量的相应的四嗪染料(于dmso中的2mm储备液),并将反应混合物在室温下孵育10至30分钟。

图20(补充附图s9)示出了在sfgfp对大肠杆菌蛋白质组中的标记1和2的特异性。考马斯亮蓝染色的凝胶示出了在指定浓度的非天然氨基酸1、2、3(外型和内型非对映体)和5存在的情况下产生sfgfp的大肠杆菌中的蛋白质。在凝胶中,荧光凝胶示出了与四嗪-染料缀合物11的特异性标记。虽然氨基酸1、2和3-外型以相似水平进行整合(从考马斯染色凝胶和western印迹来判断),我们观察到在3-外型和3-内型存在的情况下仅产生非常弱的亚化学计量的sfgfp的标记。这些观察与在3的反式烯烃至其顺式异构体的片段的体内转化相一致。

图21(补充附图s10)示出了在sfgfp对大肠杆菌蛋白质组中的标记1的特异性。泳道1-5:考马斯亮蓝染色凝胶示出了在指定浓度的非天然氨基酸1和5存在的情况下产生sfgfp的大肠杆菌中的蛋白质。泳道6-10:使用抗-his6抗体检测裂解物中的表达的蛋白。泳道11-15:指定荧光团11标记的蛋白的荧光图像。

图22(补充附图s11)示出了2分钟的egfr-gfp与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(400nm)处理细胞导致含有1的egfr-gfp的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后2分钟对细胞进行成像。在相同的未表达egfr-gfp的样品中未观察到细胞标记,且具有egfr-5-gfp的细胞未被11标记。

图23(补充附图s12)示出了5分钟的egfr-gfp与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(400nm)处理细胞导致含有1的egfr-gfp的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后5分钟对细胞进行成像。在相同的未表达egfr-gfp的样品中未观察到细胞标记,且具有egfr-5-gfp的细胞未被11标记。

图24(补充附图s13)示出了10分钟的egfr-gfp与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(400nm)处理细胞导致含有1的egfr-gfp的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后10分钟对细胞进行成像。在相同的未表达egfr-gfp的样品中未观察到细胞标记,且具有egfr-5-gfp的细胞未被11标记。

图25(补充附图s14)示出了与包含氨基酸1的egfr-gfp的超快速的标记相比,使具有egfr-4-gfp的细胞特异性标记上四嗪-荧光团缀合物112花费了2小时。

在128位具有4的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(200nm)处理细胞导致含有4的egfr-gfp的标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后2小时对细胞进行成像。

图26(补充附图s15)示出了2分钟的egfr-gfp与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有2的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(400nm)处理细胞导致含有2的egfr-gfp的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后2分钟对细胞进行成像。在相同的未表达egfr-gfp的样品中未观察到细胞标记,且具有egfr-5-gfp的细胞未被11标记。

图27(补充附图s16)示出了5分钟的egfr-gfp与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有2的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(400nm)处理细胞导致含有2的egfr-gfp的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后5分钟对细胞进行成像。在相同的未表达egfr-gfp的样品中未观察到细胞标记,且具有egfr-5-gfp的细胞未被11标记。

图28(补充附图s17)示出了30和60分钟的在哺乳动物细胞中3的位点特异性整合和egfr-gfp与四嗪-荧光团缀合物11的标记。a)western印迹表明,全长mcherry(tag)egfp-ha的表达依赖于3或5和trnacua的存在。bcnrs和pylrs被flag标记。b和c)在128位存在3的egfr-gfp在转染细胞的膜上显示为绿色荧光(左组)。用11(400nm)处理细胞导致微弱但可测量到的含有3的egfr-gfp的标记(中组)。这一观察与在哺乳动物细胞中的3的片段的反式烯键到其顺式的异构化相一致。右组示出了合并的绿色和红色荧光图像,dic=微分干涉对比。在添加11之后30或60分钟对细胞进行成像。在相同的未表达egfr-gfp的样品中未观察到细胞标记。

图29(补充附图s18)示出了在活哺乳动物细胞中核蛋白的特异性且超快速的标记。jun-1-mcherry在转染细胞的核内显示为红色荧光(左组)。用可渗透细胞的四嗪染料17(200nm)处理细胞导致jun-1-mcherry的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像。dic=微分干涉对比。在添加11之后15分钟对细胞进行成像。在相同的未表达jun-mcherry的样品中未观察到细胞标记,且具有jun-5-mcherry的细胞未被11标记。

具体实施方式

本发明现通过实施例的方式进行描述。这些实施例旨在是说明性的,并不旨在限制所附的权利要求。

实施例

我们开发了四嗪和bcn之间的快速的且荧光的反应,并在大肠杆菌和哺乳动物细胞中证明了含有氨基酸1和2的bcn和反式环辛烯的遗传编码。我们示出了蛋白的在大肠杆菌和在活哺乳动物细胞中与四嗪探针的特异性和快速标记,并明确地证明了相对于以前报道的生物正交标记策略,此方法的优势(图11-方案1)。

实施例1:化学与加成反应

测量了各种亲二烯体(bcn、tco(反式-环辛烯-4-醇)和stco(双环[6.1.0]壬-4-烯-9-基甲醇))与四嗪的反应的速率常数3-5、9、11。然而,在许多情况下,研究人员已经使用了不同的四嗪、溶剂系统或测量方法,这使定量比较各种亲二烯体与目标四嗪的反应性变得具有挑战。我们最初的实验确认了,各种亲二烯体与四嗪6(图1)的反应的速率太快以至于不能在准一级条件下通过手工混合研究。因此,我们转向停流技术以直接确定这些反应的准一级速率常数。通过归结在甲醇/水(55/45)混合物中与10至100倍过量的bcn反应时在320nm的吸光度的指数衰减,我们确定了bcn与6和7的反应的速率常数分别是437m-1s-1(+/-13)和1245m-1s-1(+/-45)。lc-ms和nmr证实了预期产物的形成(补充信息和补充附图1)。在相同条件下,我们确定了tco与6和7的速率常数分别是5235m-1s-1(+/-258)和17248m-1s-1(+/-3132)。这些数据证明了bcn和6之间的反应比5-降冰片烯-2-醇和6之间的反应快约1000倍7,而tco速率比bcn速率快约10-15倍。stco速率太快而难以由停流技术进行精确地测量,并且我们估计其比tco速率快至少50倍。在bcn与四嗪8和9的反应中观察到了相似的速率加速(图1、图2a和2b、补充表1和补充附图s2和s3)。

补充表1:使用停流装置在25℃于准一级条件下所测量的各种四嗪(6、7、9和8)与bcn和tco的反应的速率常数k,与在21℃相同的四嗪与5-降冰片烯-2-醇的反应的速率常数相比较2。数值通过至少两个独立的测量来确定。溶剂体系:55/45甲醇/水。bcn与四嗪的环加成反应比5-降冰片烯-2-醇的反应快500至1000倍,tco和四嗪之间的反应比bcn和四嗪之间的反应快10至15倍。

数个四嗪荧光团缀合物,包括11、13、14和16(附图1,补充附图s4)相对于游离荧光团而言是基本上猝灭的,观察到荧光团的发射能量转移到邻近的四嗪发色团具有510和530nm之间的最大吸光度7、18。我们发现,bcn与四嗪荧光团缀合物11、13、14和16的反应导致荧光的5-10倍的增加,这表明哒嗪产物的形成有效地减轻了荧光猝灭(图2c和补充附图s5)。bcn和这些四嗪之间的荧光反应,像有张力的烯烃和这些四嗪之间的反应一样7、18,利于成像实验,这是因为其最大化了标记信号,而最小化了游离四嗪荧光团所产生的荧光。

实施例2:氨基酸设计

接着,我们的目的是设计、合成和遗传编码具有bcn、tco和stco的氨基酸以用于在体外和在细胞中将位点特异性蛋白标记不同的探针。来自包括巴氏甲烷八叠球菌(mb)和马氏甲烷八叠球菌(mm)的甲烷八叠球菌属的吡咯赖氨酰-trna合成酶(pylrs)/trnacua对和其演化衍生物用于指导越来越多的响应琥珀密码子的结构多样的非天然氨基酸的位点特异性整合19-26。pylrs/trnacua对正在成为可能的最通用的系统,以用于将非天然氨基酸整合到蛋白质中,由于其在一系列宿主中是正交的,允许演化自大肠杆菌的合成酶在越来越多的细胞和组织中用于遗传密码延伸,这包括:大肠杆菌、鼠伤寒沙门氏菌、酵母、人类细胞和线虫7、27-31。我们设计了非天然氨基酸1、2和3(附图1),目的是用pylrs/trnacua对或演化衍生物将它们整合到蛋白中。氨基酸的合成如补充信息中所述。

实施例3:遗传整合到多肽和trna合成酶

我们筛选了mbpylrs/trnacua对以及一组mbpylrs的突变体,其是先前在我们实验室中生产的并用于将不同的非天然氨基酸位点特异性地整合到蛋白质中,其能指导1、2和3通过响应在150位引入的琥珀密码子整合入c末端六聚组氨酸-(his6)标签的超折叠绿色荧光蛋白(sfgfp)。mbpylrs/trnacua对没有指导任何所测试的非天然氨基酸的整合,如通过抗c末端his6标签的western印迹来判断。然而,包含mbpylrs突变体、在酶活性位点包含三个氨基酸取代y271m、l274g、c313a32(我们命名为bcn-trna合成酶,bcnrs)的细胞,编码mbtrnacua和在150位具有琥珀密码子的sfgfp-his6(psfgfp150tagpylt-his6)的质粒引起全长sfgfp-his6的氨基酸依赖性合成,如通过抗-his6的western印迹和考马斯染色所判断的(图3a)。使用1及其内型异构体的额外的蛋白表达实验证明了通过bcnrs/trnacua优选外型整合到蛋白中(补充附图s6)。我们发现了另外的合成酶突变体,其具有突变y271a、l274m和c313a32,我们将其命名为tco-trna合成酶,tcors。tcors/trnacua对在2存在的情况下引起来自psfgfp150tagpylt-his6的sfgfp的氨基酸依赖性合成。最后,我们发现bcnrs/trnacua对和tcors/trnacua对在3存在的情况下都引起来自psfgfp150tagpylt-his6的sfgfp的氨基酸依赖性合成。对于每个氨基酸,在his-标签和凝胶过滤纯化后以良好收率分离了sfgfp(每l培养基6-12mg,图3b)。这相当于其它良好整合的非天然氨基酸(包括5)所得到的产率。在各个非天然氨基酸存在的情况下psfgfp150tagpylt-his6所产生的sfgfp的电喷雾电离质谱(esi-ms)与它们的位点特异性整合相一致(图3c-3e)。

实施例4:位点特异性整合

为了证明四嗪-染料-探针与具有位点特异性整合的1的重组蛋白有效地且特异性地反应,我们在室温下用10当量的四嗪荧光团缀合物11标记纯化的sfgfp-1-his61小时。sds-page和esi-ms分析证实了含有1的sfgfp的定量标记(图4a和4b)。对照实验表明,在与用于标记sfgfp-1的相同条件下sfgfp-4被标记,且没有检测到与sfgfp-5的非特异性标记。esi-ms证明sfgfp-1可有效地和特异性地与一系列四嗪6、7、8和9衍生化(补充附图s7),与四嗪荧光团缀合物12、13、14和16衍生化(补充附图s8)。我们还证明了纯化的sfgfp-2-his6可以与四嗪荧光团11进行定量标记(图4a和4c)。有趣的是,我们观察到仅有非常微弱的sfgfp-his6的标记,其纯化自表达tcors/trnacua和psfgfp150tagpylt-his6的细胞,并在3存在的情况下生长(图4a和4d)且在纯化前存在此蛋白的亚化学计量的标记(补充附图s9)。由于在3存在的情况下所表达的sfgfp具有与3的整合相对应的质量,这些观察与3中的反式烯烃部分体内转化与其无反应性的顺式异构体相一致。已知此异构化发生于硫醇存在的情况下4

实施例5:反应的特异性和选择性

为了进一步证明,bcn和各种四嗪基染料之间的反应不仅高效和特异性而且在细胞环境中具有高度选择性,我们在表达sfgfp-1-his6的大肠杆菌中进行反应(补充附图s10)。在诱导蛋白表达后4小时收集表达不同水平的sfgfp-1的细胞(通过调整添加至细胞的1的浓度来控制),用pbs洗涤并在室温下与四嗪染料11孵育30分钟。加入过量的bcn以猝灭未反应的四嗪染料之后,将细胞裂解并分析反应混合物。凝胶内荧光证明了具有1的重组sfgfp与四嗪缀合的tamra染料11的特异性标记。虽然裂解物中的许多蛋白质的丰度与sfgfp-1相当,我们仅观察到极少的背景标记,这表明此反应对于大肠杆菌蛋白质组是特异性的。

实施例6:标记的速度

为了研究在小分子中观察到的bcn-四嗪环和tco-四嗪环加成反应的速度是否转化为异常快速的蛋白标记,我们比较了具有1、2或4的纯化的sfgfp与10当量的四嗪-荧光团缀合物11的标记。作为时间函数的标记反应的凝胶内荧光成像(图4e)表明了在约1小时内sfgfp-4的反应得以完成。相比之下,sfgfp-1和sfgfp-2的标记在用于测量第一时间点的几秒钟内完成,这表明bcn-四嗪和tco-四嗪反应的速率加素转换成了快速得多蛋白标记。

实施例7:应用于哺乳动物细胞

为了证明哺乳动物细胞中的氨基酸1和2的整合,我们通过植入突变创建了bcnrs和tcors的哺乳动物优化版本,以允许1或2整合进哺乳动物优化的mbpylrs中。通过western印迹,我们证明了通过使用bcnrs/trnacua对或tcors/trnacua,1和2均可以在哺乳动物细胞中高效地遗传编码进蛋白(图5a)。

为了研究快速bcn-四嗪连接是否提供了在哺乳动物细胞中的位点特异性标记蛋白的优势,我们在含有bcnrs/trnacua对的hek-293细胞中、在1存在(0.5mm)的情况下表达了在128位具有琥珀密码子的表皮生长因子受体(egfr)-绿色荧光蛋白(gfp)融合体(egfr(128tag)gfp)。在1存在的情况下产生了全长的egfr-1-gfp,这导致在细胞膜上产生了明亮的绿色荧光。为了将egfr的128位上的1(其在受体的胞外结构域中)与四嗪荧光团缀合物相标记,我们将细胞与11(400nm)孵育,改变培养基并将tamra标记所产生的红色荧光和全长egfr-gfp表达所产生的绿色荧光进行成像。tamra荧光与细胞表面的egfr-gfp荧光很好地共定位。在我们可测量的第一时间点,2分钟内观察到具有egfr-1-gfp的细胞的清晰的标记;其它时间点证明,标记在2分钟内达到饱和(图5b和补充附图s11-s14);用四嗪荧光团12得到了类似的结果。将2整合进egfr-gfp融合体产生与四嗪荧光团11的相似地快速且有效的标记(图5b和补充附图s15-s16)。相比之下,在相同条件下,经过2小时,我们才观察到具有egfr-4-gfp的细胞的特异性标记(补充附图s14)7。在对照实验中,我们观察到具有egfr-5-gfp的细胞无标记且未表达egfr-gfp的细胞未检测到非特异性标记。我们观察到,在bcnrs/trnacua对和3存在的情况下hek293细胞中所表达的egfr-gfp(来自egfr(128tag)gfp)的微弱但可测量的标记(补充附图s17)。这些观察与哺乳动物细胞中的3的片段的异构化相一致,并与我们在大肠杆菌中的观察相一致。

为了证明在哺乳动物细胞中胞内蛋白的快速标记,我们从在junb(jun)和mcherry之间的接头上具有琥珀密码子的基因中表达了具有c-末端mcherry融合的转录因子,jun。在氨基酸1和bcnkrs/trnacua对存在的情况下,在hek细胞中产生了jun-1-mcherry蛋白,与所预期的一样,其定位于细胞的细胞核(图5c和补充附图s18)。与可渗透细胞的二乙酰荧光素四嗪缀合物(200nm)的标记产生了绿色荧光,其与在第一时间点所分析的mcherry信号很好地共定位(15min标记,随后洗涤90min)。在相同样品中的未转染细胞中或表达jun-5-mcherry的对照细胞中没有观察到特异性标记,这进一步证实了胞内标记的特异性。

补充实施例

蛋白质的表达和纯化

为了表达整合有非天然氨基酸1的sfgfp,我们用pbkbcnrs(其编码mbbcnrs)和psfgfp150tagpylt-his6(其编码mbtrnacua和在150位具有琥珀密码子的c-末端六聚组氨酸标记的sfgfp基因)转化大肠杆菌dh10b细胞。在37℃于1ml的s.o.b培养基(补充有0.2%的葡萄糖)恢复细胞1小时,之后在100ml含有氨苄青霉素(100μg/ml)和四环素(25μg/ml)的lb中孵育(16h、37℃、230r.p.m)。使用20ml这种过夜培养物接种1l补充有氨苄青霉素(50μg/ml)和四环素(12μg/ml)的lb,并在37℃孵育。在od600=0.4至0.5时,添加在h2o中的1的溶液使得最终浓度为2mm。30min之后,通过加入终浓度为0.2%的阿拉伯糖诱导蛋白表达。诱导3h后,离心收集细胞并在-80℃中冷冻备用。将细胞在冰上解冻并悬浮于30ml的裂解缓冲液(10mmtris-hcl、20mm咪唑、200mmnacl,ph8,1mm苯甲基磺酰氟、1mg/ml溶菌酶、100μg/mldnasea、roche蛋白酶抑制剂)中。于4℃超声提取蛋白。通过离心将提取物澄清(20min、21.000g、4℃),将600μl的ni2+-nta珠(qiagen)加入到提取物中并将混合物在4℃搅拌孵育1小时。通过离心(10min、1000g)收集珠。将珠重悬于30ml洗涤缓冲液(20mmtris-hcl、30mm咪唑、300mmnacl,ph8)并于1000g离心,重复三次。随后,将珠重悬于10ml的洗涤缓冲液中,并转移到柱中。用3ml补充有200mm咪唑的洗涤缓冲液洗脱蛋白并通过尺寸排阻色谱法采用hiload16/60superdex75制备级柱(gelifesciences)以1ml/min的流速(缓冲液:20mmtris-hcl、100mmnacl、2mmedta,ph7.4)进一步进行纯化。将含有蛋白质的级分收集并用amiconultra-153kdamwco离心过滤装置(millipore)浓缩。通过4-12%的sds-page分析纯化的蛋白质并通过质谱确认其质量(见补充信息)。用相同的方式制备具有整合的2和3的sfgfp:sfgfp-2、sfgfp-3,预期用pbktcors(其编码mbtcors)和psfgfp150tagpylt-his6(其编码mbtrnacua和在150位具有琥珀密码子的c-末端六聚组氨酸标记的sfgfp基因)转化细胞。用相同的方式制备具有整合的4和5的sfgfp:sfgfp-4、sfgfp-5,预期用pbkpylrs(其编码mbpylrs)和psfgfp150tagpylt-his6(其编码mbtrnacua和在150位具有琥珀密码子的c-末端六聚组氨酸标记的sfgfp基因)转化细胞。纯化蛋白的产量达到6-12mg/l。

蛋白质谱

通过使用agilent1200lc-ms系统,用6130四极谱仪进行esi-ms。溶剂体系由作为缓冲液a的h2o中的0.2%甲酸和作为缓冲液b的乙腈(mecn)中的0.2%甲酸组成。使用phenomenexjupiterc4柱(150x2mm、5μm)对蛋白进行lc-esi-ms,并且根据214和280nm的蛋白uv吸光度,在正模式中分析样品。用mschemstation软件(agilenttechnologies)通过反褶积计算总蛋白质量。

此外,在具有电喷雾电离的lct飞行时间质谱仪(esi,micromass)上确定蛋白总质量。蛋白质重缓冲于20mm的碳酸氢铵中并与包含1%甲酸的乙腈1:1混合。或者用c4ziptip(millipore)制备样品并直接灌注于包含1%甲酸的50%乙腈水溶液中。以10μlmin-1的速度注射样品并用马心肌红蛋白在正离子模式下进行校准。将30个扫描进行平均,并用masslynx版本4.1(micromass)通过最大熵反褶积获得分子质量。使用protparam(http://us.expasy.org/tools/protparam.html)计算野生型蛋白质的理论质量,并手工校正包含非天然氨基酸的蛋白质的理论质量。

经四嗪-bcn或四嗪-tco环加成的蛋白标记

用不同的四嗪体外标记纯化的蛋白质

向40μl纯化的重组蛋白(~10μm于20mmtris-hcl、100mmnacl、2mmedta,ph7.4)添加4μl的1mm的溶于meoh的四嗪化合物6、7、8或9溶液(~10或20当量)。室温孵育30分钟后,通过lc-esi-ms分析溶液。(补充附图s9)

用四嗪和四嗪-染料缀合物体外标记纯化的蛋白质:

将具有位点特异性整合的1或2的纯化的重组sfgfp:sfgfp-1或sfgfp-2(~10μm于20mmtris-hcl、100mmnacl、2mmedta,ph7.4)分别与10当量的四嗪-染料缀合物11、12、13、14、15或16(2mm于dmso中)进行孵育。室温下孵育溶液,并在30分钟至3小时后取等分试样,通过sdspage分析,用c4-ziptip脱盐后通过esi-ms进行分析。用考马斯亮蓝染色sdspage凝胶或用typhoon成像仪扫描sdspage凝胶以将凝胶内荧光可视化(图4和补充附图s8)。

作为时间函数的四嗪-染料缀合物体外标记纯化的蛋白质:

将2nmol纯化的sfgfp-1、sfgfp-2或sfgfp-4(10μm于20mmtris-hcl、100mmnacl、2mmedta,ph7.4中)与20nmol的四嗪-染料缀合物11(10μl于dmso中的2mm的溶液)孵育。在不同的时间点(0、30s、1min、2min、5min、10min、30min、1h、2h、3h)从溶液中取出8μl的等分试样并用700倍过量的bcn或tco猝灭并投入液氮中。将样品与补充有5%β-巯基乙醇的nupagelds样品缓冲液混合,加热10min至90℃,并通过4-12%的sdspage进行分析。通过用typhoontrio磷光成像仪(gelifesciences)扫描荧光带对标记的蛋白的量进行定量。使用橡皮筋(rubberband)背景减法用imagequanttmtl软件(gelifesciences)对带进行定量。凝胶内荧光显示了sfgfp-4与10当量的四嗪荧光团11的标记在1h内完成(图4e),而sfgfp-1和sfgfp-2的标记在用于测量第一时间点的数秒钟内完成。

用四嗪-染料缀合物标记整个大肠杆菌蛋白质组:

将含有psfgfp150tagpylt-his6和pbkbcnrs或者psfgfp150tagpylt-his6和pbkpylrs的大肠杆菌dh10b细胞接种于含有氨苄青霉素(对于pbkbcnrs,100μg/ml)或卡那霉素(对于pbkpylrs,50μg/ml)和四环素(25μg/ml)的lb中。在37℃以250rpm将细胞振摇孵育过夜。将2ml过夜培养物接种到100ml的补充有氨苄青霉素(50μg/ml)和四环素(12μg/ml)或者卡那霉素(25μg/ml)和四环素(12μg/ml)的lb中,在37℃孵育。当od600=0.5时,移出3ml培养物等分试样并补充不同浓度(1mm、2mm和5mm)的1和1mm的5。37℃振摇孵育30min后,通过加入30μl的20%阿拉伯糖诱导蛋白表达。表达3.5h后,离心(16000g,5min)1ml的细胞悬浮液收集细胞。将细胞重悬浮于pbs缓冲液中,再次离心,弃去上清液。此过程重复多于两次。最后,将洗涤的细胞沉淀物悬浮于100μl的pbs中,并在室温下与3μl的四嗪-染料缀合物11(2mm于dmso中)孵育30分钟。添加200倍过量的bcn以猝灭未反应的四嗪染料之后,将细胞重悬浮于100μl补充有5%β-巯基乙醇的nupagelds样品缓冲液中,于90℃加热10min并16000g离心10min。通过4-12%sds-page分析粗细胞裂解物以评估蛋白质水平。用考马斯亮蓝染色或用typhoon成像仪扫描凝胶,以使荧光带显色(补充附图s9和s10)。用抗六聚组氨酸标签的抗体进行western印迹(cellsignalingtechnology,his标签27e8鼠mab#2366)。

停流确定小分子环加成的动力学速率常数

在准一级条件下、用甲醇/水混合物中10至100倍过量的bcn或tco,之后用停流装置随时间在320、300或280nm处四嗪的uv吸光度的指数衰减来测量不同的四嗪的速率常数k(appliedphotophysics,补充附图s2和s3和补充表1)。制备各个四嗪(0.1mm于9/1水/甲醇中)以及bcn和tco(1至10mm于甲醇中)的储备液。测量前,四嗪以及bcn和tco溶液均在停流装置的注射器中恒温化。通过停流装置混合等体积的制备的储备液,使得最终浓度为0.05mm的四嗪和0.5至5mm的bcn或tco,对应于10至100当量的bcn或tco。使用下列仪器参数记录光谱:对于6和7,波长为320nm;对于8,波长为300nm;对于9,波长为280nm;每秒500至5000个数据点)。所有测量均在25℃进行。bcn-四嗪反应的数据拟合到单指数方程,并且tco-四嗪反应的数据拟合到两个单指数方程之和。每个测量进行三至五次,将所观察到的速率k'的平均(如果是tco-四嗪反应,则是第一指数方程)与bcn或tco的浓度作图,以从图的斜率中获得速率常数k。对于所有4个四嗪,一式两份进行完整的测量组,值的平均值示于补充表1中。使用kaleidagraph软件(synergysoftware,reading,uk)处理所有数据。

克隆哺乳动物细胞的应用

使用酶aflii和ecorv(neb)酶切质粒pmmpyls-mcherry-tag-egfp-ha1,2和pmmpylrs-egfr-(128tag)-gfp-ha2以去除野生型mmpylrs。用相同的侧翼位点、通过geneart制备突变合成酶mbbcnrs和mbtcors的合成的基因。合成的mbbcnrs和mbtcors也用aflii和ecorv消化并克隆以代替野生型合成酶(mmpyls)。通过使用快速连接试剂盒(roche),构建了载体pmbbcnrs-mcherry-tag-egfp-ha、pmbbcnrs-egfr(128tag)-gfp-ha和pmbtcors-egfr(128tag)-gfp-ha。通过交换mmpylrs与mbbcnrs,从pcmv-cjun-tag-mcherry-mmpylrs质粒构建pcmv-cjun-tag-mcherry-mbbcnrs质粒(由fionatownsley构建)。按同样方法构建pmbbcnrs-mcherry-tag-egfp-ha质粒。

hek293细胞中的氨基酸1、2和3的整合

将hek293细胞铺于聚赖氨酸包被的μ盘(ibidi)。在10%的胎牛血清(fbs)dulbecco改进的eagle培养基(dmem)中生长至接近汇合时,使用lipofectamine2000(lifetechnologies)用2μg的pmbbcnrs-egfr(128tag)-gfp-ha和2μg的p4cmve-u6-pylt(其包含四个拷贝的野生型吡咯赖氨酰trna)1,2转染细胞。转染后,将细胞留于10%fbsdmem中,37℃和5%的co2条件下生长过夜。对于western印迹,将细胞铺于24孔板并生长至接近汇合。使用lipofectamine2000用pmbbcnrs-mcherry-tag-egfp-ha或pmmpylrs-mcherry-tag-egfp-ha或ptcors-mcherry-tag-egfp-ha构建体和p4cmve-u6-pylt质粒转染细胞。在存在或不存在0.5mm的1、1mm的2或1mm的5的条件下生长16小时后,使用ripa缓冲液(sigma)将细胞在冰上裂解。离心裂解物并将上清液加到4xlds样品缓冲液(lifetechnologies)中。样品通过sds-page进行分析,并转移至硝酸纤维素膜上,并使用原代大鼠抗-ha(罗氏)和小鼠抗-flag(abfrontier)进行印迹,二抗分别是抗-大鼠(santacruzbiotech)和抗-小鼠(cellsignaling)。

哺乳动物细胞表面蛋白的标记

将细胞铺于聚赖氨酸包被的μ盘并在生长至接近汇合后,用2μg的pmbbcnrs-egfr(128tag)-gfp-ha或pmbtcors-egfr(128tag)-gfp-ha和p4cmve-u6-pylt转染细胞。在存在0.5mm的1(0.5%dmso)、1mm的2或1mm的3的情况下于37℃和5%co2下在含有0.1%fbs的dmem中生长8-16小时后,在含有0.1%fbs的dmem中洗涤细胞,然后在含有0.1%fbs的dmem中孵育过夜。次日,将细胞洗涤一次以上之后,加入400nm的四嗪-染料缀合物11孵育2-60分钟。将培养基更换两次,然后将细胞成像。在具有平复消色差透镜63x油浸物镜的zeiss780激光扫描显微镜下进行成像;扫描缩放:1x或2x;扫描分辨率:512×512;扫描速度:9;平均:16×。egfp在488nm激发并在493至554nm成像;tamra分别在561nm和566-685nm激发和检测。

同样处理对照组,但用pmmpylrs-egfr(128tag)-gfp-ha代替pmbbcnrs-egfr(128tag)-gfp-ha转染细胞。在存在1mm的5的情况下并且在不存在或存在0.5%的dmso(例如是氨基酸1的情况下)的情况下过夜培养细胞。

哺乳动物细胞核蛋白的标记

将细胞铺于聚赖氨酸包被的μ盘并在生长至接近汇合后,用2μg的pcmv-cjun-tag-mcherry和p4cmve-u6-pylt分别转染细胞。在存在0.5mm的1(0.5%dmso)的情况下于37℃和5%co2下在含有0.1%fbs的dmem中生长约16小时后,在含有0.1%fbs的dmem中洗涤细胞,然后在含有0.1%fbs的dmem中孵育过夜。次日,用两种培养基交替重复洗涤细胞,然后在2小时内孵育30分钟。加入200nm的四嗪-染料缀合物11孵育15分钟,然后再次重复洗涤细胞90分钟。对细胞表面的标记进行成像。

化学合成:

通用方法:

在brukerultrashieldtm400plus光谱仪(1h:400mhz,13c:101mhz,31p:162mhz)上记录nmr谱。以ppm报告化学位移(δ)并参考残余的未氘化的溶剂峰:cdcl3(7.26ppm)、d6-dmso(2.50ppm)用于1h-nmr谱,cdcl3(77.0ppm)、d6-dmso(39.5ppm)用于13c-nmr谱。13c-和31p-nmr共振是质子去偶的。对于偶合常数(j)的测量精确到0.1hz并如观察所示。分裂模式指定如下:s,单峰;d,双峰;t,三重峰;q,四重峰;quin,五重峰;sext,六重峰;m,多重峰。在硅胶60f-254板上进行分析型薄层色谱(tlc)。通过uv光(254nm)和/或通过高锰酸钾染色将斑点可视化。在硅胶60(230-400目或70-230目)上进行快速柱色谱。使用具有6130四极谱仪的agilent1200lc-ms系统进行esi-ms。溶剂体系由作为缓冲液a的h2o中的0.2%甲酸和作为缓冲液b的乙腈(mecn)中的0.2%甲酸组成。使用phenomenexjupiterc18柱(150×2mm,5μm)进行小分子lc-ms。使用可变波长并在正离子和负离子模式获得ms。使用具有来自phenomenexc18柱(250×30mm,5μm)的自动化馏分收集的varianprepstar/prostarhplc系统进行制备性的hplc纯化。通过191nm的uv吸光度鉴定化合物。所有溶剂和化学试剂购自商业供应商,并且无需进一步纯化即可使用。双环[6.1.0]壬-4-炔-9-基甲醇(bcn,外/内混合物~4/1)购自synaffix,荷兰。非水反应在惰性氩气气氛下在烘箱干燥的玻璃器皿中进行,除非另有说明。所有实验用水是蒸馏的。盐水是指饱和氯化钠水溶液。

根据文献步骤3合成外-双环[6.1.0]壬-4-炔-9-基甲醇(exo-bcn,s18)。

于0℃将n,n'-二琥珀酰亚胺碳酸酯(1.38g,5.37mmol)加入到于mecn(10ml)中的exo-bcn-ohs18(538mg,3.58mmol)和三乙胺(2.0ml,14.3mmol)的搅拌溶液中。将溶液加热至室温并搅拌3小时并减压浓缩。将粗的油状物通过硅胶色谱(用己烷中的60%的etoac洗脱)的短垫(shordpad)进行纯化,得到exo-bcn-琥珀酰亚胺碳酸酯,其直接使用而不需要进一步纯化。dmf(4ml)中的exo-bcn-osu(1.25g,4.29mmol)经插管加入到dmf(10ml)中的fmoc-lys-oh.hcl(2.61g,6.45mmol)和dipea(1.49ml,8.58mmol)的搅拌溶液中。室温搅拌溶液14小时,用et2o(100ml)稀释并用h2o洗涤(3×100ml)。将有机相经硫酸钠干燥、过滤并减压浓缩。将粗的油状物通过硅胶色谱(0-5%meoh于dcm中(0.1%acoh))进行纯化,得到exo-fmoc-bcnk-ohs19,其为白色固体(1.65g,85%超过2个步骤)。δh(400mhz,d6-dmso)12.67-12.31(1h,brs),7.90(2h,d,j7.5),7.73(2h,d,j7.4),7.63(1h,d,j7.8),7.42(2h,t,j7.4),7.34(2h,t,j7.4),7.10(1h,t,j5.7),4.31-4.19(3h,m),3.95-3.87(1h,m),3.84(1h,d,j6.4),3.45-3.25(brs,1h),3.01-2.91(2h,m),2.52-2.50(1h,m),2.33-2.15(4h,m),2.11-2.02(2h,m),1.75-1.54(2h,m),1.46-1.23(6h,m),0.70-0.58(2h,m);δc(101mhz,d6-dmso)174.4,156.9,156.6,144.30,144.27,141.2,128.1,127.5,125.7,120.6,99.4,68.1,66.1,54.3,47.1,33.3,30.9,29.5,23.9,23.4,22.7,21.3;lrms(esi+):m/z543(100%[m–h])。

将聚合物结合的哌嗪(1.28g,1.28mmol,200-400目,标记程度:1.0-2.0mmol/g装载,与二乙烯基苯2%交联)添加到dcm(10ml)中的exo-fmoc-bcnk-ohs19(174mg,0.32mmol)的搅拌溶液中。所得到的混合物室温搅拌4小时,过滤并用chcl3/meoh(3:1,3x50ml)洗涤试剂。减压蒸发滤液并溶解于h2o(100ml)中,并用etoac洗涤(3×100ml)。减压蒸发水相并冷冻干燥,得到exo-h-bcnk-oh1,其为白色固体(101mg,98%)。对于所有使用哺乳动物细胞的后续标记实验而言,exo-h-bcnk-oh1进一步通过反相hplc进行纯化(0:1的h2o:mecn至9:1的h2o:mecn梯度)。δh(400mhz,d6-dmso/d2o(1:1))4.14-3.76(m,3h),3.56-3.29(m,2h),3.18-2.81(m,3h),2.31-1.98(m,5h),1.71-1.52(m,4h),1.51-1.29(m,4h),1.29-1.08(m,3h),0.95-0.66(m,2h);δc(101mhz,d6-dmso/d2o(1:1))169.4,165.9,101.3,76.0,55.8,31.8,30.1,29.9,25.2,23.2,22.1,21.0,18.7;lrms(esi+):m/z323(100%[m+h]+)。根据文献步骤3合成内-双环[6.1.0]壬-4-炔-9-基甲醇(内-bcn)并以与1类似的方式加工成相应的氨基酸。

在配备有磁力搅拌棒的玻璃小瓶(ltd.)中填入化合物6(39.2mg,0.096mmol)并用气密铝/橡胶隔片密封。在真空中干燥小瓶中的内容物并用氩气吹扫(×3)。将meoh(1ml)加入到小瓶中,然后加入exo-双环[6.1.0]壬-4-炔-9-基甲醇(exo-bcn,s18)溶液(20.2mg溶于1ml的meoh中,0.1344mmol)。室温搅拌混合物。2分钟内,反应混合物脱色,再搅拌内容物1分钟。然后将混合物减压蒸发,并通过硅胶色谱(5%meoh溶于dcm)进行纯化,得到哒嗪s20,其为淡黄色半固体(49mg,96%)。δh(400mhz,cdcl3)9.16(1h,brs),8.77-8.71(1h,m),8.67(1h,app.d,j2.1),8.01(1h,brs),7.97(1h,d,j7.8),7.89(1h,ddd,j7.8,7.6,1.7),7.75(1h,app.d,j8.4),7.40(1h,ddd,j7.4,4.9,1.1),5.93(1h,brs),4.02(2h,d,j5.0),3.49-3.31(2h,m),3.12-2.88(4h,m),2.68-2.49(2h,m),1.88-1.60(1h,brs),1.60-1.50(1h,m),1.48(9h,s),0.92-0.72(4h,m);δc(101mhz,cdcl3)169.0,159.2,159.0,156.9,156.8,155.7,152.1,148.9,143.0,140.9,137.0,134.4,128.0,125.1,124.9,123.5,80.7,66.4,45.7,30.7,29.9,29.6,29.5,28.5(3xch3(tbu)),28.0,27.8,21.7;lrms(esi+):m/z531(100%[m+h]+)。

于室温将市售的溶于h2o(10ml)的4-(氨基甲基)苄腈盐酸盐s21(2.11g,12.50mmol)加入到在h2o(10ml)中的naoh(1.50g,37.50mmol)和二叔丁基二碳酸酯(3.00g,13.75mmol)的搅拌溶液中。将混合物搅拌16小时,在此之后,形成白色沉淀。过滤混合物并用h2o(50ml)洗涤,并在真空下干燥所得到的固体,得到叔丁基氨基甲酸酯s22,其为白色固体(2.78g,96%)。δh(400mhz,cdcl3)7.62(2h,d,j8.2),7.39(2h,d,j8.2),5.00(1h,brs),4.37(2h,d,j5.8),1.46(9h,s);δc(101mhz,cdcl3)155.9,144.7,132.4,127.8,118.9,111.1,80.1,44.2,28.4;lrms(esi+):m/z233(100%[m+h]+)。

通过改进文献步骤4合成四嗪10。于室温将肼一水化物(1.024ml,21.10mmol)加入到溶于1,4-二恶烷(0.5ml)中的叔丁基氨基甲酸酯s22(98mg,0.44mmol)、乙酸甲脒(439mg,4.22mmol)和zn(otf)2(77mg,0.22mmol)的搅拌悬浮液中。将反应加热至60℃并搅拌16小时。将反应冷却至室温并用etoac(10ml)稀释。用1mhcl(10ml)洗涤反应,并用etoac(2×5ml)萃取水相。经硫酸钠干燥有机相,将其过滤并减压蒸发。将所得到的粗残留物溶于dcm和乙酸(1:1,5ml)的混合物中,并缓慢添加nano2(584mg,8.44mmol),历时15分钟,在此期间,反应变成亮红色。用活性空气净化吹扫含氮烟雾,然后用dcm(25ml)稀释反应。用碳酸氢钠(sat.,aq.,25ml)洗涤反应混合物并用dcm(2×10ml)萃取水相。经硫酸钠干燥有机相,过滤并减压蒸发。用硅胶色谱(溶于己烷的20%etoac)纯化所得到的残留物,得到四嗪10,其为粉色固体(85mg,70%)。δh(400mhz,cdcl3)10.21(1h,s),8.60(2h,d,j8.2),7.53(2h,d,j8.2),4.97(1h,brs),4.45(2h,d,j6.0),1.49(9h,s);δc(101mhz,cdcl3)149.4,142.6,141.1,132.1,120.8,119.2,118.8,51.8,39.0;lrms(esi+):m/z188(100%[(m–boc)+2h]+)。将溶于二恶烷的4mhcl(2ml,8.0mmol)加入到溶于dcm(4ml)中的四嗪10(75mg,0.26mmol)的搅拌溶液中。1小时后,反应完成,并减压去除溶剂,得到伯胺盐酸盐s23,其为粉红色固体(61mg,100%)。δh(400mhz,d6-dmso)10.64(1h,s),8.54(2h,d,j8.4),7.79(2h,d,j8.4),4.18(2h,d,j5.5);δc(101mhz,d6-dmso)165.2,158.2,138.9,131.9,129.8,127.9,41.8;lrms(esi+):m/z188(100%[m+h]+)。

通过先前所述的光化学步骤5,6或通过如下所述的非光化学步骤制备e-5-羟基环辛烯和e-exo-双环[6.1.0]壬-4-烯-9-基甲醇。

于0℃逐滴地将二异丁基氢化铝(溶于环己烷的1.0m溶液,89ml,89mmol)加入到溶于dcm(300ml)中的市售9-氧杂双环[6.1.0]壬-4-烯s24(10g,80.53mmol)的搅拌溶液中。于0℃搅拌溶液30分钟,温热至室温并搅拌16h。此后,将反应冷却至0℃,缓慢加入异丙醇(50ml),随后加入hcl(1m,aq.,100ml)。用dcm(3×200ml)萃取水相。将组合的有机物用盐水洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的10-20%etoac)纯化粗物质,得到环辛烯-4-醇s25,其为无色油状物(8.42g,83%)。光谱数据符合文献7

于0℃将叔丁基(氯)二甲基硅烷(13.3g,88.0mmol)添加至溶于dcm(30ml)的环辛烯-4-醇s25(5.6g,44.0mmol)、咪唑(7.5g,0.11mol)和dmap(1晶体)的搅拌溶液中。将溶液温热至室温并搅拌90分钟,在此期间形成白色沉淀。将反应冷却至0℃,用dcm(100ml)稀释并添加碳酸氢钠(sat.,aq.,100ml)。分离各相并用dcm(3×100ml)萃取水相。将组合的有机物用盐水(200ml)洗涤,经硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的10-20%dcm)纯化粗物质,得到甲硅烷基醚s26,其为无色油状物(10.55g,quant.)。h(400mhz,cdcl3)5.71-5.63(1h,m),5.60-5.52(1h,m),3.80(1h,apptd,j8.6,4.2),2.34(1h,dtd,j13.8,8.2,3.8),2.25-2.15(1h,m),2.13-2.05(1h,m),2.02-1.93(1h,m),1.87-1.52(5h,m),1.47-1.35(1h,m),0.88(9h,s),0.04(3h,s),0.03(3h,s);c(101mhz,cdcl3)130.4,129.4,73.1,38.0,36.5,26.1,25.8,25.1,22.7,18.4,–3.4;lrms(esi+):m/z241(11%[m+h]+)。

于0℃逐滴地将过乙酸(乙酸中的39%,10.3ml,52.7mmol)加入到溶于dcm(80ml)的甲硅烷基醚s26(10.6g,43.9mmol)和碳酸钠(7.0g,65.8mmol)的搅拌溶液中。将混合物温热至室温并搅拌14小时。将反应冷却至0℃,用dcm(50ml)稀释并添加硫代硫酸钠(sat.,aq.,100ml)。将混合物在室温下搅拌10min,然后用naoh(2m,aq.)将其碱化至ph12。分离各相并用h2o(100ml)、盐水(100ml)洗涤有机相,经硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的80%-90%dcm)纯化粗物质,得到环氧化物s27/s28,其为非对映体的不可分混合物(2.3:1,通过1h-nmr测定)且其为无色油状物(10.2g,91%)。主要非对映体:δh(400mhz,cdcl3)3.90(1h,appsext,j4.2),2.90(2h,ddd,j16.7,8.3,4.4),2.21-2.09(1h,m),1.85-1.60(6h,m),1.50-1.38(2h,m),1.34-1.23(1h,m),0.88(9h,s),0.04(3h,s),0.03(3h,s);δc(101mhz,cdcl3)171.9,55.5,55.4,36.3,34.3,27.7,26.0,25.8,22.6,18.3,–3.4;lrms(esi+):m/z257(8%[m+h]+)。

于-78℃逐滴地将正丁基锂(溶于己烷的2.5m,14.8ml,37.0mmol)加入到(15分钟内)thf(80ml)中的环氧化物s27/s28(7.9g,30.8mmol)和二苯基膦(6.43ml,37.0mmol)的搅拌溶液中。将所得到的混合物在-78℃搅拌1小时,温热至室温并搅拌14小时。将反应混合物用thf(80ml)稀释,并冷却至0℃。加入乙酸(5.54ml,92.4mmol),接着加入过氧化氢(溶于h2o中的30%溶液,7.68ml,67.7mmol)。将反应混合物温热至室温并搅拌4小时。加入硫代硫酸钠(sat.,aq.,100ml)并搅拌混合物10分钟。用etoac(3×200ml)萃取水相。将组合的有机物用盐水洗涤(3×200ml),用硫酸钠干燥,过滤并减压浓缩,得到氧化膦s29/s30/s31/s32,其为4种非对映体的混合物,其不经进一步纯化即可使用。δp(162mhz,cdcl3)45.2,44.8,44.4,43.8;lrms(esi+):m/z459(100%[m+h]+)。

于0℃将氢化钠(溶于矿物油中的60%分散,2.46g,61.5mmol)加入到溶于dmf(100ml)中的粗的羟基氧化膦s29/s30/s31/s32的搅拌溶液中。将所得到的混合物温热至室温,包裹在锡箔中并搅拌2小时。将反应冷却至0℃,用et2o(200ml)稀释并加入h2o(200ml)。分离各相并用盐水(2×200ml)洗涤组合的有机物,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的1-15%dcm)纯化粗的混合物,得到反式环辛烯s33/s34,其为非对映体的可分混合物,具有专一的e-选择性,其为无色油状物(2.78g,1.2:1dr,38%超过3个步骤)。s33:δh(400mhz,cdcl3)5.64(1h,ddd,j16.0,10.8,3.6),5.45(1h,ddd,j15.9,11.1,3.2),4.01(1h,appdd,j10.2,5.4),2.41(1h,qd,j11.5,4.4),2.26-2.19(1h,m),2.09-1.94(3h,m),1.92-1.73(2h,m),1.71-1.63(1h,m),1.54(1h,tdd,j14.0,4.7,1.1),1.30-1.08(1h,m),0.94(9h,s),0.03(3h,s),0.01(3h,s);δc(101mhz,cdcl3)135.9,131.5,67.6,44.0,35.2,34.8,29.7,27.7,26.2,18.4,–4.7,–4.8;lrms(esi+):m/z241(8%[m+h]+).s34:δh(400mhz,cdcl3)5.55(1h,ddd,j15.9,11.0,3.6),5.36(1h,ddd,j16.1,10.8,3.4),3.42-3.37(1h,m),2.36-2.28(2h,m),2.22(1h,appqd,j11.2,6.3),2.02-1.87(4h,m),1.73(1h,dd,j14.9,6.2),1.67-1.45(2h,m),0.87(9h,s),0.03(6h,s);δc(101mhz,cdcl3)135.5,132.5,78.6,44.9,42.0,34.6,33.0,31.3,26.1,18.3,–4.4,–4.5;lrms(esi+):m/z241(12%[m+h]+)。对于所有进一步的实验而言,使用反式-环辛烯s34,其中c4-氧取代占据了赤道轴位置。

于室温将氟化四丁基铵(溶于thf中的1m溶液,23.8ml,23.8mmol)和氟化铯(1.08g,7.14mmol)加入到溶于mecn(5ml)中的甲硅烷基醚s34(573mg,2.38mmol)的搅拌溶液中。将所得到的混合物包裹在锡箔中,并在室温下搅拌36小时。此后,将反应冷却至0℃,用dcm(100ml)稀释并加入h2o(100ml)。分离各相,用盐水(2×100ml)洗涤有机相,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷中的20%etoac)纯化粗物质,得到仲醇s35,其为无色油状物(289mg,96%)δh(400mhz,cdcl3)5.60(1h,ddd,j16.0,10.7,4.2),5.41(1h,ddd,j16.0,11.1,3.7),3.52-3.45(2h,m),2.40-2.25(3h,m),2.03-1.90(4h,m),1.75-1.53(3h,m),1.25-1.18(1h,m);δc(101mhz,cdcl3)135.1,132.8,77.7,44.6,41.1,34.3,32.6,32.1;lrms(esi+):m/z127(14%[m+h]+)。

于0℃将琥珀酸胺碳酸盐(succimidylcarbonate)s36(200mg,0.75mmol)加入到溶于dmf(7.5ml)中的fmoc-lys-oh.hcl(303mg,0.75mmol)和dipea(0.19g,1.50mmol)的搅拌溶液中。将溶液温热至室温,包裹在锡箔中并搅拌12小时。此后,减压浓缩溶液,并通过硅胶色谱(溶于dcm的0-10%meoh)进行纯化,得到fmoc-tcok-ohs37/s38,其为黄色油状物,其仍含有dmf(350mg,81%)。δh(400mhz,cdcl3)7.75-7.69(2h,m),7.63-7.52(2h,m),7.41-7.33(2h,m),7.32-7.25(2h,m),5.82-5.34(3h,m),5.27(1h,brs),4.90-4.50(1h,m),4.47-4.01(5h,m),3.32-3.30(1h,m),2.39-1.08(17h,m);δc(100mhz,cdcl3)174.3,156.3,155.9,143.8,143.6,141.1,135.0,134.8,132.8,132.6,127.5,126.9,125.0,119.8,80.3,66.8,53.4,47.0,41.0,40.4,38.5,34.1,32.5,32.3,32.1,30.8,29.3,22.3;esi-ms(m/z):[m+na]+,c30h36n2o6na计算值543.2471,实际值543.2466。

将哌啶(1ml)加入到溶于dcm(4ml)的fmoc-tcok-ohs37/s38(0.269g,0.517mmol)的搅拌溶液中。将混合物包裹在锡箔中并在室温下搅拌30分钟。将反应混合物减压浓缩,通过硅胶色谱(溶于dcm的30-50%meoh)纯化粗物质,得到h-tcok-oh1,其为象牙色固体。δh(400mhz,d4-meod)5.63-5.56(1h,m),5.50-5.43(1h,m),4.31-4.25(1h,m),3.60-3.53(1h,m),3.11-3.03(2h,m),2.37-2.26(3h,m),2.02-1.36(13h,m);δc(100mhz,d4-meod)174.3,159.0,136.3,133.9,81.8,56.0,42.4,41.4,39.8,35.4,33.7,32.3,32.1,30.9,23.6;esi-ms(m/z):[m–h]c15h25n2o4计算值297.1814,实际值297.1811。

根据文献步骤5合成exo-双环[6.1.0]壬-4-烯-9-基甲醇s18。

于0℃将叔丁基(氯)二苯基硅烷(7.45g,27.1mmol)加入到溶于dcm(35ml)的exo-双环[6.1.0]壬-4-烯-9-基甲醇s18(2.75g,18.1mmol)、咪唑(2.15g,31.6mmol)和dmap(2.21g,18.1mmol)的搅拌溶液中。将溶液温热至室温并搅拌24小时,在此期间形成白色沉淀。将反应冷却至0℃,用dcm(100ml)稀释并加入碳酸氢钠(sat.,aq.,100ml)。分离各相并用dcm(3×100ml)萃取水相。将组合的有机物用盐水(200ml)洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的20%dcm)纯化粗物质,得到甲硅烷基醚s39,其为无色油状物(6.85g,97%),δh(400mhz,cdcl3)7.79-7.64(4h,m),7.50-7.32(6h,m),5.63(2h,dm,j11.5),3.59(2h,d,j6.2),2.40-2.21(2h,m),2.18-1.96(4h,m),1.45-1.33(2h,m),1.07(9h,s),0.72-0.56(3h,m);δc(101mhz,cdcl3)135.7,134.3,130.2,129.5,127.6,67.9,29.1,28.6,27.2,26.9,22.0,19.3;lrms(esi+):m/z408(10%,[m+nh4]+)。

于0℃将过乙酸(3.38ml,溶于乙酸的39%,19.9mmol)加入到溶于dcm(65ml)的甲硅烷基醚s39(6.49g,16.6mmol)和无水碳酸钠(2.64g,24.9mmol)的搅拌溶液中。将混合物温热至室温并搅拌24小时。然后将反应冷却至0℃,用dcm(100ml)稀释并加入硫代硫酸钠(sat.,aq.,150ml)。将混合物在室温下搅拌30分钟,然后用naoh(2m,aq.)将其碱化至ph12。分离各相并用h2o(200ml)、盐水(200ml)洗涤有机相,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(100%dcm)纯化粗物质,得到环氧化物s40和s41,其为非对映体的不可分混合物(1:1通过1hnmr光谱),并且其为无色油状物(5.97g,88%)。δh(400mhz,cdcl3)7.72-7.63(8h,m),7.47-7.34(12h,m),3.57(2h,d,j5.6),3.54(2h,d,j5.9),3.03-3.10(2h,m),3.02-2.91(2h,m),2.36-2.24(2h,m),2.21-2.08(2h,m),2.06-1.85(6h,m),1.35-1.12(4h,m),1.06(9h,s),1.05(9h,s),0.92-0.80(2h,m),0.78-0.47(6h,m);δc(101mhz,cdcl3)135.65,135.63,134.2,134.1,129.6(2×ch),127.6(2×ch),67.4,67.0,56.91,56.85,29.7,27.7,26.9(2×3ch3),26.6,26.5,23.31,23.25,21.7,20.4,19.2(2×2c);lrms(esi+):m/z407(9%,[m+h]+)。

于-78℃逐滴地将正丁基锂(溶于己烷中的2.5m,5.92ml,14.8mmol)加入到(15分钟内)溶于thf(50ml)的环氧化物s40/s41(5.47g,13.5mmol)和二苯基膦(2.57ml,14.80mmol)的搅拌溶液中。将所得到的混合物在-78℃搅拌1小时,温热至室温,并再搅拌14小时。将反应混合物用thf(80ml)稀释并冷却至0℃。加入乙酸(1.54ml,26.9mmol),接着加入过氧化氢(溶于h2o中的30%溶液,3.05ml,26.9mmol)。将反应混合物温热至室温并搅拌4小时。加入硫代硫酸钠(sat.,aq.,100ml)并将混合物搅拌10分钟。用etoac(3×200ml)萃取水相。将组合的有机物用盐水(3×200ml)洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的40-100%etoac)纯化粗的混合物,得到氧化膦s42/s43/s44/s45,其为两个非对映异构体的51:18的混合物(5.61g,69%超过2个步骤),其各自是区域异构体的1:1混合物(s42/s45和s43/s44)。主要非对映体:δh(400mhz,cdcl3)7.82-7.68(4h,m),7.68-7.58(4h,m),7.52-7.32(12h,m),4.58-4.45(1h,m),4.16(1h,d,j5.3),3.54(2h,d,j6.0),2.47(1h,ddd,j12.0,11.7,4.3),2.21-2.07(1h,m),2.05-1.85(2h,m),1.78-1.55(3h,m),1.22-1.05(1h,m),1.03(9h,s),0.91-0.75(1h,m),0.62-0.35(3h,m);δp(162mhz,cdcl3)39.7;lrms(esi+):m/z609[100%,(m+h)+]。次要非对映体:δh(400mhz,cdcl3)7.87-7.77(2h,m),7.74-7.60(6h,m),7.52-7.30(12h,m),4.26(1h,d,j4.0),3.89-3.78(1h,m),3.63(1h,dd,j10.7,5.8),3.54(1h,dd,j10.7,6.2),3.26-3.10(1h,m),2.22-2.12(1h,m),2.00-1.78(3h,m),1.70-1.62(1h,m),1.42-1.28(1h,m),1.04(9h,s),1.04-0.92(2h,m),0.79-0.65(1h,m),0.55-0.41(1h,m),0.27-0.12(1h,m);δp(162mhz,cdcl3)39.6;lrms(esi+):m/z609[100%,(m+h)+]。

于0℃将氢化钠(溶于矿物油中的60%分散体系,0.46g,11.5mmol)加入到溶于无水dmf(60ml)的羟基氧化膦s42/s43/s44/s45(4.68g,7.69mol)的搅拌溶液中。将所得到的混合物温热至室温,包裹在锡箔中并搅拌2小时。将反应混合物冷却至0℃,用et2o(200ml)和h2o(200ml)稀释,分离各相并用己烷(150ml)萃取水相。将组合的有机物用盐水(sat.,aq.,5×250ml)洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的1-20%dcm)纯化粗的混合物,得到反式环辛烯s46,其为单一的非对映体,并具有专一的e-选择性(2.08g,69%);δh(400mhz,cdcl3)7.72-7.62(4h,m),7.46-7.34(6h,m),5.83(1h,ddd,j16.1,9.2,6.2),5.11(1h,ddd,j16.1,10.6,3.3),3.59(2h,d,j5.7),2.28-2.40(1h,m),2.12-2.27(3h,m),1.80-1.95(2h,m),1.04(9h,s),0.74-0.90(1h,m),0.46-0.60(1h,dm,j14.0),0.31-0.42(2h,m),0.18-0.29(1h,m);δc(101mhz,cdcl3)138.6,135.8,134.4,131.3,129.6,127.7,68.1,39.0,34.1,32.9,28.2,27.9,27.0,21.6,20.5,19.4。

于室温将氟化四丁基铵(溶于thf中的1m溶液,10.0ml,10.0mmol)添加到溶于thf(5ml)中的甲硅烷基醚s46(0.78g,2mmol)的搅拌溶液中,包裹在锡箔中并搅拌45分钟。此后,将反应混合物减压浓缩,用dcm(100ml)稀释并用盐水(100ml)洗涤。分离各相并用盐水(2×100ml)洗涤有机相。将组合的有机物用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的20%etoac)纯化粗物质,得到伯醇s47,其为无色油状物(0.29g,96%);δh(400mhz,d4-meod)5.87(1h,ddd,j16.5,9.3,6.2),5.13(1h,dddd,j16.5,10.4,3.9,0.8),3.39-3.47(2h,dd,j6.2,1.5),2.34-2.44(1h,m),2.12-2.33(3h,m),1.82-1.98(2h,m),0.90(1h,dtd,j12.5,12.5,7.1),0.55-0.70(1h,m),0.41-0.55(1h,m),0.27-0.41(2h,m);δc(101mhz,d4-meod)139.3,132.2,67.5,39.9,34.8,33.8,29.2,28.7,23.0,21.9;ms-ci(nh3):m/z[m-oh]c10h15,计算值135.1174;实际值135.1173。

于0℃将pno2-苯基碳酸酯s48(250mg,0.79mmol)加入到溶于dmf(3ml)中的fmoc-lys-oh.hcl(478mg,1.18mmol)和dipea(0.27ml,1.58mmol)的搅拌溶液中。将溶液温热至室温,包裹在锡箔中并搅拌16小时。此后将溶液减压浓缩,并通过硅胶色谱(溶于dcm的0-5%meoh)纯化,得到fmoc-exo-stcoks49,其为白色泡沫(373mg,87%)。δh(400mhz,d6-dmso)13.09-12.06(1h,brs),7.90(2h,d,j7.5),7.73(2h,d,j7.5),7.66-7.56(1h,m),7.43(2h,t,j7.4),7.34(2h,j7.4),7.08(1h,t,j5.4),5.84-5.72(1h,m),5.13-5.01(1h,m),4.31-4.19(3h,m),3.93-3.79(3h,m),3.00-2.90(2h,m),2.31-2.07(4h,m),1.91-1.78(2h,m),1.75-1.49(2h,m),1.45-1.22(4h,m),0.91-0.75(1h,m),0.62-0.45(2h,m),0.43-0.32(2h,m);δc(101mhz,d6-dmso)173.9,156.4,156.1,143.8,140.7,137.9,131.0,127.6,127.0,125.2,120.1,79.1,67.9,65.6,53.8,46.6,38.1,33.4,31.9,30.4,29.0,27.2,24.3,22.8,21.2,20.2;lrms(esi+):m/z545(100%[m–h])。

将氢氧化锂一水合物(94mg,0.75mmol)加入到溶于thf:h2o(3:1,8ml)的exo-stcoks49的搅拌溶液中。将溶液包裹在锡箔中,室温搅拌4小时,并加入etoac(100ml)和h2o(100ml)。通过添加acoh,将水相小心地酸化至ph4,并用etoac(4×100ml)萃取水相,减压蒸发水相并冷冻干燥,得到exo-stcok3,其为白色固体。对于所有使用哺乳动物细胞的后续标记实验而言,通过反相hplc进一步纯化exo-h-bcnk-oh1(0:1的h2o:mecn至9:1的h2o:mecn梯度)。δh(400mhz,d6-dmso)7.21-7.09(1h,brm),5.85-5.72(1h,m),5.14-5.02(1h,m),3.80(2h,d,j2.6),3.14-3.05(1h,m),2.98-2.86(2h,m),2.31-2.08(4h,m),1.92-1.78(2h,m),1.73-1.65(1h,m),1.55-1.44(1h,m),1.41-1.25(4h,m),0.90-0.62(1h,m),0.65-0.45(2h,m),0.43-0.32(2h,m);δc(101mhz,d6-dmso)175.5,156.3,137.9,131.1,67.8,54.5,38.1,33.4,32.1,32.0,29.2,27.2,24.7,24.3,22.5,21.2,20.2;lrms(esi+):m/z325(100%[m+h]+)。

补充实施例的参考文献

1.gautier,a.etal.geneticallyencodedphotocontrolofproteinlocalizationinmammaliancells.jamchemsoc132,4086-8(2010).

2.lang,k.etal.geneticallyencodednorbornenedirectssite-specificcellularproteinlabellingviaarapidbioorthogonalreaction.naturechemistry4,298-304(2012).

3.dommerholt,j.etal.readilyaccessiblebicyclononynesforbioorthogonallabelingandthree-dimensionalimagingoflivingcells.angewandtechemie-internationaledition49,9422-9425(2010).

4.yang,j.,karver,m.r.,li,w.,sahu,s.&devaraj,n.k.metal-catalyzedone-potsynthesisoftetrazinesdirectlyfromaliphaticnitrilesandhydrazine.angewandtechemie51,5222-5(2012).

5.taylor,m.t.,blackman,m.l.,dmitrenko,o.&fox,j.m.designandsynthesisofhighlyreactivedienophilesforthetetrazine-trans-cycloocteneligation.journaloftheamericanchemicalsociety133,9646-9(2011).

6.royzen,m.,yap,g.p.&fox,j.m.aphotochemicalsynthesisoffunctionalizedtrans-cyclooctenesdrivenbymetalcomplexation.journaloftheamericanchemicalsociety130,3760-1(2008).

7.zhang,k.,lackey,m.a.,cui,j.&tew,g.n.gelsbasedoncyclicpolymers.journaloftheamericanchemicalsociety133,4140-8(2011).

正文的参考文献:

(1)devaraj,n.k.;weissleder,r.;hilderbrand,s.a.bioconjugchem2008,19,2297.

(2)devaraj,n.k.;weissleder,r.accchemres2011.

(3)blackman,m.l.;royzen,m.;fox,j.m.jamchemsoc2008,130,13518.

(4)taylor,m.t.;blackman,m.l.;dmitrenko,o.;fox,j.m.journaloftheamericanchemicalsociety2011,133,9646.

(5)liu,d.s.;tangpeerachaikul,a.;selvaraj,r.;taylor,m.t.;fox,j.m.;ting,a.y.journaloftheamericanchemicalsociety2012,134,792.

(6)seitchik,j.l.;peeler,j.c.;taylor,m.t.;blackman,m.l.;rhoads,t.w.;cooley,r.b.;refakis,c.;fox,j.m.;mehl,r.a.journaloftheamericanchemicalsociety2012,134,2898.

(7)lang,k.;davis,l.;torres-kolbus,j.;chou,c.;deiters,a.;chin,j.w.naturechemistry2012,4,298.

(8)kaya,e.;vrabel,m.;deiml,c.;prill,s.;fluxa,v.s.;carell,t.angewandtechemie2012,51,4466.

(9)plass,t.;milles,s.;koehler,c.;szymanski,j.;mueller,r.;wiessler,m.;schultz,c.;lemke,e.a.angewchemintedit2012,51,4166.

(10)dommerholt,j.;schmidt,s.;temming,r.;hendriks,l.j.a.;rutjes,f.p.j.t.;vanhest,j.c.m.;lefeber,d.j.;friedl,p.;vandelft,f.l.angewchemintedit2010,49,9422.

(11)chen,w.x.;wang,d.z.;dai,c.f.;hamelberg,d.;wang,b.h.chemcommun2012,48,1736.

(12)mckay,c.s.;blake,j.a.;cheng,j.;danielson,d.c.;pezacki,j.p.chemcommun2011,47,10040.

(13)mckay,c.s.;chigrinova,m.;blake,j.a.;pezacki,j.p.organic&biomolecularchemistry2012.

(14)ning,x.;temming,r.p.;dommerholt,j.;guo,j.;ania,d.b.;debets,m.f.;wolfert,m.a.;boons,g.j.;vandelft,f.l.angewandtechemie2010,49,3065.

(15)agard,n.j.;prescher,j.a.;bertozzi,c.r.journaloftheamericanchemicalsociety2004,126,15046.

(16)sletten,e.m.;bertozzi,c.r.accountsofchemicalresearch2011,44,666.

(17)karver,m.r.;weissleder,r.;hilderbrand,s.a.angewandtechemie2012,51,920.

(18)devaraj,n.k.;hilderbrand,s.;upadhyay,r.;mazitschek,r.;weissleder,r.angewchemintedengl2010,49,2869.

(19)fekner,t.;li,x.;lee,m.m.;chan,m.k.angewchemintedengl2009,48,1633.

(20)nguyen,d.p.;garciaalai,m.m.;kapadnis,p.b.;neumann,h.;chin,j.w.jamchemsoc2009,131,14194.

(21)nguyen,d.p.;lusic,h.;neumann,h.;kapadnis,p.b.;deiters,a.;chin,j.w.jamchemsoc2009,131,8720.

(22)nguyen,d.p.;elliott,t.;holt,m.;muir,t.w.;chin,j.w.jamchemsoc2011,133,11418.

(23)neumann,h.;peak-chew,s.y.;chin,j.w.natchembiol2008,4,232.

(24)polycarpo,c.r.;herring,s.;berube,a.;wood,j.l.;soll,d.;ambrogelly,a.febslett2006,580,6695.

(25)li,x.;fekner,t.;ottesen,j.j.;chan,m.k.angewchemintedengl2009,48,9184.

(26)wang,y.s.;fang,x.;wallace,a.l.;wu,b.;liu,w.r.journaloftheamericanchemicalsociety2012,134,2950.

(27)mukai,t.;kobayashi,t.;hino,n.;yanagisawa,t.;sakamoto,k.;yokoyama,s.biochembiophysrescommun2008,371,818.

(28)hancock,s.m.;uprety,r.;deiters,a.;chin,j.w.jamchemsoc2010,132,14819.

(29)greiss,s.;chin,j.w.jamchemsoc2011.

(30)lin,s.x.;zhang,z.r.;xu,h.;li,l.;chen,s.;li,j.;hao,z.y.;chen,p.r.journaloftheamericanchemicalsociety2011,133,20581.

(31)gautier,a.;nguyen,d.p.;lusic,h.;an,w.;deiters,a.;chin,j.w.jamchemsoc2010,132,4086.

(32)virdee,s.;kapadnis,p.b.;elliott,t.;lang,k.;madrzak,j.;nguyen,d.p.;riechmann,l.;chin,j.w.journaloftheamericanchemicalsociety2011,133,10708.

上述说明书中所提及的所有出版物通过引用并入本文。本发明的所述方面和实施方式的各种改进和变型对本领域技术人员而言是显而易见的,并不脱离本发明的范围。尽管本发明已经结合具体的优选实施方式进行了描述,但应当理解,如权利要求所保护的本发明不应限制于这样的具体实施方式。事实上,用于实施本发明的所述方式的各种改进对本领域技术人员而言是显而易见的,其均在下述权利要求的范围之内。

序列表

<110>医药研究委员会

<120>整合包含bcn基团的氨基酸到多肽中的方法

<130>p3889wo

<140>pct/gb2013/051249

<141>2013-05-15

<160>18

<170>siposequencelisting1.0

<210>1

<211>419

<212>prt

<213>巴氏甲烷八叠球菌(methanosarcinabarkeri)

<400>1

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshistyrgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspileasn

65707580

asnpheleuthrargserthrgluglylysthrservallysvallys

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnprovalseralalysalaserthr

115120125

aspthrserargservalproserproalalysserthrproasnser

130135140

provalprothrseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

ilealalysprophearggluleuglusergluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargaspphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

metglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometleualaprothrleutyrasn

260265270

tyrleuarglysleuaspargileleuproaspproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphecysglnmetglyserglycysthr

305310315320

arggluasnleugluserleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalproleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>2

<211>419

<212>prt

<213>巴氏甲烷八叠球菌(methanosarcinabarkeri)

<400>2

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspileasn

65707580

asnpheleuthrargserthrgluserlysasnservallysvalarg

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnservalseralalysalaserthr

115120125

asnthrserargservalproserproalalysserthrproasnser

130135140

servalproalaseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

metalalysprophearggluleugluprogluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargglyphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

metglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometleualaprothrleutyrasn

260265270

tyrleuarglysleuaspargileleuproglyproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphecysglnmetglyserglycysthr

305310315320

arggluasnleuglualaleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalserleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>3

<211>419

<212>prt

<213>巴氏甲烷八叠球菌(methanosarcinabarkeri)

<400>3

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshistyrgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspileasn

65707580

asnpheleuthrargserthrgluglylysthrservallysvallys

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnprovalseralalysalaserthr

115120125

aspthrserargservalproserproalalysserthrproasnser

130135140

provalprothrseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

ilealalysprophearggluleuglusergluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargaspphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

metglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometleualaprothrleutyrasn

260265270

tyrleuarglysleuaspargileleuproaspproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphecysglnmetglyserglycysthr

305310315320

arggluasnleugluserleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalproleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>4

<211>454

<212>prt

<213>马氏甲烷八叠球菌(methanosarcinamazeii)

<400>4

metasplyslysproleuasnthrleuileseralathrglyleutrp

151015

metserargthrglythrilehislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargserserargthralaargalaleuarghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspleuasn

65707580

lyspheleuthrlysalaasngluaspglnthrservallysvallys

859095

valvalseralaprothrargthrlyslysalametprolysserval

100105110

alaargalaprolysproleugluasnthrglualaalaglnalagln

115120125

proserglyserlyspheserproalaileprovalserthrglnglu

130135140

servalservalproalaservalserthrserileserserileser

145150155160

thrglyalathralaseralaleuvallysglyasnthrasnproile

165170175

thrsermetseralaprovalglnalaseralaproalaleuthrlys

180185190

serglnthraspargleugluvalleuleuasnprolysaspgluile

195200205

serleuasnserglylysprophearggluleuglusergluleuleu

210215220

serargarglyslysaspleuglnglniletyralaglugluargglu

225230235240

asntyrleuglylysleugluarggluilethrargphephevalasp

245250255

argglypheleugluilelysserproileleuileproleuglutyr

260265270

ilegluargmetglyileaspasnaspthrgluleuserlysglnile

275280285

pheargvalasplysasnphecysleuargprometleualaproasn

290295300

leutyrasntyrleuarglysleuaspargalaleuproaspproile

305310315320

lysilephegluileglyprocystyrarglysgluseraspglylys

325330335

gluhisleuglugluphethrmetleuasnphecysglnmetglyser

340345350

glycysthrarggluasnleugluserileilethrasppheleuasn

355360365

hisleuglyileaspphelysilevalglyaspsercysmetvaltyr

370375380

glyaspthrleuaspvalmethisglyaspleugluleuserserala

385390395400

valvalglyproileproleuaspargglutrpglyileasplyspro

405410415

trpileglyalaglypheglyleugluargleuleulysvallyshis

420425430

aspphelysasnilelysargalaalaargserglusertyrtyrasn

435440445

glyileserthrasnleu

450

<210>5

<211>443

<212>prt

<213>嗜乙酸甲烷八叠球菌(methanosarcinaacetivorans)

<400>5

metasplyslysproleuaspthrleuileseralathrglyleutrp

151015

metserargthrglymetilehislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglygluargleuvalval

354045

asnasnserargserserargthralaargalaleuarghishislys

505560

tyrarglysthrcysarghiscysargvalseraspgluaspileasn

65707580

asnpheleuthrlysthrsergluglulysthrthrvallysvallys

859095

valvalseralaproargvalarglysalametprolysservalala

100105110

argalaprolysproleuglualathralaglnvalproleusergly

115120125

serlysproalaproalathrprovalseralaproalaglnalapro

130135140

alaproserthrglyseralaseralathrseralaseralaglnarg

145150155160

metalaasnseralaalaalaproalaalaprovalprothrserala

165170175

proalaleuthrlysglyglnleuaspargleugluglyleuleuser

180185190

prolysaspgluileserleuaspserglulysprophearggluleu

195200205

glusergluleuleuserargarglyslysaspleulysargiletyr

210215220

alaglugluarggluasntyrleuglylysleugluarggluilethr

225230235240

lysphephevalaspargglypheleugluilelysserproileleu

245250255

ileproalaglutyrvalgluargmetglyileasnseraspthrglu

260265270

leuserlysglnvalpheargileasplysasnphecysleuargpro

275280285

metleualaproasnleutyrasntyrleuarglysleuaspargala

290295300

leuproaspproilelysilephegluileglyprocystyrarglys

305310315320

gluseraspglylysgluhisleuglugluphethrmetleuasnphe

325330335

cysglnmetglyserglycysthrarggluasnleuglualaileile

340345350

thrglupheleuasnhisleuglyileaspphegluileileglyasp

355360365

sercysmetvaltyrglyasnthrleuaspvalmethisaspaspleu

370375380

gluleuserseralavalvalglyprovalproleuaspargglutrp

385390395400

glyileasplysprotrpileglyalaglypheglyleugluargleu

405410415

leulysvalmethisglyphelysasnilelysargalaalaargser

420425430

glusertyrtyrasnglyileserthrasnleu

435440

<210>6

<211>478

<212>prt

<213>嗜热甲烷八叠球菌(methanosarcinathermophila)

<400>6

metasplyslysproleuasnthrleuileseralathrglyleutrp

151015

metserargthrglylysleuhislysilearghishisgluvalser

202530

lysarglysiletyrileglumetglucysglygluargleuvalval

354045

asnasnserargsercysargalaalaargalaleuarghishislys

505560

tyrarglysilecyslyshiscysargvalseraspgluaspleuasn

65707580

lyspheleuthrargthrasngluasplysserasnalalysvalthr

859095

valvalseralaprolysilearglysvalmetprolysservalala

100105110

argthrprolysproleugluasnthralaprovalglnthrleupro

115120125

sergluserglnproalaprothrthrproileseralaserthrthr

130135140

alaproalaserthrserthrthralaproalaproalaserthrthr

145150155160

alaproalaproalaserthrthralaproalaseralaserthrthr

165170175

ileserthrseralametproalaserthrseralaglnglythrthr

180185190

lyspheasntyrileserglyglypheproargproileprovalgln

195200205

alaseralaproalaleuthrlysserglnileaspargleuglngly

210215220

leuleuserprolysaspgluileserleuaspserglythrprophe

225230235240

arglysleuglusergluleuleuserargargarglysaspleulys

245250255

glniletyralaglugluarggluhistyrleuglylysleugluarg

260265270

gluilethrlysphephevalaspargglypheleugluilelysser

275280285

proileleuileprometglutyrilegluargmetglyileaspasn

290295300

asplysgluleuserlysglnilepheargvalaspasnasnphecys

305310315320

leuargprometleualaproasnleutyrasntyrleuarglysleu

325330335

asnargalaleuproaspproilelysilephegluileglyprocys

340345350

tyrarglysgluseraspglylysgluhisleuglugluphethrmet

355360365

leuasnphecysglnmetglyserglycysthrarggluasnleuglu

370375380

alaileilelysasppheleuasptyrleuglyileaspphegluile

385390395400

valglyaspsercysmetvaltyrglyaspthrleuaspvalmethis

405410415

glyaspleugluleuserseralavalvalglyprovalprometasp

420425430

argasptrpglyileasnlysprotrpileglyalaglypheglyleu

435440445

gluargleuleulysvalmethisasnphelysasnilelysargala

450455460

serargserglusertyrtyrasnglyileserthrasnleu

465470475

<210>7

<211>416

<212>prt

<213>布氏甲烷八叠球菌(methanococcoidesburtonii)

<400>7

metglulysglnleuleuaspvalleuvalgluleuasnglyvaltrp

151015

leuserargserglyleuleuhisglyileargasnphegluilethr

202530

thrlyshisilehisilegluthraspcysglyalaargphethrval

354045

argasnserargserserargseralaargserleuarghisasnlys

505560

tyrarglysprocyslysargcysargproalaaspgluglnileasp

65707580

argphevallyslysthrphelysglulysargglnthrvalserval

859095

pheserserprolyslyshisvalprolyslysprolysvalalaval

100105110

ilelysserpheserileserthrproserprolysglualaserval

115120125

serasnserileprothrproserileservalvallysaspgluval

130135140

lysvalprogluvallystyrthrproserglnilegluargleulys

145150155160

thrleumetserproaspasplysileproileglnaspgluleupro

165170175

gluphelysvalleuglulysgluleuileglnargargargaspasp

180185190

leulyslysmettyrglugluasparggluaspargleuglylysleu

195200205

gluargaspilethrgluphephevalaspargglypheleugluile

210215220

lysserproilemetilepropheglutyrilegluargmetglyile

225230235240

asplysaspasphisleuasnlysglnilepheargvalaspgluser

245250255

metcysleuargprometleualaprocysleutyrasntyrleuarg

260265270

lysleuasplysvalleuproaspproileargilephegluilegly

275280285

procystyrarglysgluseraspglyserserhisleuglugluphe

290295300

thrmetvalasnphecysglnmetglyserglycysthrarggluasn

305310315320

metglualaleuileaspglupheleugluhisleuglyileglutyr

325330335

gluileglualaaspasncysmetvaltyrglyaspthrileaspile

340345350

methisglyaspleugluleuserseralavalvalglyproilepro

355360365

leuaspargglutrpglyvalasnlysprotrpmetglyalaglyphe

370375380

glyleugluargleuleulysvalarghisasntyrthrasnilearg

385390395400

argalaserargsergluleutyrtyrasnglyileasnthrasnleu

405410415

<210>8

<211>279

<212>prt

<213>哥本哈根脱亚硫酸菌(desulfitobacteriumhafniense)

<400>8

metserserphetrpthrlysvalglntyrglnargleulysgluleu

151015

asnalaserglygluglnleuglumetglypheseraspalaleuser

202530

argaspargalapheglnglyilegluhisglnleumetserglngly

354045

lysarghisleugluglnleuargthrvallyshisargproalaleu

505560

leugluleuglugluglyleualalysalaleuhisglnglnglyphe

65707580

valglnvalvalthrprothrileilethrlysseralaleualalys

859095

metthrileglygluasphisproleupheserglnvalphetrpleu

100105110

aspglylyslyscysleuargprometleualaproasnleutyrthr

115120125

leutrparggluleugluargleutrpasplysproileargilephe

130135140

gluileglythrcystyrarglysgluserglnglyalaglnhisleu

145150155160

asngluphethrmetleuasnleuthrgluleuglythrproleuglu

165170175

gluarghisglnargleugluaspmetalaargtrpvalleugluala

180185190

alaglyilearggluphegluleuvalthrgluserservalvaltyr

195200205

glyaspthrvalaspvalmetlysglyaspleugluleualasergly

210215220

alametglyprohispheleuaspglulystrpgluilevalasppro

225230235240

trpvalglyleuglypheglyleugluargleuleumetileargglu

245250255

glythrglnhisvalglnsermetalaargserleusertyrleuasp

260265270

glyvalargleuasnileasn

275

<210>9

<211>312

<212>prt

<213>哥本哈根脱亚硫酸菌(desulfitobacteriumhafniense)

<400>9

metaspargileasphisthraspserlysphevalglnalaglyglu

151015

thrprovalleuproalathrphemetpheleuthrargargasppro

202530

proleuserserphetrpthrlysvalglntyrglnargleulysglu

354045

leuasnalaserglygluglnleuglumetglypheseraspalaleu

505560

serargaspargalapheglnglyilegluhisglnleumetsergln

65707580

glylysarghisleugluglnleuargthrvallyshisargproala

859095

leuleugluleuglugluglyleualalysalaleuhisglnglngly

100105110

phevalglnvalvalthrprothrileilethrlysseralaleuala

115120125

lysmetthrileglygluasphisproleupheserglnvalphetrp

130135140

leuaspglylyslyscysleuargprometleualaproasnleutyr

145150155160

thrleutrparggluleugluargleutrpasplysproileargile

165170175

phegluileglythrcystyrarglysgluserglnglyalaglnhis

180185190

leuasngluphethrmetleuasnleuthrgluleuglythrproleu

195200205

glugluarghisglnargleugluaspmetalaargtrpvalleuglu

210215220

alaalaglyilearggluphegluleuvalthrgluserservalval

225230235240

tyrglyaspthrvalaspvalmetlysglyaspleugluleualaser

245250255

glyalametglyprohispheleuaspglulystrpgluilevalasp

260265270

protrpvalglyleuglypheglyleugluargleuleumetilearg

275280285

gluglythrglnhisvalglnsermetalaargserleusertyrleu

290295300

aspglyvalargleuasnileasn

305310

<210>10

<211>288

<212>prt

<213>哥本哈根脱亚硫酸菌(desulfitobacteriumhafniense)

<400>10

metpheleuthrargargaspproproleuserserphetrpthrlys

151015

valglntyrglnargleulysgluleuasnalaserglygluglnleu

202530

glumetglypheseraspalaleuserargaspargalapheglngly

354045

ilegluhisglnleumetserglnglylysarghisleugluglnleu

505560

argthrvallyshisargproalaleuleugluleugluglulysleu

65707580

alalysalaleuhisglnglnglyphevalglnvalvalthrprothr

859095

ileilethrlysseralaleualalysmetthrileglygluasphis

100105110

proleupheserglnvalphetrpleuaspglylyslyscysleuarg

115120125

prometleualaproasnleutyrthrleutrparggluleugluarg

130135140

leutrpasplysproileargilephegluileglythrcystyrarg

145150155160

lysgluserglnglyalaglnhisleuasngluphethrmetleuasn

165170175

leuthrgluleuglythrproleuglugluarghisglnargleuglu

180185190

aspmetalaargtrpvalleuglualaalaglyileargglupheglu

195200205

leuvalthrgluserservalvaltyrglyaspthrvalaspvalmet

210215220

lysglyaspleugluleualaserglyalametglyprohispheleu

225230235240

aspglulystrpgluilepheaspprotrpvalglyleuglyphegly

245250255

leugluargleuleumetilearggluglythrglnhisvalglnser

260265270

metalaargserleusertyrleuaspglyvalargleuasnileasn

275280285

<210>11

<211>277

<212>prt

<213>醋酸氧化脱硫肠状菌(desulfotomaculumacetoxidans)

<400>11

metserpheleutrpthrvalserglnglnlysargleusergluleu

151015

asnalaserglugluglulysasnmetserpheserserthrserasp

202530

argglualaalatyrlysargvalglumetargleuileasngluser

354045

lysglnargleuasnlysleuarghisgluthrargproalailecys

505560

alaleugluasnargleualaalaalaleuargglyalaglypheval

65707580

glnvalalathrprovalileleuserlyslysleuleuglylysmet

859095

thrilethraspgluhisalaleupheserglnvalphetrpileglu

100105110

gluasnlyscysleuargprometleualaproasnleutyrtyrile

115120125

leulysaspleuleuargleutrpglulysprovalargilepheglu

130135140

ileglysercysphearglysgluserglnglyserasnhisleuasn

145150155160

gluphethrmetleuasnleuvalglutrpglyleuprogluglugln

165170175

argglnlysargilesergluleualalysleuvalmetaspgluthr

180185190

glyileaspglutyrhisleugluhisalagluservalvaltyrgly

195200205

gluthrvalaspvalmethisargaspilegluleuglyserglyala

210215220

leuglyprohispheleuaspglyargtrpglyvalvalglyprotrp

225230235240

valglyileglypheglyleugluargleuleumetvalgluglngly

245250255

glyglnasnvalargsermetglylysserleuthrtyrleuaspgly

260265270

valargleuasnile

275

<210>12

<211>419

<212>prt

<213>巴氏甲烷八叠球菌(methanosarcinabarkeri)

<400>12

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshistyrgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspileasn

65707580

asnpheleuthrargserthrgluglylysthrservallysvallys

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnprovalseralalysalaserthr

115120125

aspthrserargservalproserproalalysserthrproasnser

130135140

provalprothrseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

ilealalysprophearggluleuglusergluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargaspphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

metglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometleualaprothrleutyrasn

260265270

tyrleuarglysleuaspargileleuproaspproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphecysglnmetglyserglycysthr

305310315320

arggluasnleugluserleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalproleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>13

<211>419

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>mbpyls

<400>13

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspileasn

65707580

asnpheleuthrargserthrgluserlysasnservallysvalarg

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnservalseralalysalaserthr

115120125

asnthrserargservalproserproalalysserthrproasnser

130135140

servalproalaseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

metalalysprophearggluleugluprogluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargglyphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

metglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometleualaprothrleutyrasn

260265270

tyrleuarglysleuaspargileleuproglyproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphecysglnmetglyserglycysthr

305310315320

arggluasnleuglualaleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalserleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>14

<211>419

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>mb_ackrs

<400>14

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalserglygluaspileasn

65707580

asnpheleuthrargserthrgluserlysasnservallysvalarg

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnservalseralalysalaserthr

115120125

asnthrserargservalproserproalalysserthrproasnser

130135140

servalproalaseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

metalalysprophearggluleugluprogluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargglyphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

metglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometvalalaprothrilepheasn

260265270

tyralaarglysleuaspargileleuproglyproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphepheglnmetglyserglycysthr

305310315320

arggluasnleuglualaleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalserleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>15

<211>419

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>mbpckrs

<400>15

metasplyslysproleuaspvalleuileseralathrglyleutrp

151015

metserargthrglythrleuhislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargsercysargthralaargalaphearghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspileasn

65707580

asnpheleuthrargserthrgluserlysasnservallysvalarg

859095

valvalseralaprolysvallyslysalametprolysservalser

100105110

argalaprolysproleugluasnservalseralalysalaserthr

115120125

asnthrserargservalproserproalalysserthrproasnser

130135140

servalproalaseralaproalaproserleuthrargserglnleu

145150155160

aspargvalglualaleuleuserprogluasplysileserleuasn

165170175

metalalysprophearggluleugluprogluleuvalthrargarg

180185190

lysasnasppheglnargleutyrthrasnasparggluasptyrleu

195200205

glylysleugluargaspilethrlysphephevalaspargglyphe

210215220

leugluilelysserproileleuileproalaglutyrvalgluarg

225230235240

pheglyileasnasnaspthrgluleuserlysglnilepheargval

245250255

asplysasnleucysleuargprometleuserprothrleucysasn

260265270

tyrmetarglysleuaspargileleuproglyproilelysilephe

275280285

gluvalglyprocystyrarglysgluseraspglylysgluhisleu

290295300

glugluphethrmetvalasnphecysglnmetglyserglycysthr

305310315320

arggluasnleuglualaleuilelysglupheleuasptyrleuglu

325330335

ileaspphegluilevalglyaspsercysmetvaltyrglyaspthr

340345350

leuaspilemethisglyaspleugluleuserseralavalvalgly

355360365

provalserleuaspargglutrpglyileasplysprotrpilegly

370375380

alaglypheglyleugluargleuleulysvalmethisglyphelys

385390395400

asnilelysargalaserargserglusertyrtyrasnglyileser

405410415

thrasnleu

<210>16

<211>454

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>mmpyls

<400>16

metasplyslysproleuasnthrleuileseralathrglyleutrp

151015

metserargthrglythrilehislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargserserargthralaargalaleuarghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspleuasn

65707580

lyspheleuthrlysalaasngluaspglnthrservallysvallys

859095

valvalseralaprothrargthrlyslysalametprolysserval

100105110

alaargalaprolysproleugluasnthrglualaalaglnalagln

115120125

proserglyserlyspheserproalaileprovalserthrglnglu

130135140

servalservalproalaservalserthrserileserserileser

145150155160

thrglyalathralaseralaleuvallysglyasnthrasnproile

165170175

thrsermetseralaprovalglnalaseralaproalaleuthrlys

180185190

serglnthraspargleugluvalleuleuasnprolysaspgluile

195200205

serleuasnserglylysprophearggluleuglusergluleuleu

210215220

serargarglyslysaspleuglnglniletyralaglugluargglu

225230235240

asntyrleuglylysleugluarggluilethrargphephevalasp

245250255

argglypheleugluilelysserproileleuileproleuglutyr

260265270

ilegluargmetglyileaspasnaspthrgluleuserlysglnile

275280285

pheargvalasplysasnphecysleuargprometleualaproasn

290295300

leutyrasntyrleuarglysleuaspargalaleuproaspproile

305310315320

lysilephegluileglyprocystyrarglysgluseraspglylys

325330335

gluhisleuglugluphethrmetleuasnphecysglnmetglyser

340345350

glycysthrarggluasnleugluserileilethrasppheleuasn

355360365

hisleuglyileaspphelysilevalglyaspsercysmetvaltyr

370375380

glyaspthrleuaspvalmethisglyaspleugluleuserserala

385390395400

valvalglyproileproleuaspargglutrpglyileasplyspro

405410415

trpileglyalaglypheglyleugluargleuleulysvallyshis

420425430

aspphelysasnilelysargalaalaargserglusertyrtyrasn

435440445

glyileserthrasnleu

450

<210>17

<211>454

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>mm_ackrs

<400>17

metasplyslysproleuasnthrleuileseralathrglyleutrp

151015

metserargthrglythrilehislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargserserargthralaargalaleuarghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspleuasn

65707580

lyspheleuthrlysalaasngluaspglnthrservallysvallys

859095

valvalseralaprothrargthrlyslysalametprolysserval

100105110

alaargalaprolysproleugluasnthrglualaalaglnalagln

115120125

proserglyserlyspheserproalaileprovalserthrglnglu

130135140

servalservalproalaservalserthrserileserserileser

145150155160

thrglyalathralaseralaleuvallysglyasnthrasnproile

165170175

thrsermetseralaprovalglnalaseralaproalaleuthrlys

180185190

serglnthraspargleugluvalleuleuasnprolysaspgluile

195200205

serleuasnserglylysprophearggluleuglusergluleuleu

210215220

serargarglyslysaspleuglnglniletyralaglugluargglu

225230235240

asntyrleuglylysleugluarggluilethrargphephevalasp

245250255

argglypheleugluilelysserproileleuileproleuglutyr

260265270

ilegluargmetglyileaspasnaspthrgluleuserlysglnile

275280285

pheargvalasplysasnphecysleuargprometvalalaproasn

290295300

ilepheasntyralaarglysleuaspargalaleuproaspproile

305310315320

lysilephegluileglyprocystyrarglysgluseraspglylys

325330335

gluhisleuglugluphethrmetleuasnphepheglnmetglyser

340345350

glycysthrarggluasnleugluserileilethrasppheleuasn

355360365

hisleuglyileaspphelysilevalglyaspsercysmetvaltyr

370375380

glyaspthrleuaspvalmethisglyaspleugluleuserserala

385390395400

valvalglyproileproleuaspargglutrpglyileasplyspro

405410415

trpileglyalaglypheglyleugluargleuleulysvallyshis

420425430

aspphelysasnilelysargalaalaargserglusertyrtyrasn

435440445

glyileserthrasnleu

450

<210>18

<211>454

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>mmpckrs

<400>18

metasplyslysproleuasnthrleuileseralathrglyleutrp

151015

metserargthrglythrilehislysilelyshishisgluvalser

202530

argserlysiletyrileglumetalacysglyasphisleuvalval

354045

asnasnserargserserargthralaargalaleuarghishislys

505560

tyrarglysthrcyslysargcysargvalseraspgluaspleuasn

65707580

lyspheleuthrlysalaasngluaspglnthrservallysvallys

859095

valvalseralaprothrargthrlyslysalametprolysserval

100105110

alaargalaprolysproleugluasnthrglualaalaglnalagln

115120125

proserglyserlyspheserproalaileprovalserthrglnglu

130135140

servalservalproalaservalserthrserileserserileser

145150155160

thrglyalathralaseralaleuvallysglyasnthrasnproile

165170175

thrsermetseralaprovalglnalaseralaproalaleuthrlys

180185190

serglnthraspargleugluvalleuleuasnprolysaspgluile

195200205

serleuasnserglylysprophearggluleuglusergluleuleu

210215220

serargarglyslysaspleuglnglniletyralaglugluargglu

225230235240

asntyrleuglylysleugluarggluilethrargphephevalasp

245250255

argglypheleugluilelysserproileleuileproleuglutyr

260265270

ilegluargpheglyileaspasnaspthrgluleuserlysglnile

275280285

pheargvalasplysasnphecysleuargprometleuserproasn

290295300

leucysasntyrmetarglysleuaspargalaleuproaspproile

305310315320

lysilephegluileglyprocystyrarglysgluseraspglylys

325330335

gluhisleuglugluphethrmetleuasnphecysglnmetglyser

340345350

glycysthrarggluasnleugluserileilethrasppheleuasn

355360365

hisleuglyileaspphelysilevalglyaspsercysmetvaltyr

370375380

glyaspthrleuaspvalmethisglyaspleugluleuserserala

385390395400

valvalglyproileproleuaspargglutrpglyileasplyspro

405410415

trpileglyalaglypheglyleugluargleuleulysvallyshis

420425430

aspphelysasnilelysargalaalaargserglusertyrtyrasn

435440445

glyileserthrasnleu

450

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1