本申请是申请号为201280049594.4,申请日为2012年8月9日,发明名称为“稳定的蛋白质”的中国专利申请的分案申请。
本发明涉及不易结晶的蛋白,并特别涉及不易稳定并因此不易结晶的gpcr。本发明也涉及使这种蛋白结晶的方法,以及这种蛋白的各种用途。所述蛋白可用于药物发现和开发研究。
背景技术:
gpcr组成了控制许多生理过程并且是许多有效药物靶标的一个极大的蛋白家族。特别参照overington等人(2006)naturerev.drugdiscovery5,993-996,其指出现有药物中超过四分之一具有作为靶标的gpcr。其在药理学上相当重要。在foord等人(2005)pharmacolrev.57,279-288中给出gpcr的列表,通过引用并入本文。
gpcr在分离时通常是不稳定的,并且即使付出相当大努力,才仅可能使包括牛视紫质(bovinerhodopsin)在内的几种gpcr结晶,牛视紫质是天然格外稳定的并且是β-2肾上腺素受体,其作为融合蛋白结晶或者与抗体片段形成复合物结晶。
人们认为gpcr以多种不同构象存在,所述构象与配体的不同药理学种类,如激动剂和拮抗剂相关,并且为行使功能在这些构象之间循环(kenakint.(1997)annnyacadsci812,116-125)。在构象之间的转换也导致在获得受体的晶体结构上的困难。
虽然gpcr都具有特征性的7个跨膜(tm)结构域,基于序列同源性和分子结构,仍可将其分为三个家族(a、b和c)。最大的组家族a,由与视紫质同源的受体组成。家族b也称为肠促胰液素受体家族,其是受大肽激素如高血糖素激素家族调节的受体;该家族成员的特征在于含有几个半胱氨酸的相对大的细胞外n端,所述几个半胱氨酸形成二硫桥网络并且是配体结合袋的一部分。家族c由与代谢型谷氨酸受体同源的受体组成;这些受体的特征是极长的细胞外n端和长的羧基尾巴,且所述n端形成配体结合袋,已证明其形成二硫化物连接的二聚体,在形状上类似捕蝇草。
在过去的几年中,已解析一些家族agpcr的结构,并通过开发一些关键技术已实现这些里程碑。一种这样的技术是将t4溶菌酶(t4l)插入在细胞内的细胞质环(icl)3中,并认为这样将生成允许形成晶体接触的大亲水区域[2][3]。这种技术与脂立方相结晶学相结合的应用已允许beta2、a2a、cxcr4和d3受体的高分辨率结构确定[2]。因此,已从这些关于家族a受体的tm束的定位和组织的结构中搜集到重要的信息。然而,几乎没有信息可用于家族b和c受体的成员,而且考虑到高度的序列分歧,在这些家族间的tm结构域的结构和组织上可能存在显著的不同[1]。
在家族a受体中,因为认为螺旋5和6之间的距离与t4l的n和c端之间的距离接近,所以将t4l插入到icl3中。因此,可能在这个位置容纳融合蛋白,而不认为其它螺旋之间的距离有助于插入融合配偶体。事实上,已将t4l与一些不同的家族a受体在icl3上相融合,在每种情况下功能蛋白都得以表达并具有受体柔性减少的额外优点,并因此增加整体稳定性。
我们检测了将t4l插入在家族b受体的内环、特别在icl3中的效果。我们的数据表明家族b受体不能在icl3中容纳t4l融合,然而令人惊讶和意想不到的是,考虑到家族a受体的结构,将t4l加入icl2中改善了家族b受体的生物化学性质。icl2将gpcr包含跨膜螺旋(tm)-1、tm2和tm3的部分连接到gpcr包含tm4、tm5、tm6和tm7的部分。目前的数据表明,与家族a受体不同,在家族b受体中,螺旋3和4之间的距离与t4l的n和c端之间的距离更接近,而不是螺旋5与6之间的距离与t4l的n和c端之间的距离更接近。因此,认为在gpcr的这两个部分之间插入稳定的蛋白结构域代表了之前未能预测到的促进gpcr结晶的新技术。
技术实现要素:
因此,本发明的第一方面提供融合蛋白,其从n端到c端包含:
a)家族b的g蛋白偶联受体(gpcr)的第一部分,其包含gpcr的tm1、tm2和tm3;
b)稳定的蛋白结构域;以及
c)gpcr的第二部分,其包含gpcr的tm4、tm5、tm6和tm7。
我们以“gpcr”表示具有gpcr信号活性且保留完整7个tm区的g蛋白偶联受体或多肽。本领域标准命名法将gpcr的跨膜螺旋从n端至c端命名为tm1、tm2、tm3、tm4、tm5、tm6和tm7。跨膜螺旋通过在tm2和tm3之间、在tm4和tm5之间、在tm6和tm7之间的细胞外氨基酸延伸连接,分别称为细胞外环(ecl)1、2和3。跨膜螺旋通过在tm1和tm2之间、在tm3和tm4之间以及在tm5和tm6之间的细胞内氨基酸延伸连接,分别称为细胞内环(icl)1、2和3。因此,如上定义的第一和第二gpcr部分通过icl2区天然地连接,即icl2将连接至icl2n端的第一部分(包含tm1、tm2和tm3)与连接到icl2c端的第二部分(包含tm4、tm5、tm6和tm7)连接。
gpcr优选地源自包含天然多态性的全长野生型序列,或源自被改变的突变体gpcr分子,例如为改善所述gpcr的一个或多个性质如稳定性而已将gpcr分子改变。
gpcr可源自野生型和突变体gpcr,其中所述突变体gpcr可以是偏向特定构象,例如激动剂或拮抗剂的稳定的gpcr。例如,随后可将稳定的蛋白结构域插入在构象上稳定的gpcr的tm3和tm4之间。
我们之前已经开发了在生物学相关构象中稳定gpcr的方法(参见wo2008/114020),其描述了称为starstm的稳定gpcr生产,当从细胞膜中纯化时,所述方法能够纯化保持其构象、稳定性和功能的重组g蛋白偶联受体。此外,这种平台技术也提供将偏向激动剂构象或拮抗剂构象的受体进行工程化的方法(也参见magnani等,2008;serrano-vega等,2008;shibata等,2009),即其在特定构象中具有增加的稳定性。这种稳定的受体可用于本发明并具有一些优势,例如稳定性、提高纯化蛋白产量、减少变性和减少非特异性结合。在本发明中使用稳定的突变体gpcr时,优选地选择和制备使用任何在pct申请wo2008/114020、wo2009/114020和wo2009/081136中所述的方法。优选地,第一和第二gpcr部分来自于在特定构象中、相对于亲代gpcr具有增加稳定性的gpcr(即增加的构象稳定性)。通过增加构象的稳定性,我们包括如下含义:当暴露在变性剂或变性条件中,与相同构象的亲代gpcr相比特定构象的突变体gpcr具有增加的稳定性(例如延长的寿命)。变性剂/变性条件的实例包括热、去污剂、离液剂和极端ph。如本领域所公知,这样的变性剂或变性条件可影响蛋白的二级和三级结构而不是一级序列。
在本发明实施中适合使用的gpcr包括任何家族b的gpcr,例如类胰高血糖素肽1受体(glp1r)、类胰高血糖素肽2受体(glp2r)、降钙素受体(ct)、糊精/cgrp受体(amy1α)、糊精受体(amy2α)、糊精/cgrp受体(amy3α)、cgrp/肾上腺髓质素受体(cgrp1α)、肾上腺髓质素/cgrp受体(am1α)、肾上腺髓质素/cgrp受体(am2α受体)、促肾上腺皮质激素释放因子受体(crf1)、尿皮质素(urocortin)受体(crf2)、生长激素释放激素受体(ghrh)、抑胃多肽受体(gip)、胰高血糖素受体、分泌素受体、tip-39受体(pth2)、甲状旁腺激素受体(pth1)、vip/pacap受体(vpac1)、pacap受体(pac2)以及vip/pacap受体(vpac2)中的任意者。在具体优选的实施方案中,所述gpcr是glp1r。其它适合的gpcr是本领域公知的并且包括那些已列表在overington等人(见上)中。另外,国际药理学联盟提出一个包括家族b的gpcr在内的gpcr列表(foord等人,(2005)pharmacol.rev.57,279-288,并且这个列表定期地更新在网址http://www.iuphar-db.org/gpcr/receptorfamiliesforward上;家族b的gpcr作为2类gpcr列表在表2中)。
很容易获得许多gpcr的氨基酸序列(和编码所述氨基酸序列的cdna的核苷酸序列),例如通过参考genbank。特别地,foord等人(见上)从entrezgene(http://www.ncbi.nlm.nih.gov/entrez)给出人基因符号和人、小鼠和大鼠基因id。应该注意的还有,因为人基因组序列基本上完整,可以从其推断出人gpcr的氨基酸序列。
虽然gpcr可以源自任何来源,特别优选其来自真核生物来源。特别优选地,其源自脊椎动物来源,如哺乳动物。特别优选地,gpcr源自大鼠、小鼠、兔子或狗或非人灵长类动物或人。为了避免疑义,在“源自”意思中我们包括cdna或基因是使用来自所述来源的遗传材料最初获得的,但是随后所述蛋白可在任何宿主细胞中表达。因此,这将是平常的:真核生物gpcr(例如禽或哺乳动物gpcr)可在原核宿主细胞,如大肠杆菌中表达,但视情况而定也可认为其源自禽或哺乳动物。
在某些情况下,gpcr可由多于一个不同的亚基组成。例如,降钙素基因相关的肽受体需要结合单一跨膜螺旋蛋白(ramp1)而获得其生理学配体结合特征。与gpcr组合形成或调节功能复合物的效应器、附加物、辅助器或gpcr-相互作用蛋白在本领域中是公知的并且包括,例如受体激酶、g-蛋白和抑制蛋白(arrestin)(bockaert等人,(2004)curropiniondrugdiscovanddev7,649-657)。在某些情况下,可将所述gpcr与gpcr配体结合。通过“配体”,我们包括与gpcr结合的任何分子。许多配体是已知的,例如从wo2008/114020和neubig等人(2003)pharmacol.rev.55,597-606,两者都通过参考并入本文。因此,融合蛋白可包括含有tm1、tm2和tm3的gpcr部分,其与含有tm4、tm5、tm6和tm7的gpcr部分相连接,其中所述gpcr与gpcr结合配偶体结合。用这样的方法,通过能够使gpcr与其它分子的复合物结晶可能获得在gpcr相互作用上的结构启示。优选地,所述分子不是与gpcr的icl2相结合的那些。
对任何给定的gpcr,技术人员使用本领域的标准技术可确定tm螺旋。例如,可用计算机程序,其基于疏水性为gpcr的跨膜区建模(kyle&dolittle(1982)j.mol.biol.157,105-132)。同样,在万维网上(worldwideweb)广泛使用跨膜预测算法服务器(如expasy),其中的许多依赖于嗜水性分析。tmhmm是膜蛋白拓扑预测方法,可以根据隐马尔可夫模型(hiddenmarkovmodel)(tmhmmserverv.2.0;http://www.cbs.dtu.dk/services/tmhmm/)使用该方法。对于给定的gpcr,当其跨膜区例如通过结构分析或嗜水性分析已知时,通过多重或成对地序列比对也可确定在其它gpcr中的类似区。例如,可使用clustalw程序(thompson等人,1994)进行比对。使用的参数可如下:快速配对比对参数:k-元组(字码)尺寸;1,窗口尺寸;5,空隙罚分;3,顶端对角线数;5;评分方法:x百分比。多重比对参数:空隙开放罚分;10,空隙延伸罚分;0.05;评分矩阵:blosum。
图6列出家族b的gpcr的氨基酸序列,并突出tm3、icl2和tm4的位置。例如,对于人glp1r,tm3以phe257结尾,icl2对应于ser258至ser261,tm4以glu262开始。因此合宜地,当gpcr是家族b受体时,当如使用clustalw比对序列时,通过定位氨基酸残基可确定tm3、icl2和tm4的位置,所述氨基酸残基对应于在图6中定义的tm3、icl2和tm4边界的氨基酸。
然而应当理解,所述边界不是绝对的而且其可能非常依赖为glp1r提供的曾用于定义其的模型。例如,在图1a和图1b中人glp1r的tm3以leu254结尾,icl2对应于leu255至trp264,以及tm4以ile265开始。同样,可将环区定义为连接α螺旋的氨基酸结构或经预测在膜外的氨基酸结构,所述边界将根据所用的定义而改变。
在一个实施方案中,将稳定的蛋白结构域插入到icl2中。因此,本发明提供gpcr,在其中已将稳定的蛋白结构域插入到icl2中。通过“插入到icl2中”,我们包括氨基酸序列的添加和取代两者,所述氨基酸序列的添加定义为稳定的蛋白结构域进入icl2的氨基酸序列中而没有删除icl2的任何氨基酸,所述取代为用编码稳定的蛋白结构域的氨基酸序列取代icl2的一个或多个或全部氨基酸。应当理解,在此实施方案中除必要的跨膜螺旋以外,gpcr的第一和/或第二部分可包括至少一部分的icl2。gpcr的第一部分可包括tm1、tm2和tm3以及icl2的n端部分。gpcr的第二部分可包括tm4、tm5、tm6和tm7以及icl2的c端部分。
应当理解,稳定的蛋白结构域可插入到icl2中,并且在其n和/或c端侧是一个或两个间隔部分。以这种方式,所述稳定的蛋白结构域与icl2不是直接相连而是间接相连。所述间隔部分可用于帮助减少在螺旋上的张力。
优选地,通过使用稳定的蛋白结构域的氨基酸序列取代在icl2氨基酸序列上的一个或多个连续氨基酸(例如,2、3、4或5个或更多氨基酸)从而将稳定的蛋白结构域插入在icl2中。在一个实施方案中,被取代的一个或多个氨基酸是来自tm3的c端和/或tm4的n端的至少一个或两个氨基酸。换句话说,所述融合蛋白在稳定的蛋白结构域的至少一侧可具有icl2的至少一个或两个氨基酸。
如实施例1所述,我们已将t4溶菌酶插入至glp1r的icl2中的各种位置上,在phe257和ser261之间的插入导致产生的融合glp1r受体。因此,特别优选在根据图6所示人glp1r编号的与氨基酸phe257和ser261相对应的氨基酸残基之间的位置上,将稳定的蛋白结构域插入至gpcr的icl2区。
因此,根据图6所示的人glp1r的编号,在与氨基酸phe257相对应的氨基酸之后并在与氨基酸ser261或phe260或val259相对应的氨基酸之前,可将稳定的蛋白结构域的氨基酸插入到gpcr的icl2区。例如,根据图6所示的人glp1r的编号,稳定的蛋白结构域的氨基酸序列可取代与ser258相对应的氨基酸,或者其可取代与ser258和val259相对应的氨基酸,或者其可取代与ser258、val259和phe260相对应的氨基酸。在这样的位置上插入稳定的蛋白结构域对应于图1a-1b所示的glp1r-t4溶菌酶融合构建体1c、2c和3c。
同样地,根据图6所示的人glp1r的编号,在与氨基酸ser258相对应的氨基酸之后并在与氨基酸ser261或phe260或val259相对应的氨基酸之前,可将稳定的蛋白结构域的氨基酸插入到gpcr的icl2区。例如,根据图6所示的人glp1r的编号,稳定的蛋白结构域的氨基酸序列可取代与val259相对应的氨基酸,或者其可取代与val259和phe260相对应的氨基酸。在这样的位置上插入稳定的蛋白结构域对应于图1a-1b所示的glp1r-t4溶菌酶融合构建体1d、2d和3d。
通过“相对应的氨基酸残基”,我们包括以下含义:当使用macvector和clustalw比较人glp1r受体和其它gpcr时,与在人glp1r上的给定的氨基酸残基比对的另一个gpcr上的氨基酸残基。
虽然优选地,根据图6所示的人glp1r的编号,在与氨基酸phe257和ser261相对应的氨基酸残基之间的位置上,将稳定的蛋白结构域插入到gpcr的icl2区,应当理解可将稳定的蛋白结构域插入到此区之外。
应当理解,稳定的蛋白结构域的功能是为晶体接触增加亲水性表面以及减少gpcr的固有柔性以使得如改善gpcr的结晶性质。因此,通过“稳定的蛋白结构域”,我们包括提供用于晶格接触的亲水表面的任何可溶的、折叠的多肽。此外,所述蛋白结构域是稳定的,从而在其折叠形式其对变性有抗性(例如,对热、洗涤剂、离液剂等稳定)。对蛋白稳定性的检测是本领域公知的并包括在wo2008/114020中所述的那些。
通常,稳定的蛋白结构域是在细胞中从融合蛋白的gpcr部分自主折叠的那个。
合宜地,稳定的蛋白结构域是容易结晶的那个。因此,稳定的蛋白结构域可以是已解析出晶体结构的蛋白,例如坐标(coordinate)已保存在蛋白质数据库(http://www.pdb.org/)的蛋白。
稳定的蛋白结构域的特别优选的特征是:
1、所述结构域是可溶的、良好折叠的并在一个或多个表达系统可容易地表达;
2、所述结构域的n和c端在空间上紧靠,通常在
3、所述结构域耐热和耐化学变性以及耐蛋白水解降解;
4、所述结构域在各种空间群和晶体堆积排列中是高度可结晶的。
优选地,所述结构域不含半胱氨酸残基,所以防止了在所述结构域内或在融合蛋白的gpcr部分中的二硫键形成。应当理解既然所述结构域可溶,那么其不应是疏水的或者不应倾向以无序方式聚集。
在一个实施方案中,稳定的蛋白结构域的长度在50和1000个氨基酸之间,优选地在50和300个氨基酸或100和300个氨基酸之间、或在150和250个氨基酸之间。
一旦已发现适合所述稳定的蛋白结构域的多肽,也许有必要通过从或至所述多肽的n端、c端或两端中删除或添加氨基酸残基对所述多肽进行修饰,以使得在所述多肽末端骨架上最接近的α碳原子被
优选地,稳定的蛋白结构域的插入不影响gpcr的生物学活性,例如结合活性或信号传导通路调节活性。理想地,相对于在没有稳定的蛋白结构域时的相同活性水平,所述融合蛋白应保留其生物学活性的至少60%、或70%、或80%、或90%,最理想地保留其生物学活性的100%。用于评估gpcr结合和gpcr信号传导的方法是本领域公知的并描述在如wo2008/114020和wo2009/101383中,两者都通过引用并入本文。因此,当生物学活性是结合活性时,使用本领域已知的常规结合分析可评估与任何gpcr结合配偶体的结合;当生物学活性是信号传导通路调节活性时,通过任何适用于具体信号传导通路的分析(如报告基因分析)可评估所述活性。
应当理解,对于结晶用途而言保留的配体结合活性比保留的信号传导活性更重要,因此可取地在结晶之前仅评估配体结合能力。因此,在一个具体优选的实施方案中,稳定的蛋白结构域不影响gpcr的结合活性。
为避免疑义,稳定的蛋白结构域不是特定gpcr的icl2或其部分。
在优选的实施方案中,稳定的蛋白结构域是溶菌酶。已知溶菌酶容易结晶,各种野生型和变体溶菌酶的结构已保藏在蛋白质数据库(www.rcsb.org)。合适的实例包括135l、193l、194l、1aki、1gbs、1iee、1lz1、1p7s、1rex、1vdq、2anv、2anx、2d4k、2fbb、2ihl、2nwd、2xbr、2xbs、2z2f、2zyp、3a8z、3k2r、3n9a、3n9c、3n9e和3od9。
尽管源自任何来源的溶菌酶都可用,特别优选所述溶菌酶源自t4噬菌体。在图7a-7b中提供t4噬菌体溶菌酶的两个氨基酸序列,所述序列的任一个可用在本发明的背景中。溶菌酶可源自包括天然多态性的全长野生型序列,或者其也可以是,例如改善一个或多个性质的已被改变的突变体溶菌酶。因此,可以理解可使用图7a-7b所提供的氨基酸序列的变体,例如与图7a-7b所示序列的任一个具有至少60%、65%、70%、75%、80%、85%或90%的序列同一性的氨基酸序列,更优选地与图7a-7b所示序列任一个具有至少95%或99%的序列同一性的氨基酸序列。
可以通过使用如blast或psi-blast的算法(altschul等人,nar(1997),25,3389-3402)或基于隐藏的马尔可夫模型的方法(eddys等人,jcomputbiol(1995)spring2(1)9-23.)测定序列同一性。通常可以使用任何合适的计算机程序,例如威斯康星大学遗传计算机组的gap程序确定在两个多肽之间的百分比序列同一性,并且应理解的是计算涉及其序列已经被优化比对的多肽的百分比同一性。可选择地使用如上述的clustalw程序(thompson等人,1994)进行比对。
虽然溶菌酶是稳定的蛋白结构域的优选实例,仍可使用一般原理利用具有上述特性的许多多肽。因此,合适的候选者包括那些含有易结晶蛋白的氨基酸序列,例如,通过查询本领域已知的蛋白质数据库或其它结晶数据库而发现的。其它实例包括在engel等人(2002)(bba1564:38-46)(通过引用并入本文)所述的那些,例如细胞色素b562、黄素氧化还原蛋白、β-内酰胺酶和70kda热休克三磷酸腺苷酶结构域。
可修饰融合蛋白以使其可更容易被检测出,例如通过将其生物素化或通过并入本领域已知的任何可检测标记,如放射性标记、荧光标记或者酶标记。在特别优选的实施方案中,所述标记是荧光标记如egfp。同样地,可修饰融合蛋白以促进纯化,例如通过并入任何本领域已知的任何亲和性部分,如gst标签、6xhis标签、mbp或其它表位标签。这样的修饰可在gpcr的n端或c端或者在外环中。
如实施例1所示,应相信与没有插入稳定的蛋白结构域的gpcr的生物化学性质相比,本发明的融合蛋白具有改善的生物化学性质。这种改善的性质使得所述融合蛋白更适合结晶。因此,预期融合蛋白具有用于晶体接触的更大的亲水性表面。同样地,与没有插入稳定的蛋白结构域的gpcr相比,预期融合蛋白更加可溶,例如在洗涤剂溶液中显示更少的聚集。用于评估gpcr溶解度的方法是本领域公知的,包括尺寸排阻色谱法,例如在实施例1中所述的用于评估在ddm中溶解度的荧光尺寸排阻色谱法。与没有插入稳定的蛋白结构域的gpcr相比,所述融合蛋白也可以是更加稳定的(例如,对热、洗涤剂或离液剂中的任意者)。用于评估gpcr稳定性的方法是本领域已知的,包括在wo2008/114020所述的那些。
合宜地,通过标准分子生物学和重组dna技术产生所述融合蛋白。例如,使用本领域公知的标准克隆技术和pcr可制成编码第一和第二gpcr部分以及稳定的蛋白结构域的dna片段。然后依据传统的实施可将片段在读码框内连接在一起,例如通过利用平末端或交错末端连接、限制性酶消化以提供合适的末端、酌情补平粘性末端、碱性磷酸处理以避免不需要的连接,以及酶连接。
同样地,使用不依赖连接酶的克隆策略,例如infusion或gateway可制成融合构建体。也可通过从头开始的基因合成而合成地制成所述构建体。
可以理解,可将gpcr和稳定的蛋白结构域中的一个或者两个突变以改善溶解度、稳定性、表达或结晶能力(crystallisability)中的任一项。
用于对基因和cdna进行克隆和工程化、用于突变dna和用于在宿主细胞中从多核苷酸表达多肽的分子生物学方法是本领域公知的,如在“molecularcloning,alaboratorymanual”,第三版,sambrook,j.和russell,d.w.(编),coldspringharborlaboratorypress,coldspringharbor,ny中举例说明的,通过引用并入本文。
合适的表达系统包括在细菌或酵母、病毒表达系统(所述病毒表达系统例如杆状病毒、semliki森林病毒和慢病毒)中的组成型或诱导型表达系统,或在昆虫或哺乳动物细胞中的瞬时转染。合适的宿主细胞包括大肠杆菌、乳球菌(lactococcuslactis)、酿酒酵母(saccharomycescerevisiae)、栗酒裂殖酵母(schizosaccharomycespombe)、巴斯德毕赤酵母(pichiapastoris)、草地贪夜蛾(spodopterafrugiperda)和粉纹夜蛾(trichoplusiani)细胞。合适的动物宿主细胞包括hek293、cos、s2、cho、nso、dt40等等。已知某些gpcr需要特定脂质(例如胆固醇)以行使功能。在那种情况下,希望选择含有所述脂质的宿主细胞。此外或可选择地,在分离和纯化融合蛋白期间可以加入脂质。通过标准技术,例如亲和层析法可进行纯化。
本发明的第二方面提供编码根据本发明的第一方面的融合蛋白的多核苷酸。所述多核苷酸可以是rna(如mrna)或dna,虽然通常其是dna。
应当理解,可将所述多核苷酸整合进载体中,因此本发明也提供包含根据本发明的第二方面的多核苷酸的载体。
合适的载体是在原核(如细菌)或真核(如哺乳动物)细胞中繁殖和/或允许融合蛋白表达的那些。例如,所述载体可以是质粒、粘粒、噬菌体或细菌人工染色体(bac)。载体的多核苷酸序列将取决于预期宿主细胞的性质、将本发明的第二方面的多核苷酸引入宿主细胞的方式、以及是希望维持还是整合游离基因。合宜地,所述载体包含至少一个可选择的标志物,例如抗生素抗性标志物(例如卡那霉素或新霉素)。
载体用于复制本发明的第二方面的多核苷酸,也用于使用所述多核苷酸转染细胞,以及也可用于促进融合蛋白的表达。
典型的原核载体质粒是:可获自bioradlaboratories(richmond,ca,美国)的puc18、puc19、pbr322和pbr329;可获自pharmacia(piscataway,nj,美国)的ptrc99a、pkk233-3、pkk233-3、pdr540和prit5;可获自stratagenecloningsystems(lajolla,ca92037,美国)的pbs载体、phagescript载体、bluescript载体、pnh8a、pnh16a、pnh18a和pnh46a。
典型的哺乳动物细胞载体质粒是可获自pharmacia(piscataway,nj,美国)的psvl。这个载体使用sv40晚期启动子以驱动克隆基因的表达,最高表达水平发现于t抗原产生细胞中,例如cos-1细胞。另一个实例是用在cos-1或cos-7细胞中的pcdna3.1(neo)(invitrogen)。诱导型哺乳动物表达载体的实例是也可获自pharmacia(piscataway,nj,美国)的pmsg。所述载体使用小鼠乳腺肿瘤病毒长末端重复的糖皮质激素诱导启动子以驱动克隆基因的表达。
有用的酵母质粒载体是prs403-406和prs413-416,以及通常可获自于stratagenecloningsystems(lajolla,ca92037,美国)。质粒prs403、prs404、prs405和prs406是酵母整合质粒(yips),其包含酵母可选择的标志物his3、trp1、leu2和ura3。质粒prs413-416是酵母着丝粒质粒(ycps)。
在优选的实施方案中,所述包含的本发明第二方面的多核苷酸的载体是pcdna3.1(http://products.invitrogen.com/ivgn/product/v79020)。
在本领域已知的任何合适的方法可用于构建含有本发明的第二方面的多核苷酸的载体,包括上述的连接技术。
本发明的第三方面提供含有根据本发明的第二方面的多核苷酸的细胞,或含有所述多核苷酸的载体。这种细胞可用于复制本发明的第二方面的多核苷酸,或可用于表达本发明的第一方面的融合蛋白。
所述细胞可以是原核的或真核的。
应当理解,构建和扩增本发明的第二方面的多核苷酸在细菌细胞中方便地进行。所述多核苷酸的表达可在细胞中进行,如哺乳动物细胞或细菌细胞。
细菌细胞是优选的原核宿主细胞,通常是大肠杆菌株,例如可获自bethesdaresearchlaboratoriesinc.,bethesda,md,美国的大肠杆菌株dh5、以及可获自美国,md,rockville的美国典型培养物保藏所(americantypeculturecollection,atcc)(atcc号31343)的rr1。优选的真核宿主细胞包括酵母、昆虫和哺乳动物细胞或细胞系,优选脊椎动物细胞或细胞系,例如来自小鼠、大鼠、猴子或人的那些。特别优选的细胞是人胚胎肾细胞,例如hek293t细胞。
可稳定或不稳定地转染用于表达融合蛋白的细胞。
本发明的第四方面提供使根据本发明第一方面的融合蛋白结晶的方法,所述方法包括提供根据本发明第一方面的融合蛋白以及使其结晶以获得晶体。
在一个实施方案中,通过培养根据本发明第三方面的宿主细胞以表达融合蛋白并分离所述蛋白从而提供融合蛋白。
任何合适的结晶方法可用于使融合蛋白结晶,例如那些综述在“crystallisationofbiologicalmacromolecules”(alexandermcpherson;isbn:0-87969-617-6)中的任意者,其以参考并入本文。
在优选的实施方案中,使用脂立方相结晶学进行结晶(参见us2011/0031438,以参考并入本文)。
本发明的第五方面提供包含本发明的第一方面的融合蛋白的晶体。
本文公开的融合蛋白用于结晶研究以及用于药物研发程序。其可用于受体/配体动力学和热力学参数的生物物理学测量,例如通过表面等离子共振或基于荧光的技术。其可用于配体结合筛选,以及与固体表面相偶联以用于高通量筛选或作为生物传感器芯片。包含融合蛋白的生物传感器芯片可用于检测分子,尤其是生物分子。
本发明将借助下列附图和实施例描述。
附图说明
图1a和1b:具有glp1r的t4l融合构建体的设计。t4l在icl2(左)和icl3(右)中被插入在指示的残基之后。构建体1a表示t4l被插入在l255和s261之间。tm结构域和环的模型基于参考文献[4]。
图2:与野生型(wt)和模拟转染(u)样本相比的glp1r-t4l融合构建体总egfp信号。以50ug的总细胞材料一式两份地进行每个测量。误差线代表与平均值之间的标准偏差。
图3:野生型glp1r的典型的fsec洗脱谱。
图4a至4l:ddm溶解的在icl2中的glp1r-t4l融合构建体的fsec洗脱谱覆盖野生型的谱。在每种情况下,野生型谱以红色显示,而融合构建体以蓝色显示。
图5a至5s:ddm溶解的在icl3上的glp1r-t4l融合构建体的fsec洗脱谱覆盖野生型谱。在每种情况下,野生型谱以红色显示,融合构建体以蓝色显示。
图6:显示tm3、icl2和tm4(seqidno:1-22)位置的家族b的gpcr的氨基酸序列。在glp1r融合构建体中被t4l取代的icl2的部分在来自小鼠、大鼠和人的其它家族b受体中突出显示。
图7a至7b:t4噬菌体溶菌酶的氨基酸序列:图7a,插入在家族a受体的icl3上的序列[2],[3](seqidno:23);图7b,插入在家族b受体的icl2上的序列(seqidno:24)(参见实施例)。在框中显示差异。
具体实施方式
实施例1:icl2内的t4l插入改善了glp1r的生物化学性质。
概要
我们已经检测将t4l插入家族b受体内环的效果。我们的数据表明,家族b受体不能容纳在icl3中的t4l融合,然而将t4l加至icl2却能改善受体的生物化学性质。
结果
根据glp1r的模型确定glp1r的环区,并将编码t4l的dna插入至在icl2和icl3内的不同位置(图1a至1b)。为监测总表达和使用荧光检测尺寸排阻色谱法的单分散性,将glp1r构建体在c端用egfp标记。
在序列确认后,这些构建体在hek293t中瞬时地表达。作为初始分析,在整个细胞中测量egfp信号以评估总表达水平。有趣的是,在icl3中的构建体不能产生任何egfp信号,表明在glp1r这个区的t4l融合与此受体的整体结构不相容。然而,在icl2上的融合导致glp1r的强烈表达(图2)。
为分析glp1r-t4l融合的生物化学性质,将表达这些构建体的细胞溶于十二烷基麦芽苷(ddm)中,并将其用于荧光检测尺寸排阻色谱法(fsec)。fsec已广泛用于提供关于蛋白质的单分散性和聚集状态的数据,特别是在预结晶筛选中[5]。一般地,条件越有利将导致越多的单分散性和减少的聚集。ddm溶解的野生型glp1r的fsec的洗脱谱显示具有聚集肩的主单分散性峰以及游离的egfp种类的存在,所述游离的egfp种类是蛋白水解降解的结果(图3)。
与图2所示的egfp信号数据相一致,icl2t4l融合构建体1a、1b、2a、2b、3a和3b的洗脱谱表明细胞不能表达这些融合(图4a至4l)。这最有可能因为t4l的n端与tmiii的靠近导致破坏整体结构。与之相反,构建体1c、1d、2c、2d、3c和3d的洗脱谱显示产生的融合受体得以表达,以及更显著的是看起来t4l融合导致聚集峰的减少和伴随的单分散性峰的改善,其一起表明t4l插入在受体的此区对于溶解的受体的生物化学性质具有有利的影响(图4a至4l)。在构建体1c和2c中这种影响最明显。
对icl3融合构建体进行同样的分析,其与图2所示的egfp信号数据相一致,在icl3中的t4l融合中没有导致表达任何产生的融合受体(图5a至5s)。
综上所述,这些数据表明在glp1r的第三细胞质环中的t4l融合是不相容的,然而,将t4l插入在第二细胞质环的某些位置不仅相容,并且其改善了溶解受体的生物化学性质。考虑到家族b的gpcr的成员之间的高度序列同源性,我们建议可将这些观察延伸至这个家族的其它成员。如图6所示,在其它家族b成员中突出显示在最佳构建体(1c)中被取代的icl2的部分。
方法和材料
使用标准分子生物学技术将t4溶菌酶插入到人glp1r的第二和第三细胞质环中。在hek293t细胞中从修饰的pcdna3.1中瞬时表达这些构建体,将产生的受体在其c端与eegfp融合。根据制造商的指南使用genejuice(merckbiosciences)进行转染。通常,用6ug的dna去转染在10cm平皿中的3x106贴壁细胞。在转染后约40小时收集细胞,并将其重悬于补充了完全无edta的蛋白酶抑制剂混合物(completeedta-freeproteaseinhibitorcocktail(roche))的50mmhepesph7.5/150mmnacl/0.5mmedta。通常,在4℃将每个样本的650ug与1%ddm在200ul的总体积中溶解1小时,接着在50000rpm离心30分钟。将50ul的上清上样在bioseep-sec-s3000柱(phenomenex)上,用sec缓冲液(50mmhepesph7.5/150mmnacl/0.5mmedta/0.03%ddm)进行预平衡,然后以1ml/分钟的流速运行15分钟。使洗脱液通过在线荧光计,其具有下列设置:激发490nm、发射513nm和13的增益。
参考文献
[1]kristiansen,k.molecularmechanismsofligandbinding,signaling,andregulationwithinthesuperfamilyofg-protein-coupledreceptors:molecularmodelingandmutagenesisapproachestoreceptorstructureandfunction.pharma&therap103,21-80(2004).
[2]billrm,hendersonpj,iwatas,kunjier,michelh,neutzer,newsteads,poolmanb,tatecgandvogelh.overcomingbarrierstomembraneproteinstructuredetermination.natbiotechnol.29(4),335-340(2011).
[3]kobilkabk,kobilkats,danielk,reganjw,caronmg和lefkowitzrj.chimericalpha2-,beta2-adrenergicreceptors:delineationofdomainsinvolvedineffectorcouplingandligandbindingspecificity.science240(4857)1310-6(1988).
[4]frimurertm和bywaterrp.structureoftheintegralmembranedomainoftheglp1receptor.proteins35(4),375-86(1999).
[5]kawatet和gouauxe.fluorescence-detectionsize-exclusionchromatographyforprecrystallizationscreeningofintegralmembraneproteins.structure14(4),673-81(2004)。
序列表
<110>赫普泰雅治疗有限公司
<120>稳定的蛋白质
<130>hepbp/p51727pc
<140>pct/gb2012/051940
<141>2012-08-09
<150>us61/522147
<151>2011-08-10
<160>44
<170>seqwin99
<210>1
<211>58
<212>prt
<213>大鼠
<400>1
serleuilephemetalaphepheserglulyslystyrleutrpgly
151015
phethrilepheglytrpglyleuproalavalphevalalavaltrp
202530
valglyvalargalathrleualaasnthrglycystrpaspleuser
354045
serglyhislyslystrpileileglnval
5055
<210>2
<211>58
<212>prt
<213>小鼠
<400>2
serleuilephemetalaphepheserglulyslystyrleutrpgly
151015
phethrilepheglytrpglyleuproalavalphevalalavaltrp
202530
valglyvalargalathrleualaasnthrglycystrpaspleuser
354045
serglyhislyslystrpileileglnval
5055
<210>3
<211>58
<212>prt
<213>人
<400>3
serleuilephemetalaphepheserglulyslystyrleutrpgly
151015
phethrvalpheglytrpglyleuproalavalphevalalavaltrp
202530
valservalargalathrleualaasnthrglycystrpaspleuser
354045
serglyasnlyslystrpileileglnval
5055
<210>4
<211>57
<212>prt
<213>小鼠
<400>4
asnleuilephevalserphepheseraspthrlystyrleutrpgly
151015
pheileserileglytrpglypheproalavalphevalvalalatrp
202530
alavalalaargalathrleualaaspthrargcystrpgluleuser
354045
alaglyaspargtrpiletyrglnala
5055
<210>5
<211>57
<212>prt
<213>大鼠
<220>xaa
<221>unsure
<222>氨基酸56和57
<223>unsure
<400>5
asnleuilephevalserphepheseraspthrlystyrleutrpgly
151015
pheileleuileglytrpglypheproalavalphevalvalalatrp
202530
alavalalaargalathrleualaaspthrargcystrpgluleuser
354045
alaglyaspargtrpiletyrxaaxaa
5055
<210>6
<211>58
<212>prt
<213>人
<400>6
asnleuilephevalalaphepheseraspthrlystyrleutrpgly
151015
pheileleuileglytrpglypheproalaalaphevalalaalatrp
202530
alavalalaargalathrleualaaspalaargcystrpgluleuser
354045
alaglyaspilelystrpiletyrglnala
5055
<210>7
<211>59
<212>prt
<213>小鼠
<400>7
cysleuleualaserthrserproargserlysproalaphetrptrp
151015
leuvalleualaglytrpglyleuprovalleucysthrglythrtrp
202530
valglycyslyshisserphegluaspthrglucystrpaspleuasp
354045
asnserserprocystrptrpileilelysgly
5055
<210>8
<211>59
<212>prt
<213>大鼠
<400>8
cysleuleualaserthrserproargserlysproalaphetrptrp
151015
leuvalleualaglytrpglyleuprovalleucysthrglythrtrp
202530
valglycyslysleualaphegluaspthralacystrpaspleuasp
354045
aspserserprotyrtrptrpileilelysgly
5055
<210>9
<211>59
<212>prt
<213>人
<400>9
cysleuleualaserthrserproserserargargalaphetrptrp
151015
leuvalleualaglytrpglyleuprovalleuphethrglythrtrp
202530
valsercyslysleualaphegluaspilealacystrpaspleuasp
354045
aspthrserprotyrtrptrpileilelysgly
5055
<210>10
<211>59
<212>prt
<213>小鼠
<400>10
thrleuleuvalgluthrphepheprogluargargtyrphetyrtrp
151015
tyrthrileileglytrpglythrprothrvalcysvalthrvaltrp
202530
alavalleuargleutyrpheaspaspalaglycystrpaspmetasn
354045
aspserthralaleutrptrpvalilelysgly
5055
<210>11
<211>59
<212>prt
<213>大鼠
<400>11
thrleuleuvalgluthrphepheprogluargargtyrphetyrtrp
151015
tyrthrileileglytrpglythrprothrvalcysvalthrvaltrp
202530
alavalleuargleutyrpheaspaspalaglycystrpaspmetasn
354045
aspserthralaleutrptrpvalilelysgly
5055
<210>12
<211>58
<212>prt
<213>人
<400>12
thrleuleuvalgluthrphepheprogluargargtyrphetyrtrp
151015
thrileileglytrpglythrprothrvalcysvalthrvaltrpala
202530
thrleuargleutyrpheaspaspthrglycystrpaspmetasnasp
354045
serthralaleutrptrpvalilelysgly
5055
<210>13
<211>58
<212>prt
<213>小鼠
<400>13
thrleuleuvalalaileleuproproserargcyspheleualatyr
151015
leuleuileglytrpglyileproservalcysileglyalatrpthr
202530
alathrargleuserleugluaspthrglycystrpaspthrasnasp
354045
hisserileprotrptrpvalileargmet
5055
<210>14
<211>58
<212>prt
<213>大鼠
<400>14
thrleuleuvalalaileleuproproserargcyspheleualatyr
151015
leuleuileglytrpglyileproservalcysileglyalatrpile
202530
alathrargleuserleugluaspthrglycystrpaspthrasnasp
354045
hisserileprotrptrpvalileargmet
5055
<210>15
<211>58
<212>prt
<213>人
<400>15
thrleuleuvalalametleuproproargargcyspheleualatyr
151015
leuleuileglytrpglyleuprothrvalcysileglyalatrpthr
202530
alaalaargleutyrleugluaspthrglycystrpaspthrasnasp
354045
hisservalprotrptrpvalileargile
5055
<210>16
<211>59
<212>prt
<213>小鼠
<400>16
thrleuleualavalserphephesergluarglystyrphetrpgly
151015
tyrileleuileglytrpglyvalproservalpheilemetiletrp
202530
thrilevalargilehisphegluasppheglycystrpaspthrile
354045
ileasnserserleutrptrpileilelysgly
5055
<210>17
<211>59
<212>prt
<213>大鼠
<400>17
thrleuleualavalserphephesergluarglystyrphetrpgly
151015
tyrileleuileglytrpglyvalproservalpheilethriletrp
202530
thrvalvalargiletyrphegluasppheglycystrpaspthrile
354045
ileasnserserleutrptrpileilelysala
5055
<210>18
<211>58
<212>prt
<213>人
<400>18
thrleuleualavalserphephesergluarglystyrphetrpgly
151015
tyrileleuileglytrpglyvalproserthrphethrmetvaltrp
202530
thrilealaargilehisphegluasptyrglycystrpaspthrile
354045
asnserserleutrptrpileilelysgly
5055
<210>19
<211>59
<212>prt
<213>人
<400>19
thrleuleualaileserphephesergluarglystyrleuglngly
151015
phevalalapheglytrpglyserproalailephevalalaleutrp
202530
alailealaarghispheleugluaspvalglycystrpaspileasn
354045
alaasnalaseriletrptrpileilearggly
5055
<210>20
<211>59
<212>prt
<213>大鼠
<400>20
thrleuleualaileserphephesergluarglystyrleuglnala
151015
phevalleuleuglytrpglyserproalailephevalalaleutrp
202530
alailethrarghispheleugluasnthrglycystrpaspileasn
354045
alaasnalaservaltrptrpvalilearggly
5055
<210>21
<211>59
<212>prt
<213>小鼠
<400>21
serleuleuserleualathrphesergluargserphepheserleu
151015
tyrleuglyileglytrpglyalaproleuleuphevalileprotrp
202530
valvalvallyscysleuphegluasnvalglncystrpthrserasn
354045
aspasnmetglyphetrptrpileleuargile
5055
<210>22
<211>59
<212>prt
<213>大鼠
<400>22
serleuleuserilethrthrpheserglulysserphepheserleu
151015
tyrleucysileglytrpglyserproleuleuphevalileprotrp
202530
valvalvallyscysleuphegluasnvalglncystrpthrserasn
354045
aspasnmetglyphetrptrpileleuargile
5055
<210>23
<211>164
<212>prt
<213>t4噬菌体
<400>23
metasnilepheglumetleuargileaspgluglyleuargleulys
151015
iletyrlysaspthrgluglytyrtyrthrileglyileglyhisleu
202530
leuthrlysserproserleuasnalaalalyssergluleuasplys
354045
alaileglyargasnthrasnglyvalilethrlysaspglualaglu
505560
lysleupheasnglnaspvalaspalaalavalargglyileleuarg
65707580
asnalalysleulysprovaltyraspserleuaspalavalargarg
859095
alaalaleuileasnmetvalpheglnmetglygluthrglyvalala
100105110
glyphethrasnserleuargmetleuglnglnlysargtrpaspglu
115120125
alaalavalasnleualalysserargtrptyrasnglnthrproasn
130135140
argalalysargvalilethrthrpheargthrglythrtrpaspala
145150155160
tyrlysasnleu
<210>24
<211>164
<212>prt
<213>t4噬菌体
<400>24
metasnilepheglumetleuargileaspgluglyleuargleulys
151015
iletyrlysaspthrgluglytyrtyrthrileglyileglyhisleu
202530
leuthrlysserproserleuservalalalyssergluleuasplys
354045
alaileglyargasnserasnglyvalilethrlysaspglualaglu
505560
lysleupheasnglnaspvalaspalaalavalargglyileleuarg
65707580
asnalalysleulysprovaltyraspserleuaspalavalargarg
859095
seralaleuileasnmetvalpheglnmetglygluthrglyvalala
100105110
glyphethrasnserleuargmetleuglnglnlysargtrpaspglu
115120125
alaalavalasnleualalysserargtrptyrasnglnthrproasn
130135140
argalalysargvalilealathrpheargthrglythrtrpaspala
145150155160
tyrlysasnleu
<210>25
<211>59
<212>prt
<213>人
<400>25
asnleuleuglyleualathrleuprogluargserphepheserleu
151015
tyrleuglyileglytrpglyalaprometleuphevalvalprotrp
202530
alavalvallyscysleuphegluasnvalglncystrpthrserasn
354045
aspasnmetglyphetrptrpileleuargphe
5055
<210>26
<211>59
<212>prt
<213>人
<400>26
serleuleuvalleuvalglyglyserglugluglyhispheargtyr
151015
tyrleuleuleuglytrpglyalaproalaleuphevalileprotrp
202530
valilevalargtyrleutyrgluasnthrglncystrpgluargasn
354045
gluvallysalailetrptrpileileargthr
5055
<210>27
<211>59
<212>prt
<213>大鼠
<400>27
hisleuleuvalvalvalargargserglulysglyhispheargcys
151015
tyrleuleuleuglytrpglyalaproalaleuphevalileprotrp
202530
valilevalargtyrleutyrgluasnthrglncystrpgluargasn
354045
gluvallysalailetrptrpileileargthr
5055
<210>28
<211>59
<212>prt
<213>小鼠
<400>28
thrthrleualapheservalphesergluglnargilephelysleu
151015
tyrleuserileglytrpglyvalproleuleuphevalileprotrp
202530
glyilevallystyrleutyrgluaspgluglycystrpthrargasn
354045
serasnmetasntyrtrpleuileileargleu
5055
<210>29
<211>59
<212>prt
<213>大鼠
<400>29
thrleuleualapheservalphesergluglnargilephelysleu
151015
tyrleuserileglytrpglyvalproleuleuphevalileprotrp
202530
glyilevallystyrleutyrgluaspgluglycystrpthrargasn
354045
serasnmetasntyrtrpleuileileargleu
5055
<210>30
<211>59
<212>prt
<213>人
<400>30
thrleuleualapheservalphesergluglntrpilepheargleu
151015
tyrvalserileglytrpglyvalproleuleuphevalvalprotrp
202530
glyilevallystyrleutyrgluaspgluglycystrpthrargasn
354045
serasnmetasntyrtrpleuileileargleu
5055
<210>31
<211>59
<212>prt
<213>人
<400>31
thrleuleugluprothrvalleuprogluargargleutrpproarg
151015
tyrleuleuleuglytrpalapheprovalleuphevalvalprotrp
202530
glyphealaargalahisleugluasnthrglycystrpthrthrasn
354045
glyasnlyslysiletrptrpileilearggly
5055
<210>32
<211>59
<212>prt
<213>大鼠
<400>32
thrleuleugluprothrvalpheprogluargargleutrpprolys
151015
tyrleuvalvalglytrpalapheprometleuphevalileprotrp
202530
glyphealaargalahisleugluasnthrargcystrpalathrasn
354045
glyasnleulysiletrptrpileilearggly
5055
<210>33
<211>60
<212>prt
<213>人
<400>33
thralailevalleuthrtyrserthraspargleuarglystrpmet
151015
pheilecysileglytrpglyvalpropheproileilevalalatrp
202530
alaileglylysleutyrtyraspasnglulyscystrppheglylys
354045
argproglyvaltyrthrasptyriletyrglngly
505560
<210>34
<211>60
<212>prt
<213>小鼠
<400>34
thralailevalleuthrtyrserthraspargleuarglystrpmet
151015
phevalcysileglytrpglyvalpropheproileilevalalatrp
202530
alaileglylysleutyrtyraspasnglulyscystrppheglylys
354045
argproglyvaltyrthrasptyriletyrglngly
505560
<210>35
<211>60
<212>prt
<213>大鼠
<400>35
thralailevalleuthrtyrserthraspargleuarglystrpmet
151015
phevalcysileglytrpglyvalpropheproileilevalalatrp
202530
alaileglylysleuhistyraspasnglulyscystrppheglylys
354045
argproglyvaltyrthrasptyriletyrglngly
505560
<210>36
<211>60
<212>prt
<213>人
<400>36
thralailevalmetthrtyrserthrgluargleuarglyscysleu
151015
pheleupheileglytrpcysilepropheproileilevalalatrp
202530
alaileglylysleutyrtyrgluasngluglncystrppheglylys
354045
gluproglyaspleuvalasptyriletyrglngly
505560
<210>37
<211>60
<212>prt
<213>大鼠
<400>37
thralailevalmetthrtyrserthrgluhisleuarglystrpleu
151015
pheleupheileglytrpcysileprocysproileilevalalatrp
202530
alavalglylysleutyrtyrgluasngluglncystrppheglylys
354045
gluproglyaspleuvalasptyriletyrglngly
505560
<210>38
<211>60
<212>prt
<213>小鼠
<400>38
thralailevalmetthrtyrserthrgluhisleuarglystrpleu
151015
pheleupheileglytrpcysileprocysproileileilealatrp
202530
alavalglylysleutyrtyrgluasngluglncystrppheglylys
354045
glualaglyaspleuvalasptyriletyrglngly
505560
<210>39
<211>58
<212>prt
<213>小鼠
<400>39
thrleuilevalmetalavalphethraspgluglnargleuargtrp
151015
tyrtyrleuleuglytrpglypheproilevalprothrileilehis
202530
alailethrargalaleutyrtyrasnaspasncystrpleuserala
354045
gluthrhisleuleutyrileilehisgly
5055
<210>40
<211>58
<212>prt
<213>大鼠
<400>40
thrleuilevalmetalavalphethrgluaspglnargleuargtrp
151015
tyrtyrleuleuglytrpglypheproilevalprothrileilehis
202530
alailethrargalavaltyrtyrasnaspasncystrpleuserthr
354045
gluthrhisleuleutyrileilehisgly
5055
<210>41
<211>58
<212>prt
<213>人
<400>41
thrleuilevalvalalavalphethrglulysglnargleuargtrp
151015
tyrtyrleuleuglytrpglypheproleuvalprothrthrilehis
202530
alailethrargalavaltyrpheasnaspasncystrpleuserval
354045
gluthrhisleuleutyrileilehisgly
5055
<210>42
<211>58
<212>prt
<213>小鼠
<400>42
thrleuilevalvalalavalphealaglulysglnhisleumettrp
151015
tyrtyrpheleuglytrpglypheproleuleuproalacysilehis
202530
alailealaargserleutyrtyrasnaspasncystrpileserser
354045
aspthrhisleuleutyrileilehisgly
5055
<210>43
<211>58
<212>prt
<213>大鼠
<400>43
thrleuilevalvalalavalphealaglulysglnhisleumettrp
151015
tyrtyrpheleuglytrpglypheproleuleuproalacysilehis
202530
alailealaargserleutyrtyrasnaspasncystrpileserser
354045
aspthrhisleuleutyrileilehisgly
5055
<210>44
<211>58
<212>prt
<213>人
<400>44
thrleuilevalvalalavalphealaglulysglnhisleumettrp
151015
tyrtyrpheleuglytrpglypheproleuileproalacysilehis
202530
alailealaargserleutyrtyrasnaspasncystrpileserser
354045
aspthrhisleuleutyrileilehisgly
5055