稳定的蛋白质的制作方法

文档序号:3480963阅读:626来源:国知局
稳定的蛋白质的制作方法
【专利摘要】本发明提供一种融合蛋白,其从N端至C端包含:a)家族B的G蛋白偶联受体(GPCR)的第一部分,其包含GPCR的跨膜螺旋(TM)-1、TM2和TM3;b)稳定的蛋白结构域;和c)GPCR的第二部分,其包含GPCR的TM4、TM5、TM6和TM7。本发明也提供使GPCR结晶的方法,包括提供本发明的融合蛋白并使之结晶以获得晶体。
【专利说明】稳定的蛋白质
【技术领域】
[0001]本发明涉及不易结晶的蛋白,并特别涉及不易稳定并因此不易结晶的GPCR。本发明也涉及使这种蛋白结晶的方法,以及这种蛋白的各种用途。所述蛋白可用于药物发现和开发研究。
【背景技术】
[0002]GPCR组成了控制许多生理过程并且是许多有效药物靶标的一个极大的蛋白家族。特别参照 Overington 等人(2006)Nature Rev.Drug Discovery5, 993-996,其指出现有药物中超过四分之一具有作为靶标的GPCR。其在药理学上相当重要。在Foord等人(2005)Pharmacol Rev.57,279-288中给出GPCR的列表,通过引用并入本文。
[0003]GPCR在分离时通常是不稳定的,并且即使付出相当大努力,才仅可能使包括牛视紫质(bovine rhodopsin)在内的几种GPCR结晶,牛视紫质是天然格外稳定的并且是β-2肾上腺素受体,其作为融合蛋白结晶或者与抗体片段形成复合物结晶。
[0004]人们认为GPCR以多种不同构象存在,所述构象与配体的不同药理学种类,如激动剂和拮抗剂相关,并且为行使功能在这些构象之间循环(Kenakin Τ.(1997)Ann N Y AcadSci812, 116-125)。在构象之间的转换也导致在获得受体的晶体结构上的困难。
[0005]虽然GPCR都具有特征性的7个跨膜(TM)结构域,基于序列同源性和分子结构,仍可将其分为三个家族(A、B和C)。最大的组家族A,由与视紫质同源的受体组成。家族B也称为肠促胰液素受体家族,其是受大肽激素如高血糖素激素家族调节的受体;该家族成员的特征在于含有几个半胱氨酸的相对大的细胞外N端,所述几个半胱氨酸形成二硫桥网络并且是配体结合袋的一部分。家族C由与代谢型谷氨酸受体同源的受体组成;这些受体的特征是极长的细胞外N端和长的羧基尾巴,且所述N端形成配体结合袋,已证明其形成二硫化物连接的二聚体,在形状上类似捕蝇草。
[0006]在过去的几年中,已解析一些家族A GPCR的结构,并通过开发一些关键技术已实现这些里程碑。一种这样的技术是将T4溶菌酶(T4L)插入在细胞内的细胞质环(ICL)3中,并认为这样将生成允许形成晶体接触的大亲水区域[2] [3]。这种技术与脂立方相结晶学相结合的应用已允许Beta2、A2a、CXCR4和D3受体的高分辨率结构确定[2]。因此,已从这些关于家族A受体的TM束的定位和组织的结构中搜集到重要的信息。然而,几乎没有信息可用于家族B和C受体的成员,而且考虑到高度的序列分歧,在这些家族间的TM结构域的结构和组织上可能存在显著的不同[I]。
[0007]在家族A受体中,因为认为螺旋5和6之间的距离与T4L的N和C端之间的距离接近,所以将T4L插入到ICL3中。因此,可能在这个位置容纳融合蛋白,而不认为其它螺旋之间的距离有助于插入融合配偶体。事实上,已将T4L与一些不同的家族A受体在ICL3上相融合,在每种情况下功能蛋白都得 以表达并具有受体柔性减少的额外优点,并因此增加整体稳定性。
[0008]我们检测了将T4L插入在家族B受体的内环、特别在ICL3中的效果。我们的数据表明家族B受体不能在ICL3中容纳T4L融合,然而令人惊讶和意想不到的是,考虑到家族A受体的结构,将T4L加入ICL2中改善了家族B受体的生物化学性质。ICL2将GPCR包含跨膜螺旋(TM) -1、TM2和TM3的部分连接到GPCR包含TM4、TM5、TM6和TM7的部分。目前的数据表明,与家族A受体不同,在家族B受体中,螺旋3和4之间的距离与T4L的N和C端之间的距离更接近,而不是螺旋5与6之间的距离与T4L的N和C端之间的距离更接近。因此,认为在GPCR的这两个部分之间插入稳定的蛋白结构域代表了之前未能预测到的促进GPCR结晶的新技术。

【发明内容】

[0009]因此,本发明的第一方面提供融合蛋白,其从N端到C端包含:
[0010]a)家族B的G蛋白偶联受体(GPCR)的第一部分,其包含GPCR的TM1、TM2和TM3 ;
[0011]b)稳定的蛋白结构域;以及
[0012]c) GPCR 的第二部分,其包含 GPCR 的 TM4、TM5、TM6 和 TM7。
[0013]我们以“GPCR”表示具有GPCR信号活性且保留完整7个TM区的G蛋白偶联受体或多肽。本领域标准命名法将GPCR的跨膜螺旋从N端至C端命名为TMl、TM2、TM3、TM4、TM5、TM6和TM7。跨膜螺旋通过在TM2和TM3之间、在TM4和TM5之间、在TM6和TM7之间的细胞外氨基酸延伸连接,分别称为细胞外环(ECL) 1、2和3。跨膜螺旋通过在TMl和TM2之间、在TM3和TM4之间以及在TM5和TM6之间的细胞内氨基酸延伸连接,分别称为细胞内环(ICL)1、2和3。因此,如上定义的第一和第二GPCR部分通过ICL2区天然地连接,即ICL2将连接至ICL2N端的第一部分(包含TMl、TM2和TM3)与连接到ICL2C端的第二部分(包含TM4、TM5、TM6 和 TM7)连接。
[0014]GPCR优选地源自包含天然多态性的全长野生型序列,或源自被改变的突变体GPCR分子,例如为改善所述GPCR的一个或多个性质如稳定性而已将GPCR分子改变。
[0015]GPCR可源自野生型和突变体GPCR,其中所述突变体GPCR可以是偏向特定构象,例如激动剂或拮抗剂的稳定的GPCR。例如,随后可将稳定的蛋白结构域插入在构象上稳定的GPCR的TM3和TM4之间。
[0016]我们之前已经开发了在生物学相关构象中稳定GPCR的方法(参见W02008/114020 ),其描述了称为StaRs?的稳定GPCR生产,当从细胞膜中纯化时,所述方法能够纯化保持其构象、稳定性和功能的重组G蛋白偶联受体。此外,这种平台技术也提供将偏向激动剂构象或拮抗剂构象的受体进行工程化的方法(也参见Magnani等,2008; Serrano-Vega等,2008; Shibata等,2009),即其在特定构象中具有增加的稳定性。这种稳定的受体可用于本发明并具有一些优势,例如稳定性、提高纯化蛋白产量、减少变性和减少非特异性结合。在本发明中使用稳定的突变体GPCR时,优选地选择和制备使用任何在PCT 申请 W02008/114020、W02009/114020 和 W02009/081136 中所述的方法。优选地,第一和第二 GPCR部分来自于在特定构象中、相对于亲代GPCR具有增加稳定性的GPCR (即增加的构象稳定性)。通过增加构象的稳定性,我们包括如下含义:当暴露在变性剂或变性条件中,与相同构象的亲代GPCR相比特定构象的突变体GPCR具有增加的稳定性(例如延长的寿命)。变性剂/变性条件的实例包括热、去污剂、离液剂和极端pH。如本领域所公知,这样的变性剂或变性条件可影响蛋白的二级和三级结构而不是一级序列。[0017]在本发明实施中适合使用的GPCR包括任何家族B的GPCR,例如类胰高血糖素肽I受体(GLPlR)、类胰高血糖素肽2受体(GLP2R)、降钙素受体(CT)、糊精/CGRP受体(AMY1 α )、糊精受体(AMY2 α )、糊精/CGRP受体(AMY3 α )、CGRP/肾上腺髓质素受体(CGRP1 α )、肾上腺髓质素/CGRP受体(AM1 α )、肾上腺髓质素/CGRP受体(AM2 α受体)、促肾上腺皮质激素释放因子受体(CRF1)'尿皮质素(UiOcortin)受体(CRF2)、生长激素释放激素受体(GHRH)、抑胃多肽受体(GIP)、胰高血糖素受体、分泌素受体、TIP-39受体(PTH2)、甲状旁腺激素受体(PTHl)、VIP/PACAP 受体(VPAC1)、PACAP 受体(PAC2)以及 VIP/PACAP受体(VPAC2)中的任意者。在具体优选的实施方案中,所述GPCR是GLP1R。其它适合的GPCR是本领域公知的并且包括那些已列表在Overington等人(见上)中。另外,国际药理学联盟提出一个包括家族B的GPCR在内的GPCR列表(Foord等人,(2005)Pharmacol.Rev.57, 279-288,并且这个列表定期地更新在网址 http://www.1uphar-db.0rg/GPCR/ReceptorFamiliesForward 上;家族 B 的 GPCR 作为 2 类 GPCR 列表在表 2 中)。
[0018]很容易获得许多GPCR的氨基酸序列(和编码所述氨基酸序列的cDNA的核苷酸序列),例如通过参考GenBank。特别地,Foord等人(见上)从Entrez Gene (http: //www.ncb1.nlm.nih.gov/entrez)给出人基因符号和人、小鼠和大鼠基因ID。应该注意的还有,因为人基因组序列基本上完整,可以从其推断出人GPCR的氨基酸序列。
[0019]虽然GPCR可以源自任何来源,特别优选其来自真核生物来源。特别优选地,其源自脊椎动物来源,如哺乳动物。特别优选地,GPCR源自大鼠、小鼠、兔子或狗或非人灵长类动物或人。为了避免疑义,在“源自”意思中我们包括cDNA或基因是使用来自所述来源的遗传材料最初获得的,但是随后所述蛋白可在任何宿主细胞中表达。因此,这将是平常的:真核生物GPCR (例如禽或哺乳动物GPCR)可在原核宿主细胞,如大肠杆菌中表达,但视情况而定也可认为其源自禽或哺乳动物。
[0020]在某些情况下,GPCR可由多于一个不同的亚基组成。例如,降钙素基因相关的肽受体需要结合单一跨膜螺旋蛋白(RAMPl)而获得其生理学配体结合特征。与GPCR组合形成或调节功能复合物的效应器、附加物、辅助器或GPCR-相互作用蛋白在本领域中是公知的并且包括,例如受体激酶、G-蛋白和抑制蛋白(arrestin) (Bockaert等人,(2004)Curr Opinion Drug Discov and Dev7, 649-657)。在某些情况下,可将所述 GPCR 与 GPCR配体结合。通过“配体”,我们包括与GPCR结合的任何分子。许多配体是已知的,例如从W02008/114020 和 Neubig 等人(2003)Pharmacol.Rev.55,597-606,两者都通过参考并入本文。因此,融合蛋白可包括含有TM1、TM2和TM3的GPCR部分,其与含有TM4、TM5、TM6和TM7的GPCR部分相连接,其中所述GPCR与GPCR结合配偶体结合。用这样的方法,通过能够使GPCR与其它分子的复合物结晶可能获得在GPCR相互作用上的结构启示。优选地,所述分子不是与GPCR的ICL2相结合的那些。
[0021]对任何给定的GPCR,技术人员使用本领域的标准技术可确定TM螺旋。例如,可用计算机程序,其基于疏水性为GPCR的跨膜区建模(Kyle&Dolittle (1982) J.Mol.Biol.157,105-132)。同样,在万维网上(World Wide Web)广泛使用跨膜预测算法服务器(如Expasy),其中的许多依赖于嗜水性分析。TMHMM是膜蛋白拓扑预测方法,可以根据隐马尔可夫模型(hidden Markov model) (TMHMM Server v.2.0;http://www.cbs.dtu.dk/services/TMHMM/)使用该方法。对于给定的GPCR,当其跨膜区例如通过结构分析或嗜水性分析已知时,通过多重或成对地序列比对也可确定在其它GPCR中的类似区。例如,可使用Clustal W程序(Thompson等人,1994)进行比对。使用的参数可如下:快速配对比对参数:K-元组(字码)尺寸;1,窗口尺寸;5,空隙罚分;3,顶端对角线数;5 ;评分方法:x百分比。多重比对参数:空隙开放罚分;10,空隙延伸罚分;0.05 ;评分矩阵:BL0SUM。
[0022]图6列出家族B的GPCR的氨基酸序列,并突出TM3、ICL2和TM4的位置。例如,对于人 GLP1R,TM3 以 Phe257 结尾,ICL2 对应于 Ser258 至 Ser261,TM4 以 Glu262 开始。因此合宜地,当GPCR是家族B受体时,当如使用CLUSTAL W比对序列时,通过定位氨基酸残基可确定TM3、ICL2和TM4的位置,所述氨基酸残基对应于在图6中定义的TM3、ICL2和TM4边界的氨基酸。
[0023]然而应当理解,所述边界不是绝对的而且其可能非常依赖为GLPlR提供的曾用于定义其的模型。例如,在图1中人GLPlR的TM3以Leu254结尾,ICL2对应于Leu255至Trp264,以及TM4以Ile265开始。同样,可将环区定义为连接α螺旋的氨基酸结构或经预测在膜外的氨基酸结构,所述边界将根据所用的定义而改变。
[0024]在一个实施方案中,将稳定的蛋白结构域插入到ICL2中。因此,本发明提供GPCR,在其中已将稳定的蛋白结构域插入到ICL2中。通过“插入到ICL2中”,我们包括氨基酸序列的添加和取代两者,所述氨基酸序列的添加定义为稳定的蛋白结构域进入ICL2的氨基酸序列中而没有删除ICL2的任何氨基酸,所述取代为用编码稳定的蛋白结构域的氨基酸序列取代ICL2的一个或多个或全部氨基酸。应当理解,在此实施方案中除必要的跨膜螺旋以外,GPCR的第一和/或第二部分可包括至少一部分的ICL2。GPCR的第一部分可包括TMl、ΤΜ2和ΤΜ3以及ICL 2的N端部分。GPCR的第二部分可包括ΤΜ4、ΤΜ5、ΤΜ6和ΤΜ7以及ICL2的C端部分。
[0025]应当理解,稳定的蛋白结构域可插入到ICL2中,并且在其N和/或C端侧是一个或两个间隔部分。以这种方式,所述稳定的蛋白结构域与ICL2不是直接相连而是间接相连。所述间隔部分可用于帮助减少在螺旋上的张力。
[0026]优选地,通过使用稳定的蛋白结构域的氨基酸序列取代在ICL2氨基酸序列上的一个或多个连续氨基酸(例如,2、3、4或5个或更多氨基酸)从而将稳定的蛋白结构域插入在ICL2中。在一个实施方案中,被取代的一个或多个氨基酸是来自ΤΜ3的C端和/或ΤΜ4的N端的至少一个或两个氨基酸。换句话说,所述融合蛋白在稳定的蛋白结构域的至少一侧可具有ICL2的至少一个或两个氨基酸。
[0027]如实施例1所述,我们已将Τ4溶菌酶插入至GLPlR的ICL2中的各种位置上,在Phe257和Ser261之间的插入导致产生的融合GLPlR受体。因此,特别优选在根据图6所示人GLPlR编号的与氨基酸Phe257和Ser261相对应的氨基酸残基之间的位置上,将稳定的蛋白结构域插入至GPCR的ICL2区。
[0028]因此,根据图6所示的人GLPlR的编号,在与氨基酸Phe257相对应的氨基酸之后并在与氨基酸Ser261或Phe260或Val259相对应的氨基酸之前,可将稳定的蛋白结构域的氨基酸插入到GPCR的ICL2区。例如,根据图6所示的人GLPlR的编号,稳定的蛋白结构域的氨基酸序列可取代与Ser258相对应的氨基酸,或者其可取代与Ser258和Val259相对应的氨基酸,或者其可取代与Ser258、Val259和Phe260相对应的氨基酸。在这样的位置上插入稳定的蛋白结构域对应于图1所示的GLP1R-T4溶菌酶融合构建体lc、2c和3c。[0029]同样地,根据图6所示的人GLPlR的编号,在与氨基酸Ser258相对应的氨基酸之后并在与氨基酸Ser261或Phe260或Val259相对应的氨基酸之前,可将稳定的蛋白结构域的氨基酸插入到GPCR的ICL2区。例如,根据图6所示的人GLPlR的编号,稳定的蛋白结构域的氨基酸序列可取代与Val259相对应的氨基酸,或者其可取代与Val259和Phe260相对应的氨基酸。在这样的位置上插入稳定的蛋白结构域对应于图1所示的GLP1R-T4溶菌酶融合构建体IcU2d和3d。
[0030]通过“相对应的氨基酸残基”,我们包括以下含义:当使用MacVector和CLUSTALW比较人GLPlR受体和其它GPCR时,与在人GLPlR上的给定的氨基酸残基比对的另一个GPCR
上的氨基酸残基。
[0031]虽然优选地,根据图6所示的人GLPlR的编号,在与氨基酸Phe257和Ser261相对应的氨基酸残基之间的位置上,将稳定的蛋白结构域插入到GPCR的ICL2区,应当理解可将稳定的蛋白结构域插入到此区之外。
[0032]应当理解,稳定的蛋白结构域的功能是为晶体接触增加亲水性表面以及减少GPCR的固有柔性以使得如改善GPCR的结晶性质。因此,通过“稳定的蛋白结构域”,我们包括提供用于晶格接触的亲水表面的任何可溶的、折叠的多肽。此外,所述蛋白结构域是稳定的,从而在其折叠形式其对变性有抗性(例如,对热、洗涤剂、离液剂等稳定)。对蛋白稳定性的检测是本领域公知的并包括在W02008/114020中所述的那些。
[0033]通常,稳定的蛋白结构域是在细胞中从融合蛋白的GPCR部分自主折叠的那个。
[0034]合宜地,稳定的蛋白结构域是容易结晶的那个。因此,稳定的蛋白结构域可以是已解析出晶体结构的蛋白,例如坐标(coordinate)已保存在蛋白质数据库(http://www.pdb.0rg/)的蛋白。
[0035]稳定的蛋白结构域的特别优选的特征是:
[0036]1、所述结构域是可溶的、良好折叠的并在一个或多个表达系统可容易地表达;
[0037]2、所述结构域的N和C端在空间上紧靠,通常在5-17 A的范围内,例如6-16A、7-15 A、7-10 A、10-13 A成 12-15 A;
[0038]3、所述结构域耐热和耐化学变性以及耐蛋白水解降解;
[0039]4、所述结构域在各种空间群和晶体堆积排列中是高度可结晶的。
[0040]优选地,所述结构域不含半胱氨酸残基,所以防止了在所述结构域内或在融合蛋白的GPCR部分中的二硫键形成。应当理解既然所述结构域可溶,那么其不应是疏水的或者不应倾向以无序方式聚集。
[0041]在一个实施方案中,稳定的蛋白结构域的长度在50和1000个氨基酸之间,优选地在50和300个氨基酸或100和300个氨基酸之间、或在150和250个氨基酸之间。 [0042]一旦已发现适合所述稳定的蛋白结构域的多肽,也许有必要通过从或至所述多肽的N端、C端或两端中删除或添加氨基酸残基对所述多肽进行修饰,以使得在所述多肽末端骨架上最接近的α碳原子被5-17Α范围的距离所间隔,例如6-16Α、7-15 Αλ 7-10 A、10-13 A或 12-15 Ao
[0043]优选地,稳定的蛋白结构域的插入不影响GPCR的生物学活性,例如结合活性或信号传导通路调节活性。理想地,相对于在没有稳定的蛋白结构域时的相同活性水平,所述融合蛋白应保留其生物学活性的至少60%、或70%、或80%、或90%,最理想地保留其生物学活性的100%。用于评估GPCR结合和GPCR信号传导的方法是本领域公知的并描述在如W02008/114020和W02009/101383中,两者都通过引用并入本文。因此,当生物学活性是结合活性时,使用本领域已知的常规结合分析可评估与任何GPCR结合配偶体的结合;当生物学活性是信号传导通路调节活性时,通过任何适用于具体信号传导通路的分析(如报告基因分析)可评估所述活性。
[0044]应当理解,对于结晶用途而言保留的配体结合活性比保留的信号传导活性更重要,因此可取地在结晶之前仅评估配体结合能力。因此,在一个具体优选的实施方案中,稳定的蛋白结构域不影响GPCR的结合活性。
[0045]为避免疑义,稳定的蛋白结构域不是特定GPCR的ICL2或其部分。
[0046]在优选的实施方案中,稳定的蛋白结构域是溶菌酶。已知溶菌酶容易结晶,各种野生型和变体溶菌酶的结构已保藏在蛋白质数据库(WWW.rcsb.0rg)。合适的实例包括135L、193L、194L、1AK1、1GBS、1IEE、1LZ1、1P7S、1REX、1VDQ、2ANV、2ANX、2D4K、2FBB、2IHL、2NWD、2XBR、2XBS、2Z2F、2ZYP、3A8Z、3K2R、3N9A、3N9C、3N9E 和 30D9。
[0047]尽管源自任何来源的溶菌酶都可用,特别优选所述溶菌酶源自T4噬菌体。在图7中提供T4噬菌体溶菌酶的两个氨基酸序列,所述序列的任一个可用在本发明的背景中。溶菌酶可源自包括天然多态性的全长野生型序列,或者其也可以是,例如改善一个或多个性质的已被改变的突变体溶菌酶。因此,可以理解可使用图7所提供的氨基酸序列的变体,例如与图7所示序列的任一个具有至少60%、65%、70%、75%、80%、85%或90%的序列同一性的氨基酸序列,更优选地与图7所示序列任一个具有至少95%或99%的序列同一性的氨基酸序列。
[0048]可以通过使用如BLAST或PS1-BLAST的算法(Altschul等人,NAR(1997) ,25,3389-3402)或基于隐藏的马尔可夫模型的方法(Eddy S等人,J ComputBiol (1995) Spring2 (I) 9-23.)测定序列同一'丨生。通常可以使用任何合适的计算机程序,例如威斯康星大学遗传计算机组的GAP程序确定在两个多肽之间的百分比序列同一性,并且应理解的是计算涉及其序列已经被优化比对的多肽的百分比同一性。可选择地使用如上述的Clustal W程序(Thompson等人,1994)进行比对。
[0049]虽然溶菌酶是稳定的蛋白结构域的优选实例,仍可使用一般原理利用具有上述特性的许多多肽。因此,合适的候选者包括那些含有易结晶蛋白的氨基酸序列,例如,通过查询本领域已知的蛋白质数据库或其它结晶数据库而发现的。其它实例包括在Engel等人(2002) (BBA1564:38-46)(通过引用并入本文)所述的那些,例如细胞色素b562、黄素氧化还原蛋白、β -内酰胺酶和70kDa热休克三磷酸腺苷酶结构域。
[0050]可修饰融合蛋白以使其可更容易被检测出,例如通过将其生物素化或通过并入本领域已知的任何可检测标记,如放射性标记、突光标记或者酶标记。在特别优选的实施方案中,所述标记是荧光标记如EGFP。同样地,可修饰融合蛋白以促进纯化,例如通过并入任何本领域已知的任何亲和性部分,如GST标签、6x His标签、MBP或其它表位标签。这样的修饰可在GPCR的N端或C端或者在外环中。
[0051] 如实施例1所示,应相信与没有插入稳定的蛋白结构域的GPCR的生物化学性质相比,本发明的融合蛋白具有改善的生物化学性质。这种改善的性质使得所述融合蛋白更适合结晶。因此,预期融合蛋白具有用于晶体接触的更大的亲水性表面。同样地,与没有插入稳定的蛋白结构域的GPCR相比,预期融合蛋白更加可溶,例如在洗涤剂溶液中显示更少的聚集。用于评估GPCR溶解度的方法是本领域公知的,包括尺寸排阻色谱法,例如在实施例1中所述的用于评估在DDM中溶解度的荧光尺寸排阻色谱法。与没有插入稳定的蛋白结构域的GPCR相比,所述融合蛋白也可以是更加稳定的(例如,对热、洗涤剂或离液剂中的任意者)。用于评估GPCR稳定性的方法是本领域已知的,包括在W02008/114020所述的那些。
[0052]合宜地,通过标准分子生物学和重组DNA技术产生所述融合蛋白。例如,使用本领域公知的标准克隆技术和PCR可制成编码第一和第二 GPCR部分以及稳定的蛋白结构域的DNA片段。然后依据传统的实施可将片段在读码框内连接在一起,例如通过利用平末端或交错末端连接、限制性酶消化以提供合适的末端、酌情补平粘性末端、碱性磷酸处理以避免不需要的连接,以及酶连接。
[0053]同样地,使用不依赖连接酶的克隆策略,例如InFusion或Gateway可制成融合构建体。也可通过从头开始的基因合成而合成地制成所述构建体。
[0054]可以理解,可将GPCR和稳定的蛋白结构域中的一个或者两个突变以改善溶解度、稳定性、表达或结晶能力(crystallisability)中的任一项。
[0055]用于对基因和cDNA进行克隆和工程化、用于突变DNA和用于在宿主细胞中从多核苷酸表达多肽的分子生物学方法是本领域公知的,如在“Molecular cloning, alaboratory manual,,,第三版,Sambrook, J.和 Russell, D.ff.(编),Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY中举例说明的,通过引用并入本文。
[0056]合适的表达 系统包括在细菌或酵母、病毒表达系统(所述病毒表达系统例如杆状病毒、semliki森林病毒和慢病毒)中的组成型或诱导型表达系统,或在昆虫或哺乳动物细胞中的瞬时转染。合适的宿主细胞包括大肠杆菌、乳球菌(Lactococcus lactis)、酿酒酵母(Saccharomyces cerevisiae)、栗酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichia pastoris)、草地贪夜蛾(Spodoptera frugiperda)和粉纹夜蛾(Trichoplusiani)细胞。合适的动物宿主细胞包括HEK293、COS、S2、CHO、NSO、DT40等等。已知某些GPCR需要特定脂质(例如胆固醇)以行使功能。在那种情况下,希望选择含有所述脂质的宿主细胞。此外或可选择地,在分离和纯化融合蛋白期间可以加入脂质。通过标准技术,例如亲和层析法可进行纯化。
[0057]本发明的第二方面提供编码根据本发明的第一方面的融合蛋白的多核苷酸。所述多核苷酸可以是RNA (如mRNA)或DNA,虽然通常其是DNA。
[0058]应当理解,可将所述多核苷酸整合进载体中,因此本发明也提供包含根据本发明的第二方面的多核苷酸的载体。
[0059]合适的载体是在原核(如细菌)或真核(如哺乳动物)细胞中繁殖和/或允许融合蛋白表达的那些。例如,所述载体可以是质粒、粘粒、噬菌体或细菌人工染色体(BAC)。载体的多核苷酸序列将取决于预期宿主细胞的性质、将本发明的第二方面的多核苷酸引入宿主细胞的方式、以及是希望维持还是整合游离基因。合宜地,所述载体包含至少一个可选择的标志物,例如抗生素抗性标志物(例如卡那霉素或新霉素)。
[0060]载体用于复制本发明的第二方面的多核苷酸,也用于使用所述多核苷酸转染细胞,以及也可用于促进融合蛋白的表达。[0061]典型的原核载体质粒是:可获自Biorad Laboratories (Richmond, CA,美国)的 pUC18、pUC19、pBR322 和 pBR329 ;可获自 Pharmacia (Piscataway, NJ,美国)的pTrc99A、pKK233_3、pKK233_3、pDR540 和 pRIT5 ;可获自 Stratagene CloningSystems (LaJolla, CA92037,美国)的 pBS 载体、Phagescript 载体、Bluescript 载体、pNH8A、pNH16A、PNH18A 和 pNH46A。
[0062]典型的哺乳动物细胞载体质粒是可获自Pharmacia(Piscataway, NJ,美国)的PSVL0这个载体使用SV40晚期启动子以驱动克隆基因的表达,最高表达水平发现于T抗原产生细胞中,例如C0S-1细胞。另一个实例是用在C0S-1或C0S-7细胞中的pcDNA3.l(neo)(Invitrogen)。诱导型哺乳动物表达载体的实例是也可获自Pharmacia (Piscataway, NJ,美国)的PMSG。所述载体使用小鼠乳腺肿瘤病毒长末端重复的糖皮质激素诱导启动子以驱动克隆基因的表达。
[0063]有用的酵母质粒载体是pRS403-406和pRS413_416,以及通常可获自于Stratagene Cloning Systems (La Jolla, CA92037,美国)。质粒 pRS403、pRS404、pRS405和pRS406是酵母整合质粒(YIps),其包含酵母可选择的标志物HIS3、TRP1、LEU2和URA3。质粒pRS413-416是酵母着丝粒质粒(YCps)。
[0064]在优选的实施方案中,所述包含的本发明第二方面的多核苷酸的载体是pcDNA3.1(http://products, invitrogen.com/ivgn/product/V79020)。
[0065]在本领域已知的任何合适的方法可用于构建含有本发明的第二方面的多核苷酸的载体,包括上述的连接技术。
[0066]本发明的第三方面提供含有根据本发明的第二方面的多核苷酸的细胞,或含有所述多核苷酸的载体。这种细胞可用于复制本发明的第二方面的多核苷酸,或可用于表达本发明的第一方面的融合蛋白。
[0067]所述细胞可以是原核的或真核的。
[0068]应当理解,构建和扩增本发明的第二方面的多核苷酸在细菌细胞中方便地进行。所述多核苷酸的表达可在细胞中进行,如哺乳动物细胞或细菌细胞。
[0069]细菌细胞是优选的原核宿主细胞,通常是大肠杆菌株,例如可获自BethesdaResearch Laboratories Inc.,Bethesda, MD,美国的大肠杆菌株 DH5、以及可获自美国,MD, Rockville的美国典型培养物保藏所(American Type CultureCollection, ATCC) (ATCC号31343)的RR1。优选的真核宿主细胞包括酵母、昆虫和哺乳动物细胞或细胞系,优选脊椎动物细胞或细胞系,例如来自小鼠、大鼠、猴子或人的那些。特别优选的细胞是人胚胎肾细胞,例如HEK293T细胞。
[0070]可稳定或不稳定地转染用于表达融合蛋白的细胞。
[0071 ] 本发明的第四方面提供使根据本发明第一方面的融合蛋白结晶的方法,所述方法包括提供根据本发明第一方面的融合蛋白以及使其结晶以获得晶体。
[0072]在一个实施方案中,通过培养根据本发明第三方面的宿主细胞以表达融合蛋白并分离所述蛋白从而提供融合蛋白。
[0073]任何合适的结晶方法可用于使融合蛋白结晶,例如那些综述在“Crystal Iisationof Biological Macromolecules”(Alexander McPherson; ISBN:0-87969-617-6)中的任意者,其以参考并入本文。[0074]在优选的实施方案中,使用脂立方相结晶学进行结晶(参见US2011/0031438,以参考并入本文)。
[0075]本发明的第五方面提供包含本发明的第一方面的融合蛋白的晶体。
[0076]本文公开的融合蛋白用于结晶研究以及用于药物研发程序。其可用于受体/配体动力学和热力学参数的生物物理学测量,例如通过表面等离子共振或基于荧光的技术。其可用于配体结合筛选,以及与固体表面相偶联以用于高通量筛选或作为生物传感器芯片。包含融合蛋白的生物传感器芯片可用于检测分子,尤其是生物分子。
[0077]本发明将借助下列附图和实施例描述。
【专利附图】

【附图说明】
[0078]图1:具有GLPlR的T4L融合构建体的设计。T4L在ICL2 (左)和ICL3 (右)中被插入在指示的残基之后。构建体Ia表示T4L被插入在L255和S261之间。TM结构域和环的模型基于参考文献[4]。
[0079]图2:与野生型(WT)和模拟转染(U)样本相比的GLP1R-T4L融合构建体总EGFP信号。以50ug的总细胞材料一式两份地进行每个测量。误差线代表与平均值之间的标准偏差。 [0080]图3:野生型GLPlR的典型的fSEC洗脱谱。
[0081]图4:DDM溶解的在ICL2中的GLP1R-T4L融合构建体的fSEC洗脱谱覆盖野生型的谱。在每种情况下,野生型谱以红色显示,而融合构建体以蓝色显示。
[0082]图5 =DDM溶解的在ICL3上的GLP1R-T4L融合构建体的fSEC洗脱谱覆盖野生型谱。在每种情况下,野生型谱以红色显示,融合构建体以蓝色显示。
[0083]图6:显示TM3、ICL2和TM4 (SEQ ID No:1-22)位置的家族B的GPCR的氨基酸序列。在GLPlR融合构建体中被T4L取代的ICL2的部分在来自小鼠、大鼠和人的其它家族B受体中突出显示。
[0084]图7:T4噬菌体溶菌酶的氨基酸序列:(A)插入在家族A受体的ICL3上的序列
[2], [3] (SEQ ID No:23) ; (B)插入在家族B受体的ICL2上的序列(SEQ ID No:24)(参见实施例)。在框中显示差异。
【具体实施方式】
[0085]实施例1:1CL2内的T4L插入改善了 GLPlR的生物化学性质。
[0086]概要
[0087]我们已经检测将T4L插入家族B受体内环的效果。我们的数据表明,家族B受体不能容纳在ICL3中的T4L融合,然而将T4L加至ICL2却能改善受体的生物化学性质。
[0088]结果
[0089]根据GLPlR的模型确定GLPlR的环区,并将编码T4L的DNA插入至在ICL2和ICL3内的不同位置(图1)。为监测总表达和使用荧光检测尺寸排阻色谱法的单分散性,将GLPlR构建体在C端用EGFP标记。
[0090]在序列确认后,这些构建体在HEK293T中瞬时地表达。作为初始分析,在整个细胞中测量EGFP信号以评估总表达水平。有趣的是,在ICL3中的构建体不能产生任何EGFP信号,表明在GLPlR这个区的T4L融合与此受体的整体结构不相容。然而,在ICL2上的融合导致GLPlR的强烈表达(图2)。
[0091]为分析GLP1R-T4L融合的生物化学性质,将表达这些构建体的细胞溶于十二烷基麦芽苷(DDM)中,并将其用于荧光检测尺寸排阻色谱法(fSEC)。fSEC已广泛用于提供关于蛋白质的单分散性和聚集状态的数据,特别是在预结晶筛选中[5]。一般地,条件越有利将导致越多的单分散性和减少的聚集。DDM溶解的野生型GLPlR的fSEC的洗脱谱显示具有聚集肩的主单分散性峰以及游离的EGFP种类的存在,所述游离的EGFP种类是蛋白水解降解的结果(图3)。
[0092]与图2所示的EGFP信号数据相一致,ICL2T4L融合构建体la、lb、2a、2b、3a和3b的洗脱谱表明细胞不能表达这些融合(图4)。这最有可能因为T4L的N端与TM III的靠近导致破坏整体结构。与之相反,构建体lc、ld、2c、2d、3c和3d的洗脱谱显示产生的融合受体得以表达,以及更显著的是看起来T4L融合导致聚集峰的减少和伴随的单分散性峰的改善,其一起表明T4L插入在受体的此区对于溶解的受体的生物化学性质具有有利的影响(图4)。在构建体Ic和2c中这种影响最明显。
[0093]对ICL3融合构建体进行同样的分析,其与图2所示的EGFP信号数据相一致,在ICL3中的T4L融合中没有导致表达任何产生的融合受体(图5)。
[0094]综上所述,这些数据表明在GLPlR的第三细胞质环中的T4L融合是不相容的,然而,将T4L插入在第二细胞质环的某些位置不仅相容,并且其改善了溶解受体的生物化学性质。考虑到家族B的GPCR的成员之间的高度序列同源性,我们建议可将这些观察延伸至这个家族的其它成员。 如图6所示,在其它家族B成员中突出显示在最佳构建体(Ic)中被取代的ICL2的部分。
[0095]方法和材料
[0096]使用标准分子生物学技术将T4溶菌酶插入到人GLPlR的第二和第三细胞质环中。在HEK293T细胞中从修饰的pcDNA3.1中瞬时表达这些构建体,将产生的受体在其C端与EEGFP融合。根据制造商的指南使用GeneJuice (Merck Biosciences)进行转染。通常,用6ug的DNA去转染在IOcm平皿中的3xl06贴壁细胞。在转染后约40小时收集细胞,并将其重悬于补充了完全无EDTA的蛋白酶抑制剂混合物(Complete EDTA-free proteaseinhibitor cocktail (Roche))的50mM HEPES pH7.5/150mM NaCl/0.5mM EDTA。通常,在4°C将每个样本的650ug与1%DDM在200uL的总体积中溶解I小时,接着在50000rpm离心30分钟。将50uL的上清上样在BioSE印-SEC-S3000柱(Phenomenex)上,用SEC缓冲液(50mMHEPES pH7.5/150mM NaCl/0.5mM EDTA/0.03%DDM)进行预平衡,然后以 ImL/分钟的流速运行15分钟。使洗脱液通过在线荧光计,其具有下列设置:激发490nm、发射513nm和13的增益。
[0097]参考文献
[0098][l]Kristiansen, K.Molecular mechanisms of ligand binding, signaling, andregulation within the superFamily of G-protein-coupled receptors:molecularmodeling and mutagenesis approaches to receptor structure and function.Pharma&Therap103, 21-80(2004).[0099][2]Bill RM, Henderson PJ, Iwata S, Kunji ER, Michel H, Neutze R, NewsteadS,Poolman B,Tate CG and Vogel H.0vercoming barriers to membrane proteinstructure determination.Nat Biotechnol.29 (4),335-340 (2011).[0100][3]Kobilka BK, Kobilka TSj Daniel Kj Regan JWj Caron MG 和Lefkowitz RJ.Chimeric alpha2_,beta2_adrenergic receptors: delineation ofdomains involved in effector coupling and ligand binding specificity.Science240 (4857) 1310-6(1988).[0101][4]Frimurer TM 和 Bywater RP.Structure of the integral membrane domainof the GLPlreceptor.Proteins35(4), 375-86(1999).[0102][5]Kawate T 和 Gouaux E.Fluorescence-detection size-exclusionchromatography for precrystalliz ation screening of integral membrane proteins.Structurel4(4),673-81(2004).
【权利要求】
1.一种融合蛋白,其从N端至C端包含: a)家族B的G蛋白偶联受体(GPCR)的第一部分,其包含GPCR的跨膜螺旋(TM)_1、TM2和 TM3 ; b)稳定的蛋白结构域;以及 c)GPCR的第二部分,其包含GPCR的TM4、TM5、TM6和TM7。
2.根据权利要求1所述的融合蛋白,其中所述GPCR是家族B的GPCR,例如类胰高血糖素肽I受体(GLPlR)、类胰高血糖素肽2受体(GLP2R)、降钙素受体(CT)、糊精/CGRP受体(AMY1 α )、糊精受体(AMY2 α )、糊精/CGRP受体(AMY3 a )、CGRP/肾上腺髓质素受体(CGRP1 α )、肾上腺髓质素/CGRP受体(AM1 α )、肾上腺髓质素/CGRP受体(AM2 α受体)、促肾上腺皮质素释放因子受体(CRF1)、尿皮质素受体(CRF2)、生长激素释放激素受体(GHRH)、抑胃多肽受体(GIP)、胰高血糖素受体、分泌素受体、ΤΙΡ-39受体(ΡΤΗ2)、甲状旁腺激素受体(PTHl)、VIP/PACAP 受体(VPAC1)、PACAP 受体(PAC2)以及 VIP/PACAP 受体(VPAC2)中的任一。
3.根据权利要求1或2所述的融合蛋白,其中所述GPCR是相对其亲代GPCR具有增加的构象稳定性的突变体GPCR。
4.根据权利要求1至3中任一项所述的融合蛋白,其中所述稳定的蛋白结构域插入至GPCR的细胞内环2 (ICL2)区,其中所述环连接GPCR的第一和第二部分。
5.根据权利要求4所述的融合蛋白,其中根据图6所示人GLPlR的编号,在与氨基酸Phe257和Ser261相对应的氨基酸残基之间的位置上,将稳定的蛋白结构域插入至所述GPCR 的 ICL2 区。
6.根据权利要求5所述的融合蛋白,其中根据图6所示人GLPlR的编号,在与氨基酸Phe257相对应的氨基酸之后并在与氨基酸Ser261或Phe260或Val259相对应的氨基酸之前,将稳定的蛋白结构域插入至所述GPCR的ICL2区。
7.根据权利要求5所述的融合蛋白,其中根据图6所示人GLPlR的编号,在与氨基酸Ser258相对应的氨基酸之后并在与氨基酸Ser261或Phe260或Val259相对应的氨基酸之前,将稳定的蛋白结构域插入至所述GPCR的ICL2区。
8.根据权利要求1至7中任一项所述的融合蛋白,其中稳定的蛋白结构域包含溶菌酶,如T4溶菌酶的氨基酸序列。
9.根据权利要求1至8中任一项所述的融合蛋白,其进一步包含可检测的部分,例如荧光标记、放射性标记或者酶标记中的任一。
10.根据权利要求9所述的融合蛋白,其中所述可检测的部分是EGFP。
11.一种编码如权利要求1至10中任一项所述的融合蛋白的多核苷酸。
12.—种包含如权利要求11所述的多核苷酸的宿主细胞。
13.—种包含如权利要求1至10中任一项所述的融合蛋白的晶体。
14.根据权利要求1至10中任一项所述的融合蛋白,其处于溶解的形式或者其基本不含其它蛋白或者其固定至固相载体。
15.如权利要求1至 10中任一项所述的融合蛋白在用于结晶、或用于药物发现如在配体结合筛选或在分析开发中、或作为生物传感器中的用途。
16.一种使如权利要求1至10中任一项所述的融合蛋白结晶方法,所述方法包括提供如权利要求1至10中任一项所述的融合蛋白并使之结晶以获得晶体。
17.根据权利要求16所述的方法,其中通过培养如权利要求12所述的宿主细胞以表达所述融合蛋白并分离所述蛋白来提供所述融合蛋白。
18.根据权利要求16或17所述的方法,其中使用脂立方相结晶学进行结晶。
【文档编号】C07K14/72GK103917553SQ201280049594
【公开日】2014年7月9日 申请日期:2012年8月9日 优先权日:2011年8月10日
【发明者】S·A·亚扎耶尔-徳兹浮力, F·H·马歇尔 申请人:赫普泰雅治疗有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1