针对gpcr:g蛋白复合物的结合结构域及来自其的用途

文档序号:3480591阅读:2292来源:国知局
针对gpcr:g蛋白复合物的结合结构域及来自其的用途
【专利摘要】本发明涉及G蛋白偶联受体(GPCR)的结构生物学和信号传递的领域。本发明特别涉及针对和/或特异性结合GPCR:G蛋白复合物的结合结构域。还提供了编码这类结合结构域的核酸序列,和表达或能够表达这类结合结构域的细胞。本发明的结合结构域可用作G蛋白偶联受体的结构和功能表征的通用工具,所述G蛋白偶联受体与下游的异源三聚体G蛋白复合,并与多种天然或合成配体结合,用于研究G蛋白活化的动力学特征,以及用于利用GPCR:G蛋白复合物的筛选和药物发现工作。
【专利说明】针对GPCR:G蛋白复合物的结合结构域及来自其的用途 发明领域
[〇〇〇1] 本发明涉及G蛋白偶联受体(GPCR)的结构生物学和信号传递的领域。本发明特别 涉及针对和/或特异性结合GPCR :G蛋白复合物的结合结构域。还提供了编码这类结合结 构域的核酸序列,和表达或能够表达这类结合结构域的细胞。本发明的结合结构域可用作 G蛋白偶联受体的结构和功能表征的通用工具,所述G蛋白偶联受体与下游的异源三聚体G 蛋白复合,并与各种天然或合成配体结合,所述工具用于研究G蛋白活化的动力学特征,以 及用于利用GPCR :G蛋白复合物的筛选和药物发现工作。
[0002] 背景
[0003] 7次跨膜受体(7TMR),也被称为G蛋白偶联受体(GPCR)是人基因组中的最大类的 受体,是用于医学治疗的最常见靶向蛋白质类型。在过去60年间,从药理学至体内功能表 征,对不同GPCR的理解发生了实质性进展。目前高分辨率的结构研究为GPCR活化和构成 的活性的分子机制提供了深入观察(例如,Rasmussen等人,2011)。然而,尚缺乏GPCR如 何与其下游靶标相互作用并调控其活性的分子细节。与其下游蛋白质复合的GPCR的结构 令人非常感兴趣,不仅因为这类相互作用是药理学相关的,而且因为对分子间相互作用的 原子水平的理解是破解功能选择性的秘密、不同激动剂使一种受体产生不同下游效应的能 力的关键。现有的结构数据支持这样的观点,即,即使尺寸小,GPCR也是具有多种信号传递 输出的复杂变构组织。
[0004] 一旦激活,GPCR就以GTP依赖性的方式,通过三种蛋白质的复合物传达信号,所述 复合物被称为异源三聚体G蛋白或Ga β Y。胞外配体与GPCR的结合调控了催化Ga β Y 中的GDP-GTP交换的能力,从而调控了第二信使的胞内水平。失活的Ga β Υ异源三聚体 包括2个王要兀件:G ct · GDP和G β γ异源_聚体。γ隔尚Gc[上的switch II兀件, 使其不能与第二信使系统相互作用,所述第二信使系统例如涉及cAMP、二酰基甘油和钙的 那些。活化的GPCR催化从G a释放⑶P,允许GTP结合和释放活化的G a -GTP亚基。在这 一状态下,switch II形成了被GTP的γ磷酸稳定的螺旋,使其能够与效应子,如腺苷酸环 化酶相互作用。虽然关于Ga亚基如何与其下游靶标相互作用并调控其活性的理解取得了 较大进展,但尚不清楚活化的GPCR如何通过催化Ga β γ上的核苷酸交换而启动该过程。
[0005] 药物研发的工作一般集中在与特定催化位点或活性位点竞争性结合的小分子配 体上,利用靶的静态模型作为起点。该方法已鉴别和验证了多个目前正在使用的可行的活 性位点治疗剂。然而,新药化合物的高失败率(仅约8%的I期临床治疗剂最终获得食品 药品监管局(Food and Drug Administration)批准,每种药物的保守成本为8亿美元)反 映出多数工作是不成功的,通常一旦靶被视为不可用于药物研发(undrugable)就会被放 弃(Lee&Craik,2009)。相当一部分的这类失败是由于所讨论的祀的最主要的构象不对应 可用于药物研发(drugable)的构象,后者是对治疗适应症而言药物必须结合才有效的构 象。例如,已经证实了获得结合激动剂的活性状态的GPCR结构的尝试是非常困难的,因为 在缺少G蛋白的条件下,该状态是内在不稳定的。目前,利用构象选择性稳定的纳米抗体或 Xaperones--开始能够获得活性状态的gpcr的结构,所述纳米抗体或Xaperones?· 模拟G蛋白并且增加了激动剂在orthosteric位点的亲和力(Rasmussen等人,2011)。 这证实了 Xaperones?使最有挑战性的药物靶的结构锁定在治疗相关构象中的能力 (Steyaert&Kobilka,2011),及其用于定向药物研发的用途,所述定向药物研发允许特异性 的筛选对特定的靶具有较高灵敏度和选择性的潜在药物(W02012007593)。该技术方法的一 个限制是需要为每个GPCR靶鉴别特定的稳定化纳米抗体,这不仅费时费钱,而且暗示要利 用不同的工具,如用于免疫和选择目的的生物学材料等。
[0006] 因此,需要研发新的直接的工具,用于GPCR药物靶的结构和药理学分析。
[〇〇〇7] 发明概述
[0008] 阐明与其下游异源三聚化G蛋白复合且结合至多种天然和合成配体的GPCR的结 构和功能特征,对于理解GPCR信号转导的机制以及药物研发工作都是有价值的。例如,迄 今为止尚未成功获得活性状态的三元复合物(包含激动剂、GPCR和G蛋白)的结构,由于 对其生物学的理解贫乏,获得该结构是信号转导的结构生物学非常需要的。该复合物的晶 体生成被证实是非常困难的,因为一个伙伴部分(受体)需要去垢剂使其溶解,而G蛋白在 去垢剂中则是不稳定的。此外,复合物形成所需要的核苷酸也在瞬时过程中使复合物解离。
[0009] 因此,同时也是非常令人意外的是,本发明人鉴别了使GPCR和G蛋白的复合物稳 定的工具,该工具能够捕获和纯化这类复合物,最终使这类复合物结晶。这有利于通过例如 基于病毒筛选或设计的结构、高通量筛选或基于片段的药物发现,鉴别配体或药物化合物 (参见例如,实施例10)。更具体而言,本发明人鉴别了适用于活性状态的复合物(包含激 动剂、GPCR和G蛋白)的结构和功能分析的结合结构域,特别是免疫球蛋白单可变结构域 (参见例如,实施例4-7)。令人感兴趣的是,证实了一些上述GPCR :G蛋白复合物-选择性 结合结构域是特异性针对G蛋白的,而不针对GPCR。例如,在不与β-肾上腺素能受体接 触的条件下,鉴别了结合位于的Ga s和γ界面上的Gs的结合结构域(参见例如,实施 例3),因此所述结合结构域可用于捕获和稳定其他的Gs偶联受体,如对精氨酸血管加压素 受体2 (V2R)证实的(参见例如,实施例9)。因此,特别有利的是,结合结构域针对GPCR :G 蛋白复合物中的G蛋白,因为这类结合结构域可用作稳定和捕获与特定G蛋白相互作用的 GPCR范围的活性状态复合物的一般工具。
[〇〇1〇] 因此,根据第一个方面,本发明涉及针对和/或特异性结合包含GPCR和G蛋白的 复合物的结合结构域。更具体而言,相比分别单独与G蛋白和/或与GPCR结合,本文所述 的结合结构域以更高的亲和力结合GPCR :G蛋白复合物。此外,本文所述的结合结构域增强 了 G蛋白对GPCR的亲和力。因此,本发明提供了针对和/或特异性结合包含GPCR和G蛋 白的复合物的构象表位的结合结构域,所述结合结构域将复合物稳定或锁定在特定的构象 状态,更具体而言是活性构象状态。
[〇〇11] 一般而言,本文所述的结合结构域可结合任何由GPCR和G蛋白的复合物可利用或 可接近的构象表位。这些构象表位可以由包含在复合物中的单个蛋白质呈递,和/或仅在 形成复合物时呈递。此外,这些构象表位可以或可以不由单个蛋白质单独呈递。根据一个 特定的实施方案,本文所述的结合结构域特异性结合包含在复合物中的G蛋白,而不结合 GPCR。
[0012] 通常,G蛋白本质上是结合核苷酸的形式。更具体而言,G蛋白(或至少a亚基) 结合GTP或GDP,这取决于特定GPCR的活化状态,如本文中另外描述的。结合GPCR的激动 剂促进与结合了⑶P的Ga β Y异源三聚体相互作用,导致Ga上的⑶P交换为GTP和G蛋 白功能性解离为Ga-GTP和Gi3 γ亚基,这是进一步的胞外信号传递所需的。在特定的实 施方案中,本文所述的结合结构域在缺少核苷酸的条件下特异性结合GPCR :G蛋白复合物, 并使其稳定,更具体的是,结合结构域结合和稳定这样的GPCR:G蛋白复合物,其中G蛋白处 于不合核苷酸的形态。在特定的实施方案中,本文所述的结合结构域特异性结合位于所述G 蛋白的a和β-Υ亚基之间的界面上的构象表位,并由此阻断⑶P / GTP结合位点,和干 扰GDP / GTP结合。由此且令人惊讶的,本文所述的结合结构域在存在核苷酸(特别是鸟 嘌呤核苷酸或其类似物,例如GTP γ S)的条件下阻止或抑制GPCR :G蛋白复合物解离。本文 所述的结合结构域还阻止或抑制核苷酸与G蛋白的结合。
[0013] 优选的,本文所述的结合结构域针对和/或特异性结合包含GPCR、G蛋白和一个 或多个受体配体的复合物。通常,受体配体是激动剂、或正变构调节剂、或其组合。
[0014] 根据另一个优选的实施方案,本文所述的结合结构域针对和/或特异性结合包含 Gs蛋白偶联受体和Gs蛋白的复合物;或包含Gi蛋白偶联受体和Gi蛋白的复合物;或包含 Gt蛋白偶联受体和Gt蛋白的复合物;或包含Ggust蛋白偶联受体和Ggust蛋白的复合物; 或包含Gz蛋白偶联受体和Gz蛋白的复合物;或包含Golf蛋白偶联受体和Golf蛋白的复 合物;或包含Gq蛋白偶联受体和Gq蛋白的复合物;或包含G12偶联受体和G12蛋白的复合 物;或包含G13偶联受体和G13蛋白的复合物。包含在复合物中的GPCR和/或G蛋白可来 自相同或不同的物种,特别是来自哺乳动物物种。优选的,GPCR是人蛋白质。
[0015] 一般而言,本发明的结合结构域可以是能够特异性结合GPCR :G蛋白复合物的任 何非天然存在的分子或其部分。特别的是,本文所述的结合结构域是包含这样的氨基酸序 列的免疫球蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(FR1 至FR4)和3个互补决定区(⑶R1至⑶R3):
[0016] FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4(1)。
[〇〇17] 优选的,本文所述的结合结构域是源自骆驼科物种的免疫球蛋白单可变结构域, 特别是纳米抗体或VhH。
[0018] 根据特定的实施方案,本文所述的结合结构域是包含这样的氨基酸序列的免疫球 蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(FR1至FR4)和 3个互补决定区(⑶R1至⑶R3):
[0019] FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4(1),
[0020] 并且其中⑶R1选自:
[0021] a) SEQ ID NO :13-18,
[0022] b)与SEQ ID NO :13-18具有至少80%氨基酸同一性的多肽,
[0023] c)与SEQ ID NO :13-18具有3、2或1个氨基酸差异的多肽,
[0024] 并且其中CDR2选自:
[0025] a) SEQ ID NO :25-30,
[0026] b)与SEQ ID NO :25-30具有至少80%氨基酸同一性的多肽,
[0027] c)与SEQ ID NO :25-30具有3、2或1个氨基酸差异的多肽,
[0028] 并且其中CDR3选自:
[0029] a) SEQ ID NO :37-42,
[0030] b)与SEQ ID NO :37-42具有至少80%氨基酸同一性的多肽,
[0031] c)与SEQ ID NO :37-42具有3、2或1个氨基酸差异的多肽。
[0032] 在特别优选的实施方案中,本发明提供了包含这样的氨基酸序列的免疫球蛋白单 可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(FR1至FR4)和3个互 补决定区(⑶R1至⑶R3):
[0033] FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4(1);
[0034] 其中 CDR1 是 SEQ IDNO :13 ;其中 CDR2 是 SEQ IDNO :25 ;且其中 CDR3 是 SEQ IDN0 : 37〇
[0035] 根据非常特定的实施方案,结合结构域,特别是免疫球蛋白单可变结构域具有选 自SEQ ID N0 :1至6的氨基酸序列。
[0036] 此外,本文描述的结合结构域还可以包含在多肽中。此外,结合结构域还可以固定 在固体支持物上。
[0037] 在一个特定的方面,本发明涉及针对和/或特异性结合G蛋白的结合结构域。
[0038] 本发明的另一个方面设想了包含本文所述的结合结构域的复合物。复合物特别包 含GPCR、G蛋白,和任选的受体配体。在某些应用中,本文所述的复合物是晶体。
[0039] 本发明还提供了核酸序列,特别是编码任何本文所述结合结构域的任何氨基酸序 列的核酸序列,以及包含任何本文所述核酸序列的重组载体。本发明的特别优选的方面是 包含任何本文所述载体或核酸的细胞,所述细胞可以表达或能够表达GPCR和/或G蛋白。 根据本发明的细胞的细胞培养物及其来源的膜制品也落入本发明的范围内。
[0040] 本文描述的结合结构域、复合物和细胞可用于多种上下文和应用中。因此,本发明 的一个方面相应的涉及本文所述的结合结构域的用途,用于使包含GPCR和G蛋白,和任选 的受体配体的复合物稳定化,所述受体配体处于功能构象状态,更具体的处于活性构象状 态。在一个特定的实施方案中,本文所述的结合结构域可用于阻止复合物在存在核苷酸的 条件下解离,所述核苷酸特别是鸟嘌呤核苷酸或其类似物,如GTP γ S。因此,作为工具稳定 GPCR :G蛋白复合物和阻断功能构象状态(优选活性构象状态)的GPCR的结合结构域在一 系列应用中是非常有效的,如下文概括的。
[0041] 本发明的目标是使用本文所述的结合结构域使复合物结晶和/或解析复合物结 构,所述复合物包含GPCR和G蛋白和任选的受体配体。
[〇〇42] 还认为落入本发明范围内的是使用本文所述的结合结构域,或本文所述的其来源 的细胞或模制品,来筛选调控GPCR的信号传递活性的化合物。
[〇〇43] 此外,本文所述的结合结构域可用于捕获一个或多个相互作用的蛋白质,特别是 与G蛋白和/或GPCR相互作用的蛋白质。
[0044] 根据特定的实施方案,本发明提供了用于捕获和/或纯化包含GPCR和G蛋白的复 合物的方法,方法包括步骤:
[0045] a)提供本文所述的结合结构域,和
[0046] b)允许结合结构域与包含GPCR和G蛋白,和任选受体配体的复合物结合,和
[0047] c)任选的分离步骤b)中形成的复合物。
[0048] 在另一个特定的实施方案中,本发明涉及确定包含GPCR和G蛋白的复合物的晶体 结构的方法,方法包括步骤:
[0049] a)提供本文所述的结合结构域,和
[0050] b)允许结合结构域与包含GPCR和G蛋白,和任选受体配体的复合物结合,和
[0051] c)使步骤b)中形成的复合物结晶。
[0052] -些本文所述的结合结构域可具有治疗用途。因此,本发明的目标还是使用本文 所述的结合结构域调控GPCR受体信号传递,特别是G蛋白介导的GPCR受体信号传递。
[0053] 本发明还涵盖了生产针对和/或特异性结合包含GPCR和G蛋白的复合物的结合 结构域的方法,方法包括步骤:
[0054] a)在合适的细胞表达系统中表达本文所述的核酸,和任选的
[0055] b)分离和/或纯化结合结构域。
[0056] 本发明的另一个方面涉及筛选针对和/或特异性结合包含GPCR和G蛋白的复合 物的结合结构域的方法,方法包括步骤:
[0057] a)提供多个结合结构域,和
[0058] b)在所述多个结合结构域中,筛选与包含GPCR和G蛋白的复合物结合的结合结构 域,和
[0059] c)分离与复合物结合的结合结构域。
[0060] 根据本文的其他描述,本发明的其他目标也是显而易见的。
[0061] 附图简述
[0062] 图1 : β 2AR :Gs复合物的G蛋白循环。a,与β 2AR结合的胞外激动剂导致跨膜区段 的细胞质端的构象重排,所述区段使Gs异源三聚体(α、β和Y)结合受体(R、R*)。⑶P 是在形成R:G复合物时从α亚基释放的。GTP结合不合核苷酸的α亚基,导致α和β Υ 亚从受体解离。亚基调控其相应的效应子蛋白--腺苷酸环化酶(AC)和Ca2+通道。在α 亚基中的GTP水解为GDP后,自α和β Υ亚基重新装配为Gs异源三聚体。b,维持在去垢 剂微团中的纯化的不含核苷酸的02AR:Gs蛋白质复合物。Gsa亚基由2个结构域组成: Ras结构域(a Ras)和a -螺旋状结构域(a AH)。两个结构域都参与核苷酸结合。在不合 核苷酸的状态下,相对于a Ras结构域,a AH结构域具有可变的位置。
[0063] 图2 :形成稳定的β 2AR :Gs复合物。通过下述的组合效应:1)以非常缓慢的解离 速率使高亲和力激动剂与受体结合(如Rasmussen等人,2011所述):2)在存在腺苷三磷 酸双磷酸酶的条件下,形成不含核苷酸的复合物,该酶水解释放的GDP,阻止它重新结合和 导致较不稳定的R :G相互作用;和3)将DDM去垢剂交换为稳定复合物的MNG-3,实现稳定 的β 2AR :Gs复合物。
[0064] 图3 :核苷酸类似物、pH和纳米抗体对β 2AR :Gs复合物稳定性的效应。a)分析凝 胶过滤显示了核苷酸⑶P和GTP γ S(0. ImM)导致β 2AR-365 :Gs复合物的解离。b)模拟核 苷酸磷酸基的磷酸盐-焦磷酸盐和三钠磷酸甲酸盐(forcarnet) (5mM使用)不导致复合 物解构。作为添加剂,它们改善了两种T4L- β 2AR :Gs复合物(不含纳米抗体),T4L- β 2AR : Gs :Nb37和T4L-P 2AR :Gs :Nb35的晶体生长。c)确定pH上下限,指导结晶筛选的制备。出 于相同的目的,使用各种浓度的NaCl确定离子强度的效应(数据未显示)。复合物在20、 100和500mM中是稳定的,而在2. 5M NaCl中解离。d)纳米抗体35(Nb35,红色虚线)结合 T4L-0 2AR:Gs :B1167107三元复合物(蓝色实线),形成R:G:Nb35复合物(红色实线), 与处理过的R :G复合物(绿色虚线)相反,R :G :Nb35复合物对GTP γ S处理不敏感(绿色 实线)。Nb35和Nb37结合位于Gs异源三聚体上的独立表位,形成R :G :Nb35 :Nb37复合物 (紫色实线)。e)纳米抗体36 (Nb36,红色虚线)结合R :G复合物(黑色实线),形成R :G : Nb36复合物(红色实线),后者对GTP γ S处理较不敏感(绿色实线)。Nb36和Nb37结合 位于Gs异源三聚体上的独立表位,形成R :G :Nb36 :Nb37复合物(紫色实线)。f)纳米抗 体37 (Nb37,绿线)结合R :G复合物(黑色实线),形成R :G :Nb37复合物(红色实线)。g) R :G :Nb37复合物对GTP γ S处理较不敏感(蓝色实线),与处理过的R :G复合物相反(蓝 色虚线)。
[0065] 图4 :MNG-3对R :G复合物的稳定效应。a)在4°C孵育48hr后,对在DDM (黑色)、 MNG-3 (蓝色)或2种MNG-3类似物(红色和绿色)中纯化的β 2AR-365 :Gs复合物进行分 析凝胶过滤。与DDM相反,R:G复合物在MNG去垢剂中是稳定的。b)通过3H-二氢阿普洛 尔(3H-DHA)饱和结合测定的,稀释未结合配体的纯化3 2AR在低于去垢剂的临界微团浓度 (CMC)的DDM或MNG-3中的效应。20sec后,稀释维持在低于CMC1000倍的DDM中的β 2AR 导致丧失3H-DHA结合(黑色数据点)。相反,24hr后,在稀释至低于CMC1000倍的MNG-3 中的P2AR仍保持了全部与放射性配体结合的能力。
[0066] 图5 :R :G复合物的纯度和均质性。a)在T4L_ β 2AR :G纯化的各个阶段获得的样 品的分析性SDS-PAGE /考马斯蓝染色。在过量的异源三聚体中的B1167107激动剂结合的、 去磷酸化的,和去糖基化的受体用于与G-蛋白的功能性部分的最佳偶联效率。通过与固定 在Ml树脂上的受体的相互作用,实现Gs的功能纯化,同时洗去无功能/未结合的Gs。b)4 次连续预备的凝胶过滤之一的代表性洗脱曲线,红色指出了分级。在所示短划线内合并含 有R :G复合物的级分,旋转浓缩,并分析纯度和均质性,通过SDS-PAGE /考马斯蓝(a,倒数 第2道至右侧),在c)凝胶过滤,和通过d)阴离子交换层析。上图显示了在形成复合物前 用λΡΡ酶处理过的0 2AR-365:Gs复合物的分析性IEC的洗脱曲线,与未脱磷酸化的复合 物相比,获得异质的制品(下图)。在存在多种化学品的条件下(图1中的例子),使用b) 中的所示虚线外侧的级分中的较不均质的材料进行R :G复合物的分析凝胶过滤实验。
[0067] 图6 :制备与Nb35的R :G复合物的纯化过程的流程图。
[0068] 图7 :纯化Nb35,和确定R :G :Nb的混合比例。a)在镍亲和层析纯化纳米抗体 35 (Nb35)后的预备离子交换层析。将作为小峰和均质大峰洗脱在两群中的纳米抗体(显示 为红色)收集、旋转浓缩并且在如(b)所示确定与R :G复合物的适当混合比后,用于晶体学 分析。b)基于蛋白质浓度,将激动剂结合的T4L-i3 2AR :Gs复合物与略微过量的Nb35混合 (R :G复合物比Nb35为1-1. 2摩尔比),并通过分析性凝聚过滤验证所述混合物。
[0069] 图8 :海绵样中间相中的T4L-3 2AR :Gs :Nb35复合物晶体。
[0070] 图9 : β 2AR :Gs复合物的整体结构。a)复合物的晶格堆积显示了晶体内受体和G 蛋白的交替叠层。在含水层的蛋白之间形成了丰富的接触。b)不对称单元内容的整体结构 显示i32AR(绿色)与激动剂(黄色球)结合,并参与和Gsa (桔色)的广泛的相互作用。 Gas以及Gi3 (青色)和GY (紫色)构成了异源三聚体G蛋白Gs。结合Gs的纳米抗体 (Nb35,红色)在a和β亚基之间结合G蛋白。纳米抗体(Nb35)促进结晶,与i3 2AR的氨 基末端融合的T4溶菌酶(紫红色)也促进结晶。c)省略了结晶帮助的生物学复合物,显示 了它在细胞膜中的位置和方向。
[0071] 图 10 :在结合了 BI-167107 的 T4L-P 2AR :Gs :Nb35 复合物的 BI-167107 中的 Nb35 和Gs的相互作用。a)对Nb35 (红色)的CDR1 (填充表示)与G β (填充表示,青色)的相 互作用的两幅代表性图。b)对Nb35 (红色)的CDR3 (填充表示)与G a S (填充表示,桔色) 和Gi3 (填充表示,青色)的相互作用的两幅代表性图。通过与GaS和Gi3相互作用,Nb35 可以降低复合物的构象柔性。c)对Nb35(填充表示,红色)与GaS(桔色)的框架区的相 互作用的两幅代表性图。
[0072] 图11 :Nb35与相邻复合物的Ga S亚基之间的晶体接触。涉及-X,y-Ι / 2, -z+1 对称的相关复合物(a)和X,y-1,z对称的相关复合物(b)的Nb35(红色,填充表示)和 Ga S(桔色)的晶体接触。
[0073] 图12 :比较活性和失活的β 2AR结构。a)与失活的结合卡拉洛尔(carazolol)的 β 2AR结构(蓝色;Rosenbaum等人,2007)相比,β 2AR :Gs结构(绿色)的侧面图和胞质视 图。对于TM5和TM6的胞内结构域可见显著的结构改变。如两种结构中的Glu268的α-碳 (黄色箭头)测量的,ΤΜ5延伸出两条螺旋转角,而ΤΜ6则向外移动了 14Λ。b)与纳米抗 体-稳定的活性状态的P2AR:Nb80结构(桔色,Rasmussen等人,2011)比较的P2AR:Gs。 c)从胞质侧观察到的E / DRY和NPxxY基序中的残基位置,以及β 2AR :Gs和β 2AR :Nb80 结构的其他关键残基位置。除了在P2AR:Nb80结构中与纳米抗体相互作用的Argl31夕卜, 所有残基都占据了非常相似的位置。
[0074] 图13 :R:G界面中的残基的电子密度图。a)TM3的胞质末端的D / ERY基序。b) 在E / DRY基序的Argl31和C末端G a S的Tyr391之间的堆积相互作用。c) TM7的胞质末 端的NpxxY。d)Thr68和Tyrl41与E / DRY基序的Aspl30的相互作用。IL2的Phel39包 埋在GaS的疏水口袋中。e)GaS的β 1-α 1环(P环)参与核苷酸结合。电子密度图是以 lsigma勾画轮廓的2Fo_Fc图。
[0075] 图14 :受体:G蛋白相互作用。a,b)通过打开跨膜螺旋5和6,G a S的α 5-螺旋进 入了在受体胞内侧形成的空穴中。a)在跨膜核心中,相互作用主要是非极性的。一个例外 涉及α 5-螺旋的Tyr391倚靠 TM3的保守DRY序列的Argl31堆积(也参见图13)。Argl31 还倚靠 TM7的保守NPxxY序列的Tyr堆积。b)由于存在α 5螺旋,受体与TM5和TM3形成 了极性相互作用的网络。c)受体残基Thr68和Aspl30通过Tyrl41与β 2AR的IL2螺旋相 互作用,摆放螺旋的位置,使得受体的Phel39进入(dock) G蛋白表面的疏水口袋中,从而在 结构上关联了受体-G蛋白与β 2AR的高保守DRY基序相互作用。
[0076] 图15 :Ga s的构象改变。a)比较@2AR:Gs复合物中的Ga s (桔色)与结合GTPyS 的G a s (灰色)(PDB ID :1AZT ;Sunahara等人,1997)。GTP y S显示为球形。相对于在结合 GTP YS的状态下的位置,Ga s的螺旋状结构域(Ga SAH)表现出剧烈的移位。b)旋转Ga s 的a 5螺旋,将其替换为β 2AR,干扰(perturb) β 6- a 5环,所述环另外形成GTP γ S结合 口袋的一部分。c)Ga s的β 1-a 1环(P环)和β6_α 5环分别与GTP YS-Ga s结构中的 GTPYS的磷酸和嘌呤环相互作用。d)在不合核苷酸的i32AR:Gs结构中,β 1-a 1和β6_α5 环被重排。
[0077] 图 16 :Nb37 抑制 GTP γ S 与 G a s 结合。孵育 Bodipy-GTP γ S (ΙΟΟηΜ)与 1 μ Μ 纯化 的G a s,在存在递增浓度的Nb37的条件下,实时测量的荧光增加。
[0078] 图 17 :Nb35 不影响 GTP γ S 与 G a s 结合。孵育 Bodipy-GTP γ S (ΙΟΟηΜ)与 1 μ Μ 纯 化的G a s,在存在递增浓度的Nb35的条件下,实时测量的荧光增加。
[0079] 图18 :Nb35抑制GTPyS与Gsa β Y异源三聚体结合。孵育 Bodipy-GTPYS(lOOnM)与ΙμΜ纯化的Gsa β γ异源三聚体,在存在递增浓度的Nb35的条 件下,实时测量的荧光增加。
[0080] 图19 :纯化稳定的AVP :NT4LV2R :Gs复合物。a)在FLAG标签亲和纯化后,使用 Ni-NTA纯化AVP :NT4LV2R :Gs复合物的示意图。b)亲和纯化的AVP :NT4LV2R :Gs的SEC色 谱图。c)监控纯化方案的SDS-page。道1 :经过FLAG标签亲和柱的流过物;道2 :纯化前 的AVP、NT4LV2R和Gs的混合物;道3 :分子标志物;道4 :SEC洗脱的AVP :NT4LV2R :Gs复合 物;道5 :FLAG-标签亲和纯化后的Ni-NTA后的AVP :NT4LV2R :Gs复合物。
[0081] 图20 :SEC监控的AVP :NT4LV2R :Gs复合物的稳定性。短划线:冰上孵育24hr后, AVP :NT4LV2R :Gs复合物的SEC色谱图。蓝线:冰上孵育48hr后,AVP :NT4LV2R :Gs复合物 的SEC色谱图。红线:用ΙΟμΜ拮抗剂SR121463孵育复合物后,AVP :NT4LV2R :Gs的SEC色 谱图。
[0082] 发明详述
[0083] 定义
[0084] 本发明将就一些特定实施方案并参考附图进行描述,但本发明并不限于此,而仅 受权利要求限制。权利要求中的任何提及表示都不应解释为限制范围。本文描述的附图仅 是示意性而非限制性的。在附图中,为了举例说明目的,一些元素的尺寸可能被夸大,并非 按比例绘制。当术语"包括/包含"在本说明书和权利要求中使用时,它不排除其他元素或 步骤。在使用不定冠词或定冠词的地方,当提及单数名称例如"一个/ 一种"、"所述/该" 时,除非另有具体说明,否则这涵盖该名词的复数形式。此外,在说明书和权利要求中的术 语第一、第二、第三等用于区分相似元素,而不一定用于描述顺序或时间次序。应当理解,如 此使用的术语在合适环境下是可互换的,并且本文描述的本发明的实施方案能够以与本文 描述或举例说明不同的其他顺序操作。
[0085] 除非本文中另外定义,否则本发明使用的科学和技术术语和词汇都应具有本领域 普通技术人员通常理解的含义。一般而言,本文使用的命名法,和本文所述的分子和细胞生 物学、遗传学和蛋白质和核酸化学和杂交的技术是本领域普遍已知和常规使用的。除非另 外指出,否则一般根据本领域普遍已知的常规方法和本说明书全文引用和讨论的各种常见 和更具体的参考文献所述,实施本发明的方法和技术。参见例如,Sambrook等人,Mo 1 ecu 1 ar Cloning :A Laboratory Manual,第 2 版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. y . (1989) :Ausubel 等人,Current Protocols in Molecular Biology, Greene Publishing Associates (1992,和 2002 年增刊)。
[0086] 术语"结合结构域"或"蛋白质结合结构域"一般指任何能够使用特定的分子间相 互作用,结合蛋白质或肽的非天然存在的分子,或其部分。多种分子可作为蛋白质结合结构 域发挥作用,包括但不限于蛋白质性分子(蛋白质、肽、蛋白质样或含蛋白质的)、核酸分子 (核酸、核酸样或含核酸的)和碳水化合物分子(碳水化合物、碳水化合物样、含碳水化合物 的)。说明书中还可见更详细的描述。
[〇〇87] 术语"多肽"、"蛋白质"、"肽"在本文中可互换的使用,指任何长度的氨基酸的聚合 形态,可包括编码的和非编码的氨基酸,化学或生物化学修饰的或衍生的氨基酸,和具有相 似的肽骨架的多肽。
[0088] 如本文中使用的,术语"蛋白质复合物"或简单的"复合物"指一类两条或多条相 关的多肽链。蛋白质复合物中的蛋白质是通过非共价的蛋白质-蛋白质相互作用连接的。 "四级结构"是蛋白质复合物中的相关折叠蛋白质的结构排列。可理解,复合物可以是包含 2、3、4、5、6或更多个多肽的多聚复合物。复合物还可以额外的包含非蛋白质性分子。
[〇〇89] 如本文中使用的,术语"核酸分子"、"多核苷酸"、"多聚核酸"、"核酸"可互换的使 用,指任何长度的核苷酸的聚合形态,不论是脱氧核糖核苷酸或核糖核苷酸,或其类似物。 多核苷酸可具有任何三维结构,可实施任何已知或未知的功能。多核苷酸的非限制例子包 括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、cDNA、重 组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、控制区、任何序列的分离的 RNA、核酸探针和引物。核酸分子可以是线性或环状的。
[0090] 如本文中使用的,术语"配体"或"受体配体"意指胞内或胞外特异性结合GPCR的 分子。在不是限制性目的的条件下,配体可以是蛋白质、(多)肽、脂类、小分子、蛋白质支 架、抗体、抗体片段、核酸、碳水化合物。配体可以是合成的或天然存在的。术语"配体"包 括"天然配体",这是天然GPCR的内源性的、天然的配体。在绝大部分情况下,配体是与细胞 表达的GPCR接触(例如结合)时,增加或减少胞内应答的"调节剂"。作为调节剂的配体例 子包括激动剂、部分激动剂、逆激动剂和拮抗剂,说明书中还可见对其更详细的描述。
[0091] 术语蛋白质的"构象"或"构象状态"一般指在任何瞬间,蛋白质可能采用的结构 范围。本领域技术人员将认识到,构象或构象状态的决定因素包括反映在蛋白质的氨基酸 序列(包括修饰的氨基酸)的蛋白质初级结构,和蛋白质周围的环境。蛋白质的构象或构 象状态还涉及结构特征,如蛋白质二级结构(例如,α -螺旋、β -片层等)、三级结构(例 如,多肽链的三维折叠)和四级结构(例如,多肽链与其他蛋白质亚基的相互作用)。对多 肽链的翻译后修饰和其他修饰(如配体结合、磷酸化、硫酸化、糖基化或连接疏水基等)可 影响蛋白质的构象。此外,环境因素(如周围溶液的pH、盐浓度、离子强度和重量摩尔渗透 压浓度、与其他蛋白质和辅助因子的相互作用等)可影响蛋白质构象。可以通过针对活性 或与另一种分子的结合的功能测定,或通过物理学方法(如X射线晶体学、NMR或自旋标记 等),以及其它方法,确定蛋白质的构象状态。关于蛋白质构象和构象状态的一般讨论,可参 考Cantor和 Schimmel,Biophysical Chemistry,Part I :The Conformation of Biological. Macromolecules, · W. H. Freeman and Company, 1980,和 Creighton, Proteins :Structures and Molecular Properties, W. H. Freeman and Company, 1993。"特定构象"或"特定构象状 态"是蛋白质可采用的一系列构象或构象状态的任何子集。
[0092] 如本文中使用的,"功能性构象"或"功能性构象状态"指这样的事实,S卩,蛋白质 具有不同的构象状态,所述构象状态具有动态的活性范围,特别是从无活性至最大活性的 范围。功能性构象状态的例子包括活性构象和失活构象。应明确,"功能性构象状态"意在 覆盖GPCR的任何具有任何活性的构象状态,包括无活性;而并非意在覆盖蛋白质的变性状 态。本文考虑的一类特殊的功能性构象是"可用于药物研发的构象",一般指靶蛋白的独特 的治疗相关的构象状态。作为示例,β2肾上腺素能受体的活性构象对应于该受体用于治 疗哮喘的可用于药物研发的构象。因此,可理解,可用于药物研发的能力受到取决于治疗的 适应症的特定构象的限制。
[0093] 如本文中使用的,词语"锁定(locking) "或"捕捉(trapping) "或"固定(fixing) " 或"冻结(freezing) "当涉及(本文定义的)GPCR的功能性构象状态时,指将GPCR保持或 保留在其能够另外呈现的可能的构象子集中,这是由于GPCR :G蛋白复合物与根据本发明 的结合结构域的相互作用的效应而产生的。相应的,如本文中使用的,"构象捕捉的"或"构 象固定的"或"构象锁定的"或"构象冻结的"蛋白质是由于GPCR :G蛋白复合物与根据本 发明的结合结构域的相互作用的效应,保持在其能够另外呈现的可能的构象子集中的蛋白 质。在该上下文中,特异性或选择性结合蛋白质的特定构象或构象状态的结合结构域指这 样的结合结构域,所述结合结构域与构象或构象状态子集中的蛋白质结合的亲和力比与所 述蛋白质可呈现的其他构象或构象状态结合的亲和力更高。本领域技术人员将认识到特异 性或选择性结合蛋白质的特定构象或构象状态的结合结构域将使该特定的构象或构象状 态稳定。
[0094] 如本文中使用的,在抗体上下文中的术语"互补决定区"或"⑶R"指Η(重)或 L (轻)链的可变区(也分别缩写为νΗ和VJ,含有能够特异性结合抗原性靶标的氨基酸序 列。这些⑶R区负责抗体对特定抗原决定子结构的基础特异性。这类区域也被称为"超变 区"。CDR代表了可变区内不连续的氨基酸区段,而不论物种如何,发现重链和轻链可变区内 的这些关键氨基酸序列的位置定位在可变链的氨基酸序列中具有相似的位置。所有规则抗 体的可变重链和可变轻链都具有3个CDR区,对于各的轻链(L)和重链(H)而言,所述CDR 彼此互不连续(被称为LI、L2、L3、HI、H2、H3)。特别的是,免疫球蛋白单可变结构域(如 纳米抗体(如本文别处定义的))一般包括单条氨基酸链,其包含4个"框架序列或框架区" 或 FR(被称为?1?1、?1?2、?1?3、?1?4)和3个"互补决定区"或0)1?(被称为0)1?1、0)1?2、0)1?3), 彼此不连续。CDR序列(以及FR序列)的描述是基于对V-结构域和V样结构域的MGT 特有的编号系统(Lefranc等人,2003)。
[〇〇95] 如本文中使用的,"表位"指多肽的抗原决定子。表位可包括对于表位而言独有的 空间构象中的3个氨基酸。一般而言,表位由至少4、5、6、7个这类氨基酸组成,更常见的是 由至少8、9、10个这类氨基酸组成。确定氨基酸的空间构象的方法是本领域已知的,包括例 如X射线晶体学和多维核磁共振。
[0096] 如本文中使用的,"构象表位"指包含空间构象中的氨基酸的表位,所述空间构象 对于多肽的折叠3维构象是独一无二的。一般而言,构象表位由线性序列中不连续的氨基 酸组成,这些氨基酸在蛋白质的折叠结构中聚集在一起。然而,构象表位还可以由采用多肽 的折叠3维构象所特有(且不存在于变性状态中)的构象的氨基酸线性序列组成。在蛋白 质复合物中,构象表位由一条或多条多肽的线性序列中的不连续的氨基酸组成,所述氨基 酸在不同的折叠多肽折叠并在特有的四级结构中联结时聚集在一起。相似的,构象表位在 本文中还可以由一条或多条多肽的氨基酸线性序列组成,所述氨基酸聚集在一起并采用了 四级结构特有的构象。
[0097] 如本文中使用的,术语"特异性"指结合结构域,特别是免疫球蛋白(如抗体)或免 疫球蛋白片段(如纳米抗体)相对于不同的抗原,优先结合一种抗原的能力,不必然暗示了 高亲和力(如本文中别处定义的)。可以特异性结合特定抗原或抗原决定子(例如,表位) 和/或对特定抗原或抗原决定子(例如,表位)具有亲和力的结合结构域,特别是免疫球蛋 白(如抗体)或免疫球蛋白片段(如纳米抗体)被称为"抗"或"针对"所述抗原或抗原决 定子。如果对两种不同的抗原或抗原决定子都是特异性的,则根据本发明的结合结构域被 称为与两种不同的抗原或抗原决定子是"交叉反应性的"。
[0098] 如本文中使用的,术语"亲和力"指结合结构域,特别是免疫球蛋白(如抗体)或 免疫球蛋白片段(如纳米抗体)结合抗原的程度,所述程度使抗原和结合结构域的平衡移 向存在通过其结合而形成的复合物。因此,例如,当抗原和抗体(片段)以相对相等的浓度 组合时,高亲和力的抗体(片段)将结合可利用的抗原,使平衡移向所得到的复合物的高浓 度。解离常数(K d)通常用于描述在蛋白质结合结构域和抗原靶标之间的亲和力。通常,解 离常数小于1(Γ5Μ。优选的,解离常数小于1(Γ 6Μ,更优选的小于1(Γ7Μ。最优选的,解离常数 小于1(Γ8Μ。
[0099] 如本文中使用的,术语"特异性结合"或"特异的结合" 一般指结合结构域,特别是 免疫球蛋白(如抗体)或免疫球蛋白片段(如纳米抗体)优先结合存在于不同抗原的均质 混合物中的特定抗原的能力。在某些实施方案中,特异性结合的相互作用将区分样品中想 要的和不想要的抗原,在一些实施方案中大于约10至100倍或更多(例如,大于约1000或 10, 000 倍)。
[0100] 术语"特异性结合"、"选择性结合"、"优先结合"及其语法等价物在本文中可互换 的使用。术语"构象特异性"或"构象选择性"在本文中也可互换的使用。
[0101] "缺失"在本文中定义为氨基酸或核苷酸序列的改变,其中相比亲代多肽或核酸的 氨基酸序列或核苷酸序列,分别缺少了一个或多个氨基酸或核苷酸残基。在蛋白质或其片 段的上下文中,缺失可涉及缺失约2、约5、约10个,多达约20、多达约30或多达约50个或 更多个氨基酸。蛋白质或其片段可含有一个以上的缺失。在GPCR的上下文中,缺失可特别 是环缺失,或Ν-和/或C-末端缺失。
[0102] "插入"或"添加"是氨基酸或核苷酸序列的这样的改变,即,相比亲代蛋白质的氨 基酸序列或核苷酸序列,分别导致添加了一个或多个氨基酸或核苷酸残基。"插入" 一般指 在多肽的氨基酸序列中添加一个或多个氨基酸残基,而"添加"可以是插入,或指在Ν-或 C-末端、或两端增加氨基酸残基。在蛋白质或其片段的上下文中,插入或添加通常是约1、 约3、约5、约10个,多达约20、多达约30或多达约50个或更多个氨基酸。蛋白质或其片段 可含有一个以上的插入。
[0103] 如本文中使用的,"取代"是相比亲代蛋白质或其片段的氨基酸序列或核苷酸序 列,一个或多个氨基酸或核苷酸分别被不同的氨基酸或核苷酸替换的结果。可理解,蛋白质 或其片段可具有保守性氨基酸取代,其对蛋白质的活性基本没有影响。保守性取代是有意 的组合,如 gly、ala ;val、ile、leu、met ;asp、glu ;ash、gin ;ser、thr ;Iys、arg ;cys、met ; 和 phe、tyr、trp〇
[0104] 术语"序列同一性"在本文中用于指在比较窗口中,序列基于核苷酸-核苷酸或氨 基酸-氨基酸的相同的程度。因此,"序列同一性百分比"如下计算的:通过在比较窗口比 较两条最佳比对的序列,确定两条序列中存在的相同核酸碱基(例如,A、T、C、G、I)或相同 氨基酸残基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、lie、Phe、Tyr、Trp、Lys、Arg、His、 Asp、Glu、Asn、Gin、Cys和Met)的位置数,获得匹配位置数,用匹配位置数除以比较窗口中 的位置总数(即,窗口大小),将结果乘以100,生成序列同一性百分比。可以手工的确定序 列同一性百分比,或利用本领域可得到的计算机程序。
[0105] 如本文中使用的,"晶体"或"晶体状结构"指这样的固体材料,其组成原子、分子 或离子以在伸展在所有的三维空间中的有序重复的模式排列。从液体或溶解在液体中的物 质形成晶体状结构的过程通常被称为"结晶"或"晶体发生"。蛋白质晶体几乎只在溶液中 生长。最常见的方法是逐渐降低其组分分子的溶解度。溶液中的晶体生长的特征是2个步 骤:微观级微晶(可能仅具有100个分子)的成核,然后是所述微晶的生长,理想的生长为 衍射-质量的晶体。
[0106] 如本文中使用的,"X射线晶体学"是确定晶体内的原子排列的方法,其中一 束X射线轰击晶体,并向多个特定方向衍射。根据这些衍射束的角度和强度,检晶器 (crystallographer)可以产生晶体内的电子密度的三维图像。根据该电子密度,可以确 定晶体内的原子的平均位置,及其化学键,其混乱和多种其他信息,如本领域技术人员已知 的。
[0107] 如本文中使用的,术语"原子坐标"指分子结构内的原子三维坐标组。在一个实施 方案中,根据生物物理学领域的普遍技术人员普遍已知的方法,使用X射线晶体学获得原 子坐标。简要的描述如下,可以通过从晶体衍射X射线,获得X射线衍射模式。衍射数据用 于计算包含所述晶体的晶胞的电子密度图;所述图用于建立晶胞内的原子位置(即,原子 坐标)。本领域技术人员可理解,通过X射线晶体学确定的结构坐标组合有标准差。在其他 实施方案中,可以使用其他的实验生物物理学结构确定方法,获得原子坐标,所述方法可包 括电子衍射(也称为电子晶体学)和核磁共振(NMR)方法。在其他实施方案中,可以使用 分子建模工具获得原子坐标,所述工具可基于一种或多种的从头开始的蛋白质折叠算法、 能量最小化和基于同源性的建模。这些技术是生物物理学和生物信息学领域的普遍技术人 员普遍已知的。
[0108] "解析结构"在本文中用于指确定蛋白质的原子排列或原子坐标,通常是通过生物 物理学方法进行的,如X射线晶体学。
[〇1〇9] 术语"化合物"或"测试化合物"或"候选化合物"或"药物候选化合物"在本文中 用于描述在测定中测试的任何天然存在的或合成的分子,所述测定如筛选测定或药物发现 测定。同样地,这类化合物包括有机和无机的化合物。化合物包括特征是低分子量的多核苷 酸、脂类或激素类似物。其他生物聚合的有机测试化合物包括包含约2至约40个氨基酸的 小肽或肽样分子(肽模拟物),和包含约40至约500个氨基酸的较大的多肽,如抗体、抗体 片段或抗体缀合物。测试化合物还可以是蛋白质支架。出于高通量的目的,可使用测试化 合物文库,如提供充分多样性的组合文库或随机文库。例子包括但不限于天然化合物文库、 变构化合物文库、肽文库、抗体片段文库、合成的化合物文库、基于片段的文库、噬菌体展示 文库等。更详细的描述可见于说明书的其它部分。
[0110] 如本文中使用的,术语"确定"、"测量"、"评估"、"监控"和"测定"在本文中可互换 的使用,包括定量和定性的确定。
[0111] 术语"生物学活性"涉及GPCR时指具有天然存在的GPCR的生物化学功能(例如, 结合功能、信号转导功能或由于配体结合的改变构象的能力)的GPCR。
[0112] 如本文中使用的,术语"治疗有效量"、"治疗有效剂量"和"有效量"意指实现理想 结果所需的量。
[0113] 如本文中使用的,术语"可药用的"意指不是生物学或其他方式不理想的材料,即 所述材料可以与化合物一起施用给个体,而不导致任何不理想的生物学效应或与包含其的 药物组合物中的任何其他组分以有害的方式相互作用。
[0114] 发明详述
[0115] 尽管可以激活GPCR的配体极其多样,但它们只与相对少数的胞内蛋白质相互作 用,诱导深奥的生理学变化。异源三聚体G蛋白、β-抑制蛋白和GPCR激酶在其活化状态 特异性识别GPCR的能力是普遍已知的,但从结构和功能的观点出发则对其理解有限。因 此,令人惊讶且有利的是,鉴别了特异性结合GPCR :G蛋白复合物并能够将复合物稳定或锁 定在功能性构象状态(特别是活化构象状态的)结合结构域。此外,结合结构域是用于稳 定和捕获处于结合G蛋白状态中的想要的GPCR的一般性工具,这类GPCR -般被认为代表 GPCR的活性状态(如本文定义)。
[0116] 因此,本发明的第一个方面涉及针对和/或特异性结合包含GPCR和G蛋白的复合 物的结合结构域。
[0117] 本发明的结合结构域可以是任何能够特异性结合包含GPCR和G蛋白的复合物的 非天然存在的分子或其部分(如上文定义)。根据优选的实施方案,本文所述的结合结构域 是蛋白质支架。术语"蛋白质支架" 一般指形成结构的折叠单元,特别是蛋白质或肽结构, 其包括用于结合另一种分子,例如蛋白质,的框架(参见例如,Skerra(2000),综述)。结合 结构域可源自天然存在的分子,例如源自先天性或适应性免疫系统的组分,或者可以完全 是人为设计的。结合结构域可以是基于免疫球蛋白的,或者可以基于蛋白质中存在的结构 域,包括但不限于微生物蛋白质、蛋白酶抑制剂、毒素、纤连蛋白、脂笼蛋白、单链反平行卷 曲螺旋蛋白或重复基序蛋白。本领域已知的结合结构域的例子包括但不限于:抗体、重链 抗体(hcAb)、单结构域抗体(sdAb)、微抗体(minibody)、源自胳§它重链抗体的可变结构域 (VHH或纳米抗体)、源自S鱼抗体的新抗原受体的可变结构域(VNAR)、alphabody、蛋白A、 蛋白G、设计的锚蛋白重复结构域(DARPin)、III型纤连蛋白重复、anticalin、knottin、改 造的CH2结构域(纳米抗体)、肽和蛋白质、脂肽(例如,pepducin)、DNA和RNA(参见例如, Gebauer&Skerra,2009 ;Skerra,2000 ;Starovasnik 等人,1997 ;Binz 等人,2004 ;Koide 等 人,1998 ;Dimitrov,2009 ;Nygren 等人,2008 ;W02010066740)。通常,当使用选择方法生成 特定类型的结合结构域时,使用包含共同序列或框架序列的组合文库筛选与目标分子(如 蛋白质)的结合,所述共同序列或框架序列含有随机的、潜在的相互作用残基。
[0118] 本发明的结合结构域可以针对和/或特异性结合任何选定的GPCR :G蛋白复合 物。优选的靶复合物是天然存在的GPCR和G蛋白的复合物,或可选的在例如GPCR和G蛋 白的非天然存在的变体(本文另外所述)的情况下,是这样的复合物,其中的GPCR和G蛋 白将在恰当的生理条件下关联。本领域技术人员可理解,GPCR和G蛋白之间的结构关系决 定了是否可以形成特定的GPCR :G蛋白复合物,这将在下文关于G蛋白家族成员和GPCR家 族成员中进一步详述。
[0119] "G蛋白"意指鸟嘌呤核苷酸结合蛋白的家族,该家族参与将化学信号传递到细胞 夕卜,并且导致细胞内的改变。G蛋白是配体与GPCR的胞外结构域结合后,胞内信号转导的关 键分子组分。它们也被称为"异源三聚体G蛋白"或"大型G蛋白"。G蛋白由3个亚基组成: α、β和Y,其分类大部分基于不同α亚基的同一性和后续转导事件的性质。G蛋白的其 他分类来自cDNA序列同源性分析。G蛋白结合鸟苷二磷酸(GDP)或鸟苷三磷酸(GTP),具 有高同源性的鸟嘌呤核苷酸结合结构域和用于与受体和效应子相互作用的不同结构域。不 同的Ga蛋白亚类(如Gas、Gai、Gaq和Gal2等)通过不同的通路传递信号,所述通路 涉及第二信使分子,如cAMP、肌醇三磷酸(IP3)、二酰甘油、胞内Ca2+和RhoA GTP酶。为了 进一步示例,α亚基(39_46kDa)合有鸟嘌呤核苷酸结合位点,具有GTP酶活性;β (37kDa) 和Y (8kDa)亚基紧密关联,并作为β γ异二聚体发挥功能。目前描述,有23种类型的α 亚基(包括一些剪接同种型)、6种β亚基和11种Υ亚基。G蛋白和亚基的类型是下标 的:因此,例如,Gs蛋白的α亚基(其活化腺苷酸环化酶)是Gsa ;其他G蛋白包括Gi,其 结构上不同于Gs(不同的α亚基类型)并抑制腺苷酸环化酶。表1提供了其他实施例。
[0120] 通常,G蛋白本质上是结合核苷酸的类型。更具体而言,根据特定GPCR的激活状 态,G蛋白(至少α亚基)结合GTP或⑶Ρ。结合GPCR的激动剂促进与⑶Ρ结合的Ga β Υ 异源三聚体的相互作用,导致G a上的⑶Ρ交换为GTP,和G蛋白功能上解离为G a -GTP和 Gi3 γ亚基。分离的Ga-GTP和Gi3 γ亚基可以独立或平行的调节下游的细胞效应子(通 道、激酶或其他酶,参见表1)。G γ的内在GTP酶活性导致GTP水解为⑶Ρ,和G a -GDP与 Gi3 γ亚基重新关联,和信号传递的终止。因此,G蛋白作为调控分子开关发挥作用,能够通 过a和β γ亚基效应触发分叉(bifurcating)信号。开关通过受体开启,再在数秒内自 身关闭,所述时间足以显著放大信号转导。
[0121] 如本文中使用的,"G蛋白偶联受体"或"GPCR"是享有共同结构基序的多肽,具有7 个在22至24个疏水氨基酸之间的区域,所述区域形成7个α螺旋,每个螺旋跨越细胞膜。 通过编号鉴别每个跨越,即,跨膜-1 (ΤΜ1)、跨膜-2 (ΤΜ2)等。还通过在细胞膜外部或"胞外" 侧的跨膜-2和跨膜_3、跨膜-4和跨膜-5,以及跨膜-6和跨膜-7之间的氨基酸区域连接 跨膜螺旋,所述区域分别被称为"胞外"区1、2和3(EC1、EC2和EC3)。还通过在细胞膜内部 或"胞内"侧的跨膜-1和跨膜-2、跨膜_3和跨膜-4、以及跨膜-5和跨膜-6之间的氨基酸 区域连接跨膜螺旋,所述区域分别被称为"胞内"区1、2和3(IC1、IC2和IC3)。受体的"羧 基"("C")末端位于细胞内的胞内空间,受体的"氨基"("N")末端位于细胞外的胞外空 间。任何上述区域都可以通过分析GPCR的一级氨基酸序列来方便的鉴别。
[0122] GPCR结构和分类是本领域普遍已知的,关于GPCR的其他讨论可见于Probst等 人,1992 ;Marchese 等人,1994 ; Lagerstr·腿 & SchiiHh,,2008 ;Rosenbaum 等人,2009 ; 和下列书籍:Wiley-Liss 出版的 Jurgen Wess (编著)Structure-Function Analysis of G Protein-Coupled Receptors (第 1 版;1999 年 10 月 15 日);John Wiley&Sons 出版的 Kevin R. Lynch (编著)Identification and Expression of G Protein-Coupled Receptors (1998 年 3 月);和 CRC Press 出版的 Tatsuya Haga (编著),G Protein-Coupled Receptors (1999 年 9 月 24 日);和 Academic Press 出版的 Steve Watson (编著)G_Protein Linked Receptor Factsbook(第1版;1994)。可以根据序列同源性,将GPCR分为若干不同家族的类型。虽然 所有的GPCR具有相似的7次跨膜α -螺旋的结构,该受体类型中的不同家族彼此没有表现 出任何序列同源性,因此提示其跨膜结构域结构的相似性可定义共同的功能需求。当可获 得人基因组的第一份草图时,则可能对GPCR储库进行全面理解。Fredriksson及其同事将 802个人GPCR基于系统发生规则分类。这显示绝大部分人GPCR可见于五大主要家族,被称 为视紫红质、黏附素(Adhesion)、分泌素(Secretin)、谷氨酸型(Glutamate)、Frizzled / Taste2 (Fredriksson 等人,2003)。
[0123] 视紫红质家族的成员(对应于A类(Kolakowski,1994)或原分类体系中的1类 (Foord等人(2005))仅具有小的胞外环,并且配体与跨膜豁口(cleft)中的残基发生相 互作用。这是迄今为止最大的一类(占>90%的GPCR),含有气味物、小分子(如儿茶酚胺 和胺)、(神经)肽和糖蛋白激素的受体。视紫红质是该家族的代表物质,是第一个结构被 解析的GPCR(Palczewski等人,2000)。第一个结构被解析的与扩散型配体相互作用的受 体--0 2-AR(Rosenbaum等人,2007)也属于该家族。基于系统发生的分析,B类GPCR或 2类(Foord等人,2005)受体最近被细分为2个家族:黏附素和分泌素(Fredriksson等人, 2003)。黏附素和分泌素受体的特征是参与配体结合的、相对较长的氨基末端胞外结构域。 关于跨膜结构域的方向所知甚少,但该方向很可能与视紫红质的方向迥异。这类GPCR的 配体是激素,如胰高血糖素、分泌素、促性腺激素释放激素和甲状旁腺激素。谷氨酸家族受 体(C类或3类受体)也具有大的胞外结构域,发挥与"捕蝇草(Venus fly trap) "类似的功 能,因为其打开并且将所结合的激动剂关闭在内。家族成员是代谢型谷氨酸、Ca2+_敏感型 和Y _氨基丁酸(GABA) -B受:体。
[0124] GPCR包括但不限于血清素嗅觉受体、糖蛋白激素受体、趋化因子受体、腺苷受体、 生物胺受体、黑皮质素受体、神经肽受体、趋化性受体、促生长素抑制素受体、阿片样物质受 体、褪黑激素受体、降钙素受体、PTH / PTHrP受体、胰高血糖素受体、分泌素受体、黑寡妇蜘 蛛毒素受体、代谢型谷氨酸受体、钙受体、GABA-B受体、信息素受体、蛋白酶活化型受体、视 紫红质和其他与G蛋白偶联的7次跨膜区段受体。GPCR还包括这类彼此关联作为同源或异 源二聚体或作为更高阶的寡聚体的GPCR受体。GPCR的氨基酸序列(及编码其的cDNA的核 苷酸序列)是可以方便获得的,例如参考GenBank(http : / / www.ncbi.nlm.nih.gov / entrez)。
[0125] 因此,根据特定的实施方案,本发明提供了针对和/或特异性结合GPCR :G蛋白复 合物的结合结构域,其中G蛋白选自Gs、Gi、Go、Gt、Ggust、Gz、Golf、Gq、G12和G13。在一 个优选的实施方案中,G蛋白是Gs。在另一个优选的实施方案中,G蛋白是Gi。在仍然另一 个优选的实施方案中,G蛋白是Gt,更具体的是转导素(transducin)。与其对应的是,包含 在复合物中的GPCR选自Gs偶联受体、Gi偶联受体、Go偶联受体、Gt偶联受体、Ggust偶联 受体、Golf偶联受体、Gq偶联受体、G12偶联受体和G13偶联受体。在一个优选的实施方案 中,GPCR是Gs偶联受体。在另一个优选的实施方案中,GPCR是Gi偶联受体。在仍然另一 个优选的实施方案中,GPCR是Gt偶联受体,更具体的是视紫红质。表1提供了特定的非限 制性例子。
[0126] 表1. G蛋白偶联受体和信号传递通路的关系的非限制性例子。
[0127]
[0128]
[0129]
【权利要求】
1. 结合结构域,其针对和/或特异性结合包含GPCR和G蛋白的复合物。
2. 根据权利要求1的结合结构域,相比分别与异源三聚体G蛋白单独和/或与GPCR单 独结合,其与复合物结合的亲和力更高。
3. 根据权利要求1的结合结构域,其特异性结合G蛋白,而不结合GPCR。
4. 根据权利要求1的结合结构域,其中复合物还包含受体配体。
5. 根据权利要求4的结合结构域,其中复合物由GPCR、G蛋白和受体配体组成。
6. 根据权利要求4或5的任一项的结合结构域,其中所述受体配体是激动剂。
7. 根据权利要求1至6的任一项的结合结构域,其中G蛋白处于不含核苷酸的形态中。
8. 根据权利要求1至7的任一项的结合结构域,其特异性结合位于所述G蛋白的α和 β亚基之间的界面上的构象表位。
9. 根据权利要求1至8的任一项的结合结构域,其 a) 在存在核苷酸的条件下阻止或抑制复合物解离,或 b) 阻止或抑制核苷酸与G蛋白结合,或 c) 能替换G蛋白的核苷酸。
10. 根据权利要求7至9的任一项的结合结构域,其中所述核苷酸是鸟嘌呤核苷酸,例 如⑶P或GTP,或其类似物,如GTP γ S。
11. 根据权利要求1至10的任一项的结合结构域,其中GPCR处于活性构象中。
12. 根据权利要求1至11的任一项的结合结构域,其中G蛋白选自Gs、Gi、Go、Gt、 Ggust、Gz、Golf、Gq、G12、G13。
13. 根据权利要求1至11的任一项的结合结构域,其中GPCR选自Gs偶联受体、Gi偶 联受体、Go偶联受:体、Gt偶联受:体、Ggust偶联受:体、Golf偶联受:体、Gq偶联受:体、G12偶联 受体、G13偶联受体。
14. 根据权利要求1至13的任一项的结合结构域,其中所述GPCR是人蛋白质。
15. 根据权利要求1至14的任一项的结合结构域,其中所述结合结构域是包含这样的 氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框 架区(FR1至FR4)和3个互补决定区(⑶R1至⑶R3): FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4(1)。
16. 根据权利要求15的结合结构域,其中免疫球蛋白单可变结构域包含这样的氨基酸 序列,所述氨基酸序列包含根据下列通式(1)的4个框架区(FR1至FR4)和3个互补决定 区(CDR1 至 CDR3): FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4(1), 并且其中⑶R1选自: a) SEQ ID NO :13-18, b) 与SEQ ID NO :13-18具有至少80%氨基酸同一性的多肽, c) 与SEQ ID NO :13-18具有3、2或1个氨基酸差异的多肽, 并且其中⑶R2选自: a) SEQ ID NO :25-30, b) 与SEQ ID NO :25-30具有至少80%氨基酸同一性的多肽, c) 与SEQ ID NO :25-30具有3、2或1个氨基酸差异的多肽, 并且其中⑶R3选自: a) SEQ ID NO :37-42, b) 与SEQ ID NO :37-42具有至少80 %氨基酸同一性的多肽, c) 与SEQ ID NO :37-42具有3、2或1个氨基酸差异的多肽。
17. 根据权利要求15的结合结构域,其中免疫球蛋白单可变结构域是纳米抗体(VhH)。
18. 根据权利要求17的结合结构域,其中纳米抗体具有选自SEQ ID NO :1至6的氨基 酸序列或其变体。
19. 根据权利要求1至18的任一项的结合结构域,其中所述结合结构域包含在多肽中。
20. 根据权利要求1至19的任一项的结合结构域,其中所述结合结构域被固定在固体 支持物上。
21. 包含根据权利要求1至20的任一项的结合结构域的复合物。
22. 根据权利要求21的复合物,其还包含GPCR、G蛋白和任选的受体配体。
23. 根据权利要求21至22的任一项的复合物,其是结晶的。
24. 核酸序列,其编码根据权利要求1至20的任一项的结合结构域的氨基酸序列。
25. 重组载体,其包含根据权利要求24的核酸序列。
26. 细胞,其包含根据权利要求25的载体或根据权利要求24的核酸序列。
27. 根据权利要求26的细胞,其表达或能够表达GPCR和/或G蛋白。
28. 根据权利要求26至27的任一项的细胞的细胞培养物。
29. 根据权利要求26至27的任一项的细胞或根据权利要求28的细胞培养物的膜制 品。
30. 根据权利要求1至20的任一项的结合结构域的用途,用于使复合物稳定化,所述复 合物包含GPCR和G蛋白和任选的处于功能构象状态的受体配体。
31. 根据权利要求30的用途,其用于阻止复合物在存在核苷酸的条件下解离,所述核 苷酸特别是鸟嘌呤核苷酸或其类似物,如GTP γ S。
32. 根据权利要求1至20的任一项的结合结构域的用途,用于使复合物结晶和/或解 析复合物结构,所述复合物包含GPCR和G蛋白和任选的受体配体。
33. 根据权利要求1至20的任一项的结合结构域,或根据权利要求26至27的任一项 的细胞,或根据权利要求29的膜制品的用途,用于筛选调控GPCR的信号传递活性的化合 物。
34. 根据权利要求30至33的任一项的用途,其中GPCR处于活性构象中。
35. 根据权利要求1至20的任一项的结合结构域的用途,用于捕获一个或多个相互作 用的蛋白质。
36. 捕获和/或纯化包含GPCR和G蛋白的复合物的方法,方法包括步骤: a) 提供根据权利要求1至20的任一项的结合结构域,和 b) 允许结合结构域与包含GPCR和G蛋白以及任选地受体配体的复合物结合,和 c) 任选的分离步骤b)中形成的复合物。
37. 确定包含GPCR和G蛋白的复合物的晶体结构的方法,方法包括步骤: a) 提供根据权利要求1至20的任一项的结合结构域,和 b) 允许结合结构域与包含GPCR和G蛋白和任选地受体配体的复合物结合,和 C)使步骤b)中形成的复合物结晶。
38. 根据权利要求1至20的任一项的结合结构域的用途,用于调控GPCR受体信号传 递,特别是G蛋白介导的GPCR受体信号传递。
39. 生产针对和/或特异性结合包含GPCR和G蛋白的复合物的结合结构域的方法,方 法包括步骤: a) 在合适的细胞表达系统中表达根据权利要求24的核酸,和任选的 b) 分离和/或纯化结合结构域。
40. 筛选针对和/或特异性结合包含GPCR和G蛋白的复合物的结合结构域的方法,方 法包括步骤: a) 提供多个结合结构域,和 b) 在所述多个结合结构域中,筛选与包含GPCR和G蛋白的复合物结合的结合结构域, 和 c) 分离与复合物结合的结合结构域。
【文档编号】C07K16/28GK104053667SQ201280040585
【公开日】2014年9月17日 申请日期:2012年6月21日 优先权日:2011年6月21日
【发明者】J·斯泰亚特, E·帕顿, T·拉尔曼斯, B·科比尔卡, S·拉斯穆森, S·格拉涅尔, R·K·苏娜哈拉 申请人:非营利性组织佛兰芒综合大学生物技术研究所, 布鲁塞尔自由大学, 利兰斯坦福青年大学托管委员会, 密执安大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1