针对GPCR:G蛋白复合物的结合结构域及来自其的用途的制作方法

文档序号:14044705阅读:2529来源:国知局

本申请是申请日为2012年6月21日的、发明名称为“针对gpcr:g蛋白复合物的结合结构域及来自其的用途”的中国专利申请201280040585.9(pct/ep2012/062036)的分案申请。

发明领域

本发明涉及g蛋白偶联受体(gpcr)的结构生物学和信号传递的领域。本发明特别涉及针对和/或特异性结合gpcr:g蛋白复合物的结合结构域。还提供了编码这类结合结构域的核酸序列,和表达或能够表达这类结合结构域的细胞。本发明的结合结构域可用作g蛋白偶联受体的结构和功能表征的通用工具,所述g蛋白偶联受体与下游的异源三聚体g蛋白复合,并与各种天然或合成配体结合,所述工具用于研究g蛋白活化的动力学特征,以及用于利用gpcr:g蛋白复合物的筛选和药物发现工作。

背景

7次跨膜受体(7tmr),也被称为g蛋白偶联受体(gpcr)是人基因组中的最大类的受体,是用于医学治疗的最常见靶向蛋白质类型。在过去60年间,从药理学至体内功能表征,对不同gpcr的理解发生了实质性进展。目前高分辨率的结构研究为gpcr活化和构成的活性的分子机制提供了深入观察(例如,rasmussen等人,2011)。然而,尚缺乏gpcr如何与其下游靶标相互作用并调控其活性的分子细节。与其下游蛋白质复合的gpcr的结构令人非常感兴趣,不仅因为这类相互作用是药理学相关的,而且因为对分子间相互作用的原子水平的理解是破解功能选择性的秘密、不同激动剂使一种受体产生不同下游效应的能力的关键。现有的结构数据支持这样的观点,即,即使尺寸小,gpcr也是具有多种信号传递输出的复杂变构组织。

一旦激活,gpcr就以gtp依赖性的方式,通过三种蛋白质的复合物传达信号,所述复合物被称为异源三聚体g蛋白或gαβγ。胞外配体与gpcr的结合调控了催化gαβγ中的gdp–gtp交换的能力,从而调控了第二信使的胞内水平。失活的gαβγ异源三聚体包括2个主要元件:gα·gdp和gβγ异源二聚体。gβγ隔离gα上的switchii元件,使其不能与第二信使系统相互作用,所述第二信使系统例如涉及camp、二酰基甘油和钙的那些。活化的gpcr催化从gα释放gdp,允许gtp结合和释放活化的gα-gtp亚基。在这一状态下,switchii形成了被gtp的γ磷酸稳定的螺旋,使其能够与效应子,如腺苷酸环化酶相互作用。虽然关于gα亚基如何与其下游靶标相互作用并调控其活性的理解取得了较大进展,但尚不清楚活化的gpcr如何通过催化gαβγ上的核苷酸交换而启动该过程。

药物研发的工作一般集中在与特定催化位点或活性位点竞争性结合的小分子配体上,利用靶的静态模型作为起点。该方法已鉴别和验证了多个目前正在使用的可行的活性位点治疗剂。然而,新药化合物的高失败率(仅约8%的i期临床治疗剂最终获得食品药品监管局(foodanddrugadministration)批准,每种药物的保守成本为8亿美元)反映出多数工作是不成功的,通常一旦靶被视为不可用于药物研发(undrugable)就会被放弃(lee&craik,2009)。相当一部分的这类失败是由于所讨论的靶的最主要的构象不对应可用于药物研发(drugable)的构象,后者是对治疗适应症而言药物必须结合才有效的构象。例如,已经证实了获得结合激动剂的活性状态的gpcr结构的尝试是非常困难的,因为在缺少g蛋白的条件下,该状态是内在不稳定的。目前,利用构象选择性稳定的纳米抗体或开始能够获得活性状态的gpcr的结构,所述纳米抗体或模拟g蛋白并且增加了激动剂在orthosteric位点的亲和力(rasmussen等人,2011)。这证实了使最有挑战性的药物靶的结构锁定在治疗相关构象中的能力(steyaert&kobilka,2011),及其用于定向药物研发的用途,所述定向药物研发允许特异性的筛选对特定的靶具有较高灵敏度和选择性的潜在药物(wo2012007593)。该技术方法的一个限制是需要为每个gpcr靶鉴别特定的稳定化纳米抗体,这不仅费时费钱,而且暗示要利用不同的工具,如用于免疫和选择目的的生物学材料等。

因此,需要研发新的直接的工具,用于gpcr药物靶的结构和药理学分析。

发明概述

阐明与其下游异源三聚化g蛋白复合且结合至多种天然和合成配体的gpcr的结构和功能特征,对于理解gpcr信号转导的机制以及药物研发工作都是有价值的。例如,迄今为止尚未成功获得活性状态的三元复合物(包含激动剂、gpcr和g蛋白)的结构,由于对其生物学的理解贫乏,获得该结构是信号转导的结构生物学非常需要的。该复合物的晶体生成被证实是非常困难的,因为一个伙伴部分(受体)需要去垢剂使其溶解,而g蛋白在去垢剂中则是不稳定的。此外,复合物形成所需要的核苷酸也在瞬时过程中使复合物解离。

因此,同时也是非常令人意外的是,本发明人鉴别了使gpcr和g蛋白的复合物稳定的工具,该工具能够捕获和纯化这类复合物,最终使这类复合物结晶。这有利于通过例如基于病毒筛选或设计的结构、高通量筛选或基于片段的药物发现,鉴别配体或药物化合物(参见例如,实施例10)。更具体而言,本发明人鉴别了适用于活性状态的复合物(包含激动剂、gpcr和g蛋白)的结构和功能分析的结合结构域,特别是免疫球蛋白单可变结构域(参见例如,实施例4-7)。令人感兴趣的是,证实了一些上述gpcr:g蛋白复合物-选择性结合结构域是特异性针对g蛋白的,而不针对gpcr。例如,在不与β-肾上腺素能受体接触的条件下,鉴别了结合位于的gαs和gβγ界面上的gs的结合结构域(参见例如,实施例3),因此所述结合结构域可用于捕获和稳定其他的gs偶联受体,如对精氨酸血管加压素受体2(v2r)证实的(参见例如,实施例9)。因此,特别有利的是,结合结构域针对gpcr:g蛋白复合物中的g蛋白,因为这类结合结构域可用作稳定和捕获与特定g蛋白相互作用的gpcr范围的活性状态复合物的一般工具。

因此,根据第一个方面,本发明涉及针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域。更具体而言,相比分别单独与g蛋白和/或与gpcr结合,本文所述的结合结构域以更高的亲和力结合gpcr:g蛋白复合物。此外,本文所述的结合结构域增强了g蛋白对gpcr的亲和力。因此,本发明提供了针对和/或特异性结合包含gpcr和g蛋白的复合物的构象表位的结合结构域,所述结合结构域将复合物稳定或锁定在特定的构象状态,更具体而言是活性构象状态。

一般而言,本文所述的结合结构域可结合任何由gpcr和g蛋白的复合物可利用或可接近的构象表位。这些构象表位可以由包含在复合物中的单个蛋白质呈递,和/或仅在形成复合物时呈递。此外,这些构象表位可以或可以不由单个蛋白质单独呈递。根据一个特定的实施方案,本文所述的结合结构域特异性结合包含在复合物中的g蛋白,而不结合gpcr。

通常,g蛋白本质上是结合核苷酸的形式。更具体而言,g蛋白(或至少α亚基)结合gtp或gdp,这取决于特定gpcr的活化状态,如本文中另外描述的。结合gpcr的激动剂促进与结合了gdp的gαβγ异源三聚体相互作用,导致gα上的gdp交换为gtp和g蛋白功能性解离为gα-gtp和gβγ亚基,这是进一步的胞外信号传递所需的。在特定的实施方案中,本文所述的结合结构域在缺少核苷酸的条件下特异性结合gpcr:g蛋白复合物,并使其稳定,更具体的是,结合结构域结合和稳定这样的gpcr:g蛋白复合物,其中g蛋白处于不含核苷酸的形态。在特定的实施方案中,本文所述的结合结构域特异性结合位于所述g蛋白的α和β-γ亚基之间的界面上的构象表位,并由此阻断gdp/gtp结合位点,和干扰gdp/gtp结合。由此且令人惊讶的,本文所述的结合结构域在存在核苷酸(特别是鸟嘌呤核苷酸或其类似物,例如gtpγs)的条件下阻止或抑制gpcr:g蛋白复合物解离。本文所述的结合结构域还阻止或抑制核苷酸与g蛋白的结合。

优选的,本文所述的结合结构域针对和/或特异性结合包含gpcr、g蛋白和一个或多个受体配体的复合物。通常,受体配体是激动剂、或正变构调节剂、或其组合。

根据另一个优选的实施方案,本文所述的结合结构域针对和/或特异性结合包含gs蛋白偶联受体和gs蛋白的复合物;或包含gi蛋白偶联受体和gi蛋白的复合物;或包含gt蛋白偶联受体和gt蛋白的复合物;或包含ggust蛋白偶联受体和ggust蛋白的复合物;或包含gz蛋白偶联受体和gz蛋白的复合物;或包含golf蛋白偶联受体和golf蛋白的复合物;或包含gq蛋白偶联受体和gq蛋白的复合物;或包含g12偶联受体和g12蛋白的复合物;或包含g13偶联受体和g13蛋白的复合物。包含在复合物中的gpcr和/或g蛋白可来自相同或不同的物种,特别是来自哺乳动物物种。优选的,gpcr是人蛋白质。

一般而言,本发明的结合结构域可以是能够特异性结合gpcr:g蛋白复合物的任何非天然存在的分子或其部分。特别的是,本文所述的结合结构域是包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1)。

优选的,本文所述的结合结构域是源自骆驼科物种的免疫球蛋白单可变结构域,特别是纳米抗体或vhh。

根据特定的实施方案,本文所述的结合结构域是包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1),

并且其中cdr1选自:

a)seqidno:13-18,

b)与seqidno:13-18具有至少80%氨基酸同一性的多肽,

c)与seqidno:13-18具有3、2或1个氨基酸差异的多肽,

并且其中cdr2选自:

a)seqidno:25-30,

b)与seqidno:25-30具有至少80%氨基酸同一性的多肽,

c)与seqidno:25-30具有3、2或1个氨基酸差异的多肽,

并且其中cdr3选自:

a)seqidno:37-42,

b)与seqidno:37-42具有至少80%氨基酸同一性的多肽,

c)与seqidno:37-42具有3、2或1个氨基酸差异的多肽。

在特别优选的实施方案中,本发明提供了包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1);

其中cdr1是seqidno:13;其中cdr2是seqidno:25;且其中cdr3是seqidno:37。

根据非常特定的实施方案,结合结构域,特别是免疫球蛋白单可变结构域具有选自seqidno:1至6的氨基酸序列。

此外,本文描述的结合结构域还可以包含在多肽中。此外,结合结构域还可以固定在固体支持物上。

在一个特定的方面,本发明涉及针对和/或特异性结合g蛋白的结合结构域。

本发明的另一个方面设想了包含本文所述的结合结构域的复合物。复合物特别包含gpcr、g蛋白,和任选的受体配体。在某些应用中,本文所述的复合物是晶体。

本发明还提供了核酸序列,特别是编码任何本文所述结合结构域的任何氨基酸序列的核酸序列,以及包含任何本文所述核酸序列的重组载体。本发明的特别优选的方面是包含任何本文所述载体或核酸的细胞,所述细胞可以表达或能够表达gpcr和/或g蛋白。根据本发明的细胞的细胞培养物及其来源的膜制品也落入本发明的范围内。

本文描述的结合结构域、复合物和细胞可用于多种上下文和应用中。因此,本发明的一个方面相应的涉及本文所述的结合结构域的用途,用于使包含gpcr和g蛋白,和任选的受体配体的复合物稳定化,所述受体配体处于功能构象状态,更具体的处于活性构象状态。在一个特定的实施方案中,本文所述的结合结构域可用于阻止复合物在存在核苷酸的条件下解离,所述核苷酸特别是鸟嘌呤核苷酸或其类似物,如gtpγs。因此,作为工具稳定gpcr:g蛋白复合物和阻断功能构象状态(优选活性构象状态)的gpcr的结合结构域在一系列应用中是非常有效的,如下文概括的。

本发明的目标是使用本文所述的结合结构域使复合物结晶和/或解析复合物结构,所述复合物包含gpcr和g蛋白和任选的受体配体。

还认为落入本发明范围内的是使用本文所述的结合结构域,或本文所述的其来源的细胞或模制品,来筛选调控gpcr的信号传递活性的化合物。

此外,本文所述的结合结构域可用于捕获一个或多个相互作用的蛋白质,特别是与g蛋白和/或gpcr相互作用的蛋白质。

根据特定的实施方案,本发明提供了用于捕获和/或纯化包含gpcr和g蛋白的复合物的方法,方法包括步骤:

a)提供本文所述的结合结构域,和

b)允许结合结构域与包含gpcr和g蛋白,和任选受体配体的复合物结合,和

c)任选的分离步骤b)中形成的复合物。

在另一个特定的实施方案中,本发明涉及确定包含gpcr和g蛋白的复合物的晶体结构的方法,方法包括步骤:

a)提供本文所述的结合结构域,和

b)允许结合结构域与包含gpcr和g蛋白,和任选受体配体的复合物结合,和

c)使步骤b)中形成的复合物结晶。

一些本文所述的结合结构域可具有治疗用途。因此,本发明的目标还是使用本文所述的结合结构域调控gpcr受体信号传递,特别是g蛋白介导的gpcr受体信号传递。

本发明还涵盖了生产针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域的方法,方法包括步骤:

a)在合适的细胞表达系统中表达本文所述的核酸,和任选的

b)分离和/或纯化结合结构域。

本发明的另一个方面涉及筛选针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域的方法,方法包括步骤:

a)提供多个结合结构域,和

b)在所述多个结合结构域中,筛选与包含gpcr和g蛋白的复合物结合的结合结构域,和

c)分离与复合物结合的结合结构域。

根据本文的其他描述,本发明的其他目标也是显而易见的。

附图简述

图1:β2ar:gs复合物的g蛋白循环。a,与β2ar结合的胞外激动剂导致跨膜区段的细胞质端的构象重排,所述区段使gs异源三聚体(α、β和γ)结合受体(r、r*)。gdp是在形成r:g复合物时从α亚基释放的。gtp结合不含核苷酸的α亚基,导致α和βγ亚从受体解离。亚基调控其相应的效应子蛋白——腺苷酸环化酶(ac)和ca2+通道。在α亚基中的gtp水解为gdp后,自α和βγ亚基重新装配为gs异源三聚体。b,维持在去垢剂微团中的纯化的不含核苷酸的β2ar:gs蛋白质复合物。gsα亚基由2个结构域组成:ras结构域(αras)和α-螺旋状结构域(αah)。两个结构域都参与核苷酸结合。在不含核苷酸的状态下,相对于αras结构域,αah结构域具有可变的位置。

图2:形成稳定的β2ar:gs复合物。通过下述的组合效应:1)以非常缓慢的解离速率使高亲和力激动剂与受体结合(如rasmussen等人,2011所述):2)在存在腺苷三磷酸双磷酸酶的条件下,形成不含核苷酸的复合物,该酶水解释放的gdp,阻止它重新结合和导致较不稳定的r:g相互作用;和3)将ddm去垢剂交换为稳定复合物的mng-3,实现稳定的β2ar:gs复合物。

图3:核苷酸类似物、ph和纳米抗体对β2ar:gs复合物稳定性的效应。a)分析凝胶过滤显示了核苷酸gdp和gtpγs(0.1mm)导致β2ar-365:gs复合物的解离。b)模拟核苷酸磷酸基的磷酸盐——焦磷酸盐和三钠磷酸甲酸盐(forcarnet)(5mm使用)不导致复合物解构。作为添加剂,它们改善了两种t4l-β2ar:gs复合物(不含纳米抗体),t4l-β2ar:gs:nb37和t4l-β2ar:gs:nb35的晶体生长。c)确定ph上下限,指导结晶筛选的制备。出于相同的目的,使用各种浓度的nacl确定离子强度的效应(数据未显示)。复合物在20、100和500mm中是稳定的,而在2.5mnacl中解离。d)纳米抗体35(nb35,红色虚线)结合t4l-β2ar:gs:bi167107三元复合物(蓝色实线),形成r:g:nb35复合物(红色实线),与处理过的r:g复合物(绿色虚线)相反,r:g:nb35复合物对gtpγs处理不敏感(绿色实线)。nb35和nb37结合位于gs异源三聚体上的独立表位,形成r:g:nb35:nb37复合物(紫色实线)。e)纳米抗体36(nb36,红色虚线)结合r:g复合物(黑色实线),形成r:g:nb36复合物(红色实线),后者对gtpγs处理较不敏感(绿色实线)。nb36和nb37结合位于gs异源三聚体上的独立表位,形成r:g:nb36:nb37复合物(紫色实线)。f)纳米抗体37(nb37,绿线)结合r:g复合物(黑色实线),形成r:g:nb37复合物(红色实线)。g)r:g:nb37复合物对gtpγs处理较不敏感(蓝色实线),与处理过的r:g复合物相反(蓝色虚线)。

图4:mng-3对r:g复合物的稳定效应。a)在4℃孵育48hr后,对在ddm(黑色)、mng-3(蓝色)或2种mng-3类似物(红色和绿色)中纯化的β2ar-365:gs复合物进行分析凝胶过滤。与ddm相反,r:g复合物在mng去垢剂中是稳定的。b)通过3h-二氢阿普洛尔(3h-dha)饱和结合测定的,稀释未结合配体的纯化β2ar在低于去垢剂的临界微团浓度(cmc)的ddm或mng-3中的效应。20sec后,稀释维持在低于cmc1000倍的ddm中的β2ar导致丧失3h-dha结合(黑色数据点)。相反,24hr后,在稀释至低于cmc1000倍的mng-3中的β2ar仍保持了全部与放射性配体结合的能力。

图5:r:g复合物的纯度和均质性。a)在t4l-β2ar:g纯化的各个阶段获得的样品的分析性sds-page/考马斯蓝染色。在过量的异源三聚体中的bi167107激动剂结合的、去磷酸化的,和去糖基化的受体用于与g-蛋白的功能性部分的最佳偶联效率。通过与固定在m1树脂上的受体的相互作用,实现gs的功能纯化,同时洗去无功能/未结合的gs。b)4次连续预备的凝胶过滤之一的代表性洗脱曲线,红色指出了分级。在所示短划线内合并含有r:g复合物的级分,旋转浓缩,并分析纯度和均质性,通过sds-page/考马斯蓝(a,倒数第2道至右侧),在c)凝胶过滤,和通过d)阴离子交换层析。上图显示了在形成复合物前用λpp酶处理过的β2ar-365:gs复合物的分析性iec的洗脱曲线,与未脱磷酸化的复合物相比,获得异质的制品(下图)。在存在多种化学品的条件下(图1中的例子),使用b)中的所示虚线外侧的级分中的较不均质的材料进行r:g复合物的分析凝胶过滤实验。

图6:制备与nb35的r:g复合物的纯化过程的流程图。

图7:纯化nb35,和确定r:g:nb的混合比例。a)在镍亲和层析纯化纳米抗体35(nb35)后的预备离子交换层析。将作为小峰和均质大峰洗脱在两群中的纳米抗体(显示为红色)收集、旋转浓缩并且在如(b)所示确定与r:g复合物的适当混合比后,用于晶体学分析。b)基于蛋白质浓度,将激动剂结合的t4l-β2ar:gs复合物与略微过量的nb35混合(r:g复合物比nb35为1-1.2摩尔比),并通过分析性凝聚过滤验证所述混合物。

图8:海绵样中间相中的t4l-β2ar:gs:nb35复合物晶体。

图9:β2ar:gs复合物的整体结构。a)复合物的晶格堆积显示了晶体内受体和g蛋白的交替叠层。在含水层的蛋白之间形成了丰富的接触。b)不对称单元内容的整体结构显示β2ar(绿色)与激动剂(黄色球)结合,并参与和gsα(桔色)的广泛的相互作用。gαs以及gβ(青色)和gγ(紫色)构成了异源三聚体g蛋白gs。结合gs的纳米抗体(nb35,红色)在α和β亚基之间结合g蛋白。纳米抗体(nb35)促进结晶,与β2ar的氨基末端融合的t4溶菌酶(紫红色)也促进结晶。c)省略了结晶帮助的生物学复合物,显示了它在细胞膜中的位置和方向。

图10:在结合了bi-167107的t4l-β2ar:gs:nb35复合物的bi-167107中的nb35和gs的相互作用。a)对nb35(红色)的cdr1(填充表示)与gβ(填充表示,青色)的相互作用的两幅代表性图。b)对nb35(红色)的cdr3(填充表示)与gαs(填充表示,桔色)和gβ(填充表示,青色)的相互作用的两幅代表性图。通过与gαs和gβ相互作用,nb35可以降低复合物的构象柔性。c)对nb35(填充表示,红色)与gαs(桔色)的框架区的相互作用的两幅代表性图。

图11:nb35与相邻复合物的gαs亚基之间的晶体接触。涉及-x,y-1/2,-z+1对称的相关复合物(a)和x,y-1,z对称的相关复合物(b)的nb35(红色,填充表示)和gαs(桔色)的晶体接触。

图12:比较活性和失活的β2ar结构。a)与失活的结合卡拉洛尔(carazolol)的β2ar结构(蓝色;rosenbaum等人,2007)相比,β2ar:gs结构(绿色)的侧面图和胞质视图。对于tm5和tm6的胞内结构域可见显著的结构改变。如两种结构中的glu268的α-碳(黄色箭头)测量的,tm5延伸出两条螺旋转角,而tm6则向外移动了b)与纳米抗体-稳定的活性状态的β2ar:nb80结构(桔色,rasmussen等人,2011)比较的β2ar:gs。c)从胞质侧观察到的e/dry和npxxy基序中的残基位置,以及β2ar:gs和β2ar:nb80结构的其他关键残基位置。除了在β2ar:nb80结构中与纳米抗体相互作用的arg131外,所有残基都占据了非常相似的位置。

图13:r:g界面中的残基的电子密度图。a)tm3的胞质末端的d/ery基序。b)在e/dry基序的arg131和c末端gαs的tyr391之间的堆积相互作用。c)tm7的胞质末端的npxxy。d)thr68和tyr141与e/dry基序的asp130的相互作用。il2的phe139包埋在gαs的疏水口袋中。e)gαs的β1-α1环(p环)参与核苷酸结合。电子密度图是以1sigma勾画轮廓的2fo-fc图。

图14:受体:g蛋白相互作用。a,b)通过打开跨膜螺旋5和6,gαs的α5-螺旋进入了在受体胞内侧形成的空穴中。c)在跨膜核心中,相互作用主要是非极性的。一个例外涉及α5-螺旋的tyr391倚靠tm3的保守dry序列的arg131堆积(也参见图13)。arg131还倚靠tm7的保守npxxy序列的tyr堆积。d)由于存在α5螺旋,受体与tm5和tm3形成了极性相互作用的网络。e)受体残基thr68和asp130通过tyr141与β2ar的il2螺旋相互作用,摆放螺旋的位置,使得受体的phe139进入(dock)g蛋白表面的疏水口袋中,从而在结构上关联了受体-g蛋白与β2ar的高保守dry基序相互作用。

图15:gαs的构象改变。a)比较β2ar:gs复合物中的gαs(桔色)与结合gtpγs的gαs(灰色)(pdbid:1azt;sunahara等人,1997)。gtpγs显示为球形。相对于在结合gtpγs的状态下的位置,gαs的螺旋状结构域(gαsah)表现出剧烈的移位。b)旋转gαs的α5螺旋,将其替换为β2ar,干扰(perturb)β6-α5环,所述环另外形成gtpγs结合口袋的一部分。c)gαs的β1-α1环(p环)和β6-α5环分别与gtpγs-gαs结构中的gtpγs的磷酸和嘌呤环相互作用。d)在不含核苷酸的β2ar:gs结构中,β1-α1和β6-α5环被重排。

图16:nb37抑制gtpγs与gαs结合。孵育bodipy‐gtpγs(100nm)与1μm纯化的gαs,在存在递增浓度的nb37的条件下,实时测量的荧光增加。

图17:nb35不影响gtpγs与gαs结合。孵育bodipy‐gtpγs(100nm)与1μm纯化的gαs,在存在递增浓度的nb35的条件下,实时测量的荧光增加。

图18:nb35抑制gtpγs与gsαβγ异源三聚体结合。孵育bodipy‐gtpγs(100nm)与1μm纯化的gsαβγ异源三聚体,在存在递增浓度的nb35的条件下,实时测量的荧光增加。

图19:纯化稳定的avp:nt4lv2r:gs复合物。a)在flag标签亲和纯化后,使用ni-nta纯化avp:nt4lv2r:gs复合物的示意图。b)亲和纯化的avp:nt4lv2r:gs的sec色谱图。c)监控纯化方案的sds-page。道1:经过flag标签亲和柱的流过物;道2:纯化前的avp、nt4lv2r和gs的混合物;道3:分子标志物;道4:sec洗脱的avp:nt4lv2r:gs复合物;道5:flag-标签亲和纯化后的ni-nta后的avp:nt4lv2r:gs复合物。

图20:sec监控的avp:nt4lv2r:gs复合物的稳定性。短划线:冰上孵育24hr后,avp:nt4lv2r:gs复合物的sec色谱图。蓝线:冰上孵育48hr后,avp:nt4lv2r:gs复合物的sec色谱图。红线:用10μm拮抗剂sr121463孵育复合物后,avp:nt4lv2r:gs的sec色谱图。

发明详述

定义

本发明将就一些特定实施方案并参考附图进行描述,但本发明并不限于此,而仅受权利要求限制。权利要求中的任何提及表示都不应解释为限制范围。本文描述的附图仅是示意性而非限制性的。在附图中,为了举例说明目的,一些元素的尺寸可能被夸大,并非按比例绘制。当术语“包括/包含”在本说明书和权利要求中使用时,它不排除其他元素或步骤。在使用不定冠词或定冠词的地方,当提及单数名称例如“一个/一种”、“所述/该”时,除非另有具体说明,否则这涵盖该名词的复数形式。此外,在说明书和权利要求中的术语第一、第二、第三等用于区分相似元素,而不一定用于描述顺序或时间次序。应当理解,如此使用的术语在合适环境下是可互换的,并且本文描述的本发明的实施方案能够以与本文描述或举例说明不同的其他顺序操作。

除非本文中另外定义,否则本发明使用的科学和技术术语和词汇都应具有本领域普通技术人员通常理解的含义。一般而言,本文使用的命名法,和本文所述的分子和细胞生物学、遗传学和蛋白质和核酸化学和杂交的技术是本领域普遍已知和常规使用的。除非另外指出,否则一般根据本领域普遍已知的常规方法和本说明书全文引用和讨论的各种常见和更具体的参考文献所述,实施本发明的方法和技术。参见例如,sambrook等人,molecularcloning:alaboratorymanual,第2版,coldspringharborlaboratorypress,coldspringharbor,n.y.(1989):ausubel等人,currentprotocolsinmolecularbiology,greenepublishingassociates(1992,和2002年增刊)。

术语“结合结构域”或“蛋白质结合结构域”一般指任何能够使用特定的分子间相互作用,结合蛋白质或肽的非天然存在的分子,或其部分。多种分子可作为蛋白质结合结构域发挥作用,包括但不限于蛋白质性分子(蛋白质、肽、蛋白质样或含蛋白质的)、核酸分子(核酸、核酸样或含核酸的)和碳水化合物分子(碳水化合物、碳水化合物样、含碳水化合物的)。说明书中还可见更详细的描述。

术语“多肽”、“蛋白质”、“肽”在本文中可互换的使用,指任何长度的氨基酸的聚合形态,可包括编码的和非编码的氨基酸,化学或生物化学修饰的或衍生的氨基酸,和具有相似的肽骨架的多肽。

如本文中使用的,术语“蛋白质复合物”或简单的“复合物”指一类两条或多条相关的多肽链。蛋白质复合物中的蛋白质是通过非共价的蛋白质-蛋白质相互作用连接的。“四级结构”是蛋白质复合物中的相关折叠蛋白质的结构排列。可理解,复合物可以是包含2、3、4、5、6或更多个多肽的多聚复合物。复合物还可以额外的包含非蛋白质性分子。

如本文中使用的,术语“核酸分子”、“多核苷酸”、“多聚核酸”、“核酸”可互换的使用,指任何长度的核苷酸的聚合形态,不论是脱氧核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸可具有任何三维结构,可实施任何已知或未知的功能。多核苷酸的非限制例子包括基因、基因片段、外显子、内含子、信使rna(mrna)、转运rna、核糖体rna、核酶、cdna、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的dna、控制区、任何序列的分离的rna、核酸探针和引物。核酸分子可以是线性或环状的。

如本文中使用的,术语“配体”或“受体配体”意指胞内或胞外特异性结合gpcr的分子。在不是限制性目的的条件下,配体可以是蛋白质、(多)肽、脂类、小分子、蛋白质支架、抗体、抗体片段、核酸、碳水化合物。配体可以是合成的或天然存在的。术语“配体”包括“天然配体”,这是天然gpcr的内源性的、天然的配体。在绝大部分情况下,配体是与细胞表达的gpcr接触(例如结合)时,增加或减少胞内应答的“调节剂”。作为调节剂的配体例子包括激动剂、部分激动剂、逆激动剂和拮抗剂,说明书中还可见对其更详细的描述。

术语蛋白质的“构象”或“构象状态”一般指在任何瞬间,蛋白质可能采用的结构范围。本领域技术人员将认识到,构象或构象状态的决定因素包括反映在蛋白质的氨基酸序列(包括修饰的氨基酸)的蛋白质初级结构,和蛋白质周围的环境。蛋白质的构象或构象状态还涉及结构特征,如蛋白质二级结构(例如,α-螺旋、β-片层等)、三级结构(例如,多肽链的三维折叠)和四级结构(例如,多肽链与其他蛋白质亚基的相互作用)。对多肽链的翻译后修饰和其他修饰(如配体结合、磷酸化、硫酸化、糖基化或连接疏水基等)可影响蛋白质的构象。此外,环境因素(如周围溶液的ph、盐浓度、离子强度和重量摩尔渗透压浓度、与其他蛋白质和辅助因子的相互作用等)可影响蛋白质构象。可以通过针对活性或与另一种分子的结合的功能测定,或通过物理学方法(如x射线晶体学、nmr或自旋标记等),以及其它方法,确定蛋白质的构象状态。关于蛋白质构象和构象状态的一般讨论,可参考cantor和schimmel,biophysicalchemistry,parti:theconformationofbiological.macromolecules,.w.h.freemanandcompany,1980,和creighton,proteins:structuresandmolecularproperties,w.h.freemanandcompany,1993。“特定构象”或“特定构象状态”是蛋白质可采用的一系列构象或构象状态的任何子集。

如本文中使用的,“功能性构象”或“功能性构象状态”指这样的事实,即,蛋白质具有不同的构象状态,所述构象状态具有动态的活性范围,特别是从无活性至最大活性的范围。功能性构象状态的例子包括活性构象和失活构象。应明确,“功能性构象状态”意在覆盖gpcr的任何具有任何活性的构象状态,包括无活性;而并非意在覆盖蛋白质的变性状态。本文考虑的一类特殊的功能性构象是“可用于药物研发的构象”,一般指靶蛋白的独特的治疗相关的构象状态。作为示例,β2肾上腺素能受体的活性构象对应于该受体用于治疗哮喘的可用于药物研发的构象。因此,可理解,可用于药物研发的能力受到取决于治疗的适应症的特定构象的限制。

如本文中使用的,词语“锁定(locking)”或“捕捉(trapping)”或“固定(fixing)”或“冻结(freezing)”当涉及(本文定义的)gpcr的功能性构象状态时,指将gpcr保持或保留在其能够另外呈现的可能的构象子集中,这是由于gpcr:g蛋白复合物与根据本发明的结合结构域的相互作用的效应而产生的。相应的,如本文中使用的,“构象捕捉的”或“构象固定的”或“构象锁定的”或“构象冻结的”蛋白质是由于gpcr:g蛋白复合物与根据本发明的结合结构域的相互作用的效应,保持在其能够另外呈现的可能的构象子集中的蛋白质。在该上下文中,特异性或选择性结合蛋白质的特定构象或构象状态的结合结构域指这样的结合结构域,所述结合结构域与构象或构象状态子集中的蛋白质结合的亲和力比与所述蛋白质可呈现的其他构象或构象状态结合的亲和力更高。本领域技术人员将认识到特异性或选择性结合蛋白质的特定构象或构象状态的结合结构域将使该特定的构象或构象状态稳定。

如本文中使用的,在抗体上下文中的术语“互补决定区”或“cdr”指h(重)或l(轻)链的可变区(也分别缩写为vh和vl),含有能够特异性结合抗原性靶标的氨基酸序列。这些cdr区负责抗体对特定抗原决定子结构的基础特异性。这类区域也被称为“超变区”。cdr代表了可变区内不连续的氨基酸区段,而不论物种如何,发现重链和轻链可变区内的这些关键氨基酸序列的位置定位在可变链的氨基酸序列中具有相似的位置。所有规则抗体的可变重链和可变轻链都具有3个cdr区,对于各的轻链(l)和重链(h)而言,所述cdr彼此互不连续(被称为l1、l2、l3、h1、h2、h3)。特别的是,免疫球蛋白单可变结构域(如纳米抗体(如本文别处定义的))一般包括单条氨基酸链,其包含4个“框架序列或框架区”或fr(被称为fr1、fr2、fr3、fr4)和3个“互补决定区”或cdr(被称为cdr1、cdr2、cdr3),彼此不连续。cdr序列(以及fr序列)的描述是基于对v-结构域和v样结构域的imgt特有的编号系统(lefranc等人,2003)。

如本文中使用的,“表位”指多肽的抗原决定子。表位可包括对于表位而言独有的空间构象中的3个氨基酸。一般而言,表位由至少4、5、6、7个这类氨基酸组成,更常见的是由至少8、9、10个这类氨基酸组成。确定氨基酸的空间构象的方法是本领域已知的,包括例如x射线晶体学和多维核磁共振。

如本文中使用的,“构象表位”指包含空间构象中的氨基酸的表位,所述空间构象对于多肽的折叠3维构象是独一无二的。一般而言,构象表位由线性序列中不连续的氨基酸组成,这些氨基酸在蛋白质的折叠结构中聚集在一起。然而,构象表位还可以由采用多肽的折叠3维构象所特有(且不存在于变性状态中)的构象的氨基酸线性序列组成。在蛋白质复合物中,构象表位由一条或多条多肽的线性序列中的不连续的氨基酸组成,所述氨基酸在不同的折叠多肽折叠并在特有的四级结构中联结时聚集在一起。相似的,构象表位在本文中还可以由一条或多条多肽的氨基酸线性序列组成,所述氨基酸聚集在一起并采用了四级结构特有的构象。

如本文中使用的,术语“特异性”指结合结构域,特别是免疫球蛋白(如抗体)或免疫球蛋白片段(如纳米抗体)相对于不同的抗原,优先结合一种抗原的能力,不必然暗示了高亲和力(如本文中别处定义的)。可以特异性结合特定抗原或抗原决定子(例如,表位)和/或对特定抗原或抗原决定子(例如,表位)具有亲和力的结合结构域,特别是免疫球蛋白(如抗体)或免疫球蛋白片段(如纳米抗体)被称为“抗”或“针对”所述抗原或抗原决定子。如果对两种不同的抗原或抗原决定子都是特异性的,则根据本发明的结合结构域被称为与两种不同的抗原或抗原决定子是“交叉反应性的”。

如本文中使用的,术语“亲和力”指结合结构域,特别是免疫球蛋白(如抗体)或免疫球蛋白片段(如纳米抗体)结合抗原的程度,所述程度使抗原和结合结构域的平衡移向存在通过其结合而形成的复合物。因此,例如,当抗原和抗体(片段)以相对相等的浓度组合时,高亲和力的抗体(片段)将结合可利用的抗原,使平衡移向所得到的复合物的高浓度。解离常数(kd)通常用于描述在蛋白质结合结构域和抗原靶标之间的亲和力。通常,解离常数小于10-5m。优选的,解离常数小于10-6m,更优选的小于10-7m。最优选的,解离常数小于10-8m。

如本文中使用的,术语“特异性结合”或“特异的结合”一般指结合结构域,特别是免疫球蛋白(如抗体)或免疫球蛋白片段(如纳米抗体)优先结合存在于不同抗原的均质混合物中的特定抗原的能力。在某些实施方案中,特异性结合的相互作用将区分样品中想要的和不想要的抗原,在一些实施方案中大于约10至100倍或更多(例如,大于约1000或10,000倍)。

术语“特异性结合”、“选择性结合”、“优先结合”及其语法等价物在本文中可互换的使用。术语“构象特异性”或“构象选择性”在本文中也可互换的使用。

“缺失”在本文中定义为氨基酸或核苷酸序列的改变,其中相比亲代多肽或核酸的氨基酸序列或核苷酸序列,分别缺少了一个或多个氨基酸或核苷酸残基。在蛋白质或其片段的上下文中,缺失可涉及缺失约2、约5、约10个,多达约20、多达约30或多达约50个或更多个氨基酸。蛋白质或其片段可含有一个以上的缺失。在gpcr的上下文中,缺失可特别是环缺失,或n-和/或c-末端缺失。

“插入”或“添加”是氨基酸或核苷酸序列的这样的改变,即,相比亲代蛋白质的氨基酸序列或核苷酸序列,分别导致添加了一个或多个氨基酸或核苷酸残基。“插入”一般指在多肽的氨基酸序列中添加一个或多个氨基酸残基,而“添加”可以是插入,或指在n-或c-末端、或两端增加氨基酸残基。在蛋白质或其片段的上下文中,插入或添加通常是约1、约3、约5、约10个,多达约20、多达约30或多达约50个或更多个氨基酸。蛋白质或其片段可含有一个以上的插入。

如本文中使用的,“取代”是相比亲代蛋白质或其片段的氨基酸序列或核苷酸序列,一个或多个氨基酸或核苷酸分别被不同的氨基酸或核苷酸替换的结果。可理解,蛋白质或其片段可具有保守性氨基酸取代,其对蛋白质的活性基本没有影响。保守性取代是有意的组合,如gly、ala;val、ile、leu、met;asp、glu;asn、gln;ser、thr;lys、arg;cys、met;和phe、tyr、trp。

术语“序列同一性”在本文中用于指在比较窗口中,序列基于核苷酸-核苷酸或氨基酸-氨基酸的相同的程度。因此,“序列同一性百分比”如下计算的:通过在比较窗口比较两条最佳比对的序列,确定两条序列中存在的相同核酸碱基(例如,a、t、c、g、i)或相同氨基酸残基(例如,ala、pro、ser、thr、gly、val、leu、ile、phe、tyr、trp、lys、arg、his、asp、glu、asn、gln、cys和met)的位置数,获得匹配位置数,用匹配位置数除以比较窗口中的位置总数(即,窗口大小),将结果乘以100,生成序列同一性百分比。可以手工的确定序列同一性百分比,或利用本领域可得到的计算机程序。

如本文中使用的,“晶体”或“晶体状结构”指这样的固体材料,其组成原子、分子或离子以在伸展在所有的三维空间中的有序重复的模式排列。从液体或溶解在液体中的物质形成晶体状结构的过程通常被称为“结晶”或“晶体发生”。蛋白质晶体几乎只在溶液中生长。最常见的方法是逐渐降低其组分分子的溶解度。溶液中的晶体生长的特征是2个步骤:微观级微晶(可能仅具有100个分子)的成核,然后是所述微晶的生长,理想的生长为衍射-质量的晶体。

如本文中使用的,“x射线晶体学”是确定晶体内的原子排列的方法,其中一束x射线轰击晶体,并向多个特定方向衍射。根据这些衍射束的角度和强度,检晶器(crystallographer)可以产生晶体内的电子密度的三维图像。根据该电子密度,可以确定晶体内的原子的平均位置,及其化学键,其混乱和多种其他信息,如本领域技术人员已知的。

如本文中使用的,术语“原子坐标”指分子结构内的原子三维坐标组。在一个实施方案中,根据生物物理学领域的普遍技术人员普遍已知的方法,使用x射线晶体学获得原子坐标。简要的描述如下,可以通过从晶体衍射x射线,获得x射线衍射模式。衍射数据用于计算包含所述晶体的晶胞的电子密度图;所述图用于建立晶胞内的原子位置(即,原子坐标)。本领域技术人员可理解,通过x射线晶体学确定的结构坐标组含有标准差。在其他实施方案中,可以使用其他的实验生物物理学结构确定方法,获得原子坐标,所述方法可包括电子衍射(也称为电子晶体学)和核磁共振(nmr)方法。在其他实施方案中,可以使用分子建模工具获得原子坐标,所述工具可基于一种或多种的从头开始的蛋白质折叠算法、能量最小化和基于同源性的建模。这些技术是生物物理学和生物信息学领域的普遍技术人员普遍已知的。

“解析结构”在本文中用于指确定蛋白质的原子排列或原子坐标,通常是通过生物物理学方法进行的,如x射线晶体学。

术语“化合物”或“测试化合物”或“候选化合物”或“药物候选化合物”在本文中用于描述在测定中测试的任何天然存在的或合成的分子,所述测定如筛选测定或药物发现测定。同样地,这类化合物包括有机和无机的化合物。化合物包括特征是低分子量的多核苷酸、脂类或激素类似物。其他生物聚合的有机测试化合物包括包含约2至约40个氨基酸的小肽或肽样分子(肽模拟物),和包含约40至约500个氨基酸的较大的多肽,如抗体、抗体片段或抗体缀合物。测试化合物还可以是蛋白质支架。出于高通量的目的,可使用测试化合物文库,如提供充分多样性的组合文库或随机文库。例子包括但不限于天然化合物文库、变构化合物文库、肽文库、抗体片段文库、合成的化合物文库、基于片段的文库、噬菌体展示文库等。更详细的描述可见于说明书的其它部分。

如本文中使用的,术语“确定”、“测量”、“评估”、“监控”和“测定”在本文中可互换的使用,包括定量和定性的确定。

术语“生物学活性”涉及gpcr时指具有天然存在的gpcr的生物化学功能(例如,结合功能、信号转导功能或由于配体结合的改变构象的能力)的gpcr。

如本文中使用的,术语“治疗有效量”、“治疗有效剂量”和“有效量”意指实现理想结果所需的量。

如本文中使用的,术语“可药用的”意指不是生物学或其他方式不理想的材料,即所述材料可以与化合物一起施用给个体,而不导致任何不理想的生物学效应或与包含其的药物组合物中的任何其他组分以有害的方式相互作用。

发明详述

尽管可以激活gpcr的配体极其多样,但它们只与相对少数的胞内蛋白质相互作用,诱导深奥的生理学变化。异源三聚体g蛋白、β-抑制蛋白和gpcr激酶在其活化状态特异性识别gpcr的能力是普遍已知的,但从结构和功能的观点出发则对其理解有限。因此,令人惊讶且有利的是,鉴别了特异性结合gpcr:g蛋白复合物并能够将复合物稳定或锁定在功能性构象状态(特别是活化构象状态的)结合结构域。此外,结合结构域是用于稳定和捕获处于结合g蛋白状态中的想要的gpcr的一般性工具,这类gpcr一般被认为代表gpcr的活性状态(如本文定义)。

因此,本发明的第一个方面涉及针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域。

本发明的结合结构域可以是任何能够特异性结合包含gpcr和g蛋白的复合物的非天然存在的分子或其部分(如上文定义)。根据优选的实施方案,本文所述的结合结构域是蛋白质支架。术语“蛋白质支架”一般指形成结构的折叠单元,特别是蛋白质或肽结构,其包括用于结合另一种分子,例如蛋白质,的框架(参见例如,skerra(2000),综述)。结合结构域可源自天然存在的分子,例如源自先天性或适应性免疫系统的组分,或者可以完全是人为设计的。结合结构域可以是基于免疫球蛋白的,或者可以基于蛋白质中存在的结构域,包括但不限于微生物蛋白质、蛋白酶抑制剂、毒素、纤连蛋白、脂笼蛋白、单链反平行卷曲螺旋蛋白或重复基序蛋白。本领域已知的结合结构域的例子包括但不限于:抗体、重链抗体(hcab)、单结构域抗体(sdab)、微抗体(minibody)、源自骆驼重链抗体的可变结构域(vhh或纳米抗体)、源自鲨鱼抗体的新抗原受体的可变结构域(vnar)、alphabody、蛋白a、蛋白g、设计的锚蛋白重复结构域(darpin)、iii型纤连蛋白重复、anticalin、knottin、改造的ch2结构域(纳米抗体)、肽和蛋白质、脂肽(例如,pepducin)、dna和rna(参见例如,gebauer&skerra,2009;skerra,2000;starovasnik等人,1997;binz等人,2004;koide等人,1998;dimitrov,2009;nygren等人,2008;wo2010066740)。通常,当使用选择方法生成特定类型的结合结构域时,使用包含共同序列或框架序列的组合文库筛选与目标分子(如蛋白质)的结合,所述共同序列或框架序列含有随机的、潜在的相互作用残基。

本发明的结合结构域可以针对和/或特异性结合任何选定的gpcr:g蛋白复合物。优选的靶复合物是天然存在的gpcr和g蛋白的复合物,或可选的在例如gpcr和g蛋白的非天然存在的变体(本文另外所述)的情况下,是这样的复合物,其中的gpcr和g蛋白将在恰当的生理条件下关联。本领域技术人员可理解,gpcr和g蛋白之间的结构关系决定了是否可以形成特定的gpcr:g蛋白复合物,这将在下文关于g蛋白家族成员和gpcr家族成员中进一步详述。

“g蛋白”意指鸟嘌呤核苷酸结合蛋白的家族,该家族参与将化学信号传递到细胞外,并且导致细胞内的改变。g蛋白是配体与gpcr的胞外结构域结合后,胞内信号转导的关键分子组分。它们也被称为“异源三聚体g蛋白”或“大型g蛋白”。g蛋白由3个亚基组成:α、β和γ,其分类大部分基于不同α亚基的同一性和后续转导事件的性质。g蛋白的其他分类来自cdna序列同源性分析。g蛋白结合鸟苷二磷酸(gdp)或鸟苷三磷酸(gtp),具有高同源性的鸟嘌呤核苷酸结合结构域和用于与受体和效应子相互作用的不同结构域。不同的gα蛋白亚类(如gαs、gαi、gαq和gα12等)通过不同的通路传递信号,所述通路涉及第二信使分子,如camp、肌醇三磷酸(ip3)、二酰甘油、胞内ca2+和rhoagtp酶。为了进一步示例,α亚基(39-46kda)含有鸟嘌呤核苷酸结合位点,具有gtp酶活性;β(37kda)和γ(8kda)亚基紧密关联,并作为βγ异二聚体发挥功能。目前描述,有23种类型的α亚基(包括一些剪接同种型)、6种β亚基和11种γ亚基。g蛋白和亚基的类型是下标的:因此,例如,gs蛋白的α亚基(其活化腺苷酸环化酶)是gsα;其他g蛋白包括gi,其结构上不同于gs(不同的α亚基类型)并抑制腺苷酸环化酶。表1提供了其他实施例。

通常,g蛋白本质上是结合核苷酸的类型。更具体而言,根据特定gpcr的激活状态,g蛋白(至少α亚基)结合gtp或gdp。结合gpcr的激动剂促进与gdp结合的gαβγ异源三聚体的相互作用,导致gα上的gdp交换为gtp,和g蛋白功能上解离为gα-gtp和gβγ亚基。分离的gα-gtp和gβγ亚基可以独立或平行的调节下游的细胞效应子(通道、激酶或其他酶,参见表1)。gγ的内在gtp酶活性导致gtp水解为gdp,和gα-gdp与gβγ亚基重新关联,和信号传递的终止。因此,g蛋白作为调控分子开关发挥作用,能够通过α和βγ亚基效应触发分叉(bifurcating)信号。开关通过受体开启,再在数秒内自身关闭,所述时间足以显著放大信号转导。

如本文中使用的,“g蛋白偶联受体”或“gpcr”是享有共同结构基序的多肽,具有7个在22至24个疏水氨基酸之间的区域,所述区域形成7个α螺旋,每个螺旋跨越细胞膜。通过编号鉴别每个跨越,即,跨膜-1(tm1)、跨膜-2(tm2)等。还通过在细胞膜外部或“胞外”侧的跨膜-2和跨膜-3、跨膜-4和跨膜-5,以及跨膜-6和跨膜-7之间的氨基酸区域连接跨膜螺旋,所述区域分别被称为“胞外”区1、2和3(ec1、ec2和ec3)。还通过在细胞膜内部或“胞内”侧的跨膜-1和跨膜-2、跨膜-3和跨膜-4、以及跨膜-5和跨膜-6之间的氨基酸区域连接跨膜螺旋,所述区域分别被称为“胞内”区1、2和3(ic1、ic2和ic3)。受体的“羧基”(“c”)末端位于细胞内的胞内空间,受体的“氨基”(“n”)末端位于细胞外的胞外空间。任何上述区域都可以通过分析gpcr的一级氨基酸序列来方便的鉴别。

gpcr结构和分类是本领域普遍已知的,关于gpcr的其他讨论可见于probst等人,1992;marchese等人,1994;&2008;rosenbaum等人,2009;和下列书籍:wiley-liss出版的jurgenwess(编著)structure-functionanalysisofgprotein-coupledreceptors(第1版;1999年10月15日);johnwiley&sons出版的kevinr.lynch(编著)identificationandexpressionofgprotein-coupledreceptors(1998年3月);和crcpress出版的tatsuyahaga(编著),gprotein-coupledreceptors(1999年9月24日);和academicpress出版的stevewatson(编著)g-proteinlinkedreceptorfactsbook(第1版;1994)。可以根据序列同源性,将gpcr分为若干不同家族的类型。虽然所有的gpcr具有相似的7次跨膜α-螺旋的结构,该受体类型中的不同家族彼此没有表现出任何序列同源性,因此提示其跨膜结构域结构的相似性可定义共同的功能需求。当可获得人基因组的第一份草图时,则可能对gpcr储库进行全面理解。fredriksson及其同事将802个人gpcr基于系统发生规则分类。这显示绝大部分人gpcr可见于五大主要家族,被称为视紫红质、黏附素(adhesion)、分泌素(secretin)、谷氨酸型(glutamate)、frizzled/taste2(fredriksson等人,2003)。

视紫红质家族的成员(对应于a类(kolakowski,1994)或原分类体系中的1类(foord等人(2005))仅具有小的胞外环,并且配体与跨膜豁口(cleft)中的残基发生相互作用。这是迄今为止最大的一类(占>90%的gpcr),含有气味物、小分子(如儿茶酚胺和胺)、(神经)肽和糖蛋白激素的受体。视紫红质是该家族的代表物质,是第一个结构被解析的gpcr(palczewski等人,2000)。第一个结构被解析的与扩散型配体相互作用的受体——β2-ar(rosenbaum等人,2007)也属于该家族。基于系统发生的分析,b类gpcr或2类(foord等人,2005)受体最近被细分为2个家族:黏附素和分泌素(fredriksson等人,2003)。黏附素和分泌素受体的特征是参与配体结合的、相对较长的氨基末端胞外结构域。关于跨膜结构域的方向所知甚少,但该方向很可能与视紫红质的方向迥异。这类gpcr的配体是激素,如胰高血糖素、分泌素、促性腺激素释放激素和甲状旁腺激素。谷氨酸家族受体(c类或3类受体)也具有大的胞外结构域,发挥与“捕蝇草(venusflytrap)”类似的功能,因为其打开并且将所结合的激动剂关闭在内。家族成员是代谢型谷氨酸、ca2+-敏感型和γ-氨基丁酸(gaba)-b受体。

gpcr包括但不限于血清素嗅觉受体、糖蛋白激素受体、趋化因子受体、腺苷受体、生物胺受体、黑皮质素受体、神经肽受体、趋化性受体、促生长素抑制素受体、阿片样物质受体、褪黑激素受体、降钙素受体、pth/pthrp受体、胰高血糖素受体、分泌素受体、黑寡妇蜘蛛毒素受体、代谢型谷氨酸受体、钙受体、gaba-b受体、信息素受体、蛋白酶活化型受体、视紫红质和其他与g蛋白偶联的7次跨膜区段受体。gpcr还包括这类彼此关联作为同源或异源二聚体或作为更高阶的寡聚体的gpcr受体。gpcr的氨基酸序列(及编码其的cdna的核苷酸序列)是可以方便获得的,例如参考genbank(http://www.ncbi.nlm.nih.gov/entrez)。

因此,根据特定的实施方案,本发明提供了针对和/或特异性结合gpcr:g蛋白复合物的结合结构域,其中g蛋白选自gs、gi、go、gt、ggust、gz、golf、gq、g12和g13。在一个优选的实施方案中,g蛋白是gs。在另一个优选的实施方案中,g蛋白是gi。在仍然另一个优选的实施方案中,g蛋白是gt,更具体的是转导素(transducin)。与其对应的是,包含在复合物中的gpcr选自gs偶联受体、gi偶联受体、go偶联受体、gt偶联受体、ggust偶联受体、golf偶联受体、gq偶联受体、g12偶联受体和g13偶联受体。在一个优选的实施方案中,gpcr是gs偶联受体。在另一个优选的实施方案中,gpcr是gi偶联受体。在仍然另一个优选的实施方案中,gpcr是gt偶联受体,更具体的是视紫红质。表1提供了特定的非限制性例子。

表1.g蛋白偶联受体和信号传递通路的关系的非限制性例子。

一般而言,对本领域技术人员显而易见的是,本发明的结合结构域至少结合从生物学和/或治疗的观点来看最相关的那些gpcr:g蛋白复合物类型。因此可理解,根据目的和应用,包含在靶复合物中的gpcr和g蛋白可以是天然存在的或非天然存在的(即,人为改变的)。如本文中使用的,术语“天然存在的”意指天然生产的gpcr或g蛋白。特别的是,gpcr和g蛋白的野生型多态变体和同种型,以及不同物种的直向同源物是天然存在的蛋白的例子,可见于例如而不限于哺乳动物中,更具体的是在人中,或病毒中,或植物中,或昆虫中等。因此,这类gpcr或g蛋白是自然界中可见的。如本文中使用的,术语“非天然存在的”意指gpcr或g蛋白不是天然存在的。在某些环境下,有利的是包含在复合物中的gpcr和/或g蛋白是非天然存在的蛋白。例如,仅出于示例的目的,为了增加获得通过本发明的结合结构域稳定的gpcr:g蛋白复合物的晶体的可能性,理想的是实施一些蛋白质改造,不影响或仅最低限度的影响配体结合亲和力。或可选的或额外的,为了增加gpcr和/或g蛋白的细胞表达水平,或增加稳定性,还可以考虑在目标gpcr和/或g蛋白中导入某些突变。非天然存在的gpcr的非限制例子包括但不限于相对于其氨基酸或核苷酸序列,通过突变而使其组成型活化的gpcr、具有环缺失的gpcr、具有n-和/或c-末端缺失的gpcr、相对于其氨基酸或核苷酸序列具有取代、插入或添加,或其任意组合的gpcr,或天然存在的gpcr的其他变体。类似的,非天然存在的g蛋白的非限制例子包括但不限于具有n-和/或c-末端缺失的g蛋白、相对于其氨基酸或核苷酸序列具有取代、插入或添加或其任意组合的g蛋白,或天然存在的g蛋白的其他变体。本发明范围内还包括了靶gpcr:g蛋白复合物,所述复合物包含嵌合的或杂交的gpcr,例如具有一种gpcr的n-和/或c-末端和第二种gpcr的环的嵌合gpcr,或包含与某部分(如t4溶菌酶)融合的gpcr(还参见实施例部分)。

根据本发明范围内的特定实施方案,包含在gpcr:g蛋白复合物中的非天然存在的gpcr或g蛋白可具有与天然存在的gpcr或g蛋白至少80%相同,至少90%相同,至少95%相同,至少97%相同,或至少99%相同的氨基酸序列。为了进一步示例,以β2-肾上腺素能受体作为本发明范围内的gpcr的特定的非限制性例子,根据上文应该明显的是除了人β2肾上腺素能受体(例如,genbank登录号np_000015描述的序列)外,还涵盖了小鼠β2肾上腺素能受体(例如,genbank登录号nm007420描述的序列)或其他哺乳动物的β2肾上腺素能受体。还考虑了特定物种的β2肾上腺素能受体的野生型多态变体和某些其他的活性变体。例如,“人β2肾上腺素能受体”具有与genbank登录号np_000015的天然存在的“人β2肾上腺素能受体”至少80%相同,至少90%相同,至少95%相同,至少97%相同,或至少99%相同的氨基酸序列。类似的,并且以gαs、gαi和gαt作为本发明范围内的g蛋白亚基的特定的非限制性例子,根据上文应该明显的是除了人gαs或gαi或gαt外,还涵盖了小鼠gαs或gαi或gαt蛋白质,或其他哺乳动物的gαs或gαi或gαt蛋白质。还考虑了特定物种的gαs或gαi或gαt的野生型多态变体和某些其他的活性变体。例如,“人gαs”或“人gαi”或“人gαt”分别具有与genbank登录号p63092、p63096和p11488的天然存在的“人gαs”或“人gαi”或“人gαt”至少80%相同,至少90%相同,至少95%相同,至少97%相同,或至少99%相同的氨基酸序列。此外,存在许多g蛋白亚基的同种型,包括例如gs和gi蛋白的同种型(gαs:gnas;gα0:gnao1;gαi:gnai1或gnai2或gnai3;gβ:gnb1或gnb2或gnb3或gnb4或gnb5或gnb1l或gnb2l;gγ:gngt1或gngt2或gng2或gng3或gng4或gng5或gng7或gng8或gng10或gng11或gng12或gng13;根据人基因的hgnc标准化命名;不同生物体的不同同种型的登录号可获得自www.uniprot.org)。表5提供了g蛋白亚基的同种型的一些特定例子。本领域技术人员可以理解,在不同物种和生物体之间的不同g蛋白亚基的氨基酸序列几乎是100%相同,即使不是100%,也是保守的。值得注意的是,g蛋白的人、牛、大鼠和小鼠β亚基的氨基酸序列的序列比对揭示了这些生物体之间的氨基酸序列是100%保守的。类似的,g蛋白的人、小鼠和牛γ亚基的氨基酸序列是100%相同的。大鼠和小鼠的gαs氨基酸序列也是100%相同的,而人和牛的gαs仅分别有1或2个氨基酸不同。因此,预期针对和/或特异性结合gpcr:g蛋白复合物,特别是结合包含在复合物中的g蛋白,的结合结构域是交叉反应的。还明显的是,包含在靶复合物中的gpcr和g蛋白可以来自相同或不同的物种。优选的,gpcr和/或g蛋白是哺乳动物的蛋白质,或植物蛋白质,或微生物蛋白质,或病毒蛋白质,或昆虫蛋白质。更优选的,gpcr是人蛋白质。

还预期本发明的结合结构域一般能够结合这样的gpcr:g蛋白复合物,所述复合物中包含在复合物中包含的特定gpcr和/或g蛋白的所有天然存在的或合成的类似物、变体、突变体、等位基因、部分、片段和同种型;或至少结合复合物中包含的含有一个或多个这样的抗原决定子或表位的特定gpcr和/或g蛋白的那些类似物、变体、突变体、等位基因、部分、片段和同种型,所述抗原决定子或表位与本发明的结合结构域结合包含在复合物中的特定gpcr和/或g蛋白结合的抗原决定子或表位基本相同。

可使用各种方法确定在结合结构域和靶gpcr:g蛋白复合物之间的特异性结合(如上文定义),包括例如,酶联免疫吸附测定(elisa)、表面等离振子共振测定、噬菌体展示等,都是本领域的常规实践活动,例如在sambrook等人,(2001),molecularcloning,alaboratorymanual.第3版,coldspringharborlaboratorypress,coldspringharbor,ny中予以讨论,并在实施例章节中进一步示例。出于该目的,可以理解通常将使用独特的标记或标签,如肽标记、核酸标记、化学物标记、荧光标记或放射频率标签,如本文进一步所述。

根据特定的实施方案,相比分别仅与g蛋白和/或仅与gpcr结合,针对gpcr:g蛋白复合物的结合结构域以更高的亲和力结合复合物。在一个实施方案中,针对gpcr:g蛋白复合物的结合结构域特异性结合包含在复合物中的gpcr,而不结合g蛋白。优选的,在另一个实施方案中,针对gpcr:g蛋白复合物的结合结构域特异性结合包含在复合物中的g蛋白,而不结合gpcr。更具体而言,针对gpcr:g蛋白复合物的结合结构域特异性结合包含在gs偶联受体和gs蛋白的复合物中的为gs蛋白的g蛋白。

普遍已知的是,gpcr是结构复杂的膜蛋白,其响应天然的和合成的配体,而表现出一系列功能行为。在自然界中,结合了配体的gpcr可以与g蛋白关联成复合物,所述复合物呈现出特定的功能性构象状态,更具体而言是活性构象状态,导致特定的生物学活性。本发明提供了特殊的优势在于本文描述的结合结构域可以稳定与g蛋白复合并与多种天然或合成的配体结合的gpcr的多种这类活性构象。本领域技术人员将认识到,特异性结合配体:gpcr:g蛋白复合物的结合结构域可稳定包含在复合物中的gpcr的特定构象。在优选的实施方案中,结合结构域能够稳定或者增加gpcr:g蛋白复合物的特定功能性构象状态的稳定性,优选其中gpcr处于活性构象状态。一般而言,所述gpcr的功能性构象状态可以是基础构象状态,或活性构象状态或失活构象状态。优选的,本发明的结合结构域能够使gpcr稳定在其活性构象状态和/或能够在结合gpcr:g蛋白复合物时,将gpcr锁定在活性构象状态,不论是否存在受体配体。

在本发明的特别优选的实施方案中,考虑了结合结构域针对和/或特异性结合包含gpcr、g蛋白和受体配体(如本文定义)的复合物。更优选的,结合结构域针对和/或特异性结合由gpcr、g蛋白和受体配体组成的复合物。受体配体可以是小化合物、肽、抗体或抗体片段等,其在结合时触发应答。本文定义的受体配体,或仅仅配体,可以是orthosteric配体(天然的和合成的),其结合受体活性位点,并根据其功效或换言之根据其通过特定通路对受体信号传递的效应而分类。如本文中使用的,“激动剂”指通过结合受体,而增加受体的信号传递活性的配体。完全激动剂能够最大限度的刺激受体;部分激动剂即使在饱和浓度下也不能引发完全活性。部分激动剂还可以通过阻止结合更强力的激动剂,而作为“阻断剂(blocker)”发挥功能。“拮抗剂”指结合受体而不刺激任何活性的配体。“拮抗剂”还被称为“阻断剂”,因其阻止其他配体结合的能力并且因此阻断激动剂诱导的活性。此外,“反向激动剂”指除了阻断激动剂效应外,还使受体的基础活性或组成活性降低至低于未结合配体的受体的拮抗剂。优选的,本发明的结合结构域针对和/或特异性结合包含gpcr、g蛋白和受体配体的复合物,其中受体配体是激动剂。更具体而言,激动剂在orthosteric位点结合受体。

gpcr的信号传递活性(及其构象行为)也可以受结合另一种被称为变构调节剂的配体的影响。“变构调节剂(regulator)”或“变构调控剂(modulator)”或“效应子分子”结合在gpcr的变构位点(即,物理上不同于蛋白质活性位点的调节剂位点)。与orthosteric配体相反,变构调控剂是非竞争性的,因为它们在不同的位点结合受体,并且即使也结合内源性配体,也可修饰受体功能。因此,变构调控剂不限于像绝大部分药物那样简单的开启或关闭受体。反而更类似二聚体开关发挥作用,提供对活化或去活化的强度的控制,同时通过改变受体与其(内源性)配体的亲和力,允许机体保留其对触发受体活化的天然控制。增强蛋白质活性的变构调节剂在本文中被称为“变构激活剂”或“正变构调控剂”,而减少蛋白质活性的变构调节剂在本文中被称为“变构抑制剂”或“负变构调控剂”。因此,在一个特定的实施方案中,本发明的结合结构域针对和/或特异性结合包含gpcr、g蛋白和受体配体的复合物,其中受体配体是变构调控剂,优选正变构调控剂。更具体而言,正变构调控剂在变构位点结合受体。

如所述,gpcr如何调控细胞生理学的经典观点是:配体(如激素、神经递质或感觉刺激素)的结合稳定了受体的活性构象状态,从而允许与异源三聚体g蛋白相互作用。除了与g蛋白相互作用外,结合了激动剂的gpcr关联gpcr激酶(grk),导致受体磷酸化。grk使gpcr磷酸化的普遍结果是减少gpcr与g蛋白的相互作用,和增加gpcr与抑制蛋白的相互作用,其在空间上限制了其他的g蛋白信号传递,导致受体脱敏。由于β-抑制蛋白关闭了g蛋白信号,因此可以同时触发第二组平行的信号级联,如mapk通路。gpcr还与一般的gpcr-相互作用蛋白家族外的多种蛋白质(g蛋白、grk、抑制蛋白和其他受体)相互作用。这些gpcr-选择性伙伴蛋白可以介导gpcr信号传递、通过g蛋白组织gpcr信号传递、指导gpcr运输、锚定gpcr至特别是亚细胞区域,和/或影响gpcr药理学(ritter和hall2009)。就此而言,本文使用的配体还可以是具有选择性刺激一小类受体的信号传递活性的能力的“偏向性(biased)配体”,例如选择性激活g蛋白或β-抑制蛋白功能。这类配体也被称为“偏向性配体”、“偏向性激动剂”或“功能上的选择性激动剂”。更特别的是,配体偏向性可以是不完善的偏向性,其特征是配体刺激多种受体活性,所述受体活性对不同的信号具有不同的相对功效(非绝对选择性);或者配体偏向性可以是完善的偏向性,其特征是配体刺激一种受体活性,而对另一种已知的受体活性没有任何刺激作用。因此,在一个特定的实施方案中,本发明的结合结构域针对和/或特异性结合包含gpcr、g蛋白和受体配体的复合物,其中受体配体是偏向性配体。

此外,根据本发明的优选的实施方案,特别考虑了本发明的针对和/或特异性结合gpcr:g蛋白复合物的结合结构域,如上文所述,源自先天性或适应性免疫系统。优选的,所述结合结构域源自免疫球蛋白。优选的,根据本发明的结合结构域是抗体或抗体片段。术语“抗体”(ab)一般指由免疫球蛋白基因或其功能片段编码的多肽,其特异性结合和识别抗原,并且是本领域技术人员已知的。常规的免疫球蛋白(抗体)结构单元包括四聚体。每个四聚体都包含两个相同的多肽链对,每对具有一条“轻链”(约25kda)和一条“重链”(约50-70kda)。每条链的n-末端定义了约100至110个或更多个氨基酸的可变区,其主要负责抗原识别。术语可变轻链(vl)和可变重链(vh)分别指这些轻链和重链。术语“抗体”意在包括完整的抗体,包括完整的单链抗体,和抗原结合片段。在一些实施方案中,抗原结合片段可以是结合抗原的抗体片段,包括但不限于fab、fab'和f(ab')2、fd、单链fv(scfv)、单链抗体、二硫键连接的fv(dsfv),和包含vl或vh结构域的片段,或由vl或vh结构域组成的片段,和任意上述的组合,或能够结合靶抗原的免疫球蛋白肽的任何其他功能部分。术语“抗体”还意在包括重链抗体,或其功能片段,如单结构域抗体,更具体而言,免疫球蛋白单可变结构域,如vhh或纳米抗体,如本文别处定义。

优选的,本发明的结合结构域是免疫球蛋白单可变结构域。更优选的,所述结合结构域是包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3),优选根据下列通式(1):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1)

,或其任何合适的片段(通常含有形成至少一个互补决定区的至少一些氨基酸残基)。

包含4个fr和3个cdr的结合结构域是本领域技术人员已知的,并作为非限制性例子描述在wesolowski等人(2009,med.microbiol.immunol.198:157)中。免疫球蛋白单可变结构域的典型但非限制性的例子包括通常源自常规的四链抗体的轻链可变结构域序列(例如,vl结构域序列)或重链可变结构域序列(例如,vh结构域序列)。优选的,免疫球蛋白单可变结构域源自骆驼抗体,优选源自不含轻链的重链骆驼抗体,被称为vhh结构域序列或纳米抗体(如本文另外所述)。

如本文中使用的,术语“纳米抗体”(nb)指源自天然存在的重链抗体的最小抗原结合片段或单可变结构域(vhh),是本领域技术人员已知的。它们源自骆驼中可见的仅含重链的抗体(hamers-casterman等人,1993;desmyter等人,1996)。在“骆驼”科中,发现了不含轻链多肽的免疫球蛋白。“骆驼”包括旧世界骆驼(双峰驼(camelusbactrianus)和单峰驼(camelusdromedarius))和新世界骆驼(例如羊驼(lamapaccos)、家羊驼(lamaglama)、原驼(lamaguanicoe)和小羊驼(lamavicugna))。所述单可变结构域重链抗体在本文中被称为纳米抗体或vhh抗体。nanobodytm和nanobodiestm是ablynxnv(比利时)的商标。nb的小尺寸和独特的生物物理学特性使其在识别不常见的或隐藏表位时,和结合到蛋白质靶的空穴或活性位点中时,优于常规抗体片段。此外,可以将nb设计为多特异性和/或多价的抗体,或与报告子分子连接(conrath等人,2001)。nb是稳定且僵硬的单结构域蛋白质,可以方便的生产和在胃肠系统中存活。因此,nb可用于多种用途,包括药物发现和治疗(saerens等人,2008),也可作为多用途和宝贵的工具,用于蛋白质的纯化、功能研究和结晶化(conrath等人,2009)。作为结晶化分子伴侣结合天然靶的构象表位发挥作用的特定类型的纳米抗体被称为xaperone,是本文特别考虑的。xaperone是结构生物学中的独特工具。xaperonetm是vib和vub(比利时)的商标。使用骆驼抗体片段作为结晶辅助手段的主要优点是xaperone(1)结合隐蔽表位和使蛋白质锁定为独特的天然构象,(2)增加可溶性蛋白质和增溶性膜蛋白的稳定性,(3)降低可溶性蛋白质和增溶性膜蛋白的构象复杂程度,(4)增加极性表面,使其能够生长衍射晶体,(5)隔离凝聚或多聚化的表面,(6)允许亲和力捕获活性蛋白质。

因此,本发明的免疫球蛋白单可变结构域,特别是本发明的纳米抗体,一般包括单条氨基酸链,所述氨基酸链通常包含根据通式(1)的4个“框架序列”或fr和3个“互补决定区”或cdr:

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1)。

术语“互补决定区”或“cdr”指免疫球蛋白单可变结构域中的可变区,含有能够特异性结合抗原靶的氨基酸序列。这些cdr区负责纳米抗体对特定抗原决定子结构的基础特异性。这类区域也被称为“超变区”。免疫球蛋白单可变结构域具有3个cdr区,彼此互不连续(称为cdr1、cdr2、cdr3)。应该明确的是,免疫球蛋白单可变结构域的框架区也可能对与其抗原的结合作出贡献(desmyter等人2002;korotkov等人,2009)。本文中描述了根据本发明的这类免疫球蛋白单可变结构域的非限制性例子以及fr和cdr的特定组合(参见表2-3)。cdr序列(以及fr序列)的描述是基于imgt关于v-结构域和v样结构域的特有编号体系的(lefranc等人,2003)。可选的,可以通过使用kabat编号体系描述fr和cdr序列,如用于riechmann和muyldermans(2000)文章中的骆驼vhh结构域的体系。如本领域技术人员已知的,免疫球蛋白单可变结构域,特别是纳米抗体的特征尤其可以是在一条或多条框架序列中,存在一个或多个骆驼科印记(hallmark)残基(根据kabat编号体系),例如wo08/020079的第75页,表a-3中所述(其通过引用整合到本文中)。

在优选的实施方案中,本发明提供了含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列选自基本由4个框架区(分别是fr1至fr4)和3个互补决定区(分别是cdr1至cdr3)组成的氨基酸序列,其中所述氨基酸序列的cdr序列与seqidno:1-6,优选seqidno:1和/或4的免疫球蛋白单可变结构域的至少一条cdr序列(参见表3)具有至少70%氨基酸同一性,优选至少80%氨基酸同一性,更优选至少90%氨基酸同一性,如至少95%,至少96%,至少97%,至少98%,至少99%或者甚至100%氨基酸同一性。可理解,对于确定免疫球蛋白单可变结构域的一条或多条序列的cdr的氨基酸序列的氨基酸同一性的程度,忽略来自框架区的氨基酸残基。seqidno:1-6,优选seqidno:1和/或seqidno:4中给出了本发明的免疫球蛋白单可变结构域的一些优选但非限制性的例子(参见表2)。

应注意,本发明的免疫球蛋白单可变结构域,特别是纳米抗体就其最广的含义而言不限于特定的生物学来源或特定的制备方法。例如,一般可以如下获得本发明的免疫球蛋白单可变结构域,特别是纳米抗体:(1)分离天然存在的重链抗体的vhh结构域;(2)表达编码天然存在的vhh结构域的核苷酸序列;(3)使天然存在的vhh结构域“人源化”或表达编码此类人源化vhh结构域的核酸;(4)使来自任何动物物种(并且特别是来自哺乳动物物种,例如来自人)的天然存在的vh结构域“骆驼化”,或表达编码此类骆驼化vh结构域的核酸,;(5)如本领域所述使“结构域抗体”或“dab”“骆驼化”或表达编码这类骆驼化vh结构域的核酸;(6)使用合成或半合成技术,制备蛋白质、多肽或其他本身已知的氨基酸序列;(7)使用本身已知的核酸合成技术,再表达所获得的核酸,制备编码纳米抗体的核酸;和/或(8)一种或多种上述技术的任意组合。

一类优选的免疫球蛋白单可变结构域对应于天然存在的针对gpcr和g蛋白的靶复合物的重链抗体的vhh结构域。虽然免疫球蛋白单可变结构域的原始文库(library)或合成文库可含有针对靶复合物的构象结合物(binder),但本发明的优选实施方案包括用靶复合物免疫骆驼科,使动物的免疫系统暴露在复合物特有的构象表位下。可以用相互作用单体的混合物免疫动物。任选的,可以通过化学交联或添加稳定复合物的协作/变构配体/代谢物(orthosteric激动剂、变构活化剂、ca++、atp……),来稳定复合物。还可以通过共价修饰(磷酸化……)复合物的成员(之一),使复合物稳定。在可选的实施方案中,还可以用gpcr和/或g蛋白单独(因此彼此不复合)免疫骆驼。任选的,还可以通过例如添加稳定gpcr和/或g蛋白的协作/变构配体/代谢物(orthosteric激动剂、变构活化剂、ca++、atp等),来稳定gpcr和/或g蛋白。

因此,一般可以通过用包含gpcr和g蛋白的靶复合物,或用一种或两种其组成成员蛋白,适当的免疫骆驼物种(即,使得提高免疫应答和/或针对靶复合物的重链抗体),从所述骆驼获得合适的生物学样品(如血样,或任何b细胞样品),和使用本身已知的任何合适的技术,从所述样品起始生成针对靶复合物的vhh序列,来生成或获得这类vhh序列。这类技术对本领域技术人员是显而易见的。可选的,可以从骆驼vhh序列的原始文库中获得这类天然存在的vhh结构域,例如通过使用一种或多种本身已知的筛选技术,用靶复合物或其至少一个部分、片段、抗原决定子或表位筛选这类文库。这类文库和技术描述在例如wo9937681、wo0190190、wo03025020和wo03035694中。可选的,可以使用源自原始vhh文库的改良的合成或半合成文库,如通过技术例如随机诱变和/或cdr改组从原始vhh文库中获得的vhh文库,如wo0043507中所述。用于获得针对靶的vhh序列的另一种技术涉及使用本身已知的任何合适的技术,适当的免疫能够表达重链抗体的转基因哺乳动物(即,从而提高针对靶的免疫应答和/或重链抗体),从所述转基因哺乳动物获得合适的生物学样品(如血样,或任何b细胞样品),然后从所述样品开始生成针对靶的vhh序列。例如,出于该目的,可以使用表达重链抗体的小鼠,和wo02085945和wo04049794中描述的其他方法和技术。

本发明的特别优选的免疫球蛋白单可变结构域类型,特别是本发明的纳米抗体的特别优选的类型,包括具有与天然存在的vhh结构域的氨基酸序列对应的氨基酸序列的免疫球蛋白单可变结构域,但所述氨基酸序列已经过“人源化”,即,用存在于人的常规4链抗体的vh结构域的相应位置上的一个或多个氨基酸残基取代了所述天然存在的vhh序列(特别是框架序列中)的氨基酸序列中的一个或多个氨基酸残基。可以以本身已知的方式实施,这对本领域技术人员是显而易见的,例如基于本文和现有技术关于本文所述人源化作用的进一步描述。此外,应该注意本发明的这类人源化免疫球蛋白单可变结构域是可以通过任何本身已知的合适方式获得的(即,如上文(1)-(8)点所示),因此,不严格限于使用包含天然存在的vhh结构域的多肽作为起始材料获得的多肽。人源化免疫球蛋白单可变结构域,特别是纳米抗体可具有若干优点,如比相应的天然存在的vhh结构域降低的免疫原性。这类人源化作用一般涉及用存在于人vh结构域(如人vh3结构域)的相同位置上的氨基酸残基取代天然存在的vhh序列中的一个或多个氨基酸残基。应该选择这样的人源化取代,使获得的人源化免疫球蛋白单可变结构域仍然保留本文定义的免疫球蛋白单可变结构域的有利特性。本领域技术人员能够选择人源化取代或人源化取代的合适组合,所述取代或取代组合使一方面人源化取代提供的有利特性与另一方面天然存在的vhh结构域的有利特性之间的平衡最优化,或者实现了理想或合适的平衡。

本发明的免疫球蛋白单可变结构域,特别是本发明的纳米抗体的另一个特别优选的类型包括具有这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列与天然存在的vh结构域的氨基酸序列对应,但已经被“骆驼化”,即,用存在于重链抗体的vhh结构域的相应位置上的一个或多个氨基酸残基取代了常规4链抗体的天然存在的vh结构域的氨基酸序列中的一个或多个氨基酸残基。这类“骆驼化”取代优选插入到形成vh-vl界面的氨基酸位置和/或存在于vh-vl界面中的氨基酸位置,和/或位于所谓的骆驼科的印记残基的氨基酸位置,如本文定义的(参见例如wo9404678)。优选的,用作生成或设计骆驼化纳米抗体的起始材料或起点的vh序列优选是哺乳动物的vh序列,更优选是人的vh序列,如vh3序列。然而,应注意本发明的这类骆驼化免疫球蛋白单可变结构域是可以通过任何本身已知的合适方式获得的(即,如上文(1)-(8)点所示),因此,不严格限于使用包含天然存在的vh结构域的多肽作为起始材料获得的多肽。

例如,可以如下实施“人源化”和“骆驼化”:分别提供编码天然存在的vhh结构域或vh结构域的核苷酸序列,然后以本身已知的方式改变所述核苷酸序列中的一个或多个密码子,使新的核苷酸序列分别编码本发明的“人源化的”或“骆驼化的”免疫球蛋白单可变结构域。然后,可以以本身已知的方式表达该核酸,从而提供理想的本发明的免疫球蛋白单可变结构域。可选的,分别基于天然存在的vhh结构域或vh结构域的氨基酸序列,可以设计本发明的理想的人源化或骆驼化免疫球蛋白单可变结构域的氨基酸序列,然后使用本身已知的肽合成技术从头合成它们。还可分别基于天然存在的vhh结构域或vh结构域的氨基酸序列或核苷酸序列来设计编码本发明的理想的人源化或骆驼化免疫球蛋白单可变结构域的核苷酸序列,然后使用本身已知的核酸合成技术从头合成所述核苷酸序列,之后以本身已知的方式表达因此获得的核酸,从而提供理想的本发明的免疫球蛋白单可变结构域。用于从天然存在的vh序列,或优选从vhh序列获得本发明的免疫球蛋白单可变结构域和/或其编码核酸的其他合适的方法和技术对本领域技术人员是显而易见的,可以例如包括以合适的方式组合一个或多个天然存在的vh序列(如一个或多个fr序列和/或cdr序列)的一个或多个部分,一个或多个天然存在的vhh序列(如一个或多个fr序列和/或cdr序列)的一个或多个部分,和/或一个或多个合成或半合成的序列,从而提供理想的本发明的纳米抗体或其编码核苷酸序列或核酸。

还位于本发明范围内的是如本文定义的本发明的免疫球蛋白单可变结构域,特别是纳米抗体,的天然的或合成的类似物、突变体、变体、等位基因、部分或片段(在本文中统称“变体”),特别是seqidno:1-6的免疫球蛋白单可变结构域的变体(参见表2-3)。因此,根据本发明的一个实施方案,术语“本发明的免疫球蛋白单可变结构域”或“本发明的纳米抗体”就其最广的含义还覆盖了上述变体。一般而言,相比本文定义的本发明的免疫球蛋白单可变结构域,这类变体中已取代、缺失和/或添加了一个或多个氨基酸残基。这类取代、插入或缺失可在一个或多个fr和/或一个或多个cdr中进行,特别是seqidno:1-6的免疫球蛋白单可变结构域的fr和cdr的变体(参见表2-3)。如本文中使用的,变体是这样的序列,其中每个或任何一个框架区、每个或任何一个互补决定区都与参照序列的相应区域表现出至少80%同一性,优选至少85%同一性,更优选90%同一性,甚至更优选95%同一性,或者甚至更优选99%同一性(即,fr1_变体与fr1_参照物、cdr1_变体与cdr1_参照物、fr2_变体与fr2_参照物、cdr2_变体与cdr2_参照物、fr3_变体与fr3_参照物、cdr3_变体与cdr3_参照物、fr4_变体与fr4_参照物),如可以利用算法,如pileup和blast电子测量的(50,51)。用于实施blast分析的软件是可以通过美国国立生物技术信息中心公开获得的(http://www/ncbi.nlm.nih.gov/)。可以理解,为了确定免疫球蛋白单可变结构域的一条或多条序列的cdr的氨基酸序列的氨基酸同一性程度,忽略了形成框架区的氨基酸残基。类似的,为了确定本发明的免疫球蛋白单可变结构域的一条或多条序列的fr的氨基酸序列的氨基酸同一性程度,忽略了形成互补区的氨基酸残基。免疫球蛋白单可变结构域的这类变体可以是特别有利的,因为其具有改善的效价/亲和力。

作为非限制性例子,取代可以是例如保守性取代(如本文所述)和/或氨基酸残基被天然存在于另一种vhh结构域的相同位置上的另一种氨基酸残基取代。因此,本发明的范围内包括了任何一个或多个这样的取代、缺失或插入,或其任意的组合,所述取代、缺失或插入或其组合改善了本发明的免疫球蛋白单可变结构域的特性,或至少不过分减弱本发明的纳米抗体的所需特性或所需特性的平衡或组合(即所述免疫球蛋白单可变结构域不再适用于其预期的用途)。本领域技术人员一般能够基于本文公开的内容,任选的在有限程度的常规实验后,确定和选择合适的取代、缺失或插入,或其合适的组合,所述常规实验可涉及例如导入有限数量的可能取代和确定其对所获得的免疫球蛋白单可变结构域的特性的影响。

根据特别优选的实施方案,本发明的免疫球蛋白单可变结构域,特别是纳米抗体的变体可以在1、2或3个cdr中具有1、2或3个氨基酸的取代、缺失或插入,更具体的是在(i)cdr1或cdr2或cdr3;(ii)cdr1和cdr2,或cdr1和cdr3,或cdr2和cdr3;(iii)cdr1和cdr2和cdr3中具有1、2或3个氨基酸的取代、缺失或插入,所述cdr的氨基酸序列列于表3中。更优选的,本发明的免疫球蛋白单可变结构域,特别是纳米抗体的变体可以在1、2或3个cdr中具有1、2或3个氨基酸的保守性取代(如本文定义),更具体的是在表3列举的cdr的氨基酸序列的(i)cdr1或cdr2或cdr3;(ii)cdr1和cdr2,或cdr1和cdr3,或cdr2和cdr3;(iii)cdr1和cdr2和cdr3中具有1、2或3个氨基酸的保守性取代。

根据特定的实施方案,发明提供了包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3),根据下列通式(1):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1);

并且其中cdr1选自:

a)seqidno:13-18,

b)与seqidno:13-18具有至少80%氨基酸同一性的多肽,

c)与seqidno:13-18具有3、2或1个氨基酸差异的多肽,

并且其中cdr2选自:

a)seqidno:25-30,

b)与seqidno:25-30具有至少80%氨基酸同一性的多肽,

c)与seqidno:25-30具有3、2或1个氨基酸差异的多肽,

并且其中cdr3选自:

a)seqidno:37-42,

b)与seqidno:37-42具有至少80%氨基酸同一性的多肽,

c)与seqidno:37-42具有3、2或1个氨基酸差异的多肽。

在特别优选的实施方案中,本发明提供了包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3),根据下列通式(1):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1):

其中cdr1是seqidno:13;其中cdr2是seqidno:25;且其中cdr3是seqidno:37。

此外,根据用于表达本发明的结合结构域,特别是免疫球蛋白单可变结构域的宿主生物,可以这样设计缺失和/或取代,使得去除了一个或多个用于翻译后修饰的位点(如一个或多个糖基化位点),这是本领域技术人员能力范围内的。可选的,可以这样设计取代或插入,使得导入一个或多个用于连接官能团,例如允许位点特异性聚乙二醇化,的位点(如本文所述)。

修饰的例子、以及本发明的结合结构域,特别是免疫球蛋白单可变结构域中可以被修饰的氨基酸残基的例子(即,在蛋白质骨架上,优选在侧链上)、可用于导入这类修饰的方法和技术,和这类修饰的潜在用途和优点,对本领域技术人员是显而易见的。例如,这类修饰可涉及向本发明的结合结构域,特别是免疫球蛋白单可变结构域,之中或其上导入(例如,通过共价连接或另一种合适的方式)一个或多个官能团、残基或部分,特别是赋予本发明的结合结构域一种或多种想要的特性或功能的一个或多个官能团、残基或部分。这类官能团和用于导入它们的技术的例子对本领域技术人员是显而易见的,一般可包括本领域中提及的所有官能团和技术,以及本身已知用于修饰药物蛋白质,特别是用于修饰抗体或抗体片段(包括scfv和单结构域抗体)的官能团和技术,例如参考remington的pharmaceuticalsciences,第16版,mackpublishingco.,easton,pa(1980)。这类官能团可以例如与本发明的结合结构域,特别是免疫球蛋白单可变结构域直接(例如共价的)连接,或任选的通过合适的接头或间隔子连接,这对于本领域技术人员仍然是显而易见的。一种最常用的用于增加药物蛋白质的半衰期和/或降低其免疫原性的技术包括连接合适的可药用的聚合物,如聚(乙二醇)(peg)或其衍生物(如甲氧基聚(乙二醇)或mpeg)。一般而言,可以属于任何合适的聚乙二醇化形式,如本领域中用于抗体和抗体片段的聚乙二醇化(包括但不限于(单)结构域抗体和scfv);参考例如chapman,nat.biotechnol.,54,531-545(2002);veronese和harris,adv.drug.deliv.rev.54,453-456(2003);harris和chess,nat.rev.drug.discov.,2,(2003)和wo04060965。用于蛋白质聚乙二醇化的各种试剂也是可商购,例如从nektartherapeutics,usa。优选使用定点聚乙二醇化,特别是通过半胱氨酸残基(参见例如yang等人,proteinengineering,16,10,761-770(2003))。例如,出于该目的,可以将peg连接到天然存在于本发明的免疫球蛋白单可变结构域中的半胱氨酸残基上,可以修饰本发明的免疫球蛋白单可变结构域从而适当的导入一个或多个用于连接peg的半胱氨酸残基,或可以融合包含一个或多个用于连接peg的半胱氨酸残基的氨基酸序列至本发明的纳米抗体的n-和/或c-末端,上述所有都使用技术人员本身已知的蛋白质改造技术。优选的,对于本发明的免疫球蛋白单可变结构域,可以使用分子量大于5000,如大于10,000且小于200,000,如小于100,000的peg;例如分子量范围是20,000-80,000。另外,通常较不优选的修饰包括n-连接或o-连接糖基化,通常作为共翻译和/或翻译后修饰的一部分,这取决于用于表达本发明的结合结构域,特别是免疫球蛋白单可变结构域的宿主细胞。用于增加结合结构域的半衰期的另一个技术包括改造为双功能结合结构域(例如,针对靶gpcr:g蛋白复合物的一个免疫球蛋白单可变结构域和针对血清蛋白质如白蛋白的一个),或改造成结合结构域,特别是免疫球蛋白单可变结构域与肽(例如,针对血清蛋白质(如白蛋白)的肽)的融合物。

另一种修饰可包括导入一个或多个可检测的标记或其他生成信号的基团或部分,取决于被标记的结合结构域的预期用途。合适的标记和用于连接、使用和检测标记的技术是本领域技术人员显而易见的,例如包括但不限于荧光标记(如荧光素、异硫氰酸盐、罗丹明、藻红蛋白、藻蓝蛋白、别藻蓝蛋白、邻苯二醛和荧光胺,和荧光金属,如eu,或其他镧系元素系列的金属)、发磷光标记、化学发光标记或生物发光标记(如鲁米诺(luminal)、异氨基苯二酰肼、theromaticacridiniumester、咪唑、吖啶盐、草酸酯、二氧杂环丁烷或gfp,及其类似物)、放射性同位素、金属、金属螯合物或金属阳离子,或其他特别适合在体内、体外或原位诊断和成像使用的金属或金属阳离子,以及生色团和酶(如苹果酸脱氢酶、葡萄球菌核酸酶、δ-v-类固醇异构酶、酵母醇脱氢酶、α-甘油磷酸脱氢酶、磷酸丙糖异构酶、生物素-亲和素过氧化物酶、辣根过氧化物酶、碱性磷酸酶、天冬酰胺酶、葡萄糖氧化酶、β-半乳糖苷酶、核糖核酸酶、脲酶、过氧化氢酶、葡萄糖-vi-磷酸脱氢酶、葡糖淀粉酶和乙酰胆碱酯酶)。其他合适的标记对本领域技术人员是显而易见的,例如包括可以使用nmr或esr光谱检测的部分。这类标记的本发明的结合结构域可用于例如体外、体内或原位测定(包括本身已知的免疫测定,如elisa、ria、eia和其他“夹心测定”等)以及体内诊断和成像目的,取决于特定标记的选择。对本领域技术人员显而易见的是,另一种修饰可涉及导入螯合基团,例如螯合一种或多种上述金属或金属阳离子。例如,合适的螯合基包括但不限于二乙烯三胺五乙酸(dtpa)或乙二胺四乙酸(edta)。另一种修饰可包括导入作为特定结合对的一部分的官能团,如生物素-(链霉)抗生物素结合对。这类官能团可用于连接本发明的结合结构域与另一种与结合对的另一半结合的蛋白质、多肽或化学化合物,即,通过形成结合对。例如,本发明的免疫球蛋白单可变结构域可以与生物素缀合,并与另一种与抗生物素蛋白或链霉抗生物素缀合的蛋白质、多肽、化合物或载体连接。例如,这类缀合的免疫球蛋白单可变结构域可用作报告子,例如在将可检测的信号生成剂与抗生物素蛋白或链霉抗生物素缀合的诊断系统中。这类结合对还可以用于例如将本发明的免疫球蛋白单可变结构域与载体结合,包括适合制药目的的载体。一个非限制性例子是cao和suresh,journalofdrugtargetting,8,4,257(2000)描述的脂质体制剂。这类结合对还可以用于连接治疗活性剂与本发明的结合结构域。

本发明范围内还涵盖了处于“多价”形态的本发明的结合结构域,特别是本发明的免疫球蛋白单可变结构域,所述结构域是通过化学的或重组dna技术将两个或多个单价免疫球蛋白单可变结构域键合在一起而形成的。多价构建体的非限制性例子包括“二价”构建体、“三价”构建体、“四价”构建体等。包含在多价构建体中的免疫球蛋白单可变结构域可以是相同或不同的。在另一个特定的实施方案中,本发明的免疫球蛋白单可变结构域处于“多特异性”形态,是通过将两个或多个免疫球蛋白单可变结构域键合在一起而形成的,其中至少一个具有不同的特异性。多特异性构建体的非限制性例子包括“双特异性”构建体、“三特异性”构建体、“四特异性”构建体等。为了进一步示例,本发明的任何多价或多特异性的(如本文定义)免疫球蛋白单可变结构域都可合适的针对相同抗原上的两种或多种不同的表位,例如针对包含在gpcr:g蛋白复合物中的g蛋白的两个或多个不同的部分;或者可以针对两种或多种不同的抗原,例如针对gpcr的表位和g蛋白的表位。特别的是,本发明的单价免疫球蛋白单可变结构域是这样的,即其以小于500nm,优选小于200nm,更优选小于10nm,如小于500pm的亲和力结合靶gpcr:g蛋白复合物(如本文所述)的。本发明的多价或多特异性的免疫球蛋白单可变结构域还可对想要的gpcr:g蛋白复合物具有(或被改造和/或被选择为)增加的亲合力和/或改善的选择性,和/或通过使用这类多价或多特异性的免疫球蛋白单可变结构域可获得的任何其他理想的特性或理想特性的组合。

此外,本发明的结合结构域,特别是本发明的免疫球蛋白单可变结构域一般可针对或特异性结合任何构象表位,所述表位由包含gpcr和g蛋白的复合物所呈现,或有所述复合物所接触,或是所述复合物的一部分。特异性结合“三维”表位或“构象”表位的结合结构域是特异性结合折叠的蛋白质或蛋白质复合物的三级或四级结构的结合结构域。这类结合结构域以明显降低的(即,降低至至少2、5、10、50或100分之一)亲和力结合线性(即,未折叠的、变性的)多肽链。此类结合结构域所结合的结构通常含有在蛋白质(复合物)的线性序列中不连续的氨基酸。换言之,这类结合结构域与多肽的结合依赖于折叠成特定三维构象的多肽。应该明确的是,本发明的结合结构域选择性识别的构象表位可以是gpcr特异性表位,或g蛋白特异性表位,或者gpcr:g蛋白复合物-特异性表位,其仅在关联组分蛋白时并且因此通过组合所述gpcr和所述g蛋白的氨基酸残基而形成。在一个实施方案中,本发明的结合结构域,特别是免疫球蛋白单可变结构域,特异性结合任何理想g蛋白或其部分的任何构象表位。在另一个实施方案中,所述构象表位可以是任何所需gpcr的胞内或胞外区的一部分,或膜内区,或结构域或环状结构。明显的是,在非关联形态的gpcr和/或g蛋白中,一些这类构象表位是可接触的,而其他构象表位则仅在形成复合物时可接触。根据一个特定的实施方案,本发明的结合结构域,特别是免疫球蛋白单可变结构域,特异性结合位于g蛋白的α和β亚基之间的界面上的构象表位,如本文别处的非限制性例子所述(参见实施例章节)。

根据其他特定的实施方案,结合结构域结合这样的gpcr:g蛋白复合物,其中g蛋白处于其不含核苷酸的形态。根据其他特定的实施方案,本发明的结合结构域,特别是免疫球蛋白单可变结构域,在存在核苷酸(特别是鸟嘌呤核苷酸(如gdp或gtp),或其类似物,如不可水解的gtp类似物(如gtpγs)),或与氟化铝或氟化铍组合的gdp,或者在最小核苷酸类似物(如焦磷酸盐或forcarnet)的条件下,抑制或阻止gpcr:g蛋白复合物的解离。在缺少本发明的结合结构域的条件下,gpcr:g蛋白复合物通常在存在这些核苷酸的条件下解离。

根据一个特定的方面,本发明还提供了针对或特异性结合g蛋白(即,仅g蛋白,不与gpcr复合)的结合结构域。在特定的实施方案中,本文所述的结合结构域针对和/或特异性结合gs蛋白。根据该方面特定的实施方案,本发明的结合结构域阻止或抑制核苷酸(特别是鸟嘌呤核苷酸或类似物(如上文所述))与g蛋白结合。或者本发明的结合结构域还能够替代g蛋白中的鸟嘌呤核苷酸或类似物。实施例章节中提供了测定的非限制性例子,用于确定对鸟嘌呤核苷酸与蛋白质的结合的抑制程度或对蛋白质的鸟嘌呤核苷酸的替代程度,例如实施例3和8。此外,可以理解所有涉及本发明的结合结构域的特定实施方案(如上文所述)也适用于本发明的这一特定方面。

gpcr的功能多样性与导致构象谱的这些蛋白质的柔性内在关联。构象能量景观(energylandscape)与这样的因素内在相关,如存在结合的配体(效应子分子、激动剂、拮抗剂、逆向激动剂……)、脂类环境或结合相互作用的蛋白质。因此,在一个实施方案中,本发明的结合结构域,特别是免疫球蛋白单可变结构域增加了包含gpcr和g蛋白的复合物在结合所述结合结构域时的稳定性。在其他实施方案中,本发明的结合结构域结合任何下述构象表位,诱导形成gpcr的功能性构象状态,特别是所述gpcr的活性构象状态,所述构象表位由包含gpcr:g蛋白复合物呈现,或可接近所述复合物,或者是所述复合物的一部分。更具体而言,本发明的结合结构域能够通过增加g蛋白对受体的亲和力,稳定包含在gpcr:g蛋白复合物中的gpcr的活性状态。同样的,本发明的结合结构域能够稳定结合了激动剂的gpcr:g蛋白复合物和/或增强激动剂对gpcr:g蛋白复合物的亲和力。优选的,通过kd的减少所测量的,结合结构域能够增加g蛋白对gpcr的亲和力,和/或激动剂对gpcr:g蛋白复合物的亲和力至少2倍、至少5倍,更优选至少10倍。可选的,在任何比较存在复合物稳定的结合结构域的条件与缺少该结合结构域的条件下的受体和g蛋白的相互作用强度的测定设置中,或者任何其他本领域技术人员已知的亲和力或效价测量中,结合结构域能够诱导ec50或ic50改变至少2倍、至少5倍,更优选至少10倍。

如本文中使用的,术语“功能性构象状态”指这样的事实,即,蛋白质,特别是膜蛋白(如gpcr)具有多种具动态活性范围的不同构象状态,特别是从无活性至最大活性(参见kobilka和deupi,2007的综述)。应该明确的是“功能性构象状态”并非意在覆盖蛋白质的变性状态。例如,基础构象状态可定义为在缺少配体时,受体的低能量状态。蛋白质经历转变成为另一种构象状态的可能性是两种状态之间的能量差异和两种状态之间的能量壁垒高度的函数。在受体蛋白质(如gpcr)的情况下,配体结合的能量可用于改变两种状态之间的能量壁垒,或用于改变两种状态之间的相对能量水平,或同时。能量壁垒的改变影响两种状态之间的转换速率,而能量水平的改变影响受体在两种状态中的平衡分布。结合激动剂或部分激动剂可降低能量壁垒和/或降低更高活性构象状态相对于失活构象状态的能量。反向激动剂可增加能量壁垒和/或降低失活构象状态相对于活性构象状态的能量。偶联受体与其g蛋白可进一步改变能量景观。在配体结合测定中观察到的β2ar和gs的协作相互作用形成了gpcr活化的三元复合物模型的基础(delean等人,1980)。在由激动剂、受体和g蛋白组成的三元复合物中,受体对激动剂的亲和力增强,g蛋白对鸟嘌呤核苷酸的特异性改变,相比gdp更偏爱gtp。

应该注意到,整合膜蛋白(包括gpcr)的活性还受膜中的围绕它们的脂分子结构的影响。膜蛋白不是僵硬的实体,而是变形以确保与周围脂双层良好的疏水性匹配。一个重要的参数是脂双层的疏水厚度,由脂类的脂肪酰链长度定义。此外,在定义位于脂类头部基团区域中的膜蛋白的那些部分的结构时,脂类头部基团区域的结构也可能是重要的。在其他脂类中,棕榈酰基化和gpcr结合胆固醇在单体受体中也发挥了结构性作用,并对受体寡聚物的形成/稳定作出贡献(lee2004;chini和parenti2009)。

本发明的另一个方面涉及包含本发明的结合结构域的复合物。更具体而言,提供了包含本发明的结合结构域、gpcr、g蛋白和任选的受体配体的复合物。作为非限制性例子,可通过凝胶过滤纯化稳定的复合物,如对含有纳米抗体、gpcr、g蛋白和受体配体的四级复合物的所进行的操作那样进行的(参见实施例章节)。在特定的实施方案中,复合物可以是结晶的。相应的,还提供了复合物的晶体,以及制备所述晶体的方法,更详细的描述在本文别处。

在另一个方面,编码本发明的任何结合结构域,特别是免疫球蛋白单可变结构域,的氨基酸序列的核酸序列也是本发明的一部分,表4中提供了非限制性的例子。根据优选的实施方案,本发明涉及本发明的结合结构域,特别是免疫球蛋白单可变结构域的核酸序列,其中序列与seqidno:49-54的结合结构域的至少一条核酸序列的序列具有大于80%,优选大于90%,更优选大于95%,如99%或更高的序列同一性(如本文定义)(参见表4)。为了计算百分比序列同一性,应该忽略标签(例如,his标签或epea标签)的核酸序列。此外,核酸序列中可包含本文所述的核酸序列。

此外,本发明还考虑了包含编码本发明的任何结合结构域,特别是免疫球蛋白单可变结构域的核酸序列的表达载体,以及表达这类表达载体的宿主细胞。合适的表达系统包括细菌或酵母的组成型和诱导型的表达系统、病毒表达系统(如杆状病毒、塞姆利基森林病毒和慢病毒),或在昆虫或哺乳动物细胞中瞬时转染。可以根据本领域技术人员已知的技术,克隆、表达和/或纯化本发明的结合结构域,特别是免疫球蛋白单可变结构域。

因此,本发明涵盖了表达本发明的结合结构域,特别是免疫球蛋白单可变结构域的细胞或细胞培养物,所述结构域针对和/或能够特异性结合包含gpcr和g蛋白的复合物。根据本发明的细胞可以是任何原核或真核生物。优选的,细胞是内源性或重组表达目标gpcr和/或g蛋白的真核细胞,例如酵母细胞或昆虫细胞,或培养细胞系,例如哺乳动物细胞系,优选人细胞系。使用的细胞的本质通常取决于生产天然蛋白质的容易程度和成本、所需的糖基化特性、靶蛋白的来源、预期用途,或其任意组合。用于蛋白质生产的真核细胞或细胞系是本领域普遍已知的,包括具有修饰的糖基化通路的细胞系,下文提供了非限制性例子。

适合容纳、表达和生产用于后续分离和/或纯化的蛋白质的动物或哺乳动物宿主细胞包括中华仓鼠卵巢细胞(cho),如cho-k1(atccccl-61)、dg44(chasin等人,1986,som.cellmolec.genet.,12:555-556;和kolkekar等人,1997,biochemistry,36:10901-10909)、cho-k1tet-on细胞系(clontech)、标明为ecacc85050302的cho(camr,salisbury,wiltshire,uk)、cho克隆13(geimg,genova,it)、cho克隆b(geimg,genova,it)、标明为ecacc93061607的cho-k1/sf(camr,salisbury,wiltshire,uk)、标明为ecacc92052129的rr-chok1(camr,salisbury,wiltshire,uk)、二氢叶酸还原酶阴性的cho细胞(cho/-dhfr,urlaub和chasin,1980,proc.natl.acad.sci.usa,77:4216)和dp12.cho细胞(美国专利号5,721,121):用sv40转化的猴肾cv1细胞(cos细胞,cos-7,atcccrl-1651):人胚胎肾细胞(例如,293细胞或293t细胞,或用于悬浮培养的亚克隆293细胞,graham等人,1977,j.gen.virol.,36:59,或gntikohek293s细胞,reeves等人,2002,pnas,99:13419):幼仓鼠肾细胞(bhk,atccccl-10):猴肾细胞(cv1,atccccl-70):非洲绿猴肾细胞(vero-76,atcccrl-1587;vero,atccccl-81):小鼠sertoli细胞(tm4,mather,1980,biol.reprod.,23:243-251):人宫颈癌细胞(hela,atccccl-2):犬肾细胞(mdck,atccccl-34):人肺细胞(w138,atccccl-75):人肝细胞瘤细胞(hep-g2,hb8065):小鼠乳房肿瘤细胞(mmt060562,atccccl-51):水牛大鼠肝细胞(brl3a,atcccrl-1442):tri细胞(mather,1982,annalsnyacad.sci.,383:44-68):mcr5细胞;fs4细胞。根据特定的实施方案,细胞是选自hek293细胞或cos细胞的哺乳动物细胞。

示例性非哺乳动物细胞系包括但不限于sf9细胞、杆状病毒-昆虫细胞系统(例如,综述jarvis,virology,第310卷,第1期,2003年5月25日,第1-7页)、植物细胞,如烟草细胞、番茄细胞、玉米细胞、藻类细胞、或酵母,如酵母属(saccharomyces)物种、裂殖酵母属(schizosaccharomyces)物种、汉逊酵母属(hansenula)物种、耶氏酵母属(yarrowia)物种或毕赤酵母属(pichia)物种。根据特定的实施方案,真核细胞是来自酵母属物种(例如酿酒酵母(saccharomycescerevisiae))、裂殖酵母属物种(例如栗酒裂殖酵母(schizosaccharomycespombe))、汉逊酵母属物种(例如多形汉逊酵母(hansenulapolymorpha))、耶氏酵母属物种(例如解脂耶氏酵母(yarrowialipolytica))、克鲁维酵母属(kluyveromyces)物种(例如乳酸克鲁维酵母(kluyveromyceslactis))、毕赤酵母属物种(例如巴斯德毕赤酵母(pichiapastoris))或komagataella物种(例如komagataellapastoris)的酵母细胞。根据特定的实施方案,真核细胞是毕赤酵母细胞,在最特定的实施方案中,是巴斯德毕赤酵母细胞。

可以按sambrook和russel(molecularcloning,alaboratorymanual,第3版,第3卷,第16章,第16.1-16.54节)概括的下列原理,转染靶细胞(例如哺乳动物细胞)。此外,还可以使用如腺病毒载体的试剂实施病毒转导。选择恰当的病毒载体系统、调节区和宿主细胞是本领域普通技术人员掌握的常识。根据标准实践将获得的转染细胞保持在培养物中,并冷冻用于后续用途。

相应的,本发明的另一个方面涉及生产根据本发明的结合结构域的方法,方法至少包括步骤:

a)在合适的细胞表达系统(如上文定义)中表达根据本发明的核酸,和任选的

b)分离和/或纯化所述结合结构域。

本文描述的结合结构域、复合物、细胞或细胞系可用于多种环境和应用,例如但不限于用于捕获和/或纯化gpcr:g蛋白复合物,和gpcr:g蛋白复合物的结晶化研究和高分辨率结构分析。因此,本发明的一个目的是利用根据本发明的结合结构域,特别是免疫球蛋白单可变结构域(如纳米抗体)作为稳定gpcr:g蛋白复合物的工具,并进一步涉及利用这些结合结构域作为与g蛋白复合的gpcr的共结晶化的辅助,或换言之促进gpcr:g蛋白复合物的晶体发生。额外的和/或可选的,结合结构域和优选的表达结合结构域的细胞系统(如本文所述)可用于其他用途,如配体筛选、药物发现、免疫,下文别处将全面描述。

稳定gpcr:g蛋白复合物和使gpcr锁定在g蛋白结合状态

因此,根据一个方面,本发明涉及上述结合结构域的用途,用于稳定包含gpcr和g蛋白的复合物。根据优选的实施方案,被稳定的复合物进一步包括受体配体,更具体的激动剂。如本文中使用的,术语“稳定”或“增加稳定性”指在复合物的一个或两个构成蛋白质(特别是gpcr和/或g蛋白)的结构(构象状态)和/或特定生物学活性(胞内信号传递活性)方面,增加gpcr:g蛋白复合物的稳定性。在一个特别优选的实施方案中,本发明的结合结构域可用于稳定gpcr:g蛋白复合物,使gpcr锁定或固定在活性的或结合g蛋白的状态。采用这类活性的或结合g蛋白的状态的gpcr将执行其天然的生物学活性。上文已描述了确定(增加的)gpcr:g蛋白复合物的稳定性的方式,实施例章节中将进一步示例。

可以理解,在gpcr的结构和/或特定生物学活性方面,具有增加的稳定性包括对其他变性剂或变性条件的稳定性,包括热、去垢剂、离液剂和极端ph。相应的,在其他实施方案中,根据本发明的结合结构域能够增加gpcr:g蛋白复合物在由稀释、浓缩、缓冲液组成、加热、冷却、冰冻、去垢剂、离液剂、ph等诱导的非生理条件下的稳定性。相应的,术语“热稳定”、“增加热稳定性”指gpcr:g蛋白复合物的功能特性而非热动力学特性,并且是指构成蛋白对由热和/或化学方式诱导的不可逆变性的抗性,所述方式包括但不限于加热、冷却、冰冻、化学变性剂、ph、去垢剂、盐、添加剂、蛋白酶或温度。不可逆变性导致蛋白质功能性构象的不可逆解折叠、生物学活性丢失和变性蛋白质凝聚。如本文中使用的,术语“(热)稳定”、“增加(热)稳定性”应用于包埋在脂质颗粒或脂层(例如,脂单层、脂双层等)中的gpcr:g蛋白复合物,和溶解在去垢剂中的gpcr:g蛋白复合物。

对于增加的热稳定性,可以通过测量配体结合或使用光谱学方法(如对升高温度时解折叠敏感的荧光、cd或光散射),方便的确定。优选的是,结合结构域能够增加稳定性,如通过gpcr:g蛋白复合物的热稳定性增加至少2℃、至少5℃、至少8℃,和更优选至少10℃或15℃或20℃所测量的。根据另一个优选的实施方案,结合结构域能够增加含受体配体(更具体的是gpcr依赖性信号传递通路的激动剂或正变构调控剂)的gpcr:g蛋白复合物的热稳定性。根据另一个优选的实施方案,本发明的结合结构域能够增加gpcr:g蛋白复合物在存在去垢剂或离液剂的条件下的稳定性。优选的,结合结构域能够增加gpcr:g蛋白复合物对由热或化学方法诱导的变性的稳定性。对于增加的对热、去垢剂或离液剂的稳定性,通常在存在测试去垢剂或测试离液剂的条件下,将gpcr:g蛋白孵育定义的时间,并使用例如配体结合或光谱学方法确定稳定性,任选在增加的温度下,如上文所讨论的。根据仍然另一个优选的实施方案中,根据本发明的结合结构域能够增加gpcr的功能性构象状态对极端ph的稳定性。优选的,结合结构域能够增加gpcr:g蛋白复合物对极端ph的稳定性。对于极端的ph,可选择典型的测试ph,例如在6至8、5.5至8.5、5至9、4.5至9.5的范围内,更具体的是在4.5至5.5的范围内(低ph)或8.5至9.5的范围内(高ph)。

在特别优选的实施方案中,根据本发明的结合结构域可用于阻止复合物在存在核苷酸,特别是鸟嘌呤核苷酸或其类似物的条件下解离。更具体而言,鸟嘌呤核苷酸包括gdp和gtp,鸟嘌呤核苷酸的类似物包括但不限于gtpγs或gdp与氟化铝或氟化铍的组合,或核苷酸片段(如焦磷酸盐或膦甲酸)。

捕获和/或纯化gpcr:g蛋白复合物

可理解,形成稳定的gpcr:g蛋白复合物的能力对于捕获和/或纯化gpcr:g蛋白复合物是特别有效的,其允许后续结晶化、配体表征和化合物筛选、免疫等。此外,特殊的优点是,本发明的结合结构域可以是可用于一系列gpcr:g蛋白复合物的普遍有效工具。

相应的,本发明还考虑了捕获和/或纯化包含gpcr和g蛋白的复合物的方法,方法包括步骤:

a)提供根据本发明的结合结构域,和

b)允许结合结构域与包含gpcr和g蛋白的复合物结合,和

c)任选的分离步骤b)中形成的复合物。

在特定的实施方案中,本发明提供了捕获包含gpcr和g蛋白的复合物的方法,方法包括步骤:

a)将含有多个gpcr和g蛋白的溶液用于具有根据本发明的固定化结合结构域的固体支持物,和

b)形成结合结构域、gpcr和g蛋白的复合物,和

c)去除微弱结合的或未结合的分子。

本发明还考虑了纯化包含gpcr和g蛋白的复合物的方法,方法包括步骤:

a)将包含gpcr和g蛋白的溶液与根据本发明的结合结构域接触,和

b)形成包含结合结构域、gpcr和g蛋白的复合物,和

c)分离步骤b)的复合物,

其中,gpcr和g蛋白的复合物是基本纯化的。

根据特定的实施方案,本文所述的结合结构域还可用于捕获进一步包含受体配体和/或一个或多个其它相互作用蛋白质的靶gpcr:g蛋白复合物。

上述用于捕获/纯化靶gpcr:g蛋白复合物的方法包括但不限于基于亲和力的方法,如亲和层析、亲和纯化、免疫沉淀、蛋白质检测、免疫组化、表面展示等,是本领域普遍已知的。

结晶化和解析gpcr:g蛋白复合物的结构

包括gpcr在内的膜蛋白的结晶化仍然是艰巨的挑战。虽然出现了允许生成毫克量级的表达和纯化方法,但使这些分子获得稳定性可能是最难克服的障碍。首先,根据本发明的结合结构域可增加去垢剂溶解的gpcr:g蛋白复合物的稳定性,保护其免受蛋白水解的降解和/或聚集,以及促进纯化和浓缩正确折叠的蛋白质的均质样品。本领域的普通技术人员可认识到,这类样品是用于生成衍射晶体的优选起点。

结晶化是通过x射线晶体学确定大分子结构的方法的另一个主要瓶颈。成功的结晶化需要形成核,及其之后生长为合适大小的晶体。晶体生长一般在过饱和溶液中自发发生,是均质成核的结果。在经典的稀疏矩阵筛选实验中,蛋白质可以结晶,其中对沉淀剂、添加剂和蛋白质的浓度广泛取样,可以鉴别对于特定蛋白质的适合成核和晶体生长的过饱和条件。稀疏矩阵筛选方法相关的是在蛋白质本身中产生结构差异,例如通过添加与蛋白质结合的配体,或通过产生不同的突变(优先在靶蛋白质的表面残基中),或通过尝试结晶靶蛋白质的不同种类的直向同源物(chang1998)。本发明的一个预料之外的发现是特异性结合gpcr:g蛋白复合物的结合结构域的有效性,用于在结合时导入一定程度的结构改变,同时保留复合物的整体折叠。

因为结晶化涉及不利的丢失了待装配在晶格中的分子的构象熵,所以降低仍然在溶液中的靶的构象熵的方法应该通过降低晶格形成的净熵罚分(netentropicpenalty),增强了结晶的可能性。已证实“表面熵减”方法是非常有效的(derewenda2004)。类似的,结合伙伴对象(如离子、小分子配体和肽)可以通过结合和稳定蛋白质的构象状态亚组降低构象异质性。虽然这类结合伙伴对象是有效的,但并非所有的蛋白质都具有已知的结合伙伴对象,甚至当已知结合伙伴对象时,其亲和力、溶解度和化学稳定性可能与结晶试验不相容。因此,令人惊讶的发现本发明的结合结构域可用作工具,通过结合g蛋白的特定构象,使靶gpcr:g蛋白复合物的构象异质性最小化,增加获得良好有序晶体的可能性。

用于高分辨率结构研究的gpcr结晶是特别困难的,因为这类膜蛋白的两亲性表面。包埋在膜双分子层中,蛋白质与磷脂的酰基链的接触位点是疏水性的,而极性表面则暴露给脂类的极性头部基团和水相。为了获得良好有序的三维晶体——高分辨率x射线结构分析的必要前提——在去垢剂的帮助下溶解gpcr,并作为蛋白质-去垢剂复合物对其纯化。去垢剂微团以带状(belt-like)方式覆盖了膜蛋白的疏水性表面(hunte和michel2002;ostermeier等人,1995)。gpcr-去垢剂复合物形成三维晶体,其中通过从去垢剂微团上突出的蛋白质的极性表面产生相邻蛋白质分子之间的接触(day等人,2007)。显而易见的是,去垢剂微团需要晶格中的空间。虽然微团之间的吸引性相互作用可以稳定晶体堆积(rasmussen等人,2007;dunn等人,1997),但这些相互作用不导致僵硬的晶体接触。由于包括gpcr在内的许多膜蛋白含有相对小或高度灵活的亲水性结构域,因此,一种增加得到良好有序晶体的可能性的对策是扩大蛋白质的极性表面和/或降低其柔性。最生理学的方法是使用天然的信号传递伙伴对象(partner),如g蛋白或抑制蛋白。不幸的是,gpcr与g蛋白或抑制蛋白的相互作用高度依赖于脂类,难以形成具有足够稳定性的复合物进行用于晶体学。因此,本发明的结合结构域通过结合g蛋白,可用于扩大gpcr的极性表面,补充可促进晶格的分子与g蛋白和纳米抗体的极性表面间初级接触的蛋白质表面的量。本发明的结合结构域还可以降低其胞外区的柔性,以生长良好有序的晶体。免疫球蛋白单可变结构域,包括纳米抗体尤其适合该目的,因为它们结合构象表位,并包含一个僵硬的球状结构域,与常规抗体或来自其的片段(如fab)不同,缺少柔性接头区。

因此,根据优选的实施方案,本发明提供了可用作使包含gpcr和g蛋白的复合物结晶,最终解析结构的工具的结合结构域。更优选的,利用本发明的结合结构域结晶的复合物还包括受体配体,更具体的激动剂。在特别优选的实施方案中,包含在复合物中的gpcr处于活性状态或构象。

因此,可以使用多种专门用于膜蛋白的结晶方法,使与gpcr:g蛋白复合物以及任选地受体配体复合的结合结构域结晶,许多方法见caffrey(2003&2009)的综述。一般而言,方法是基于脂类的方法,包括在结晶前向复合物中添加脂类。这类方法之前已用于结晶其他膜蛋白。许多这类方法,包括脂质立方相结晶方法和bicelle结晶方法,利用了脂类和去垢剂作为小泡的自发的自装配特性(小泡融合方法)、盘状微团(bicelle方法)、和脂质晶体或中间相(中间相或立方相方法中)。脂质立方相结晶方法描述在例如:landau等人,1996;gouaux1998;rummel等人,1998;nollert等人,2004,rasmussen等人,2011中,通过引用这些方法的公开内容整合这些出版物。bicelle结晶方法描述在例如:faham等人,2005;faham等人,2002中,通过引用这些方法的公开内容整合这些出版物。

根据另一个实施方案,本发明涉及本文所述结合结构域的用途,用于解析包含gpcr和g蛋白的靶复合物的结构,所述复合物任选还包括受体配体。本文中使用的“解析结构”指确定蛋白质的原子或原子坐标排列,通常是通过生物物理学方法进行的,如x射线晶体学。

在x射线晶体学中,正确组合的衍射数据给出了单位晶胞中的分子的电子密度的3d傅里叶变换幅度。如果已知相位,则可以通过傅里叶合成简单的获得电子密度。对于蛋白质复合物,当具有已知结构(研究模型)的蛋白质比例低(小于50%的氨基酸含量)时,和/或当晶体表现出有限的衍射质量时,仅从分子置换(mr)成功推断相位信息是令人质疑的。虽然已证实了多个同晶型置换(mir)和mr定相的组合可成功用于蛋白质复合物(例如,ostermeier等人,1995;li等人,1997;hunte等人,2000),但生产良好的重原子衍生物的需要几乎总是困难重重。在过去的二十年里,反常色散数据的应用普遍超越了经典的mir方法,所述反常色散数据主要使用硒代甲硫氨酸(semet)掺入(mad或sad)(hendrickson1991)。实际上,使用se-边缘能量的反常实验数据普遍提供了比mir或基于模型的mr定相数据更好且偏见更少的相位信息。相应的,一个特定的实施方案涉及了根据本发明的结合结构域的用途,用于通过mr或mad定相gpcr:g复合物。特别的是,免疫球蛋白单可变结构域,包括纳米抗体一般是大量表达的,适合semet掺入。为了进一步示例而非限制,通过仅在纳米抗体中导入所有的semet位点来定相包含gpcr、g蛋白和纳米抗体的复合物规避了在gpcr或g蛋白中掺入semet位点的要求。

在许多情况下,获得衍射级的晶体是解决原子分辨率结构的主要障碍。因此,根据特定的实施方案,可以使用本文所述的结合结构域改善晶体的衍射质量,从而可以解析靶复合物的晶体结构。

此外,获得gpcr靶的结构信息,例如用于帮助指导gpcr药物发现,是非常理想的。除了结晶更多的gpcr外,尤其需要用于获得与不同类型的配体结合的受体结构的方法,所述配体包括激动剂、拮抗剂、变构调节剂和/或g蛋白。本发明特别提供了用于获得gpcr:g蛋白复合物的晶体的一般性工具。特别的是,结合激动剂的gpcr:g蛋白复合物晶体可提供活性状态的gpcr的三维展示。这些结构将帮助澄清与配体结合和g蛋白相互作用位点相关联的构象改变,获得更精确的机制假设,最终获得新的治疗剂。考虑到配体活化的gpcr内在的构象柔性和结合激动剂的受体所表现出的更大的异质性,这类状态是难以稳定的。因此,这方面的工作可受益于结合了激动剂的受体构象与其异源三聚体的g蛋白结合后的复合物的稳定作用,所述稳定作用是通过添加这类复合物特异性的结合结构域。尤其适合的是结合g蛋白的形成了这类复合物的一部分的结合结构域,因为这类结合结构域可用作稳定所有通过相同的g蛋白(例如,gs偶联受体、gi偶联受体等)传递信号的gpcr的普遍工具。

根据备选的实施方案,本发明涵盖了确定包含gpcr和g蛋白的复合物的晶体结构的方法,方法包括步骤:

a)提供根据本发明的结合结构域,和

b)允许结合结构域与包含gpcr和g蛋白的复合物结合,和

c)使步骤b)中形成的复合物结晶。

在上述确定晶体结构的方法的特定实施方案中,包含gpcr和g蛋白的靶复合物还包括结合gpcr的受体配体,更具体的激动剂。

可以通过生物物理学方法进行所述晶体结构的确定,如x射线晶体学。方法还可包括获得晶体的原子坐标的步骤(如上文定义)。

鉴别靶向gpcr:g蛋白复合物的化合物

在化合物筛选、药物发现和先导物优化的过程中,需要更快、更有效、成本更低、尤其是信息量更丰富的筛选测定,所述测定提供了各种化合物特征及其对各种细胞通路的影响(即,功效、特异性、毒性和药物代谢)的同步信息。因此,需要快速和低价的筛选大量的化合物,从而鉴别目标gpcr的新的特异性配体,优选构象特异性配体,其可能是潜在的新药候选物。本发明通过提供使处于功能性构象状态的gpcr:g蛋白复合物稳定的结合结构域,解决了该难题,所述复合物之后可用作免疫原或选择试剂,用于在多种情况下筛选。根据本发明的结合结构域的主要优点是包含在gpcr:g蛋白复合物中的gpcr可以保持在稳定的功能性构象中,特别是活性状态构象中。例如,选择性结合该受体活性构象的文库化合物具有更大的倾向性表现为激动剂,因为gpcr的活性构象的orthosteric或变构稳定引发生物学应答。另一个优点是结合结构域增加了包含在复合物中的gpcr活性构象的热稳定性,因而保护gpcr免受由化合物筛选和药物发现中使用的非自然条件导致的不可逆变性或热变性,而不需要依赖具有增加的稳定性的突变gpcr。根据本发明的构象选择性结合结构域的另一个主要优点是其允许快速可靠的筛选和区分gpcr和gpcr依赖性通路的受体激动剂、反向激动剂、拮抗剂和/或调控剂,以及抑制剂,从而增加了鉴别具有理想药理学特性的配体的可能性。

为了进一步示例,非常明确的概念是当与g蛋白复合时,绝大部分gpcr表现出更高的激动剂结合亲和力。这归功于被激动剂占据的受体和g蛋白之间的协作相互作用。抑制gpcr和g蛋白复合物的解离的本发明的结合结构域因而稳定r:g蛋白复合物的活性构象状态,因而增加了gpcr与激动剂的亲和力,减少了与反向激动剂的亲和力。因此,识别r:g复合物的活性功能性构象的结合结构域可例如用于高通量筛选测定中以筛选激动剂,因为相对于反向激动剂,其增加受体与激动剂的亲和力。识别g:r复合物的活性功能性构象的结合结构域还可用于高通量筛选测定中筛选偏向性激动剂,所述偏向性激动剂具有选择性刺激某类受体的信号传递活性的能力,例如相对于β-抑制蛋白的功能,选择性激活g蛋白。根据特定的实施方案,可以使用特异性结合与gpcr复合的g蛋白的结合结构域(例如,表2-3)作为靶向多种gpcr的筛选程序的普遍工具,因为特定的g蛋白(例如gs)可与多种gpcr(例如,gs偶联受体,包括5-ht受体5-ht4和5-ht7型、acth受体、腺苷受体a2a和a2b型、精氨酸血管加压素受体2、β-肾上腺素能受体β1、β2和β3型、降钙素受体、降钙素基因相关肽受体、促肾上腺皮质激素释放激素受体、多巴胺受体d1样家族(d1和d5)、fsh-受体、胃抑制型多肽受体、胰高血糖素受体、组胺h2受体、黄体生成素/绒毛膜促性腺激素受体、黑皮质素受体、甲状旁腺激素受体1、前列腺素受体d2和i2型、分泌素受体、促甲状腺素受体等;还参见表1)形成复合物。

因此,根据本发明的另一个方面涵盖了结合结构域的用途,或包含结合结构域的复合物、细胞、膜制品的用途,均如上文所述,用于gpcr:g蛋白复合物的构象特异性结合伙伴对象的筛选和/或鉴别程序,最终可导致潜在的新药候选物。

根据一个实施方案,本发明考虑了鉴别能够选择性结合gpcr:g蛋白复合物的化合物的方法,方法包括步骤:

(i)提供包含gpcr和g蛋白的复合物

(ii)使复合物与针对和/或特异性结合复合物的结合结构域接触,允许结合结构域结合复合物,和

(iii)提供测试化合物,和

(iv)评估测试化合物是否结合复合物,和

(v)选择选择性结合复合物的化合物。

显而易见的是,用于任何上述方法的结合结构域都能够稳定gpcr:g蛋白复合物的功能性构象状态,和阻止复合物解离。优选的,gpcr:g蛋白复合物处于活性构象状态(如上文定义)。根据上述筛选方法的特别优选的实施方案,gpcr:g蛋白复合物还包括受体配体。

应该注意到,结合结构域的特别优选的实施方案如上文关于本发明之前方面所述。

因此,本发明的结合结构域可用于筛选测定。用于药物发现的筛选测定可以是固相或液相的测定,例如结合测定,如放射性配体结合测定。可理解的是,在一些情况下,测试化合物的高通量筛选是优选的,上述方法可用作“文库筛选”方法,这是本领域技术人员普遍已知的术语。因此,测试化合物可以是测试化合物的文库。特别的是,用于治疗化合物的高通量筛选测定构成本发明的一部分,所述治疗化合物如激动剂、拮抗剂或反向激动剂和/或调控剂。出于高通量的目的,可以使用化合物文库,如变构化合物文库、肽文库、抗体文库、基于片段的文库、合成化合物文库、天然化合物文库、噬菌体展示文库等。用于制备和筛选这类文库的方法是本领域已知的。在一个优选的实施方案中,高通量筛选方法涉及提供含有大量潜在的治疗配体的组合的化学品或肽文库。然后在一个或多个测定中筛选这类“组合文库”或“化合物文库”,如本文所述,鉴别表现出理想的特征活性的文库成员(特定化学种类或亚类)。“化合物文库”是一类储藏的化学品集合,通常最后用于高通量筛选中。“组合文库”是通过组合多种化学的“构件”(如试剂),通过化学合成或生物学合成生成的多种化学化合物的集合。组合文库的制备和筛选是本领域技术人员普遍已知的。因而鉴别的化合物可作为常规的“前导化合物”发挥作用,或者本身可用作潜在的或实际的治疗剂。因此,在另一个实施方案中,本文上述的筛选方法还包括修饰已表现出与构象活性的gpcr:g蛋白复合物结合的测试化合物,以及确定修饰的测试化合物是否与保持在特定构象中的gpcr结合。

当优选就构象特异性结合伙伴对象对靶gpcr:g蛋白复合物进行高通量筛选时,这可以通过将根据本发明的结合结构域,或被结合结构域稳定的gpcr:g蛋白复合物固定在可以被阵列或其他多路的合适固体表面或支持物上予以促进。合适的固体支持物的非限制性例子包括珠子、柱、载玻片、芯片或平板。更具体而言,固体支持物可以是颗粒状(例如,珠状或粒状,一般用于抽提柱中)或片层形态(例如,膜或滤纸、玻璃或塑料载片、微滴度测定板、测验片、毛细管填充装置等),其可以是平板的、褶层的或中空的纤维或管。下列基质作为例子而非穷举给出,这类例子包括硅石(多孔无定形硅石),即,含有由biotage(dyaxcorp.的分部)供应的60a不规则硅石(32-63um或35-70um)的flash系列柱体;琼脂糖或聚丙烯酰胺支持物,如由amershampharmaciabiotech供应的sepharose系列产品,或由bio-rad供应的affi-gel支持物。此外,还有大孔聚合物,如bio-rad提供的压力稳定型affi-prep支持物。可利用的其他支持物包括:葡聚糖、胶原、聚苯乙烯、甲基丙烯酸盐、海藻酸钙、可控孔玻璃、铝、钛和多孔陶瓷。可选的,固体表面可包括一部分质量依赖型传感器,例如,表面等离振子共振检测仪。可商购的支持物的其他例子讨论在例如proteinimmobilisation,r.f.taylor编著,marceldekker,inc.,newyork,(1991)中。

固定可以是非共价或共价的。特别的是,根据本发明的结合结构域,或通过结合结构域稳定的gpcr:g蛋白复合物,在固体表面的非共价固定或吸附可如下产生,通过根据本领域技术人员已知的标准技术,用任何识别与结合结构域或gpcr连接的分子标签的抗体、或链霉抗生物素或抗生物素蛋白、或金属离子包被表面(例如,生物素标签、组氨酸标签等)。可选的,可以使用常规的偶联化学,通过共价交联,将根据本发明的结合结构域,或通过结合结构域稳定的gpcr:g蛋白复合物连接到固体表面。固体表面可天然的包括适用于共价连接的可交联残基,或者可以将其包被或衍生而导入根据本领域普遍已知的方法的合适的可交联基团。在一个特定的实施方案中,在通过不含化学间隔子臂的反应部分与理想基质直接共价偶联后,固定化蛋白质保留了足够的功能。jung等人,(2008)中讨论了关于在固体支持物上固定抗体(片段)的方法的其他例子和更详细的信息;类似的,cooper(2004)中综述了膜受体固定方法;都通过引用整合到本文中。值得注意的是,例如,将特定氨基酸(在具有已知或提示结构的蛋白质中)突变为赖氨酸或半胱氨酸(或其他理想的氨基酸)可以为共价偶联提供特异性位点。还可能重新改造特定蛋白质,改变涉及化学偶联的表面可利用氨基酸的分布(kallwass等人,1993),这有效控制偶联蛋白质的方向。类似的方法可用于根据本发明的结合结构域,以及构象稳定化的gpcr:g蛋白复合物,从而提供在不添加其他肽尾部或含有天然或非天然氨基酸的结构域的条件下,定向固定的手段。在抗体或抗体片段(如纳米抗体)的情况下,在框架区中导入突变是优选的,使对抗体(片段)的抗原结合活性的破坏最小化。

常规上,固定的蛋白质可用于免疫吸附方法,如免疫测定(例如elisa),或免疫亲和力纯化方法,这是通过根据本领域常规的标准方法,使固定的根据本发明的蛋白质与测试样品(即,包含测试化合物等)接触来进行的。可选的,特别是出于高通量的目的,可以排列或多路传输固定的蛋白质。优选的,固定的根据本发明的蛋白质可用于筛选和选择特异性结合构象稳定的gpcr:g蛋白复合物的化合物,其中特别是处于活性构象状态的gpcr。

可理解,根据用途的类型或所需筛选的类型,可以固定结合结构域,或(构象稳定的)gpcr:g蛋白复合物,或其构成蛋白。此外,对gpcr:g蛋白稳定化结合结构域(靶向gpcr:g蛋白复合物的特定构象表位)的选择将决定蛋白质的方向,并且因此,化合物鉴别的理想结果,例如,特异性结合所述构象稳定化gpcr的胞外部分、膜内部分或胞内部分的化合物,或特异性结合所述构象稳定化g蛋白的化合物。

可选的,测试化合物(或测试化合物的文库)可固定在固体表面上,如芯片表面,而在例如去垢剂溶液或膜样制品中提供了结合结构域和gpcr:g蛋白复合物(参见下文)。

最优选的,结合结构域、gpcr:g蛋白复合物或其构成蛋白,或测试化合物都是没有固定的,正如在例如溶液中的噬菌体展示选择过程或放射性配体结合测定中。在优选的实施方案中,用于任何上述筛选方法的结合结构域、gpcr:g蛋白复合物(或分别的构成蛋白)是作为完整细胞或细胞(细胞器)提取物,如膜提取物或其级分,提供的,或者可以被掺入到脂质层或小泡中(包括天然和/或合成的脂质)、高密度脂颗粒,或任何纳米粒,如纳米盘(nanodisk),或作为vlp被提供,从而保留了相应蛋白质充分的功能。cooper(2004)中详细综述了从膜片段或膜-去垢剂提取物形成的gpcr制品,所述文献通过引用整合到本文中。可选的,还可以将结合结构域、gpcr:g蛋白复合物或构成蛋白溶解在去垢剂中。实施例章节中还提供了溶解的受体制品的非限制性例子。

可使用各种方法确定在稳定的gpcr:g蛋白复合物和测试化合物之间的结合,包括本领域的常规实践,例如酶联免疫吸附测定(elisa)、表面等离振子共振测定、基于芯片的测定、免疫细胞荧光、酵母双杂技术和噬菌体展示,例如在sambrook等人,(2001),molecularcloning,alaboratorymanual.第3版,coldspringharborlaboratorypress,coldspringharbor,ny中。其他用于检测测试化合物和gpcr之间的结合的方法包括用离子喷雾质量光谱/hplc方法超滤,或其他(生物)物理学和分析方法。还可以使用荧光能量共振转移(fret)方法,例如本领域技术人员普遍已知的。可理解,可以使用与化合物关联的独特标记或标签,检测结合的测试化合物,所述标记或标签如肽标记、核酸标记、化学标记、荧光标记或放射性频率标签,如本文别处所述。

可以使用任何本身已知的合适的体外测定、基于细胞的测定、体内测定和/或动物模型,或其任意组合,测试化合物和/或包含化合物的组合物的功效,这取决于所涉及的特定疾病或病症。

在一个特定的实施方案中,确定了化合物是否改变gpcr与受体配体的结合(如本文定义)。可以使用本文所述的本领域已知的标准配体结合方法,测定gpcr与其配体的结合。例如,配体可以是放射性标记的或荧光标记的。可以在完整细胞上或从细胞获得的膜上或去垢剂水性溶解的受体上进行测定。通过化合物改变标记配体结合的能力来表征所述化合物(还参见实施例章节)。化合物可减少在gpcr及其配体之间的结合,或可增加在gpcr及其配体之间的结合,例如减少或增加至少2倍、3倍、4倍、5倍、10倍、20倍、30倍、50倍、100倍。因此,根据更特殊的实施方案,用于上述任何筛选方法的复合物还包括受体配体。优选的,受体配体选自小分子、多肽、抗体或来自其的任何片段、天然产物等。更优选的,受体配体是完全激动剂,或部分激动剂,或反向激动剂,或拮抗剂,如上文所述。

除了确立与功能性构象状态的靶gpcr:g蛋白复合物结合外,理想的还确定化合物对gpcr:g蛋白复合物,特别是对gpcr及下游相互作用伙伴对象的生物学活性的功能效应。特别的是,根据本发明的结合结构域可用于筛选调控(增加或减少)gpcr:g蛋白复合物或其组分(gpcr或g蛋白)的生物学活性的化合物。所需的对生物学活性的调控取决于选择的gpcr。化合物可结合靶gpcr:g蛋白复合物,特别是结合它的一种或两种组分,导致调控(激活或抑制)下游的受体信号传递。该gpcr信号传递的调控可orthosterically或变构(allosterically)的发生。化合物可结合包含与g蛋白或其组分结合的gpcr的靶复合物,从而激活或增加受体信号传递;或可选的,从而减少或抑制受体信号传递。化合物还可以这样的方式结合靶复合物,使其阻断gpcr的构成活性。化合物还可以这样的方式结合靶复合物,使得它们介导变构调节(例如,在变构位点结合gpcr或g蛋白)。以该方式,化合物可通过结合gpcr、g蛋白复合物(例如,在变构位点)中的不同区域,调节受体功能。例如参考george等人,(2002),kenakin(2002)和rios等人,(2001)。本发明的化合物还可以这样的方式结合靶复合物,使其延长gpcr介导的信号传递的持续期,或通过增加受体-配体亲和力,增强受体信号传递。此外,化合物还可以这样的方式结合靶复合物,使其抑制或增强gpcr功能性同聚物或异聚物的装配。

此外,基于细胞的测定对于评估新生物学靶的作用机制和化学化合物的生物学活性是关键的。目前用于gpcr的基于细胞的测定包括测量通路激活(ca2+释放、camp生成或转录活性);通过用gfp标记gpcr和下游元件,测量蛋白质运输;和使用fórster共振能量转移(fret)、生物发光共振能量转移(bret)或酵母双杂方法,直接测量在蛋白质之间的相互作用。通过本领域普遍已知和常规使用的任何手段,将本发明的结合结构域在细胞内细胞内导入至细胞的相关区室(胞内或胞外),可导致新的或更好的基于细胞的测定。

特别的是,需要将尚未鉴别出天然的激活配体的那些gpcr“去孤儿化”。使用根据本发明的结合结构域稳定处于功能性构象状态中的gpcr,能实现用于鉴别“孤儿”gpcr的配体的筛选方法,所述“孤儿”gpcr的天然配体是未知的。例如,采用各种方法“去孤儿化”,包括针对已知配体的家族进行阵列筛选。可以从生物学样品中鉴别孤儿gpcr的配体。因此,在特定的实施方案中,提供测试化合物作为生物学样品。特别的是,样品可以是从个体采集的任何合适的样品。例如,样品可以是体液,如血液、血清、血浆、脊髓液。可选的,样品是组织或细胞提取物。

用于任何上述筛选方法的测试化合物可选自多肽、肽、小分子、天然产物、肽模拟物、核酸、脂类、脂肽、碳水化合物、抗体或来自其的任何片段,如fab、fab'和f(ab')2、fd、单链fv(scfv)、单链抗体、二硫键连接的fv(dsfv)和包含vl或vh结构域的片段、重链抗体(hcab)、单结构域抗体(sdab)、微抗体、源自骆驼重链抗体的可变结构域(vhh或纳米抗体)、源自鲨鱼抗体(vnar)的新型抗原受体的可变结构域、蛋白质支架(包括αbody)、蛋白a、蛋白g、设计的锚蛋白重复结构域(darpin)、iii型纤连蛋白重复、anticalins、knottins、改造的ch2结构域(纳米抗体),如上文定义。

测试化合物可任选的与可检测的标记共价或非共价的连接。合适的可检测标记和用于连接、使用和检测它们的技术是本领域技术人员显而易见的,包括但不限于任何通过光谱、光化学、生物化学、免疫化学、电学、光学或化学手段可检测的组合物。有效的标记包括磁珠(例如,dynabead)、荧光染料(例如,所有的alexafluor染料、荧光素异硫氰酸盐、texas红、罗丹明、绿色荧光蛋白等)、放射性标记(例如,3h、125i、35s、14c或32p)、酶(例如,辣根过氧化物酶、碱性磷酸酶)和比色标记,如胶体金或有色玻璃或塑料(例如,聚苯乙烯、聚丙烯、胶乳等)珠子。检测这类标记的方法是本领域技术人员已知的。因此,例如,可以使用胶卷或闪烁计数器,检测放射性标记,可以使用光检测器检测发散的光照来检测荧光标记物。通常通过为酶提供底物,和检测由酶对底物的作用生产的反应产物,检测酶标记。通过将有色标记简单可视化,检测比色标记。之前在本发明涉及结合结构域的第一方面中也描述了其他合适的可检测标记。

根据特别优选的实施方案,测试化合物是抗体或来自其的任何片段,如上所述,包括纳米抗体。例如但不限于,测试化合物可以是针对被根据本发明的结合结构域稳定的gpcr:g蛋白复合物产生的抗体(如本文中最广泛含义定义的)。在体内产生抗体的方法是本领域已知的。优选的,以本文之前描述的相似方式免疫动物。本发明还涉及用于选择特异性结合构象稳定化的gpcr:g蛋白复合物的抗体的方法,涉及在所述gpcr:g蛋白复合物上,筛选编码免疫球蛋白基因或其部分的表达文库,所述文库是在细菌、酵母、丝状噬菌体、核糖体或核糖体亚基或其他展示系统中表达的。

本发明的特定方面涉及固定了根据本发明的结合结构域的固体支持物。因而这类固体支持物(如上文所述)可用于任何上述筛选方法。

调控gpcr受体信号传递

本发明的结合结构域还可用于调节gpcr信号传递,特别是g蛋白介导的gpcr信号传递,包括消除g蛋白介导的gpcr信号传递。术语“调节”、“调节的”意指蛋白质或蛋白质复合物,特别是gpcr:g蛋白复合物的活性的增加或减少。特别的是,本发明的结合结构域可以是变构调控剂或变构抑制剂。术语“变构调控剂”或“变构抑制剂”在本发明的上下文中指非竞争性调控剂或抑制剂,其通过结合受体的活性位点以外的位点产生效应,调节受体活性或使受体在信号转导中无效。“正变构调控剂(pam)”增加了信号转导,而“负变构调控剂(nam)”降低了信号转导。特别的是,变构抑制剂还可以消除信号转导。用于评估本发明的结合结构域对gpcr信号传递的调控的测定如上文所述。

在这一方面,根据特定的实施方案,本发明的结合结构域,特别是免疫球蛋白单可变结构域还可用于前导物鉴别和设计肽模拟物(peptidomimetics)。利用生物学相关的肽或蛋白质结构作为前导物鉴别的起点,代表了现代药物发现中最强大的方法之一。肽模拟物是关键元素(药效团(pharmacophore))的3d空间模拟天然肽或蛋白质的化合物,同时保留了与生物学靶相互作用和产生相同生物学效应的能力。肽模拟物被设计为规避与天然肽相关的一些难题:例如对蛋白分解的稳定性(活性持续期)和低下的生物利用度。通常可以显著改善其他一些特性,如受体选择性或效价。

治疗和诊断应用

某些上述结合结构域可具有治疗用途,并可施用给具有病况的对象,从而治疗对象的病况。结合结构域的治疗用途是由所述结合结构域结合的靶gpcr:g蛋白复合物决定的,因为通过所述gpcr的信号传递与病况关联。在某些情况下,可以通过在结合配体的条件下激活gpcr。在其他实施方案中,可以例如突变gpcr使其组成型激活。可应用本发明结合结构域治疗gpcr介导的病况,如精神分裂症、偏头痛、反流、哮喘、支气管痉挛、前列腺肥大、溃疡、癫痫、咽痛、过敏、鼻炎、癌症例如前列腺癌、青光眼和中风。在ncbi的世界范围内的网站中可发现man数据库中的on-linemendelianinheritance下的其他示例性的gpcr相关病况。因此,本发明的特定实施方案还考虑了本发明的结合结构域,或包含结合结构域的药物组合物,用于治疗gpcr相关性疾病或病症。可理解,治疗用途还取决于结合结构域所针对的gpcr:g蛋白复合物的特定构象表位。

在固定的药物组合物中,本发明的结合结构域可与另一种药物混合,或可以分开施用,在其他药物物质之前、同时或之后。一般而言,这些规程涉及向患有gpcr相关性疾病或病症的个体施用有效量的结合结构域,其调节宿主中的gpcr的信号传递活性和治疗个体的病症。

在一些实施方案中,当需要降低某些gpcr的活性时,可施用一种或多种减少gpcr活性的化合物,而当需要增加某些gpcr的活性时,可施用一种或多种增加gpcr活性的化合物。

根据本发明的方法,多种个体是可治疗的。这类个体一般是哺乳动物或哺乳类,其中这类术语用于广义的描述落入哺乳纲中的生物,包括食肉动物目(例如狗和猫)、啮齿目(例如,小鼠、豚鼠和大鼠)和灵长目(例如,人、黑猩猩和猴子)。在多个实施方案中,个体是人。本发明的治疗方法通常在患这类病症的个体上实施,或者在需要避免这类病症的个体上实施。

在另一个方面,本发明还涉及包含治疗有效量的本发明的结合结构域和至少一种可药用的载体、佐剂或稀释剂的药物组合物。

“载体”或“佐剂”,特别是“可药用的载体”或“可药用的佐剂”是任何合适的赋形剂、稀释剂、载体和/或佐剂,其本身不诱导产生对接受组合物的个体有害的抗体,也不引起保护作用。因此,可药用的载体本质上是无毒和非治疗性的,是本领域技术人员已知的。合适的载体或佐剂通常包括一种或多种包括在下列非穷举列表中的化合物:代谢缓慢的大型大分子,如蛋白质、多糖、聚乳酸、聚乙醇酸、多聚氨基酸、氨基酸共聚物和失活的病毒颗粒。作为非限制性的例子,载体或佐剂可以是林格氏液、右旋糖溶液或hank溶液。还可以使用不含水的溶液,如非挥发性油类和油酸乙酯。优选的赋形剂是在生理盐水中的5%右旋糖。赋形剂可含有少量的添加剂,如增强等渗性和化学稳定性的物质,包括缓冲剂和防腐剂。

可以通过口服、吸入或肠胃外的施用,来施用本文所述的结合结构域或其可药用的盐。在特定的实施方案中,通过鞘内或脑室内施用,来递送纳米抗体。可以单独施用活性化合物,或优选将其配制成药物组合物。有效治疗某些表达结合结构域识别的抗原的疾病或病症的量取决于常见的因素,如要治疗的病症的性质和严重程度,和哺乳动物的体重。然而,单位剂量通常在0.01至50mg,例如0.01至10mg,或0.05至2mg结合结构域或其可药用的盐。单位剂量通常每天施用一次或一次以上,例如每天2、3或4次,更常见每天1至3次,使总每日剂量通常在0.0001至1mg/kg的范围内;因此,对于70kg的成人,合适的总每日剂量是0.01至50mg,例如0.01至10mg,或更常见0.05至10mg。更优选的是,以单位剂量组合物的形式施用化合物或其可药用的盐,如单位剂量的口服、肠胃外的或吸入的组合物。这类组合物是通过混合制备的,适用于口服、吸入或肠胃外的施用,其形态可以是片剂、胶囊剂、口服液体制品、散剂、颗粒剂、锭剂、可复水的散剂、可注射和可输注的溶液剂或混悬剂或栓剂或气雾剂。用于口服施用的片剂和胶囊剂通常以单位剂量存在,并含有常规赋形剂,如粘合剂、填充剂、稀释剂、压片剂、润滑剂、崩解剂、着色剂、矫味剂(flavouring)和湿润剂。可以根据本领域普遍已知的方法包被片剂。使用的合适的填充剂包括纤维素、甘露醇、乳糖和其他类似试剂。合适的崩解剂包括淀粉、聚乙烯吡咯烷酮和淀粉衍生物,如淀粉羟乙酸钠。合适的润滑剂包括例如硬脂酸镁。合适的可药用的湿润剂包括十二烷基硫酸钠。这些固体的口服组合物可以通过掺合、填充、压片等常规方法制备。重复的掺合操作可用于将活性剂分布到整个应用了大量填充剂的上述组合物中。这类操作当然是本领域常规的。口服的液体制品可以是例如含水或油性混悬剂、溶液剂、乳剂、糖浆剂或酏剂的形态,或者可以表现为用于在使用前用水或其他合适溶媒复水的干燥粉末。这类液体制品可含有常规的添加剂,如悬浮剂,例如山梨醇、糖浆、甲基纤维素、明胶、羟乙基纤维素、羧甲基纤维素、硬脂酸铝凝胶或氢化的食用脂肪;乳化剂,例如卵磷脂、脱水山梨醇单油酸酯或阿拉伯胶;不含水溶媒(可包括食用油),例如杏仁油、分馏的椰子油、油状酯类如丙三醇、丙二醇或乙醇的脂类;防腐剂,例如对羟基苯甲酸甲酯或丙酯或山梨酸,以及根据需要常规的矫味剂或着色剂。口服制剂还包括常规的缓释制剂,如具有肠溶衣的片剂或颗粒剂。优选的,用于吸入的组合物作为单独的或与惰性载体(如乳糖)组合的鼻烟、或气雾剂、或喷雾器的溶液、或作为用于吹入的超细粉末存在用于向呼吸道施用。在上述情况下,活性化合物的颗粒恰当的具有小于50微米,优选小于10微米的直径,例如1至5微米,如2至5微米的直径。有利的吸入剂量在0.05至2mg,例如0.05至0.5mg,0.1至1mg或0.5至2mg。对于肠胃外的施用,制备含有本发明的化合物和无菌溶媒的流体单位剂型。根据溶媒和浓度,活性化合物可以是悬浮的或溶解的。通常通过将化合物溶解在溶媒中,在装入合适的小瓶或安瓿瓶之前过滤除菌,并密封,来制备肠胃外的溶液。有利的是,溶媒中也溶解了佐剂(如局部麻醉剂)、防腐剂和缓冲剂。为了增强稳定性,在装入小瓶后可以冷冻组合物,并在真空下去除水分。以基本相同的方式制备肠胃外的重悬剂,除了将化合物悬浮而非溶解在溶媒中,并在悬浮在无菌溶媒中之前通过暴露给环氧乙烷来除菌。有利的是,组合物中包括表面活性剂或湿润剂,以促进活性化合物的均匀分布。恰当时,可包括少量的支气管扩张药,例如拟交感胺,如异丙肾上腺素、乙基异丙肾上腺素、舒喘宁(salbutamol)、苯肾上腺素和麻黄碱;黄嘌呤衍生物,如茶碱和氨茶碱、和皮质类固醇如泼尼松龙和肾上腺刺激物,如acth。作为普通实践,组合物通常附有手写或印刷的用于相关医学处理的说明。

可以如关于肽、多肽和蛋白质所述,将结合结构域,特别是免疫球蛋白单可变结构域递送到细胞内。如果抗原是胞外的或是胞外结构域,则结合结构域可通过与该结构域结合来行使其功能,而不需要胞内递送。本文所述的本发明的结合结构域可以靶向目标gpcr:g蛋白的胞内构象表位。为了使用这些结合结构域作为细胞内的有效且安全的治疗剂,可以通过本领域已知的蛋白质转导或递送系统增强胞内递送。由于其跨过生物膜转位的能力,蛋白质转导结构域(ptd)已吸引了药物递送领域的普遍关注。ptd是相对较短的(11-35个氨基酸)序列,赋予与其缀合、复合或融合的蛋白质和其他大分子负荷这一明显的转位活性(sawant和torchilin2010)。例如,源自hiv的tat肽(ygrkkrrqrrr)已经广泛用于各种活性剂的胞内递送,所述活性剂的范围覆盖了从小分子至蛋白质、肽、多种药物纳米载体和成像剂。可选的,还可以使用受体介导的胞吞机制进行胞内药物递送。例如,转铁蛋白受体介导的内化通路是有效的细胞摄入通路,已研发其用于位点特异性的递送药物和蛋白质(qian等人,2002)。这是通过缀合转铁蛋白与治疗药物或蛋白质化学地实现,或者通过融合治疗肽或蛋白质到转铁蛋白的结构中遗传实现。由于天然存在的蛋白质(如铁结合蛋白转铁蛋白)是可生物降解的、无毒且无免疫原性的,因此这些蛋白质在药物靶向领域非常有效。此外,由于在细胞表面存在大量的其受体,因此可以实现位点特异性靶向。其他递送系统包括但不限于基于聚合物和基于脂质体的递送系统。

可以使用本身已知的任何合适的体外测定、基于细胞的测定、体内测定和/或动物模型,或其任意的组合,测试本发明的结合结构域以及包含所述结构域的组合物的功效,这取决于所涉及的特定疾病或病症。

筛选、选择和生产结合结构域

在另一个方面,本发明还涵盖了筛选针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域的方法,方法包括步骤:

a)提供多个结合结构域,和

b)在所述多个结合结构域中,筛选与包含gpcr和g蛋白的复合物结合的结合结构域,和

c)分离与复合物结合的结合结构域。

在本发明这一方面的优选的实施方案中,生成并就其特异性结合包含gpcr和g蛋白,以及任选受体配体在内的复合物来筛选结合结构域。还可以生成结合结构域和筛选其对g蛋白的特异性结合。如本文所述,可以多种方式生成结合结构域。在免疫球蛋白单可变结构域(如纳米抗体)的情况下,通常用包含与g蛋白和受体配体结合的gpcr的靶复合物免疫动物,如上文所述(例如vhh序列,作为非限制性例子)及本文别处示例的。

为了用靶复合物免疫动物,可以使用在宿主细胞中表达所述蛋白质的重组形态的常规方法生产和纯化靶复合物(即,gpcr和g蛋白)的蛋白质,并使用亲和力层析和/或基于抗体的方法纯化蛋白质。在特定的实施方案中,可应用杆状病毒/sf-9系统表达,但也可以使用其他表达系统(例如,细菌、酵母或哺乳动物细胞系统)。表达和纯化gcpr的示例性方法描述在例如kobilka(1995),eroglu等人(2002),chelikani等人(2006)和书籍“identificationandexpressionofgprotein-coupledreceptors”(kevinr.lynch(编著),1998)等中。还可以使用纯化的受体(例如,β2-ar或mor)(用化学当量过量的g蛋白(gs或gi)重构为重组hdl颗粒),来重构功能性gpcr:g蛋白复合物,如whorton等人,(2009)所述(关于β2-ar:gs)或kuszak等人,(2009)所述(关于mor:gi)。还可以在磷脂小泡中重构gpcr,并将其负载化学当量过量的g蛋白。类似的,用于在磷脂小泡中重构活性gpcr的方法是已知的,描述在:luca等人(2003),mansoor等人(2006),niu等人,(2005),shimada等人,(2002)和eroglu等人,(2003)等中。在某些情况下,可以高密度的重构gpcr和磷脂(例如,每mg磷脂1mg受体)。在许多情况下,gpcr可以以两种方向位于磷脂小泡中(正常的方向,和“颠倒的”方向,后者的胞内环位于小泡外侧)。gpcr的其他免疫方法包括但不限于使用表达gpcr和/或g蛋白的完整细胞或来自其的膜。

在特定的实施方案中,用于双功能交联剂交联的靶复合物免疫动物(还参见实施例章节)。可以使用本领域技术人员普遍已知的标准技术进行化学交联(参见例如,hermanson,g.t.(2008)bioconjugatetechniques,第2版,elsevierinc.,第1202页)。

可以使用本领域普遍已知的任何适合产生免疫应答的技术,免疫任何合适的动物,例如暖血动物,特别是哺乳动物,如兔、小鼠、大鼠、骆驼、绵羊、牛或猪,或鸟类,如鸡或火鸡。

可以例如通过筛选在表面表达结合结构域的细胞(例如,从适当免疫的骆驼获得的b细胞)的组合、集合或文库,通过筛选结合结构域的(原始或免疫)文库,或者通过筛选编码结合结构域的氨基酸序列的核酸序列的(原始的或免疫)文库,实施对特异性结合靶复合物的构象表位的结合结构域的筛选,所述筛选都可以本身已知的方式实施,且所述方法还可以任选的包括一个或多个其他合适的步骤,例如但不限于亲和力成熟步骤、表达理想的氨基酸序列的步骤、筛选针对理想抗原结合和/或活性的步骤、确定理想的氨基酸序列或核苷酸序列的步骤、导入一个或多个人源化取代的步骤、以合适的多价和/或多特异性模式格式化的步骤、筛选理想的生物学和/或生理学特性的步骤(即,使用本领域已知的合适的测定),和/或以任何合适的顺序的一个或多个这类步骤的组合。

本发明的另一个方面涉及包含根据本发明的结合结构域的试剂盒。试剂盒还可包括试剂,如缓冲剂、分子标签、载体构建体、参照样品材料以及合适的固体支持物、细胞、核酸等,的组合。这类试剂盒可用于本文所述的本发明的任何应用。例如,试剂盒可包括用于化合物筛选用途的测试化合物(的文库)。

最后,本发明的最后一个方面是根据本发明的任何结合结构域的用途,用于分离负责特异性结合gpcr:g蛋白复合物的构象表位的氨基酸序列和构建基于所述氨基酸序列的人工结合结构域。可理解,在根据本发明的结合结构域中,框架区和互补决定区是已知的,对于结合gpcr:g蛋白复合物中相同构象表位的结合结构域衍生物的研究将允许获得参与结合所述构象表位的关键氨基酸。这一知识可用于构建最小的结合结构域和生成其衍生物,这是可以通过本领域技术人员已知的技术常规实行的。

下列实施例意在促进对本发明的进一步理解。本文中参考了示例的实施方案描述本发明,但应理解,本发明不限于此。具有本领域常规技能和接受本文教导的人将认识到在本发明范围内的其他修饰和实施方案。因此,本发明仅受本文所附权利要求的限制。

实施例

实施例1:形成和纯化稳定的激动剂-β2ar-gs三元复合物

通过在2ml缓冲液(10mmhepes,ph7.5,100mmnacl,0.1%ddm,1mmedta,3mmmgcl2,10μmbi-167107)中混合约100μm浓度的gs异源三聚体与过量摩尔(约130μm)的结合了bi-167107的t4l-β2ar(或β2ar-365),并在室温孵育3hr,形成稳定的复合物(参见图2)。从筛选和表征约50种不同的β2ar激动剂中鉴别出的bi-167107具有约30hr的解离半衰期,为结合了活性g蛋白的受体提供了比其他的完全激动剂(如异丙肾上腺素)更高程度的稳定作用(rasmussen等人,2011)。为了维持复合物的不含核苷酸的高亲和力状态,在90min后加入腺苷三磷酸双磷酸酶(25mu/ml,neb),水解结合受体时从gαs释放的剩余gdp。腺苷三磷酸双磷酸酶水解gdp得到的gmp对复合物中的g蛋白具有非常低的亲和力。重新结合gdp可导致r:g复合物解离(图3a)。

4℃下,ddm中的r:g复合物在48小时后表现出显著的解离(图4a)。筛选和表征了超过50种的两亲物(数据未显示),并且鉴别出mng-3(ng-310,affymetrix-anatrace;chae等人,2011)及其密切相关的类似物作为基本上稳定复合物的去垢剂(图4a,b)。通过在室温下将r:g混合物(2ml)添加到含有1%mng-3的8ml缓冲液(20mmhepes,ph7.5,100mmnacl,bi-167107)中1hr,将复合物交换入mng-3中。

在该阶段,混合物含有r:g复合物、非功能性gs和过量的β2ar。为了从非功能性gs中分离功能性r:g复合物和完成去垢剂交换,将r:g复合物固定在m1flag树脂上,并在含有0.2%mng-3的缓冲液(20mmhepes,ph7.5,100mmnacl,10μmbi-167107和3mmcacl2)中洗涤。为了阻止半胱氨酸键桥介导的r:g复合物聚集,在用50kdamwcomillipore浓缩器浓缩前,向洗脱的蛋白质中加入100μmtcep。在用含有0.02%mng-3,10mmhepesph7.5,100mmnacl,10μmbi-167107和100μmtcep的缓冲液平衡的superdex20010/300gl柱(gehealthcare)上实施了最终的尺寸排阻层析步骤,以从r:g复合物中分离了过量的游离受体(图5b)。混合峰级分(图5b),将所述级分用100kdamwcoviva-旋转浓缩器浓缩至约90mgml-1,并通过sds-page/考马斯亮蓝染色(图5a)和凝胶过滤(图5c)分析。为了验证是纯的、均质的和去磷酸化的制品,通过离子交换层析常规分析r:g复合物(图5d)。

实施例2:生成与激动剂:β2ar:gs三元复合物结合的纳米抗体

从负染em成像(数据未显示)中,观察到了gαs的α螺旋状结构域是柔性的。通过生成与激动剂-β2ar-gs三元复合物结合的纳米抗体解决该结构域的靶向稳定化。纳米抗体是单结构域抗体,源自家羊驼的仅含重链的抗体(muyldermans,2001)。为了鉴别结合(负载激动剂的)受体偶联型gs-蛋白的纳米抗体,用二(磺基琥珀酸亚酰胺)戊二酸酯(bs2g,pierce)交联的β2ar:gs:bi167107三元复合物免疫了2只家羊驼(llamaglama)。两只动物都用每隔一周50-100μg一针免疫四次。在结束免疫后,从免疫动物中分离外周血淋巴细胞,提取总rna,制备cdna。从约107淋巴细胞中分离总rna,如chomczynski和sacchi(1987)所述。根据生产商(invitrogen)说明,使用dn6引物和superscriptrt,制备第一链的cdna合成。如前所述,使用特异性引物,通过pcr从该cdna中扩增编码vhh基因的片段(conrad等人,2001)。使用巢式pcr,分别在vhh可读框的起始和末端改造pst1和bsteii。将vhh作为pst1-bsteii片段克隆到噬菌体展示载体pmesy4中。对于每只家羊驼,都构建独立的噬菌体展示文库,其容纳相应的纳米抗体库作为geneiii融合物(domanska等人,2011)。通过对i)包埋在apol生物素化高密度脂蛋白颗粒(rhdl,whorton等人,2007)中的β2ar:gs:bi167107三元复合物或ii)bs2g交联型β2ar:gs:bi167107三元复合物进行两轮生物淘选,富集r:g复合物特异性纳米抗体。对于第一轮生物淘选对策,在20mmhepes(ph8.0),100mmnacl,1mmedta,100μmtcep和100nmbi167107中,将含有β2ar:gs:bi167107三元复合物的生物素化rhdl颗粒以1μg/孔固定在包被了亲和素(neutravidin)的maxisorp平板(nunc)上。对于第二轮生物淘选对策,将bs2g交联型β2ar:gs:bi167107三元复合物以1μg/孔固相包被在maxisorp平板上。对于每轮生物淘选,加入1011个噬菌体固定抗原,并孵育1至2小时。之后,从含抗原的孔中去除未结合的噬菌体,用20mmhepes,100mmnacl,ph8洗涤孔14次,最后用200μl的20mmhepes(ph8.0),100mmnacl,1mmedta,100μmtcep和100nmbi167107孵育10分钟,去除非特异性噬菌体。为了洗脱复合物特异性的噬菌体,用胰蛋白酶处理孔,将噬菌体重新覆盖并用于感染对数生长的tg1细胞(od600±0.5)。从每个富集文库中随机挑选48个集落,生长在1ml含氨苄青霉素和葡萄糖的2xty中。用iptg诱导培养物,诱导纳米抗体表达,制备含有部分纯化的纳米抗体的周质提取物。通过elisa分析包含在这些周质提取物中的纳米抗体与激动剂:β2ar:gs三元复合物的结合。

通过对固定在亲和素包被的maxisorb平板上的下述复合物和空白rhdl颗粒之间的比较elisa,分析在含有β2ar:gs:bi167107三元复合物的生物素化rhdl颗粒上富集的纳米抗体。通过对相同固相包被的复合物与未包被的孔之间的比较elisa,分析在固相包被的bs2g交联型β2ar:gs:bi167107三元复合物上富集的纳米抗体。从比较elisa的打分阳性的集落中制备单克隆,提取dna,并使用常规方法分析编码的纳米抗体基因的序列(表2-3显示了氨基酸序列)。对于nb35、nb36和nb37,通过分析性凝胶过滤进一步验证与β2ar:gs:bi167107三元复合物的结合(图3d、3e、3f、3g)。

实施例3:nb35、nb36和nb37结合gs,并通过gtpγs阻止复合物解离

为了确定针对β2ar:gs:bi167107三元复合物产生的纳米抗体(表2)是否结合受体或gs,之后在elisa中监控了这些纳米抗体与单独的纯化受体的结合。在用结合了激动剂的β2ar-356包被的固相(maxisorb,nunc)中,表2的所有纳米抗体被打分为负,所述结合了激动剂的β2ar-356高密度的重构成磷脂小泡(rasmussen等人,2011)。在该elisa中,β2ar特异性纳米抗体——nb80(rasmussen等人,2011)打分阳性。表2中描述的β2ar:gs:bi167107结合物无一结合重构的单独受体,提示其结合gs中包含的表位。尺寸排阻层析显示,nb35和nb37结合位于gs异源三聚体上的分离的表位,形成r:g:nb35:nb37复合物(图3d)。类似的,nb36和nb37结合位于gs异源三聚体上的分离的表位,形成r:g:nb36:nb37复合物(图3e)。

gdp、gtp和不能水解的gtp类似物破坏β2ar:gs复合物(图3a),在体外和体内导致gpcrg蛋白复合物解离。在存在和不存在gtpγs的条件下,通过分析级的尺寸排阻层析,分析nbs和不能水解的gtp类似物gtpγs对激动剂:β2ar:gs三元复合物的完整性的相互影响。发现纳米抗体35、36和37保护β2ar:gs:bi167107复合物免于被gtpγs解离(图3d、3e&3g)。

实施例4.纳米抗体辅助的β2ar-gs复合物结晶

g蛋白偶联受体(gpcr)负责了对激素和神经递质,以及视觉、嗅觉和味觉的大部分细胞应答。gpcr信号传递的范例是通过激动剂占据的受体活化异源三聚体gtp结合蛋白(g蛋白)。在理解gpcr信号传递的结构基础的尝试中,结晶了β2ar-gs复合物,通过x射线晶体学解析了它的结构。

晶体形成的一个难题是在去垢剂溶液中制备稳定的β2ar:gs复合物。β2ar和gs在脂质双层中有效偶联,但不在用于溶解和纯化这些蛋白质的去垢剂中偶联(实施例1)。发现了可以通过在十二烷基麦芽糖苷溶液中混合纯化的gdp-gs(约100μm终浓度)与摩尔过量的结合了纯化β2ar的高亲和力激动剂(bi167107;rasmussen等人,2011),制备相对稳定的β2ar:gs复合物。可以添加一种非选择性的嘌呤焦磷酸酶——腺苷三磷酸双磷酸酶,水解从与β2ar形成复合物的gs上释放的gdp。之后,通过连续的抗体亲和力层析和尺寸排阻层析纯化复合物。通过将复合物交换到新研发的麦芽糖新戊二醇去垢剂(ng-310,anatrace)中,增强复合物的稳定性(chae等人,2010)。该复合物可以在室温下孵育24小时,没有任何可注意到的降解;然而,使用稀疏矩阵筛选在去垢剂微团、bicelle和脂质立方相(lcp)中结晶复合物的初步尝试失败了。

为了进一步评估复合物的品质,通过单粒电子显微镜(em)分析蛋白质。结果验证了复合物是单分散的(数据未显示),但揭示了用于获得质量晶体衍射的其他可能的瓶颈。首先,用于稳定复合物的去垢剂形成了大的微团,导致在β2ar:gs复合物的胞外侧只留下极少的极性表面用于形成晶格接触。因此,用t4溶菌酶(t4l)替换了β2ar的无结构的氨基末端。之前通过在跨膜区段(tm)5和6的细胞质末端之间插入t4l,使用t4l促进失活β2ar的晶体发生(rosenbaum等人,2007)。该融合蛋白(t4l-β2ar)表现出正常的配体结合和gs偶联特性。在lcp中,使用修饰的单油酸酯(monolein)进行结晶化试验(7.7mag,由martincaffrey提供),所述单油酸酯设计为与t4l-β2ar:gs复合物的大的亲水性组分相容(misquitta等人,2004)。虽然我们能够获得衍射的小晶体,但却不能通过使用添加剂和其他修饰来改善其质量。

单粒em分析揭示的另一个晶体生成的潜在难题是放置gαs亚基的α-螺旋状组分的位置时增加的可变性。gαs由2个结构域组成,ras样gtp酶结构域(gαsras),其与β2ar和gβ亚基相互作用,和α-螺旋状结构域(gαsah)(sprang等人,1997)。两个gαs亚结构域的界面形成了结合核苷酸的口袋(图1),而em2d平均值和3d重构提示了在缺少鸟嘌呤核苷酸的条件下,gαsah相对于t4l-β2ar-gαsras-gβγ的复合物具有可变的位置(图1b)。

在进一步促进复合物的晶体生成的工作中,我们尝试了共结晶复合物和纳米抗体35。nb35保护复合物免于被gtpγs解离,提示稳定了gs:nb相互作用(图3a)。按1:1.2的摩尔比,混合结合了bi-167107的t4l-β2ar:gs复合物和nb35(参见图6和7)。通过分析凝胶过滤验证了略微摩尔过量的nb35(图7b)。利用之前报道过的双体注射器(twin-syringe)混合法(caffrey2009),在按1:1蛋白质比脂类的比例(w/w)与含有10%胆固醇(c8667,sigma)的7.7mag(由martincaffrey提供)混合前,室温孵育混合物1hr。r:g:nb复合物在7.7mag中的浓度是约25mg/ml。通过lcp分散机器人(gryphon,artrobbinsinstruments),按每滴40nl,向24孔或96孔玻璃夹心平板中递送蛋白质:脂类混合物,并用0.8μl沉淀溶液覆盖全体。使用部分基于stockoptionssalt试剂盒试剂(hamptonresearch)的内部筛选,初步鉴别了多个结晶前导物。在18至22%peg400,100mmmesph6.5(图1c),350至450mm硝酸钾,10mm膦甲酸(图3b),1mmtcep和10μmbi167107中,生长用于收集数据的晶体。晶体在20℃下3-4天内达到实际大小(图8),并将其从海绵样中间相中挑取,并在不含额外的冷冻保护剂的条件下,在液氮中瞬间冰冻。

实施例5:nb35促进r:g复合物的晶体形成

bi-167107结合在空间群p21中结晶的t4l-β2ar:gs:nb35复合物,每个不对称单元中具有单个复合物。图9a显示了晶体学堆积的相互作用。图9b显示了包括t4l和nb35在内的完整复合物的结构,图9c显示了β2ar:gs复合物自身。

在备选的含水层和脂质层中排列结合了bi-167107的t4l-β2ar:gs:nb35复合物,具有几乎只在复合物的可溶组分之间形成的晶格接触,留下受体分子悬浮在g蛋白层之间,在膜的平面上彼此广泛分开。在所有的可溶蛋白质之间形成了广泛的晶格接触,可能导致强烈的整体衍射和g蛋白的非常清楚的电子密度。

nb35和t4l促进了结合bi-167107的t4l-β2ar:gs:nb35复合物的晶体形成。nb35结合gs上的构象表位,压在gβ和gα亚基与互补决定区(cdr,根据imtg编号定义;lefranc,2003)1的界面上,所述互补决定区1主要与gβ相互作用(图10a),而长的cdr3环同时与gβ和gα亚基相互作用(图10b)。nb35的一些框架区还与相同复合物的gα相互作用(图10c)。来自一个复合物的其他框架区与来自两个相邻复合物的gα亚基相互作用(图11),主要负责晶格内的晶体接触。t4l与受体的氨基末端形成相对稀疏的相互作用,但压在一个复合物的gβ亚基的氨基末端,另一个复合物的gγ亚基与另一个复合物的gα亚基的羧基末端。

实施例6.活性状态β2ar的结构

β2ar:gs结构为gpcr的跨胞质膜信号转导机制和三元复合物的功能特性的结构基础提供了第一个高分辨率的透视。图12a比较了在β2ar:gs复合物中和在结合了失活卡拉洛尔的β2ar中结合了激动剂的受体的结构。失活和活性结构之间的最大差异是在e268的cα碳处测量时,tm6向外移动了tm5螺旋的胞质末端向外移动和延伸更少,少7个残基。在第3个胞内环(icl3)中,26个氨基酸的区段是乱序的。失活和活性结构之间的另一个显著差异是第2个胞内环(icl2),其在失活的β2ar结构中形成延伸的环,而在β2ar:gs复合物中形成α-螺旋。在β2ar-nb80结构中也观察到了这一螺旋(图12b):然而,这可能不是活性状态特有的特征,因为在高度均质的鸟类β1ar的失活结构中也观察到了这一结构(warne等人,2008)。

在该β2ar-gαsras界面上,β2ar的电子密度图的质量是最高的,而胞外部分则弱得多,可能是由于缺少与胞外表面的晶格接触(图9a)。结果是,不能确定地构建在结合配体的口袋中的高亲和力激动剂(bi-167107)的模型。然而,t4l-β2ar:gs复合物中的β2ar的整体结构与g蛋白模拟的纳米抗体(nb80)稳定的β2ar的我们最近的活性状态结构非常相似。这些结构主要背离了在tm5和6的胞质末端(图12b),可能是由于存在取代了β2ar-nb80结构中的icl3的t4l。不论如何,β2ar-nb80复合物对激动剂异丙肾上腺素表现出与β2ar:gs复合物(rasmussen等人,2011)同样高的亲和力,与配体结合口袋周围的高结构同源性一致。β2ar-nb80晶体的电子密度图为配体结合口袋周围和配体结合口袋与gs偶联界面之间的氨基酸构象重排提供了更可靠的观察(rasmussen等人,2011)。

图12c显示了与β2ar-nb80复合物相比,β2ar:gs复合物中的高保守序列基序的位置,所述基序包括d/ery和npxxy(还参见图13)。已建议这些保守序列对激活或维持受体处于活性失活是重要的(hofmann等人,2009)。这些氨基酸的位置在这两个结构中基本相同,证实nb80是非常好的g蛋白代替品。这两个结构间仅arg131不同。在β2ar-nb80结构中,arg131与nb80相互作用,而在β2ar:gs结构中,arg131压在gαs的tyr391上(图13)。

通过与(gαsras)广泛的相互作用,稳定了β2ar的活性状态(图14)。与gβ或gγ亚基没有任何直接的相互作用。β2ar-gαsras界面的总包埋表面是(gαsras为β2ar为)。该界面是由β2ar的icl2、tm5和tm6、以及由gαsras的α5-螺旋、αn-β1连接、β3链的顶部和α4-螺旋形成的(参见表6关于特异性相互作用)。涉及该相互作用的β2ar序列表现出在g蛋白偶联中发挥作用;然而,当比对这些区段和其他gpcr时,没有用于gs-偶联特异性的明显的共同序列。这可能不令人惊讶,考虑到β2ar还偶联gi,而许多gpcr偶联一个以上的g蛋白同种型。因此,g蛋白偶联特异性的结构基础必须涉及更细微的二级和三级结构特征。然而,值得注意的相互作用涉及phe139,其位于icl2螺旋的起始处,坐落于由β1链起始处的gαshis41、β3链起始处的val213和α5-螺旋中的phe376、arg380和ile383形成的疏水性口袋中(图14c)。β2ar突变体f139a展现了与gs的偶联严重受损(moro等人,1993)。在几乎所有的gs偶联受体上,与phe139对应的残基是phe或leu,但在已知与其他g蛋白偶联的gpcr中所述残基更多变。令人感兴趣的是,保守dry序列的asp130与icl2螺旋中央的tyr141之间的相互作用,稳定icl2螺旋(图14c)。tyr141表现出是胰岛素受体酪氨酸激酶的底物(baltensperger等人,1996):然而,该磷酸化的功能性重要性目前未知。

实施例7.活化的gs的结构

β2ar:gs复合物中最令人惊讶的观察结果是gαsah相对于gαsras的大位移(围绕结构域之间的连接约180°旋转)(图15a)。在gαs的晶体结构中,由gαsras和gαsah之间的界面形成结合核苷酸的口袋。结合鸟嘌呤核苷酸稳定了这两个结构域之间的相互作用。失去该结合鸟嘌呤核苷酸的稳定效应与在去垢剂溶解的复合物的单粒em分析中观察到的gαsah的高柔性一致(数据未显示)。这也和复合物形成时,这两个结构域之间的界面上的氘交换增加一致(数据未显示)。最近,hamm、hubbell及其同事利用双电子电子共振(deer)光谱,证实了在与光活化的视紫红质形成复合物后,位于ras和gi的α-螺旋状结构域上的硝基氧探针之间的距离大改变(多达)(vaneps2011)。因此,可能不需要惊讶的是,替换的是gαsah而非gαsras;然而,其在该晶体结构中的位置可能反映了对晶体堆积的相互作用而非对其生理学构象的影响。

在β2ar和核苷酸结合口袋之间的构象关联主要涉及gαs的氨基和羧基末端的螺旋(图14)。图15b关注了比较gs-β2ar复合物与gαs-gtpγs复合物的gαsras结构时,经历最大构象改变的gαsras区域(sunahara等人,1997)。观察到的最大差异是α5螺旋,其向受体移动了并转动至羧基末端突入β2ar的跨膜核心中。与该移动相关,与gαs-gtpγs结构中的鸟嘌呤环相互作用的β6-α5环朝向外侧,偏离了核苷酸结合口袋(图15b-d)。α5螺旋的移动也与该螺旋和β6片层、αn-β1环和α1螺旋之间的相互作用的改变相关。β1链形成了β2ar和核苷酸结合口袋之间的另一连接。该链的c-末端改变了gly47周围的构象,在配合gtp结合形态中的γ-磷酸的β1-α1环(p环)中还有其他改变(图15b-d)。晶体结构的观察结果与氘交换实验一致,其中,在形成不含核苷酸的β2ar:gs复合物后,在β1片层中和α5螺旋的氨基末端中存在增强的氘交换(数据未显示)。

尚未确定gs异源三聚体的结构,因此不能直接比较β2ar:gs复合物形成前后的gαs-gβγ界面。基于结合gdp的gi异源三聚体的结构(wall等人,1995),在与β2ar形成复合物后,没有观察到gαsras和gβγ之间相互作用的大的改变。这也与氘交换研究一致(数据未显示)。应注意的是,nb35结合在gαsras和gβ之间的界面(图2b)。因此,不能排除nb35可影响晶体结构中的gαsras-gβγ界面的相对方向的可能性。然而,单粒em研究提供了nb35不破坏gαsah和gαsras之间的相互作用的证据(数据未显示)。

实施例8:nb35和nb37结合gs上的不同表位并抑制核苷酸结合

为了研究纳米抗体(nb35和nb37)对gs本身的效应,在20mmtris-hcl,ph8.0,3mmmgcl2,1mmdtt中添加纳米抗体和bodipy-gtpγs-fl和各种gs蛋白制品至终体积200μl。含有异源三聚体gs蛋白的样品还包括0.1%ddm。bodipy-gtpγs-fl是稳定的荧光gtp类似物其荧光强度在结合g蛋白后增加,因此,bodipy-gtpγs-fl可用于实时测量核苷酸与g蛋白的结合(mcewen等人,2001)。在m5荧光平板读数器(molecularprecision)上,以96孔微滴度板模式测量荧光。

在第一个实验中(图16),孵育量增加的nb37与1μm纯化的gαs和100nmbodipy-gtpγs-fl,短时间(300秒)的测量荧光增加,使水解产物bodipy-磷酸的积累最小化(jameson等人,2005)。如前所述,纯化异源三聚体gs蛋白的gαs亚基(sunahara等人,1997)。根据该实验,nb37似乎以剂量依赖性的方式阻断gtpγs结合单独的gsα。这些结果还提示nb37的结合表位限于异源三聚体gs蛋白的gαs亚基。在类似的实验中(图17),孵育量增加的nb35与1μm纯化的gαs和100nmbodipy-gtpγs-fl。与观察结果一致的是,nb35结合包含gαsras和gβ元件的表位(参见实施例7),nb35对gtpγs与单独的gαs亚基结合没有影响。

在另一个实验中(图18),孵育量增加的nb35与1μm纯化的gsαβγ异源三聚体和100nmbodipy-gtpγs-fl。该实验提示,nb35以剂量依赖性的方式阻断gtpγs与游离的gsαβγ异源三聚体结合。

实施例9.nb35稳定其他的激动剂-gpcr-gs复合物

gsα亚基(或gs蛋白)是通过激活腺苷酸环化酶,激活camp-依赖性通路的异源三聚体g蛋白亚基。与gs偶联的g蛋白偶联受体包括:5-ht受体5-ht4和5-ht7型、acth受体、腺苷受体a2a和a2b型、精氨酸血管加压素受体2、β-肾上腺素能受体β1、β2和β3型、降钙素受体、降钙素基因相关肽受体、促肾上腺皮质激素释放激素受体、多巴胺受体d1样家族(d1和d5)、fsh-受体、胃抑制型多肽受体、胰高血糖素受体、胰高血糖素样肽1受体(glp1-r)、组胺h2受体、黄体生成素/绒毛膜促性腺激素受体、黑皮质素受体、甲状旁腺激素受体1、前列腺素受体d2和i2型、分泌素受体、促甲状腺素受体等。

为了确定结合β2ar:gs:bi167107中的gs的纳米抗体是否也稳定其他的gpcr:gs:激动剂复合物,制备了与gs、nb35、精氨酸血管加压素(avp:nt4lv2r:gs)复合的精氨酸血管加压素受体2(登录号p30518;v2r_human)的复合物,并证实了该复合物在sec中的稳定性。精氨酸血管加压素(avp)也被称为血管加压素、精氨加压素或抗利尿素激素,是激活精氨酸血管加压素受体2的天然配体。

通过在0.1ml缓冲液(10mmhepes,ph7.5,100mmnacl,0.1%ddm,1mmedta,3mmmgcl2,10μmavp)中混合约90μm浓度的his标记的gs异源三聚体与结合avp的nt4lv2r(90μm)和nb35(100μm),并在室温孵育2小时,形成稳定的复合物(图19a)。之后,在两步连续的亲和力纯化步骤中纯化avp:nt4lv2r:gs复合物。通过sds-page监控纯化(图19)。首先,在向反应混合物加入含300μl1%mng的10mmhepes,ph7.5,100mmnacl缓冲液后,将复合物用于ni-nta柱。在用缓冲液充分洗涤后,在0.2%mng,10mmhepes,ph7.5,100mmnaclavp10μm和200mm咪唑中洗脱复合物。之后,将复合物用于flag-标签的亲和力柱,在含有0.01%mng的相同缓冲液中充分洗涤,并用flag-肽洗脱。通过sds-page监控该过程(图19b),并且该过程显示可以相应的纯化含有nt4lvtr、gαs、gβ、gγ和nb35的复合物。在10mmhepes,ph7.5,100mmnacl,0.01%mng,1mmedta,3mmmgcl2,1μmavp中,通过superdex200柱上的sec进一步纯化了该复合物。通过sds-page监控该过程(图19c),显示可以相应的纯化含有nt4lvtr、gαs、gβ、gγ和nb35的单分散性复合物。

为了验证avp:nt4lv2r:gs复合物的稳定性,在冰上孵育纯化的样品24hr,并将其重新用于sec,验证它的单分散性特征及其mw(图20)。与预期相同,过量的拮抗剂sr121463(10μm)破坏了avp:nt4lv2r:gs复合物。

实施例10.使用纳米抗体稳定的gpcr:g蛋白复合物,对激动剂或正变构调控剂的改善的筛选

选择性稳定gpcr的非主要构象异构体的纳米抗体将允许更有效的筛选与该特定的低丰度构象异构体选择性相互作用的配体。此外,构象异构体选择性的纳米抗体还可用于暴露变构的或隐藏的可用于药物研发的位点,或反向遮蔽对药物筛选不理想的结合口袋。当特定的构象异构体是活性状态时,鉴别的配体具有高的可能性作为激动剂行动,该结果受costanzi&vilar(2011)所述的电脑模拟入坞(insilicodocking)实验的支持。实际上,其结果提示,活化的结构对激动剂的鉴别比对拮抗剂的鉴别更有利,而失活的结构对受体阻断剂的鉴别比对激动剂的鉴别更有利。

提供的证据是,通过结合gαs和gβγ亚基的界面,nb35稳定了在活化的β2ar和g蛋白之间的复合物。鉴别与β2ar的低丰度的活性状态的构象异构体选择性相互作用的配体的筛选测定的例子可以是放射性配体测定,其利用nb35使β2ar群体更加移向其活性状态。可以按seifert及其同事(1998)所述,以极少的修正来类似的执行这类放射性配体测定。本文描述了涉及β2ar作为选择的通过通过任何与gαs亚基相互作用的其他gpcr替换β2ar的靶的测定,允许执行类似的筛选方法,鉴别针对该特定gpcr的激动型配体。可以筛选小分子(化合物mw通常在250至1000da之间)或者甚至基于片段(化合物mw通常<250da)的文库来鉴别候选激动剂。稳定非主要的构象异构体将显著增加片段文库筛选的性能,尤其是因为在基于片段的药物筛选中,初始命中通常具有低的效价/亲和力。nb35将选择性的增加对这样的化合物的亲和力,所述化合物是对选择性的、可用于药物研发的构象异构体特异性的,因此对鉴别从头片段具有深远影响。

在孵育缓冲液(50mmhepesph7.4,1mmcacl2,5mmmgcl2,100mmnacl和0,5%w/vbsa)中,将恰当量(通常10μg)的来自hek293t细胞的人β2ar均质化膜提取物与nb35或不相关的纳米抗体(不稳定活性gpcr构象)在30℃平行孵育1h,所述细胞含有锚定了g蛋白亚基的膜。纳米抗体是外源提供的,相比肾上腺素能受体是大量摩尔过量的(例如,≥1μm)。之后,将结合了纳米抗体的膜加入到含有文库化合物和2nm的3h-二氢阿普洛尔(dha)拮抗型放射性配体的96孔板中。用孵育缓冲液调节每个孔的总体积至100μl,在30℃进一步孵育反应混合物另外1小时。之后,使用预先浸泡在0.3%聚乙烯亚胺中的gf/c玻璃纤维96孔过滤板(perkinelmer),收获与膜结合的放射性配体。用冰冷的洗涤缓冲液(50mmtris-hclph7.4)洗涤过滤板,在50℃干燥30分钟。在加入25μl闪烁液(microscinttm-o,perkinelmer)后,在wallacmicrobetatrilux闪烁计数器中测量放射活性(cpm)。在存在nb35而不施用不相关纳米抗体时,cpm显著减少的那些文库化合物被认为是激动型配体。通过初步文库筛选鉴别的候选激动剂命中将以剂量应答的方式重新筛选。使用graphpadprism软件,计算每种候选激动剂在存在nb35和不相关的纳米抗体的条件下的%放射性配体替换曲线的ic50值。为了证实从头鉴别的化合物的有效的激动作用,在细胞的β2ar信号传递测定中评估这些化合物的剂量依赖性效应。这类测定的一个实例依赖于检测第二信使分子,如gαs介导的信号传递后的camp(例如,hithuntercamp测定技术,discoverx)。除了使用膜提取物和外源应用的nb35外,可以在用nb35作为胞内抗体共转染的、表达β2ar的细胞系(或来源膜)上实施放射性配体测定,从而使β2ar群体移向它的活性状态。可选的,可以使用重组g蛋白和β2ar通过nb35稳定β2ar的活性状态。

实施例的材料和方法

表达和纯化β2ar、gs异源三聚体和纳米抗体-35

在用重组杆状病毒(bestbac,expressionsystems)感染的sf-9昆虫细胞培养物中,表达在第365位截短的n-末端融合的t4溶菌酶-β2ar构建体(t4l-β2ar,下文详述),根据前述方法(kobilka等人,1995),将构建体溶解在正十二烷基-β-d-麦芽糖苷(ddm)中(参见图6关于纯化概述)。大部分分析实验和氘交换实验使用在第365位残基后截短的β2ar构建体(β2ar-365;seqidno:55)。m1flag亲和层析(sigma)作为最初的纯化步骤,再进行阿普洛尔-sepharose层析,用于选择功能性受体。使用后续的m1flag亲和层析步骤交换结合了受体的阿普洛尔与高亲和力激动剂bi-167107。洗脱结合了激动剂的受体,针对缓冲液(20mmhepesph7.5,100mmnacl,0.1%ddm和10μmbi-167107)透析,用λ磷酸酶(newenglandbiolabs)处理,用50kda截留分子量(mwco)的millipore浓缩仪浓缩至约50mgml-1。在旋转浓缩之间,将β2ar-365构建体而非t4l-β2ar用pngasef(newenglandbiolabs)处理,去除氨基末端n-连接糖基化。通过sds-page/考马斯亮蓝染色常规分析纯化的受体(参见图5a)。

在生长于insectxpress无血清培养基(lonza)中的high5昆虫细胞(invitrogen)内表达牛gαs短(bovinegαsshort)、与his6标签融合的大鼠gβ1和大鼠gγ2(参见表5)。培养物生长至150万格细胞/ml的密度,然后,用3种分开的苜蓿银纹夜蛾(autographacalifornica)核型多角体病毒感染,每种病毒含有1种1:1复合感染的g蛋白亚基的基因(病毒由dr.alfredgilman馈赠)。在孵育40-48小时后,通过离心收获感染的细胞,并重悬在每升培养体积75ml裂解缓冲液(50mmhepesph8.0,65mmnacl,1.1mmmgcl2,1mmedta,1xptt(35μg/ml苯甲基磺酰氟(phenylmethanesulfonylfluoride),32μg/ml甲苯磺酰基苯丙氨酰甲基氯酮(tosylphenylalanylchloromethylketone),32μg/ml甲苯磺酰基赖氨酰甲基氯酮),1xls(3.2μg/ml亮抑酶肽和3.2μg/ml大豆胰蛋白酶抑制剂)、5mmβ-me和10μmgdp)中。在氮空化贮罐(nitrogencavitationbomb,parrinstrumentcompany)中,用600psign2对悬浮液加压40分钟。在降压后,将裂解物离心,去除核与未裂解的细胞,然后,在180,000xg超速离心40分钟。使用dounce均质器,将沉淀的膜重悬在每升培养体积30ml洗涤缓冲液(50mmhepesph8.0,50mmnacl,100μmmgcl2,1xptt,1xls,5mmβ-me,10μmgdp)中,并在180,000xg再次离心40分钟。将洗净的沉淀团块重悬在小体积的洗涤缓冲液中,并用液氮瞬间冰冻。

融解冷冻的膜,用新鲜的洗涤缓冲液稀释至5mg/ml的总蛋白质浓度。向悬浮液中加入终浓度1.0%的胆酸钠去垢剂,加入终浓度5mm的mgcl2,每升培养体积加入0.05mg纯化的蛋白质磷酸酶5(内部制备)。样品在冰上搅拌40分钟,然后在180,000xg离心40分钟,去除不可溶的残渣。用ni-nta上样缓冲液(20mmhepesph8.0,363mmnacl,1.25mmmgcl2,6.25mm咪唑,0.2%anzergent3-12,1xptt,1xls,5mmβ-me,10μmgdp)稀释上清液5倍,缓慢的仔细添加缓冲液,避免使胆酸浓度过快下降至低于其临界微团浓度。每升培养体积加入3ml在ni-nta洗涤缓冲液1(20mmhepesph8.0,300mmnacl,2mmmgcl2,5mm咪唑,0.2%胆酸,0.15%anzergent3-12,1xptt,1xls,5mmβ-me,10μmgdp)中预平衡的ni-nta树脂(qiagen),在冰上搅拌样品20分钟。将树脂收集到重力柱,并用4x柱体积的ni-nta洗涤缓冲液1、ni-nta洗涤缓冲液2(20mmhepesph8.0,50mmnacl,1mmmgcl2,10mm咪唑,0.15%anzergent3-12,0.1%ddm,1xptt,1xls,5mmβ-me,10μmgdp)和ni-nta洗涤缓冲液3(20mmhepesph8.0,50mmnacl,1mmmgcl2,5mm咪唑,0.1%ddm,1xptt,1xls,5mmβ-me,10μmgdp)洗涤。用ni-nta洗脱缓冲液(20mmhepesph8.0,40mmnacl,1mmmgcl2,200mm咪唑,0.1%ddm,1xptt,1xls,5mmβ-me,10μmgdp)洗脱蛋白质。混合含蛋白质的级分,并加入mncl2至终浓度100μm。每升培养体积加入50μg纯化的λ蛋白磷酸酶(内部制备),在冰上孵育洗脱液并伴随搅拌30分钟。将洗脱液通过0.22μm滤膜,并直接上样到在monoq缓冲液a(20mmhepesph8.0,50mmnacl,100μmmgcl2,0.1%ddm,5mmβ-me,1xptt)中平衡的monoqhr16/10柱(gehealthcare)上。用150ml缓冲液a,以5ml/min洗涤柱,用超过350ml、达28%的monoq缓冲液b(除了1mnacl外,与缓冲液a相同)的线性梯度洗脱结合的蛋白质。将级分收集到沾有足够gdp的试管中,使终浓度为10μm。用具有10kdanmwl再生的纤维素膜(millipore)的搅拌型超滤池,将含gs的级分浓缩至2ml。在用s200缓冲液(20mmhepesph8.0,100mmnacl,1.1mmmgcl2,1mmedta,0.012%ddm,100μmtcep,2μmgdp)平衡的superdex200prepgradexk16/70柱(gehealthcare)上运行浓缩的样品。混合含有纯gs的级分,加入甘油至10%终浓度,然后使用30kdamwco再生纤维素amicon离心超滤装置,浓缩蛋白质至至少10mg/ml。然后,将浓缩的样品等分、瞬间冷冻,并储藏在-80°。来自8升细胞培养体积中的最终的、纯化的gs异源三聚体的典型产量是6mg。

根据前述方法,在大肠杆菌(escherichiacoli)菌株wk6的周质中表达纳米抗体-35(nb35)(seqidno:1),提取,并通过镍亲和层析纯化(rasmussen等人,2011),之后使用monos10/100gl柱(gehealthcare)进行离子交换层析(图7a)。用缓冲液(10mmhepesph7.5,100mmnacl)透析选定的nb35级分,用10kdamwcomillipore浓缩仪浓缩至约65mgml-1

蛋白质改造

为了增加获得r:g复合物晶体的可能性,使用两种对策着手增加受体胞外表面的极性表面面积。方法是用之前使用的球状蛋白质t4溶菌酶(t4l)替换柔性和假设无结构的n-末端,结晶并解析结合了卡拉洛尔的受体(rosenbaum等人,2007)。本文使用的构建体(t4l-β2ar)含有可切割的信号序列,后接m1flag表位(dykdddda;seqidno:70)、tev蛋白酶识别序列(enlyfqg;seqidno:71)、从n2至y161的噬菌体t4溶菌酶(包含c54t和c97a突变),以及与人β2ar序列的d29至g365融合的2个剩余的丙氨酸接头(seqidno:69定义的t4l-β2ar融合构建体)。将β2ar在n187的pngasef不可接触的糖基化位点突变为glu。用thr分别替换第一个胞外环中的m96和m98以增加另外的t4l-β2ar的低表达水平。苏氨酸突变不影响配体结合3h-二氢阿普洛尔的亲和力,但导致与异丙肾上腺素的亲和力少量减少,约2倍(数据未显示)。应注意,本文使用的野生型参照物β2ar由seqidno:72定义。

显微晶体学数据收集和加工

在advancedphotonsourcebeamline23id-b上实施数据收集。筛选了数百个晶体,使用自20个最强衍射晶体通常10度的衍射楔汇编最终的数据集。使用hkl2000(otwinowski等人,1997)实施所有的数据整理。虽然在许多情况下,在初步框架中可见超过的衍射,但放射性破坏和各向异性衍射产生在较高分辨率的壳(shell)中的较低的完整性。由ucla各向异性衍射服务商(strong等人,2006)对最终的数据集的分析提示:沿a*倒易轴的衍射比沿其他方向的衍射更好。基于沿着各倒易空间(reciprocalspace)轴的f/sigf截止值为3,在用于精修之前,将反射进行各向异性截断,沿着a*、b*和c*的分辨率限为2.9、3.2和3.2埃。由于高分辨率壳的较低完整性,报道了该结构的整体分辨率仅为但应该注意到,在精修和图计算的过程中,包括了一些达到的衍射数据。

结构解析和精修

使用phaser(mccoy等人,2007a,b),通过分子替换解析结构。在解析结构中,发现分子替换研究的顺序是关键性的。在使用的顺序中,研究模型是:来自gi异源三聚体g蛋白(pdbid:1gp2)、gsαras结构域(pdbid:1azt)、活性状态β2肾上腺素能受体(pdbid:3p0g)、β2结合纳米抗体(pdbid:3p0g)、t4溶菌酶(pdbid:2rh1)、gsα螺旋状结构域(pdbid:1azt)结构的β和γ亚基。在通过分子替换确定最初结构后,在phenix(afonine等人,2005)和buster(blanc等人,2004)中实施刚体精修和模拟退火,然后在coot(emsley等人,2004)中约束精修和手工重建。在迭代精修和手工调整后,使用den方法在cns中精修结构。虽然该结构的分辨率超过了den通常最有效的分辨率,但若干解析较差区域的存在提示了整合用于指导精修的额外信息可以提供更好的结果。使用的den参照物模型是如上所述作为分子替换研究的模型,例外的是nb35,它是非常有序的且对其不能获得更高分辨率的结构。使用pymol(thepymolmoleculargraphicssystem,1.3版,llc.)制图。表7给出了精修的统计学。

结合

如前所述,从感染杆状病毒的sf9细胞制备表达β2ar或β2ar-gs肽融合物的膜,和实施3h-双氢阿普洛尔(3h-dha)结合(swaminath等人,2002)。对于竞争结合,在收获至gf/b滤膜之前,用3h-dha(最终1.1nm)和递增浓度的(-)-异丙肾上腺素(iso)孵育膜1hr。以双位点结合模型拟合竞争数据,使用graphpad棱镜计算iso的高和低ki和分数。

纯化nt4lv2r

使用杆状病毒系统(pfastbac),在sf9细胞中表达n-末端融合的t4lv2r构建体(nt4l-v2r;seqidno:73)。按4×106细胞/ml的密度感染细胞,并在27℃振荡培养瓶48h。收获后,在包含10mmtris-hclph7.5,1mmedta,1μmtolvaptan(sigma)和2mgml-1用于阻断反应性半胱氨酸的碘乙酰胺的缓冲液中通过渗透压休克,裂解细胞。在包含0.5%十二烷基麦芽糖苷(ddm)、0.3%cholate、0.03%胆固醇半琥珀酸酯(chs)、20mmhepesph7.5,0.5mnacl,30%v/v甘油、2mgml-1碘乙酰胺和1μmtolvaptan的溶解缓冲液中,用dounce均质器从sf9膜中提取nt4l-v2r。在离心后,向上清液中添加镍-nta琼脂糖,搅拌2h,然后用100g旋转(spin)分批洗涤,每次5min,洗涤缓冲液为0.1%ddm,0.03%cholate,0.01%chs,20mmhepesph7.5和0.5mnacl。将树脂倒入玻璃柱内,在补充了300mm咪唑的洗涤缓冲液中洗脱结合的受体。使用抗-flagm1亲和力树脂进一步纯化nt4l-v2r,与激动剂avp交换配体。将ni-nta树脂洗脱液上样到抗-flagm1树脂上,在存在10μmavp的条件下充分洗涤。然后,在存在1μmavp的条件下,从抗-flagm1亲和力树脂上用0.2mgml-1flag肽和2mmedta洗脱受体,并使用100kdamwco浓缩仪浓缩。

表2.纳米抗体列表

表4.纳米抗体的核酸序列

表5:g蛋白亚基的同种型的实例

表6.在r:g界面内的潜在分子间相互作用

表7.数据收集和精修统计

*括号中是最高的壳统计。a由于电子密度解析较差,从模型中省略了这些区域。这些残基范围内不包括未建模的纯化标签。b构建体省略了β2ar的第1-28位残基,t4l与跨膜螺旋1的氨基末端融合,有利于结晶。c构建体省略了t4l残基。d如molprobity定义的。

参考文献

-afonine,p.v.,grosse-kunstleve,r.w.,&adams,p.d.(2005).arobustbulk-solventcorrectionandanisotropicscalingprocedure.actacrystallographica.sectiond,biologicalcrystallography,61,850-5。

-baltensperger,k.等人thebeta-adrenergicreceptorisasubstratefortheinsulinreceptortyrosinekinase.jbiolchem271,1061-1064(1996)。

-binz等人,naturebiotech.,22:575-582(2004)。

-blanc,e.,roversi,p.,vonrhein,c.,flensburg,c.,lea,s.m.,bricogne,g.,等人(2004).refinementofseverelyincompletestructureswithmaximumlikelihoodinbuster-tnt.actacrystallographica.sectiond,biologicalcrystallography,60,2210-21。

-caffrey(2003).membraneproteincrystallization.jstruct.biol.2003142:108-32。

-caffrey,m.&cherezov,v.crystallizingmembraneproteinsusinglipidicmesophases.natprotoc4,706-731,(2009)。

-chae,p.s.等人maltose-neopentylglycol(mng)amphiphilesforsolubilization,stabilizationandcrystallizationofmembraneproteins.natmethods7,1003-1008(2010)。

-chelikani等人proteinsci.200615:1433-40。

-chini,b.,&parenti,m.(2009).g-protein-coupledreceptors,cholesterolandpalmitoylation:factsaboutfats.journalofmolecularendocrinology,42(5),371-9。

-chomczynski,p.和sacchi,n.,1987.singlestepmethodofrnaisolationbyacidguanidiumthiocyanate-phenol-chloroformextraction.anal.

biochem.162,页156。

-conrathk,pereiraas,martinsce,timóteocg,tavaresp,spinellis,kinnej,flaudropsc,cambillauc,muyldermanss,mourai,mourajj,tegonim,desmytera.camelidnanobodiesraisedagainstanintegralmembraneenzyme,nitricoxidereductase.proteinsci.2009mar;18(3):619-28。

-conrathk.e.,m.lauwereys,m.galleni等人,antimicrobagentschemother45(10),2807(2001)。

-costanzis,vilars(2011).insilicoscreeningforagonistsandblockersofthebeta(2)adrenergicreceptor:implicationsofinactiveandactivatedstatestructures.journalofcomputationalchemistry33:561-572。

-dayp.w.,rasmussens.g.,parnotc.,fungj.j.,masooda.,kobilkat.s.,yaox.j.,choih.j.,weisw.i.和rohrerd.k.等人,amonoclonalantibodyforgprotein-coupledreceptorcrystallography,natmethods4(2007),页927–929。

-delean,a.,j.m.stadel,等人(1980)."aternarycomplexmodelexplainstheagonist-specificbinding-propertiesoftheadenylatecyclase-coupledbeta-adrenergic-receptor."journalofbiologicalchemistry255(15):7108-7117。

-derewendaz.s.rationalproteincrystallizationbymutationalsurfaceengineering,structure(camb)12(2004),页529–535。

-domanska,k.等人atomicstructureofananobody-trappeddomain-swappeddimerofanamyloidogenicbeta2-microglobulinvariant.procnatlacadsciusa108,1314-1319,(2011)。

-emsley,p.&cowtan,k.coot:model-buildingtoolsformoleculargraphics.actacrystallogrdbiolcrystallogr60,2126-2132,(2004)。

-eroglu等人embo20023:491^96

-eroglu等人proc.natl.acad.sci.2003100:10219-10224

-faham等人crystallizationofbacteriorhodopsinfrombicelleformulationsatroomtemperature.proteinsci.200514:836-40.2005

-faham等人,bicellecrystallization:anewmethodforcrystallizingmembraneproteinsyieldsamonomericbacteriorhodopsinstructure.jmoibiol.2002feb8;316(1):1-6。

-foord,s.m.,t.i.bonner,等人(2005)."internationalunionofpharmacology.xlvi.gprotein-coupledreceptorlist."pharmacologicalreviews57(2):279-288。

-fredriksson,r.,m.c.lagerstrom,等人(2003)."theg-protein-coupledreceptorsinthehumangenomeformfivemainfamilies.phylogeneticanalysis,paralogongroups,andfingerprints."molecularpharmacology63(6):1256-1272.

-gebauer&skerra(2009)currentopinioninchemicalbiology13,245-255

-george等人,natrevdrugdiscov1:808-820(2002)

-gouaux,it'snotjustaphase:crystallizationandx-raystructuredeterminationofbacteriorhodopsininlipidiccubicphases.structure.19986:5-10;

-hamers-casterman,c.,t.atarhouch,s.muyldermans等人naturallyoccurringantibodiesdevoidoflightchains.nature363,446-448,doi:10.1038/363446a0(1993)。

-hendricksonwa.determinationofmacromolecularstructuresfromanomalousdiffractionofsynchrotronradiation.science.1991oct4;254(5028):51-8。

-hofmannk.p.,p.scheerer,p.w.hildebrand等人,trendsbiochemsci34(11),540(2009)。

-huntec.andmichelh.,crystallisationofmembraneproteinsmediatedbyantibodyfragments,curropinstructbiol12(2002),页503–508。

-jameson,e.e.等人(2005).real-timedetectionofbasalandstimulatedgproteingtpaseactivityusingfluorescentgtpanalogues.jbiolchem280,7712-7719。

-kenakin,trendspharmacolsci25:186-192(2002)

-kobilka等人(2007)trendsinpharmacologicalsciences28,397-406。

-kobilka,b.k.aminoandcarboxylterminalmodificationstofacilitatetheproductionandpurificationofagprotein-coupledreceptor.analbiochem231,269-271(1995)。

-koide等人,j.moibiol,284:1141-1151(1998))

-kolakowski,l.f.(1994)."gcrdb-ag-protein-coupledreceptordatabase."receptors&channels2(1):1-7。

-kolb,p.,d.m.rosenbaum,等人(2009)."structure-baseddiscoveryofbeta(2)-adrenergicreceptorligands."proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica106(16):6843-6848。

-kuszak,a.j.,s.pitchiaya,等人(2009)."purificationandfunctionalreconstitutionofmonomericmu-opioidreceptors:allostericmodulationofagonistbindingbygi2."thejournalofbiologicalchemistry284:26732-26741。

-m.c.和h.b.(2008)."structuraldiversityofgprotein-coupledreceptorsandsignificancefordrugdiscovery."naturereviews.drugdiscovery7:339-357。

-landau等人,lipidiccubicphases:anovelconceptforthecrystallizationofmembraneproteins.proc.natl.acad.sci.199693:14532-5

-lee,a.g.(2004).howlipidsaffecttheactivitiesofintegralmembraneproteins.biochimicaetbiophysicaacta,1666(1-2),62-87.

-leegm,craikcs(2009).trappingmovingtargetswithsmallmolecules.science.apr10;324(5924):213-5。

-lefranc,m.p.,c.pommie,等人(2003)."imgtuniquenumberingforimmunoglobulinandtcellreceptorvariabledomainsandigsuperfamilyv-likedomains."developmentalandcomparativeimmunology27(1):55-77。

-lih.,dunnj.j.,luftb.j.andlawsonc.l.,crystalstructureoflymediseaseantigenoutersurfaceproteinacomplexedwithanfab,procnatlacadsciusa94(1997),页3584–3589

-luca等人proc.natl.acad.sci.2003100:10706-l1

-lynchkevinr.(编)identificationandexpressionofgprotein-coupledreceptorspublishedbyjohnwiley&sons(march1998)

-mansoor等人proc.natl.acad.sci.2006103:3060-3065

-marchese等人genomics23:609-618,1994

-mccoy,a.j.solvingstructuresofproteincomplexesbymolecularreplacementwithphaser.actacrystallogrdbiolcrystallogr63,32-41(2007)。

-mccoy,a.j.,grosse-kunstleve,r.w.,adams,p.d.,winn,m.d.,storoni,l.c.,read,r.j.,等人(2007).phasercrystallographicsoftware.journalofappliedcrystallography,40(pt4),658-674.

-mcewen,d.p.,gee,k.r.,kang,h.c.&neubig,r.r.(2001)fluorescentbodipy-gtpanalogs:real-timemeasurementofnucleotidebindingtogproteins.analbiochem291,109-117。

-misquitta,l.v.等人membraneproteincrystallizationinlipidicmesophaseswithtailoredbilayers.structure12,2113-2124,(2004)。

-moro,o.,lameh,j.,hogger,p.&sadee,w.hydrophobicaminoacidinthei2loopplaysakeyroleinreceptor-gproteincoupling.jbiolchem268,22273-22276(1993)。

-niu等人,biophysj.200589:1833-1840

-nollert等人lipidiccubicphasesasmatricesformembraneproteincrystallizationmethods.200434:348-53

-ostermeierc.,iwatas.,ludwigb.andmichelh.,fvfragment-mediatedcrystallizationofthemembraneproteinbacterialcytochromecoxidase,natstructbiol2(1995),页842–846。

-otwinowski,z.,&minor,w.(1997).processingofx-raydiffractiondatacollectedinoscillationmode.methodsinenzymology,276,307–325.

-palczewski,k.等人crystalstructureofrhodopsin:agprotein-coupledreceptor[seecomments].science289,739-745(2000)。

-probst等人1992,dnacellbiol.199211:1-20;

-qianzm,lih,sunh和hok(2002).targeteddrugdeliveryviathetransferringreceptor-mediatedendocytosispathway.pharmacolrev54,561-587。

-rasmussen等人(2011)nature469,175-180。

-rasmussens.g.,choih.j.,rosenbaumd.m.,kobilkat.s.,thianf.s.,edwardsp.c.,burghammerm.,ratnalav.r.,sanishvilir.和fischettir.f.等人,crystalstructureofthehumanbeta2adrenergicg-protein-coupledreceptor,nature450(2007),页383–387。

-riechmann和muyldermansj.immunol.methods2000;240:185-195。

-rios等人,pharmacolther92:71-87(2001)。

-ritter,s.l.,&hall,r.a.(2009).fine-tuningofgpcractivitybyreceptor-interactingproteins.naturereviews.molecularcellbiology,10(12),819-30.naturepublishinggroup.doi:10.1038/nrm2803.)

-rosenbaumd.m.,s.g.rasmussen,andb.k.kobilka,nature459(7245),356(2009)。

-rosenbaum,d.m.等人structureandfunctionofanirreversibleagonist-beta(2)adrenoceptorcomplex.nature469,236-240(2011)。

-rosenbaum,d.m.,v.cherezov,等人(2007)."gpcrengineeringyieldshigh-resolutionstructuralinsightsintobeta2-adrenergicreceptorfunction."science318:1266-1273。

-rummel等人,lipidiccubicphases:newmatricesforthethree-dimensionalcrystallizationofmembraneproteins.j.struct.biol.1998121:82-91;

-sawantr,torchilinv.intracellulartransductionusingcell-penetratingpeptides.molbiosyst.2010apr;6(4):628-40.epub2009dec21。

-seifert等人(1998).reconstitutionofbeta2-adrenoceptor-gtp-binding-proteininteractioninsf9cells--highcouplingefficiencyinabeta2-adrenoceptor-g(salpha)fusionprotein.eur.j.biochem.255:369-382。

-shimada等人j.biol.chem.2002277:31774-80

-skerra,j.molecularrecognition,13:167-187(2000)

-sprang,s.r.gproteinmechanisms:insightsfromstructuralanalysis.annurevbiochem66,639-678(1997)。

-starovasnik等人,proc.natl.acad.sd.usa,94:10080-10085(1997)

-steyaertj,kobilkabk(2011).nanobodystabilizationofgprotein-coupledreceptorconformationalstates.curropinstructbiol.aug;21(4):567-72。

-strong,m.等人towardthestructuralgenomicsofcomplexes:crystalstructureofape/ppeproteincomplexfrommycobacteriumtuberculosis.procnatlacadsciusa103,8060-8065,(2006)。

-sunahara,r.k.,tesmer,j.j.,gilman,a.g.&sprang,s.r.crystalstructureoftheadenylylcyclaseactivatorgsalpha[seecomments].science278,1943-1947(1997)。

-swaminath,g.,steenhuis,j.,kobilka,b.&lee,t.w.allostericmodulationofbeta2-adrenergicreceptorbyzn(2+).molpharmacol61,65-72.(2002)。

-tatsuyahaga(编),gprotein-coupledreceptors,publishedbycrcpress(september24,1999)

-vaneps,n.等人interactionofagproteinwithanactivatedreceptoropenstheinterdomaininterfaceinthealphasubunit.procnatlacadsciusa(2011)。

-wall,m.a.等人thestructureofthegproteinheterotrimergia1b1g2.cell83,1047-1058(1995)。

-warne,t.等人structureofabeta1-adrenergicg-protein-coupledreceptor.nature454,486-491,(2008)。

-watson,s.(编)g-proteinlinkedreceptorfactsbook,publishedbyacademicpress(第一版;1994)。

-wessjurgen(编)structure-functionanalysisofgprotein-coupledreceptorspublishedbywiley-liss(1stedition;october15,1999)

-whorton,m.r.等人amonomericgprotein-coupledreceptorisolatedinahigh-densitylipoproteinparticleefficientlyactivatesitsgprotein.procnatlacadsciusa104,7682-7687(2007)。

-whorton,m.r.,s.g.f.rasmussen,等人(2009)."theeffectofligandefficacyontheformationandstabilityofagpcr-gproteincomplex."pnas106:1-6。

本发明涉及,例如但不限于,如下实施方案:

1、结合结构域,其针对和/或特异性结合包含gpcr和g蛋白的复合物。

2、根据实施方案1的结合结构域,相比分别与异源三聚体g蛋白单独和/或与gpcr单独结合,其与复合物结合的亲和力更高。

3、根据实施方案1的结合结构域,其特异性结合g蛋白,而不结合gpcr。

4、根据实施方案1的结合结构域,其中复合物还包含受体配体。

5、根据实施方案4的结合结构域,其中复合物由gpcr、g蛋白和受体配体组成。

6、根据实施方案4或5的任一项的结合结构域,其中所述受体配体是激动剂。

7、根据实施方案1至6的任一项的结合结构域,其中g蛋白处于不含核苷酸的形态中。

8、根据实施方案1至7的任一项的结合结构域,其特异性结合位于所述g蛋白的α和β亚基之间的界面上的构象表位。

9、根据实施方案1至8的任一项的结合结构域,其

a)在存在核苷酸的条件下阻止或抑制复合物解离,或

b)阻止或抑制核苷酸与g蛋白结合,或

c)能替换g蛋白的核苷酸。

10、根据实施方案7至9的任一项的结合结构域,其中所述核苷酸是鸟嘌呤核苷酸,例如gdp或gtp,或其类似物,如gtpγs。

11、根据实施方案1至10的任一项的结合结构域,其中gpcr处于活性构象中。

12、根据实施方案1至11的任一项的结合结构域,其中g蛋白选自gs、gi、go、gt、ggust、gz、golf、gq、g12、g13。

13、根据实施方案1至11的任一项的结合结构域,其中gpcr选自gs偶联受体、gi偶联受体、go偶联受体、gt偶联受体、ggust偶联受体、golf偶联受体、gq偶联受体、g12偶联受体、g13偶联受体。

14、根据实施方案1至13的任一项的结合结构域,其中所述gpcr是人蛋白质。

15、根据实施方案1至14的任一项的结合结构域,其中所述结合结构域是包含这样的氨基酸序列的免疫球蛋白单可变结构域,所述氨基酸序列包含根据下列通式(1)的4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1)。

16、根据实施方案15的结合结构域,其中免疫球蛋白单可变结构域包含这样的氨基酸序列,所述氨基酸序列包含根据下列通式(1)的4个框架区(fr1至fr4)和3个互补决定区(cdr1至cdr3):

fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4(1),

并且其中cdr1选自:

a)seqidno:13-18,

b)与seqidno:13-18具有至少80%氨基酸同一性的多肽,

c)与seqidno:13-18具有3、2或1个氨基酸差异的多肽,

并且其中cdr2选自:

a)seqidno:25-30,

b)与seqidno:25-30具有至少80%氨基酸同一性的多肽,

c)与seqidno:25-30具有3、2或1个氨基酸差异的多肽,

并且其中cdr3选自:

a)seqidno:37-42,

b)与seqidno:37-42具有至少80%氨基酸同一性的多肽,

c)与seqidno:37-42具有3、2或1个氨基酸差异的多肽。

17、根据实施方案15的结合结构域,其中免疫球蛋白单可变结构域是纳米抗体(vhh)。

18、根据实施方案17的结合结构域,其中纳米抗体具有选自seqidno:1至6的氨基酸序列或其变体。

19、根据实施方案1至18的任一项的结合结构域,其中所述结合结构域包含在多肽中。

20、根据实施方案1至19的任一项的结合结构域,其中所述结合结构域被固定在固体支持物上。

21、包含根据实施方案1至20的任一项的结合结构域的复合物。

22、根据实施方案21的复合物,其还包含gpcr、g蛋白和任选的受体配体。

23、根据实施方案21至22的任一项的复合物,其是结晶的。

24、核酸序列,其编码根据实施方案1至20的任一项的结合结构域的氨基酸序列。

25、重组载体,其包含根据实施方案24的核酸序列。

26、细胞,其包含根据实施方案25的载体或根据实施方案24的核酸序列。

27、根据实施方案26的细胞,其表达或能够表达gpcr和/或g蛋白。

28、根据实施方案26至27的任一项的细胞的细胞培养物。

29、根据实施方案26至27的任一项的细胞或根据实施方案28的细胞培养物的膜制品。

30、根据实施方案1至20的任一项的结合结构域的用途,用于使复合物稳定化,所述复合物包含gpcr和g蛋白和任选的处于功能构象状态的受体配体。

31、根据实施方案30的用途,其用于阻止复合物在存在核苷酸的条件下解离,所述核苷酸特别是鸟嘌呤核苷酸或其类似物,如gtpγs。

32、根据实施方案1至20的任一项的结合结构域的用途,用于使复合物结晶和/或解析复合物结构,所述复合物包含gpcr和g蛋白和任选的受体配体。

33、根据实施方案1至20的任一项的结合结构域,或根据实施方案26至27的任一项的细胞,或根据实施方案29的膜制品的用途,用于筛选调控gpcr的信号传递活性的化合物。

34、根据实施方案30至33的任一项的用途,其中gpcr处于活性构象中。

35、根据实施方案1至20的任一项的结合结构域的用途,用于捕获一个或多个相互作用的蛋白质。

36、捕获和/或纯化包含gpcr和g蛋白的复合物的方法,方法包括步骤:

a)提供根据实施方案1至20的任一项的结合结构域,和

b)允许结合结构域与包含gpcr和g蛋白以及任选地受体配体的复合物结合,和

c)任选的分离步骤b)中形成的复合物。

37、确定包含gpcr和g蛋白的复合物的晶体结构的方法,方法包括步骤:

a)提供根据实施方案1至20的任一项的结合结构域,和

b)允许结合结构域与包含gpcr和g蛋白和任选地受体配体的复合物结合,和

c)使步骤b)中形成的复合物结晶。

38、根据实施方案1至20的任一项的结合结构域的用途,用于调控gpcr受体信号传递,特别是g蛋白介导的gpcr受体信号传递。

39、生产针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域的方法,方法包括步骤:

a)在合适的细胞表达系统中表达根据实施方案24的核酸,和任选的

b)分离和/或纯化结合结构域。

40、筛选针对和/或特异性结合包含gpcr和g蛋白的复合物的结合结构域的方法,方法包括步骤:

a)提供多个结合结构域,和

b)在所述多个结合结构域中,筛选与包含gpcr和g蛋白的复合物结合的结合结构域,和

c)分离与复合物结合的结合结构域。

序列表

<110>非营利性组织佛兰芒综合大学生物技术研究所(vibvzw)

布鲁塞尔自由大学(vrijeuniversiteitbrussel)

利兰斯坦福青年大学托管委员会(theboardoftrusteesofthelelandstanfordjunioruniversity)

密执安大学董事会(theregentsoftheuniversityofmichigan)

<120>针对gpcr:g蛋白复合物的结合结构域及来自其的用途

<130>js/gprot/380

<150>us61/571,159

<151>2011-06-21

<150>ep11181357.2

<151>2011-09-15

<160>73

<170>patentin版本3.5

<210>1

<211>138

<212>prt

<213>家羊驼(lamaglama)

<400>1

glnvalglnleuglngluserglyglyglyleuvalglnproglygly

151015

serleuargleusercysalaalaserglyphethrpheserasntyr

202530

lysmetasntrpvalargglnalaproglylysglyleuglutrpval

354045

seraspileserglnserglyalaserilesertyrthrglyserval

505560

lysglyargphethrileserargaspasnalalysasnthrleutyr

65707580

leuglnmetasnserleulysprogluaspthralavaltyrtyrcys

859095

alaargcysproalaprophethrargaspcyspheaspvalthrser

100105110

thrthrtyralatyrargglyglnglythrglnvalthrvalserser

115120125

hishishishishishisgluprogluala

130135

<210>2

<211>138

<212>prt

<213>家羊驼

<400>2

glnvalglnleuglngluserglyglyglyleuvalglnproglygly

151015

serleuargleusercysalaalaserglyphethrpheserasntyr

202530

valmetasntrpvalargglnalaproglylysglyleuglutrpval

354045

seraspileserasnglyglyglythrthrsertyralaserserval

505560

lysglyargphethrileserargaspasnalalysasnthrleutyr

65707580

leuglnmetasnglyleulysproalaaspthralavaltyrtyrcys

859095

alaargcysproalaprophethrasnaspcysmetaspilethrser

100105110

thrthrtyralatyrargglyglnglythrglnvalthrvalserser

115120125

hishishishishishisgluprogluala

130135

<210>3

<211>129

<212>prt

<213>家羊驼

<400>3

glnvalglnleuglngluserglyglyglyservalglnalaglygly

151015

serleuargleusercysthrvalserglythrilepheservalthr

202530

valmetglytrptyrargglnalaproglylysglnarggluleuval

354045

alaglyphethrasnthrargasnthrasntyrvalaspservallys

505560

glyargphethrileserlysaspseralalysasnthrmettyrleu

65707580

glnmetasnserleulysprogluaspthralavaltyrtyrcysasn

859095

valargargtrpglyglythrasntrpasnasptyrtrpglyglngly

100105110

thrglnvalthrvalserserhishishishishishisgluproglu

115120125

ala

<210>4

<211>129

<212>prt

<213>家羊驼

<400>4

glnvalglnleuglngluserglyglyglyphevalglnalaglygly

151015

serleuargleusercysalaalaserglyserilepheserlysasn

202530

thrmetalatrppheargglnalaproglylysgluarggluleuval

354045

alaalaserprothrglyglyserthralatyrlysaspservallys

505560

glyargphethrileserargaspseralalysasnthrvalleuleu

65707580

glnmetasnvalleulysprogluaspthralavaltyrtyrcyshis

859095

leuargglnasnasnargglysertrpphehistyrtrpglyglngly

100105110

thrglnvalthrvalserserhishishishishishisgluproglu

115120125

ala

<210>5

<211>129

<212>prt

<213>家羊驼

<400>5

glnvalglnleuglngluserglyglyglyleuvalglnalaglygly

151015

serleuargleusercysalavalserglythrilepheaspilethr

202530

prometglytrptyrargglnthrproglylysglnarggluvalval

354045

alaaspleuthrserargglythrthrasntyralaaspservallys

505560

glyargphethrileserargaspasnalalyslysmetleutyrleu

65707580

glnmetasnserleulysseraspaspthrglyvaltyrtyrcysasn

859095

vallysargtrpglyglyileglytrpasnasptyrtrpglyglngly

100105110

thrglnvalthrvalserserhishishishishishisgluproglu

115120125

ala

<210>6

<211>129

<212>prt

<213>家羊驼

<400>6

glnvalglnleuglngluserglyglyglyleuvalglnserglygly

151015

serleuargleusercysvalalaserglypheargpheserasnphe

202530

prometmettrpvalargglnalaproglylysglyleuglutrpval

354045

serleuileserileglyglyserthrthrasntyralaaspserval

505560

lysglyargphethrileserargaspasnalalysasnthrleuphe

65707580

leuglnmetasnserleulysprogluaspthralavaltyrtyrcys

859095

alalystyrleuglyargleuvalproprothrthrgluglyglngly

100105110

thrglnvalthrvalserserhishishishishishisgluproglu

115120125

ala

<210>7

<211>25

<212>prt

<213>家羊驼

<400>7

glnvalglnleuglngluserglyglyglyleuvalglnproglygly

151015

serleuargleusercysalaalaser

2025

<210>8

<211>25

<212>prt

<213>家羊驼

<400>8

glnvalglnleuglngluserglyglyglyleuvalglnproglygly

151015

serleuargleusercysalaalaser

2025

<210>9

<211>25

<212>prt

<213>家羊驼

<400>9

glnvalglnleuglngluserglyglyglyservalglnalaglygly

151015

serleuargleusercysthrvalser

2025

<210>10

<211>25

<212>prt

<213>家羊驼

<400>10

glnvalglnleuglngluserglyglyglyphevalglnalaglygly

151015

serleuargleusercysalaalaser

2025

<210>11

<211>25

<212>prt

<213>家羊驼

<400>11

glnvalglnleuglngluserglyglyglyleuvalglnalaglygly

151015

serleuargleusercysalavalser

2025

<210>12

<211>25

<212>prt

<213>家羊驼

<400>12

glnvalglnleuglngluserglyglyglyleuvalglnserglygly

151015

serleuargleusercysvalalaser

2025

<210>13

<211>8

<212>prt

<213>家羊驼

<400>13

glyphethrpheserasntyrlys

15

<210>14

<211>8

<212>prt

<213>家羊驼

<400>14

glyphethrpheserasntyrval

15

<210>15

<211>8

<212>prt

<213>家羊驼

<400>15

glythrilepheservalthrval

15

<210>16

<211>8

<212>prt

<213>家羊驼

<400>16

glyserilepheserlysasnthr

15

<210>17

<211>8

<212>prt

<213>家羊驼

<400>17

glythrilepheaspilethrpro

15

<210>18

<211>8

<212>prt

<213>家羊驼

<400>18

glypheargpheserasnphepro

15

<210>19

<211>17

<212>prt

<213>家羊驼

<400>19

metasntrpvalargglnalaproglylysglyleuglutrpvalser

151015

asp

<210>20

<211>17

<212>prt

<213>家羊驼

<400>20

metasntrpvalargglnalaproglylysglyleuglutrpvalser

151015

asp

<210>21

<211>17

<212>prt

<213>家羊驼

<400>21

metglytrptyrargglnalaproglylysglnarggluleuvalala

151015

gly

<210>22

<211>17

<212>prt

<213>家羊驼

<400>22

metalatrppheargglnalaproglylysgluarggluleuvalala

151015

ala

<210>23

<211>17

<212>prt

<213>家羊驼

<400>23

metglytrptyrargglnthrproglylysglnarggluvalvalala

151015

asp

<210>24

<211>17

<212>prt

<213>家羊驼

<400>24

metmettrpvalargglnalaproglylysglyleuglutrpvalser

151015

leu

<210>25

<211>8

<212>prt

<213>家羊驼

<400>25

ileserglnserglyalaserile

15

<210>26

<211>8

<212>prt

<213>家羊驼

<400>26

ileserasnglyglyglythrthr

15

<210>27

<211>7

<212>prt

<213>家羊驼

<400>27

phethrasnthrargasnthr

15

<210>28

<211>7

<212>prt

<213>家羊驼

<400>28

serprothrglyglyserthr

15

<210>29

<211>7

<212>prt

<213>家羊驼

<400>29

leuthrserargglythrthr

15

<210>30

<211>8

<212>prt

<213>家羊驼

<400>30

ileserileglyglyserthrthr

15

<210>31

<211>38

<212>prt

<213>家羊驼

<400>31

sertyrthrglyservallysglyargphethrileserargaspasn

151015

alalysasnthrleutyrleuglnmetasnserleulysprogluasp

202530

thralavaltyrtyrcys

35

<210>32

<211>38

<212>prt

<213>家羊驼

<400>32

sertyralaserservallysglyargphethrileserargaspasn

151015

alalysasnthrleutyrleuglnmetasnglyleulysproalaasp

202530

thralavaltyrtyrcys

35

<210>33

<211>38

<212>prt

<213>家羊驼

<400>33

asntyrvalaspservallysglyargphethrileserlysaspser

151015

alalysasnthrmettyrleuglnmetasnserleulysprogluasp

202530

thralavaltyrtyrcys

35

<210>34

<211>38

<212>prt

<213>家羊驼

<400>34

alatyrlysaspservallysglyargphethrileserargaspser

151015

alalysasnthrvalleuleuglnmetasnvalleulysprogluasp

202530

thralavaltyrtyrcys

35

<210>35

<211>38

<212>prt

<213>家羊驼

<400>35

asntyralaaspservallysglyargphethrileserargaspasn

151015

alalyslysmetleutyrleuglnmetasnserleulysseraspasp

202530

thrglyvaltyrtyrcys

35

<210>36

<211>38

<212>prt

<213>家羊驼

<400>36

asntyralaaspservallysglyargphethrileserargaspasn

151015

alalysasnthrleupheleuglnmetasnserleulysprogluasp

202530

thralavaltyrtyrcys

35

<210>37

<211>21

<212>prt

<213>家羊驼

<400>37

alaargcysproalaprophethrargaspcyspheaspvalthrser

151015

thrthrtyralatyr

20

<210>38

<211>21

<212>prt

<213>家羊驼

<400>38

alaargcysproalaprophethrasnaspcysmetaspilethrser

151015

thrthrtyralatyr

20

<210>39

<211>13

<212>prt

<213>家羊驼

<400>39

asnvalargargtrpglyglythrasntrpasnasptyr

1510

<210>40

<211>13

<212>prt

<213>家羊驼

<400>40

hisleuargglnasnasnargglysertrpphehistyr

1510

<210>41

<211>13

<212>prt

<213>家羊驼

<400>41

asnvallysargtrpglyglyileglytrpasnasptyr

1510

<210>42

<211>12

<212>prt

<213>家羊驼

<400>42

alalystyrleuglyargleuvalproprothrthr

1510

<210>43

<211>11

<212>prt

<213>家羊驼

<400>43

argglyglnglythrglnvalthrvalserser

1510

<210>44

<211>11

<212>prt

<213>家羊驼

<400>44

argglyglnglythrglnvalthrvalserser

1510

<210>45

<211>11

<212>prt

<213>家羊驼

<400>45

trpglyglnglythrglnvalthrvalserser

1510

<210>46

<211>11

<212>prt

<213>家羊驼

<400>46

trpglyglnglythrglnvalthrvalserser

1510

<210>47

<211>11

<212>prt

<213>家羊驼

<400>47

trpglyglnglythrglnvalthrvalserser

1510

<210>48

<211>11

<212>prt

<213>家羊驼

<400>48

gluglyglnglythrglnvalthrvalserser

1510

<210>49

<211>417

<212>prt

<213>家羊驼

<400>49

cysalaglyglythrglycysalaglycysthrglycysalaglygly

151015

alaglythrcysthrglyglyalaglyglyalaglyglycysthrthr

202530

glyglythrglycysalaglycyscysthrglyglyglyglyglygly

354045

thrcysthrcysthrglyalaglyalacysthrcysthrcyscysthr

505560

glythrglycysglyglycyscysthrcysthrglyglyalathrthr

65707580

cysalacyscysthrthrcysalaglycysalaalathrthralathr

859095

alaalaalaalathrglyalaalacysthrglyglyglythrcyscys

100105110

glycyscysalaglyglycysthrcyscysalaglyglyalaalaala

115120125

glyglyglyglycysthrcysglyalaglythrglyglyglythrcys

130135140

thrcysalaglyalathralathrthrthrcysthrcysalaglyala

145150155160

glythrglyglythrglycysthralaglycysalathralaalagly

165170175

thrthralacysalacysalaglyglycysthrcyscysglythrgly

180185190

alaalaglyglyglycyscysglyalathrthrcysalacyscysala

195200205

thrcysthrcyscysalaglyalaglyalacysalaalacysglycys

210215220

cysalaalaglyalaalacysalacysglycysthrglythralathr

225230235240

cysthralacysalaalaalathrglyalaalacysalaglycyscys

245250255

thrglyalaalaglycyscysthrglyalaglyglyalacysalacys

260265270

glyglycyscysglythrcysthralathrthralacysthrglythr

275280285

glycyscysalaglyalathrglythrcyscysglyglycyscyscys

290295300

cysalathrthrcysalacysglyalaglyalaglyalathrthrgly

305310315320

thrthrthrthrglyalacysglythrglyalacysthralaglythr

325330335

alacyscysalacysglythralathrglycyscysthralacysala

340345350

glyglyglyglycyscysalaglyglyglyglyalacyscyscysala

355360365

glyglythrcysalacyscysglythrcysthrcyscysthrcysala

370375380

cysalacyscysalacyscysalathrcysalacyscysalathrcys

385390395400

alacysglyalaalacyscysthrglyalaalaglycyscysthrala

405410415

gly

<210>50

<211>417

<212>prt

<213>家羊驼

<400>50

cysalaglyglythrglycysalaglycysthrglycysalaglygly

151015

alaglythrcysthrglyglyalaglyglyglyglyglycysthrthr

202530

glyglythrglycysalaglycyscysthrglyglyglyglyglygly

354045

thrcysthrcysthrglyalaglyalacysthrcysthrcyscysthr

505560

glythrglycysalaglycyscysthrcysthrglyglyalathrthr

65707580

cysalacysthrthrthrcysalaglythralaalacysthralathr

859095

glythrcysalathrglyalaalacysthrglyglyglythrcyscys

100105110

glycyscysalaglyglycysthrcyscysalaglyglyalaalaala

115120125

glyglyglyglycysthrcysglyalaglythrglyglyglythrcys

130135140

thrcysalaglyalathralathrthrthrcysthralaalathrgly

145150155160

glycysglyglythrglyglythralacyscysalacysalaalagly

165170175

thrthralathrglycysalaalaglycysthrcyscysglythrgly

180185190

alaalaglyglyglycyscysglyalathrthrcysalacyscysala

195200205

thrcysthrcyscysalaglyalaglyalacysalaalacysglycys

210215220

cysalaalaglyalaalacysalacysglycysthrglythralathr

225230235240

cysthrglycysalaalaalathrglyalaalacysglyglycyscys

245250255

thrglyalaalaglycyscysthrglycysglyglyalacysalacys

260265270

glyglycyscysglythrcysthralathrthralacysthrglythr

275280285

glycysalaalaglyalathrglythrcyscysglyglycyscyscys

290295300

cysalathrthrcysalacysglyalaalacysglyalathrthrgly

305310315320

thralathrglyglyalacysalathralaalacysthralaglythr

325330335

alacyscysalacysglythralathrglycyscysthralacysala

340345350

glyglyglyglycyscysalaglyglyglyglyalacyscyscysala

355360365

glyglythrcysalacyscysglythrcysthrcyscysthrcysala

370375380

cysalacyscysalacyscysalathrcysalacyscysalathrcys

385390395400

alacysglyalaalacyscysthrglyalaalaglycyscysthrala

405410415

gly

<210>51

<211>390

<212>prt

<213>家羊驼

<400>51

cysalaglyglythrglycysalaglycysthrglycysalaglygly

151015

alaglythrcysthrglyglyalaglyglyalaglyglycysthrcys

202530

glyglythrglycysalaglyglycysthrglyglyglyglyglygly

354045

thrcysthrcysthrglyalaglyalacysthrcysthrcyscysthr

505560

glythralacysalaglythrcysthrcysthrglyglyalaalacys

65707580

cysalathrcysthrthrcysalaglythrglythrcysalacysthr

859095

glythrcysalathrglyglyglycysthrglyglythralacyscys

100105110

glycyscysalaglyglycysthrcyscysalaglyglyglyalaala

115120125

glycysalaglycysglycysglyalaglythrthrglyglythrcys

130135140

glycysalaglyglythrthrthrthralacysthralaalathrala

145150155160

cysthralaglyalaalaalacysalacysalaalaalacysthrala

165170175

thrglythralaglyalacysthrcyscysglythrglyalaalagly

180185190

glyglycyscysglycysthrthrcysalacyscysalathrcysthr

195200205

cyscysalaalaalaglyalacysalaglycysglycyscysalaala

210215220

glyalaalacysalacysglyalathrglythralathrcysthrala

225230235240

cysalaalaalathrglyalaalacysalaglycyscysthrglyala

245250255

alaalacyscysthrglyalaglyglyalacysalacysalaglycys

260265270

cysglythrcysthralathrthralacysthrglythralaalathr

275280285

glythralacysglythrcysglyglythrglyglyglyglycysgly

290295300

glythralacysglyalaalathrthrglyglyalaalathrglyala

305310315320

cysthralacysthrglyglyglyglycyscysalaglyglyglygly

325330335

alacyscyscysalaglyglythrcysalacyscysglythrcysthr

340345350

cyscysthrcysalacysalacyscysalacyscysalathrcysala

355360365

cyscysalathrcysalacysglyalaalacyscysthrglyalaala

370375380

glycyscysthralagly

385390

<210>52

<211>390

<212>prt

<213>家羊驼

<400>52

cysalaglyglythrglycysalaglycysthrglycysalaglygly

151015

alaglythrcysthrglyglyalaglyglyglyglyglycysthrthr

202530

cysglythrglycysalaglyglycysthrglyglyglyglyglygly

354045

thrcysthrcysthrglyalaglyalacysthrcysthrcyscysthr

505560

glythrglycysalaglycyscysthrcysthrglyglyalaalagly

65707580

cysalathrcysthrthrcysalaglythralaalaglyalaalathr

859095

alacyscysalathrglyglycyscysthrglyglythrthrcyscys

100105110

glycyscysalaglyglycysthrcyscysalaglyglyglyalaala

115120125

glyglyalaglycysglyalaglyalaglythrthrglyglythrcys

130135140

glycysalaglycysthralaglythrcyscysthralacysglygly

145150155160

glythrglyglythralaglycysalacysalaglycysglythrala

165170175

thralaalaalaglyalacysthrcyscysglythrglyalaalagly

180185190

glyglycyscysglyalathrthrcysalacyscysalathrcysthr

195200205

cyscysalaglyalaglyalacysalaglycysglycyscysalaala

210215220

glyalaalacysalacysglyglythrglythrthrglycysthrgly

225230235240

cysalaalaalathrglyalaalacysglythrcyscysthrglyala

245250255

alaalacyscysthrglyalaglyglyalathralacysthrglycys

260265270

cysglythrcysthralathrthralacysthrglythrcysalathr

275280285

cysthralacysglythrcysalaalaalaalathralaalacyscys

290295300

glythrglyglythrthrcysthrthrglyglythrthrcyscysala

305310315320

cysthralacysthrglyglyglyglycyscysalaglyglyglygly

325330335

alacyscyscysalaglyglythrcysalacyscysglythrcysthr

340345350

cyscysthrcysalacysalacyscysalacyscysalathrcysala

355360365

cyscysalathrcysalacysglyalaalacyscysthrglyalaala

370375380

glycyscysthralagly

385390

<210>53

<211>390

<212>prt

<213>家羊驼

<400>53

cysalaglyglythrglycysalaglycysthrglycysalaglygly

151015

alaglythrcysthrglyglyglyglyglyalaglyglycysthrthr

202530

glyglythrglycysalaglyglycysthrglyglyglyglyglygly

354045

thrcysglycysthrglyalaglyalacysthrcysthrcysthrthr

505560

glythrglycysalaglythrcysthrcysthrglyglythralacys

65707580

glyalathrcysthrthrcysglyalathralathrcysalacysthr

859095

cyscyscysalathrglyglyglycysthrglyglythralacyscys

100105110

glycyscysalaglyalacysthrcyscysalaglyglyglyalaala

115120125

glycysalaglycysglycysglyalaalaglythrglyglythrcys

130135140

glycysalaglyalathrcysthrthralacysthralaglythrcys

145150155160

glycysglyglythralacyscysalacysalaalaalathrthrala

165170175

cysglycysalaglyalacysthrcyscysglythrglyalaalagly

180185190

glyglycyscysglyglythrthrcysalacyscysalathrcysthr

195200205

cyscysalaglyalaglyalacysalaalacysglycyscysalaala

210215220

glyalaalaalaalathrglythrthrglythralathrcysthrgly

225230235240

cysalaalaalathrglyalaalacysalaglycyscysthrglyala

245250255

alaalathrcysthrglyalacysglyalacysalacysalaglygly

260265270

cysglythrglythralathrthralacysthrglythralaalacys

275280285

glythrglyalaalaalacysglyglythrglyglyglyglyalagly

290295300

glythralathrthrglyglycysthrglyglyalaalacysglyala

305310315320

cysthralacysthrglyglyglyglycyscysalaglyglyglygly

325330335

alacyscyscysalaglyglythrcysalacyscysglythrcysthr

340345350

cyscysthrcysalacysalacyscysalacyscysalathrcysala

355360365

cyscysalathrcysalacysglyalaalacyscysthrglyalaala

370375380

glycyscysthralagly

385390

<210>54

<211>390

<212>prt

<213>家羊驼

<400>54

cysalaglyglythrglycysalaglycysthrglycysalaglygly

151015

alaglythrcysthrglyglyalaglyglyalaglyglycysthrthr

202530

glyglythrglycysalaglythrcysthrglyglyglyglyglygly

354045

thrcysthrcysthrglyalaglyalacysthrcysthrcyscysthr

505560

glythrglythralaglycyscysthrcysthrglyglyalathrthr

65707580

cysalaglyalathrthrcysalaglythralaalacysthrthrthr

859095

cyscysthralathrglyalathrglythrglyglyglythrcyscys

100105110

glycyscysalaglyglycyscyscyscysalaglyglyalaalaala

115120125

glyglyglyglycysthrcysglyalaglythrglyglyglythrcys

130135140

thrcysglycysthrglyalathrthralaglycysalathrthrgly

145150155160

glythrglyglythralaglythralacyscysalacysglyalaala

165170175

thrthralathrglycysglyglyalacysthrcyscysglythrgly

180185190

alaalaglyglyglycyscysglyalathrthrcysalacyscysala

195200205

thrcysthrcyscysalaglyalaglyalacysalaalacysglycys

210215220

cysalaalaglyalaalacysalacysglycysthrglythrthrthr

225230235240

cysthrglycysalaalaalathrglyalaalacysalaglycyscys

245250255

thrglyalaalaalacyscysthrglyalaglyglyalacysalacys

260265270

glyglycyscysglythrglythralathrthralacysthrglythr

275280285

glycysalaalaalaalathralathrcysthrthrglyglythrcys

290295300

glyglycysthrglyglythrcyscyscysalacyscysglyalacys

305310315320

thralacysthrglyalaglyglyglycyscysalaglyglyglygly

325330335

alacyscyscysalaglyglythrcysalacyscysglythrcysthr

340345350

cyscysthrcysalacysalacyscysalacyscysalathrcysala

355360365

cyscysalathrcysalacysglyalaalacyscysthrglyalaala

370375380

glycyscysthralagly

385390

<210>55

<211>1095

<212>prt

<213>人工

<220>

<223>beta2ar构建体

<400>55

glyglyglycysalaalacyscyscysglyglyglyalaalacysgly

151015

glycysalaglycysglycyscysthrthrcysthrthrglycysthr

202530

glyglycysalacyscyscysalaalathralaglyalaalaglycys

354045

cysalathrglycysglycyscysglyglyalacyscysalacysgly

505560

alacysglythrcysalacysglycysalaglycysalaalaalagly

65707580

glyglyalacysglyalaglyglythrglythrglyglyglythrgly

859095

glythrglyglyglycysalathrglyglyglycysalathrcysgly

100105110

thrcysalathrglythrcysthrcysthrcysalathrcysglythr

115120125

cyscysthrglyglycyscysalathrcysglythrglythrthrthr

130135140

glyglycysalaalathrglythrglycysthrglyglythrcysala

145150155160

thrcysalacysalaglycyscysalathrthrglycyscysalaala

165170175

glythrthrcysglyalaglycysglythrcysthrglycysalagly

180185190

alacysglyglythrcysalacyscysalaalacysthralacysthr

195200205

thrcysalathrcysalacysthrthrcysalacysthrglyglycys

210215220

cysthrglythrglycysthrglyalathrcysthrglyglythrcys

225230235240

alathrglyglyglycyscysthrglyglycysalaglythrglygly

245250255

thrglycyscyscysthrthrthrglyglyglyglycyscysglycys

260265270

cyscysalathralathrthrcysthrthralathrglyalaalaala

275280285

alathrglythrglyglyalacysthrthrthrthrglyglycysala

290295300

alacysthrthrcysthrglyglythrglycysglyalaglythrthr

305310315320

thrthrglyglyalacysthrthrcyscysalathrthrglyalathr

325330335

glythrglycysthrglythrglycysglythrcysalacysglygly

340345350

cyscysalaglycysalathrthrglyalaglyalacyscyscysthr

355360365

glythrglycysglythrglyalathrcysglycysalaglythrgly

370375380

glyalathrcysglycysthralacysthrthrthrglycyscysala

385390395400

thrthralacysthrthrcysalacyscysthrthrthrcysalaala

405410415

glythralacyscysalaglyalaglycyscysthrglycysthrgly

420425430

alacyscysalaalaglyalaalathralaalaglyglycyscyscys

435440445

glyglyglythrglyalathrcysalathrthrcysthrglyalathr

450455460

glyglythrglythrglyglyalathrthrglythrglythrcysala

465470475480

glyglycyscysthrthralacyscysthrcyscysthrthrcysthr

485490495

thrglycyscyscysalathrthrcysalaglyalathrglycysala

500505510

cysthrglyglythralacyscysglyglyglycyscysalacyscys

515520525

cysalacyscysalaglyglyalaalaglycyscysalathrcysala

530535540

alacysthrglycysthralathrglycyscysglyalaglyglyala

545550555560

glyalacyscysthrglycysthrglythrglyalacysthrthrcys

565570575

thrthrcysalacysglyalaalacyscysalaalaglycyscysthr

580585590

alathrglycyscysalathrthrglycyscysthrcysthrthrcys

595600605

cysalathrcysglythrglythrcyscysthrthrcysthralacys

610615620

glythrthrcyscyscyscysthrglyglythrglyalathrcysala

625630635640

thrglyglythrcysthrthrcysglythrcysthralacysthrcys

645650655

cysalaglyglyglythrcysthrthrthrcysalaglyglyalagly

660665670

glycyscysalaalaalaalaglyglycysalaglycysthrcyscys

675680685

alaglyalaalaglyalathrthrglyalacysalaalaalathrcys

690695700

thrglyalaglyglyglycyscysglycysthrthrcyscysalathr

705710715720

glythrcyscysalaglyalaalacyscysthrthralaglycyscys

725730735

alaglyglythrglyglyalaglycysalaglyglyalathrglygly

740745750

glycysglyglyalacysglyglyglyglycysalathrglyglyala

755760765

cysthrcyscysglycysalaglyalathrcysthrthrcyscysala

770775780

alaglythrthrcysthrglycysthrthrglyalaalaglyglyala

785790795800

glycysalacysalaalaalaglycyscyscysthrcysalaalagly

805810815

alacysglythrthralaglyglycysalathrcysalathrcysala

820825830

thrglyglyglycysalacysthrthrthrcysalacyscyscysthr

835840845

cysthrglycysthrglyglycysthrglycyscyscysthrthrcys

850855860

thrthrcysalathrcysglythrthralaalacysalathrthrgly

865870875880

thrglycysalathrglythrglyalathrcyscysalaglyglyala

885890895

thralaalacyscysthrcysalathrcyscysglythralaalagly

900905910

glyalaalaglythrthrthralacysalathrcyscysthrcyscys

915920925

thralaalaalathrthrglyglyalathralaglyglycysthrala

930935940

thrglythrcysalaalathrthrcysthrglyglythrthrthrcys

945950955960

alaalathrcyscyscyscysthrthralathrcysthralacysthr

965970975

glycyscysglyglyalaglycyscyscysalaglyalathrthrthr

980985990

cysalaglyglyalathrthrglycyscysthrthrcyscysalagly

99510001005

glyalaglycysthrthrcysthrglythrglycyscysthrgly

101010151020

cysglycysalaglyglythrcysthrthrcysthrthrthrgly

102510301035

alaalaglyglycyscysthralathrglyglyglyalaalathr

104010451050

glyglycysthralacysthrcyscysalaglycysalaalacys

105510601065

glyglycysalaalacysalacysalaglyglyglyglyalagly

107010751080

cysalaglyalaglythrglyglyalathralaala

108510901095

<210>56

<211>380

<212>prt

<213>人(homosapiens)

<400>56

metglycysleuglyasnserlysthrgluaspglnargasngluglu

151015

lysalaglnargglualaasnlyslysileglulysglnleuglnlys

202530

asplysglnvaltyrargalathrhisargleuleuleuleuglyala

354045

glygluserglylysserthrilevallysglnmetargileleuhis

505560

valasnglypheasnglyaspserglulysalathrlysvalglnasp

65707580

ilelysasnasnleulysglualailegluthrilevalalaalamet

859095

serasnleuvalproprovalgluleualaasnprogluasnglnphe

100105110

argvalasptyrileleuservalmetasnvalproasppheaspphe

115120125

proprogluphetyrgluhisalalysalaleutrpgluaspglugly

130135140

valargalacystyrgluargserasnglutyrglnleuileaspcys

145150155160

alaglntyrpheleuasplysileaspvalilelysglnalaasptyr

165170175

valproseraspglnaspleuleuargcysargvalleuthrsergly

180185190

ilephegluthrlyspheglnvalasplysvalasnphehismetphe

195200205

aspvalglyglyglnargaspgluargarglystrpileglncysphe

210215220

asnaspvalthralaileilephevalvalalasersersertyrasn

225230235240

metvalilearggluaspasnglnthrasnargleuglnglualaleu

245250255

asnleuphelysseriletrpasnasnargtrpleuargthrileser

260265270

valileleupheleuasnlysglnaspleuleualaglulysvalleu

275280285

alaglylysserlysilegluasptyrpheprogluphealaargtyr

290295300

thrthrprogluaspalathrprogluproglygluaspproargval

305310315320

thrargalalystyrpheileargaspglupheleuargileserthr

325330335

alaserglyaspglyarghistyrcystyrprohisphethrcysala

340345350

valaspthrgluasnileargargvalpheasnaspcysargaspile

355360365

ileglnargmethisleuargglntyrgluleuleu

370375380

<210>57

<211>354

<212>prt

<213>人

<400>57

metglycysthrleuseralagluasplysalaalavalgluargser

151015

lysmetileaspargasnleuarggluaspglyglulysalaalaarg

202530

gluvallysleuleuleuleuglyalaglygluserglylysserthr

354045

ilevallysglnmetlysileilehisglualaglytyrsergluglu

505560

glucyslysglntyrlysalavalvaltyrserasnthrileglnser

65707580

ileilealaileileargalametglyargleulysileaspphegly

859095

aspseralaargalaaspaspalaargglnleuphevalleualagly

100105110

alaalaglugluglyphemetthralagluleualaglyvalilelys

115120125

argleutrplysaspserglyvalglnalacyspheasnargserarg

130135140

glutyrglnleuasnaspseralaalatyrtyrleuasnaspleuasp

145150155160

argilealaglnproasntyrileprothrglnglnaspvalleuarg

165170175

thrargvallysthrthrglyilevalgluthrhisphethrphelys

180185190

aspleuhisphelysmetpheaspvalglyglyglnargsergluarg

195200205

lyslystrpilehiscysphegluglyvalthralaileilephecys

210215220

valalaleuserasptyraspleuvalleualagluaspgluglumet

225230235240

asnargmethisglusermetlysleupheaspserilecysasnasn

245250255

lystrpphethraspthrserileileleupheleuasnlyslysasp

260265270

leuphegluglulysilelyslysserproleuthrilecystyrpro

275280285

glutyralaglyserasnthrtyrgluglualaalaalatyrilegln

290295300

cysglnphegluaspleuasnlysarglysaspthrlysgluiletyr

305310315320

thrhisphethrcysalathraspthrlysasnvalglnphevalphe

325330335

aspalavalthraspvalileilelysasnasnleulysaspcysgly

340345350

leuphe

<210>58

<211>350

<212>prt

<213>人

<400>58

metglyalaglyalaseralagluglulyshisserarggluleuglu

151015

lyslysleulysgluaspalaglulysaspalaargthrvallysleu

202530

leuleuleuglyalaglygluserglylysserthrilevallysgln

354045

metlysileilehisglnaspglytyrserleugluglucysleuglu

505560

pheilealaileiletyrglyasnthrleuglnserileleualaile

65707580

valargalametthrthrleuasnileglntyrglyaspseralaarg

859095

glnaspaspalaarglysleumethismetalaaspthrilegluglu

100105110

glythrmetprolysglumetseraspileileglnargleutrplys

115120125

aspserglyileglnalacysphegluargalaserglutyrglnleu

130135140

asnaspseralaglytyrtyrleuseraspleugluargleuvalthr

145150155160

proglytyrvalprothrgluglnaspvalleuargserargvallys

165170175

thrthrglyileilegluthrglnpheserphelysaspleuasnphe

180185190

argmetpheaspvalglyglyglnargsergluarglyslystrpile

195200205

hiscysphegluglyvalthrcysileilepheilealaalaleuser

210215220

alatyraspmetvalleuvalgluaspaspgluvalasnargmethis

225230235240

gluserleuhisleupheasnserilecysasnhisargtyrpheala

245250255

thrthrserilevalleupheleuasnlyslysaspvalphepheglu

260265270

lysilelyslysalahisleuserilecyspheproasptyraspgly

275280285

proasnthrtyrgluaspalaglyasntyrilelysvalglnpheleu

290295300

gluleuasnmetargargaspvallysgluiletyrserhismetthr

305310315320

cysalathraspthrglnasnvallysphevalpheaspalavalthr

325330335

aspileileilelysgluasnleulysaspcysglyleuphe

340345350

<210>59

<211>394

<212>prt

<213>欧洲牛(bostaurus)

<400>59

metglycysleuglyasnserlysthrgluaspglnargasngluglu

151015

lysalaglnargglualaasnlyslysileglulysglnleuglnlys

202530

asplysglnvaltyrargalathrhisargleuleuleuleuglyala

354045

glygluserglylysserthrilevallysglnmetargileleuhis

505560

valasnglypheasnglygluglyglyglugluaspproglnalaala

65707580

argserasnseraspglyglulysalathrlysvalglnaspilelys

859095

asnasnleulysglualailegluthrilevalalaalametserasn

100105110

leuvalproprovalgluleualaasnprogluasnglnpheargval

115120125

asptyrileleuservalmetasnvalproasppheaspphepropro

130135140

gluphetyrgluhisalalysalaleutrpgluaspgluglyvalarg

145150155160

alacystyrgluargserasnglutyrglnleuileaspcysalagln

165170175

tyrpheleuasplysileaspvalilelysglnaspasptyrvalpro

180185190

seraspglnaspleuleuargcysargvalleuthrserglyilephe

195200205

gluthrlyspheglnvalasplysvalasnphehismetpheaspval

210215220

glyglyglnargaspgluargarglystrpileglncyspheasnasp

225230235240

valthralaileilephevalvalalasersersertyrasnmetval

245250255

ilearggluaspasnglnthrasnargleuglnglualaleuasnleu

260265270

phelysseriletrpasnasnargtrpleuargthrileservalile

275280285

leupheleuasnlysglnaspleuleualaglulysvalleualagly

290295300

lysserlysilegluasptyrpheprogluphealaargtyrthrthr

305310315320

progluaspalathrprogluproglygluaspproargvalthrarg

325330335

alalystyrpheileargaspglupheleuargileserthralaser

340345350

glyaspglyarghistyrcystyrprohisphethrcysalavalasp

355360365

thrgluasnileargargvalpheasnaspcysargaspileilegln

370375380

argmethisleuargglntyrgluleuleu

385390

<210>60

<211>394

<212>prt

<213>褐家鼠(rattusnorvegicus)

<400>60

metglycysleuglyasnserlysthrgluaspglnargasngluglu

151015

lysalaglnargglualaasnlyslysileglulysglnleuglnlys

202530

asplysglnvaltyrargalathrhisargleuleuleuleuglyala

354045

glygluserglylysserthrilevallysglnmetargileleuhis

505560

valasnglypheasnglygluglyglyglugluaspproglnalaala

65707580

argserasnseraspglyglulysalathrlysvalglnaspilelys

859095

asnasnleulysglualailegluthrilevalalaalametserasn

100105110

leuvalproprovalgluleualaasnprogluasnglnpheargval

115120125

asptyrileleuservalmetasnvalproasnpheaspphepropro

130135140

gluphetyrgluhisalalysalaleutrpgluaspgluglyvalarg

145150155160

alacystyrgluargserasnglutyrglnleuileaspcysalagln

165170175

tyrpheleuasplysileaspvalilelysglnalaasptyrvalpro

180185190

seraspglnaspleuleuargcysargvalleuthrserglyilephe

195200205

gluthrlyspheglnvalasplysvalasnphehismetpheaspval

210215220

glyglyglnargaspgluargarglystrpileglncyspheasnasp

225230235240

valthralaileilephevalvalalasersersertyrasnmetval

245250255

ilearggluaspasnglnthrasnargleuglnglualaleuasnleu

260265270

phelysseriletrpasnasnargtrpleuargthrileservalile

275280285

leupheleuasnlysglnaspleuleualaglulysvalleualagly

290295300

lysserlysilegluasptyrpheprogluphealaargtyrthrthr

305310315320

progluaspalathrprogluproglygluaspproargvalthrarg

325330335

alalystyrpheileargaspglupheleuargileserthralaser

340345350

glyaspglyarghistyrcystyrprohisphethrcysalavalasp

355360365

thrgluasnileargargvalpheasnaspcysargaspileilegln

370375380

argmethisleuargglntyrgluleuleu

385390

<210>61

<211>394

<212>prt

<213>小鼠(musmusculus)

<400>61

metglycysleuglyasnserlysthrgluaspglnargasngluglu

151015

lysalaglnargglualaasnlyslysileglulysglnleuglnlys

202530

asplysglnvaltyrargalathrhisargleuleuleuleuglyala

354045

glygluserglylysserthrilevallysglnmetargileleuhis

505560

valasnglypheasnglygluglyglyglugluaspproglnalaala

65707580

argserasnseraspglyglulysalathrlysvalglnaspilelys

859095

asnasnleulysglualailegluthrilevalalaalametserasn

100105110

leuvalproprovalgluleualaasnprogluasnglnpheargval

115120125

asptyrileleuservalmetasnvalproasnpheaspphepropro

130135140

gluphetyrgluhisalalysalaleutrpgluaspgluglyvalarg

145150155160

alacystyrgluargserasnglutyrglnleuileaspcysalagln

165170175

tyrpheleuasplysileaspvalilelysglnalaasptyrvalpro

180185190

seraspglnaspleuleuargcysargvalleuthrserglyilephe

195200205

gluthrlyspheglnvalasplysvalasnphehismetpheaspval

210215220

glyglyglnargaspgluargarglystrpileglncyspheasnasp

225230235240

valthralaileilephevalvalalasersersertyrasnmetval

245250255

ilearggluaspasnglnthrasnargleuglnglualaleuasnleu

260265270

phelysseriletrpasnasnargtrpleuargthrileservalile

275280285

leupheleuasnlysglnaspleuleualaglulysvalleualagly

290295300

lysserlysilegluasptyrpheprogluphealaargtyrthrthr

305310315320

progluaspalathrprogluproglygluaspproargvalthrarg

325330335

alalystyrpheileargaspglupheleuargileserthralaser

340345350

glyaspglyarghistyrcystyrprohisphethrcysalavalasp

355360365

thrgluasnileargargvalpheasnaspcysargaspileilegln

370375380

argmethisleuargglntyrgluleuleu

385390

<210>62

<211>340

<212>prt

<213>欧洲牛

<400>62

metsergluleuaspglnleuargglnglualagluglnleulysasn

151015

glnileargaspalaarglysalacysalaaspalathrleusergln

202530

ilethrasnasnileaspprovalglyargileglnmetargthrarg

354045

argthrleuargglyhisleualalysiletyralamethistrpgly

505560

thraspserargleuleuvalseralaserglnaspglylysleuile

65707580

iletrpaspsertyrthrthrasnlysvalhisalaileproleuarg

859095

sersertrpvalmetthrcysalatyralaproserglyasntyrval

100105110

alacysglyglyleuaspasnilecysseriletyrasnleulysthr

115120125

arggluglyasnvalargvalserarggluleualaglyhisthrgly

130135140

tyrleusercyscysargpheleuaspaspasnglnilevalthrser

145150155160

serglyaspthrthrcysalaleutrpaspilegluthrglyglngln

165170175

thrthrthrphethrglyhisthrglyaspvalmetserleuserleu

180185190

alaproaspthrargleuphevalserglyalacysaspalaserala

195200205

lysleutrpaspvalarggluglymetcysargglnthrphethrgly

210215220

hisgluseraspileasnalailecysphepheproasnglyasnala

225230235240

phealathrglyseraspaspalathrcysargleupheaspleuarg

245250255

alaaspglngluleumetthrtyrserhisaspasnileilecysgly

260265270

ilethrservalserpheserlysserglyargleuleuleualagly

275280285

tyraspasppheasncysasnvaltrpaspalaleulysalaasparg

290295300

alaglyvalleualaglyhisaspasnargvalsercysleuglyval

305310315320

thraspaspglymetalavalalathrglysertrpaspserpheleu

325330335

lysiletrpasn

340

<210>63

<211>340

<212>prt

<213>人

<400>63

metsergluleuaspglnleuargglnglualagluglnleulysasn

151015

glnileargaspalaarglysalacysalaaspalathrleusergln

202530

ilethrasnasnileaspprovalglyargileglnmetargthrarg

354045

argthrleuargglyhisleualalysiletyralamethistrpgly

505560

thraspserargleuleuvalseralaserglnaspglylysleuile

65707580

iletrpaspsertyrthrthrasnlysvalhisalaileproleuarg

859095

sersertrpvalmetthrcysalatyralaproserglyasntyrval

100105110

alacysglyglyleuaspasnilecysseriletyrasnleulysthr

115120125

arggluglyasnvalargvalserarggluleualaglyhisthrgly

130135140

tyrleusercyscysargpheleuaspaspasnglnilevalthrser

145150155160

serglyaspthrthrcysalaleutrpaspilegluthrglyglngln

165170175

thrthrthrphethrglyhisthrglyaspvalmetserleuserleu

180185190

alaproaspthrargleuphevalserglyalacysaspalaserala

195200205

lysleutrpaspvalarggluglymetcysargglnthrphethrgly

210215220

hisgluseraspileasnalailecysphepheproasnglyasnala

225230235240

phealathrglyseraspaspalathrcysargleupheaspleuarg

245250255

alaaspglngluleumetthrtyrserhisaspasnileilecysgly

260265270

ilethrservalserpheserlysserglyargleuleuleualagly

275280285

tyraspasppheasncysasnvaltrpaspalaleulysalaasparg

290295300

alaglyvalleualaglyhisaspasnargvalsercysleuglyval

305310315320

thraspaspglymetalavalalathrglysertrpaspserpheleu

325330335

lysiletrpasn

340

<210>64

<211>340

<212>prt

<213>褐家鼠

<400>64

metsergluleuaspglnleuargglnglualagluglnleulysasn

151015

glnileargaspalaarglysalacysalaaspalathrleusergln

202530

ilethrasnasnileaspprovalglyargileglnmetargthrarg

354045

argthrleuargglyhisleualalysiletyralamethistrpgly

505560

thraspserargleuleuvalseralaserglnaspglylysleuile

65707580

iletrpaspsertyrthrthrasnlysvalhisalaileproleuarg

859095

sersertrpvalmetthrcysalatyralaproserglyasntyrval

100105110

alacysglyglyleuaspasnilecysseriletyrasnleulysthr

115120125

arggluglyasnvalargvalserarggluleualaglyhisthrgly

130135140

tyrleusercyscysargpheleuaspaspasnglnilevalthrser

145150155160

serglyaspthrthrcysalaleutrpaspilegluthrglyglngln

165170175

thrthrthrphethrglyhisthrglyaspvalmetserleuserleu

180185190

alaproaspthrargleuphevalserglyalacysaspalaserala

195200205

lysleutrpaspvalarggluglymetcysargglnthrphethrgly

210215220

hisgluseraspileasnalailecysphepheproasnglyasnala

225230235240

phealathrglyseraspaspalathrcysargleupheaspleuarg

245250255

alaaspglngluleumetthrtyrserhisaspasnileilecysgly

260265270

ilethrservalserpheserlysserglyargleuleuleualagly

275280285

tyraspasppheasncysasnvaltrpaspalaleulysalaasparg

290295300

alaglyvalleualaglyhisaspasnargvalsercysleuglyval

305310315320

thraspaspglymetalavalalathrglysertrpaspserpheleu

325330335

lysiletrpasn

340

<210>65

<211>340

<212>prt

<213>小鼠

<400>65

metsergluleuaspglnleuargglnglualagluglnleulysasn

151015

glnileargaspalaarglysalacysalaaspalathrleusergln

202530

ilethrasnasnileaspprovalglyargileglnmetargthrarg

354045

argthrleuargglyhisleualalysiletyralamethistrpgly

505560

thraspserargleuleuvalseralaserglnaspglylysleuile

65707580

iletrpaspsertyrthrthrasnlysvalhisalaileproleuarg

859095

sersertrpvalmetthrcysalatyralaproserglyasntyrval

100105110

alacysglyglyleuaspasnilecysseriletyrasnleulysthr

115120125

arggluglyasnvalargvalserarggluleualaglyhisthrgly

130135140

tyrleusercyscysargpheleuaspaspasnglnilevalthrser

145150155160

serglyaspthrthrcysalaleutrpaspilegluthrglyglngln

165170175

thrthrthrphethrglyhisthrglyaspvalmetserleuserleu

180185190

alaproaspthrargleuphevalserglyalacysaspalaserala

195200205

lysleutrpaspvalarggluglymetcysargglnthrphethrgly

210215220

hisgluseraspileasnalailecysphepheproasnglyasnala

225230235240

phealathrglyseraspaspalathrcysargleupheaspleuarg

245250255

alaaspglngluleumetthrtyrserhisaspasnileilecysgly

260265270

ilethrservalserpheserlysserglyargleuleuleualagly

275280285

tyraspasppheasncysasnvaltrpaspalaleulysalaasparg

290295300

alaglyvalleualaglyhisaspasnargvalsercysleuglyval

305310315320

thraspaspglymetalavalalathrglysertrpaspserpheleu

325330335

lysiletrpasn

340

<210>66

<211>71

<212>prt

<213>欧洲牛

<400>66

metalaserasnasnthralaserilealaglnalaarglysleuval

151015

gluglnleulysmetglualaasnileaspargilelysvalserlys

202530

alaalaalaaspleumetalatyrcysglualahisalalysgluasp

354045

proleuleuthrprovalproalasergluasnpropheargglulys

505560

lysphephecysalaileleu

6570

<210>67

<211>71

<212>prt

<213>小鼠

<400>67

metalaserasnasnthralaserilealaglnalaarglysleuval

151015

gluglnleulysmetglualaasnileaspargilelysvalserlys

202530

alaalaalaaspleumetalatyrcysglualahisalalysgluasp

354045

proleuleuthrprovalproalasergluasnpropheargglulys

505560

lysphephecysalaileleu

6570

<210>68

<211>71

<212>prt

<213>人

<400>68

metalaserasnasnthralaserilealaglnalaarglysleuval

151015

gluglnleulysmetglualaasnileaspargilelysvalserlys

202530

alaalaalaaspleumetalatyrcysglualahisalalysgluasp

354045

proleuleuthrprovalproalasergluasnpropheargglulys

505560

lysphephecysalaileleu

6570

<210>69

<211>514

<212>prt

<213>人工

<220>

<223>t4l-beta2ar融合构建体

<400>69

asptyrlysaspaspaspaspalagluasnleutyrpheglnglyasn

151015

ilepheglumetleuargileaspgluglyleuargleulysiletyr

202530

lysaspthrgluglytyrtyrthrileglyileglyhisleuleuthr

354045

lysserproserleuasnalaalalyssergluleuasplysalaile

505560

glyargasnthrasnglyvalilethrlysaspglualaglulysleu

65707580

pheasnglnaspvalaspalaalavalargglyileleuargasnala

859095

lysleulysprovaltyraspserleuaspalavalargargalaala

100105110

leuileasnmetvalpheglnmetglygluthrglyvalalaglyphe

115120125

thrasnserleuargmetleuglnglnlysargtrpaspglualaala

130135140

valasnleualalysserargtrptyrasnglnthrproasnargala

145150155160

lysargvalilethrthrpheargthrglythrtrpaspalatyrala

165170175

alaaspgluvaltrpvalvalglymetglyilevalmetserleuile

180185190

valleualailevalpheglyasnvalleuvalilethralaileala

195200205

lysphegluargleuglnthrvalthrasntyrpheilethrserleu

210215220

alacysalaaspleuvalmetglyleualavalvalpropheglyala

225230235240

alahisileleuthrlysthrtrpthrpheglyasnphetrpcysglu

245250255

phetrpthrserileaspvalleucysvalthralaserilegluthr

260265270

leucysvalilealavalaspargtyrphealailethrserprophe

275280285

lystyrglnserleuleuthrlysasnlysalaargvalileileleu

290295300

metvaltrpilevalserglyleuthrserpheleuproileglnmet

305310315320

histrptyrargalathrhisglnglualaileasncystyralaglu

325330335

gluthrcyscysaspphephethrasnglnalatyralailealaser

340345350

serilevalserphetyrvalproleuvalilemetvalphevaltyr

355360365

serargvalpheglnglualalysargglnleuglnlysileasplys

370375380

sergluglyargphehisvalglnasnleuserglnvalgluglnasp

385390395400

glyargthrglyhisglyleuargargserserlysphecysleulys

405410415

gluhislysalaleulysthrleuglyileilemetglythrphethr

420425430

leucystrpleuprophepheilevalasnilevalhisvalilegln

435440445

aspasnleuilearglysgluvaltyrileleuleuasntrpilegly

450455460

tyrvalasnserglypheasnproleuiletyrcysargserproasp

465470475480

pheargilealapheglngluleuleucysleuargargserserleu

485490495

lysalatyrglyasnglytyrserserasnglyasnthrglyglugln

500505510

sergly

<210>70

<211>8

<212>prt

<213>人工

<220>

<223>m1flag表位

<400>70

asptyrlysaspaspaspaspala

15

<210>71

<211>7

<212>prt

<213>人工

<220>

<223>tev蛋白酶识别序列

<400>71

gluasnleutyrpheglngly

15

<210>72

<211>413

<212>prt

<213>人

<400>72

metglyglnproglyasnglyseralapheleuleualaproasngly

151015

serhisalaproasphisaspvalthrglngluargaspgluvaltrp

202530

valvalglymetglyilevalmetserleuilevalleualaileval

354045

pheglyasnvalleuvalilethralailealalysphegluargleu

505560

glnthrvalthrasntyrpheilethrserleualacysalaaspleu

65707580

valmetglyleualavalvalpropheglyalaalahisileleumet

859095

lysmettrpthrpheglyasnphetrpcysgluphetrpthrserile

100105110

aspvalleucysvalthralaserilegluthrleucysvalileala

115120125

valaspargtyrphealailethrserprophelystyrglnserleu

130135140

leuthrlysasnlysalaargvalileileleumetvaltrpileval

145150155160

serglyleuthrserpheleuproileglnmethistrptyrargala

165170175

thrhisglnglualaileasncystyralaasngluthrcyscysasp

180185190

phephethrasnglnalatyralailealaserserilevalserphe

195200205

tyrvalproleuvalilemetvalphevaltyrserargvalphegln

210215220

glualalysargglnleuglnlysileasplyssergluglyargphe

225230235240

hisvalglnasnleuserglnvalgluglnaspglyargthrglyhis

245250255

glyleuargargserserlysphecysleulysgluhislysalaleu

260265270

lysthrleuglyileilemetglythrphethrleucystrpleupro

275280285

phepheilevalasnilevalhisvalileglnaspasnleuilearg

290295300

lysgluvaltyrileleuleuasntrpileglytyrvalasnsergly

305310315320

pheasnproleuiletyrcysargserproasppheargilealaphe

325330335

glngluleuleucysleuargargserserleulysalatyrglyasn

340345350

glytyrserserasnglyasnthrglygluglnserglytyrhisval

355360365

gluglnglulysgluasnlysleuleucysgluaspleuproglythr

370375380

gluaspphevalglyhisglnglythrvalproseraspasnileasp

385390395400

serglnglyargasncysserthrasnaspserleuleu

405410

<210>73

<211>539

<212>prt

<213>人工序列

<220>

<223>n-末端t4lv2r构建体

<400>73

asptyrlysaspaspaspaspalaglyleumetalaserthrthrser

151015

alavalproglyhisproserleuproserleuproserasnserser

202530

glngluargproleuaspthrasnilepheglumetleuargileasp

354045

gluglyleuargleulysiletyrlysaspthrgluglytyrtyrthr

505560

ileglyileglyhisleuleuthrlysserproserleuasnalaala

65707580

lyssergluleuasplysalaileglyargasnthrasnglyvalile

859095

thrlysaspglualaglulysleupheasnglnaspvalaspalaala

100105110

valargglyileleuargasnalalysleulysprovaltyraspser

115120125

leuaspalavalargargalaalaleuileasnmetvalpheglnmet

130135140

glygluthrglyvalalaglyphethrasnserleuargmetleugln

145150155160

glnlysargtrpaspglualaalavalasnleualalysserargtrp

165170175

tyrasnglnthrproasnargalalysargvalilethrthrphearg

180185190

thrglythrtrpaspalatyrargaspproleuleualaargalaglu

195200205

leualaleuleuserilevalphevalalavalalaleuserasngly

210215220

leuvalleualaalaleualaargargglyargargglyhistrpala

225230235240

proilehisvalpheileglyhisleucysleualaaspleualaval

245250255

alaleupheglnvalleuproglnleualatrplysalathrasparg

260265270

pheargglyproaspalaleucysargalavallystyrleuglnmet

275280285

valglymettyralasersertyrmetileleualametthrleuasp

290295300

arghisargalailecysargprometleualatyrarghisglyser

305310315320

glyalahistrpasnargprovalleuvalalatrpalapheserleu

325330335

leuleuserleuproglnleupheilephealaglnargasnvalglu

340345350

glyglyserglyvalthraspcystrpalacysphealagluprotrp

355360365

glyargargthrtyrvalthrtrpilealaleumetvalphevalala

370375380

prothrleuglyilealaalacysglnvalleuilephearggluile

385390395400

hisalaserleuvalproglyprosergluargproglyglyargarg

405410415

argglyargargthrglyserproglygluglyalahisvalserala

420425430

alavalalalysthrvalargmetthrleuvalilevalvalvaltyr

435440445

valleucystrpalaprophepheleuvalglnleutrpalaalatrp

450455460

aspproglualaproleugluglyalaprophevalleuleumetleu

465470475480

leualaserleuasnsercysthrasnprotrpiletyralaserphe

485490495

serserservalsersergluleuargserleuleucyscysalaarg

500505510

glyargthrproproserleuglyproglnaspglusercysthrthr

515520525

alaserserserleualalysaspthrserser

530535

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1