用小表位抗体降低样品复杂度的方法

文档序号:426634阅读:164来源:国知局
专利名称:用小表位抗体降低样品复杂度的方法
技术领域
本发明一般涉及用于降低样品复杂度的方法。更特别地,本发明涉及蛋白质组学,生物样品中蛋白质水平的测量,和使用识别小表位的抗体对样品中蛋白质的分析。
背景技术
蛋白质组学与用于评估基因活性的传统方法基因组学相比,可更直接的考察细胞或有机体的生物学功能。蛋白质组学包括通过检测及定量在蛋白质水平而不是在信使RNA水平上的表达定性及定量测定基因活性。蛋白质组学也包括研究非基因组编码事件,包括蛋白质的翻译后修饰、蛋白质降解及蛋白质副产物、蛋白质之间的相互作用以及细胞中蛋白质的定位。细胞表达的蛋白质的结构、功能或活性水平也是重要的。
蛋白质水平上基因表达的研究是重要的,因为许多最重要的细胞过程是通过细胞的蛋白质状态调节,而不是通过基因表达状态调节的。并且,由于大部分药物设计为对蛋白质靶具有活性,所以细胞的蛋白质含量与药物发现成果高度相关。
用于分析蛋白质混合物的当前技术是基于多种蛋白质分离技术及随后经分离蛋白质的鉴定和/或分析,所述蛋白质混合物为诸如细胞或细胞群的细胞内蛋白质及通过细胞或细胞群或生物学液体分泌的蛋白质。最普遍的方法是基于2D-凝胶电泳及随后的“胶内”(in-gel)蛋白水解消化及质谱分析。备选地,可用Edman及相关方法测序。该2D-凝胶技术需要大量样品量、费时且当前在可再现地分辨通过人细胞表达的蛋白质的重要级分的能力中受到限制。包括一些大型2D-凝胶的技术比常规2D-凝胶技术可产生分离较大量蛋白质的凝胶,但重复性仍很低并且由于可利用的测序技术灵敏度的限制不能对95%以上的点进行测序。电泳技术也具有偏向于高丰度蛋白质的缺点。
因此,需要能够更完全地测定有机体中细胞或细胞群表达的蛋白质或包含蛋白质的液体(如血清、血浆、淋巴及其它生物液体)中的蛋白质,包括直到一个或多个细胞表达的或者包含蛋白质的液体中发现的整组蛋白质。
发明概述一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触;和(b)分离抗体-蛋白质复合体,由此离析、分离、富集和/或纯化包含被一种或多种小表位抗体结合的一种或多种表位的蛋白质。
另一方面,本发明提供了方法,所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触;(b)分离抗体-蛋白质复合体,而将通过蛋白质进行离析、分离、富集和/或纯化,由此离析、分离、富集和/或纯化包含被一种或多种小表位抗体结合的一种或多种表位的蛋白质;和(c)自抗体-蛋白质复合体分离蛋白质。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括分离小表位抗体-蛋白质复合体,而将包含通过小表位抗体结合的表位的蛋白质进行富集;其中通过样品与小表位抗体接触产生所述复合体。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)分离小表位抗体-蛋白质复合体,而将包含通过小表位抗体结合的表位的蛋白质进行富集;其中通过样品与小表位抗体接触产生所述复合体;和(b)自抗体-蛋白质复合体分离蛋白质。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括自小表位抗体-蛋白质复合体分离蛋白质,而将包含通过小表位抗体结合的表位的蛋白质进行富集;其中小表位抗体-蛋白质复合体通过(a)和(b)产生,所述(a)为在允许结合条件下将样品与小表位抗体接触,由此产生小表位抗体-蛋白质复合体;所述(b)为分离抗体-蛋白质复合体。
显然地,可组合和/或顺序进行(常常以任意次序,只要能形成所需产物)一个或多个步骤,且显然地,本发明包括文中描述的步骤的多种组合。显然且在文中描述的是,本发明包括这样的方法,其中最初,或第一个步骤是文中描述的任意步骤。本发明的方法包含实施方案,在所述实施方案中较晚的“下游”步骤为最初步骤。
在一些实施方案中,所述方法还包括用蛋白质切割剂处理样品的步骤,从而产生多肽片段。在包括自抗体-蛋白质复合体分离蛋白质的步骤的实施方案中,在样品与至少一种小表位抗体接触的步骤之前,和/或自抗体-蛋白质复合体分离蛋白质的步骤之后,可用蛋白质切割剂处理样品。用蛋白质切割剂处理的方法是本领域公知的且在文中描述。可使用一种或多种蛋白质切割剂。蛋白质切割剂可为酶(如胰凝乳蛋白酶或胰蛋白酶)或化学剂(如溴化氰)。
因此,另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触;(b)分离抗体-蛋白质复合体,从将包含被一种或多种小表位抗体结合的一种或多种表位的蛋白质进行富集;(c)自抗体-蛋白质复合体分离蛋白质;和(d)用蛋白质切割剂处理蛋白质,从而产生多肽片段。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触,以形成抗体-蛋白质复合体;和(b)用蛋白质切割剂处理抗体-蛋白质复合体以产生多肽片段。
另一方面,本发明提供了用于降低蛋白质样品复杂度的方法,所述方法包括(a)用蛋白质切割剂处理样品,从而产生多肽片段;(b)在允许结合的条件下将多肽片段与一种或多种小表位抗体接触,从而产生抗体-多肽复合体;和(c)分离抗体-多肽复合体,从而将包含被一种或多种小表位抗体结合的一种或多种表位的多肽进行富集。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)孵育反应混合物,所述反应混合物包含(i)、表位抗体,和(ii)样品,其中在允许结合的条件下孵育;和(b)分离抗体-蛋白质复合体,从而富集蛋白质。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括分离抗体-蛋白质复合体,从而富集蛋白质;其中通过孵育反应混合物产生抗体-蛋白质复合体,所述反应混合物包含(a)小表位抗体;和(b)样品,其中在允许结合的条件下孵育。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)孵育反应混合物,所述反应混合物包含(i)小表位抗体,和(ii)样品,其中在允许结合的条件下孵育;(b)分离抗体-蛋白质复合体;和(c)自蛋白质-抗体复合体分离蛋白质,从而富集蛋白质。
另一方面,本发明提供了自经分离的蛋白质-抗体复合体分离蛋白质,其中通过孵育反应混合物产生蛋白质-抗体复合体,所述反应混合物包含(a)小表位抗体,和(b)样品,其中在允许结合的条件下孵育;和分离蛋白质-抗体复合体。
另一方面,本发明提供了用于降低包含蛋白质混合物的样品复杂度的方法,其包括分离小表位抗体-蛋白质复合体,其中将包含通过小表位抗体结合的表位的蛋白质进行富集。在一些实施方案中,所述方法还包括自抗体-蛋白质复合体分离蛋白质。在一些实施方案中,小表位抗体结合由约3至约5个氨基酸组成的表位。在一些实施方案中,将样品与多种小表位抗体接触以形成多种小表位抗体-蛋白质复合体。在一些实施方案中,将小表位抗体进行可检测地标记。在一些实施方案中,将多种小表位抗体在固体基质上固定。在一些实施方案中,样品与多种小表位抗体平行地接触。在一些实施方案中,样品与多种小表位抗体顺序接触。在一些实施方案中,样品与至少100种小表位抗体接触。在一些实施方案中,所述方法还包括将自抗体-蛋白质复合体分离的蛋白质与蛋白质切割剂接触以形成多肽片段。在一些实施方案中,方法又包括小表位抗体-蛋白质复合体与蛋白质切割剂接触以形成多肽片段。在一些实施方案中,所述方法还包括在形成小表位抗体-蛋白质复合体之前,将样品与蛋白质切割剂接触以形成多肽片段,任选还包括自小表位抗体-蛋白质复合体分离多肽片段。在一个实施方案中,蛋白质切割剂包含蛋白酶。在另一实施方案中,蛋白质切割剂包含化学剂。
另一方面,本发明提供了用于降低包含蛋白质混合物的样品复杂度的方法,其包括(a)将样品与至少一种小表位抗体接触以形成抗体-蛋白质复合体;和(b)自样品中未结合的蛋白质分离抗体-蛋白质复合体。在一些实施方案中,步骤(a)和(b)顺序地进行。在一些实施方案中,步骤(a)和(b)同时进行。在一些实施方案中,所述方法还包括自抗体-蛋白质复合体分离蛋白质。在一些实施方案中,小表位抗体结合由约3个至约5个氨基酸组成的表位。在一些实施方案中,至少一种小表位抗体包含至少约100种小表位抗体。
在其它方面,本发明提供了用文中描述的用于降低样品复杂度的方法制备的小表位抗体-蛋白质复合体、蛋白质和/或多肽片段。
对本领域技术人员显然地,所提及的组合及孵育所得混合物的方面也包括方法实施方案,其包括孵育多种混合物(以多种组合和/或亚组合)以形成所希望的产物。
本发明的方法中可使用一种或一种以上(如约两、约三、约四、约五、约十、约二十或二十种以上)小表位抗体。在一些实施方案中,样品与约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与至少约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与低于约100、约95、约90、约85、约80、约75、约70、约65、约60、约55、约50、约45、约40、约35、约30、约25、约20、约15、约10或10种以下小表位抗体接触。在一些实施方案中,样品与至少约10、20、30、40、50、75、100、125、150、200、300、400或500种小表位抗体接触,上限分别为约20、30、40、50、75、100、125、150、200、300、400、500或1000种小表位抗体。
本发明还提供了使用文中描述的任意方法制备的蛋白质的方法,例如用于表征蛋白质的方法,表达概况分析方法,鉴定蛋白质的方法;用于鉴定蛋白质降解产物的方法;用于鉴定翻译后修饰中变化的方法以及用于确定样品中蛋白质质量、量和/或同一性的方法。本发明的方法还包括基因分型(蛋白质突变检测)、鉴定剪接变体、确定目的蛋白质的存在或不存在、表达概况分析的方法;用于鉴定蛋白质降解产物的方法;用于鉴定翻译后修饰中变化以及蛋白质发现的方法。
因此,一方面,本发明提供了用于表征蛋白质的方法,其包括(a)用文中描述的任意方法降低样品的复杂度,从而富集和/或纯化蛋白质;和(b)分析蛋白质(可互换地称为“产物”)。
另一方面,本发明提供了用于表征蛋白质,包括分析蛋白质的方法;其中用文中描述的任意方法制备所述蛋白质。
在一些实施方案中,分析步骤包含确定所述蛋白质的量,从而对经制备、富集和/或分离的蛋白质的量进行定量。在一些实施方案中,分析步骤包含鉴定一种或多种所述蛋白质。在一些实施方案中,使用小表位抗体结合的表位的同一性帮助鉴定所富集的蛋白质。在一些实施方案中,用任意一种或多种以下特征鉴定蛋白质序列、质量、m/z比率(在包括质谱分析的实施方案中)和/或氨基酸组成。在其它实施方案中,分析步骤包含确定一种或多种蛋白质的质量。在一些实施方案中,分析步骤检测与参考蛋白质相比,蛋白质中的改变,所述参考蛋白质与没有序列改变的蛋白质序列(至少部分)相同。序列改变包括突变(如一个或多个氨基酸的缺失、替代、插入和/或颠换)、剪接变体、降解产物及糖基化的变化。
另一方面,本发明提供了用于用质谱分析法表征蛋白质的方法,其包括(a)用文中描述的任意方法降低样品的复杂度,从而富集和/或纯化蛋白质;和(b)分析用文中描述的任意方法分离、纯化、制备和/或分离的蛋白质(互换地称为“产物”),其中通过质谱分析法分析。
另一方面,本发明提供了用于表征蛋白质的方法,其包括用质谱分析法分析蛋白质;其中蛋白质用文中描述的任意方法制备;其中通过质谱分析法分析。在一些实施方案中,确定了蛋白质的数量、质量和/或同一性。在一些实施方案中,所述方法还包括使用表位同一性信息。
在一些实施方案中,质谱为基质辅助激光解吸/电离(“MALDI”)质谱分析法;表面增强激光解吸/电离(“SELDI”);和/或串连质谱分析法(例如,MS/MS、MS/MS/MS、ESI-MS/MS)。
另一方面,本发明提供了用质谱分析法确定样品中蛋白质同一性的方法,所述方法包括(a)用文中描述的任意方法降低样品的复杂度,从而富集和/或纯化蛋白质;(b)分析蛋白质(可互换地称为“产物”),其中通过质谱分析法分析;和(c)确定经富集的蛋白质的同一性。在一些实施方案中,所述方法还包括使用表位同一性信息。
另一方面,本发明提供了用于用质谱分析法确定样品中蛋白质同一性的方法,所述方法包括用质谱分析法确定蛋白质的同一性,其中蛋白质用文中描述降低样品复杂度的任意方法进行制备。在一些实施方案中,所述方法还包括使用表位同一性信息。
另一方面,本发明提供了用于蛋白质表达概况分析的方法,其中确定了一种或多种蛋白质的表达水平,其中蛋白质用文中描述用于降低样品复杂度的任意方法制备。在一些实施方案中,用质谱分析法确定表达水平。在一些实施方案中,本发明提供了用于比较两个或多个样品中蛋白质的量的方法。
另一方面,本发明提供了用于蛋白质表达概况分析的方法,其中确定了一种或多种蛋白质的同一性,其中蛋白质用文中描述用于降低样品复杂度的任意方法制备。在一些实施方案中,用质谱分析法确定蛋白质的同一性。在一些实施方案中,所述方法还包括使用表位同一性信息。在一些实施方案中,本发明提供了用于比较两个或多个样品中蛋白质同一性的方法。
另一方面,本发明提供了用于确定样品中存在或不存在目的蛋白质的方法,其中该方法包括在经富集的蛋白质级分中检测任意目的蛋白质,其中经富集的蛋白质级分用文中描述用于降低样品复杂度的任意方法制备,且其中目的蛋白质的检测表明样品中存在所述蛋白质。在一个实施方案中,检测包含质谱分析法。
另一方面,本发明提供了用于确定样品中目的蛋白质的量的方法,其中方法包括定量经富集的蛋白质级分中的蛋白质的量,其中经富集的蛋白质级分用文中描述的用于降低样品复杂度的任意方法制备。在一个实施方案中,目的蛋白质的定量包含质谱分析法。
另一方面,本发明提供了用于鉴定小表位抗体-蛋白质复合体中蛋白质的方法,其中小表位抗体-蛋白质复合体用文中描述的用于降低样品复杂度的任意方法制备。在一个实施方案中,鉴定包含质谱分析法。
另一方面,本发明提供了用于鉴定生物标记的方法,其中该方法包括比较两个或多个经富集的蛋白质级分中的蛋白质,其中用文中描述的用于降低样品复杂度的任意方法从样品制备两个或多个经富集的蛋白质级分中的每个级分。在一些实施方案中,两个或多个样品包含来自至少一名具有疾病状况的个体和至少一名不具有疾病状况的个体的样品,生物标记的存在或不存在指示该疾病状况。在一个实施方案中,本发明提供了用于确定个体中存在或不存在疾病状况的方法,其包括确定来自该个体的样品中生物标记的水平,其中生物标记如文中描述进行鉴定,且其中生物标记的水平指示存在或不存在所述疾病状况。在一些实施方案中,两个或多个样品包含来自至少一名接受疾病状况治疗的个体和至少一名未接受疾病状况治疗的个体的样品,所述生物标记的存在或缺乏指示治疗功效。在一个实施方案中,本发明提供了用于确定个体中疾病状况治疗功效的方法,其包括确定来自该个体的样品中生物标记的水平,其中所述生物标记如文中描述进行鉴定,其中所述生物标记的水平指示治疗功效。在一些实施方案中,两个或多个样品包含来自至少一名暴露于毒素或病原体的个体及至少一名未暴露于该毒素或病原体的个体的样品,生物标记的存在或缺乏指示个体暴露于该毒素或病原体。在一个实施方案中,本发明提供了用于确定个体暴露于毒素或病原体的方法,其包括确定来自所述个体的样品中生物标记水平,其中生物标记如文中描述的进行鉴定,其中所述生物标记的水平指示暴露于所述毒素或病原体。
另一方面,本发明提供了组合物及试剂盒,所述组合物及试剂盒包含用于本发明所述方法任一种的一种或多种小表位抗体。
在一些实施方案中,本发明提供了包含多种小表位抗体的组合物。在一些实施方案中,多种小表位抗体结合由约3个至约5个氨基酸组成的表位。在一些实施方案中,可检测地标记小表位抗体。在一些实施方案中,多种小表位抗体包含至少约100种小表位抗体。
在一些实施方案中,本发明提供了包含多种小表位抗体的试剂盒。在一些实施方案中,多种小表位抗体结合由约3个至约5个氨基酸组成的表位。在一些实施方案中,可检测地标记小表位抗体。在一些实施方案中,多种小表位抗体包含至少约100种小表位抗体。
附图简述

图1分别显示对于第2组及第5组小鼠使用免疫多肽的作图多肽跨越序列的反应图式。
图2显示了如在实施例2中描述的噬菌体ELISA中阳性抗体的第二次筛选结果。
图3显示了如在实施例2中描述的,针对肽1、6、7、8及9的来源于噬菌体L50P1_15的单链抗体的SPR迹线。
发明详述本发明提供了方法,所述方法用一种或多种结合(一般地,特异结合)小表位的抗体,称为“小表位抗体”基于蛋白质混合物中蛋白质内小表位的存在和/或量来分级分离蛋白质混合物,从而离析、分离、制备、纯化和/或富集包含小表位的蛋白质。因此使用本发明所述方法提供了用于降低蛋白质混合物复杂度的方法,有助于样品的经富集的蛋白质组分的随后使用和/或表征。在抗体结合的小表位是已知的范围内,通过小表位抗体结合提供了与小表位抗体结合的蛋白质的氨基酸含量相关的信息。文中还描述了小表位抗体。
总体上,所述方法包括(a)在允许结合的条件下,将样品与至少一种小表位抗体接触;和(b)分离抗体-蛋白质复合体与不结合小表位抗体的蛋白质。大体上,将包含通过至少一种小表位抗体结合的一种或多种表位的蛋白质进行离析、分离、富集和/或纯化。在一些实施方案中,所述方法还包括自抗体-蛋白质复合体分离蛋白质的步骤(c)。在一些实施方案中,所述方法还包括在将样品与至少一种小表位抗体接触的步骤(a)之前或在涉及自抗体-蛋白质复合体分离蛋白质的实施方案中,在自抗体-蛋白质复合体分离蛋白质的步骤(c)之后,用蛋白质切割剂处理样品的步骤。
本发明所述方法对包含蛋白质的样品的分级分离是有用的,所述分级分离通过使用抗体(称为“小表位抗体”)完成,所述抗体识别在多种蛋白质中存在的表位(例如,由或基本由3个线性氨基酸、4个线性氨基酸或5个线性氨基酸组成的表位)。适合在本发明的方法中使用的小表位抗体在文中广泛描述且在实施例中示例。由于小表位抗体的特异性,依赖通过本发明的方法中使用的小表位抗体识别的蛋白质中小表位的存在和/或量,分离、富集和/或纯化蛋白质(例如,多肽)。文中还描述了使用通过本发明的方法制备的蛋白质的方法。显然地,如文中所用的,“降低样品复杂度”包含自样品中离析、纯化、分离、富集和/或纯化蛋白质(例如多肽)。因此,本发明提供了用于纯化和/或富集蛋白质的方法,用于离析蛋白质的方法,用于分离蛋白质的方法,用于制备蛋白质用于表征的方法,用于制备蛋白质用于质谱分析法分析的方法,用于鉴定蛋白质(如一种或一组蛋白质)的方法,用于发现新蛋白质的方法及用于样品中蛋白质定量的方法。
一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触;和(b)分离抗体-蛋白质复合体,从而离析、分离、富集和/或纯化包含一种或多种小表位抗体结合的一种或多种表位的蛋白质。
另一方面,本发明还提供了方法,所述方法用于纯化和/或富集蛋白质;离析蛋白质;分离蛋白质,制备蛋白质用于表征;制备蛋白质用于质谱分析法分析;鉴定蛋白质(如一种或多种蛋白质或一组蛋白质);发现新蛋白质;和/或样品中蛋白质的定量,其中所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触;和(b)分离抗体-蛋白质复合体。
另一方面,本发明还包含使用通过本发明的任意方法制备的蛋白质的方法,例如,用于表征蛋白质,表达概况分析的方法,鉴定蛋白质的方法;用于鉴定蛋白质降解产物的方法;用于鉴定翻译后修饰中变化的方法,以及用于确定样品中蛋白质质量、量和/或同一性的方法。例如,这些方法可在诸如蛋白质发现、表达概况分析、药物发现及诊断学的领域中使用。
在另一实施方案中,质谱分析法用于表征用本发明的任意方法制备的蛋白质。由于通过使用文中描述的小表位抗体(与起始样品相比)降低了蛋白质(包括蛋白质变体)的数目,所以用小表位抗体产生的蛋白质级分特别经得起用质谱分析法分析。在鉴定了蛋白质中存在的表位范围内,表位的氨基酸序列或含量(称为“表位序列”或“表位氨基酸含量”)还提供了用于表征及鉴定蛋白质的信息。质谱分析法方法已用于定量和/或鉴定蛋白质。在一些实施方案中,质谱分析法分析产生多肽质量图。用这些结果,多肽质量作图可允许鉴定对应的蛋白质。在其它实施方案中,质谱分析法分析通过串连质谱仪并产生特定序列信息。用此信息可在序列水平鉴定对应蛋白质。在一些实施方案中,用包含用本发明的任意方法制备的蛋白质的MS分析联合表位序列或氨基酸含量信息的方法鉴定蛋白质。
在本发明所述方法中可使用一种或一种以上(如约2、约5、约7、约10、约20、约30、约50、约100或100种以上)小表位抗体。在一些实施方案中,样品与约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与至少约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与低于约100、约95、约90、约85、约80、约75、约70、约65、约60、约55、约50、约45、约40、约35、约30、约25、约20、约15、约10或10种以下小表位抗体接触。在一些实施方案中,样品与至少约10、20、30、40、50、75、100、125、150、200、300、400或500种小表位抗体接触,上限分别为约20、30、40、50、75、100、125、150、200、300、400、500或1000种小表位抗体。
另一方面,本发明提供了组合物及试剂盒,所述组合物及试剂盒包含在本发明的任一方法中使用的一种或多种小表位抗体。在一些实施方案中,试剂盒还包含用于文中描述的任一种方法的说明书。
常规技术除了另外注明外,本发明的实践利用本领域技术范围内的分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学及免疫学常规技术。此类技术在文献中充分说明,所述文献为诸如Molecular CloningALaboratory Manual,第二版(Sambrook等人,1989)Cold Spring HarborPress;Oligonucleotide Synthesis(M.J.Gait,ed.,1984);Methods inMolecular Biology,Humana Press;Cell BiologyA LaboratoryNotebook(J.E.Cellis,ed.,1998)Academic Press;Animal Cell Culture(R.I.Freshney,ed.,1987);Introduction to Cell and Tissue Culture(J.P.Mather和P.E.Roberts,1998)Plenum Press;Cell and Tissue CultureLaboratoryProcedures(A.Doyle,J.B.Griffiths和D.G.Newell,eds.,1993-8)J.Wiley和Sons;Methods in Enzymology(Academic Press,Inc.);Handbook ofExperimental Immunology(D.M.Weir和C.C.Blackwell,eds.);GeneTransfer Vectors for Mammalian Cells(J.M.Miller和M.P.Calos,eds.,1987);Current Protocols in Molecular Biology(F.M.Ausubel等人,eds.,1987);PCRThe Polymerase Chain Reaction(Mullis等人,eds.,1994);Current Protocols in Immunology(J.E.Coligan等人,eds.,1991);ShortProtocols in Molecular Biology(Wiley和Sons,1999);Immunobiology(C.A.Janeway和P.Travers,1997);Antibodies(P.Finch,1997);Antibodiesapractical approach(D.Catty.,ed.,IRL Press,1988-1989);Monoclonalantibodiesa practical approach(P.Shepherd和C.Dean,eds.,OxfordUniversity Press,2000);Using antibodiesa laboratory manual(E.Harlow和D.Lane(Cold Spring Harbor Laboratory Press,1999);以及TheAntibodies(M.Zanetti和J.D.Capra,eds.,Harwood Academic Publishers,1995)。
定义“抗体”为免疫球蛋白分子,其能够通过位于该免疫球蛋白分子的可变区中的至少一个抗原识别位点特异结合靶标,如糖、多核苷酸、脂类、多肽等。如文中所用的,该术语不仅仅包括完整多克隆或单克隆抗体,也包括其片段(如Fab、Fab’、F(ab’)2、Fv)、单链(ScFv)、其突变体、包含抗体部分的融合蛋白及包含具有所需要的特异性的抗原识别位点的免疫球蛋白分子的任意其它经修饰的构型。抗体包括任意类别的抗体,如IgG、IgA或IgM(或其亚类),且抗体不必属于任意具体类别。取决于抗体重链的恒定结构域的氨基酸序列,免疫球蛋白可分为不同类。主要有五类免疫球蛋白IgA、IgD、IgE、IgG及IgM,且这些类中的几种又可分为亚类(同种型),例如,IgG1、IgG2、IgG3、IgG4、IgA1及IgA2。对应于免疫球蛋白不同类的重链恒定结构域分别称为α、δ、ε、γ及μ。不同类免疫球蛋白的亚单位结构及三维构型是公知的。
“Fv”为包含完全抗原识别及抗原结合位点的抗体片段。在两链Fv种类中,此区域由以紧密、非共价连接的一条重链及一条轻链可变结构域的二聚体组成。在单链Fv种类中,一条重链及一条轻链可变结构域可通过柔性多肽接头共价连接从而轻链及重链可以在两链Fv种类中类似的二聚体结构连接。这种构型中,每个可变结构域的三个CDR相互作用以限定在VH-VL二聚体表面上抗原结合特异性。然而,甚至单个可变结构域(或仅仅包含对抗原特异的3个CDR的Fv的一半)具有识别及结合抗原的能力,即使大体上以比完整结合位点较低的亲和力识别及结合抗原。
Fab片段也包含轻链的恒定结构域及重链的第一个恒定结构域(CH1)。Fab’片段通过在重链CH1结构域的羧基末端加入几个残基,包括来自抗体铰链区的一个或多个半胱氨酸而与Fab片段不同。
“单克隆抗体”是指同质性抗体群,其中单克隆抗体包含涉及选择性结合抗原的氨基酸(天然存在或非天然存在的)。在它们针对单个抗原性位点方面,单克隆抗体群(相对于多克隆抗体)是高度特异的。术语“单克隆抗体”不仅仅包含完全单克隆抗体及全长单克隆抗体,也包含其片段(如Fab、Fab’、F(ab’)2、Fv)、单链(ScFv)、其突变体、包含抗体部分的融合蛋白及包含具有所需要的特异性的抗原识别位点及结合抗原的能力的免疫球蛋白分子的任意其它经修饰的构型(参见抗体定义)。抗体来源或抗体制备方式(例如,通过杂交瘤、噬菌体选择、重组表达、转基因动物,等)不欲受到限制。
文中可互换使用的术语“多肽”、“寡肽”、“肽”及“蛋白质”是指任意长度的氨基酸聚合物。聚合物可为线性或分支的,它可包含经修饰氨基酸,它可通过非氨基酸断开。该术语也包含经天然修饰或通过干扰修饰的氨基酸聚合物;所述修饰为例如二硫键形成、糖基化、脂化、乙酰化、磷酸化或任意其它操作或修饰,如用标记组分缀合。所述定义中也包括,例如包含一种或多种氨基酸类似物(包括,例如非天然氨基酸等等)以及本领域已知的其它修饰的多肽。
与抗体“特异结合”或“优先结合”(文中互换使用)的表位是本领域充分理解的术语,且确定特异或优先结合的方法也是本领域公知的。如果分子与特定细胞或物质比与备选细胞或物质反应或结合地更频繁、更快速、持续时间更长和/或亲和力更高,那么称此分子显示“特异结合”或“优先结合”。如果抗体与靶结合比与其它物质结合具有更大亲和力、亲合力、更容易和/或持续时间更长,那么此抗体与靶“特异结合”或“优先结合”。例如与表位特异或优先结合的抗体为比与其它表位以更大亲和力、亲合力、更容易和/或持续时间更长结合该表位的抗体。通过阅读这个定义也应当理解,例如,与第一种靶特异或优先结合的抗体(或部分或表位)与第二种靶可以或不可以特异或优先结合。同样地,“特异结合”或“优先结合”不必需要(虽然它可包括)专一结合。一般地,但不是必需的,所谈及的结合表示优先结合。
“样品”包含多种样品类型,包括获得自个体的样品。该定义包含血液及其它生物来源的液体样品、固体组织样品,如活体解剖标本或其来源的组织培养物或细胞及其子代。样品可来自微生物(例如,细菌、酵母、病毒、类病毒、霉菌、真菌)、植物或动物,包括哺乳动物如人、啮齿动物(如小鼠和大鼠)及猴(及其它灵长类)。样品可包含单个细胞或一个以上的细胞。该定义还包括在获得样品后对其以任意方法进行操作的样品,所述方法为诸如通过用试剂处理、增溶,或富集某些组分,如蛋白质或多核苷酸。术语“样品”包含临床样品,也包括培养的细胞、细胞上清液、细胞裂解物、血清、血浆、生物液、在动物中增殖的人组织,及组织样品。样品的实例包括血液、血浆、血清、尿、粪、脑脊液、滑液、羊膜液、唾液、肺灌洗液、精液、奶、乳头抽吸液、前列腺液、粘液及泪液。
样品的“复杂度”指不同蛋白质种类的数目,包括不同蛋白质的数目以及不同蛋白质变体(包括剪接变体、多态性及蛋白质降解产物)的数目。
“检测”是指鉴定(确定)待检测物体或物质的存在、缺乏和/或量,如文中描述的,检测可为定性和/或定量的。
如文中所用的,除非另外注明,单数形式“一个”、“一种”及“这个”包括复数形式。例如,“一种”抗体包括一种或多种抗体,“一种蛋白质””表示一种或多种蛋白质。
发明方法关于文中描述的所有方法,谈及小表位抗体时,其也包括包含一种或多种这些抗体的组合物。这些组合物可以还包含用以增强稳定性的合适的赋形剂,如可药用赋形剂以及缓冲剂和/或组分,它们是本领域公知的。用于降低样品复杂度的方法本发明提供了方法,所述方法基于蛋白质混合物中的蛋白质中蛋白质内小表位的存在或缺乏或量,用结合(一般地,特异结合)小表位的一种或多种抗体,称为“小表位抗体”以分级分离蛋白质混合物,从而产生蛋白质级分,所述蛋白质包含并富集所述小表位。如文中所用的,“经富集的”是指蛋白质或肽的浓度和/或纯度与该蛋白质或肽所来源的样品中的该蛋白质或肽的浓度和/或纯度相比增加。因此本发明所述方法的使用提供了降低蛋白质混合物的复杂度,方便样品的经富集的蛋白质组分的随后使用和/或表征的方法。在抗体结合的小表位的氨基酸序列或组成是已知的范围内,被小表位抗体结合提供了关于小表位抗体结合的蛋白质的氨基酸序列和/或含量的信息。如文中描述的,表位同一性信息(即,小表位抗体识别的氨基酸含量和/或序列)可与本发明的其它方法组合使用以例如,鉴定蛋白质。文中还描述了小表位抗体。
本发明还提供了方法,这些方法用于纯化和/或富集蛋白质;离析蛋白质;分离蛋白质,制备蛋白质用于表征(例如,随后分析);制备蛋白质用于质谱分析法分析;鉴定蛋白质;发现新蛋白质;和/或定量样品中的蛋白质。
总体上,所述方法包括(a)在允许结合条件下,将样品与至少一种小表位抗体接触;和(b)分离抗体-蛋白质复合体。在一个实施方案中,步骤(a)与步骤(b)顺序发生。在另一实施方案中,步骤(a)与步骤(b)同时发生。大体上,将包含被至少一种或多种小表位抗体结合的一种或多种表位的蛋白质进行离析、分离、富集和/或纯化(即,自最初样品的环境中除去)。在一些实施方案中,所述方法还包括步骤(c)自抗体-蛋白质复合体分离蛋白质。在一些实施方案中,所述方法还包括用蛋白质切割剂处理样品。在一个实施方案中,在样品与至少一种小表位抗体接触的步骤(a)之前加入蛋白质切割剂。在另一实施方案中,在自抗体-蛋白质复合体分离蛋白质的步骤(c)之后加入蛋白质切割剂。
本发明的方法对分级分离包含蛋白质(如多肽)的样品是有用的,所述方法通过使用识别存在于多种蛋白质中的表位(例如,由或者基本上由3个线性氨基酸、4个线性氨基酸或5个线性氨基酸组成的表位)的抗体(称为“小表位抗体”)来完成。适合在本发明的方法中使用的小表位抗体在文中详尽描述且在实施例中例证。依靠小表位抗体的特异性,根据本发明方法中使用的小表位抗体识别的蛋白质中的小表位的存在和/或量,分离、富集和/或纯化蛋白质或肽(例如,多肽)。显然,如文中所用的,“降低样品复杂度”包括从样品中离析、纯化、分离、富集和/或纯化蛋白质或肽(例如多肽)(包括自样品的环境除去所述蛋白质或肽)。
因此,一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下将样品与一种或多种小表位抗体接触;和(b)分离抗体-蛋白质复合体,从而离析、分离、富集和/或纯化包含被一种或多种小表位抗体结合的一种或多种表位的蛋白质。在一些实施方案中,所述方法还包括自抗体-蛋白质复合体分离蛋白质的步骤(c)。
在一个实施方案中,本发明提供了用于降低蛋白质样品复杂度的方法,所述方法包括分离小表位抗体-蛋白质复合体,从而富集包含小表位抗体结合的表位的蛋白质;其中通过将样品与小表位抗体接触产生复合体。在另一实施方案中,本发明提供了用于降低蛋白质样品复杂度的方法,所述方法包括分离多种小表位抗体-蛋白质复合体,从而富集包含被多种小表位抗体结合的表位的蛋白质,其中通过将样品与多种小表位抗体接触产生复合体。
另一方面,本发明提供了用于降低蛋白质样品复杂度的方法,所述方法包括自小表位抗体-蛋白质复合体分离蛋白质,从而富集包含被小表位抗体结合的抗体的蛋白质;其中在允许结合的条件下,通过将样品与小表位抗体接触产生小表位抗体-蛋白质复合体,从而产生小表位抗体-蛋白质复合体;并分离抗体-蛋白质复合体与样品中未结合的蛋白质(如果存在)。在一个实施方案中,本发明提供了用于降低蛋白质样品复杂度的方法,所述方法包括自小表位抗体-蛋白质复合体分离多种蛋白质,从而富集包含被多种小表位抗体结合的表位的蛋白质,其中在允许结合样品中蛋白质的条件下,通过将样品与多种小表位抗体接触产生小表位抗体-蛋白质复合体,从而产生小表位抗体-蛋白质复合体,并分离抗体-蛋白质复合体与样品中未结合的蛋白质(如果存在)。
显然,一个或多个步骤可组合和/或顺序进行(常常是以任意次序,只要能形成需要的产物),并且,显然地,本发明包括文中描述的步骤的多种组合。显然且在文中描述的是,本发明包括这样的方法,其中最初,或第一个步骤是文中描述的任意步骤。本发明的方法包含实施方案,在所述实施方案中较晚的“下游”步骤为最初步骤。
在一些实施方案中,所述方法还包括用蛋白质切割剂处理样品的步骤,从而产生多肽片段。在包括自抗体-蛋白质复合体分离蛋白质的步骤(c)的实施方案中,在样品与至少一种小表位抗体接触的步骤(a)之前,和/或自抗体-蛋白质复合体分离蛋白质的步骤(c)之后,可用蛋白质切割剂处理样品。蛋白质切割剂可为酶(如胰凝乳蛋白酶或胰蛋白酶)或化学剂(如溴化氰)。蛋白质切割剂及用蛋白质切割剂处理的方法是本领域公知的并在文中进一步描述。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下,将样品与一种或多种小表位抗体接触;(b)分离蛋白质-抗体复合体,从而富集包含被一种或多种小表位抗体结合的一种或多种表位的蛋白质;(c)自蛋白质-抗体复合体分离蛋白质;和(d)用蛋白质切割剂处理蛋白质,从而产生多肽片段。
另一方面,本发明提供了用于降低样品复杂度的方法,所述方法包括(a)在允许结合的条件下,将样品与一种或多种小表位抗体接触,从而形成抗体-蛋白质复合体;和(b)用蛋白质切割剂处理抗体-蛋白质复合体以产生多肽片段。
另一方面,本发明提供了用于降低蛋白质样品复杂度的方法,所述方法包括(a)用蛋白质切割剂处理样品,从而产生多肽片段;(b)在允许结合的条件下将多肽片段与一种或多种小表位抗体接触,从而产生抗体-多肽复合体;和(c)分离抗体-多肽复合体,从而富集包含被一种或多种小表位抗体结合的一种或多种表位的多肽。
在本发明方法中可使用一种,或一种以上(如约两、约三、约五、约十、约二十、约一百或一百种以上)小表位抗体。在一些实施方案中,样品与约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与至少约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与低于约100、约95、约90、约85、约80、约75、约70、约65、约60、约55、约50、约45、约40、约35、约30、约25、约20、约15、约10或10种以下小表位抗体接触。在一些实施方案中,样品与至少约10、20、30、40、50、75、100、125、150、200、300、400或500任一种的小表位抗体接触,上限为约20、30、40、50、75、100、125、150、200、300、400、500或1000任一种的小表位抗体。
应当理解样品也可以与其它蛋白质结合活性剂,包括不是小表位抗体的蛋白质及其它蛋白质结合活性剂接触。此类活性剂可在用小表位抗体处理前或处理后同时、顺序使用。
在一些实施方案中,在样品与一种或多种小表位抗体接触的步骤之前或同时,用结合一种或多种蛋白质的一种或多种抗体处理样品,优选已知在样品中丰富的蛋白质。例如,在血清样品中,预处理可包含结合白蛋白、免疫球蛋白和/或其它丰富蛋白质的抗体。在一个实施方案中,在与结合一种或多种已知丰富蛋白质的一种或多种抗体接触之前,将样品中的蛋白质用蛋白质切割剂切割。在另一实施方案种,在与结合一种或多种已知蛋白质,如丰富蛋白质的一种或多种抗体接触之后,将样品中的蛋白质用蛋白质切割剂切割。在一个实施方案中,在与一种或多种小表位抗体接触前,自样品中除去结合的蛋白质(如丰富蛋白质)。在一个实施方案中,所述方法包括通过用与样品中一种或多种已知蛋白质,如丰富蛋白质结合的一种或多种抗体处理(任选接着除去结合的蛋白质)来“压实”(debulking)样品,用蛋白质切割剂切割样品中的蛋白质,及将切割的蛋白质与一种或多种小表位抗体接触。在另一实施方案中,所述方法包括用蛋白质切割剂处理样品,通过用与一种或多种已知蛋白质,如丰富蛋白质和/或样品中经切割的多肽片段结合的一种或多种抗体处理压实样品(任选接着除去结合的蛋白质和/或多肽片段),及将剩余蛋白质和/或经切割的多肽片段与一种或多种小表位抗体接触。在另一实施方案中,所述方法包括通过用结合一种或多种已知蛋白质,如丰富蛋白质的一种或多种抗体处理(任选接着除去丰富蛋白质)压实样品,将样品与至少一种小表位抗体接触以形成抗体-蛋白质复合体,及用蛋白质切割剂处理抗体蛋白质复合体。
还理解用小表位抗体处理后剩余的样品的蛋白质组分(即未结合的组分)也可适合在本发明的方法中使用,所述方法使用用本发明的方法产生的蛋白质。因此,在一些实施方案中,使用用本发明的方法产生的蛋白质的方法包括使用此未结合的蛋白质级分。
用于抗体结合及分离抗体-蛋白质复合体的方法及条件是本领域公知的且在文中进一步描述。一般地,样品与小表位抗体接触时部分或全部变性,但不是在每个实施方案都需要变性。在一些实施方案中,将样品与两种或多种抗体接触的步骤(a)是顺序的(如当一种抗体与样品接触,然后除去时,另一抗体与样品接触并除去,等等)。在其它实施方案中,例如,当一组抗体与样品同时接触时,接触两种或多种抗体的步骤(a)是平行的。在一些实施方案中,两种或多种抗体的几个组与样品顺序接触,例如,组1接触并除去,组2接触并除去等等。
如在定义中注明的,及如文中所用的,“样品”包含多种样品类型,包括获得自个体的样品类型。在一些实施方案中,样品包含血液、血浆、血清、尿、粪、脑脊液、滑液、羊水、唾液、肺灌洗液、精液、奶、乳头抽吸液、前列腺液、粘液及泪液。用于在本发明方法中使用的合适的样品在文中进一步描述。
使用用本发明的方法分离(富集)的蛋白质的方法用本发明的方法分离或富集的蛋白质可用于多种目的。为了阐明,描述了用通过本发明的方法富集和/或纯化蛋白质表征蛋白质的方法。在一些实施方案中,用质谱分析法表征蛋白质,从而可定量和/或鉴定蛋白质。还描述了基因分型(蛋白质突变检测)、鉴定剪接变体、确定目的蛋白质的存在或不存在、表达概况分析的方法;用于鉴定蛋白质降解产物的方法;用于鉴定翻译后修饰中变化的方法及蛋白质发现的方法。
为了简便和方便,一般谈及“蛋白质”。应当理解谈及蛋白质时其包含“多肽”(可互换地称为“多肽片段”)。如从文中讨论显然的,在一些实施方案中,用蛋白质切割剂产生多肽片段。
表征蛋白质的方法本发明提供了用于表征(例如,检测(存在或不存在)和/或定量)目的蛋白质(一般地,多肽片段)的方法。在一些实施方案中,用本发明的方法产生一种或多种样品级分,每种级分包含的蛋白质少于起始样品中的,有助于随后表征级分中包含的所述蛋白质。特别地,如文中进一步描述的,预计有待加强使用质谱分析法的表征。
因此,本发明提供了用于表征蛋白质的方法,其包括(a)用文中描述的任意方法降低样品的复杂度,从而对蛋白质进行富集和/或纯化;及(b)分析通过文中描述的任意一种方法分离的蛋白质(可互换地称为“产物”)。
另一方面,本发明提供了用于表征蛋白质的方法,其包括分析蛋白质(可互换地称为“产物”),其中用文中描述的用于降低样品复杂度的任意方法(包括用于纯化和/或富集蛋白质的方法,用于离析蛋白质的方法,用于分离蛋白质的方法,用于制备蛋白质级分用于表征的方法,用于制备蛋白质级分用于质谱分析法分析的方法,用于鉴定蛋白质(如一种或多种蛋白质,或一组蛋白质)的方法,用于发现新蛋白质的方法及用于定量样品中的蛋白质的方法)制备蛋白质。
通过本领域已知或文中描述的任意方法进行分析步骤。用于分析蛋白质的方法是本领域公知的,且包括十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(“SDS-PAGE”)、等电聚焦、通过诸如高压液相层析、FPLC、薄层层析、亲和层析、凝胶过滤层析、离子交换层析的技术分离,及其它标准生物化学分析、免疫检测、蛋白质测序、用蛋白质阵列分析、质谱分析等等。因此,本发明包括如应用于文中方法的任意产物的其他分析和/或定量方法。
在一些实施方案中,分析步骤包括确定所述蛋白质的量,从而定量所制备、富集和/或分离的蛋白质的量。应当理解可用定量和/或定性方法确定富集的蛋白质的量。确定蛋白质产物的量包括确定产物存在或不存在。
在一些实施方案中,分析步骤包含鉴定一种或多种所述蛋白质。用于鉴定蛋白质的方法是本领域已知的,且包括免疫检测、蛋白质测序等等。在一些实施方案中,鉴定基本上所有经富集的蛋白质(从样品纯化或富集)。在一些实施方案中,小表位抗体结合的表位的同一性用于帮助鉴定经富集的蛋白质。在一些实施方案中,用任意一种或多种以下特征鉴定蛋白质序列、质量、m/z比率(在涉及质谱分析的实施方案中)、氨基酸组成及提供鉴定蛋白质的足够信息的任意其它方法。如文中所用的,“鉴定”包括鉴定已知(以前经表征的蛋白质)以及发现以前未知或未表征的蛋白质(包括蛋白质变体如突变蛋白质、差别修饰的蛋白质(例如,不同糖含量)及剪接变体)。在一些实施方案中,鉴定了多种、很多种或非常多种蛋白质。在其它实施方案中,鉴定了至少约2、3、4、5、10、20、30、40、50、60、70、80、90、100、500或1000或1000种以上的蛋白质。
在其它实施方案中,分析步骤包括确定一种或多种蛋白质的质量。
在一些实施方案中,分析步骤包括分析与参考蛋白质相比蛋白质中的改变,所述参考蛋白质与没有序列改变的蛋白质序列(至少部分)相同。序列改变可为基因组序列中存在的序列改变或可为在基因组DNA序列中没有反映出来的序列改变,例如,由于翻译后修饰改变和/或mRNA加工的改变,包括剪接变体,和/或翻译后修饰如糖基化的量的改变及蛋白质降解或副产物。序列改变包括突变(如一个或多个氨基酸的缺失、替代、插入和/或颠换)。
应当理解小表位抗体与表位的同一性(序列)可与文中描述的任意方法组合使用以例如鉴定蛋白质。
用质谱分析法表征蛋白质的方法在一些实施方案中,质谱分析法(MS)用于表征用本发明的方法分离的蛋白质。一般地,在涉及质谱分析的实施方案中,用蛋白质切割剂处理样品(从而产生多肽片段),但不是在每个实施方案中都需要用切割剂处理。在一些实施方案中,在样品与小表位抗体接触前用蛋白质切割剂处理样品。在其它实施方案中,在通过与小表位抗体接触、分离抗体-蛋白质复合体及从蛋白质-抗体复合体分离蛋白质富集蛋白质级分之后用蛋白质切割剂处理样品。如文中提到的,因为用本发明的方法产生的蛋白质级分复杂性低于起始样品,所以用本发明的方法产生的蛋白质(如多肽片段)特别适合用质谱分析法分析。在蛋白质中存在的表位是已知的,例如,小表位抗体识别的关连表位(cognate epitope)用于纯化和/或富集包含所述蛋白质的蛋白质级分的情况下,所述表位的氨基酸序列或含量(称为“表位序列”或“表位含量”)提供了用于表征及鉴定所述蛋白质的其他信息。
用于质谱蛋白质分析的方法是本领域已知的且在文中进一步描述。质谱分析方法已经用于定量和/或鉴定蛋白质(参见,例如,Li等人(2000)Tibtech 18151-160;Rowley等人(2000)Methods 20383-397;及Kuster和Mann(1998)Curr.Opin.Structural Biol.8393-400.)。还研发了质谱分析技术,其允许至少部分从头测序分离的蛋白质。Chait等人(1993)Science 26289-92;Keough等人(1999)Proc.Natl.Acad.Sci.USA 967131-6;在Bergman(2000)EXS 88133-44中综述。
多肽质量作图提供了所分析的蛋白质或蛋白质级分的基于它的氨基酸组成的多肽质量指纹图。可用例如MALDI-TOF平台获得多肽质量作图,在所述MALDI-TOF平台中基质辅助激光解吸/电离(MALDI)用于离子化目的多肽而离子化多肽的飞行时间分布提供了每种多肽的质量与电荷比,其可用于查询蛋白质序列数据库。产生的多肽质量指纹图包含基于质量及电荷测定的氨基酸组成。用这些结果,小组多肽质量匹配可提供用于鉴定对应蛋白质的足够信息。
在用于通过MS鉴定蛋白质的第二种方法中,将混合物中的个体多肽片段化以产生序列信息。通过来自液相的电喷射(ESI)将多肽离子化,且然后喷射到串联的质谱仪中,所述质谱仪通过主要断裂多肽键(碰撞诱导的解离)能溶解混合物中的多肽、分离目的多肽和将个体多肽种类解离成为组成性包含氨基末端及羧基末端的片段。产生的质谱包含亲本离子以及来自包含氨基末端及羧基末端的片段的离子的两个重叠质量梯。因为梯的每个成员的质量与电荷比(称为“m/z”)与该系列中它的最接近的质量邻居有一个氨基酸不同,所以可产生部分一级序列并将其用于查询蛋白质及所翻译的DNA序列数据库。此质谱分析平台提供了来自几种多肽的特定序列信息,所述特定序列信息对于蛋白质鉴定通常比反映多肽氨基酸组成的一组多肽质量(如通过其它平台,包括SELDI-TOF产生的)更有用。
如下文进一步描述的,质谱分析方法还允许定量所分析的蛋白质。
其它质谱分析方法是本领域公知的,且包括基质辅助激光解吸/电离(“MALDI”)质谱分析法;表面增强激光解吸/电离(“SELDI”);串联质谱分析法(例如,MS/MS、MS/MS/MS、ESI-MS/MS等等)。在一些实施方案中,使用激光解吸/电离质谱仪进行串联质谱分析法,所述质谱仪又连接四极飞行时间质谱仪QqTOF MS(参见例如,Krutchinsky等人,WO99/38185)。以前描述了诸如MALDI-QqTOFMS(Krutchinsky等人,WO 99/38185;Shevchenko等人(2000)Anal Chem.722132-2141)、ESI-QqTOF MS(Figeys等人(1998)Rapid Comm′ns.Mass Spec.12-1435-144)及芯片毛细管电泳(芯片-CE)-QqTOF MS(Li等人(2000)Anal.Chem.72599-609)的方法。质谱分析仪及本发明方法中使用它们的技术是本领域技术人员公知的。本领域技术人员将理解质谱仪的任意组件(例如,解吸源、质量分析仪、检测等等)可与文中描述或本领域技术人员已知的其它合适的组件组合。关于质谱仪的额外信息,参见,例如,Principles ofInstrumental Analysis,3rd ed.,Skoog,Saunders College Publishing,Philadelphia,1985;及Kirk-Othmer Encyclopedia of Chemicai Technology,4th ed.Vol.15(John Wiley & Sons,New York 1995),pp.1071-1094。
质谱的数据分析用质谱分析法分析获得的质谱数据可用于获得关于用本发明方法获得的经富集的蛋白质产物的量和/或同一性的信息。可用任意合适方法(例如,通过视觉,通过计算机,等等)分析通过多肽解吸及检测产生的数据。在一个实施方案中,使用可编程的数字计算机分析数据。计算机含有接收输入数据的代码,所述输入数据为在基质上特定可寻址位置接收的多种分子质量的信号强度的数据。此数据可指出所检测产物的数目,任选包括峰值信号的强度及对于每种检测产物测定的分子质量。
数据分析可包括确定所检测的峰值(例如,特定质量-电荷值或值的范围的峰值)的信号强度(例如,峰高度)和除去“异常值”(与预定统计分布偏离的数据)的步骤。可对观察到的峰进行归一化,该方法中计算相对于某个参比的每个峰的高度。例如,参比可为通过仪器及化学品(例如,能量吸收分子)产生的本底噪声,所述本底噪声在刻度上设为零。然后对每种多肽或其它物质检测的信号强度可以以希望的刻度(例如,100)以相对强度的形式显示。备选地,可承认样品是标准的,从而来自标准的峰可用作参比以计算为所检测的每种亲和标记产物观察到的信号的相对强度。可用软件程序如Biomarker Wizard程序(Ciphergen Biosystems,Inc.,Fremont,Calif.)帮助分析质谱。
在一些实施方案中,通过用可编程的数字计算机执行算法部分确定样品中存在的一种或多种蛋白质的量。所述算法鉴定第一个样品中第一个质谱中及第二个样品中的第二个质谱中的至少一个峰值。然后算法比较第一个质谱峰值的信号强度与第二个质谱峰值的信号强度。相对信号强度表明第一及第二样品中存在的蛋白质的量。含有已知量蛋白质的标准可作为第二个样品进行分析以对第一个样品中存在的蛋白质的量更好地定量。在某些实施方案中,也可确定第一及第二个样品中蛋白质的同一性(参见下文)。
本发明还提供了用于确定蛋白质同一性的方法。在某些实施方案中,可编程的数字计算机用于存取包含一个或多个质谱的数据库。然后用可编程的数字计算机执行算法以对每个预计的质谱确定至少第一次测定。第一次测定表明所述蛋白质的质谱与多种预计的质谱的每一个之间的拟合接近性(closeness-of-fit)。
通过用可编程的数字计算机执行比较MS数据与数据库中的记录的算法,质谱的数据可用于鉴定蛋白质。通过MS方法分析时,每个分子提供了特征性的质谱(MS)数据(也称作质谱“签名”或“指纹”)。可通过将此数据与包含真实的或理论MS数据或蛋白质序列信息等的数据库比较分析此数据。此外,可将蛋白质切割成片段用于MS分析。获得自片段的MS分析的信息也与数据库进行比较以鉴定样品中的蛋白质(例如,蛋白质)(参见,例如,Yates(1998)J Mass Spec.331-19;Yates等人,美国专利号5,538,897;Yates等人,美国专利号6,017,693;PCT申请号WO 00/11208及Gygi等人(1999)Nat.Biotechnol.10994-999)。现在易于在因特网上获得有助于解释质谱,特别是蛋白质质谱及公共结构域序列数据库的挖掘的软件来源来促进蛋白质鉴定。这些软件来源中有ProteinProspector(http//prospector.ucsf/edu)、PROWL(http//prowl.rockefeller.edu及Mascot Search Engine(Matrix Science Ltd.,London,UK,www.matrixscience.com)。
在某些实施方案中,获得自此数据的MS数据及信息与由关于蛋白质的数据及信息组成的数据库进行比较。例如数据库可由核苷酸或氨基酸序列组成。数据库可由表达序列标签(EST)的核苷酸或氨基酸序列组成。备选地,数据库可由核苷酸或氨基酸水平上的基因序列组成。数据库可包括但不限于一组核苷酸序列、氨基酸序列或任意物种的基因组中包括的核苷酸序列的翻译。
通常通过任选由计算机执行的计算机程序或搜索算法分析关于蛋白质信息,例如,核苷酸或氨基酸序列的数据库。对来自序列数据库的信息搜索与获得自本发明的方法的数据及信息的最佳匹配(参见例如,Yates(1998)J.Mass Spec.331-19;Yates等人,美国专利号5,538,897;Yates等人,美国专利号6,017,693)。可用任意适当算法或计算机程序搜索数据库。搜索算法及数据库不断更新,并且根据本发明使用此类更新版本。程序或数据库的实例可在万维网(WWW)上http//base-peak.wiley.com/、http//mac-mann6.embl-heidelberg.de/MassSpec/Software.html、http//www.mann.emblheidelberg.de/Services/PeptideSearch/PeptideSearchIn-tro.html、ftp//ftp.ebi.ac.uk/pub/databases/及http//donatello.ucsf.edu找到。美国专利号5,632,041;5,964,860;5,706,498及5,701,256也描述了用于序列比较的算法或方法。其它数据库的实例包括Genpept数据库、GenBank数据库(在Burks等人(1990)Methods in Enzymology 1833-22中描述)、EMBL数据库(在Kahn等人(1990)Methods in Enzymology18323-31中描述)、蛋白质序列数据库(在Barker等人(1990)Methods inEnzymology 18331-49描述)、SWISS-PROT(在Bairoch等人(1993)Nucleic Acids Res.213093-3096中描述)及PIR-International(在(1993)Protein Seg.Data Anal.567-192中描述)。
在一些实施方案中,通过小表位抗体识别的表位的氨基酸序列(称为“表位序列”)与数据库搜索信息及搜索算法联合使用以加强蛋白质的鉴定。例如,在MS数据及通过比较由涉及蛋白质的数据及信息组成的数据库获得的信息分析之前或之后,表位的氨基酸序列可用于改进数据分析。例如,通过自列表中排除不包括所述表位序列的成员可精选蛋白质同一性候选物的初步列表。在另一实例中,可编辑或理论上产生包含给定表位序列的所有蛋白质的数据库。然后用本领域已知的数据分析方法进一步分析该数据库。
一般通过任选通过计算机执行的计算机程序或搜索算法分析涉及蛋白质信息例如,核苷酸或氨基酸序列的数据库。
在又一实施方案中,产生新数据库用于比较质谱分析法确定的MS数据,例如经切割蛋白质及多肽片段的质量或质谱。例如,产生包含小表位抗体识别的表位的所有多肽片段的理论数据库。该数据库可与任意数据分析工具及文中描述的方法联合使用。
在一些实施方案中,来自质谱的多肽的质量用于查询数据库中提供最接近拟合的来自核酸序列的蛋白质或预计蛋白质的那些质量。以这种方式,在无氨基酸序列时可快速鉴定未知蛋白质。在本发明的其它实施方案中,自其多肽片段提供的质量可与来自提供最接近拟合的核酸序列的蛋白质或预计蛋白质数据库的预计质谱比较。
如果来自序列数据库的序列或者模拟切割序列落入与从亲本或者片段分子的MS数据产生的序列的相似序列同源性的所希望的范围内,那么称所述来自序列数据库的序列或者模拟切割序列“匹配”或“命中”。以这种方式,可快速确定蛋白质或其片段的同一性。研究者可根据每个具体分析定制或改变可接受的序列同源性比较值的范围。
应当理解为了方便,谈及蛋白质“同一性”。应当理解文中描述的方法同样适用于确定突变(如氨基酸替代、颠换、插入或缺失)及其它蛋白质变体,如剪接变体、降解产物和/或差别翻译后修饰(例如,在糖基化水平的变异)的存在或不存在。
在一些实施方案中,通过检测m/z比相对于参照m/z比的改变确定突变的存在或不存在。
在一些实施方案中,通过比较内糖基化酶(endoglycosylase)处理的样品与参考样品(例如,没有用内糖基化酶处理的样品)确定翻译后修饰的水平(或水平的改变),从而确定翻译后修饰的水平。
表达概况分析本发明的方法适合用于确定样品中一种或多种蛋白质的表达水平。如以上描述地,可通过如文中和/或本领域已知的多种方法检测和/或定量经富集和/或纯化的蛋白质级分。在一些实施方案中,用质谱分析法分析(包括定量和/或鉴定)蛋白质级分。理解可用定量和/或定性方法确定蛋白质产物的量。确定产物的量包括确定产物存在或不存在。因此,表达概况分析可包括关于一种或多种目的蛋白质存在或不存在的信息。如文中所用的产物的“不存在”及“检测不到产物”包括不显著的或最低(de minimus)水平。
在一些实施方案中,比较了两个或多个样品中蛋白质的量。一般地,样品具有重叠蛋白质分布图。用本发明的方法,可比较蛋白质的量以确定分布图本质的差别和存在的蛋白质的量。这些方法用于鉴定指示疾病状态(例如,疾病生物标记、PSA、BRCA1,等等)的蛋白质的性质或者量的改变,或治疗功效、或活性剂的毒性作用或病原体(例如,HIV、细菌病原体、朊病毒等等)的存在,等等。这些方法也用于发现与疾病状态相关的蛋白质,其用于药物发现目的、诊断目的等等。具体地,比较来自不同受试者或者已经受到不同条件或者处理的样品的蛋白质分布图是有用的。
例如,在某些实施方案中,第一个样品为未处理的对照样品,第二个样品受活性剂或条件的处理。活性剂的实例包括但不限于化学治疗剂、紫外线、医学装置(例如,支架除纤颤器)、外源基因及生长因子。本领域技术人员认识到有许多将外源基因导入到细胞中的方法(参见,例如,Ausubel等人,eds.,(1994),同上)。在其它实施方案中,第一个样品为患病样品且第二个样品为非患病样品。此外,活性剂可为候选药物的形式。例如,第一个样品中的蛋白质用候选药物处理且可与为阴性或阳性对照的第二个样品进行比较。候选药物对第一及第二个样品中存在的蛋白质(例如,蛋白质)的量的影响可表明候选药物的效力或毒性。本领域技术人员应当理解这些方法可适合分析任意活性剂对疾病状态或样品中存在的疾病标记物的量的影响。在一个实施方案中,所述方法用于鉴定与活性剂(如候选药物)处理相关的蛋白质。此类蛋白质可以,例如,与活性剂效力相关,且因此作为临床终点的代表。
生物标记可用文中描述的表达概况分析及表征方法鉴定生物标记蛋白质(或蛋白质)。生物标记为目的蛋白质,其检测、监视、定量和/或表征是重要的。在一些实施方案中,生物标记与特定条件或处理,如疾病或病症、用药物治疗(包括药物治疗的效力和/或毒性)、用医学装置处理等等相关。在其它实施方案中,生物标记在目的组织或细胞(例如肿瘤、器官,等等)中表达。如文中所用的,生物标记蛋白质可为新鉴定的蛋白质或蛋白质变体(如突变蛋白质、剪接变体、具有改变的翻译后修饰的蛋白质等等)。在其它实施方案中,生物标记为组织特异标记物。
生物标记在诊断(在一些实施方案中,包括疾病分期)、预测、评估和/或疗法选择、疾病发展监视、治疗效力监视和/或疾病治疗中可用作替代标记物。在一些实施方案中,生物标记通过本领域已知的任意方法和/或文中描述任意方法进行检测和/或定量,其中生物标记的表达(生物标记存在或不存在,或生物标记的差异表达)表明病症或疾病的存在。在一个实施方案中,生物标记的水平升高表明存在病症或疾病。在另一实施方案中,生物标记的水平降低表明存在病症或疾病。在一些实施方案中,生物标记的表达用于评估特定治疗性治疗方案在动物研究、临床试验中的效力或监测个体受试者的治疗。在一些实施方案中,生物标记作为所希望的临床终点的代表。在其它实施方案中,当生物标记的表达预示活性剂(如药物)治疗效力时,生物标记与活性剂的效力相关。在一个实施方案中,生物标记水平升高表明治疗的效力或进展。在另一实施方案中,生物标记水平降低表明治疗的效力或进展。
生物标记可用作毒性的标记,所述毒性包括活性剂如药物、新的药物候选者、化妆品或其它化学品的毒性。在一些实施方案中,生物标记表达的检测也可用于监测对活性剂如毒素或病原体的环境暴露。在一个实施方案中,生物标记水平升高表明毒性或暴露于活性剂。在另一实施方案中,生物标记水平降低表明毒性或暴露于活性剂。
生物标记可用于筛选具有特异结合亲和力的多种分子及化合物或分子或化合物库,包括例如DNA分子、RNA分子、肽核酸、多肽、模拟物、小分子等等。在一个实施方案中,测定包括提供多种分子和/或化合物,在允许特异结合条件下将生物标记与多种分子和/或化合物组合,并检测特异结合以鉴定特异结合该生物标记的至少一种分子或化合物。
类似地,一种或多种生物标记或其部分可在多种筛选测定的任一种中用于筛选多种分子和/或化合物或分子和/或化合物库以鉴定配体。筛选方法是本领域公知的。测定法可用于筛选,例如,与生物标记特异结合的适体、DNA分子、RNA分子、肽核酸、多肽、模拟物、蛋白质、抗体、激动剂、拮抗剂、免疫球蛋白、抑制剂、小分子、药学活性剂或药物化合物等等。
在另一实施方案中,包含特异结合生物标记的抗原结合位点的一种或多种抗体可用于检测所述生物标记(包括体外及体内检测)。在另一实例中,特异结合生物标记的抗体可连接体内成像试剂,例如3H、111In、125I(参见Esteban等人(1987)J.Nucl.Med.28.861-870),并用于体内成像应用中。
组合物及试剂盒本发明还提供了组合物,其用于在文中描述的任意方法中,所述方法为诸如降低样品复杂度的方法、纯化和/或富集蛋白质或多种蛋白质的方法、离析和/或分离蛋白质或多种蛋白质的方法,和/或制备用于表征的蛋白质、多种蛋白质或蛋白质级分的方法、制备用于质谱分析法分析的蛋白质、多种蛋白质或蛋白质级分的方法、鉴定蛋白质或多种蛋白质的方法、发现一种或多种新蛋白质的方法、检测和/或定量样品中蛋白质或多种蛋白质的方法、表征一种或多种蛋白质的方法、表达概况分析的方法、鉴定蛋白质降解产物的方法、鉴定翻译后修饰改变的方法和/或确定样品中蛋白质的质量、量和/或同一性的方法。本发明方法中使用的组合物可包含一种或多种(如约2、约3、约4、约5、约7、约10、约15或15种以上)小表位抗体。在一些实施方案中,组合物包含低于约100、约95、约90、约85、约80、约75、约70、约65、约60、约55、约50、约45、约40、约35、约30、约25、约20、约15、约10、约5或5种以下小表位抗体。在一些实施方案中,组合物包含至少约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体。在一些实施方案中,组合物包含约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体。在一些实施方案中,组合物包含至少约10、20、30、40、50、75、100、125、150、200、300、400或500种小表位抗体,上限分别为约20、30、40、50、75、100、125、150、200、300、400、500或1000种小表位抗体。
本发明还提供了在本方法中使用的试剂盒。本发明的试剂盒包括包含一种或多种小表位抗体的一个或多个容器。在一些实施方案中,试剂盒包含少于约100、约95、约90、约85、约80、约75、约70、约65、约60、约55、约50、约45、约40、约35、约30、约25、约20、约15、约10、约5或5种以下的小表位抗体。在一些实施方案中,试剂盒包含至少约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体。在一些实施方案中,试剂盒包含约20、约30、约40、约50、约75、约100、约125、约150、约200、约300、约400、约500、约1000或1000种以上小表位抗体。在一些实施方案中,试剂盒包含至少约10、20、30、40、50、75、100、125、150、200、300、400或500种小表位抗体,上限分别为约20、30、40、50、75、100、125、150、200、300、400、500或1000种小表位抗体。在一些实施方案中,试剂盒还包含关于根据文中描述的本发明的任意方法使用的说明书,所述方法为诸如降低样品复杂度的方法、纯化和/或富集蛋白质或多种蛋白质的方法、离析和/或分离蛋白质或多种蛋白质的方法,和/或制备用于表征的蛋白质、多种蛋白质或蛋白质级分的方法、制备用于质谱分析法分析的蛋白质、多种蛋白质或蛋白质级分的方法、鉴定蛋白质或多种蛋白质的方法、发现一种或多种新蛋白质的方法、检测和/或定量样品中蛋白质或多种蛋白质的方法、表征一种或多种蛋白质的方法、表达概况分析的方法、鉴定蛋白质降解产物的方法、鉴定翻译后修饰改变的方法和/或确定样品中蛋白质的质量、量和/或同一性的方法。
本发明还包含任意蛋白质“产物”(例如,用文中描述的任意方法富集、纯化、离析、制备、分离和/或分级分离的蛋白质)。本发明还提供了用文中描述的本发明的任意方法表征(例如,检测、鉴定、定量,等等)的蛋白质或蛋白质片段及包含此类产物的组合物。此类蛋白质包含小表位抗体识别的关连小表位(蛋白质结合所述小表位抗体)。本发明还提供了通过文中描述的任意方法制备或分离的小表位抗体-蛋白质复合体或小表位抗体-蛋白质片段复合体(对于其中在与小表位抗体接触前蛋白质与蛋白质切割剂接触的方法)。本发明还提供了根据文中描述的任意方法自小表位抗体-蛋白质复合体或小表位抗体-蛋白质片段复合体分离的蛋白质或蛋白质片段,和/或从小表位抗体分离后的蛋白质制备的蛋白质片段。
另一方面,本发明包括组合物和/或试剂盒,所述组合物和/或试剂盒包含通过本发明方法的任意方面产生的中间物(如复合体,例如小表位抗体-蛋白质复合体)。本发明还提供了孵育混合物,所述孵育混合物包含如文中描述的含有蛋白质的样品及小表位抗体和/或小表位抗体-蛋白质复合体。
本发明的试剂盒在合适的包装内。合适的包装包括但不限于小瓶、瓶、罐、柔性包装(例如,密封Mylar或塑料袋),等等。在一些实施方案中,试剂盒包含容器和容器上或与容器结合的标签或包装说明书。标记或包装说明书可说明小表位抗体可用于文中描述的任意方法,所述方法为例如用于降低样品复杂度的方法,或用于鉴定蛋白质、表征蛋白质和/或表达概况分析的方法。可提供用于实践文中描述的任意方法的说明书。
本发明的方法中有用的组分及反应混合物小表位抗体本发明的方法使用小表位抗体。如文中所用的,“小表位抗体”为结合(一般地特异结合)小肽表位的抗体。由于表位特异性,小表位抗体一般识别包含抗体结合的小表位的多种蛋白质。在通过抗体结合的小表位是已知的情况下,通过小表位抗体结合提供了涉及小表位抗体结合的蛋白质的氨基酸含量和/或序列的信息。小表位抗体例如在共同待决的美国专利申请号10/687,174中描述。小表位抗体及制备小表位抗体的方法在文中进一步讨论且在实施例中示例。
抗体可包括单克隆抗体、多克隆抗体、抗体片段(例如,Fab、Fab’、F(ab’)2、Fv、Fc等等)、嵌合抗体、单链(ScFv)、其突变体、包含抗体部分的融合蛋白及包含具有所需要的特异性的抗原识别位点的免疫球蛋白分子的任意其它修饰的构型。抗体可为鼠、大鼠、人或任意其它来源(包括人源化抗体)。可通过本领域已知的许多方法产生,包括例如,通过杂交瘤产生、重组产生或化学合成产生小表位抗体。
一般地,小表位抗体结合3、4或5个顺序(连续)氨基酸的短的、线性肽表位。备选地,在一些实施方案中,小表位抗体结合多肽中的非连续氨基酸序列。在一些实施方案中,小表位抗体结合由或基本由约2、3、4、5、6、7、8、9或10个氨基酸组成。在一些实施方案中,小表位抗体结合由或基本由2至10,3至8,或3至5个氨基酸组成的表位。在一些实施方案中,小表位抗体结合由或基本由少于约10、9、8、7、6、5、4或3个氨基酸组成的表位。在一些实施方案中,小表位抗体群结合由或基本由约3至约5个氨基酸组成的表位。在一些实施方案中,小表位抗体群结合由或基本由2至10、3至8或3至5个氨基酸组成的表位。在一些实施方案中,小表位抗体群结合由或基本由约2、3、4、5、6、7、8、9或10个氨基酸组成的表位。在一些实施方案中,小表位抗体群结合由或基本由少于约10、9、8、7、6、5、4或3个氨基酸组成的表位。小表位抗体群包含多种小表位抗体。在一个实施方案中,多种小表位抗体结合相同数目氨基酸的表位。在其它实施方案中,多种小表位抗体结合不同数目氨基酸混合物的表位。在文中描述的任意实施方案中,表位可为如以下描述的多肽中的连续或不连续序列。在一些实施方案中,在抗体混合物中可包含一种或多种小表位抗体,所述抗体混合物包含的抗体结合的表位多于所述一种或多种小表位抗体识别的表位。
在一些实施方案中,小表位抗体结合由或基本由3个连续氨基酸(称为3mer)、4个连续氨基酸(称为4mer)或5个连续氨基酸(称为5mer)组成的表位。在其它实施方案中,小表位抗体结合小的“不连续”或“简并”线性肽序列,如线性肽序列YCxC,其中x代表20种天然氨基酸任一种(简并线性序列)。在其它实施方案中,小表位抗体结合多肽中非连续(不连续)序列,所述结合是基于该多肽中氨基酸的构象接近性而形成表位(例如,由于折叠多肽中的二级结构,通过氨基酸残基的接近形成的构象表位)。在其它实施方案中,小表位抗体可结合由氨基酸序列组成的表位,所述氨基酸序列用本领域公知的用于预测抗原性的方法预测为具有抗原性。如以下表2中显示的,以前描述了结合小线性肽表位的抗体。在一些实施方案中,相同抗体可结合一种或多种蛋白质上的连续序列及一种或多种蛋白质上的不连续序列。
小表位抗体一般识别多种蛋白质,所述蛋白质包含所述抗体结合的小表位。在一些实施方案中,小表位抗体结合样品中约0.1%、0.5%、1%、2%、3%、4%、5%、10%或10%以上的蛋白质中一次或多次出现的表位。在其它实施方案中,小表位抗体结合样品中约0.1%至1%的蛋白质中一次或多次出现的表位。在其它实施方案中,小表位抗体结合在样品中约1-5%的蛋白质中一次或多次出现的表位。在其它实施方案中,小表位抗体结合样品中约0.1%至1%的蛋白质中一次或多次出现的表位,其中小抗体表位结合由3个氨基酸、4个氨基酸或5个氨基酸组成或一般由3个氨基酸、4个氨基酸或5个氨基酸组成的线性肽表位。在其它实施方案中,小表位抗体结合样品中约1-5%的蛋白质中一次或多次出现的表位,其中小抗体表位结合一般由或基本由3个氨基酸、4个氨基酸或5个氨基酸组成的线性肽表位。在其它实施方案中,小表位抗体结合样品中约5-7%或约5-10%的蛋白质中一次或多次出现的表位,其中小表位抗体结合由或基本由3个氨基酸、4个氨基酸或5个氨基酸组成的线性肽表位。在一些实施方案中,多种小表位抗体一起结合样品中至少约0.1%、0.5%、1%、2%、3%、4%、5%、10%或10%以上的蛋白质中的任意一种中一次或多次出现的一种或多种表位。在一些实施方案中,多种小表位抗体结合样品中约0.1至1%、1至5%、5至7%或5至10%的蛋白质中一次或多次出现的表位。用于经验评估样品中表位频率的方法包括用生物化学方法评估,如结合抗体后用例如2D凝胶或质谱分析法分析,及用例如氨基酸或核酸序列数据库如GenBank及SwissProt的基于序列的分析。文中还描述了合适的数据库。
在一些实施方案中,通过小表位抗体识别的表位还包含作为通过内肽酶识别为切割位点的C末端氨基酸。例如,表位可包含C末端精氨酸和/或赖氨酸,其每个都被胰蛋白酶识别为切割位点。内肽酶消化蛋白质混合物后,通过内肽酶识别的氨基酸一般存在于靶肽的C末端;因此,包含此氨基酸的肽也存在于靶多肽的C末端,其可增加免疫原性,和增加与抗体-靶肽结合相关的结合能。
在一些实施方案中,小表位抗体结合它的关连表位,结合反应的亲和力为至少约10-7M、至少约10-8M或至少约10-9M或10-9M以下。通过本领域公知的方法,包括例如通过表面等离子体共振(Malmborg和Borrebaeck(1995)J Immunol.Methods 183(1)7-13;Lofas和Johnson(1990)J Chem.Soc.Chem.Commun.1526)测定结合亲和力。在一些实施方案中,反应中结合相互作用与偶发结合相互作用相差至少2倍,至少5倍、至少10倍到至少100倍或100倍以上。
本发明的方法中可使用一种小表位抗体、或一种以上(如约二、约三、约四、约五、约十、约二十、约一百或一百种以上)的小表位抗体群。因此,在一些实施方案中,所述方法包括使用至少一种小表位抗体。在其它实施方案中,所述方法包括使用至少两种小表位抗体。在其它实施方案中,本发明方法中使用至少约5、约10、约20、约30、约40、约50、约60、约75、约100、约125、约150、约200、约300、约400、约500、约750、约1000或1000种以上小表位抗体。在一些实施方案中,样品与少于约100、约95、约90、约85、约80、约75、约70、约65、约60、约55、约50、约45、约40、约35、约30、约25、约20、约15、约10、约5或5种以下小表位抗体接触。在一些实施方案中,样品与至少约20、约30、约40、约50、约75、约100、约500、约1000或1000种以上小表位抗体接触。在一些实施方案中,样品与至少约5、10、20、30、40、50、60、75、100、125、150、200、300、400、500或750种小表位抗体接触,上限为约10、20、30、40、50、75、100、125、150、200、300、400、500、750或1000种小表位抗体。理解可使用小表位抗体与其它蛋白质结合剂(如不是小表位抗体的抗体)混合物。
理解小表位抗体结合的的表位的同一性(序列)可与文中描述的任意方法组合使用以例如鉴定蛋白质。在一些实施方案中,小表位同一性是已知的。在其它实施方案中,表位的同一性可用本领域已知的方法预测。
如文中讨论的,抗体可与样品一次一种接触或与两种或多种抗体构成的组接触。在一些实施方案中,接触为顺序的(相继的或反复的),例如一种抗体或一组抗体与样品接触并分离,第二种抗体或第二组抗体与样品接触并分离。在其它实施方案中,接触是平行的,例如,一组抗体与样品接触并分离。不同组抗体与样品顺序接触时,可理解接触可为平行的和顺序的。抗体组在组成中可以是重叠的(例如,第1组=抗体A、B、C、D;第2组=抗体B、C、D、E等等)。
显然在降低样品复杂度的方法中有用的小表位抗体数目取决于用一种或多种小表位抗体制备的蛋白质预期的用途、应用和/或随后的分析。在一些应用中,如包含通过小抗体识别的关连表位的蛋白质的检测中,一种小表位抗体(或在一些实施方案中,少数几种小表位抗体)可用于制备、纯化和/或富集蛋白质级分,所述蛋白质级分包含随后检测(或其它分析)所希望的蛋白质。然后,可进一步分析分离的蛋白质。在其它实施方案中,用一组两种或多种小表位抗体是有用的。例如,在如蛋白质发现和,在一些实施方案中,表达概况分析的应用中,希望使用多种小表位抗体,从而富集和/或纯化多种蛋白质(如起始样品中基本上所有蛋白质)。在希望纯化和/或富集新蛋白质或蛋白质形式(例如,由于关于靶蛋白质序列的信息是未知的)的应用中也可以使用多种小表位抗体。如涉及与样品中多种蛋白质分级分离有关的实施方案的示例性实例中所示的,小表位抗体识别的关连氨基酸表位的序列和/或长度的知识允许估计蛋白质样品中小表位抗体识别的表位的期望频率。如表1中显示的,对3mer、4mer及5mer线性肽序列总共分别有8,000(203)、160,000(204)及3,200,000(205)种随机组合。考虑到蛋白质的平均长度为500个氨基酸,它通过一种抗-3mer抗体检测到的概率为0.0625,使用15种抗-3mer抗体时,概率增加到约1,用100种抗-3mer抗体时,概率增加到6.25。此类计算是常规的。小表位抗体也可识别简并线性表位,例如短肽,如YCxC,其中x代表20种标准氨基酸的两种或多种。
表1.短线性氨基酸肽的分布性质
因此,理解本发明的方法中有用的小表位抗体数目取决于多种因素,包括,例如通过小表位抗体结合的蛋白质级分预期的用途、应用和/或随后的分析、样品的复杂度(根据预计或估计或以前确定的蛋白质,包括蛋白质变体如剪接变体的数目)、样品中蛋白质的平均大小、样品中出现或预计出现的关连表位的频率、小表位抗体的结合亲和力和/或特异性;靶蛋白的知识及小表位抗体的稳定性。此类因素是本领域公知的并在文中进一步讨论。
如表2中显示的,以前已经描述了结合小线性肽表位的抗体。
表2.公开的短抗体肽序列
*DAF及DSF**指DGYA、DGYG、SGYA及SGYG。
制备小表位抗体的方法是本领域已知的。另一方面,如在实施例中示例的,可通过用免疫原制备小表位抗体(例如人抗体、人源化抗体、小鼠抗体、嵌合抗体),所述免疫原表达一种或多种小肽表位,如由或基本由3、4或5个氨基酸组成的小线性肽表位。
可例如通过化学合成产生免疫原。用于合成多肽的方法是本领域公知的。在一些实施方案中,如本领域已知的,合成末端为半胱氨酸的多肽免疫原,以促进与KLH或BSA的偶联。可在多肽的氨基末端掺入(在免疫及筛选期间降低位阻效应)或羧基末端掺入末端半胱氨酸。在其它实施方案中,多肽免疫原作为多种抗原多肽或MAP合成。
如文中进一步描述的,免疫宿主动物的途径及方案一般按照用于抗体刺激及产生的成熟和常规的技术。用于产生人及小鼠抗体的一般技术是本领域已知的并在文中描述。通常,宿主动物用一定量的免疫原,包括如文中描述的免疫原腹膜内接种。
用Kohler,B.和Milstein,C.(1975)Nature 256495-497或如通过Buck,D.W.等人(1982)In Vitro,18377-381改进的一般体细胞杂交技术自淋巴细胞及永生化骨髓瘤细胞制备杂交瘤。在杂交中可使用可利用的骨髓瘤细胞系,包括但不限于X63-Ag8.653及来自Salk Institute,CellDistribution Center,San Diego,Calif.,USA的骨髓瘤细胞系。一般地,所述技术包括用融合剂如聚乙二醇,或通过本领域技术人员公知的电学方法融合骨髓瘤细胞及淋巴细胞。融合后,将细胞自融合培养基分离并在选择性生长培养基如次黄嘌呤-氨基蝶呤-胸苷(HAT)培养基上生长以除去未杂交的亲代细胞。添加或没有添加血清的文中描述的任意培养基可用于培养分泌单克隆抗体的杂交瘤。作为细胞融合技术的另一备选方案,EBV永生化的B细胞可用于产生主题发明的小表位抗体。将杂交瘤扩大及亚克隆,如果希望,通过常规免疫测定方法(例如,放射免疫测定法、酶免疫测定法或荧光免疫测定法)分析上清液的抗免疫原活性。
产生小表位抗体(如单克隆抗体)的杂交瘤或亲代杂交瘤的子代细胞可用作抗体或其衍生物或其部分的来源。
产生此类抗体的杂交瘤可用已知方法在体外或体内生长。单克隆抗体可根据需要用常规免疫球蛋白纯化方法如硫酸铵沉淀、凝胶电泳、透析、层析及超滤从培养基或体液分离。如果存在不希望的活性,那么例如通过将制备物在由连接到固相制备的免疫原制备的吸附剂上流动并从免疫原洗脱或释放所希望的抗体除去所述活性。用人或其它物种的小表位受体,或人或其它物种小表位受体的片段或用双官能剂或衍生剂缀合到在待免疫的物种中为免疫原性的蛋白质的人或其它物种的小表位受体或含有靶氨基酸序列的片段免疫宿主动物可产生抗体群(例如单克隆抗体),所述在待免疫的物种中为免疫原性的蛋白质为例如钥孔血蓝蛋白、血清白蛋白、牛甲状腺球蛋白或大豆胰蛋白酶抑制剂,所述双官能剂或衍生剂为例如马来酰亚胺苯甲酰基磺基琥珀酰亚胺酯(通过半胱氨酸残基缀合)、N-羟基琥珀酰亚胺(通过赖氨酸残基缀合)、戊二醛、琥珀酐、SOC12或R1N=C=NR,其中R及R1为不同烷基。
如果希望,可对目的小表位抗体(单克隆或多克隆的)测序,然后将多核苷酸序列克隆到载体用于表达或增殖。编码目的抗体的序列可在宿主细胞中的载体中维持并然后将宿主细胞扩大及冷冻用于以后使用。在备选方案中,多核苷酸序列可用于遗传操作以“人源化”抗体或改善抗体的亲和力或其它特征。例如,可对恒定区进行改造以更像人恒定区以避免抗体用于临床试验及人体治疗时产生免疫反应。希望遗传操作抗体序列以获得对小表位的更大亲和力和/或对小表位的更大和/或改变的特异性。对本领域技术人员显而易见的是,可以对小表位抗体进行一个或多个多核苷酸改变并仍维持它对小表位的结合能力。
已经描述了包含来自非人免疫球蛋白的抗原结合位点的许多“人源化”抗体分子,包括嵌合抗体,其具有与人恒定结构域融合的啮齿动物或经修饰的啮齿动物V区及它们的相关互补性决定区(CDR)。参见,例如Winter等人Nature 349293-299(1991),Lobuglio等人(1989)Proc.Nat.Acad.Sci.USA 864220-4224,Shaw等人(1987)J Immunol.1384534-4538及Brown等人(1987)Cancer Res.473577-3583。其它参考文献描述了在与适当人抗体恒定区融合前移植到人支持构架区(FR)的啮齿动物CDR。参见,例如,Riechmann等人(1988)Nature 332323-327,Verhoeyen等人Science(1988)2391534-1536以及Jones等人Nature(1986)321522-525。另一参考文献描述了通过重组镶嵌的啮齿动物构架区支持的啮齿动物CDR。参见,例如,欧洲专利
发明者M·S·乌尔代亚, G·M·兰德斯, G·T·文特 申请人:特提斯生物科学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1