疾病蛋白质组蛋白质阵列及其应用的制作方法

文档序号:21698529发布日期:2020-07-31 22:53阅读:548来源:国知局
疾病蛋白质组蛋白质阵列及其应用的制作方法

相关申请的交叉引用

本申请要求2017年10月16日提交的第62/572,666号美国临时申请的优先权,其通过引用全文纳入本文用于所有目的。

关于联邦资助研究的声明

无。



背景技术:

功能性蛋白质微阵列是由生物提取复杂蛋白质组信息的重要工具。提取的信息可以帮助表型表征,在系统水平上与基因组学和其他组学相关联,可以帮助疾病的早期检测,准确的诊断和预后,精准医疗,客观结果测量,解决疾病网络和途径,药物发现和开发个性化疗法。与dna微阵列类似,蛋白质微阵列允许大规模平行筛选和分析蛋白质与其他蛋白质、核酸、药物、其他生物分子的相互作用,获得高通量数据。然而,虽然dna的功能性很大程度上取决于核苷酸的线性序列,但是蛋白质的功能性通过三维多肽折叠确定,其在离体条件下可能会快速变性,从而导致功能丧失。

当前产生蛋白质阵列的方法均不能满足基于蛋白质的生物传感器的挑战和质量要求。当前的蛋白质微阵列方法是基于蛋白质的生物传感器技术,当其应用于上述应用时,存在许多局限性,如特异性低,导致高假阳性,假阴性,检测灵敏度低以及信噪比高。例如,常规基于蛋白质的生物传感器使用经有限预定蛋白质(或其他生物分子)集合涂覆的传感器装置的小阵列检测感兴趣的预鉴定生物标志物以诊断疾病。如当前有关psa测试实用性的争议所示,基于单个生物标志物(或者甚至一小组生物标志物)的过表达或表达不足诊断疾病可能在很多情况下导致做出次佳决定。因此,仍然需要改进的方法和组合物,用于检测疾病相关蛋白质、核酸和其他生物分子存在,并基于检测的结果诊断对象患有特定疾病。



技术实现要素:

一方面,本文提供了一种基因变体阵列,其包含排列在基材上与一种或多种疾病相关的多种基因产物,其中所述阵列的各离散位置包含靶基因产物和基因产物变体。各离散位置可以包含单一靶基因产物和一种或多种基因产物变体。多种基因产物可以作为表达的蛋白质固定在各离散位置。通过体外转录和翻译获自一种或多种生物样品的基因变体的核酸和靶基因核酸可以在阵列的各离散位置处原位表达多种基因产物。基材可以选自:载玻片,微孔板和纳米孔板。

在另一方面中,本文提供制备本公开基因变体阵列的方法,该方法包括:(a)提供第一基材,所述第一基材在处于阵列形式的一个或多个离散位置处包含一种或多种疾病相关生物分子;和(b)提供包含生物传感器阵列的第二基材,所述生物传感器阵列设置成捕获一种或多种疾病相关生物分子,其中第二基材邻近第一基材,并且其中一种或多种疾病相关生物分子的阵列与生物传感器阵列对齐,其中阵列设置成检测测试样品中至少一种疾病相关靶生物分子。可以设置基因变体阵列以检测阵列中的蛋白质翻译后修饰。可以设置基因变体阵列以确定翻译后修饰的动力学速率。

在另一方面中,本文提供了检测测试样品中靶生物分子存在的方法,该方法包括(a)使一种或多种疾病相关生物分子接触第一基材上处于阵列形式的一个或多个离散位置,所述第一基材具有至少两个物理分离的区域;(b)在第二基材上一个或多个离散位置处捕获一种或多种疾病相关生物分子,以在第二基材上形成处于阵列形式的单层捕获的生物分子,其中第二基材包含生物传感器阵列,所述生物传感器捕获一种或多种疾病相关生物分子;(c)在促进靶生物分子与捕获的生物分子(如果存在于测试样品中)结合的条件下,使测试样品接触捕获的生物分子的阵列;和(d)检测第二基材上一个或多个离散位置处捕获的生物分子与靶生物分子的结合,其中可检测到的结合表明测试样品中存在靶生物分子。一种或多种疾病相关生物分子可以是通过体外转录和翻译(ivtt)表达的蛋白质。第二基材上的生物传感器阵列可以与一种或多种疾病相关生物分子的阵列对齐,由此一种或多种疾病相关生物分子被直接捕获到第二基材上对应生物传感器的活性区域。生物传感器的活性区域可以是紧邻传感器装置的至少一个表面。阵列的至少一部分生物传感器可以包括电化学传感器阵列,金属或半导体表面或绝缘体表面。生物传感器可以包括量子点,纳米颗粒,珠,磁性颗粒,并且其中检测包括光学检测。生物传感器可以包括量热传感器,电位传感器,sers(表面增强拉曼光谱)传感器,安培传感器,电导传感器,离子通道传感器,离子敏感传感器,基于阻抗光谱的传感器或表面等离子体激元传感器,或其组合。一种或多种疾病相关生物分子可以是这样的蛋白质,所述蛋白质在生物传感器的约1nm至约1mm内结合第二基材。一种或多种疾病相关生物分子可以是直接结合生物传感器表面至少部分的蛋白质。使用化学标签,亲和标签或共价结合,蛋白质可以结合。

通过以下附图、详述和所附权利要求本领域普通技术人员可以更好地理解本发明的这些特征、方面和优点,以及其他的特征、方面和优点。

附图说明

当考虑以下的详细描述时,本发明将被更好地理解,并且除了上述内容之外的特征,方面和优点将变得显而易见。这样的详细描述参考了以下附图。

图1显示了癌症蛋白质组蛋白质阵列的实施方式。癌症或疾病相关蛋白质排列在基材上,用于基于光学染料的检测,或排列在生物传感器表面上,用于检测蛋白质-传感器相互作用。单个芯片可以包含蛋白质,所述蛋白质代表与一种或多种癌症相关的野生型和变体蛋白质的全部或子集。以此方式,该芯片能够多重检测检测样品和癌症蛋白质组蛋白质阵列之间的蛋白质-蛋白质,蛋白质-dna和蛋白质-生物分子相互作用。

图2显示了使用一种或多种寡核苷酸引物来分离生物样品中感兴趣基因的变体。可以设计引物以分离并进一步扩增变体,包括感兴趣基因的野生型、等位基因、交替剪接(alternatesplicing),同种型,重组,多态性和突变形式。

图3显示了使用多种引物来杂交并分离生物样品中感兴趣的基因。在该实施方式中,将使用引物分离的代表感兴趣的基因的分离核酸置于多孔板单独的孔中以形成癌症相关基因变体的文库。

图4显示了可以获得多个患者的生物学样品的癌症相关基因文库。或者,还可以通过首先将来自多个患者的生物样品组合成单一生物样品以单一步骤完成基因变体的提取。

图5是提取用于癌症蛋白质组蛋白质阵列的感兴趣的核酸的示例性方案的示意图。

图6a是说明由疾病生物样品分离核酸(例如,dna,rna)的示意图。可以将分离的核酸克隆到表达载体,用于体外蛋白质表达。

图6b是说明使用图6a中分离的核酸构建疾病蛋白质组蛋白质阵列的示意图,图6a中分离的核酸使用例如nappa或ipc(分离蛋白质捕获)或另一蛋白质阵列技术。

图6c是说明示例性方法的示意图,其中包含抗体的测试血液样品,免疫细胞与疾病蛋白质组蛋白质阵列接触以获得免疫特征(signature)。

图7是说明癌症蛋白质组蛋白质阵列的实施方式的示意图。

图8是说明包含nappa分离蛋白质捕获(ipc)的疾病蛋白质组蛋白质阵列或相反(contra)(覆盖)捕获蛋白质阵列的实施方式的示意图。

图9是说明包含表面捕获蛋白质生物传感器的阵列的实施方式的示意图。

图10是说明包含表面邻近捕获蛋白质生物传感器的阵列的实施方式的示意图。

图11是说明阵列以及将阵列用于测试样品的抗体概述(profiling)的实施方式的示意图,所述阵列包含示例性电化学传感器或场效应传感器或纳米线生物传感器。

图12是通过检测释放的h+显示fdec电荷传感器对src激酶自磷酸化的响应。添加10μl的10mm三磷酸腺苷(atp)后产生200mv阈值电压响应,然而添加10μl纯水和纯二磷酸腺苷(adp)等分试样无响应。

图13是说明使用基于电极的传感器检测乙酰胆碱酯酶相互作用的示意图。

图14是说明使用设置为检测释放的h+的fet生物传感器检测激酶磷酸化的示意图。

图15显示了可以使用本文所述生物传感器检测的酶活性。

图16显示了各种生物传感器,适用于本文所提供的阵列以用于各种生物传感应用。

图17展示了微阵列中细胞表面蛋白质,受体或其他细胞表面分子与特定蛋白质的选择性结合。

尽管本发明可以进行大量的改变,采用替代形式,在附图和以下详述中以示例的方式显示了本发明的特定实施方式。但是应当理解,附图和详述并不是将本发明的范围限制在所揭示的特定形式,本发明应包括所附权利要求书所揭示的本发明范围内的所有变化、等价形式和替代形式。

具体实施方式

本说明书中提到的所有发表物、专利和专利申请通过引用纳入本文,就好像将各篇单独的发表物、专利或专利申请专门和单独地通过引用纳入本文那样。

本公开通过某些说明性和非限制性实例提供了方法和组合物(例如,蛋白质组蛋白质阵列),用于检测疾病相关蛋白质存在,并基于检测的结果诊断对象患有特定疾病。本公开至少部分基于发明人对蛋白质传感器芯片的开发,所述蛋白质传感器芯片能够检测生物样品中疾病相关蛋白质(包括疾病相关变体蛋白质)的存在。在癌症和某些其他疾病中,患者的免疫系统通过产生针对“外来”癌症蛋白质的抗体来对疾病做出应答,从而成为疾病的前哨。通过对癌症患者血清中自身抗体进行概述并与健康对照进行比较,已知癌症蛋白质的蛋白质阵列可以用于发现具有免疫原性的这些蛋白质的子集。然后,通过简单的血液检查,可以将发现的癌症特异性抗原或这些抗原的抗体或它们的组合用作疾病的诊断和预后生物标志物。或者,排列在芯片上的疾病蛋白质组(表示肿瘤或经感染组织的蛋白质补体)包含排列在单个芯片上的一些或所有疾病相关蛋白质及其各自的突变,其可以用于基于免疫概述的疾病诊断和预后。此外,可以对表达的蛋白质进行翻译后修饰(ptm),然后用患者血清进行分析,用于鉴定针对ptm修饰的蛋白质的抗体或免疫应答生物标志物,或用于获得蛋白质变体在功能上的丧失或获得。不希望受理论的束缚,据信疾病蛋白质组蛋白质阵列为患有或疑患疾病的对象提供了改进的检测方法以及改进的诊断和预后能力,所述疾病蛋白质组蛋白质阵列包含表达自与疾病如癌症(例如,衍生自一种或多种肿瘤,癌,肉瘤,白血病或淋巴瘤或与之相关)相关的基因(野生型,等位基因,同种型,突变,ptm修饰(天然和异常)和其他变体形式)的蛋白质的补体。

当前许多诊断测试采用蛋白质生物标志物的检测,所述蛋白质生物标志物的数量通常很少。然而,相对于疾病相关生物标志物本身,可以放大对于疾病或感染存在的抗体、自身抗体或免疫细胞应答(例如,大几个数量级)。例如,生物样品可以包含生物标志物以及疾病特异性抗体,但是这些抗体被过高的数量级代表,并且可以更容易地检测且具有更高的灵敏度检测用于诊断目的。以此方式,本文所提供的蛋白质传感器装置能够使人们使用生物样品诸如血液或肿瘤活检样品快速获得抗体概况或免疫细胞特征用于诊断和其他临床目的。此外,通过使用这类蛋白质传感器平台,有可能检测肿瘤是良性或恶性的,肿瘤类型和亚型(例如,在乳腺癌的情况中,区分er+、pr+和her2+样品),肿瘤的耐药性,发展阶段以及进一步详细的癌症分子亚型分析。不希望受理论的束缚,据信身体对特定疾病的免疫应答对于疾病的类型和亚型具有特异性。例如,预期良性肿瘤将会引发与恶性肿瘤不同的抗体应答。

因此,本公开提供了疾病蛋白质组蛋白质阵列(或“疾病蛋白质组芯片”)以及将这类阵列用于诊断和其他具体实际应用的方法。在本公开的一方面中,本文提供了检测测试样品中靶生物分子存在的方法,其中该方法包括或基本上有下述内容组成:(a)使一种或多种疾病相关生物分子接触第一基材上处于阵列形式的一个或多个离散位置,所述第一基材具有至少两个物理分离的区域;(b)在第二基材上一个或多个离散位置处捕获一种或多种疾病相关生物分子,以在第二基材上形成处于阵列形式的单层捕获的生物分子,其中第二基材包含生物传感器阵列,所述生物传感器捕获一种或多种疾病相关生物分子;(c)在促进靶生物分子与捕获的生物分子(如果存在于测试样品中)结合的条件下,使测试样品接触捕获的生物分子的阵列;(d)检测第二基材上一个或多个离散位置处捕获的生物分子与靶生物分子的结合,其中可检测到的结合表明测试样品中存在靶生物分子。

术语“蛋白质组蛋白质阵列”和“蛋白质组芯片”在本文可互换使用并指用蛋白质或核酸涂覆的传感器阵列,所述蛋白质或核酸代表天然存在的人蛋白质的全部或子集,包括具有翻译后修饰的蛋白质。本文所提供的蛋白质组蛋白质阵列可以作为常规蛋白质微阵列的改进替代。如本文所用,术语“疾病蛋白质组”或“疾病组”指用与一种或多种疾病相关的独特蛋白质或抗原涂覆的传感器阵列。在某些情况中,独特蛋白质或抗原表达自这样的基因,所述基因提取自单个疾病样品(例如,肿瘤,细胞系,感染的细胞或组织)或多种肿瘤/癌症或疾病或其他异常或感染的细胞。同样,术语“癌蛋白质组”或“癌症蛋白质组(cancer-ome)”指用独特蛋白质或抗原涂覆的传感器阵列,所述独特蛋白质或抗原与一种或多种癌症相关,包括癌症类型或亚型(例如,包括源自er+、pr+和/或her2+乳腺癌样品的蛋白质)。

相较于依赖于印刷的材料和有限的传感器阵列的常规蛋白质阵列,本公开的方法产生了包含大量传感器的改进阵列,用于同时检测许多结合或相互作用的物质,从而使得误差诸如诊断过度或诊断不足最小化(p值<0.01)。有利地,该阵列还包含直接连接表面或邻近传感元件的独特,纯蛋白质,抗体或其他感兴趣的生物分子的单个层(或者在单层是不可能的情况下时为多层)。

在一些情况中,疾病蛋白质组芯片包含存在于固体基材上离散位置(特征)的多种蛋白质,从而在基材上形成蛋白质阵列。出于本公开的目的,术语“蛋白质”指肽和多肽,包括抗原,蛋白质片段,和修饰的多肽(例如,具有一种或多种翻译后修饰的蛋白质)。虽然优选使用原位蛋白表达方法来生产本公开的疾病蛋白质组阵列,但是也可以使用其他基于细胞的技术或印刷纯化的蛋白质来生产它们。本文描述了蛋白质生物传感器的特定应用,所述生物传感器中蛋白质以任何这些方式产生。

在一些情况中,蛋白质被固定在传感器装置表面(基材)上。在其他情况中,蛋白质被固定在紧邻一个或多个传感器装置的表面上。在任一种设置中,固定的蛋白质阵列形成单个传感器芯片,该传感器芯片能够根据阵列中包含的不同的疾病相关蛋白质组来检测和诊断独特疾病或不同疾病的集合。

生物传感器是将信号转导(传感)元件与薄膜或化学或生物组分(生物分子)组合在一起的设备,经由特异性结合、相互作用或生物化学反应来检测,定量测试介质中感兴趣的特定化学或生物分子物质的存在与否。生物传感器阵列是在各(或多个)传感器单元上包含独特化学或生物分子的传感器阵列,以组合地检测测试介质中感兴趣的单一或多种生物分子的存在与否。信号转导元件可以包含光学活性标签,如染料,量子点,磁性颗粒,纳米颗粒或放射性标签。生物传感器还可以包括传感器装置,所述传感器装置监视转导(传感)元件电性质(如电阻,电容,电感或质量),电化学,磁性,等离子体或磁性或光或热(或这些的组合)性能中产生的变化,以检测感兴趣的靶化学或生物分子。参照图16,实例包括但不限于,场效应晶体管(fet)纳米线传感器,离子敏感fet(isfets),spr传感器,等离子体传感器,拉曼,电化学,声学传感器,石英晶体微量天平等。

本文所用术语“蛋白质生物传感器”指感测或检测与任何其他化学或代谢组学或分子或生物分子或离子物质的蛋白质相互作用或结合的生物传感器,其还可以用于检测蛋白质相互作用的动力学。本文提供了使用单层原位表达的蛋白质涂覆传感器表面(或传感器附近/邻近的表面)以产生高密度感测蛋白质阵列用于高通量试验的创新方法,其中阵列中的各传感器涂覆有独特的蛋白质单层,该创新方法能够以高灵敏度和高选择性原位时间分辨多重检测相互作用的生物分子。本公开的疾病蛋白质组蛋白质阵列平台提供了使用无标记的感测阵列的高通量筛选,以解决采集(mining)人蛋白质组,发现各种蛋白质相互作用和功能中的复杂挑战,并且通常可以应用于分子系统生物学。由目前的光学读出方法到诸如无标签电子信号读出的方法的转变应当带来与由微孔板到一侧高密度微阵列的转变相似或更大的进步。

优选地,蛋白质捕获生物传感器具有以下两种设置之一:其中将蛋白质直接涂覆在传感器装置的表面(如图9所示的直接捕获蛋白生物传感器),或者将蛋白质涂覆在紧密靠近传感器装置的基材上,从而使它们可以感测蛋白质反应的产物——称之为邻近捕获蛋白质生物传感器。参照图10,邻近感测蛋白质反应产物的第二设置适合特定感测应用,其中可以通过检测溶液中的二级物质或反应/相互作用的产物间接监测蛋白质的相互作用/反应。

在一些实施方案中,“邻近捕获蛋白质生物传感器”包括涂覆有蛋白质的珠或纳米颗粒,可以将其用于阵列中的传感器上,从而使各传感器孔中的珠具有捕获在其上的不同蛋白。在另一设置中,邻近捕获蛋白质生物传感器包括在第二基材上产生的蛋白质阵列,其阵列周期对应传感器阵列周期,并且将两个基材彼此靠近。以此方式,将蛋白质微阵列上的各蛋白质紧邻传感器装置放置(例如,以约1nm至约1mm的距离)。

本文所用术语“基材”指固定肽的任何类型的固体支持物。基材的实例包括但不限于:微阵列;珠;柱;光纤;湿巾;硝酸纤维素;尼龙;玻璃;石英;重氮化膜(纸或尼龙);硅酮;聚甲醛;纤维素;乙酸纤维素;纸;陶瓷;金属;准金属;半导体材料;涂覆的珠;磁性颗粒;塑料,如聚乙烯、聚丙烯和聚苯乙烯;凝胶形成材料;硅酸盐;琼脂糖;聚丙烯酰胺;甲基丙烯酸甲酯聚合物;溶胶凝胶;多孔聚合物水凝胶;纳米结构表面;纳米管(如碳纳米管);和纳米颗粒(如金纳米颗粒或量子点)。当与基材结合时,蛋白质可以直接连接支持物,或者经由接头连接表面。因此,可以使用本领域已知的方法衍生固体基材和/或蛋白质,以促进蛋白质与基材的结合,只要该衍生不消除对于可能存在于测试样品中的生物分子和蛋白质之间结合的检测。

参照图8和图11,通过用捕获抗体涂覆其表面,分离蛋白质捕获程序可以用于将处于阵列形式的单层蛋白质捕获到许多不同类型的基材上,如硅,二氧化硅,二氧化铝,氧化铪(栅极电介质)和金属如金,钯。例如,通过使用阵列中包含传感器元件的场效应晶体管(fet)纳米传感器芯片,所述传感器具有与硅纳米孔基材的周期对应的相同周期,在装置活性表面上形成单层捕获抗体(抗-gst),使fet传感器芯片上的图案与纳米孔阵列对齐,并按压密封组件用于分离的蛋白质表达以及装置上蛋白质的抗体捕获,有可能用单层独特蛋白质涂覆阵列中的各传感器,这是能够实现感测蛋白质阵列的突破性进展。因此,在活性纳米传感器表面上使用自组装的蛋白质单层(或多层)产生的fet感测蛋白质阵列可用于高灵敏度,高选择性,时间分辨电子检测与其他蛋白质和生物分子的相互作用。使用不同蛋白质涂覆传感器阵列的另一示例性方法是使用基于细胞的蛋白质合成方法,或通过将先前纯化的蛋白质印刷在独特装置上。

在一些实施方式中,蛋白质通过转录和翻译核酸分子来提供,所述核酸分子在传感器基材上或在紧邻传感器基材的基材上的离散位置处提供。以此方式,阵列的蛋白质要么在传感器基材上产生(图9),要么在紧邻传感器基材处产生(图10)。在这类情况中,将疾病相关核酸沉积在阵列上的离散位置,并且使用例如无细胞的体外转录和翻译试剂原位表达疾病蛋白质组蛋白质阵列。对于这类原位生成的蛋白质阵列,将核酸如cdna、基因或质粒印刷在基材(例如,玻璃基材,硅纳米孔)上并与体外转录和翻译(ivtt)混合物孵育以表达新鲜的蛋白质,就在使用时。虽然有可能使用之前已经表达和纯化的单层纯蛋白质涂覆有限的传感器阵列,但是对于具有成千上万种蛋白质的大型传感器阵列,在不损失蛋白质功能性的情况下是不可能做到这一点的。例如,基于蛋白质的生物传感器中的现有技术中使用经有限预定蛋白质(或其他生物分子)集合涂覆的传感器装置的小阵列检测感兴趣的预鉴定生物标志物。因此,原位产生的蛋白质阵列对于大型传感器阵列(例如,约100个传感器至100,000个传感器单元)特别有利,其中各传感器涂覆有单层独特,纯蛋白质,抗体或其他感兴趣的生物分子。本文所用术语“抗体”指免疫球蛋白分子和免疫球蛋白分子的免疫活性部分(片段),即包含抗体结合位点或互补位的分子。该术语包括单克隆抗体和多克隆抗体。

在一些实施方式中,蛋白质沉积于基材上的一个或多个离散位置,从而在基材上形成蛋白质阵列。例如,可以将先前表达的纯化蛋白质印刷于阵列基材上的离散位置。

如图3和4所示,在一些情况中,使用获自生物样品(例如,癌症样品,肿瘤活检样品)的核酸制备芯片。核酸可以是rna,dna,例如,基因组dna、线粒体dna、病毒dna、合成dna,或由rna逆转录的cdna。核酸样品中的核酸通常用作延伸杂交引物的模板。在优选实施方式中,核酸分子分离自生物样品。通过在促进寡核苷酸引物与互补核酸杂交的条件下使与感兴趣的核酸序列(例如,感兴趣的基因)具有互补性的一种或多种寡核苷酸引物与互补核酸接触,可以选择和分离对应感兴趣基因的rna或dna的核酸。使一种或多种寡核苷酸引物与来自生物样品的核酸分子接触可以在进行扩增反应以扩增感兴趣的核酸序列的拷贝数之前或之后。在感兴趣的rna的情况中,使一种或多种寡核苷酸引物与来自生物样品的核酸分子接触可以在进行反应以将rna转化成cdna之前或之后。在一些情况中,分离自总核酸样品的核酸分子可以用于产生芯片,无需进行进一步处理。在其他情况中,可以在将分离的核酸分子放置于芯片上之前以某种方式对其进行扩增或修饰。

当使用长度约为10-100个核苷酸或更长(例如,约10、20、30、40、50、60、70、80、90、100nt)或者在某些情况中长度为数百或数千个核苷酸的引物从生物样品(例如,肿瘤样品)分离感兴趣的基因时,样品中存在的特定基因的突变形式将与野生型拷贝一起被分离。参照图2,以此方式,使用一种或多种引物由混合的核酸样品分离核酸序列将同时分离样品中存在的野生型拷贝以及感兴趣基因的任何突变形式。术语“分离的”或“纯化的”指基本上或本质上不含物质在其天然状态时通常与之相伴的组分。

本文所用术语“变体”指核酸序列或氨基酸序列(例如,基因或基因产物)的正常序列中的改变。在一些情况中,基因型和对应的表型与变体相关。在其他情况中,对于变体没有已知功能。变体还可以表示相对于参照序列的序列差异。变体可以是单核苷酸多态性(snp)。变体可以是多个核苷酸的插入。变体可以是多个核苷酸的缺失。变体可以是突变。变体可以是拷贝数变异。变体可以是结构变体。

根据本文所述的方法,可以使用任何合适的寡核苷酸扩增方法。聚合酶链反应(pcr)是使用引物和聚合试剂扩增核酸样品中存在的一种或多种靶核酸序列然后检测扩增序列的过程。当一种引物的延伸产物与另一延伸产物杂交时成为用于产生所需特定核酸序列的模板,反之亦然,并且该过程会不断重复以产生所需量的序列。本领域技术人员通常使用聚合酶链反应检测所需序列的存在(美国专利号4,683,195)。本领域技术人员通常用于检测所需序列的pcr的具体实例是逆转录pcr(rt-pcr;saiki等,science,1985,230:1350;scharf等,science,1986,233:1076)。rt-pcr涉及由生物流体分离全部rna,在引物存在的情况下使rna变性,所述引物识别所需核酸序列,使用引物通过逆转录生成rna的cdna拷贝,使用特异性引物通过pcr扩增cdna,并通过电泳或本领域技术人员已知的其他方法检测扩增的cdna。

使用引物提取感兴趣的核酸序列为本领域技术人员众所周知,并且方法是可及的。在一些情况中,寡核苷酸引物在溶液中。在其他情况中,寡核苷酸引物与珠、颗粒、磁性颗粒、孔板表面或载玻片结合。

可以使用任何合适的方法由生物样品如组织或肿瘤活检分离核酸。例如,可以使用溶解样品中的细胞并沉淀核酸的溶液处理样品。

本文使用的术语“样品”表示非生物样品和生物样品。非生物样品包括体外制备的那些,其在溶液中包含各种浓度的感兴趣的靶分子。生物样品包括但不限于,血液,淋巴,血清,尿液,唾液,痰,呼气提取物(表示溶液中捕获的呼出空气),骨髓,抽出物(鼻,肺,支气管,气管),眼液,羊水,粪便,其他体液和分泌物,细胞和组织样品以及它们的稀释液。可以使用任何合适的生物学样品(“生物样品”)。例如,生物样品可以获自对象(例如,哺乳动物,如人,犬,小鼠,大鼠,猪,豚鼠,牛,猴或猿)的样品,或者可以源自于这样的对象。对象可以提供来自例如活检或组织的多种生物样品,包括固体生物样品。在一些情况中,样品可以是置于组织培养物中或适应于组织培养的组织切片或细胞。生物样品还可以是生物流体,如尿液,血液,血浆,血清,唾液,眼泪或粘液,或吸收到纸或聚合物基材上的这类样品。如果需要,可以将生物样品进一步分离成含有特定细胞类型的部分。在一些实施方式中,样品可以是来自对象的样品的组合(例如,组织和流体样品的组合)。在一些情况中,使用本领域已知的技术由个体获得血清。样品可以是具有一种或多种靶蛋白或一种或多种其他感兴趣的生物分子的任何细胞样品。例如,细胞学样品可获自选自下述的组织:乳房,卵巢,食道,胃,结肠,直肠,肛门,胆管,脑,子宫内膜,肺,肝,皮肤,前列腺,肾脏,鼻咽,胰腺,头颈,肾,淋巴瘤,白血病,子宫颈和膀胱。样品可以是实体或非实体肿瘤样品。肿瘤样品可以是癌。样品可能是新癌症,复发癌症,原发性癌症或转移性(继发性)癌症。

样品可以通过本领域已知的方法获得,如手术,活检或由血液(例如,循环肿瘤细胞),腹水或胸腔积液中获得。可以使用本领域已知的方法来处理样品。例如,样品可以是新鲜的,冷冻的或福尔马林固定的和石蜡包埋的(ffpe)。

“对象”或“个体”或“动物”或“患者”或“哺乳动物”指需要诊断、预防或治疗的任何对象,特别是哺乳动物对象。哺乳动物对象包括人、家养动物、家畜和动物园动物、竞技动物或宠物,如犬、猫、豚鼠、兔、大鼠、小鼠、马、家牛、奶牛等。因此,除了用于人诊断、预后或预测性应用(例如,诊断人患者的疾病)之外,本发明的方法和装置还能够用于哺乳动物包括同伴动物的兽医治疗。

本文所用术语“癌症”和“恶性肿瘤”在本文可互换使用,指代或描述哺乳动物中通常以细胞生长不受控制为特征的生理状况。癌症可能是多药耐药性的(mdr)或药物敏感性的。癌症的实例包括但不限于:癌,淋巴瘤,母细胞瘤,肉瘤和白血病。这类癌症更具体的实例包括:乳腺癌,前列腺癌,结肠癌,鳞状细胞癌,小细胞肺癌,非小细胞肺癌,胃肠癌,胰腺癌,宫颈癌,卵巢癌,腹膜癌,肝癌,例如,肝脏癌,膀胱癌,结直肠癌,子宫内膜癌,肾癌和甲状腺癌。癌症的其他非限制性实例是基底细胞癌,胆道癌;骨癌;脑和cns癌症;绒毛膜癌;结缔组织癌;食道癌;眼癌;头颈癌;胃癌;上皮内肿瘤;喉癌;淋巴瘤,包括霍奇金淋巴瘤和非霍奇金淋巴瘤;黑色素瘤;骨髓瘤;成神经细胞瘤;口腔癌(例如,嘴、舌、口和咽);视网膜母细胞瘤;横纹肌肉瘤;直肠癌;呼吸系统癌症;肉瘤;皮肤癌;胃癌;睾丸癌;子宫癌;泌尿系统癌症,以及其他癌症和肉瘤。

本文所用术语“肿瘤”是指所有的成瘤性细胞生长和增殖,无论是恶性的还是良性的,以及所有的癌前和癌细胞和组织。例如,特定的癌症可以通过实体瘤或非实体瘤表征。实体瘤块(如果存在)可能是原发性肿瘤块。原发性肿瘤块指由于组织的正常细胞转化而导致的组织中癌细胞生长。在大多数情况中,通过囊肿的存在鉴定原发性肿瘤块,囊肿可以通过视检或触诊方法发现,或者通过组织的形状,质地或重量中不规则来发现。然而,一些原发性肿瘤是不易察觉的并且只能通过医学成像技术如x射线(例如,乳房x线照相)或磁共振成像(mri)或通过针吸术进行检测。

由提取自和/或扩增自患者生物样品的关键基因的变体制造疾病基因的阵列

这部分提供了示例性工作流程,用于由提取自患者生物学样品(“生物样品”)的核酸产生疾病蛋白质组阵列。虽然该实例讨论了为人患者生物样品准备的阵列,但是该方法同样适用于获自其他动物甚至植物生物样品的样品。

1.获得患者生物样品:在一些情况中,生物样品获自已知患有特定疾病如癌症的患者。合适的样品是组织(例如,活检样品),血液和其他生物样品。

2.用于阵列的生物样品可以对应疾病的特定类型、亚型或阶段:生物样品可以来自一名患者或者可以是来自多个患者的合并的生物样品。在一实例中,组织获自患有1期乳腺癌的患者。其他样品:来自三阴性乳腺癌的组织;收集自多个不同患者的组织的组合,其各自患有1期乳腺癌;收集自多个不同患者的组织的组合,其各自患有不同阶段的原发性肺癌;收集自多个不同患者的组织的组合,其各自患有转移性肺癌;收集自一个或多个白血病患者的血液;收集自患有其他疾病如糖尿病,自身免疫性疾病,神经退行性疾病等的患者的唾液,血液,尿液或其他生物样品。

3.对于各种癌症,可能有几个至数十个,数百个或数千个起作用的关键基因。关键基因可以过度表达或表达不足,可以携带突变,或者可以是等位基因,多态性,同种型或者任意剪接的变体,并且在一些情况中,表达自关键基因的蛋白质经翻译后修饰(正常或异常疾病相关的或随机ptm)–所有这些都可以称之为特定基因的变体蛋白。

4.对于各生物样品,使用设计成与特定关键疾病基因(例如,癌症关键基因)特异性杂交的一种或多种引物提取和(在一些情况中)扩增生物样品中存在的关键基因的野生型和变体。在一些情况中,在逆转录酶试验和/或后续pcr扩增中,引物是与组织样品中的rna互补的基因特异性引物,由此反应提取关键基因,包括与基因特异性引物对应的变体。在其他情况中,引物是与基因组dna(例如,提取自细胞核、染色质、染色体的dna)互补的基因特异性引物,其中引物提取关键基因以及基因特异性引物对应的变体。在一些情况中,可以设计引物以提取核外dna或无细胞dna(例如,存在于循环血液中)。藉由对感兴趣的关键基因具有特异性的一种或几种引物开始,针对与疾病或癌症相关的几个至数十个,数百个或数千个感兴趣的关键基因,可以重复试验。

5.将各种基因变体收集到微孔板单独的孔,单独的管,单独的纳米孔,或一些合适的斑点或位置或容器中。

6.藉由提取的dna变体,有可能创建针对各种感兴趣疾病的阵列(例如,针对肺癌,乳腺癌,前列腺癌,神经退行性疾病等的阵列)。

生产阵列产品

在该部分中,我们描述了可以使用实施例1中收集的基因变体制备的各种阵列产品。出于本公开的目的,术语“阵列”涵盖微阵列,纳米阵列以及在载玻片或微孔板或纳米孔底物上制备的阵列。阵列中的生物分子变体可以使用捕获分子捕获或以其他方式固定于表面,或者生物分子变体可以在微孔或纳米孔板的离散位置(例如,孔)中的溶液中。

在一些情况中,阵列是基因变体阵列。这些阵列包括以阵列形式分配或点样的rna或dna变体。如上所述,各斑点可以具有提取自患者样品的一种关键基因及其变体。阵列形式可以是微孔板,微阵列载玻片或包含纳米孔阵列的载玻片。基因变体阵列能够(a)作为转录组(rna)或基因组(dna)变体的储库用于进一步分析;(b)或研究dna变体与其他生物分子和细胞的相互作用;(c)用于基因表达分析(d)用于分析突变负荷(mutationalload);(e)用于生物标志物基于pcr的扩增和检测;和(f)用于功能获得或功能丧失分析(g)用于与补充蛋白质组学分析结合以进行更准确的疾病诊断,预后和精准医疗。

在另一实施方式中,将关键基因(以及各自的变体)克隆到表达载体(例如,质粒)中。载体或基因用于在体外转录和翻译(ivtt)系统,细胞表达系统或使用噬菌体展示中表达蛋白质。表达蛋白质微阵列的各孔或各斑点包含关键蛋白质的许多变体,它们表达自克隆到质粒中的对应关键基因变体。

在另一实施方式中,将关键基因与共同表位标签融合,并将组合基因-表位标签融合构建体克隆到表达载体(例如,质粒)中。将质粒印刷到离散位置(斑点,纳米孔等),并使用ivtt原位表达,或在无细胞或细胞系统中表达。使用固定在同一表面或二级表面上的通用抗-表位结合配体或抗体,将通用标签用于捕获表达的蛋白质。对于表达的蛋白质微阵列,其中各斑点包含表达自对应关键基因变体的关键蛋白质的许多变体,表达的蛋白质被捕获或以其他方式固定在固体表面上。

在一些情况中,抗-表位结合配体或抗体或结合剂固定于同一表面上(例如,nappa蛋白质阵列或ipc分离蛋白质捕获)。在其他情况中,抗-表位结合配体或抗体或结合剂固定于第二表面上。第二表面可以是玻璃或另一类型的表面,并且使用荧光、发光或放射线法或其他基于标签的方法来实现检测。第二表面可以是生物传感器阵列表面,其中生物传感器可以是fet,spr,gmr,拉曼或纳米管或纳米线传感器,等离子体石墨烯或任何其他传感器(图16)。使用的其他检测方法可能是基于质谱的方法,基质辅助激光解吸电离(maldi)或表面增强激光解吸电离(seldi)tof,激光或液相色谱法,基于hplc的方法,串联ms或tims(热电离质谱),ams(加速器质谱),icp-ms(电感耦合等离子体质谱)。在一些情况中,第二表面可以是纳米颗粒或磁性颗粒或其他珠或微颗粒。

对于一些阵列,使用本领域技术人员众所周知的方法将基因变体片段化成较小的dna链。所有变体的基因片段表达为各斑点处各关键基因的相应肽变体。又例如,使用酶促、化学、机械或对于本领域从业者已知的其他方法,表达各关键蛋白质/基因的蛋白质变体并片段化成肽。

在一些情况中,蛋白质变体阵列可以原位表达,如上所述。或者,蛋白质变体阵列的蛋白质在形成阵列之前表达,然后以阵列形式沉积或印刷。以此方式,提供蛋白质作为后续试验的产物。在这类情况中,蛋白变异体阵列不需要经由ivtt的原位表达蛋白质,并且可以用作现成产品。例如,可以由相应关键基因变体大量产生关键蛋白质变体。可以在生产商的工厂中产生许多不同的关键蛋白质,并且通过将蛋白以阵列形式点样或印刷到适当的基材上(例如,载玻片上,在微孔板上,在纳米孔载玻片上)来产生关键蛋白质变体阵列。例如,huprot阵列是以此方式制备的印刷蛋白质阵列。

翻译后修饰(ptm)的蛋白质变体阵列:使用一些或全部酶、辅因子、化学物质、生物化学物质、溶液或这些的组合对上述方法(由提取自癌症/疾病患者生物样品中的基因变体)产生的蛋白质变体阵列进行翻译后修饰(ptm),以产生天然(野生型)或疾病相关或异常或随机ptm。例如,特异性激酶或几种激酶以及辅因子和其他试验组分可以用于使蛋白质变体试验中的蛋白质磷酸化。各自蛋白质的变体对ptm修饰的倾向性可能不同,这反过来可能导致与其他蛋白质、dna、药物分子相互作用的差异,而这可能导致功能丧失或功能获得。

使用蛋白质阵列进行试验

该部分描述了可以使用实施例2中所述阵列产品进行的试验。在一些情况中,进行试验以检测变异蛋白质阵列与其他生物分子(例如,其他蛋白质,抗体,dna,rna,小分子,化学物质等)的相互作用。这类试验能够用于研究目的,诊断或预后目的,药物发现目的,治疗开发目的,疾病网络发现,靶标鉴定或免疫疗法开发。试验的检测方式可以是:(i)荧光或发光或放射性或其他标记的/标签标记的检测试验;(ii)基于fet或spr或石墨烯或等离子体或磁性或电化学传感器或基于其他生物传感器的检测试验或无标记检测试验(图16);(iii)基于质谱或液相色谱的方法(如tofmaldi/seldi),或这些的组合。表达蛋白质阵列在各斑点或各孔包含关键蛋白质的许多变体,它们表达自对应的关键基因变体。阵列可以在试验时原位表达用于后续应用。下文描述了其他示例性试验:

用于生物标志物发现的试验:使用来自(i)癌症/疾病患者(ii)健康对照的血清或组织裂解物或细胞裂解物或血液或其他生物样品筛选上述方法/装置中产生的蛋白质变体微阵列,以检测与这些二级生物样品中的蛋白质,dna、rna、生物化学物质等的相互作用——识别特定癌症/疾病生物标志物。这里使用的生物标志物可以用于早期检测,诊断,预后,疾病监测,精准医疗,个性化医疗,疾病途径特异性生物标志物,发病机理,途径/网络鉴定生物标志物,临床终点生物标志物,结果生物标志物。

抗体概述特征的试验:对于这些试验,使用针对特定疾病产生的蛋白质变体微阵列筛选测试样品。测试样品优选是来自测试个体的血清,血液,组织裂解物或细胞裂解物。测试样品中存在与蛋白质变体阵列的一种或多种蛋白质结合的抗体表明测试个体可能患有上述特定疾病。在一些情况中,使用提取自患有特定癌症的一位或多位患者的癌症特异性关键基因及其变体产生蛋白质变体阵列。例如,肺癌蛋白质变体阵列可以用于检测和诊断测试个体中的肺癌。肺癌蛋白质变体阵列可以包括对前期1期肺癌、1期肺癌、2期肺癌、3期肺癌、4期肺癌等具有特异性的蛋白质变体阵列的子阵列。如果测试个体的结果显示有较大数量针对2期的抗体,那么测试个体可能患有2期肺癌。可以开发蛋白质变体阵列,其包括对应各种特定癌症的子阵列,如前列腺癌,肺癌,脑瘤,胰腺癌,乳腺癌,卵巢癌,白血病,黑色素瘤等,并且可能进一步包括针对各种癌症的各个特定阶段和特定亚型的亚子阵列(sub-sub-array)。

免疫细胞试验或细胞试验。可以使用疾病/癌症蛋白质变体阵列筛选分离自血液的免疫细胞或提取自组织样品或其他生物样品的细胞,用于鉴定与疾病相关的蛋白质变体。免疫细胞可以是t细胞,b细胞,天然杀伤细胞,调节细胞,记忆细胞,巨噬细胞,粒细胞,肥大细胞,单核细胞,树突细胞,嗜中性粒细胞或其他免疫相关细胞。免疫细胞表面的nk细胞受体,细胞表面受体,mhc(主要组织相容性复合体),g蛋白偶联受体,酶联受体,离子通道偶联受体,激素受体,整联蛋白,生长因子受体,神经受体,细胞表面蛋白,脂质,聚糖,凝集素,粘附素或其他生物分子,或受体,如pamp受体,tlr,nlr,模式识别受体(prr),杀伤激活和杀伤抑制剂受体(kar和kir),补体受体,fc受体,b细胞受体和t细胞受体可能与蛋白质变体阵列上排列的表位相互作用。筛选和检测这类相互作用能够用于与蛋白质变体阵列相关的疾病的疾病诊断或预后。或者,可以使用干细胞,红血细胞(红细胞),白血细胞(白细胞),血小板,神经细胞(神经元),神经胶质细胞,肌肉细胞(肌细胞),软骨组织细胞(软骨细胞),骨细胞,皮肤细胞,内皮细胞,上皮细胞,脂肪细胞(脂细胞),性细胞(配子)或其他组织的细胞实现筛选,以检测蛋白质变体阵列的蛋白质和测试样品中存在的细胞表面受体、细胞表面蛋白质或其他细胞表面生物分子之间或与裂解后它们各自的细胞提取物之间的相互作用。

功能获得和功能丧失试验:优选地,疾病/癌症变体蛋白质阵列在各斑点或孔处包含针对各种关键蛋白的许多变体。在许多癌症/疾病中,相对于野生型蛋白质,蛋白质变异导致功能获得或功能丧失。可以使用功能获得或功能丧失试验测试变体蛋白质阵列(使用基于光学光源或基于生物传感器的检测方法)以鉴定关键蛋白质,所述关键蛋白质在导致发病机制、疾病网络/途径、转移、后期发展等的失调或功能异常中起作用。

分析疾病基因型-表型相关性:该试验可以包括对关键基因及其变体进行测序,并将结果与变体蛋白质阵列试验结果相关联,以实现深度基因型表型相关性。这类相关性对于阐明疾病信号传导途径和疾病发病机理,鉴定用于早期疾病检测的生物标志物、疾病诊断和预后,精准医疗以及相关临床和研究应用而言都十分重要。

数据分析

可以通过多种分析技术来分析在进行实施例3中所述试验收集的数据(例如,生物标志物检测,用于疾病预后或诊断,用于监测给予治疗剂之前或之后的生物标志物变化)。示例性的数据分析方法包括但不限于,检测测试个体中的特异性生物标志物,由测试个体中可能的生物标志物的较大集合中检测至少一些生物标志物。例如:癌症/疾病可能具有50种生物标志物。一个测试个体可能具有这50种可能的生物标志物中的至少5种以指示疾病的存在。另一测试对象可能携带来自可能的50种生物标志物中至少5种生物标志物的不同集合,对于疾病诊断这也可能是充分的标准。在一些情况中,动态组合生物标志物分析,排列和组合分析用于由使用高级数据挖掘,神经网络,机器学习以及基于人工智能的算法方法,有可能使用云计算生成的数据,可能使用动态roc曲线进行特征分析,用于大规模,高通量患者筛选和验证数据。数据分析方法可以是但不限于“用于计算生物学的深度学习(deeplearningforcomputationalbiology)”christofangermueller等,molecularsystemsbiology(2016)12,878和“基因组,蛋白质组学和代谢组学数据整合策略(genomic,proteomic,andmetabolomicdataintegrationstrategies),kwanjeerawanichthanarak等,biomarkerinsights2015:10(s4)中所讨论的内容,并且用于标准化,模式识别,时间序列分析,跨组学比较和多重假设测试的数据分析在“perseus和maxquant软件平台”(万维网上的coxdocs.org/doku.php)中讨论或包含在其中,通过引用将其包括在本文中。

引物设计

该部分说明了一种示例性方法,用于设计基因特异性引物,优选由基因编码部分上最保守的区域,以提取感兴趣的靶基因及其变体。在基因最保守的区域上设计引物导致提取自患者生物样品的基因变体数量增加。对于用于cdna合成的基因特异性引物设计,必须使用感兴趣基因的mrna翻译序列。基因组dna序列包含在rna处理过程中经剪接以产生mrna的内含子,因此由mrna开始时可以由外显子区域设计引物。当使用基因组dna(gdna)进行后处理以使基因易于转录时,可以将感兴趣的关键基因首先转录为rna,然后反转录为cdna,然后将其扩增。或者,使用本领域技术人员已知的方法(例如:使用诸如苯酚/氯仿纯化循环等方法或使用其他化学和/或酶促处理或片段化方法去除核糖体蛋白)对基因组dna进行后处理以使基因可用于pcr,基因变体可以直接由基因组dna复制和扩增。当由基因组dna提取/复制/扩增基因变体时,如果还希望由生物样品提取/复制/扩增rna,那么可以优选来自最保守的外显子区域的引物设计。

感兴趣的基因序列使用系列克隆在计算机上生成,如下所示。例如,我们选择了对人表皮生长因子受体(egfr)具有特异性的引物的序列。egfr是一种跨膜蛋白,其是胞外蛋白配体表皮生长因子家族(egf家族)的成员的受体。设计正向引物,以与mrna翻译的egfr开放阅读框5'端的序列互补。根据egfr开放阅读框3'端的序列设计反向引物。具体地,反向引物代表了3'端的反义或较低链反向互补。下述实施例中,粗体核苷酸表示选择包含在各引物中的那些。可以将未以粗体显示的核苷酸添加到引物序列中,例如,以实现两个引物不同的tm值(相差约5℃)。合适的tm计算器在万维网上的promega.com/a/apps/biomath/index.html?calc=tm处提供。

正向egfr引物:5’-ttaatgcgaccctccgggacg-3’(seqidno:1)tm=61℃。

反向egfr引物:5’cgcagtacgaggttatttaagtgacg3’(seqidno:2)tm=58℃。

另一反向引物:5’-ataatcctgggcatccacgtcaaacc3’(seqidno:9)tm=61℃

另一反向引物4:5’gccagtcgagtttggacactaaagg3’(seqidno:10)tm=60℃

由mrna翻译序列或cdna选择针对靶基因nras的引物。nras基因为生成称之为n-ras的蛋白质提供了指令,所述蛋白质主要涉及调节细胞分裂。设计正向引物,以与mrna翻译的人nras开放阅读框5'端的序列互补。根据人nras开放阅读框3'端的序列设计反向引物。可以将未以粗体显示的核苷酸添加到引物序列中,例如,以实现两个引物不同的tm值。

正向nras引物:5’-ataatgactgagtacaaactggtgg-3’(seqidno:3)tm=55℃。

反向nras引物:5’-gtaaatgtagtggtgtgtaccgttagg-3’(seqidno:4)tm=58℃。

由mrna翻译序列或cdna选择针对靶基因alk的引物。alk基因为生成称之为alk受体酪氨酸激酶的蛋白质提供了指令,所述蛋白质通过称之为信号转导的过程将来自细胞表面的信号转导到细胞中。设计正向引物,以与mrna翻译的人alk开放阅读框5'端的序列互补。根据人alk开放阅读框3'端的序列设计反向引物。可以将未以粗体显示的核苷酸添加到引物序列中,例如,以实现两个引物不同的tm值。

正向alk引物:5’-gcaatgggagccatcgggctcctg-3’(seqidno:5)tm=66℃。

反向alk引物:5’-taccgtacttggtcggacccgggact-3’(seqidno"6)tm=66℃。

由mrna翻译序列或cdna选择针对靶基因braf的引物。braf基因为生成称之为b-raf的蛋白质提供了指令。b-raf蛋白质是ras/mapk信号传导途径的部分,其调节细胞的生长和分裂(增殖),细胞成熟以执行特定功能的过程(分化),细胞运动(迁移)和程序性细胞死亡(细胞凋亡)。设计正向引物,以与mrna翻译的人braf开放阅读框5'端的序列互补。根据人braf开放阅读框3'端的序列设计反向引物。可以将未以粗体显示的核苷酸添加到引物序列中,例如,以实现两个引物不同的tm值。

正向braf引物:5’-tatatgccgggggcgcggcg-3’(seqidno:7)tm=67℃。

反向braf引物:5’-gccagtcacctgtcctttgcgtgg-3’(seqidno:8)tm=65℃。

在一些情况中,使用任何可用方法将收集到的基因用于产生蛋白质微阵列:使用异位蛋白质微阵列方法或原位蛋白质微阵列方法。例如,可以使用的蛋白质微阵列技术包括但不限于,核酸可编程蛋白质阵列(nappa)(见图6b),或ipc(分离蛋白质捕获)(见图8),蛋白质原位阵列(pisa),原位嘌呤霉素捕获,dna阵列到蛋白质阵列(dapa),纳米孔蛋白质阵列,分析性微阵列(也称之为捕获阵列),功能性蛋白质微阵列(也称之为靶蛋白质阵列)和反相蛋白质微阵列(rppa)。

可以使用本领域中已知的任何合适的蛋白质涂覆技术,例如nappa或ipc,对蛋白质传感器阵列进行功能化,所述蛋白质传感器阵列在阵列中包含从几个传感器至数百万个传感器。

在一些情况中,通过elisa或相似的方法,通过光学染料扫描(例如,使用染料诸如fitc,cy3染料进行基于光学染料标签的检测)或使用生物传感器检测抗体特征或基于细胞的免疫应答,这表示抗体的结合模式以及对于蛋白质,突变的变体蛋白或具有翻译后修饰的蛋白质基于细胞的免疫应答。在一些实施方式中,通过在生物传感器表面涂覆疾病蛋白质组蛋白质来检测抗体特征或基于细胞的免疫应答,然后可以将它们用于以多重形式的高灵敏度和特异性检测蛋白质相互作用,用于诊断或预后筛查或个性化治疗开发。使用无标记生物传感器产生了动力学结合数据,其通过减少假阳性和假阴性结果的发生率改善了诊断和预后数据质量。本文所用术语“结合”指可能是永久的或者暂时的任何物理连接或紧密结合。例如,结合可以由氢键结合,疏水力,范德华力,共价或离子结合产生。

例如,该部分描述了本公开疾病蛋白质组蛋白质阵列的一种应用。获自测试患者的生物样品可以与涂覆抗-人二抗(通常用作二抗,在任何宿主中制备)的磁性纳米颗粒或磁珠接触或混合很短的一段时间。这导致测试流体中存在的待捕获的所有抗体结合到磁性颗粒上,然后可以在多个洗涤步骤中将其从测试流体中分离出来。或者,可以用抗体捕获剂如化学接头、mix&go涂层、生物偶联物(bio-conjugate)等涂覆磁性珠。然后可以将磁性颗粒上捕获的抗体从磁性颗粒化学或酶促分离,并且可以用蛋白质传感器阵列芯片检测所得纯抗体溶液,以检测对疾病具有特异性的抗体,从而帮助疾病诊断和预后。或者,可以在蛋白质传感器阵列芯片上直接检测包含捕获的抗体的磁性颗粒,然后可以将来自传感器阵列的多重信号用于检测和诊断疾病或其他人状况。

如图7所示,蛋白质阵列可以是癌症蛋白质组蛋白质阵列,其包含癌症相关基因及其突变变异以及与特定癌症亚型或阶段相关的遗传信息。例如,可以在癌症蛋白质组(“癌症组(cancer-ome)”)芯片上检测收集自对象的血液或血清样品。如果存在于样品中,那么免疫应答标志物如肿瘤特异性或其他疾病特异性抗体将与癌症蛋白质组芯片上一种或多种癌症相关蛋白质斑点(可能会针对突变蛋白质和野生型蛋白质产生抗体)结合,这表明对象可能患有与蛋白质斑点相关的癌症类型。检测到的光学染料筛选特征或生物传感器阵列特征是可以使用生物信息学分析的数据,用于疾病诊断,预后,药物发现,药物耐药性概况和/或监测以及药物相互作用概况。

如果检测到的模式与患有特定类型癌症的患者中观察到的模式相似,那么测试患者患有该癌症的可能性很高。通过对抗体特征进行定性和定量,还可以确定肿瘤的大小以及疾病的阶段,因为相较于早期癌症,晚期癌症通常存在较大量抗体。疾病蛋白质组蛋白质阵列可在下午进行用于诊断或预后目的。在一些情况中,执行阵列以检测患者中癌症的存在与否。通过包括与各种癌症类型相关的蛋白质,它可以用作针对一种或多种类型的癌症的筛查测试,诊断测试,预后测试。

在一些情况中,将疾病蛋白质组蛋白质阵列冷冻并存储或运输以供按需使用,例如在不同的位置(例如,在诊所,在现场)。在一些情况中,将疾病蛋白质组蛋白质阵列冻干用于存储和/或运输,用于不同的位置。

在一些实施方式中,本文提供的方法可用于产生经蛋白质或抗原修饰的疾病蛋白质组蛋白质阵列,所述蛋白质或抗原表达自任何或所有致病性病原体如病毒,细菌,真菌,原生动物,蠕虫,朊病毒和其他单细胞和多细胞致病剂的基因。因为感染了致病剂的患者的免疫系统将会产生针对致病剂或其组分的抗体,所以对响应感染性试剂而特异性产生的抗体特征进行概述可以作为检测患者中感染的理想诊断。因此,通过表达来自病原体的蛋白质而产生的蛋白质生物传感器可以用于检测测试患者的抗体应答,以检测和诊断特定疾病的感染、收缩、发展。这类传感器可以用于临床应用(例如,诊断感染)以及生物防御应用以检测生物战,大流行性感染等的试剂。除了人类之外,本公开中所描述的方法和特定应用可以用于检测和诊断其他动物(包括野生动物,宠物,牲畜等)的疾病、感染和状况。

在另一方面中,本文提供了使用疾病蛋白质组蛋白质阵列芯片检测酶活性的方法。例如,可以将至少一种感兴趣的酶添加到传感器结合的蛋白质阵列中,并且可以经由传感器应答检测酶针对存在的蛋白质组的比活性。在另一实例中,酶蛋白质在传感器位置上产生和捕获。所得酶生物传感器可以用于检测针对测试样品中的测试蛋白质、dna或其他生物分子的比活性。在两种情况中,酶(i)直接结合传感器表面以检测由其反应所产生的酶的变化或者(ii)与靶分子发生反应而反应产物由传感器检测。在一些情况中,生物传感器设置成检测由酶催化的反应所产生的电子或质子。在其他情况中,生物传感器设置成检测酶催化的反应的产物。可以使用生物传感器检测的示例性酶促反应在图13、图14和图15中示出。

在另一方面中,本申请中所述蛋白质生物传感器可以用于检测传感器阵列结合的蛋白质的翻译后修饰(ptm)。如图12所示,通过检测释放的h+,fdec电荷传感器可以用于检测src激酶自身磷酸化。可以检测的ptm包括但不限于,酰化,乙酰化,去乙酰化,甲酰化,烷基化,甲基化,酰胺化,糖基化,氧化,糖化,磷酸化,生物素化,泛素化,sumo化,nedd化,硫酸化,peg化,瓜氨酸化,去磷酸化,脱酰胺化和消除。

出于免疫表型分析,可以使用来自携带癌症/疾病的特定患者的血液筛选本文所述癌症/疾病的蛋白质变体阵列,以鉴定蛋白质阵列中这样的变体蛋白质集合,其是在特定患者中产生抗体的免疫原,或产生涉及t细胞或b细胞或nk细胞或其他免疫细胞的细胞介导的免疫应答,所述其他免疫细胞涉及tcr,tlr,nlr,kar,kir,pamp,prr或mch或其他免疫细胞表面受体或表面蛋白或生物分子中任一种。蛋白质变体阵列筛选试验能够鉴定特定患者中宽泛的抗原性蛋白质变体集合,其是使用在蛋白质变体阵列上进行的抗体概述试验或免疫细胞结合试验检测的。在本文所述常规免疫表型分析试验后,可以使用基于质谱或液相色谱的方法如seldi或malditof来鉴定具有免疫原性或抗原性的蛋白质的特定变体(等位基因,同种型,突变,ptm修饰)。进一步使用蛋白质变体阵列的无标记生物传感器试验可以用于分解特定患者中宽泛的抗原性蛋白质变体集合的相对亲和力或相互作用强度或结合动力学,以对宽泛的抗原性变体蛋白质集合进行排序以及向下选择(downselect)至包含几个到几十或几百个高亲和力或最佳免疫相互作用的抗原性变体蛋白质的子集。例如,当使用相关癌蛋白质变体阵列筛选癌症患者血液(或其他生物样品)时,可以鉴定出200(大量)种患者特异性抗原性蛋白质变体。使用无标记生物传感器试验(如spr,fet传感器,拉曼,等离子,电化学传感器),可以进行动力学筛选以向下选择特定患者中前10种或前25种或前100种高亲和力或最佳免疫相互作用抗原。免疫原或抗原可以称之为新抗原或自身抗体或肿瘤特异性抗原(tsa)。然后,可以将特定患者中对这些抗原性蛋白质变体敏感的抗体或免疫细胞表面受体用于开发针对特定患者定制的更优秀的基于细胞的免疫疗法(基于患者中发现的免疫原),以改善癌症的免疫疗法结果,如“癌症免疫疗法中的新抗原(neoantigensincancerimmunotherapy)”tonschumacher等,science2015年4月3日;“肿瘤新抗原:建立个性化癌症免疫疗法的框架(tumorneoantigens:buildingaframeworkforpersonalizedcancerimmunotherapy)”,matthewgubin等,jclininvest.2015年9月;125(9);“基于树突细胞的免疫疗法:现有技术和发展(dendriticcell–basedimmunotherapy:stateoftheartandbeyond)”,kalijnf.bol等,ccrfocus,第22卷,第8期,第1897-1906页2016中所述;根据鉴定的癌症或患者肿瘤特异性免疫原或新抗原或tsa开发免疫疗法的示例方法在“驱动癌症的基因工程改造的t细胞免疫治疗(drivinggene-engineeredtcellimmunotherapyofcancer)”,lauraajohnson和carlhjune,cellresearch第27卷,2017中讨论。

使用的基于细胞的免疫疗法的实例可以是但不限于,car-t,t细胞,b细胞,nk细胞,树突状细胞,其他基于免疫细胞的免疫疗法。例如,鉴定的患者特异性变体抗原可以用于以最佳方式设计用于t细胞免疫疗法的嵌合抗原受体(car)或工程改造的t细胞受体(tcr)。鉴定的免疫原还可以用于改善检查点免疫疗法的结果,例如通过指导抑制剂疗法的最佳设计。

在另一方面中,使用本公开的癌症蛋白质组蛋白质阵列鉴定的癌症抗原可以用于开发个性化的新抗原癌症疫苗,作为预防性抗癌剂或作为癌症患者的个性化免疫疗法。最近的两项研究报道了针对黑色素瘤的个性化免疫原性新抗原疫苗的成功。参见ott等,nature547:217–221(2017年7月13日);sahin等,nature547:222–226(2017年7月13日)。根据本文所述方法通过由生物样品提取癌症相关靶基因及其变体鉴定的个体突变可以用于癌症患者的个性化免疫治疗。

在另一方面中,本文提供了基于使用本公开的疾病蛋白质组蛋白质阵列所确定的对象的抗体特征或免疫概况来治疗对象的方法。术语“治疗”、“处理”和“疗法”在本文中用于指代治疗性疗法,预防性疗法和防御性疗法。该术语包括防御性(即预防性)和缓解性治疗/处理。因此,在本公开的上下文中,术语“治疗/处理”包括治愈,改善或缓解神经元缺失,坏死性凋亡和/或相关疾病或其症状的严重性。在一些情况中,术语“治疗/处理的”指对疾病或病症进展的任何有益作用。有益作用可以包括逆转,减轻,抑制该术语所适用的疾病或病症或这类疾病或病症的一种或多种症状或表现的进展,预防或降低其可能性。如果在给予本发明的化合物或药物组合物之后发展出坏死性凋亡,“预防”或“防御”表示预防坏性凋亡的发生或减轻防坏性凋亡的严重性。术语“抑制”用于描述导致预防,减少或以任何其他方式减轻与坏死性凋亡相关的神经元缺失的任何形式的抑制。如本文所述,抑制神经元缺失包括完全和部分抑制神经元缺失或坏死性凋亡。在一个实施方式中,抑制是完全抑制。在一个实施方式中,抑制是部分抑制。

在本公开的上下文中,术语“给予”和该术语包括“给药”和“施用”的变形包括通过任何适当的手段将本发明的化合物或组合物与对象接触,施加于对象,递送至对象或提供给对象。例如,在向对象给予作为神经元缺失或坏死性凋亡激活抑制剂的试剂的情况下,所述试剂的有效量是例如相较于未给予试剂情况下获得的应答足以实现神经元缺失减少的量。

可以使用经编程以接收数据的计算机来执行本文所述方法(例如,来自疾病蛋白质组蛋白质阵列的数据,其指示对象是否具有与特定癌症相关的免疫概况/抗体特征)。该计算机可以输出与对象的生物标志物或免疫概况/抗体特征有关的展示信息。专业人员(例如,医学专业人员)可以将与蛋白质组蛋白质阵列分析有关的信息传递给对象或对象的家庭。在一些情况中,专业人员可以向对象和/或对象的家庭提供与特定疾病疗法有关的信息,包括治疗/处理选择和潜在的副作用。在一些情况中,专业人员可以提供对象的医疗记录,以将与生物标志物分析和/或疾病状态有关的信息传递给专家。

专业人士(例如,研究专业人士)可以将与对象的生物标志物有关的信息应用于针对抗癌疗法或其他疾病治疗/处理的进一步研究。例如,研究人员可以使用与特定疗法功效或与特定疗法相关的副作用有关的信息编辑关于特定抗体概况存在的数据。在一些情况中,研究专业人员可以获得对象的生物标志物信息,以评估对象的入组,或继续参与研究或临床试验。在一些情况中,研究专业人员可以将对象的生物标志物信息传递给医学专业人员,或者可以将对象委托于医学专业人员进行临床评估和/或治疗/处理。

可以使用任何适当的方法来将信息传递给另一个人(例如,专业人员),并且可以直接或间接地传达信息。例如,实验室技术人员可以将生物标志物信息输入到基于计算机的记录中。在一些情况中,可以通过对医疗或研究记录进行物理更改以传递信息。例如,医学专业人员可以对医学记录做出永久记号或标记,以将信息传递给查看该记录的其他医学专业人员。可以使用任何类型的通信(例如,邮件,电子邮件,电话和面对面的互动)。还可以通过使专业人员能够通过电子方式获得信息来将信息传递给专业人员。例如,可以将信息置于计算机数据库上,从而使医学专业人员可以访问该信息。此外,可以将信息传递给充当专业人员代理的医院、诊所或研究机构。

制品

本公开还提供了制品,其可以包括例如可以用于确定对象是否具有与特定疾病(例如,癌症)相关的抗体概况或免疫应答概况的材料和试剂。制品可以包括,例如,疾病相关核酸,或多肽,其固定于一个或多个基材上(例如,在离散区域(“特征”)中,并且各离散区域中固定有不同群体的分离核酸或多肽)。制品可以还包括用于实施本文所提供的用于预测对象患有特定疾病可能性的方法的说明。

制品可以进一步包括一种或多种疾病蛋白质组蛋白质阵列用于进行分析。在一些情况中,核酸或蛋白质阵列连接固体基材,例如,不溶的多孔或无孔材料。各阵列的核酸或蛋白质可以共价或非共价地固定在基材上。

还提供了包含本文所述任何疾病蛋白质组蛋白质阵列的试剂盒。任选地,该试剂盒可以包含用于检测本文所述一种或多种抗体概况或免疫应答特征的说明书。任选地,该试剂盒可以包含例如对照生物样品。

在一些情况中,用于处理生物样品和/或使用阵列的一种或多种试剂(例如,还原剂,变性,去糖基化试剂,去磷酸化试剂,烷基化试剂和/或用于化学或酶促切割肽或蛋白质的试剂)和试剂盒一起提供。试剂盒还可以包括用于检测特定特征存在与否的检测试剂。或者,这类试剂可以与试剂盒分别提供。

通常将上述制品的说明书记录在合适的记录介质上。例如,说明书可以印刷在基材上,诸如纸或塑料等。因此,说明书可以存在于试剂盒中,作为包装插页,在试剂盒或其组分的容器的标签中(即,与包装或子包装相关)等。在其他实施方式中,说明书以电子存储数据文件存在于合适的计算机可读存储介质上,例如,cd-rom,磁盘等,包括其上存在程序的相同介质。

在其他实施方式中,说明书本身并不存在于试剂盒中,但是提供由远程源获得说明书的手段,例如,经由因特网。该实施方式的示例是一种试剂盒,其包括网址,在该网址上可以查看和/或可以从其下载说明书。相反,可以提供用于由远程源获得对象程序的手段,如通过提供网址。更进一步,该试剂盒可以是这样的试剂盒,其中说明书和软件获自或下载自远程源,如在因特网或万维网中。可以使用某种形式的访问安全性或标识协议来将访问限制为对有权使用本发明的人员进行访问。与说明书一样,用于获得说明书和/或程序的手段通常记录在合适的记录介质上。

任选地,本文所述试剂盒还可以包括用于基于本文所述抗体概况或免疫应答特征存在与否来治疗癌症患者的说明书。

术语“确定”、“测量”、“评价”、“评估”、“测试”和“分析”在本文中互换使用以指任何形式的测量,并包括确定某要素存在与否。这些术语可以包括定量和/或定性确定。评估可以是相对的,也可以是绝对的。“评估…的存在”包括确定事物存在的量,以及确定其存在与否。

本文使用冠词“一个”和“一种”表示一个或一个以上的(即至少一个)该冠词语法上的宾语。举例而言,“一种抗体”表示一种抗体或者超过一种的抗体。因此,“一(个或种)”、“一(个或种)或多(个或种)”、“至少一(个或种)”可以互换使用。

预期可以相对于本文所述任何其他方法或组合物来实现本文所述任何实施方式所示方法或组合物。

本文所用术语“大约”或“约”在应用于感兴趣的一个或多个值时,指与所述参照值相似的值。在某些实施方式中,术语“大约”或“约”指落入所述参照值任一方向(大于或小于)上25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更少的比例内的数值范围,除非另有说明或从上下文中可以明显地看出(除非该数字超过可能值的100%)。

当提供一个数值范围时,应理解在本发明的范围内包括该范围上下限之间的每一个中间值,以及在该提到的范围内的任何其它所提到的或中间的数值。所述较小范围内可独立地包含这些较小范围的上下限,它们也属于本发明范围,受到所述范围明确排除的限值制约。设定范围包含一个或两个限值时,本发明也包括排除所含限值之一个或两个的范围。

除非另有说明,本文所用的所有科技术语与本发明所属领域普通技术人员所理解的通常含义相同。本文所提及的所用出版物通过引用纳入本文,用于描述和公开可以与本文所述发明结合使用的装置、制剂和方法的目的。

尽管本发明可以进行大量的改变,采用替代形式,在附图和以下详述中以示例的方式显示了本发明的特定实施方式。然而应当理解的是,本文对特定实施方式的描述并不旨在将本发明限制在所公开的特定形式中。相反,应当理解的是,除了明确说明的内容之外,许多等同,替代,变化和修改是可能的,并且落入通过所附权利要求书所限定的本发明的精神和范围内。

在考虑以下非限制性实施例的基础上,能够更完整地理解本发明。

实施例

实施例1-用于由提取自生物学样品的rna克隆基因突变的方案[预测性]

a.rna提取

为了将总rna与其他细胞组分分离,可以裂解癌细胞/组织以释放其内容物,然后在trizol试剂中进行一系列离心步骤。总rna包括所有mrna,转移rna,核糖体rna和其他非编码rna。如所期望的是,可以使用商业mrna提取试剂盒由总rna中选择性地提取mrna。也可以直接由细胞或组织裂解物中提取mrna,而无需进行初始总rna提取。存在用于由组织裂解物中直接提取mrna的许多商业试剂盒。

mrna提取:mrna分离试剂盒包含寡聚(dt)20引物,其与mrna的多聚腺苷酸尾直接结合,能够通过多聚a尾分离mrna。分离的mrna可直接用于cdna合成的逆转录酶试验,以获得存在于患者样品中感兴趣的基因变体。然后可以将cdna剪接到克隆质粒上以产生重组质粒,然后将其用于转化大肠杆菌dh5α。

对于自由循环的rna或dna(例如,在人血清或血浆中),不需要细胞破坏。我们可以低速简单地离心沉淀样品,然后使用商业试剂盒进行核酸提取。虽然核酸dna或细胞质rna需要进行细胞裂解,然后进行离心,但是无细胞的dna/rna仅需要进行初始离心。

b.cdna合成

分离mrna后,使用基本上识别部分mrna的基因特异性引物通过逆转录mrna为dna可以合成cdna。我们有兴趣由多顺反子mrna的其余部分“分离”感兴趣的基因(及其突变)。我们的最终目标是分离感兴趣的基因及其突变,并生成用于克隆和纯化的重组质粒。

c.用于cdna合成的基因特异性引物设计

假设突变不影响感兴趣的基因(goi)5'和3'端的序列,那么可以基于这两个末端设计通用引物对。该引物对应当基本上合成具有不同基因突变的cdna。然而,如果突变影响goi5'或3'端之一的序列,那么最好根据与基因组dna上goi邻近的dna序列设计引物对。

d.重组质粒的产生(连接)

将设计在适当末端具有限制酶识别序列的另一组引物,然后将其用于pcr扩增上述cdna。将用于新引物的识别序列应当取决于克隆质粒上的限制酶。pcr产物将通过凝胶电泳纯化,然后用适当的限制酶消化。也将使用相同的限制酶使环状克隆质粒线性化,然后连接线性化质粒和消化的pcr产物,以产生具有感兴趣的基因/突变的环状重组质粒。

e.大肠杆菌的转化

如上所述制备的重组质粒可用于使用电穿孔或热激法转化大肠杆菌dh5α。转化的大肠杆菌可以在合适的培养基中生长以产生更多的大肠杆菌细胞。然后可以将细胞沉淀,然后进行裂解以提取重组质粒,然后可以将其用于nappa或ipc(分离蛋白质捕获)。

该申请中所列出的所有参考文献通过引用其全部内容纳入用于所有目的,只要它们与本发明发生冲突。尽管本文已经讨论了所公开主题的特定实施方式和示例,但是这些示例是说明性的而非限制性的。通过阅读本说明书和下面的权利要求书,许多变化对于本领域技术人员将变得显而易见。

序列表

<110>伊纳诺生物股份有限公司(inanobio,inc.)

b·塔库拉帕里(takulapalli,bharath)

<120>疾病蛋白质组蛋白质阵列及其应用

<130>155529.00004

<150>us62/572,666

<151>2017-10-16

<160>10

<170>patentinversion3.5

<210>1

<211>21

<212>dna

<213>人工序列

<220>

<223>合成的

<400>1

ttaatgcgaccctccgggacg21

<210>2

<211>26

<212>dna

<213>人工序列

<220>

<223>合成的

<400>2

cgcagtacgaggttatttaagtgacg26

<210>3

<211>25

<212>dna

<213>人工序列

<220>

<223>合成的

<400>3

ataatgactgagtacaaactggtgg25

<210>4

<211>27

<212>dna

<213>人工序列

<220>

<223>合成的

<400>4

gtaaatgtagtggtgtgtaccgttagg27

<210>5

<211>24

<212>dna

<213>人工序列

<220>

<223>合成的

<400>5

gcaatgggagccatcgggctcctg24

<210>6

<211>26

<212>dna

<213>人工序列

<220>

<223>合成的

<400>6

taccgtacttggtcggacccgggact26

<210>7

<211>20

<212>dna

<213>人工序列

<220>

<223>合成的

<400>7

tatatgccgggggcgcggcg20

<210>8

<211>24

<212>dna

<213>人工序列

<220>

<223>合成的

<400>8

gccagtcacctgtcctttgcgtgg24

<210>9

<211>26

<212>dna

<213>人工序列

<220>

<223>合成的

<400>9

ataatcctgggcatccacgtcaaacc26

<210>10

<211>25

<212>dna

<213>人工序列

<220>

<223>合成的

<400>10

gccagtcgagtttggacactaaagg25

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1