间皮瘤生物标记及其用途

文档序号:6159042阅读:322来源:国知局
间皮瘤生物标记及其用途
【专利摘要】公开了用于一般检测和诊断癌症以及具体检测和诊断间皮瘤的生物标记、方法、装置、试剂、系统和试剂盒。
【专利说明】间皮瘤生物标记及其用途
[0001]相关申请
[0002]本申请要求于2010年9月27日提交的美国临时申请系列号61/386,840以及于2011年3月31日提交的美国临时申请系列号61/470,143的权益,这些申请每个整体援引加入本文。
发明领域
[0003]本申请一般涉及个体中生物标记的检测和癌症的诊断,并且更具体地涉及用于诊断个体的癌症,更特别是恶性间皮瘤(间皮瘤)的一种或多种生物标记、方法、装置、试剂、系统和试剂盒。
【背景技术】
[0004]下面的描述提供了本公开相关信息的概述,并非承认任何本文提供的信息或引用的出版物是本公开的现有技术。
[0005]间皮瘤是侵袭性的石棉相关的肺癌,其发病率增加。这种疾病在全世界每年引起预计15,000-20, 000例死亡。1940年至1979年之间,在美国约27.5X IO6人职业性暴露于石棉。美国的间皮瘤发病率为每年约3,000例新病例,并且再过20年不会达到顶峰。间皮瘤从石棉暴露开始具有20-40年的潜伏期,但是一旦确诊,这种侵袭性疾病常在14个月内致死。因为诊断困难,大多数患者处于临床晚期,这时治愈的可能性最小。
[0006]具有石棉暴露史的个体的间皮瘤的早期诊断是尚未满足的临床需求。这样的暴露可以是直接的,例如在管道铺设或者安装或拆除基于石棉的绝缘层期间,或者是间接的,例如通过暴露于蛭石或采煤。随着职业暴露的 发现继续增加,筛查所有暴露的工人的需要会增加。
[0007]石棉暴露是疾病的主要致病因素这一事实意味着对于临床筛查可以容易地鉴别高风险群体。自1973年以来,美国职业安全与健康管理局规定具有职业性空气石棉暴露的个体应当在暴露后监测长达30年。监测包括胸部X-射线、健康史和肺活量测定法。然而,这种监测在诊断早期间皮瘤或检测复发中是无效的。因此,监测的依从性差,并且大多数疾病检测太晚而无法治愈。
[0008]目前,大多数患者由于胸腔积液而鉴别,并且在博学的专家见到患者和怀疑间皮瘤之前一些咨询通常是必需的。诊断通常通过胸腔积液的细胞学分析来进行,这具有良好的特异性但并不是非常灵敏。
[0009]患有间皮瘤的患者可以存在各种症状,包括:
[0010]持续性干咳或刺耳的咳嗽(通常非排痰性(non-productive))
[0011]咯血(咳血)
[0012]吞咽困难(咽下困难)
[0013]盗汗或发热
[0014]原因不明的体重减轻10%更多[0015]疲劳
[0016]胸部或肋骨区域的持续疼痛,或者疼痛的呼吸
[0017]甚至在休息时发生的气短
[0018]胸部皮肤下肿块的出现
[0019]朝向恶性一侧的脊柱侧凸
[0020]这些症状是非特异性的,并且一般指示晚期疾病。许多良性肺疾病病例经历侵入性过程,因为胸腔积液在患有石棉沉着病和胸膜斑的患者中也是常见表现。
[0021]间皮瘤的检测往往在疾病的晚期进行。在晚期诊断的间皮瘤患者的存活率非常低-对于III期,少于15个月,并且对于IV期更差。当疾病可切除和可治疗时,在较早阶段检测应当增加总存活率并有益于患者。
[0022]吸烟与石棉暴露具有强协同效应,并且当这两种风险因素组合时,肺癌的发病率增加4-5倍。吸烟对间皮瘤的发病率没有影响。
[0023]特定疾病状态的生物标记选择包括首先鉴定与对照群体相比在疾病群体中具有可测量和统计上显著的差异的标记用于特定医学应用。生物标记可以包括分泌或脱落(shed)的分子,其与疾病发展或进程平行,并且容易对恶性肿瘤响应而从间皮瘤或肺癌组织或者从周围组织和循环细胞扩散入血流。鉴定的生物标记或生物标记的集合(set)通常临床上进行验证,或者证实为对其所选的原始预期用途是可靠的指示物。生物标记可以包括小分子、肽、蛋白和核酸。影响生物标记鉴定的一些关键问题包括可用数据的过拟合(over-fitting)及数据偏差。
·[0024]已使用各种方法来试图鉴定生物标记和诊断疾病。对于基于蛋白的标记,这些方法包括二维电泳、质谱和免疫测定方法。对于核酸标记,这些方法包括mRNA表达谱、微RNA谱、FISH、基因表达系列分析(SAGE)、甲基化谱和大规模基因表达阵列。
[0025]二维电泳的应用由于如下问题而受限:低检测灵敏度;与蛋白溶解性、电荷及疏水性相关的问题;凝胶再现性,以及单个斑点代表多种蛋白的可能性。对于质谱,取决于所用形式,限制围绕样品加工和分离、对低丰度蛋白的灵敏性、信噪比考虑及不能立即鉴定检测的蛋白而出现。免疫测定方法发现生物标记的限制集中在基于抗体的多重测定不能测量大量分析物。可以简单地印刷高质量抗体的阵列,并且无需夹心而测量与这些抗体结合的分析物。(这会是使用全基因组核酸序列经杂交测量有机体或细胞中的全部DNA或RNA序列的方式上的等同物。因为杂交可以是同一性的严紧测试,所以杂交实验可行。甚至非常好的抗体在选择它们的结合配偶体中也并非足够严紧来在血液或甚至是细胞提取物环境中工作,因为那些基质中的蛋白总体(ensemble)具有极其不同的丰度。)因此,必须使用不同的基于免疫测定的方法以发现生物标记-需要使用多重ELISA测定(即夹心)以获得足够严紧性来同时测量许多分析物,从而决定哪些分析物的确是生物标记。夹心免疫测定不放大至高含量,因此使用标准阵列形式不能用严紧夹心免疫测定发现生物标记。最后,抗体试剂产生相当大的批次差异和试剂不稳定性。本发明的蛋白生物标记发现平台克服了这个问题。
[0026]许多这些方法依赖或需要在分析前一些类型的样品的分级。因此进行设计为在一系列良好限定的样品群体中鉴定和发现统计学相关生物标记的足够有效的研究所需的样品制备是极其困难、昂贵和耗时的。在分级期间,大范围的变异性可以被引入各种样品。例如,一种潜在的标记可能对于方法是不稳定的,标记的浓度可能变化,不合适的聚集或解聚可能发生,无意的样品污染可能发生,并因此掩盖预期的早期疾病中的微小变化。
[0027]广泛接受的是使用这些技术的生物标记发现和检测方法对于鉴定诊断性生物标记具有严重限制。这些限制包括不能检测低丰度生物标记,不能持续覆盖蛋白质组的完整动态范围,样品加工和分级中的不可再现性,以及方法的整体不可再现性和缺乏稳健性(robustness)。另外,这些研究在数据中引入了偏差,针对鉴定和验证靶疾病群体内的生物标记所需的分布和随机化方面,没有充分解决包括适当对照在内的样品群体的复杂性。
[0028]尽管旨在发现新的和有效的生物标记的努力已进行了几十年,但是这些努力大部分是不成功的。针对各种疾病的生物标记通常在学术性实验室中鉴定,通常通过进行一些疾病过程的基础研究时偶然发现。基于所述发现和少量临床数据,发表的论文提示鉴定了新的生物标记。然而大多数这些建议的生物标记未证实是真实或有用的生物标记;这主要是因为测试的少量临床样品对于已确实发现有效的生物标记仅提供弱统计学证据。也就是说,最初的鉴定对于统计学的基本元素是不严格的。在1994-2003年的每一年中,检索科学文献显示公开了上千篇关于生物标记的参考文献。然而,在同时期内,FDA—年最多批准3种新蛋白生物标记的诊断应用,并且在若干年中没有批准新的蛋白生物标记。
[0029]基于失败的生物标记发现努力的历史,已建议了数学理论以进一步促进通常理解,即针对疾病的生物标记很少且难以发现。基于2D凝胶或质谱的生物标记研究支持这些观点。通过这些方法鉴定了非常少的有用生物标记。然而,通常忽视2D凝胶和质谱测量血液中存在的约InM或更高浓度的蛋白,这种蛋白的总体很可能是最不可能随疾病变化的。除了本发明的生物标记发现平台,尚不存在能够精确测量低得多的浓度的蛋白表达水平的蛋白质组生物标记发现平台。
[0030]关于复杂的人生物学的生物化学途径已知`许多。许多生物化学途径以在病理学内局部发挥作用的分泌的蛋白达到顶点或开始,例如分泌生长因子以刺激病理学中其他细胞的复制,以及分泌其他因子以避开免疫系统等。尽管许多这些分泌的蛋白以旁分泌方式发挥作用,但是一些在身体的远端运行。具有生物化学途径基本了解的本领域技术人员会理解,许多病理学特异性蛋白应当以低于(甚至远低于)2D凝胶和质谱检测极限的浓度存在于血液中。在这种相对丰富数目的疾病生物标记的鉴定之前必须有一种蛋白质组平台,其可以分析低于2D凝胶或质谱可以检测的浓度的蛋白。
[0031]因此,亟需生物标记、方法、装置、试剂、系统和试剂盒,其允许(a)在暴露于石棉的个体中区分间皮瘤与良性疾病状况;(b)区分间皮瘤与转移性疾病与其他癌症,这可以包括肺、乳房、胃、肾、卵巢、胸腺和前列腺;(C)区分间皮瘤与肺腺癌;(d)检测间皮瘤生物标记;以及(e)诊断间皮瘤。
[0032]发明概沭
[0033]本申请包括用于检测和诊断癌症,更特别是间皮瘤的生物标记、方法、试剂、装置、系统和试剂盒。本申请的生物标记使用实施例1详述的基于多重适配体的测定来鉴定。通过使用本文所述的基于适配体的生物标记鉴定方法,本申请描述了可用于检测和诊断间皮瘤的惊人的大量间皮瘤生物标记以及可用于检测和诊断更一般的癌症的大量癌症生物标记。在鉴定这些生物标记中,测量了来自数百个个体样品的超过1000种蛋白,其中一些的浓度在低飞摩尔(femtomolar)范围。这比用2D凝胶和/或质谱进行的生物标记发现实验低约4个数量级。
[0034]尽管某些所述间皮瘤生物标记可单独用于检测和诊断间皮瘤,但是本文所述的方法用于分组可用作一组生物标记的间皮瘤生物标记的多个子集。一旦鉴定了单独的生物标记或生物标记的子集,则个体中间皮瘤的检测或诊断可以使用能够测量生物学样品中所选生物标记或多种生物标记的水平差异的任何测定平台或形式来完成。
[0035]然而,仅仅通过使用本文所述的基于适配体的生物标记鉴定方法,其中超过1000个单独的潜在生物标记值从先前已经诊断为患有或不患有间皮瘤的大量个体中逐个进行了筛查,才可能鉴定本文公开的间皮瘤生物标记。这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反,因为其询问无需翻译为人病理学的更加患者相关的系统。
[0036]因此,本申请一方面提供一种或多种生物标记以用于单独或以各种组合来诊断间皮瘤,或者允许鉴别诊断间皮瘤与良性疾病状况,如在暴露于石棉的个体中发现的那些良性疾病状况。示例性实施方案包括表I提供的生物标记,如上所述,这些生物标记用实施例1中一般描述并在实施例2中更具体描述的基于多 重适配体的测定鉴定。表I提供的标记可用于诊断高风险群体中的间皮瘤以及区分暴露于石棉的个体中的良性肺疾病与间皮瘤。
[0037]虽然某些所述间皮瘤生物标记可以单独用于检测和诊断间皮瘤,但是本文所述的方法还用于分组间皮瘤生物标记的多个子集,其各自可用作两个或更多个生物标记的组。因此,本申请的各个实施方案提供了包含N个生物标记的组合,其中N是至少2个生物标记。在其他实施方案中,N选自2-66个生物标记中的任意数。
[0038]在其他实施方案中,N选自2-5、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、
2-50、2-55、2-60或2-66中的任意数。在其他实施方案中,N选自3-5、3-10、3-15、3_20、
3-25、3-30、3-35、3-40、3-45、3-50、3-55、3-60或 3-66 中的任意数。在其他实施方案中,N选自 4-5、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55、4-60 或 4-66 中的任意数。在其他实施方案中,N 选自 5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、
5-60或5-66中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、
6-40、6-45、6-50、6-55、6-60或6-66中的任意数。在其他实施方案中,N选自7_10、7_15、
7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55、7-60或 7-66 中的任意数。在其他实施方案中,N选自 8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55、8-60 或 8-66 中的任意数。在其他实施方案中,N选自 9-10、9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55、
9-60或9-66中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、10-30、10-35、
10-40、10-45、10-50、10-55、10-60或10-66中的任意数。应当理解N可以选自包含类似但更闻级的范围。
[0039]在另一方面,本发明提供了一种诊断个体的间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表I提供的生物标记的组的至少一个生物标记,其中所述个体基于所述至少一个生物标记值分类为患有间皮瘤。
[0040]在另一方面,本发明提供了一种诊断个体的间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中所述个体患有间皮瘤的似然性基于所述生物标记值来确定。[0041]在另一方面,本发明提供了一种诊断个体的间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中所述个体基于所述生物标记值分类为患有间皮瘤,并且其中N = 2-10。
[0042]在另一方面,本发明提供了一种诊断个体的间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中所述个体患有间皮瘤的似然性基于所述生物标记值来确定,并且其中N = 2-10。
[0043]在另一方面,本发明提供了一种诊断个体不患有间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表I所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为不患有间皮瘤。
[0044]在另一方面,本发明提供了一种诊断个体不患有间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为不患有间皮瘤,并且其中N = 2-10。
[0045]在另一方面,本发明提供了一种诊断间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表I所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有间皮瘤,并且其中N = 3-10。
[0046]在另一方面,本发 明提供了一种诊断间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表I所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有间皮瘤,并且其中N = 3-10。
[0047]在另一方面,本发明提供了一种诊断间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组生物标记中的生物标记,所述一组生物标记选自表2-11所列的组(group of panels),其中所述生物标记值的分类指示所述个体患有间皮瘤。
[0048]在另一方面,本发明提供了一种诊断间皮瘤不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表I所列的生物标记的组,其中所述生物标记值的分类指示所述个体中不存在间皮瘤,并且其中N = 3-10。
[0049]在另一方面,本发明提供了一种诊断间皮瘤不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表I所列的生物标记的组,其中所述生物标记值的分类指示所述个体中不存在间皮瘤,并且其中N = 3-10。
[0050]在另一方面,本发明提供了一种诊断间皮瘤不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组生物标记中的生物标记,所述一组生物标记选自表2-11提供的组,其中所述生物标记值的分类指示所述个体中不存在间皮瘤。
[0051 ] 在另一方面,本发明提供了一种诊断个体的间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为患有间皮瘤,并且其中N = 2-10。
[0052]在另一方面,本发明提供了一种诊断个体中不存在间皮瘤的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为不患有间皮瘤,并且其中N = 2-10。
[0053]在另一方面,本发明提供了一种指示间皮瘤的似然性的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表I所列的生物标记的组的至少N个生物标记之一,其中N如上定义;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有间皮瘤的似然性。
[0054]在另一方面,本发明提供了一种将个体分类为患有或不患有间皮瘤的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表I提供的生物标记的组的至少N个生物标记之一;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体是否患有间皮瘤。
[0055]在另一方面,本发明提供了一种指示间皮瘤的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表I所列的生物标记的组的至少N 个生物标记之一,其中N如上定义;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有间皮瘤的似然性。
[0056]在另一方面,本发明提供了一种指示个体的间皮瘤状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表I提供的生物标记的组的至少N个生物标记之一;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的间皮瘤状态。
[0057]在另一方面,本发明提供了一种指示间皮瘤的似然性的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表I所列的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体患有间皮瘤的似然性。
[0058]在另一方面,本发明提供了一种将个体分类为患有或不患有间皮瘤的计算机执行方法。所述方法包括:从计算机检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表I提供的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体是否患有间皮瘤。[0059]在另一方面,本发明提供了一种指示间皮瘤的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表I所列的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有间皮瘤的似然性。
[0060]在另一方面,本发明提供了一种指示个体的间皮瘤状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表I提供的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的间皮瘤状态。
[0061]尽管某些所述生物标记还可单独用于检测和诊断一般癌症,但是本文所述的方法用于分组用作一般检测和诊断癌症的一组生物标记的生物标记的多个子集。一旦鉴定了单独的生物标记或生物标记的子集,则个体中癌症的检测或诊断可以使用能够测量生物学样品中所选生物标记或多种生物标记的水平差异的任何测定平台或形式来完成。
[0062]然而,仅仅通过使用本文所述的基于适配体的生物标记鉴定方法,其中超过1000个单独的潜在生物标记值从先前已经诊断为患有或不患有癌症的大量个体中逐个进行了筛查,才可能鉴定本文公开的癌症生物标记。这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反,因为其询问无需翻译为人病理学的更加患者相关的系统。
[0063]因此,在本申请的一方面,提供了一种或多种生物标记用于单独或在各种组合中使用以诊断癌症。示例性实施方案包括表19提供的生物标记,这些生物标记用实施例1中一般描述并在实施例5中更具体描述的基于多重适配体的测定鉴定。表19提供的标记可用于区分患有癌症的个体与不患有癌症的个体。
[0064]虽然某些所述癌症生物标`记可以单独用于检测和诊断癌症,但是本文所述的方法还用于分组癌症生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请的各个实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自3-22个生物标记中的任意数。
[0065]仍然在其他实施方案中,N选自2-5、2-10、2-15、2-20或2-22中的任意数。在其他实施方案中,N选自3-5、3-10、3-15、3-20或3-22中的任意数。在其他实施方案中,N选自4-5、4-10、4-15、4-20或4-22中的任意数。在其他实施方案中,N选自5-10、5-15、5_20或5-22中的任意数。在其他实施方案中,N选自6-10、6-15、6-20或6-22中的任意数。在其他实施方案中,N选自7-10、7-15、7-20或7-22中的任意数。在其他实施方案中,N选自
8-10、8-15、8-20或8-22中的任意数。在其他实施方案中,N选自9-10、9-15、9_20或9-22中的任意数。在其他实施方案中,N选自10-15、10-20或10-22中的任意数。应当理解N可以选自包含类似但更高级的范围。
[0066]在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表19提供的生物标记的组的至少一个生物标记,其中所述个体基于所述至少一个生物标记值分类为患有癌症。
[0067]在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中所述个体患有癌症的似然性基于所述生物标记值来确定。
[0068]在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中所述个体基于所述生物标记值分类为患有癌症,并且其中N = 3-10。
[0069]在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中所述个体患有癌症的似然性基于所述生物标记值来确定,并且其中N= 3-10。
[0070]在另一方面,本发明提供了一种诊断个体不患有癌症的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表19所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为不患有癌症。
[0071]在另一方面,本发明提供了一种诊断个体不患有癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为不患有癌症,并且其中N = 3-·10。
[0072]在另一方面,本发明提供了一种诊断癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表19所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有癌症,并且其中N = 3-10。
[0073]在另一方面,本发明提供了一种诊断癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表19所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有癌症,并且其中N = 3-10。
[0074]在另一方面,本发明提供了一种诊断癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组生物标记中的生物标记,所述一组生物标记选自表20-29所列的组,其中所述生物标记值的分类指示所述个体患有癌症。
[0075]在另一方面,本发明提供了一种诊断癌症不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表19所列的生物标记的组,其中所述生物标记值的分类指示所述个体中不存在癌症,并且其中N = 3-10。
[0076]在另一方面,本发明提供了一种诊断癌症不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表19所列的生物标记的组,其中所述生物标记值的分类指示所述个体中不存在癌症,并且其中N = 3-10。
[0077]在另一方面,本发明提供了一种诊断癌症不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组生物标记中的生物标记,所述一组生物标记选自表20-29提供的组,其中所述生物标记值的分类指示所述个体中不存在癌症。
[0078]在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为患有癌症,并且其中N = 3-10。
[0079]在另一方面,本发明提供了一种诊断个体中不存在癌症的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为不患有癌症,并且其中N = 3-10。
[0080]在另一方面,本发明提供了一种指示癌症的似然性的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中N如上定义;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有癌症的似然性。
[0081]在另一方面,本发明提供了一种 将个体分类为患有或不患有癌症的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表19提供的生物标记的组的至少N个生物标记之一;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体是否患有癌症。
[0082]在另一方面,本发明提供了一种指示癌症的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表19所列的生物标记的组的至少N个生物标记之一,其中N如上定义;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有癌症的似然性。
[0083]在另一方面,本发明提供了一种指示个体的癌症状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表19提供的生物标记的组的至少N个生物标记之一;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的癌症状态。
[0084]在另一方面,本发明提供了一种指示癌症的似然性的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表19所列的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体患有癌症的似然性。
[0085]在另一方面,本发明提供了一种将个体分类为患有或不患有癌症的计算机执行方法。所述方法包括:从计算机检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表19提供的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体是否患有癌症。
[0086]在另一方面,本发明提供了一种指示癌症的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表19所列的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有癌症的似然性。
[0087]在另一方面,本发明提供了一种指示个体的癌症状态的计算机程序产品。所述计算机程序产品包 括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表19提供的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的癌症状态。
【专利附图】

【附图说明】
[0088]图1A是检测生物学样品中的间皮瘤的示例方法的流程图。
[0089]图1B是用朴素贝叶斯(naiVe Bayes)分类方法检测生物学样品中的间皮瘤的示例方法的流程图。
[0090]图2示出单个生物标记⑶Hl的ROC曲线,其使用用于检测间皮瘤的测试的朴素贝叶斯分类器(classifier)。
[0091]图3示出2至10个生物标记的生物标记组的ROC曲线,其使用用于检测间皮瘤的测试的朴素贝叶斯分类器。
[0092]图4说明当生物标记的数目从I增加至10时分类评分(AUC)的增加,其使用用于间皮瘤组的朴素贝叶斯分类。
[0093]图5示出对于组合的暴露于石棉的个体(实线)和间皮瘤疾病组(虚线),作为log转化的RFU形式的累积分布函数(cdf)的CDHl的测量的生物标记分布,以及它们的曲线拟合为正态cdf (短划线),以用于训练(train)朴素贝叶斯分类器。
[0094]图6说明与本文所述的各种计算机执行方法一起使用的示例计算机系统。
[0095]图7是一实施方案的指示个体患有间皮瘤的似然性的方法的流程图。
[0096]图8是一实施方案的指示个体患有间皮瘤的似然性的方法的流程图。
[0097]图9说明可以用于检测生物学样品中一个或多个间皮瘤生物标记的示例适配体测定。
[0098]图10示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类器以区分间皮瘤与暴露于石棉的个体的频率的柱状图。
[0099]图1lA示出一对柱状图,其总结了使用表I所列的生物标记(黑色)和随机标记的集合(灰色)的所有可能的单蛋白朴素贝叶斯分类器评分(AUC)。
[0100]图1lB示出一对柱状图,其总结了使用表I所列的生物标记(黑色)和随机标记的集合(灰色)的所有可能的二蛋白蛋白朴素贝叶斯分类器评分(AUC)。
[0101]图1lC示出一对柱状图,其总结了使用表I所列的生物标记(黑色)和随机标记的集合(灰色)的所有可能的三蛋白朴素贝叶斯分类器评分(AUC)。
[0102]图12示出使用选自完全组的2-10个标记的朴素贝叶斯分类器的AUC,以及通过在分类器产生期间放弃最好的5个、10个和15个标记而获得的评分。
[0103]图13A示出一组ROC曲线,其从表14中的数据对2至5个标记的组建模。
[0104]图13B示出一组ROC曲线,其从图12A的2至5个标记的组的训练数据计算。
[0105]图14A和14B示出通过实施例5所述的贪婪选择方法选择的10个癌症生物标记(表19)与10个“非标记”生物标记的1,000个随机样品集合之间性能的比较。表19中10个癌症生物标记的平均AUC显示为虚线垂直线。在图14A中,10个“非标记”的集合随机选自实施例5所述的贪婪方法未选择的标记。在图14B中,使用与14A相同的方法;然而,采样仅限于未通过实施例5所述的贪婪方法选择的来自表I的剩余的56个间皮瘤生物标记。
[0106]图15示出表19所列的3个朴素贝叶斯分类器的接受者操作特征(ROC)曲线。对于每个研究,曲线下面积(AUC)也在图例旁边示出。
[0107]发明详沭
[0108]现在详细描述本发明的代表性实施方案。虽然本发明结合列举的实施方案进行描述,但是应理解本发明并不限于 这些实施方案。相反,本发明旨在涵盖可以包括在如权利要求书所限定的本发明范围内的所有替代、修饰和等价物。
[0109]本领域技术人员会知道与本文所述的相似或等同的许多方法和材料,其可以使用并在本发明的实践的范围内。本发明不以任何方式限制于所述方法和材料。
[0110]除非另有定义,本文所用的技术和科学术语具有本发明所属领域技术人员通常理解的相同含义。尽管与本文所述的方法、装置和材料相似或等价的任何方法、装置和材料可以用于实施或测试本发明,但是现在描述优选的方法、装置和材料。
[0111]本申请中引用的所有出版物、公开的专利文件和专利申请指示本申请所属领域的技术水平。本文引用的所有出版物、公开的专利文件和专利申请援引加入本文,与每个单独的出版物、公开的专利文件或专利申请具体地和单独地指明援引加入本文的程度相同。
[0112]如在包括所附权利要求书在内的本申请中所用,除非特别说明,单数形式一个“ (a) ”、“一个(an) ”和“这个(the) ”包括复数形式,且与“至少一个”和“一个或多个”可互换使用。因此,提及的“一个适配体”包括适配体的混合物,提及的“探针”包括探针的混合物等。
[0113]如本文所用,术语“约”表示数值的不明显更改或变化,由此该数值所涉及的项目的基本功能未改变。
[0114]如本文所用,术语“包含(comprises) ”、“包含(comprising) ”、“包括(includes) ”、“包括(including) ”、“含有(contains) ”、“含有(containing) ”及它们的任何变体意图覆盖非排他的包含,由此包含、包括或含有一个元件或者一系列元件的过程、方法、方法限定产品或组成(composition of matter)不仅包括这些元件,而且可以包括未明确列举或这样的过程、方法、方法限定产品或组成固有的其他元件。[0115]本申请包括用于检测和诊断间皮瘤和更一般的癌症的生物标记、方法、试剂、装直、系统和试剂盒。
[0116]在一方面,本发明提供了一种或多种生物标记,其单独或以各种组合用于诊断间皮瘤,允许鉴别诊断间皮瘤与暴露于石棉的个体中发现的非恶性疾病状况,监测间皮瘤复发或寻址(address)其他临床指征。如下文详细描述,示例性实施方案包括表I提供的生物标记,这些生物标记使用基于多重适配体的测定来鉴定,所述测定在实施例1中一般描述,并且在实施例2中更具体地描述。
[0117]表I列出获得自以下分析的发现:来自间皮瘤病例的几百个个体血液样品,以及来自暴露于石棉的个体的几百个等价个体血液样品。暴露于石棉的个体组设计为匹配间皮瘤诊断测试可以具有最大益处的群体,包括无症状的个体和有症状的个体。间皮瘤的高风险包括职业或环境暴露于石棉或者包括碳纳米管或纤维状硅酸盐在内的相关纤维材料以及暴露于电离福射。
[0118]潜在的生物标记在单独的样品而不是在混合疾病和对照血液中测量;这允许更好地理解与疾病(在这种情况下是间皮瘤)的存在和不存在相关的表型中个体和组的变化。由于对每个样品进行1000个以上的蛋白测量,并且单独测量来自每个疾病和对照群体的几百个样品,所以表I得自非常大的数据集合的分析。使用本文“生物标记的分类和疾病评分计算”章节中描述的方法分析测量结果。表I列出发现可用于区分得自患有间皮瘤的个体的样品与得自暴露于石棉的个体的“对照”样品的66个生物标记。
[0119]虽然某些所述间皮瘤生物标记可单独用于检测和诊断间皮瘤,但是本文还描述了间皮瘤生物标记的多个子集的分组方法,其中每个分组或者子集选择可作为一组三个或更多个生物标记使用,这在本文中可互换地称为“生物标记组”和一组。因此,本申请的各个实施方案提供了包含N个生物标记的组合,其中N是至少2个生物标记。在其他实施方案中,N选自2-66个生物标记。
[0120]在其他实施方案中 ,N选自2-5、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、
2-50、2-55、2-60或2-66中的任意数。在其他实施方案中,N选自3-5、3-10、3-15、3_20、
3-25、3-30、3-35、3-40、3-45、3-50、3-55、3-60或 3-66 中的任意数。在其他实施方案中,N选自 4-5、4-10、4-15、4-20、4-25,4-30、4-35,4-40、4-45、4-50、4-55,4-60 或 4-66 中的任意数。在其他实施方案中,N选自 5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、
5-60或5-66中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、
6-40、6-45、6-50、6-55、6-60或6-66中的任意数。在其他实施方案中,N选自7_10、7_15、
7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55、7-60或 7-66 中的任意数。在其他实施方案中,N选自 8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55、8-60 或 8-66 中的任意数。在其他实施方案中,N选自 9-10、9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55、
9-60或9-66中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、10-30、10-35、
10-40、10-45、10-50、10-55、10-60或10-66中的任意数。应当理解N可以选自包含类似但更闻级的范围。
[0121]在一实施方案中,可用于生物标记子集或组的生物标记的数目基于生物标记值的特定组合的灵敏性和特异性值。本文所用术语“灵敏性”和“特异性”是关于基于在个体的生物学样品中检测的一个或多个生物标记值来正确分类个体患有间皮瘤或不患有间皮瘤的能力。“灵敏性”指生物标记或多个生物标记关于正确分类患有间皮瘤的个体的性能。“特异性”指生物标记或多个生物标记关于正确分类不患有间皮瘤的个体的性能。例如,用于测试一组对照样品和间皮瘤样品的一组标记的85%特异性和90%灵敏性指85%的对照样品由该组正确分类为对照样品,并且90%的间皮瘤样品由该组正确分类为间皮瘤样品。期望或优选的最小值可以如实施例3所述确定。代表性组如表4-11所示,其示出一系列3-10个生物标记的100个不同的组,其具有所示的每组的特异性和灵敏性水平。这些组的每个中每个标记出现的总数目在表12示出。
[0122]在一方面,在个体中通过以下方法检测或诊断间皮瘤:对来自所述个体的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于生物标记⑶H1、BMPER或F9中的至少一个以及选自表I的生物标记列表的至少N个额外的生物标记,其中N等于2、
3、4、5、6、7、8或9。在另一方面,在个体中通过以下方法检测或诊断间皮瘤:对来自所述个体的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于生物标记⑶H1、BMPER或F9以及选自表I的生物标记列表的至少N个额外的生物标记之一,其中N等于1、
2、3、4、5、6或7。在另一方面,在个体中通过以下方法检测或诊断间皮瘤:对来自所述个体的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于生物标记⑶Hl以及选自表I的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8或
9。在另一方面,在个体中通过以下方法检测或诊断间皮瘤:对来自所述个体的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于生物标记BMPER以及选自表I的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8或9。在另一方面,在个体中通过以下方法检测或诊断间皮瘤:对来自所述个体的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于生物标记F9以及选自表I的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8或9。
[0123]本文鉴定的间皮瘤生物标记表示较大数目的可以用于有效检测或诊断间皮瘤的生物标记的子集或组的 选择。期望数目的这类生物标记的选择取决于所选生物标记的特定组合。重要的是记住:用于检测或诊断间皮瘤的生物标记的组还可以包括在表I中未发现的生物标记,并且包括在表I中未发现的额外的生物标记可以减少选自表I的特定子集或组中的生物标记的数目。如果额外的生物医学信息与生物标记值联合用于建立对于给定测定可接受的灵敏性和特异性值,则用于子集或组的来自表I的生物标记的数目也可以减少。
[0124]可以影响用于生物标记的子集或组的生物标记数目的另一因素是用于从进行间皮瘤诊断的个体中获得生物学样品的方法。在精心控制的样品获取环境中,满足期望的灵敏性和特异性值所必需的生物标记的数目会低于在样品收集、处理和贮存中可以存在更多变化的情况中的数目。在研究表I所列的生物标记列表中,利用多个样品收集位点来收集数据以进行分类器训练。这提供了更稳健的生物标记,其对于样品收集、处理和贮存中的变化较不敏感,但是如果训练数据全部在非常相似的条件下获得,则还可以要求子集或组中更大的生物标记数目。
[0125]本申请的一方面可以参考图1A和IB来一般性描述。生物学样品获得自所关注的一个或多个个体。然后测定该生物学样品以检测所关注的一个或多个(N个)生物标记的存在,并且确定所述N个生物标记的每一个的生物标记值(在图1B中称为标记RFU)。一旦检测生物标记并指定生物标记值,则如本文详细描述地对每个标记进行评分或者分类。然后组合标记评分以提供总诊断评分,其表示获取样品的个体患有间皮瘤的似然性。
[0126]“生物学样品”、“样品”和“测试样品”在本文中可互换使用,指获得自或以另外的方式源自个体的任何材料、生物液体、组织或者细胞。这包括血液(包括全血、白细胞、夕卜周血单核细胞、血沉棕黄层(buffy coat)、血楽;和血清)、痰、泪液、粘液、洗鼻液(wash)、鼻抽吸物(aspirate)、呼吸物(breath)、尿、精液、唾液、腹腔灌洗液、腹水、囊液、脑膜液(meningeal fluid)、羊水、腺体液(glandular fluid)、胰液、淋巴液、胸膜液、细胞学液、乳头抽吸物、支气管抽吸物、支气管刷检(brushing)、滑液、关节抽吸物、器官分泌物、细胞、细胞提取物和脑脊液。其还包括上述所有材料的实验分离级分。例如,血液样品可以分级分离为血清、血衆或者含有诸如红细胞或白细胞(white blood cell)(白细胞(leukocyte))的特定类型血细胞的级分。如果需要,样品可以是来自个体的样品的组合,如组织与液体样品的组合。术语“生物学样品”还包括含有均质固体材料的材料,如来自粪便样品、组织样品或组织活检样品的材料。术语“生物学样品”还包括源自组织培养或者细胞培养的材料。可以采用获得生物学样品的任何合适方法;示例性方法包括如静脉切开放血术、拭子(如口腔拭子)以及细针抽吸活检方法。易受细针抽吸影响的示例性组织包括淋巴结、肺、肺洗液、BAL(支气管肺泡灌洗液)、胸膜、甲状腺、乳腺、胰和肝。样品还可以通过显微切割(如激光捕获显微切割(LCM)或激光显微切割(LMD))、膀胱冲洗、涂片(如PAP涂片)或导管灌洗收集。获得自或源自个体的“生物学样品”包括在获得自所述个体之后已经通过任何合适方式处理的任何此类样品。
[0127]此外,应当认识到生物学样品可以通过从许多个体中取得生物学样品并将它们混合或混合每个个体的生物学样品的等份而获得。混合的样品可以作为来自单个个体的样品进行处理,并且如果在混合的样品中确定癌症的存在,则可以将每个个体的生物学样品再进行测试以确定哪个/哪些个体患有间皮瘤。
[0128]为了本说明书的目的,短语“归因于来自个体的生物学样品的数据”指所述数据以某种形式源自所述个体的生物学样品或利用所述个体的生物学样品产生。数据在产生后可以被重新格式化、修改或以数 学方式改变至某种程度,例如通过从一种测量系统中的单位转变为另一测量系统中的单位;但是应当理解,数据源自所述生物学样品或利用所述生物学样品产生。
[0129]“靶标”、“靶分子”和“分析物”在本文中可互换使用,指可能存在于生物学样品中的任何所关注的分子。“所关注的分子”包括特定分子的任何微小变化,如在蛋白的情况下,例如氨基酸序列的微小变化、二硫键形成、糖基化、脂质化、乙酰化、磷酸化或者任何其他操作或修饰,如与基本不改变分子同一性的标记组分偶联。“靶分子”、“靶标”或“分析物”是一种类型或种类的分子或多分子结构的一组拷贝。“靶分子”、“靶标”和“分析物”指一组以上这样的分子。示例性靶分子包括蛋白、多肽、核酸、碳水化合物、脂质、多糖、糖蛋白、激素、受体、抗原、抗体、自身抗体、affybodies、抗体模拟物(mimic)、病毒、病原体、毒性物质、底物、代谢物、过渡态类似物、辅因子、抑制剂、药物、染料、营养素、生长因子、细胞、组织以及前述任何物质的任何片段或部分。
[0130]如本文所用,“多肽”、“肽”和“蛋白”在本文中可互换使用,指任何长度的氨基酸聚合物。聚合物可以是线性或支化的,其可以包含修饰的氨基酸,并且其可以被非氨基酸中断。该术语还涵盖已经被天然修饰或者通过干预修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或者任何其他操作或修饰,如与标记组分偶联。该定义还包括例如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。多肽可以是单链或缔合(associated)链。该定义还包括前蛋白和完整的成熟蛋白;源生自成熟蛋白的肽或多肽;蛋白的片段;剪接变体;蛋白的重组形式;具有氨基酸修饰、缺失或取代的蛋白变体;消化;以及翻译后修饰,如糖基化、乙酰化、磷酸化等。
[0131]如本文所用,“标记”和“生物标记”可互换使用,指指示个体中正常或异常过程或者个体中疾病或其他疾病状况的迹象或者是个体中正常或异常过程或者个体中疾病或其他疾病状况的迹象的靶分子。更具体地,“标记”或“生物标记”是与无论正常与否的特定生理状态或过程的存在相关的解剖学、生理学、生物化学或分子参数,并且如果是异常的,则无论是慢性或急性的。生物标记可以通过各种方法检测和测量,包括实验室测定和医学成像。当生物标记是蛋白时,还可以使用相应基因的表达作为生物学样品中相应蛋白生物标记的量或存在或不存在或者编码该生物标记的基因或控制该生物标记表达的蛋白的甲基化状态的替代测量。
[0132]如本文所用,“生物标记值”、“值”、“生物标记水平”和“水平”可互换使用,指使用任何分析方法来检测生物学样品中的生物标记而进行的测量,其示出所述生物学样品中的生物标记、对于所述生物标记或对应于所述生物标记的存在、不存在、绝对量或浓度、相对量或浓度、效价、水平、表达水平、测量水平的比率等。所述“值”或“水平”的确切性质取决于用于检测生物标记的特定分析方法的具体设计和组分。
[0133]当生物标记表示个体中异常过程或疾病或其他疾病状况或者是个体中异常过程或疾病或其他疾病状况的迹象时,该生物标记通常描述为与表示个体中正常过程或不存在疾病或其他疾病状况或者是个体中正常过程或不存在疾病或其他疾病状况的迹象的生物标记的表达水平或值相比时是过表达或低表达的。“上调”、“上调的”、“过表达”、“过表达的”及其任何变体可互换使用,指生物学样品中生物标记的值或水平高于通常在来自健康或正常个体的相似生物学样品中检测的所述生物标记的值或水平(或者值或水平的范围)。该术语还可以指生物学样品中生物标记的值或水平高于在特定疾病的不同阶段可以检测的生物标记的值或水平(或者值或水平`的范围)。
[0134]“下调”、“下调的”、“低表达”或“表达低的”及其任何变体可互换使用,指生物学样品中生物标记的值或水平低于通常在来自健康或正常个体的相似生物学样品中检测的生物标记的值或水平(或者值或水平的范围)。该术语还可以指生物学样品中生物标记的值或水平低于在特定疾病的不同阶段可以检测的生物标记的值或水平(或者值或水平的范围)。
[0135]此外,过表达的或低表达的生物标记还可以指与所述生物标记的“正常”表达水平或值相比是“差异表达的”或者具有“不同水平”或“不同值”,所述“正常”表达水平或值表示个体中正常过程或不存在疾病或其他疾病状况或者是个体中正常过程或不存在疾病或其他疾病状况的迹象。因此,生物标记的“差异表达”还可以指与所述生物标记的“正常”表达水平不同。
[0136]术语“差异基因表达”和“差异表达”可互换使用,指在患有指定疾病的对象中基因(或其相应的蛋白表达产物)的表达被激活至相对于其在正常或对照对象中的表达较高或较低的水平。该术语还包括基因(或其相应的蛋白表达产物)的表达在相同疾病的不同阶段被激活至较高或较低水平。还应当理解差异表达的基因可以在核酸水平或蛋白水平激活或抑制,或者可以进行可变剪接以获得不同的多肽产物。这样的差异可以通过许多改变来证实,包括多肽的mRNA水平、表面表达、分泌或其他分配(partitioning)。不同的基因表达可以包括比较两个或更多个基因或者它们的基因产物之间的表达;或者比较两个或更多个基因或者它们的基因产物之间的表达的比率;或者甚至比较相同基因的两种不同加工的产物,其在正常对象与患病对象之间或者在相同疾病的不同阶段之间是不同的。差异表达包括在例如正常和患病细胞或者经历不同疾病事件或疾病阶段的细胞中的基因或其表达产物在时间或细胞表达模式中的定量以及定性的差异。
[0137]如本文所用,“个体”指测试对象或患者。个体可以是哺乳动物或非哺乳动物。在许多实施方案中,个体是哺乳动物。哺乳动物个体可以是人或非人。在许多实施方案中,个体是人。健康或正常个体是其中通过常规诊断方法不可检测出所关注的疾病或疾病状况(包括例如胸膜和腹膜间皮疾病、胸膜异常相关疾病或者其他胸膜异常疾病状况)的个体。
[0138]“诊断(Diagnose) ”、“诊断(diagnosing) ”、“诊断(diagnosis) ”及其变体指基于个体相关的一种或多种迹象、症状、数据或其他信息对所述个体的健康状态或疾病状况的检测、确定或识别。个体的健康状态可以诊断为健康/正常(即诊断为不存在疾病或疾病状况)或者诊断为患病/异常(即诊断为存在疾病或疾病状况或者对疾病或疾病状况的特征的评价)。对于特定疾病或疾病状况,术语“诊断(diagnose) ”、“诊断(diagnosing)”、“诊断(diagnosis)”等涵盖对疾病的初始检测;对疾病的表征或分类;疾病的进展、缓解或复发的检测;以及在给予个体治疗或疗法后疾病应答的检测。间皮瘤的诊断包括区分患有癌症与不患有癌症的个体。其还包括区分暴露于石棉的个体与间皮瘤。
[0139]“预后(Prognose) ”、“预后(prognosing) ”、“预后(prognosis) ”及其变体指预测患有疾病或疾病状况的个体中所述疾病或疾病状况的未来进程(如预测患者存活),并且这类术语涵盖在给予·个体治疗或疗法后评价疾病的应答。
·[0140]“评价(Evaluate) ”、“评价(evaluating) ”、“评价(evaluation) ” 及其变体涵盖“诊断”和“预后”,并且还涵盖对不患病个体的疾病或疾病状况的未来进程的确定或预测以及确定或预测在表面上已经治愈疾病的个体中所述疾病或疾病状况复发的似然性。术语“评价”还包括评价个体对疗法的应答,例如预测个体是否可能对治疗剂顺利地应答,或者不大可能对治疗剂应答(或者会例如经历毒性或其他不期望的副作用);选择给予个体的治疗剂;或者监测或确定个体对已经给予该个体的疗法的应答。因此,“评价”间皮瘤可以包括例如以下任何方面:预后个体中间皮瘤的未来进程;预测表面上已经治愈间皮瘤的个体中间皮瘤的复发;或者确定或预测个体对于间皮瘤治疗的应答;或者基于确定源自个体生物学样品的生物标记值来选择给予该个体的间皮瘤治疗。
[0141]任何如下实例均可以称作“诊断”或“评价”间皮瘤:最初检测间皮瘤的存在或不存在;确定间皮瘤的具体阶段、类型或亚型或者其他分类或特征;确定可疑的胸膜异常是否为良性或恶性间皮瘤;或者检测/监测间皮瘤进展(如监测肿瘤生长或转移扩散)、缓解或复发。
[0142]如本文所用,“额外的生物医学信息”指除了使用本文所述的任何生物标记之外的对个体所做的与癌症风险或更具体地与间皮瘤风险相关的一个或多个评价。“额外的生物医学信息”包括任何以下方面:个体的物理描述(physical descriptor),包括通过任何具有三维重建的对比增强的多层(多检测器)螺旋计算机断层扫描(CT)、胸部X-射线、PET扫描、超声、磁共振成像(MRI)观察到的腹膜或胸膜异常或积液;石棉暴露史;肺活量测定法测量;个体的身高和/或体重;体重变化;个体的种族;职业史;间皮瘤(或其他癌症)的家族史;个体或家族成员中与间皮瘤(或其他癌症)的高风险相关的遗传标记的存在;胸膜异常的存在或不存在;胸膜异常的大小;胸膜异常的位置;胸膜异常和相关胸膜异常区域的形态学(例如通过成像观察的);临床症状如呼吸困难、胸痛、可触知的胸壁肿块、胸腔积液、朝向恶性一侧的脊柱侧凸、体重减轻;基因表达值;个体的物理描述,包括通过放射成像观察到的物理描述;个体的身高和/或体重;个体的性别;个体的种族;吸烟史;职业史;暴露于已知的致癌物(如暴露于任何石棉、氡气、化学品、来自火的烟以及空气污染,这可以包括来自静止或移动来源的排放物,如工业/工厂或汽车/海运/飞机排放物);暴露于二手烟;以及间皮瘤或其他癌症的家族史。生物标记水平的测试联合任何额外的生物医学信息的评价,包括其他实验室测试(例如,间皮素、可溶性间皮素相关肽或骨桥蛋白的浓度)与单独测试生物标记或单独评价额外的生物医学信息的任何特定项目(例如,单独的超声成像)相比,可以例如改善检测间皮瘤(或其他间皮瘤相关用途)的灵敏性、特异性和/或AUC。额外的生物医学信息可以通过使用本领域已知的常规技术得自个体,如通过使用常规患者问卷调查或健康史问卷调查等得自个体自身,或者得自医学从业人员等。生物标记水平的测试联合任何额外的生物医学信息的评价与单独测试生物标记或单独评价额外的生物医学信息的任何特定项目(如单独的CT成像)相比,可以例如改善检测间皮瘤(或其他间皮瘤相关用途)的灵敏性、特异性和/或AUC。
[0143]术语“曲线下面积”或“AUC”指接受者操作特征(ROC)曲线下的面积,这两个术语均为本领域所熟知。AUC测量可用于比较完整数据范围内的分类器的精确性。具有较大AUC的分类器具有较大的能力来正确分类两个所关注的组(如间皮瘤样品与正常或对照样品)之间的未知情况。ROC曲线可以用于对特定特征的性能作图(如本文描述的任何生物标记和/或任何额外的生物医学信息项目 ),以在两个群体之间进行区分(如患有间皮瘤的病例与无间皮瘤的对照)。通常,整个群体(如病例与对照)的特征数据基于单个特征的值递增分类。然后,对于该特征的每个值,计算数据的真阳性率和假阳性率。真阳性率通过计数高于该特征值的病例数,然后除以病例总数来确定。假阳性率通过计数高于该特征值的对照数,然后除以对照总数来确定。尽管这个定义指其中特征在病例中与在对照中相比升高的情况,但是这个定义还适用于其中特征在病例中与在对照中相比降低的情况(在这种情况下,计数低于该特征值的样品)。ROC曲线可以对单个特征以及其他单个输出产生,例如两个或更多个特征的组合可以是数学组合(如加、减、乘等)以提供单个的和值,并且该单个的和值可以在ROC曲线中绘制。此外,其中组合产生单个输出值的多个特征的任何组合可以在ROC曲线中绘制。这些特征的组合可以包括测试。ROC曲线是测试的真阳性率(灵敏性)对该测试的假阳性率(1-特异性)的作图。
[0144]如本文所用,“检测”或“确定”生物标记值包括使用观察和记录对应于生物标记值的信号所需的设备以及产生该信号所需的材料。在各种实施方案中,生物标记值使用任何合适的方法检测,包括荧光、化学发光、表面等离子共振、表面声波、质谱、红外线光谱、拉曼光谱、原子力显微术、扫描隧道显微术、电子化学检测方法、核磁共振、量子点等。[0145]“固体支持物”在本文中指具有分子可以直接或间接,通过共价键或非共价键附着的表面的任何支持物。“固体支持物”可以具有各种物理形式,可以包括例如膜;芯片(如蛋白芯片);玻片(如载玻片或盖玻片);柱;空心、固体、半固体、有孔或有腔的颗粒,例如珠;凝胶;纤维,包括光学纤维材料;基质;以及样品容器。示例性样品容器包括样品孔、管、毛细管、小瓶以及能够容纳样品的任何其他容器、沟槽或凹陷。样品容器可以包含于多样品平台上,如微量滴定板、玻片、微流体装置等。支持物可以由天然或合成材料、有机或无机材料组成。其上附着捕获剂的固体支持物的成分通常取决于附着方法(如共价附着)。其他示例性容器包括微滴和微流体控制的或大量的油/水性乳液,在其中可以进行测定和相关操作。合适的固体支持物包括例如塑料、树脂、多糖、硅石或基于硅石的材料、官能化玻璃、改性的硅、碳、金属、无机玻璃、膜、尼龙、天然纤维(例如丝、羊毛和棉)、聚合物等。包含固体支持物的材料可以包含反应基团,例如羧基、氨基或羟基以用于捕获剂的附着。聚合固体支持物可以包括如聚苯乙烯、聚对苯二甲酸乙二醇酯、聚乙酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、聚甲基丙烯酸甲酯、聚四氟乙烯、丁基橡胶、苯乙烯丁二烯橡胶、天然橡胶、聚乙烯、聚丙烯、(聚)四氟乙烯、(聚)偏氟乙烯、聚碳酸酯和聚甲基戊烯。可以使用的合适的固体支持物颗粒包括例如编码的颗粒,如Luminex-型编码的颗粒、磁性颗粒以及玻璃颗粒。
[0146]生物标记的示例性用途
[0147]在许多示例性实施方案中,本发明提供了诊断个体的间皮瘤的方法,所述方法通过检测对应于个体的循环如血清或血浆中存在的一个或多个生物标记的一个或多个生物标记值来进行,并且通过任何数目的分析方法来进行,包括本文所述的任何分析方法。这些生物标记例如在间皮瘤个体中与在无间皮瘤个体相比差异表达。生物标记在个体中的差异表达的检测可以用于例如允许间皮瘤的早期诊断,区分良性和恶性团块(例如,在计算机断层扫描(CT)、胸部X-射线、MRI或超声上观察到的团块),监测间皮瘤复发,或者用于鉴别诊断其他临床疾病状况如暴露于石棉的个体。
[0148]本文所述的任何生物标记可以用于间皮瘤的各种临床指征,包括以下任何方面:检测间皮瘤(例如在高风险个体或群体中);表征间皮瘤(例如,确定间皮瘤类型、亚型或阶段),如通过区分间皮瘤与暴露于石棉的个体和/或区分间皮瘤与腺癌与其他恶性细胞类型(或者以其他方式促进组织病理学);确定胸膜异常或团块是否为良性或恶性;确定间皮瘤预后;监测间皮瘤进展或缓解;监测间皮瘤复发;监测转移;治疗选择;监测对治疗剂或其他治疗的应答;对个体的胸部CT分层(stratification)(例如,鉴定面临较高间皮瘤风险从而最可能受益于放射学筛查的那些个体,因此增加胸部CT的阳性预测值);组合生物标记测试与额外的生物医学信息如石棉暴露史,指示间皮瘤的较高风险的遗传标记的存在等,或者与团块大小,形态学,腹水的存在等(例如以提供与其他实验室测试或者与团块大小、形态学等相比具有增加的诊断性能的测定);促进胸膜异常为恶性或良性的诊断;促进一旦在CT、MR1、PET或US上观察到胸膜异常则作出临床决定(例如,如果认为胸膜异常是低风险的,例如如果基于生物标记的测试是阴性的,则进行重复放射扫描,或者如果认为胸膜异常是中高风险的,例如如果基于生物标记的测试是阳性的,有或无胸膜异常的分类或组织侵袭程度,则考虑活组织检查);以及促进关于临床随访的决定(例如,在成像上观察到胸膜异常后是否进行重复放射成像扫描、细针活组织检查、辐射、全身治疗或手术)。生物标记测试可以单独提高高风险个体的CT或胸部X-射线筛查的阳性预测值(PPV)。除了联合CT筛查之外,本文所述的生物标记还可以与用于与间皮瘤的任何其他成像方式如胸部X-射线、MRI或PET扫描联合使用。此外,所述生物标记还可以用于在通过成像方式或其他临床相关性检测间皮瘤指征之前或者在症状出现之前允许这些应用的某一些。其还包括区分暴露于石棉的个体与间皮瘤。
[0149]本文所述的任何生物标记可以用于诊断间皮瘤的示例性方式是:未知患有间皮瘤的个体中一个或多个所述生物标记的差异表达可以表明该个体患有间皮瘤,从而使得可以在治疗最有效的疾病早期检测间皮瘤,也许在通过其他方式检测间皮瘤之前或者在症状出现之前检测间皮瘤。间皮瘤期间一个或多个生物标记的过表达可以指示间皮瘤的进展,如间皮瘤生长和/或转移(并且因此提示不良预后);而一个或多个生物标记差异表达程度的降低(即在随后的生物标记测试中,个体中的表达水平趋向或接近“正常”表达水平)可以指示间皮瘤的缓解,如间皮瘤缩小(并且因此提示良好或较好的预后)。相似地,在间皮瘤治疗期间一个或多个生物标记差异表达的程度增加(即在随后的生物标记测试中,个体中的表达水平进一步远离“正常”表达水平)可以指示间皮瘤正在发展,并因此表示所述治疗是无效的;而在间皮瘤治疗期间一个或多个生物标记的差异表达降低可以指示间皮瘤的缓解,并因此表示该治疗是成功的。此外,在个体看起来已经治愈间皮瘤之后一个或多个生物标记的差异表达的增加或降低可以指示间皮瘤的复发。在这种情况下,例如可以在早期对个体重新启动治疗(或者如果个体维持治疗,则修改治疗方案以增加剂量和/或频率),否则直至晚期还未检测到间皮瘤的复发。此外,个体中一个或多个生物标记的差异表达水平可以预测个体对特定治疗剂的应答。在监测间皮瘤复发或进展中,生物标记表达水平的改变可以指示需要重复成像,例如来确定间皮瘤活性或确定需要改变治疗方案。
[0150]本文所述的任何生物标记的检测可以特别地在间皮瘤治疗后使用或者与间皮瘤治疗联合使用,如评价治疗的成功或者监测治疗后间皮瘤的缓解、复发和/或进展(包括转移)。间皮瘤治疗可以包括例如给予个体治疗剂、进行手术(如手术切除至少一部分间皮瘤或者去除间皮瘤和周围组织)、给予放疗或本领域所用的任何其他类型的间皮瘤治疗方法以及这些治疗的任意组合。例如,任何生物标记可以在治疗后检测至少一次,或者可以在治疗后检测多次(如定期检测),或者可以在治疗之前和之后检测。个体中任何生物标记随时间的差异表达水平可以 指示间皮瘤的进展、缓解或复发,其实例包括任何以下方面:生物标记的表达水平在治疗后与治疗前相比增加或降低;生物标记的表达水平在治疗后较晚时间点与治疗后较早时间点相比增加或降低;以及生物标记的表达水平在治疗后的一个时间点与该生物标记的正常水平相比不同。
[0151]作为具体的实例,本文所述的任何生物标记的生物标记水平可以在手术前和手术后(例如手术后2-16周)的血清或血浆样品中确定。手术后样品与手术前样品相比生物标记表达水平的增加可以指示间皮瘤的进展(如不成功的手术);而手术后样品与手术前样品相比生物标记表达水平的降低可以指示间皮瘤的消退(如成功除去间皮瘤的手术)。生物标记水平的相似分析可以在其他形式的治疗之前和之后进行,如在放疗或者给予治疗剂或癌症疫苗之前和之后进行。
[0152]除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平还可以联合SNP或者指示疾病易感性风险增加的其他遗传病变或变异性的确定来进行。(参见,例如,Amos et al., Nature Genetics40,616-622(2009))。
[0153]除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平还可以联合放射筛查进行。除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平还可以联合相关症状或遗传测试进行。本文所述的任何生物标记的检测可以在已通过成像观察到胸膜异常或团块之后用来辅助诊断间皮瘤并指导适当的个体临床护理,包括由适当的外科专家护理或者在不可切除的患者中通过姑息疗法来护理。除了联合相关症状或风险因素测试生物标记水平,关于生物标记的信息还可以联合其他类型的数据来评价,特别是指示个体的间皮瘤风险的数据(例如,患者临床史、职业暴露、症状、间皮瘤的家族史、石棉暴露史、吸烟、风险因素如存在遗传标记、和/或其他生物标记的状态等)。这些不同数据可以通过自动化方法评价,如计算机程序/软件,其可以在计算机或其他设备/装置中实施。
[0154]除了在高风险个体中联合放射筛查测试生物标记水平之外(如联合在成像扫描上观察到的胸膜异常或团块的大小或其他特征评价生物标记水平),关于生物标记的信息还可以联合其他类型的数据进行评价,特别是指示个体的间皮瘤风险的数据(例如,患者临床史、职业暴露史、症状、癌症家族史、风险因素如个体是否暴露于石棉和/或其他生物标记的状况等)。这些不同数据可以通过自动化方法评价,如计算机程序/软件,其可以在计算机或其他设备/装置中实施。
[0155]任何所述生物标记还可以用于成像测试。例如,显像剂可以与任何所述生物标记偶联,这可以用于辅助间皮瘤诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。
[0156]生物标记和生物标记值的检测和确定
[0157]本文所述的生物标记的生物标记值可以使用任何已知的分析方法来检测。在一实施方案中,生物标记值使用捕获试剂(capture reagent)检测。如本文所用,“捕获剂(capture agent) ”或“捕获试剂”指能够特异性结合生物标记的分子。在许多实施方案中,捕获试剂可以在溶液中暴 露于生物标记,或者可以暴露于生物标记,同时该捕获试剂固定在固体支持物上。在其他实施方案中,捕获试剂含有与固体支持物上的第二特征反应的特征。在这些实施方案中,捕获试剂可以在溶液中暴露于生物标记,然后该捕获试剂上的特征可以联合固体支持物上的第二特征来将所述生物标记固定在固体支持物上。捕获试剂基于进行的分析类型加以选择。捕获试剂包括但不限于适配体、抗体、抗原、adnectin、锚蛋白、其他抗体模拟物(mimetic)及其他蛋白支架、自身抗体、嵌合物、小分子、F(ab ' )2片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体(nanobodies)、印迹聚合物(imprinted polymer)、高亲合性多聚体(avimer)、肽模拟物(peptidomimetic)、激素受体、细胞因子受体及合成受体以及这些物质的修饰物和片段。
[0158]在一些实施方案中,生物标记值使用生物标记/捕获试剂复合物来检测。
[0159]在其他实施方案中,生物标记值得自生物标记/捕获试剂复合物,并且例如作为生物标记/捕获试剂相互作用之后的反应结果间接检测,但是依赖于生物标记/捕获试剂复合物的形成。
[0160]在一些实施方案中,生物标记值从生物学样品中的生物学标记直接检测。
[0161]在一实施方案中,生物标记使用多重形式检测,这允许在生物学样品中同时检测两个或更多个生物标记。在多重形式的一实施方案中,捕获试剂直接或间接、共价或非共价地固定在固体支持物上分散的位置。在另一实施方案中,多重形式使用分离的固体支持物,其中每个固体支持物具有与该固体支持物相关的独特捕获试剂,例如量子点。在另一实施方案中,单独的装置用于检测生物学样品中待检测的多个生物标记的每一个。可以配置单独的装置以允许同时处理生物学样品中的每个生物标记。例如,可以使用微量滴定板,由此该板中的每个孔用于独特地分析生物学样品中待检测的多个生物标记之一。
[0162]在一个或多个前述实施方案中,可以使用荧光标签(tag)来标记生物标记/捕获复合物的组分以允许检测生物标记值。在许多实施方案中,使用已知技术可以将荧光标记(fluorescent label)与对本文所述的任何生物标记特异性的捕获试剂偶联,然后该突光标记可以用于检测相应的生物标记值。合适的荧光标记包括稀土元素螯合物、荧光素及其衍生物、罗丹明及其衍生物、丹磺酰、别藻蓝蛋白、PBXL-3、Qdot605、丽丝胺(Li ssamine)、藻红蛋白、德克萨斯红及其他这样的化合物。
[0163]在一实施方案中,突光标记是突光染料分子。在一些实施方案中,突光染料分子包括至少一个取代的吲哚环(indolium ring)体系,其中吲哚环的3-碳上的取代基含有化学反应性基团或偶联的物质。在一些实施方案中,染料分子包括AlexFluor分子,例如AlexaFluor488> AlexaFluor532> AlexaFluor647> AlexaFluor680 或 AlexaFluorTOO。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,如两种不同的AlexaFluor分子。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,并且两种染料分子具有不同的发射光谱。
[0164]荧光可以用与大范围的测定形式相容的许多仪器测量。例如,已经设计了分光突光计来分析微量滴定板、显微镜载玻片、印刷阵列(printted array)、小杯等。 参见 Principles of Fluorescence Spectroscopy, by J.R.Lakowicz, SpringerScience+Business Media, Inc.,2004。 参见 Bioluminescence&Chemiluminescence:Progress&Current Applications ;Philip E.Stanley and Larry J.Kricka editors,World Scientific Publishing Company, January2002o
[0165]在一个或多个前述实 施方案中,化学发光标签可以任选地用于标记生物标记/捕获复合物的组分以允许检测生物标记值。合适的化学发光材料包括任何草酰氯、Rodamin6G、Ru (bipy) 32+> TMAE (四三(二甲基氨基)乙烯(tetrakis (dimethylamino)ethylene))、连苯三酌.(I, 2, 3_ 三轻基苯(1,2, 3-trihydroxibenzene))、光泽精、过氧草酸酯(peroxyoxalate)、芳基草酸酯、Π丫唳酯(acridinium ester)、二氧杂环丁烧(dioxetane)等。
[0166]在其他实施方案中,检测方法包括酶/底物组合,其产生对应于生物标记值的可检测信号。通常,酶催化生色底物的化学改变,这种改变可以使用多种技术测量,包括分光光度法、荧光及化学发光。合适的酶包括例如萤光素酶、萤光素、苹果酸脱氢酶、脲酶、辣根过氧化物酶(HRPO)、碱性磷酸酶、β-半乳糖苷酶、葡糖淀粉酶、溶菌酶、葡萄糖氧化酶、半乳糖氧化酶及葡萄糖-6-磷酸脱氢酶、尿酸氧化酶、黄嘌呤氧化酶、乳过氧化物酶、微过氧化物酶等。
[0167]在其他实施方案中,检测方法可以是产生可测量信号的荧光、化学发光、放射性核素或酶/底物组合的组合。多种方式的信号在生物标记测定形式中可以具有独特且有利的特征。[0168]更特别地,本文所述的生物标记的生物标记值可以使用已知的分析方法来检测,包括单重适配体测定、多重适配体测定、单重或多重免疫测定、mRNA表达谱、miRNA表达谱、质谱分析、组织学/细胞学方法等,这在下文中详细地描述。
[0169]使用基于适配体的测定确定生物标记值
[0170]检测和定量生物学样品及其他样品中生理学上有意义的分子的测定在科学研究和卫生保健领域是重要的工具。一类这样的测定包括使用包含固定在固体支持物上的一个或多个适配体的微阵列。所述适配体各自能够以高特异性方式和非常高的亲和力结合靶分子。参见例如题为“核酸配体”的美国专利第5,475,096号;还参见例如美国专利第6,242,246号、美国专利第6,458,543号和美国专利第6,503,715号,这些专利的题目均为“核酸配体诊断生物芯片”。一旦使微阵列与样品接触,则适配体结合所述样品中存在的它们各自的靶分子,从而允许确定对应于生物标记的生物标记值。
[0171 ] 如本文所用,“适配体”指对靶分子具有特异性结合亲和力的核酸。应当了解到亲和相互作用的间题关键是程度;然而在本文中,适配体对其靶标的“特异性结合亲和力”指适配体通常以与其结合测试样品中其他组分的亲和力相比更高程度的亲和力结合其靶标。“适配体”是一种类型或物种的核酸分子的一系列拷贝,其具有特定的核苷酸序列。适配体可以包含任何合适数目的核苷酸,包括任何数目的化学修饰的核苷酸。“适配体”指多于一个的这种系列的分子。不同的适配体可以具有相同或不同数目的核苷酸。适配体可以是DNA或RNA或化学修饰的核酸,并且可以是单链、双链的或者含有双链区,以及可以包含高级结构。适配体还可以是光适配体(photoaptamer),其中该适配体中包含光反应性或化学反应性官能团以允许其与其对应靶标共价连接。本文公开的任何适配体方法可以包括使用特异性结合相同靶分子的两种或更多种适配体。如下文进一步描述,适配体可以包含标签。如果适配体包含标签,则该适配体的所有拷贝不需要具有相同的标签。此外,如果不同的适配体各自包含标签,则这些不同的适配体可以具有相同的标签或者不同的标签。
[0172]适配体可以使用任何已知方法鉴定,包括SELEX方法。一旦鉴定,则可以根据任何已知方法制备或合成适配体,这些已知方法包括化学合成方法和酶促合成方法。
[0173]如本文所用,“SOMAmer”或低解离速率修饰的适配体指具有改善的解离速率特征的适配体。SOMAmer可以使用题为“产生具有改善的解离速率的适配体的方法”的美国公开第2009/0004667号所述的改进的SELEX方法来产生。
[0174]术语“SELEX”和“SELEX方法”在本文中可互换使用,通常指(I)与(2)的组合,其中(I)是选择以期望的方式与靶分子相互作用的适配体,例如以高亲和力结合蛋白,(2)是扩增那些选择的核酸。SELEX方法可以用于鉴定对特定靶标或生物标记具有高亲和力的适配体。
[0175]SELEX通常包括制备核酸的候选混合物;使所述候选混合物与期望的靶分子结合以形成亲和复合物;分离所述亲和复合物与未结合的候选核酸;使核酸与所述亲和复合物分开并分离所述核酸;纯化所述核酸;以及鉴定特异性适配体序列。所述方法可以包括多次循环以进一步精制所选适配体的亲和力。所述方法可以包括在该方法的一个或多个点的扩增步骤。参见例如题为“核酸配体”的美国专利第5,475,096号。SELEX方法可以用于产生与适配体的靶标共价结合的适配体,以及与适配体的靶标非共价结合的适配体。参见例如题为“通过指数富集的核酸配体的系统进化:Chem1-SELEX”的美国专利第5,705,337号。[0176]SELEX方法可以用于鉴定含有修饰的核苷酸的高亲和力适配体,所述修饰的核苷酸赋予该适配体改善的特征,例如改善的体内稳定性或改善的递送特征。此类修饰的实例包括核糖和/或磷酸和/或碱基位置的化学取代。通过SELEX方法鉴定的含有修饰的核苷酸的适配体描述于题为“含有修饰的核苷酸的高亲和力核酸配体”的美国专利第5,660,985号,其描述了含有在嘧啶的5'-和2'-位置处经化学修饰的核苷酸衍生物的寡核苷酸。见上文,美国专利第5,580,737号描述了高特异性适配体,其含有用2'-氨基(2' -NH2)、2'-氟(2' -F)和/或2' -O-甲基(2' -OMe)修饰的一个或多个核苷酸。还参见题为“SELEX和PH0T0SELEX”的美国专利申请公开2009/0098549,其描述了具有扩展的物理和化学性质的核酸文库及其在SELEX和photoSELEX中的用途。
[0177]SELEX还可以用于鉴定具有期望的解离速率特征的适配体。参见题为“产生具有改善的解离速率的适配体的方法”的美国专利申请公开2009/0004667,其描述了产生可以结合靶分子的适配体的改进SELEX方法。描述了产生与各自的靶分子具有较慢解离速率的适配体和光适配体的方法。所述方法包括使候选混合物与靶分子接触;允许形成核酸-靶标复合物;以及进行缓慢解离速率富集过程,其中具有快解离速率的核酸-靶标复合物解离并不再形成,而具有慢解离速率的复合物会保持完整。此外,所述方法包括在产生候选核酸混合物中使用修饰的核苷酸,以产生具有改善的解离速率性能的适配体。
[0178]这种测定的变化使用包含光反应性官能团的适配体,这允许适配体与其靶分子共价结合或“光交联”。参见例如题为“核酸配体诊断生物芯片”的美国专利第6,544,776号。这些光反应性适配体也称作光适配体。参见例如美国专利第5,763,177号、美国专利第6,001,577号和美国专利第6,291,184号,所述专利的题目均是“通过指数富集的核酸配体的系统进化:核酸配体的光选择和溶液SELEX”;还参见例如题为“核酸配体的光选择”的美国专利第6,458,539号。在使微阵列与样品接触并使光适配体具有结合其靶分子的机会之后,将该光适配体光激活并洗涤固体支持物以除去任何非特异性结合的分子。可以使用严格洗涤条件,因为结合光适配体的靶分子由于该光适配体上光激活的官能团所产生的共价键而通常未被除去。在这种方式中,测定允许检测对应于测试样品中的生物标记的生物标记值。
`[0179]在这两种测定形式中,适配体在与样品接触之前固定在固体支持物上。然而,在某些情况下,在与样品接触之前固定适配体也许无法提供最佳的测定。例如,预固定适配体可能导致适配体与靶分子在固体支持物表面上的无效混合,这可能导致漫长的反应时间及因此延长的温育时间以允许适配体与其靶分子有效结合。此外,当光适配体用于测定并且取决于用作固体支持物的材料时,该固体支持物可能趋于分散或吸收用于实现光适配体与其靶分子之间的共价键形成的光。此外,根据所用的方法,结合适配体的靶分子的检测可能不准确,因为固体支持物的表面也可能暴露于且受所用的任何标记剂的影响。最后,适配体固定在固体支持物上通常包括在适配体暴露于样品之前的适配体制备步骤(即固定),这个制备步骤可能影响适配体的活性或功能性。
[0180]还描述了适配体测定,其允许适配体在溶液中捕获其靶标,然后在检测之前使用设计为除去适配体-靶标混合物中特定组分的分离步骤(参见题为“测试样品的多重分析”的美国专利申请公开2009/0042206)。所述适配体测定方法允许检测和定量测试样品中的非核酸靶标(如蛋白靶标),这通过检测和定量核酸(即适配体)进行。所述方法产生核酸替代物(surrogate)(即适配体)以检测和定量非核酸靶标,由此允许包括扩增在内的许多核酸技术用于包括蛋白靶标在内的更大范围的期望靶标。
[0181]可以构建适配体以促进从适配体生物标记复合物(或光适配体生物标记共价复合物)分离测定组分,以及允许分离适配体以进行检测和/或定量。在一实施方案中,这些构建体可以包含适配体序列中可裂解或可释放的元件。在其他实施方案中,可以在适配体中引入额外的官能性,例如标记的或可检测的组分、间隔组分或者特异性结合标签或固定元件。例如,适配体可以包含通过可裂解部分与适配体连接的标签、标记、分隔标记与可裂解部分的间隔组分。在一实施方案中,可裂解元件是光可裂解接头(linker)。光可裂解接头可以连接至生物素部分和间隔区段,可以包含NHS基团以用于胺的衍生化,以及可以用于在适配体中弓I入生物素基团,从而允许适配体在测定方法中较晚地释放。
[0182]用溶液中所有测定组分进行的均质测定在检测信号之前不需要分离样品与试剂。这些方法是快速且易于使用的。这些方法基于分子捕获或与其特异性靶标反应的结合试剂产生信号。对于间皮瘤,分子捕获试剂是适配体或抗体等,特异性靶标是表I的间皮瘤生物标记.
[0183]在一实施方案中,一种信号产生方法利用由于荧光团-标记的捕获试剂与其特异性生物标记靶标的相互作用而导致的各向异性信号改变。当标记的捕获剂与其靶标反应时,增加的分子量导致附着于该复合物的荧光团的旋转运动变得更慢,从而改变各向异性值。通过监测各向异性改变,结合事件可以用于定量测量溶液中的生物标记。其他方法包括荧光偏振测定、分子信标方法、时间分辨荧光猝灭法、化学发光、荧光共振能量转移等。
[0184]可以用于检测对应于生物学样品中生物标记的生物标记值的基于溶液的示例性适配体测定包括以下步骤:(a)通过使所述生物学样品与适配体接触来制备混合物,所述适配体包含第一标签并具有对所 述生物标记的特异性亲和力,其中当所述样品中存在所述生物标记时形成适配体亲和复合物;(b)使所述混合物暴露于包含第一捕获元件的第一固体支持物,并且允许所述第一标签与所述第一捕获元件结合;(C)除去未与所述第一固体支持物结合的混合物的任何组分;(d)使第二标签附着于所述适配体亲和复合物的生物标记组分;(e)从所述第一固体支持物释放所述适配体亲和复合物;(f)使释放的适配体亲和复合物暴露于包含第二捕获元件的第二固体支持物,并且允许所述第二标签与所述第二捕获元件结合;(g)通过分离未复合的适配体与所述适配体亲和复合物来从所述混合物除去任何未复合的适配体;(h)从固体支持物洗脱适配体;以及(i)通过检测所述适配体亲和复合物的适配体组分来检测所述生物标记。
[0185]本领域已知的任何方法可以用于通过检测适配体亲和复合物的适配体组分来检测生物标记值。许多不同的检测方法可以用于检测亲和复合物的适配体组分,例如,杂交测定、质谱分析或QPCR。在一些实施方案中,核酸测序方法可以用于检测适配体亲和复合物的适配体组分,从而检测生物标记值。简单地说,可以使测试样品进行任何种类的核酸测序方法以鉴定和定量测试样品中存在的一种或多种适配体的序列或多个序列。在一些实施方案,序列包括整个适配体分子或者可以用来唯一地鉴定该分子的该分子的任何部分。在其他实施方案中,鉴定序列是添加至适配体的特定序列;这类序列常称为“标签”、“条形码”或“邮政编码”。在一些实施方案中,测序方法包括酶促步骤以扩增适配体序列,或者将任何种类的核酸(包括在任何位置包含化学修饰的RNA和DNA)转化为适合测序的任何其他种类的核酸。
[0186]在一些实施方案中,测序方法包括一个或多个克隆步骤。在其他实施方案中,测序方法包括没有克隆的直接测序方法。
[0187]在一些实施方案中,测序方法包括具有靶向测试样品中的一种或多种适配体的特异性引物的直接方法。在其他实施方案中,测序方法包括靶向测试样品中的所有适配体的鸟枪法。
[0188]在一些实施方案中,测序方法包括酶促步骤以扩增测序靶向的分子。在其他实施方案中,测序方法直接测序单一分子。可以用来检测对应于生物学样品中的生物标记的生物标记值的示例性基于核酸测序的方法包括以下步骤:(a)通过酶促步骤将包含化学修饰的核苷酸的适配体混合物转化为未修饰的核酸;(b)用大规模平行测序平台鸟枪测序所得的未修饰的核酸,例如454测序系统(454Life Sciences/Roche)、Illumina测序系统(Illumina)、ABI SOLiD 测序系统(Applied Biosystems)、HeliScope 单分子测序仪(Helicos Biosciences)、或 Pacific Biosciences 实时单分子测序系统(PacificBioSciences)或Polonator G测序系统(Dover Systems);以及(c)通过特异性测序和测序计数来鉴定和定量混 合物中存在的适配体。
[0189]使用免疫测定确定生物标记值
[0190]免疫测定方法基于抗体与其对应靶标或分析物的反应,并且根据特定测定形式可以检测样品中的分析物。为了改进基于免疫反应性的测定方法的特异性和灵敏性,通常由于单克隆抗体的特异性表位识别而使用单克隆抗体。多克隆抗体由于其与单克隆抗体相比增加的靶标亲和力也成功地用于各种免疫测定中。免疫测定已经设计为用于大范围生物学样品基质。免疫测定形式已经设计为提供定性、半定量和定量结果。
[0191]定量结果通过使用已知浓度的待检测的特定分析物产生的标准曲线来产生。将来自未知样品的应答或信号在标准曲线上作图,并确定该未知样品中对应于靶标的量或值。
[0192]已经设计了许多免疫测定形式。ELISA或EIA可以定量检测分析物。这种方法依赖于标记对分析物或抗体的附着,并且标记组分直接或间接包括酶。ELISA测试可以设计为直接、间接、竞争性或者夹心检测分析物。其他方法依赖于标记,如放射性同位素(1125)或荧光。其他技术包括例如凝集反应、浊度测定法、比浊法、蛋白印迹、免疫沉淀、免疫细胞化学、免疫组织化学、流式细胞术、Luminex测定等(参见ImmunoAssay:A Practical Guide,edited by Brian Law, published by Taylor&Francis, Ltd.,2005edition)。
[0193]示例性测定形式包括酶联免疫吸附测定(ELISA)、放射性免疫测定、荧光、化学发光以及荧光共振能量转移(FRET)或时间分辨的-FRET(TR-FRET)免疫测定。检测生物标记的方法的实例包括生物标记免疫沉淀及随后允许辨别大小和肽水平的定量方法,如凝胶电泳、毛细管电泳、平面电色谱等。
[0194]检测和/或定量可检测标记或信号产生材料的方法取决于所述标记的性质。由合适的酶催化的反应产物(其中所述可检测标记是酶;见上文)可以是但不限于荧光、发光或放射性的,或者它们可以吸收可见光或紫外光。适合于检测这样的可检测标记的检测仪的实例包括但不限于X光照片、放射性计数器、闪烁计数器、分光光度计、比色计、荧光计、发光计和光密度计。
[0195]可以通过允许任何适当准备、处理和分析反应的任何方式来进行任何检测方法。这可以例如在多孔测定板(如96孔或384孔)中进行,或者使用任何合适的阵列或微阵列进行。可以人工或自动化制备各种试剂的储液,使用能够检测可检测标记的可商购的分析软件、机器人技术和检测仪器自动化进行所有随后的移液、稀释、混合、分配、洗涤、温育、样品读取、数据收集和分析。
[0196]使用基因表达谱确定生物标记值
[0197]测量生物学样品中的mRNA可以用作检测该生物学样品中相应的蛋白水平的替代。因此,本文所述的任何生物标记或生物标记的组还可以通过检测适当的RNA来检测。
[0198]mRNA表达水平通过逆转录定量聚合酶链式反应(RT-PCR及随后的qPCR)测量。RT-PCR用于从mRNA产生cDNA。cDNA可以用于qPCR测定以随DNA扩增过程的进展而产生荧光。通过与标准曲线比较,qPCR可以产生绝对测量度,如每细胞的mRNA拷贝数。RNA印迹、微阵列、Invader测定以及与毛细管电泳组合的RT-PCR全部已经用于测量样品中mRNA的表达水平° 参见 Gene Expression Profiling:Methods and Protocols, Richard A.Shimkets,editor,Humana Press,2004。
[0199]miRNA分子是小RNA,其不编码但是可以调节基因表达。适合测量mRNA表达水平的任何方法均可以用于相应的miRNA。最近,许多实验室已经研究了 miRNA作为疾病的生物标记的用途。许多疾病涉及广泛的转录调节,并且毫不意外地发现miRNA可以作为生物标记。miRNA浓度与疾病之间的关联通常不如蛋白水平与疾病之间的关联明确,但是miRNA生物标记值可能是重要的。当然,随着疾病期间任何RNA的不同表达,开发体外诊断产品所面临的问题包括需要miRNA在患病细胞中存活及易于提取以进行分析,或者miRNA被释放进入血液或其他基质中,在此它们必须存活足够长的时间以进行测量。蛋白生物标记具有相似的要求,尽管许多潜在的蛋白生物标记以旁分泌方式在疾病期间于病变和功能部位有意地分泌。许多潜在的蛋白生物标记设计为在合成那些蛋白的细胞外起作用。
[0200]使用体内分子成像技术检测分子标记
[0201]任何所述的生 物标记(见表I)还可以用于分子成像测试。例如,显像剂可以与任何所述生物标记偶联,这可以用于辅助间皮瘤诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。
[0202]体内成像技术提供了用于确定个体体内特定疾病状态的非侵入性方法。例如,身体的所有部分或者甚至整个身体均可以作为三维图像观察,从而提供关于身体内形态学和结构的有价值的信息。这样的技术可以与检测本文所述的生物标记组合以提供关于个体的癌症状态,特别是间皮瘤状态的息。
[0203]体内分子成像技术的应用由于该技术的各种进展而得以扩展。这些进展包括新造影剂或标记的开发,如放射性标记和/或荧光标记,其可以在身体内提供强信号;以及开发更强的新成像技术,其可以从身体外部检测和分析这些信号,并且具有足够的灵敏性和精确度以提供有用的信息。造影剂可以在适当的成像系统中观察,从而提供所述造影剂所处位置的身体部分或多个部分的图像。造影剂可以与捕获试剂结合或缔合,例如适配体或抗体,例如和/或结合或缔合肽或蛋白,或寡核苷酸(例如为了检测基因表达),或者复合物,所述复合物含有任何这些物质及一种或多种大分子和/或其他颗粒形式。
[0204]造影剂还是可用于成像的放射性原子的特征。对于闪烁照相研究,合适的放射性原子包括锝-99m或碘-123。其他易于检测的部分包括例如磁共振成像(MRI)的自旋标记物,如碘-123、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、钆、锰或铁。这样的标记为本领域熟知,并且可以由本领域技术人员容易地选择。
[0205]标准成像技术包括但不限于磁共振成像、计算机断层扫描、正电子发射断层扫描(PET)、单光子发射计算机断层扫描(SPECT)等。对于诊断性体内成像,可用的检测设备的类型是选择指定造影剂的主要因素,如用于靶标(蛋白、mRNA等)的指定放射性核素和特定生物标记。所选的放射性核素通常具有通过指定类型设备可检测的衰变类型。此外,当选择用于体内诊断的放射性核素时,其半衰期应当足够长以允许在靶组织最大吸收时进行检测,但是也应当足够短,以最小化宿主所受的有害辐射。
[0206]示例性成像技术包括但不限于PET和SPECT,这是将放射性核素全身(synthetically)或局部地给予个体的成像技术。随后,随时间测量放射性示踪剂的吸收,并用于获得关于靶向的组织与生物标记的信息。由于所用的特定同位素的高能(Y-射线)发射以及用于检测它们的设备的灵敏性和完善(sophistication),可以从身体外部推导出放射性的二维分布。
[0207]PET中常用的正电子发射核素包括例如碳-11、氮-13、氧-15和氟-18。通过电子捕获和/或Y-发射衰变的同位素用于SPECT中,并且包括例如碘-123和锝-99m。用锝-99m标记氨基酸的示例性方法是在螯合前体的存在下还原高锝酸盐离子以形成不稳定的锝-99m-前体配合物,其又与双官能修饰的趋化肽的金属结合基团反应,形成锝-99m-趋化肽偶联物。
[0208]抗体常用于这样的体内成像诊断方法。用于体内诊断的抗体的制备和用途为本领域熟知。特异性结合表I的任何生物标记的标记的抗体可以注入疑似患有某种类型癌症(如间皮瘤)的个体,并根据所用的特定生物标记的可检测性来诊断或评价所述个体的疾病状态。如上文所述,使用的标记根据所用的成像形式来选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量还允许确定该器官或组织中癌症的存在或不存在。
[0209]相似地,适配 体可以用于这样的体内成像诊断方法。例如,用于鉴定表I所述的特定生物标记的适配体(并且因此特异性结合该特定生物标记)可以适当地进行标记并注入疑似患有间皮瘤的个体,并根据该特定生物标记的可检测性来诊断或评价所述个体的间皮瘤状态。如上文所述,使用的标记根据所用的成像形式来选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量还允许确定该器官或组织中癌症的存在或不存在。适配体定向的显像剂与其他显像剂相比可以具有关于组织渗透、组织分布、动力学、消除、效力和选择性方面独特且有利的特征。
[0210]这样的技术还可以任选地用标记的寡核苷酸进行,例如通过用反义寡核苷酸成像检测基因表达。这些方法用于原位杂交,例如用荧光分子或放射性核素作为标记。检测基因表达的其他方法包括例如检测报道基因的活性。
[0211]另一种常见类型的成像技术是光学成像,其中对象体内的荧光信号通过所述对象体外的光学设备检测。这些信号可以是由于实际的荧光和/或生物发光。光学检测设备灵敏性的改进增加了光学成像在体内诊断测定中的应用。
[0212]体内分子生物标记成像的用途日益增加,包括临床试验,例如在新癌症疗法的试验中更快速地测量临床效力,和/或避免对那些疾病的长期安慰剂治疗,其中这样的长期治疗可能被认为是存在伦理问题的。[0213]关于其他技术的综述,参见N.Blow,Nature Methods,6,465-469,2009。
[0214]使用组织学/细胞学方法确定生物标记值
[0215]对于间皮瘤的评价,许多组织样品可以用于组织学或细胞学方法。样品选择取决于原发肿瘤位置和转移的部位。例如,在CT或US指导的FNA时采集的组织或积液样品(钳夹活检、细针抽吸(FNA)和/或刷检(brush cytology))可以用于组织学。腹水或腹腔灌洗液、胸腔积液或间皮液可以用于细胞学。本文鉴定的在胸膜异常个体中表现出上调的任何生物标记(表I)可以用于染色组织学样本作为疾病的指征。
[0216]在一实施方案中,对于相应的生物标记是特异性的一种或多种捕获试剂用于间皮细胞样品的细胞学评价,并且可以包括以下一个或多个方面:收集细胞样品、固定细胞样品、脱水、透明(clearing)、将细胞样品固定在显微镜载玻片上、使细胞样品透化、分析物检索处理、染色、脱色、洗涤、封闭以及在缓冲溶液中与一种或多种捕获试剂反应。在另一实施方案中,细胞样品从细胞块(cell block)中产生。
[0217]在另一实施方案中,对于相应的生物标记是特异性的一种或多种捕获试剂用于腹膜或胸膜异常组织样品的组织学评价,并且可以包括以下一个或多个方面:收集组织样本、固定组织样品、脱水、透明、将组织样品固定在显微镜载玻片上、使组织样品透化、分析物检索处理、染色、脱色、洗涤、封闭、再水合以及在缓冲溶液中与一种或多种捕获试剂反应。在另一实施方案中,固定和脱水用冷冻代替。
[0218]在另一实施方案中,使对于相应的生物标记是特异性的一种或多种适配体与组织学或细胞学样品反应,并且可以作为核酸扩增方法中的核酸靶标。合适的核酸扩增方法包括例如PCR、q-β复制酶、滚环扩增、链置换、解旋酶依赖性扩增、环介导的等温扩增、连接酶链式反应以及限制和环化辅助的滚环扩增。
[0219]在一实施方案中,将对于用于组织学或细胞学评价的相应生物标记是特异性的一种或多种捕获试剂在缓冲溶液中 混合,所述缓冲溶液可以包含任何以下成分:封闭材料、竞争剂、去污剂、稳定剂、载体核酸、聚阴离子材料等。
[0220]“细胞学方案”通常包括样品收集、样品固定(fixation)、样品固定(immobilization)和染色。“细胞制备”可以包括样品收集后的一些处理步骤,包括使用一种或多种慢解离速率的适配体来染色制备的细胞。
[0221]样品收集可以包括直接将样品置于未处理的转运容器中,将样品置于含有一些类型的介质的转运容器中,或者将样品直接置于玻片上(固定)而不进行任何处理或固定。
[0222]样品固定可以通过将一部分收集的样本涂在用聚赖氨酸、明胶或硅烷处理的载玻片上而改进。玻片可以通过在玻片上涂有薄且均匀的细胞层而制备。通常采取小心操作以最小化机械扭转和干燥假象。液体样本可以通过细胞块方法处理。或者,液体样本可以与固定溶液在室温下1:1混合约10分钟。
[0223]细胞块可以从剩余的积液、痰、尿液沉淀、胃肠液、细胞刮取物或细针抽吸物中制备。通过离心或膜过滤浓缩或压实细胞。已经开发了许多细胞块制备方法。代表性方法包括固定的沉淀、细菌琼脂或膜过滤方法。在固定的沉淀方法中,将细胞沉淀与诸如鲍音液(Bouins)、苦味酸或缓冲的福尔马林的固定剂混合,然后将混合物离心以沉淀固定的细胞。除去上清,尽可能完全地干燥细胞团块(pellet)。收集团块并包在镜头纸中,然后置于组织盒(tissue cassette)中。将组织盒置于包含其他固定剂的罐子中并作为组织样品进行处理。琼脂方法与上述方法非常相似,只是取出团块并在纸巾上干燥,然后切成两半。将切面置于载玻片上一滴熔化的琼脂中,然后将该团块用琼脂包被,保证琼脂中无气泡形成。使琼脂变硬,然后除去任何过多的琼脂。将其置于组织盒中,完成组织处理。或者,可以将团块直接悬浮于在65°C的2%液体琼脂中并离心样品。使琼脂细胞团块在4°C下固化I小时。可以从离心管中取出固体琼脂并切成两半。将琼脂包在滤纸中,然后置于组织盒中。从这点开始的处理与上述方法相同。在任何这些方法中可以用膜过滤代替离心。任何这些方法均可以用于产生“细胞块样品”。
[0224]细胞块可以使用专门的树脂制备,包括Lowicryl树脂、LR White、LRGold、Unicryl和MonoSt印。这些树脂具有低粘度,并且可以在低温下及用紫外(UV)光聚合。包埋方法依赖于在脱水期间逐渐冷却样品,将样品转移至树脂以及于最终低温下在合适的UV波长处聚合细胞块。
[0225]细胞块切片可以用苏木精-伊红染色以进行细胞形态学检查,而其他切片用于特异性标记检查。
[0226]无论方法是细胞学方法或组织学方法,可以在进一步处理之前将样品固定以防止样品降解。这种方法称作“固定”,并且描述了可以互换使用的许多材料和方法。基于待检测的靶标和待分析的特定细胞/组织类型,根据经验最佳地选择样品固定方案和试剂。样品固定依赖于试剂,如乙醇、聚乙二醇、甲醇、福尔马林或异丙醇。样品应当尽可能在收集及附着在玻片上后很快固定。然而,所选的固定剂可以在各种分子靶标中引入结构改变,这使得随后更难以检测。固定(fixation)和固定(immobilization)方法及其顺序可以改变细胞的外观,并且这些改变必须是由细胞学技术人员预期及认可的。固定剂可以导致某些类型细胞收缩,并且导致细胞质出现颗粒或网状物。许多固定剂通过使细胞组分交联而起作用。这可以破坏或改变特异性表位,产生新表位,导致分子缔合以及降低膜通透性。福尔马林固定是一种最常用的细胞学/组织学方法。福尔马林在相邻蛋白之间或在蛋白内形成甲基桥。沉淀或凝固也用于固定,乙醇常用于这种类型的固定。交联与沉淀的组合也可以用于固定。牢固的固定方法在保留形态学信息方面是最佳的,而较弱的固定方法对于保留分子靶标方面是最佳的。
[0227]代表性固定剂是50%无水乙醇、2mM聚乙二醇(PEG)、1.85%甲醛。这种制剂的变化包括乙醇(50%-95%)、甲醇(20%-50%)以及仅福尔马林(甲醛)。另一种常用的固定剂是2% PEG1500、50%乙醇以及3%甲醇。将玻片在室温下置于固定剂中约10-15分钟,然后取出并干燥。一旦玻片被固定,可以用诸如PBS的缓冲溶液对其进行漂洗。
[0228]许多染料可以用于差异地突出和反差或“染色”细胞、亚细胞和组织特征或形态学结构。苏木精(hematoylin)用于将核染色为蓝色或黑色。橘黄G_6和天青伊红(EosinAzure)均将细胞质染色。橘黄G将含有角蛋白和糖原的细胞染成黄色。伊红Y用于将核仁、纤毛、红细胞和表面上皮扁平细胞染色。罗曼诺夫斯基(Romanowsky)染色用于空气干燥的玻片,并且可以用于增强复型及区分细胞外与细胞质内材料。
[0229]染色方法可以包括增加细胞对染色的通透性的处理。用去污剂处理细胞可以用于增加通透性。为了增加细胞和组织通透性,可以将固定的样品用溶剂、皂苷类或非离子型去污剂进一步处理。酶促消化还可以改进组织样品中特异性靶标的可接近性。
[0230]染色后,使用渐增的醇浓度进行连续醇漂洗将样品脱水。最终的洗涤使用二甲苯或诸如柑桔萜的二甲苯取代物,其具有接近在载玻片上应用的盖玻片的折射率。这个最后的步骤称作透明。一旦使样品脱水及透明,应用封固剂。所选的封固剂具有接近玻璃的折射率,并且能够使盖玻片与载玻片粘合。其还抑制细胞样品另外的干燥、收缩或褪色。
[0231]无论使用的染色或处理,对间皮细胞学样本的最后评价通过一些类型的显微镜检查进行以允许通过肉眼观察形态学并确定标记的存在或不存在。示例性显微镜检查方法包括明视野显微镜、相差显微镜、荧光显微镜和微分干涉相差显微镜方法。
[0232]如果在检查后需要对样品进行次级测试,则可以除去盖玻片并对载玻片进行脱色。脱色包括使用用于染色该载玻片的最初未加入染料的原始溶剂系统,并以与原始染色程序相反顺序进行。脱色还可以通过将该载玻片浸泡在酸醇中直至细胞无色来完成。一旦无色,则将载玻片用水浴充分漂洗并进行第二染色程序。
[0233]此外,通过使用特异性分子试剂,如抗体或者核酸探针或适配体,可以将特异性分子区分与细胞形态学分析组合。这改进了诊断细胞学的精确性。显微切割可以用于分离细胞的子集以进行另外的评价,特别是用于遗传学评价异常染色体、基因表达或突变。
[0234]制备用于组织学评价的组织样品包括固定、脱水、浸润(infiltration)、包埋和切片。用于组织学的固 定试剂与用于细胞学的固定试剂非常相似或相同,并且在以诸如个体蛋白的分子为代价的情况中具有相同的保持形态学特征的问题。如果组织样品不进行固定和脱水而是代之以冷冻然后在冷冻时切片可以节省时间。这是更温和的处理程序,并且可以保留更多的个体标记。然而,冷冻对于组织样品的长期保存不可接受,因为由于冰晶体的引入引起亚细胞信息丧失。冷冻组织样品中的冰也妨碍切片过程产生极薄的切片,并且因此可以丧失一些显微镜分辨力和亚细胞结构的图像。除了福尔马林固定之外,四氧化锇也用于固定和染色磷脂(膜)。
[0235]组织的脱水是通过用渐增浓度的醇连续洗涤来完成。透明使用可以与醇和包埋材料混溶的材料,并且包括从50: 50醇:澄清试剂开始至100%澄清试剂(二甲苯或二甲苯取代物)的逐步处理过程。浸润包括将组织与液体形式的包埋剂(温热的蜡,硝化纤维素溶液)一起温育,首先是50: 50包埋剂:澄清剂,随后是100%包埋剂。包埋通过将组织置于模具或盒中并充填熔化的包埋剂如蜡、琼脂或明胶来完成。使包埋剂硬化。然后将硬化的组织样品切成薄切片以用于染色和随后的检查。
[0236]在染色之前,将组织切片脱蜡并再水合。用二甲苯使切片脱蜡,可以更换一次或多次二甲苯,并且通过在递减浓度的醇中连续洗涤来将组织再水合。在脱蜡之前,可以将组织切片于约80°C下在载玻片上热固定约20分钟。
[0237]激光捕获显微切割允许从组织切片分离细胞的子集以进行进一步分析。
[0238]在细胞学中,为了增强显微特征的观察,可以将组织切片或薄片用各种染色方法染色。许多可商购的染色方法可以用于增强或鉴定特定的特征。
[0239]为了进一步增加分子试剂与细胞学/组织学样品的相互作用,已经开发了许多“分析物检索(analyte retrieval) ”技术。第一种这样的技术使用高温加热固定的样品。这种方法也称作热诱导的表位检索或HIER。已经使用了许多加热技术,包括蒸汽加热、微波、高压蒸汽、水浴以及加压蒸煮或这些加热方法的组合。分析物检索溶液包括例如水、柠檬酸盐和普通盐水缓冲液。分析物检索的关键是高温的时间,但是较低温度进行较长时间也已经成功使用。分析物检索的另一关键是加热溶液的pH。据发现低pH提供最佳的免疫染色,但是也产生经常需要使用第二组织切片作为阴性对照的背景。无论缓冲液组成,使用高PH溶液通常获得最一致的益处(增加免疫染色而不增加背景)。对特异性靶标的分析物检索方法根据经验对使用加热的靶标、时间、PH和缓冲液组成的变量加以优化。使用微波分析物检索方法允许用抗体试剂顺序染色不同的靶标。但是在染色步骤之间获得抗体与酶复合物所需的时间也证实使细胞膜分析物降解。微波加热方法也改进原位杂交方法。
[0240]为了开始分析物检索过程,首先将切片脱蜡并水合。然后将玻片置于平皿或罐子中的IOmM柠檬酸钠缓冲液pH6.0中。代表性程序使用1100W微波,以100%功率对玻片微波处理2分钟,随后在确保玻片保留覆盖于液体中之后使用20%功率对玻片微波处理18分钟。然后使玻片在敞口容器中冷却,随后用蒸馏水漂洗。HIER可以与酶促消化组合使用以改进靶标对免疫化学试剂的反应性。
[0241]一种这样的酶促消化方案使用蛋白酶K。20g/ml浓度的蛋白酶K在50mM Tris碱、ImM EDTA、0.5% Triton X-100、ρΗ8.0缓冲液中制备。该方法首先包括将切片在更换2次的二甲苯中脱蜡,每次5分钟。然后将样品在更换2次的100%乙醇中水合,每次3分钟,在95 %和80 %乙醇中水合,每次I分钟,然后在蒸馏水中漂洗。将切片用蛋白酶K工作溶液覆盖,于37°C下在加湿室中温育10-20分钟(最佳温育时间可以根据组织类型和固定程度而变化)。将切片在室温下冷却10分钟,然后在PBS吐温(Tween) 20中漂洗2次2分钟。如果需要,可以将切片封闭以消除来自内源化合物和酶的潜在干扰。然后将切片用在一抗稀释缓冲液中适当稀释的一抗在室温下温育I小时或者在4°C下温育过夜。然后将该切片用PBS吐温20漂洗2次2分钟。如果需要特定的应用,可以进行另外的封闭,随后用PBS吐温20再漂洗3次2分钟,然后最后完成免疫染色方案。
[0242]在室温下用1% SDS简单处理也已经证实改进了免疫组织化学染色。分析物检索方法已经应用于玻片固定切片(slide mounted section)以及自由浮动切片(freefloating section)。另一处理选择是将玻片置于pH6.0的含有朽1檬酸和0.1诺纳德(Nonident)P40的罐·子中,并加热至95°C。然后将该玻片用诸如PBS的缓冲溶液洗涤。
[0243]对于组织的免疫学染色,可以通过将切片浸入诸如血清或脱脂奶粉的蛋白溶液中来封闭抗体与组织蛋白的非特异性结合。
[0244]封闭反应可以包括需要降低内源生物素的水平;消除内源电荷作用;失活内源核酸酶;和/或失活内源酶如过氧化物酶和碱性磷酸酶。内源核酸酶可以通过以下方式失活:用蛋白酶K降解;热处理;使用螯合剂,如EDTA或EGTA ;引入载体DNA或RNA ;用离液剂处理,如尿素、硫脲、盐酸胍、硫氰酸胍、高氯酸锂等或焦碳酸二乙酯。碱性磷酸酶可以通过用0.1NHCl在室温下处理5分钟或用ImM左旋咪唑处理来失活。过氧化物酶活性可以通过用0.03%过氧化氢处理来消除。内源生物素可以通过将玻片或切片在室温下浸入抗生物素蛋白(链霉抗生物素蛋白,可以取代中性链亲和素(neutravidin))溶液中至少15分钟来封闭。然后将玻片或切片在缓冲液中洗涤至少10分钟。这个步骤可以重复至少3次。然后将玻片或切片浸入生物素溶液中10分钟。这个步骤可以重复至少3次,每次使用新鲜的生物素溶液。重复缓冲液洗涤程序。应当减少封闭方案以防止破坏所关注的细胞或组织结构或者靶标或多个靶标,但是可以组合一种或多种这样的方案以“封闭”玻片或切片,然后与一种或多种慢解离速率适配体反应。参见Basic Medical Histology:the Biology ofCells,Tissues and Organs,authored by Richard G.Kessel,Oxford University Press,1998。
[0245]使用质谱方法确定生物标记值
[0246]许多质谱仪的配置(configuration)可以用于检测生物标记值。一些类型的质谱仪可以获得或可以用各种配制生产。通常,质谱仪具有以下主要部件:样品入口、离子源、质量分析仪、检测仪、真空系统以及设备控制系统和数据系统。样品入口、离子源和质量分析仪的差异通常限定设备的类型及其能力。例如,入口可以是毛细管柱液体层析源,或者可以是直接探针或镜台(stage)如用于基质辅助激光解吸电离中。常用的离子源是例如电喷射,包括纳米喷射(nanospray)和微喷射(microspray);或者基质辅助激光解吸电离。常用的质量分析仪包括四极滤质器(quadrupole mass filter)、离子讲质量分析仪和飞行时间质量分析仪。其他质谱方法为本领域熟知(参见Burlingame et al.Anal.Chem.70:647R-716R(1998) ;Kinter and Sherman, New York(2000))?
[0247]蛋白生物标记和生物标记值可以通过任何如下方式检测和测量:电喷射离子化质谱(ES1-MS)、ES1-MS/MS、ES1-MS/(MS) η、基质辅助激光解吸离子化飞行时间质谱(MALD1-T0F-MS)、表面增强激光解吸/离子化飞行时间质谱分析(SELD1-T0F-MS)、硅表面解吸/离子化(DIOS)、二次离子质谱(SIMS)、四极飞行时间(Q-TOF)、称作ultrafiex IIIT0F/T0F的串联式飞行时间(T0F/T0F)技术、大气压化学离子化质谱(APC1-MS)、APC1-MS/MS、APC1-(MS)N、大气压光电离质谱(APP1-MS)、APPI_MS/MS 和 APP1-(MS) N、四极质谱、傅里叶变换质谱(FTMS)、定量质谱以及离子阱质谱。
[0248]样品制备策略用于在对蛋白生物标记进行质谱表征及确定生物标记值之前标记和富集样品。标记方法包括但不限于用于相对和绝对定量的等量异位标签(iTRAQ)和在细胞培养中用氨基酸稳定同位素标记(SILAC)。在质谱分析之前用于选择性富集候选生物标记蛋白样品的捕获试剂包括但不限于适配体、抗体、核酸探针、嵌合物、小分子、F(ab’)2片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体、锚蛋白、结构域抗体、可变抗`体支架(例如双抗体等)印刷的聚合物、高亲合性多聚体、肽模拟物、拟肽、肽核酸、苏糖核酸、激素受体、细胞因子受体及合成的受体以及这些物质的修饰和片段。
[0249]使用邻位连接技术确定生物标记值
[0250]邻位连接技术可以用来确定生物标记值。简单地说,使测试样品与一对亲和性探针接触,所述一对亲和性探针可以是一对抗体或一对适配体,这对的每个成员延伸出寡核苷酸。这对亲和性探针的靶标可以是一个蛋白上的两个不同决定簇或者两个不同蛋白中每一个上的一个决定簇,其可以作为同源或异源多聚复合物存在。当探针结合靶决定簇时,寡核苷酸延伸的游离端足够接近以杂交在一起。寡核苷酸延伸的杂交通过常见的连接寡核苷酸来促进,所述连接寡核苷酸在位置足够接近时用于将寡核苷酸延伸连接在一起。一旦探针的寡核苷酸延伸杂交,延伸的末端通过酶促DNA连接而连接在一起。
[0251]每个寡核苷酸延伸包含用于PCR扩增的引物位点。一旦寡核苷酸延伸连接在一起,寡核苷酸形成连续的DNA序列,通过PCR扩增,其显示关于靶蛋白的性质和量的信息,以及当靶决定簇在两个不同蛋白上时关于蛋白-蛋白相互作用的信息。邻位连接可以通过使用实时PCR提供实时蛋白浓度和相互作用信息的高度灵敏和特异性的测定。不结合所关注的决定簇的探针不具有邻近的相应的寡核苷酸延伸,并且不可以进行连接或PCR扩增,导致没有信号产生。
[0252]前述测定允许检测可用于诊断间皮瘤的方法的生物标记值,其中所述方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物标记值每个对应于选自表I提供的生物标记的组的生物标记,其中如下文详述,利用生物标记值的分类指示所述个体是否患有间皮瘤。虽然某些所述间皮瘤生物标记可以单独用于检测和诊断间皮瘤,但是本文所述的方法还用于分组间皮瘤生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请的各个实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-66个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述的任何方法,可以单独检测和分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。
[0253]在另一方面,本发明提供了检测间皮瘤不存在的方法,所述方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物标记值每个对应于选自表I提供的生物标记的组的生物标记,其中如下文详述,生物标记值的分类指示所述个体中不存在间皮瘤。虽然某些所述间皮瘤生物标记可以单独用于检测和诊断间皮瘤不存在,但是本文所述的方法还用于分组间皮瘤生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请的各个实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-66个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述的任何方法,可以单独检测和分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。
[0254]生物标记分类和疾病评分计算
[0255]给定诊断测试的生物标记“特征”含有标记的集合,每个标记在所关注群体中具有不同水平。在这方面,不同水平可以指针对两个或更多个组中个体的标记水平的不同平均值(mean),或者两个或更多个组中的不同的方差,或者这两者的组合。对于最简单形式的诊断测试,这些标记可以 用于将来自个体的未知样品分配到两组中的一组中,疾病组或非疾病组。将样品分配于两个或更多个组中的一组称为分类,用于实现这种分配的程序称为分类器或分类方法。分类方法也可以称为评分方法。有许多分类方法可以用于从生物标记值的集合构建诊断分类器。通常,分类方法最容易用监督学习技术进行,其中用获得自希望区分的两个(或更多个,对于多个分类状态)不同组内的个体的样品收集数据集合。因为每个样品所属的类别(组或群体)事先对于每个样品均是已知的,所以可以训练分类方法以获得期望的分类应答。还可以使用无监督学习技术来产生诊断分类器。
[0256]开发诊断分类器的常用方法包括决策树;bagging, boosting, forests和随机 forests ;基于规则推论的学习(rule inference based learning) ;Parzen 窗方法(Parzen Windows);线性模型;逻辑;神经网络方法;无监督聚类;K_means ;分级上升/下降(hierarchical ascending/descending);半监督学习;原型方法;近邻取样(nearest neighbor);核密度估计(kernel density estimation);支持向量机(supportvector machine);隐马尔可夫模型(hidden Markov model);玻尔兹曼学习(BoltzmannLearning);并且分类器可以简单组合或者以最小化特定目标函数的方式组合。综述参见例如 Pattern Classification,R.0.Duda,et al., editors,John ffiley&Sons,2nd edition,2001;还参见 The Elements of Statistical Learning-Data Mining, Inference, andPrediction, T.Hastie, et al., editors, Springer Science+Business Media, LLC,2ndedition, 2009 ;它们均整体援引加入本文。
[0257]为了用监督学习技术产生分类器,获得称为训练数据的样品集合。在诊断测试的情况下,训练数据包括来自未知样品稍后会被分配的不同组(类别)的样品。例如,收集自对照群体的个体和特定疾病群体的个体的样品可以组成训练数据以开发可以分类未知样品(或者,更特别地,样品所来自的个体)为患有该疾病或无该疾病的分类器。从训练数据开发分类器已知为训练该分类器。分类器训练的具体细节取决于监督学习技术的性质。作为示例,训练朴素贝叶斯(nai\υ Bayesian)分类器的实例在下文进行描述(参见例如Pattern Classification, R.0.Duda, et al., editors, John ffiley&Sons,2nd edition,2001;还参见 The Elements of Statistical Learning-Data Mining, Inference, andPrediction, T.Hastie, et al., editors, Springer Science+Business Media, LLC,2ndedition,2009)。
[0258]因为通常在训练集合中存在比样品多得多的潜在生物标记值,所以必须小心避免过拟合。当统计学模型描述随机误差或噪声而非潜在关系时发生过拟合。过拟合可以由各种方式避免,这包括例如限制开发分类器中使用的标记数目,假设标记应答互相独立,限制采用的潜在统计学模型的复杂性,以及保证潜在统计学模型符合数据。
[0259]使用生物标记的集合开发诊断测试的说明性实例包括应用朴素贝叶斯分类器,这是一种基于贝叶斯(Bayes)定理的简单或然性分类器,具有生物标记的严格独立处理。每个生物标记由针对每种类别中测量的RFU值或1gRFU (相对荧光单位)值的类别依赖性概率密度函数(pdf)描述。一个类别中的标记的集合的共同pdf (joint pdf)假定为每个生物标记的个体类别依赖性Pdf的积。在这种情况下训练朴素贝叶斯分类器意味着分配参数(“参数化”)以表征类别依赖性pdf。类别依赖性pdf的任何潜在模型均可以使用,但是模型应该通常符合在训练集合中观察到的数据。
[0260]具体地,测量疾病类别中生物标记i的值Xi的类别依赖性概率写作P (Xi I d),并且观察具有值:r = f J ,, T2..…r?!.)的η个标记的整体朴素贝叶斯概率写作
= Il/=t Mj、丨山,其中各个Xi是以RFU或log RFU表不的测量的生物标记水平。对于未知的分类分配通过以下方法来促进:对于相同测量值,计算与不患病(对照)的概率/.心++μι相比的具有测量的f的患病概率H 这些概率的比率通过应用贝叶斯定理从
类别依赖性pdf计算,即
【权利要求】
1.一种诊断个体患有或不患有间皮瘤的方法,所述方法包括: 在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表I的至少N个生物标记之一,其中基于所述生物标记值,将所述个体分类为患有或不患有间皮瘤、或者确定所述个体患有间皮瘤的似然性,并且其中N=2-66。
2.权利要求1的方法,其中所述诊断包括对间皮瘤与暴露于石棉的个体中发现的良性疾病状况进行鉴别诊断。
3.权利要求1的方法,其中所述个体具有胸膜异常。
4.权利要求1的方法,其中检测所述生物标记值包括进行体外测定。
5.权利要求4的方法,其中所述体外测定包括对应于每个所述生物标记的至少一种捕获试剂,并且还包括从适配体、抗体和核酸探针的组中选择所述至少一种捕获试剂。
6.权利要求5的方法,其中所述至少一种捕获试剂为适配体。
7.权利要求1的方法,其中所述生物学样品选自全血、血浆、血清和胸膜液。
8.权利要求4的方法,其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定、以及mRNA表达水平测定。
9.权利要求8的方法,其中所述生物学样品为血清。
10.权利要求1的方法,其中所述生物学样品为胸膜或腹膜间皮组织,并且其中所述生物标记值源自所述间皮·组织的组织学或细胞学分析。
11.权利要求1的方法,其中所述个体为人。
12.权利要求1的方法,其中N=3-10。
13.权利要求1的方法,其中N=3-15。
14.权利要求1的方法,其中N=2-10。
15.权利要求1的方法,其中N=4-10。
16.权利要求1的方法,其中N=5-10。
17.权利要求1的方法,其中所述个体由于石棉或相关纤维暴露而具有间皮瘤的高风险。
18.权利要求1的方法,其中所述生物标记选自表18。
19.一种指示间皮瘤的似然性的计算机执行方法,所述方法包括: 在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表I的至少N个生物标记之一; 用计算机对每个所述生物标记值进行分类;以及基于多种分类指示所述个体患有间皮瘤的似然性,并且其中N=2-66。
20.权利要求19的方法,其中指示所述个体患有间皮瘤的似然性包括在计算机显示器上显示所述似然性。
21.一种指示间皮瘤的似然性的计算机程序产品,所述计算机程序产品包括:包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括: 检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于选自表I的至少N个生物标记之一,其中所述生物标记在所述生物学样品中检测;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的间皮瘤状态; 并且其中N=2-66。
22.权利要求21的计算机程序产品,其中所述分类方法使用概率密度函数。
23.权利要求22的计算机程序产品,其中所述分类方法使用两种或更多种类别。
24.一种筛查间皮瘤的无症状高风险个体的方法,所述方法包括: 在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表I的至少N个生物标记之一,其中基于所述生物标记值,将所述个体分类为患有或不患有间皮瘤、或者确定所述个体患有间皮瘤的似然性,并且其中N=2-66。
25.权利要求24的方法,其中检测所述生物标记值包括进行体外测定。
26.权利要求25的方法,其中所述体外测定包括对应于每个所述生物标记的至少一种捕获试剂,并且还包括从适配体、抗体和核酸探针的组中选择所述至少一种捕获试剂。
27.权利要求26的方法,其中所述至少一种捕获试剂为适配体。
28.权利要求27的方法,其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定、以及mRNA表达水平测定。
29.权利要求24的方法,其中所述生物学样品选自全血、血浆、血清和胸膜液。
30.权利要求29的方法,其中所述生物学样品为血清。
31.权利要求24的方法 ,其中所述生物学样品为间皮组织,并且其中所述生物标记值源自所述间皮组织的组织学或细胞学分析。
32.权利要求24的方法,其中所述个体为人。
33.权利要求24的方法,其中N=3-10。
34.权利要求24的方法,其中N=3-15。
35.权利要求24的方法,其中N=2-10。
36.权利要求24的方法,其中N=4-10。
37.权利要求24的方法,其中N=5-10。
38.权利要求24的方法,其中所述个体由于暴露于石棉或其它相关纤维而具有间皮瘤的闻风险。
39.权利要求24的方法,其中所述生物标记选自表18。
40.一种指示间皮瘤癌的似然性的计算机执行方法,所述方法包括: 在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表I的至少N个生物标记之一; 用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有间皮瘤癌的似然性,并且其中N=2-66。
41.权利要求40的方法,其中指示所述个体患有间皮瘤的似然性包括在计算机显示器上显示所述似然性。
42.一种指示间皮瘤的似然性的计算机程序产品,所述计算机程序产品包括:包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括: 检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于选自表I的至少N个生物标记之一,其中所述生物标记在所述生物学样品中检测;以及 执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的间皮瘤状态; 并且其中N=2-66。
43.权利要求42的计算机程序产品,其中所述分类方法使用概率密度函数。
44.权利要求43的计算机程序产品,其中所述分类方法使用两种或更多种类别。
45.一种诊断个体患有或不患有癌症的方法,所述方法包括: 在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表19的至少N个生物标记之一,其中基于所述生物标记值,将所述个体分类为患有或不患有癌症、或者确定所述个体患有间皮瘤的似然性,并且其中N=2-22。
46.权利要求45的方法,其中所述诊断的癌症包括肺癌、肾细胞癌或间皮瘤中的一种或多种。
47.权利要求45的方法,其中检测所述生物标记值包括进行体外测定。
48.权利要求47的方法,其中所述体外测定包括对应于每个所述生物标记的至少一种捕获试剂,并且还包括从 适配体、抗体和核酸探针的组选择所述至少一种捕获试剂。
49.权利要求48的方法,其中所述至少一种捕获试剂为适配体。
50.权利要求47的方法,其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定、以及mRNA表达水平测定。
51.权利要求45的方法,其中所述生物学样品选自全血、血浆和血清。
52.权利要求51的方法,其中所述生物学样品为血清。
53.权利要求45的方法,其中所述个体为人。
54.权利要求45的方法,其中N=2-10。
55.权利要求45的方法,其中N=2-15。
56.权利要求45的方法,其中N=3-10。
57.权利要求45的方法,其中N=3-15。
58.权利要求45的方法,其中N=4-10。
59.一种指示癌症的似然性的计算机执行方法,所述方法包括: 在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表19的至少N个生物标记之一; 用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有癌症的似然性,并且其中N=2-22。
60.权利要求59的方法,其中指示所述个体患有癌症的似然性包括在计算机显示器上显示所述似然性。
61.一种指示癌症的似然性的计算机程序产品,所述计算机程序产品包括:包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括: 检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于选自表19的至少N个生物标记之一,其中所述生物标记在所述生物学样品中检测;以及 执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的癌症状态; 并且其中N=2-22。
62.权利要求61的计算机程序产品,其中所述分类方法使用概率密度函数。
63.权利要求62的计算机程序产品,其中所述分类方法使用两种或更多种类别。
64.权利要求1或25的方法,其中基于所述生物标记值以及至少一项对应于所述个体的额外的生物医学信息,将所述个体分类为患有或不患有间皮瘤、或者确定所述个体患有间皮瘤的似然性。
65.权利要求45的方法,其中基于所述生物标记值以及至少一项对应于所述个体的额外的生物医学信息,将所述个体分类为患有或不患有癌症、或者确定所述个体患有癌症的似然性。
66.权利要求64或65的方法,其中所述至少一项额外的生物医学信息独立地选自 (a)对应于胸腔积液或团块或者其他胸膜团块存在或不存在的信息, (b)对应于所述个体的物理描述的信息, (C)对应于所述个体的重量变化的信息, (d)对应于所述个体的种族的信息,` (e)对应于所述个体的性别的信息, (f)对应于所述个体的吸烟史的信息, (g)对应于所述个体的石棉暴露史的信息, (h)对应于所述个体的职业史的信息, (i)对应于所述个体的间皮瘤或其他癌症的家族史信息, (j)对应于所述个体中与所述个体或所述个体家族成员的间皮瘤或癌症高风险相关的至少一种遗传标记存在或不存在的信息, (k)对应于所述个体的临床症状的信息, (I)对应于其他实验室测试的信息, (m)对应于所述个体的基因表达值的信息,以及 (η)对应于所述个体暴露于已知致癌物的信息。
67.一种包含表18的生物标记的分类器。
【文档编号】G01N33/53GK103429753SQ201180046637
【公开日】2013年12月4日 申请日期:2011年9月27日 优先权日:2010年9月27日
【发明者】R·M·奥斯特罗夫, A·A·E·斯图尔特, S·A·威廉森, E·N·布罗迪, M·尼克拉德, M·里尔-米恩 申请人:私募蛋白质体公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1