肺癌生物标记及其用途的制作方法

文档序号:6595441阅读:323来源:国知局
专利名称:肺癌生物标记及其用途的制作方法
技术领域
本申请一般地涉及个体中生物标记的检测及癌症的诊断,更具体地涉及用于诊断个体的癌症,更特别是肺癌的一种或多种生物标记、方法、装置、试剂、系统和试剂盒。
背景技术
下面的描述提供了本申请相关信息的概述,并非承认本文提供的信息或者引用的出版物是本申请的现有技术。更多的人死于肺癌而非其他癌症类型。这对于男性和女性都是如此。2005年在美国(目前有统计数字的最近年份),肺癌死亡比乳腺癌、前列腺癌和结肠癌死亡的组合还多。在那一年,107,416名男性和89,271名女性诊断患有肺癌,并且90,139名男性和 69,078女性死于肺癌。在美国男性中,肺癌是白人男性、黑人男性、亚裔/太平洋岛男性、美国印第安男性/阿拉斯加土著男性以及西班牙裔男性中第二常见的癌症。在美国女性中, 肺癌是白人女性、黑人女性、美国印第安女性/阿拉斯加土著女性中第二常见的癌症,并且是亚裔/太平洋岛女性和西班牙裔女性中第三常见的癌症。对于不戒烟的人,肺癌死亡率为15%,甚至对于50-59岁的戒烟的人仍为5%以上。仅美国在肺癌上每年保健费用就为 950亿美元。91%由吸烟所致的肺癌是非小细胞肺癌(NSCLC),其占所有肺癌的约87%。所有肺癌中剩余的13%是小细胞肺癌,虽然混合细胞肺癌确有发生。因为小细胞肺癌罕见且迅速致死,所以早期检测机会不大。NSCLC有三种主要类型鳞状细胞癌、大细胞癌和腺癌。腺癌是最常见形式的肺癌 (30% _40%,且据报道高达50% ),并且是在吸烟者和非吸烟者中最常发现的肺癌。鳞状细胞癌占所有肺癌的25-30%,并且通常在近端支气管中发现。早期NSCLC倾向于局部化, 如果早期检测到,其通常可以手术治疗,并且结果有利且存活率改善。其他治疗选择包括放疗、药物疗法和这些方法的组合。NSCLC根据肿瘤大小及其在包括淋巴结在内的其他组织中的存在来分期。在隐藏期,癌细胞在痰样品或灌洗样品中发现,在肺中检测不到肿瘤。在0期,仅肺最深的内衬 (lining)表现出癌细胞,肿瘤没有生长通过内衬。在IA期,癌症被认为是侵袭性的,并且已生长深入肺组织,但是肿瘤横向(across)小于3cm。在这个时期,在支气管或淋巴结中未发现肿瘤。在IB期,肿瘤横向大于3cm或者已生长入支气管或胸膜,但是尚未生长入淋巴结。 在IIA期,肿瘤横向大于3cm,并且已生长入淋巴结。在IIB期,肿瘤在淋巴结中发现并且横向大于3cm,或者已生长入支气管或胸膜;或者癌症不在淋巴结中但是在胸壁、膈、胸膜、支气管或围绕心脏的组织中发现。在IIIA期,癌细胞在肺和支气管附近的淋巴结中以及肺之间的淋巴结中,不在在肿瘤所位于的胸的一侧上。在IIIB期,癌细胞位于胸的肿瘤的对侧及在颈中。肺附近的其他器官也可以具有癌细胞,并且在一个肺叶中可以发现多个肿瘤。在 IV期,肿瘤在相同肺或两个肺多于一个的肺叶中发现,并且癌细胞在身体其他部分发现。目前肺癌诊断方法包括测试痰的癌细胞、胸部X-射线、呼吸道的纤维光学评价和低剂量螺旋计算机断层扫描(CT)。痰细胞学的灵敏性非常低。胸X-射线也较不灵敏,而且要求病灶的大小大于Icrn以可见。支气管镜检查要求肿瘤在支气管镜可及的呼吸道内可见。最广泛认可的诊断方法是CT,但是常与X-射线一起,CT的应用涉及电离辐射,其本身可以导致癌症。CT还有明显的限制扫描需要高技术水平以解释,并且许多观测的异常事实上不是肺癌,在跟踪CT发现中产生很大保健花费。最常见伴随发现是良性肺小结。肺小结是较圆的病灶或异常组织区域,其位于肺中且大小可变。肺小结可以是良性或癌性的,但是大多数是良性的。如果小结小于4mm,则发病率仅为1.5%,如果小结为 4_8mm,则发病率为约6%,如果超过20mm,则发病率为约20%。对于小和中等大小的小结, 建议患者在3个月至1年内重复扫描。对于许多大小结,患者接受生物活检(其是侵入性的并且可能导致并发症),即使大部分小结是良性的。因此,亟需可以替代或补充CT的诊断方法以减少进行的手术数量及降低手术并发症的风险。另外,甚至当不存在或未知肺小结时,需要在早期检测肺癌的方法以改善患者的结局。仅16%的肺癌病例诊断为局部早期癌症,其中5年存活率为46%,相比之下,在晚期诊断的为84%,其中5年存活率仅为13%。这证实依赖于症状诊断是无用的,因为它们中的许多是其他肺疾病常见的。这些症状包括久咳、血痰、胸痛和复发性支气管炎或肺炎。当存在癌症早期诊断方法时,益处通常是医疗行业所接受的。广泛使用筛查方案的癌症具有最高5年的存活率,如乳腺癌(88% )和结肠癌(65% ),相比之下肺癌为16%。 但是,如果癌症在1期通过筛查诊断,则88%的肺癌患者存活10年或更长。这证实明显亟需可以可靠地检测早期NSCLC的诊断方法。特定疾病状态的生物标记的选择首先涉及鉴定标记,该标记对特定医疗应用在疾病群体中具有与对照群体相比可测量且统计学显著的差异。生物标记可以包括分泌或脱落 (shed)的分子,其与疾病发展或进程平行,并且容易从肺组织或远端组织对病灶响应而扩散入血流。鉴定的生物标记或生物标记的集合(set)通常临床上进行验证,或者证实为对其所选的原始预期用途是可靠的指示物。生物标记可以包括小分子、肽、蛋白和核酸。影响生物标记鉴定的一些关键问题包括可用数据的过拟合(over-fitting)及数据偏差。已使用各种方法来试图鉴定生物标记及诊断疾病。对于基于蛋白的标记,这些方法包括二维电泳、质谱和免疫测定方法。对于核酸标记,这些方法包括mRNA表达谱、微RNA 谱、FISH、基因表达系列分析(SAGE)和大规模基因表达阵列。二维电泳的应用由于如下问题而受限低检测灵敏度;与蛋白溶解性、电荷及疏水性相关的问题;凝胶再现性;以及单个斑点代表多个蛋白的可能性。对于质谱,取决于所用形式,限制围绕样品加工和分离、对低丰度蛋白的灵敏性、信噪比考虑及不能立即鉴定检测的蛋白而出现。免疫测定方法发现生物标记的限制集中在基于抗体的多重测定不能测量大量分析物。可以简单地印刷高质量抗体的阵列,并且无需夹心而测量与这些抗体结合的分析物。(这会使用全基因组核酸序列经杂交测量有机体或细胞中的全部DNA或RNA序列的方式上的等同物。因为杂交可以是同一性的严紧测试,所以杂交实验可行。甚至非常好的抗体在选择它们的结合配偶体中也并非足够严紧来在血液或甚至是细胞提取物环境中工作,因为那些基质中的蛋白总体(ensemble)具有极其不同的丰度。)因此,必须使用不同的基于免疫测定的方法以发现生物标记一需要使用多重ELISA测定(即夹心)以获得足够严紧性来同时测量许多分析物从而决定哪些分析物确实是生物标记。夹心免疫测定不放大到高含量,因此使用标准阵列形式不能用严紧夹心免疫测定发现生物标记。最后,抗体试剂容易产生相当大的批次差异和试剂不稳定性。本发明的蛋白生物标记发现平台克服了这个问题。许多这些方法依赖或需要在分析前一些类型的样品的分级。因此进行设计为在一系列良好限定的样品群体中鉴定/发现统计学相关生物标记的足够有效的研究所需样品制备是极其困难、昂贵和耗时的。在分级期间,大范围的各种变异性可能被引入各种样品。 例如,一个潜在的标记可能对于方法是不稳定的,标记的浓度可能变化,不合适的聚集或解聚可能发生,无意的样品污染可能发生,并因此掩盖预期在早期疾病中的微小变化。广泛接受的是使用这些技术的生物标记发现和检测方法对于鉴定诊断性生物标记具有严重限制。这些限制包括不能检测低丰度生物标记,不能持续覆盖蛋白质组的完整动态范围,样品加工和分级中的不可再现性,以及方法的整体不可再现性和缺乏稳健性 (robustness)。另外,这些研究在数据中引入了偏差,针对鉴定和验证靶疾病群体内的生物标记所需的分布和随机化方面,没有充分解决包括合适的对照在内的样品群的复杂性,。尽管意图发现有效的新生物标记的努力已进行了几十年,但是这些努力大部分是不成功的。针对各种疾病的生物标记通常在实验室中鉴定,通常通过进行一些疾病过程的基础研究时偶然发现。基于所述发现及少量临床数据,发表的论文提示鉴定了新的生物标记。然而大多数这些建议的生物标记未证实是真实或有用的生物标记,这主要是因为测试的少量临床样品对于已确实发现有效的生物标记仅提供弱统计学证据。也就是说,最初的鉴定对于统计学基本元素是不严格的。在1994-2003年的每一年中,检索科学文献表明公开了上千篇关于生物标记的参考文献。然而,在同时期内,FDA—年最多批准3种新蛋白生物标记的诊断应用,并且在若干年中没有批准新的蛋白生物标记。基于失败的生物标记发现努力的历史,已建议了数学理论以进一步促进通常理解,即针对疾病的生物标记很少且难以发现。基于2D凝胶或质谱的生物标记研究支持这些观点。通过这些方法鉴定了非常少的有用生物标记。然而,通常忽视2D凝胶和质谱测量血液中存在的约InM或更高浓度的蛋白,这种蛋白的总体很可能是最不可能随疾病变化的。 除了本发明的生物标记发现系统,尚不存在能够精确测量低得多的浓度的蛋白表达水平的蛋白质组生物标记发现平台。关于复杂的人生物学的生物化学途径已知许多。许多生物化学途径以在病理学内局部发挥作用的分泌的蛋白达到顶点或开始,例如分泌生长因子以刺激病理学中其他细胞的复制,分泌其他因子以避开免疫系统等。尽管许多这些分泌的蛋白以旁分泌方式发挥作用,但是一些在身体的远端运行。具有生物化学途径基本了解的本领域技术人员会理解,许多病理学特异性蛋白应当以低于(甚至远低于)2D凝胶和质谱检测极限的浓度存在于血液中。在这种相对丰富数目的疾病生物标记的鉴定之前必须有一种蛋白质组平台,其可以分析低于2D凝胶或质谱可以检测的浓度的蛋白。因此,亟需生物标记、方法、装置、试剂、系统和试剂盒,其允许(a)区分良性肺小结与恶性肺小结;(b)检测肺癌生物标记;和(C)诊断肺癌。发明概述本申请包括用于检测和诊断癌症,更特别是肺癌的生物标记、方法、试剂、装置、系统和试剂盒。本申请的生物标记使用实施例1详述的基于多重适配体的测定鉴定。通过使用本文所述的基于适配体的生物标记鉴定方法,本申请描述了可用于检测和诊断肺癌的惊人的大量肺癌生物标记。在鉴定这些生物标记中,测量了来自几百个个体样品的超过800 种蛋白,其中一些的浓度在低毫微微摩尔(femtomolar)范围。这比用2D凝胶和/或质谱进行的生物标记发现实验低约4个数量级。尽管一些所述肺癌生物标记可单独用于检测和诊断肺癌,但是本文所述的方法用于分组用作一组生物标记的肺癌生物标记的多个子集。一旦鉴定了单独的生物标记或生物标记的子集,则个体中肺癌的检测或诊断可以用能够测量生物学样品中所选生物标记或多个生物标记的水平差异的任何测定平台或者形式完成。然而,仅仅通过使用本文所述的基于适配体的生物标记鉴定方法,其中超过800 个单独的潜在生物标记值从先前已经诊断为患有或不患有肺癌的大量个体中逐个进行了筛查,才可能鉴定本文公开的肺癌生物标记。这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反,因为其询问无需翻译为人病理学的更加患者相关的系统。因此,本申请一方面提供了一种或多种生物标记以用于单独或以各种组合来诊断肺癌或者允许将肺小结区分诊断为良性或恶性。示例性实施方案包括表1第2列提供的生物标记,如上所述,这些生物标记用实施例2所述的基于多重适配体的测定鉴定。表1第5 列提供的标记可以用于区分良性小节与癌性小结。表1第6列提供的标记可以用于区分无症状吸烟者与患有肺癌的吸烟者。尽管一些所述肺癌生物标记可以单独用于检测和诊断肺癌,但是本文所述的方法也用于分组肺癌生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请各个实施方案提供了包含N个生物标记的组合,其中N是至少2个生物标记。在其他实施方案中,N选自2-61个生物标记的任意数。仍然在其他实施方案中,N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、
2-45、2-50、2-55或2-61中的任意数。在其他实施方案中,N选自3-7、3-10、3-15、3_20、
3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-61中的任意数。在其他实施方案中,N选自
4-7、4-10、4-15、4-20、4-25,4-30、4-35,4-40、4-45、4-50、4-55或 4-61 中的任意数。在其他实施方案中,N选自 5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55 或 5-61 中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、
6-50、6-55或6-61中的任意数。在其他实施方案中,N选自7-10、7-15、7-20、7-25、7_30、
7-35、7-40、7-45、7-50、7-55或7-61中的任意数。在其他实施方案中,N选自8_10、8_15、
8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或 8-61 中的任意数。在其他实施方案中,N 选自 9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55 或 9-61 中的任意数。在其他实施方案中,N选自 10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55 或 10-61 中的任意数。应理解N可以选自包含类似但更高级(order)的范围。
在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第 2列提供的生物标记的组的至少一个生物标记,其中所述个体基于所述至少一个生物标记值分类为患有肺癌。在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中所述个体患有肺癌的似然性(likelihood)基于所述生物标记值确定。在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中所述个体基于所述生物标记值分类为患有肺癌,其中N = 2-10。在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中所述个体患有肺癌的似然性基于所述生物标记值确定,其中N= 2-10。在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第5列所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性。在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第5列所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N =2-10。在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第6列所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性。在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第6列所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N = 2-10。在另一方面,本发明提供了一种诊断个体不患有肺癌的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表 1第2列所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为不患有肺癌。在另一方面,本发明提供了一种诊断个体不患有肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为不患有肺癌,其中N = 2-10。在另一方面,本发明提供了一种诊断肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N = 3-10。在另一方面,本发明提供了一种诊断肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N = 3-15。在另一方面,本发明提供了一种诊断肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表2-27所列组的集合的一组生物标记中的生物标记,其中所述生物标记值的分类指示所述个体患有肺癌。在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N = 3-10。在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N = 3-15。在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N = 3-10。在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N = 3-15。在另一方面,本发明提供了一种诊断肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N = 3-10。在另一方面,本发明提供了一种诊断肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N = 3-15。在另一方面,本发明提供了一种诊断肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表2-27提供的组的集合的一组生物标记中的生物标记,其中所述生物标记值的分类指示所述个体中不存在肺癌。在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为患有肺癌,其中N = 2-10。在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N = 3-10。在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N = 3-15。在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中 N = 3-10。在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中 N = 3-15。在另一方面,本发明提供了一种诊断个体中不存在肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为不患有肺癌,其中N = 2-10。在另一方面,本发明提供了一种指示肺癌的似然性的计算机执行方法。所述方法包括在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中N如上定义;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有肺癌的似然性。在另一方面,本发明提供了一种将个体分类为患有或不患有肺癌的计算机执行方法。所述方法包括在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表1第2列提供的生物标记的组的至少N个生物标记之一;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体是否患有肺癌。在另一方面,本发明提供了一种指示肺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中N如上定义;以及执行分类方法的代码, 所述分类方法指示作为所述生物标记值的函数的所述个体患有肺癌的似然性。在另一方面,本发明提供了一种指示个体的肺癌状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物标记的组的至少N个生物标记之一;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺癌状态。在另一方面,本发明提供了一种指示肺癌的似然性的计算机执行方法。所述方法包括在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1第2列所列的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体患有肺癌的似然性。在另一方面,本发明提供了一种将个体分类为患有或不患有肺癌的计算机执行方法。所述方法包括从计算机检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1第2列提供的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体是否患有肺癌。在另一方面,本发明提供了一种指示肺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表1第2列所列的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有肺癌的似然性。在另一方面,本发明提供了一种指示个体的肺癌状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺癌状态。


图IA是检测生物学样品中的肺癌的示例方法的流程图。图IB是用朴素贝叶斯(naiVe Bayes)分类方法检测生物学样品中的肺癌的示例方法的流程图。图2示出单个生物标记SCFsR的ROC曲线,其使用用于检测无症状吸烟者中的肺癌的测试的朴素贝叶斯分类器(classifier)。图3示出1至10个生物标记的生物标记组的ROC曲线,其使用用于检测无症状吸烟者中的肺癌的测试的朴素贝叶斯分类器。图4示出随生物标记的数目从1增加到10的分类评分(特异性+灵敏性)的增加,其使用用于良性小结-肺癌组的朴素贝叶斯分类。图5示出对于良性小结对照组(实线)和肺癌疾病组(虚线),作为log转化的 RFU形式的累积分布函数(cdf)的SCFsR的测量的生物标记分布,以及它们的曲线拟合为正态cdf (短划线),以用于训练(train)朴素贝叶斯分类器。图6示出与本文所述的各种计算机执行方法一起使用的示例计算机系统。图7是一实施方案的指示个体患有肺癌的似然性的方法的流程图。图8是一实施方案的指示个体患有肺癌的似然性的方法的流程图。图9示出可以用于检测生物学样品中一个或多个肺癌生物标记的示例适配体测定。图10示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类器以区分 NSCLC与良性小结的频率的柱状图。图11示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类器以区分 NSCLC与无症状吸烟者的频率的柱状图。图12示出从位点一致(site-consistent)的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与良性小结的频率的柱状图。图13示出从位点一致的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与无症状吸烟者的频率的柱状图。图14示出从得自聚集和位点一致的标记组合的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与良性小结的频率的柱状图。图15示出从得自聚集和位点一致的标记组合的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与无症状吸烟者的频率的柱状图。图16示出得自pull-down实验的凝胶图像,其示出作为蛋白LBP、C9和IgM的捕获剂的适配体的特异性。对于每个凝胶,泳道1是来自链霉抗生物素蛋白-琼脂糖珠的洗脱物,泳道2是最终洗脱物,泳道是棚标记泳道(主要条带从上至下是110、50、30、15和 3. 5kDa) ο图17A示出一对柱状图,其总结了使用表1第5列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的单蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。图17B示出一对柱状图,其总结了使用表1第5列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的二蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。图17C示出一对柱状图,其总结了使用表1第5列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的三蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。图18A示出一对柱状图,其总结了使用表1第6列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的单蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。图18B示出一对柱状图,其总结了使用表1第6列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的二蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。图18C示出一对柱状图,其总结了使用表1第6列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的三蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。图19A示出使用选自完全组( )的2-10个标记的朴素贝叶斯分类器的灵敏性 +特异性评分,以及通过在用于良性小结对照组的分类器产生期间放弃最好的5个(■)、 10个(▲)和15个(X)标记获得的评分。图19B示出使用选自完全组( )的2-10个标记的朴素贝叶斯分类器的灵敏性 +特异性评分,以及通过在用于吸烟者对照组的分类器产生期间放弃最好的5个(■ )、10 个(▲)和15个(χ)标记获得的评分。图20A示出一组ROC曲线,其从表38和39中的数据对1至5个标记的组建模。图20B示出一组ROC曲线,其从对图19A的1至5个标记的组训练数据计算。发明详述现在详细描述本发明的代表性实施方案。虽然本发明结合列举的实施方案进行描述,但是应理解本发明并不限于这些实施方案。相反,本发明旨在涵盖可包含在如权利要求书所限定的本发明范围内的所有替代、修饰和等价物。本领域技术人员应意识到与本文所述的方法和材料相似或等价的许多方法和材料可用于或在本发明的范围内。本发明决不限于本文描述的方法和材料。除非特别说明,本文所用技术和学术术语具有本发明所属领域技术人员通常了解的相同含义。尽管与本文所述的方法、装置和材料相似或等价的任何方法、装置和材料可用于实施或测试本发明,但是现在描述一些优选的方法、装置和材料。本申请书中列举的所有出版物、公开的专利文件和专利申请均表示本申请所属领域技术人员的水平。本文列举的所有出版物、公开的专利文件和专利申请在此以如同每个单独的出版物、公开的专利文件或专利申请特别且单独指示相同的程度并入本文作参考。如在包括所附权利要求书在内的本申请中所用,除非特别说明,单数形式“一个 (a)”、“一个(an)”和“这个(the) ”包括复数形式,且与“至少一个”和“一个或多个”可以互换使用。因此,提及的“一个适配体”包括适配体的混合物,提及的“探针”包括探针的混合物等。如本文所用,术语“约”表示数值的不明显更改或变化,由此该数值所涉及的项目的基本功能未改变。如本文所用,术语“包含(comprises) ”、“包含(comprising) ”、“包括 (includes)”、“包括(including) ”、“含有(contains) ”、“含有(containing) ” 及它们的任何变体意图覆盖非排他的包含,由此包含、包括或含有一个元件或者一系列元件的过程、方法、方法限定产品或组成(composition of matter)不仅包括这些元件,而且可以包括未明确列举或这样的过程、方法、方法限定产品或组成固有的其他元件。本发明包括用于检测和诊断肺癌的生物标记、方法、装置、试剂、系统和试剂盒。
在一方面,本发明提供了一种或多种生物标记,其单独或以各种组合用于诊断肺癌,允许区分诊断肺小结是良性或恶性的,监测肺癌复发或寻址(address)其他临床指征。 如下文详细描述,示例性实施方案包括表1第2列提供的生物标记,这些生物标记使用基于多重适配体的测定来鉴定,所述测定在实施例1中,更特别是在实施例2中描述。表1第2列列出得自以下分析的发现来自NSCLC癌症病例的几百个个体血液样品以及来自吸烟者和来自诊断为具有良性肺小结的个体的几百个等价个体血液样品。吸烟者和良性小结组的设计使得肺癌测试与群体匹配可以具有最大益处。(这些病例和对照得自多个临床场所以模拟这样的测试可以应用的真实世界条件的范围)。潜在的生物标记在单独的样品而不是在混合疾病和对照血液中测量;这允许更好地理解与疾病(在这种情况下是肺癌)的存在和不存在相关的表型中个体和组的变化。由于对每个样品进行800个以上的蛋白测量,并且单独测量来自每个疾病和对照群体的几百个样品,所以表1第2列得自非常大的数据集合的分析。使用本文“生物标记的分类和疾病评分计算”章节中描述的方法分析测量结果。表1第2列列出了发现可用于区分得自NSCLC个体的样品与得自吸烟者和良性肺小结个体的“对照”样品的生物标记。使用本文所述的多重适配体测定,发现了 38个生物标记,其区分得自患有肺癌的个体的样品与得自吸烟者对照组中个体的样品(见表1第6 列)。相似地,使用多重适配体测定,发现了 40个生物标记,其区分得自NSCLC个体的样品与得自具有良性肺小结的人的样品(见表1第5列)。总之,这两列38和40个生物标记由 61个独特的生物标记组成,因为区分NSCLC与良性小结的生物标记的列表与区分NSCLC与不患有肺癌的吸烟者的生物标记的列表之间有相当大的重叠。虽然某些所述肺癌生物标记可单独用于检测和诊断肺癌,但是本文还描述了肺癌生物标记的多个子集的分组,其中每个分组或者子集选择可作为一组三个或更多个生物标记使用,这在本文中互换地称为“生物标记组”和一组。因此,本申请的各种实施方案提供了包含N个生物标记的组合,其中N是至少两个生物标记。在其他实施方案中,N选自2-61 个生物标记。仍然在其他实施方案中,N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、
2-45、2-50、2-55或2-61中的任意数。在其他实施方案中,N选自3-7、3-10、3-15、3_20、
3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-61中的任意数。在其他实施方案中,N选自
4-7、4-10、4-15、4-20、4-25,4-30、4-35,4-40、4-45、4-50、4-55或 4-61 中的任意数。在其他实施方案中,N选自 5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55 或 5-61 中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、
6-50、6-55或6-61中的任意数。在其他实施方案中,N选自7-10、7-15、7-20、7-25、7_30、
7-35、7-40、7-45、7-50、7-55或7-61中的任意数。在其他实施方案中,N选自8_10、8_15、
8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或 8-61 中的任意数。在其他实施方案中,N 选自 9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55 或 9-61 中的任意数。在其他实施方案中,N选自 10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55 或 10-61 中的任意数。应理解N可以选自包含类似但更高级的范围。在一实施方案中,可用于生物标记子集或者组的生物标记的数目基于生物标记值特定组合的灵敏性和特异性值。本文所用术语“灵敏性”和“特异性”是关于基于在个体的生物学样品中检测的一个或多个生物标记值来正确分类个体患有肺癌或不患有肺癌的能力。“灵敏性”指生物标记或多个生物标记关于正确分类患有肺癌的个体的性能。“特异性” 指生物标记或多个生物标记关于正确分类不患有肺癌的个体的性能。例如,用于测试一组对照样品和肺癌样品的一组标记的85 %特异性和90 %灵敏性指85 %的对照样品由该组正确分类为对照样品,并且90%的肺癌样品由该组正确分类为肺癌样品。期望或优选的最小值可以如实施例3所述确定。代表性标记组在表2-27中示出,其列出了一系列100个不同的3-15个生物标记的组,其具有每组的特异性和灵敏性的标示水平。这些组中每一个的每个标记出现的总数在每个表的底部示出。在一方面,在个体中通过以下方法检测或诊断肺癌对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记ERBB1、LRIG3或 SCFsR的至少一个和选自表1第2列的生物标记列表的至少N个额外的生物标记,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在个体中通过以下方法检测或诊断肺癌对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记ERBBl、LRIG3和SCFsR和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于1、2、3、4、5、6、7、8、9、10、11、12或13。在另一方面,在个体中通过以下方法检测或诊断肺癌,对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记ERBBl和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在个体中通过以下方法检测或诊断肺癌对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记LRIG3和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或 15。在另一方面,在个体中通过以下方法检测或诊断肺癌对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记SCFsR和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、 13,14 或 15。本文鉴定的肺癌生物标记表示较大数目的可用于有效检测或诊断肺癌的生物标记的子集或组的选择。期望数目的这类生物标记的选择取决于所选生物标记的特定组合。 重要的是记住用于检测或诊断肺癌的生物标记的组也可以包含在表1第2列中未发现的生物标记,并且包含在表1第2列中未发现的额外的生物标记可以减少选自表1第2列的特定子集或组中生物标记的数目。如果额外的生物医学信息与生物标记值联合用于建立对于给定测定可接受的灵敏性和特异性值,则用于子集或组的来自表1第2列的生物标记的数目也可以减少。可能影响用于生物标记的子集或组的生物标记数目的另一因素是用于从进行肺癌诊断的个体中获得生物学样品的方法。在精心控制的样品获取环境中,符合期望的灵敏性和特异性值必需的生物标记的数目会低于在样品收集、处理和贮存中可以存在更多变化的情况中的数目。在研究表1第2列所列的生物标记列表中,利用多个样品收集位点来收集数据以进行分类器训练。这提供了更稳健的生物标记,其对于样品收集、处理和贮存中的变化较不敏感,但是如果训练数据都在非常相似条件下获得,则还可以要求子集或组中更大的生物标记数目。
本申请的一方面可以参考图IA和B来一般性描述。生物学样品获得自所关注的一个或多个个体。然后测定该生物学样品以检测所关注的一个或多个(N个)生物标记的存在,并确定所述N个生物标记的每一个的生物标记值(在图IB中称为标记RFU)。一旦检测生物标记并指定生物标记值,则如本文详细描述地对每个标记进行评分或者分类。然后组合标记评分以提供总诊断评分,其表示获取样品的个体患有肺癌的似然性。如本文所用,“肺(lung) ”与“肺(pulmonary) ”可互换使用。如本文所用,“吸烟者”指具有吸烟历史的个体。“生物学样品”、“样品,,和“测试样品,,在本文可互换使用,指获得自或以另外的方式源自个体的任何材料、生物液体、组织或者细胞。这包括血液(包括全血、白细胞、外周血单核细胞、血沉棕黄层(buffy coat)、血浆和血清)、痰液、泪液、粘液、洗鼻液(wash)、鼻抽吸物(aspirate)、呼吸物(breath)、尿液、精液、唾液、脑膜液(meningeal fluid)、羊水、腺体液(glandular fluid)、淋巴液、乳头抽吸物、支气管抽吸物、滑液、关节抽吸物、细胞、细胞提取物和脑脊液。其还包括上述所有材料的实验分离级分。例如,血液样品可以分级分离为血清或含有诸如红细胞或白细胞(淋巴细胞)的特定类型血细胞的级分。如果需要,样品可以是来自个体的样品的组合,如组织与液体样品的组合。术语“生物学样品”也包括含有均质固体材料的材料,如来自粪便样品、组织样品或组织活检样品的材料。术语“生物学样品”也包括源自组织培养或者细胞培养的材料。可以使用获得生物学样品的任何合适方法;示例性方法包括如静脉切开放血术、拭子(如口腔拭子)以及细针抽吸活检方法。易受细针抽吸影响的示例性组织包括淋巴结、肺、肺洗液、BAL(支气管肺泡灌洗液)、甲状腺、乳腺和肝。样品也可以通过显微切割(如激光捕获显微切割(LCM)或激光显微切割(LMD))、 膀胱冲洗、涂片(如PAP涂片)或导管灌洗收集。获得自或源自个体的“生物学样品”包括在获得自所述个体之后已经通过任何合适方式处理的任何此类样品。此外,应认识到生物学样品可以通过从多个体中取得生物学样品并将它们混合或混合每个个体的生物学样品的等份而获得。混合的样品可以作为来自单个个体的样品进行处理,并且如果在混合的样品中确定癌症的存在,则可以将每个个体的生物学样品再进行测试以确定哪个/哪些个体患有肺癌。对于本说明书的目的,短语“归因于来自个体的生物学样品的数据”指所述数据以某种形式源自所述个体的生物学样品或利用所述个体的生物学样品产生。数据在产生后可以被重新格式化、修改或以数学方式改变至某种程度,例如通过从一种测量系统中的单位转变为另一测量系统中的单位;但是应理解,数据源自所述生物学样品或利用所述生物学样品产生。“靶标”、“靶分子”和“分析物”在本文可互换使用,指可能存在于生物学样品中的任何所关注的分子。“所关注的分子”包括特定分子的任何微小变化,如在蛋白的情况下,例如氨基酸序列的微小变化、二硫键形成、糖基化、脂质化、乙酰化、磷酸化或者任何其他操作或修饰,如与基本不改变分子同一性的标记组分偶联。“靶分子”、“靶标”或“分析物”是一种类型或种类的分子或多分子结构的一组拷贝。“靶分子”、“靶标”和“分析物”指一组以上这样的分子。示例性靶分子包括蛋白、多肽、核酸、碳水化合物、脂质、多糖、糖蛋白、激素、受体、抗原、抗体、affybodies,抗体模拟物(mimic)、病毒、病原体、毒性物质、底物、代谢物、过渡态类似物、辅因子、抑制剂、药物、染料、营养素、生长因子、细胞、组织以及前述物质的任何片段或部分。如本文所用,“多肽”、“肽”和“蛋白”在本文可互换使用,指任何长度的氨基酸聚合物。聚合物可以是线性或支化的,其可以包含修饰的氨基酸,并且其可以被非氨基酸中断。 该术语还涵盖已经被天然修饰或者通过干预修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分偶联。该定义还包括例如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。多肽可以是单链或缔合(associated)链。该定义还包括前蛋白和完整的成熟蛋白; 源生自成熟蛋白的肽或多肽;蛋白的片段;剪接变体;蛋白的重组形式;具有氨基酸修饰、 缺失或取代的蛋白变体;消化;以及翻译后修饰,如糖基化、乙酰化、磷酸化等。如本文所用,“标记”和“生物标记”可互换使用,指指示个体中正常或异常过程或者个体中疾病或其他病症的迹象或者是个体中正常或异常过程或者个体中疾病或其他病症的迹象的的靶分子。更具体地,“标记”或“生物标记”是与无论正常与否的特定生理状态或过程的存在相关的解剖学、生理学、生物化学或分子参数,并且如果是异常的,则无论是慢性或急性的。生物标记可以通过各种方法检测和测量,包括实验室测定和医学成像。当生物标记是蛋白时,也可以使用对应的表达作为生物学样品中对应蛋白生物标记的量或存在或不存在或者编码该生物标记的基因或控制该生物标记表达的蛋白的甲基化状态的替代测量。如本文所用,“生物标记值”、“值”、“生物标记水平”和“水平”在本文可互换使用,指使用任何分析方法来检测生物学样品中的生物标记而进行的测量,其示出所述生物学样品中的生物标记、对于所述生物标记或对应于所述生物标记的存在、不存在、绝对量或浓度、 相对量或浓度、效价、水平、表达水平、测量水平的比率等。所述“值”或“水平”的确切性质取决于用于检测生物标记的特定分析方法的具体设计和组分。当生物标记表示个体中异常过程或疾病或其他病症或者是个体中异常过程或疾病或其他病症的迹象时,该生物标记通常描述为与表示个体中正常过程或不存在疾病或其他病症或者是个体中正常过程或不存在疾病或其他病症的迹象的生物标记的表达水平或值相比时是过表达或低表达的。“上调”、“上调的”、“过表达”、“过表达的”及其任何变体在本文可互换使用,指生物学样品中生物标记的值或水平高于通常在来自健康或正常个体的相似生物学样品中检测的所述生物标记的值或水平(或者值或水平的范围)。该术语也可以指生物学样品中生物标记的值或水平高于在特定疾病的不同阶段检测的生物标记的值或水平(或者值或水平的范围)。“下调”、“下调的”、“低表达”或“表达低的”及其任何变体在本文可互换使用,指生物学样品中生物标记的值或水平低于通常在来自健康或正常个体的相似生物学样品中检测的生物标记的值或水平(或者值或水平的范围)。该术语也指生物学样品中生物标记的值或水平低于在特定疾病的不同阶段检测的所述生物标记的值或水平(或者值或水平的范围)。此外,过表达的或低表达的生物标记也可以指与所述生物标记的“正常”表达水平或值相比是“差异表达的”或具有“不同水平”或“不同值”,所述“正常”表达水平或值表示个体中正常过程或不存在疾病或其他病症或者是个体中正常过程或不存在疾病或其他病症的迹象。因此,生物标记的“差异表达”也可以指与所述生物标记的“正常”表达水平不同。术语“不同的基因表达”和“差异表达”在本文可互换使用,指在患有指定疾病的对象中基因(或其对应蛋白表达产物)的表达被激活至相对于其在正常或对照对象中的表达较高或较低的水平。该术语还包括基因(或其对应的蛋白表达产物)的表达在相同疾病的不同各阶段被激活至较高或较低水平。也应理解差异表达的基因可以在核酸水平或蛋白水平激活或抑制,或者可以进行可变剪接以获得不同的多肽产物。这样的差异可以通过许多改变证实,包括多肽的mRNA水平、表面表达、分泌或其他分配(partitioning)。不同的基因表达可以包括比较两个或更多个基因或者它们的基因产物之间的表达;或者比较两个或更多个基因或者它们的基因产物之间的表达的比率;或者甚至比较相同基因的两种不同的加工产物,其在正常对象与患病对象之间或者在相同疾病的不同阶段之间是不同的。差异表达包括在例如正常和患病细胞或者经历不同疾病事件或疾病阶段的细胞中的基因或其表达产物在时间或细胞表达模式中的定量以及定性的差异。如本文所用,“个体”指测试对象或患者。个体可以是哺乳动物或非哺乳动物。在一些实施方案中,个体是哺乳动物。哺乳动物个体可以是人或非人。在一些实施方案中,个体是人。健康或正常个体是其中通过常规诊断方法未检测出所关注的疾病或病症(包括例如肺疾病、肺相关疾病或其他肺病症)的个体。“诊断(Diagnose) ”、“诊断(diagnosing) ”、“诊断(diagnosis) ”及其变体指基于个体相关的一种或多种迹象、症状、数据或其他信息对所述个体的健康状况或病症的检测、 确定或识别。个体的健康状况可以诊断为健康/正常(即诊断为不存在疾病或病症)或者诊断为患病/异常(即诊断为存在疾病或病症或者对疾病或者病症的特性的评价)。对于特定疾病或病症,术语“诊断(Diagnose)”、“诊断(diagnosing) ”、“诊断(diagnosis) ”等涵盖对疾病的初始检测;对疾病的表征或分类;疾病进展、缓解或复发的检测;以及在给予个体治疗或疗法后疾病应答的检测。肺癌的诊断包括区分患有癌症与不患有癌症的个体, 包括吸烟者和非吸烟者。其还包括区分良性肺小结与癌性肺小结。“预后(Prognose) ”、“预后(prognosing) ”、“预后(prognosis) ”及其变体指预测患有疾病或病症的个体中所述疾病或病症的未来进程(如预测患者存活),这个术语涵盖在给予个体治疗或疗法后评价疾病的应答。“评价(Evaluate) ”、“评价(evaluating) ”、“评价(evaluation) ” 及其变体涵盖 “诊断”和“预后”,也涵盖对不患病个体的疾病或病症的未来进程的确定或预测以及确定或者预测在表面上已经治愈疾病的个体中所述疾病或病症复发的似然性。术语“评价”还包括评价个体对疗法的应答,例如预测个体是否可能对治疗剂顺利地应答,或者不大可能对治疗剂应答(或者会例如经历毒性或其他不期望的副作用);选择给予个体的治疗剂;或者监测或确定个体对已经给予该个体的疗法的应答。因此,“评价”肺癌可以包括例如以下任何方面预后个体中肺癌的未来进程;预测表面上已经治愈肺癌的个体中肺癌的复发;或者确定或预测个体对于肺癌治疗的应答;或者基于确定源自个体生物学样品的生物标记值来选择给予该个体的肺癌治疗。任何如下实例均可以称作“诊断”或“评价”肺癌最初检测肺癌的存在或不存在; 确定肺癌的具体阶段、类型或亚型或者其他分类或特性;确定肺小结是良性病变或恶性肺肿瘤;或者检测/监测肺癌进展(如监测肺肿瘤生长或转移扩散)、缓解或复发。
如本文所用,“额外的生物医学信息”指除了使用本文所述任何生物标记之外的对个体所做的与肺癌风险相关的一个或多个评价。“额外的生物医学信息”包括如下任何方面个体的物理描述(physical descriptor)、通过CT成像观察到的肺小结的物理描述、个体的身高和/或体重、个体的性别、个体的种族、吸烟史、职业史、暴露于已知致癌物(如暴露于任何石棉、氡气、化学品、来自火的烟以及空气污染,这可包括来自静止或移动来源的排放物,如工业/工厂或汽车/海运/飞机排放物)、暴露于二手烟、肺癌(或其他癌症) 家族史、肺小结的存在、小结的大小、小结的部位、小结的形态学(如通过CT成像、磨玻璃影 (GGO)观察,实体、非实体)、小结的边界特点(如平滑、分叶、锐利及光滑、针状、浸润)等。 吸烟史通常以术语“包年(pack year)”量化,其指一个人吸烟的年数乘以每天吸烟的平均包数。例如,平均每天吸一包烟共35年的人称作吸烟史为35包年。额外的生物医学信息可以通过使用本领域已知的常规技术得自个体,如通过使用常规患者问卷调查或健康史问卷调查等得自个体自身,或者得自医学从业人员等。或者,额外的生物医学信息可以得自常规成像技术,包括CT成像(如低剂量CT成像)和X-射线检查。生物标记水平的测试联合任何额外的生物医学信息的评价与单独测试生物标记或单独评价额外的生物医学信息的任何特定项目(如单独的CT成像)相比,可以例如改善检测肺癌(或其他肺癌相关用途) 的灵敏性、特异性和/或AUC。术语“曲线下面积”或“AUC”指接受者操作特性(ROC)曲线下的面积,这两个术语均为本领域所熟知。AUC测量可以用于比较完整数据范围内的分类器的精确性。具有较大AUC的分类器具有较大的能力来正确分类两个所关注的组(如肺癌样品与正常或对照样品)之间的未知情况。ROC曲线可以用于对特定特征的性能作图(如本文描述的任何生物标记和/或任何额外的生物医学信息项目),以在两个群体之间进行区分(如患有肺癌的病例与无肺癌的对照)。通常,整个群体(如病例与对照)的特征数据基于单个特征的值递增分类。然后,对于该特征的每个值,计算数据的真阳性率和假阳性率。真阳性率通过计数高于该特征值的病例数,然后除以病例总数而确定。假阳性率通过计数高于该特征值的对照数,然后除以对照总数而确定。尽管这个定义指其中特征在病例中与在对照中相比升高的情况,但是这个定义也适用于其中特征在病例中与在对照中相比降低的情况(在这种情况下,计数低于该特征值的样品)。ROC曲线可以对单个特征以及其他单个输出产生,例如两个或更多个特征的组合可以是数学组合(如加、减、乘等)以提供单个的和值,该单个的和值可以在ROC曲线中绘制。此外,其中组合产生单个输出值的多个特征的任意组合可以在ROC曲线中绘制。这些特征的组合可以包括测试。ROC曲线是测试的真阳性率(灵敏性)对测试的假阳性率(1-特异性)的作图。如本文所用,“检测”或者“确定”生物标记值包括使用观察和记录对应于生物标记值的信号所需的设备以及产生该信号所需的材料。在一些实施方案中,生物标记值使用任何合适方法检测,包括荧光、化学发光、表面等离子共振、表面声波、质谱、红外线光谱、拉曼光谱、原子力显微术、扫描隧道显微术、电子化学检测方法、核磁共振、量子点等。“固体支持物”在本文指具有分子可以直接或间接,通过共价键或非共价键附着的表面的任何支持物。“固体支持物”可以具有各种物理形式,可以包括例如膜;芯片(如蛋白芯片);玻片(如载玻片或盖玻片);柱;空心、固体、半固体、有孔或有腔的颗粒,例如珠;凝胶;纤维,包括光学纤维材料;基质;及样品容器。示例性样品容器包括样品孔、管、毛细管、小瓶及能够容纳样品的任何其他容器、沟槽或凹陷。样品容器可以包含于多样品平台上,如微量滴定板、玻片、微流体装置等。支持物可以由天然或合成材料、有机或无机材料组成。其上附着捕获剂的固体支持物的成分通常取决于附着方法(如共价附着)。其他示例性容器包括微滴和微流体控制的或大量的油/水性乳液,在其中可以进行测定和相关操作。合适的固体支持物包括例如塑料、树脂、多糖、硅石或基于硅石的材料、官能化玻璃、改性的硅、 碳、金属、无机玻璃、膜、尼龙、天然纤维(例如丝、羊毛和棉)、聚合物等。包含固体支持物的材料可以包含反应基团,例如羧基、氨基或羟基以用于捕获剂的附着。聚合固体支持物可以包括如聚苯乙烯、聚对苯二甲酸乙二醇酯、聚乙酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、聚甲基丙烯酸甲酯、聚四氟乙烯、丁基橡胶、苯乙烯丁二烯橡胶、天然橡胶、聚乙烯、聚丙烯、(聚)四氟乙烯、(聚)偏氟乙烯、聚碳酸酯和聚甲基戊烯。可以使用的合适固体支持物颗粒包括如编码的颗粒,如Luminex -型编码的颗粒、磁性颗粒以及玻璃颗粒。生物标记的示例性用途在一些示例性实施方案中,本发明提供了诊断个体的肺癌的方法,所述方法通过检测对应于个体循环如血清或血浆中存在的一个或多个生物标记的一个或多个生物标记值进行,并且通过任何数目的分析方法进行,包括本文所述任何分析方法。这些生物标记例如在肺癌个体中与在无肺癌个体中差异表达。生物标记在个体中的差异表达的检测可以用于例如早期诊断肺癌、区分良性与恶性肺小结(例如在计算机断层(CT)扫描上观察到的小结)、监测肺癌复发或者用于其他临床指征。本文所述的任何生物标记可以用于肺癌的各种临床指征,包括如下任何方面检测肺癌(如在高危个体或人群中);表征肺癌(如确定肺癌类型、亚型或阶段),如通过区分非小细胞肺癌(NSCLC)与小细胞肺癌(SCLC)和/或区分腺癌与鳞状细胞癌(或者促进组织病理学);确定肺小结是良性小结或恶性肺肿瘤;确定肺癌预后;监测肺癌进展或缓解; 监测肺癌复发;监测转移;治疗选择;监测对治疗剂或其他治疗的应答;对个体的计算机断层扫描(CT)筛查进行分层(stratification)(如鉴定面临较高肺癌风险的那些个体,从而更可能得益于螺旋CT筛查,因此增加CT的阳性预测值);将生物标记测试与诸如吸烟史等的额外的生物医学信息组合,或者与小结大小、形态学等组合(如提供与单独的CT测试或生物标记测试相比具有增加的诊断性能的测定);促进诊断肺小结为恶性或良性;促进在 CT上观察到肺癌小结就做出临床决定(例如,如果小结被视为低风险的,例如如果基于生物标记的测试是阴性的,有或无小结大小的归类,则要求重复CT扫描;或者,如果小结被视为中等至高风险的,例如如果基于生物标记的测试是阳性的,有或无小结大小的归类,则考虑进行活组织检查);以及促进决定临床后续处理(如在CT上观察到未钙化小结后是否实施重复CT扫描、细针活组织检查或胸廓切开术)。生物标记测试可以改善单独的CT筛查的阳性预测值(PPV)。除了联合CT筛查之外,本文所述的生物标记也可以与用于与肺癌的任何其他成像方式如胸部X-射线检查联合使用。此外,所述生物标记也可以用于在通过成像方式或其他临床相关性检测肺癌指征之前或者在症状出现之前允许这些应用的某一些。本文所述的生物标记可以用于诊断肺癌的示例性方式是未知患有肺癌的个体中一个或多个所述生物标记的差异表达可以表明该个体患有肺癌,从而使得可以在治疗最有效的疾病早期检测肺癌,也许在通过其他方式检测肺癌之前或者在症状出现之前检测肺癌。肺癌期间一个或多个生物标记的过表达可以指示肺癌的进展,如肺肿瘤生长和/或转移(因此表示不良预后);而一个或多个生物标记差异表达程度的降低(即在随后的生物标记测试中,个体中的表达水平趋向或接近“正常”表达水平)可以指示肺癌的缓解,如肺肿瘤缩小(因此提示良好或较好的预后)。相似地,在肺癌治疗期间一个或多个生物标记差异表达的程度增加(即在随后的生物标记测试中,个体中的表达水平进一步远离“正常”表达水平)可以指示肺癌的进展,并因此表示所述治疗是无效的;而在肺癌治疗期间一个或多个生物标记的差异表达降低可以指示肺癌的缓解,并因此表示该治疗是成功的。此外,在个体看起来已经治愈肺癌之后一个或多个生物标记的差异表达增加或降低可指示肺癌的复发。在这种情况下,例如可以在早期对个体重新启动治疗(或者如果个体维持治疗,则修改治疗方案以增加剂量和/或频率),否则直至晚期还未检测到肺癌的复发。此外,个体中一个或多个生物标记的差异表达水平可以预测个体对特定治疗剂的应答。在监测肺癌复发或进展中,生物标记表达水平的改变可以指示需要重复成像(如重复CT扫描),例如来确定肺癌活性或确定需要改变治疗方案。本文所述的任何生物标记的检测可以在肺癌治疗后使用或者与肺癌治疗联合使用,如评价治疗的成功或者监测治疗后肺癌的缓解、复发和/或进展(包括转移)。肺癌治疗可以包括例如给予个体治疗剂、进行手术(如手术切除至少一部分肺肿瘤)、给予放疗或本领域所用的任何其他类型肺癌治疗方法以及这些治疗的任意组合。例如,任何生物标记可以在治疗后检测至少一次,或者在治疗后检测多次(如定期检测),或者可以在治疗之前和之后检测。个体中任何生物标记随时间的差异表达水平可以指示肺癌的进展、缓解或复发, 其实例包括如下方面生物标记的表达水平在治疗后与治疗前相比增加或降低;生物标记的表达水平在治疗后较晚时间点与治疗后较早时间点相比增加或降低;以及生物标记的表达水平在治疗后的一个时间点与该生物标记的正常水平相比不同。作为具体的实例,本文所述的任何生物标记的生物标记水平可以在手术前和手术后(例如手术后2-4周)的血清样品中确定。手术后样品与手术前样品相比生物标记表达水平的增加可以指示肺癌的进展(如不成功的手术);而手术后样品与手术前样品相比生物标记表达水平的降低可以指示肺癌的消退(如成功除去肺肿瘤的手术)。生物标记水平的类似分析可以在其他形式治疗之前和之后进行,如在放疗或者给予治疗剂或癌症疫苗之前和之后进行。除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平也可以联合SNP或者指示疾病易感性风险增加的其他遗传病变或变异性的确定进行(见例如Amos et al·,Nature Genetics 40,616-622(2009)) 除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平也可以联合CT筛查进行。例如,生物标记可以促进实施CT筛查的医学和经济理由,例如筛查面临肺癌风险的大量无临床症状群体(如吸烟者)。例如,生物标记水平的“CT前”测试可以用于分类CT筛查的高危个体,如基于个体生物标记水平来鉴定面临肺癌最高危险并且应当优先进行CT筛查的那些个体。如果实施CT测试,则可以测量一个或多个生物标记的生物标记水平(如通过血清或血浆样品的适配体测定确定),并且可以联合额外的生物医学信息来评价诊断评分(如通过CT测试确定肿瘤参数),以增强单独的CT或生物标记测试的阳性预测值(PPV)。确定生物标记水平的“CT后”适配体组可以用于确定通过CT(或其他成像方式)观察到的肺小结是恶性或良性的似然性。
本文所述的任何生物标记的检测可以用于CT后测试。例如,生物标记测试可以显著消除或降低单独CT的测试假阳性数目。此外,生物标记检测可以促进患者的治疗。例如, 如果肺小结的大小小于5mm,则生物标记测试的结果可以使患者在更早的时间从“观察和等待”进展至活组织检查;如果肺小结为5-9mm,则生物标记测试可以排除对假阳性扫描使用活组织检查或胸廓切开术;以及如果肺小结大于10mm,则生物标记测试可以排除具有良性小结的这些患者亚群的手术。基于生物标记测试在一些患者中排除活组织检查的需求是有益的,因为存在与小结活组织检查相关的显著发病率以及难以根据小结的位置获得小结组织。相似地,在一些患者中排除手术的需要,如其小结实际上是良性的那些患者,会避免与手术相关的不必要风险和花费。除了联合CT筛查测试生物标记水平之外(如联合在CT扫描上观察到的肺小结的大小或其他特征评价生物标记水平),关于生物标记的信息也可以联合其他类型数据进行评价,特别是指示个体患有肺癌风险的数据(如患者临床史、症状、癌症家族史、诸如个体是否是吸烟者的风险因素和/或其他生物标记的状况等)。这些不同数据可以通过自动化方法评价,如计算机程序/软件,其可以在计算机或其他设备/装置中实施。任何所述的生物标记也可以用于成像测试中。例如,显像剂可以与任何所述生物标记偶联,这可以用于辅助肺癌诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。生物标记和生物标记值的检测和确定本文所述的生物标记的生物标记值可以使用任何已知的分析方法检测。在一实施方案中,生物标记值使用捕获试剂(capture agent)检测。如本文所用,“捕获剂(capture reagent) ”或“捕获试剂”指能够特异性结合生物标记的分子。在一些实施方案中,捕获剂可以在溶液中暴露于生物标记,或者可以暴露于生物标记,同时该捕获剂固定在固体支持物上。在其他实施方案中,捕获剂含有与固体支持物上的第二特征反应的特征。在这些实施方案中,捕获剂可以在溶液中暴露于生物标记,然后该捕获剂上的特征可以联合固体支持物上的第二特征来将所述生物标记固定在固体支持物上。捕获剂基于进行的分析类型加以选择。捕获剂包括但不限于适配体、抗体、adnectin、锚蛋白、其他抗体模拟物(mimetic) 及其他蛋白支架、自身抗体、嵌合物、小分子、F(ab' )2片段、单链抗体片段、Fv片段、单链 Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体(nanobodies)、印迹聚合物 (imprinted polymer)、高亲合性多聚体(avimer)、肽模拟物(ρ印tidomimetic)、激素受体、 细胞因子受体及合成受体以及这些物质的修饰物和片段。在一些实施方案中,生物标记值使用生物标记/捕获剂复合物来检测。在其他实施方案中,生物标记值得自生物标记/捕获剂复合物,并且例如作为生物标记/捕获剂相互作用随后的反应结果间接检测,但是依赖于生物标记/捕获剂复合物的形成。在一些实施方案中,生物标记值从生物学样品中的生物学标记直接检测。在一实施方案中,生物标记使用多重形式检测,这允许在生物学样品中同时检测两个或更多个生物标记。在多重形式的一实施方案中,捕获剂直接或间接、共价或非共价地固定在固体支持物上分散的位置。在另一实施方案中,多重形式使用分离的固体支持物,其中每个固体支持物具有与该固体支持物相关的独特捕获剂,例如量子点。在另一实施方案中,单独的装置用于检测生物学样品中待检测的多个生物标记的每一个。可以配置单独的装置以允许同时处理生物学样品中的每个生物标记。例如,可以使用微量滴定板,由此该板中的每个孔用于独特地分析生物学样品中待检测的多个生物标记之一。在一个或多个前述实施方案中,可以使用荧光标签(tag)来标记生物标记/捕获复合物的组分以允许检测生物标记值。在一些实施方案中,使用已知技术可以将荧光标记 (fluorescent label)与对本文所述的任何生物标记特异性的捕获剂偶联,然后该荧光标记可以用于检测对应的生物标记值。合适的荧光标记包括稀土元素螯合物、荧光素及其衍生物、罗丹明及其衍生物、丹磺酰、别藻蓝蛋白、PBXL-3、Qdot 605、丽丝胺(Lissamine)、藻红蛋白、德克萨斯红及其他这样的化合物。在一实施方案中,荧光标记是荧光染料分子。在一些实施方案中,荧光染料分子包含至少一个取代的吲哚环(indolium ring)体系,其中吲哚环的3-碳上的取代基含有化学反应性基团或偶联的物质。在一些实施方案中,染料分子包括AlexFluor分子,例如 AlexaFluor 488、AlexaFluor 532、AlexaFluor 647、AlexaFluor 680 或 AlexaFluor 700。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,如两种不同的 AlexaFluor分子。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,并且两种染料分子具有不同的发射光谱。荧光可以用与大范围的测定形式相容的许多仪器测量。例如,已经设计了分光荧光计来分析微量滴定板、显微镜载玻片、印刷阵列(printed array)、小杯等。见I^inciples of Fluorescence Spectroscopy, by J. R. Lakowicz, Springer Science+Business Media, Inc.,2004。 见 Bioluminescence & Chemiluminescence :Progress & Current Applications ;Philip E. Stanley and Larry J. Kricka editors, World Scientific Publishing Company, January 2002。在一个或多个前述实施方案中,化学发光标签可以任选地用于标记生物标记/捕获复合物的组分以允许检测生物标记值。合适的化学发光材料包括任何草酰氯、Rodamin 6G、Ru(bipy)32+、TMAE (四三(二甲胺基)乙烯(tetrakis (dimethylamino) ethylene))、 连苯三酚(1,2,3-三羟基苯(l,2,3-trihydroXibenzene))、光泽精、过氧草酸酯 (peroxyoxalate)、芳基草酸酯、吖啶酯(Acridinium ester)、二氧杂环丁烧(dioxetane)寸。仍然在其他实施方案中,检测方法包括酶/底物组合,其产生对应于生物标记值的可检测信号。通常,酶催化生色底物的化学改变,这种改变可以使用多种技术测量,包括分光光度法、荧光及化学发光。合适的酶包括例如萤光素酶、萤光素、苹果酸脱氢酶、脲酶、 辣根过氧化物酶(HRPO)、碱性磷酸酶、β-半乳糖苷酶、葡糖淀粉酶、溶菌酶、葡萄糖氧化酶、半乳糖氧化酶及葡萄糖-6-磷酸脱氢酶、尿酸氧化酶、黄嘌呤氧化酶、乳过氧化物酶、微过氧化物酶等。仍然在其他实施方案中,检测方法可以是产生可测量信号的荧光、化学发光、放射性核素或酶/底物组合的组合。多种方式的信号在生物标记测定形式中可以具有独特且有利的特性。更特别地,本文所述的生物标记的生物标记值可以使用已知的分析方法来检测, 包括单重适配体测定、多重适配体测定、单重或多重免疫测定、mRNA表达谱、miRNA表达谱、质谱分析、组织学/细胞学方法等,这在下文中详细地描述。使用基于适配体的测定确定生物标记值检测和定量生物学样品及其他样品中生理学上有意义的分子的测定在科学研究和卫生保健领域是重要的工具。一类这样的测定包括使用包含固定在固体支持物上的一个或多个适配体的微阵列。所述适配体各自能够以高特异性方式和非常高的亲和力结合靶分子。见例如题为“核酸配体”的美国专利第5,475,096号,还见例如美国专利第6,242, 246 号、美国专利第6,458,543号和美国专利第6,503,715号,这些专利的题目均是“核酸配体诊断生物芯片”。一旦使微阵列与样品接触,则适配体结合所述样品中存在的它们各自的靶分子,从而允许确定对应于生物标记的生物标记值。如本文所用,“适配体”指对靶分子具有特异性结合亲和力的核酸。技术人员应当了解到亲和力相互作用的问题关键程度;然而在本文中,适配体对其靶标的“特异性结合亲和力”指适配体通常以与其结合测试样品中其他组分的亲和力相比更高程度的亲和力结合其靶标。“适配体”是一种类型或物种的核酸分子的一系列拷贝,其具有特定的核苷酸序列。 适配体可包含任何合适数目的核苷酸,包括任何数目的化学修饰的核苷酸。“适配体”指多于一个的这种系列的分子。不同的适配体可以具有相同或不同数目的核苷酸。适配体可以是DNA或RNA或化学修饰的核酸,并且可以是单链、双链的或者含有双链区,以及可以包含较高级别的结构。适配体也可以是光适配体(photoaptamer),其中该适配体中包含光反应性或化学反应性官能团以允许其与其对应靶标共价连接。本文公开的任何适配体方法可以包括使用特异性结合相同靶分子的两种或更多种适配体。如下文进一步描述,适配体可以包含标签。如果适配体包含标签,则该适配体的所有拷贝不需要具有相同的标签。此外, 如果不同的适配体各自包含标签,则这些不同的适配体可以具有相同的标签或者不同的标签。适配体可以使用任何已知方法鉴定,包括SELEX方法。一旦鉴定,则可以根据任何已知方法制备或合成适配体,这些已知方法包括化学合成方法和酶促合成方法。术语“SELEX”和“SELEX方法”在本文可互换使用,通常指(1)与O)的组合,其中 (1)是选择以期望的方式与靶分子相互作用的适配体,例如以高亲和力结合蛋白,(2)是扩增那些选择的核酸。SELEX方法可用于鉴定对特定靶标或生物标记具有高亲和力的适配体。SELEX通常包括制备核酸的候选混合物;使所述候选混合物与期望的靶分子结合以形成亲和力复合物;分离所述亲和力复合物与未结合的候选核酸;使核酸与所述亲和力复合物分开并分离所述核酸;纯化所述核酸;以及鉴定特异性适配体序列。所述方法可以包括多次循环以进一步精制所选适配体的亲和力。所述方法可以包括在该方法的一个或多个点处的扩增步骤。见例如题为“核酸配体”的美国专利第5,475,096号。SELEX方法可以用于产生与适配体的靶标共价结合的适配体,以及与适配体的靶标非共价结合的适配体。见例如题为“通过指数富集的核酸配体的系统进化Chemi-SELEX”的美国专利第5,705,337 号。SELEX方法可以用于鉴定含有修饰的核苷酸的高亲和力适配体,所述修饰的核苷酸赋予该适配体改善的特性,例如改善的体内稳定性或改善的递送特性。此类修饰的实例包括核糖和/或磷酸和/或碱基位置的化学取代。通过SELEX方法鉴定的含有修饰的核苷酸的适配体描述于题为“含有修饰的核苷酸的高亲和力核酸配体”的美国专利第5,660,985号,其描述了含有在嘧啶的5'-和2'-位置处经化学修饰的核苷酸衍生物的寡核苷酸。 见上文,美国专利第5,580,737号描述了高特异性适配体,其含有由2'-氨基O' -NH2)、 2'-F)和/或2' -0-甲基O' -OMe)修饰的一个或多个核苷酸。还见题为
“SELEX和PH0T0SELEX,,的美国专利申请公开20090098M9,其描述了具有扩展的物理和化学性质的核酸文库及其在SELEX和photoSELEX中的用途。SELEX也可用于鉴定具有期望的解离速率(off-rate)特性的适配体。见题为“产生具有改善的解离速率的适配体的方法”的美国专利申请公开20090004667,其描述了产生可以结合靶分子的适配体的改进SELEX方法。描述了产生与各自的靶分子具有较慢解离速率的适配体和光适配体的方法。所述方法包括使候选混合物与靶分子接触;允许形成核酸-靶标复合物;以及进行缓慢解离速率富集过程,其中具有快解离速率的核酸-靶标复合物解离并不再形成,而具有慢解离速率的复合物会保持完整。此外,所述方法包括在产生候选核酸混合物中使用修饰的核苷酸,以产生具有改善的解离速率性能的适配体。许多这样的测定使用包含光反应性官能团的适配体,这允许适配体与其靶分子共价结合或“光交联”。见例如题为“核酸配体诊断生物芯片”的美国专利第6,544, 776 号。这些光反应性适配体也称作光适配体。见例如美国专利第5,763,177号、美国专利第 6,001,577号和美国专利第6,291, 184号,所述专利的题目均是“通过指数富集的核酸配体的系统进化核酸配体的光选择和溶液SELEX”;还见例如题为“核酸配体的光选择”的美国专利第6,458,539号。在使微阵列与样品接触并使光适配体具有结合其靶分子的机会之后,将该光适配体光激活并洗涤固体支持物以除去任何非特异性结合的分子。可以使用严格洗涤条件,因为结合光适配体的靶分子由于该光适配体上光激活的官能团所产生的共价键而通常未被除去。在这种方式中,测定允许检测对应于测试样品中生物标记的生物标记值。在这两种测定形式中,适配体在与样品接触之前固定在固体支持物上。然而,在某些情况下,在与样品接触之前固定适配体也许无法提供最佳的测定。例如,预固定适配体可能导致适配体与靶分子在固体支持物表面上的无效混合,这可能导致漫长的反应时间及因此的延长的孵育时间以允许适配体与其靶分子有效结合。此外,当光适配体用于测定并且取决于用作固体支持物的材料时,该固体支持物可能趋于分散或吸收用于实现光适配体与其靶分子之间的共价键形成的光。此外,取决于所用的方法,结合适配体的靶分子的检测可能不准确,因为固体支持物的表面也可能暴露于且受所用的任何标记剂的影响。最后,适配体固定在固体支持物上通常包括在适配体暴露于样品之前的适配体制备步骤(即固定), 这个制备步骤可能影响适配体的活性或功能性。还描述了适配体测定,其允许适配体在溶液中捕获其靶标,然后在检测之前使用设计为除去适配体-靶标混合物中特定组分的分离步骤(见题为“测试样品的多重分析”的美国专利申请公开20090042206)。所述适配体测定方法允许检测和定量测试样品中的非核酸靶标(如蛋白靶标),这通过检测和定量核酸(即适配体)进行。所述方法产生核酸替代物(surrogate)(即适配体)以检测和定量非核酸靶标,由此允许包括扩增在内的许多核酸技术用于包括蛋白靶标在内的更大范围的期望靶标。可以构建适配体以促进从适配体生物标记复合物(或光适配体生物标记共价复合物)分离测定组分,以及允许分离适配体以进行检测和/或定量。在一实施方案中,这些构建体可以包含适配体序列中可裂解或可释放的元件。在其他实施方案中,可以在适配体中引入额外的官能性,例如标记的或可检测的组分、间隔组分或者特异性结合标签或固定元件。例如,适配体可以包含通过可裂解部分与适配体连接的标签、标记、分隔标记与可裂解部分的间隔组分。在一实施方案中,可裂解元件是光可裂解接头(linker)。光可裂解接头可以连接至生物素部分和间隔区段,可以包含NHS基团以用于胺的衍生化,以及可以用于在适配体中引入生物素基团,从而允许适配体在测定方法中较晚地释放。用溶液中所有测定组分进行的均质测定在检测信号之前不需要分离样品与试剂。 这些方法是快速且易于使用的。这些方法基于分子捕获或与特异性靶标反应的结合试剂产生信号。对于肺癌,分子捕获剂是适配体或抗体等,特异性靶标是表1第2列的肺癌生物标记。在一实施方案中,一种信号产生方法利用由于荧光团标记的捕获剂与其特异性生物标记靶标的相互作用而导致的各向异性信号改变。当标记的捕获剂与其靶标反应时,增加的分子量导致附着于该复合物的荧光团的旋转运动变得更慢,从而改变各向异性值。通过监测各向异性改变,结合事件可以用于定量测量溶液中的生物标记。其他方法包括荧光偏振测定、分子信标方法、时间分辨荧光猝灭法、化学发光、荧光共振能量转移等。可以用于检测对应于生物学样品中生物标记的生物标记值的基于溶液的示例性适配体测定包括如下步骤(a)通过使所述生物学样品与适配体接触来制备混合物,所述适配体包含第一标签并具有对所述生物标记的特异性亲和力,其中当所述样品中存在所述生物标记时形成适配体亲和力复合物;(b)使所述混合物暴露于包含第一捕获元件的第一固体支持物,并且允许所述第一标签与所述第一捕获元件结合;(c)除去未与所述第一固体支持物结合的混合物的任何组分;(d)使第二标签附着于所述适配体亲和力复合物的生物标记组分;(e)从所述第一固体支持物释放所述适配体亲和力复合物;(f)使释放的适配体亲和力复合物暴露于包含第二捕获元件的第二固体支持物,并且允许所述第二标签与所述第二捕获元件结合;(g)通过分离未复合的适配体与所述适配体亲和力复合物从所述混合物除去任何未复合的适配体;(h)从固体支持物洗脱适配体;以及(i)通过检测所述适配体亲和力复合物的适配体组分来检测所述生物标记。使用免疫测定确定生物标记值免疫测定方法基于抗体与其对应靶标或分析物的反应,并且根据特定测定形式可以检测样品中的分析物。为了改进基于免疫反应性的测定方法的特异性和灵敏性,通常由于单克隆抗体的特异性表位识别而使用单克隆抗体。多克隆抗体由于其与单克隆抗体相比增加的靶标亲和力而成功地用于各种免疫测定中。免疫测定已经设计为用于大范围生物学样品基质。免疫测定形式已经设计为提供定性、半定量及定量结果。定量结果通过使用已知浓度的待检测的特定分析物产生的标准曲线来产生。将来自未知样品的应答或信号在标准曲线上作图,并确定该未知样品中对应于靶标的量或值。已经设计了许多免疫测定形式。ELISA或EIA可以定量检测分析物。这种方法依赖于标记对分析物或抗体的附着,标记组分直接或者间接包括酶。ELISA测试可以设计为直接、间接、竞争性或者夹心检测分析物。其他方法依赖于标记,如放射性同位素(ι125)或荧光。其他技术包括例如凝集反应、浊度测定法、比浊法、蛋白印迹、免疫沉淀、免疫细胞化学、 免疫组织化学、流式细胞术、Luminex测定等(见ImmunoAssay :A Practical Guide, editedby Brian Law, published by Taylor & Francis, Ltd. ,2005edition)。示例性测定形式包括酶联免疫吸附测定(ELISA)、放射性免疫测定、荧光、化学发光以及荧光共振能量转移(FRET)或时间分辨的-FRET(TR-FRET)免疫测定。检测生物标记的方法的实例包括生物标记免疫沉淀及随后允许辨别大小和肽水平的定量方法,如凝胶电泳、毛细管电泳、平面电色谱等。检测和/或定量可检测标记或信号产生材料的方法取决于所述标记的性质。由合适的酶催化的反应产物(其中所述可检测标记是酶,见上文)可以是但不限于荧光、发光或放射性的,或者它们可以吸收可见光或紫外光。适合于检测这样的可检测标记的检测仪的实例包括但不限于X光照片、放射性计数器、闪烁计数器、分光光度计、比色计、荧光计、发光计和光密度计。可以通过允许适当准备、处理和分析反应的任何方式来进行任何检测方法。这可以例如在多孔测定板(如96孔或者386孔平板)中进行,或者使用任何合适的阵列或者微阵列进行。可以人工或自动化制备各种试剂的储液,使用能够检测可检测标记的可商购的分析软件、机器人技术和检测仪器自动化进行所有随后的移液、稀释、混合、分配、洗涤、孵育、样品读取、数据收集和分析。使用基因表达谱确定生物标记值测量生物学样品中的mRNA可以用作检测该生物学样品中对应的蛋白水平的替代。因此,本文所述的任何生物标记或生物标记的组还可以通过检测适当的RNA来检测。mRNA表达水平通过逆转录定量聚合酶链式反应(RT-PCR及随后的qPCR)测量。 RT-PCR用于从mRNA产生cDNA。cDNA可用于qPCR测定以随DNA扩增过程的进展而产生荧光。通过与标准曲线比较,qPCR可以产生绝对测量度,如每细胞的mRNA拷贝数。RNA印迹、 微阵列、Invader测定以及与毛细管电泳组合的RT-PCR已经用于测量样品中mRNA的表达 /K平。见 Gene Expression Profiling :Methods and Protocols, Richard A. Shimkets, editor, Humana Press,2004。miRNA分子是小RNA,其不编码但是可以调节基因表达。适合于测量mRNA表达水平的任何方法均可以用于对应的miRNA。最近,许多实验室已经研究了 miRNA作为疾病的生物标记的用途。许多疾病涉及广泛的转录调节,并且毫不意外地发现miRNA可以作为生物标记。miRNA浓度与疾病之间的关联通常不如蛋白水平与疾病之间的关联明确,但是miRNA 生物标记值可能是重要的。当然,随着疾病期间任何RNA的不同表达,开发体外诊断产品所面临的问题包括需要miRNA在患病细胞中存活及易于提取以进行分析,或者miRNA被释放进入血液或其他基质中,在此它们必须存活足够长的时间以进行测量。蛋白生物标记具有类似的要求,尽管许多潜在的蛋白生物标记以旁分泌方式在疾病期间于病变和功能部位有意地分泌。许多潜在的蛋白生物标记设计为在合成那些蛋白的细胞外起作用。 使用体内分子成像技术检测分子标记任何所述的生物标记(见表1第2列)也可以用于分子成像测试。例如,显像剂可以与任何所述生物标记偶联,这可以用于辅助肺癌诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。体内成像技术提供了用于确定个体体内特定疾病状况的非侵入性方法。例如,身体的所有部分或者甚至整个身体均可以作为三维图像观察,从而提供关于身体内形态学和结构的有价值的信息。这样的技术可以与检测本文所述的生物标记组合以提供关于个体的癌症状态,特别是肺癌状态的信息。体内分子成像技术的应用由于该技术的各种进展而得以扩展。这些进展包括新造影剂或标记的开发,如放射性标记和/或荧光标记,其可以在身体内提供强信号;以及开发更强的新成像技术,其可以从身体外部检测和分析这些信号,并且具有足够的灵敏性和精确度以提供有用的信息。造影剂可以在适当的成像系统中观察,从而提供所述造影剂所处位置的身体部分或多个部分的图像。造影剂可以与捕获剂结合或缔合,例如适配体或抗体, 例如和/或结合或缔合肽或蛋白,或寡核苷酸(例如为了检测基因表达),或者复合物,所述复合物含有任何这些物质和一种或多种大分子和/或其他颗粒形式。造影剂也是可以用于成像的放射性原子的特征。对于闪烁照相研究合适的放射性原子包括锝_99m或碘-123。其他易于检测的部分包括例如磁共振成像(MRI)的自旋标记物,如碘-123、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、钆、锰或铁。这样的标记为本领域熟知,并且可以由本领域技术人员容易地选择。标准成像技术包括但不限于磁共振成像、计算机断层扫描、正电子发射断层扫描 (PET)、单光子发射计算机断层扫描(SPECT)等。对于诊断性体内成像,可用的检测设备的类型是选择指定造影剂的主要因素,如用于靶标(蛋白、mRNA等)的指定放射性核素和特定生物标记。所选的放射性核素通常具有通过指定类型设备可检测的衰变类型。此外,当选择用于体内诊断的放射性核素时,其半衰期应当足够长以允许在靶组织最大吸收时进行检测,但是也应当足够短,以减小宿主所受到的有害辐射。示例性成像技术包括但不限于PET和SPECT,这是将放射性核素全身 (synthetically)或局部地给予个体的成像技术。随后,随时间测量放射性示踪剂的吸收, 并用于获得关于靶向的组织与生物标记的信息。由于所用的特定同位素的高能(Y-射线) 发射以及用于检测它们的设备的灵敏性和完善(sophistication),可以从身体外部推导出放射性的二维分布。PET中常用的正电子发射核素包括例如碳-11、氮-13、氧-15和氟-18。通过电子捕获和/或Y-发射衰变的同位素用于SPECT中,并且包括例如碘-123和锝-99m。用锝-99m标记氨基酸的示例性方法是在螯合前体的存在下还原高锝酸盐离子以形成不稳定的锝-99m-前体配合物,其又与双官能修饰的趋化肽的金属结合基团反应,形成锝-99m-趋化肽偶联物。抗体常用于这样的体内成像诊断方法。用于体内诊断的抗体的制备和用途为本领域熟知。特异性结合表1第2列的任何生物标记的标记的抗体可以注入疑似患有某种类型癌症(如肺癌)的个体,并根据所用的特定生物标记的可检测性来诊断或评价所述个体的疾病状况。如上文所述,使用的标记根据所用的成像形式选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量也允许确定该器官或组织中癌症的存在与否。相似地,适配体可以用于这样的体内成像诊断方法。例如,用于鉴定表1第2列所述的特定生物标记的适配体(并且因此特异性结合该特定生物标记)可以适当地进行标记并注入疑似患有肺癌的个体,并根据该特定生物标记的可检测性来诊断或评价所述个体的肺癌状态。如上文所述,使用的标记根据所用的成像形式选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量也允许确定该器官或组织中癌症的存在与否。适配体定向的显像剂与其他显像剂相比可以具有关于组织渗透、组织分布、动力学、消除、效力和选择性方面独特且有利的特性。这样的技术也可以任选地用标记的寡核苷酸进行,例如通过用反义寡核苷酸成像检测基因表达。这些方法用于原位杂交,例如用荧光分子或放射性核素作为标记。检测基因表达的其他方法包括例如检测报道基因的活性。另一种常见类型的成像技术是光学成像,其中对象体内的荧光信号通过所述对象体外的光学设备检测。这些信号可以是由于实际的荧光和/或生物发光。光学检测设备灵敏性的改进增加了光学成像在体内诊断测定中的应用。体内分子生物标记的用途日益增加,包括临床试验,例如在新癌症疗法临床试验中更快速地测量临床效力,和/或避免对诸如多发性硬化的那些疾病的长期安慰剂治疗, 其中这样的长期治疗可能被认为是存在伦理问题。关于其他技术,见N. Blow,Nature Methods,6,465-469,2009。使用组织学/细胞学方法确定生物标记值对于肺癌的评价,许多组织样品可用于组织学或细胞学方法。样品选择取决于原发肿瘤位置和转移的部位。例如,支气管内和经支气管活组织检查、细针抽吸、切割针及核心活组织检查可以用于组织学。支气管洗涤(washing)和刷检(brushing)、胸膜抽吸和痰可用于细胞学。虽然细胞学分析仍用于诊断肺癌,但是已知组织学方法提供癌症检测更好的灵敏性。本文鉴定的在肺癌个体中表现出上调的任何生物标记(见表37)可以用于染色组织学样本作为疾病的指征。在一实施方案中,对于对应的一种或多种生物标记是特异性的一种或多种捕获剂用于肺细胞样品的细胞学评价,并且可以包括如下一个或多个方面收集细胞样品、固定细胞样品、脱水、透明(clearing)、将细胞样品固定在显微镜载玻片上、使细胞样品透化、分析物检索处理、染色、脱色、洗涤、封闭以及在缓冲溶液中与一种或多种捕获剂反应。在另一实施方案中,细胞样品从细胞块(cell block)中产生。在另一实施方案中,对于对应生物标记是特异性的一种或多种捕获剂用于肺组织样品的组织学评价中,并且可以包括如下一个或多个方面收集组织样本、固定组织样品、 脱水、透明、将组织样品固定在显微镜载玻片上、使组织样品透化、分析物检索处理、染色、 脱色、洗涤、封闭、再水合以及在缓冲溶液中与一种或多种捕获剂反应。在另一实施方案中, 固定和脱水用冷冻代替。在另一实施方案中,对于对应的一种或多种生物标记是特异性的一种或多种适配体与组织学或细胞学样品反应,并且可以作为核酸扩增方法中的核酸靶标。合适的核酸扩增方法包括例如PCR、q-β复制酶、滚环扩增、链置换、解旋酶依赖性扩增、环介导的等温扩增、连接酶链式反应以及限制和环化辅助的滚环扩增。在一实施方案中,将对于用于组织学或细胞学评价的对应生物标记是特异性的一种或多种捕获剂在缓冲溶液中混合,所述缓冲溶液可以包含任何如下成分封闭材料、竞争剂、去污剂、稳定剂、载体核酸、聚阴离子材料等。“细胞学方案”通常包括样品收集、样品固定(fixation)、样品固定 (immobilization)和染色。“细胞制备”可以包括样品收集后的一些处理步骤,包括使用一种或多种慢解离速率的适配体来染色制备的细胞。
样品收集可以包括直接将样品置于未处理的转运容器中,将样品置于含有一些类型介质的转运容器中,或者将样品直接置于玻片上(固定)而不进行任何处理或固定。样品固定可以通过将一部分收集的样本涂在用聚赖氨酸、明胶或硅烷处理的载玻片上而改进。玻片可以通过在玻片上涂有薄且均勻的细胞层而制备。通常采取小心操作以使减少机械扭转和干燥假象。液体样本可以通过细胞块方法处理。或者,液体样本可以与固定溶液在室温下1 1混合大约10分钟。细胞块可以从剩余的积液、痰、尿液沉淀、胃肠液、细胞刮取物或细针抽吸物中制备。通过离心或膜过滤浓缩或压实细胞。已经揭示了许多细胞块制备方法。代表性方法包括固定的沉淀、细菌琼脂或膜过滤方法。在固定的沉淀方法中,将细胞沉淀与诸如鲍音液 (Bouins)、苦味酸或缓冲的福尔马林的固定剂混合,然后将混合物离心以沉淀固定的细胞。 除去上清,尽可能完全地干燥细胞团块(pellet)。收集细胞团块并包在镜头纸中,然后置于组织盒(tissue cassette)中。将组织盒置于含其他固定剂的罐子中,作为组织样品进行处理。琼脂方法与上述方法非常相似,只是取出细胞团块并在纸巾上干燥,然后切成两半。将切面置于载玻片上一滴熔化的琼脂中,然后将该细胞团块用琼脂包被,保证琼脂中无气泡形成。使琼脂变硬,然后除去任何过多的琼脂。将其置于组织盒中,完成组织处理。或者,可以将细胞团块直接悬浮于在65°C的2%液体琼脂中并离心样品。使琼脂细胞团块在 4°C下固化1小时。可以从离心管中取出固体琼脂并切成两半。将琼脂包在滤纸中,然后置于组织盒中。从这点开始的处理与上述方法相同。在任何这些方法中可以用膜过滤低代替离心。任何这些方法均可用于产生“细胞块样品”。细胞块可以使用专门的树脂制备,包括Lowicryl树脂、LR White、LR Gold、 Unicryl和ΜοηοΜ印。这些树脂具有低粘度,并且可以在低温下及用紫外(UV)光聚合。包埋方法依赖于在脱水期间逐渐冷却样品,将样品转移至树脂以及于最终低温下在合适UV 波长处聚合细胞块。细胞块切片可以用苏木精-伊红(HE)染色以进行细胞形态学检查,而其他切片用于特异性标记检查。无论方法是细胞学方法或组织学方法,可以在进一步处理之前将样品固定以防止样品降解。这种方法称作“固定”,并且描述了可以互换使用的许多材料和方法。基于待检测的靶标和待分析的特定细胞/组织类型,根据经验最佳地选择样品固定方案和试剂。样品固定依赖于试剂,如乙醇、聚乙二醇、甲醇、福尔马林或异丙醇。样品应当尽可能在收集及附着在玻片上后很快固定。然而,选择的固定剂可以在各种分子靶标中引入结构改变,这使得随后更难以检测。固定(fixation)和固定(immobilization)方法及其顺序可以改变细胞的外观,并且这些改变必须是由细胞学技术人员预期及认可的。固定剂可以导致某些类型细胞收缩,并且导致细胞质出现颗粒或网状物。许多固定剂通过使细胞组分交联而起作用。这可以破坏或改变特异性表位,产生新表位,导致分子缔合以及降低膜通透性。福尔马林固定是一种最常用的细胞学/组织学方法。福尔马林在相邻蛋白之间或在蛋白内形成甲基桥。沉淀或凝固也用于固定,乙醇常用于这种类型的固定。交联与沉淀的组合也可以用于固定。牢固的固定方法在保留形态学信息方面是最佳的,而较弱的固定方法对于保留分子靶标方面是最佳的。代表性的固定剂是50%无水乙醇、2mM聚乙二醇(PEG)、1. 85%甲醛。这种制剂的变化包括乙醇(50% -95% 甲醇(20% -50% )以及仅福尔马林(甲醛)。另一种常用的固定剂是2% PEG 1500、50%乙醇以及3%甲醇。将玻片在室温下置于固定剂中约10-15分钟,然后取出并干燥。一旦玻片被固定,可以用诸如PBS的缓冲溶液对其进行漂洗。许多染料可以用于差异地突出和反差或“染色”细胞、亚细胞和组织特征或形态学结构。苏木精(hematoylin)用于使细胞核染色为蓝色或黑色。橘黄G-6和天青伊红(Eosin hure)均使细胞质染色。橘黄G使含有角蛋白和糖原的细胞染成黄色。伊红Y用于使核仁、纤毛、红细胞和表面上皮扁平细胞染色。罗曼诺夫斯基(Romanowsky)染色用于空气干燥的玻片,并且可以用于增强复型及区分细胞外与细胞质内材料。染色方法可以包括增加细胞对于染色通透性的处理。用去污剂处理细胞可以用于增加通透性。为了增加细胞和组织的通透性,可以将固定的样品用溶剂、皂苷类或者非离子去污剂进一步处理。酶促消化也可以改进组织样品中特异性靶标的可接近性。染色后,使用渐增的醇浓度进行连续醇漂洗将样品脱水。最终的洗涤使用二甲苯或诸如柑桔萜的二甲苯取代物,其具有接近在载玻片上应用的盖玻片的折射率。这个最后的步骤称作透明。一旦使样品脱水及透明,应用封固剂。所选的封固剂具有接近玻璃的折射率,并且能够使盖玻片与载玻片粘合。其还抑制细胞样品另外的干燥、收缩或褪色。无论使用的染色或处理,对肺细胞学样本进行的最后评价通过一些类型显微镜检查进行以允许通过肉眼观察形态学并确定标记的存在与否。示例性显微镜检查方法包括明视野显微镜、相收缩显微镜、荧光显微镜和微分干涉相差显微镜方法。如果在检查后需要对样品进行次级测试,则可以除去盖玻片并对载玻片进行脱色。脱色包括使用用于染色该载玻片的最初未加入染料的原始溶剂系统,并以与原始染色程序相反顺序进行。脱色也可以通过将该载玻片浸泡在酸醇中直至细胞无色。一旦无色, 则将载玻片用水充分漂洗并进行第二染色程序。此外,通过使用特异性分子试剂,如抗体或者核酸探针或适配体,可以将特异性分子区分与细胞形态学分析组合。这改进了诊断细胞学的精确性。显微切割可用于分离细胞的子集以进行另外的评价,特别是用于遗传学评价异常染色体、基因表达或突变。制备用于组织学评价的组织样品包括固定、脱水、浸润(infiltration)、包埋和切片。用于组织学的固定试剂与用于细胞学的固定试剂非常相似或相同,并且在以诸如个体蛋白的分子为代价的情况中具有相同的保持形态学特征的问题。如果组织样品不进行固定和脱水而是代之以冷冻然后在冷冻时切片可以节省时间。这是更温和的处理程序,并且可以保留更多的个体标记。然而,冷冻对于组织样品的长期保存不可接受,因为由于冰晶体的引入引起亚细胞信息丧失。冷冻组织样品中的冰也妨碍切片过程产生极薄的切片,并且因此可以丧失一些显微镜分辨力和亚细胞结构的图像。除了福尔马林固定之外,四氧化锇也用于固定和染色磷脂(膜)。组织的脱水是通过用渐增浓度的醇连续洗涤而实现。透明使用的材料可以与醇和包埋材料混溶,并且包括从50 50醇澄清剂开始至100%澄清剂(二甲苯或二甲苯取代物)的逐步处理过程。浸润包括将组织与液体形式的包埋剂(温热的蜡,硝化纤维溶液) 一起孵育,首先是50 50包埋剂澄清剂,随后是100%包埋剂。包埋通过将组织置于模具或盒中并充填熔化的包埋剂如蜡、琼脂或明胶而完成。使包埋剂硬化。然后将硬化的组织样品切成薄切片以用于染色和随后的检查。
在染色之前,将组织切片脱蜡并再水合。用二甲苯使切片脱蜡,可以更换一次或多次二甲苯,并通过在递减浓度的醇中连续洗涤而再水合。在脱蜡之前,可以将组织切片于约 80°C下在载玻片上热固定约20分钟。激光捕获显微切割允许从组织切片分离细胞的子集以进行进一步分析。在细胞学中,为了增强显微特征的观察,可以将组织切片或薄片用各种染色方法染色。许多可商购的染色方法可以用于增强或鉴定特定的特征。为了进一步增加分子试剂与细胞学/组织学样品的相互作用,已经开发了许多 “分析物检索(analyte retrieval) ”技术。第一种这样的技术使用高温加热固定的样品。 这种方法也称作热诱导的表位检索或HIER。已经使用了许多加热技术,包括蒸汽加热、微波、高压蒸汽、水浴以及加压蒸煮或这些加热方法的组合。分析物检索溶液包括例如水、柠檬酸盐和普通盐水缓冲液。分析物检索的关键是高温的时间,但是较低温度进行较长时间也已经成功使用。分析物检索的另一关键是加热溶液的PH。发现低pH提供最佳的免疫染色,但是也产生经常需要使用第二组织切片作为阴性对照的背景。无论缓冲液组成,使用高 PH溶液通常获得最一致的益处(增加免疫染色而不增加背景)。对特异性靶标的分析物检索方法根据经验对使用加热的靶标、时间、PH和缓冲液组成的变量加以优化。使用微波分析物检索方法允许用抗体试剂顺序染色不同的靶标。但是在染色步骤之间获得抗体与酶复合物需要的时间也证实使细胞膜分析物降解。微波加热方法也改进原位杂交方法。为了开始分析物检索过程,首先将切片脱蜡并水合。然后将玻片置于平皿或罐子中的IOmM柠檬酸钠缓冲液pH 6. 0中。代表性的程序使用1100W微波,以100%功率对玻片微波处理2分钟,随后在确保玻片保留覆盖于液体中之后使用20%功率对玻片微波处理18 分钟。然后使玻片在敞口容器中冷却,随后用蒸馏水漂洗。HIER可以与酶促消化组合使用以改进靶标对免疫化学试剂的反应性。一种这样的酶促消化方案使用蛋白酶K。20 μ g/ml浓度的蛋白酶K在50mM Tris 碱、ImM EDTA.0. 5% Triton X-100、pH 8. 0缓冲液中制备。该方法首先包括将切片在更换 2次的二甲苯中脱蜡,每次5分钟。然后将样品在更换2次的100%乙醇中水合,每次3分钟,在95%和80%乙醇中水合,每次1分钟,然后在蒸馏水中漂洗。将切片用蛋白酶K工作溶液覆盖,于37°C下在加湿室中孵育10-20分钟(最佳孵育时间可以根据组织类型和固定程度而变化)。将切片在室温下冷却10分钟,然后在PBS吐温(Tween) 20中漂洗2次2分钟。如果需要,可以将切片封闭以消除来自内源化合物和酶的潜在干扰。然后将切片用在一抗稀释缓冲液中适当稀释的一抗在室温下孵育1小时或者在4°C下孵育过夜。然后将该切片用PBS吐温20漂洗2次2分钟。如果需要特定的应用,可以进行另外的封闭,随后用 PBS吐温20再漂洗3次2分钟,然后最后完成免疫染色方案。在室温下用SDS简单处理也已经证实改进了免疫组织化学染色。分析物检索方法已经应用于玻片固定切片(slide mounted section)以及自由浮动切片(free floating section)。另一处理选择是将玻片置于pH 6. 0的含有柠檬酸和0. 1诺纳德 (Nonident) P40的罐子中,并加热至95°C。然后将该玻片用诸如PBS的缓冲溶液洗涤。对于组织的免疫学染色,可以通过将切片浸入诸如血清或脱脂奶粉的蛋白溶液中来封闭抗体与组织蛋白的非特异性结合。封闭反应可包括需要降低内源生物素的水平;消除内源电荷作用;失活内源核酸酶;和/或失活内源酶如过氧化物酶和碱性磷酸酶。内源核酸酶可以通过以下方式失活 用蛋白酶K降解;热处理;使用螯合剂,如EDTA或EGTA ;引入载体DNA或RNA ;用离液剂处理,如尿素、硫脲、盐酸胍、硫氰酸胍、高氯酸锂等或焦碳酸二乙酯。碱性磷酸酶可以通过用 0. INHCl在室温下处理5分钟或用ImM左旋咪唑处理而失活。过氧化物酶活性可以通过用 0. 03%过氧化氢处理而消除。内源生物素可以通过将玻片或切片在室温下浸入抗生物素蛋白(链霉抗生物素蛋白,可以取代中性链亲和素(neutravidin))溶液中至少15分钟而封闭。然后将玻片或切片在缓冲液中洗涤至少10分钟。这个步骤可以重复至少3次。然后将玻片或切片浸入生物素溶液中10分钟。这个步骤可以重复至少3次,每次使用新鲜的生物素溶液。重复缓冲液洗涤程序。应当减少封闭方案以防止破坏所关注的细胞或组织结构或者靶标或多个靶标,但是可以组合一种或多种这样的方案以“封闭”玻片或切片,然后与一种或多种慢解离速率适配体反应。见Basic Medical Histology :the Biology of Cells, Tissues and Organs, authored by Richard G. Kessel, Oxford University Press,1998。使用质谱方法确定生物标记值许多质谱仪的配制(configuration)可以用于检测生物标记值。一些类型的质谱仪可以获得或可以用各种配制生产。通常,质谱仪具有如下主要部件样品入口、离子源、 质量分析仪、检测仪、真空系统以及设备控制系统和数据系统。样品入口、离子源和质量分析仪的不同通常限定设备的类型及其能力。例如,入口可以是毛细管柱液体层析源,或者可以是直接探针或镜台(stage)如用于基质辅助激光解吸电离中。常用的离子源是例如电喷射,包括纳米喷射(nanospray)和微喷射(microspray);或者基质辅助激光解吸电离。 常用的质量分析仪包括四极滤质器(quadrupole mass filter)、离子阱质量分析仪和飞行时间质量分析仪。其他质谱方法为本领域熟知(见Burlingame et al. Anal. Chem. 70 647R-716R(1998) ;Kinter and Sherman, New York(2000))o蛋白生物标记和生物标记值可以通过任何如下方式检测和测量电喷射离子化质谱(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)η、基质辅助激光解吸离子化飞行时间质谱 (MALDI-T0F-MS)、表面增强激光解吸/离子化飞行时间质谱分析(SELDI-T0F-MQ、硅表面解吸/离子化(DIOS)、二次离子质谱(SIMS)、四极飞行时间(Q-TOF)、称作ultraflex III T0F/T0F的串联式飞行时间(T0F/T0F)技术、大气压化学离子化质谱(APCI-MS)、APCI-MS/ MS、APCI-(MS)N、大气压光电离质谱(APPI-MS) ,APPI-MS/MS 和 APPI-(MS) N、四极质谱、傅里叶变换质谱(FTMS)、定量质谱以及离子阱质谱。样品制备策略用于在对蛋白生物标记进行质谱表征及确定生物标记值之前标记和富集样品。标记方法包括但不限于用于相对和绝对定量的等量异位标签(iTRAQ)和在细胞培养中用氨基酸稳定同位素标记(SILAC)。在质谱分析之前用于选择性富集候选生物标记蛋白样品的捕获剂包括但不限于适配体、抗体、核酸探针、嵌合物、小分子、F(ab' )2片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体、锚蛋白、结构域抗体、可变抗体支架(例如双抗体等)印刷的聚合物、高亲合性多聚体、肽模拟物、拟肽、肽核酸、苏糖核酸、激素受体、细胞因子受体及合成的受体以及这些物质的修饰和片段。前述测定允许检测可用于诊断肺癌的方法中的生物标记值,其中所述方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物标记值每个对应于选自表1第2列提供的生物标记的生物标记,其中如下文所述,利用生物标记值的分类指示所述个体是否患有肺癌。虽然某些所述肺癌生物标记可以单独用于检测和诊断肺癌,但是本文所述的方法用于分组肺癌生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请的各种实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-61个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述任何方法,可以单独检测和分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。在另一方面,本发明提供了检测肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物标记值每个对应于选自表1第 2列提供的生物标记的生物标记,其中如下文所述,生物标记值的分类指示所述个体中不存在肺癌。虽然某些所述肺癌生物标记可以单独用于检测和诊断不存在肺癌,但是本文所述的方法用于分组肺癌生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此, 本申请的各种实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-61个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述任何方法,可以单独检测和分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。生物标记分类及疾病评分计算对于给定诊断测试的生物标记“特征”含有标记的集合,每个标记在所关注群体中具有不同水平。在此方面,不同水平可以指针对两个或更多个组中个体的标记水平的不同平均值(mean),或者两个或更多个组中的不同的方差,或者这两者的组合。对于最简单形式的诊断测试,这些标记可以用于将来自个体的未知样品分配到两组中的一组中,疾病组或非疾病组。将样品分配于两个或更多个组中的一组称为分类,用于实现这种分配的程序称为分类器或分类方法。分类方法也可以称为评分方法。有许多分类方法可以用于从生物标记值的集合构建诊断分类器。通常,分类方法最容易用监督学习技术进行,其中用获得自希望区分的两个(或更多个,对于多个分类状态)不同组内的个体的样品收集数据集合。因为每个样品所属类别(组或群体)事先对于每个样品均是已知的,所以可以训练分类方法以获得期望的分类应答。还可以使用无监督学习技术来产生诊断分类器。开发诊断分类器的常用方法包括决策树;bagging+boosting+forests ;基于规贝1J推论的学习(rule inference based learning) ;Parzen 窗方法(Parzen Windows); 线性模型;逻辑;神经网络方法;无监督聚类;K-means ;分级上升/下降(hierarchical ascending/descending);半监督学习;原型方法;近邻取样(nearest neighbor);核密度估计(kernel density estimation);支持向量机(support vector machine);隐马尔可夫模型(hidden Markov model);玻尔兹曼学习(Boltzmann Learning);并且分类器可以简单组合或者以减小特定目标函数的方式组合。综述参见例如I^attern Classification, R. 0. Duda, et al. , editors, John Wiley & Sons, 2nd edition, 2001 ;还参见The Elements of Statistical Learning-Data Mining,Inference,and Prediction,T. Hastie,et al., editors, Springer Science+Business Media, LLC, 2nd edition,2009 ;它们均通过引用整体并入本文。为了用监督学习技术产生分类器,获得称为训练数据的样品集合。在诊断测试的情况中,训练数据包括来自未知样品稍后会被分配的不同组(类别)的样品。例如,收集自对照群体的个体和特定疾病群体的个体的样品可以组成训练数据以开发可以分类未知样品(或者,更特别地,样品所来自的个体)为患有该疾病或无该疾病的分类器。从训练数据开发分类器已知为训练该分类器。分类器训练的具体细节取决于监督学习技术的性质。 作为示例,训练朴素贝叶斯(naiVe Bayesian)分类器的实例在下文进行描述(参见例如 Patten Classification, R. 0. Duda, et al. , editors, John Wiley & Sons,2nd edition, 2001;还参见 The Elements of Statistical Learning-Data Mining, Inference, and Prediction, T. Hastie, et al.,editors, Springer Science+Business Media, LLC,2nd edition,2009)。因为通常在训练集合中存在比样品多得多的潜在生物标记值,所以必须小心避免过拟合。当统计学模型描述随机误差或噪声而非潜在关系时发生过拟合。过拟合可以由各种方式避免,这包括例如限制开发分类器中使用的标记数目,假设标记应答互相独立,限制采用的潜在统计学模型的复杂性,以及保证潜在统计学模型符合数据。使用生物标记的集合开发诊断测试的示意性实例包括应用朴素贝叶斯分类器,这是一种基于贝叶斯(Bayes)定理的简单或然性分类器,具有生物标记的严格独立处理。每个生物标记由针对每种类别中测量的RFU值或IogRFU (相对荧光单位)值的类别依赖性概率密度函数(Pdf)描述。一个类别中的标记的集合的共同pdf (joint pdfs)假定为每个生物标记的个体类别依赖性Pdf的积。在此情况中训练朴素贝叶斯分类器意味着分配参数 (“参数化”)以表征类别依赖性pdf。类别依赖性pdf的任何潜在模型均可以使用,但是模型应该通常符合在训练集合中观察的数据。具体地,测量疾病类别中生物标记i的值Xi的类别依赖性概率写作P(XiId),并且
η
观察具有值;C = (^,X2,...XnP η个标记的整体朴素贝叶斯概率写作.P^ I d) = ΠI d)
”1=17
其中各个Xi是以RFU或log RFU表示的测量的生物标记水平。对于未知的分类分配通过以下方法来促进对于相同测量值,计算与不患病(对照)的概率P(Clf)相比的
具有测量的χ的患病概率Ρ"1 )这些概率的比率通过应用贝叶斯定理从类别依赖
O
P(C \X) P(x\c)(\-P(d))
性pdf计算,即^p(x\d)P(d) 其中p(d)为对测试合适的群体中疾病的
- ,
发病率。对这一比率的两边取对数并从以上代入朴素贝叶斯类别依赖性概率,获得 p(c|x) / (X |c) , (I-P(J))
S种形式e知为log似然比,并简单i也表示不患、
O
有特定疾病比患有所述疾病的log似然性,并且主要由η个单独生物标记的单独log似然比的总和组成。在其最简单的形式中,未知样品(或者,更特别地,样品所来自的个体)分类为不患有疾病,如果上述比率大于0 ;而分类为患有疾病,如果所述比率小于0。在一示例性实施方案中,类别依赖性生物标记pdf p(Xi|C)和p(Xi|d)假定
(",-Mcjf
为在测量的RFU值Xi中为正态分布或log正态分布,BP P(XiIc)=g 2^并且对于p(Xi|d),具有μ“和CT^的类似表达。模型的参数化要求估计来自训练数据的每个类别依赖性Pdf的两个参数,平均值μ和方差δ2。这可以通过各种方式实现,包括例如最大似然估计、最小平方以及本领域技术人员已知的任何其他方法。将 P(XiIc)和p(Xi|d)的正态分布代入上文所定义的log-似然比,获得以下表达式
权利要求
1.一种诊断个体患有或不患有肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1的至少N个生物标记之一,其中所述个体基于所述生物标记值分类为患有或不患有肺癌,其中 N = 2-61。
2.一种指示肺癌的似然性的计算机执行方法,所述方法包括在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表1的至少N个生物标记之一;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有肺癌的似然性,其中N = 2-61。
3.一种指示肺癌的似然性的计算机程序产品,所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于选自表1的至少N个生物标记之一,其中所述生物标记在所述生物学样品中检测;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺疾病状态;其中N = 2-61。
4.权利要求3的计算机程序产品,其中所述分类方法使用概率密度函数。
5.权利要求4的计算机程序产品,其中所述分类方法使用两种或更多种类别。
6.权利要求2的方法,其中指示所述个体患有肺癌的似然性包括在计算机显示器上显示所述似然性。
7.—种诊断个体患有或不患有肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1的一组生物标记,其中所述个体分类为患有或不患有肺癌,其中所述生物标记的组的灵敏性+ 特异性值为1.65或更大。
8.权利要求7的方法,其中所述组的灵敏性+特异性值为1.70或更大。
9.权利要求1-8中任一项的方法,其中N= 2-15。
10.权利要求1-8中任一项的方法,其中N= 2-10。
11.权利要求1-8中任一项的方法,其中N= 3-10。
12.权利要求1-8中任一项的方法,其中N= 4-10。
13.权利要求1-8中任一项的方法,其中N= 5-10。
14.一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表1的生物标记,其中所述个体基于所述生物标记值分类为患有肺癌。
15.一种指示肺癌的似然性的计算机执行方法,所述方法包括在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体患有肺癌的似然性。
16.权利要求15的方法,其中指示所述个体患有肺癌的似然性包括在计算机显示器上显示所述似然性。
17.一种指示肺癌的似然性的计算机程序产品,所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于选自表1的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺疾病状态。
18.权利要求1-17中任一项的方法,其中检测所述生物标记值包括进行体外测定。
19.权利要求18的方法,其中所述体外测定包括对应于每个所述生物标记的至少一种捕获剂,并且还包括从由适配体、抗体和核酸探针组成的组中选择所述至少一种捕获剂。
20.权利要求19的方法,其中所述至少一种捕获剂是适配体。
21.权利要求18的方法,其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定以及mRNA表达水平测定。
22.权利要求1-21中任一项的方法,其中每个生物标记值基于预定值或值的预定范围评价。
23.权利要求1-22中任一项的方法,其中所述生物学样品是肺组织,其中所述生物标记值源自所述肺组织的组织学或细胞学分析。
24.权利要求1-22中任一项的方法,其中所述生物学样品选自全血、血浆和血清。
25.权利要求1-22中任一项的方法,其中所述生物学样品是血清。
26.权利要求1-25中任一项的方法,其中所述个体是人。
27.权利要求116中任一项的方法,其中所述个体是吸烟者。
28.权利要求27的方法,其中所述生物标记选自表1第6列。
29.权利要求116中任一项的方法,其中所述个体具有肺小结。
30.权利要求四的方法,其中所述生物标记选自表1第5列。
31.权利要求1-30中任一项的方法,其中所述肺癌是非小细胞肺癌。
全文摘要
本发明包括检测和诊断肺癌的生物标记、方法、装置、试剂、系统和试剂盒。在一方面,本发明提供了生物标记,其可以单独使用或以各种组合使用来诊断肺癌或允许区分诊断肺小结为良性或恶性的。在另一方面,本发明提供了诊断个体的肺癌的方法,其中所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第2列提供的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性。
文档编号G06G7/58GK102209968SQ200980144620
公开日2011年10月5日 申请日期2009年9月9日 优先权日2008年9月9日
发明者A·A·E·斯图尔特, D·济奇, E·N·布罗迪, L·戈尔德, M·斯坦顿, R·M·奥斯特罗夫 申请人:私募蛋白质体公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1