用于肺癌诊断的组合物、方法和试剂盒与流程

文档序号:13267325阅读:425来源:国知局
相关申请的交叉引用本申请要求2013年7月26日提交的U.S.S.N.61/858,760的优先权和权益,其内容通过引用以其整体结合到本文中。发明背景肺病况,且特别是肺癌,存在着重大诊断挑战。在许多无症状的患者中,放射性筛查,例如计算机断层成像(CT)扫描,是诊断范式的第一步。肺结节(PN)或不确定性结节位于肺中,并常常在筛选这两类高危患者期间或附带被发现。由于越来越多数量的患者易于获得卫生保健服务、筛选技术的迅速采用和人口老龄化,经鉴定的PN的数量预计将上升。在美国,估计每年有超过3百万例PN被鉴定。尽管绝大多数PN是良性的,但有些是恶性的,导致额外的干预措施。对于被认为是低风险的恶性结节的患者,目前的医疗实践规定每3-6个月扫描,持续至少两年,以监测肺癌。PN识别与诊断之间的时间段是医疗监测或“警惕等待”的时间并由于重复成像研究可能会诱导患者的压力,导致重大风险和费用。如果对被发现患有良性结节的患者进行活组织检查,则增加了不必要的成本和对患者的潜在的伤害。为了切除用于组织活检和诊断的样本,主要外科手术是需要的。所有这些程序与对患者的风险有关,包括:疾病、损伤和死亡以及高的经济成本。通常,PN由于其在肺中的大小和/或位置而不能经活检来确定它们是否是良性或恶性的。然而,PN与循环系统关联,因此如果是恶性的,癌症的蛋白标志物可以进入血液并提供用于确定是否PN是恶性或不是恶性的信号。需要可以代替或补充用于患有PN患者的现有诊断方法的诊断方法以改进诊断,减少成本和最大限度地减少对患者的侵入性程序和并发症。发明简述本发明提供用于鉴定蛋白标记物以鉴定、诊断、分类和监测肺病况,特别是肺癌的新的组合物、方法和试剂盒。本发明使用一种多重测定法以区别良性肺结节与恶性肺结节,以分类罹患或未罹患肺癌的患者。本发明可用于表现出肺癌症状,但没有肺结节的患者。本发明提供一种测定受试者的肺病况为癌症的可能性的方法,其通过以下步骤进行:测量从受试者获得的样品中的蛋白质丰度;基于蛋白质丰度和FRIL_HUMAN和COIA1_HUMAN之间的蛋白-蛋白(数学)相互作用,计算癌症得分的概率;和如果得分低于预定得分,则排除受试者的癌症。当癌症被排除时,受试者不接受治疗方案。治疗方案包括例如肺功能测试(PFT)、肺成像、活组织检查、手术、化疗、放疗,或其任何组合。在一些实施方案中,成像是x-射线、胸部计算机断层成像(CT)扫描或正电子发射断层成像(PET)扫描。本发明还提供一种确定受试者的肺病况存在的可能性的方法,其通过以下步骤进行:测量从受试者获得的样品中的蛋白质丰度,基于蛋白质丰度和FRIL_HUMAN和COIA1_HUMAN之间的蛋白-蛋白(数学)相互作用,计算癌症得分的概率;和如果得分等于或大于预定得分,则得出存在所述肺病况的结论。预定得分可通过对作为参照人群的一部分的多个受试者打分来确定。所述肺病况是肺癌例如,非-小细胞肺癌(NSCLC)。受试者处于发生肺癌的危险中。癌症的可能性可通过与得分有关的敏感性、特异性、阴性预测值或阳性预测值来确定。本发明还提供确定受试者的肺病况为癌症的方法,其包括评价多种蛋白的表达,包括确定来自从受试者获得的生物样品的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达水平;计算在前一步骤中确定的、来自生物样品的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达的得分;和比较来自生物样品的得分与从参照人群获得的多个得分,其中所述比较提供肺病况不是癌症的判定。肺病况不是癌症的判定可包括评价多种蛋白的表达,以确定从受试者的生物样品获得的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达水平。从这些评价计算得分并将这种得分进一步与从参照人群获得的多个得分比较,其中所述比较提供肺病况不是癌症的判定。该方法也可包括确定FRIL_HUMAN和COIA1_HUMAN之间的相互作用。比较来自受试者的得分与从参照人群获得的多个得分可提供癌症概率。优选地,当所述比较提供癌症概率且概率是15%或更少时,肺病况被归类为不是癌症。更优选地,当所述比较提供癌症概率且概率是10%或更少时,肺病况被归类为不是癌症。最优选地,当所述比较提供癌症概率且概率是5%或更少时,肺病况被归类为不是癌症。受试者可以是患有或疑似患有肺结节的受试者。肺结节可具有30mm或更小的直径。优选地,肺结节具有约8mm-30mm的直径。受试者可被怀疑患有癌或非-癌肺病况。癌性肺病况可包括非-小细胞肺癌。非-癌肺病况可包括慢性阻塞性肺病、错构瘤、纤维瘤、神经纤维瘤、肉芽瘤、类肉瘤病、细菌感染或真菌感染。受试者可以是哺乳动物。优选地,受试者是人。生物样品可以是从受试者获得的任何样品,例如,组织、细胞、体液。优选地,生物样品是组织、血、血浆、血清、全血、尿、唾液、生殖器分泌物、脑脊液、汗液、排泄物或支气管肺泡灌洗液。本方面的方法也可包括评价多种蛋白的表达,其包括测定PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN和PTPRJ_HUMAN的至少一种的蛋白表达水平。确定本发明蛋白的至少一种或每一种的蛋白水平可包括使蛋白碎片化,每种蛋白生成至少一个肽。优选地,蛋白的片段化通过胰蛋白酶消化完成。本方面的方法可进一步包括蛋白质测量的标准化。例如,蛋白测量可通过一种或多种“持家”蛋白,例如,在不同的样本或受试者中没有可变表达的蛋白标准化。优选的标准化蛋白质可包括PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN和PTPRJ_HUMAN的至少一种。本发明还提供使用对应于ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN、COIA1_HUMAN、PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN或PTPRJ_HUMAN的至少一种或每一种的合成的、修饰重肽的方法。合成肽的至少一个或每一个可附接有同位素标记。评价多种蛋白的表达的方法可包括质谱法(MS)、液相色谱-选择反应监测/质谱法(LC-SRM-MS)、逆转录酶-聚合酶链反应(RT-PCR)、微阵列、基因表达系列分析(SAGE)、通过大规模平行特征测序的基因表达分析(MPSS)、免疫测定、免疫组织化学(IHC)、转录组学或蛋白质组学技术。优选地,多种蛋白的表达用LC-SRM-MS评价。LC-SRM-MS可被用来确定每个分析的肽的跃迁。优选地,可确定ALQASALK、AVGLAGTFR、GFLLLASLR、LGGPEAGLGEYLFER或VEIFYR的至少一个或每一个的肽跃迁。更优选肽跃迁包括至少ALQASALK(401.25,617.4)、AVGLAGTFR(446.26,721.4)、GFLLLASLR(495.31,559.4)、LGGPEAGLGEYLFER(804.4,1083.6)和VEIFYR(413.73,598.3)。测量步骤也可使用特异性地结合待检测的蛋白的化合物或肽跃迁进行。例如,特异性地结合于待测量的蛋白的化合物可以是抗体或适体。得分可从应用于蛋白测量的逻辑回归模型计算。例如,得分按照测定,其中是所述样品中跃迁i的Box-Cox变换和标准化强度,βi是相应的逻辑回归系数,α是小组-特异性常数,和γ是交互作用项的系数。参照人群可包括至少100位患有肺病况的受试者,其中参照人群的每个受试者已基于从来自受试者的生物样品获得的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达被赋予一个分值。本发明还提供用于治疗受试者的方法,其中如果肺病况不是癌症,则根据临床实践指南治疗受试者。优选地,如果肺病况不是癌症,则受试者接受图像监测至少1年的时期,至少2年的时期或至少3年的时期。更优选地,如果肺病况不是癌症,则受试者接受胸部计算机断层成像扫描至少1年的时期,至少2年的时期或至少3年的时期。本发明还提供任何公开的方法的至少一个步骤可在计算机或计算机系统上进行。本文引用的专利和科学文献建立为本领域技术人员可以利用的知识。本文引用的所有的美国专利和公布的或未公布的美国专利申请通过引用予以结合。本文引用的所有公布的外国专利和专利申请通过引用予以结合。由本文引用的索取号指示的GenBank和NCBI呈递书通过引用予以结合。本文引用的所有其它发表的参考文献、文件、手稿和科学文献通过引用予以结合。虽然通过参考其优选的实施方案已经具体地表明和描述了本公开内容,但本领域技术人员应该理解,形式和细节的各种改变可在其中作出,而不背离由所附权利要求书涵盖的本公开内容的范围。附图简述图1是显示用于来自3个场所UPenn、Laval和NYU的实验的样品批次的图。图2是显示A)NPV和小组ID_465的特异性和B)对小组ID_465的接受操作曲线的曲线下面积的一组图。图3是显示A)NPV和小组ID_341的特异性和B)对小组ID_341的接受操作曲线的曲线下面积的一组图。图4是显示NPV和小组ID_465的特异性加COIA1xFRIL相互作用的图(C4分类器)。图5是显示NPV和小组ID_341的特异性的图。发明详述所公开的本发明来自惊人的发现,即在表现有肺结节的患者中,在血液中的一小组蛋白标记物能够用高的阴性预测值(NPV)特异性地鉴定和区别恶性和良性肺结节。更重要的是,小组中的至少两种蛋白标记物在确定概率得分的模型中以数学方式相互作用。这样的蛋白-蛋白相互作用令人吃惊地增加本文所述方法的特异性。本文描述的分类器(C4分类器)还表现出显著的独立性和准确性。没有临床因素影响分类器的评分。因此本发明提供给患者与早期检测患者的肺癌有关的独特优点,包括增加生存寿命,降低发病率和死亡率,减少在筛查过程中对辐射的暴露以及重复筛查,和最小侵入性诊断模型。重要地,本发明的方法使得患者得以避免侵入性程序。胸部计算机断层成像(CT)扫描的常规临床应用每年鉴定数百万的肺结节,其中只有很小的一部分是恶性的,但却对诊断患有非-小细胞肺癌(NSCLC)的患者造成令人沮丧的15%的五年生存率。患有肺结节的患者的早期肺癌诊断是最优先考虑的,因为基于临床表现,结合当前非侵入性诊断选项如胸部CT和正电子发射断层成像(PET)扫描,和其它的侵入性替代方案作出的决策,没有改变患有I期NSCLC的患者的临床结果。相对于8mm以下的较低恶性率和20mm以上的较高恶性率,尺寸在8mm和20mm之间的肺结节的子群越来越被公认为是\中间的\。经使用胸针抽吸活检的活组织检查或支气管镜检的肺结节的侵入性采样可提供NSCLC的细胞病理学诊断,但也与假-阴性和非-诊断结果二者有关。简言之,肺结节处理的关键未满足的临床需求是非-侵入性诊断试验,该试验在不确定性肺结节(IPN),特别是在尺寸介于8mm和20mm之间的患者中区分恶性和良性过程。在治疗上或多或少有侵袭性的临床决策,除了成像外,还以风险因素、主要的结节大小、抽烟史和年龄为基础。因为这些都不是决定性的,因此对将是非-侵入性和提供对风险因素和成像的补充信息的基于分子的血试验有很大的需求。因此,这些和相关的实施方案将发现在肺病况的筛查方法中,且特别是肺癌诊断中有用。更重要的是,本发明发现在确定患者的临床处理中有用。即是说,本发明的方法可用于为个体受试者采用或排除特定的治疗方案。癌症生物学需要分子策略以解决为评价肺癌风险的未满足的医疗需求。诊断医学领域随着提供用于检测蛋白变化的灵敏机制的技术和测定法已得到发展。本文所述的方法使用LC-SRM-MS技术测量在恶性PN患者中共同改变的血浆蛋白浓度。这种蛋白特征是肺癌的预示。LC-SRM-MS是一种提供血浆中循环蛋白的定量和鉴定的方法。可使用这样一种灵敏的技术检测蛋白表达水平的变化,例如但不限于信号转导因子、生长因子、裂解的表面蛋白和分泌蛋白,以分析癌症。这里提出的是一个基于血液的分类试验,以确定呈现为肺结节的患者具有良性或恶性结节的可能性。本发明提出了一种预测PN为良性或恶性的相对可能性的分类算法。更广泛地,已证实关于本发明有许多变化,这些变化也是用于PN是良性或恶性的可能性的诊断试验。这些是关于一组蛋白、蛋白标准、测量方法和/或分类算法的变化。本发明还提供确定受试者的肺病况为癌症的方法,其包括评价多种蛋白的表达,包括确定来自从受试者获得的生物样品的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达水平;从来自前一步骤中确定的生物样品的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达计算得分;和比较来自生物样品的得分与从参照人群获得的多个得分,其中所述比较提供肺病况不是癌症的判定。肺病况不是癌症的判定可包括评价多种蛋白的表达,以确定从来自受试者的生物样品获得的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达水平。从这些评价计算得分并将这种得分进一步与从参照人群获得的多个得分比较,其中所述比较提供肺病况不是癌症的判定。该方法还可包括确定FRIL_HUMAN和COIA1_HUMAN之间的相互作用。比较来自受试者的得分与从参照人群获得的多个得分可提供癌症概率。优选地,当所述比较提供癌症概率且概率是15%或更少时,则肺病况被归类为不是癌症。更优选地,当所述比较提供癌症概率且概率是10%或更少时,肺病况被归类为不是癌症。最优选地,当所述比较提供癌症概率和概率是5%或更少时,肺病况被归类为不是癌症。受试者可以是患有或疑似患有肺结节的受试者。肺结节可具有30mm或更小的直径。优选地,肺结节具有约8mm-30mm的直径。受试者可被怀疑患有癌或非-癌肺病况。癌性肺病况可包括非-小细胞肺癌。非-癌肺病况可包括慢性阻塞性肺病、错构瘤、纤维瘤、神经纤维瘤、肉芽瘤、类肉瘤病、细菌感染或真菌感染。受试者可以是哺乳动物。优选地,受试者是人。生物样品可以是从受试者获得的任何样品,例如,组织、细胞、体液。优选地,生物样品是组织、血、血浆、血清、全血、尿、唾液、生殖器分泌物、脑脊液、汗液、排泄物或支气管肺泡灌洗液。本方面的方法还可包括评价多种蛋白的表达,其包括测定PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN和PTPRJ_HUMAN的至少一种的蛋白表达水平。确定本发明蛋白的至少一种或每一种的蛋白水平可包括使蛋白碎片化,每种蛋白生成至少一个肽。优选地,蛋白的片段化通过胰蛋白酶消化完成。本方面的方法可进一步包括蛋白质测量的标准化。例如,蛋白测量可由一种或多种“持家”蛋白标准化,例如,在不同的样品或受试者中没有可变表达的蛋白。优选的标准化蛋白可包括PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN和PTPRJ_HUMAN的至少一种。本发明还提供使用对应于ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN、COIA1_HUMAN、PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN或PTPRJ_HUMAN的至少一种或每一种的合成的、修饰重肽的方法。合成肽的至少一个或每一个可以有附接的同位素标记。评价多种蛋白的表达的方法可包括质谱法(MS)、液相色谱-选择反应监测/质谱法(LC-SRM-MS)、逆转录酶-聚合酶链反应(RT-PCR)、微阵列、基因表达系列分析(SAGE)、通过大规模平行特征测序的基因表达分析(MPSS)、免疫测定、免疫组织化学(IHC)、转录组学或蛋白质组学技术。优选地,多种蛋白的表达用LC-SRM-MS评价。LC-SRM-MS可被用来确定每个分析的肽的跃迁。优选地,可测定ALQASALK、AVGLAGTFR、GFLLLASLR、LGGPEAGLGEYLFER或VEIFYR的至少一个或每一个的肽跃迁。更优选地,肽跃迁包括至少ALQASALK(401.25,617.4)、AVGLAGTFR(446.26,721.4)、GFLLLASLR(495.31,559.4)、LGGPEAGLGEYLFER(804.4,1083.6)和VEIFYR(413.73,598.3)。测量步骤也可使用特异性地结合待检测的蛋白的化合物或肽跃迁进行。例如,特异性地结合于待测量的蛋白的化合物可以是抗体或适体。可从应用于蛋白测量的逻辑回归模型计算得分。例如,得分按照测定,其中是所述样品中跃迁i的Box-Cox变换和标准化强度,βi是相应的逻辑回归系数,α是小组-特异性常数,和γ是交互作用项的系数。参照人群可包括至少100位患有肺病况的受试者和其中参照人群的每个受试者已根据从来自受试者的生物样品获得的ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的至少每一种的蛋白表达,被赋予一个分值。本发明还提供用于治疗受试者的方法,其中如果肺病况不是癌症,则根据临床实践指南治疗受试者。优选地,如果肺病况不是癌症,则受试者接受图像监测至少1年的时期,至少2年的时期或至少3年的时期。更优选地,如果肺病况不是癌症,则受试者接受胸部计算机断层成像扫描至少1年的时期,至少2年的时期或至少3年的时期。本发明还提供了任何公开的方法的至少一个步骤可在计算机或计算机系统上进行。如本文公开的,通过质谱法分析来自表现有PN的受试者的保存的血浆样品中的差异蛋白表达,而结果被用来鉴定与各种肺病况(癌症对比非-癌症)有关的差异表达的生物标记物蛋白和各小组的生物标记物蛋白。在本发明的一个方面,小组包含具有至少一个蛋白-蛋白相互作用的至少2、3、4、5或更多种蛋白标记物。在一些实施方案中,小组包含具有至少一个蛋白-蛋白相互作用的5种蛋白标记物。在一些实施方案中,小组包含ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN;而FRIL_HUMAN和COIA1_HUMAN在用于确定癌症的概率得分的模型中相互作用。在一些实施方案中,小组包含2、3或4种选自ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的生物标记物;和至少一个蛋白-蛋白数学相互作用存在于生物标记物中。本文可使用的另外的生物标记物描述于WO13/096845,其内容通过引用以其全文结合到本文中。本文所用的术语“交互作用”、“相互作用的”、“相互作用”或“蛋白-蛋白相互作用”指当计算癌症的概率得分时,从两种或更多种蛋白标记物衍生的肽(或肽跃迁)之间的数学相互作用。术语“肺结节”(PN)指可通过射线照相技术可视的肺损伤。肺结节是直径少于或等于3厘米的任何结节。在一个实例中,肺结节具有约0.8cm-2cm的直径。术语\肿块(masses)\或“肺部肿块”指最大直径大于3厘米的肺结节。术语“血液活检”指对血液的诊断研究以确定呈现有结节的患者是否患有可归类为良性或者恶性的病况。术语“接受标准”指分析、测试、诊断或产品应该符合其预期用途的被认为可接受的一套标准。如本文所用的,接受标准是一个测试、分析程序参考和适当的度量的列表,其针对用于诊断的测定或产品而被定义。例如,用于分类器的接受标准指一组预定范围的系数。术语“平均最大AUC”指计算性能的方法。对于本发明,在确定应该为一个小组的一组蛋白质的过程中,通过向前或向后选择,一次一个地除去或添加蛋白。用性能可生成图(在Y轴上的AUC或部分AUC得分和在X轴上的蛋白),使性能最大化的点指示给出最佳结果的蛋白的数量和组。术语“部分AUC因子或pAUC因子”是大于通过随机预测所预期的。在灵敏性=0.90时,pAUC因子是在从0.9至1.0特异性的ROC曲线下的梯形面积/(0.1*0.1/2)。术语“增量信息”指可与其它的诊断信息一起使用以提高诊断准确性的信息。增量信息独立于临床因素如包括结节大小、年龄或性别。术语“得分”或“评分”指计算样品的概率可能性。对于本发明,接近1.0的值被用来表示样品是癌症的可能性,接近0.0的值表示样品是良性的可能性。术语“鲁棒性”指不通过违反它基于的假设而严重干扰的测试或程序。对于本发明,鲁棒性试验是其中蛋白或质谱色谱图的跃迁已经进行了人工审查,而且是\一般\没有干扰信号的试验。术语“系数”是指分配给每种蛋白质的权重,用来在逻辑回归模型中对样品评分。在本发明的某些实施方案中,考虑到在MCCV的逻辑回归模型方面,模型系数和每种蛋白的模型系数的变异系数(CV)可增加或减少,取决于蛋白分类器的测量的方法(或模型)。对于在小组中列出的每种蛋白质,对于每个系数和CV,有约至少,至少约,或至多约2-、3-、4-、5-、6-、7-、8-、9-或10-倍或可从其中推导的任何范围。或者,考虑到本发明的定量实施方案可根据如约,至少,至少约,或至多约10、20、30、40、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%或更多,或可从其中推导的任何范围进行讨论。术语“最佳团队成员”指在随机小组选择算法中排名最佳的蛋白质,即,在小组上良好地进行。当结合到分类器中时,这些蛋白可将癌症与良性样品分开。“最佳团队成员蛋白”与“协作蛋白”是同义的。术语“协作蛋白”指在蛋白的高性能小组上比偶然预期的更频繁地出现的蛋白。这引起蛋白的协作得分,其测量它在高性能小组上出现的频率有多高。例如,具有协作得分为1.5的蛋白在高性能小组上的出现为单独偶然预期的1.5倍。如本文关于肺病况所用的术语\分类\指使用统计学技术汇编和分析表达数据的行动,提供分类以帮助诊断肺病况,特别是肺癌。如本文所用的术语“分类器\指一种用预定水平的统计学意义区分疾病状态的算法。两类分类器是使用从样品测量的数据点并将数据分类到两组之一的算法。在某些实施方案中,用于分类器的数据是生物样品中蛋白的相对表达。在受试者中的蛋白表达水平可与先前诊断为无疾病或患有特定病症的患者的水平比较。表4列出代表性分类器(C4分类器)。“分类器”使区分随机选择的癌症样品与随机选择的良性样品的概率,即ROC曲线的AUC最大化。除了分类器的具有差异表达的组成蛋白外,它也可包括具有最小甚或没有生物学变异的蛋白,以便能够在临床样本内或临床样本之间评价变异性或其缺乏;这些蛋白可被称为内源性蛋白并用作其它分类器蛋白的内部对照。如本文所用的术语\标准化\或“标准品”指按照标准值的差异值的表述,以调节由于样品处理、样品制备和质谱法测量(而非样品中蛋白浓度的生物学变异)自技术变化产生的影响。例如,当测量差异表达蛋白的表达时,蛋白表达的绝对值可根据基本上是恒定表达的标准蛋白表达的绝对值表述。这防止了样品制备和质谱法测量的技术变化阻碍样品中蛋白浓度水平的测量。如本文所用的术语\病况\一般指疾病、事件或健康状况的变化。如本文所用的术语“治疗方案”包括通常为确定肺结节是否为良性或恶性所进行的进一步的诊断试验。治疗方案包括通常用来诊断肺结节或肿块的诊断试验,例如,CT扫描、正电子发射断层成像(PET)扫描、支气管镜检或组织活检。如本文所用的治疗方案也意欲包括通常用来治疗恶性肺结节和/或肺癌的疗效性治疗,例如,化疗、放疗或手术。术语\诊断\和\诊断学\也分别涵盖术语\预后\和\预后学\,以及这样的程序在两个或更多个时间点的应用,以随时间推移监测诊断和/或预后,及基于其的统计学建模。此外,术语诊断包括:a.预测(确定患者是否将可能发展过度增殖性疾病),b.预后(预测患者在将来预选的时间是否可能具有更好的或更坏的结果),c.疗法选择,d.治疗药物监测,e.复发监测。在一些实施方案中,例如,得自患有肺病况的受试者的生物样品分类可指由实验室产生的结果和相关报告,而诊断可指使用分类法以鉴定或验证肺病况的医学专业行动。如本文关于生物样品所用的术语\提供\指从受试者直接或间接获得生物样品。例如,\提供\可指从受试者直接获得生物样品的行动(例如,通过抽血、组织活检、灌洗等)。同样地,\提供\可指间接获得生物样品的行动。例如,提供可指实验室从直接获得的样品的一方接受样品的行动,或从存档获得样品的行动。如本文所用的,\肺癌\优选地指肺部癌症,但可包括人或其它哺乳动物的呼吸系统的任何疾病或其它障碍。呼吸道肿瘤性疾病包括,例如小细胞癌或小细胞肺癌(SCLC)、非-小细胞癌或非-小细胞肺癌(NSCLC)、鳞状细胞癌、腺癌、支气管肺泡癌、混合肺癌、恶性胸膜间皮瘤、未分化大细胞癌、巨细胞癌、同步肿瘤、大细胞神经内分泌癌、腺鳞癌、未分化癌;和小细胞癌,包括燕麦细胞癌、混合小细胞/大细胞癌,和合并小细胞癌;以及腺样囊性癌、错构瘤、粘液表皮样肿瘤、典型类癌肺肿瘤、非典型类癌肺肿瘤、周围类癌肺肿瘤、中心类癌肺肿瘤、胸膜间皮瘤,和未分化肺癌和原发于肺外部的癌症,如已从身体的其它部位转移至肺的继发性癌症。肺癌可具有任何阶段或等级。优选地,该术语可用来共同指任何发育不良、增生、瘤形成或癌转移,其中例如通过与邻近的健康组织比较,可确定表达高于正常水平的蛋白生物标记物。非-癌肺病况的实例包括慢性阻塞性肺病(COPD)、良性肿瘤或细胞肿块(例如,错构瘤、纤维瘤、神经纤维瘤)、肉芽瘤、类肉瘤病和由细菌(例如,结核)或真菌(如组织胞浆菌病)病原体引起的感染。在某些实施方案中,肺病况可与放射照像的PN外观有关。如本文所用的,\肺组织\和\肺癌\分别指肺本身的组织或癌症,以及邻近肺和/或在肺下层内的组织和支撑结构如胸膜、肋间肌、肋骨和呼吸系统的其它元件。呼吸系统本身在本上下文中被视为代表鼻腔、鼻窦、咽、喉、气管、支气管、肺、肺叶、肺泡、肺泡管、肺泡囊、肺泡毛细血管、细支气管、呼吸道细支气管、内脏胸膜、胸腔胸膜、胸膜腔、横隔膜、会厌、类腺、扁桃腺、口和舌等。组织或癌症可以是来自哺乳动物并且是优选地来自人,虽然猴、猿、猫、狗、牛、马和兔也在本发明的范围内。如本文所用的术语\肺病况\指与肺有关的疾病、事件或健康状况的变化,包括例如肺癌和各种非-癌病况。\准确性\指测量或计算的量(试验报告值)与其实际(或真实)值的符合程度。临床准确性与真实结果的比例相关(真阳性(TP)或真阴性(TN)对比错误的分类结果(假阳性(FP)或假阴性(FN)),并可称为灵敏性、特异性、阳性预测值(PPV)或阴性预测值(NPV),或称为可能性、比值比以及其它度量。如本文所用的术语\生物样品\指可能含有一种或多种生物标记物蛋白的生物来源的任何样品。生物样品的实例包括组织、器官或体液如全血、血浆、血清、组织、灌洗液或供检测疾病所用的任何其它样本。如本文所用的术语\受试者\指哺乳动物,优选人。如本文所用的术语\生物标记物蛋白\指来自患有肺病况的受试者的生物样品对比来自对照受试者的生物样品的多肽。生物标记物蛋白不仅包括多肽本身,而且还包括其微小变异,包括例如一个或多个氨基酸取代或修饰如糖基化或磷酸化。如本文所用的术语\生物标记物蛋白小组\指多种生物标记物蛋白。在某些实施方案中,在小组中的蛋白的表达水平可与受试者的肺病况的存在相关。在某些实施方案中,生物标记物蛋白小组包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90或100种蛋白。在某些实施方案中,生物标记物蛋白小组包含2-5种蛋白、5-10种蛋白、10-20种蛋白或更多。如本文所用关于病况的\处理\或\治疗\可指预防所述病况,延缓病况的发作或发生速率,减少发生所述病况的风险,预防或延迟与所述病况有关的症状的发展,减轻或终止与所述病况有关的症状,使所述病况产生完全或部分的消退,或其一些组合。生物标记物水平可由于治疗疾病而改变。生物标记物水平的变化可通过本发明测量。生物标记物水平的变化可被用来监测疾病的进展或疗法。\改变的\、\变化的\或\显著不同的\指可检测的变化或与合理地可比较的状态、特征、测量等的差别。本领域技术人员应能够确定合理的可测量的变化。这样的变化可以是全部或可以是全无。它们可以是渐进的且不必是线性的。它们可以是按数量级的。变化可以是增加或减少1%、5%、10%、20%,30%、40%、50%、60%、70%、80%、90%、95%、99%、100%,或更多,或在0%和100%之间的任何值。或者,变化可以是1-倍、1.5-倍、2-倍、3-倍、4-倍、5-倍,或更多倍,或在1-倍和5-倍之间的任何值。变化可以是有统计学意义的(p值为0.1、0.05、0.001,或0.0001)。使用本发明的方法,首先进行患者的临床评价。如果存在癌症的较高的可能性,临床医师可管控疾病,这将需要追踪产生数据的诊断试验选项,所述数据增加和/或证实诊断的可能性。疾病的“管控”需要具有高特异性的试验。\FN\是假阴性,其用于疾病状态试验时,意指将疾病受试者错误地分类为无疾病或正常的。\FP\是假阳性,其用于疾病状态试验时,意指将正常的受试者错误地分类为患有疾病。术语“管控”指具有高特异性的诊断试验,其任选地与临床评价结合指示癌症的较高的可能性。如果临床评价是较少的癌症可能性,临床医师可采取一种立场来排除这种疾病,这将需要产生减少诊断可能性的数据的诊断试验。“排除”需要具有高灵敏度的试验。因此,如本文所用的术语“管控”意指受试者被选择以接受治疗方案。术语“排除”指具有高的灵敏性的诊断试验,其任选地与临床评价结合指示癌症的较低的可能性。因此,如本文所用的术语“排除”意指受试者被选择不接受治疗方案。术语“试验的灵敏性”指患有所述疾病的患者将具有阳性试验结果的概率。这从具有阳性试验结果(真阳性)的患有所述疾病的患者数目除以患有所述疾病的患者的总数(包括具有真阳性结果的那些和具有阴性结果,即假阴性的患有所述疾病的那些患者)导出。术语“试验的特异性”指没有疾病的患者将具有阴性试验结果的概率。这从具有阴性试验结果(真阴性)的没有所述疾病的患者数目除以无所述疾病的患者(包括具有真阴性结果的那些和具有阳性试验结果,如假阳性的无所述疾病的那些患者)导出。虽然试验的灵敏性、特异性、真或假阳性率,和真或假阴性率提供试验性能(如相对于其它的试验)的指示,但为基于试验的结果对个体患者作出临床决定,临床医师仍需要关于给定群体的试验性能参数。术语“阳性预测值”(PPV)指阳性结果正确地鉴定患有所述疾病的患者的概率,其是真阳性的数量除以真阳性和假阳性总和。术语\阴性预测值\或\NPV\通过TN/(TN+FN)或所有阴性试验结果的真阴性分数计算。它还固有地被疾病的患病率和计划待试验的群体的预试验概率所影响。术语NPV指阴性试验正确地鉴定没有所述疾病的患者的概率,其是真阴性的数量除以真阴性和假阴性的总和。来自具有足够PPV的试验的阳性结果可被用来管控患者的疾病,而来自具有足够NPV的试验的阴性结果可被用来排除所述疾病,如果对于给定群体(其中患者可被认为是一个部分)的疾病患病率是已知的话。术语“疾病患病率”指一种疾病的所有新和老病例或在特定时段事件发生的数目。患病率被表示为其中事件的数目是分子和处于风险中的群体是分母的比率。术语疾病发病率指在特定的时间段内发生一些新病况的风险的量度;在一些时段期间新病例的数目,最好表示为与分母的比例或比率。依据“国家肺筛查试验”的肺癌风险按年龄和吸烟史分类。高危-年龄≥55和≥30包-年吸烟史;中等风险-年龄≥50和≥20包-年吸烟史;低风险-<年龄50或<20包-年吸烟史。临床医师必须使用诊断测试,基于其内在性能参数(包括灵敏性和特异性),并基于其外在性能参数(如阳性预测值和阴性预测值)(这取决于在给定群体中的疾病的患病率),作出决定。可影响疾病可能性的临床评价的另外参数包括患者对已知物质(如暴露风险)的先前频率和接近性,这直接或间接与疾病病因,如吸第二手烟、辐射等有关,并且也与肺结节的放射照相外观或特征(除了大小外)有关。结节的描述可包括固体、半-固体或毛玻璃状,其基于通过CT扫描技术采用的相对灰度色标密度的频谱将结节表征。\质谱\指包括使用电离源,以从呈现探针表面的样品上存在的分析物生成气相离子并用质谱仪检测气相离子的方法。在本发明的一个实施方案中,一小组5种蛋白(ALDOA、FRIL、LG3BP、TSP1和COIA1)和一个蛋白-蛋白交互作用项(FRIL和COIA1)有效地在从具有少于2cm直径的良性和恶性结节的患者中获得的样品之间区分。生物信息学和生物统计分析被首先用来鉴定具有统计学显著差异表达的个别蛋白,然后使用这些蛋白衍生出一个或多个蛋白的组合或蛋白的小组,其共同表现出比任何个别蛋白优越的识别性能。生物信息学和生物统计学方法被用来推导小组中每个个别蛋白的系数(C),该系数反映其相对表达水平,即增加或减少,及其关于小组的净识别能力相对于其它蛋白的权重或重要性。小组的定量识别能力可表示为用其组成蛋白的每一个是其系数和蛋白的血浆表达水平(P)(如通过LC-SRM-MS测定的)的乘积,如CxP的术语的数学算法,使用由如下所述的n种蛋白组成的算法:C1xP1+C2xP2+C3xP3+…+CnxPn。用统计学意义的预定水平区分疾病状态的算法可以称为“疾病分类器”。除了分类器的具有差异表达的组成蛋白,它也可包括具有极少甚或没有生物变异的蛋白,以便能够在临床样本内或临床样本之间评价变异性或其缺乏;这些蛋白可被称为典型的天然蛋白并用作对其它的分类器蛋白的内部对照。在某些实施方案中,由MS测量表达水平。MS分析在其经母蛋白的蒸发生产及其基于其质量与电荷比与其它的离子分离后通过离子产生的质谱。获得MS数据的最常用的模式是1)导致典型的全离子电流图(TIC)的全扫描采集,2)选择的离子监测(SIM),和3)选择的反应监测(SRM)。在本文提供的方法的某些实施方案中,生物标记物蛋白表达水平通过LC-SRM-MS测定。LC-SRM-MS是一种高选择性的串联质谱法,其具有有效地过滤掉除了所需分析物外所有分子和污染物的潜力。这是特别有益的,如果分析样品是在定义的分析窗口内可包含几种同质异位物种的复杂化合物的话。LC-SRM-MS方法可利用本领域已知的三重四极质谱仪,包括3个四极杆装置。第一阶段的质量选择是在第一个四极杆装置中进行,而选择性地发射的离子在第二个四极杆装置中被碎片化。产生的跃迁(产物)离子被输送到第三个四极杆装置,其进行第二阶段的质量选择。通过第三个四极杆装置发射的产物离子用探测器测量,所述探测器产生代表选择性地发射的产物离子数的信号。施加于第一和第三个四极的RF和DC电位被调整以选择(分别地)具有位于狭窄规定范围内的m/z值的前体和产物离子。通过指定适当的跃迁(前体和产物离子的m/z值),可测量具有高度灵敏性和选择性的对应于靶蛋白的肽。信噪比优于传统的串联质谱法(MS/MS)实验,其在第一个四极中选择一个质量窗口,然后测量离子检测器中的所有产生的跃迁。LC-SRM-MS。在某些实施方案中,本文公开的用于诊断或监测肺癌的SRM-MS测定可利用一个或多个源自蛋白ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的肽和/或肽跃迁。在某些实施方案中,源自2种或更多种蛋白的肽和/或肽跃迁在数学上“相互作用”。在某些实施方案中,源自FRIL和COIA1的肽和/或肽跃迁在测定肺癌概率得分模型中,在数学上相互作用。生物标记物蛋白的表达水平可使用本领域已知的任何合适的方法测量,包括但不限于质谱法(MS)、逆转录酶-聚合酶链反应(RT-PCR)、微阵列、基因表达系列分析(SAGE)、通过大规模平行特征测序的基因表达分析(MPSS)、免疫测定(例如,ELISA)、免疫组织化学(IHC)、转录组学和蛋白质组学技术。为评价一组特定的肽跃迁的诊断性能,生成用于每个显著的跃迁的ROC曲线。如本文所用的\ROC曲线\指二元分类器系统的真阳性率(灵敏性)对假阳性率(特异性)的作图,因为其识别阈值是变化的。ROC曲线可通过绘制阳性中的真阳性分数(TPR=真阳性率)对比阴性中的假阳性分数(FPR=假阳性率)等同地表示。ROC曲线上的每个点表示对应于特定的决策阈值的灵敏性/特异性对。AUC表示在ROC曲线下的面积。AUC是1)生物标记物或生物标记物的小组和2)ROC曲线的诊断准确度的总指标。AUC由“梯形规则”确定。对于给定的曲线,数据点由直线段连接,垂直线从横坐标上竖立至每个数据点,并计算如此构成的三角形和梯形的面积总和。在本文提供的方法的某些实施方案中,生物标记物蛋白具有在约0.75-1.0的范围内的AUC。在某些这样的实施方案中,AUC是在约0.8-0.8、0.9-0.95,或0.95-1.0的范围内。本文提供的方法是最小侵入性的,并构成极小风险或没有风险的不利影响。因此,它们可被用来对未表现出肺病况的任何症状的受试者和分类为发生肺病况的低风险的受试者进行诊断、监测并提供临床处理。例如,本文公开的方法可被用来在未出现PN和/或在过去未曾出现PN,但虽然如此却被认为处于发生PN和/或肺病况的风险的受试者中诊断肺癌。类似地,本文公开的方法可被用作严格的预防措施,以诊断分类为发生肺病况的低风险的健康受试者。本发明提供测定受试者的肺病况为癌症的可能性的方法,即通过测量从受试者获得的样品中蛋白小组的丰度;基于蛋白测量,计算癌症得分的概率,并且如果得分低于预定得分,则排除受试者的癌症,当排除癌症时,受试者不接受治疗方案。治疗方案包括例如肺功能试验(PFT)、肺成像、活组织检查、手术、化疗、放疗,或其任何组合。在一些实施方案中,成像是x-射线、胸部计算机断层成像(CT)扫描或正电子发射断层成像(PET)扫描。本发明还提供一种管控受试者的癌症可能性的方法,即通过测量从受试者获得的样品的蛋白小组的丰度,基于蛋白测量,计算癌症得分的概率,并且如果得分高于预定得分,则管控受试者的癌症的可能性。在另一方面,本发明还提供一种测定受试者的肺病况存在的可能性的方法,即通过测量从受试者获得的样品的蛋白小组的丰度,基于蛋白测量,计算癌症得分的概率,并且如果得分是等于或大于预定得分,则得出存在这种肺病况的结论。所述肺病况是肺癌例如非-小细胞肺癌(NSCLC)。受试者处于发生肺癌的危险中。小组包括5种蛋白ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN。对于这些,核酸和氨基酸序列可分别在表6和表7中发现。优选地,FRIL_HUMAN和COIA1_HUMAN在用于测定概率得分的模型中在数学上相互作用。在仅仅说明性的实施方案中,本文所述方法包括以下步骤:(a)测量源自从受试者获得的样品中包含ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN的每种蛋白的一个代表性肽跃迁的丰度(强度);(b)测定每个代表性肽跃迁的系数;(c)计算每个跃迁的每个对数变换(并任选地标准化)强度与其相应的系数的乘积的总和;(d)通过乘以它们的代表性肽跃迁的其对数变换(并任选地标准化)强度,计算FRIL和COIA1之间的数学相互作用;和(e)基于步骤(c)中计算的总和和在步骤(d)中计算的数学相互作用,计算癌症得分的概率。在一些实施方案中,蛋白ALDOA_HUMAN、COIA1_HUMAN、TSP1_HUMAN、FRIL_HUMAN和LG3BP_HUMAN的代表性肽跃迁分别是ALQASALK(401.25,617.4)、AVGLAGTFR(446.26,721.4)、GFLLLASLR(495.31,559.4)、LGGPEAGLGEYLFER(804.4,1083.6)和VEIFYR(413.73,598.3)。在一些实施方案中,本文所述的任何方法的测量步骤通过检测包含ALQASALK(401.25,617.4)、AVGLAGTFR(446.26,721.4)、GFLLLASLR(495.31,559.4)、LGGPEAGLGEYLFER(804.4,1083.6)和VEIFYR(413.73,598.3)的跃迁来进行。受试者具有或疑似具有肺结节。肺结节具有少于或等于3.0cm的直径。在一个实施方案中,肺结节具有约0.8cm-2.0cm的直径。受试者可具有IA期肺癌(即,肿瘤小于3cm)。概率得分从应用于蛋白测量的逻辑回归模型计算。例如,得分按照测定,其中是所述样品中跃迁i的对数变换和标准化强度,βi是相应的逻辑回归系数,α是小组-特异性常数,和γ是交互作用项的系数。确定的得分具有至少约85%、至少90%或更高(91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)的阴性预测值(NPV)。在各种实施方案中,本发明的方法还包含蛋白质测量的标准化。例如,蛋白测量用一种或多种选自PEDF_HUMAN、MASP1_HUMAN、GELS_HUMAN、LUM_HUMAN、C163A_HUMAN和PTPRJ_HUMAN的蛋白进行标准化。用于这些的核酸和氨基酸序列可分别在表8和表9中发现。生物样品包括例如组织、血、血浆、血清、全血、尿、唾液、生殖器分泌物、脑脊液、汗液和排泄物。在一些实施方案中,测定癌症的可能性通过灵敏性、特异性、与得分有关的阴性预测值或阳性预测值确定。测量步骤通过选择反应监测质谱,使用特异性地结合待检测的蛋白的化合物或肽跃迁进行。在一个实施方案中,特异性地结合于待测量的蛋白的化合物是抗体或适体。在特定实施方案中,本文公开的诊断方法被用来排除用于受试者的这样的治疗方案,即测量从受试者获得的样品中蛋白小组的丰度,基于蛋白测量和蛋白-蛋白相互作用,计算癌症得分的概率,并且如果在样品中确定的得分低于预定得分,则排除用于受试者的治疗方案。在一些实施方案中,小组含有ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN;而为了测定得分,FRIL_HUMAN和COIA1_HUMAN在模型中相互作用。在特定实施方案中,本文公开的诊断方法被用来管控用于受试者的治疗方案,即通过测量从受试者获得的样品中蛋白小组的丰度,基于蛋白测量和蛋白-蛋白相互作用,计算癌症得分的概率,并且如果在样品中确定的得分大于预定得分,则管控用于受试者的治疗方案。在一些实施方案中,小组含有ALDOA_HUMAN、FRIL_HUMAN、LG3BP_HUMAN、TSP1_HUMAN和COIA1_HUMAN;而为了测定得分,FRIL_HUMAN和COIA1_HUMAN在模型中相互作用。在某些实施方案中,本文公开的诊断方法可用于与其它的临床评价方法,包括例如各种放射照相和/或侵入性方法组合。类似地,在某些实施方案中,本文公开的诊断方法可被用来鉴定用于其它的临床评价方法的候选物,或评价受试者将从其它的临床评价方法受益的可能性。生物样品如血浆或血清中的某些蛋白的高丰度可能妨碍测定感兴趣的蛋白的能力,特别是在感兴趣的蛋白以相对低的浓度表达的情况下。几种方法可用来规避这一问题,包括浓缩、分离和排除。浓缩使用亲和剂以按类别从样品中提取蛋白质,例如,通过糖捕获(glycocapture)除去糖基化蛋白。分离使用方法如凝胶电泳或等电聚焦,以将样品分成在蛋白内容物中大部分不重叠的多个部分。排除通常通过利用先进的技术如能够除去大多数最丰富蛋白质的IgY14/Supermix(SigmaSt.Louis,MO),使用亲和柱以去除血液中最丰富的蛋白质,如白蛋白。在本文提供的方法的某些实施方案中,生物样品可以在分析生物标记物或推定生物标记物蛋白表达水平之前,经受浓缩、分离和/或排除。在某些这样的实施方案中,可通过糖捕获方法初步处理血蛋白,该方法富集糖基化蛋白,允许定量分析以检测在高pg/ml至低ng/ml浓度范围的蛋白。糖捕获的示例性方法是本领域熟知的(见,例如,美国专利号7,183,188;美国专利申请公布号2007/0099251;美国专利申请公布号2007/0202539;美国专利申请公布号2007/0269895;和美国专利申请公布号2010/0279382)。在其它的实施方案中,可通过蛋白排除方法初步处理血蛋白,该方法允许通过去除丰富的蛋白,检测样品中通常被隐藏的生物标志物。在一个这样的实施方案中,蛋白排除方法是Supermix(Sigma)排除方法。在某些实施方案中,生物标记物蛋白小组包含2-100种生物标记物蛋白。在某些这样的实施方案中,小组包含2-5、6-10、11-15、16-20、21-25、5-25、26-30、31-40、41-50、25-50、51-75、76-100种生物标记物蛋白。在某些实施方案中,生物标记物蛋白小组包含一个或多个生物标记物蛋白的亚组,其各自包含至少2种生物标记物蛋白。例如,生物标记物蛋白小组可包含由特定肺病况中过度表达的生物标记物蛋白组成的第一亚组和由特定肺病况中低表达的生物标记物蛋白组成的第二亚组。在本文提供的方法、组合物和试剂盒的某些实施方案中,生物标记物蛋白可以是表现出与肺癌有关的差异表达的蛋白。在其它的实施方案中,本文公开的诊断方法可被用来区别两种不同的肺病况。例如,所述方法可被用来将肺病况分类为恶性肺癌与良性肺癌,NSCLC与SCLC,或肺癌与非-癌病况(例如,炎性病况)。在某些实施方案中,提供用于诊断受试者的肺病况的试剂盒。这些试剂盒被用来检测一种或多种生物标记物蛋白的表达水平。任选地,试剂盒可包含以标签或独立的插页形式使用的用法说明书。试剂盒可包含特异性地结合于本文描述的小组中的蛋白的试剂。这些试剂可包括抗体。试剂盒也可包含特异性地结合于表达本文描述的小组中的蛋白的mRNA的试剂。这些试剂可包括核苷酸探针。试剂盒也可包括用于检测特异性地结合于本文描述的小组中的蛋白的试剂的试剂。这些试剂可包括荧光团。提供以下实施例以更好地说明要求保护的本发明并且不视为限制本发明的范围。在提及具体材料时,仅仅是为了举例说明的目的并不打算限制本发明。本领域技术人员可开发等效工具或反应物,而无需运用创新能力且不背离本发明的范围。实施例实施例1:区分恶性和良性肺结节的鲁棒性分类器的鉴定源自3个场所(UPenn、Laval和NYU)的患者血浆样品被分成5个实验批次。在每批中,处理合并的人血浆标准(HPS)样品的4个等分液。血浆样品被免疫-排除、变性、减少、胰蛋白酶-消化,并使用在前述研究中开发的方案在综合诊断(IntegratedDiagnostics)中通过LC-MRM-MS分析。100份临床样品均来自具有大小为8-20mm的肺结节和年龄>40岁的患者。癌症和良性样品按性别、年龄(+/-10年)和结节大小(+/-8mm)匹配。关于吸烟史和关于吸烟包-年,癌症和良性样品之间有一些偏差。表1:5个批次的样品来源及其分配批次中心良性癌症总计S1UPenn101020S2UPenn101020S3Laval101020S4NYU101020S5NYU101020总计3个场所5050100样品制备和数据处理,包括原始数据的标准化的详细程序可在PCT/US2012/071387(WO13/096845)中发现,其内容以其整体结合到本文中。由WO13/096845鉴定的13种蛋白形成的所有可能的小组中,有28个小组具有交叉验证性能,其中特异性=0.9的部分AUC,为随机机会预期的数目的2-倍(0.1^2/2)。这些模型被保留和使用100,000个交叉验证模型,以得到它们的逻辑回归系数的更精确的测量,并确定模型系数的变异性系数。以20%的流行率,在中值小组中测量每个蛋白系数的CV,并报告NPV、SPC性能。表2:鲁棒性的28个小组接着生成蛋白ALDOA、COIA1、FRIL、LG3BP、LRP1、PRDX1、TSP1、TETN和BGH3的所有可能的小组。一组27个小组被选择按以下标准向前进行:·中位特异性>=0.5·最大系数CV<=1.5·最大ALPHACV<=1.5·交叉验证的pAUC在特异性=0.9时大于1倍随机·每小组最少4种蛋白前6个小组向前进行。表3:前6个小组对于ID_465和ID_341小组的代表性NPV/特异性作图可分别见图2和3。所有可能的相互作用对被加入到小组465中。测定了交叉验证的性能(在NPV=0.90的特异性)和部分AUC。下表显示性能:对于小组465的交叉验证的性能和部分AUC包括来自COIA1和FRIL的交互作用项的小组的性能在NPV=0.9的交叉验证的特异性和交叉验证的部分AUC二者中,远优于无交互作用项的小组。表4:C4分类器表5:C4分类器的性能表6:高性能小组中蛋白质的核苷酸序列表7:高性能小组中蛋白的氨基酸序列表8:小组中标准品蛋白的核苷酸序列表9:小组中标准品蛋白的氨基酸序列
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1