用于肺癌诊断的方法和系统与流程

文档序号:12509530阅读:340来源:国知局
本申请要求于2014年6月2日提交的美国临时申请No.62/006,549的优先权。该申请的内容通过引用整体并入本文。
技术领域
本发明涉及用于肺癌的高风险筛选、诊断、预后和监测的方法和系统。
背景技术
:肺癌是一种特征在于肺组织中不受控制的细胞生长的恶性肺肿瘤,它是美国男性和女性的主要癌症杀手。全球整体上,死于肺癌的人多于乳腺癌、前列腺癌和结肠癌。然而,早期非小细胞肺癌(NSCLC)的五年存活率高于50%。患有转移性疾病的NSCLC患者的五年存活率降至5%以下。尽管早期检测可以挽救生命,但仍然缺乏针对高风险个体的筛选测试。螺旋低剂量计算机断层扫描(LDCT)已用于高风险人群的筛查。然而,存在与LDCT筛查相关的多个缺点,包括假阴性、假阳性、辐射暴露和经济成本。目前,没有可用的使用体液诸如血液和痰对肺癌的非侵入性检测。此外,通常在CT上检测肺结节。据报道,高达51%的50岁或以上吸烟者在CT上有肺结节。在一些情况下,难以区分恶性结节和良性结节。建议对这些未确定的结节进行连续CT,这增加了个体的实质性辐射暴露和经济成本。用于区分恶性和良性结节的血液检测将对患者非常有益。因此,迫切需要用于肺癌检测和用于区分肺癌与良性肺结节的血液检测。发明概述本发明涉及用于肺癌的高风险筛选、诊断、预后和监测的方法和系统。因此,在一个方面,本发明提供了用于诊断或评估受试者是否患有肺癌(诸如NSCLS)或处于患有肺癌(诸如NSCLS)的风险中的方法。该方法包括从测试受试者的血液获得细胞群的AKAP4基因的第一表达水平;以及将第一表达水平与第一预定参考值进行比较。第一表达水平和第一预定参考值之间的差异与肺癌的诊断或评估相关。在一个实施方案中,群体细胞是有核细胞群体。例如细胞可以是低密度细胞,包括外周血单核细胞(PBMC)和相关细胞(即,血液含有PBMC的级分)。在该方法中,第一预定参考值可以从选自以下的对照受试者获得:(a)患有恶性疾病(例如肺癌)的吸烟者,(b)患有非恶性疾病的吸烟者,(c)患有非恶性疾病的前吸烟者,(d)没有疾病的健康非吸烟者,(e)患有慢性阻塞性肺病(COPD)的非吸烟者,(f)患有COPD的前吸烟者,(g)在移除实体肺肿瘤的外科手术之前患有实体肺肿瘤的受试者,(h)在手术移除实体肺肿瘤之后患有所述肿瘤的受试者,(i)在治疗实体肺肿瘤之前患有实体肺肿瘤的受试者,以及(j)在治疗实体肺肿瘤期间或之后患有实体肺肿瘤的受试者。对照受试者(a)-(j)可以是在暂时的较早时间点的相同测试受试者。在一个实施方案中,如果第一表达水平高于从没有患有肺癌的对照受试者获得的第一预定参考值,则测试受试者被确定为患有肺癌或处于患有肺癌的风险中。在一些实施方案中,上述方法可以进一步包括在获得步骤之前从测试受试者的血液中分离或富集有核细胞或低密度细胞。获得步骤可以包括从细胞群体提取总RNA,并测量从AKAP4基因转录的RNA的水平。测量步骤可以通过包括PCR,诸如RT-PCR,定量实时聚合酶链式反应(qRT-PCR),巢式PCR或巢式qRT-PCR的方法进行。当进行巢式PCR时,可以使用分别产生第一扩增子和第二扩增子的第一引物对和第二引物对。优选地,第二扩增子不同于第一扩增子,并且包括或包含在第一扩增子内。在一个实例中,第一引物对含有SEQID:5和6的序列,第二引物对含有SEQID:7和8的序列。除了AKAP4基因之外,该方法还可以包括检测或测量选自以下的第二基因的表达:(a)乙型肝炎病毒x相关蛋白(HBXAP或RSF1),(b)双特异性酪氨酸-(Y)-磷酸化调节激酶2(DYRK2),(c)YY1转录因子(YY1),(d)染色体19开放阅读框12,转录变体1(C19orf12),(e)硫酯酶超家族成员2(THEM2),(f)三功能结构域(PTPRF相互作用)(TRIO),(g)骨髓相关分化标志物,转录变体4(MYADM),(h)BAI1相关蛋白2(BAIAP2),(i)亮氨酸拉链结构域蛋白(FLJ22386或ROGDI),(j)DnaJ(Hsp40)同源物,亚家族B,成员14(DNAJB14),(k)脑和生殖器官表达的TNFRSF1A调节剂(BRE),(l)跨膜蛋白41A(TMEM41A),(m)染色体9开放阅读框64(C9orf64),(n)染色体20开放阅读框55,转录变体1(C20orf55或FAM110A),(o)pecanex-样2PCNXL2,(p)RE1沉默转录因子(REST),(q)HSPC142蛋白(HSPC142或C19orf62),(r)假定蛋白BC015148(LOC93081或C13orf27),(s)激活信号共整合子1复合体亚单位3(ASCC3)(t)溶质载体家族1,成员5(SLC1A5),(u)含蛋白酪氨酸磷酸酶样A结构域蛋白1(PTPLAD1),(v)MRE11减数分裂重组11同系物A(MRE11A),(w)假定蛋白或GTP结合蛋白10(DKFZP686A10121或GTPBP10)(y)Soares胎肝脾1NFLScDNA克隆IMAGp998K18127,(z)丝氨酸蛋白酶抑制蛋白肽酶抑制剂,进化枝I(pancpin),成员2(SERPINI2),(aa)cDNAFLJ44370fis,克隆TRACH3008902或CAMP反应元件结合蛋白1(CREB1),(bb)含卷曲螺旋结构域蛋白53(CCDC53),(cc)泛素特异性肽酶48(USP48),以及(dd)含锌指和SCAN结构域蛋白2,转录变体3(ZSCAN2),如美国专利8,476,420中所描述,其内容通过引用并入本文。在这种情况下,该方法包括获得第二基因的第二表达水平,并以与上述相同的方式将第二基因的第二表达水平与第二预定参考值进行比较。在一个实例中,如果(i)第一表达水平高于第一预定参考值和(ii)第二表达水平高于第二预定参考值,则测试受试者被确定为患有肺癌或处于患有肺癌的风险中。上述方法允许获得各种诊断或评价,包括诊断肺癌,诊断肺癌阶段,诊断肺癌的类型或分类,诊断或检测肺癌的复发,诊断或检测肺癌的消退,肺癌预后,或评估肺癌对手术或非手术治疗的响应。因此,测试受试者可以是已经进行实体瘤切除术或化疗的受试者。在上述方法中,获得步骤还可包括使细胞、其RNA或由其产生的cDNA与在严格条件下与AKAP4基因的RNA或cDNA或其互补物杂交的探针接触。探针可以沉积在固相支持物上,例如微阵列上。或者,为了获得上述表达水平,可以使用相应的抗体,包括将细胞或来自其的样品与抗体诸如抗AKAP4抗体接触。还可以对AKAP4的RNA或cDNA进行测序以确定样品中的AKAP4水平。在第二方面,本发明提供了寡核苷酸组,其具有能够产生AKAP4基因的RNA的第一扩增子的第一寡核苷酸对或引物对;和/或能够使用第一扩增子作为模板产生所述RNA的第二扩增子的第二寡核苷酸对。第一寡核苷酸对可以具有SEQID:5和6的序列;第二寡核苷酸对可以具有SEQIDNO:7和8的序列。本领域技术人员可以基于下述核酸序列设计和使用其它合适的引物。还提供了含有该寡核苷酸组和用于其的包装材料的试剂盒。在优选的实施方案中,试剂盒可以进一步包含选自缓冲液、DNA聚合酶、RNAse抑制剂、延伸核苷酸、随机引物和探针的一种或多种试剂。在下面的描述中阐述了本发明的一个或多个实施方案的细节。本发明的其它特征、目的和优点将从说明书和权利要求书中显而易见。附图简述图1显示来自NSCLC和对照的全血细胞样品中AKAP4表达并且在全血样品中NSCLC和对照之间没有显著差异。图2表明,基于小发现样品组,130个CTA的无偏差巢式PCR筛选将AKAP4和GAGE4鉴定为NSCLC诊断的潜在候选者。图2A表明,AKAP4证明了基于其表达对来自NSCLC和对照组的样品的完美分离。图2B表明,仅有1个癌症样品通过GAGE4的表达而被错误分类。图3说明在两组NSCLC患者和对照中,AKAP4用作NSCLC的循环生物标志物。图3A示出了来自141个NSCLC患者和35个良性肺病患者的PBMC样品中AKAP4表达的ROC曲线。图3B说明在第二独立患者队列中AKAP4被证实为NSCLC的循环生物标志物。显示了来自123个NSCLC患者和100个对照的PBMC样品中AKAP4表达的ROC曲线。图3C示出了队列1和队列2合并组的ROC曲线。点表示对应于所选择的最佳截断点的性能。图3D说明了NSCLC和对照中AKAP4表达水平的分布。绿色虚线表示针对平衡灵敏度(92.8%)和特异性(92.6%)优化的截断点。图4说明了AKAP4是用于NSCLC早期检测的基于血液的生物标志物。图4A示出了来自136个I期NSCLC患者和135个对照的PBMC样品中AKAP4表达的ROC曲线。AUC为0.9795。图4B说明来自264个NSCLC患者和27个良性肺结节患者的PBMC样品中AKAP4表达的ROC曲线。AUC为0.9825。图4B示出了恶性和良性肺结节之间的区别。图5说明AKAP4表达与NSCLC阶段相关。显示每个NSCLC阶段的平均AKAP4表达±平均值的标准误差。显示了差异倍数对阶段I。图6说明AKAP4是用于NSCLC疾病监测和复发的早期检测的循环生物标志物。(患者vh.603)在三个时间点,测定在来自NSCLC患者的PBMC样品中AKAP4表达:手术前;手术后6个月;和手术后12个月。AKAP4在手术前高表达,但在手术后6个月降至截断点以下,这表明患者处于缓解。AKAP4表达在术后12个月增加到截断点以上,这表明该患者患有肺癌。在阳性AKAP4结果后大约4个月,通过CT扫描检测到第二肺癌结节。(患者vh.621)在三个时间点,测定在来自NSCLC患者的PBMC样品中AKAP4表达:手术前;手术后9个月;和手术后24个月。AKAP4在手术前高表达。手术后9个月AKAP4表达下降至截断点以下,并且在手术后24个月保持在截断点以下。随访的CT扫描未检测到任何肺结节。该患者目前处于缓解。(患者vh.495)在三个时间点,测定在来自NSCLC患者的PBMC样品中AKAP4表达:手术前;手术后9个月;和手术后36个月。AKAP4在手术前高表达。在手术后9个月AKAP4表达下降至截断点以下,并且在手术后36个月保持在截断点以下。随访的CT扫描未检测到任何肺结节。该患者目前被评估为处于缓解。(患者vh.554)在三个时间点测定在来自NSCLC患者的PBMC样品中AKAP4表达:手术后6个月;手术后32个月;和手术后37个月。AKAP4表达在手术后6个月处于截断点以下,这表明这个患者处于缓解。AKAP4表达在术后32个月增加高于截断点,这表明复发。CT扫描和随后的活检证实了复发的NSCLC。AKAP4表达在放射治疗后3个月降低,但保持在截断点以上,表明仍然存在残留的癌症。该患者在放射治疗10个月后被诊断为转移性肺癌。发明详述本发明(至少部分)基于出乎意料的发现,即来自受试者血液的有核或低密度细胞群中AKAP4基因的表达与肺癌高度相关,甚至在疾病的非常早期和其在治疗后的复发。如本文所公开的,本发明的AKAP4基因和相关方法和试剂可用于早期检测早期肺癌的非侵入性检测。该检测还可用于区分恶性肺结节与良性结节,这在CT扫描中常常见到。发明人对纵向样品的研究还显示,该检测可用作预测性生物标志来鉴定治疗和疾病复发中的应答者和无应答者。生物标志物如本文所公开,基于其在来自肺癌患者和健康受试者的血液的细胞群中改变的表达模式,将AKAP4基因鉴定为外周血标志物。下面列出人AKAP4的两种同种型的核酸和多肽序列。NM_003886(SEQIDNO:1)1ccagctggcagtcaaggctgtaggagggcatggagagttgaagaaaaaagcagtatcttg61aggcagactggaagagtcatcacagcatccaaatcaacaagaaaacatcattccagggtc121ctacatgatggcgtactctgatactacaatgatgtctgatgatattgactggttacgcag181ccacaggggtgtgtgcaaggtagatctctacaacccagaaggacagcaagatcaggaccg241gaaagtgatatgctttgtcgatgtgtccaccctgaatgtagaagataaagattacaagga301tgctgctagttccagctcagaaggcaacttaaacctgggaagtctggaagaaaaagagat361tatcgtgatcaaggacactgagaagaaagaccagtctaagacagagggatctgtatgcct421tttcaaacaagctccctctgatcctgtaagtgtcctcaactggcttctcagtgatctcca481gaagtatgccttgggtttccaacatgcactgagcccctcaacctctacctgtaaacataa541agtaggagacacagagggcgaatatcacagagcatcctctgagaactgctacagtgtcta601tgccgatcaagtgaacatagattatttgatgaacagacctcaaaacctacgtctagaaat661gacagcagctaaaaacaccaacaataatcaaagtccttcagctcctccagccaaacctcc721tagcactcagagagcagtcatttcccctgatggagaatgttctatagatgacctttcctt781ctacgtcaaccgactatcttctctggtaatccagatggcccataaggaaatcaaggagaa841gttggaaggtaaaagcaaatgccttcatcattcaatctgtccatcccctgggaacaaaga901gagaatcagtccccgaactcctgcgagcaagattgcttctgaaatggcctatgaagctgt961ggaactgacagctgcagaaatgcgtggcactggagaggagtccagggaaggtggccagaa1021aagctttctatatagcgaattatccaacaagagcaaaagtggagacaaacagatgtccca1081gagagagagcaaagaatttgcagattccatcagcaaggggctcatggtttatgcaaatca1141ggtggcatctgacatgatggtctctctcatgaagaccttgaaagtgcacagctctgggaa1201gccaattccagcatctgtggtcctgaagagggtgttgctaaggcacaccaaggagattgt1261gtccgatttgattgattcttgcatgaagaacctgcataatattactggggtcctgatgac1321tgactcagactttgtctcagctgtcaagagaaatctgttcaaccagtggaaacaaaatgc1381tacagacatcatggaggccatgctgaagcgcttggtcagtgcccttataggtgaggagaa1441ggagactaagtctcagagtctgtcatatgcatctttaaaagctgggtcccatgatcccaa1501atgcaggaatcagagtcttgaattctccaccatgaaagctgaaatgaaagagagggacaa1561aggcaaaatgaaatcagacccatgcaagtcactgactagtgctgagaaagtcggtgaaca1621cattctcaaagagggcctaaccatctggaaccaaaagcaaggaaactcatgcaaggtggc1681taccaaagcatgcagcaataaagatgagaaaggagaaaagatcaatgcttccacagattc1741actggccaaggacctgattgtctctgcccttaagctgatccagtaccatctgacccagca1801gactaagggcaaagatacatgtgaagaagactgtcctggttccaccatgggctatatggc1861tcagagtactcaatatgaaaagtgtggaggtggccaaagtgccaaagcactttcagtgaa1921acaactagaatctcacagagcccctggaccatccacctgtcaaaaggagaaccaacacct1981ggactcccagaaaatggatatgtcaaacatcgttctaatgctgattcagaaactgcttaa2041tgagaaccccttcaaatgtgaggatccatgcgaaggtgagaacaagtgttctgagcccag2101ggcaagcaaagcagcttccatgtccaacagatctgacaaagcggaagaacaatgccagga2161gcatcaagaacttgactgtaccagtgggatgaagcaagcgaacgggcaatttatagataa2221actagtagaatctgtgatgaagctctgccttatcatggctaagtatagcaacgatggggc2281agcccttgctgagttggaagaacaagcagcctcggcaaataagcccaatttcaggggcac2341cagatgcattcacagtggtgcaatgccacagaactatcaagactctcttggacatgaagt2401aattgtcaataatcagtgctctacaaatagcttgcagaagcagctccaggctgtcctgca2461gtggattgcagcctcccagtttaacgtgcccatgctctacttcatgggagataaggatgg2521acaactggaaaagcttcctcaggtttcagctaaagcagcagagaaggggtacagtgtagg2581aggtcttcttcaagaggtcatgaagtttgccaaggaacggcaaccagatgaagctgtggg2641aaaggtggccaggaaacagttgctggactggctgctcgctaacctgtgagctgatccttg2701actcctcttcatcttagcccccctagcagcattccatcccagccagagcacccccaccat2761caggccagtcaactgcacaatacacaactgtatttcccaatacacttgagcagttgcctg2821tgaatgtaagaggtgtcaacaaactgggaaataaaataaaaaaaaataataataaatgtg2881tNP_003877(SEQIDNO:2)MMAYSDTTMMSDDIDWLRSHRGVCKVDLYNPEGQQDQDRKVICFVDVSTLNVEDKDYKDAASSSSEGNLNLGSLEEKEIIVIKDTEKKDQSKTEGSVCLFKQAPSDPVSVLNWLLSDLQKYALGFQHALSPSTSTCKHKVGDTEGEYHRASSENCYSVYADQVNIDYLMNRPQNLRLEMTAAKNTNNNQSPSAPPAKPPSTQRAVISPDGECSIDDLSFYVNRLSSLVIQMAHKEIKEKLEGKSKCLHHSICPSPGNKERISPRTPASKIASEMAYEAVELTAAEMRGTGEESREGGQKSFLYSELSNKSKSGDKQMSQRESKEFADSISKGLMVYANQVASDMMVSLMKTLKVHSSGKPIPASVVLKRVLLRHTKEIVSDLIDSCMKNLHNITGVLMTDSDFVSAVKRNLFNQWKQNATDIMEAMLKRLVSALIGEEKETKSQSLSYASLKAGSHDPKCRNQSLEFSTMKAEMKERDKGKMKSDPCKSLTSAEKVGEHILKEGLTIWNQKQGNSCKVATKACSNKDEKGEKINASTDSLAKDLIVSALKLIQYHLTQQTKGKDTCEEDCPGSTMGYMAQSTQYEKCGGGQSAKALSVKQLESHRAPGPSTCQKENQHLDSQKMDMSNIVLMLIQKLLNENPFKCEDPCEGENKCSEPRASKAASMSNRSDKAEEQCQEHQELDCTSGMKQANGQFIDKLVESVMKLCLIMAKYSNDGAALAELEEQAASANKPNFRGTRCIHSGAMPQNYQDSLGHEVIVNNQCSTNSLQKQLQAVLQWIAASQFNVPMLYFMGDKDGQLEKLPQVSAKAAEKGYSVGGLLQEVMKFAKERQPDEAVGKVARKQLLDWLLANLNM_139289(SEQIDNO:3)1caggggtggcagccaactgcaggtgcccaagaacttggcacttctcagttccatctaaag61gggcacatctcccttctgggtgtcacgttttcagccaaacatctaaaagaacttcatcat121caagatgtctgatgatattgactggttacgcagccacaggggtgtgtgcaaggtagatct181ctacaacccagaaggacagcaagatcaggaccggaaagtgatatgctttgtcgatgtgtc241caccctgaatgtagaagataaagattacaaggatgctgctagttccagctcagaaggcaa301cttaaacctgggaagtctggaagaaaaagagattatcgtgatcaaggacactgagaagaa361agaccagtctaagacagagggatctgtatgccttttcaaacaagctccctctgatcctgt421aagtgtcctcaactggcttctcagtgatctccagaagtatgccttgggtttccaacatgc481actgagcccctcaacctctacctgtaaacataaagtaggagacacagagggcgaatatca541cagagcatcctctgagaactgctacagtgtctatgccgatcaagtgaacatagattattt601gatgaacagacctcaaaacctacgtctagaaatgacagcagctaaaaacaccaacaataa661tcaaagtccttcagctcctccagccaaacctcctagcactcagagagcagtcatttcccc721tgatggagaatgttctatagatgacctttccttctacgtcaaccgactatcttctctggt781aatccagatggcccataaggaaatcaaggagaagttggaaggtaaaagcaaatgccttca841tcattcaatctgtccatcccctgggaacaaagagagaatcagtccccgaactcctgcgag901caagattgcttctgaaatggcctatgaagctgtggaactgacagctgcagaaatgcgtgg961cactggagaggagtccagggaaggtggccagaaaagctttctatatagcgaattatccaa1021caagagcaaaagtggagacaaacagatgtcccagagagagagcaaagaatttgcagattc1081catcagcaaggggctcatggtttatgcaaatcaggtggcatctgacatgatggtctctct1141catgaagaccttgaaagtgcacagctctgggaagccaattccagcatctgtggtcctgaa1201gagggtgttgctaaggcacaccaaggagattgtgtccgatttgattgattcttgcatgaa1261gaacctgcataatattactggggtcctgatgactgactcagactttgtctcagctgtcaa1321gagaaatctgttcaaccagtggaaacaaaatgctacagacatcatggaggccatgctgaa1381gcgcttggtcagtgcccttataggtgaggagaaggagactaagtctcagagtctgtcata1441tgcatctttaaaagctgggtcccatgatcccaaatgcaggaatcagagtcttgaattctc1501caccatgaaagctgaaatgaaagagagggacaaaggcaaaatgaaatcagacccatgcaa1561gtcactgactagtgctgagaaagtcggtgaacacattctcaaagagggcctaaccatctg1621gaaccaaaagcaaggaaactcatgcaaggtggctaccaaagcatgcagcaataaagatga1681gaaaggagaaaagatcaatgcttccacagattcactggccaaggacctgattgtctctgc1741ccttaagctgatccagtaccatctgacccagcagactaagggcaaagatacatgtgaaga1801agactgtcctggttccaccatgggctatatggctcagagtactcaatatgaaaagtgtgg1861aggtggccaaagtgccaaagcactttcagtgaaacaactagaatctcacagagcccctgg1921accatccacctgtcaaaaggagaaccaacacctggactcccagaaaatggatatgtcaaa1981catcgttctaatgctgattcagaaactgcttaatgagaaccccttcaaatgtgaggatcc2041atgcgaaggtgagaacaagtgttctgagcccagggcaagcaaagcagcttccatgtccaa2101cagatctgacaaagcggaagaacaatgccaggagcatcaagaacttgactgtaccagtgg2161gatgaagcaagcgaacgggcaatttatagataaactagtagaatctgtgatgaagctctg2221ccttatcatggctaagtatagcaacgatggggcagcccttgctgagttggaagaacaagc2281agcctcggcaaataagcccaatttcaggggcaccagatgcattcacagtggtgcaatgcc2341acagaactatcaagactctcttggacatgaagtaattgtcaataatcagtgctctacaaa2401tagcttgcagaagcagctccaggctgtcctgcagtggattgcagcctcccagtttaacgt2461gcccatgctctacttcatgggagataaggatggacaactggaaaagcttcctcaggtttc2521agctaaagcagcagagaaggggtacagtgtaggaggtcttcttcaagaggtcatgaagtt2581tgccaaggaacggcaaccagatgaagctgtgggaaaggtggccaggaaacagttgctgga2641ctggctgctcgctaacctgtgagctgatccttgactcctcttcatcttagcccccctagc2701agcattccatcccagccagagcacccccaccatcaggccagtcaactgcacaatacacaa2761ctgtatttcccaatacacttgagcagttgcctgtgaatgtaagaggtgtcaacaaactgg2821gaaataaaataaaaaaaaataataaaaaaaaaaaaaaaaaaaaaaaaNP_647450(SEQIDNO:4)MSDDIDWLRSHRGVCKVDLYNPEGQQDQDRKVICFVDVSTLNVEDKDYKDAASSSSEGNLNLGSLEEKEIIVIKDTEKKDQSKTEGSVCLFKQAPSDPVSVLNWLLSDLQKYALGFQHALSPSTSTCKHKVGDTEGEYHRASSENCYSVYADQVNIDYLMNRPQNLRLEMTAAKNTNNNQSPSAPPAKPPSTQRAVISPDGECSIDDLSFYVNRLSSLVIQMAHKEIKEKLEGKSKCLHHSICPSPGNKERISPRTPASKIASEMAYEAVELTAAEMRGTGEESREGGQKSFLYSELSNKSKSGDKQMSQRESKEFADSISKGLMVYANQVASDMMVSLMKTLKVHSSGKPIPASVVLKRVLLRHTKEIVSDLIDSCMKNLHNITGVLMTDSDFVSAVKRNLFNQWKQNATDIMEAMLKRLVSALIGEEKETKSQSLSYASLKAGSHDPKCRNQSLEFSTMKAEMKERDKGKMKSDPCKSLTSAEKVGEHILKEGLTIWNQKQGNSCKVATKACSNKDEKGEKINASTDSLAKDLIVSALKLIQYHLTQQTKGKDTCEEDCPGSTMGYMAQSTQYEKCGGGQSAKALSVKQLESHRAPGPSTCQKENQHLDSQKMDMSNIVLMLIQKLLNENPFKCEDPCEGENKCSEPRASKAASMSNRSDKAEEQCQEHQELDCTSGMKQANGQFIDKLVESVMKLCLIMAKYSNDGAALAELEEQAASANKPNFRGTRCIHSGAMPQNYQDSLGHEVIVNNQCSTNSLQKQLQAVLQWIAASQFNVPMLYFMGDKDGQLEKLPQVSAKAAEKGYSVGGLLQEVMKFAKERQPDEAVGKVARKQLLDWLLANL上述发现是令人惊讶和出人意料的,因为已经进行努力来鉴定外周血单核细胞中的基因表达谱,其可以区分患有非小细胞肺癌的患者和患有非恶性肺疾病的患者。例如Showeetal.CancerRes.2009Dec15;69(24):9202-10和美国专利8,476,420描述了分离这两类的29-基因标签(signature)。然而,AKAP4基因不在所述29个基因之列。另外,如本文所公开的,基于来自血液的低密度细胞或含PBMC的级分中的AKAP4基因表达的测试的特异性和灵敏度优于已知使用体液的肺癌检测方法,体液包括血浆、痰、血清或PBMC。事实上,下面实例中所示的结果(包括ROC曲线分析的AUC)远远优于基于其它外周血标志物的常规方法。此外,这里公开的研究使用的样本大小大于其他,这表明AKAP4基因表达在肺癌的早期检测、恶性和良性肺结节的区分和肺癌复发检测中的应用。AKAP4基因表达可以单独使用或与其它已知的肺癌标志物组合使用。这样的已知标志物的实例包括在Showeetal.CancerRes.2009Dec15;69(24):9202-10和美国专利8,476,420中描述的那些,这两篇文献的全部内容通过引用并入本文。本文公开的用于早期肺癌检测的发明的优点是显著的。在所患癌症在早期检测并可治疗的肺癌患者的5年生存率为50-70%。转移性疾病患者的5年生存率低于5%。目前只有15%的肺癌患者在早期被诊断出。本文公开的发明允许在非常早期检测肺癌,从而显著改善肺癌患者的存活并减少肺癌死亡。诊断和预后方法本文公开的标志物、相关试剂盒、试剂和系统可用于确定受试者是否患有肺癌或处于患有肺癌的风险中。或者,它们可用于确定受试者中此类疾病的预后。诊断方法在一个方面,本发明提供定性和定量信息以确定受试者是否患有肺癌或有肺癌倾向性。患有肺癌或易于患有肺癌的受试者可以基于来自受试者的测试样品中的上述基因或其表达产物(RNA或多肽)的表达水平、模式或图谱来确定。换句话说,产物可以用作指示病症存在或不存在的标志物。本发明的诊断和预后测定包括用于评估产物表达水平的方法。该方法和试剂盒允许检测肺癌。例如来自血液的含PBMC的级分中AKAP4基因表达水平的相对增加表示存在该病症。相反,较低的表达水平或缺乏表达指示缺乏该病症。测试样品中表达产物的存在、水平或不存在可通过获得来自测试受试者的测试样品和将测试样品与能够检测核酸的化合物或试剂(例如RNA或DNA探针)接触来评价。测试样品包括从受试者分离的组织、细胞和生物流体,以及受试者内存在的组织、细胞和流体。感兴趣的基因的表达水平可以多种方式测量,包括测量由基因编码的RNA。可以使用许多众所周知的方法中的任一种从生物样品中分离所表达的RNA样品。例如生物样品可以在基于胍盐的裂解缓冲液(任选地含有额外的组分以稳定RNA)中裂解。在一些实施方案中,裂解缓冲液可含有纯化的RNA作为对照以监测来自细胞培养物的RNA的回收和稳定性。此类纯化的RNA模板的例子包括购自Promega(Madison,WI)的卡那霉素阳性对照RNA和购自LifeTechnologies(Rockville,MD)的7.5kb的多聚(A)尾RNA的RNA。裂解物可立即使用或在例如-80℃下冷冻储存。任选地,可以使用基于二氧化硅的自动化兼容的96孔形式(诸如RNEASY纯化平台(QIAGEN,Inc.,Valencia,CA))从细胞裂解物(或其他类型的样品)中纯化总RNA。也考虑其它RNA分离方法,例如用二氧化硅涂覆的珠或胍盐提取。用于RNA分离和制备的其它方法可以由本领域技术人员设计。可以使用粗样品(例如血液、血清、血浆或细胞裂解物)进行本发明的方法。任选将RNAse抑制剂加入粗样品中。当使用粗细胞裂解物时,应注意,根据样品,基因组DNA可贡献靶序列(例如基因)的一个或多个拷贝。在靶序列来源于一个或多个高度表达的基因的情况下,来自基因组DNA的信号可能不显著。但是对于以低水平表达的基因,可以通过用DNAse处理样品,或通过使用靶向用于随后引发cDNA或扩增产物的剪接接头的引物,来消除背景。可以在原位和体外测定细胞中对应于基因的RNA水平。从测试样品分离的RNA或从其制备的cDNA可用于测序、杂交或扩增测定,包括Southern或Northern分析、PCR分析和探针阵列。用于检测RNA水平的示例性诊断方法包括使分离的RNA或cDNA或cRNA与可与由基因编码的RNA杂交的核酸探针接触。探针可以是全长核酸或其部分,诸如长度为至少10个核苷酸并且足以在严格条件下与RNA特异性杂交的寡核苷酸。在一种形式中,RNA(或从其制备的cDNA)被固定在表面上,并与探针接触,例如通过在琼脂糖凝胶上电泳分离的RNA并从凝胶转移RNA至膜,诸如硝酸纤维素膜。在另一种形式中,探针被固定在表面上,并且RNA(或cDNA或cRNA)与探针接触,例如在基因芯片阵列中。技术人员可以改变用于检测RNA(或从其制备的cDNA或cRNA)的水平的已知的RNA检测方法。样品中由待检测基因编码的RNA(或由其制备的cDNA)水平可以用核酸扩增,例如通过标准PCR(美国专利号4,683,202)、RT-PCR(BustinS.JMolEndocrinol.25:169-93,2000)、定量PCR(OngY.etal,Hematology.7:59-67,2002)、实时PCR(GinzingerD.ExpHematol.30:503-12,2002)和原位PCR(ThakerV.MethodsMolBiol.115:379-402,1999)或任何其它核酸扩增方法来评估,随后使用本领域已知的技术检测扩增的分子。在另一个实施方案中,本发明的方法还包括使对照样品与能够检测基因的RNA的化合物或试剂接触,并将对照样品中的RNA的存在与测试样品中RNA的存在进行比较。上述方法和标志物可用于评估受试者形成肺癌的风险。特别地,本发明可以应用于已经具有某些风险的高风险队列中的那些人,以便获得针对早期检测的关键信息。与肺癌相关的基因产物水平的变化可以在受试者的细胞中转化表型或致瘤性表型形成之前或其早期阶段检测到。因此,本发明还提供了用于筛选处于形成肺癌的风险中的受试者的方法,包括评估在血液的含有PBMC级分中的AKAP4基因表达水平,以及任选的在从受试者获得的生物样品中上述其它标志物中一种或多种的水平。因此,与对照样品中相应基因产物的水平相比,生物样品中的基因产物或基因产物组合的水平的差异或改变指示了受试者处于形成肺癌的风险中。用于这种筛选的生物样品可以包括来自受试者血液的细胞群体,细胞群体是正常的或怀疑是癌前期的。具有与肺癌相关的一种或多种基因产物水平变化的受试者是进一步监测和测试的候选者。这样的进一步测试可包括组织样品的组织学检查、CT或本领域技术内的其他技术。“诊断”或“评估”是指诊断肺癌,诊断肺癌阶段,诊断肺癌的类型或分类,诊断或检测肺癌的复发,诊断或检测肺癌的消退,肺癌预后,或评估肺癌对手术或非手术治疗的响应。通常,疾病或病症的诊断是基于对指示该疾病的一种或多种因素和/或症状的评估。也就是说,可以基于指示疾病或病症存在或不存在的因素的存在、不存在或量来进行诊断。被认为指示特定疾病的诊断的每个因素或症状不需要仅与特定疾病相关;即可以存在可以从诊断因素或症状推断的差异诊断。同样,可能存在这种情况,即指示特定疾病的因素或症状存在于不具有该特定疾病的个体中。诊断方法可以独立地使用,或与医学领域中已知用于特定疾病或病症例如肺癌的其它诊断和/或分期方法组合使用。预后方法上述诊断方法可以鉴定患有肺癌或具有发展成肺癌风险的受试者。此外,生物样品(例如血液的含PBMC的级分)中上述基因(或其子集)的表达水平和/或趋势的变化可以提供其恢复或缺乏的早期指示。例如AKAP4基因的进一步增加(或下降)或持续改变的基因表达水平指示不良预后,即缺乏改善或健康下降。因此,这些基因允许评估癌症的治疗后恢复。该选择的基因组或其子集的分析指示了病况的结果。本文所述的预后测定可用于确定受试者是否适合施用试剂(例如激动剂、拮抗剂、肽模拟物、蛋白质、肽、核酸、小分子或其它药物候选物)治疗肺癌。例如,这样的测定可以用于确定受试者是否可以施用化疗剂。因此,本发明还提供了监测受试者中肺癌的治疗的方法。为此目的,可以在经历治疗之前、期间或之后,测定来自受试者的测试样品的本文公开的基因(例如AKAP4)的基因表达水平。然后评估与基线水平相比的水平变化的幅度。治疗后变化幅度的降低表明受试者可以通过相同的治疗进一步治疗。例如一种或多种上调基因(例如AKAP4)的表达水平的相对降低指示从该病症中恢复。相反,一种或多种上调基因的进一步增加或持续的高表达水平表明缺乏改善或健康下降。实施上述测定所获得的信息可用于影响个体受试者的健康状况的疾病和其他有害病况的预后、鉴定其进展和临床管理。在优选的实施方案中,前述诊断测定提供了用于肺癌的预后、鉴定其进展和管理的信息。该信息更具体地辅助临床医生设计化疗或其它治疗方案以从受折磨的受试者(人)的身体中消除这种病况。本文使用的术语“预后”是指预测临床病况或疾病的可能的过程和结果,例如癌症归因的死亡或进展的可能性,包括致瘤性疾病(诸如肺癌)的复发、转移扩散和耐药性。预后通常通过评价疾病的指示疾病有利或不利过程或结果的因素或症状来完成。本文中使用的术语“预测”是指患者对药物或药物组有利地或不利地响应的可能性,以及这些响应的程度,或者患者在去除原发性肿瘤的手术后将存活和/或化疗一段时间而没有癌症复发的可能性。本发明的预测方法可以临床上用于通过为任何特定患者选择最合适的治疗方式来作出治疗决定。本文所述的预测方法是预测患者是否可能对治疗方案(诸如外科手术干预、使用给定药物或药物组合的化疗和/或放射治疗)有利地响应、或在手术之后和/或化疗或终止化疗或其他治疗方式后患者是否可能长期存活的有用工具。本文所用的短语“确定预后”是指本领域技术人员可以预测患者中病况的进程或结果的方法。术语“预后”不是指以100%准确度预测病况的进程或结果的能力,相反,技术人员将理解术语“预后”是指将发生某一进程或结果的概率增加;即,当与没有表现出给定病况的那些个体相比,呈现给定病况的患者更可能发生进程(course)或结果(outcome)。本文使用的术语“有利的预后”和“阳性预后”或“不利的预后”和“阴性预后”是用于预测病况或疾病的可能过程和/或可能的结果的相对术语。有利的或积极的预后比不利的或消极的预后预测了病况更好的结果。在一般意义上,“有利的预后”是比可能与特定病况相关联的许多其它可能预后相对更好的结果,而不利的预后预测了比可与特定病况相关联的许多其它可能预后相对更差的结果。有利的或积极的预后的典型实例包括比平均治愈率更好、转移倾向更低、预期寿命更长、癌性过程与良性过程的区分等。例如,阳性预后是这样的预后,其中患者在治疗后具有50%的特定癌症治愈概率,而患有相同癌症的普通患者仅有25%的治愈概率。检测外周血中的AKAP4AKAP4是A激酶锚蛋白的成员,其结合蛋白激酶A(PKA)调节亚单位并且起到将PKA锚定到特定细胞位置的作用。AKAP4是位于X染色体上的已知的癌/睾丸基因,并且已经显示在多种不同的癌症中(AgarwalS,etal.JournaloftheInternationalGynecologicalCancerSociety2013;23(4):650-8;AgarwalS,etal.Oncoimmunology2013;2(5):e24270;和Chiriva-InternatiM,etal.Chest2014)以及循环肿瘤细胞(CTC)(Chiriva-InternatiM,etal.Chest2014)上异常表达。它已经被鉴定为肿瘤抗原,并且作为宫颈癌和卵巢癌(AgarwalS,etal.JournaloftheInternationalGynecologicalCancerSociety2013;23(4):650-8;AgarwalS,etal.Oncoimmunology2013;2(5):e24270),多发性骨髓瘤(MirandolaL,etal.Cancer2011;11:394)、乳腺癌(SainiS,etal.PLoSOne2013;8(2):e57095)、前列腺癌(Chiriva-InternatiM,etal.Prostate2012;72(1):12-23)的潜在治疗靶标,并且对于NSCLC是重要的(Chiriva-InternatiM,etal.Chest2014)。由于AKAP4的表达通常限于睾丸(HofmannO,etal.ProcNatlAcadSciUSA2008;105(51):20422-7),无癌对照中的背景表达基本上是阴性的。虽然在PBMC样品中检测到该信息提高了与CTC相关的可能性表达,但是CTC数,特别是在我们的早期样品中的CTC数预计相当低。AKAP4信号的另一个潜在来源是肿瘤衍生的外来体,其被大量释放并被肿瘤浸润性淋巴细胞(包括包含在PBMC级分中的巨噬细胞)吞噬(IeroM,etal.CellDeathDiffer2007;15(l):80-88;YangC,etal.ClinicalandDevelopmentalImmunology2011;2011:11;BurkeM,etal.JournalofProteomeResearch2013;13(2):836-43;和ClaytonA,etal.CancerResearch2007;67(15):7458-66)。由于肺中存在肿瘤而在PBMC级分中的特异性免疫细胞中诱导低水平表达这一第三种选项不能被排除,但似乎不太可能。上述方法包括检测血液的含PBMC级分中AKAP4基因的表达。如本文所公开的,人AKAP4基因通常不在外周血细胞中表达。即使在癌症患者中,外周血中AKAP4基因表达的水平也极低。为了检测或评估AKAP4基因表达水平,优选在测定前从血液富集或分离包括单核细胞的低密度细胞群体以获得血液的含有PBMC的级分。实际上,如以下实施例所示,当使用全血时,AKAP4表达不允许将肺癌与对照区分开。如本文所使用的,“低密度细胞”是指来自血液的细胞,其密度低于粒细胞或红细胞的密度且高于血浆,使得在Ficoll密度梯度分离(诸如下述的BDCPTTM细胞制备管)中,它们在粒细胞或红细胞层和Ficoll(或密度梯度液体)层上方和血浆层下方的层中。换句话说,低密度细胞与PBMC共迁移并包括PBMC。低密度细胞的实例包括使用从血液中分离PBMC的方法与PBMC共纯化的PBMC的单核细胞(包括淋巴细胞、单核细胞和树突状细胞)和其它细胞。因此,低密度细胞群也称为血液的含有PBMC的级分。如本文所使用的,“单核细胞”是指存在于外周血中并具有单圆核的细胞。这些细胞可以下面实施例部分所述的方式从全血中提取。例如,它们可以使用ficoll(亲水多糖)分离或富集,ficoll将血液分离成顶层血浆,然后是含有PBMC的级分层以及多形核细胞(诸如嗜中性粒细胞和嗜酸性粒细胞)和红细胞的底部级分。含有低密度细胞的细胞级分可以使用用于分离或富集PBMC的几种方法获得。下面提供了使用BDCPTTM细胞制备管的用于获得这种含PBMC的细胞级分的示例性操作方案:1.将6-8ml血液收集在CPT真空采血管中或作为用于FicollHypagque梯度的抗凝血液样品,并如下进行2.在室温(18-25℃)下在水平转子(水平转头)中以3130RPM离心样品30分钟-在SorvalCentrifugeinTissueCultureRm上-BrakeOFF-Flatbelow)。3.离心后,单核细胞和血小板将在正好在血浆层(顶层)下面的发白层(第二层)中。吸出血浆顶层至一些漂白剂,而不干扰单核细胞层。4.用1ml或5ml移液管收集单核细胞层,并缓慢推入新管15ml锥形管中。5.倒PBS以填充15ml蓝色管并倒置管。(这是减少PBMC层中存在的血小板数量的第一洗涤步骤)。6.在室温下以1335RPM离心15分钟-在SorvalCentrifugeinTissueCultureRm上)(BRAKEON)。7.尽可能多地吸出上清液而不干扰沉淀-留下约1ml上清液与沉淀用于重悬浮。用手指轻敲试管,将沉淀重悬于1ml上清液中。8.加入PBS以使体积再次在15ml管中增加。通过倒置管混合。(这是减少PBMC层中存在的血小板数量的第二洗涤步骤)。9.在室温下以1335RPM离心15分钟-在SorvalCentrifugeinTissueCultureRm上)(BRAKEON)。10.吸出所有上清液而不干扰沉淀。丢弃上清液至一些漂白剂。将含有沉淀的管倒置,并在室温下静置2分钟以排出所有上清液。一旦获得含有PBMC的细胞级分,可以使用PCR测量AKAP4基因表达。由于外周血中AKAP4基因表达水平极低,因此常规PCR的灵敏度可能不足以检测它。因此,应使用更灵敏的方法。例如,可以使用具有两轮或更多轮PCR的方法,例如巢式PCR。如下文实施例中所示,定量巢式RT-PCR成功地用于测定血液(或PBMC)中AKAP4的表达,并且显示生物标志物能够检测早期肺癌和复发,并且区分恶性和良性肺结节。样品中AKAP4的存在和/或表达水平/量也可以通过多种方法分析,其中许多是本领域已知的并且是本领域技术人员所理解的,包括但不限于免疫组织化学(“IHC”),蛋白质印迹分析,免疫沉淀,分子结合测定,ELISA,ELIFA,荧光激活细胞分选术(“FACS”),MassARRAY,蛋白质组学,基于定量血液的测定(例如血清ELISA),生物化学酶活性测定,原位杂交,Southern分析,Northern分析,全基因组测序,包括定量实时聚合酶链反应(“PCR”)(“qRT-PCR”)的PCR和其他扩增类型检测方法(诸如例如分支DNA,SISBA,TMA等),Taqman探针,RNA-Seq,FISH,微阵列分析,基因表达谱分析和/或基因表达的连续分析(“SAGE”),以及可以通过蛋白质、基因和/或组织阵列分析进行的多种测定中的任一种。用于评价基因状态和基因产物的典型操作方案见于例如Ausubel等编辑,1995,CurrentProtocolsInMolecularBiology,Units2(NorthernBlotting),4(SouthernBlotting),15(Immunoblotting)和18(PCR分析)。也可以使用多重免疫测定,诸如可从RulesBasedMedicing或MesoScaleDiscovery(“MSD”)获得的那些。在一些实施方案中,使用包括以下的方法测定AKAP4的存在和/或表达水平/量:(a)对样品(诸如受试者癌症样品)进行基因表达谱分析,PCR(诸如rtPCR),Taqman探针,RNA-seq,微阵列分析,SAGE,MassARRAY技术或FISH;和(b)测定样品中生物标志物的存在和/或表达水平/量。在一些实施方案中,微阵列方法包括使用具有一种或多种核酸分子的微阵列芯片,所述核酸分子可以在严格条件下与编码上述基因的核酸分子杂交,或者具有一种或多种多肽(诸如肽或抗体)的微阵列芯片,所述多肽可以结合由上述基因编码的一种或多种蛋白质。在一个实施方案中,PCR方法是qRT-PCR。在一个实施方案中,PCR方法是多重PCR。在一些实施方案中,通过微阵列测量基因表达。在一些实施方案中,通过qRT-PCR测量基因表达。在一些实施方案中,通过多重PCR测量表达。临床应用需要对该生物标志物的RNA分子的拷贝的精确定量。因此,在一个实施方案中,数字PCR可用于本发明以定量该生物标志物的RNA拷贝。目前有许多数字PCR平台,包括可从Fluidigm,LifeTechnologies,Bio-Rad和RainDance获得的那些平台。在一个实例中,因为其每次运行的分区数、多重能力和成本,可以使用Bio-RadddPCR系统进行数字PCR测定的开发。该系统每次运行有超过130万个分区,分别超过Fluidigm和LifeTechnologies系统的36,960和3,072个分区。虽然它具有的分区比RainDance系统(其具有高达8000万个分区)少,其RNA拷贝的准确度因为AKAP4生物标志物的丰度而不会显著不同,但每次运行成本比RainDance系统低70-90%。可以使用本文公开的来自肺癌患者和健康对照的血液RNA样品。为此,可以通过使用例如EvaGreen和基于探针的数字PCR系统来优化用于数字PCR的RNA的量。可以使用数字PCR并分析(1)所有NSCLC相对于健康对照;(2)I期NSCLC相对于健康对照;和(3)所有NSCLC相对于良性结节的ROC曲线,来确定AKAP4生物标志物的表达水平。之后,可以将数字PCR结果与定量RT-PCR结果进行比较,并确定该生物标志物的参考截断值用于样品分析。相同的策略也可以用于纵向样本中以准确地检测疾病复发。AKAP4生物标志物的数字PCR也可用于其他肺癌患者和健康对照中。例如,可以从300个NSCLC肺癌患者和300个健康对照中收集血液样品。在300个健康对照中,至少100个是通过连续CT或活检确认的具有良性肺结节的个体。还从经历治疗、处于缓解中和定期随访的肺癌患者收集纵向血液样品。分离来自这些样品的RNA,然后进行数字PCR以确定生物标志物的表达水平,用于早期检测肺癌和复发;并区分恶性和良性结节。尽管优选基于PCR的方法,但是免疫细胞化学方法也适合于检测用于本发明的方法和系统中的基因表达产物的表达水平。使用对每种标志物特异的抗体或抗血清,优选单克隆抗体或其他蛋白质结合配体来检测表达。可以通过抗体本身的直接标记,例如用放射性标记,荧光标记,半抗原标记(诸如生物素)或酶(诸如辣根过氧化物酶或碱性磷酸酶)来检测抗体。或者,未标记的一抗与标记的二抗一起使用,二抗包括对一抗特异的抗血清、多克隆抗血清或单克隆抗体。用于免疫组织化学分析的操作方案和试剂盒是本领域众所周知的,并且可商购获得。可以使用本领域已知的多种方法,包括例如ELISA测定,在患有肺癌的患者中检测抗AKAP4抗体。在一个实例中,将包被缓冲液(15mmol/LNa2CO3,35mmol/LNaHCO3,pH9.4)中浓度为4μg/ml的重组AKAP4纯化蛋白在96孔板(Nunc,Roskilde,Denmark)中4℃包被过夜。在室温下用3%非脱脂乳封闭非特异性位点1小时,并在室温下在封闭溶液中与肺癌患者或健康正常血清孵育2小时。用含有0.5%Tween20的PBS(PBST)洗涤板,并与偶联辣根过氧化物酶的抗人IgG(JacksonImmunoresearchLaboratories,WestGrove,PA)在室温下孵育1小时。通过使用邻苯二胺二盐酸盐作为底物,在492nm处用比色法观察吸光度。所有肺癌患者和健康供体样品一式两份进行测试,平均值用于分析。从三个独立实验计算测定间和测定内的变异系数。适合于检测基因表达水平的其它方法是本领域已知的。参见例如美国专利7,081,340。这样的基因表达检测/基因表达谱分析的方法包括基于多核苷酸的杂交分析的方法、基于多核苷酸测序的方法和基于蛋白质组学的方法。本领域已知的用于定量样品中mRNA表达的最常用的方法包括RNA印迹、原位杂交和RNAse保护测定。或者,可以使用可以识别特定双链体的抗体,包括DNA双链体、RNA双链体和DNA-RNA杂交双链体或DNA-蛋白质双链体。用于基于测序的基因表达分析的代表性方法包括基因表达的连续分析(SAGE),通过大规模平行标签测序(MPSS)的基因表达分析和下一代测序。阵列本发明还提供了生物芯片或阵列。生物芯片/阵列可以包含具有附着的探针或多个探针的固相或半固相基材,所述探针或多个探针能够在严格杂交条件下与上述公开的基因的靶序列(例如mRNA或cDNA序列)杂交。探针可以在空间限定的地址处附接在基材上。可以使用每个靶序列多于一个探针,其中重叠探针或针对特定靶序列的不同区段的探针。探针可以能够与本领域技术人员所理解的与单一病症相关的靶序列杂交。探针可以首先合成,随后连接到生物芯片上,或者可以直接合成在生物芯片上。另外,还包括用于参考对照/标准化基因的探针。本文所用的用于指核酸(例如探针)和固相支持物时的附着或固定的可以意指探针和固相支持物之间的结合足以在结合、洗涤、分析和去除的条件下是稳定的。结合可以是共价或非共价的。共价键可以直接在探针和固相支持物之间形成,或者可以通过交联剂或通过在固相支持物或探针或两个分子上包含特异性反应基团而形成。非共价结合可以是静电、亲水和疏水相互作用中的一种或多种。包括在非共价结合中的是分子诸如链霉亲和素与载体的共价连接以及生物素化探针与链霉亲和素的非共价结合。固定化还可以涉及共价和非共价相互作用的组合。固相基材可以是这样的材料,其可以经修饰以含有适合于探针的附着或缔合的离散的单独位点,并且适合于至少一种检测方法。这种基材的实例包括玻璃和改性或功能化玻璃,塑料(包括丙烯酸类、聚苯乙烯以及苯乙烯和其它材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯,TeflonJ等),多糖,尼龙或硝酸纤维素,树脂,二氧化硅或基于二氧化硅的材料(包括硅和改性硅),碳,金属,无机玻璃和塑料。基材可以允许光学检测而没有明显的荧光。基材可以是平面的,但是也可以使用其它构造的基材。例如探针可以放置在管的内表面上,用于流通样品分析以使样品体积最小化。类似地,基材可以是柔性的,诸如柔性泡沫,包括由特定塑料制成的闭孔泡沫。阵列/生物芯片和探针可以用化学官能团衍生化,用于随后的两者的附着(或结合)。例如生物芯片可以用以下化学官能团衍生化,包括但不限于氨基、羧基、氧代基团或硫醇基团。使用这些官能团,探针可以使用探针上的官能团直接或使用连接体间接附接。探针可以通过5'末端、3'末端或通过内部核苷酸附接到固相支持物(基材)。探针也可以非共价地附接到固相支持物(基材)上。例如,可以制备生物素化的寡核苷酸,其可以结合共价地包被有链霉亲和素的表面,从而形成附着。或者,可以使用诸如光聚合和光刻的技术在表面上合成探针。用于将核酸连接到支持物基材的方法的详细讨论可以在例如美国专利号5837832、6087112、5215882、5707807、5807522、5958342、5994076、6004755、6048695、6060240、6090556和6040138中找到。在一些实施方案中,表达的转录物(例如AKAP4基因的转录物)表示在核酸阵列中。在这样的实施方案中,一组结合位点可以包括具有与表达的转录物的不同序列区段互补的不同核酸的探针。此类核酸的实例可以具有15至200个碱基、20至100个碱基、25至50个碱基、40至60个碱基的长度。除了与其靶序列互补的序列之外,每个探针序列还可以包括一个或多个接头序列。接头序列是与其靶序列互补的序列和支持物表面之间的序列。例如本发明的核酸阵列可以具有特异性针对每个靶微RNA基因的一个探针。然而,如果需要,核酸阵列可以含有特异性针对某些表达的转录物的至少2、5、10、100、200、300、400、500个或更多个探针。在一些实施方案中,可以使用与AKAP4核酸序列互补的标记探针来拉下(pulldown)AKAP4RNA或相应的RT-PCR产物,以鉴定AKAP4靶序列。通常,捕获靶核酸的方法如下:(1)从生物样品获得核酸;(2)通过使核酸与互补DNA和/或RNA探针(即诱饵)杂交来选择性捕获靶向核酸;(3)首先洗掉未与杂交探针结合的核酸,而在适当的条件下洗脱与杂交探针结合的靶向核酸;和(4)捕获的靶向核酸用于下游应用。这种捕获的AKAP4核酸靶序列可以使用分子生物学的标准工具,诸如例如PCR、Taqman测定、RNA分子的直接测序或RNA-seq(下一代测序)来定量。示例性操作程序可以在例如由AgilentTechnologies,Inc.销售的SureSelectTargetEnrichmentSystemTM和US20100029498中找到,其内容通过引用整体并入本文。试剂盒本发明还包括试剂盒和诊断系统,其含有用于进行上述方法的试剂,包括用于核酸扩增、拷贝、引物延伸、检测、鉴定和/或定量的方法。为此,本文公开的方法的一种或多种反应成分可以用于检测靶核酸的试剂盒的形式提供。在这样的试剂盒中,在一个或多个容器中或者在基材上(例如通过静电相互作用或共价键合)提供适量的一种或多种反应成分。本文所述的试剂盒包括一种或多种上述引物。该试剂盒可以包括一个或多个含有本发明的一种或多种引物的容器。试剂盒可以在单个容器中包含单一引物,含有相同引物的多个容器,含有两种或更多种本发明的不同引物的单个容器,或含有不同引物或含有两种或更多种引物的混合物的多个容器。本发明的试剂盒包括引物和容器的任何组合和排列。试剂盒还可以含有用于实施上述方法的另外的材料。在一些实施方案中,试剂盒包含用于进行本发明的方法的试剂、材料中的一些或全部。因此,试剂盒可以包含用于使用本发明的引物进行PCR反应的一些或全部试剂。试剂盒的一些或所有成分可以在与含有本发明的引物的容器分开的容器中提供。试剂盒的另外成分的实例包括但不限于一种或多种不同的聚合酶,特异于对照核酸或靶核酸的一种或多种引物,特异于对照核酸或靶核酸的一种或多种探针,用于聚合反应的缓冲液(以1X或浓缩形式),以及用于检测聚合产物的一种或多种染料或荧光分子。试剂盒还可以包括以下成分中的一种或多种:支持物,终止、修饰或消化试剂,渗透调节剂(osmolyte),以及用于检测探针的设备。在扩增和/或检测方法中使用的反应成分可以多种形式提供。例如,成分(例如酶、核苷三磷酸、探针和/或引物)可以悬浮在水溶液中或作为冷冻干燥或冻干粉末,丸粒或珠。在后一种情况下,当重构时,成分形成用于测定的成分的完全混合物。试剂盒或系统可含有足以用于至少一种测定的量的本文所述成分的任何组合,并且还可包括以有形形式记录的用于使用成分的说明书。在一些应用中,可以在单独的、通常一次性的管或等同容器中以预先测量的单次使用量提供一种或多种反应成分。通过这样的安排,可以将待测试靶核酸存在的样品加入到各个管中并直接进行扩增。试剂盒中提供的成分的量可以是任何适当的量,并且可以取决于产品所针对的目标市场。确定适当的量的一般指导原则可参见例如JosephSambrookandDavidW.Russell,MolecularCloning:ALaboratoryManual,3rdedition,ColdSpringHarborLaboratoryPress,2001;和FrederickM.Ausubel,CurrentProtocolsinMolecularBiology,JohnWiley&Sons,2003。本发明的试剂盒可以包含任何数量的可用于实施本发明方法的另外的试剂或物质。这样的物质包括但不限于:用于分离细胞的试剂(包括缓冲液),用于裂解细胞的试剂,抑制不想要的核酸酶的二价阳离子螯合剂或其它试剂,用于确保引物、聚合酶和其他反应成分正常运行的对照DNA/RNA,RNA分离试剂(包括缓冲液),扩增反应试剂(包括缓冲液)和洗涤溶液。本发明的试剂盒可以在任何温度下提供。例如,为了储存含有蛋白质成分或其复合物的液体的试剂盒,优选将其提供并保持在低于0℃,优选-20℃或低于-20℃,或者在冷冻状态下。其中供应成分的容器可以是能够保持所供应形式的任何常规容器,例如微量离心管,安瓿,瓶或整体测试装置,诸如流体装置,盒,侧向流(lateralflow)或其它类似装置。试剂盒可以包括用于扩增或检测靶核酸的标记的或未标记的核酸探针。在一些实施方案中,试剂盒可以进一步包括在本文所述的任何方法中使用所述成分的说明书,例如使用没有进行核酸提取和/或纯化的粗基质的方法。试剂盒或系统还可以包括用于保持容器或容器组合的包装材料。用于这样的试剂盒和系统的典型包装材料包括将反应成分或检测探针保持在各种配置(例如小瓶、微量滴定板孔、微阵列等)中的任一种中的固相基质(例如玻璃、塑料、纸、箔、微粒等)。除了含有试剂盒成分之外,系统还可以包括用于进行测定的仪器,例如用于检测来自标记的探针的信号的光度计和/或用于分离与捕获探针杂交的核酸的磁性装置。试剂盒或系统任选提供有用于详细说明本发明的试剂盒或系统的使用的说明书,诸如书面指导或录像演示。在另一方面,本发明提供了本文的任何组合物或试剂盒在实施本文的任何方法或测定中的用途,和/或使用任何设备或试剂盒来实施本文的任何测定或方法的用途。任选地,本发明的试剂盒或系统还包括加速数据的产生、分析和/或储存以及促进对数据库的访问的软件。所述软件包括可以在数据的收集、存储和/或分析中使用的逻辑指令、指令集或适当的计算机程序。可以使用提供的软件进行数据的比较和关系分析。所有上述方法、试剂和系统提供了多种诊断工具,其允许对受试者的疾病状态进行基于血液的非侵入性评估。在诊断测试中使用这些方法、试剂和系统,其可以与其他筛选测试诸如胸部X射线或CT扫描结合,提高了诊断准确度和/或指导额外测试。在其它方面,本文所述的本发明允许对疾病进行预后、监测对特定治疗的响应和对复发风险的定期评估。本文所述的发明还允许评估存在于手术前和治疗后样品中的诊断标记的变化,并鉴定反映肿瘤存在的基因表达谱或特征,并且可用于评估复发的概率。在以下实施例中鉴定的手术前或手术后肺癌的结果支持了肿瘤对患者PBMC中基因表达的类似的可检测的影响。本发明的方法相对于现有方法的显著优点是它们能够从微创手术,即通过取血样而不分离癌细胞来表征疾病状态。相比之下,目前从基因表达谱分类癌症肿瘤的实践取决于组织样品,通常是来自肿瘤的样品。在非常小的肿瘤的情况下,活检是有问题的并且显然如果已知没有肿瘤或没有看见肿瘤,则不可能获得来自其的样品。不需要肿瘤的纯化或分离,如在分析肿瘤样品时即是如此。血液样品具有另外的优点,即,该材料易于制备且经稳定以用于随后的分析,这在分析信使RNA时是重要的。附加定义“核酸”是指DNA分子(例如cDNA或基因组DNA)、RNA分子(例如mRNA或cRNA)或DNA或RNA类似物。DNA或RNA类似物可以从核苷酸类似物合成。核酸分子可以是单链或双链,但优选是双链DNA。如本文所使用的,术语“靶核酸”或“靶序列”是指含有靶核酸序列的核酸。靶核酸可以是单链或双链的,并且通常是DNA、RNA、DNA或RNA的衍生物,或其组合。“靶核酸序列”、“靶序列”或“靶区域”是指包含单链核酸的全部或部分序列的特定序列。靶序列可以在核酸模板内,核酸模板可以是任何形式的单链或双链核酸。如本文所使用的,术语“扩增”及其变体包括用于产生多核苷酸的至少某些部分的多个拷贝或互补序列的任何方法,所述多核苷酸通常称为“模板”。模板多核苷酸可以是单链或双链的。模板可以是纯化或分离的核酸,或可以是非纯化或非分离的。给定模板的扩增可以导致产生多核苷酸扩增产物群,统称为“扩增子”。扩增子的多核苷酸可以是单链或双链,或两者的混合物。通常,模板将包括靶序列,并且所得扩增子将包括具有与靶序列基本上相同或基本互补的序列的多核苷酸。在一些实施方案中,特定扩增子的多核苷酸彼此基本上相同或基本互补;或者,在一些实施方案中,给定扩增子内的多核苷酸可以具有彼此不同的核苷酸序列。扩增可以以线性或指数方式进行,并且可以包括给定模板的重复和连续复制以形成两种或更多种扩增产物。一些典型的扩增反应包括连续和重复循环的基于模板的核酸合成,导致形成多个子多核苷酸,其含有模板的核苷酸序列的至少一部分并且与模板具有至少一定程度的核苷酸序列同一性(或互补性)。在一些实施方案中,可称为扩增“循环”的核酸合成的每个实例包括产生游离3'末端(例如通过使dsDNA的一条链形成切口),从而产生引物和引物延伸步骤;任选地,还可以包括另外的变性步骤,其中模板部分或完全变性。在一些实施方案中,一轮扩增包括单个扩增循环的给定次数的重复。例如一轮扩增可以包括特定循环的5、10、15、20、25、30、35、40、50次或更多次重复。在一个示例性实施方案中,扩增包括其中使特定多核苷酸模板经受两个连续的核酸合成循环的任何反应。合成可以包括模板依赖性核酸合成。本发明的扩增包括等温扩增。术语“等温”是指在基本上恒定的温度下进行反应,即不改变发生核酸聚合反应的反应温度。等温扩增反应的等温温度取决于反应中使用的链置换核酸聚合酶。通常,等温温度低于主要反应产物的解链温度(Tm;混合物中一半潜在双链分子处于单链、变性状态的温度),即通常为90℃或更低,通常在约20℃至75℃之间,优选在约30℃至60℃之间,或更优选在约37℃。术语“引物”或“引物寡核苷酸”是指这样的核酸或寡核苷酸,其能够与模板核酸杂交并充当根据模板核酸的组成掺入用于核酸合成的延伸核苷酸的起始点。“延伸核苷酸”是指能够在扩增期间掺入延伸产物的任何核苷酸(例如dNTP),即DNA、RNA或如果DNA或RNA可以包括标记的衍生物。如本文所使用的,术语“寡核苷酸”是指短的多核苷酸,通常小于或等于300个核苷酸长(例如长度在5和150个核苷酸的范围内,优选在10至100个核苷酸的范围内,更优选在15至50个核苷酸的范围内)。然而,如本文所使用的,该术语也意图包括更长或更短的多核苷酸链。“寡核苷酸”可与其它多核苷酸杂交,因此用作多核苷酸检测的探针或用于多核苷酸链延伸的引物。本文所用的术语“探针”是指能够通过一种或多种类型的化学键(通常通过互补碱基配对,通常通过氢键形成)与互补序列的靶核酸结合的寡核苷酸。探针可以结合与探针序列缺乏完全互补性的靶序列,这取决于杂交条件的严格性。可存在任何数目的碱基对错配,其将干扰靶序列与本文所述的单链核酸之间的杂交。然而,如果突变的数目如此之大,使得即使在最不严格的杂交条件下也不会发生杂交,则该序列不是互补的靶序列。探针可以是单链或部分单链和部分双链。探针的链性由靶序列的结构、组成和性质决定。探针可以直接标记或用标记间接标记,例如用生物素标记,链霉亲和素复合物随后可以结合。“标记”或“报道分子”是用于标记核酸(包括单个核苷酸)、多核苷酸、寡核苷酸或蛋白质配体(例如氨基酸或抗体)的化学或生物化学部分。实例包括荧光剂、化学发光剂、显色剂、猝灭剂、放射性核苷酸、酶、底物、辅因子、抑制剂、磁性颗粒和本领域已知的其它部分。标记或报道分子能够产生可测量的信号并且可以共价或非共价连接到寡核苷酸或核苷酸(例如非天然核苷酸)或配体。在指核酸时,本文使用的“互补”是可以表示核酸分子的核苷酸或核苷酸类似物之间的Watson-Crick(例如A-T/U和C-G)或Hoogsteen碱基配对。完全互补可以意指核酸分子的核苷酸或核苷酸类似物之间的100%互补碱基配对。“杂交”或“退火”是指完全或部分互补的核酸链在特定杂交条件(例如严格杂交条件)下以平行或优选反向平行取向集合在一起以形成稳定的双链结构或区域(有时称为“杂交体”)的能力,其中两条构成链通过氢键连接。虽然氢键通常在腺嘌呤和胸腺嘧啶或尿嘧啶(A和T或U)或胞嘧啶和鸟嘌呤(C和G)之间形成,但是可以形成其他碱基对(例如Adams等人,TheBiochemistryoftheNucleicAcids,11thed.,1992)。术语“严格杂交条件”或“严格条件”是指探针或寡聚物与其预期的靶核酸序列特异性杂交而不与另一序列杂交的条件。严格条件可以根据熟知的因素例如GC含量和序列长度而变化,并且可以使用分子生物学中的普通技术人员熟知的标准方法(例如Sambrook,J.etal.,1989,MolecularCloning,ALaboratoryManual,2nded.,Ch.11,pp.11.47-11.57,(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY))凭借经验预测或确定。“严格条件”或“高严格条件”通常:(1)使用低离子强度和高温洗涤,例如0.015M氯化钠/0.0015M柠檬酸钠/0.1%十二烷基硫酸钠,在50℃;(2)在杂交期间使用变性剂,诸如甲酰胺,例如含有0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM磷酸钠缓冲液(pH6.5)的50%(v/v)甲酰胺与750mM氯化钠、75mM柠檬酸钠,在42℃;或(3)在42℃下使用50%甲酰胺,5×SSC(氯化钠/柠檬酸钠,0.75MNaCl,0.075M柠檬酸钠),50mM磷酸钠(pH6.8),0.1%焦磷酸钠,5×Denhardt's溶液,超声处理的鲑精DNA(50μg/ml),0.1%SDS和10%硫酸葡聚糖,在42℃下在0.2xSSC和在55℃下50%甲酰胺中洗涤,随后是在55℃下由含有EDTA的0.1×SSC组成的高严格性洗涤。“中等严格条件”可以常规鉴定,包括使用不如上述那么严格的洗涤溶液和杂交条件(例如温度、离子强度和%SDS)。中等严格条件的实例是在37℃下在包含20%甲酰胺、5×SSC(150mMNaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt's溶液、10%硫酸葡聚糖和20mg/ml变性剪切的鲑精DNA的溶液中孵育过夜,随后在约36-50℃下在1×SSC中洗涤滤器。通过使用制造商的说明书(参见例如Illumina系统说明书),本领域技术人员将认识到如何调整温度、离子强度等,以适应诸如探针长度等因素。如本文所使用的,术语“受试者”是指具有基因组的任何生物体,优选是活的动物,例如哺乳动物,其已经是诊断、治疗、观察或实验的对象。受试者的实例可以是人、家畜动物(肉牛和奶牛、羊、家禽,猪等)或伴侣动物(狗、猫、马等)。本文所使用的“样品”是指含有从生物体或从生物体(例如患者)的成分(例如血液)获得的上述低密度或单核细胞和/或癌细胞的任何生物流体或组织。样品可以是任何生物组织、细胞或流体。样品可以是“临床样品”,其是来自受试者(诸如人类患者或兽医受试者)的样品。用于本发明的最合适的样品包括外周血,更具体地来自外周血的低密度或单核细胞。其他有用的生物样品包括但不限于来自患有癌症的患者的全血,唾液,尿液,滑液,骨髓,脑脊液,阴道粘液,宫颈粘液,鼻分泌物,痰液,精液,羊水,支气管肺泡灌洗液和其他细胞渗出液。这样的样品可以进一步用盐水、缓冲液或生理学上可接受的稀释剂稀释。或者,这些样品通过常规方法浓缩。生物样品还可包括组织切片,例如用于组织学目的的冷冻切片。生物样品也可以称为“患者样品”。生物样品还可以包括基本纯化或分离的蛋白质、膜制剂或细胞培养物。如本文所使用的,术语“癌症”是指或描述哺乳动物中通常特征在于不受调节的细胞生长的生理状况。更具体地,如本文所使用的,术语“癌症”是指任何肺癌。在一个实施方案中,肺癌是NSCLC。在更具体的实施方案中,肺癌是肺腺癌(AC或LAC)。在另一个更具体的实施方案中,肺癌是肺鳞状细胞癌(SCC或LSCC)。在另一个实施方案中,肺癌是I期或II期NSCLC。在另一个实施方案中,肺癌是早期和晚期阶段和各种类型的NSCLC的混合物。本文所用的术语“肿瘤”是指所有致瘤性细胞生长和增殖,无论是恶性的还是良性的,以及所有癌前和癌性细胞和组织。如本文所使用的,术语“接触”及其变体当用于指任何成分组时,包括任何将待接触的成分混合到相同混合物中(例如加入到相同的隔室或溶液中)的方法,并且不一定需要所述成分之间的实际物理接触。所述成分可以以任何顺序或任何组合(或亚组合)接触,并且可包括随后从混合物中除去所述成分中的一个或一些,任选地在加入其它所述成分之前的情况。例如“使A与B和C接触”包括任何和所有以下情况:(i)A与C混合,然后将B加入到混合物中;(ii)A和B混合成混合物;从混合物中除去B,然后将C加入到混合物中;以及(iii)将A加入B和C的混合物。例如“使模板与反应混合物接触”包括以下情况的任意一种或所有:(i)使模板与反应混合物的第一成分接触以产生混合物;然后将反应混合物的其它成分以任何顺序或组合加入到混合物中;和(ii)在与模板混合之前反应混合物完全形成。如本文所用的术语“混合物”是指散布且不以任何特定顺序散布的元素的组合。混合物是异质的并且在空间上不可分离成其不同的成分。元素混合物的实例包括溶解在相同水溶液中的许多不同元素,或随机地或以不特定顺序附接于固相载体的多种不同元素,其中不同元素在空间上没有不同。换句话说,混合物是不可寻址的。具体而言,如本领域通常已知的和下文所述的表面结合寡核苷酸阵列不是表面结合寡核苷酸的混合物,因为表面结合寡核苷酸的种类在空间上独特的并且阵列是可寻址的。如本文所使用的,术语“参考值”是指当与测定结果比较时与特定结果统计上相关的值。在优选的实施方案中,参考值从将RNA表达与已知临床结果进行比较的研究的统计学分析来确定。参考值可以是阈值分数值或截断分数值。通常,参考值将是这样的阈值,高于(或低于)该阈值则一种结果是更可能的,而低于该阈值,则替代结果是更可能的。在一个实施方案中,参考水平可以是以来自从健康(无疾病)受试者的对照群体所采样品的表达水平的平均值表示的一种或多种基因表达(例如以mRNA的形式)水平。在另一个实施方案中,参考水平可以是在不同时间(例如在本发明的测定之前)的同一受试者中的水平,诸如在受试者形成疾病之前或在开始治疗之前测定的水平。通常,样品通过共同因子进行标准化。例如含细胞的样品通过蛋白质含量或细胞计数进行标准化。核酸样品也可以相对于内部对照核酸进行标准化。如本文所使用的“对照”或“对照受试者”是指参考水平的来源(例如参考基因表达谱)以及在下文实施例中鉴定的对照受试者的特定组。例如,在一个实施方案中,对照受试者可以是患有肺癌的对照,诸如作为患有恶性疾病的正在吸烟的人或前吸烟者的受试者,在用于去除实体肺肿瘤手术之前患有实体肺肿瘤的受试者;在手术切除所述肿瘤后患有实体肺肿瘤的受试者;在治疗之前患有实体肺肿瘤的受试者;和在治疗期间或之后患有实体肺肿瘤的受试者。在其他实施方案中,用于本文所述的组合物和方法的目的的对照包括任何下述类别的没有肺癌的参考人类受试者。这样的非健康对照(NHC)包括患有非恶性疾病的吸烟者,患有非恶性疾病的前吸烟者(包括患有肺结节的患者),患有慢性阻塞性肺病(COPD)的非吸烟者,患有COPD的前吸烟者。在其它实施方案中,对照受试者是没有疾病的健康非吸烟者或没有疾病的健康吸烟者。在其他实施方案中,对照或参考是相同的受试者,其中在手术之前或在另一较早的时间点评估基因或基因谱,以能够评估手术或治疗功效或疾病的预后或进展。特定分类的对照的选择取决于医师将诊断/监测方法和组合物所用于的用途。在优选的实施方案中,特异性选择所选的对照组(非健康对照),以尽可能接近地与恶性疾病患者匹配。匹配包括吸烟状况和吸烟相关疾病诸如COPD。两种分类的所有受试者在呈现疾病症状时可以是现有或前吸烟者。本文公开的最有信息性的基因可以将患有恶性疾病的吸烟者与患有非恶性疾病的吸烟者区分开。术语“确定”、“测量”、“评估”和“测定”可互换使用,包括定量和定性测量,并且包括确定特征、性状或性质是否存在。评估可以是相对的或绝对的。评估靶的存在包括确定存在的靶的量,以及确定其是否存在。如本文所公开的,一种或多种基因的表达水平的差异指示疾病或其阶段。短语“水平的差异”是指与对照或参考水平相比,样品中特定标志物(诸如核酸)的量的差异。例如,与参考水平相比,特定生物标志物(例如AKAP4)的量可以以升高的量或以降低的量存在于患有致瘤性疾病的患者的样品中。在一个实施方案中,“水平的差异”可以是样品中存在的特定生物标志物的量与对照物(例如参考值)之间的差异为至少约1%,2%,3%5%,10%,15%,20%,25%,30%,35%,40%,50%,60%,75%,80%,100%,150%,200%或更多。在一个实施方案中,“水平的差异”可以是样品中存在的生物标志物的量与对照相比的统计学显著差异。例如,如果生物标志物的测量水平落在任何对照或参考组的平均值的约1.0标准偏差,约1.5标准偏差,约2.0标准偏差或约2.5标准偏差之外,则差异可以是统计上显著的。关于mRNA测量,可以从实时PCR测量水平作为Ct值,其可以标准化为ACt值,如下文实施例中所述。如本文所公开的,提供了多个数值范围。应当理解,还具体公开了在该范围的上限和下限之间的每个中间值,至下限单位的十分之一,除非上下文另有明确说明。本发明包括在所述范围内的任何所述值或中间值与在该所述范围内的任何其它所述值或中间值之间的每个较小范围。这些较小范围的上限和下限可以独立地包括或排除在该范围内,并且其中任一、没有一个或两个端值都包括在较小范围内的每个范围也包括在本发明内,并且在所描述的范围内任意特别排除端值。当所描述的范围包括一个或两个端值时,排除这些所包括的端值中的一个或两个的范围也包括在本发明中。术语“约”通常是指所指示数目的正或负10%。例如“约10%”可以指示9%至11%的范围,“约1”可以指0.9-1.1。“约”的其它含义可从上下文显而易见,例如四舍五入,因此,例如“约1”也可意指0.5至1.4。实施例实施例1在该实施例中,描述了用于进行实施例2和3中的测定的材料和方法。PBMC收集使用BDVacutainerCPT管根据制造商的说明以上述方式用于PBMC级分(PBMC和相关细胞)收集。总RNA分离使用TRI试剂(T9424Sigma-Aldrich)根据制造商说明书从正常和肺癌PBMC沉淀中提取RNA。简言之,将1mlTRI试剂加入到沉淀中并在室温下孵育15分钟。加入1μl线性丙烯酰胺并在室温下进一步孵育5分钟。然后加入100μl的1-溴-3-氯丙烷,涡旋30秒,在室温下孵育10分钟,然后在4℃下以12000g离心15分钟。收集水相并加入1μl的RNasin(N2115Promega)和500μl异丙醇。在室温下孵育10分钟后,将样品在4℃下以12000g离心10分钟。RNA沉淀用1ml的75%乙醇洗涤两次。将沉淀空气干燥,并悬浮在50μl无RNAse的水中,并储存在-80℃。使用NanoDrop评估RNA浓度和质量。反转录根据制造商的说明书,使用HighCapacitycDNAReverseTranscription试剂盒(AppliedBiosystems,P/N4374966)从总RNA合成cDNA。简言之,将250ng总RNA用作总体积为20μl中的模板,20μl包含2μl10XRT缓冲液、0.8μl100mMdNTP混合物、2μl10XRT随机引物、1μlMultiscribeReverseTranscriptase和1μlRNAse抑制剂。将反应在25℃下孵育10分钟,在37℃下孵育2小时,在85℃下孵育5分钟。将cDNA样品储存在-20℃。定量实时PCR包括在研究中的每个基因的参考序列和基因组序列获自UCSCGenomeBioinformatics网站。使用PrimerExpress(AppliedBiosystems)设计RT-PCR引物。手动设计基因特异性引物。巢式PCR用于确定基因表达。PCR用于第一轮扩增以选择性扩增基因。在含有5μl的cDNA、10μl10X缓冲液、1μl10mMdNTP、3μl基因特异性引物混合物(20μM)、5单位Taq聚合酶的50μl反应物中进行PCR,并在热循环仪上扩增:94℃持续2分钟,随后是94℃持续30秒、60℃持续1分钟和72℃持续15秒的40个循环,然后1个循环的72℃持续10分钟,结束于4℃。用于AKAP4的第一轮扩增的PCR引物是:5'TCCTACATGATGGCGTACTCTG和5'AAGTTGCCTTCTGAGCTGGAAC(分别为SEQIDNO:5和6)。使用5μl第一轮PCR产物、12.5μlSYBRSelectMasterMix(AppliedBiosystems)、0.25μl引物混合物(2μM终浓度)和7.25μl水的25μl反应体积中进行实时PCR反应以检测基因的表达,一式两份。核糖体5S基因是管家基因并用于标准化。用于AKAP4的实时PCR引物是:5'GGGTGTGTGCAAGGTAGATCTCT(SEQIDNO:7)和5'CACATCGACAAAGCATATCACTTTC(SEQIDNO:8)。5S的实时PCR引物是:5'GCCATACCACCCTGAACG(SEQIDNO:9)和5'AGCCTACAGCACCCGGTATT(SEQIDNO:10)。作为污染的阴性对照,还测定没有任何模板的孔。所有反应在7500FastRealTimePCR系统(AppliedBiosystem)上进行。使用ΔΔ阈值循环(Ct)方法计算每个基因和样品两次重复的平均值,并根据制造商的说明书相对于内源参考对照基因5S标准化。实施例2在该实施例中,进行测定以鉴定和验证用于肺癌诊断的生物标志物。简言之,含有PBMC和相关细胞的细胞群以上述方式从患有NSCLC(晚期或早期)的患者和各种对照受试者获得。然后,进行测定以筛选在肺癌患者的细胞群中表达但在正常吸烟对照的细胞群中不表达或低水平表达的120个基因。发现AKAP4基因能够区分患有肺癌的患者和健康对照。然后,使用定量RT-PCR来确定264个NSCLC肺癌患者和135个年龄、性别和吸烟史匹配的健康对照中的AKAP4基因表达。为此,使用接受者工作特征(ROC)曲线,并计算接受者工作特征曲线下面积(AUC)和其95%置信区间。在本领域中已知,AUC可以解释为随机选择的异常受试者的诊断测试的结果会大于来自随机选择的正常受试者的相同诊断测试的结果的概率。AUC越大,诊断测试的总体性能越好。发现当所有肺癌与健康对照比较时,ROC曲线的AUC为97.14%。在这些肺癌病例中,133例是I期NSCLC肺癌。结果表明,在所检查的细胞群体中该AKAP4生物标志物可以区分肺癌和吸烟对照。此外,当将这些I期NSCLC与健康对照进行比较时,ROC曲线的AUC为97.9%。在健康对照中,有24个患有良性肺结节的患者,这已经通过活检确认。结果表明,AKAP4可以允许检测早期NSCLC。还发现当所有NSCLC肺癌与良性结节比较时,ROC曲线的AUC为98.45%。这些结果表明,该生物标志物可用于区分肺癌和良性结节。使用上述RT-PCR进行另外的测定以检查AKAP4表达的组织分布。AKAP4在肺癌细胞中表达,诸如例如A549、HCC827、H1975、H23和H520,但不在正常肺组织表达。AKAP4在正常肾上腺和胎盘中表达。这些结果表明,从含NSCLCPBMC的细胞级分中检测到的AKAP4可能来自循环的NSCLC癌细胞。还检查了来自NSCLC患者和对照的全血细胞样品中的AKAP4表达。发现当使用全血样品时,NSCLC患者和对照之间没有显著差异。参见图1。这些结果表明,全血样品不允许使用常规检测方法来检测AKAP4表达以将NSCLC与对照区分开,这可能是由于循环癌细胞在全血中极低的相对数量,这些循环癌细胞包括丰度高的细胞类型,嗜中性粒细胞没有包括在其中。也就是说,非常少量的肺癌细胞可能在非常早期的阶段在外周血中循环。这些细胞被与PBMC共纯化并富集,并且因此可以通过经由高度灵敏的巢式PCR检查AKAP4表达来检测。实施例3在该实施例中,在四个肺癌患者的纵向研究中,在三个不同时间点监测含有PBMC的细胞级分中的AKAP4表达,如下表所示,目的是测定该循环生物标志物是否可用于检测肺癌复发。时间点1时间点3时间点3患者#1手术前手术后6个月手术后12个月患者#2手术前手术后9个月手术后24个月患者#3手术前手术后9个月手术后36个月患者#4手术后6个月手术后32个月手术后37个月更具体地,在患者#1中,AKAP4在手术前高表达,并且该患者基于AKAP4表达被正确地分类为肺癌。手术后6个月AKAP4表达降低至截断值以下,但随后在手术后12个月增加至截断值以上。AKAP4表达的这种反弹表明该患者在手术后12个月有肺癌复发。事实上,4个月20天后,发现该患者表现出肺癌的临床复发。这些结果表明,含有PBMC的级分样品中的AKAP4表达可用于早期检测复发和疾病监测。在患者#2中,发现AKAP4在手术前也高表达,并且该患者基于AKAP4表达被正确地分类为肺癌。与在患者#1中一样,在患者#2中的AKAP4表达手术后9个月也降至截断值以下。然而,患者#2的AKAP4表达在手术后24个月保持在截断值以下。参见图4。而且,该患者的肺癌没有复发。这些结果表明,PBMC级分样品中的AKAP4表达可用于疾病监测和预后。在患者#3中也发现了相似的AKAP4表达模式和肺癌结果。该患者的含有PBMC的级分中的AKAP4在手术前高表达,并且该患者基于AKAP4表达被正确地分类为肺癌。手术后9个月AKAP4表达降至截断值以下,并且在手术后24个月保持低于截断值。像患者#2一样,患者#3也没有复发。这些结果再次表明,在含有PBMC的级分样品中的AKAP4表达可以用于疾病监测和预后。在3个时间点:在手术后6个月、手术后32个月和手术后37个月,从肺癌患者#4收集含有PBMC的级分样品。发现手术后6个月AKAP4表达低于截断值。然后,在手术后32个月AKAP4表达增加到截断值以上,表明该患者有肺癌。事实上,2个月后,这个病人表现出肺癌的临床复发。该患者然后接受放射治疗,放射治疗后CT扫描显示肺癌结节消失。放疗后3个月AKAP4表达下降,但保持高于截断值,表明放射治疗部分有效,但放射治疗后仍有癌症。事实上,该患者在放疗后10个月表现出转移性肺癌。这些结果表明,含有PBMC的级分样品中的AKAP4表达可用于早期检测复发、疾病监测和预后。实施例4分析作为基于血液的生物标志物的癌症睾丸抗原(“CTA”)基因,用于检测NSCLC。针对X染色体上130个CT基因中116个,设计了独特PCR引物(序列相似性阻止了对14个CT-X基因选择特异性引物)(AlmeidaLG,etal.NucleicAcidsRes2009;37(Databaseissue):D816-9)。巢式PCR用作检测方法,因为可能mRNA在所测试的PBMC级分中以低水平存在。进行测试以确定116个CT-X基因中的任一个是否在来自12个NSCLC肺癌患者和7个具有吸烟相关良性肺病(包括COPD和/或良性肉芽肿性炎症)的对照患者的PBMC衍生的RNA中差异表达。四个对照具有组织学证实的良性肺结节。这些高度表征的样品是先前描述的以开发NSCLC的基于血液的生物标志物的微阵列研究的一部分(ShoweMK,etal.CancerRes2009;69(24):9202-10);KossenkovAV,etal.ClinCancerRes2011;17(18):5867-77)。基于发现组的结果,选择在该数据集中以最佳准确度将NSCLC与良性肺病区分开的两个候选CTX基因:AKAP4和GAGE4,用于在更大的独立样品集上进一步分析。AKAP4的表达完美地分离癌症和对照组(图2A),而GAGE4(图2B)在所测试的所有116个候选物中仅错误分类了一个NSCLC样品。因此,在两种生物标志物中,AKAP4是最准确的,并且由于随后在应用于较大数据集时表现差而消除了GAGE4。实施例5为了确定AKAP4和GAGE4作为NSCLC生物标志物的潜在效用,分析了具有141个NSCLC患者和35个患有良性肺病的对照患者,不包括任何发现组样品的的另外的队列。35例对照中有24例患有通过活检证实的良性肺结节(Showeetal,2009)。虽然AKAP4和GAGE4二者的准确度在小数据集上基本相同,但是AKAP4表达在较大数据集上的性能显著高于GAGE4,在该比较中AKAP4的AUC为0.9735(图3A)和GAGE4的AUC为0.7149。在测试并发现AKAP4和GAGE4表达的组合没有改善总体预测并且由于其在该较大样品组中的低AUC之后,GAGE4未包括在进一步的分析中。然后在第二独立队列的患者中测定AKAP4表达。该数据集包括123个NSCLC患者和100个对照。VH数据集上的ROC曲线的AUC为0.9805(图3B)。分析包括来自两个队列而不是发现组(discoveryset)的样品的合并数据集。合并数据包括264个NSCLC患者和135个对照。分析了作为NSCLC分类器的AKAP4在合并数据集中的表达,图3D中显示的NSCLC和对照组之间的表达值的分布的ROC曲线的AUC为0.9714(图3C)。AKAP4表达水平-4.3显示对于92.7%的总准确度的最平衡的灵敏度/特异性值(分别为92.8%和92.6%)。除了AKAP4表达、年龄、性别和吸烟状况外,还包括交叉验证的线性判别分析作为潜在预测因子没有显示改善的AUC或准确度。用于分类的AKAP4表达的最终观察的性能总结在表1中。此外,进行交叉验证研究以估计报告的AUC和准确度值的变化(表2)。合并数据集的变异系数对于AUC为0.10%和对于准确度为0.16%,这表明在研究中呈现非常高的置信结果。表1AKAP4表达在不同的NSCLC和对照子集中的分类表1说明了在不同NSCLC和对照子集的分类中AKAP4表达的性能。对于每个分类,该表列出了在-4.3的阈值下AKAP4表达所观察的AUC和95%置信区间(CI)和灵敏度(sens),特异性(spec)和总体准确度(acc)有两个特别感兴趣的样品亚组:I期NSCLC(当肺切除术是最有利的时候从早期检测获益最多的组)以及高风险肺结节(需要手术确认以确定恶性/非恶性状态)。在264个NSCLC患者中,136个被诊断为I期NSCLC。用作仅I期NSCLC和所有对照的分类器的AKAP4表达水平证明了ROC曲线的AUC是0.9795(图4A)。虽然该分析中包括的结节数相对较少,但是用于将所有264个NSCLC和来自良性结节患者的27个样品分类的ROC曲线的AUC给出0.9825的值(图4B)(所有测试分类的最佳性能),这表明与PBMC相关的AKAP4表达区分开了良性和恶性肺结节。AKAP4提供了一个灵敏的标志物来跟踪缓解,并作为复发的早期标志物。实施例6因为在先前的PBMC基因表达研究(Showe2009和Kossenkov2011)中,确定肺鳞状细胞癌(LSCC)的患者比具有肺腺癌(AC)的患者更准确地分类,并且分类准确度也随着晚期癌症分期而增加,重要的是确定AKAP4PCR信号的强度是否也与包括癌症分期和亚型在内的多种临床参数相关。使用组织学、分期、吸烟史、性别和年龄作为自变量进行AKAP4表达的线性回归分析。所述分析鉴定得到:AKAP4表达仅与癌症分期显著相关(表2)。图5显示,AKAP4表达的量级经过所有4个期持续增加,II、III和IV期的AKAP4水平分别平均为I期中表达水平的4.7、9.8和>3000倍。AKAP4表达不与烟草使用显著相关的事实也表明,AKAP4分类可以以相同的效率成功地用于较高风险的目前吸烟者以及较低风险的非吸烟者。表2变量显著性(p<0.05)β值95%CIAC诊断ns-0.045[-0.581,0.491]LSCC诊断ns-0.01[-0.635,0.614]分期(阶段)显著0.214[0.049,0.379]从不吸烟者ns-0.182[-0.822,0.458]目前吸烟ns-0.008[-0.446,0.431]吸烟年龄ns-0.009[-0.020,0.001]每年包数ns-0.051[-0.284,0.182]性别ns-0.028[-0.355,0.298]年龄ns-0.012[-0.029,0.005]表2说明了AKAP4表达和不同临床参数的线性回归分析的结果。结果表明,只有肿瘤分期与AKAP4表达显著相关。如图5所示,检测到的AKAP4信号的来源是肺癌这进一步得到信号强度与肿瘤分期的强相关性的支持。没有其他患者特征(包括年龄、性别、烟草使用或癌症亚型)显示任何显著相关。此信号的肿瘤衍生(derivation)进一步由证明以下内容的数据的支持:在成功的肺切除术后PBMC的RNA存在的AKAP4显著降低,并且该表达随着肺肿瘤复发而再次增加。肺切除后分析了PBMC相关的AKAP4表达。对来自4个NSCLC患者的样品中的表达进行了分析,其中在肺切除术后多次收集随访样品。将术前样品中的AKAP4表达与手术切除后不同时间的表达进行比较。图6显示了具有不同结局的四个病例。病例1-复发:患者vh.603是85岁的女性前吸烟者,其进行了肺切除术,被诊断为I期NSCLC。在随访中评估CT扫描,在3个时间点从该患者收集PBMC样品:手术前、手术后6个月和手术后12个月。手术后约16个月,通过CT扫描发现肺结节,随后证实为NSCLC。对所有可用样品进行巢式PCR,并在大数据集上使用截断点以评估AKAP4表达。手术前样品中的AKAP4表达高于截断点,这证实了NSCLC的存在,这与临床诊断一致(图6)。基于我们的病例对照研究,手术后6个月样品中的AKAP4表达降至截断点以下,表明患者在6个月时缓解(图6)。随后在手术后12个月的样品中表达增加到截断点以上,表明癌症已复发(图6),虽然在这时没有通过CT扫描检测到复发的证据。大约4个月后(手术后16个月),通过CT扫描检测到肺结节,随后证实为NSCLC。病例2-缓解:患者vh.621是85岁的女性前吸烟者,诊断为I期NSCLC。通过手术除去患者的肿瘤,并诊断为处于缓解。在3个时间点收集PBMC样品:手术前、手术后9个月和手术后24个月。在手术前样品中的AKAP4表达高于截断点,这与NSCLC的存在一致(图6)。在手术后9个月AKAP4表达下降至截断点以下,并且在手术后24个月保持在截断点以下(图5)。通过临床评估,该患者处于缓解。病例3-缓解:患者vh.495是也被诊断为I期NSCLC的67岁女性前吸烟者。在3个时间点从该患者收集PBMC:手术前、手术后9个月和手术后36个月。AKAP4表达从手术前的截断点以上下降到手术后9个月的截断点以下,并且在手术后36个月保持在截断点以下(图6)。重复CT扫描证实该患者处于缓解。病例4-复发+治疗:测定来自复发并随后经历额外治疗的患者的PBMC样品中的AKAP4表达。患者vh.554是一名79岁的女性目前吸烟者,其诊断为I期NSCLC。进行手术以去除她的肿瘤,并且在32个月后,在随访期间通过CT扫描检测到肺结节。结节通过活检证实为NSCLC。该患者接受立体定向体放射治疗。放射治疗后CT扫描未检测到任何肺结节的存在。然而,在发现第二个肿瘤后12个月检测到转移性疾病。在该患者的血液中的3个时间点分析AKAP4表达:手术后6个月、手术后32个月(其在复发检测时但是放射治疗前)以及手术后37个月(放射后3月)。没有手术前血液样品。虽然手术后6个月的AKAP4表达低于截断点(图6),但手术后32个月的表达显著增加到截断点以上,这支持了CT和活检诊断的NSCLC复发。在手术后37个月(放射治疗后3个月),AKAP4水平从放射前治疗值下降,但仍保持在截断点以上,表明存在残留癌症,即便CT扫描在那时没有检测到任何肺结节并且没有残留疾病的临床指征。该患者在放射治疗后10个月被临床诊断为转移性NSCLC。这些临床研究支持了即便在没有阳性CT扫描的情况下监测AKAP4表达也作为缓解/复发的标志物的效用。患者vh.603、vh.621和vh.495显示在手术前和手术后样品之间AKAP4表达的显著下降。患者vh.623和vh.495(其分别在手术后24和36个月保持缓解)的AKAP4表达保持在截断值以下。患者vh.603在手术后12个月和在被诊断为复发之前4个月AKAP4表达急剧上升。没有获得患者vh.554的手术前样品,但是手术后6个月的样品处于非癌症范围。患者vh.554在手术后32个月显示AKAP4急剧增加,与诊断的复发和经历的放射治疗相关。在第3个时间点,放射治疗后3个月的AKAP4信号已经大大降低,但仍然在癌症范围内。出乎意料地确定的是,肺中肿瘤的存在与在外周血样品中检测到AKAP4信号之间存在强相关性。前述实施例和优选实施方案的描述应当被认为是示例性的,而不是限制权利要求所限定的本发明。容易理解的是,可以使用上述特征的许多变化和组合,而不脱离权利要求中阐述的本发明。这样的变化不被认为是偏离本发明的范围,并且所有这样的变化旨在包括在所附权利要求的范围内。本文引用的所有参考文献通过引用整体并入。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1