检测生物标志物的试剂在制备评价肺癌患者整体生存的产品中的应用的制作方法

文档序号:32030074发布日期:2022-11-03 01:18阅读:105来源:国知局
检测生物标志物的试剂在制备评价肺癌患者整体生存的产品中的应用的制作方法

1.本技术涉及分子诊断技术领域,尤其是涉及检测生物标志物的试剂在制备评价肺癌患者整体生存的产品中的应用。


背景技术:

2.肺癌是人类恶性肿瘤的重要分支,流行病学调查显示肺癌是恶性肿瘤中新发病例和死亡病例中较多的一种,肺癌病例的发现以晚期居多,化疗是目前最主要的标准治疗模式。根据组织学类型分类,肺癌分为小细胞肺癌(sclc)和非小细胞肺癌(nsclc)。虽然sclc和nsclc的中位生存期相差不大,但对于不同患者之间的个体化差异,实际的生存期仍然有比较明显的区别,并且整体预后较差,5年生存率偏低。因此,如何选择合适的治疗方案以提高患者的生存时间,从而提高其存活率是目前肺癌治疗的重要目标。目前在临床上对于肺癌的生存监测的金标准为影像学检查,包括超声、x光胸片、ct等,但这些传统诊断技术对肺癌的监测存在滞后性,即需要在原发或其它部位出现成形的肿瘤才能够确定,而这往往会错过最佳的治疗时间窗口。因此,有必要提供能够准确评估整体生存的生物标志物。


技术实现要素:

3.本技术旨在至少解决现有技术中存在的技术问题之一。为此,本技术提出检测标志物的试剂在制备肺癌患者整体生存的产品中的应用。
4.本技术的第一方面,提供检测标志物的试剂在制备肺癌患者整体生存的产品中的应用,标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n个,n任选自1~49的正整数。
5.根据本技术实施例的应用,至少具有如下有益效果:
6.上述生物标志物具有良好的诊断特性,采用上述生物标志物中的一种或几种作为靶标检测其水平,以此能够较为准确地评价肺癌患者的整体生存风险,进一步可以考虑合适的治疗方式以延长其整体生存。
7.其中,dhrs7c(dehydrogenase/reductase sdr family member 7c)是脱氢酶/还原酶sdr家族成员7c基因,激活nad视黄醇脱氢酶活性,参与调节肌质网将螯合钙离子释放到细胞质中,位于细胞外区和纵向肌浆网,在肌质网膜中具有活性。
8.sdhaf2(succinate dehydrogenase complex assembly factor 2)是琥珀酸酯脱氢酶复合物组装因子2基因,该基因编码琥珀酸脱氢酶复合物亚基(sdha)的发酵所需的线粒体组装因子,是琥珀酸脱氢酶复合物的活性所必需的。该基因中的突变与副神经胶质瘤有关。
9.apoa5(apolipoprotein a5)是载脂蛋白a5基因,该载脂蛋白在调节血浆甘油三酯水平方面发挥着重要作用,是冠状动脉疾病的主要危险因素。该基因的突变与高甘油三酯血症和5型高脂蛋白血症有关。
10.spaca3(sperm acrosome associated 3)是精子顶体相关3基因,其编码蛋白是精子表面蛋白质,它可能在受精前参与与卵子的粘附。虽然编码蛋白在氨基酸水平上与溶菌酶有显着相似性,但没有可检测到的杀菌活性。
11.b9d1(b9 domain containing 1)是包含1的b9域,该基因编码一种含有b9结构域的蛋白质,是参与纤毛发生的几种蛋白质之一,该基因位于17号染色体上的smith-magenis综合征区域内。
12.itpk1(inositol-tetrakisphosphate 1-kinase)是肌醇-四磷酸1-激酶,该基因编码一种属于肌醇1,3,4-三磷酸5/6激酶家族的酶,能够调节四磷酸肌醇和下游产物五磷酸肌醇和六磷酸肌醇的合成。
13.odaph(odontogenesis associated phosphoprotein)是牙源性相关磷蛋白,该基因编码一种细胞外基质酸性磷蛋白,在牙釉质形成过程中具有釉质矿化功能,该基因的突变与隐性矿化不足的牙釉质发育不全有关。
14.fscn2(fascin actin-bundling protein 2,retinal)是筋膜蛋白-肌动蛋白捆绑蛋白2基因,视网膜。该基因编码肌成束蛋白家族的成员,在动态细胞扩展中将肌动蛋白交联成丝状束,在光感受器椎间盘形态发生中发挥作用。
15.rrm1(ribonucleotide reductase catalytic subunit m1)是核糖核苷酸还原酶催化亚基m1基因,是核糖核苷酸转化为脱氧核糖核苷酸至关重要的酶。而可用的脱氧核糖核苷酸池对于在细胞周期的s期以及多个dna修复过程中的dna复制很重要。
16.prok1(prokineticin 1)是促动素1基因,该基因的编码蛋白在毛细血管内皮细胞中诱导了增殖、迁移和形成膜不连续性,表达仅限于类固醇生成腺,由缺氧诱导,通常与血管内皮生长因子(vegf)的表达相辅相成,这表明这些分子以协同的方式起作用。
17.dgki(diacylglycerol kinase iota)是二酰基甘油激酶iota基因,该基因是iv型二酰基甘油激酶亚家族的成员。二酰甘油激酶通过磷酸化调节二酰甘油的细胞内浓度,产生磷脂酸。该酶能够在视网膜磷脂酸的产生或隐性视网膜变性中发挥关键作用。
18.s100a4(s100 calcium binding protein a4)是s100钙结合蛋白a4基因,该基因编码的蛋白是含有2个ef手钙结合基序的s100家族的成员。s100蛋白位于广泛细胞的细胞质和/或核中,并参与了许多细胞过程的调节,可能在运动,侵袭和微管蛋白聚合中起作用。
19.apol6(apolipoprotein l6)是载脂蛋白l6基因,该基因是载脂蛋白l基因家族的成员,它可能会影响脂质的运动或允许脂质与细胞器结合。
20.sell(selectin l)是选择素l基因,该基因编码属于粘附/归因受体家族的细胞表面粘附分子,编码蛋白包含一个c型凝集素样结构域,钙结合表皮生长因子样结构域和两个短的补体样重复序列。该基因中的单核苷酸多态性与包括免疫球蛋白a肾病在内的各种疾病有关。
21.slc28a2(solute carrier family 28member 2)是溶质载体家族28成员2,能够激活神经递质跨膜转运蛋白活性和核苷跨膜转运酶活性,参与核苷转运、嘌呤核碱跨膜转运和嘧啶类化合物的跨膜转运等多个过程。
22.gpr37(g protein-coupled receptor 37)是g蛋白偶联受体37基因,编码蛋白存在于细胞和内质网膜中,包含七重跨膜结构域,并且参与将外部信号转化为g蛋白介导的细胞内效应。
23.bcorp1(bcl6 corepressor pseudogene 1)是bcl6辅加压素假基因1基因。
24.fstl4(follistatin like 4)是卵泡抑素样4基因,可能参与激活脑源性神经营养因子结合活性和钙离子结合活性以及细胞分化。此外还可能作用于脑源性神经营养因子受体信号通路的上游或内部负调控等。
25.spink1(serine peptidase inhibitor kazal type 1)是丝氨酸肽酶抑制剂kazal 1型基因,该基因的编码蛋白是一种胰蛋白酶抑制剂,从胰腺腺泡细胞分泌到胰汁中。其在预防胰蛋白酶催化的胰腺和胰管内的酶促的过早激活中起作用。
26.brca2(brca2 dna repair associated)和brca1都参与了基因组稳定性的维持,特别是双链dna修复的同源重组途径。brca2被认为是肿瘤抑制基因,因为具有brca2突变的肿瘤通常表现出野生型等位基因的杂合性(loh)的丧失。
27.ankar(ankyrin and armadillo repeat containing)是含锚蛋白和犰狳重复序列,预测位膜组成部分。
28.pspn(persephin)编码蛋白质的gdnf(神经胶质细胞系衍生的神经营养因子)亚家族和tgf-β(转化生长因子-β)超家族的分泌配体。通过ret受体酪氨酸激酶和gpi连接的辅助受体发出信号,并促进神经元群体的存活。
29.galk1(galactokinase 1)是半乳激酶1基因,作为半乳糖代谢的主要酶,与galk1相关的疾病包括半乳糖血症ii、大疱性表皮松解症、结节5b和幽门闭锁。
30.rbm10(rna binding motif protein 10)是rna结合基序蛋白10基因,该基因编码的核蛋白属于包含rna结合基序的家族蛋白,编码蛋白与hnrnp蛋白质结合,可能参与调节可变剪接。
31.gdpd5(glycerophosphodiester phosphodiesterase domain containing 5)是含5的甘油磷酸二酯磷酸二酯酶结构域,其参与甘油代谢。
32.calr(calreticulin)是钙网蛋白,属于一种高度保守的伴侣蛋白,主要存在于内质网中,并参与多种细胞过程,其中包括细胞粘附。此外,它在蛋白质折叠质量控制和钙稳态中起作用。在细胞核中也发现了钙网蛋白,这表明它可能在转录调节中起作用。
33.pdia3(protein disulfide isomerase family amember 3)是蛋白质二硫键异构酶家族a成员3基因,该基因编码一种内质网蛋白,该蛋白与凝集素伴侣钙网蛋白和钙连接蛋白相互作用以调节新合成的糖蛋白的折叠。
34.recql5(recq like helicase 5)是recq样螺旋酶5基因,作为一种对基因组稳定性很重要的解旋酶,还能够从ssdna中置换rad51来防止异常同源重组。
35.g6pc2(glucose-6-phosphatase catalytic subunit 2)是葡萄糖-6-磷酸酶催化亚基2基因,该基因编码属于葡萄糖-6-磷酸酶催化亚基家族的酶。该基因编码的家族成员在胰岛中发现,不表现出磷酸化酶活性,但它是糖尿病细胞介导的自身免疫性的主要靶标。
36.slc29a3(solute carrier family 29member 3)是溶质载体家族29成员3基因,该基因编码核苷转运蛋白。编码蛋白在细胞摄取核苷,核碱基及其相关类似物中起作用。
37.fat1(fat atypical cadherin 1)是脂肪异型钙粘蛋白1基因,该基因编码蛋白是
钙粘蛋白超家族的成员,该基因在许多胎儿上皮中以高水平表达,产物可能是粘附分子和/或信号受体的作用,并且在发育过程和细胞通信中可能很重要。
38.dnajb6(dnaj heat shock protein family(hsp40)member b6)是dna j热休克蛋白家族(hsp40)成员b6基因,该基因编码dna j蛋白家族的成员。dna j蛋白家族特征在称为“j域”的高度保守的氨基酸片段,并作为参与广泛细胞事件的两大类分子伴侣之一发挥作用。
39.ptprd(protein tyrosine phosphatase receptor type d)是d型蛋白酪氨酸磷酸酶受体d型基因,编码蛋白是蛋白质酪氨酸磷酸酶(ptp)家族成员。作为信号分子,ptp可调节各种细胞过程,包括细胞生长、分化、有丝分裂循环和致癌转化。在促进神经突的生长和调节神经元轴突指导中有重要作用。
40.mfsd4b(major facilitator superfamily domain containing 4b)是包含4b的主要促进子超家族域,该基因可能会激活葡萄糖跨膜转运蛋白活性、参与葡萄糖跨膜转运和钠离子转运。该基因的表达蛋白位于顶端质膜,是膜的组成部分。
41.ezr(ezrin)编码的细胞质外周膜蛋白在微绒毛中起蛋白质酪氨酸激酶底物的作用,作为erm蛋白家族成员,充当质膜和肌动蛋白细胞骨架之间的中间体。此外,蛋白质在细胞表面结构的粘附、迁移和组织中起关键作用,可能与多种人类癌症有关。
42.iqcd(iq motif containing d)位于睫状体基底部,与iqcd相关的疾病包括内脏异位和原发性睫状体运动障碍。
43.ripply2(ripply transcriptional repressor 2)是ripply转录阻遏物2基因,属于脊椎动物体细胞发生所需的一个新的蛋白质家族。该家族成员具有与转录抑制子groucho相互作用所需的四肽wrpw基序和转录抑制所需的羧基末端同源域/bowline dscr ledgerline保守区。
44.il26(interleukin 26)是白介素26基因,编码蛋白是细胞因子il10家族的成员,它是一种分泌蛋白,可能作为同型二聚体发挥作用。
45.pax1(paired box 1)是转录因子配对盒(pax)家族的成员。该基因在胚胎发育过程中的模式形成中发挥作用,可能对脊柱的发育至关重要。此外,该基因在卵巢癌和宫颈癌中因甲基化而沉默,可能是一种肿瘤抑制基因。
46.hmox1(heme oxygenase 1)是血红素氧酶1基因,它是血红素分解代谢中的必需酶,裂解血红素形成双脂蛋白,随后通过biliverdin还原酶将其转化为胆红素。血红素氧酶活性由其底物血红素和各种非血红素物质诱导。
47.ndrg1(n-myc downstream regulated 1)是n-myc下游调节1基因,该基因是属于α/β水解酶超家族的n-myc下调基因家族的成员。该基因编码的蛋白质是一种涉及胁迫反应、激素反应、细胞生长和分化的细胞质蛋白。编码蛋白对于p53介导的半胱天冬酶激活和凋亡所必需的。
48.klk12(kallikrein related peptidase 12)是激肽释放酶相关肽酶12基因,激肽释放酶是一类丝氨酸蛋白酶,具有多种生理功能。越来越多的证据表明,许多激肽释放酶与癌症的发生有关。而该基因是位于19号染色体簇中的15个激肽释放酶亚家族成员之一。
49.tnfrsf19(tnf receptor superfamily member 19)是tnf受体超家族成员19基因,该基因编码的蛋白质是tnf受体超家族的成员,而该受体在胚胎发育过程中高度表达。
研究表明,它与traf家族成员相互作用,并在细胞中过度表达时激活jnk信号通路。这种受体能够通过非caspase依赖的机制诱导细胞凋亡,被认为在胚胎发育中发挥重要作用。
50.ddr2(discoidin domain receptor tyrosine kinase 2)是盘状蛋白结构域受体酪氨酸激酶2基因,该基因编码受体酪氨酸激酶(rtks)蛋白家族的一个成员。rtk在细胞与其微环境的通信中发挥关键作用。该编码蛋白是一种胶原诱导受体,激活参与细胞粘附、增殖和细胞外基质重塑的信号转导途径。
51.tsc1(tsc complex subunit 1)是tsc复合体亚基1基因,该基因是编码生长抑制蛋白hamartin的肿瘤抑制基因。编码蛋白与gtpase激活蛋白tuberin相互作用并稳定。这种hamartin-tuberin复合物对雷帕霉素复合物1(mtorc1)信号的哺乳动物靶点起负调节作用,该信号是合成代谢细胞生长的主要调节因子。
52.fancc(fa complementation group c)是fa互补组c基因。
53.rad51c(rad51 paralog c)是rad51同源c基因,该蛋白质可以与其他rad51同源物相互作用,已经观察到了在扩增过程中四个基因的过表达,并表明在肿瘤进展中可能起作用。
54.rac1(rac family small gtpase 1)是rac家族小型gtp水解酶1基因,该基因编码的蛋白质是一种gtp酶,属于小gtp结合蛋白的ras超家族。这一超家族成员似乎可以调节多种细胞事件,包括控制细胞生长、细胞骨架重组和蛋白激酶的激活。
55.elac2(elac ribonuclease z 2)是elac核糖核酸酶z 2基因,其编码蛋白具有trna3'加工核糖核酸内切酶活性,可催化前体trna中3'端的去除。该蛋白还与激活的smad家族成员(smad2)及其核伙伴叉头盒h1(也称为fast-1)相互作用,并且降低的表达可以抑制转化生长因子-β诱导的生长停滞。
56.整体生存(overal survival)是肿瘤临床试验最主要的疗效终点。如果结果显示整体生存时间有提高,证明治疗方案的效果较好,可以延长患者的生存期。在本技术中,整体生存包括整体生存时间(或整体生存期)以及整体生存风险。其中,整体生存风险是指整体生存的风险。整体生存风险越高,整体生存期越短。在其中一些实施方式中,整体生存风险进一步可以指达到某一特定整体生存期的风险,例如一年生存期、两年生存期、三年生存期、五年生存期、十年生存期的风险,风险越高,则能够达到一年生存期、两年生存期、三年生存期、五年生存期、十年生存期的可能性就越低。
57.在本技术的一些实施方式中,在有辅助化疗时,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少n1个;
58.在无接受辅助化疗时,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n2个;
59.其中,n1任选自1~19的正整数,n2任选自1~30的正整数。
60.本技术的实施方案进一步针对接受辅助化疗和无辅助化疗的肺癌患者建立了关于整体生存的模型,为此将肺癌患者中不同的辅助治疗手段加以区分,通过不同的标志物来预测患者的整体生存,从而可以从中选择合适的辅助治疗手段。对于接受辅助化疗整体
生存风险相对于未接受辅助化疗的整体生存更高的,优先采用辅助化疗之外的其它治疗方案;而对于接受辅助化疗整体生存风险更低的,首选接受辅助化疗。两种检测可以供医生与病人选择,从而作为医生制定更准确治疗方案的依据。
61.此外,对于术后正在进行辅助化疗或者还没有进行辅助化疗的病人,应用上述检测试剂的整体生存的产品可以为患者改善与优化现有的治疗方案。
62.其中,有辅助化疗时是指肺癌患者正在进行辅助化疗或者计划接受辅助化疗,而在无辅助化疗时是指肺癌患者从未接受辅助化疗或者计划不接受辅助化疗。在其中一些具体实施方式中,肺癌患者是指经过手术的肺癌患者,例如术后1min、2min、5min、30min、1h、2h、3h、5h、12h、24h、2d、3d、5d、7d、14d、30d等不同时间间隔的肺癌患者。辅助化疗的具体方案可以是包括顺铂(p)的方案,具体可以是包括顺铂的双药方案,例如tp(紫杉醇+顺铂)、gp(吉西他滨+顺铂)、dp(多西他赛+顺铂)、ap(培美曲塞+顺铂)、lp(紫杉醇脂质体+顺铂)等,可以理解的是,对于部分无法耐受顺铂的患者,可采用卡铂进行代替。
63.在本技术的一些实施方式中,在有辅助化疗时,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个以及全部十九个。
64.在本技术的一些实施方式中,在有辅助化疗时,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个或全部十八个。这其中一个或多个的生物标志物的水平升高时,指示具有较高的整体生存风险。
65.在本技术的一些实施方式中,在有辅助化疗时,生物标志物包括spink1。这一生物标志物的水平下降时,指示具有较高的整体生存风险。
66.在本技术的一些实施方式中,在有辅助化疗时,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、全部十八个,和spink1。
67.在本技术的一些实施方式中,在无辅助化疗时,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个、至少二十二个、至少二十三个、至少二十四个、至少二十五个、至少二十六个、至少二十七个、至少二十八个、至少二十九个以及全部三十个。
68.在本技术的一些实施方式中,在无辅助化疗时,生物标志物包括brca2、ankar、
pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1和ndrg1中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个以及全部二十二个。这其中一个或多个的生物标志物的水平升高时,指示具有较高的整体生存风险。
69.在本技术的一些实施方式中,在无辅助化疗时,生物标志物包括klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个以及全部八个的水平下降时,指示具有较高的整体生存风险。
70.在本技术的一些实施方式中,在无辅助化疗时,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1和ndrg1中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个以及全部二十二个,和klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个以及全部八个。
71.在本技术的一些实施方式中,试剂检测生物标志物的mrna表达水平。
72.在本技术的一些实施方式中,试剂检测生物标志物的蛋白表达水平。
73.在本技术的一些实施方式中,肺癌选自小细胞肺癌、非小细胞肺癌中的至少一种。
74.在本技术的一些实施方式中,非小细胞肺癌选自鳞状细胞癌、腺癌、大细胞癌中的至少一种。
75.在本技术的一些实施方式中,样本选自血液、组织、粪便、尿液中的至少一种。
76.本技术的第二方面,提供一种评价肺癌患者的整体生存的产品,该产品包括检测生物标志物的试剂,生物标志物包含dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n个,n任选自1~49的正整数。
77.在本技术的一些实施方式中,生物标志物包含dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个、至少二十二个、至少二十三个、至少二十四个、至少二十五个、至少二十六个、至少二十七个、至少二十八个、至少二十九个、至少三十个、至少三十一个、至少三十二个、至少三十三个、至少三十四个、至少三十五个、至少三十六个、至
少三十七个、至少三十八个、至少三十九个、至少三十个、至少四十一个、至少四十二个、至少四十三个、至少四十四个、至少四十五个、至少四十六个、至少四十七个、至少四十八个以及全部四十九个。
78.在本技术的一些实施方式中,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少n1个,n1任选自1~19的正整数。
79.在本技术的一些实施方式中,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个以及全部十九个。
80.在本技术的一些实施方式中,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n2个,n2任选自1~30的正整数。
81.在本技术的一些实施方式中,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个、至少二十二个、至少二十三个、至少二十四个、至少二十五个、至少二十六个、至少二十七个、至少二十八个、至少二十九个以及全部三十个。
82.在本技术的一些实施方式中,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、全部十八个,和/或,spink1。
83.在本技术的一些实施方式中,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1和ndrg1中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个以及全部二十二个,和/或,klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个以及全部八个。
84.在本技术的一些实施方式中,试剂检测生物标志物的mrna表达水平。
85.在本技术的一些实施方式中,肺癌选自小细胞肺癌、非小细胞肺癌中的至少一种。
86.在本技术的一些实施方式中,非小细胞肺癌选自鳞状细胞癌、腺癌、大细胞癌中的至少一种。
87.本技术的第三方面,提供用于评价肺癌患者的整体生存的生物标志物,该生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n个,n任选自1~49的正整数;
88.在本技术的一些实施方式中,在有辅助化疗时,标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少n1个,n1任选自1~19的正整数;例如其中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个以及全部十九个。
89.在本技术的一些实施方式中,在无辅助化疗时,标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n2个,n2任选自1~30的正整数;例如其中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个、至少二十二个、至少二十三个、至少二十四个、至少二十五个、至少二十六个、至少二十七个、至少二十八个、至少二十九个以及全部三十个。
90.本技术的第四方面,提供计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行以下操作:
91.步骤1:获取来自肺癌患者样本中的生物标志物的表达水平的信息,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n个,n任选自1~49的正整数;
92.步骤2:对表达水平进行数学关联以获得评分;评分用于指示肺癌患者的整体生存风险。
93.在本技术的一些实施方式中,生物标志物包含dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十一个、至少十二个、至少十三个、至少十四个、至少十五个、至少十六个、至少十七个、至少十八个、至少十九个、至少二十个、至少二十一个、至少二十二个、至少二十三个、至少二十四个、至少二十五个、至少二十六个、至少二十七个、至少二十八个、至少二十九个、至少三十个、至少
三十一个、至少三十二个、至少三十三个、至少三十四个、至少三十五个、至少三十六个、至少三十七个、至少三十八个、至少三十九个、至少三十个、至少四十一个、至少四十二个、至少四十三个、至少四十四个、至少四十五个、至少四十六个、至少四十七个、至少四十八个以及全部四十九个。
94.在本技术的一些实施方式中,生物标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少n1个,n1任选自1~19的正整数。
95.在本技术的一些实施方式中,生物标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n2个,n2任选自1~30的正整数。
96.在本技术的一些实施方式中,步骤2中对表达水平进行数学关联以获得评分包括对brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少一种的表达水平进行数学关联获得一种整体生存评分,对dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少一种的表达水平进行数学关联获得另一整体生存评分,根据两种整体生存评分比较肺癌患者采取辅助化疗和不采取辅助化疗的整体生存风险的差异。可以理解的是,可以根据两者的差异确定是否采取辅助化疗。具体而言,假设采用有辅助化疗,在这种情况下,依照其中特定的一组(一个或多个)标志物进行关联获取整体生存评分,所反映出的整体生存风险比按照无辅助化疗的情况下的特定的一组(一个或多个)标志物进行关联所获取的整体生存评分反映的整体生存风险更大时,显然采用后者,即考虑采用其它辅助疗法;而当相反的情况,采用有辅助化疗情况下整体生存风险更低,显然就采用辅助化疗的方案。可以理解的是,两者在比较时所反映的整体生存风险的参照一致。
97.根据获得的整体生存评分来指导以降低整体生存为临床目标的个性化精准医疗方案,采用辅助化疗的整体生存风险更高的首选除辅助化疗之外的其它辅助治疗方案;不接受辅助化疗整体生存风险更高的应该首选辅助化疗。两部分检测内容可供医生与病人选择,也可同时检测,相互验证,为提供更准确的制定治疗方案的依据。对于术后正在进行辅助化疗或者还未进行辅助化疗的病人,整体生存风险的评估提供改善与优化现有治疗方案的工具。
98.在本技术的一些实施方式中,试剂检测生物标志物的mrna表达水平。
99.在本技术的一些实施方式中,ai为生物标志物的表达水平,bi为生物标志物的设定权重,n为标志物的个数,n≤n。
100.在本技术的一些实施方式中,ai为生物标志物的表达水平,bi为生物标志物的设定权重,n为标志物的个数,n≤n1,标志物选自dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1。
101.在本技术的一些实施方式中,ai为标志物的表达水平,bi为标志物的设定权重,n为标志物的个数,n≤n2,标志物选自brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2。
102.在本技术的一些实施方式中,当评分高于设定值时,指示肺癌患者具有较高的整体生存风险。其中,设定值至少可以是基于具体的评分公式,能够有效区分整体生存风险高和整体生存风险低的肺癌患者的设定阈值。例如,在高于该设定值和低于该设定值的两组患者中,对于整体生存的风险具有显著差异,当高于该设定值时,患者的整体生存风险较高;当低于设定值时,患者的整体生存风险较低。上述设定值可以理解为截断值(cutoff value),即阳性与阴性的边界值,在本方案中即是整体生存高或低的边界值。可以理解的是,在一些具体实施方式中,并无一般的设定值/截断值,因而在实施时有必要通过预实验等方法事先确定设定值/截断值后再进行。设定值/截断值的确定可以采用本领域的常规技术手段,例如通过比较不同设定值/截断值条件下预实验样本的准确率(如检出率、检准率、假阳性率、假阴性率、灵敏度、特异性等),根据检测效果上调或者下调截断值,直至达到较佳或最佳的检测效果。可以理解的是,预实验样本可以通过具体的样本中提取检测以获得,或者从相关数据库中获取符合标准的样本。
103.在本技术的一些实施方式中,在标志物的评分高于设定值例如0.1倍、0.2倍、0.3倍、0.4倍、0.5倍、1倍、1.5倍、2倍、2.5倍、3倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍以上,指示其具有较高的整体生存风险。
104.可以理解的是,由于有表征不同情况下整体生存的两组标志物,因此对应的评分也可以对两个设定值进行归一化后考虑两者评分的绝对值大小,或者直接考虑评分与各自设定值的相对大小,根据大小比较结果确定选择化疗或者是考虑选择化疗以外的辅助治疗方式。
105.在本技术的一些实施方式中,评分=2.326
×
dhrs7c+0.7183
×
sdhaf2+0.6346
×
apoa5+0.4697
×
spaca3+0.4183
×
b9d1+0.3881
×
itpk1+0.326
×
odaph+0.3194
×
fscn2+0.3154
×
rrm1+0.306
×
prok1+0.2751
×
dgki+0.245
×
s100a4+0.2176
×
apol6+0.212
×
sell+0.1764
×
slc28a2+0.1515
×
gpr37+0.1037
×
bcorp1+0.073
×
fstl4-0.1405
×
spink1,公式中标志物的缩写表示对应标志物的标准化后的表达水平。
106.在本技术的一些实施方式中,评分=0.5681
×
brca2+0.4144
×
ankar+0.4098
×
pspn+0.3722
×
galk1+0.3608
×
rbm10+0.3444
×
gdpd5+0.3359
×
calr+0.3221
×
pdia3+0.3217
×
recql5+0.3084
×
g6pc2+0.2514
×
slc29a3+0.2337
×
fat1+0.2218
×
dnajb6+0.2152
×
ptprd+0.2144
×
mfsd4b+0.194
×
ezr+0.1917
×
iqcd+0.1813
×
ripply2+0.1717
×
il26+0.1599
×
pax1+0.1139
×
hmox1+0.1058
×
ndrg1+0.0548
×
klk12-0.1377
×
tnfrsf19-0.1965
×
ddr2-0.3165
×
tsc1-0.3343
×
fancc-0.4581
×
rad51c-0.5573
×
rac1-0.7051
×
elac2,公式中标志物的缩写表示对应生物标志物的标准化后的表达水平。
107.在本技术的一些实施方式中,标准化的表达水平为先后经过样本标准化和基因标准化后的表达水平。
108.本技术的第五方面,提供一种设备,该设备包括处理器和存储器,存储器上存储有
可在处理器上运行的计算机程序,处理器在运行计算机程序时实现以下操作:
109.步骤1:获取来自肺癌患者样本中的标志物的表达水平的信息,标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n个,n任选自1~49的正整数;
110.步骤2:对表达水平进行数学关联以获得评分;评分用于指示肺癌患者的整体生存风险。
111.在本技术的一些实施方式中,步骤1中标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少n1个,n1任选自1~19的正整数。
112.在本技术的一些实施方式中,步骤1中标志物包括brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n2个,n2任选自1~30的正整数。
113.在本技术的一些实施方式中,步骤2中对表达水平进行数学关联以获得评分包括对dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少一种的表达水平进行数学关联获得一种整体生存评分,对brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少一种的表达水平进行数学关联获得另一整体生存评分,根据两种整体生存评分比较肺癌患者采取辅助化疗和不采取辅助化疗的整体生存的差异。可以理解的是,可以根据两者的差异确定是否采取辅助化疗。
114.在本技术的一些实施方式中,ai为标志物的表达水平,bi为标志物的设定权重,n为标志物的个数,n≤n。
115.在本技术的一些实施方式中,评分=2.326
×
dhrs7c+0.7183
×
sdhaf2+0.6346
×
apoa5+0.4697
×
spaca3+0.4183
×
b9d1+0.3881
×
itpk1+0.326
×
odaph+0.3194
×
fscn2+0.3154
×
rrm1+0.306
×
prok1+0.2751
×
dgki+0.245
×
s100a4+0.2176
×
apol6+0.212
×
sell+0.1764
×
slc28a2+0.1515
×
gpr37+0.1037
×
bcorp1+0.073
×
fstl4-0.1405
×
spink1,公式中标志物的缩写表示对应标志物的表达水平。
116.在本技术的一些实施方式中,评分=0.5681
×
brca2+0.4144
×
ankar+0.4098
×
pspn+0.3722
×
galk1+0.3608
×
rbm10+0.3444
×
gdpd5+0.3359
×
calr+0.3221
×
pdia3+0.3217
×
recql5+0.3084
×
g6pc2+0.2514
×
slc29a3+0.2337
×
fat1+0.2218
×
dnajb6+0.2152
×
ptprd+0.2144
×
mfsd4b+0.194
×
ezr+0.1917
×
iqcd+0.1813
×
ripply2+0.1717
×
il26+0.1599
×
pax1+0.1139
×
hmox1+0.1058
×
ndrg1+0.0548
×
klk12-0.1377
×
tnfrsf19-0.1965
×
ddr2-0.3165
×
tsc1-0.3343
×
fancc-0.4581
×
rad51c-0.5573
×
rac1-0.7051
×
elac2,公式中标志物的缩写表示对应生物标志物的标准化后的表达水平。
117.其中,存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如本技术实施方式中描述的针对肺癌患者整体生存进行评估的过程。处理器通过运行存储在存储器中的非暂态软件程序以及指令,从而实现肺癌患者整体生存的评价。
118.存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述计算机程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,比如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。
119.在本技术的一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
120.实现上述评估所需的非暂态软件程序以及指令存储在存储器中,当被一个或者多个处理器执行时,执行上述上述评价。
121.以上所描述的装置实施仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
122.可以理解的是,上文中所公开的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。可以理解的是,计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。
123.此外,可以理解的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
124.本技术的第六方面,提供一种肺癌患者整体生存评估装置,该肺癌患者整体生存评估装置包括:
125.获取模块,用于获取来自肺癌患者的样本中标志物的表达水平的信息,标志物包括dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少n个,n任选自1~49的正整数;
126.评分模块,用于对表达水平进行数学关联以获得评分,评分用于指示肺癌患者的整体生存风险。
127.在本技术的一些实施方式中,评分模块对表达水平进行数学关联以获得评分包括对dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1中的至少一种的表达水平进行数学关联获得一种整体生存评分,对brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2中的至少一种的表达水平进行数学关联获得另一整体生存评分,根据两种整体生存评分比较肺癌患者采取辅助化疗和不采取辅助化疗的整体生存的差异。可以理解的是,可以根据两者的差异确定是否采取辅助化疗。
128.需要说明的是,在本技术实施例中,并不仅限于全部49个生物标志物的模型,或者全部19个生物标志物的模型,或者全部30个生物标志物的模型,从全部49个、全部19个或全部30个标志物中选择若干个标志物同样能够构建得到评价整体生存的其它模型。
129.与现有的临床诊断肺癌整体生存的影像学方法相比,本技术实施例所利用的标志物或其组合在评价肺癌整体生存时没有时间滞后性,可以在肺癌手术后立刻评估其整体生存的风险,且能够对是否采取辅助化疗分别进行评估,为医生及病人选择治疗方案提供依据,另一方面,对于术后没有进行整体生存评估但已经进行了治疗的病人,也可以评估整体生存,不必等待整体生存已经成形通过影像学来诊断。
130.基于上述两组基因的集合中的一个或多个作为生物标志物分别构建线性模型,从而分别计算在有辅助化疗或者无辅助化疗情形下的两种肺癌整体生存分数。根据两种整体生存分数可以对病人实施个人化治疗方案:辅助化疗整体生存分数高的应该首选非辅助化疗的其它治疗方案;无辅助化疗整体生存分数高的应该首选辅助化疗。可以理解的是,两种肺癌整体生存分数在相互比较时应当基于相同或接近的标准,例如可以将两者通过设定的方式进行标准化等变换后再进行比较其绝对大小,或者可以直接比较两种分数与各自对应的门槛值的相对大小,诸如此类。
131.本技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
132.图1是本技术的实施例中nchemo的数据在聚类时的4组基因的韦恩图。
133.图2是本技术的实施例中nchemo的模型交叉验证的重复20次的auc最大值、中值和最小值对应的roc曲线。
134.图3是本技术的实施例中nchemo的模型在全部样本中验证的roc曲线。
135.图4是本技术的实施例中chemo的模型交叉验证的重复20次的auc最大值、中值和最小值对应的roc曲线。
136.图5是本技术的实施例中chemo的模型在全部样本中验证的roc曲线。
137.图6是本技术的实施例中nchemo的模型中的23个正权重基因的单标志物的roc曲线。
138.图7是本技术的实施例中nchemo的模型中的7个负权重基因的单标志物的roc曲线。
chemotherapy)表示;
154.无辅助化疗人群(nchemo):指从没有接受辅助化疗或者计划不接受辅助化疗的手术后肺癌病人,用nchemo(none adjuvant chemotherapy)表示。
155.一、数据集准备
156.1.原始数据取自cai l,et.al.重新整理的美国基因表达综合数据库(geo)及癌症基因组图谱(tcga)数据库,合并成综合数据集。为扩大共同基因个数,只选取基因数大于18000的数据集,共10个,得到1941例肺癌组织切片的共同基因转录组数据,剔除表达极低的基因转录(其表达非零的样本个数不超过10个)后,共同基因数为17062。
157.2.对每个数据集进行数据标准化,分两步对样本及基因分别进行:
158.(1)对每个样本进行标准化:对每个样本分别计算其所有基因表达量的中位数,然后以该样本的各个基因的原始表达量减去该样本的所有基因表达量的中位数,得到该样本的各个基因的一次标准化后的表达量,通过这种标准化方式去除了样本mrna输入量的差异,把样本基因中值调至同一水平;
159.(2)对每个基因进行标准化:以第(1)步中一次标准化后的基因表达数据为基础,进一步对每个基因分别计算其在所有样本中的表达量的中位数,然后将各个样本的该基因的一次标准化后的表达量减去该基因在所有样本表达量的中位数,得到该基因在各个样本中的二次标准化后的表达量。
160.把上述10个标准化后的数据集组装为一个综合基因基因表达矩阵,行代表1941个样本,列代表17062个基因变量,包括样本及病人信息(病人年龄、性别等基本信息)、肺癌病理分型、驱动基因(如alk、egfr、kras、tp53)的突变状态、整体生存(os)指标及时长临床预后信息等等。
161.二、标志物筛选及建模
162.从综合基因表达矩阵中抽取出辅助化疗(adjuvant chemotherapy)标记非空及整体生存(os)标记非空的样本,共得到512例,分别来自数据集gse31210(204例)、tcga-luad(154例)、tcga-lusc(154例)。
163.其中辅助化疗组chemo含88例,无辅助化疗组nchemo有412例,chemo组整体生存率23.86%,nchemo组整体生存率21.36%,两组整体生存t-检验p值为0.53,显示两组病人整体生存率无统计意义区别。两组人群分别进行基本信息如年龄,性别,及临床病理如病理分期(stage),tnm分级等针对生存与死亡的对比分析,其结果见表1。
164.其中m分级因为样本数不足而省去。在两组人群中,生存与死亡组的年龄、性别均无统计意义差异;此外,化疗组中癌症分期、tnm分级的t与n、及平均生存期均无统计意义区别,但是在无化疗组中,生存组平均寿命比死亡组多九个月(p=0.02),tnm分级的t与n均有统计意义区别。
165.此外,需要说明的是,上述的88例患者所接受的辅助化疗的方案并不完全相同,经统计这些辅助化疗方案涵盖了包括多种不同的药物在内所组成的多种化疗方案,包括顺铂、卡铂,或者顺铂、卡铂分别联合多西紫杉醇、吉西他滨、紫杉醇、培美曲塞或长春瑞滨等,而其中的每一例患者都接受了其中至少一种化疗方案,因此,可以以此体现对整体辅助化疗的整体生存程度。
166.表1.nchemo和chemo组病人特征对于整体生存率的t-检验结果
[0167][0168]
根据以上结果,可以针对是否进行辅助化疗的情形分别建立肺癌整体生存评估模型,从而可以评估肺癌病人术后进行不同治疗方案(是否辅助化疗)的整体生存风险的高低,从而选择合适的治疗手段,延长患者的生存期,降低整体生存。
[0169]
使用上述数据集中nchemo及chemo分组的相关数据建立模型,分别以每个数据集为训练数据,以整体生存指标(os)为目标变量进行模型的构建:
[0170]
1.确定和整体生存相关的基因。利用t-检验(t-test),寻找能够区分目标变量不同人群(os=0,死亡vs os=1,生存)的有统计意义(p《0.05)的基因,初步得到差异表达的基因。
[0171]
2.对基因进行上调或下调分组。差异表达基因分为两组,t-检验结果中t为正数的代表表达在病人组织中下调的基因;t为负数的代表表达在病人组织中上调的基因。分别对两组基因进行分层关联系数分析。
[0172]
3.分层关联系数分析。对表达上调或下调的基因组,分别进行分层关联系数聚类,其目的是在给定的关联系数水平区间内,每一聚类中的基因需要大致两两相互关联,每个聚类中选取与该聚类中其它基因平均关联度最大的作为代表,所有聚类的达标基因构成标志物模型的候选基因。由于关联系数聚类需要对正相关与负相关的情形分别进行处理,因此,出现以下4种组合:
[0173]
pp:对下调基因组(t》0)进行正相关聚类;
[0174]
pn:对下调基因组(t》0)进行负相关聚类;
[0175]
np:对上调基因组(t《0)进行正相关聚类;
[0176]
nn:对上调基因组(t》0)进行负相关聚类。
[0177]
合并4个候选基因组得到最终的模型候选基因组。图1即为其中nchemo的4组基因的韦恩图。
[0178]
4.迭代线性回归分析确定基因组。对表达上调或下调的基因组,在分层关联系数分析中,预先给定作为模型参变量的基因个数(s),进行迭代线性回归分析。再循环不同的s值,寻找最优的模型参变量个数,由对应的r平方值(rsq)的最大值确定,从而得到最优模型。
[0179]
5.预先选取与癌症相关的基因突变图谱上的基因,共741个,重复步骤4,得到最优模型;
[0180]
6.综合4和5的基因,再次重复4,得到最后的模型。
[0181]
建模完成后进行交叉验证:把数据集按照目标变量的人群平分,一半为训练集,另一半为验证集,计算roc及auc,如此重复n(=20)次。并计算auc的统计特征,如最小值、最大值、中值。
[0182]
最终的无辅助化疗情形下nchemo对应的整体生存模型为30个标志物所构成的模型:brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2。
[0183]
该模型中各个基因的参数如下表2所示:
[0184]
表2.30标志物线性回归模型中各个基因的相关参数
[0185][0186]
因而计算无辅助化疗情形下肺癌整体生存的公式评分=0.5681
×
brca2+0.4144
×
ankar+0.4098
×
pspn+0.3722
×
galk1+0.3608
×
rbm10+0.3444
×
gdpd5+0.3359
×
calr+
0.3221
×
pdia3+0.3217
×
recql5+0.3084
×
g6pc2+0.2514
×
slc29a3+0.2337
×
fat1+0.2218
×
dnajb6+0.2152
×
ptprd+0.2144
×
mfsd4b+0.194
×
ezr+0.1917
×
iqcd+0.1813
×
ripply2+0.1717
×
il26+0.1599
×
pax1+0.1139
×
hmox1+0.1058
×
ndrg1+0.0548
×
klk12-0.1377
×
tnfrsf19-0.1965
×
ddr2-0.3165
×
tsc1-0.3343
×
fancc-0.4581
×
rad51c-0.5573
×
rac1-0.7051
×
elac2,公式中标志物的缩写表示对应标志物的表达水平的标准化的值。
[0187]
30标志物回归模型在选择一半病例为训练集,另一半病例为验证集,交叉验证过程中重复20次的auc值的最大值、中值、最小值对应的roc曲线如图2所示,依次为0.88、0.83、0.77。
[0188]
根据建立的30标志物回归模型对上述的nchemo全体样本绘制roc曲线,评估模型对于患者整体生存风险的评估能力,结果如图3所示。auc为0.931,roc曲线上最优的决策点(如虚线所示)对应的特异性(1-假阳性率)为84%,敏感性为90%。
[0189]
最终的辅助化疗情形下chemo对应的整体生存模型为19个标志物所构成的模型:dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4和spink1。
[0190]
该模型中各个基因的参数如下表3所示:
[0191]
表3.19标志物线性回归模型中各个基因的相关参数
[0192][0193]
因而计算辅助化疗情形下肺癌整体生存的公式评分=2.326
×
dhrs7c+0.7183
×
sdhaf2+0.6346
×
apoa5+0.4697
×
spaca3+0.4183
×
b9d1+0.3881
×
itpk1+0.326
×
odaph+0.3194
×
fscn2+0.3154
×
rrm1+0.306
×
prok1+0.2751
×
dgki+0.245
×
s100a4+0.2176
×
apol6+0.212
×
sell+0.1764
×
slc28a2+0.1515
×
gpr37+0.1037
×
bcorp1+0.073
×
fstl4-0.1405
×
spink1,公式中标志物的缩写表示对应生物标志物的表达水平的标准化的值。
[0194]
19标志物回归模型在选择一半病例为训练集,另一半病例为验证集,交叉验证过
程中重复20次的auc值的最大值、中值、最小值对应的roc曲线如图4所示,依次为0.92、0.64、0.50。
[0195]
根据建立的19标志物回归模型对上述的chemo全体样本绘制roc曲线,评估模型对于患者整体生存风险的评估能力,结果如图5所示。auc为0.9993,roc曲线上最优的决策点(如虚线所示)对应的特异性(1-假阳性率)为99%,敏感性为100%。
[0196]
对于上述构建得到的针对nchemo的评估模型,30个基因的组合中采用单一基因作为标志物的roc曲线分别如图6~7所示,单基因表达量的直方图如图10~11所示;针对chemo的评估模型,19个基因的组合中采用单一基因作为标志物的roc曲线分别如图8~9所示,单基因表达量的直方图如图12~13所示。
[0197]
对于chemo模型和nchemo模型中的多个基因,在标志物中随机选k(2,3
……n1-1/n
2-1)个基因,按照前述方法重建模型并进行交叉验证,nchemo子模型交叉验证的最小、中值、最大auc见表4。chemo模型的子模型交叉验证的最小、中值、最大auc见表5。
[0198]
表4.nchemo子模型交叉验证结果
[0199]
[0200]
[0201][0202]
表5.chemo子模型交叉验证结果
[0203]
[0204][0205]
从上述表中数据可以看出,选择上述30个基因集合或19个基因集合中的2个或更多个基因组成的子集重新构建的模型同样具有较好的诊断价值,诊断价值总体上看随着基因数的增加而增加,因此也可以从上述筛选出的30个基因集合或19个基因集合中任选多个基因作为评价肺癌患者整体生存的指标,且越接近全部数量的基因,其诊断准确率可能越高。
[0206]
生存分析
[0207]
通过上述模型参数计算出整体生存分数(0-生存,1-死亡),分别对两组人群进行cox生存分析。
[0208]
nchemo组的k-m曲线如图14所示,取整体生存分数的门槛值t=0.4362,大于t为死亡高风险,反之为低风险。高,低风险人群三年生存率分别为50%,90%;五年生存率分别为15%,80%;十年生存率分别为4%,80%。由此可见,无化疗整体生存分数对于不接受辅助化疗的肺癌患者有极其重要的预后价值。
[0209]
chemo组的k-m曲线如图15所示,取整体生存分数门槛值t=0.5065,大于t的为死亡高风险,反之为低风险。高,低风险人群三年生存率分别为40%,90%;五年生存率分别为30%,80%;十年生存率分别为5%,70%。由此可见,化疗组整体生存分数对接受辅助化疗的肺癌患者同样有极其重要的预后价值。
[0210]
实施例2:
[0211]
本实施例提供一种用于评价肺癌患者的整体生存的试剂盒,该试剂盒包括能够定量检测以下49个基因的mrna水平的试剂:dhrs7c、sdhaf2、apoa5、spaca3、b9d1、itpk1、odaph、fscn2、rrm1、prok1、dgki、s100a4、apol6、sell、slc28a2、gpr37、bcorp1、fstl4、spink1、brca2、ankar、pspn、galk1、rbm10、gdpd5、calr、pdia3、recql5、g6pc2、slc29a3、fat1、dnajb6、ptprd、mfsd4b、ezr、iqcd、ripply2、il26、pax1、hmox1、ndrg1、klk12、tnfrsf19、ddr2、tsc1、fancc、rad51c、rac1和elac2,该试剂包括逆转录酶、引物、taq酶、荧光染料等。
[0212]
实施例3
[0213]
本实施例提供一种对肺癌患者的整体生存进行评估的设备,该设备包括处理器和存储器,存储器上存储有可被处理器运行的计算机程序。运用该设备对肺癌患者的整体生存的评估的方法如下:
[0214]
1.选择肺癌患者的术后的组织切片样本提取mrna。
[0215]
2.将提取到的mrna送入检测装置,获取以下25+9个基因:ankar、brca2、ddr2、elac2、ezr、fat1、g6pc2、galk1、gdpd5、hmox1、il26、iqcd、klk12、ndrg1、pax1、pdia3、pspn、ptprd、rac1、rad51c、recql5、ripply2、slc29a3、tnfrsf19、tsc1、apoa5、gpr37、itpk1、odaph、prok1、rrm1、s100a4、sdhaf2、spink1的定量表达水平的信息ai。
[0216]
3.根据评分公式分别对前25个基因和后9个基因的表达水平代入计算出整体生存分数;其中bi的设定权重值为实施例1中前25个基因和后9个基因构建的对应模型的权重或按照实施例1中的方法重新建模设置权重,并设置各自的门槛值把受试者的整体生存分数分成不同风险人群。比较两个模型评估出的整体生存,若nchemo模型计算出的分数相对于对应的门槛值更高,则选择辅助化疗;如果chemo模型计算出的分数相对于对应的门槛值更高,则选择其它的辅助治疗方式。
[0217]
实施例4
[0218]
本实施例提供一种对肺癌患者的整体生存进行评估的设备,其采用用于液体活检的离心式微流控芯片进行检测,该离心式微流控芯片设有至少27+12个检测槽,通过液体活检的方式进行检测,滴入的血液样本通过离心的方式经结合、洗涤、洗脱等流程进入检测槽与其中的试剂反应,通过荧光获取标志物的定量表达水平的信息,标志物包括以下27+12个基因:ankar、brca2、calr、ddr2、dnajb6、elac2、ezr、fancc、fat1、g6pc2、galk1、il26、iqcd、klk12、mfsd4b、ndrg1、pax1、pdia3、pspn、rac1、rad51c、rbm10、recql5、ripply2、slc29a3、tnfrsf19、tsc1及apol6、dgki、fscn2、fstl4、gpr37、odaph、prok1、rrm1、sell、slc28a2、spaca3、spink1。
[0219]
上面结合实施例对本技术作了详细说明,但是本技术不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本技术宗旨的前提下作出各种变化。此外,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1