基因群作为共预后因子在肾癌预后检测中的应用的制作方法

文档序号:26790028发布日期:2021-09-28 23:03阅读:122来源:国知局
基因群作为共预后因子在肾癌预后检测中的应用的制作方法

1.本发明涉及疾病诊断领域,更具体地,本发明涉及基因群作为共预后因子在 肾癌预后检测中的应用。


背景技术:

2.肾癌(renal cell carcinoma,rcc)是泌尿系统最常见的恶性肿瘤之一,根据 组织学分型,肾癌分为多种亚型,其中肾透明细胞癌(clear cell renal cellcarcinoma,ccrcc)是肾癌的主要亚型,约占肾癌的75

80%(pavlovich cp,schmidtls,phillips jl.the genetic basis of renal cell carcinoma[j].urol clin north am, 2003,30(3):437

54,vii.),其他类型包括乳头状癌、嫌色细胞癌、bellini管(集合 管)癌等。肾透明细胞癌患者具有最高的死亡率和转移率,2018年全球约400,000 例肾透明细胞癌新发病例,并有175,000例死亡病例(lindenberg l,mena e, choyke pl,et al.pet imaging in renal cancer[j].curr opinoncol,2019,31(3):216

221.)。治疗肾透明细胞癌的最主要的方式是手术切除,但 是接受切除治疗的患者术后复发率高达40%以上(rossi sh,klatte t,usher

smithj,et al.epidemiology and screening for renal cancer[j].world j urol, 2018,36(9):1341

1353.)。肾透明细胞癌早期无明显特征,且缺乏有效的诊断方法 和早期预警信号,约30%的患者初次就诊时癌症已经发生了远期转移,5年生存 率由90%下降到12%(campbell s,uzzo rg,allaf me,et al.renal mass andlocalized renal cancer:aua guideline[j].j urol,2017,198(3):520

529.),对于这 些转移的晚期患者手术切除治疗难以满足治疗需要,且大部分肾透明细胞癌对放 疗和化疗也不敏感,仅靠手术切除和放射治疗等传统方式难以取得良好的治疗效 果。
[0003]
肿瘤免疫疗法是继手术治疗、化疗、放疗、靶向治疗后的一种创新的癌症治 疗方法,其作用机制是通过激活体内的免疫细胞增强机体抗肿瘤免疫应答,特异 性地清除肿瘤微小残留病灶、抑制肿瘤生长,打破免疫耐受,达到控制和杀伤肿 瘤细胞的目的。传统的癌症治疗方法除了杀伤肿瘤细胞外,对机体的正常组织细 胞也会造成不必要的损害,影响患者的身体状况,且治疗效果也难以保证。随着 分子生物学、医学免疫学等学科的发展,肿瘤免疫治疗越来越成熟,已在黑色素 瘤、急性淋巴性白血病、肺癌等恶性肿瘤的治疗中取得了重大突破(cuevas lm, daud ai.immunotherapy for melanoma[j].semin cutan medsurg,2018,37(2):127

131.),肿瘤免疫疗法疗效较高、安全性强,与传统的癌症治 疗方法联合应用,可以提高手术、放疗和化疗的治疗效果及肿瘤患者的生存期, 显著改善患者的生活质量,为肿瘤患者带来新的希望。
[0004]
肾癌是一种免疫原性较强的肿瘤,免疫原性使肾癌的免疫治疗前景广阔。虽 然免疫疗法在肾癌的治疗中已经取得了很大的进步,但并不是所有患者都可以从 中获益,存在部分患者对免疫检查点抑制剂治疗不响应,少部分患者应用药后不 久发生耐药,以及存在免疫相关的毒性等问题(nowicki ts,hu

lieskovan s, ribas a.mechanisms of resistance to pd

1 and pd

l1 blockade[j].cancer j, 2018,24(1):47

53.)。因此需
要开发新的有效的免疫治疗靶点,通过联合治疗等方 式增加疗效,减少副作用。随着下一代测序对肾癌基因组合免疫微环境的日益了 解,可以从肾癌基因组特征出发指导治疗选择,从而朝着精密医学发展,因此迫 切需要更好地了解该疾病地分子机制、免疫微环境,并且识别更好的预后生物标 志物和预测模型。


技术实现要素:

[0005]
本发明的目的是提供用于肾癌预后的生物标志物群、诊断产品、装置和设备。
[0006]
为了实现上述目的,本发明第一方面提供了一种用于肾癌预后的生物标志物 群,所述生物标志物群包括ar、il20rb、rnase2、rora和/或slc11a1。
[0007]
本发明第二方面提供了检测样本中本发明第一方面所述的生物标志物群的 试剂在制备肾癌预后的诊断产品中的应用。
[0008]
进一步,所述试剂包括通过数字成像技术、蛋白免疫技术、染料技术、核酸 测序技术、核酸杂交技术、色谱技术、质谱技术检测样本中生物标志物表达水平 的试剂。
[0009]
进一步,所述样本选自下组:外周血样本、血清样本、血浆样本、尿样本、 唾液样本和组织样本。
[0010]
本发明的第三方面提供了一种肾癌预后的诊断产品,所述诊断产品包括检测 本发明第一方面所述的生物标志物群的试剂。
[0011]
进一步,所述诊断产品包括芯片、试剂盒。
[0012]
进一步,所述试剂包括检测所述生物标志物群基因转录的rna的量的试剂。
[0013]
进一步,所述试剂为检测所述生物标志物群转录的mrna的量的试剂。
[0014]
进一步,所述试剂为检测与所述基因转录的mrna互补的cdna的量的试 剂。
[0015]
进一步,所述试剂包括探针或引物。
[0016]
进一步,所述诊断产品还包括总rna抽提试剂、逆转录试剂和/或二代测序 试剂。
[0017]
进一步,所述试剂为检测所述生物标志物群基因编码的多肽/蛋白的量的试 剂。
[0018]
进一步,所述试剂为抗体、抗体片段或者亲和性蛋白。
[0019]
本发明第四方面提供了一种肾癌生存期预测装置,包括:
[0020]
数据获取模块,用于获取待测癌症患者的本发明第一方面所述的生物标志物 群基因表达谱数据;
[0021]
预测模块,用于将所述基因表达谱数据作为输入提供给训练好的预测模型, 所述预测模型被训练基于癌症患者的基因表达谱数据而对所述癌症患者的生存 期进行预测;
[0022]
预测结果获取模块,用于获取所述预测模型的输出,得到待测癌症患者的生 存期预测结果。
[0023]
进一步,所述预测模型为cox回归模型。
[0024]
进一步,所述cox回归模型为lasso cox回归模型。
[0025]
进一步,所述预测模型的公式为其中,n为用 于预测预后的基因数,expi为每个基因的表达水平,ci为每个基因的回归系数; 当风险评分较高时,患者预后不良;当风险评分较低时,患者预后良好。
[0026]
进一步,所述基因为ar、il20rb、rnase2、rora和slc11a1。
[0027]
进一步,所述c1、c2、c3、c4、c5分别为

0.4808、0.1081、0.0786、

0.2433、 0.4719。
[0028]
本发明第五方面提供了一种计算机设备,包括存储器和处理器,所述存储器 存储有程序,所述处理器执行所述程序时实现如下方法:
[0029]
获取待测癌症患者的本发明第一方面所述的生物标志物群基因表达谱数据;
[0030]
将所述基因表达谱数据作为输入提供给训练好的预测模型;
[0031]
输出待测癌症患者的生存期预测结果。
[0032]
进一步,所述预测模型为cox回归模型。
[0033]
进一步,所述cox回归模型为lasso cox回归模型。
[0034]
进一步,所述预测模型的公式为其中,n为用 于预测预后的基因数,expi为每个基因的表达水平,ci为每个基因的回归系数, 当风险评分较高时,患者预后不良;当风险评分较低时,患者预后良好。
[0035]
进一步,所述基因为ar、il20rb、rnase2、rora和slc11a1。
[0036]
进一步,所述c1、c2、c3、c4、c5分别为

0.4808、0.1081、0.0786、

0.2433、 0.4719。
[0037]
本发明第六方面提供了一种计算机可读存储介质,其上存储有程序,所述程 序被执行时实现如下方法:
[0038]
获取待测癌症患者的本发明第一方面所述的生物标志物群基因表达谱数据;
[0039]
将所述基因表达谱数据作为输入提供给训练好的预测模型;
[0040]
输出待测癌症患者的生存期预测结果。
[0041]
进一步,所述预测模型为cox回归模型。
[0042]
进一步,所述cox回归模型为lasso cox回归模型。
[0043]
进一步,所述预测模型的公式为其中,n为 用于预测预后的基因数,expi为每个基因的表达水平,ci为每个基因的回归系 数;所述基因为ar、il20rb、rnase2、rora和slc11a1。
[0044]
进一步,所述c1、c2、c3、c4、c5分别为

0.4808、0.1081、0.0786、

0.2433、 0.4719。
[0045]
本发明的优点和有益效果:
[0046]
本发明选择包括ar、il20rb、rnase2、rora和/或slc11a1作为生物 标志物,可以有效预测肾癌患者的预后,进而实现早干预早治疗。
附图说明
[0047]
图1是训练集中ar、il20rb、rnase2、rora和slc11a1联合预测肺腺癌预后 的生存曲线图;
[0048]
图2是验证集中ar、il20rb、rnase2、rora和slc11a1联合预测肺腺癌预后 的生存曲线图;
[0049]
图3是训练集中ar、il20rb、rnase2、rora和slc11a1联合预测肺腺癌预后 的roc曲线图;
[0050]
图4是验证集中ar、il20rb、rnase2、rora和slc11a1联合预测肺腺癌预后 的roc曲线图。
具体实施方式
[0051]
本发明部分地提供了试剂盒、基因特征和检测此类基因特征/生物标志物以 执行
对肾癌组织样本分析的方法,在一方面,本发明提供了与肾癌生存期相关的 基因特征,该基因特征能对个体的不良预后的风险进行分类,有助于指导医生选 择治疗策略。
[0052]
在本文中使用的“和/或”应被视对在具有或不具有另一者的情况下两种指 定特征或组分中的每一种的具体公开。例如,“a和/或b”将被视为(i)a、 (ii)b、以及(iii)a和b中的每一种的具体公开,就像每一种在本文中单独 列出一样。
[0053]
如本文所用,术语“生物标志物”、“标志物”和“基因特征”是可互换的, 并且是指与取自对照受试者,例如患有不良预后的肾癌的受试者的可比较样本相 比,在取自患有良好预后的肾癌的受试者的样本中差异存在的分子。因此,本发 明的生物标志物提供有关肾癌的可能病程的信息,并与肾癌的预后相关联。
[0054]
术语“生物标志物”是指上述任何单个生物标志物,优选地ar、il20rb、 rnase2、rora或slc11a1,或其任何生物标志物组合。
[0055]
在一些实施方式中,基因特征能对个体的预后进行分类。如本文所使用的, 预后是指对医疗转归的预测,并且可以基于诸如总生存率、肾癌特异性生存率、 无复现(recurrence)生存率、无复发(relapse)生存率和无远端复发生存率的度量, 进而用于确定治疗或诊断工作时间表。
[0056]
在一些实施方式中,如本领域技术人员所理解的,当肾癌预后基因特征由上 述基因组成时,用于执行分析的方法可包括测量其它基因的表达(例如,用于归 一化),但仅使用基因特征来分类个体。
[0057]
ar基因:androgen receptor,以gene id:367在ncbi数据库中可以找到典 型的智人mrna和蛋白序列。
[0058]
il20rb基因:interleukin 20receptor subunit beta,以gene id:53833在ncbi 数据库中可以找到典型的智人mrna和蛋白序列。
[0059]
rnase2基因:ribonuclease a family member 2,以gene id:6036在ncbi 数据库中可以找到典型的智人mrna和蛋白序列
[0060]
rora基因:rar related orphan receptor a,以gene id:6095在ncbi数据 库中可以找到典型的智人mrna和蛋白序列。
[0061]
slc11a1基因:solute carrier family 11member 1,以gene id:6556在ncbi 数据库中可以找到典型的智人mrna和蛋白序列。
[0062]
样本
[0063]
本文中使用的“样本”可以是指生物学样本,通常是临床样本,并且包括 例如血液和其他体液,包括但不限于外周血、血清、血浆、尿液和唾液;以及实 体组织样本,例如活检标本,尤其是那些包含癌细胞的样本。在某些实施方案中, 血液样本如血清或血浆样本是要用于本方法中的最优选的样本类型。通常,从受 试者获得要分析的样本不是本发明预后方法的一部分。
[0064]
术语“样本”还包括在购买后以任何适当方式已经操作或处理过的样本,包 括但不限于离心、过滤、沉淀、透析、色谱、用试剂处理、洗涤或富集样本的某 种组分,例如细胞群。
[0065]
生物标志物
[0066]
本文中使用的“生物标志物”是指以可用于预测个体的癌症状态的不同浓 度存在
于个体中的生物分子。生物标志物可包括,但不限于,核酸、蛋白质及其 变体和片段。生物标志物可以是包含编码该生物标志物的全部或部分核酸序列或 这类序列的互补体的dna。可用于本发明的生物标志物核酸被认为包括包含任 何目的核酸序列的全部或部分序列的dna和rna。
[0067]
基因表达
[0068]
在本文中,术语“水平”在应用于生物标志物时与术语“量”和“浓度”可 互换使用,并且可以指生物标志物的绝对量或相对量。
[0069]
可以通过多种技术确定本发明生物标志物中任何一种的表达水平。特别地, 可以通过使用本领域熟知的方法测量代表所讨论的生物标志物的rna,优选地 mrna或任何其他rna种类的量来确定核酸水平上的表达。合适方法的非限制 性实例包括数字pcr和实时(rt)定量或半定量pcr。适用于这些方法的引物可 由技术人员容易地设计。
[0070]
在实时pcr(qpcr)中,反应的特征是循环过程中首次检测到靶标的扩增的 时间点,而不是经过固定次数的循环后累积的靶标量。首次检测到信号时的这一 点称为阈值周期(ct)。在一些实施方式中,通过从管家基因的平均ct中减去特征 基因的ct来针对管家基因的表达进行标准化,从而相对于彼此量化基因特征的 表达。
[0071]
用于确定任何一种本发明生物标志物在核酸水平上的表达水平的其他合适 技术包括但不限于荧光激活细胞分选(facs)和原位杂交。
[0072]
测量代表所讨论的生物标志物的rna,优选地是mrna或任何其他rna 种类的量的其他非限制性方式包括转录组方法,特别是dna微阵列。通常,当 要确定的是mrna的量时,将测试和对照mrna样本反转录并标记以生成cdna 探针。然后将探针与固定化在固体支持物上的互补核酸的阵列杂交。该阵列配置 为知道该阵列每个成员的序列和位置。标记的探针与特定阵列成员的杂交指示衍 生探针的样本表达该基因。市售微阵列系统的非限制性实例包括affymetrixgenechiptm和illumina beadchip。
[0073]
此外,批量rna测序、单细胞rna测序或cdna测序,例如通过下一代 测序(ngs)方法,也可以用于确定任一种本发明生物标志物的表达水平。
[0074]
可以通过表观遗传分析,例如组蛋白修饰分析,例如通过染色质免疫沉淀然 后测序或定量pcr,或定量dna甲基化水平,例如通过亚硫酸氢盐测序或基于 捕获的方法,在所讨论的生物标志物的基因间调控位点或基因区域上,来确定编 码所讨论的生物标志物的基因的活性调节的变化。
[0075]
对于技术人员显而易见的是,可以采用多种技术来确定蛋白质水平上任何一 种本发明生物标志物的表达水平。合适方法的非限制性实例包括基于质谱的定量 蛋白质组学技术,例如相对和绝对定量试剂的同重异位标签(itraq)和无标记分 析,以及选择反应监测(srm)质谱和靶向蛋白质组学的任何其他技术。而且,蛋 白质标志物的水平或量可以通过例如免疫测定法(例如elisa或)、 western印迹法、分光光度法、酶测定法、紫外线测定法、动力学测定法、电化 学测定法、比色测定法、比浊测定法、原子吸收测定法、流式细胞术、质谱流式 细胞术或其任何组合来确定。其他合适的分析技术包括但不限于液相色谱法,例 如高效/高压液相色谱法(hplc),气相色谱法,核磁共振光谱法,相关技术及其 组合和混合,例如串联液相色谱

质谱(lc

ms)。
[0076]
本文所使用的术语“引物”是指包含5~100个核苷酸的核酸片段,优选地, 包含能
起始酶促反应(如,酶促扩增反应)的15~30个核苷酸。
[0077]
本文所使用的术语“探针”是指包括至少5个核苷酸的核酸序列,比如,包 含5~100个核苷酸,其能在指定条件下与目标基因的表达产物或者该表达产物 的扩增产物杂交形成复合物。杂交探针上还可以包括用于检测的标记物。所述标 记物包括但不限于用于荧光定量pcr或荧光原位杂交的标记物。在一优选方案 中,所述标记物可以为fam、hex、vic、cy5等。在另一优选方案中,所述标 记物可以为生物素、地高辛等。
[0078]
本文所使用的术语“抗体”是本领域众所周知的,是指针对抗原位点的特异 性免疫球蛋白。本发明中的抗体是指与本发明的生物标志物蛋白特异性结合的抗 体,可以根据本领域中的常规方法来制造抗体。抗体的形式包括多克隆抗体或单 克隆抗体、抗体片段(诸如fab、fab'、f(ab')2和fv片段)、单链fv(scfv) 抗体、多特异性抗体(诸如双特异性抗体)、单特异性抗体、单价抗体、嵌合抗 体、人源化抗体、人抗体、包含抗体的抗原结合位点的融合蛋白,以及包含抗原 结合位点的任何其他修饰的免疫球蛋白分子,只要该抗体表现出所需的生物结合 活性。
[0079]
术语“多肽”是指由氨基酸以肽键连接组成的化合物,包括多肽的全长或 氨基酸片段。所述基因编码的多肽的量,可以针对样本中总蛋白的量或管家基因 所编码的多肽的量来标准化。
[0080]
预后
[0081]
如本文所用,术语“预后”是指疾病的可能病程或临床结果,而表述“预期”、
ꢀ“
进行预后”、“确定预后”等是指对肾癌的未来进展的预测。
[0082]
如本文所用,术语“良好预后”和“正向预后”是指与疾病的中位结果或与 具有不良预后的受试者的生存相比,可能在统计学上显著延长的生存,例如延长 的总体生存,延长的无疾病生存,延长的无复发生存或延长的无进展生存。
[0083]
如本文所用,术语“不良预后”是指与具有良好预后的受试者相比,可能在 统计学上显著降低的生存,例如降低的总生存,无疾病生存,无复发生存或无进 展生存。
[0084]
根据本发明,在从要预后肾癌的受试者获得的生物样本中,基于与肾癌预后 相关联的生物标志物的检测水平来进行预后。这还意味着包括其中未最终确定预 后而是需要进一步测试的情况。在这样的实施方案中,该方法本身并不决定受试 者肾癌的预后,而是可以指示需要进一步的测试或将是有益的。因此,本方法可 以与一种或多种其他方法组合以最终确定预后。这类其他方法是本领域技术人员 众所周知的,包括但不限于活组织检查、肿瘤的分子表征,计算机断层扫描、磁 共振成像和正电子发射断层扫描,以及监测癌胚抗原(cea)的水平。可与本发明 组合使用的其他预测标志物包括但不限于肿瘤的分子谱分析、检查肿瘤的染色体 稳定性(微卫星稳定(mss)和微卫星不稳定(msi))。
[0085]
在一些实施方式中,本发明的在患有肾癌的受试者中预后肾癌的方法可以进 一步包括治疗干预。一旦鉴定受试者具有疾病的给定的可能结果,就可以对他/ 她进行适当的治疗干预,例如化学疗法。在这样的实施方式中,本发明还可被构 造为在有此需要的受试者中治疗肾癌的方法,其中方法包括如上所述预后肾癌, 并向所述受试者施用一种或多种合适的化学治疗剂。
[0086]
本发明提供了一种生存期预测装置和计算机设备。如上所述,本领域普通技 术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程 序来指令相
关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读 存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其 中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的 任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读 存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程 rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高 速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、 动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增 强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线 (rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储 器总线动态ram(rdram)等。
[0087]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实 施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的 组合不存在矛盾,都应当认为是本说明书记载的范围。
[0088]
本发明所述的计算机,是广义上的一种能够按照事先设定或存储的指令,自 动进行数值计算和/或信息处理的计算设备,其硬件可以包括至少一个存储器、 至少一个处理器,以及至少一个通信总线。其中,所述通信总线用于实现这些元 件之间的连接通信。处理器可以包括但不限于微处理器。计算机硬件还可以包括 专用集成电路(applicationspecific integrated circuit,asic)、可编程门阵列(field -programmable gatearray,fpga)、数字处理器(digital signal processor,dsp)、 嵌入式设备等。所述计算机还可包括网络设备和/或用户设备。其中,所述网络 设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计 算(cloud computing)的由大量主机或网络服务器构成的云,其中,云计算是分布 式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
[0089]
计算设备可以是,但不限于任何一种可与用户通过键盘、触摸板或声控设备 等方式进行人机交互的个人电脑、服务器等终端。本文中的计算设备还可以包括 移动终端,其可以是,但不限于任何一种可与用户通过键盘、触摸板或声控设备 等方式进行人机交互的电子设备,例如,平板电脑、智能手机、个人数字助理 (personal digital assistant,pda)、智能式穿戴式设备等终端。计算设备所处的网 络包括,但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtual privatenetwork,vpn)等。
[0090]
所述存储器用于存储程序代码。所述存储器可以是集成电路中没有实物形式 的具有存储功能的电路,如ram(random

access memory,随机存取存储器)、 fifo(first infirst out)等。或者,所述存储器也可以是具有实物形式的存储器, 如内存条、tf卡(trans

flash card)、智能媒体卡(smart media card)、安全数字卡 (secure digital card)、快闪存储器卡(flash card)等储存设备等等。
[0091]
所述处理器可以包括一个或者多个微处理器、数字处理器。所述处理器可调 用存储器中存储的程序代码以执行相关的功能。例如,各个模块是存储在所述存 储器中的程序代码,并由所述处理器所执行,以实现上述方法。所述处理器又称 中央处理器(cpu,central processing unit),可以是一块超大规模的集成电路, 是运算核心(core)和控制核心(control unit)。
[0092]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为 一系
列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作 顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次, 本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉 及的动作和模块并不一定是本发明所必须的。
[0093]
以下结合附图对本技术的具体实施方式进行详细说明。应当理解的是,此处 所描述的具体实施方式仅用于说明和解释本技术,并不用于限制本技术。
[0094]
实施例与肾癌预后相关的生物标志物
[0095]
1、数据下载
[0096]
在癌症基因组图谱数据库(tcga)中搜索肾透明细胞癌的公共基因表达数据 和完整的临床注释,排除缺少生存期或者生存期为0的样本,纳入的样本总数为 531例,将样本随机分成371例作为训练集,160例作为验证集。
[0097]
2、数据标准化
[0098]
对于tcga的rna

seq数据使用voom方法进行标准化处理,使用r中的 tidyverse包对基因进行注释,合并去重取平均值,将将基因表达的rna测序数据 (fpkm值)转化为每千碱基百万(tpm)值的转录本。
[0099]
3、筛选免疫相关基因
[0100]
免疫相关基因来自immport数据库(https://www.immport.org/home)。筛选在 immport数据库中与tcga中同时存在的基因。
[0101]
4、单因素cox分析
[0102]
使用r中的survival包、survminer包对训练集与验证集的基因进行单因素cox 分析,筛选在两个数据集中同时与肾癌患者生存相关的基因,p<0.001的基因被 认为是对肾癌患者的生存有影响。
[0103]
5、lasso cox回归分析
[0104]
进行lasso cox回归分析,构建lasso回归模型。使用训练集的数据,利 用r语言中的glmnet包、survival包对训练集数据进行回归分析建模,输出预测模 型的相关系数与riskscore(风险评分),其中,seed设定为2。
[0105]
在验证集中进行验证时利用相同的公式,计算每个样本的风险评分,根据风 险评分的中位数,将所有样本分为高风险组与低风险组,进一步进行生存分析。
[0106]
6、生存曲线分析
[0107]
采用r软件“survival”、“survminer”“ggplot2”包对训练集、验证集的高风 险组和低风险组的肾癌患者进行生存分析并绘制生存曲线,通过log

rank检验进 行组间差异比较。
[0108]
7、roc曲线分析
[0109]
为了评估由预后模型在预测肾癌预后的准确性,采用r软件“survival
”ꢀ“
timeroc”包使用时间依赖性roc曲线检测生物标志物1年、3年、5年的预后 效能,用自助抽样法检测各组roc曲线之间差异的显著性,p<0.05被认为有统计 学差异。
[0110]
8、结果
[0111]
风险评分中的基因单因素cox回归分析结果及lasso系数如表1所示,
[0112]
表1预后相关的基因
[0113][0114]
风险评分 =

0.4808*expar+0.1081*expil20rb+0.0786*exprnase2

0.2433*exprora+0.4 719*expslc11a1。
[0115]
根据风险评分的中位数将肾癌患者分析高风险组(高评分)和低风险组(低 评分)两组,通过km生存分析,比较两组在生存时间上的差异,发现高风险组 患者的累积生存率显著低于低风险组。与训练集的结果一致(图1),高风险组患 者的累积生存率显著低于低风险组(图2)。
[0116]
对训练集和验证集的肾癌患者进行预后roc曲线分析,结果显示,风险评分 预后模型对肾癌患者的预后具有较好的区分性能(图3和图4)。
[0117]
综上所述,基于本发明的基因能够预测肾癌的生存期/预后。
[0118]
以上结合附图详细描述了本技术的优选实施方式,但是,本技术并不限于上 述实施方式中的具体细节,在本技术的技术构思范围内,可以对本技术的技术方 案进行多种简单变型,这些简单变型均属于本技术的保护范围。
[0119]
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在 不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复, 本技术对各种可能的组合方式不再另行说明。
[0120]
此外,本技术的各种不同的实施方式之间也可以进行任意组合,只要其不违 背本技术的思想,其同样应当视为本技术所公开的内容。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1