用于肺癌预后的基因及其应用的制作方法
【专利摘要】本发明公开了一组用于肺癌预后的基因,包括SEQ?ID?No.8~SEQ?ID?No.14所示核苷酸序列的基因。此外,本发明还公开了上述基因组的应用,包括在制备用于肺癌预后的基因芯片中的应用,以及在制备用于肺癌预后的试剂盒中的应用。本发明有助于提高结肺癌患者术后的生存率。在肺癌患者接受根治性手术后,即可通过对上述基因芯片的检测和联合分析,快速判断出该患者术后复发转移的危险度,从而能够对复发转移危险度较高的患者及早地进行辅助治疗,帮助延长患者的生存时间。
【专利说明】用于肺癌预后的基因及其应用
【技术领域】
[0001] 本发明涉及肺癌的预后领域,主要是肺癌术后复发转移的预测。更具体而言,涉及 一组用于肺癌预后的基因及其应用。
【背景技术】
[0002] 肺癌在我国乃至全球范围内是最常见的恶性肿瘤之一,发病率和死亡率 居恶性肿瘤的第一位(Jemal A, et al. Cancer statistics. CA Cancer J Clin. 2010 ; 60(5) :277-300.)。肺癌包括小细胞肺癌、腺癌、鳞癌等多种病理类型,其中腺癌是最为常见 的肺癌类型,其特点为容易出现术后远处转移,恶性程度高、预后差。尽管多年来从分子水 平认识肺癌的发生发展为肺癌的治疗和预防创造了条件,各种新的诊治方法和药物层出不 穷,但是肺癌的治疗效果并没有取得同步提高,其总的五年生存率仅在10%左右。在目前 的临床实际工作中,大部分临床医师对肺癌治疗是基于临床分期、患者的功能状态、病理分 型、药物不良反应的评价等临床因素来制定肺癌个体化治疗,是基于循证医学基础上的规 范化治疗。组织病理学诊断是肿瘤诊断的金标准和临床治疗的基础。肺癌的组织病理学分 型和临床分期是目前肺癌的临床预后指标。然而即使同为非小细胞肺癌,甚至?m分期相 同的肺腺癌,采用同样的治疗方案却会产生截然不同的治疗效果。事实上,由于肺癌是一 类分子水平上高度异质性的疾病,组织学形态相同的肿瘤,其分子遗传学改变不尽一致,从 而导致了肺癌治疗反应和预后的差别,因此对其进行分子分型是肺癌个体化治疗的必然要 求。目前大多数的分子分型是基于新鲜组织的全基因表达谱,而新鲜组织在临床上的获取 及保存还存在着一定的问题,相比之下石蜡组织更易于获取及保存,因此石蜡组织的基因 表达谱分析更适合今后的临床应用。NanoString nCounter system数字式单分子基因表达 谱分析系统在分析石蜡样本表达谱分析领域非常有优势。该平台是直接对基因表达进行多 重计数的全新数字式技术,利用分子条形码和单分子成像来检测及统计每一个反应体系中 特定转录本的数量,表现出极高的灵敏度、精确度和重复性。分子分型对于预测肿瘤进展或 复发转移风险,预测肿瘤预后,指导肿瘤治疗方式具有重要的临床意义。
【发明内容】
[0003] 本发明要解决的技术问题是提供一组用于肺癌预后的基因及其应用,能对肺癌患 者术后的复发转移情况进行预测,有助于提高结肺癌患者术后的生存率。
[0004] 为解决上述技术问题,本发明采用如下技术方案:
[0005] 在本发明的一方面,提供一组用于肺癌预后的基因,包括SEQ ID No. 8?SEQ ID No. 14所示核苷酸序列的基因。
[0006] 在本发明的另一方面,提供一组用于肺癌预后的基因在制备用于肺癌预后的基因 芯片中的应用,所述基因芯片包括固相载体和探针,所述探针与待测SEQ ID No. 8?SEQ ID No. 14所不基因序列和/或其互补序列进行杂受。
[0007] 所述探针包括下列三组核苷酸序列之一:
[0008] (1) SEQ ID No. 1 ?SEQ ID No. 7 所示序列;
[0009] (2) SEQ ID No. 1?SEQ ID No. 7所示序列中每条序列的互补链;
[0010] (3)与SEQ ID No. 1?SEQ ID No. 7所示的序列中每条序列有至少70%同源性的序 列。
[0011] 优选的,所述探针包括SEQ ID No. 1?SEQ ID No. 7所示序列。
[0012] 在本发明的另一方面,提供一组用于肺癌预后的基因在制备用于肺癌预后的试剂 盒中的应用,所述试剂盒包含:与SEQ ID No. 8?SEQ ID No. 14中至少一个基因序列进行杂 交的探针。
[0013] 所述探针包括下列三组核苷酸序列之一:
[0014] (1) SEQ ID No. 1 ?SEQ ID No. 7 所示序列;
[0015] (2) SEQ ID No. 1?SEQ ID No. 7所示序列中每条序列的互补链;
[0016] (3)与SEQ ID No. 1?SEQ ID No. 7所示的序列中每条序列有至少70%同源性的序 列。
[0017] 优选的,所述探针包括SEQ ID No. 1?SEQ ID No. 7所示序列。
[0018] 本发明通过多基因计算模型预测肺癌患者术后复发转移危险度的检测方法,主要 包括以下步骤:
[0019] (1)收集肺癌患者的手术切除癌组织石蜡标本;
[0020] ⑵提取石蜡组织的RNA ;
[0021] (3) RNA质量控制:用Alignent2100生物分析仪检测抽提的总RNA的质量;
[0022] (4)通过定制的似11〇31:1';[叩11(]〇111^6185^七611140基因的表达谱芯片检测,发现7个 探针在非复发转移组和复发转移组样本中存在差异表达(所述探针为SEQ ID No. 1?SEQ ID No. 7所示序列);
[0023] (5)计算上述7个探针的基因表达权重,通过预测死亡危险度计算公式对患者术 后预后进行评价;预测死亡危险度计算公式如下:C为权重值的常数,C = -166. 0 ;B为每 个基因的权重系数;X为每个基因在四分类方法中的赋值;y = C+(B1*X1…B7*X7),P = EXP (y)八(1+EXP (y))。根据计算的P值来预测复发的可能性:P〈0. 5非复发转移;P>0. 5复 发转移。所述探针的表达计算所得概率越大,该患者术后的复发转移率越高。
[0024] 为解决上述技术问题,本发明人等针对全基因组表达谱筛选出的肺癌预后相关基 因反复进行研究,通过定制的Nan 〇String40基因芯片(表1)检测得到的7个基因模型,用 于预测肺癌患者的术后复发转移风险。模型的建立包括以下步骤:采集肺癌患者的手术切 除石蜡标本;抽提石蜡组织RNA ;检测223例肺癌石蜡组织的Nan〇string40基因芯片,通过 统计分析得出在复发转移组和非复发转移组样本中存在差异表达的该7个特异性探针,以 用于预测术后复发转移风险;通过计算公式得出每个探针的表达权重,进而评价该患者术 后复发转移的可能性大小。本发明还公开了由上述探针组成的探针组,以及包含该探针组 的计算过程及公式。本发明通过对肿瘤石蜡组织的Nan 〇String40基因芯片的检测,通过对 7个差异探针的联合分析,来快速判断肺癌患者术后复发转移危险度,从而可以在术后及早 筛查出复发转移风险较高的肺癌患者,并对其进行积极的辅助治疗,以提高结肺癌患者术 后的生存率,延长患者的生存时间。
【专利附图】
【附图说明】
[0025] 图1是本发明实施例中验证组无病生存曲线图;
[0026] 图2是本发明实施例中验证组I期病人无病生存曲线图;
[0027] 图3是本发明实施例中验证组II期病人无病生存曲线图;
[0028] 图4是本发明实施例中验证组III期病人无病生存曲线图。
【具体实施方式】
[0029] 以下实施例仅用于说明本发明,而不用于限制本发明的范围。实施例中未注明 具体条件的实验方法,按照制造试剂盒生产公司所建议的条件或按照常规实验条件,例 如 Sambrook 等人,分子克隆:实验室手册(New York :Cold Spring Harbor Laboratory Press, 1989)中所述的条件。
[0030] 1、实验对象
[0031] 本实施例的研究对象选择2007年1月一2011年4月间复旦大学附属肿瘤医院病 理科肺癌术后石蜡组织223例。纳入及排除标准:
[0032] (1)新发肺癌患者(需以手术标本的病理诊断为标准);
[0033] (2)年龄18-65岁之间,病理诊断为腺癌;
[0034] (3)临床分期:1-111 期;
[0035] (4)患者手术前未接受放射性治疗、化学药物治疗及分子靶向药物治疗,术后采用 相同或相近的放化疗方案治疗。
[0036] (5)无其他器官肿瘤病史;无肺癌家族史。
[0037] 2、实验方法
[0038] 采集上述223例患者的手术切除癌组织标本,用Ambion公司的Ambion? RecoverAl 1?FFPE组织总核酸分离试剂盒,按照试剂盒的说明,抽提RNA样本。抽提后的RNA 样本保存在_7〇°C的深低温冰箱中。
[0039] 用Aligent2100生物分析仪,检测抽提的总RNA的质量及片段化程度。
[0040] 用美国Nanostring公司定制的40基因的寡核苷酸芯片。按照Nanostring ncounter system基因表达谱芯片操作说明规定的标准操作步骤,对223例石錯组织的RNA 样本进行40基因组表达谱的检测。采用分子条形码技术扫描芯片,用nSolver分析软件读 取数据,F0V百分比>75%,探针结合率介于0. 05和2,。25之间,阳性对照线性值>0. 95的 数据为质检合格的数据,采用nSolver分析软件自带标化功能进行标准化处理分析,得出 每一个基因在每一个样本中的表达值。
[0041] 3、结果分析
[0042] 结合223例患者的临床随访结果,随机分成训练组和验证组,训练组111例,验证 组112例。为了去除极值的影响,我们将所有探针的表达值进行四分法分类分别赋值为1、 2、3、4 ;进一步进行二分类Logistic回归分析(我们分析时不将1、2、3、4看作亚变量分析, 仍看作连续变量)后我们在训练组筛选得到7个探针模型。探针名称、对应基因及权重系 数见表2。根据每个基因表达量进行权重后,得出预测生存情况的计算公式。具体预测计算 公式如下:C为权重值的常数,C = -166. 0 ;B为每个基因的权重系数;X为每个基因在四分 类方法中的赋值;y = C+(B1*X1…B7*X7),P = EXP(yV((l+EXP(y))。根据计算的P值来 预测复发的可能性:P〈〇. 5非复发转移;P>0. 5复发转移。从预测公式可以看出,B值为正数 的基因表达量越高,术后发生肿瘤复发转移的危险度就越高;反之,B值为负数的基因表达 量越高,术后发生肿瘤复发转移的危险度就越小。实际观测值与预期结果比较见表3。表3 是用该公式实际预测本次实验中所有样本的复发转移情况。训练集中共有复发转移病例53 例,非复发转移病例58例,在预测过程中,根据计算的P值来预测复发的可能性:P〈0. 5非 复发转移;P>〇. 5复发转移。实际检测结果显示53例复发转移病例P值均大于0. 5,58例 非复发转移病例P值均小于〇. 5, 7个探针模型对预测本组肺癌生存情况的准确性为100%。 卡方分析P值为5.9E-26。
[0043] 该公式在验证组中实际观测值与预期结果比较见表4。表4是用该公式实际预测 本次实验中所有样本的复发转移情况。训练集中共有复发转移病例54例,非复发转移病例 58例,在预测过程中,根据计算的P值来预测复发的可能性:P〈0. 5非复发转移;P>0. 5复发 转移。实际检测结果显示50例复发转移病例P值均大于0.5,准确率为92. 6%。51例非复 发转移病例P值均小于0.5,准确率为87. 9%。卡方分析P值为1.6E-17。定义复发转移为 阳性事件:真阳性50例,假阳性7例,真阴性51例,假阴性4例,灵敏度=真阳性八真阳性 +假阴性)=92.6%,特异度=真阴性八真阴性+假阳性)=87.9%,阳性准确率=真阳 性八真阳性+假阳性)=87. 7%,阴性准确率=真阴性八真阴性+假阴性)=92. 7%。 分析结果表明,7个探针模型对预测本组结肺癌死亡的阳性准确率为87. 7%,阴性准确率 为93%,即判读为非复发转移的常规治疗即有非常好的疗效,而判读为复发转移的应该及 时进行治疗方案的优化。
[0044] 该公式在验证组中能够准确的区分验证组样本中无复发生存时间低和高的病人 群体,P值为5. 59E-16,如图1。将验证组样本按照临床分期分为三组(I,II,III)时,该 公式能够在分期相同的样本中准确的区分无复发生存时间低和高的病人群体,P值分别为 7· 57E-08(I 期),1. 71E-05(II 期),0· 005(111 期),如图 2,图 3,图 4。
[0045] 表lnanostring40基因芯片名称
【权利要求】
1. 一组用于肺癌预后的基因,其特征在于,包括SEQ ID No. 8?SEQ ID No. 14所示核苷 酸序列的基因。
2. 如权利要求1所述的一组用于肺癌预后的基因在制备用于肺癌预后的基因芯片中 的应用,所述基因芯片包括固相载体和探针,其特征在于,所述探针与待测SEQ ID No. 8? SEQ ID No. 14所示基因序列和/或其互补序列进行杂交。
3. 如权利要求2所述的应用,其特征在于,所述探针包括下列三组核苷酸序列之一: (1) SEQ ID No. 1 ?SEQ ID No. 7 所示序列; (2) SEQ ID No. 1?SEQ ID No. 7所示序列中每条序列的互补链; (3) 与SEQ ID No. 1?SEQ ID No. 7所示的序列中每条序列有至少70%同源性的序列。
4. 如权利要求3所述的应用,其特征在于,所述探针包括SEQ ID No. 1?SEQ ID No. 7所 示序列。
5. 如权利要求1所述的一组用于肺癌预后的基因在制备用于肺癌预后的试剂盒中的 应用,其特征在于,所述试剂盒包含:与SEQ ID No. 8?SEQ ID No. 14中至少一个基因序列进 行杂交的探针。
6. 如权利要求5所述的应用,其特征在于,所述探针包括下列三组核苷酸序列之一: (1) SEQ ID No. 1 ?SEQ ID No7 所示序列; (2) SEQ ID No. 1?SEQ ID No. 7所示序列中每条序列的互补链; (3) 与SEQ ID No. 1?SEQ ID No. 7所示的序列中每条序列有至少70%同源性的序列。
7. 如权利要求6所述的应用,其特征在于,所述探针包括SEQ ID No. 1?SEQ ID No. 7所 示序列。
【文档编号】C12N15/11GK104046624SQ201410226211
【公开日】2014年9月17日 申请日期:2014年5月26日 优先权日:2014年5月26日
【发明者】杜祥, 周晓燕, 危平, 王志敏, 王丽莎, 王懿琴, 徐清华 申请人:复旦大学附属肿瘤医院, 上海人类基因组研究中心