一组用于肿瘤分子分型的基因及其应用

文档序号:9367695阅读:1169来源:国知局
一组用于肿瘤分子分型的基因及其应用
【技术领域】
[0001] 本发明涉及癌症诊断和分子生物学领域,以及诊断技术在临床上的应用。具体地, 本发明涉及一组用于肿瘤分子分型的基因及其应用。本发明还涉及一种用于肿瘤分子分型 的试剂盒。
【背景技术】
[0002] 肿瘤是威胁人类健康的重要疾病之一。根据《2012中国肿瘤登记年报》,全国每 6分钟就有一人被确诊为癌症,每天有8550人确诊为癌症,每七到八人中就有一人死于癌 症。我国恶性肿瘤的发病及死亡呈上升趋势,每年新发癌症病例约350万,癌症特异性死亡 约250万。预计到2020年,中国每年的癌症死亡总数将达到300万左右,患病总数达600 万。
[0003]目前,癌症的诊断主要包括详细的病史询问,全面的体格检查,影像学检查(包括 X线常规透视、拍片、各种造影、各种体层检查;CT、ECT、核磁共振检查;B型超声检查,核医 学检查等),病理学检查,内窥镜检查,放射免疫学检查等。肿瘤的影像诊断虽有了很大的发 展,但是目前最先进的医学技术也只能"捕捉"到直径0. 5厘米以上的肿块,体积较小时传 统影像方法则束手无策。病理学诊断是肿瘤诊断的"金标准"和临床治疗的基础,但病理诊 断也有局限性。病理学检查的结果大大依赖于病理医生的专业技术水平。因此,需要一种 比较客观的判断肿瘤类型和组织来源的方法。
[0004] 肿瘤是一类分子水平上高度异质性的疾病。组织学形态相同的肿瘤,其分子遗传 学改变不尽一致,从而导致了肿瘤治疗反应和预后的差别。近年来,随着科学技术的发展, 手术治疗、化学治疗、放射治疗等传统治疗手段不断发展,生物靶向治疗药物不断研发,为 了达到最大疗效和最小毒性,肿瘤类型的诊断和精确分型是关键。因此对肿瘤进行分子分 型是肿瘤个体化治疗的必然要求。
[0005] 在世界范围内,大约3% -5%的癌症是原发灶不明转移性癌(Carcinomasof unknownprimary,CUP),是一类病理学确诊为转移性恶性,但是经过详细评估仍不能确定 原发位点的异质性肿瘤。目前临床上,尽管经过详细的影像学检查和免疫组化分析,但是还 是只有大概20% -30%的原发灶不明转移癌能够找到原发灶。因此,如何准确识别原发灶 不明转移癌的组织起源是目前肿瘤临床诊断中存在的痛点和难点。
[0006] 基因分子诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越来越多 地运用于肿瘤检测。例如乳腺癌HER-2基因的扩增检测,肺癌、结直肠癌EGFR和K-RAS基 因突变检测,腹腔胃肠道间质瘤C-kit基因检测等。但基本都是采用少数几个肿瘤标志物, 只能用于单一肿瘤的亚型分类。而且,这些肿瘤标志物的研究往往是基于一定量的实验数 据,所涉及的癌症种类和样本量都相对有限。近年来,随着基因组学不断发展,肿瘤基因大 数据不断增加。因此,利用大数据分析方法,找到一种适用范围广、准确率高的识别肿瘤类 型和组织来源的基因诊断方法,有助于实现个性化用药,对患者进行精准治疗具有重要的 临床意义。

【发明内容】

[0007] 本发明要解决的技术问题之一是提供一组用于肿瘤分子分型的基因,建立肿瘤分 类模型,能够识别多种肿瘤的组织来源和肿瘤类型,有助于实现个体化治疗。
[0008] 本发明要解决的技术问题之二是提供一组用于肿瘤分子分型的基因的用途。
[0009] 本发明要解决的技术问题之三是提供一种用于肿瘤分子分型的试剂盒及其用途。
[0010] 本发明要解决的技术问题之四是提供一组用于肿瘤分子分型的基因在制备用于 肿瘤分子分型的基因芯片中的应用。
[0011] 为解决上述技术问题,本发明采用如下技术方案:
[0012] 在本发明的一方面,提供一组用于肿瘤分子分型的基因,包括如下38个基因: ACPP基因、AGR2基因、ASPN基因、AZGPl基因、CDHl基因、CEACAM5基因、CEACAM6基因、 CYP17A1基因、EPCAM基因、FABPl基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、KLK2基 因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、MMPl 基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPSll基因、 S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA基因、 XIST基因。
[0013] 作为本发明优选的技术方案,该组用于肿瘤分子分型的基因,还包括如下58个基 因(即包括96个基因):ACTG2基因、AP0BEC3B基因、APOD基因、ATPlBl基因、C7基因、CA12 基因、0(^18基因、0)1117基因、(^^基因、011311基因、(:0)附8基因、0〇]基因、0^1认1基 因、CXCL14基因、DLKl基因、EGFR基因、ESRl基因、FABP4基因、GJAl基因、GPM6B基因、GPX3 基因、GREMl基因、HBB基因、HLA-DQAl基因、ID4基因、IGFBP2基因、IGFBP7基因、ISLl基 因、KRT20基因、LGALS4基因、MMP3基因、MSMB基因、NKX2-1基因、NKX3-1基因、NPYlR基 因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRXl基因、PTCDS基因、PTN基因、 RGS4基因、RPS4Y1基因、S100A2基因、S100P基因、SCGB2A2基因、SERPINB3基因、SFRPl基 因、SFTPB基因、SPINKl基因、SPPl基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、 TSPAN8基因、TYRPl基因。
[0014] 所述肿瘤包括(但不限于):肾上腺癌,脑癌,乳腺癌,宫颈癌,结直肠癌,子宫内膜 癌,胃食管癌,头颈部肿瘤,肾癌,肝癌,肺癌,淋巴瘤,黑色素瘤,间皮瘤,神经内分泌肿瘤, 子宫癌,胰腺癌,前列腺癌,肉瘤,睾丸癌,甲状腺肿瘤,泌尿系统肿瘤和原发灶不明转移癌。
[0015] 本发明通过基因检测、标志物组合及数据挖掘算法的联合应用来建立基因标志物 组合模型,利用多基因预测模型判断原发灶不明转移癌的原发位点,主要包括以下步骤:
[0016] (1)收集肿瘤样本的临床诊断数据和基因表达谱数据,构建包含人类已知2万多 个基因、22种癌症类型,5800例肿瘤样品的癌症基因表达谱数据库;
[0017] (2)对基因表达模式进行统计分析,筛选出96个与肿瘤组织起源密切相关的基 因,分别为:ACPP基因、AGR2基因、ASPN基因、AZGP1基因、CDHl基因、CEACAM5基因、CEACAM6 基因、CYP17A1基因、EPCAM基因、FABPl基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、 KLK2基因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、 MMP1基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPS11 基因、S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA 基因、XIST基因、ACTG2基因、AP0BEC3B基因、APOD基因、ATPlBl基因、C7基因、CA12基因、CCL18 基因、CDH17 基因、CHGA基因、CHI3L1 基因、CLDN18 基因、CLU基因、COLlIAl基因、 CXCL14 基因、DLKl基因、EGFR基因、ESRl基因、FABP4 基因、GJAl基因、GPM6B基因、GPX3 基因、GREMl基因、HBB基因、HLA-DQAl基因、ID4基因、IGFBP2基因、IGFBP7基因、ISLl基 因、KRT20 基因、LGALS4 基因、MMP3 基因、MSMB基因、NKX2-1 基因、NKX3-1 基因、NPYlR基 因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRXl基因、PTCDS基因、PTN基因、 RGS4 基因、RPS4Y1 基因、S100A2 基因、S100P基因、SCGB2A2 基因、SERPINB3 基因、SFRPl基 因、SFTPB基因、SPINKl基因、SPPl基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、 TSPAN8 基因、TYRPl基因;
[0018] (3)计算上述96个基因表达模式,通过肿瘤分类模型对组织来源进行评价,计算 该样本与每种癌症类型的相似度分数(SimilarityScore)。根据相似度分数最高的判定规 贝IJ,判定组织来源和肿瘤类型。
[0019] 本发明提供了一种用于肿瘤分子分型的检测方法,包括以下步骤:
[0020] (1)将取自肿瘤患者的生物学样本与生物标志物接触,所述生物标志物包括上述 96个基因;所述生物学样本是取自所述对象的离体肿瘤组织,可以是新鲜样本或者福尔马 林固定的石蜡包埋(FFPE)样本;
[0021] 在此基础上,进一步进行肿瘤分类:
[0022] (2)检测该生物学样本中96个基因的表达模式和表达水平,基于96个基因的表达 水平来判断该生物学样本的肿瘤类型。采用数据分析方法,计算该生物学样本与各种肿瘤 类别的相似度分数(SimilarityScore)。根据相似度分数最高的判定规则,判定组织来源 和肿瘤类型,进行肿瘤分子分型。所述检测包括从所述样本制备RNA,所述RNA用于聚合酶 链式反应(PCR),所述PCR是逆转录PCR(RT-PCR),可选实时RT-PCR或者基因芯片或者高通 量测序技术。
[0023] 在本发明的另一方面,提供一组用于肿瘤分子分型的基因在制备用于肿瘤分子分 型的试剂盒中的应用。
[0024] 在本发明的另一方面,提供一种用于肿瘤分子分型的试剂盒,该试剂盒包含如下 生物标志物,所述生物标志物选自上述一组用于肿瘤分子分型的基因中的任意一种或多 种。
[0025] 作为本发明优选的技术方案,所述生物标志物是核酸、寡核酸链、或PCR引物组。
[0026] 作为本发明优选的技术方案,所述PCR引物组包括:
[0027]ACPP基因:正向引物如SEQIDNO. 1所示,反向引物如SEQIDNO. 2所示;
[0028]AGR2基因:正向引物如SEQIDNO. 3所示,反向引物如SEQIDNO. 4所示;
[0029]ASPN基因:正向引物如SEQIDNO. 5所示,反向引物如SEQIDNO. 6所示;
[0030]AZGPl基因:正向引物如SEQIDNO. 7所示,反向引物如SEQIDNO. 8所示;
[0031]CDHl基因:正向引物如SEQIDNO. 9所示,反向引物如SEQIDNO. 10所示;
[0032]CEACAM5基因:正向引物如SEQIDNO. 11所示,反向引物如SEQIDNO. 12所示;
[0033]CEACAM6基因:正向引物如SEQIDNO. 13所示,反向引物如SEQIDNO. 14所示;
[0034]CYP17A1基因:正向引物如SEQIDNO. 15所示,反向引物如SEQIDNO. 16所示;
[0035] EPCAM基因:正向引物如SEQ ID NO. 17所示,反向引物如SEQ ID NO. 18所示;
[0036] FABPl基因:正向引物如SEQ ID NO. 19所示,反向引物如SEQ ID NO. 20所示;
[0037] GATA3基因:正向引物如SEQ ID NO. 21所示,反向引物如SEQ ID NO. 22所示;
[0038] GCG基因:正向引物如SEQ ID NO. 23所示,反向引物如SEQ ID NO. 24所示;
[0039] GFAP基因:正向引物如SEQ ID NO. 25所示,反向引物如SEQ ID NO. 26所示;
[0040] IGJ基因:正向引物如SEQ ID NO. 27所示,反向引物如SEQ ID NO. 28所示;
[0041] KLK2基因:正向引物如SEQ ID NO. 29所示,反向引物如SEQ ID NO. 30所示;
[0042] KLK3基因:正向引物如SEQ ID NO. 31所示,反向引物如SEQ ID NO. 32所示;
[0043] KRT13基因:正向引物如SEQ ID NO. 33所示,反向引物如SEQ ID NO. 34所示;
[0044] KRT14基因:正向引物如SEQ ID NO. 35所示,反向引物如SEQ ID NO. 36所示;
[0045] KRT15基因:正向引物如SEQ ID NO. 37所示,反向引物如SEQ ID NO. 38所示;
[0046] KRT19基因:正向引物如SEQ ID NO. 39所示,反向引物如SEQ ID NO. 40所示;
[0047] LUM基因:正向引物如SEQ ID NO. 41所示,反向引物如SEQ ID NO.
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1