一种利用特定基因组合的表达特征鉴定肿瘤组织及亚型,以及用以预测患者预后与转移...的制作方法

文档序号:438496阅读:452来源:国知局
专利名称:一种利用特定基因组合的表达特征鉴定肿瘤组织及亚型,以及用以预测患者预后与转移 ...的制作方法
技术领域
本发明是关于使用基因表达谱分析的方法,⑴使用含SEQ ID N0S:l-7、8-17或 1-17核酸序列的基因组合(gene set)确定人类样本是否为肿瘤;(2)鉴定肿瘤组织是否 为腺癌(adenocarcinoma)(使用含SEQ ID NOS :15,18-21核酸序列的基因组合)或鳞状 细胞癌(squamous cell carcinoma)(使用含SEQID NOS :22-27核酸序列的基因组合); 及C3)预测存活的预后及在人体内肿瘤的转移(使用含SEQ ID NOS 19、28-42或SEQ ID N0S:19J9、31、40及41核酸序列的基因组合),特别是在早期肺癌的人类。较佳者为,基因 表达谱最好以cDNA微阵列(microarray)为基础的技术和/或实时反转录聚合酶链式反应 (Real-Time RT-PCR)进行,并通过统计方法分析。
背景技术
癌症为一种无法控制生长及不正常细胞蔓延为特征的疾病群,若蔓延不受控制, 则可导致死亡。癌症因外在因子(例如香烟、化学物质及放射线)及内在因子(遗传突变、 荷尔蒙、免疫状况及由代谢所发生的突变)引起,这些因子可一起或接续作用而开始或促 进癌化(carcinogenesis),暴露于外在因子及可侦测到癌症之间通常可经过10年以上。癌 症可通过手术、放射线、化学疗法及免疫疗法治疗。所有癌症包含控制细胞生长及分裂的基因的机能不全。约5至10%的癌症明确地 为遗传性,遗传性基因的改变使人类有罹患特定癌症的高风险倾向,其它癌症并非为遗传 性,而是由于终其一生所发生的基因(突变)损伤所造成,或者是因为内在因子,例如荷尔 蒙或营养物在细胞内的消化作用,或外在因子,例如香烟、化学物质或阳光。肺癌是全世界癌症死亡最常见的死因(Jemal et al.,CA Cancer J. for Clin. (2005)55 :10-30 ;Parkin et al. , European J. of Cancer (2001) 37 :S4_66)。在 2005 年, 肺癌占被诊断出的癌症的13%,发生率在男性已明显下降,由1984年每100,000人中有 102. 1人的高峰降至2001年的77. 7。在女性中,于长时间的增加之后,第一次减少的比例 由1998年的52. 8降至2001年的49. 1。在2005年报告指出超过163,000人死于肺癌,此约占所有癌症死亡的四%,自从 1987年起,每年因肺癌死亡的女性已多于乳癌。从1991年起男性死亡率已持续以每年约 1. 9%明显下降,女性肺癌死亡率在数十年间连续增加后近来已达到高原期,下降的肺癌发 病率及死亡率反映出过去30年间下降的吸烟率。吸烟显然是肺癌最主要的风险因子,其它风险因子包括二手烟与在职业上或环境 上暴露于某些物质,如砷、苯类的有机化学物、氡及石绵;于职业、医学及环境来源的放射线 暴露;空气污染及结核病。肇始于肺部的癌症根据在显微镜下的细胞外观可区分成两种主要类型,S卩非小 细胞肺癌(NSCLC, non-small cell lung cancer)及小细胞肺癌(SCLC,smallcell lung cancer)。每一类型的肺癌以不同方法生长及蔓延,且治疗方法不同。非小细胞肺癌比小细胞肺癌更为普遍,且通常其生长及蔓延较为缓慢。非小细胞肺癌有三种主要类型, 其以癌症发展中的细胞类型而被称为鳞状细胞癌(squamous cell carcinomas)、腺癌 (adenocarcinomas)及大细胞癌(large-cellcarcinomas) 0鳞状细胞癌为一种肇始于鳞状细胞的癌症,其薄而平的细胞看起来类似鱼鳞。鳞 状细胞被发现于形成皮肤表面、身体中空脏器的内衬(lining)及呼吸道与消化道的通道 的组织。腺癌为一种肇始于内衬在某些内脏的细胞且具有腺体(分泌)特性的癌症类型。 此外,大细胞癌为一种在显微镜视野下相较于周围的细胞,细胞较大且看起来不正常的癌 症类型。肺癌也可在癌症的实际类型被鉴定之前,依据所在的位置而被分类,例如肺癌发 生于肿疡的疾病种类,肿疡为一种当细胞分裂比其应该分裂的多或当其应该死亡而未死亡 时所造成的不正常组织肿块。依据细胞所在的位置,肿疡可在进一步区分成胸腔肿疡、呼吸 道肿疡及肺肿疡,这些位置间的差异与最后肿疡存在的位置有关。例如,胸腔肿疡存在于胸 腔区域,呼吸道肿疡包括所有涉及呼吸的器官(即鼻、咽、喉、气管、支气管及肺),而肺肿疡 仅于胸腔内供应身体氧气及移除二氧化碳的成对器官之一发现。过去在早期检测上的努力仍不能证实降低死亡率的能力,胸腔X光、唾液中细胞 分析及支气管通道的光纤检测在改善存活率或确定预后已显示有限的效力。较新的试验, 例如低剂量螺旋计算机断层摄影仪扫描及唾液的分子标识,在检测早期(较可手术的阶 段)肺癌上已产生有希望的结果,而较为可能存活。然而,当评估筛检的风险及优点时,必 须考虑有大量关于肺穿刺病理切片及手术的风险。此外,当病人具有相同的临床及病理特征时,NSCLC的临床病理分期系统不能充 分预测结果,大约30%的NSCLC病人表达早期的疾病状态且接受可能治愈的治疗方式。然 而,其中有40%的病人将会在五年内复发(Hoffman etal.,Lancet (2000) 355 :479-485 ; Mountain, Chest(1997)111 1710-1717 ;andNaruke et al.,J.Throac. Cardiovasc. Surg. (1988)96 :440-447)。分子层面的研究对于鉴别治疗后再复发或转移高风险病人提供更多的信息,这将 有助于改善对NSCLC病人的管理。近年来,基因表达谱显示能够区分不同存活情形的病 人(Beer et al.,Nat. Med. (2002)8 :816_824and Wigle et al.,Cancer Res. (2002)62 3005-3008)。值得注意地,临床上被分为早期的病人中有不少比例在基因表达谱方面被认 定为预后差的高风险群。尽管如此,基因表达谱方法的临床应用仍受限于参与基因数量的 过于庞大(Ramaswamy, N. Engl. J. Med. (2004)350:1814-1816)。再者,多数被选中的基因 实际上在不同肺癌的研究中的结果是截然不同的,只有非常少的基因才能一致地被算进去 (Endoh etal.,J. Clin. Oncol. (2004)22 :811-9)。此外,几个最近的微阵列研究显示基因表达谱(gene expression profiling) 能够用来区分肺癌的组织病理种类的亚型(如腺癌和鳞状细胞癌)(Miattacharjee et al.,Proc. Natl. Acad. Sci. (2001)98 :13790-13795 ;Garber et al.,Proc. Natl. Acad. Sci. (2001)98 :13784-13789 ;McDoniels-Silvers et al.,Clin. Cancer Res. (2002)8 1127-1138 ;McDoniels-Silvers et al.,Neoplasia(2002)4:141-50 ;and Nacht et al., Proc. Natl. Acad. Sci. (2001)98 :15203-8)。目前的数据显示,区别肺癌亚群的最佳基因表 达谱在不同的组中可能不同。举例来说,在东亚民族(包括台湾及日本)组中,发现表皮生长因子受体(epidermal growthfactor receptor, EGFR)对于治疗的反应率高于其它种 族(Chou et al. , Clin. Cancer Res. (2005) 11 :3750-7 ;Huang et al. , Clin. Cancer Res. (2004) 10 :8195-203 ;Shigematsu et al.,J. Natl. Cancer Inst. (2005)97 :339-46)。本发明者先前已鉴别超过600个与转移有关连的基因,在本发明下一部份,将进 一步描述所发现的特定基因组合,其可决定在人类发展为肿瘤的风险;鉴别肺癌的亚型,尤 其是区别腺癌与鳞状细胞癌;及预测具有肿瘤的人的预后。

发明内容
本发明提供(1)鉴定人类样本是否为肿瘤的方法;( 鉴定人类肿瘤组织是否为 腺癌及鳞状细胞癌的方法;及C3)预测具有肿瘤的人预后的方法。第一方法需要比较人类样本的基因组合的基因表达与对照组中相同基因组合的 相应基因表达(对照组可为标准化的数据、在健康人类受试者中相应基因组合的基因表达 或相同人类受试者正常区域组织的基因表达。)本文所述的基因表达通过实时反转录聚合 酶链式反应(Real-Time RT-PCR)或基于cDNA微阵列技术测定,其使用PROC RANK统计软件 SAS (版本9. 1 =SAS InstituteInc.,Cary, NC, USA)标准化,根据对数强度决定基因表达。7-基因组合及10-基因组合已被选用于通过威尔科克森带符号秩检验(Wilcoxon signed-rank test)测定人类样本是否为肿瘤,在7_基因组合或10-基因组合各基因 的基因表达与对照组中相应基因表达相互比较,并进一步通过判别分析(discriminant analysis)禾口 / JlKfti一^MMtMM (hierarchical clusteringanalysis) ^^,了― 1 组合包括 THBS2 (SEQ ID NO 1)、FAP (SEQ ID NO :2)、IGFBP3 (SEQ ID NO 3)、PLAU (SEQ ID NO :4)、MCM4(SEQ IDNO 5)、MMPl (SEQ ID NO 6)及 CDC20 (SEQ ID NO :7),此组的基因特征 为在人类肿瘤组织中的基因表达高于对照组,较佳的为二倍且显著(即ρ值小于0.05)高 于对照组。10-基因组合包括 ADARBl (SEQ ID NO 8)、THBD (SEQ ID NO :9)、NR4A1 (SEQ ID NO: 10)、TGFBR2(SEQ ID NO :11)、SPARCL1(SEQID NO : 12)、CAVl(SEQ ID NO :13)、ADRB2(SEQ ID NO 14) ,KlAAl 102 (SEQ ID NO 15) ,TGFBR3(SEQ ID NO :16)及 GPM6A(SEQ ID NO :17),此组 的基因特征为在人类肿瘤组织中的基因表达低于对照组,较佳的为二倍且显著(即P值小 于0. 05)低于对照组。或者是,合并7-基因组合与10-基因组合的17-基因组合,其也可用于测定人类 肿瘤。可被用于测定基因表达的人类样本较佳为人体组织,可通过此方法测定的肿瘤类 型包括(但不限于)呼吸道肿疡、胸腔肿疡、肺癌、腺癌及鳞状细胞癌。第二方法应用于在已预先被测定为类肿瘤的人类样本中测定肺癌亚型,即腺癌或 鳞状细胞癌。为了测定肿瘤组织是否为腺癌,在已预先被测定为类肿瘤的人类样本中,使用 在5-基因组合各基因的微阵列技术的基因表达已被鉴定出来,5-基因组合包括MUCl (SEQ ID NO :18)、ErbB3(SEQ ID NO :19)、KIAAl 102 (SEQ ID NO 15)、PTPRU (SEQ ID NO :20) 及SCP2(SEQID N0:21)。5-基因组合是以威尔科克森带符号秩和检验(Wilcoxon rank sumtest)挑选出来,在人类样本中此组的基因会被正调控,较佳者为基因表达大于1.7倍 并具有显著差异(较佳者为具有小于0. 05的显著系数ρ值)。5-基因组合的基因表达谱以cDNA微阵列技术或实时RT-PCR完成,且进一步通过判别分析及任意一种系统聚类分析 分析之。为了测定样本是否为鳞状细胞癌,已预先被测定为类肿瘤的人类样本中的6-基 因组合通过威尔科克森带符号秩和检验挑选出来,此6-基因组合包括SLC43A3 (SEQ ID NO 22)、MXDl (SEQ ID NO :23)、S100A8 (SEQ IDNO :24)、ODCl (SEQ ID NO :25)、PIK3CA (SEQ ID NO 26)及CMKORl (SEQ ID NO :27),此组的基因在人类样本中被正调控,较佳者为大于1. 7 倍并具显著差异(较佳者为具有小于0. 05的显著系数ρ值)。6-基因组合的基因表达谱 通过cDNA微阵列技术或实时RT-PCR完成,且进一步通过判别分析及任意一种系统聚类分 析分析之。在SEQ ID NO :22中的序列可以SEQ IDNOS :44及45置换,该二者事实上为具有 长度些微不同的相同基因。第三方法适用于预测具有肿瘤的人的预后,其包括自人类获得样本,并测定在 16-基因组合中各基因的基因表达,16-基因组合包括ANXA5 (SEQ IDNO 28)、LCK (SEQ ID NO 29)、FRAPl (SEQ ID NO 30)、STATl (SEQID NO 31)、NFl (SEQ ID NO 32)、HGF (SEQ ID NO 33)、HMMR(SEQID NO :34)、IRF4(SEQ ID NO :35)、ZNF264(SEQ ID NO :36)、ErbB3(SEQ ID NO 19)、STAT2 (SEQ ID NO :37)、CPEB4 (SEQ ID NO :38)、RNF4 (SEQ ID NO :39)、DUSP6 (SEQ ID NO :40)、MMD (SEQ ID NO :41)、及DLG2 (SEQ ID NO :42),在此 16-基因组合中每一基因个 别的基因表达可用于合并各基因的回归系数,以计算风险分数,其具有下列方程式风险分数=-1.09xANXA5-0. 84xLCK_0. 77xFRAPl_0. 58xSTATl+0. 47xNFl+0. 5IxHG F+0. 52xHMMR+0. 52xIRF4+0. 55xZNF264+0. 55xErbB3+0. 59xSTAT2+0. 59xCPEB4+0. 65xRNF4+ 0.75xDUSP6+0. 92xMMD+l. 32xDLG2其中该ANXA5、该 LCK、该 FRAPl、该 STATU 该 NFl、该 HGF、该 HMMR、该 IRF4、该 ZN拟64、该ErbB3、该STAT2、该CP^4、该RNF4、该DUSP6、该MMD、及该DLG2于上述方程式中 代表该基因组合中该基因的基因表达,其基因表达可通过实时反转录聚合酶链式反应(实 时RT-PCR)或cDNA微阵列技术分析而得到。风险分数可用于将人类分成具有肿瘤的高风险或低风险组。由前述16-基因挑选出的5-基因组合,能通过实时反转录聚合酶链式反应(实 时RT-PCR)或cDNA微阵列技术分析预测预测具有肿瘤的人的预后。此5-基因组合包括 LCK(SEQ ID NO 29),STATl(SEQ ID NO 31)、ErbB3(SEQ ID NO :19)、DUSP6(SEQ ID NO :40)、 及MMD (SEQ ID NO :41),其通过单变量Cox比例风险模型回归分析法(univariate Cox,s proportionalhazards regression analysis)挑选,此5-基因组合的基因表达谱通过决策 树模式(decision tree model)分析。前述肿瘤较佳为肺癌,最佳为非小细胞肺癌,且对象 为具有早期肺癌的人。用于预测具有肿瘤的人预后的5-基因组合,能以3-基因组合置换,该3-基因组 合包含但不限于(I)STATl (SEQ ID NO :31)、ErbB3 (SEQ ID NO :19)、及LCK (SEQ ID NO :29); (2) STATl (SEQ ID NO :31)、ErbB3 (SEQID NO 19)、及 MMD (SEQ ID NO :41) ; (3) STATl (SEQ ID NO :31)、ErbB3(SEQ ID N0:19)、及 DUSP6 (SEQ ID NO :40) ; (4) LCK (SEQID NO :29)、 ErbB3 (SEQ ID NO : 19)、及 MMD (SEQ ID NO :41);以及 LCK (SEQ ID NO :29)、ErbB3 (SEQ ID NO : 19)、及 DUSP6 (SEQ IDNO :40)。最后,本发明提供一种诊断试剂盒以用来预测具有肿瘤的人的预后。该诊断试剂盒包含实时反转录聚合酶链式反应(实时RT-PCR)的试剂,用以分析该5-基因组合中 各基因的个别基因表达,包含 LCK (SEQ ID NO 29)、STATl (SEQ ID NO :31)、ErbB3 (SEQ ID NO :19)、DUSP6(SEQ ID NO :40)及 MMD (SEQ ID NO :41)。该试剂包含针对 5-基因组合和 /或控制基因的特异性探针及引物,该控制基因较佳为编码TATA-盒结合蛋白(TATA-box bindingprotein ;TBP)的内源性基因。前述5-基因组合能被3-基因组合置换。


图1显示卡普兰-迈耶(Kaplan-Meier)存活曲线(整体存活率于左栏,而无复发 的存活率于右栏)关于下列4个方案(A)以微阵列为基础的16个基因在训练数据组(n = 63)中,以具风险分数中间值作为次分群切点(cut-offpoint) ; (B)以微阵列为基础的16 个基因在试验数据组(n = 62)中,使用衍生自训练数据组的相同切点;(C)以实时RT-PCR 为基础的5个基因于次级样本(n = 101)中以决策树模式预测病患;(D)基于实时RT-PCR 的5个基因以决策树模式由次级样本(n = 59)将第I期及第II期病患分层以预测病患;图2显示在独立组(n = 60)中,基于实时RT-PCR的5个基因的预测模式,及关于 整体存活的Kaplan-Meier存活曲线。(A)整群独立组(n = 60) ; (B)由独立组分层出来的 第I及第II期病患(n = 42);图3显示关于下列三个方案的颜色图(color-gram)(训练资料组于左栏且试验 资料组于右栏),及(A)与(B)的二维系统聚类分析(栏代表基因,且列代表检体及由蓝 (低)至红(高)代表基因表达程度)㈧关于癌症鉴定及正常分布的检体的17个基因表 达谱,-2. 7至2. 7 (任意单位);(B)关于癌症鉴定及正常分布的检体的17个基因表达谱, 关于癌症的亚群分类及正常分布的检体的11个基因表达谱,"2. 4至2. 4(任意单位);(C) 关于转移及存活的预测的16个基因表达谱,上方白至红的色谱代表病患的风险由低至高, 列表示风险及保护性基因,栏代表病患,且由-2. 3至2. 3的蓝至红的色谱代表基因表达程 度;图4显示决策树模式,其以实时RT-PCR所分析的样本为基础而建构,每一结点中 的数据包括结点编号(记述于上方)及分类成高风险(以High指出)及低风险(以Low 指出)的样本编号,其以使用微阵列试验数据的预后预测模式分类。新样本(或检体)的 分类决定末端结点中可含有的新样本(或检体)。例如,结点1含完整亚群(101个相对基 因表达测量;57个来自高风险群及44个来自低风险群)。第一叉口是基于“ErbB3”基因的 表达相对基因表达测量(以实时RT-PCR)少于0. 15形成结点3而其它测量形成结点2。
具体实施例方式本发明一方面提供测定在人类身上肿瘤发展风险的方法,另一方面包括区别人类 二种肿瘤类型的方法,及预测具有肿瘤的人预后的方法。本发明所涉及的肿瘤包括胸腔肿 疡、呼吸道肿疡、肺肿疡、肺癌、非小细胞肺癌、腺癌及鳞状细胞癌。测定肿瘤发展风险的方法需要取自人类的样本,样本包括组织样本,其包括(但 不限于)上皮组织、结缔组织、肌肉组织及神经组织。上皮组织样本包括单层上皮(即鳞状、 立方及柱状上皮)、假复层上皮(即柱状上皮)及复层上皮(即鳞状上皮)。结缔组织样本 包括胚胎结缔组织(即间质结缔组织及粘液状结缔组织)、一般结缔组织(即疏松结缔组织及致密结缔组织)、及特殊结缔组织(即软骨、骨及动物性脂肪)。肌肉组织样本包括平滑 肌(即不随意肌)及横纹肌(即随意及不随意肌)。神经组织样本包括神经及支撑细胞。 此外,样本可含肺部系统独特的细胞,例如来自气管、支气管、小支气管及肺泡的细胞,还包 括口及喉独特的细胞,例如口腔中所有形式的细胞,其包括脸颊内衬、舌、口腔底部及顶部、 牙龈、喉及唾液样本。本发明的方法也需要取自人类的正常样本,正常样本包含组织样本,例如上皮组 织、结缔组织、肌肉组织及神经组织。上皮组织样本包括单层上皮(即鳞状、立方及柱状上 皮)、假复层上皮(即柱状上皮)及复层上皮(即鳞状上皮)。结缔组织样本包括胚胎结缔 组织(即间质结缔组织及粘液状结缔组织)、一般结缔组织(即疏松结缔组织及致密结缔组 织)、及特殊结缔组织(即软骨、骨及动物性脂肪)。肌肉组织样本包括平滑肌(即不随意 肌)及横纹肌(即随意及不随意肌)。神经组织样本包括神经及支撑细胞。此外,样本可含 肺部系统独特的细胞,例如来自气管、支气管、小支气管及肺泡的细胞,也包括口及喉独特 的细胞,例如口腔中所有形式的细胞,其包括脸颊内衬、舌、口腔底部及顶部、牙龈、喉及唾 液样本。正常样本被定义为表达包含表1中这些基因的样本,不论是来自相同病人或是健 康人类受试者。一旦分析模式被定义后,它将成为标准化的数据。这个时候仅需要分析病 患的肿瘤样本,而不是相同病患的肿瘤样本与正常样本。关于自人类取得样本,自样本中分离并萃取总RNA及扩增,扩增程序根据反义 RNA(aRNA)扩增法,并涉及数组分析中造成极小的信使RNA (messenger RNA)的线性扩增的 一连串酶反应。此程序由被反转录的全部或聚(A)RNA起始,在第一链合成后,反应以RNase H处理,以切割mRNA成为小片段,这些小RNA片段在第二链合成反应时做为引物(primer)。一旦RNA由样本中萃取,然后在上述程序中转变成cDNA或cRNA,作为微阵列分 析的准备,其中微阵列的用途为定量自不同基因转录mRNA,该基因编码不同蛋白质,复 制体(copies)也可通过RT-PCR扩增。随后荧光标签(Fluorescent tag)或地高辛配 基-dUTP (digoxigenin-dUTP)酶并入新合成的cDNA/cRNA中,或可化学连接至DNA或RNA 新链,然后含有与数组上单链探针序列互补的序列的cDNA或cRNA分子通过碱基配对被杂 交至互补报导子(reporter)被黏上的点,然后当使用微阵列扫描机检测时,该点发出荧光 (或发光)。微阵列可使用不同技术制造,包括以细尖的针印刷于玻璃片上、使用预制光罩的 微影技术、使用动态微镜芯片(dynamic micromirror device)的微影技术、喷墨打印、或在 微电极数组上的电化学。增加的或减少的荧光强度显示样本中细胞最近已转录或停止转录含侦测的序列 的基因(“最近”,因为在转录后不久细胞倾向于降解RNA),荧光强度对于所存在特定mRNA 复制体的数量是概略的比例项,因此概略地显示该基因的活性或表达程度。数组可绘制成 图形或“图谱”,其中可以比色分析观察在特定细胞类型及特定情况下基因组中哪些基因具 有活性。本发明所针对的表达基因组合选自这些SEQ. IDs、Unigene组编号、Genbank登录 编号及GI编号列于下表1。表I权利要求
1.一种测定人类肿瘤的方法,其包含由所述人类获得样本;测定在所述样本中基因组合中各基因的基因表达;其中,所述基因组合包含SEQ ID NOS 1-7的核酸序列;比较在所述基因组合中的基因表达与对照组中所述基因组合中的相应的基因表达;藉此当在所述人类样本的基因组合中各基因的基因表达大于所述对照组的基因组合 中各基因的相应的基因表达时,所述人类具有所述肿瘤。
2.根据权利要求1所述的方法,其中,所述人类样本为组织。
3.根据权利要求1所述的方法,其中,所述肿瘤选自由呼吸道肿疡、胸腔肿疡、肺癌、腺 癌及鳞状细胞癌所组成的组。
4.根据权利要求1所述的方法,其中,所述基因表达通过实时反转录聚合酶链式反应 测定。
5.根据权利要求1所述的方法,其中,所述基因表达程度使用cDNA微阵列技术测定。
6.根据权利要求1所述的方法,其中,所述对照组为标准化数据、来自所述人类周边正 常区域或含所述基因组合的健康人类的正常组织。
7.根据权利要求1所述的方法,其中,所述基因组合通过威尔科克森带符号秩检验选取。
8.根据权利要求1所述的方法,其中,所述人类样本中基因组合的基因表达约为所述 对照组中所述基因组合的相应的基因表达的二倍。
9.根据权利要求1所述的方法,其中,在所述人类样本中基因组合的基因表达明显不 同于对照组中所述基因组合的相应的基因表达,具有小于0. 05的显著系数ρ值。
10.根据权利要求1所述的方法,其中,所述基因组合中各基因的基因表达进一步通过 判别分析和/或系统聚类法分析。
11.一种测定人类肿瘤的方法,其包含由所述人类获得样本;测定在所述人类样本中基因组合中各基因的基因表达;其中,所述基因组合包含SEQ ID NOS 8-17的核酸序列;比较在所述基因组合中各基因的基因表达与对照组中所述基因组合中各基因的相应 的基因表达;藉此当在所述人类样本的基因组合中各基因的基因表达低于所述对照组的基因组合 中各基因的相应的基因表达时,所述人类具有所述肿瘤。
12.根据权利要求11所述的方法,其中,所述基因组合通过威尔科克森带符号秩检验 选取。
13.根据权利要求12所述的方法,其中,所述对照组中所述基因组合中各基因的相应 的基因表达约为所述人类样本中基因组合的基因表达的二倍。
14.根据权利要求12所述的方法,其中在所述人类样本中基因组合的基因表达明显不 同于所述对照组中所述基因组合的相应的基因表达,具有小于0. 05的显著系数ρ值。
15.一种测定人类肿瘤的方法,其包含由所述人类获得样本;测定在所述人类样本中第一基因次组合中各基因的第一基因表达; 测定在所述人类样本中第二基因次组合中各基因的第二基因表达; 其中,所述第一基因次组合包含SEQ ID NOS :1-7的核酸序列,而所述第二基因次组合 包含SEQ ID NOS 8-17的核酸序列;比较在所述人类样本中第一基因次组合中各基因的第一基因表达与对照组中所述第 一基因次组合中各基因的相应的第一基因表达;比较在所述人类样本中第二基因次组合中各基因的第二基因表达与所述对照组的所 述第二基因次组合中各基因的相应的第二基因表达;藉此当在所述第一基因次组合中各基因的第一基因表达大于所述对照组中所述第一 基因次组合中各基因的相应的第一基因表达,且在所述第二基因次组合中各基因的第二基 因表达低于所述对照组中第二基因次组合中各基因的相应的第二基因表达时,所述人类具 有所述肿瘤。
16.一种在人类肿瘤样本中鉴定腺癌的方法,其包含 获得所述人类肿瘤样本;测定在基因组合中各基因的基因表达;其中,所述基因组合包含SEQ IDNO 18, SEQ ID NO :19、SEQ ID NO :15、SEQ ID NO 20 及 SEQ ID NO 21 的核酸序列;藉此当所述基因组合的基因表达在所述人类肿瘤样本中被正调控时,所述人类肿瘤样 本被鉴定为所述腺癌。
17.根据权利要求16所述的方法,其中,所述基因组合通过威尔科克森带符号秩和检 验选取。
18.根据权利要求17所述的方法,其中,所述基因组合中各基因的基因表达被正调控 约大于1.7倍。
19.根据权利要求17所述的方法,其中,所述基因组合中各基因的基因表达显著地被 正调控,具有小于0. 05的显著系数ρ值。
20.根据权利要求17所述的方法,其中,所述基因组合中各基因的基因表达进一步通 过判别分析和/或系统聚类法分析。
21.根据权利要求16所述的方法,其中,所述人类肿瘤样本为人类肺癌组织。
22.根据权利要求16所述的方法,其中,所述人类肿瘤样本通过比较所述样本中基因 组合中各基因的基因表达与对照组中所述基因组合中各基因的相应的基因表达而测定;其 中,所述基因组合包含SEQ ID NOS 1-7的核酸序列。
23.根据权利要求16所述的方法,其中,所述人类肿瘤通过比较在所述样本中基因组 合中各基因的基因表达与对照组中所述基因组合中各基因的相应的基因表达而测定;其 中,所述基因组合包含SEQ ID NOS 8-17的核酸序列。
24.根据权利要求16所述的方法,其中,所述人类肿瘤样本通过比较在所述样本中基 因组合各基因的基因表达与对照组中所述基因组合中各基因的相应的基因表达而测定;其 中,所述基因组合包含SEQ ID NOS :1-17的核酸序列。
25.一种在人类肿瘤样本中鉴定鳞状细胞癌的方法,其包含 获得所述人类肿瘤样本;测定在基因组合中各基因的基因表达;其中,所述基因组合包含SEQ IDNO 22, SEQ IDNO :23、SEQ ID NO :24、SEQ ID NO :25、SEQ ID NO 26 及 SEQID NO 27 的核酸序列;因此当所述基因组合的基因表达在所述人类肿瘤样本中被正调控时,所述人类肿瘤样 本被鉴定为所述鳞状细胞癌。
26.根据权利要求25所述的方法,其中,所述基因组合通过威尔科克森带符号秩和检 验选取。
27.根据权利要求沈所述的方法,其中,所述基因组合中各基因的基因表达被正调控 约大于1.7倍。
28.根据权利要求沈所述的方法,其中,所述基因组合中各基因的基因表达显著地被 正调控,且具有小于0. 05的显著系数ρ值。
29.根据权利要求25所述的方法,其中,所述基因组合中各基因的基因表达进一步通 过判别分析和/或系统聚类法分析。
30.根据权利要求25所述的方法,其中,所述人类肿瘤样本为人类肺癌组织。
31.根据权利要求25所述的方法,其中,所述人类肿瘤样本通过比较所述样本中基因 组合中各基因的基因表达与对照组中所述基因组合中各基因的相应的基因表达而测定;其 中,所述基因组合包含SEQ ID NOS 1-7的核酸序列。
32.根据权利要求25所述的方法,其中,所述人类肿瘤通过比较在所述样本中基因组 合中各基因的基因表达与对照组中所述基因组合中各基因的相应的基因表达而测定;其 中,所述基因组合包含SEQ ID NOS 8-17的核酸序列。
33.根据权利要求25所述的方法,其中,所述人类肿瘤样本通过比较在所述样本中基 因组合中各基因的基因表达与对照组中所述基因组合中各基因的相应的基因表达而测定; 其中,所述基因组合包含SEQ ID NOS 1-17的核酸序列。
34.根据权利要求25所述的方法,其中,以SEQID NO 44或SEQ ID NO :45置换所述 SEQ ID NO :22。
35.一种对具有肿瘤的人预测转移及存活预后的方法,其包含获得所述人的肿瘤样本;测定在基因组合中各基因的基因表达;其中,所述基因组合包含ANXA5(SEQ ID NO 28),LCK(SEQ ID NO :29)、FRAPl(SEQ ID NO :30)、STATl(SEQ ID NO :31)、NFl(SEQ ID NO: 32),HGF(SEQ ID NO :33),HMMR(SEQ ID NO :34)、IRF4(SEQ ID NO :35)、ZNF264(SEQ ID NO 36)、ErbB3(SEQ ID NO :19)、STAT2 (SEQ ID NO :37),CPEB4 (SEQ ID NO :38),RNF4 (SEQ ID NO :39)、DUSP6(SEQ ID NO :40)、MMD (SEQ ID NO :41)及 DLG2 (SEQ ID NO :42)的基因序列;根据所述基因表达产生所述人的风险分数;将具有所述肿瘤的人的风险分数编入高风险或低风险组别。
36.根据权利要求35所述的方法,其中,所述肿瘤为非小细胞肺癌。
37.根据权利要求35所述的方法,其中,所述风险分数根据所述基因组合中各基因的 基因表达与所述基因的回归系数的乘积的总和计算。
38.根据权利要求37所述的方法,其中,所述风险分数根据下列方程式计算风险分数=-1. 09x ANXA5-0. 84x LCK-0. 77x FRAP1-0. 58x STAT1+0. 47x NF1+0. 5Ix HGF+0. 52xHMMR+0. 52x IRF4+0. 55x ZNF264+0. 55x ErbB3+0. 59x STAT2+0. 59x CPEB4+0. 65x RNF4+0. 75x DUSP6+0. 92xMMD+l. 32x DLG2其中,所述ANXA5、所述LCK、所述FRAPl、所述STATl、所述NFl、所述HGF、所述HMMRjjf 述IRF4、所述ZNF264、所述ErbB3、所述STAT2、所述CP^4、所述RNF4、所述DUSP6、所述MMD、 及所述DLG2于上述方程式中代表所述基因组合中所述基因的基因表达。
39.根据权利要求35所述的方法,其中,所述基因组合是通过单变量Cox比例风险模型 回归分析法挑选。
40.根据权利要求35所述的方法,其中,所述基因表达通过基于cDNA微阵列的技术分析。
41.一种对具有肿瘤的人预测转移及存活预后的方法,其包含获得所述人的肿瘤样本;测定在5-基因组合中各基因的个别基因表达;其中,所述5-基因组合包含LCK(SEQ ID NO 29)、STATl(SEQ ID NO :31)、ErbB3 (SEQ ID NO :19)、DUSP6 (SEQ ID NO :40)及 MMD(SEQ ID NO 41)的核酸序列;使用在5-基因组合中各基因的所述个别基因表达,预测所述具有肿瘤的人为高风险 或低风险。
42.根据权利要求41所述的方法,其中,所述个别基因表达通过实时反转录聚合酶链 式反应(实时RT-PCR)测定。
43.根据权利要求41所述的方法,其中,所述各基因表达通过cDNA微阵列技术分析。
44.根据权利要求41所述的方法,其中,所述预测通过决策树模式预测所述具有肿瘤 的人为高风险或低风险。
45.根据权利要求41所述的方法,其中,所述肿瘤为肺癌。
46.根据权利要求45所述的方法,其中,所述肺癌为非小细胞肺癌。
47.根据权利要求45所述的方法,其中,所述具有肿瘤的人为具有早期肺癌的人。
48.根据权利要求41所述的方法,其中以3-基因组合置换所述5-基因组合,其中, 所述 3-基因组合选自由(I)STATl (SEQ ID NO :31)、ErbB3 (SEQID NO 19)、及 LCK(SEQ ID NO 29) ; (2) STATl (SEQ ID NO :31)、ErbB3 (SEQ ID NO :19)、及 MMD (SEQ ID NO :41); (3) STATl (SEQID NO :31)、ErbB3 (SEQ ID NO : 19)、及 DUSP6 (SEQ ID NO :40) ; (4) LCK (SEQ ID NO :29)、ErbB3(SEQ ID NO : 19)、及 MMD (SEQ ID NO :41);以及 LCK(SEQ ID NO :29)、 ErbB3 (SEQ ID NO : 19)、及 DUSP6 (SEQID NO :40)的核酸序列所组成的组。
49.根据权利要求35所述的方法,其中,所述基因表达通过实时反转录聚合酶链式反 应(实时RT-PCR)测定。
50.一种诊断试剂盒,其包含实时反转录聚合酶链式反应(实时RT-PCR)的试剂,所述 试剂盒是用以分析如权利要求41所述的所述5-基因组合中各基因的个别基因表达。
51.根据权利要求50所述的诊断试剂盒,其中,所述试剂包含针对5-基因组合的特异 性探针及引物。
52.根据权利要求50所述的诊断试剂盒,其中,所述试剂进一步包含分析TATA-盒结合 蛋白基因表达的特异性探针及引物。
53.一种诊断试剂盒,其包含实时反转录聚合酶链式反应(实时RT-PCR)的试剂,所述 试剂盒是用以分析如权利要求48所述的所述3-基因组合中各基因的个别基因表达。
54.根据权利要求53所述的诊断试剂盒,其中,所述试剂进一步包含分析控制基因表达的特异性探针及引物,而所述控制基因编码TATA-盒结合蛋白。
全文摘要
本发明提供用于基因表达谱分析的方法,(1)使用含SEQ ID NOS1-7、8-17或1-17核酸序列的基因组合(gene set)确定人类样本是否为肿瘤;(2)鉴定肿瘤组织是否为腺癌(adenocarcinoma)(使用含SEQ ID NOS15,18-21核酸序列的基因组合)或鳞状细胞癌(squamous cell carcinoma)(使用含SEQID NOS22-27核酸序列的基因组合);及(3)预测存活的预后及在人体内肿瘤的转移(使用含SEQ ID NOS19、28-42或SEQ ID NOS19、29、31、40及42核酸序列的基因组合),特别是在早期肺癌的人类。基因表达谱优选以cDNA微阵列(microarray)为基础的技术和/或实时反转录聚合酶链式反应(Real-Time RT-PCR)进行,并通过统计方法分析。
文档编号C12P19/34GK102099484SQ200780018571
公开日2011年6月15日 申请日期2007年2月9日 优先权日2006年5月22日
发明者俞松良, 周业自, 杨泮池, 杰里米·J·W·陈, 滕涵菁, 陈璇宇 申请人:怡发科技股份有限公司, 达生药物开发公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1