对包括结肠直肠癌细胞的样品进行分型的方法和装置的制作方法

文档序号:581643阅读:487来源:国知局
专利名称:对包括结肠直肠癌细胞的样品进行分型的方法和装置的制作方法
技术领域
本发明涉及肿瘤学领域。更确切地讲,本发明涉及对结肠直肠癌细胞进行分型的方法。本发明提供了区分具有低转移潜力和高转移潜力的结肠直肠癌细胞的装置和方法。
背景技术
2002年在世界范围内诊断了超过一百万的结肠直肠癌新增病例,占所有癌症 IfiI^fMStJ 9% ((Ries et al. , editors. National Cancer Institute Bethesda, MD. 2006. 5-3-2006. SEER Cancer Statistics Review, 1975-2003) 结肠直肠癌是世界范围内继肺癌和乳腺癌之后的第三种最普遍的癌症,所有的结肠直肠癌中的三分之二发生在较发达区域。对于所有的癌症,当在早期检测到癌症时,患者具有较高的存活几率。I期的患者具有 93%的存活率,而II期患者的5年存活率跌至 80%,III期患者的5年存活率跌至 60% (Sobrero et al. ,2006. The Lancet Oncology 7(6) :515-517)。尽管进行了许多的临床试验,辅助化疗对II期结肠癌患者的益处仍然是有争议的(Andre et al. ,2006. Annals of Surgical Oncology 13(6) :887-898)。通过观察 II期结肠癌或结肠直肠癌患者,已进行了比较辅助化疗的临床试验的几种分析和后期分 l/f (meta-analyses) ( ¢"1 ] Benson et al. , 2004. Journal of Clinical Oncology 22 3408-3419)。通过手术只能治愈四分之三的患者,因此,小于25%的患者得益于辅助的化疗。因此,接受辅助化疗的患者数量在发达国家变化很大,官方指导未提供明确的建议(Van Cutsem et al. ,2005. Annals of Oncology 16(suppl_l) :il8_il9)。对于 III 期患者, 辅助治疗被推荐给所有的患者(Gill et al.,2004. Journal of Clinical Oncology 22: 1797-1806),尽管具有Tl或T2mM0肿瘤(第IIIA期)的患者比第II B期患者具有显著更好的存活率,表明许多患者不需要额外的化疗。确定更有可能遭受疾病复发的患者的亚群可以因此确定患者中谁更可能得益于手术后的辅助治疗。已经投入了大量的努力确定预测预后的临床病理参数。预测复发风险的最重要的因素是紧急出现、低分化的肿瘤(组织学级别)和肿瘤侵袭深度和邻近器官浸润(T4)(Van Cutsem et al. ,2005. Annals of Oncology 16(suppl_l) :il8_il9 ;Le Voyer et al. ,2003. Journal of Clinical Oncology 21 J912-2919)。淋巴结评估数量不足是额外的风险因素,因为被评估的淋巴结数量少与5年存活率的降低相关。尽管已显示这些临床参数与结果相关,内科医生意识到它们不足以正确识别高风险患者。目前的病理预测因素不足以确定疾病复发的风险较高的“高风险”患者。因此本发明的目标是提供可以对患有结肠直肠癌患者的癌症样本进行分型的方法和装置,从而确定所述的高风险患者和低风险患者。

发明内容
因此,本发明提供了对患有或怀疑患有结肠直肠癌的个体的RNA样本进行分型的方法,该方法包括提供由所述个体的组织样本制备的RNA样本,所述组织样本包括结肠直肠癌细胞或怀疑包括结肠直肠癌细胞;确定所述RNA样本中的一组基因的RNA水平;和根据确定的所述一组基因的RNA水平对所述RNA样本进行分型;其中所述一组基因包括表1 中列出的至少两个基因。本研究公开了预测疾病复发并且可被添加于当前的临床病理风险评价中从而辅助医生作出治疗决定的稳定基因表达标志。确定更有可能遭受疾病复发的患者的亚群可以确定更有可能得益于辅助化疗和应在手术后进行治疗的患者。在很大程度上去除包括具有B-Raf中的激活突变(BRAFmut)的癌细胞的训练样本之后确定本基因表达标志。发现BRAFmut结肠癌样本的基因表达数据是高度可变的,其掩盖了更广泛的与预后相关的基因表达数据。不希望被理论束缚,所述的可变基因表达可以是由BRAFmut结肠癌样本中的高度的微卫星不稳定性造成的。发现在去除BRAFmut结肠癌样本之后确定得到的基因表达标志是稳定的,适用于包括具有和不具有BRAFmut的癌细胞的样本。结肠直肠癌是一种起源于大肠或包括结肠和直肠的肠的癌症类型。结肠癌和直肠癌具有许多共同特征。大部分的结肠直肠癌是腺癌。它们是沿着结肠和直肠壁的内层排列的细胞的癌症。其它更少见的肿瘤类型也可在结肠和直肠中发展,如良性肿瘤,其由肠的特定激素产生细胞发展而来;胃肠道间质瘤或平滑肌肉瘤,其由肠壁的平滑肌肉细胞发展而来;和淋巴瘤,其是通常在淋巴结中发展的免疫系统细胞的癌症,但也可在结肠和直肠或其它器官发生。腺癌通常以结肠直肠息肉起始,被定义为周围正常大肠粘膜表面之上的可见突出的增生。结肠直肠息肉被分类为瘤性的(腺瘤息肉)或非瘤性的,包括不具有恶性潜能的增生性的、粘膜的、炎症性的和错构性息肉。腺瘤息肉或腺瘤通过柄(有柄的)或通过宽平底(无柄的)连接于肠壁。结肠直肠增生或息肉可发展成恶性腺瘤。使用从具有野生型B-Raf基因的并且包括在每一患者的跟踪时间长度内在患者中不产生转移的结肠直肠癌样本和在每一患者的跟踪时间长度内在患者中产生转移的结肠直肠癌样本的训练组结肠直肠样本分离的RNA,使用基于多变量Cox回归的方法来 3 ^ ! ] (Simon et al.,Design and Analysis of DNA Microarray Investigations, Springer-Verlag New York, (2003) ;Korn et al. , Journal of Statistical Planning and Inference 124, 379-398 (2004)) 0选择其RNA水平与患者的存活率显著相关的基因, 无论患者的分期,其中存活被定义为无癌症复发。表1中列出的每一个基因显示预测存活并且具有最低0. 001的显著性阈值。在优选的实施方式中,最少两个基因的组包括MCTPl (SEQ ID N036)和THNSL2 (SEQ ID NO 13)。更优选的是确定MCTPl (SEQ ID NO 36)和 THNSL2 (SEQ ID NO 13)的表达比例。 具有确定的MCTP1/THNSLC2比高于预定阈值的样本显示为具有低癌症复发风险的样本。具有高MCTP1/THNSLC2比(低风险)的样本显示87%的5年无远处转移存活(DMFS)。具有低MCTP1/THNSLC2比(高风险)的样本显示出70%的DMFS。在优选的实施方式中,本发明的一组基因包括至少三个表1中列出的基因,更优选的是至少四个表1中列出的基因,更优选的是至少五个表1中列出的基因,更优选的是至少六个表1中列出的基因,更优选的是至少七个表1中列出的基因,更优选的是至少八个表 1中列出的基因,更优选的是至少九个表1中列出的基因,更优选的是至少十个表1中列出的基因,更优选的是至少十五个表1中列出的基因,更优选的是至少二十个表1中列出的基因,更优选的是至少二十五个表1中列出的基因,更优选的是至少三十个表1中列出的基因,更优选的是至少四十个表1中列出的基因,更优选的是至少五十个表1中列出的基因, 更优选的是至少六十个表1中列出的基因,更优选的是至少七十个表1中列出的基因,更优选的是至少八十个表1中列出的基因,更优选的是至少九十个表1中列出的基因,更优选的是至少一百个表1中列出的基因,更优选的是至少一百五十个表1中列出的基因,更优选的是至少二百个表1中列出的基因,更优选的是表1中列出的所有基因。用于本发明的方法的优选基因组包括表1中列出的排序为最初两个的基因,更优选排序为最初三个的基因,更优选排序为最初四个的基因,更优选排序为最初五个的基因,更优选排序为最初六个的基因,更优选排序为最初七个的基因,更优选排序为最初八个的基因,更优选排序为最初九个的基因,更优选排序为最初十个的基因,更优选排序为最初十五个的基因,更优选排序为最初二十个的基因,更优选排序为最初三十个的基因,更优选排序为最初四十个的基因,更优选排序为最初五十个的基因,更优选排序为最初六十个的基因,更优选排序为最初七十个的基因,更优选排序为最初八十个的基因,更优选排序为最初九十个的基因,更优选排序为最初一百个的基因,更优选排序为最初一百五十个的基因, 更优选排序为最初两百个的基因,更优选表1中列出的所有二百零九个基因。其它优选的标志包括表1中被称为^ED4、LIF、PIM3、IL2RA、PYROXDU CTSC、 EDEMU M6PRBP1、SLC6A12、THNSL2、PPARA, ZNF697、LAMA3、CA438802、MCTP 1、HSD3B 1、 CYFIP2、IL2RB的基因,也被称为“18基因谱”。其它优选的标志包括表1中被称为^ED4、LIF、IL18R1、PIM3、IL2RA、PYROXDU CTSC、EDEMU M6PRBP1、SLC6A12、THNSL2、KCNJlO, THC2663361、C10orf67、KIAA0040、 BC040628、AK096685、PIGW、PPARA,COLQ、AK021427、C 15orf27、PRDM4、L0C165186、ZNF697、 CRYGA, EEPDl、LAMA3、NEDD8、CA438802、MCTPl、HSD3B1、CYFIP2、IL2RB、XKR3、NT 035113、 THC2520461 和 TH(^662025 的基因。细胞样本是包括结肠直肠癌细胞或包括来自结肠直肠癌细胞的核酸的表达产物的临床相关样本。在优选的实施方式中,手术过程中直接从大肠得到本发明的细胞样本。在可替换的实施方式中,结肠镜检查过程中取得活组织检查样本来制备细胞样本。还优选活组织具有最多10毫米的深度,更优选最多5毫米的深度,优选直径约2 毫米,更优选约3毫米,更优选约4毫米,更优选约5毫米,更优选约6毫米,更优选约7毫米,更优选约8毫米,更优选约9毫米,更优选约10毫米。但是,尺寸和总体积相等的其它形式也是可能的。在另一优选的实施方式中,组织样本包括患有结肠直肠癌患者排出的粪便和血液,所述的组织样本包括结肠直肠癌细胞或基因表达产物,如结肠直肠癌细胞的核酸产物。 纯化细胞或基因表达产物的方法,如人粪便或血液样本的RNA在所属领域中是已知的,例如,在专利申请 W0199820355、W02003068788 和 Yang et al. 2005. Cancer Lett 226 :55-63 中进行了描述,其通过弓I用并入本文。可以多种方式处理样本,这对于技术人员是已知的。例如,在富集时由细胞或组织新鲜制备,或可由样本制备处理前储藏于_70°C的样本进行制备。可替换地,可在保持蛋白质或RNA质量的条件下储存组织、活组织检查、粪便或血液样本。这些保存条件的实施例是使用例如福尔马林进行固定,如RNAsin(Pharmingen)或RNasecure (Ambion)的RNase 抑制剂,如RNAlater (Assuragen ;US06204375)的水溶液,H印es_谷氨酸缓冲液介导的有机溶剂保护效果(HOPE ;DE10021390),和 RCL2 (Alphelys ;W004083369),和如 Universal Molecular Fixative (Sakura Finetek USA Inc. ;US7138226)的非水溶液。可通过所属领域中已知的任意方法确定表1列出的至少两个基因的RNA水平。确定基因的RNA水平的方法对于技术人员是已知的,包括,但是不限定于,Northern杂交、定量PCR和微阵列分析。Northern杂交包括凝胶电泳分离核酸表达产物之后,通过杂交与所述核酸表达产物特异性相互作用的标记探针将特殊基因的核酸表达产物定量化。与所述核酸表达产物相互作用的标记探针的定量化用于测量确定表达水平。可通过比较已知样本之间的表达水平无差异的基因的表达水平来对两个独立样本之间的核酸表达产物的总量差异,将确定的表达水平归一化。定量聚合酶链式反应(qPCR)提供了定量核酸表达水平的可替换方法。可通过实时PCR(rtPCR)进行qPCR,其中在反应过程中监控产物量,或通过确定终产物量的终点测量。这对技术人员是已知的,可通过使用核酸嵌入剂,如,例如溴化乙锭或SYBRJ^ I染料实施rtPCR,其相互作用使所有产生的双链产物导致扩增过程中荧光提高,或通过使用与感兴趣的基因产生的双链产物特异性反应的标记探针。树状信号扩增、杂交信号扩增和分子信标提供了可替换的检测方法。可使用技术人员已知的不同的扩增方法用于qPCR,包括但不限于PCR、滚环扩增、 核酸序列扩增、转录介导的扩增和线性RNA扩增。为了同时检测多个核酸基因表达产物,可使用如逆转录酶-多重连接-依赖性扩增(rtMLPA),其在一管试验中精确定量达到45个感兴趣的转录子(Eldering et al., NucleicAcids Res 2003 ;31 :el53)。微阵列分析涉及使用选择的被固定于表面上的生物分子。微阵列通常包括核酸分子、条件探针,其能够与核酸表达产物杂交。探针暴露于标记的样本核酸,杂交,确定样本中与探针互补的大量的核酸表达产物。微阵列上的探针可包括DNA序列、RNA序列或DNA和 RNA共聚物序列。探针还可包括DNA和/或RNA类似物,如,例如核酸类似物或肽核酸分子 (PNA),或其组合。探针的序列可以是完整的基因组DNA或基因组DNA部分片段。还可以是体外合成的核酸序列,如合成的寡核苷酸序列。优选同时确定所述的RNA水平。可进行同时分析,例如通过多重qPCR和微阵列分析。微阵列分析可以同时确定大量基因的核酸表达水平,如超过50个基因,超过100个基因,超过1000个基因,甚至超过10000基因,从而可以使用大量基因表达数据用于包括结肠直肠表达谱的基因的归一化。因此,在优选的实施方式中,通过微阵列分析确定所述的RNA水平。所述的探针对于表1列出的基因是特异性的。当其包括与所述基因的RNA产物或其cDNA产物的核苷酸序列完全互补的连续延伸的核苷酸时,探针可以是特异性的。当其包括部分互补于所述基因的RNA产物,或其cDNA产物的核苷酸序列的连续延伸的核苷酸时, 探针也可以是特异性的。“部分地”表示连续延伸的至少20个核苷酸中最多5%的核苷酸与所述基因的RNA产物的对应核苷酸序列不同。术语“互补”对于所述领域来说是已知的, 是指通过碱基配对原则与要被检测的序列相关联的序列。优选仔细设计探针序列从而将对所述探针的非特异性杂交最小化。优选探针是或模拟单链核酸分子。所述互补的连续延伸的核苷酸的长度可以在15个碱基和几千个碱基之间变化,优选20个碱基和1千个碱基之间,更优选40个碱基和100个碱基之间,最优选60个核苷酸。最优选的探针包括60个连续延伸的核苷酸,其与基因的RNA产物,或其cDNA产物的核苷酸序列一致。
为了确定表1列出的至少两个基因的RNA水平,优选直接或间接标记RNA样本,并且有利于探针和标记的RNA样本中的互补分子之间形成双链体的条件下,接触阵列上的探针。清洗微阵列之后,确定保持与探针相连的标记的数量,该数量被用于测量互补于所述探针的核酸分子的RNA水平。可将确定的表1列出的至少两个基因的RNA水平归一化从而校正系统偏差。由于阵列内整体性能的差异,系统偏差导致变化,其可以是由于,例如,阵列构建、染色和扫描的不一致性,和标记RNA样本之间的变化,其可以是由于,例如纯度的变化。在微阵列实验中操作样本的过程中会引入系统偏差。为了降低系统偏差,优选校正确定的RNA水平的背景非特异性杂交,使用例如feature Extraction软件(Agilent Technologies)进行归一化。 其它的方法对于所属领域的一般技术人员是已知的,如dye swap实验(Martin-Magniette et al.,Bioinformatics 21 :1995-2000(2005))可被用于归一化染料偏差引入的差异。表达水平的归一化产生了归一化的表达值。归一化阵列数据的传统方法包括全局分析,其是基于阵列上的大部分遗传标记在样品之间表达是无差异的假设(Yang et al. ,Nucl Acids Res 30 :15(2002))。或者,阵列可包括用于归一化的特异性探针。这些探针优选检测管家基因的RNA产物,如甘油醛-3-磷酸脱氢酶和18S rRNA水平,其RNA水平被认为在特定细胞中是恒定的并且与所述细胞的发育阶段或预后无关。因此,本发明的优选方法还包括将所述样本中表1列出的至少两个基因的所述组的确定的RNA水平归一化。所述归一化优选包括中值中心,其中大部分基因在条件之间是不变化的假设下, 使阵列数据的“中心”成为同一水平。所述的归一化优选包括Lowess (局部加权回归散点平滑法)局部回归归一化从而校正点样和强度依赖性偏差。在优选的实施方式中,选择RNA水平在包括一个个体的结肠直肠细胞的不同组织样本之间,和包括不同个体的结肠直肠细胞的组织样本之间,基本上是稳定的基因。还优选所述的归一化基因组的RNA水平在不同基因之间具有差异。例如,优先选择在所述组织样本中具有低RNA水平的基因,和具有高RNA水平的基因。更优选的是选择在所述组织样本中具有低RNA水平的基因,具有中等RNA水平的基因,和具有高RNA水平的基因。对于技术人员可清楚所述归一化基因组的RNA水平可以在整个RNA水平的范围上进行归一化。优选的方法还包括将每一个归一化了的表达值乘以所述基因的预定常数从而得到所述基因的相对RNA水平的加权值,和由此的所述基因组的加权值组,所述方法还包括根据所述的加权值组对所述样本分型。将所述加权值组加和,并且与参考样本的加权值组的加和进行比较。优选,所述加和的加权值组与分类阈值进行比较,通过对已知的RNA样本得到的值进行分型确定分类阈
根据周围组织的可见的侵袭来对如腺癌的结肠直肠癌进行分期。TNM分期系统提供了分期系统,其组合了肿瘤的数据(T)、淋巴结扩增(N)和远处转移的存在(M)。
Μ I期结肠直肠癌被确定为开始扩散并且已侵袭粘膜下层或固有肌层的癌症。TNM II期确定了经过固有肌层侵袭到浆膜下层中的,或侵袭到结肠周或直肠周组织中的,但是未达到淋巴结的癌症。III期确定了已经扩散到淋巴结未远处转移的癌症。IV期确定了已经扩散至远处位点的癌症。在优选的实施方式中,本发明提供了对患有结肠直肠癌的个体进行分型的方法, 其中所述结肠直肠癌包括 M分期系统确定的 M I期、 MII期、 M III期,其中 M II 期和TNM III期是优选的结肠直肠癌。优选本发明的方法中的所述分型可以区别具有低转移潜力或复发风险的癌细胞和具有高转移潜力或复发风险的癌细胞。为了区别具有低转移潜力的癌细胞和具有高转移潜力的癌细胞,可将表1列出的至少两个基因的RNA水平与对照样本中的所述基因的RNA水平进行比较。参考样本优选是从健康个体的结肠直肠组织分离的RNA样本,或相关细胞系或细胞系混合物的RNA样本。所述的参考样本还可以是患有结肠直肠癌的个体的癌生长的RNA 样本。所述的患有结肠直肠癌的个体可具有提高的癌症复发的风险,或降低的癌症复发的风险。优选所述参考样本是患有结肠直肠癌并且具有低癌症复发风险的个体的RNA样本。在更优选的实施方式中,所述的参考样本是包括患有结肠直肠癌并且具有低癌症复发风险的个体的结肠直肠细胞的多个组织样本的RNA样本集合。优选所述的多个组织样本包括超过10个组织样本,更优选超过20个组织样本,更优选超过30个组织样本,更优选超过 40个组织样本,最优选超过50个组织样本。最优选的参考样本包括包含了具有低癌症复发风险的个体和具有高癌症复发风险的个体的结肠直肠癌细胞的多个组织样本的RNA集合。其它的优选参考样本包括从健康个体的结肠组织,或从结肠癌患者的所谓的正常的临近组织或一般细胞系或细胞系混合物的RNA分离和富集的RNA。细胞或细胞系混合物的RNA可以机构内部产生或从商业来源获得,如,例如Mratagene人参考RNA。可以以各种方式进行样本分型。在一个方法中,确定系数,其是测量样本与所述参考样本的相似性或不同点。多个不同的系数可被用于确定个体和参考样本的RNA样本中的 RNA表达水平之间的相关性。优选的方法是其假设数据的正常分布的参数方法。这些方法中的一个是皮尔逊禾只矩相关系数(Pearson profuct-moment correlation coefficient), 其通过两个变量的协方差除以它们的标准偏差的值得到。优选的方法包括余弦角、非中心相关性,更优选余弦相关性(Fan et al.,Conf Proc IEEE Eng Med Biol Soc. 5 4810-3(2005))ο优选,所述的与参考样本的相关性被用于产生使用的基因组的整体相似性值。相似性值是测量个体和参考样本的RNA样本的基因组RNA水平的平均相关性的测量。所述的相似性值可以是,例如+1和-1之间的数值,+1表示所述个体和所述参考样本的RNA样本中的基因组的RNA表达水平之间的高度相关性,-1表示负相关从而表示具有提高的癌症复发的风险(van ‘t Veer et al. , Nature 415 :484-5 (2002))
在另一方面,本发明提供了对患有结肠直肠癌的个体分类的方法,包括通过包括确定所述个体的RNA样本中表1列出的至少两个基因的组的RNA水平和初始诊断5年内未疾病复发的患者的RNA样本的所述基因组的表达水平的相似性值的方法,将所述个体分类为具有不良预后或良好预后,如果所述相似性值低于相似性阈值,将所述个体分类为具有不良预后,如果所述的相似性值超过了相似性阈值,将所述个体分类为具有良好预后。本发明提供了用于区别具有良好预后的结肠直肠癌患者的样本与具有不良预后的结肠直肠癌患者的样本的标志物组。在本发明的方法中,这些标志物的表达水平被用于确定患有结肠癌的个体是否会具有良好或不良的临床预后。在一个实施方式中,本发明提供了确定患有结肠癌的个体是否可能在初始诊断的五年内复发的方法(即,患者是否具有不良预后),包括(1)将取自个体的样本中的表1列出的至少两个基因的表达水平与对照中的相同标志物的水平进行比较,其中所述对照的水平代表了具有不良预后的个体中发现的;和( 确定个体样本的所述至少两个基因的每一个基因的表达水平是或不是显著不同于对照。如果未发现实质性差异,患者具有不良预后,如果发现实质性差异,患者具有良好预后。所属领域的技术人员会容易理解所述的对照水平或者可以代表在具有良好预后的个体中发现的。在一个更具体的实施方式中,两个对照都进行。在样本集合不是纯粹的“良好预后”或“不良预后”的情况下,具有已知结果的个体的实验组应与集合杂交从而确定良好预后和不良预后组的表达对照水平。每一个具有未知结果的个体应与相同的集合杂交,比较得到的表达谱与模板从而预测其结果。结肠癌的不良预后可表示肿瘤具有相对的侵袭性,而良好的预后可表示肿瘤是相对非侵袭性的。因此,本发明提供了确定治疗结肠癌患者的治疗过程的方法,包括确定表1的至少两个基因的表达水平是否与代表良好预后表达形式或不良预后形式的样本中的这些基因的水平相关;和确定治疗的过程,其中如果表达与不良预后形式相关,肿瘤被作为侵袭性肿瘤进行治疗。优选的将样本分类为高或低疾病复发风险的方法涉及使用分类模板,分类模板来自使用被确定为与疾病进展相关的所有基因的支持向量机(Support Vector Machine) (SVM)训练。模板中的每一基因(标志)具有对应的权重因子,由Chang和Lin的SVM实施石角定(Chih_Churig Chang and Chih-Jen Lin,LIB SVM -.a library for support vector machines, 2001. http: //www, csie. ntu. edu. tw/ c.jlin/libsvm)。该算法分析所有训练组样本的标志基因中含有的信息,并且构建最佳区分复发患者和未复发患者的分类模板。 Chih-Chung Chang和Chih-Jen Lin发展的LIBSVM是用于分析监督分类或回归框架中的多个问题的综合软件。相似性阈值是可以区分具有高癌症复发风险的患者的RNA样本和具有低癌症复发风险的患者的RNA样本的任意值。所述的相似性阈值被设定为以下的阈值,可接受数量的初始诊断后五年内具有已知的转移形成的患者被记为超过阈值的假阴性,和可接受数量的在初始诊断后五年内不具有已知转移形成的患者被记为低于阈值的假阳性的值。相似性值优选被显示或输出给使用者的界面装置、计算机可读存储介质或本地或远端的计算机系统。
在可替换的实施方式中,本发明提供了对患有结肠直肠癌的个体进行分类的方法,包括将所述个体分类为具有不良预后或良好预后,通过包括(a)提供通过所述个体的组织样本制备的所述个体的RNA样本,所述的组织样本包括结肠直肠癌细胞或怀疑包括结肠直肠癌细胞;(b)确定所述样本中包括表1列出的至少两个基因的基因组的RNA水平; (c)确定所述个体的基因组的表达水平和初始诊断五年内未疾病复发的患者的所述基因组的表达水平之间的相似性值;和(d)如果所述相似性值低于第一相似相阈值,将所述个体分类为具有不良预后的,如果所述相似性值超过所述第一相似性阈值,将所述个体分类为具有良好预后的。在本发明的优选方法中,所述样本中的包括表1所列出的至少两个基因的基因组的RNA水平被归一化。可通过技术人员已知的任意方法进行归一化,包括全局分析和使用特异性探针。仍然在另一方面,本发明提供了对患有结肠直肠癌的个体指定治疗的方法,包括根据本发明的方法将所述个体分类为具有不良预后或良好预后的,如果所述个体被分类为具有不良预后的,指定辅助化疗。结肠直肠癌的常规治疗是手术,如果所述个体被分类为具有不良预后的,手术随后是附加治疗。所述的附加治疗选自辅助化疗或放射治疗。化疗包括使用天然或非天然的化合物从而消除快速分裂因此易感的癌症细胞。化疗化合物包括烷化剂,如氨烯咪胺和环磷酰胺;DNA交联剂,如顺钼和卡波钼;抗代谢剂,如甲氨蝶呤、5-氟尿嘧啶(5FU)和巯基嘌呤;alkaloidic agent如,如紫杉醇和紫杉萜的紫杉烷类,长春新碱和长春碱;局部异构酶抑制剂,如喜树碱和安吖啶;抗生素,如蒽环类糖苷,如阿霉素、柔毛霉素、去甲氧正定霉素、 吡喃阿霉素和表柔比星;丝裂霉素;多氨生物合成抑制剂,如依洛尼塞;菌酚酸和其它的肌苷一磷酸脱氢酶抑制剂;和蒽吡唑,如米托蒽醌、吡罗蒽醌和洛索蒽醌。目前包括改进的 M III期或更高的结肠直肠癌的标准的手术辅助治疗是 FOLFOX 4。FOLFOX组合了奥沙利钼、甲酰四氢叶酸和输注5FU。甲酰四氢叶酸是用于提高化疗,尤其是5FU,的抗癌效果的药物。其它治疗应用是XEL0X,包括奥沙利钼和卡培他滨的组合疗法;F0LHRI,其组合了 5-FU、甲酰四氢叶酸,和依立替抗、局部异构酶1抑制剂。这些可与基于抗体的治疗组合,抗体治疗包括但是不限定于贝伐单抗,其抑制血管再生,西妥昔单抗-表皮生长因子受体抑制剂,和panitumumab-表皮生长因子受体抑制剂。起源于结肠或直肠中的癌症被命名为结肠直肠癌或肠癌。所述的癌症包括结肠癌和直肠癌。在优选的实施方式中,本发明的结肠直肠癌涉及结肠癌。在另一优选的实施方式中,本发明的结肠直肠癌涉及直肠癌。在另一方面,本发明提供了根据本发明对结肠直肠癌细胞进行分型从而筛选对治疗有反应的机会提高的患者的方法。本发明的方法可以有助于确定具有某些并发症风险或优先得益于特殊治疗的结肠直肠癌患者的亚组。结肠直肠亚型的信息也可大幅度改进未来的结肠直肠临床研究的设计,通过提高患者的筛选,降低变化性和集中于相关结果的测量。在其它方面,本发明提供了形成结肠直肠基因标志用于对患有结肠直肠癌或怀疑患有其的个体的RNA样本进行分型的方法,包括确定从非微卫星不稳定(非MSI)结肠直肠癌得到的RNA样本中与无远处转移存活期相关的基因组,由此所述的无远处转移存活期是2年,更优选3年,更优选4年,更优选5年,更优选超过5年。所述的非MSI结肠直肠癌优选不包括低水平微卫星不稳定(MSI-L)结肠直肠样本。MSI通常是由于错配修复基因 MLHU MSH2、MSH6或PMS2中的一个的突变造成,导致患者肿瘤的高水平的微卫星不稳定性 (MSI-高)。MSI试验是基于所述错配修复基因的突变分析。本发明优选提供了对用于患有结肠直肠癌或怀疑患有其的个体的RNA样本进行分型的结肠直肠基因标志形成的方法,包括确定从在B-Raf的600位置具有缬氨酸的结肠直肠癌样本得到的RNA样本中的无远处转移存活期相关的基因组,由此所述的无远处转移存活期是2年,更优选3年,更优选4年,更优选5年,更优选超过5年。另一方面,本发明提供了包括第一组的核酸分子的包括5至12000个核酸分子的阵列,其中所述第一组的每一个核酸分子包括能够杂交于选自由表1列出的基因的不同基因的核苷酸序列。所述第一组的核苷酸序列优选包括两个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选三个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选四个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选五个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选六个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选十个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选十八个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选三十八个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选四十四个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选五十个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,更优选一百个能够杂交于选自表1 列出的基因的不同基因的核苷酸序列,更优选所有两百零九个能够杂交于选自表1列出的基因的不同基因的核苷酸序列。在最优选的实施方式中,所述阵列包括至少十八个能够杂交于选自表1列出的基因的不同基因的核苷酸序列,其被表示为属于18基因谱。在优选的实施方式中,本发明的阵列还包括第二组核酸分子,其中所述第二组的每一核酸分子包括能够杂交于归一化基因的核苷酸序列,由此,其优选所述的归一化基因的RNA水平是不相似的。在另一方面,本发明提供了本发明的阵列的用于获得结肠直肠表达谱的应用。


图1 未监控分析确定三种结肠亚类。图2 对基因与5年无远处转移存活(DMFS)相关性的评分。图3 :18-基因谱的复发时间的Kaplan Meier分析。图4 11期和III期结肠样本中的18基因谱的复发时间的Kaplan Meier分析。图5 治疗和未治疗的结肠样本中的18基因谱的复发时间的Kaplan Meier分析。图6 验证组中的低风险和高风险患者的治疗益处。图7 通过18基因谱被分类为低风险和高风险的样本之间的区别。图8 :MCTP1/THNSL2比率对于结肠预后的应用。图9 使用18-基因谱的I期结肠样本的复发时间的Kaplan Meier分析。
具体实施例方式实施例
实施例1 分类的产生患者手术时记录的临床和病理信息包括肿瘤的分期、级别、尺寸和位置。此外,在95% 的案例中描述了评价淋巴结转移的淋巴结数目。根据TMN分期系统对肿瘤进行分期。从适当知情同意的患者收集所有的组织样本。根据赫尔辛基宣言的伦理标准进行研究,并且得到了参与的医疗中心和医院的医学伦理委员会的批准。监控患者的存活和复发长达270个月。突变分析使用测序方法对所有样本进行突变分析,包括训练组和验证组。cDNA扩增之后分析外显子15中的B-Raf突变从而检测V600E激活突变。使用的引物是(引物 1)5, -tgatcaaacttatagatattgcacga 和(弓丨物 2)5, -tcatacagaacaattccaaatgc。使用 Macherey-Nagel NucleoFast 纯化试剂盒纯化扩增产物。在很大程度上从样本的训练组去除包括B-Raf中的V600E激活突变的样本。微卫星不稳定(MSI)状态通过之前的描述(Gonzalez-Garcia et al. 2000. J Natl Cancer Inst 92 :5423) 确定145个患者的MSI状态(训练组中η = 90和验证组中η = 55)。简单来说,通过聚合酶链式反应(PCR)从成对的正常和肿瘤组织扩增六个微卫星DNA区,在变性聚丙烯酰胺测序凝胶上分析产物。根据与正常DNA相比较肿瘤DNA中不存在(稳定的)或存在(不稳定)迁移率变动的条带或额外的条带,对每一微卫星的稳定性进行评分。当条带模式难以解析或未从正常的或肿瘤DNA获得扩增产物,样本被评分为未经分析。22个患者的样本被分类为MSI-高(MSI-高)。微阵列杂交冷冻肿瘤样本的总RNA的等分被用于本研究。使用低RNA投入荧光标记试剂盒 (Low RNA Input Fluorescent Labeling Kit) (Agilent Technologies)扩增200纳克的总 RNA。Cyanine 3-CTP或Cyanine 5-CTP (GE Health Care)在体外转录的过程中直接结合到cRNA中。总共750ng的酞菁标记的RNA与标准参考于60摄氏度共杂交于Agilent 44k 寡核苷酸微阵列达17小时,随后根据Agilent的标准杂交方案进行清洗(Agilent Oligo Microarray Kit,Agilent Technologies)。所述的标准参考(结肠参考集合)包括44个结肠直肠癌样本,其中的13个是从手术后5年内发生了转移的患者得到,31个是从手术后5年内未发展转移的患者得到。微阵列图像分析对扫描图像上的荧光强度进行定量,对值进行背景非特异性杂交校正,并根据厂商推荐的对于Agilent Whole Genome 44k微阵列的设置使用Agilent Feature Extraction软件(9. 5. 1. 3版)进行归一化。该微阵列的默认归一化方法包括线性和 Lowess元件,其校正Cy3/5染料结合的任意差异并且将最终的谱定中心于0 (log 10级, Cy5/Cy3)。 $ Agilent Feature Extraction Reference Guide 巾禾呈。iii^Ti^ 用,如,例如R/Bioconductor软件中提供的其它的常规的归一化程序。数据预处理使用Agendia XPrint软件(1. 5. 1版)对每一杂交的归一化的基因表达比进行组合从而产生每一患者的单一基因表达谱,或者使用R/Bioconductor软件中可用的数据分析程序。为了得到阵列上的每一标志基因的单一表达比值,将属于相同基因的探针的误差加权平均值计算为IoglO或log2比。为了得到合适的相对加权,使用Rosetta误差模式,其校正个体探针测量的不确定性(Weng L et al,Bioinformatics 22 :1111-21 Q006))。产生了包含归一化的、误差加权的log比的文本文件,其随后被用于进一步的分析。然后将数据加载到 BRB ArrayTools (Simon et al. ,Cancer Informatics 2 11-17 (2007)) 为了得到阵列上每一个独特的探针的单一表达比值,计算所有出现超过一次的探针的平均比值。或者,在R/Bioconductor软件中加载表达值并进行分析。预后基因选择基于完整基因组基因表达测量的无监督分级类显示存在3种主要的结肠分子亚类(见图1)。这3类的存活分析显示一种亚型具有相对不良的结果(亚型C),一种亚型 (亚型A)显示出良好的结果(A与C的五年无远处转移存活风险比是1. 8,P = 0. 15)。这些亚型的其它研究显示,对于具有激活BRAF突变状态(BRAFmut)的样本富含两种与存活相关的亚型A和C,尤其是良好结果类(良好结果类A 52% BRAFmut,不良结果类C 22% BRAFmut,相对比于剩余的亚类B的4% )。这些发现提示A类和C类中的样本显示出不同的基因表达,其可能与激活的BRAF突变表型相关。BRAFmut亚类显然富含具有微卫星不稳定性(MSI)的结肠样本。因此观察的结肠聚类可表示为两个已知的不同的结肠肿瘤发展途径MSS (B亚型)和MSI起源的(亚型A,也可能是亚型C)。因为可根据完整基因组的无监督聚类区别A类和C类,具有良好和不良结果的 BRAFmut样本之间的差异是相对较大的。BRAFmut样本内的这种大差异可能掩盖更普遍的与预后相关的基因表达,该表达对于所有的结肠亚型是明显的,包括亚型B,其构成具有混合的预后结果的野生型BRAF样本的96% (100/104)。为了避免强BRAFmut相关的基因表达差异,只在亚型B中进一步研究预后相关的基因表达(n = 104),随后应用于所有的样本 (n = 188)。在验证程序过程中使用“留一法”,对所有基因与5年无远处转移存活(DMre)的相关性进行评分。一组209个基因在至少一个重复中显示出稳定的DMFS相关性(表1),而 38个非多余的探针(来自总共44个探针组)经过50%的所有重复显示出稳定的DMFS相关(见图2)。为了保证选择的基因是最适合于诊断应用并且使用不同的阵列类型和/或参考产生相等的读出,我们证明了 HD对CRP参考上测量的表达是对不同的低密度(LD)阵列类型和使用不同的参考(通用人细胞系,UHR)上的。38个探针中的十八个可以与LD的相符, 在使用两种平台分析的整个1 个训练样本显示出高度相关的基因表达读出(R2 > 0. 50)。 这18个探针对应于18个基因或0RF,被用于随后的谱形成(见图7)。实施例2 分类训练18个确定的基因被用于构建结肠预后分类,其类似于在先确定的乳癌预后标志 (W02002103320 ;其通过引用结合到本文中作为参考)。对于每一样本,根据该样本中的 18-基因表达方式计算低风险评分和高风险评分。组合两个评分为最终指数。以达到最佳的灵敏性和特异性的方式确定分类指数评分的最佳阈值。如果样本的指数超过阈值(-0. 05), 其被认为是高风险样本,反之亦然。训练组的谱结果的存活分析(在验证程序中使用留一法)显示低风险样本的82%的5年DMFS率(95CI,76-89% )和高风险样本的50%的5年 DMFS率(95% Cl, 38-66% )的3. 41的风险比(HR) (P = 1. 4e_5)。对于高风险类和低风险类,无疾病的存活都是相对较低的,可能是因为训练组中的绝大部分的样本未接受辅助化疗。分别对于BRAF野生型和BRAFmut样本的分析证实18-基因谱与BRAF突变状态无关 (图 3)。实施例3 分类评价在178个独立组的II期和III期结肠样本上验证18-基因谱。该谱将61%的验证样本分类为低风险,将39%分类为高风险。低风险和高风险样本显示具有3. 19的HR(P =8. 5e-4)的DMFS显著差异。对于低风险样本,五年DMFS率是89% (95CI,93-95% ),对于高风险样本是62% (95CI, 50-77% ) 在只有II期患者的亚分析中,18-基因谱具有3. 61 (0 = 0. 01)的HR,对于低风险患者,五年DMFS率是91% (95(1,84-98%),对于高风险患者是71.8% (95CI, 57-87% ) 在只有III期患者的亚分析中,18-基因谱具有2. 72 (0 = 0. 045),对于低风险患者,五年 DMFS 率是 84. 3% (95CI,71. 4-97. 2% ),对于高风险患者是 49. 4% (95CI,27. 4-71. 3% )。接下来,我们研究了 18-基因谱是否只对于未治疗的患者,或者还对于已经接受化疗治疗的患者的样本显示出预后能力。18-基因谱对于未治疗的样本(P = 0. 0082)和治疗的患者(P = 0.016)都显示出显著的性能,表示该谱的性能不是由于治疗的益处造成的 (图 5)。发现具有MSI-H的患者具有高频率的B-Raf突变(50 ,并且主要是低风险 18-基因谱(19/22 = 86% ),表示通过基因分类确定了 MSI-H患者的良好预后。对于该分类与其它临床因素的比较,只使用了验证组的结果。在单变量分析中, 18-基因谱是最强的DMFS预报。只有分期和淋巴结状态显示了相似级别的统计显著性。在所有样本,或者只是II期或III期患者的多变量分析中,18-基因谱仍然是最强的重要的独立的预后因素(表幻。对于多变量分析,包括单变量分析中所有的具有0. 1或更好的ρ值的临床参数。当18-基因谱的结果与目前使用的基于ASCO推荐的风险评价(被称为ASCO风险)进行比较时,18-基因谱表现优于该临床风险评价(表3)。II期患者的多变量分析显示该基因表达谱是远处转移发展的最强的预报,独立于ASCO列出的单独(HR = 3. 56,95% CI 1. 35-9. 39,p = 0. 010)或组合(HR = 3. 6452,95% CI 1. 3337-9. 3365,ρ = 0. 011)的因素。18-基因谱和ASCO标准之间在风险分层上具有高度的不一致性,表示18-基因谱可补充和改进临床风险评价。在II期患者亚群中,通过18-基因谱指数,41个(36%)接受了辅助化疗的患者中,观个(68% )被分类为低风险指数,13个(32% )被分类为高风险,化疗给药也不是显著的预后因素。实施例4验证组中的低风险和高风险患者的治疗益处通过分析治疗的与未治疗的18-基因低风险和高风险患者的5年DM发展率,确定化疗的治疗益处。对于被分类为低风险(ΙΙ/ΠΙ期,-0% DM ;II期,+2. 7% DM)的患者无治疗益处。对高风险患者(ΙΙ/ΠΙ期,-10. 4% DM ;II期,-9. 5% DM)观察到治疗益处。这些结果显示(图6)高风险患者更可能受益于化疗。实施例5结肠预后的MCTP1/THNSL2比使用MCTPl和THNSL2基因例示了二基因预后模型的预后能力。在188个训练样本上确定了 MCTP1/THNSLC2比的阈值,该阈值显示出HR为3. 1 (P = 6. 8e_5)的显著性。具有超过阈值的高MCTP1/THNSLC2比的样本被分类为低风险。在178个独立的验证样本上证实了 MCTP1/THNSLC2比模型,并且显示了 HR为2. 3的显著性(P = 0. 017)(图8)。具有高 MCTP1/THNSLC2比的验证样本(低风险)显示87% (95CI,80-95% )的5年DMFS,具有低 MCTP1/THNSLC2 比的样本(高风险)显示了0% (95CI,60-82% )的 DMFS。实施例6此外,我们研究了 30个I期结肠癌患者组的18-基因谱。一个患者显示出远处转移形成。通过18-基因谱,该患者被正确地确定为高风险(图9)。表权利要求
1.一种对患有结肠直肠癌或怀疑患有结肠直肠癌的个体的RNA样本进行分型的方法, 所述方法包括a.提供从所述个体的组织样本制备的RNA样本,所述组织样本包括结肠直肠癌细胞或怀疑包括结肠直肠癌细胞;b.确定所述RNA样本中的一个基因组的RNA水平;和c.根据所述基因组确定的RNA水平对所述RNA样本进行分型;其中,所述基因组包括表1中列出的至少两个基因。
2.根据权利要求1所述的方法,其中,所述基因组包括表1中列出的至少十个基因。
3.根据权利要求1所述的方法,其中,所述基因组包括MCTP1、LAMA3、CTSC、PYROXDU EDEMl、IL2RB、ZNF697、SLC6A12、IL2RA、CYXIP2、PIM3、LIF、M6PRBP1、CA438802、HSD3B1、 ZBED4、PPARA、THNSL2。
4.根据权利要求1-3中任一项所述的方法,通过微阵列分析确定所述RNA水平。
5.根据前述权利要求中的任一项所述的方法,还包括归一化所述样本中的所述基因组确定的RNA水平。
6.根据前述权利要求中任一项所述的方法,所述结肠直肠癌包括根据TNM分期系统的 TNM I期、TNM II期或TNM III期癌症。
7.根据前述权利要求中任一项所述的方法,所述分型区别具有低转移潜力的癌细胞和具有高转移潜力的癌细胞。
8.—种对患有结肠直肠癌的个体进行分类的方法,包括通过以下方法将所述个体分类为具有不良预后或良好预后,所述方法包括(a)提供由所述个体的组织样本制备的所述个体的RNA样本,所述组织样本包括结肠直肠癌细胞或怀疑包括结肠直肠癌细胞;(b)确定包括所述样本中的表1列出的至少两个基因的基因组的RNA水平;(c)确定所述个体的基因组的表达水平与初始诊断5年内无疾病复发的患者的所述基因组的表达水平之间的相似性值;并且(d)如果所述相似性值低于第一相似性阈值,将所述个体分类为具有不良预后,如果所述相似性值高于所述第一相似性阈值,将所述个体分类为具有良好预后。
9.根据权利要求8所述的方法,归一化所述基因组的确定的RNA水平。
10.一种为患有结肠直肠癌的个体分配治疗的方法,包括(a)根据权利要求8或权利要求9将所述个体分类为具有良好预后或不良预后;(b)如果所述个体被分类为具有所述不良预后,则分配化疗。
11.根据前述权利要求中任一项所述的方法,所述结肠直肠癌包括结肠癌。
12.—种形成结肠直肠基因标志用于对患有结肠直肠癌或怀疑患有结肠直肠癌的个体的RNA样本进行分型的方法,包括确定从非MSI结肠直肠癌获得的RNA样本中与无远处转移存活期相关的基因组。
13.一种形成结肠直肠基因标志用于对患有结肠直肠癌或怀疑患有结肠直肠癌的个体的RNA样本进行分型的方法,包括确定在B-Raf的600位置具有缬氨酸的结肠直肠癌样本获得的RNA样本中与无远处转移存活期相关的基因组。
14.一种核苷酸微阵列,包括总共100至12000之间的核酸分子,所述核酸分子中至少两个能够杂交于包括表1中列出的至少两个基因的基因组。
15.根据权利要求14所述的阵列在区别具有低转移潜力和高转移潜力的结肠直肠癌细胞中的应用。
全文摘要
本发明涉及通过确定一组标志基因的RNA水平对结肠直肠癌细胞进行分型的方法。所述分型可用于预测所述结肠直肠癌的复发风险。本发明还涉及可用于归一化所述标志基因组的RNA水平的一组基因,并且涉及包括所述标志基因组的微阵列。
文档编号C12Q1/68GK102325902SQ200980157369
公开日2012年1月18日 申请日期2009年12月23日 优先权日2008年12月24日
发明者保罗·罗普曼, 阿纳斯卡·玛丽亚·格拉斯 申请人:阿詹迪亚有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1