用于经荧光原位杂交检测肿瘤抑制基因缺失的方法、探针组和试剂盒的制作方法

文档序号:3322939阅读:466来源:国知局
专利名称:用于经荧光原位杂交检测肿瘤抑制基因缺失的方法、探针组和试剂盒的制作方法
用于经荧光原位杂交检测肿瘤抑制基因缺失的方法、探针
组和试剂盒本申请要求2010年3月15日提交的美国临时专利申请61/313,916和2010年3月15日提交的加拿大专利申请2,696,545的权益,两份申请的全部内容均通过引用并入本文。本发明涉及在检测肿瘤抑制基因的缺失的分析中使用的方法、探针组和试剂盒,以及制备所述探针组和优化所述分析的方法。本发明的实施方案还包括检测样品中的染色体事件,比如缺失、扩增、转位和其它染色体事件的方法,其中所述样品是比如血液或实体瘤以及甲醛固定石蜡包埋(FFPE)薄切片、细针抽吸活检(FNA)、抹片等。在某些实施方案中,染色体事件涉及诸如肿瘤抑制、癌基因相关的和/或原癌基因的基因。了解癌细胞或原癌细胞是否发生率肿瘤抑制基因的缺失对于提高诊断和/或预 后准确性或者治疗方法的选择一般来说很有用。被怀疑是癌细胞或原癌细胞的样品,比如来自怀疑是癌或原癌生长(包括肿瘤(081 ^1'、1^0 1&81118)、增生等)的样品经常以例如固定的保存样品(比如甲醛固定石蜡包埋(FFPE)样品)的形式供实验室分析。显然,这类样品的保存也使得可以进行追溯性研究,给未来预后和治疗选择提供信息。肿瘤抑制基因的缺失可以通过荧光原位杂交(FISH)在FFPE样品中检测分析,所述技术中样品与目标基因的探针以及通常还有至少一个对照探针和/或核复染进行接触。肿瘤抑制基因的例子包括PTEN、p53、pl6(又称为CDKN2A)、RBU DCC、BRCAU BRCA2和APC。可以利用荧光使探针可见,并且分析产生的FISH信号来确定是否存在缺失。来自实体生长物的样品以固定的保存样品提供时,通常是采取几个微米厚的切片。因此,在样品切片过程中有可能切掉了含有肿瘤抑制基因的那部分细胞核。这种现象经常造成核截断现象,导致实际上不带有肿瘤抑制基因缺失的细胞看上去至少失去了一个拷贝的肿瘤抑制基因。截断现象可能发生在间期细胞,这时染色体凝集并分布在构成常规病理学组织切片的球形核的三维空间内。在分裂中期细胞中广46条染色体处于扁平、杆状的线性结构,一般可以在不被截断的情况下沉积到显微镜载片的表面。在临床样品(包括来自疑似癌或原癌实体生长的样品,比如实体瘤)中,多数细胞的确通常处于间期。代表性的分裂中期细胞样品很难或者不可能从用于追溯性分析的样品,或者从患者中获得,固定、保存并送到异地实验室进行分析。因此核截断现象负面影响基于FISH的肿瘤抑制基因缺失分析的表现。为了防止假阳性(即发生了肿瘤抑制缺失的不正确结论)的可能性,可以给表观缺失发生率设置一个最低阈值,其中当表观缺失发生率不超过该阈值时,结果被认为是阴性或最多不确定的。所述阈值可以基于利用对照细胞估计的人为缺失发生率;观察到的缺失水平要被认为是显著的,可能需要超过人为缺失发生率例如人为缺失发生率的三个标准差。但是使用这种最小阈值要以灵敏度为代价,因为例如当样品中含有缺失的细胞的数量较低或者当样品中细胞是遗传型异质的时,很难或者不可能确定缺失。同源性憐酸酶-张力蛋白(phosphataseand tensin homolog, PTEN)是人体中由PTEN基因编码的一种蛋白质。许多癌症类型(Cristofano AD et al.,PTEN isessential for embryonic development and tumour suppression, NatureGenetics1998; 19:348-355)和被称为考登综合征(Cowden syndrome)的遗传学发育缺陷(MarshDJ et al. , Germline PTEN mutations in Cowdensyndrome-Iike families, J. Med.Genet. 1998;35:881-885)中观察到过该肿瘤抑制基因的失活。近年来,利用与PTEN杂交的368kb探针发现PTEN基因座周围368kb或以上的基因组缺失在前列腺癌中很常见(Yoshimoto et al. , Cancer Genetics and Cytogenetics 2006;169:128-137),并且它们的存在带来不利的预后(Yoshimoto et al. , British Journal of Cancer2007;97:678-685;Yoshimoto et al. ,Modern Pathology 2008;21:1451-1460)。因此,准确的肿瘤抑制基因(比如PTEN)缺失的分析法在临床上有重要意义。此外,需要更高的通过大小来区分缺失的检测能力。有纯合PTEN缺失的前列腺肿瘤,其中至少一个缺失事件删除了超过PTEN及其直接的周边的染色体区域,更有可能是转移性肿瘤或者发生转移的可能性增加。因此,用于这类检测的探针组和方法对预后和做出治疗方面的决定,以及对前列腺癌的进展和分类进行进一步研究是有用的。因此,需要用于检测肿瘤抑制基因(比如,例如PTEN)缺失分析的方法、探针组和试剂盒,所述分析能够减少核截断现象的发生率;以及制备这类探针组和优化所述分析的 方法。本发明的方法和组合物部分基于这样的发现,即通过提供能够减少误差(比如截断现象)来源的探针组可以使基于FISH的肿瘤抑制缺失分析的性能(特异性、灵敏度和/或统计学显著性)得以优化。所述探针组包含至少第一侧翼探针、目标探针和第二侧翼探针,它们分别与位于肿瘤抑制基因的着丝粒方向、肿瘤抑制基因或者附近,以及端粒方向的位点杂交。肿瘤抑制基因在某些类型的癌或原癌细胞中易于发生缺失;例如至少在前列腺肿瘤中PTEN很容易发生缺失。第一或第二侧翼探针和目标探针之间的距离在细胞遗传学尺度来说可能较短,例如,500kb-10或20Mb的距离。在某些实施方案中,第一和第二侧翼探针的杂交位点与目标探针的杂交位点分别被第一和任选的第二边界区隔开(例如,靠近这些部位的基因组结构特征,比如节段性重复和拷贝数差异;详细讨论见下文)。第一和第二侧翼探针的杂交位点可以分别位于第一和第二(如果有的话)边界区或者与所述区域从细胞遗传学角度来说邻近。所述探针组由于它们的杂交位点的位置,可以使基于FISH的基因变异分析的表现得以优化。将侧翼探针定位在目标探针的杂交位点附近和/或与边界区相邻,但相对边界区在分析目标的远端,可以起到减少不确定结果和/或包括由核截断造成的假阳性的人为观察结果的作用。因此,本公开提供了进行基于FISH的分析的方法,制备用于基于FISH的肿瘤抑制因子缺失分析的探针的方法,和测量核截断在基于FISH的肿瘤抑制因子分析中的影响的方法。本公开还提供了可以在基于FISH的肿瘤抑制因子缺失分析中使用的探针组和组合物以及包含所述探针的试剂盒。发明的一个实施方案是基于FISH的肿瘤抑制因子缺失分析中使用的探针组的制备方法,所述方法包括(a)识别染色体上的至少一个边界区,所述染色体包含肿瘤抑制基因,其中所述至少一个边界区包含位于肿瘤抑制基因着丝粒方向的第一边界区;
(b)提供至少一个第一侧翼探针,所述探针与第一边界区内的核酸序列杂交;或者与相对第一边界区而言位于肿瘤抑制基因远端的核酸序列杂交;(c)提供至少一个第二侧翼探针,所述探针与位于肿瘤抑制基因端粒方向的核酸序列杂交;和(d)提供至少一个目标探针,所述探针与边界区之间的肿瘤抑制基因中的核酸序列杂父。发明的另一个实施方案是进行基于FISH的肿瘤抑制基因缺失分析的方法,所述方法包括(a)用探针组在包含复数个细胞的细胞样品上进行FISH,其中所述探针组包含至少第一侧翼探针,其与位于肿瘤抑制基因着丝粒方向的位点杂交;至少第二侧翼探针,其与位于肿瘤抑制基因端粒方向的位点杂交;和至少一个与肿瘤抑制基因杂交的目标探针;(b)计数所述复数个细胞中由至少第一和至少第二侧翼探针以及至少一个目标探针产生的FISH信号;(C)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率选出的至少一个人为缺失发生率;(d)根据步骤(b)计数的FISH信号确定至少一个表观缺失发生率,所述表观缺失发生率从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率选出,其中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少一个表观缺失发生率包含表观纯合缺失发生率;和(e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定样品是否包含带有肿瘤抑制基因半合缺失的细胞;或者根据表观纯合缺失发生率是否显著高于人为纯合缺失发生率,确定样品是否包含带有肿瘤抑制基因纯合缺失的细胞。发明的另一个实施方案是进行基于FISH的分析的方法,以区别性地检测肿瘤抑制基因的小缺失和大缺失,所述方法包括(a)用探针组对包含复数个细胞的细胞样品进行FISH ;或者用所述探针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH,和用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个体的含有复数个细胞的第二细胞样品进行FISH,其中所述探针组包含与肿瘤抑制基因杂交的至少一个目标探针,与位于肿瘤抑制基因着丝粒方向的位点杂交的至少第一侧翼探针,与位于肿瘤抑制基因端粒方向的位点杂交的至少第二侧翼探针,和下述中的至少一个与位于第一侧翼探针杂交位点着丝粒方向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点端粒方向的位点杂交的至少第四侧翼探针;(b)计数复数个或复数组细胞中由至少一个目标探针和至少第一、至少第二以及由至少第三和至少第四侧翼探针中选出的至少一个探针产生的FISH信号;(C)给肿瘤抑制基因缺失提供至少一个第一人为缺失发生率,其中缺失端点在至少第一和至少第二侧翼探针之间;
(d)给肿瘤抑制基因缺失提供至少一个第二人为缺失发生率,其中至少一个缺失端点不在至少第一和至少第二侧翼探针之间;(e)根据步骤(b)计数的FISH信号,给肿瘤抑制基因缺失确定至少一个第一表观缺失发生率,其中至少一个缺失端点在至少第一和至少第二侧翼探针之间;(f)根据步骤(b)计数的FISH信号,给肿瘤抑制基因缺失确定至少一个第二表观缺失发生率,其中至少一个缺失端点不在至少第一和至少第二侧翼探针之间;和(g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为缺失发生率,确定样品是否包含带有肿瘤抑制基因小缺失的细胞;和根据至少一个第二表观缺失发生率是否显著高于至少一个第二人为纯合缺失发生率,确定样品是否包含带有肿瘤抑制基因大缺失的细胞。发明另一个实施方案是优化基于FISH的肿瘤抑制基因分析法的方法,所述方法包括 (a)提供复数个候选探针组,其中每个候选探针组包含与处于肿瘤抑制基因着丝粒方向的位点杂交的至少第一侧翼探针,与处于肿瘤抑制基因端粒方向的位点杂交的至少第二侧翼探针,和与肿瘤抑制基因杂交的至少一个目标探针;(b)对于每个候选探针组,(i)用候选探针组对至少一个细胞样品进行FISH,所述细胞样品包含复数个含有整倍体数量肿瘤抑制基因完整拷贝的细胞;(ii)计数至少一个样品的复数个细胞中由候选探针组的至少第一和至少第二侧翼探针,以及至少一个目标探针产生的FISH信号;和(iii)根据步骤(ii)计数的FISH信号确定人为缺失发生率;和(c)从候选探针组中选出用于优化基于FISH的肿瘤抑制基因缺失分析法的探针组,其中选定的探针组经确定在步骤(iii)中具有良好的人为缺失发生率。发明的另一个实施方案是对21号染色体带21q22. 13_21q22. 3中的缺失进行基于FISH的分析的方法,所述方法包括(a)用探针组对包含复数个细胞的细胞样品进行FISH,其中所述探针组包含与位于TMPRSS2和ERG之间的,或者替代地位于被TMPRSS2和ERG基因覆盖的区域内的至少一个目标基因杂交的至少一个目标探针,与位于至少一个目标基因的着丝粒方向的位点杂交的至少第一侧翼探针,和与位于至少一个目标基因的端粒方向的位点杂交的至少第二侧翼探针;(b)计数复数个细胞中至少第一和至少第二侧翼探针以及至少一个目标探针产生的FISH信号;(C)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率选出的至少一个人为缺失发生率;(d)根据步骤(b)计数的FISH信号确定至少一个表观缺失发生率,所述表观缺失发生率从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率选出,其中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少一个表观缺失发生率包含表观纯合缺失发生率;和(e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定样品是否包含带有至少一个目标基因半合缺失的细胞;或者根据表观纯合缺失发生率是否显著高于人为纯合缺失发生率,确定样品是否包含带有至少一个目标基因纯合缺失的细胞。发明的另一个实施方案是进行基于FISH的分析的方法,以区别性地检测21号染色体中带21q22. 13-21q22. 3的小缺失和大缺失,所述方法包括(a)用探针组对包含复数个细胞的细胞样品进行FISH ;或者用所述探针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH,和用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个体的含有复数个细胞的第二细胞样品进行FISH,其中所述探针组包含
与位于TMPRSS2和ERG之间的至少两个目标基因杂交的至少两个目标探针,与位于至少两个目标基因着丝粒方向的位点杂交的至少第一侧翼探针;与位于至少两个目标基因端粒方向的位点杂交的至少第二侧翼探针;和任选地,下述中的至少一个与位于第一侧翼探针杂交位点着丝粒方向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点端粒方向的位点杂交的至少第四侧翼探针;(b)计数复数个或复数组细胞中由至少两个目标探针和至少第一、至少第二以及如果有的话,至少第三和至少第四侧翼探针中的至少一个产生的FISH信号;(c)给至少一个目标基因缺失提供至少一个第一人为缺失发生率,其中缺失端点在至少第一和至少第二侧翼探针之间,其中一个缺失端点在两个目标基因之间;(d)给至少一个目标基因缺失提供至少一个第二人为缺失发生率,其中(i)任何一个缺失端点都不在两个目标基因之间,或者(ii)如果使用了至少第三和至少第四侧翼探针中的至少一个,则至少一个缺失端点不在至少第一和至少第二侧翼探针之间;(e)根据步骤(b)计数的FISH信号,给至少一个目标基因缺失确定至少一个第一表观缺失发生率,其中缺失端点在至少第一和至少第二侧翼探针之间,其中一个缺失端点在两个目标基因之间;(f)根据步骤(b)计数的FISH信号,给至少一个目标基因缺失确定至少一个第二表观缺失发生率,其中(i)任何一个缺失端点都不在两个目标基因之间,或者(ii)如果使用了至少第三和至少第四侧翼探针中的至少一个,则至少一个缺失端点不在至少第一和至少第二侧翼探针之间;和(g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为缺失发生率,确定细胞样品是否包含,或者第一和第二细胞样品是否包含,带有至少一个目标基因的小缺失的细胞;和根据至少一个第二表观缺失发生率是否显著高于至少一个第二人为纯合缺失发生率,确定细胞样品是否包含,或者第一和第二细胞样品是否包含,带有至少一个目标基因的大缺失的细胞。发明的另一个实施方案是探针组,所述探针组包含至少一个与PTEN杂交的探针,至少一个与FAS或SUFU杂交的探针,和至少一个与TSPAN15杂交的探针。发明的另一个实施方案是探针组,所述探针组包含至少一个与位于TMPRSS2和ERG之间的至少一个目标基因杂交的探针,至少一个与DYRKlA或ERG杂交的探针,和至少一个与TMPRSS2或U2AF1杂交的探针。应当理解,以上的概述和下面对实施方案的描述都仅仅是示范性和解释性的,不对权利要求请求保护的发明范围构成限制。实施方案的描述A.概述发明的实施方案包括进行基于FISH的分析的方法;基于FISH的肿瘤抑制基因缺失分析中使用的探针的制备方法;基于FISH的肿瘤抑制基因缺失分析的优化方法;以及探针组、组合物和试剂盒,所述试剂盒包含可用于基于FISH的肿瘤抑制基因缺失分析的探针。在某些实施方案中,肿瘤抑制因子选自PTEN、p53、pl6(又称为CDKN2A)、RB1、 DCC、BRCA1、BRCA2 和 APC。在例如 Chang H et al.,Multiplemyeloma involving centralnervous system:high frequency of chromosome17p13. I(p53)deletions,BritishJournal of Haematology 2004,127:280-284 ;Kohno T and Yokota Jj Molecularprocesses of chromosome 9p21 deletionscausing inactivation of the pl6tumor suppressor gene in human cancer:Deduction from structural analysisof breakpoints for deletions, DNA Repair2006;5:1273-1281 ;Friend SH etal. , A human DNA segment with properties ofthe gene that predisposes toretinoblastoma and osteosarcoma, Nature 1986, 323:643-6 ;Popat S and HoulstonRSj A systematic review and meta-analysis ofthe relationship between chromosome18q genotype, DCC status and colorectalcancer prognosis,European Journal ofCancer 2005,41:2060-2070 ;Becker K etal.,Deletions of BRCAl/2and p53 R248Wgain-of-function mutation suggestimpaired homologous recombination repair infragile histidine triad negativesebaceous gland carcinomas, British Journal ofDermatology 2008,159:1282-1289 ;和 Castellsagu6E et al.,Detection of APC genedeletions usingquantitative multiplex PCR of short fluorescent fragments, Clin.Chem. 2008,54:1132-40中讨论过这些肿瘤抑制因子。在某些实施方案中,肿瘤抑制因子选自位于人染色体上选自10q23、17pl3、13ql4、9q24和9p21的染色体带的肿瘤抑制因子。在某些实施方案中,肿瘤抑制因子选自位于人染色体上选自10q、17p、13q、9p、lp、5q、19q、20q、8p、12p和16q的染色体臂的肿瘤抑制因子。在例如 Kolomietz Eet al. , Quantitative PCR identifies aminimal deleted region of 120kb extendingfrom the Philadelphia chromosome ABLtranslocation breakpoint in chronicmyeloid leukemia with poor outcome, Leukemia2003,17:1313-1323,2003 ;Haase D,Cytogenetic features in myelodysplasticsyndromes, Ann. Hematol. 2008, 87:515-526 ;Reifenberger J et al. , Molecular geneticanalysis ofoligodendroglial tumors shows preferential allelic deletions on 19qand Ipj Am. J. Pathol. 1994, 145:1175-1190 ;Chang B et al., Integration of SomaticDeletionAnalysis of Prostate Cancers and Germline Linkage Analysis of ProstateCancerFamilies Reveals Two Small Consensus Regions for Prostate Cancer Genes at8p, Cancer Research 2007,67:4098-4103 ;和 Reiner M et al. , Microarraycomparativegenomic hybridization analysis of tubular breast carcinoma showsrecurrent lossof the CDH131ocus on 16q, Human Pathology 2008,39:1621-1629 中讨论了上述染色体带和染色体臂中存在的肿瘤抑制因子。人染色体臂和染色体带如ISCN 2009. An International System forHumanCytogenetics Nomenclature, Editors:Shaffer LG,Slovak ML,CampbellLJ. , 2009;Chapter 2, S. Karger Publishers Inc.中的定义。 以下定义是有助于理解发明实施方案的名称和概念的定义,其后是对实施方案的详细讨论以及这些实施方案的例子。虽然实施方案的讨论按照节和子节组织,应当理解一个子节中讨论的许多方面与其它节中的实施方案有关联;例如,关于探针类型的讨论与使用所述探针的方法相关。B.定义本文中,“边界区”是染色体中出现缺失端点的频率增加的区域。通过测量多个样品的缺失端点,然后识别其中聚集了许多端点的区域可以确定肿瘤抑制基因附近的边界区在染色体上的位置。一群样品中的缺失端点可以通过诸如FISH或者利用阵列进行的比较基因组杂交(CGH)的技术来测量,这在以下O节中有进一步讨论。在某些实施方案中,边界区的大小大于或者等于50kb、IOOkb、200kb、300kb、400kb、500kb或1Mb,和/或小于或等于I. 5Mb、2Mb、3Mb、4Mb或5Mb。边界区包括通过CGH鉴定的脆性区域。对于给定的肿瘤抑制基因、区域大小和感兴趣的状况(例如前列腺癌),包含肿瘤抑制基因的染色体在某些实施方案中可能包含“主要边界区”。主要边界区是处于肿瘤抑制基因着丝粒或者端粒方向的缺失端点发生率最大的区域。可以有两个主要边界区,在肿瘤抑制基因一边一个。术语“缺失”用于本文是从细胞遗传学角度对染色体的结构变异的描述,其中染色体臂的一部分丢失。因此,缺失是被定位在失去的特定基因组区域上的染色体物质和基因的丢失。概括地说,将FISH探针(比如通过将来自细菌人工染色体(BACs)的DNA标记而制备的探针)与细胞样品杂交,利用是否存在FISH信号可以确定是否存在缺失。临床上遇到的最简单的缺失类型是中间缺失(见图I)。某些缺失被认为是微小缺失,即低于传统细胞遗传学分析的分辨率C5Mb DNA)的缺失。这类亚显微的DNA中间缺失发生在染色体内部,并且可能发生在一个染色体区段(cytoband)以内。它们可能只有几百个kb DNA,通常通过FISH方法来检测。本文中,“探针组”是一群被区别标记或者能够区别标记从而用于多色FISH分析的DNA序列。染色体组中的探针可以通过本领域技术人员已知的各种程序来制备,包括但不限于通过从宿主菌株中分离BAC或粘粒DNA ;基因组或克隆DNA的扩增(例如,聚合酶链式反应或滚环扩增);或者人工合成例如一组寡核苷酸,所述探针覆盖目标基因组中足够大的一个区域(例如至少50kb或至少IOOkb)从而生成能够通过荧光显微镜可见的信号。应当指出,给定区域的探针可以来源于复数个细菌人工染色体(BACs)、粘粒、扩增产物、寡核苷酸等。某些情况中,可能要设计探针不含会与基因组其它区域也发生杂交的重复序列。应当理解,“包含” “来源于”特定BAC的探针的探针组对于所用的其它BAC来说都是开放式的,无论是针对书面描述的探针或者提供或针对其它探针而言都如此。相反,由“来源于”特定BAC的探针“组成”的探针组对于所用的其它BAC来说是封闭式的。与特定基因“杂交”的探针具有与该特定基因至少部分重叠的结合位点。所述探针可能或者不能还与相邻基因的一部分杂交。术语“基因通常用于指代基因组DNA中被染色体坐标限定的一个区域,所述染色体坐标是比如(.kneCiirds 数据库,v3. 05, Feb. 13,2011 (参见,例如http://www.Renecards. orR)中给特定基因提供的。本文中,“FISH信号”是在FISH分析检测中观察到的由探针及其靶分子杂交产生的荧光点。FISH信号常常呈现点状,但根据被观察细胞中染色质的凝聚状态,看上去并不总是完全紧密的。当讨论包含复数个具有给定特性的细胞的细胞样品时,应当注意不一定细胞样品中所有细胞都具有所述给定特性。本文中,“人为缺失发生率”是指缺失分析中观察到由于误差来源而造成的缺乏 FISH信号情况的发生率,所述误差来源是比如样品制备过程中细胞核发生截断或者与样品中细胞的基因型无关的任何其它原因。利用不含有FISH分析中的目标基因的缺失的阴性对照样品可以确定人为缺失发生率。本文中,“表观缺失发生率”是指缺失分析中观察到缺乏FISH信号情况的发生率;因此表观缺失发生率是人为缺失发生率(通常对于测试样品是未知的,但可以象以上讨论的由对照样品估计得到)和样品中实际缺失发生率的组合。表观缺失发生率可以指缺少特定的一或多个FISH信号的发生率、目标探针丢失一个FISH信号的总体发生率、目标探针丢失两个FISH信号的总体发生率,或者目标探针丢失至少一个FISH信号的总体发生率。本文中,“整倍体数”是指对给定类型的细胞来说正常的基因的拷贝数。对于体细胞中常染色体基因座典型的整倍体数是2,除了在复制后分裂前整倍体数是4。本领域技术人员还知道整倍体数不同的其它一些情况,例如在已经发生了减数分裂的生殖系细胞中,和雄性细胞的X染色体基因座整倍体数减少一半。Y染色体基因座的整倍体数在雌性细胞中是0,在雄性细胞中是I (或者在复制后分裂前是2)。“染色体计数探针”是指用于确定细胞核中特定染色体的数量的探针;常见的染色体计数探针的类型包括能够与着丝粒或近着丝粒基因座杂交的探针。在提到候选探针组给出的人为缺失发生率和/或灵敏度的数值时使用的“良好的”意味着所述数值至少优于接受检测的候选探针组的平均数值。当然还可以通过采用更严格的标准来选择候选探针组,比如人为缺失发生率和/或敏感度数值在至少60th、70th、80th,90th或95th百分位数(百分位数越高表明表现越好,即灵敏度越高或者人为缺失发生率越低)。如果第一基因座比第二基因座更靠近着丝粒,第一基因座是位于第二基因座的“着丝粒方向”。如果第一基因座比第二基因座更靠近第一基因座所处的臂的端粒,第一基因座是位于第二基因座的“端粒方向”。当相对第三基因座,第一基因座位于第二基因座的“远端”(比如杂交位点相对边界区位于肿瘤抑制因子的远端)意味着第一基因座离第二基因座比它离第三基因座更远;因此,如果杂交位点相对边界区位于肿瘤抑制因子的远端,其中所述边界区处于肿瘤抑制因子的着丝粒方向,则杂交位点一定处于肿瘤抑制因子的着丝粒方向。同样地,如果杂交位点相对边界区位于肿瘤抑制因子的远端,其中所述边界区处于肿瘤抑制因子的端粒方向,则杂交位点一定处于肿瘤抑制因子的端粒方向。C.制备探针的方法发明部分涉及探针的制备,所述探针可用于为了缺失检测进行的三色或更多色FISH分析。探针经设计,其杂交位点位于在人癌症中常常发生缺失的例如O. 5-10兆碱基(mb)DNA的基因组间隔(genomic interval)内或者在基因组间隔的末端或者末端附近。制备了与肿瘤抑制基因杂交的目标探针,并且提供了杂交位点处于肿瘤抑制基因端粒和着丝粒方向的侧翼探针(图2A)。根据发明所述方法制备的侧翼探针的杂交位点可以位于鉴定到的边界区之内,和/或相对边界区位于肿瘤抑制基因的远端。在某些实施方案中,侧翼探针具有的杂交位点相对边界区位于肿瘤抑制基因的远端,其中杂交位点的中心靠近边界区的近边,例如距离边界区的近边低于或等于2Mb、I. 5Mb、lMb、500kb、200kb或lOOkb。
I.边界区的鉴定边界区的鉴定可以利用来源于公共领域数据集的比较基因组杂交数据,比如[http://www.broadinstitute.org/tumorscape/pages/portalHome.jsf]提供的,在Beroukhim R et al.,The landscape of somatic copy-number alteration acrosshumancancers, Nature 2010,463:899-905 中有描述;还可参见 Liu W et al.,Copy numberanalysis indicates monoclonal origin of lethal metastatic prostatecancer, NatMed 2009,15:559-65和Ferreira BI et al. , Array CGH andgene-expression profilingreveals distinct genomic instability patterns associatedwith DNA repair andcell-cycle checkpoint pathways in Ewing’s sarcoma, Oncogene 2008;27:2084-2090。一般来说,这些数据集是通过用经过标记的来自复数个癌变性样品(例如肿瘤样品)的可能包含目标肿瘤抑制因子缺失的DNA与区别标记的来自正常细胞的不包含缺失的参照DNA一起和高分辨率基因组微阵列进行比较杂交实验获得的。来自复数个样品的基因组DNA —经被确认包含频繁发生目标肿瘤抑制因子缺失的子集,则可以将其中有一簇缺失断点的区域鉴定为边界区,所述缺失断点定位为各个样品中拷贝数的明显变更。这可以由癌变性样品群体中位点的平均丰度来鉴定,作为随着位点逐渐向目标肿瘤抑制因子靠近,拷贝数随位点的明显下降。例如,相对参照,平均拷贝数在诸如500kb、750kb、lMb、l. 5Mb或2Mb的长度上会减少比如15%、20%或25%的量。当进行大量阵列比较基因组杂交分析(例如50、75、100或以上)以便各个地检验复数个样品时,也可以通过确定每个样品中哪里发生拷贝数变更,将这些位置分级(binning)(例如,分选至对应诸如 50kb、IOOkb、200kb、300kb、400kb、500kb、1Mb、I. 5Mb或2Mb大小的DNA片段的级别中),并且鉴定出拷贝数变更明显富集的级别从而确认边界区。各个样品中的拷贝数变更可以按照例如Ferreira BI et al. , Array CGHand gene-expressionprofiling reveals distinct genomic instability patternsassociated with DNA repairand cell-cycle checkpoint pathways in Ewing'ssarcoma, Oncogene 2008, 27:2084-2090中的描述来鉴定。可以利用排序分段(ranksegmentation)来鉴定有增加和丢失的段,这一过程在例如商业软件Nexus Copy Number版本 4 或 5 (February 2010) (BioDiscovery, El Se gun do, CA)中采用了,如用户手册中所述。
除了以上边界区确定模式,在如上所述鉴定的拷贝数变更附近可能存在被称为“节段性重复”的微同源性序列类型和被称为“拷贝数变异”(CNVs)的其它类型。在某些实施方案中,当拷贝数变更的邻接处或者附近(例如25、50、75或IOOkb以内)存在这两种类型序列中的至少一种或者两种时,该区域即被选中用于如下所述的FISH探针分析。节段性重复的位点可以从 Segmental Duplication Database (She X et al. , Shotgun sequenceassembly andrecent segmental duplications within the human genome, Nature2004; 431:927-930)获得。CNV 数据可以从 Sanger Institute’s CNV Project (http://www. sanger. ac. uk/humgen/cnv/)获得;参见例如 Redon R et al. , Globalvariationin copy number in the human genome, Nature 2006,444:444-454 和 Komura D etal. , Genome-wide detection of human copy number variations usinghigh—density DNAoligonucleotide arrays, Genome Res. 2006, 16:1575-84。Stankiewicz P, Lupski JR, Genome architecture, rearrangements andgenomicdisorders, Trends Genet. 2002, 18:74-82 ;Beroukhim R et al. , The landscapeofsomatic copy-number alteration across human cancers, Nature 2010,463:899-905和 Casci T, Genome evolution:CNV evolution revisited, Nature ReviewsGenetics 2008;9:814-815中也讨论了 CNVs和节段性重复。某些实施方案中,确定了拷贝数转换(transition)附近是否存在一簇节段性重复。一个簇在500kb、lMb或2Mb的区域内可以包含至少3、4、5、6或更多个节段性重复。除了以上的边界区确定模式,替代地或者附加地,可以利用FISH,通过用一系列探针对大量可能包含目标肿瘤抑制因子缺失的样品(例如300或更多样品)进行分析检测来鉴定边界区,其中所述探针的杂交位点沿染色体正常序列分布。系列中的探针如果没有其它探针结合在它们之间,则被认为是相邻的。如果两个相邻探针中,距离目标肿瘤抑制因子较远的探针在包含缺失的样品生成的FISH信号比距离目标肿瘤抑制因子较近的那个生成的更频繁,则可以确认这两个探针之间存在边界区。下文中讨论了显著性阈值。2.杂交位点如果探针与位点能够稳定地形成可以在低严紧条件(比如45° C,在含有50%甲酰胺的2X SSC中)下通过FISH检测的碱基对,所述探针被认为与位点杂交。通常,较低的严紧度与低温和高盐浓度关联(Bayani J, Squire JA, Fluorescence in situHybridization(FISH), Curr Protoc Cell Biol. 2004;Chapter22:Unit 22.4)。根据本发明方法制备的探针的杂交位点可以有多种方式定位,包括下述中的一或多种(a)相对目标和其它杂交位点定位本发明中制备探针组的方法一般包括提供至少一个与肿瘤抑制基因中的核酸序列杂交的目标探针,和至少两个侧翼探针,其中的一个与位于肿瘤抑制基因着丝粒方向的位点杂交,一个与肿瘤抑制基因端粒方向杂交。(b)相对第一和第二边界区定位侧翼探针可以相对边界区进行定位。一个侧翼探针可以与第一边界区内的核酸序列杂交,或者与相对第一边界区处于肿瘤抑制基因远端的核酸序列杂交;另一个侧翼探针可以与第二边界区内的核酸序列杂交,或者与相对第二边界区处于肿瘤抑制基因远端的核酸序列杂交。在某些实施方案中,这些序列相对第一或第二边界区位于肿瘤抑制基因的远端。(C)相对其它边界区定位所述方法还可以包括鉴定其它边界区(比如第三、第四或第五边界区),并且给每个额外的边界区提供探针,所述探针与所述额外边界区内的核酸序列杂交或者与相对所述额外边界区处于肿瘤抑制基因远端的核酸序列杂交;杂交位点可能靠近边界区。当鉴定了两个以上边界区时,可以预期样品之间的缺失大小各异。可以利用探针组,根据离目标探针较近的一或多个侧翼探针产生的FISH信号是否丢失以及目标探针本身产生的FISH信号,来获取关于缺失大小的信息。3.探针大小和来源除了鉴定边界区,探针组的制备方法还包括提供探针。作为探针使用的DNA可 以通过下述途径获得从一或多个已经存在的宿主菌株或BAC/粘粒文库分离BAC或粘粒DNA ;或者构建一或多个新的BACs或粘粒;扩增(例如聚合酶链式反应或滚环复制)基因组或克隆DNA ;或者人工合成DNA,例如覆盖目标基因组中足够长区域(例如至少50kb或至少IOOkb)的一组寡核苷酸从而能够生成荧光显微镜可见的信号。被探针杂交的区域的大小可以大于或者等于50kb或lOOkb,和/或小于或等于150kb、200kb、300kb、400kb或500kb。4.探针功能在某些实施方案中,根据发明方法制备的所述至少一个目标探针和至少第一和第二侧翼探针可以用于基于FISH的肿瘤抑制因子缺失分析,其中所述分析具有的显著性阈值是低于20%、25%、30%或35%的人为缺失发生率加上三个标准差,是在5 μ m厚,平均核直径小于5μπι的甲醛固定石蜡包埋细胞样品上确定的。来自诸如癌变性样品的样品的FFPE切片中的完整细胞核可能不呈现完美的球形,而是在切片制备过程中被略微压缩为椭圆形。D.探针组和试剂盒发明涉及根据以上描述的方法制备的探针组。发明还涉及这样的探针组,所述探针组包含至少一个与PTEN杂交的探针,至少一个与FAS或SUFU杂交的探针,和至少一个与TSPAN15杂交的探针。在这类实施方案中,所述至少一个与PTEN杂交的探针作为目标探针,所述至少一个与FAS或SUFU杂交的探针和至少一个与TSPAN15杂交的探针作为侧翼探针。在某些实施方案中,探针组包含至少一个额外的与BMPRlA杂交的侧翼探针。在某些实施方案中,探针组包含至少一个额外的与WAPAL杂交的侧翼探针。在某些实施方案中,所述至少一个与PTEN杂交的探针包含来源于BACRP11-846G17的探针。在某些实施方案中,探针组包含的与FAS杂交的至少一个探针来源于BACs RP11-399019和RP11-360H20中的至少一个。在某些实施方案中,探针组包含的与TSPAN15杂交的至少一个探针来源于BACsRPlI-404C6和RP11-6P16中的至少一个。在某些实施方案中,探针组包含的与BMPRlA杂交的至少一个探针来源于RP11-141D8和RP11-52G13中的至少一个。在某些实施方案中,探针组包含的与WAPAL和/或BMPRlA杂交的至少一个探针来源于 RP11-351D13、RP11-661D10、RP11-141D8 和 RP11-52G13 中的至少一个。在某些实施方案中,探针组包含的与WAPAL杂交的至少一个探针来源于RPl 1-141D8和RP11-661D10中的至少一个。在某些实施方案中,探针组包含的与SUFU杂交的至少一个探针来源于RPl 1-18114和RP11-2F13中的至少一个。这些和所有其它本文提及的BACs可以从 Roswell Park Cancer Institute,Buffalo, New York 和 BACPACResources Center atChildren’s Hospital and Research Center at Oakland,California 获得。例如 NCBIClone Registry (http://www.ncbi.nlm.nih.gov/projects/genome/clone/)提供了序列的有关息。下表提供的信息是对于可以在本公开所述探针组中使用的选中的BACs在10号染色体上的杂交位点(定位按照版本NCBI36/hgl8,March 2006)。
ps 着丝粒方向(10qll.21)
RPl 1-89了2343,432,326~ 43,596,132
RP11-1044H343,572, 030~ 43,801, 357
RP11-80C1643,723, 472~ 43,889, 995
TSPAN15(10q21. 3)
RP11-404C670, 784, 881~ 70, 979, 123
RP11-6P1670, 824, 041~ 71, 006,065
BMPRlA/WAPAL(10q23. 2)
RP11-351D1387, 894, 018~ 88, 064,908
RP11-661D1088, 057, 057~ 88, 255,780
RP11-141D888, 280, 060~ 88, 465, 884
RP11-52G1388, 441,801 ~ 88, 565, 254
PTEN(10q23. 31)
RP11-846G1789, 666, 216~ 89, 843, 09权利要求
1.基于FISH的肿瘤抑制因子缺失分析中使用的探针组的制备方法,所述方法包括 (a)识别染色体上的至少一个边界区,所述染色体包含肿瘤抑制基因,其中所述至少一个边界区包含位于肿瘤抑制基因着丝粒方向的第一边界区; (b)提供至少第一侧翼探针,所述探针与第一边界区内的核酸序列杂交;或者与相对第一边界区位于肿瘤抑制基因远端的核酸序列杂交; (c)提供至少第二侧翼探针,所述探针与位于肿瘤抑制基因端粒方向的核酸序列杂交;和 (d)提供至少一个目标探针,所述探针与边界区之间的肿瘤抑制基因中的核酸序列杂交。
2.进行基于FISH的分析肿瘤抑制基因缺失的方法,所述方法包括 (a)用探针组在包含复数个细胞的细胞样品上进行FISH, 其中所述探针组包含至少第一侧翼探针,其与位于肿瘤抑制基因着丝粒方向的位点杂交;至少第二侧翼探针,其与位于肿瘤抑制基因端粒方向的位点杂交;和至少一个与肿瘤抑制基因杂交的目标探针; (b)计数所述复数个细胞中由至少第一和至少第二侧翼探针以及至少一个目标探针产生的FISH信号; (c)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率选出的至少一个人为缺失发生率; (d)根据步骤(b)计数的FISH信号确定至少一个表观缺失发生率,所述表观缺失发生率从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率选出,其中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少一个表观缺失发生率包含表观纯合缺失发生率;和 (e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定样品是否包含带有肿瘤抑制基因半合缺失的细胞;或者根据表观纯合缺失发生率是否显著高于人为纯合缺失发生率,确定样品是否包含带有肿瘤抑制基因纯合缺失的细胞。
3.进行基于FISH的分析以区别性地检测肿瘤抑制基因的小缺失和大缺失的方法,所述方法包括 (a)用探针组对包含复数个细胞的细胞样品进行FISH;或者用所述探针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH,并且,用所述探针组中包含的第二探针子集对含有来自与所述第一细胞样品相同的个体的复数个细胞的第二细胞样品进行 FISH, 其中所述探针组包含与肿瘤抑制基因杂交的至少一个目标探针,与位于肿瘤抑制基因着丝粒方向的位点杂交的至少第一侧翼探针,与位于肿瘤抑制基因端粒方向的位点杂交的至少第二侧翼探针,和下述中的至少一个与位于第一侧翼探针杂交位点着丝粒方向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点端粒方向的位点杂交的至少第四侧翼探针; (b)计数复数个或复数组细胞中由至少一个目标探针和至少第一、至少第二、以及从至少第三和至少第四侧翼探针选出的至少一个探针产生的FISH信号;(C)给肿瘤抑制基因中缺失端点位于至少第一和至少第二侧翼探针之间的那些缺失提供至少一个第一人为缺失发生率; (d)给肿瘤抑制基因中有至少一个缺失端点不位于至少第一和至少第二侧翼探针之间的那些缺失提供至少一个第二人为缺失发生率; (e)根据步骤(b)计数的FISH信号,给肿瘤抑制基因中缺失端点位于至少第一和至少第二侧翼探针之间的那些缺失确定至少一个第一表观缺失发生率; (f)根据步骤(b)计数的FISH信号,给肿瘤抑制基因中有至少一个缺失端点不位于至少第一和至少第二侧翼探针之间的那些缺失确定至少一个第二表观缺失发生率;和 (g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为缺失发生率,确定样品是否包含带有肿瘤抑制基因小缺失的细胞;和,根据至少一个第二表观缺失发生 率是否显著高于至少一个第二人为纯合缺失发生率,确定样品是否包含带有肿瘤抑制基因大缺失的细胞。
4.优化基于FISH的肿瘤抑制基因分析法的方法,所述方法包括 (a)提供复数个候选探针组,其中每个候选探针组包含与处于肿瘤抑制基因着丝粒方向的位点杂交的至少第一侧翼探针,与处于肿瘤抑制基因端粒方向的位点杂交的至少第二侧翼探针,和与肿瘤抑制基因杂交的至少一个目标探针; (b)对于每个候选探针组, (i)用候选探针组对至少一个细胞样品进行FISH,所述细胞样品包含复数个含有整倍体数量肿瘤抑制基因完整拷贝的细胞; (ii)计数至少一个样品的复数个细胞中由探针产生的FISH信号,所述探针是候选探针组中的至少第一和至少第二侧翼探针、以及至少一个目标探针;和 (iii)根据步骤(ii)计数的FISH信号确定人为缺失发生率;和 (c)从候选探针组中选出用于优化基于FISH的肿瘤抑制基因缺失分析法的探针组,其中所选探针组经确认在步骤(iii)中具有良好的人为缺失发生率。
5.进行基于FISH的分析以检测21号染色体中21q22.13_21q22. 3分带的缺失的方法,所述方法包括 (a)用探针组对包含复数个细胞的细胞样品进行FISH; 其中所述探针组包含,与位于TMPRSS2和ERG之间的至少一个目标基因杂交的至少一个目标探针,与位于至少一个目标基因着丝粒方向的位点杂交的至少第一侧翼探,以及与位于至少一个目标基因端粒方向的位点杂交的至少第二侧翼探针; (b)计数复数个细胞中由至少第一和至少第二侧翼探针以及至少一个目标探针产生的FISH信号; (c)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率中选出的至少一个人为缺失发生率; (d)根据步骤(b)计数的FISH信号,确定从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率中选出的至少一个表观缺失发生率,其中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少一个表观缺失发生率包含表观纯合缺失发生率;和 (e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定样品是否包含带有至少一个目标基因的半合缺失的细胞;和,根据表观纯合缺失发生率是否显著高于人为纯合缺失发生率,确定细胞样品是否包含带有至少一个目标基因的纯合缺失的细胞。
6.进行基于FISH的分析以区别性地检测21号染色体中21q22.13_21q22. 3分带的小缺失和大缺失的方法,所述方法包括 (a)用探针组对包含复数个细胞的细胞样品进行FISH;或者用所述探针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH,并用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个体的含有复数个细胞的第二细胞样品进行FISH, 其中所述探针组包含, 至少两个目标探针,它们与位于TMPRSS2和ERG之间的至少两个目标基因杂交, 至少一个第一侧翼探针,其与位于至少两个目标基因着丝粒方向的位点杂交, 至少一个第二侧翼探针,其与位于至少两个目标基因端粒方向的位点杂交; 和,任选地,下述中的至少一个与位于第一侧翼探针杂交位点着丝粒方向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点端粒方向的位点杂交的至少第四侧翼探针; (b)计数复数个或复数组细胞中由探针产生的FISH信号,所述探针是至少两个目标探针和至少第一、至少第二侧翼探针,以及如果有的话,从至少第三和至少第四侧翼探针中选出的至少一个探针; (c)给至少一个目标基因的缺失提供至少一个第一人为缺失发生率,所述缺失的端点在至少第一和至少第二侧翼探针之间,其中一个缺失端点在两个目标基因之间; (d)给至少一个目标基因的缺失提供至少一个第二人为缺失发生率,其中,(i)任何一个缺失端点都不在两个目标基因之间,或者(ii)如果使用了至少第三和至少第四侧翼探针中的至少一个,则至少一个缺失端点不在至少第一和至少第二侧翼探针之间; (e)根据步骤(b)计数的FISH信号,给至少一个目标基因的缺失确定至少一个第一表观缺失发生率,所述缺失的端点在至少第一和至少第二侧翼探针之间,其中一个缺失端点在两个目标基因之间; (f)根据步骤(b)计数的FISH信号,给至少一个目标基因的缺失确定至少一个第二表观缺失发生率,其中(i)任何一个缺失端点都不在两个目标基因之间,或者(ii)如果使用了至少第三和至少第四侧翼探针中的至少一个,则至少一个缺失端点不在至少第一和至少第二侧翼探针之间;和 (g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为缺失发生率,确定细胞样品是否包含带有至少一个目标基因的小缺失的细胞;和,根据至少一个第二表观缺失发生率是否显著高于至少一个第二人为纯合缺失发生率,确定细胞样品是否包含带有至少一个目标基因的大缺失的细胞。
7.探针组,包含至少一个与PTEN杂交的探针,至少一个与FAS或SUFU杂交的探针,和至少一个与TSPAN15杂交的探针。
8.探针组,包含至少一个与位于TMPRSS2和ERG之间的至少一个目标基因杂交的探针,至少一个与DYRKlA或ERG杂交的探针,和至少一个与TMPRSS2或U2AF1杂交的探针。
9.探针组,包含至少一个与PTEN杂交的探针,至少一个与FAS或SUFU杂交的探针,和至少一个与WAPAL杂交的探针。
全文摘要
本发明公开了用于基因缺失分析的方法、探针组、试剂盒和组合物。在某些实施方案中,方法涉及制备缺失分析使用的探针、进行缺失分析或者优化缺失分析。在某些实施方案中,方法和探针组可以提供下降的人为缺失发生率,例如分析经过人为截断的样品时。在某些实施方案中,方法和探针组可以区分小的和大的缺失。
文档编号C40B30/04GK102892934SQ201180024255
公开日2013年1月23日 申请日期2011年3月15日 优先权日2010年3月15日
发明者J.A.斯奎尔, M.约希默托 申请人:金斯顿女王大学, 金斯顿总医院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1