针对与癌症相关的表观遗传学沉默基因的基因组筛选的制作方法

文档序号:1029088阅读:379来源:国知局
专利名称:针对与癌症相关的表观遗传学沉默基因的基因组筛选的制作方法
技术领域
本发明总体上涉及检测癌症细胞中表观遗传学上(epigenetically)沉默的基因的方法,更具体的说,是涉及用于鉴定结直肠癌和胃癌细胞的基因组筛选。
背景技术
虽然癌症一般被认为是由于遗传变化如一个基因的突变而导致的,但现在已经比较明确地认为不改变DNA序列的表观遗传学机制也可以导致癌症。最常见的表观遗传学上的变化就是由于基因序列甲基化而导致该基因的表达沉默,特别是在5′端上游的基因调控序列。在CpG二核苷酸中,特别是在CpG富含区(CpG岛)中,与鸟嘌呤相邻的胞嘧啶的甲基化常常参与高等真核生物的正常基因表达调控。举个例子,CpG岛的过度甲基化与某些印记基因的转录失活相关,这些基因就像女性X染色体上基因的一样失活。正常情况下不甲基化的CpG岛的异常甲基化也在一些株化(immortalized)细胞和癌化细胞中发现,而且这种甲基化还与人类癌症的某些特定的肿瘤抑制基因的转录失活有关。
与癌症相关的基因变化,包括使基因表达丧失或者表达出缺陷型基因产物的基因变化,以及表观遗传学机理,比如甲基化导致基因转录的沉默,为确定一个细胞是否易于失去生长控制,也就是说是否容易形成癌细胞提供了标记。比如,BRCA1基因的一个突变与乳腺癌相关。这样就可以对一个有家族乳腺癌历史的女性身上的细胞作诊断性测试,看看这位女性是否也有作为乳腺癌标记分子的BRCA1基因突变。前列腺特异性抗原(PSA)是标记分子的另外一个例子,它是前列腺癌的标记分子。虽然对于导致PSA表达的缺陷以及PSA在体内的正常功能都一无所知,但是不可否认PSA提供了一个极有价值的癌症标记分子,因为通过它就可以确定那些易于患前列腺癌或者是处在癌症早期的男性,这样就有可能引进有效的治疗。最近,一个细胞因子信号转导/受细胞因子诱导的SH2蛋白质家族成员的抑制子——SOCS-1基因的甲基化转录沉默在各种各样的癌细胞中都有发现,包括肝癌、多骨髓瘤和急性白血病。因此,用来检测SOCS-1基因甲基化状态的筛选分析就能够提供一些与这些癌症相关的诊断信息。
因为癌症是潜伏性较强的疾病,在病情恶化之前没有明显的临床特征和症状,标记分子的存在及其使用使得我们能够确定一个人是否易于患某种癌症,甚至作出癌症早期的检测,这是具有相当大医学价值的。可惜的是,对于大多数癌症,还没有这样的标记分子可以被利用。这样,许多癌症患者都只有在病情恶化到需要做化疗或者已经是无药可治的情况下才会寻求医学的帮助。因此,就有必要寻找到可以用来检测癌症细胞的标记分子。本发明就满足了这样一个需要,并且提供了额外的优点。
发明概述 本发明涉及鉴定与癌症有关的表观遗传学沉默基因例如甲基化沉默基因的方法。在一种实施方案中,本发明涉及鉴定与至少一种癌症有关的至少一种表观遗传学沉默基因的方法。这种方法可以这样来实施,例如将代表基因组的核苷酸序列阵列与核酸扣除(substraction)产物在适合于核酸扣除产物与阵列上互补的核苷酸序列选择性杂交的条件下接触,所述核酸扣除产物含有对应于在用至少一种可以恢复表观遗传学沉默基因的表达的试剂接触过的癌细胞中表达的,但不在所述癌细胞的对应正常细胞中表达的RNA的核酸分子;然后检测核酸扣除产物与该阵列的一部分核苷酸序列的选择性杂交,其中对应于在与所述癌细胞对应的正常细胞中表达的RNA的核酸分子在适合于选择性杂交的条件下不与所述的这部分核苷酸序列杂交,因而与所述阵列的这部分核苷酸序列选择性杂交的核酸扣除产物代表了所述癌细胞的表观遗传学沉默基因,由此鉴定出与至少一种癌症相关的至少一种表观遗传学沉默基因。
重新激活表观遗传学沉默基因的表达的试剂可以是如下的任何一种试剂,例如,甲基转移酶抑制剂(如,5-氮杂-2′-脱氧胞苷;DAC),组蛋白脱乙酰酶抑制剂(如,曲古抑菌素A;TSA),或这些试剂的组合如DAC和TSA的组合。因此,在本实施方案的一个方面,所述的核酸扣除产物包括与癌细胞中表达的RNA对应的核酸分子,所述癌细胞与DAC或TSA接触过。在另一个方面,核酸扣除产物包括与癌细胞中表达的RNA对应的核酸分子,所述癌细胞与DAC和TSA接触过。
与癌症有关的表观遗传学沉默基因在此通过表1中所列的基因来例示。例如,可以通过癌细胞与DAC接触而被重新激活的表观遗传学沉默基因,即甲基化沉默基因的实例是PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7。同样,可以通过癌细胞与DAC和TSA接触而被重新激活的表观遗传学沉默基因的实例是POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPP1R21A,FPGT,TRIM32,或其组合。
发明的方法可鉴定与一种或多种癌症有关的表观遗传学沉默基因,所述癌症包括,例如一种或多种癌和/或肉瘤。这种方法在此的实例是鉴定与结直肠癌有关的表观遗传学沉默基因,与胃癌有关的表观遗传学沉默基因,以及与结直肠癌和胃癌有关的表观遗传学沉默基因。
在另一个具体实施方案中,本发明涉及鉴定与至少一种癌症有关的至少一种甲基化沉默基因的方法。这种方法可以这样来实施,例如将代表基因组的核苷酸序列阵列与核酸扣除产物在适合于核酸扣除产物与阵列上互补的核苷酸序列选择性杂交的条件下接触,所述核酸扣除产物含有对应于在用去甲基化试剂接触过的癌细胞中表达的,但不在所述癌细胞的对应正常细胞中表达的RNA的核酸分子;然后检测核酸扣除产物与该阵列的一部分核苷酸序列的选择性杂交,其中对应于在与所述癌细胞对应的正常细胞中表达的RNA的核酸分子在适合于选择性杂交的条件下不与所述的这部分核苷酸序列杂交,因而与所述阵列的这部分核苷酸序列选择性杂交的核酸扣除产物代表了所述癌细胞的甲基化沉默基因,由此鉴定出与至少一种癌症相关的至少一种甲基化沉默基因。
与癌症细胞的RNA对应的核酸分子可以是DNA(如cDNA)或RNA(如cRNA)。一般地,与细胞RNA对应的核酸分子被标记以进行检测,例如用放射性同位素,顺磁性同位素,发光化合物,化学发光化合物,荧光化合物,金属螯合物,酶,酶的底物,受体,或受体的配体标记,或例如采用可检测的标记探针来进行检测,这样核酸分子与阵列的核苷酸序列的杂交能够被检测到。
根据本发明的一种方法,至少一种(如,1,2,3,4,5或更多种)甲基化沉默基因与至少一种(如,1,2,3或更多种)癌症有关。癌症可以是,例如癌(carcinoma)或肉瘤(sarcoma),包括一种或更多种特定类型的癌症,例如消化道/胃肠道癌,肝癌,皮肤癌,乳癌,卵巢癌,前列腺癌,淋巴瘤,白血病,肾癌,肺癌,肌肉癌,骨癌或脑癌。在一个实例中,单独的甲基化沉默PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3和DLX7基因,或其组合被确定与结直肠癌,胃癌有关,或同时与结直肠癌和胃癌有关。在另一个实例中,一个基因家族的成员,包括单独的SFRP1,SFRP2,SFRP4,SFRP5或其组合被鉴定为与结直肠癌和/或胃癌有关的甲基化沉默基因。
本发明也涉及鉴定表现出不受调控的生长或有这种倾向的细胞的方法。这种方法可以这样来实施实施,例如在受测细胞中检测表1所示的至少一种基因或其组合的表观遗传学沉默,由此确定该受测细胞为表现出不受调控的生长或有这种倾向的细胞。例如,表观遗传学沉默基因可以是PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPPIR21A,FPGT,或TRIM32基因,或这些基因的组合。表现出不受调控的生长或有这种倾向的细胞可以是赘生性细胞,例如一种恶化前的细胞如胃肠息肉的细胞,或可以是癌症细胞,例如一种癌细胞如结直肠癌细胞或胃癌细胞,或肉瘤细胞。
在一种具体实施方案中,表观遗传学沉默是甲基化沉默,用于鉴定表现出不受调控的生长或有这种倾向的细胞的方法可以通过检测甲基化沉默来实现。例如,甲基化沉默的检测是通过将包含着含有基因的核酸分子的5′端调控区域的区域与甲基化敏感型限制性内切酶接触来实现的,这种对甲基化敏感的内切酶在含有CpG二核苷酸的甲基化胞嘧啶残基的5′调控区内的识别位点上剪切,这样,核酸分子的切割就可以作为指示受测细胞中这个基因甲基化沉默的标志。例如,这种甲基化敏感型限制性内切酶是Acc III,Ban I,BstN I,Msp I或者Xma I。作为选择,或者作为补充,甲基化沉默的检测是通过将包含着含有基因的核酸分子的5′端调控区域的区域与甲基化敏感型限制性内切酶接触来实现的,这种内切酶在含有CpG二核苷酸的甲基化胞嘧啶残基的5′调控区内的识别位点处剪切,假如所述CpG二核苷酸的胞嘧啶残基被去甲基化的话,这样没有核酸分子的剪切发生提供了受测细胞中基因甲基化沉默的指示。例如,这种甲基化敏感型限制性内切酶是Acc II,Ava I,BssH II,BstU I,Hpa II或者Not I。
基因的甲基化沉默也可以这样来检测,将含有受测细胞中基因的核酸分子的5′端调控区域与化学试剂接触,所述化学试剂会选择性地修饰未甲基化的或者甲基化的胞嘧啶残基,并检测由于所述接触而产生的产物,其中该产物是作为基因上CpG二核苷酸中胞嘧啶残基甲基化的指示,由此检测待测细胞中基因的甲基化沉默。例如,这样的产物可以通过电泳方法,色谱方法,质谱方法,或者这些方法的组合来检测。
在本方法的一个方面,所述化学试剂是肼,由此就会生成肼处理的基因5′端调控区域。这样的方法可以进一步包括将被肼处理的5′端调控区域与能够剪切经肼修饰的胞嘧啶残基的试剂接触,得到包含着含有基因的核酸分子的片断的产物;按照分子量大小分离这些片断;然后检测在这个基因的5′端调控区域中已知含有胞嘧啶残基的位置处的缺口,其中该缺口就是基因中CpG二核苷酸的胞嘧啶残基甲基化的指示,由此便可检测受测细胞中这个基因的甲基化沉默。用来剪切经肼修饰的胞嘧啶残基的试剂可以是例如哌啶。
在本方法的另一个方面,所述化学试剂包括亚硫酸氢根离子,由此在基因5’调控区中未甲基化的胞嘧啶残基可被转变为亚硫酸氢盐修饰的胞嘧啶残基。这种方法可进一步包括将亚硫酸氢根离子处理的基因暴露于碱性条件中,从而亚硫酸氢盐修饰的胞嘧啶残基被转变为尿嘧啶残基;然后检测在受测细胞的亚硫酸氢根离子处理的基因的5’调控区中尿嘧啶残基的数量或分布,其中与暴露于碱性条件后相应的亚硫酸氢根离子处理的未甲基化基因中尿嘧啶残基的数量或分布相比,受测细胞的基因5’调控区中尿嘧啶残基数量或分布的减少指示所述的基因5’调控区中CpG二核苷酸中胞嘧啶残基存在甲基化,由此检测受测细胞所述基因的甲基化沉默。尿嘧啶残基的数量或分布可以通过例如测定在暴露于碱性条件后亚硫酸氢盐修饰的基因5’调控区的核苷酸序列来检测。作为选择,或作为补充,尿嘧啶残基的数量或分布可以这样来检测,将暴露于碱性条件后的亚硫酸氢根离子处理的基因序列与寡聚核苷酸接触,所述的寡聚核苷酸可选择性地与含有尿嘧啶残基的基因5’调控区杂交,并检测寡聚核苷酸的选择性杂交。
用于这种方法中的寡聚核苷酸可以是,例如具有在SEQ ID NO23,24,111,112,115,116,119,120,125,126,129,130,133,134,139,140,143或144中所示的核苷酸序列的寡聚核苷酸。为了方便检测,在一个方面,寡聚核苷酸可包括可检测的标记,因此提供了一种通过检测标记来检测选择性杂交的方法。可检测的标记可以是可以方便地被检测的任何标记,包括,例如放射性同位素,顺磁性同位素,发光化合物,化学发光化合物,荧光化合物,金属螯合物,酶,酶的底物,受体或受体的配体。在另一个方面,所述的寡聚核苷酸可以是引物延伸反应的底物,其中所述的检测选择性杂交包括检测引物延伸反应的产物。例如,寡聚核苷酸(引物)可以是甲基化特异性引物,如具有在SEQ IDNO23,24,111,112,115,116,119,120,125,126,129,130,133,134,139,140,143或144中所示的核苷酸序列的寡聚核苷酸,其可选择性地与含有SFRP1,SFRP2,SFRP4或SFRP5基因甲基化区的核苷酸序列杂交,并使其延伸。
尿嘧啶残基的数量或分布的检测也可以这样来检测,例如将基因的5’调控区与含有正向和反向引物的扩增引物对在适合扩增的条件下接触,其中所述引物对的至少一条引物含有可选择性与含尿嘧啶残基的5’调控区的核苷酸序列杂交的寡聚核苷酸,因而扩增产物的产生指示在所述基因5’调控区中CpG二核苷酸中的胞嘧啶残基甲基化,因此可检测受测细胞的基因的甲基化沉默。用于这种方法中的扩增引物对的实例见表2和3,包括,例如在SEQ ID NO23和24,SEQ IDNOS111和112,SEQ ID NOS115和116,SEQ ID NOS119和120,SEQID NOS125和126,SEQ ID NOS129和130,SEQ ID NOS133和134,SEQ ID NOS139和140,或SEQ ID NOS143和144中所示的引物对,它们是可用于检测SFRP1,SFRP2,SFRP4或SFRP5基因5’调控区甲基化的甲基化特异性引物。
另外,尿嘧啶残基的数量或分布的检测可以这样来检测,将基因的5’调控区与含有正向和反向引物的扩增引物对在适合扩增的条件下接触,其中所述引物对的两条引物可选择性地与含有胞嘧啶残基的5’调控区的核苷酸序列杂交,但不与含尿嘧啶残基的5’调控区的核苷酸序列杂交,因而扩增产物的产生可指示在所述基因5’调控区中CpG二核苷酸中缺少胞嘧啶残基甲基化,因此可检测受测细胞中基因的甲基化沉默。可用于这种方法中的扩增引物对的实例见表2和3,包括,例如在SEQ ID NOS25和26,SEQ ID NOS113和114,SEQ ID NOS117和118,SEQ ID NOS121和122,SEQ ID NOS127和128,SEQ IDNOS131和132,SEQ ID NOS135和136,SEQ ID NOS141和142或SEQ ID NOS145和146中所示的引物对,它们是可用于检测SFRP1,SFRP2,SFRP4或SFRP5基因5’调控区缺少甲基化的未甲基化特异性引物。
尿嘧啶残基的数量或分布的检测也可以这样来检测,将基因的5’调控区与第一扩增引物对和第二扩增引物对在适合扩增的条件下接触,其中所述第一扩增引物对含有一条正向引物和一条反向引物,其中所述第一引物对的至少一条引物含有可与含尿嘧啶残基的基因5’调控区的核苷酸序列选择性杂交的寡聚核苷酸,其中所述第二扩增引物对含有一条正向引物和一条反向引物,其中所述第二引物对的两条引物可与含胞嘧啶残基的基因5’调控区的核苷酸序列选择性杂交,但不与含尿嘧啶残基的基因5’调控区的对应核苷酸序列杂交,其中如果由所述第一引物对可获得扩增产物的话,其具有第一长度,其中如果由所述第二引物对可获得扩增产物的话,其具有与第一长度不同的第二长度,因而扩增产物的长度可指示尿嘧啶残基,因此可指示基因5’调控区中CpG二核苷酸中胞嘧啶残基的甲基化,因此可检测受测细胞中基因的甲基化沉默。
与癌症有关的基因的甲基化沉默的检测也可以这样来进行,将受测细胞与脱甲基试剂接触,然后检测与未用脱甲基试剂接触过的受测细胞中RNA的表达水平相比,由所述基因编码的RNA的表达增加。这种方法可以进一步包括检测在相应的表现出受控的生长的细胞,或相应细胞的提取物中所述基因5’调控区的CpG岛中CpG二核苷酸的胞嘧啶残基甲基化,如果存在的话。所述脱甲基试剂可以是甲基转移酶抑制剂如5-氮杂-2′-脱氧胞苷。RNA表达增加的检测可应用用于检测RNA的任何方法进行,包括,例如,northern印迹分析,逆转录聚合酶链式反应,或与核苷酸序列阵列的选择性杂交,如在此所公开的。因此,本发明的方法可以高通量的形式实施,其中所述的受测细胞或受测细胞的提取物包括一系列受测细胞或受测细胞的提取物的一种,或其组合;而所述的一系列受测细胞或受测细胞的提取物中的每一份是相同的或不同的,或是其组合。根据实施本发明的高通量方法,受测细胞或受测细胞的提取物可被安排在阵列中,所述阵列可以是可寻址的阵列,其在固体支持物如微芯片,玻璃板或珠子上。
根据本发明的方法来研究的受测细胞可以是来自于细胞培养物的细胞,例如已建立的细胞系或培养中的原代细胞,或可以包括从受试者例如人类受试者中获得的样本。这样,所述样本可以是器官样本,组织样本,或细胞样本,例如消化道/胃肠道组织样本,肝样本,皮肤样本,淋巴结样本,肾样本,肺样本,肌肉样本,骨样本,或脑样本。例如,胃肠道样本可包括胃样本,小肠样本,结肠样本,直肠样本,或其组合。样本也可包括一种生物流体样本,例如骨髓,血液,血清,淋巴,脑脊液,唾液,痰液,粪便,尿液,或精液样本,其中可含有细胞或细胞产物,特别是核酸分子。
本发明也涉及减缓或抑制细胞的无调控生长的方法,所述细胞中至少一种与癌症有关的基因的转录表现出表观遗传学上的沉默。这种方法可以这样来实施,例如恢复由所述的表观遗传学沉默基因编码的多肽在所述细胞中的表达,由此减缓或抑制细胞的无调控生长。这种表达的恢复例如可通过将细胞与脱甲基试剂(例如,甲基转移酶抑制剂),组蛋白脱乙酰酶抑制剂或其组合接触来实现。
在一个具体实施方案中,所述的表观遗传学沉默基因是甲基化沉默基因,所述方法包括将细胞与至少一种脱甲基试剂接触,例如与DAC接触。在一个方面,细胞可在体外与脱甲基试剂接触,例如在培养基中或其他有助于细胞生存的介质中。如果需要,与脱甲基试剂接触过的细胞可进一步施予受试者。在另一个方面,所述试剂可以施予受试者,这样,生长不受调控的细胞可与该试剂接触。
在另一个具体实施方案中,该方法包括将编码所述多肽的多聚核苷酸导入进所述细胞中,这样多肽可由所述多聚核苷酸表达出来,从而在细胞中恢复多肽的表达。所述多肽可以但不是必须包含在载体中,所述载体如病毒载体,和/或可以在可促进多聚核苷酸导入进细胞的基质中进行配制,如脂质体或微泡。可以通过将细胞与多聚核苷酸在体外接触而将多聚核苷酸导入进细胞中,在此情况下,含有多聚核苷酸的细胞可以但不是必须被施于受试者。也可以通过将细胞与多聚核苷酸在体内接触而可将多聚核苷酸导入进细胞中。
表观遗传学沉默基因可以是采用在此所公开的方法,检测特定类型的细胞如特定类型的癌症细胞而鉴定出的任何基因。在结直肠癌细胞中的表观遗传学沉默基因用在表1中所列的基因来例示,举个例子,采用表4中所列的扩增引物对(SEQ ID NOS149至296;例如,SEQ ID NOS149和150,或SEQ ID NOS151和152,等等)对由结直肠癌细胞中获得的核酸分子进行RT-PCR,可获得包括表1中的基因的部分的GenBank登记的多聚核苷酸序列。结直肠癌细胞和/或胃癌细胞中的表观遗传学沉默基因的示例是PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1和SNRPN,它们并不显示有可检测到的基底表达,而用DAC处理时可重新表达,但用TSA处理不会重新表达;HOXA1,GRO3和DLX7,它们显示有基底水平的表达,但在用DAC而不用TSA处理时其表达会增强;POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPPIR21A,FPGT和TRIM32,它们可被单独使用的TSA上调,而它们的基底表达和在DAC处理下的上调在这些基因中有所不同。
本发明进一步涉及一种治疗癌症患者的方法,其中所述患者的癌细胞中表现有至少一种基因的表观遗传学沉默表达。这种方法可以通过例如恢复患者的癌细胞中一种或多种表观遗传学沉默基因的表达来实施。例如,当至少一种表观遗传学沉默基因是甲基化沉默基因时,可通过对受试者施予足以恢复受试者癌细胞中甲基化沉默基因表达的量的脱甲基试剂来治疗患者。作为选择,或作为补充,患者可以这样来治疗,对受试者施用至少一种多聚核苷酸,所述多聚核苷酸编码由所述的表观遗传学沉默基因中的一种或多种所编码的至少一种多肽,并且施用量足以使所述的至少一种多肽在患者的癌细胞中表达。当对患者施予多聚核苷酸时,多聚核苷酸可包含在载体(例如,病毒载体)中,所述载体优选表达载体,和/或可以在可促进靶癌细胞摄取多聚核苷酸的基质中进行配制(例如,在脂质体中)。
根据本发明的方法要治疗的癌症可以是任何类型的癌症,包括,例如癌(carcinoma)或肉瘤(sarcoma)。例如,其中所述的癌症是结直肠癌,胃癌或结直肠癌和胃癌,患者的治疗可通过恢复一种或多种表观遗传学沉默基因的表达来实现,所述表观遗传学沉默基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,POR1,MBNL,TRADD,PDIP,RAD23B,RPLl3,GNAI2,PPP1R21A,FPGT,TRIM32,其家族成员,或其组合。包括SFRP1,SFRP2,SFRP4和SFRP5在内的SFRP基因提供了一个家族基因的实例,其中的一种或多种基因在结直肠癌,胃癌或两者中被表观遗传学地沉默。
本发明也涉及一种为治疗癌症患者而选择治疗策略的方法。这种方法可以这样来实施,例如,根据在此公开的方法,鉴定至少一种与癌症有关的甲基化沉默基因(即,将代表基因组的核苷酸序列阵列与核酸扣除产物接触,检测核酸扣除产物与阵列上的一部分核苷酸序列之间的选择性杂交);然后选择用于恢复一种或多种已被确定的甲基化沉默基因在患者癌细胞中的表达的试剂。例如,被选择的试剂可以是编码已被确定的甲基化沉默基因的多聚核苷酸,例如,编码由PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3或DLX7基因,这样的基因的家族成员,或这样的基因的组合所编码的多肽的多聚核苷酸。被选择用于恢复甲基化沉默基因的表达的试剂也可以是脱甲基试剂如DAC。
因此,本发明进一步涉及治疗患有结直肠癌、胃癌或两者的个体的方法,其中与所述癌症有关的细胞含有至少一种甲基化沉默基因。这种方法可以这样来实施,例如施予受试者可以恢复所述的至少一种甲基化沉默基因的表达的试剂,其量足以恢复所述的甲基化沉默基因在与所述癌症有关的细胞中的表达。所述试剂可以是编码所述的至少一种甲基化沉默基因的多聚核苷酸,例如,编码由PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3和/或DLX7基因,其家族成员,或其组合所编码的多肽的多聚核苷酸;所述试剂或者是一种脱甲基试剂如DAC。用于治疗患有结直肠癌、胃癌或两者的个体的试剂可与所述癌症的细胞离体接触,此后所述细胞可以被再施予患者;或者,所述试剂被施于患者癌细胞所在的部位。
本发明进一步涉及一种分离的寡聚核苷酸,其具有在SEQ IDNOS1至296的任何一个中所示的核苷酸序列,还涉及多种分离的寡聚核苷酸,其包括在SEQ ID NOS1至296中所示的分离的寡聚核苷酸中的至少两种。另外,本发明涉及扩增引物对,其包括在SEQ ID NOS1至296中所示的一条正向引物和一条反向引物(如,SEQ ID NOS1和2,SEQ ID NOS3和4,SEQ ID NOS5和6,等等),其中所述扩增引物对可以扩增在表1中所列的基因的核苷酸序列。在一个方面,本发明的扩增引物对可以用来特异地扩增核酸分子的甲基化的5’调控区,这样的扩增引物对的示例是SEQ ID NOS23和24,SEQ ID NOS111和112,SEQ ID NOS115和116,SEQ ID NOS119和120,SEQ IDNOS125和126,SEQ ID NOS129和130,SEQ ID NOS133和134,SEQ ID NOS139和140或SEQ ID NOS143和144,它们可扩增具有甲基化的5’调控区的SFRP家族成员。在另一个方面,本发明的扩增引物对可以用来特异地扩增核酸分子的未甲基化的5’调控区,这样的扩增引物对的示例是SEQ ID NOS25和26,SEQ ID NOS113和114,SEQ ID NOS117和118,SEQ ID NOS121和122,SEQ ID NOS127和128,SEQ ID NOS131和132,SEQ ID NOS135和136,SEQ IDNOS141和142或SEQ ID NOS145和146,它们可扩增具有未甲基化的5’调控区的SFRP家族成员。
本发明还涉及试剂盒,它含有本发明的至少一种分离的寡聚核苷酸,包括例如多种这样的分离的寡聚核苷酸。在一个具体实施方案中,本发明的试剂盒中的多种分离的寡聚核苷酸包括至少一对扩增引物(即,一条正向引物和一条反向引物),还可以包括多对扩增引物,包括例如在表2,表3和/或表4中所示的扩增引物对。因此,本发明的试剂盒可以含有,例如一种或多种甲基化特异性扩增引物对,未甲基化特异性扩增引物对,或甲基化特异性扩增引物对和未甲基化特异性扩增引物对的组合,其包括用于扩增特定基因的甲基化形式或未甲基化形式的甲基化特异性引物对和未甲基化特异性引物对,所述的特定基因已知是或怀疑是在一种或多种类型癌症细胞中被甲基化沉默的基因。
本发明的试剂盒可以进一步包括有用的其他试剂,例如与所述试剂盒的寡聚核苷酸用于共同目的的试剂。例如,当试剂盒中含有一种或多种甲基化特异和/或未甲基化特异的扩增引物对时,所述试剂盒可以进一步含有例如对照多聚核苷酸,其可以是甲基化或未甲基化的;还可以含有一种或多种修饰甲基化胞嘧啶残基的试剂,和/或一种或多种用于进行扩增反应的试剂。当所述试剂盒中含有一种或多种可与甲基化或未甲基化的基因序列选择性杂交的多聚核苷酸时,所述试剂盒中可以进一步含有例如甲基化敏感的限制性核酸内切酶。


图1总结了在不同来源的一系列人类癌症细胞系中,选自组1a(见表1)的6个基因的甲基化特异PCR(MSP)分析。基因的名称标示在上侧,细胞系的名称标示在左侧。黑框表示完全甲基化,灰框和空白框分别表示部分的甲基化和没有甲基化。“ND”表示没有被测定(因为缺少MSP中的扩增)。
图2总结了在124个原发性CRC样本中,SFRP基因的MSP分析(见实施例1)。基因的名称表示在上面。每行代表一种原发性CRC肿瘤。灰框和空白框分别表示甲基化和没有甲基化。
发明详述 本发明是基于开发用于鉴定在细胞基因组例如癌症细胞基因组中的表观遗传学沉默基因的方法。本方法的示例是鉴定在结直肠癌(CRC)细胞中的74种表观遗传学沉默基因,包括由于甲基化和/或组蛋白脱乙酰基作用而被沉默的基因。如在此所公开的,揭示了肿瘤特征(tumor profiling)的模式,其通过鉴定CRC和胃癌(GC)中SFRP1,SEZ6L,LPPHI和CXX1基因的甲基化沉默来例示。这样的肿瘤特征可以延伸至SFRP1基因的相关家族成员,其中,在CRC和GC中,也检测到SFRP2,SFRP4和SFRP5的高度甲基化(SFRP3在5’调控区缺少CpG岛)。因此,本发明提供了鉴定与癌症有关的表观遗传学沉默基因的方法,并进一步提供了检测与基因表达的表观遗传学沉默有关的癌症的方法,治疗患有这样的癌症的患者的方法,和用于实施这些方法的组合物。
基因启动子的异常的高度甲基化被认为是癌症中与肿瘤抑制基因的失活相关的主要机制。转录的沉默是由甲基化和/或组蛋白脱乙酰酶(HDAC)活性介导的,而甲基化是主要的。如在此所公开的,基于cDNA微阵列的分析被用来筛选人类CRC中的表观遗传学沉默基因。对超过10,000个基因进行的筛选鉴定出大量的表观遗传学沉默基因,包括数种启动子高度甲基化的(即,甲基化沉默的)基因和其它启动子未甲基化的基因,对于后者,其表达的增加是通过HDAC抑制来实现的(见实例1)。通过许多这样的高度甲基化的基因的预测的功能或染色体位置,确定了它们在肿瘤发生中的地位,从而确定了所公开的方法的有效性。鉴定了优选在CRC和GC中高度甲基化的一组基因,包括SFRP1基因,如在此所公开的,它所属于的基因家族在CRC中也是频繁地被高度甲基化的。除了说明肿瘤抑制基因功能丧失的机制以外,本结果还提供了可检测基本上所有的CRC的一系列分子标记(见图2)。
癌症的进展不仅与遗传决定的基因功能改变有关,而且与表观遗传学决定的基因功能改变有关。后者涉及基因启动子中异常的高度甲基化的CpG岛,伴随着基因转录的丧失。为了随机筛选癌症基因组以鉴定这样的基因座,已经花费了很大的努力来识别这种启动子甲基化。这些搜索策略,包括在高频率杂合性丧失(LOH)的区域和在整个基因组内鉴定CpG岛的高度甲基化,均被证明可用于鉴定肿瘤特异的高度甲基化的CpG岛。然而,也会受到一些问题的困扰,如鉴定了一些与基因启动子无关的位点,所使用的CpG岛亚类的甲基化敏感限制性位点的潜在偏差,或在很多岛中缺乏位点和/或一旦鉴定发生变化的基因座,需要费力地搜索附近的基因。
通过将基因表达状态(expression status)和表观遗传学调控结合在一起,目前公开的微阵列策略避免了以前的方法的劣势。而且,该方法利用了以下的观察结果,即癌症中高度甲基化基因的沉默可能依赖于致密的CpG岛甲基化和HDAC活性(Cameron等,Nature Genet.21103-107,1999,在此整入以供参考)。如采用结肠癌细胞所例示的,所公开的方法有效地鉴定出一些新基因,其转录的抑制在肿瘤发生中具有重要作用。令人注目的是,所公开的基因组筛选方法可鉴定集中于特定肿瘤类型的基因高度甲基化事件,可同时涉及一个基因家族的多个成员(实例1)。
因此,提供了鉴定表观遗传学沉默基因的方法,例如鉴定与癌症有关的甲基化沉默基因的方法。在一个具体实施方案中,本发明提供了鉴定与至少一种癌症有关的至少一种表观遗传学沉默基因的方法。如在此所使用的,术语“至少一种”的含义是1,2,3,4,5,6,7,8,9,10或更多。例如,所公开的微阵列方法鉴定了74个基因,它们在结直肠癌中是表观遗传学沉默的。而且,已确定的是,被鉴定为在CRC中表观遗传学沉默的几种基因也是在胃癌细胞中表观遗传学沉默的。正是这样,该方法鉴定了与CRC和/或GC有关的表观遗传学沉默的基因。
术语“表观遗传学上被沉默”或“表观遗传学沉默的”,当用于基因时是指未被转录的基因,或被转录的水平与对应的对照细胞(如,正常细胞)中该基因的转录水平相比是减少的,这是由不同于遗传改变的一种机制导致的。基因沉默的表观遗传学机制是为人所熟知的,包括,例如基因5’调控区CpG岛中CpG二核苷酸的高度甲基化,以及由于例如组蛋白乙酰化导致的染色质结构的改变,这样基因的转录减少或被抑制。检测一种基因的表观遗传学沉默的方法在此被公开,包括,例如在细胞与一种可缓解表观遗传学沉默的试剂例如脱甲基试剂接触后,检测基因的再表达(再活化),其中所述的沉默是由高度甲基化导致的。
如在此所使用的,术语“甲基化”或“高度甲基化”,当用于基因时,其含义是指与所述基因相关的CpG岛中CpG二核苷酸的胞嘧啶残基在5’位置被甲基化,即5′-甲基胞嘧啶。在此所使用的术语“甲基化状态”是指相对丰度,包括在CpG岛中CpG二核苷酸的甲基化胞嘧啶残基的存在或缺少。通常,CpG岛中的胞嘧啶残基在转录活性基因中是未甲基化的,因此,在CpG岛中检测到甲基化胞嘧啶残基表明基因的表达减少或被抑制。因此,如上所讨论的,在此所提到的“甲基化沉默的”基因是指基因不被转录,或与在对应的对照细胞(通常是正常细胞)中所述基因的转录水平相比,其转录的水平降低,这是由于基因5’调控区的CpG岛中CpG二核苷酸的高度甲基化。甲基化沉默基因表达的结果是含有该基因的细胞中该基因编码的多肽(即,基因产物)水平降低,或完全缺乏,这样在该细胞中正常由该基因产物所提供的功能降低或缺少。
鉴定与癌症有关的表观遗传学沉默基因的方法可以这样来进行,例如在适合于核酸扣除产物与阵列的互补核苷酸序列选择性杂交的条件下,将代表基因组的核苷酸序列阵列与核酸扣除产物(即,对应于在用至少一种可以重新激活表观遗传学沉默基因的表达的试剂接触过的癌细胞中表达的,但不在所述癌细胞的对应正常细胞中表达的RNA的核酸分子)接触;并检测核酸扣除产物和阵列的一部分核苷酸序列的选择性杂交,其中对应于在所述癌细胞的对应正常细胞中表达的RNA的核酸分子在所述的适合于杂交的条件下并不与所述的这部分核苷酸序列杂交,因此与阵列的这部分核苷酸序列选择性杂交的核酸扣除产物代表了癌细胞的表观遗传学沉默基因(见实施例1)。所提到的细胞的“对应于RNA的核酸分子”的含义是RNA如mRNA或polyA+RNA,利用来自细胞的RNA作为模板产生的cDNA,或利用RNA或cDNA作为模板产生的cRNA。为了实施本发明的方法,与细胞的RNA对应的核酸分子通常可被可探测地标记,例如用放射性同位素,顺磁性同位素,发光化合物,化学发光化合物,金属螯合物,酶,酶底物,受体或受体的配体;或能够例如利用可检测到的标记探针来检测,这样核酸分子和阵列的核苷酸序列的杂交可被检测到。
如在此所使用的,术语“代表基因组的核苷酸序列阵列”的含义是有组织的一组核苷酸序列与固体支持物相连接,例如,与一种微芯片或玻璃板相连接,其中所述的序列可特异地和选择性地与在细胞中表达的核酸分子杂交。阵列的选择是以要被检测的细胞所来源的生物体和/或要被检测的一种或多种组织为基础。通常,阵列代表一种真核细胞或细胞类型的基因组,特别是哺乳动物细胞或细胞类型,优选是人类细胞,包括一种或多种组织的细胞,如果需要的话(如,结直肠上皮细胞)。通常,“代表”基因组的探针阵列可鉴定细胞中至少大约10%的表达核酸,一般至少大约20%或40%,通常是大约50%至70%,典型地是至少大约80%或90%,特别是95%至99%,或细胞或生物体的更多的表达核酸分子。应该认识到的是,代表的核酸分子越多,本发明的方法就越可能鉴定在癌症中表观遗传学上沉默的所有基因。含有代表特定基因组的核苷酸序列的阵列可应用熟知的方法进行制备,或从商业渠道中购得(如,Invitrogen Corp.;Affymetrix),其实例为在本研究(实施例1)中被应用的Human GeneFiltersTM微阵列,ReleaseII,阵列(Research Genetics;现在是Invitrogen Corp.的子公司)。
可重新激活表观遗传学沉默基因的表达的试剂可以是甲基转移酶抑制剂(如,5-氮杂-2′-脱氧胞苷;DAC),组蛋白脱乙酰酶抑制剂(如,曲古抑菌素A;TSA),或试剂组合如DAC和TSA的组合。可以从细胞例如用这样的试剂处理过的癌症细胞中分离出RNA,将该RNA或该RNA的cDNA产物与来自于未用所述试剂处理过的相应细胞(如,癌症细胞)的RNA分子接触,在此条件下,仅在处理过的细胞中表达的RNA(或cDNA)可以被分离,由此获得核酸扣除产物。进行核酸扣除反应的方法是为人熟知的(Hedrick等,Nature 308149-155,1984,在此整入以供参考),执行这种方法的试剂盒可从商业渠道中购得(如,Gibco/BRL;见实施例1)。
根据本发明的方法,可以有至少一种(例如,1,2,3,4,5或更多种)表观遗传学沉默的基因与至少一种(例如,1,2,3或更多种)癌症有关。所述癌症可以是,例如一种癌(carcinoma)或肉瘤(sarcoma),包括一种或多种特定类型的癌症,例如,消化道/胃肠道癌症,肝癌,皮肤癌,乳癌,卵巢癌,前列腺癌,淋巴瘤,白血病,肾癌,肺癌,肌肉癌,骨癌或脑癌。与癌症有关的表观遗传学沉默基因在此的例示是在表1中所列举的基因(提供了GenBank注册号;见,例如互联网URL″ncbi.nlm.nih.gov″),它们与CRC和/或GC有关。关于表1,在CRC细胞中表观遗传学上沉默的而又能通过细胞与DAC的接触而被重新激活的基因(即,甲基化沉默基因)的例示是PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3和DLX7;可以通过癌症细胞与TSA的接触而被重新的表观遗传学沉默基因的例示是POR1,MBNL,TRADD,PDIP RAD23B,RPL13,GNAI2,PPP1R21A,FPGT和TRIM32。而且,如在此所公开的,已鉴定出的表观遗传学沉默基因的相关家族成员也可被表观遗传学沉默,包括,例如SFRP2,SFRP4和SFPR5,它们与SFRP1相关,它们单独或它们的组合与124个受测CRC样本的123个相关(见实施例1;图2)。
与正常的未甲基化的基因启动子区中CpG二核苷酸的异常DNA甲基化相关的基因转录的沉默是在肿瘤发生中被最广泛研究的表观遗传学异常。由甲基-CpG-结合结构域,转录辅阻遏物,染色质重构蛋白和组蛋白脱乙酰酶组成的蛋白复合体与高度甲基化的DNA区域的结合可导致染色质处于转录抑制(沉默)的状态。在真核细胞中,紧接着鸟嘌呤核苷残基5’端的胞嘧啶残基的甲基化主要发生在CG含量低的区域。相反,CpG岛通常在正常细胞中保持未甲基化状态,除了在X染色体失活和亲代的特异性印记的过程中,其中5’调控区的甲基化与转录的抑制有关。视网膜母细胞瘤(Rb)基因的从头甲基化已经在一小部分视网膜母细胞瘤中证明(Sakai等,Am.J.Hum.Genet.48880,1991),VHL基因的异常甲基化在一组散发性肾细胞癌中发现(Herman等,Proc.Natl.Acad.Sci.USA 919700-9704,1994)。肿瘤抑制基因的表达也可被正常的未甲基化的5’CpG岛的重新DNA甲基化所消除(见,例如,Issa等,Nature Genet.7536,1994;Merlo等,NatureMed.1686,1995;Herman等,Cancer Res.56722,1996)。
启动子区域的CpG岛的异常甲基化还与癌症的进一步发展有关。比如在造血细胞肿瘤中,E-钙依粘连蛋白(Graff等,Cancer Res.555195-5199,1995),DAP激酶(Katzenellenbogen等,Blood934347-4353,1999),和细胞周期调控子p15INK4B和p16INK4A的过度甲基化都与基因的失活相关(Herman等,Cancer Res.57837-841 1997;Melki等,Blood 953208-3213,2000;Ng等,Clin.Canc.Res.71724-1729,2001)。由于过度甲基化导致的转录沉默还在CDKN2A基因(Herman等,Cancer Res.554525-4530,1995),MGMT(Esteller等,Cancer Res.59793-797,1999),和MLH1基因(Herman等,Proc.Natl.Acad.Sci.USA956870-6875,1998)中发现。
染色体17p13.3位置的CpG岛的过度甲基化在多种常见类型的人类癌症中发现(Makos等,Proc.Natl.Acad.Sci.USA 891929,1992;Makos等,Cancer Res.532715,1993;Makos等,Cancer Res.532719,1993),而且在脑癌,结肠癌和眼癌中还与17p丢失和p53突变的时间和频率一致。与正常非甲基化启动子区域CpG岛的过度甲基化相关的基因转录沉默向我们展示了不同于编码区突变机制的另外一种使肿瘤抑制基因失活的机制(Baylin等,Cancer Cells 3383,1991;Jones和Buckley,Adv.Cancer Res.541-23,1990)。这种变化还与VHL,染色体3p上一种肾癌肿瘤抑制基因(Herman等,supra,1994),染色体6q上的雌激素受体基因(Ottaviano等,Cancer Res.542552,1994)和染色体11p上的H19基因(Steenman等,Nature Genetics,7433,1994)的表达丢失相关。SOCS-1基因的表达的甲基化沉默与多种癌症有关,包括肝细胞癌,多发性骨髓瘤和急性白血病(Yoshikawa等,Nat.Genet.2829-35,2001,在此整入以供参考)。
因此,本发明提供了通过在受测细胞中检测如表1所示的至少一种基因或其组合的表观遗传学沉默来鉴定生长不受调控或有此倾向的细胞的方法。例如,所述的表观遗传学沉默基因可以是PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPP1R21A,FPGT或TRIM32基因,或这些基因的组合。生长不受调控或有此倾向的细胞可以是一种赘生性细胞,其可以是,例如一种恶化前的细胞如胃肠道息肉细胞,或可以是一种癌症细胞,例如癌细胞如结直肠癌细胞或胃癌细胞,或肉瘤细胞。
在一种具体实施方案中,本发明的方法一部分需要比较待测细胞中基因的甲基化状态与正常生长的细胞中对应的基因的甲基化状态。此处所使用的名词“对应的”是指参考材料,通过它就可以比较待测材料。一般地,参考材料提供一个对照或者标准让待测材料具有可比性。比如,对于一个待测其甲基化状态的SFRP基因,参照一个对应的非甲基化的SFRP基因,就是指待测甲基化状态的SFRP基因的类型与非甲基化SFRP基因的类型相同,比如,待测基因和对应的非甲基化基因都是人类SFRP1基因。对于待测细胞来说,参考一个对应的正常生长的细胞一般是指参考正常的细胞,即其细胞周期和生长方式具有健康个体中该类细胞所具有的特征的细胞,这样,如果待测细胞被认为是一种CRC细胞,那么对应的细胞可以是例如正常的结肠上皮细胞。
本发明中的方法在实践的时候需要的样本包括待测细胞,或者是待测细胞的抽提物,其含有所述细胞的核酸分子,特别是基因组DNA,它们包括所有或者部分用来检测甲基化状态的基因的5’端调控区域的CpG岛。一般地,待测细胞是那些被怀疑已经失去生长控制的细胞,比如被怀疑具有损伤的活组织检查样本,或者是与恶化前或者恶化以后的细胞接近的细胞或者是曾经与之接近的细胞,如从一个被怀疑是损伤部位的周围一块地方或者几块地方取下来的细胞样本,这样的待测细胞可以提供例如外科手术需要进行到什么程度的信息,或者是一些从外科手术边缘收集的细胞样本,这样的待测细胞可以用于检测癌症是否已经完全摘除,或者是检测癌症是否已经重生。
根据本发明的方法研究的待测细胞也可以是来自于生物体并进行了培养的原代细胞,其目的可以是例如为了建立具有实质上和建立培养物的细胞来源一样的特性的原代细胞培养物,或者是出于为了能够重新施用于生物体而治疗和/或扩增细胞的目的。例如,结肠上皮细胞可以从一个患有CRC的病人的身上获得,其中所述细胞的一个或者更多个基因的表达表现出与癌症相关的甲基化沉默。这些培养中的细胞可以用一种或者更多种试剂处理,以检测这些试剂使沉默的基因恢复表达的能力,进而提供一种鉴定可以用于治疗该癌症病人或者另外一个患有以一种或者更多种同样的基因的甲基化沉默为特征的CRC的病人的药物的方法。
待测细胞可以用临床上通常用来获得含有细胞的样本的任何方式从生物体上获得。比如,待测细胞(或者含有这些待测细胞的样本)可以通过活组织检查程序获得,例如对含有待测细胞的器官或者组织进行活体穿刺取样。这样,待测细胞可以从各种样本中获取,例如胃肠道样本(如,息肉活检),肝样本,骨髓样本,皮肤样本,淋巴结样本,肾样本,肺样本,肌肉样本,骨样本,脑样本或类似样本。待测细胞也可以是生物流体的成分,例如,血液,淋巴,脑脊液,唾液,痰,粪便,尿或精液。如果合适的话,待测细胞也可以通过灌洗来得到,比如要从结肠,子宫,腹腔,或者类似的地方获取样品,或者可以通过抽吸来获得,比如要获得骨髓样本。
本发明中的方法在实践时也可以使用待测细胞的提取物,其中所述提取物包括待测细胞的核酸分子,特别是基因组DNA,其中的待测基因中包含全部或者部分CpG岛。所述提取物可以是粗提取物,包括例如含有待测细胞的组织的冻溶样本;也可以包括部分提纯的基因组DNA,其可能含有例如核基质的成分;或者可以包括基本纯化的基因组DNA,其可以是例如用蛋白酶处理和乙醇沉淀后得到的。在某些具体实施方案中,待测细胞还可以是包埋在石蜡中的组织切片样本的成分。
由于表观遗传学沉默包括甲基化沉默,因此用来鉴定细胞是否表现出或者易于表现出生长失控的方法可以通过检测细胞中一个或者多个目标基因的甲基化来实施。基因的CpG岛中的CpG二核苷酸的甲基化可以通过各种各样已知的检测核酸分子甲基化的方法来检测。这样的方法包括让基因与一种或者一系列可以选择性的修饰非甲基化的胞嘧啶残基或者是甲基化的胞嘧啶残基但不会对两者均起作用的化学试剂接触,这样甲基化修饰的存在与否就可以被检测;将基因序列与一种甲基化敏感的限制性内切酶接触,这种限制性内切酶的识别位点中含有CpG二核苷酸,然后就可以用这种内切酶来剪切含有或者缺乏甲基化胞嘧啶残基的CpG位点,但不能够在两种情况下都能够剪切,这样这些序列的剪切是否发生就可以被检测到;或者将包含基因的核酸分子与能够与该基因序列选择性杂交的寡聚核苷酸探针,引物或者扩增引物对接触,这样也可以用来确定是否有CpG甲基化的存在。这里提供了运用这些方法的一些例子,并且这些方法的一些修改和变动也本技术领域是已知的。
目标基因的甲基化可以这样来检测,例如,将含有包含该基因的核酸分子的5′端调控区域的区域与甲基化敏感型限制性内切酶接触,这种对甲基化敏感的内切酶在含有其胞嘧啶残基被甲基化的CpG二核苷酸的5′调控区内的识别位点上剪切,这样,该核酸分子的剪切就可以作为指示甲基化,也就是待测细胞中这个基因甲基化沉默的标志。甲基化敏感型限制性内切酶是众所周知的,例如有Acc III,Ban I,BstNI,Msp I和Xma I。作为选择或者作为补充,甲基化沉默也可以这样来检测,将包含着含有基因的核酸分子的5′端调控区域的区域与甲基化敏感型限制性内切酶接触,这种内切酶在含有其胞嘧啶残基被甲基化的CpG二核苷酸的5′调控区内的识别位点处剪切,倘若CpG二核苷酸的胞嘧啶残基被去甲基化的话,这样核酸分子没有发生剪切便是待测细胞中该基因甲基化沉默的指示。这样的甲基化敏感型限制性内切酶的例子是Acc II,Ava I,BssH II,BstU I,Hpa II,或者Not I。
检测包含目标基因序列的核酸分子被甲基化敏感型限制性内切酶剪切的发生与否可以通过任何一种有效的检测多聚核苷酸序列长度或者连贯性的方法来实现。比如,目标基因序列的断裂可以通过Southern印迹分析来确定,这种方法允许对剪切位点进行作图,或者用其他电泳方法或者色谱方法,这些方法可以基于相对大小,电荷,或者是二者的组合来分离核酸分子。目标基因的剪切还可以通过寡聚核苷酸连接分析来检测,其中,在核酸分子与限制性内切酶接触之后,设计有两个寡聚核苷酸,第一个寡聚核苷酸与限制性内切酶剪切位点上游且相邻的位置选择性杂交,第二个寡聚核苷酸与限制性内切酶剪切位点的下游且相邻的位置选择性杂交,然后将这两个寡聚核苷酸与目标基因接触,并进一步与连接酶接触,如果没有剪切发生,那么两个相邻的寡聚核苷酸分子就可以被连接到一起,而在剪切发生的情况下,连接不发生。通过测定连接反应之后的寡聚核苷酸分子的大小或者是其他参数,被连接的寡聚核苷酸分子就会与没有连接的寡聚核苷酸分子区别开来,因此也就提供了一种指示限制性内切酶活性的方法。
基因的甲基化沉默也可以通过将包含待测细胞基因的核酸分子的5’端调控区域与可以选择性的修饰非甲基化或者甲基化的胞嘧啶残基的化学试剂接触,然后检测这样接触之后的产物,其中这种产物就是指示该基因的CpG二核苷酸中的胞嘧啶残基是否甲基化的标记,这样也就达到了检测待测细胞中基因的甲基化沉默的目的。例如,这种产物可以通过电泳方法,色谱方法,质谱方法,或者是这些方法的组合来检测。
在这种实施方案的一个方面,用可以修饰胞嘧啶残基但却不能够修饰甲基化的胞嘧啶残基的肼与基因接触,然后再将经过肼处理的基因序列与一种可以在被肼处理的胞嘧啶残基处剪切核酸分子的试剂接触,比如哌啶,这样就会产生包括片断的产物。根据分子量来分离这些片断,例如可以利用电泳方法,色谱方法,或者质谱方法来分离,然后再与经过相同处理的对应的非甲基化的基因序列的分离模式比对,待测基因上在某些位置出现的缺口就说明这个基因含有甲基化的胞嘧啶残基。这样,缺口的存在就是待测细胞中目标基因的CpG二核苷酸中的胞嘧啶残基甲基化的一个指示。
在另外一个方面,含有目标基因的核酸分子与含有亚硫酸氢根离子的化学试剂接触,比如亚硫酸氢钠,它可以将没有甲基化的胞嘧啶残基转变成亚硫酸氢盐修饰的胞嘧啶残基,然后再将经过亚硫酸氢根离子处理过的基因序列暴露在碱性环境中,这样亚硫酸氢盐修饰的胞嘧啶残基又被转变成尿嘧啶残基。亚硫酸氢钠可以快速地与胞嘧啶的5,6-双键反应(但与甲基化的胞嘧啶反应很慢),形成磺化胞嘧啶反应中间产物,这种中间产物非常易于进行脱氨反应,而形成磺化尿嘧啶。这样,如果将磺化尿嘧啶暴露于碱性环境中就可以去除磺基,结果形成尿嘧啶。然后这些DNA分子又可以被扩增,例如通过PCR反应进行扩增,接着再测序以确定所有CpG位点的甲基化状态。在PCR反应中,Taq聚合酶将尿嘧啶识别作胸腺嘧啶,结果PCR的产物只有在起始模板DNA含有5-甲基化胞嘧啶的位置才有胞嘧啶。通过比较待测细胞中被亚硫酸氢根离子处理过的基因序列与经过相同处理的对应的没有甲基化的基因序列之间的尿嘧啶残基的数量或者分布,检测到待测细胞中基因的尿嘧啶残基数量或者分布的减少就说明待测细胞中目标基因的CpG二核苷酸中的胞嘧啶残基上发生了甲基化。尿嘧啶的数量或者分布也可以通过将经过亚硫酸氢根离子处理,再暴露在碱性环境中的目标基因序列与可以选择性的与含有或者缺少尿嘧啶残基的目标基因的核苷酸序列杂交的寡聚核苷酸接触,然后检测与寡聚核苷酸分子的选择性杂交(或者是没有杂交发生)。
在这里提到的“选择性的杂交”或者“选择性地进行杂交”或者“特异性杂交”是指两个核酸分子在一般严紧或者高度严紧的条件下发生稳定的相互作用。这样,选择性杂交比较偏向于在寡聚核苷酸和目标核酸分子杂交,而基本上不在寡聚核苷酸和非目标核酸分子的核酸分子之间发生,包括与编码基因家族中相关但不同的成员的核酸分子之间也不发生。一般地,可以用作与目标核酸分子选择性杂交的探针或者引物的寡聚核苷酸在长度上至少有大约12到15个核苷酸,一般是大约18到20核苷酸长度,常用的是至少21到25个核苷酸长度,特殊情况下会是26到35个核苷酸长度或者更长。可用于实施本发明方法的寡聚核苷酸的实例在此公开,如SEQ ID NOS1至296(见表2,3和4)。
适合于选择性杂交的条件可以通过经验来确定,或者可以估计,比如,基于要杂交的寡聚核苷酸和目标核酸分子的相对GCAT(或者GCAU)含量,杂交寡聚核苷酸的长度,杂交的寡聚核苷酸分子和目标序列之间的错配数目(如果有的话)(参见,比如Sambrook等,″Molecular CloningA laboratory manual(Cold Spring Harbor LaboratoryPress 1989))。这样,被用来获得特定的严紧水平的杂交条件会随着杂交的核酸分子的性质而改变。需要额外考虑的是核酸分子是否被固定化了,比如固定在滤膜上。逐步增高的严紧条件的例子如下2XSSC/0.1%SDS在大约室温条件下(杂交条件);0.2X SSC/0.1%SDS在大约室温条件下(低严紧条件);0.2X SSC/0.1%SDS在大约42摄氏度条件下(一般严紧条件);0.1XSSC在大约62摄氏度条件下(高严紧条件)。杂交和/或洗涤可以在其中一种条件下进行,比如高严紧条件,或者其中的每一个条件都被使用,例如,每个条件进行10到15分钟,按上面列出的顺序,重复列出的这些步骤的任何一个或者所有的步骤。
寡聚核苷酸与目标基因(比如表1中所列基因)的选择性杂交可以通过让寡聚核苷酸带上可检测的标记这样的方法来检测。这些可检测的标记可以是任何一种能够方便地与寡聚核苷酸连接的分子,而且还可以用容易获得的仪器来检测。比如,这种可检测的标记可以是一种荧光化合物比如Cy3,Cy5,Fam,荧光黄,罗丹明,或者绿色荧光蛋白,或者是其增强型或者改进型;放射性原子核如硫-35,technicium-99,磷-32,氘或者碘-125;顺磁旋转标记如碳-13,Gd-17,Mn-55,Dy-162,Cr-52,或者Fe-52;发光物质如发光蛋白;化学发光物质;金属螯合剂;一种酶如荧光素酶或者β-半乳糖苷酶,或者是酶底物;或者是一种受体或受体的配体,比如生物素。检测可检测标记的方法是根据标记的性质来选择的,同样将标记连接到寡聚核苷酸上的方法也是如此(参见,比如,Hermanson,″Bioconjugate Techniques″(Academic Press 1996),其在此被整入以供参考)。
例如,选择性杂交的检测也可以利用寡聚核苷酸作为引物延伸反应的底物,进一步让样本在足够使引物延伸反应进行的条件下与脱氧核糖核苷酸(dNTPs)接触,如果需要的话,这些脱氧核糖核苷酸可以包括可检测的dNTP(比如一种荧光标记的dNTP,一种地高辛配体标记的dNTP,或者是一种生物素标记的dNTP),另外还要有DNA依赖型的DNA聚合酶,接着就可以检测引物延伸反应的产物。进行引物延伸反应的条件在本领域是已知的(参见,比如,Sambrook等,如上,1989)。
包含目标基因序列的核酸分子经过亚硫酸氢根离子处理,接着暴露在碱性环境中之后,检测其中尿嘧啶的数量或者分布也可以通过扩增反应比如PCR来实现。扩增反应是在适合于扩增引物对的正向引物和反向引物与目标核酸分子选择性杂交的条件下进行的。一般地,反应是在含水缓冲溶液中进行的,pH在7~9之间,常常pH是大约8。另外,反应一般在引物的摩尔量远远超过目标核酸分子的情况下进行的,比如引物∶基因组DNA的摩尔比例约为100∶1。当样本中目标核酸分子的量不知道的时候,比如在一个诊断程序中用到的生物样本,这时就可以用一定范围的引物量加到样本中做平行实验,虽然一般即使很少量的引物加到样本中也可以形成足够的摩尔逾量而使得这样的扩增反应可以继续。
足量的三磷酸脱氧核糖核苷酸dATP,dCTP,dGTP和dTTP可以单独也可以混合在一起加到合成反应混合物中,如果混在一起加入的话,还可以进一步包括引物,最后溶液需要加热到90~100摄氏度,维持大约1到10分钟,优选是1到4分钟。经过这段加热期之后,溶液需要冷却到室温,这样更有利于引物的杂交。往冷却下来的混合物中加入影响引物延伸反应的合适的试剂,一般是一种聚合酶,接着反应就可以在这里公开的条件下(参见实施例1)进行或者是按照本领域已知的条件进行。如果聚合酶是热稳定的,那么它还可以与其它试剂一起被加入。聚合酶可以是任何一种用来指导引物延伸产物的合成的酶,比如包括E.coli DNA聚合酶I,E.coli DNA聚合酶I的Klenow片断,T4 DNA聚合酶,其它可获得的DNA聚合酶,聚合酶的突变蛋白,反转录酶,或者其他酶,包括热稳定酶,它们在本领域都是熟知的而且可以通过商业渠道获得。扩增反应产物是否甲基化可以通过测序方法,寡聚物限制性分析(Saiki等,BioTechnology 31008-1012,1985),等位基因特异性寡聚核苷酸探针分析(Conner等,Proc.Natl.Acad.Sci.USA 80278,1983),寡聚核苷酸连接反应分析(Landegren等,Science 2411077,1988),以及类似的方法(也请参见,Landegren等,Science 242229-237,1988)来检测。
在一种实施方案中,扩增反应是通过将目标基因序列(例如列在表1中的基因)在适合于扩增的条件下与包括正向引物和反向引物的扩增引物对接触来进行的,其中该引物对中至少有一个引物包含可以与含有尿嘧啶残基的目标基因序列选择性杂交的寡聚核苷酸,因而扩增产物的生成就是待测细胞中目标基因的CpG二核苷酸的胞嘧啶残基甲基化的标记。在另外一种实施方案中,扩增反应是通过将目标基因序列在适合于扩增的条件下与包括正向引物和反向引物的扩增引物对接触来进行的,但其中该引物对的两个引物都能够与含有胞嘧啶残基的目标基因序列选择性杂交,而不与含有尿嘧啶残基的目标基因序列杂交,因而扩增反应产物的生成就是待测细胞中目标基因的CpG二核苷酸的胞嘧啶残基非甲基化的标记。
在又另外一个实施方案中,甲基化特异性的扩增反应比如甲基化特异性PCR(MSP)可以单独使用或者与亚硫酸氢盐处理组合使用,从而检测核酸分子的甲基化状态(参见美国专利号6,265,171;6,200,756;和6,017,704,其中每一篇都在此整入以供参考;也可参见实施例1)。MSP是一种特别灵敏的方法,可以用来检测数目很少的甲基化等位基因,而且只需要使用很少量的核酸样本,包括石腊包埋的材料,该方法还可以方便地在多重分析中采用,比如包括,在单个样本中同时检测甲基化和非甲基化产物,这样就可以提供一个内标。
在MSP反应中使用的扩增引物对经设计之后可以特异性地区分未经亚硫酸氢盐处理的或未经修饰的DNA,甲基化的和非甲基化的DNA。针对非甲基化DNA的MSP引物对(非甲基化特异性引物对)一般在3’-CpG对中具有胸腺嘧啶残基以区别于甲基化DNA中保留的胞嘧啶,对于反义引物则采用互补序列来设计。MSP引物对的序列中常常含有相对少量的胞嘧啶或者鸟嘌呤残基,这是由于在正义(正向)引物中缺乏胞嘧啶,而在反义(反向)引物中缺乏鸟嘌呤所致;胞嘧啶被修饰之后成为尿嘧啶,而尿嘧啶在扩增产物中是作为胸腺嘧啶来扩增的。MSP未甲基化(MSP(U))特异引物对和MSP甲基化(MSP(M))特异引物对的例子见表2和3。例如,可用于这样的方法的扩增引物对包括,例如,在SEQ ID NO23和24,SEQ ID NOS111和112,SEQ ID NOS115和116,SEQ ID NOS119和120,SEQ IDNOS125和126,SEQ ID NOS129和130,SEQ ID NOS133和134,SEQID NOS139和140或SEQ ID NOS143和144中所示的引物对,它们是用于检测SFRP1,SFRP2,SFRP4或SFRP5基因5’调控区的甲基化的甲基化特异性引物;在SEQ ID NOS25和26,SEQ ID NOS113和114,SEQ ID NOS117和118,SEQ ID NOS121和122,SEQ ID NOS127和128,SEQ ID NOS131和132,SEQ ID NOS135和136,SEQ ID NOS141和142或SEQ ID NOS145和146中所示的引物对,它们是用于检测SFRP1,SFRP2,SFRP4或SFRP5基因5′调控区中缺少甲基化的未甲基化特异性引物。考虑到例示出的甲基化特异和未甲基化特异引物对,和含有表1中所列举的靶基因的部分的核苷酸序列的可利用性,要理解的是,可用于扩增如表1中列举的甲基化或未甲基化的基因或其他已鉴定的靶基因,以及与列举出的基因相关的家族成员如SFRP家族成员的其他甲基化特异和未甲基化特异引物对很容易被制备。
因此,一方面,MSP被用来检测经亚硫酸氢根离子处理并接着进行碱处理的目标基因中的尿嘧啶残基的数量和分布。这样的方法可以这样来实施,将基因序列与第一引物对和第二引物对在适合于扩增的条件下接触,其中第一扩增引物对含有一个正向引物和一个反向引物,该第一引物对中的至少一个引物包含可以与含有尿嘧啶残基的目标基因的核苷酸序列选择性杂交的寡聚核苷酸,而第二扩增引物对含有一个正向引物和一个反向引物,该第二引物对的两个引物都能够与含有胞嘧啶残基的目标基因选择性杂交,而不与含有尿嘧啶残基的目标基因序列杂交,这样由第一引物对生成的扩增产物(如果有的话)会有一个第一长度,而由第二引物对生成的扩增产物(如果有的话)会有一个第二长度,其不同于第一长度,因此扩增产物的长度就是一种指示尿嘧啶残基的数量或者分布的标记,这样,待测细胞中目标基因的CpG二核苷酸的胞嘧啶残基的甲基化也就可以通过这个方法来检测。
尿嘧啶残基的数量或者分布也可以这样来检测,将基因的5’端调控区域与第一引物对和第二引物对在适合于扩增的条件下接触,其中第一扩增引物对含有一个正向引物和一个反向引物,该第一引物对中的至少一个引物包含可以与含有尿嘧啶残基的基因5’端调控区域的核苷酸序列选择性杂交的寡聚核苷酸,而第二扩增引物对含有一个正向引物和一个反向引物,该第二引物对的两个引物都能够与含有胞嘧啶残基的基因5’端调控区域的核苷酸序列选择性杂交,而不与含有尿嘧啶残基的基因5’端调控区域的核苷酸序列杂交,这样由第一引物对生成的扩增产物(如果有的话)会有一个第一长度,而由第二引物对生成的扩增产物(如果有的话)会有一个第二长度,其不同于第一长度,因此扩增产物的长度就是一种指示尿嘧啶残基并因而指示基因5’端调控区域的CpG二核苷酸的胞嘧啶残基的甲基化的标记,由此可以检测待测细胞中基因的甲基化沉默。
在表现出或者被怀疑表现出失去控制的生长的细胞中的基因的甲基化沉默(比如,一种癌症相关的基因)的检测也可以这样进行,将待测细胞与一种脱甲基化试剂接触,然后再与没有用脱甲基化试剂接触过的待测细胞中RNA的表达水平比较,检测由这个基因编码的RNA的表达量增加。这样的方法可以进一步包括检测表现出正常生长的对应细胞或者对应细胞的提取物中基因的5’端调控区域的CpG岛中的CpG二核苷酸的胞嘧啶残基的甲基化(如果有的话)。脱甲基化试剂可以是甲基化转移酶抑制剂如DAC。RNA表达量的增加可以用任何一种检测RNA的方法来检测,例如包括RNA点杂交分析,反转录聚合酶链式反应分析,或者与核苷酸序列阵列的选择性杂交,如在此所公开的。相应地,本发明的这些方法也可以以高通量的形式进行,其中待测细胞或者待测细胞的提取物包括多份待测细胞的一份或者待测细胞的提取物,或者是其组合;所述的多份待测细胞中的每一份,或者所述的多份待测细胞的提取物可以是相同的或者不同的,或者是其组合。
在将本发明的方法应用于高通量的形式时,待测细胞或者待测细胞的抽提物可以被安排在一个阵列上,这种阵列可以是一种可追踪的(addressable)阵列,可以在一个固体支持物如微芯片,玻璃板,或者玻璃珠上,细胞(或者提取物)可以顺序地或者是平行地与寡聚核苷酸探针或者引物(或者引物对)接触,如在此所公开的。安排在阵列中的样本或者是安排成其它可再现形式的样本可以被指定地址(即,阵列上的位置),这样就利于确定样本的来源。将样本排列成阵列特别是可寻址阵列的另外一个好处是可以用自动化系统对一个或者多个样本在不同时间增加或者去除试剂,或者是为特定的样本加入不同的试剂。除了可以同时检测多个样本的好处之外,这样的高通量分析还能够提供检测单个样本的两份等份,三份等份,或者更多等份的手段,这样可以增加获得的结果的合理性,而且还可以在和待测样本同样的条件下检测对照样本,从而为比较不同分析的结果提供了内标。方便的是,阵列上某个位置的细胞或者抽提物可以与两种或者更多种寡聚核苷酸探针或者引物(或者引物对)接触,其中所述寡聚核苷酸是被不同地标记的或者是包括产生可区别的产物的反应,从而提供了一种进行多重分析的手段。这样的分析可以允许检测一个或者多个,尤其是2,3,4,5,10,15,20或者更多个基因,以鉴定待测细胞中的表观遗传学沉默基因。
本发明也提供用作鉴定表观遗传学沉默基因(或者鉴定这些基因的缺乏)的探针或者引物的寡聚核苷酸。在这里被使用的术语“寡聚核苷酸”,“多聚核苷酸”或者“核酸分子”是指一段由两个或者更多脱氧核糖核苷酸或者核糖核苷酸组成,由磷脂键连接起来的序列。这里提到的“基因”是指包含在基因组中的一段多聚核苷酸序列。然而,应该认识到,包含基因的一部分的核酸分子可以从细胞中分离出来或者作为基因组DNA被研究,比如通过杂交反应或者PCR反应。因此,在基因组中,也许并不清楚某个基因在哪一个特定的核苷酸位置起始或者结束,对于本发明的目的来说,对于在此被鉴定和/或研究的各种基因,基因可以被认为是不连续的(discrete)核酸分子,它至少包括GenBank注册号列在表1中的核苷酸序列。
为了讨论的方便,这里用到的术语“寡聚核苷酸”是指用作探针或者引物的多聚核苷酸,而使用更加广泛的术语“多聚核苷酸”或者“核酸分子”则是包含了具有两个或者多个核苷酸的任何序列,包括寡聚核苷酸。另外,术语“核苷酸序列”是指存在于阵列上的分子。因此,应该认识到,这里使用的各种术语可以方便地区分不同的核酸分子。因此,这些术语包括了RNA和DNA,其可以是一个基因或者是基因的一部分,cDNA,合成的多聚脱氧核糖核酸序列,或者类似的分子。一般地,寡聚核苷酸或者多聚核苷酸可以是单链也可以是双链,还可以是DNA/RNA杂交分子,然而应该注意的是,用来作为探针或者引物的双链寡聚核苷酸的两条链在使用的时候需要分开,比如通过加热含有寡聚核苷酸的溶液到高于特定寡聚核苷酸的熔点。
这里使用的术语“寡聚核苷酸”,“多聚核苷酸”和类似物包括自然发生的核酸分子,这些核酸分子可以从细胞中分离,也可以是比如通过限制性内切酶消化之后得到的片断,还可以是合成的分子,比如这些分子可以通过化学合成的方法或者酶学方法如PCR来制备。在各种各样的实施方案中,本发明的寡聚核苷酸或者多聚核苷酸可以包含核苷或者核苷酸类似物,或者其骨架键不是磷酯键,比如是硫酯键,硫代磷酸键,类似肽键的键或者本领域技术人员已知的能够连接核苷生成合成的多聚核苷酸的其它任何化学键(参见,比如,Tam等,Nucl.Acids Res.22977-986,1994;Ecker和Crooke,BioTechnology13351-360,1995,每个文献在此整入以供参考)。非自然发生的核苷类似物或者连接核苷或类似物的非自然发生的连接键的整入在该多聚核苷酸要暴露于可能含有核酸水解活性的环境中时特别有用,这些环境包括例如组织培养液,细胞或者存活个体,因为这种被修饰的多聚核苷酸可以被设计成对于降解较不敏感(假如需要的话,也可以设计成对于降解更加敏感)。
一般地,组成多聚核苷酸的核苷酸是自然发生的脱氧核糖核苷酸,比如腺嘌呤,胞嘧啶,鸟嘌呤或者胸腺嘧啶连接到2’-脱氧核糖上,或者是核糖核苷酸,比如腺嘌呤,胞嘧啶,鸟嘌呤或者尿嘧啶连接到核糖上。尽管如此,多聚核苷酸(或者寡聚核苷酸)也可以包含核苷酸类似物,包括非自然发生的合成的核苷酸或者被修饰过的自然发生的核苷酸。这些核苷酸类似物在本领域是已知的,而且可以通过商业渠道获得,含有这些核苷酸类似物的多聚核苷酸也是如此(Lin等,Nucl.Acids Res.225220-5234,1994;Jellinek等,Biochemistry3411363-11372,1995;Pagratis等,Nature Biotechnol.1568-73,1997,每篇文献都在此整入以供参考)。
包含自然发生的核苷酸和磷酯键的多聚核苷酸可以通过化学合成来制备或者用合适的多聚核苷酸作为模板通过DNA重组方法来制备。与此相比,包含核苷酸类似物或者非磷酯键的共价键的多聚核苷酸一般都通过化学合成的方法来制备,尽管某些酶如T7聚合酶可以将某些类型的核苷酸类似物整合到多聚核苷酸中,并因而被用来由一个合适的模板来重组合成这样一段多聚核苷酸(Jellinek等,如上,1995)。这样,多聚核苷酸可以通过例如传统的磷酸三酯方法和磷酸二酯方法的方法来制备,比如,包括例如使用二乙基磷酸脒的自动化方法(参见,Beaucage等,Tetrahedron Lett.,221859-1862,1981),或者一种在被修饰的固体支持物上进行的寡聚核苷酸合成方法(参见美国专利号4,458,066)。
本发明的可以选择性地与目标核酸分子杂交且可以作为检测一个基因的表达和/或甲基化(或者甲基化缺乏;“非甲基化”)的试剂的寡聚核苷酸被设计成与目标基因上游(5’)或者下游(3’)大约2000个核苷酸之内的核苷酸序列选择性杂交,一般是在大约1000个核苷酸的区域内,这些区域含有需要检测胞嘧啶甲基化的CpG岛,更常见的是在大约500个核苷酸内的位点进行检测。另外,如上面所说明的,本发明的寡聚核苷酸,或者对于本发明的方法有用的寡聚核苷酸,在长度上至少要有大约12个核苷酸,一般至少是大约14或15个核苷酸长度,通常是大约18到20个核苷酸长度,也可以是大约25,30,35或者更多的核苷酸,这样它可以选择性地与目标核酸分子杂交(参见,例如表2,3和4)。需要注意的是,寡聚核苷酸的长度会部分地依赖于目标基因。比如,当目标基因是由含有相似性非常高的区域的紧密相关的基因组成的家族的一员时,使用更长的寡聚核苷酸可以保证其与目标基因的选择性杂交,而最小化与相关基因序列的交互杂交,如果有的话。
本发明中的寡聚核苷酸被设计成与对应于基因组的基因座的双链核酸分子的至少一条链基本互补(当间插序列要被扩增时,则是与双链的每条链互补),这些寡聚核苷酸被用于区分甲基化或者非甲基化的胞嘧啶残基时,会包含一定量的鸟嘌呤和胞嘧啶,正如上述讨论的一样。本发明的寡聚核苷酸的实例是下列的扩增引物对,1)用于靶基因核苷酸序列的RT-PCR的引物对(见,例如,表4,SEQ ID NOS149至296);2)用于靶基因核苷酸序列的甲基化特异或未甲基化特异扩增的引物对(见,例如,表2,其中的MSP(M)表示甲基化特异引物对(如,SEQ ID NOS3和4),MSP(U)表示未甲基化特异引物对(如,SEQ ID NOS5和6),也见表3);或3)用于亚硫酸氢盐PCR的引物对(见,例如,表2,SEQ ID NOS1和2)。
因此,本发明提供了选自SEQ ID NOS1至296中的任何一个的寡聚核苷酸,并进一步提供了多个这样的寡聚核苷酸,其包括SEQ IDNOS1至296所示的寡聚核苷酸中的至少两个(例如,2,3,4,5或更多个),其中所述的扩增引物对可扩增表1所列的基因的核苷酸序列,在某些情况下,扩增依赖于例如靶序列是否甲基化。本发明也提供了一种扩增引物对,它含有一条正向引物和一条反向引物,特别是含有SEQ ID NOS1至296的寡聚核苷酸中的一个,特别是两个,其可以是表2,3和4中所示的引物对中的一条正向引物,一条反向引物,或两条引物(例如,SEQ ID NOS1和2,SEQ ID NOS3和4;SEQ ID NOS5和6,等等)。
在一个方面,本发明的扩增引物对可用来特异地扩增核酸分子的甲基化5’调控区,这种扩增引物对的示例是SEQ ID NOS23和24,SEQ ID NOS111和112,SEQ ID NOS115和116,SEQ ID NOS119和120,SEQ ID NOS125和126,SEQ ID NOS129和130,SEQ ID NOS133和134,SEQ ID NOS139和140或SEQ ID NOS143和144,它们可扩增具有甲基化5’调控区的SFRP家族成员(见表2和3)。在另一个方面,本发明的扩增引物对可用来特异地扩增核酸分子的未甲基化的5’调控区,这种扩增引物对的示例是SEQ ID NOS25和26,SEQ IDNOS113和114,SEQ ID NOS117和118,SEQ ID NOS121和122,SEQID NOS127和128,SEQ ID NOS131和132,SEQ ID NOS135和136,SEQ ID NOS141和142或SEQ ID NOS145和146,它们可扩增具有未甲基化的5’调控区的SFRP家族成员(见表2和3)。
本发明还涉及试剂盒,其中包括至少一种分离的本发明的寡聚核苷酸,包括例如多种这样的分离的寡聚核苷酸。在一种实施方案中,本发明的试剂盒的多种分离的寡聚核苷酸包括至少一个扩增引物对(即,一个正向引物和一个反向引物),也可以包括多个扩增引物对,包括,例如在表2,表3和/或表4中所示的扩增引物对。这样,本发明的试剂盒可以包括,例如,一个或者多个甲基化特异性扩增引物对,非甲基化特异性扩增引物对,或者甲基化特异性引物对和非甲基化特异性引物对的组合,这种组合包含用来扩增特定基因的甲基化形式或者非甲基化形式的甲基化特异性引物对和非甲基化特异性引物对,所述特定基因已知或者被怀疑在一种或者多种类型的癌症细胞中被甲基化沉默。
本发明的试剂盒可以进一步包含额外的试剂,它们是很有用的,例如,确保所述试剂盒中的寡聚核苷酸能够更好地使用。例如,当试剂盒含有一种或者多种甲基化特异性和/或非甲基化特异性扩增引物时,该试剂盒可以进一步包括例如可以被甲基化的或者非甲基化的对照寡聚核苷酸;一种或者更多种可以修饰甲基化胞嘧啶残基的试剂,和/或一种或更多种用于进行扩增反应的试剂。如果试剂盒包含一种或者多种能够与甲基化或者非甲基化基因序列选择性杂交的寡聚核苷酸,那么试剂盒还可以进一步包括,例如,甲基化敏感型限制性内切酶。本发明的试剂盒还可以包括至少第二引物对,它可以是但不一定是上述所列引物对中的一种,它可以用来进行例如巢式扩增反应。这些额外的引物对可以基于目标基因的扩增部位的期望序列,利用依据目标基因的相关GenBank注册号所获得的序列信息(参见表1)来设计。
在一种具体实施方案中,本发明的试剂盒含有一对甲基化特异性引物和一对非甲基化特异性引物,它们的特异性都是针对同一个目标基因,因而使用该试剂盒的用户可以确定某个特定目标基因是否甲基化。在另外一种实施方案中,试剂盒含有多对这样的甲基化特异性和非甲基化特异性引物,因而用户就可以确定一个或者更多个目标基因的甲基化。例如,这样的试剂盒可含有在SEQ ID NOS3和4中所示的引物对(见表2;MSP(M))和在SEQ ID NOS5和6中所示的引物对(表2;MSP(U)),由此提供了用于确定S100A10基因的5’调控区是否甲基化的扩增引物对(也见,GenBank注册号AA44051;表1)。甲基化和/或未甲基化特异性引物对的其它组合可根据表2和3来确定,由此提供的试剂盒可以测定不同基因和/或例如SFRP基因家族的一个基因家族的不同成员的甲基化状态。这样的试剂盒可进一步包含一个引物对,其包括可与利用甲基化特异或未甲基化特异性引物对所产生的所期望的扩增产物选择性杂交的寡聚核苷酸,由此提供了可用于进行巢式扩增程序的试剂。
本发明的试剂盒还可以包括一种能够连接或者整合到试剂盒中的寡聚核苷酸上的可检测的标记,或者多种不同的可检测的标记,这样用户就可以根据需要为特定的应用选择合适的标记,而且如有需要的话,还可以包括将可检测标记连接或者整合到寡聚核苷酸上所需的试剂。作为选择或者作为补充,试剂盒可以包含一种或者多种用于进行杂交反应的试剂,这样选择性杂交的条件就可以很快的获得;和/或者可以包括一种或者多种标准核酸分子,例如含有甲基化胞嘧啶残基的标准目标SFRP1核苷酸序列,其对应于SFRP1上寡聚核苷酸选择性杂交的区域,或者所述的标准核酸分子是对应于目标序列的含有非甲基化胞嘧啶残基的标准目标SFRP1核苷酸序列,或者是二者的组合。这样的标准具有数个优点,包括,例如,可以确认用待测细胞或其抽提物进行的反应是否正确有效,或者可以用来比较不同时间检测的样本或者收集于不同来源的样本。
当试剂盒含有一种或者多种用来进行引物延伸(或者扩增)反应的寡聚核苷酸,那么试剂盒可以进一步包括用于进行选择性杂交反应的试剂,以使所述寡聚核苷酸可以作为延伸反应的底物;和/或一种或多种用于进行引物延伸(或扩增)反应的试剂,比如,dNTPs,其中的一种或者多种可以被可检测的标记标记或者为了方便地连接上可检测的标记而被修饰;一种或者一系列的多聚酶;和/或一种或多种标准目标核酸分子。如果本发明的试剂盒含有两种或者更多种寡聚核苷酸(或者引物对),例如在此例示的或者其它可以用于实践本发明的方法的寡聚核苷酸,那么试剂盒可以提供一系列方便来源的试剂,有了这些,技术人员就可以根据自己的需要选择一种或者多种寡聚核苷酸(或者引物对)。
本发明也涉及一种减缓或者抑制表现出至少一种与癌症相关的基因的转录在表观遗传学上沉默的细胞的失控生长的方法。例如,这种方法可以通过恢复由表观遗传学沉默基因编码的多肽在细胞中的表达来实施,这样就可以减缓或者抑制细胞的失控生长。例如,所述的表达恢复可以通过将细胞与脱甲基化试剂,组蛋白脱乙酰酶抑制剂,或者二者的组合接触来完成。
在一个具体实施方案中,所述的表观遗传学沉默基因是甲基化沉默基因,所述方法包括将细胞与至少一种脱甲基试剂接触,例如与DAC接触。在一个方面,细胞可在体外与脱甲基试剂接触,例如在培养基中或其他有助于细胞生存的介质中。如果需要,与脱甲基试剂接触过的细胞可进一步施予受试者。在另一个方面,所述试剂可以施予受试者,这样,生长不受调控的细胞可与该试剂接触。
在另一个具体实施方案中,该方法包括将编码所述多肽的多聚核苷酸导入进所述细胞中,这样多肽可由所述多聚核苷酸表达出来,从而在细胞中恢复多肽的表达。所述多肽可以但不是必须包含在载体中,所述载体如病毒载体,和/或可以在可促进多聚核苷酸导入进细胞的基质中进行配制,如脂质体或微泡。可以通过将细胞与多聚核苷酸在体外接触而将多聚核苷酸导入进细胞中,在此情况下,含有多聚核苷酸的细胞可以但不是必须被施于受试者。也可以通过将细胞与多聚核苷酸在体内接触而可将多聚核苷酸导入进细胞中。
表观遗传学沉默基因可以是采用在此所公开的方法,检测特定类型的细胞如特定类型的癌症细胞而鉴定出的任何基因。在结直肠癌细胞中的表观遗传学沉默基因用在表1中所列的基因来例示,举个例子,采用表4中所列的扩增引物对(SEQ ID NOS149至296)对由结直肠癌细胞中获得的核酸分子进行RT-PCR,可获得包括表1中的基因的部分的GenBank登记的多聚核苷酸序列。结直肠癌细胞和/或胃癌细胞中的表观遗传学沉默基因的示例是PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1和SNRPN,它们并不显示有可检测到的基底表达,而用DAC处理时可重新表达,但用TSA处理不会重新表达;HOXA1,GRO3和DLX7,它们显示有基底水平的表达,但在用DAC而不用TSA处理时其表达会增强;POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPPIR21A,FPGT和TRIM32,它们可被单独使用的TSA上调,而它们的基底表达和在DAC处理下的上调在这些基因中有所不同。
本发明也涉及一种为治疗癌症患者而选择治疗策略的方法。这种方法可以这样来实施,例如,根据在此公开的方法,鉴定至少一种与癌症有关的甲基化沉默基因(即,将代表基因组的核苷酸序列阵列与核酸扣除产物接触,检测核酸扣除产物与阵列上的一部分核苷酸序列之间的选择性杂交);然后选择用于恢复一种或多种已被确定的甲基化沉默基因在患者癌细胞中的表达的试剂。例如,被选择的试剂可以是编码已被确定的甲基化沉默基因的多聚核苷酸,例如,编码由PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3或DLX7基因,这样的基因的家族成员,或这样的基因的组合所编码的多肽的多聚核苷酸。被选择用于恢复甲基化沉默基因的表达的试剂也可以是脱甲基试剂如DAC。
因此,本发明提供了一种治疗癌症患者的方法,其中所述患者的癌细胞中表现有至少一种基因的表观遗传学沉默表达。这种方法可以通过例如恢复患者的癌细胞中一种或多种表观遗传学沉默基因的表达来实施。例如,当至少一种表观遗传学沉默基因是甲基化沉默基因时,可通过对受试者施予足以恢复受试者癌细胞中甲基化沉默基因表达的量的脱甲基试剂来治疗患者。作为选择,或作为补充,患者可以这样来治疗,对受试者施用至少一种多聚核苷酸,所述多聚核苷酸编码由所述的表观遗传学沉默基因中的一种或多种所编码的至少一种多肽,并且施用量足以使所述的至少一种多肽在患者的癌细胞中表达。当对患者施予多聚核苷酸时,多聚核苷酸可包含在载体(例如,病毒载体)中,所述载体优选表达载体,和/或可以在可促进靶癌细胞摄取多聚核苷酸的基质中进行配制(例如,在脂质体中)。
根据本发明的方法要治疗的癌症可以是任何类型的癌症,包括,例如癌(carcinoma)或肉瘤(sarcoma)。例如,其中所述的癌症是结直肠癌,胃癌或结直肠癌和胃癌,患者的治疗可通过恢复一种或多种表观遗传学沉默基因的表达来实现,所述表观遗传学沉默基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,POR1,MBNL,TRADD,PDIP,RAD23B,RPLl3,GNAI2 PPP1R21A,FPGT,TRIM32,其家族成员,或其组合。包括SFRP1,SFRP2,SFRP4和SFRP5在内的SFRP基因提供了一个家族基因的实例,其中的一种或多种基因在结直肠癌,胃癌或两者中被表观遗传学地沉默。
在一个具体实施方案中,提供了治疗患有结直肠癌、胃癌或两者的个体的方法,其中与所述癌症有关的细胞含有至少一种甲基化沉默基因。这种方法可以这样来实施,例如施予受试者可以恢复所述的至少一种甲基化沉默基因的表达的试剂,其量足以恢复所述的甲基化沉默基因在与所述癌症有关的细胞中的表达。所述试剂可以是编码所述的至少一种甲基化沉默基因的多聚核苷酸,例如,编码由PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3和/或DLX7基因,其家族成员,或其组合所编码的多肽的多聚核苷酸;所述试剂或者是一种脱甲基试剂如DAC。用于治疗患有结直肠癌、胃癌或两者的个体的试剂可与所述癌症的细胞离体接触,此后所述细胞可以被再施予患者;或者,所述试剂被施于患者癌细胞所在的部位。
细胞中一种或多种基因的转录被甲基化沉默的结果是,所述基因的产物不存在于细胞中,由此导致与被编码的基因产物的缺乏相关的功能丧失。例如,SFRP基因家族成员可以拮抗WNT/frizzled信号传导(Finch等,Proc.Natl.Acad.Sci.,USA 946770-6775,1997;Rattner等,Proc.Natl.Acad.Sci.,USA 942859-2963,1997)。因此,一种或多种SFRP基因的功能丧失可以使整个肿瘤抑制通路失效。类似地,PCDH8基因编码细胞粘附分子家族成员,其功能的丧失已知在肿瘤侵袭和转移过程中是很重要的(Strehl等,Genomics 5381-89,1998)。因此,本发明的方法是基于向由于基因表达发生表观遗传学沉默特别是甲基化沉默而导致生长失控的细胞提供由所述表观遗传学沉默基因编码的多肽,由此恢复细胞的受控生长。正如在这里公开的,可以直接向细胞提供所述多肽,可以向细胞中引入编码所述多肽的外源多聚核苷酸并让其表达,或者恢复细胞中内源的甲基化沉默基因的表达。通过对表现出生长失控的细胞进行所述多肽的恢复,一些与生长失控相关的特征,比如包括在软琼脂中生长的能力,缺乏接触生长抑制,或者对细胞程序性死亡的抗性都被减轻了。
一种或者多种甲基化沉默基因例如表1所列基因的一种或者多种的表达恢复,可以通过将细胞与一种脱甲基化试剂比如DAC接触来完成,DAC可以在细胞复制的过程中整合到基因中,结果子代细胞就含有非甲基化的基因,这样就可以被转录了。用脱甲基化试剂接触的细胞可以是培养的细胞,其中所述的脱甲基化试剂以足以导致靶基因脱甲基化的量加入至细胞培养基中,这个过程对细胞是无毒的。培养中的细胞可以是已建立的细胞系的细胞,或者可以是混合种群的细胞,这些细胞是从受试者体内取出,并进行离体处理,举例来说,可以确定与特定的脱甲基化试剂的接触是否可以恢复靶基因的表达,并因此在施予受试者时发挥作用。这样的细胞离体处理也可以用于恢复靶基因的表达,经过这样的处理之后,细胞可选择性地在培养中扩增,可以被重新注回受试者体内。这种方法以及在此所公开的任何治疗方法可以进一步包括本领域已知的用于治疗患有特定癌症的受试者的治疗方法,或者与本方法联合使用时有新的作用的方法。
表现出甲基化沉默基因表达的细胞也可以通过将试剂施用到体内的方法使之在体内与脱甲基化试剂接触。如果方便的话,脱甲基化试剂可以通过下列方法引入体内,比如在体内表现出生长失控的细胞的位置或者附近运用导管插入法,或向流入该细胞部位的血液所在的血管中注入脱甲基化试剂。类似地,如果将要被治疗的器官或者器官的一部分可以通过分路方法被分离,那么试剂可以通过分路器被施用,结果本质上也可以将试剂施于含有所述细胞的位置。试剂也可以被系统地施用或者是通过其他路径施用,如在这里所公开的,或者如本领域所知的。
由于基因的表观遗传学沉默而导致减少或者缺乏的多肽也可以通过将编码所述多肽的多聚核苷酸导入进细胞中而被提供给细胞,这样所述多肽在细胞中可由所述多聚核苷酸表达。这样,本发明提供了基因治疗的方法,其可在体内或离体实施。例如,当细胞的特征是SFRP1基因的转录被甲基化沉默时,可以将具有GenBank注册号N32514(见表1)所示的核苷酸序列的多聚核苷酸导入进靶细胞中。
除了编码多肽的序列,所述多聚核苷酸还可以包括有效连接的(operatively linked)转录调控元件,翻译调控元件和类似的元件,所有这些可以形成一个裸露的DNA分子,可以包含在一个载体中,或者可以包装在一种基质比如脂质体或者微气泡中,它们可以帮助多聚核苷酸进入特定的细胞。在这里提到的术语“有效连接的”是指两种或者更多种分子邻近相连以至它们可以作为一个单位来看待,而且表现出的功能可以是其中一种或者所有分子的功能,或者这些功能的组合。例如,编码SFRP1多肽的多聚核苷酸可以与另外一个(或者更多)编码序列有效连接,这样由所述的有效连接的编码多肽可以表达出嵌合多肽。所述的嵌合多肽可以是融合蛋白,其中两种(或者更多种)被编码的多肽被翻译成一条多肽,即,通过肽键共价连接;或者可以被翻译成两个独立的多肽,这些多肽被翻译出来之后,可以彼此联系形成一个稳定的复合物。类似地,编码需要的多肽的多聚核苷酸序列可以与调控元件有效连接,在这种情况中该调控元件可以将它的调控作用赋予该多聚核苷酸,其方式与这种调控元件调控细胞中与其正常相关的多聚核苷酸序列一样。
融合蛋白常常表现出其中每个多肽组分的部分或者全部特性,因此可以用来在细胞中恢复基因的表达,还可以进一步提供其他的优点。比如,融合蛋白可以包含由于其编码基因的表观遗传学沉默而导致其量降低或者缺乏的多肽,这种多肽可以与一种细胞区室定位结构域有效连接,这样该融合蛋白在细胞中的表达或者向细胞中引入这种融合蛋白可以将编码的多肽定位到特定的细胞内区室中以发挥其活性,比如定位到细胞核。细胞区室定位结构域已经研究的很清楚了,比如包括质膜定位结构域,核定位信号,线粒体膜定位信号,内质网定位信号和类似的结构域,也包括可以指导多肽从细胞中分泌出来的信号肽(参见,比如,Hancock等,EMBO J.104033-4039,1991;Buss等,Mol.Cell.Biol.83960-3963,1988;美国专利号5,776,689,每篇文献都在此整入以供参考文献)。融合蛋白也可以包括所需要的多肽与起其它作用的肽有效连接,包括作为受体的配体的肽,用作确定多肽在细胞中的表达的标记的肽,或者是用于分离融合蛋白的肽,或者是任何其他感兴趣的多肽或者肽,只要该融合蛋白具有所要的多肽的蛋白活性,例如,可拮抗WNT/frizzled活性的SFRP多肽活性。肽标记比如多聚组氨酸标记肽,比如His-6,可以用一种二价阳离子比如镍离子,钴离子或者类似的离子来检测;FLAG表位,可以用抗FLAG抗体来检测(参见,比如,Hopp等,BioTechnology 61204(1988);美国专利号5,011,912,每篇文献都在此整入以供参考);c-myc表位,可以用针对这种表位的特异性抗体来检测;生物素,可以用链霉亲和素或者亲和素来检测;谷胱甘肽S-转移酶,可以用谷胱甘肽来检测,这些标记在本技术领域是已熟知的,它们为检测与其有效连接的多肽存在与否提供了一种方法。这些标记还提供了额外的好处,比如它们可以帮助分离与之有效连接的多肽,如果需要获得基本纯化的形式的多肽的话,这样的多肽可以用于实践本发明的方法。
编码本来由表观遗传学沉默基因编码的多肽的多聚核苷酸可以单独使用,也可以包含在一个载体中,这可以辅助多聚核苷酸的操作,包括将所述多聚核苷酸引入到目标细胞中。载体可以是一个用来保存多聚核苷酸的克隆载体,也可以是一个表达载体,它除了包括多聚核苷酸,还含有对多聚核苷酸和被编码的多肽在特定细胞中的表达有用的调控元件。一个表达载体可以含有,例如,维持编码多聚核苷酸的转录所必需的表达元件,或者能够在多聚核苷酸被克隆到载体之前就可以与该多聚核苷酸有效连接的调控元件。
一个表达载体(或者编码所需多肽的多聚核苷酸)一般含有或者编码一段启动子序列,它可以为所述的编码多聚核苷酸提供组成性的,或者如果需要的话,可以是可诱导的或者组织特异性的或者发育阶段特异性的表达,还可以含有多聚腺嘌呤识别序列,核糖体识别位点或者内部核糖体进入位点,或者其他调控元件,比如组织特异性的增强子。载体还可以包含在原核或者真核宿主系统中复制所需要的元件,或者是在两种系统中都需要的元件,如果需要的话。这样的载体包括质粒载体和病毒载体比如噬菌体,杆状病毒,反转录病毒,慢病毒(lentivirus),腺病毒,疫苗病毒,塞姆利基森林(semliki forest)病毒和腺相关病毒,这些病毒是已熟知的,而且也都可以通过商业渠道(Promega,Madison WI;Stratagene,La Jolla CA;GIBCO/BRL,Gaithersburg MD)来获得,或者可以由本领域技术人员构建(参见,比如,Meth.Enzymol.,第185卷,Goeddel,ed.(Academic Press,Inc.,1990);Jolly,Canc.Gene Ther.151-64,1994;Flotte,J.Bioenerg.Biomemb.2537-42,1993;Kirshenbaum等,J.Clin.Invest.92381-387,1993;每篇文献都在此整入以供参考)。
四环素(tet)诱导的启动子对于控制编码所需多肽的多聚核苷酸的表达特别有用。在四环素或者其类似物被施于含有与四环素诱导型启动子有效连接的多聚核苷酸的个体之后,编码的多肽就被诱导表达。多聚核苷酸也可以与组织特异性的调控元件有效连接,比如一种肝脏细胞特异性调控元件,如α-胎蛋白启动子(Kanai等,Cancer Res.57461-465,1997;He等,J.Exp.Clin.Cancer Res.19183-187,2000)或者白蛋白启动子(Power等,Biochem.Biophys.Res.Comm.2031447-1456,1994;Kuriyama等,Int.J.Cancer 71470-475,1997);一种肌肉细胞特异性调控元件,比如肌球蛋白启动子(Delvin等,J.Biol.Chem.26413896-13901,1989;Yan等,J.Biol.Chem.27617361-17366,2001);一种前列腺细胞特异性调控元件,比如PSA启动子(Schuur等,J.Biol.Chem.2717043-7051,1996;Latham等,Caner Res.60334-341,2000);一种胰腺细胞特异性调控元件,比如弹性蛋白酶启动子(Omitz等,Nature 313600-602,1985;Swift等,Genes Devel.3687-696,1989);一种白细胞特异性调控元件,比如白细胞唾液酸蛋白(CD43)启动子(Shelley等,Biochem.J.270569-576,1990;Kudo和Fukuda,J.Biol.Chem.27013298-13302,1995);或者类似的启动子,这样多肽的表达就可以限制在个体内特定的细胞中,或者限制在培养基如器官培养基中一个混合群体的细胞中的特定细胞中。调控元件,包括组织特异性元件,许多都是可以通过商业渠道获得的,它们在本领域是已熟知的(参见,比如,InvivoGen;San Diego CA)。
病毒表达载体在将多聚核苷酸引入到细胞特别是个体内的细胞特别有效。病毒载体所具有的优势是它们可以以相对高的效率来侵染寄主细胞,而且可以侵染特定的细胞类型。例如,编码所需多肽的多聚核苷酸可以被克隆到杆状病毒载体中,它然后可以用于侵染昆虫宿主细胞,由此提供一种产生大量该被编码的多肽的方法。病毒载体也可以来源于侵染感兴趣的生物的细胞的病毒,这些生物细胞比如是脊椎动物宿主细胞如哺乳动物宿主细胞,鸟类宿主细胞或者鱼类宿主细胞。在本发明的方法中,病毒载体在向目标细胞中引入多聚核苷酸方面特别有用。病毒载体还可以被发展以用于特定的宿主系统,特别是哺乳动物系统,这样的病毒载体包括反转录病毒,其他慢病毒载体,如那些基于人类免疫缺乏综合症(HIV)的病毒,腺病毒载体,腺相关病毒载体,疱疹病毒载体,肝病毒载体,疫苗病毒载体,或者类似的病毒载体(参见Miller和Rosman,BioTechniques 7980-990,1992;Anderson等,Nature 39225-30 Suppl.,1998;Verma和Somia,Nature389239-242,1997;Wilson,New Engl.J.Med.3341185-1187(1996),每篇文献都在此整入以供参考)。
包含在载体之中的多聚核苷酸可以通过本领域已知的任何方法被引入到细胞中(Sambrook等,如上,1989;Ausubel等,CurrentProtocols in Molecular Biology,John Wiley和Sons,Baltimore,MD(1987,和1995年的增补材料),每篇文献都在此整入以供参考)。这样的方法包括如转染,脂转染(lipofection),微注射,电转和用病毒载体侵染;还可以包括运用脂质体,微乳剂或者类似物来引入,这些方法可以帮助多聚核苷酸导入细胞,还可以使多聚核苷酸在被导入细胞之前避免降解。一个特别有用的方法包括将多聚核苷酸整合到微气泡中,然后可以注射到循环通路中。可以放置一个超声源使得超声可以传递到肿瘤处,正在肿瘤的位置循环的含有多聚核苷酸的微气泡被超声波打破,这样就可以在癌症部位提供这种多聚核苷酸。一种特定方法的选择需要依据比如多聚核苷酸所要导入的细胞,还有细胞是否分离于培养基中,或者是在培养的组织或器官中,或者是在原位。
利用病毒载体的侵染来将多聚核苷酸导入细胞中的方法是非常有益的,它可以将核酸分子高效地导入到细胞中(参见,例如,美国专利号5,399,346,在此整入以供参考)。而且,病毒一般都是非常特化的,可以根据其对一种或者几种特定类型的细胞的侵染能力以及繁殖能力来挑选需要的载体。因此,它们的天然特异性可以将包含在载体中的核酸分子定向导入到特定类型的细胞中。这样,基于HIV的载体可以用于侵染T细胞,基于腺病毒的载体可以用于侵染例如呼吸道上皮细胞,基于疱疹病毒的载体可以用来侵染神经元细胞,等等。其他载体如腺相关病毒可以有更加宽泛的宿主细胞范围,因此可以用来侵染很多类型的细胞,尽管病毒或者非病毒载体也可以用特定的受体或者配体进行修饰,以通过受体介导的事件来改变其目标特异性。本发明的多聚核苷酸,或者含有多聚核苷酸的载体可以包含在细胞中,比如在宿主细胞中,这样含有多聚核苷酸的载体便可以增殖,或者在辅助细胞中,这样含有多聚核苷酸的病毒载体便可以组装。所述多聚核苷酸可以暂时地存在于细胞中,也可以稳定地存在,例如通过整合到细胞基因组中这样的方法。
本发明的方法还可以通过直接将所需要的多肽提供给病人体内表现出生长失控的细胞来实施。所述多肽可以在产生后被分离,然后按照需要采用这里公开的方法制成配方。所述多肽可以与细胞在体外接触,这种接触发生的条件导致所述细胞能够充分地透过,这样所述多肽可以穿过细胞膜,或者可以将多肽微注射进入细胞。如果所需的多肽与生物体的细胞在原位接触,那么这种多肽可以包括融合蛋白,其中含有促进其穿过细胞膜的肽或者多肽组分,比如人类免疫系统缺乏综合症病毒(HIV)TAT蛋白转导结构域,而且还可以进一步包含与之有效连接的核定位结构域。作为选择,或者作为补充,所述多肽可以被包装在基质中以促进多肽进入细胞。
对于活体施用,用于实践本发明的治疗方法的试剂例如脱甲基化试剂,多聚核苷酸或者多肽一般被配制成适合于施用的组合物。因此,本发明提供含有用于恢复由于一种或者多种基因的甲基化转录沉默而导致生长失控的细胞的受控生长的试剂的组合物。这样,这种试剂就可以用作治疗患有与这种生长失控相关的病理症状的病人的药物。
这样的组合物一般包含对于形成配方和将试剂施用于个体可接受的载剂。可被接受的载剂在本领域是已知的,包括比如含水溶液如水或者生理缓冲盐溶液,或者其他溶剂或媒介物如乙二醇,甘油,油类物质如橄榄油或者可注射的有机酯。可被接受的载剂可以含有一些生理上能够接受的化合物,其作用是例如稳定或者增加结合物的吸收。这样的生理上可以接受的化合物包括例如碳水化合物如葡萄糖,蔗糖或者葡聚糖,抗氧化剂如抗坏血酸或者谷胱甘肽,螯合试剂,低分子量蛋白或者其他稳定剂或赋形剂。本领域技术人员应该知道,包括生理上可接受的化合物在内的可接受载剂的选择是依赖于比如治疗试剂本身的物理化学性质和施用该组合物的途径,所述途径可以是例如口服或者不经肠胃的途径,如静脉内施用并且是通过注射,插管,或者本领域已知的其他这样的方法。所述药物组合物还可以含有第二种试剂,比如诊断试剂,营养物质,毒素,或者治疗试剂,比如癌症化疗试剂。
所述试剂可以整合到一种胶囊材料中,比如在油水混合乳剂,微乳剂,微胶束,混合微胶束,脂质体,微球体或者其他聚合物基质当中(参见,例如Gregoriadis,Liposome Technology,第1卷(CRC Press,Boca Raton,FL 1984);Fraley等,Trends Biochem.Sci.,677(1981),每篇文献都在此整入以供参考)。脂质体,例如由磷脂或者其他脂类组成的脂质体,是没有毒性的,生理上可接受的而且可代谢的载体,它们比较容易制作和施用。“隐形(Stealth)”脂质体(参见,例如美国专利号5,882,679;5,395,619和5,225,212,每篇文献都在此整入以供参考)就是这样的胶囊材料的一个例子,其对于制备用于本发明的方法的组合物非常有用,而其他的“隐蔽(masked)”脂质体也可以类似地被应用,这样的脂质体延长了治疗试剂在循环中的保留时间。阳离子型脂质体比如也可以用特异性的受体或者配体修饰(Morishita等,J.Clin.Invest.,912580-2585(1993),这篇文献在此整入以供参考)。另外,多聚核苷酸试剂可以利用比如腺病毒-多赖氨酸DNA复合物来导入到细胞中(参见,比如,Micheal等,J.Biol.Chem.2686866-6869(1993),这篇文献在此整入以供参考)。
含有治疗试剂的组合物的施用途径部分地依赖于分子的化学结构。比如多肽和多聚核苷酸,如果是通过口服进入体内的话就不是特别有效,因为它们会在消化道中被降解。然而,比如用来使多肽对于内源的蛋白酶降解更加不敏感或者使其更容易通过消化道吸收的化学修饰多肽的方法,都在这里公开了或者它们是本领域所知的(参见,比如,Blondelle等,如上,1995;Ecker和Crook,如上,1995)。另外,多肽试剂可以用D型氨基酸来制备,或者可以包含一个或者多个基于肽模拟物的结构域,它们是模拟结构域的结构的有机分子;或者是基于一种类肽比如维尼纶类肽(vinylogous peptoid)构成。
在这里公开的组合物可以通过各种途径被施于个体,比如包括口服或者不经肠道的途径,如静脉内,肌肉内,皮下,眼睑内,囊内,腹腔内,直肠内,脑池内施用,或者通过皮肤被动或者易化吸收,比如分别应用皮肤帖或者透皮离子电渗透法。而且,所述组合物可以通过注射,插管,口服或者局部施用,后者可以是被动式的,比如直接贴上一块膏药,或者是主动式的,比如利用鼻腔喷雾或者吸入剂,在这种情况中,所述混合物的一种成分是一种合适的推进剂。药物组合物也可以被施于具有病理症状的位点,比如通过静脉或者动脉注射到给肿瘤供血的血管。
在实践本发明的方法时施用的试剂的总用量可以以单次剂量的形式施于个体,也就是以一粒药丸的形式或者是通过在一段相对较短的时间内输注,或者可以采用分次治疗方案来施用,其中在一段延长的时间内分多次剂量施用。本领域技术人员知道,治疗患者的病理状况所需要的组合物用量依赖于许多因素,包括患者的年龄,一般健康状况,还有给药的途径和要进行治疗的次数。纵观这些因素,熟练的技术人员会根据需要来调整特定的剂量。一般地,所述组合物的配方以及给药的途径和频率都在一开始就已经通过I期和II期临床试验确定了。
所述组合物可以配制成口服配方,比如药片,或者溶液或悬浮液的形式;或者可以包含带有有机或无机载剂的附加剂,或适合于肠道或者非肠道应用的赋形剂,还可以与例如通常无毒的药学上可接受的载剂构成复合物,形成药片,药丸,胶囊,栓剂,溶液,乳剂,悬浮液或者其他适于使用的形式。除了前面公开的那些,载剂还可以包括葡萄糖,乳糖,甘露糖,阿拉伯树胶,明胶,甘露醇,淀粉糊,三硅酸镁,云母,谷物淀粉,角蛋白,胶体硅石,马铃薯淀粉,尿素,中等链长的甘油三酸酯,葡聚糖和其他适于工业制备的载剂,它们可以是固体,半固体或者液体的形式。另外,助剂,稳定剂,增稠剂或者着色剂和香料也可以被应用,例如一种干性稳定剂如酮丙糖(参见,例如,美国专利号5,314,695)。
下面的实施例用来说明本发明但是并不限制本发明。
实施例1基因组筛选与结直肠癌有关的表观遗传学沉默基因 本实施例提供了用于检测癌症细胞中表观遗传学下调的基因的方法,并通过鉴定在结直肠癌细胞中表观遗传学下调的基因和诊断结直肠癌细胞,证实该方法的有效性(也参见,Suzuki等,Nature Genet.31141-149,2002,在此整入以供参考)。
方法细胞培养和组织样本 细胞系在添加了10%胎牛血清的RPMI 1640或最小必须培养基(MEM)中培养。结直肠癌和正常结肠粘膜的组织样本来自于临床手术操作时获得的标本。
DAC和TSA处理和RNA制剂 RKO细胞用5-氮杂-2′-脱氧胞苷(DAC;Sigma)和/或曲古抑菌素A(TSA;Wako)根据已描述的方法(Cameron等,如上,1999)进行处理。简言之,处理包括用DAC(200nM)处理48hr,在处理开始后24hr的时间点更换药物和培养基,然后添加TSA至终浓度300nM(来自1.5mM乙醇溶解的储液),并再温育24hr。细胞也用DAC或TSA单独处理,或应用相同体积的PBS和/或乙醇作为对照进行处理,和/或相同量的药物处理。一些结直肠癌(CRC)细胞系也被处理,为的是进行RT-PCR分析以评价基因表达的更高水平;用5μM DAC处理72hr,每24hr更换一次药物和培养基。利用TRIZOL试剂(Gibco/BRL)提取总RNA,并用作微阵列分析,cDNA扣除和RT-PCR。
cDNA扣除 在cDNA扣除前,利用MESSAGE MAKER Reagent Assembly kit(Gibco/BRL)从总RNA中分离poly A RNA。利用PCR-SelectTMcDNA扣除试剂盒(Clontech)进行cDNA扣除实验,以组合处理的RKO细胞系作为检测子(tester),假处理的(mock treated)细胞作为驱动子(driver)。合成的cDNA用Rsa I消化,检测子cDNA与包含在试剂盒中的接头(adaptors)连接。杂交后,扣除cDNA的PCR扩增采用ADVANTAGE cDNA PCR试剂盒(Clontech)进行。
微阵列分析 采用Mammalian GeneFilters MicroarraysTM(Research Genetics)进行微阵列分析。针对在Johns Hopkins Comprehensive microarray core分析的大约5000种基因产生滤膜(filter),针对其它5000种基因的滤膜购买获得(Human GeneFilters MicroarraysTMReleaseII;ResearchGenetics)。总共分析10,814种基因和ESTs。根据生产厂商的建议进行滤膜的杂交。简言之,5μg总RNA用SUPERSCRIPT II逆转录酶(Gibco/BRL)进行逆转录,采用oligo(dT)12-18引物和32dCTP进行标记。滤膜的杂交进行12至18hr。应用PSCAN程序(国立卫生院)分析数据。对于扣除微阵列分析,来自cDNA扣除的第二次PCR产物用33p采用MULTIPRIME DNA标记系统(Amersham)标记。如上所述进行杂交和数据分析。对于每种条件独立地重复微阵列分析至少三次,将应用来自假处理细胞的总RNA的cDNA时的阵列探测结果与扣除PCR产物的杂交结果进行比较。
半定量RT-PCR 应用oligo(dT)12-18引物,利用SUPERSCRIPT II逆转录酶(Gibco/BRL)将DNase I(Ambion)处理的总RNA(2μg)逆转录为单链cDNA。在含有1xPCR缓冲液(Gibco/BRL),1.5mM MgCl2,0.3mM dNTP,0.25μM每种引物和2U Taq聚合酶(Gibco/BRL)的50μl体积中进行PCR反应。100ng cDNA用来进行PCR扩增,所有基因被扩增多个循环数(20至35循环)以确定能够获得它们的表达水平中的半定量差异的合适条件。进行GAPDH PCR(25和28循环)以保证cDNA质量和上样准确性。扩增引物对在表4中显示(SEQ ID NOS149至296)。
甲基化分析 如所描述的那样进行基因组DNA的亚硫酸氢盐修饰(Baylin等,Proc.Natl.Acad.Sci.USA 939821-9826,1996,在此整入以供参考)。采用两种程序对亚硫酸氢盐修饰的基因组DNA进行PCR分析,以测定其甲基化状态。在第一个程序中,所有被测基因通过亚硫酸氢盐PCR进行分析,然后用多种甲基化CpG位点特异的限制性酶进行消化(COBRA;Xiong和Laird,Nucleic Acids Res.252532-2534,1997,在此整入以供参考)。第二个程序对在多个癌细胞系和组织样本中分析的所有基因使用甲基化特异的PCR(MSP)(Baylin等,如上,1996)。根据被测基因假设的转录起始位点附近的基因组序列设计所有的亚硫酸氢盐PCR和MSP引物。
SFRP基因的甲基化和表达分析 对SFRP2和SFRP4进行甲基化分析,其中应用三种不同的MSP引物对来覆盖每种基因的5′CpG岛。对于SFRP5的甲基化分析,应用两种不同的MSP引物对。对于RT-PCR,分别针对外显子2和3来设计SFRP2的正义和反义引物;分别针对外显子2和5来设计SFRP4的正义和反义引物;分别针对外显子2和3来设计SFRP5的正义和反义引物。对于每种基因,根据细胞系中的表达数据可最佳评测基因甲基化状态的MSP引物对被应用;也应用这些引物进行原发性CRC组织的分析。
结果上调基因的微阵列分析和分类 应用cDNA微阵列技术来鉴定基因上调的RKO CRC细胞,鉴定之前细胞用低剂量DAC和/或TSA处理过,前者可最低限度地阻断DNA的甲基化,后者可抑制组蛋白脱乙酰酶(HDAC)活性。在最初的研究中,应用的低剂量DAC和短时间的处理细胞仅引起为数不多的可能导致基因表达上调的等位基因去甲基化(Cameron等,如上,1999),这样的处理的灵敏性不足,其证据是不能检测到滤膜上排列的对照基因,这些基因已知在RKO细胞中可被所述的药物组合协同地重新活化(Cameron等,如上,1999;Toyota等,Cancer Res.604044-4048,2000)。因此,通过在假处理细胞(驱动子)与DAC和TSA处理细胞(检测子)之间进行初始cDNA扣除步骤,增加筛选的敏感性。第二轮扣除后的PCR产物然后可被用作微阵列杂交的探针。
在滤膜上排列的已知在RKO细胞中甲基化的四种对照基因中,仅hMLH1的再表达不能被检测到,但其他三种对照基因p16,TIMP3和PTGS2(COX2)被成功地检测到,这可通过随后的PCR研究来验证。对于未知基因,那些在假处理滤膜中显示没有表达(即,当用来自假处理细胞的非扣除cDNA进行探测时,其与空白点具有相同的强度),而在用假处理细胞和处理细胞之间的扣除产物探测后显示有可检测到的表达的基因被选择进行随后的分析,也就是在接受假处理,单独DAC处理,单独TSA处理或联合药物处理的细胞中进行半定量RT-PCR。
在通过扣除微阵列检测的总共10,814种基因中,74种被DAC和/或TSA的处理上调。这74种基因可被分为两组1组基因(n=51),用TSA单独处理时显示没有变化,在低剂量DAC单独处理后有最小量的表达增加,但DAC和TSA联合处理后有更强的诱导作用(表1);2组基因(n=23),用TSA单独处理时显示上调,对DAC的单独处理有可变化的初始表达或响应。另外,1组基因可进一步再分为两组1a组基因(n=24),在假处理细胞中是完全失活的;1b组基因(n=27),通过RT-PCR检测发现显示有基底表达。
总共56种非EST基因(表1)具有特征化的染色体位置;通过搜索所有可获得的基因组数据库,对这些基因中的46种鉴定出推定的转录起始位点。另外,在56种基因中的27种中鉴定到5′CpG岛(GC含量>60%,CpG比GpC>0.6,最小长度200bp)(Gardiner-Garden和Frommer,J.Mol.Biol.20,261-282,1987)。在剩余基因的推定的上游区域附近不能发现CpG岛表明,要么缺少富含CpG的近端启动子,含有CpG岛的控制区域的位置比利用可获得的基因组数据所能确定的区域更加上游,要么鉴定的区域不是真正的转录起始位点。
RKO细胞中5′CpG岛的甲基化分析 已被鉴定的CpG岛的甲基化状态应用亚硫酸氢盐PCR,结合甲基化CpG位点特异限制性酶(Xiong和Laird,如上,1997)和MSP(Herman等,如上,1996)进行分析,所得结果与表达状态进行比较。1a组基因(包括3个阳性对照基因)中具有被鉴定的5’CpG岛的所有12种基因在RKO细胞中都含有这些区域的高度甲基化(表1),并且通过RT-PCR检测显示没有基底表达。1b组基因中被鉴定到5′CpG岛的5种基因中的三种显示有部分甲基化(表1),这与其很低的基底表达水平相对应;其他两种基因没有显示任何甲基化。相比,不管是否有基底表达,2组基因中的10种基因中没有一种显示有5′CpG岛甲基化(表1)。
CRC细胞系中1a组基因的甲基化和表达分析 对于1a组基因,可进一步检测其与癌症的相关性。在一系列的8个CRC细胞系中检测1a组基因的甲基化状态和表达。在所有受测的CRC细胞系中均检测到SFRP1,SEZ6L,PCDH8和FOLH1基因的高度甲基化。8个细胞系中的5个显示KIAA0786有全部或占优势的甲基化。对CXX1是特别感兴趣的,因为它位于X染色体上,正常情况下在一条等位基因上是失活的且甲基化的,而在女性细胞中的另一条等位基因上是有活性且未甲基化的。然而,在8个CRC细胞系中的5个中,仅检测到甲基化的或甲基化占优势的CXX1等位基因,这些细胞系包括RKO细胞,除了HT29以外所有都来自男性患者。SNRPN也是很引人注目的,因为它在人类中是母系印记的(maternally imprinted),而且在该沉默的等位基因的启动子区CpG岛中是高度甲基化的,如所期望的那样,正常外周血淋巴细胞在转录起始位点附近的CpG岛中显示有部分甲基化(Sutcliffe等,Nature Genet.852-58,1994)。相比,RKO,HCT116和SW480 CRC细胞显示完全的甲基化,并缺少基底表达。S100A10和TIMP2甲基化仅在RKO细胞中观察到。重要地是,在甲基化的细胞系中,上述基因的每一种都缺少基底表达,而又可以通过与DAC的温育而被恢复。尽管缺少甲基化,KIAA0786在SW480细胞中也没有基底表达,然而可通过用DAC处理使其活化。
在原发性CRC组织中1a组基因的甲基化分析 在原发性结肠癌和相应的正常结肠组织中检查1a组基因的甲基化状态。SFRP1的甲基化在原发性CRC样本中观察到,具有惊人的高频率(17/20),而在具有所述肿瘤的相同个体的17个正常组织中的6个,或在其肿瘤没有显示甲基化的三个个体的正常组织中没有检测到甲基化。在11个病例中,在肿瘤和正常的组织中均观察到SFRP1甲基化,但肿瘤显示有更强的甲基化信号。还在来自没有CRC的两个患者的正常结肠组织中检查SFRP1的甲基化;没有检测到甲基化。
SEZ6L和KIAA0786也显示在原发性CRC中有非常高频率的高度甲基化(分别是,20病例中有13个,20个病例中有8个)。然而,如同SFRP1,在其肿瘤没有甲基化的个体的正常结肠中这些基因没有检测到甲基化,或对于肿瘤有甲基化的个体,13个中的11个(SEZ6L)和8个中的4个(KIAA0786)的正常结肠中没有检测到甲基化。在分别来自2和4个个体的正常结肠中检测到有一些SEZ6L和KIAA0786的甲基化,但肿瘤显示了更强的甲基化信号。
如所期望的那样,对于来自女性患者的所有组织样本包括正常结肠粘膜都显示有CXXl的部分甲基化,CXX1位于X染色体上。然而,14个男性患者中的3个显示有肿瘤特异性的CXX1甲基化。S100A10和TIMP2的甲基化未在任何原发性CRC样本中观察到。FOLH1和PCDH8在被检查的每个CRC样本和对应的正常样本中均是同等地被甲基化。
1a组基因的甲基化模式与CRC和胃癌的关系 目前的结果表明SFRP1,SEZ6L,CXX1,KIAA0786,S100A10和TIMP2涉及肿瘤的发育和/或进展。同样,还在其他类型癌症的肿瘤细胞系中检查这些基因。出现了惊人的肿瘤特征模式,因为在CRC和胃癌中SFRP1,SEZ6L,LPPH1和CXX1的完全高度甲基化是很普遍的,而在研究的所有其他类型癌症中通常仅观察到部分甲基化或观察不到甲基化(图1)。SFRP1这种模式的例外是值得注意的。在MCF7乳癌细胞中已经证明了SFRP1基因的促凋亡活性,该细胞并不具有这种基因的基底表达(Melkonyan等,Proc.Natl.Acad.Sci.USA 9413636-13641,1997)。如在此公开的,在MCF7细胞,以及MDA MB231乳癌细胞,和研究的4种前列腺癌细胞系中的2种中检测到CpG岛区域的完全甲基化(图1)。
SFRP家族成员的甲基化和表达分析 为了进一步表征上面讨论的高度甲基化基因的分组以及最感兴趣的基因之一,SFRP1在CRC细胞中的潜在作用,检查其他的SFRP基因。在5个已经鉴定的SFRP基因中,4个已经发现在其第一个外显子附近有致密的CpG岛。SFRP3缺少5′CpG岛,它在受测的7个CRC细胞系的每一个中均以基底水平表达。然而,其他3个SFRP基因的每一个在CRC细胞系中都是高度甲基化的,且具有非常高的频率,这样的高度甲基化与缺少基底表达是相关的,它们可通过DAC处理来恢复。
在原发性CRC组织(n=124)中SFRP基因的甲基化分析是特别令人感兴趣的。在正常结肠中这些基因不是高度甲基化的,除了结肠癌患者中SFRP2的微量甲基化,在该癌症中这个基因是高度甲基化的。而且,正常结肠组织和来自其他组织的细胞系在缺少启动子甲基化的情况下表达这些基因。但在原发性CRC肿瘤中对所有四种基因均观察到高度甲基化。在这种大量样本分析中,它们发生的频率是不同的,这里的分析包括了针对SFRP1的扩展数据(SFRP1,124中的118个,95.1%;SFRP2,124中的111个,89.5%;SFRP4,124中的36个,29.0%;和SFRP5,73/124,58.9%)。惊人地是,24.1%(124中的30个)显示所有4个SFRP基因均发生CpG岛的甲基化,在124个肿瘤中的123个(99.2%;图2)中,这4个基因中至少有一个是甲基化的。
这些结果证明初始微阵列数据的逻辑挖采(logical mining)明显地扩展了基因发现的关系。这些结果也揭示了基因家族的表观遗传学沉默与其在CRC中消除对WNT癌基因活性的阻断的关联。对于常见的人类癌症来说,SFRP基因家族的这种高度甲基化似乎提供了最大的分子标记物范围(见Esteller等,Cancer Res.613225-3229,2001)。
通过利用下面的观察结果,即癌症细胞中高度甲基化基因的转录沉默依赖于甲基化和HDAC活性之间的协同作用,而甲基化具有优势效应(Cameron等,如上,1999),已经开发出针对这些基因而筛选癌细胞基因组的方法。现在的结果验证了这种概念,即染色质的性质与沉默的癌症基因有关,后者则与启动子高度甲基化有关,并证明了该方法可有效地鉴定在肿瘤发生中具有极重要作用的基因。
从转录抑制染色质的观点出发,所公开的策略提供了关于对使用的抑制剂有各种反应的基因的启动子的重要信息。1a组基因的结果证实,如果单独接受HDAC的抑制作用,则高度甲基化的基因是不会重新表达的。相比,2组基因的结果揭示,在单独用HDAC抑制后重新表达或表达上调的那些基因是缺少启动子的甲基化的,即使CpG岛存在于其5’区域中。本研究公开了在用脱甲基试剂DAC处理细胞后表达上调的基因,即使这些基因的启动子本来未甲基化。类似的发现以前也有报道(Soengas等,Nature 409,207-211(2001)。上游基因如转录因子的甲基化可能继而导致这些基因的活化,另一种可能性是DNA甲基转移酶(DNMT)的抑制剂,如DAC,可以影响这些蛋白,但不是通过阻断其甲基化能力来影响。最近的研究揭示了DNMT具有通过与HDAC和其他辅阻遏物蛋白的相互作用而直接抑制转录的潜力,而这不并依赖其甲基化活性(Rountree等,Nature Genet.25269-277,2000;Bachman等,J.Biol.Chem.27632282-32287,2001;Fuks等,Nature Genet.2488-91,2000;Fuks等,EMBO J.202536-2544,2001;Robertson等,Nature Genet.25338-342,2000)。
本研究最初使用的是已建立的细胞系,这可能对基因的检测产生一些偏见,即认为这些基因仅在培养中改变或启动子高度甲基化不是肿瘤特异性的(见,例如,Smiraglia等,Hum.Mol.Genet.101413-1419,2001),然而,一对对原发性肿瘤和正常组织的仔细分析表明,所公开的方法可有效地鉴定基因(12中的11个),对于这些基因,其表达的改变与高度甲基化的5’CpG岛有关,在原代和培养的细胞中均是如此。通过微阵列方法检测的12个基因中的7个,包括p16,COX2,TIMP3,SEZ6L,SFRP1,KIAA0786和CXX1,是在原发性肿瘤中特异地甲基化,或仅在来自CRC患者的正常结肠的区域内甲基化,而所述基因在这些患者的CRC肿瘤中也都是甲基化的。另一个基因,TIMP2,在正常结肠、原发性CRC肿瘤或PBL中都不是甲基化的,而在恶性淋巴瘤中具有非常高频率的高度甲基化。第9个基因,SNRPN,是一个印记基因,在沉默的等位基因的启动子中显示有甲基化。另外两个基因在正常结肠和原发性CRC中都是甲基化的;只有S100A10在原发性组织中没有甲基化,尽管对这种基因的分析并不详尽,但已经有报道它在前列腺癌中是下调的(Chetcuti等,Cancer Res.616331-6334,2001)。
所公开的微阵列方法进一步鉴定了为数不少的以肿瘤特异性的方式高度甲基化基因。例如,一些基因如SFRP1在一些但不是全部CRC患者的正常结肠粘膜组织中是甲基化的,但没有CRC的受试者则不会有这样的甲基化。在正常组织中的这种甲基化反映了一种“场效应(fieldeffect)”,其中恶化前的变化发生在结肠很广泛的区域中,或者表明在正常结肠中某些CpG岛有随年龄变化而发生甲基化的倾向,正如对在CRC中频繁地高度甲基化的一组基因的发现那样(Toyota等,Proc.Natl.Acad.Sci.USA 968681-8686,1999)。场效应更有可能性,因为在正常组织中没有甲基化的个体的年龄范围从53至64岁,而一个46岁的老患者显示在正常组织和肿瘤组织中均有甲基化。
本发明的优势是大多数被鉴定的基因具有已知的性质或隐含的功能,它们在肿瘤发生中是很重要的。例如,1a组基因的大多数和其他组中的许多基因都定位在癌症中经历频繁LOH的染色体区域中,例如,SFRP1在染色体8p12,SEZ6L在22q11,和TIMP2在17q25(表1)。另外,许多已经鉴定的基因编码癌症所涉及的通路的组分。例如,在1a组基因中,SFRP1可拮抗WNT癌基因信号转导(Finch等,如上,1997),用SFRP1转染的乳癌细胞显示出对促凋亡信号刺激的敏感性增加(Melkonyan等,如上,1997)。SFRP1的下调表达已经在大多数乳癌中观察到(Ugolini等,Oncogene 181903-1910,1999;Ugolini等,Oncogene 205810-5817,2001)。鼠SEZ6和大鼠latrophilin的表达限制在脑内,但它们的人类同源物(SEZ6L和KIAA0786)已经分别从肺癌和乳癌中频繁被删除的区域中被鉴定,尽管在人类中其功能还不清楚(Nishioka等,Oncogene 196251-6260,2000;White等,Oncogene 173513-3519,1998)。TIMP2是间质金属蛋白酶(TIMP)家族的组织抑制物的一个成员,所述TIMP家族还包括TIMP3,这是一个在各种恶性肿瘤中经常被高度甲基化致使失活的基因(Bachman等,Cancer Res.59798-802,1999)。S100A10,也称为膜联蛋白II轻链或p11,它可与另一个钙结合蛋白,膜联蛋白II重链(p36;Kube等,Gene 102255-259,1991)形成异源四聚复合物。据报道,在前列腺癌中p36和p11蛋白表达经常丢失,可能是由于p36基因的甲基化沉默(Chetcuti等,如上,2001)。CXX1是一个推定的异戊二烯化的蛋白(Frattini等,Genomics46167-169,1997)。SNRPN,可能参与前mRNA的剪接,它位于15q11-q13,这个区域涉及Prader-Will综合征和Angelman综合征(Nicholls等,Trends Genet.14194-200,1998)。
FOLH1和PCDH8也具有令人感兴趣的特性。叶酸代谢影响DNA甲基化,一种叶酸盐代谢酶,亚甲基四氢叶酸还原酶可影响对人类恶性肿瘤的易感性(Matsuo等,Blood 973205-3209,2001;Song等,Cancer Res.613272-3275,2001)。FOLH1参与了叶酸的摄取,在癌症的DNA甲基化中具有一定的作用(Heston,W.D.,Urology 3A Suppl104-112,1997)。PCDH8是细胞-细胞粘附分子家族的一个成员(Strehl等,Genomics 5381-89,1998),其功能的丧失对侵袭和转移很重要。然而,FOLH1和PCDH8并没有显示肿瘤特异性或肿瘤优势性的甲基化。FOLH1最初被定性为前列腺特异膜抗原(PSMA),它在前列腺癌中强烈表达;它还没有在结直肠肿瘤中被研究过。在正常组织中,PCDH8在胎儿和成人的脑中专一性地表达。因此,FOLH1和PCDH8的甲基化可能是与基因表达有关的组织特异性现象,因为这些基因在CRC细胞中是沉默的,用DAC处理这些细胞可导致重新表达。
对包括基因家族SFRP在内的多个基因在胃肠道肿瘤中发生高度甲基化的频率偏好的鉴定表明,在染色质构成中的一个普遍缺陷可能使多个基因更易发生与启动子高度甲基化相关的表观遗传学沉默,这里所述的多个基因可以包括一个家族的相关基因。这个结果暗示了用于鉴定与正常细胞相比较在癌细胞中调控有差别的基因的其它方法。
从一种功能性的观点来看,所有SFRP基因都被认为可拮抗WNT/frizzled信号传导(Finch等,如上,1997;Rattner等,Proc.Natl.Acad.Sci.USA 942859-2863,1997;Chang等,Hum.Mol.Genet.8575-583,1999;Abu-Jawdeh等,Lab.Invest.79439-447,1999)。这样,SFRP基因功能的丧失可使整个肿瘤抑制基因通路失效。例如,APC的突变在结肠癌中很普遍,这可引起组成型的WNT通路作用(Morin等,Science 2751787-1790,1997;Behrens等,Science 280596-599,1998)。最初的结果表明APC的突变在CRC肿瘤中是经常发生的,同时有SFRP基因高度甲基化的各种组合。然而,APC具有其它的功能(Mimori-Kiyosue和Tsukita,J.Cell Biol.1541105-1109,2001)。因此,通过其它机制对WNT活性进行抑制的作用的丧失指出了一个对于结直肠肿瘤发生很重要的新的功能通路。
在此公开的方法提供了一种手段,以鉴定各个类型癌症中通过表观遗传学机制发生沉默的基因的整个谱图。发现这些新鉴定出的基因的甲基化模式与最初筛选的特定癌症类型和相关的肿瘤类型形成了映射(见图1),这证实了启动子高度甲基化对人类癌症的表征(profiling)的重要性。令人注意的是,CRC和胃肿瘤是由于丧失错配修复功能而表现出微卫星不稳定性的表型的数种肿瘤类型中的两种;在每一种中,起到联系作用的都是涉及MLH1基因启动子的高度甲基化事件(Baylin和Herman,Trends Genet.16168-174,2000,在此整入以供参考)。因此,一系列这样的标记可用于检查和操作调节肿瘤发生的通路。而且,现在的结果证明,有限数量的高度甲基化基因就足以组成全面的标记系列,它们可以用于特定类型的人类癌症的灵敏检测。上述的方法提供了用于在其它紊乱中鉴定这样的基因系列的手段。
尽管本发明已经根据上述的实施例进行了描述,要理解的是,各种修饰和变化包括在本发明的精神和范围之内。因此,本发明仅由权利要求书限制。
表1·RKO细胞中被DAC和TSA处理而上调的基因1a组Acc no.a基因名称 符号位置CpG岛b甲基化CR80217 前列腺素-内源过氧化物合成酶2 PTGS2d1q25.2-q25.3是是(前列腺素G/H合成酶和环加氧酶)dAA877595 细胞周期蛋白依赖的激酶抑制剂2A(黑素瘤, CDKN2Ad9p21是是AA099153 金属蛋白酶3的组织抑制剂 TIMP3d22q12.3 是是(索斯比基底营养不良,假炎性)dAA444051 S100钙-结合蛋白A10S100A10 1q21是是N32514 分泌型卷曲相关蛋白1 SFRP1 8p12-p11.1 是是W72596 CAAX序列盒1 CXX1Xq26是是H29013 发作相关基因6(鼠)-样 SEZ6L 22q11.2-12.1是是W74533 latrophilin KIAA07861p31.1 是是AA486280 金属蛋白酶2的组织抑制剂 T1MP2 17q25 是是H29216 原钙依粘连蛋白8 PCDH8 13q14.3-q21.1 是是N64840 叶酸水解酶(前列腺特异膜抗原)1 FOLH1 11p11.2 是是A1017332 人SNRPN mRNA,3′UTR,部分序列SNRPN 15q12 是是N54793 妊娠特异的β-1-糖蛋白6PSG619q13.2 否H87471 犬尿氨酸酶(L-犬尿氨酸水解酶) KYNU2p23.3-q14.3否AA001432 层粘蛋白,a3(nicein(150kD),kalinin(165kD), LAMA3 18q11.2 否BM600(150kD),epilegrin)AA034939 层粘蛋白,α2(merosin,先天的肌营养不良,LAMA2) LAMA2 6q22-q23否A1298976 小的可诱导的细胞因子亚族C,成员1(lymphotactin)SCYC1 1q21-q25否AA291484 细胞色素P450,亚族IVB,多肽1 CYP4B1 1p34-p12否R62603 胶原蛋白,VI型,a3COL6A3 2q37否T73558 脱氧核糖核酸酶1-样3 DNASE1L33p21.1-3p14.3 否AA404246 人类假想蛋白MGC13047 10 否AA156424 ESTH16554 ESTN67972 EST
表1-续1b组Acc no.a基因名称符号 位置 CpG岛b甲基化CAA173290 同源序列盒A1HOXA1 7p15.3是部分的AA935273 GRO3癌基因 GRO3 4q21 是部分的AA256304 distal-less homeobox 7 DLX7 17q21.33 是部分的H17115 基质抗原3 STAG3 7 是否AA454880 不均一核核糖核蛋白D HNRPD 4q21.1-q21.2 是否(富AU元件RNA结合蛋白1,37kD)AA496149 3-羟-3-甲基戊二酰基-辅酶A合成酶2(线粒体)HMGCS21p13-p12 否AA176491 肌源性因子6(herculin) MYF6 12q21 否H16793 染色体8开放阅读框4 C8orf48p11.2否H10079 KIAA0751基因产物 8 否H59614 类似于推定的胰岛素样生长因子II相关蛋白11p15.5 ukAA457731 SNARE蛋白 YKT6 6 ukAA419251 干扰素诱导的跨膜蛋白1(9-27) IFITM111ukN48178 KIAA0403蛋6 ukAA027147 假想蛋白MGC3040 3 ukH18646 假想蛋白FLJ10697 10ukAA013268 含(CAG)4重复序列的人类mRNA,克隆CZ-CAG-7 UKukAA039857 ESTAA101632 ESTAA464518 ESTAA427754 ESTH16733 ESTH88953 ESTN90849 ESTN22486 ESTT62979 ESTR53558 ESTR39555 EST
表1-续组2Acc no.a基因名称 符号 位置 CpG岛b甲基化cAA425908 RAC1伴侣(arfaptin 2) POR1 11p15 是否AA405717 muscleblind(果蝇)-样 MBNL 3 是否AA916906 TNFRSF1A-相关的经死亡结构域 TRADD 16q22 是否AA404394 蛋白二硫化物异构酶-相关的 PDIP 3 是否AA489678 RAD23(酿酒酵母)同源物BRAD23B 3p25.1是否AA447514 核糖体蛋白L13 RPL13 16q24.3 是否AA071330 鸟嘌呤核苷酸结合蛋白(G蛋白). GNAI2 3p21 是否α-抑制活性多肽2AA669126 蛋白磷酸酶1,调节(抑制物)亚基12A PPPTR21A 12q15-q21 是否R38619 海藻糖-1-磷酸鸟苷转移酶 FPGT 1 是否AA055503 含tripartite基序-32 TRIM32 9q32-q34.11 是否T66981 含egf样组件,粘液素样,激素受体样序列1EMR1 19p13.3 否AA480906 蛋白激酶C结合蛋白1PRKCBP120q12 否N45318 磷酸甘油酯变位酶2(肌肉) PGAM2 7p13-p12 否N30096 谷胱甘肽S-转移酶A3GSTA3 6p12 否AA427733 advillin ADVIL 12否N92901 脂肪酸结合蛋白4,脂肪细胞 FABP4 8q21 否T60149 假想蛋白FLJ3449 13ukAA453578 染色体9-12-13.3上来自克隆RP11-3J10的人DNA序列9p12-p13.3ukW81520 来自PAC 106H8的人类基因,相似于Dynamin 1 ukAA446486 ESTAA447992 ESTH94605 ESTW46439 ESTaGenbank注册号.b是CpG岛发现于假定的转录启始位点周围或紧挨上游区;否在假定的转录启始位点周围或紧挨上游区未发现CpG岛;uk上游基因组序列未知.c是完全甲基化;部分的部分甲基化;否无甲基化作用.d阳性对照基因.
表2·甲基化作用研究的引物序列基因名称 方法正义 反义S100A10 亚硫酸氢盐PCR TGAAGAGAAGTTTATAAGAAYGTTTTGT*(1)***CAACAAATCCRAACCTAAAAACTACCCA**(2)MSP(M) TCGCGTCGTTTTTTTTTATTTATTCGTC(3)AAACTCACCTTAACCGAAACGCGACG(4)MSP(U) GTTTTTGTGTTGTTTTTTTTTATTTATTTGTT(5)AACAAAACTCACCTTAACCAAAACACA(6)CXX1 亚硫酸氢盐PCR GGAGTTTATGAGAGGGTTGGAGTTT(7) ATCACCCACTACAAAACRAACCCTA**(8)MSP(M) TGGATACGTATTTTCGGCGACGTTTC CAACGACGCGTCGCAAACCGAATCGMSP(U) TGGTTTTTGTGGATATGTATTTTTGGTGAT AATTCCTCCAACAACACATCACAAACCASEZ6L亚硫酸氢盐PCR GGGGAATTGGYGTTAAATTTTGTAGGG*AAACAACTTCCRAAACCCCCTAAAC**MSP(M) TTCGGAAGTTGTTTCGGTTCGC CGAACATCGTAACTACAAAAAACGCGMSP(U) GGGTTTTGGAAGTTGTTTTGGTTTGT AACCACAAACATCATAACTACAAAAAACACASFRP1亚硫酸氢盐PCR1 TGGTTTTGTTTTTTAAGGGGTGTTGAGT(19) ACACTAACTCCRAAAACTACAAAACTAAA**(20)亚硫酸氢盐PCR2 TTAGTTTTGTAGTTTTYGGAGTTAGTG*TCCTAGCRCAAACTTCCAAAAACCTCC**MSP(M) TGTAGTTTTCGGAGTTAGTGTCGCGC CCTACGATCGAAAACGACGCGAACGMSP(U) GTTTTGTAGTTTTTGGAGTTAGTGTTGTGT CTCAACCTACAATCAAAAACAACACAAACALPHH1亚硫酸氢盐PCR GTTAAAGTTTAGTTGGTTTTAYGTAATTAT*CTTTTAATTTCCRTAACCCTCCTTTTAT**MSP(M) ATTAATTTTGGAGCGTTTTTCGCGCGTC TCCACGCACCGAACCAAAAACCCCGMSP(U) ATGTATTAATTTTGGAGTGTTTTTTGTGTGTT TCTCCACACACCAAACCAAAAACCCCATIMP2亚硫酸氢盐PCR AGATAAAGAGGAGAGAAAGTTTGCCAACAACAAAAAACCRAAC**MSP(M) ATTCGTAGAAGGTAGCGCGGTCGTC CTCACCTACCCCGCTCGACCGCGMSP(U) ATATATTTGTAGAAGGTAGTGTGGTTGTT TCCTCACCTACCCCACTCAACCACASNRPN亚硫酸氢盐PCR GTTATYGGTATAGTTGATTTTGT*(39) CTCCCCCCAAATCATTCCRATAA**(40)FOLH1亚硫酸氢盐PCR GAGGTATTAGTGAGATTGAGAGAGATTT CCCTAAAAAAAACCAACAACAAAATCCCAMSP(M) TTCGTCGTGGTGGTTGGAGGGCGC CAACGCACAACCAACGCGAACGACGMSP(U) TTATTTTGTTGTGGTGGTTGGAGGGTGT CCCCAACACACAACCAACACAAACAACAPCDH8亚硫酸氢盐PCR AAGGGATTGTTAGAGGTAGGYGGAG*CACAAAACTCATACCTCCAACCTCAHOXA1亚硫酸氢盐PCR TTATGGAGGAAGTGAGAAAGTTGG TCTACACCCCCCTACCCACTAAAAGRO3 亚硫酸氢盐PCR TAGGAATTTGGGGTAGAAAATGAATATTT ACCCRAACTATATAACTCCCCAAAATC**DLX7 亚硫酸氢盐PCR GGAGAGTTAGGYGGGTTAGAGTTGA*CTACAAAAAAAATAACCATATCTCCMPS(M) GATTTTTCGCGGCGGTATCGTAGCGC CAACCCCTTCCTTCGTTAAACAACGCGMSP(U) GATTAGATTTTTTGTGGTGGTATTGTAGTGTAACAACCCCTTCCTTCATTAAACAACACAHNRNP亚硫酸氢盐PCR GAAGGGGGTAGGTTAGGGAGAGG(59)CCACCATAACTCCCTCCTACTC(60)MSP(M) TGATCGGGACGCGTCGTTTTTTCGTC CTTCGCCTCCCACTCTCGCGCGACGMSP(U) TTATGTGATTGGGATGTGTTGTTTTTTTGTTCCCTTCACCTCCCACTCTCACACAACA
表2续基因名称方法 正义 反义STAG3 亚硫酸氢盐PCR TGGTATTTAGGAGGTTGGTGAAATA ACCCTCAATCTCCTACTCCATTAAAMSP(M)GCGGGGTTAAAGCGGGTCGTTCGC AAAAATATACGAACTAATACGCGCCACGMSP(U)GGGTGGGGTTAAAGTGGGTTGTTTGT TAAAAATATACAAACTAATACACACCACAPOR1亚硫酸氢盐PCR GTAGTTGTTGTTGTTGTTGTTGTTGTTT AACATCTTACCCTCTAAACAAATTTATACMSP(M)GTTTCGTTTTTATAATTTGCGACGTGGTC CTCAAAACGCCAAACCCGAACCGCGMSP(U)GTGATGTTAGTTTTGTTTTTATAATTTGTGAT TCCCCTCAAAACACCAAACCCAAACCAMBNL亚硫酸氢盐PCR GAATTTATTGGTGTGTTTAGTAGTYGG*CCCRAACCACAAAATCRCCTATCAAC**MSP(M)GGGAGGGCGTTCGGTTTGTACGTTC(79) CATAAACGATCGCCCAACGACGCCG(80)MSP(U)AGTGGGAGGGTGTTTGGTTTGTATGTTT CAAATCATAAACAATCACCCAACAACACCARAD23B 亚硫酸氢盐PCR AGGAGGAAGTTTTAGGAGTTTTTG CTAACTCACCACAAAATAATAACCMSP(M)TCGTGGTTGGCGTTCGGCGCGTGA ACCGCCGCGCAACTCGACTACCGAMSP(U)TTGTGGTTGGTGTTTGGTGTGTGA ATACCACCACACAACTCAACTACCRPL13 亚硫酸氢盐PCR GTGTTTTATAAATGTGAATAAATAGAATTT CAATACACTCTAAAATAATAACAAAACCMSP(M)TTTTAGGGTTGTCGGGAGAGTCGCGG CAACCGAACGAAAAAAAAACGACCCCGMSP(U)GTGGTTTTAGGGTTGTTGGGAGAGTTGT AAAACAACCAAACAAAAAAAAAACAACCCCATRADD 亚硫酸氢盐PCR GGTATTAGAAAATTTTGGTTTTTAGGGGG ACCCACCCACCTACTACACTAACCTAMSP(M)ACGGGAAGTAGTTATCGGGAGTTCGC GACGAAACCTAAATTCCCACGCCCGMSP(U)TGGATGGGAAGTAGTTATTGGGAGTTTGT(99) CTCAACAAAACCTAMTTCCCACACCCA(100)FPGT亚硫酸氢盐PCR GTTATTTGTTTTTGAGATYGTTGTTAGAG*CTAACAACTACCATAACCCCACCTTCPDIR亚硫酸氢盐PCR AGTGGAGAAAGGAGTTAGYGGTGGGTA*CCTACCTAACATACACRCCCTCATCCC**GNAl2 亚硫酸氢盐PCR GGTTTAGTTATAGGTTTGGTTYGTTTAGG*CTCACCCAACAACAACAACTTCACCTCMYPT1 亚硫酸氢盐PCR GGGTTATATTYGTTTTTTTTTGGTGGTTTA*CCTCCCTTCCTACCACAAAAACCCTCHT2A亚硫酸氢盐PCR GTTTTTAGAGGAAAGTTTATTTTTGTAGGG(109)ATCCCCAATCCCCAACCCTCCTTCCC(110)*Y=C或T**R=A或G***SEQ ID NO-编号从1至110,从左至右,从上至下;显示了代表性的SEQ ID NOS。
表3-SFRP基因的引物序列基因 方法 正义 反义SFRP2 MSP1(M)*GGGTCGGAGTTTTTCGGAGTTGCGC(111)**CCGCTCTCTTCGCTAAATACGACTCG(112)MSP1(U)*TTTTGGGTTGGAGTTTTTTGGAGTTGTGT AACCCACTCTCTTCACTAAATACAACTCAMSP2(M) AAAATAAGTTCGGGTTTCGGCGGTACCAATAAACGAACAAAACGCGAACTACGMSP2(U) GTAAAATAAGTTTGGGTTTTGGTGGTAT CACAATAAACAAACAAAACACAAACTACAMSP3(M) TTAGTATTTGGTCGCGAGGTCGTTC CCCTAAATACCGCCGCTCGCCCGMSP3(U) TTGTTAGTATTTGGTTGTGAGGTGTTT CCCCTAAATACCACCACTCACCCART-PCRGATGATGACAACGACATAATGGAAACG GAGTGTGCTTGGGGAACGGGAGCTSFRP4 MSP1(M) AGTTGTTAAGGGAGCGTTTCGAGTTTAC CTCAACCTTCGAAAACGAACCCGCCGMSP1(U) GTAGTTGTTAAGGGAGTGTTTTGAGTTTATCTCTCAACCTTCAAAAACAAACCCACCAMSP2(M)*GGGTGATGTTATCGTTTTTGTATCGAC(129) CCTCCCCTAACGTAAACTCGAAACG(130)MSP2(U)*GGGGGTGATGTTATTGTTTTTGTATTGAT CACCTCCCCTAACATAAACTCAAAACAMSP3(M) GGTTGCGTTTCGAGTTGCGGAGTTC TCCAATCGACAACAAAACGAAACGCGMSP3(U) GTTGGTTGTGTTTTGAGTTGTGGAGTTT AACTCCAATCAACAACAAAACAAAACACART-PCRGGTACAGGAAAGGCCTCTTGATGTTGGGATCTTTTACTAAGCTGATCTCTCCSFRP5 MSP1(M)*AAGATTTGGCGTTGGGCGGGACGTTCACTCCAACCCGAACCTCGCCGTACGMSP1(U)*GTAAGATTTGGTGTTGGGTGGGATGTTT AAAACTCCAACCCAAACCTCACCATACAMSP2(M) CGTTTTGGAGTTGGGGTTAGGCGGTCAAATAAATAACAACCTACGCTACGAACGMSP2(U) TTTGTTTTGGAGTTGGGGTTAGGTGGTT CCAAATAAATAACAACCTACACTACAAACART-PCRTGCGCCCAGTGTGAGATGGAGCAC(147) CCCATCCCTTAGGCCTTGTGCCAGT(148)*引物显示于图6并用于原发性组织样本分析**SEQ ID NO-编号从111-148,从左至石,从上至下;显示了代表性的SEQ ID NOS。
表4组1a 基因名称 符号 RT引物(正义)RT引物(反义)Ace No.aR80217前列腺素-内源过氧化物合成酶2 PTGS2d TAAACAGACATTTATTCCAGAC(149)**GAAAGAAATAGTCAATATGCTTG(150)(前列腺素G/H合成酶和环加氧酶)dAA877595 细胞周期蛋白依赖的激酶抑制剂2A(黑素瘤, CDKN2Ad AGCCTTCGGCTGACTGGCTGG CTGCCCATCATCATGACCTGGAp16,抑制CDK4)dAA099153 金属蛋白酶3的组织抑制剂 TIMP3d CAGCTGGAGCCTGGGGGACTG CCTTGCGCTGGGAGAGGGTGAGAA444051 S100钙-结合蛋白A10S100A10 TTTCTCTGCTTGTCAAATGAGAGTCTTAACAAAGGAGGACCTGAGAGN32514分泌型卷曲相关蛋白1 SFRP1TTGTAGTTATCTTAGAAGATAGCATGG ACGGGAATTACTATTAACATAAGCGW72596CAAX序列盒1 CXX1 CTGCTGCCGCCCCTGGGCCTCAC(159)GTAGTGTATTAGAGCAGAGCAGAATG(160)H29013发作相关基因6(鼠)-样 SEZ6LCCCAGGAGAATGCCTACCTTTG AAACTGCCAAACAGCCCAGAAGGW74533latrophilin LPHH1CTGTGGTTGATTGCTAGTGGT AAGTGACTGAACCTTGCAGTTCTAA486280 金属蛋白酶2的组织抑制剂 TIMP2CCCTCCTCGGCAGTGTGTGGGGTCGGGATGTCAGAGCTGGACCAGTCGAAH29216原钙依粘连蛋白8 PCDH8ATTACTGTGCTTATAAGTGACACGGAAGTTATTGCCAAAGGAACTGTN64840叶酸水解酶(前列腺特异膜抗原)1 FOLH1GTTCGAGGAGGGATGGTGTTTGAGC(169) ATACCACACAAATTCAATACGGATTCT(170)A1017332 人SNRPN mRNA,3′UTR,部分序列SNRPNAATGACACTCTGAAATCCAGTC CTATTGTGTGATAGGCTCTGTN54793妊娠特异的β-1-糖蛋白6PSG6 TGAGTGGTAGCAAGGTTTACA ATTTCAGCCTCTTCCGAATCTH87471犬尿氨酸酶(L-犬尿氨酸水解酶) KYNU TTAAAAATCGAATAATACTGAAATAACCGGGGTGCCCAGCCTAACAATAAAA001432 层粘蛋白,a3(nicein(150kD),kalinin(165kD), LAMA3TCTCTGAAGAAGGAGGTCATGT GGAGGGAGGTGCATTGGGTAATBM600(150kD),epilegrin)AA034939 层粘蛋白,α2(merosin,先天的肌营养不良,LAMA2) LAMA2AAAGCAGTTGGTGGATTCAAAG(179) TTATTAGTTGGCTGGGCATGA(180)A1298976 小的可诱导的细胞因子亚族C,成员1(lymphotactin)SCYC1TTCTTTACACATCAGTCACAAG GGGTGTTGAGTTACCAGATGAAA291484 细胞色素P450,亚族IVB,多肽1 CYP4B1 AAAGAAACACATCTCAGTGAAGGGCAGGAGGCTTGTAGTTTAGAAGGR62603胶原蛋白,VI型,a3COL6A3 AGTTAGCCACTGCTGGTGTTCCCTCCCTCCAGCACACAAAT73558脱氧核糖核酸酶I-样3 DNASE1L3 CCAGAGACATCCGTTAAGGAGA TTGGGTCTAGGAGCGTTTGCTAA404246 人类假想蛋白MGC13047 MGC13047 TCTTGAGCATTGTGGTGGCCTTA(189)TTCGGGCTTCCTGGAGGGAACA(190)AA156424 ESTGCAACATGAAGATTCTGAAGGGT ACAGCAAACTGCATTTACCATCGH16554ESTTTGGAAAGA TCGTCCTGGTGC AACTTCTGGCCCTCGGAGGAAN67972ESTAACAGCAAGCATGACATATTCA GCAGAGAGAATGTGAGGAACCTT组1bAA173290 homeo box A1 HOXA1ATGCCTCAGAGGGTAGCCTTG ATTACAGACATCCTAAGACCCGAA935273 GRO3致癌基因 GRO3 TCATCAAACATAGCTCAGTCCT(199) CCAAGGGAAAGAGAAACGCTG(200)AA256304 distal-less homeobox 7DLX7 TTTCTCTGGAGGACAAGCAGTTAGTTTCTCTGCATCTCTTCTACCTCCH17115基质抗原3 STAG3ACCTGGAGCTGTTCCTGC GTAACAGCTCTTCAAGCTCCT
表4组1b 基因名称 符号 RT引物(正义) RT引物(反义)AA454880 不均一核核糖核蛋白D HNRPD GGTGGTTATGGAGGATATGACCCAGTAAGACACTAGTAGATC(富AU元件RNA结合蛋白1,37kD)AA496149 3-羟-3-甲基戊二酰基-辅酶A合成酶2(线粒体) HMGCS2 ATTTGGAGATTCACAGGAACAGC CCACTCTTAGCTGGTAAATGAAT
H10079KIAA0751基因产物 KIAA0751 AACCATCTTGCTTTCCTTAAATTC(209)CCCACCCTTCTTCACCCGCTTT(210)AA176491 肌源性因子6(herculin)MYF6 TACAATACCAGGATCCTCGCACAT TTGGAACTGCGAGTGGCTTAGH16793染色体8开放阅读框4 C8ORF4 TATTATTGTTGCATGACATTTGC AAAGTGCACCCACATGGATGTTAH59614类似于推定的胰岛素样生长因子II相关蛋白 GCTTTATTGGGATTGCAAGCGT GGGCTGCCTGTCTGACCTCAA457731 SNARE蛋白YKT6 GGGCGGACGCATGATAGCTGTA GTCTTGTTCTTTGACAGAAGCTCN48178KIAA0403蛋白 KIAA0403 TTCACATAGCACACAAGTGAC(219) GACCTCTACTTCCTTGGAGCTT(220)AA419251 干扰素诱导的跨膜蛋白1(9-27) IFITM1 CACAAGCACGTGCACTTTATTGAA TAGTAGCCGCCCATAGCCTGCAA027147 假想蛋白MGC3040 MGC3040AATGTTTCTCATTAAGTCAGGGT CCAGCCAATGGCGACTATAGAGAH18646假想蛋白FLJ10697 FLJ10697 CCCACGTTTATTTACATATGAGTTTTGTGTATATATAGATACTTGCAA013268 含(CAG)4重复序列的人类mRNA,克隆CZ-CAG-7GCAGAGTTTCACTGTATCAACTGAAGATTGTAGGGCTTAGATAA039857 EST TATTTGTGGCTCCTTCCCACTT(229) CCTCCTGCCCTCATGCCTGTAA(230)AA101632 EST CGCGTTGCATCCCTTGGATTGTA CCACGGTTGGTTAATAGTCCCTTAA464518 EST AAGTACACAAGTGGTAAGTATAG ACTCTTTGATTACAAGCACTGGAA427754 EST ATGCACACATGTTTAATTGTAG CGTAGGTATACACGTGCCATH16733EST TGCCAAGTGCAATGTTCCAGAAA TTTCGGGAGAACCCAACCTAAGH88853EST TGCTTAGGATATAGCATGAAA(239) TATCGGCATAGATATATGAGT(240)N90849EST AAATGCTTTGGAATCCCTGAGA TGTGCTTAAGTGGCAGGATN22486EST ACAAGTTTAAGAAGAACAAAGCTG TATGGACATCCAGTTGTTCCAGCAT62979EST AGGAGGGAAGGGTAACAACTCAT AGAATGTGGATGACCCCTCGGAAGR53558EST GTCAGTCTGCTCACTCCACCGT CGGATGTGGAAACCTTTCAGGAR39555EST TATCACAAGCATTTATTGAGTACC(249)TATTCTAGATATTTACTCCTTCG(250)组2AA425908 RAC1伴侣(arfaptin 2) POR1 ACAAAGGATGTACCATGTCCAA CAGATCAAGGTGATGCACAAGAA405717 museleblind(果蝇)-样 MBNL CATACAGCAAAGTCAACTACTGC ACGCAGTTCAAATTTCATGGTTTAA916906 TNFRSF1A-相关的经死亡结构域 TRADD TTTGGAGAACCTGGATGGCCTATCTGCAGCACCCAGGATGAAAA404394 蛋白二硫化物异构酶-相关的PDIR AGAGCCCACGTGGGAAGA CAGGTATCATTCACAGTGTAAT
表4组1a基因名称 符号RT引物(正义)RT引物(反义)AA489678RAD23(酿酒酵母)同源物BRAD23B TGCCATGAGATATCTTGATTGT(259) GGGCCAATGGAGAAATGCAGC(260)AA447514核糖体蛋白L13 RPL13 TATACAGTCTTCCCACTTCACT TTCTGCCTGATCATCCCATTGTAAA071330鸟嘌呤核苷酸结合蛋白(G蛋白) GNA12 AAGCTACGAGAATGAGCAGGTG GTCTTGTTCTGTGATGAGGGGα-抑制活性多肽2AA669126肌球蛋白磷酸酶,目标亚基1 MYPT1 GAAGATCAGTTAATGTCACTCC TGGTAGAAGACAAGATGATTTGR38619 海藻糖-1-磷酸鸟苷转移酶 FPGTTGAATGACAAAGACATAACATCC CTCAAGTTATGTGTCCCTATATTAA055503TAT相互作用蛋白,72KD HT2ATTCCGCTGCATTGCTGGCATGT(269) GCCTTGGAAGTGCCTAATTGCT(270)T66981 含egf样组件,粘液素样,激素受体样序列1EMT1AGTCCCAGACCTCAAGGATCT GGGTAAATCAGTCAGACAGGCAA480906蛋白激酶C结合蛋白1PRKCBP1 CAGCTCAGTCACAGGAGAGATACAGTTCGCATCCTCTTAACN45318 磷酸甘油酯变位酶2(肌肉) PGAM2 CTCACAGGCTTCAACAAGGCA GGGAGGTGCCTTTATTGCCCAN30096 谷胱甘肽S-转移酶A3GSTA3 TAGCATATAATTGGAAAGGGTTC AAGTGTTACAGAGCCATGGACAAAA427733advillin AVlLCTTTGACACATTACAGATCTGGG(279)CATCCTTGCATTCCTTGCTTGTT(280)N92901 脂肪酸结合蛋白4,脂肪细胞 FABP4 TTAACCAACGTAACCATATTGAATAAA AGGATGATAAACTGGTGGTGGAATT60149 假想蛋白FLJ3449 FLJ13449GCACATTAAACAGCATACATACC CCCTGTTCCTTGTGGAAACCTATAA453578染色体9p12-133上来自克隆RP11-3J10的人DNA序列 TTGCCCATAACTCACTGTGGCCT AAATCTGGCTGGAACGGGACAW81520 来自PAC 106H8的人类基因,相似于DynaminTGTCTTTAGGAGACGTGAGAAAG CTTCCACGGATTACTGACAGAGAA446486EST AACTTAGCACATTAACTGCAGC(289) TGCCTGAAATCCCACTACTTGG(290)AA447992EST CATTTATCTTGATCAAACCCACC ATGCTTTCTGAAGAGTGAGCCCH94605 EST CGTGGTACCTAAACATGGACAC TCTCATTGTAGGTCTCCTAAAGW46439 EST TTTGAAGCACTAAGATCAATAC(295) TTGCGAACGCGTCTGTGA(296)*Acc.No.,Genbank注册号。bCpG岛,‘是’,CpG岛发现于假定的转录起始位点周围或紧挨上游区‘否’,在假定的转录起始位点周围或紧挨上游区未发现CpG岛;‘UK’,上游基因组序列未知;c甲基化作用,‘是’,完全甲基化;‘部分的’,部分甲基化;‘否’,无甲基化作用。
d阳性对照基因。
**-SEQ ID NO-编号从149至296,从左至右,从上至下;显示了代表性的SEQ ID NO。
序列表<110>约翰霍普金斯大学<120>针对与癌症相关的表观遗传学沉默基因的基因组筛选<130>CPUSZ41965<150>US 60/362,422<151>2002-03-07<160>296<170>PatentIn version 3.1<210>1<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>1tgaagagaag tttataagaa ygttttgt 28<210>2<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>2caacaaatcc raacctaaaa actaccca 28<210>3<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>3tcgcgtcgtt tttttttatt tattcgtc 28<210>4<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>4aaactcacct taaccgaaac gcgacg 26<210>5<211>32<212>DNA<213>人工序列<220>
<223>扩增引物<400>5gtttttgtgt tgtttttttt tatttatttg tt 32<210>6<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>6aacaaaactc accttaacca aaacaca 27<210>7<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>7ggagtttatg agagggttgg agttt 25<210>8<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>8atcacccact acaaaacraa cccta 25<210>9<211>26<212>DNA<213>人工序列<220>
<223>扩增引物
<400>9tggatacgta ttttcggcga cgtttc 26<210>10<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>10caacgacgcg tcgcaaaccg aatcg 25<210>11<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>11tggtttttgt ggatatgtat ttttggtgat 30<210>12<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>12aattcctcca acaacacatc acaaacca28<210>13<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>13ggggaattgg ygttaaattt tgtaggg 27<210>14<211>25<212>DNA<213>人工序列<220>
<223>扩增引物
<400>14aaacaacttc craaaccccc taaac 25<210>15<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>15ttcggaagtt gtttcggttc gc 22<210>16<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>16cgaacatcgt aactacaaaa aacgcg 26<210>17<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>17gggttttgga agttgttttg gtttgt 26<210>18<211>31<212>DNA<213>人工序列<220>
<223>扩增引物<400>18aaccacaaac atcataacta caaaaaacac a31<210>19<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>19
tggttttgtt ttttaagggg tgttgagt 28<210>20<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>20acactaactc craaaactac aaaactaaa 29<210>21<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>21ttagttttgt agttttygga gttagtg27<210>22<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>22tcctaccrca aacttccaaa aacctcc27<210>23<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>23tgtagttttc ggagttagtg tcgcgc 26<210>24<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>24cctacgatcg aaaacgacgc gaacg 25
<210>25<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>25gttttgtagt ttttggagtt agtgttgtgt 30<210>26<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>26ctcaacctac aatcaaaaac aacacaaaca 30<210>27<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>27gttaaagttt agttggtttt aygtaattat 30<210>28<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>28cttttaattt ccrtaaccct ccttttat28<210>29<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>29attaattttg gagcgttttt cgcgcgtc28
<210>30<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>30tccacgcacc gaaccaaaaa ccccg 25<210>31<211>32<212>DNA<213>人工序列<220>
<223>扩增引物<400>31atgtattaat tttggagtgt tttttgtgtg tt 32<210>32<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>32tctccacaca ccaaaccaaa aacccca27<210>33<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>33agataaagag gagagaaagt ttg23<210>34<211>20<212>DNA<213>人工序列<220>
<223>扩增引物<400>34ccaacaacaa aaaaccraac20
<210>35<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>35attcgtagaa ggtagcgcgg tcgtc25<210>36<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>36ctcacctacc ccgctcgacc gcg 23<210>37<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>37atatatttgt agaaggtagt gtggttgtt29<210>38<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>38tcctcaccta ccccactcaa ccaca25<210>39<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>39gttatyggta tagttgattt tgt 23<210>40
<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>40ctccccccaa atcattccra taa 23<210>41<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>41gaggtattag tgagattgag agagattt28<210>42<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>42ccctaaaaaa aaccaacaac aaaatccca 29<210>43<211>24<212>DNA<213>Artificial sequence<220>
<223>Amplification primer<400>43ttcgtcgtgg tggttggagg gcgc24<210>44<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>44caacgcacaa ccaacgcgaa cgacg 25<210>45<211>28
<212>DNA<213>人工序列<220>
<223>扩增引物<400>45ttattttgtt gtggtggttg gagggtgt 28<210>46<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>46ccccaacaca caaccaacac aaacaaca 28<210>47<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>47aagggattgt tagaggtagg yggag 25<210>48<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>48cacaaaactc atacctccaa cctca 25<210>49<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>49ttatggagga agtgagaaag ttgg 24<210>50<211>24<212>DNA
<213>人工序列<220>
<223>扩增引物<400>50tctacacccc cctacccact aaaa24<210>51<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>51taggaatttg gggtagaaaa tgaatattt 29<210>52<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>52acccraacta tataactccc caaaatc 27<210>53<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>53ggagagttag gygggttaga gttga 25<210>54<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>54ctacaaaaaa aataaccata tctcc 25<210>55<211>26<212>DNA<213>人工序列
<220>
<223>扩增引物<400>55gatttttcgc ggcggtatcg tagcgc26<210>56<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>56caaccccttc cttcgttaaa caacgcg 27<210>57<211>31<212>DNA<213>人工序列<220>
<223>扩增引物<400>57gattagattt tttgtggtgg tattgtagtg t 31<210>58<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>58aacaacccct tccttcatta aacaacaca 29<210>59<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>59gaagggggta ggttagggag agg 23<210>60<211>22<212>DNA<213>人工序列
<220>
<223>扩增引物<400>60ccaccataac tccctcctac tc 22<210>61<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>61tgatcgggac gcgtcgtttt ttcgtc 26<210>62<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>62cttcgcctcc cactctcgcg cgacg 25<210>63<211>31<212>DNA<213>人工序列<220>
<223>扩增引物<400>63ttatgtgatt gggatgtgtt gtttttttgt t 31<210>64<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>64cccttcacct cccactctca cacaaca27<210>65<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>65tggtatttag gaggttggtg aaata 25<210>66<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>66accctcaatc tcctactcca ttaaa 25<210>67<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>67gcggggttaa agcgggtcgt tcgc24<210>68<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>68aaaaatatac gaactaatac gcgccacg28<210>69<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>69gggtggggtt aaagtgggtt gtttgt 26<210>70<211>30<212>DNA<213>人工序列<220>
<223>扩增引物
<400>70ttaaaaatat acaaactaat acacaccaca 30<210>71<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>71gtagttgttg ttgttgttgt tgttgttt28<210>72<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>72aacatcttac cctctaaaca aatttatac 29<210>73<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>73gtttcgtttt tataatttgc gacgtggtc 29<210>74<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>74ctcaaaacgc caaacccgaa ccgcg 25<210>75<211>32<212>DNA<213>人工序列<220>
<223>扩增引物
<400>75gtgatgttag ttttgttttt ataatttgtg at 32<210>76<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>76tcccctcaaa acaccaaacc caaacca 27<210>77<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>77gaatttattg gtgtgtttag tagtygg 27<210>78<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>78cccraaccac aaaatcrcct atcaac26<210>79<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>79gggagggcgt tcggtttgta cgttc 25<210>80<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>80
cataaacgat cgcccaacga cgccg25<210>81<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>81agtgggaggg tgtttggttt gtatgttt 28<210>82<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>82caaatcataa acaatcaccc aacaacacca 30<210>83<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>83aggaggaagt tttaggagtt tttg 24<210>84<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>84ctaactcacc acaaaataat aacc 24<210>85<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>85tcgtggttgg cgttcggcgc gtga 24
<210>86<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>86accgccgcgc aactcgacta ccga24<210>87<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>87ttgtggttgg tgtttggtgt gtga24<210>88<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>88ataccaccac acaactcaac tacc24<210>89<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>89gtgttttata aatgtgaata aatagaattt 30<210>90<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>90caatacactc taaaataata acaaaacc28
<210>91<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>91ttttagggtt gtcgggagag tcgcgg 26<210>92<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>92caaccgaacg aaaaaaaaac gaccccg27<210>93<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>93gtggttttag ggttgttggg agagttgt 28<210>94<211>31<212>DNA<213>人工序列<220>
<223>扩增引物<400>94aaaacaacca aacaaaaaaa aaacaacccc a 31<210>95<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>95ggtattagaa aattttggtt tttaggggg 29
<210>96<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>96acccacccac ctactacact aaccta 26<210>97<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>97acgggaagta gttatcggga gttcgc 26<210>98<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>98gacgaaacct aaattcccac gcccg25<210>99<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>99tggatgggaa gtagttattg ggagtttgt29<210>100<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>100ctcaacaaaa cctaaattcc cacaccca 28<210>101
<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>101gttatttgtt tttgagatyg ttgttagag 29<210>102<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>102ctaacaacta ccataacccc accttc 26<210>103<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>103agtggagaaa ggagttagyg gtgggta27<210>104<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>104cctacctaac atacacrccc tcatccc27<210>105<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>105ggtttagtta taggtttggt tygtttagg 29<210>106<211>27
<212>DNA<213>人工序列<220>
<223>扩增引物<400>106ctcacccaac aacaacaact tcacctc27<210>107<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>107gggttatatt ygtttttttt tggtggttta 30<210>108<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>108cctcccttcc taccacaaaa accctc 26<210>109<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>109gtttttagag gaaagtttat ttttgtaggg 30<210>110<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>110atccccaatc cccaaccctc cttccc 26<210>111<211>25<212>DNA
<213>人工序列<220>
<223>扩增引物<400>111gggtcggagt ttttcggagt tgcgc 25<210>112<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>112ccgctctctt cgctaaatac gactcg 26<210>113<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>113ttttgggttg gagttttttg gagttgtgt 29<210>114<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>114aacccactct cttcactaaa tacaactca 29<210>115<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>115aaaataagtt cgggtttcgg cggtac 26<210>116<211>27<212>DNA<213>人工序列
<220>
<223>扩增引物<400>116caataaacga acaaaacgcg aactacg 27<210>117<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>117gtaaaataag tttgggtttt ggtggtat28<210>118<211>29<212>DNA<213>人工序列<220>
<223>扩增引物<400>118cacaataaac aaacaaaaca caaactaca 29<210>119<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>119ttagtatttg gtcgcgaggt cgttc 25<210>120<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>120ccctaaatac cgccgctcgc ccg 23<210>121<211>28<212>DNA<213>人工序列
<220>
<223>扩增引物<400>121ttgttagtat ttggttgtga ggttgttt28<210>122<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>122cccctaaata ccaccactca ccca24<210>123<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>123gatgatgaca acgacataat ggaaacg 27<210>124<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>124gagtgtgctt ggggaacggg agct24<210>125<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>125agttgttaag ggagcgtttc gagtttac28<210>126<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>126ctcaaccttc gaaaacgaac ccgccg 26<210>127<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>127gtagttgtta agggagtgtt ttgagtttat 30<210>128<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>128ctctcaacct tcaaaaacaa acccacca28<210>129<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>129gggtgatgtt atcgtttttg tatcgac 27<210>130<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>130cctcccctaa cgtaaactcg aaacg 25<210>131<211>29<212>DNA<213>人工序列<220>
<223>扩增引物
<400>131gggggtgatg ttattgtttt tgtattgat 29<210>132<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>132cacctcccct aacataaact caaaaca 27<210>133<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>133ggttgcgttt cgagttgcgg agttc 25<210>134<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>134tccaatcgac aacaaaacga aacgcg26<210>135<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>135gttggttgtg ttttgagttg tggagttt 28<210>136<211>29<212>DNA<213>人工序列<220>
<223>扩增引物
<400>136aactccaatc aacaacaaaa caaaacaca 29<210>137<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>137ggtacaggaa aggcctcttg atgttg 26<210>138<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>138ggatctttta ctaagctgat ctctcc 26<210>139<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>139aagatttggc gttgggcggg acgttc 26<210>140<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>140actccaaccc gaacctcgcc gtacg 25<210>141<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>141
gtaagatttg gtgttgggtg ggatgttt 28<210>142<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>142aaaactccaa cccaaacctc accataca 28<210>143<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>143cgttttggag ttggggttag gcggtc26<210>144<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>144aaataaataa caacctacgc tacgaacg 28<210>145<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>145tttgttttgg agttggggtt aggtggtt 28<210>146<211>30<212>DNA<213>人工序列<220>
<223>扩增引物<400>146ccaaataaat aacaacct acactacaaaca30
<210>147<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>147tgcgcccagt gtgagatgga gcac24<210>148<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>148cccatccctt aggccttgtg ccagt 25<210>149<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>149taaacagaca tttatttcca gac 23<210>150<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>150gaaagaaata gtcaatatgc ttg 23<210>151<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>151agccttcggc tgactggctg g 21
<210>152<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>152ctgcccatca tcatgacctg ga 22<210>153<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>153cagctggagc ctgggggact g 21<210>154<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>154ccttgcgctg ggagagggtg ag 22<210>155<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>155tttctctgct tgtcaaatga gagt24<210>156<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>156cttaacaaag gaggacctga gag 23
<210>157<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>157ttgtagttat cttagaagat agcatgg 27<210>158<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>158acgggaatta ctattaacat aagcg25<210>159<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>159ctgctgccgc ccctgggcct cac 23<210>160<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>160gtagtgtatt agagcagagc agaatg 26<210>161<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>161cccaggagaa tgcctacctt tg 22<210>162
<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>162aaactgccaa acagcccaga agg 23<210>163<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>163ctgtggttga ttgctagtgg t 21<210>164<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>164aagtgactga accttgcagt tct 23<210>165<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>165ccctcctcgg cagtgtgtgg ggtc24<210>166<211>26<212>DNA<213>人工序列<220>
<223>扩增引物<400>166gggatgtcag agctggacca gtcgaa 26<210>167<211>24
<212>DNA<213>人工序列<220>
<223>扩增引物<400>167attactgtgc ttataagtga cacg 24<210>168<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>168gaagttattg ccaaaggaac tgt23<210>169<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>169gttcgaggag ggatggtgtt tgagc 25<210>170<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>170ataccacaca aattcaatac ggattct27<210>171<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>171aatgacactc tgaaatccag tc 22<210>172<211>21<212>DNA
<213>人工序列<220>
<223>扩增引物<400>172ctattgtgtg ataggctctg t21<210>173<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>173tgagtggtag caaggtttac a21<210>174<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>174atttcagcct cttccgaatc t21<210>175<211>28<212>DNA<213>人工序列<220>
<223>扩增引物<400>175ttaaaaatcg aataatactg aaataacc 28<210>176<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>176ggggtgccca gcctaacaat aa 22<210>177<211>22<212>DNA<213>人工序列
<220>
<223>扩增引物<400>177tctctgaaga aggaggtcat gt22<210>178<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>178ggagggaggt gcattgggta at22<210>179<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>179aaagcagttg gtggattcaa ag22<210>180<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>180ttattagttg gctgggcatg a 21<210>181<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>181ttctttacac atcagtcaca ag22<210>182<211>21<212>DNA<213>人工序列
<220>
<223>扩增引物<400>182gggtgttgag ttaccagatg a 21<210>183<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>183aaagaaacac atctcagtga aggg24<210>184<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>184caggaggctt gtagtttaga agg 23<210>185<211>20<212>DNA<213>人工序列<220>
<223>扩增引物<400>185agttagccac tgctggtgtt 20<210>186<211>20<212>DNA<213>人工序列<220>
<223>扩增引物<400>186ccctccctcc agcacacaaa 20<210>187<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>187ccagagacat ccgttaagga ga 22<210>188<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>188ttgggtctag gagcgtttgc t 21<210>189<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>189tcttgagcat tgtggtggcc tta23<210>190<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>190ttcgggcttc ctggagggaa ca 22<210>191<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>191gcaacatgaa gattctgaag ggt23<210>192<211>23<212>DNA<213>人工序列<220>
<223>扩增引物
<400>192acagcaaact gcatttacca tcg23<210>193<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>193ttggaaagat cgtcctggtg c 21<210>194<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>194aacttctggc cctcggagga a 21<210>195<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>195aacagcaagc atgacatatt ca 22<210>196<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>196gcagagagaa tgtgaggaac ctt 23<210>197<211>21<212>DNA<213>人工序列<220>
<223>扩增引物
<400>197atgcctcaga gggtagcctt g21<210>198<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>198attacagaca tcctaagacc cg 22<210>199<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>199tcatcaaaca tagctcagtc ct 22<210>200<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>200ccaagggaaa gagaaacgct g21<210>201<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>201tttctctgga ggacaagcag ttag 24<210>202<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>202
tttctctgca tctcttctac ctcc24<210>203<211>18<212>DNA<213>人工序列<220>
<223>扩增引物<400>203acctggagct gttcctgc 18<210>204<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>204gtaacagctc ttcaagctcc t 21<210>205<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>205ggtggttatg gaggatatga c 21<210>206<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>206ccagtaagac actactacat c 21<210>207<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>207atttggagat tcacaggaac agc 23
<210>208<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>208ccactcttag ctggtaaatg aat 23<210>209<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>209aaccatcttg ctttccttaa attc 24<210>210<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>210cccacccttc ttcacccgct tt22<210>211<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>211tacaatacca ggatcctcgc acat 24<210>212<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>212ttggaactgc gagtggctta g 21
<210>213<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>213tattattgtt gcatgacatt tgc 23<210>214<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>214aaagtgcacc cacatggatg tta 23<210>215<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>215gctttattgg gattgcaagc gt 22<210>216<211>19<212>DNA<213>人工序列<220>
<223>扩增引物<400>216gggctgcctg tctgacctc 19<210>217<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>217gggcggacgc atgatagctg ta 22
<210>218<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>218gtcttgttct ttgacagaag ctc23<210>219<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>219ttcacatagc acacaagtga c 21<210>220<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>220gacctctact tccttggagc tt 22<210>221<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>221cacaagcacg tgcactttat tgaa 24<210>222<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>222tagtagccgc ccatagcctg c 21<210>223
<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>223aatgtttctc attaagtcag ggt23<210>224<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>224ccagccaatg gcgactatag aga23<210>225<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>225cccacgttta tttacatatg a 21<210>226<211>25<212>DNA<213>人工序列<220>
<223>扩增引物<400>226cttttgtgta tatatagata cttgc 25<210>227<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>227gcagagtttc actgtatcaa c 21<210>228<211>21
<212>DNA<213>人工序列<220>
<223>扩增引物<400>228tgaagattgt agggcttaga t 21<210>229<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>229tatttgtggc tccttcccac tt 22<210>230<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>230cctcctgccc tcatgcctgt aa 22<210>231<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>231cgcgttgcat cccttggatt gta 23<210>232<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>232ccacggttgg ttaatagtcc ctt 23<210>233<211>23<212>DNA
<213>人工序列<220>
<223>扩增引物<400>233aagtacacaa gtggtaagta tag23<210>234<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>234actctttgat tacaagcact gg 22<210>235<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>235atgcacacat gtttaattgt ag 22<210>236<211>20<212>DNA<213>人工序列<220>
<223>扩增引物<400>236cgtaggtata cacgtgccat20<210>237<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>237tgccaagtgc aatgttccag aaa23<210>238<211>22<212>DNA<213>人工序列
<220>
<223>扩增引物<400>238tttcgggaga acccaaccta ag 22<210>239<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>239tgcttaggat atagcatgaa a21<210>240<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>240tatcggcata gatatatgag t21<210>241<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>241aaatgctttg gaatccctga ga 22<210>242<211>19<212>DNA<213>人工序列<220>
<223>扩增引物<400>242tgtgcttaag tggcaggat 19<210>243<211>24<212>DNA<213>人工序列
<220>
<223>扩增引物<400>243acaagtttaa gaagaacaaa gctg24<210>244<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>244tatggacatc cagttgttcc agca24<210>245<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>245aggagggaag ggtaacaact cat 23<210>246<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>246agaatgtgga tgacccctcg gaag24<210>247<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>247gtcagtctgc tcactccacc gt 22<210>248<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>248cggatgtgga aacctttcag ga 22<210>249<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>249tatcacaagc atttattgag tacc 24<210>250<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>250tattctagat atttactcct tcg23<210>251<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>251acaaaggatg taccatgtcc aa 22<210>252<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>252cagatcaagg tgatgcacaa g 21<210>253<211>23<212>DNA<213>人工序列<220>
<223>扩增引物
<400>253catacagcaa agtcaactac tgc23<210>254<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>254acgcagttca aatttcatgg ttt23<210>255<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>255tttggagaac ctggatggcc t 21<210>256<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>256atctgcagca cccaggatga a 21<210>257<211>18<212>DNA<213>人工序列<220>
<223>扩增引物<400>257agagcccacg tgggaaga 18<210>258<211>22<212>DNA<213>人工序列<220>
<223>扩增引物
<400>258caggtatcat tcacagtgta at 22<210>259<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>259tgccatgaga tatcttgatt gt 22<210>260<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>260gggccaatgg agaaatgcag c21<210>261<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>261tatacagtct tcccacttca ct 22<210>262<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>262ttctgcctga tcatcccatt gta 23<210>263<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>263
aagctacgag aatgagcagg tg22<210>264<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>264gtcttgttct gtgatgaggg g 21<210>265<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>265gaagatcagt taatgtcact cc22<210>266<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>266tggtagaaga caagatgatt tg22<210>267<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>267tgaatgacaa agacataaca tcc 23<210>268<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>268ctcaagttat gtgtccctat att 23
<210>269<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>269ttccgctgca ttgctggcat gt 22<210>270<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>270gccttggaag tgcctaattg ct 22<210>271<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>271agtcccagac ctcaaggatc t21<210>272<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>272gggtaaatca gtcagacagg c21<210>273<211>20<212>DNA<213>人工序列<220>
<223>扩增引物<400>273cagctcagtc acaggagaga 20
<210>274<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>274tacagttcgc atcctcttaa c21<210>275<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>275ctcacaggct tcaacaaggc a21<210>276<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>276gggaggtgcc tttattgccc a21<210>277<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>277tagcatataa ttggaaaggg ttc 23<210>278<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>278aagtgttaca gagccatgga caa 23
<210>279<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>279ctttgacaca ttacagatct ggg 23<210>280<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>280catccttgca ttccttgctt gtt 23<210>281<211>27<212>DNA<213>人工序列<220>
<223>扩增引物<400>281ttaaccaacg taaccatatt gaataaa 27<210>282<211>24<212>DNA<213>人工序列<220>
<223>扩增引物<400>282aggatgataa actggtggtg gaat 24<210>283<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>283gcacattaaa cagcatacat acc 23<210>284
<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>284ccctgttcct tgtggaaacc tat 23<210>285<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>285ttgcccataa ctcactgtgg cct 23<210>286<211>21<212>DNA<213>人工序列<220>
<223>扩增引物<400>286aaatctggct ggaacgggac a 21<210>287<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>287tgtctttagg agacgtgaga aag 23<210>288<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>288cttccacgga ttactgacag ag 22<210>289<211>23
<212>DNA<213>人工序列<220>
<223>扩增引物<400>289aacttagcac aattaactgc agc 23<210>290<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>290tgcctgaaat cccactactt gg 22<210>291<211>23<212>DNA<213>人工序列<220>
<223>扩增引物<400>291catttatctt gatcaaaccc acc 23<210>292<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>292atgctttctg aagagtgagc cc 22<210>293<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>293cgtggtacct aaacatggac ac 22<210>294<211>22<212>DNA
<213>人工序列<220>
<223>扩增引物<400>294tctcattgta ggtctcctaa ag 22<210>295<211>22<212>DNA<213>人工序列<220>
<223>扩增引物<400>295tttgaagcac taagatcaat ac 22<210>296<211>18<212>DNA<213>人工序列<220>
<223>扩增引物<400>296ttgcgaacgc gtctgtga18
权利要求
1.鉴定与至少一种癌症相关的至少一种甲基化沉默基因的方法,包括a)在适合于核酸扣除产物与阵列上的互补核苷酸序列选择性杂交的条件下,将代表基因组的核苷酸序列阵列与核酸扣除产物接触,所述核酸扣除产物包含对应于在用脱甲基试剂接触过的癌症细胞中表达的,但不在所述癌症细胞的对应正常细胞中表达的RNA的核酸分子;和b)检测核酸扣除产物与所述阵列的一部分核苷酸序列的选择性杂交,其中对应于在与所述癌症细胞对应的正常细胞中表达的RNA的核酸分子在适合于选择性杂交的条件下不与所述的那部分核苷酸序列杂交,从而与所述阵列的那部分核苷酸序列选择性杂交的核酸扣除产物代表了所述癌症细胞的甲基化沉默基因,由此鉴定出与至少一种癌症相关的至少一种甲基化沉默基因。
2.权利要求1中的方法,其中所述的对应于RNA的核酸分子包括cDNA。
3.权利要求1中的方法,其中所述的脱甲基试剂包括5-氮杂-2′-脱氧胞苷。
4.权利要求1中的方法,其中所述的至少一种甲基化沉默基因与一种类型的癌症有关。
5.权利要求1中的方法,其中所述的至少一种甲基化沉默基因与至少两种类型的癌症有关。
6.权利要求1中的方法,其中所述的至少一种甲基化沉默基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,或其组合。
7.权利要求1中的方法,其中所述的至少一种甲基化沉默基因包括HOXA1,GR03,DLX7,或其组合。
8.权利要求1中的方法,其中所述的至少一种癌症是癌或肉瘤。
9.权利要求6中的方法,其中所述的至少一种癌症是结直肠癌,胃癌,或结直肠癌和胃癌。
10.权利要求1中的方法,其中所述的至少一种甲基化沉默基因包括SFRP1,SFRP2,SFRP4,SFRP5,或其组合。
11.权利要求10中的方法,其中所述的至少一种癌症是结直肠癌,胃癌或结直肠癌和胃癌。
12.鉴定与至少一种癌症相关的至少一种表观遗传学沉默基因的方法,包括a)在适合于核酸扣除产物与阵列上互补的核苷酸序列选择性杂交的条件下,将代表基因组的核苷酸序列阵列与核酸扣除产物接触,所述核酸扣除产物包含对应于在用至少一种可以重新激活表观遗传学沉默基因的表达的试剂接触过的癌细胞中表达的,但不在所述癌症细胞的对应正常细胞中表达的RNA的核酸分子;和b)检测核酸扣除产物与所述阵列的一部分核苷酸序列的选择性杂交,其中对应于在与所述癌症细胞对应的正常细胞中表达的RNA的核酸分子在适合于选择性杂交的条件下不与所述的那部分核苷酸序列杂交,从而与所述阵列的那部分核苷酸序列选择性杂交的核酸扣除产物代表了所述癌症细胞的表观遗传学沉默基因,由此鉴定出与至少一种癌症相关的至少一种表观遗传学沉默基因。
13.权利要求12中的方法,其中所述的可重新激活表观遗传学沉默基因的表达的试剂包括甲基转移酶抑制剂,组蛋白脱乙酰酶抑制剂,或其组合。
14.权利要求13中的方法,其中所述的甲基转移酶抑制剂是5-氮杂-2′-脱氧胞苷。
15.权利要求13中的方法,其中所述的组蛋白脱乙酰酶抑制剂是曲古抑菌素A。
16.权利要求12中的方法,其中所述的核酸扣除产物包括与在癌症细胞中表达的RNA对应的核酸分子,所述癌症细胞已与5-氮杂-2′-脱氧胞苷,曲古柳菌素A,或其组合接触过。
17.权利要求12中的方法,其中所述的至少一种表观遗传学沉默基因包括在表1中所示的核酸分子,或其组合。
18.权利要求12中的方法,其中所述的至少一种表观遗传学沉默基因包括甲基化沉默基因。
19.权利要求18中的方法,其中所述的至少一种甲基化沉默基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,或其组合。
20.权利要求16中的方法,其中所述的至少一种表观遗传学沉默基因包括POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPP1R21A,FPGT,TRIM32,或其组合。
21.权利要求12中的方法,其中所述的至少一种癌症是癌或肉瘤。
22.权利要求12中的方法,其中所述的至少一种癌症是结直肠癌,胃癌,或结直肠癌和胃癌。
23.一种鉴定显示出生长不受调控或具有这种倾向的细胞的方法,包括在受测细胞中检测至少一种基因的表观遗传学沉默,所述的至少一种基因包括在表1中所示的核酸分子或其组合,从而确定受测细胞为显示出生长不受调控或具有这种倾向的细胞。
24.权利要求23中的方法,其中所述的至少一种基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPP1R21A,FPGT,TRIM32,或其组合。
25.权利要求23中的方法,其中所述的显示出生长不受调控或具有这种倾向的细胞是赘生性细胞。
26.权利要求25中的方法,其中所述的赘生性细胞是恶化前细胞。
27.权利要求25中的方法,其中所述的赘生性细胞是癌症细胞。
28.权利要求27中的方法,其中所述的癌症细胞是癌或肉瘤。
29.权利要求27中的方法,其中所述的癌症细胞是结直肠癌细胞或胃癌细胞。
30.权利要求23中的方法,其中所述的表观遗传学沉默包括甲基化沉默,所述的方法包括检测甲基化沉默。
31.权利要求30中的方法,其中检测甲基化沉默包括将包含着含有所述基因的核酸分子的5′端调控区域的区域与甲基化敏感型限制性内切酶接触,所述的内切酶在含有CpG二核苷酸的甲基化胞嘧啶残基的5′调控区内的识别位点上剪切,从而,所述核酸分子的切割就可以作为指示受测细胞中所述基因甲基化沉默的标志。
32.权利要求31中的方法,其中所述的甲基化敏感的限制性核酸内切酶是AccIII,BanI,BstNI,MspI,或XmaI。
33.权利要求30中的方法,其中检测甲基化沉默包括将包含着含有所述基因的核酸分子的5′端调控区域的区域与甲基化敏感型限制性内切酶接触,所述的内切酶在含有CpG二核苷酸的甲基化胞嘧啶残基的5′调控区内的识别位点处剪切,假如所述CpG二核苷酸的胞嘧啶残基被去甲基化的话,这样,所述核酸分子没有发生剪切便可以作为指示受测细胞中所述基因甲基化沉默的标志。
34.权利要求33中的方法,其中所述的甲基化敏感的限制性核酸内切酶是AccII,AvaI,BssHII,BstUI,HpaII,或NotI。
35.权利要求30中的方法,其中检测甲基化沉默包括将含有受测细胞的所述基因的核酸分子的5′端调控区域与化学试剂接触,所述化学试剂会选择性地修饰未甲基化的或者甲基化的胞嘧啶残基,并检测由于所述接触而产生的产物,其中所述产物可作为指示所述基因上CpG二核苷酸中胞嘧啶残基甲基化的标志,由此检测受测细胞中所述基因的甲基化沉默。
36.权利要求35中的方法,其中所述的产物的检测包括电泳法,色谱法,质谱法,或其组合。
37.权利要求35中的方法,其中所述化学试剂是肼,由此可以产生经肼处理的基因5′端调控区域,所述方法进一步包括将被肼处理的5′端调控区域与能够剪切经肼修饰的胞嘧啶残基的试剂接触,获得包含着含有所述基因的核酸分子的片断的产物;按照分子量大小分离所述片断;检测在所述基因的5′端调控区域中已知含有胞嘧啶残基的位置处的缺口,其中所述缺口可以作为指示所述基因中CpG二核苷酸的胞嘧啶残基甲基化的标志,由此检测受测细胞中所述基因的甲基化沉默。
38.权利要求37中的方法,其中所述的可剪切经肼修饰的胞嘧啶残基的试剂是哌啶。
39.权利要求35中的方法,其中所述化学试剂包括亚硫酸氢根离子,由此在所述基因5’调控区中未甲基化的胞嘧啶残基可被转变为亚硫酸氢盐修饰的胞嘧啶残基,所述方法进一步包括将亚硫酸氢根离子处理的基因暴露于碱性条件中,从而亚硫酸氢盐修饰的胞嘧啶残基被转变为尿嘧啶残基,和检测在受测细胞的亚硫酸氢根离子处理的基因的5’调控区中尿嘧啶残基的数量或分布,其中与暴露于碱性条件后相应的亚硫酸氢根离子处理的未甲基化基因中尿嘧啶残基的数量或分布相比,受测细胞的基因5’调控区中尿嘧啶残基数量或分布的减少可以作为指示所述基因5’调控区中CpG二核苷酸中胞嘧啶残基甲基化的标志,由此检测受测细胞所述基因的甲基化沉默。
40.权利要求39中的方法,其中检测尿嘧啶残基的数量或分布包括测定在暴露于碱性条件后亚硫酸氢盐修饰的基因5’调控区的核苷酸序列。
41.权利要求39中的方法,其中检测尿嘧啶残基的数量或分布包括将暴露于碱性条件后的亚硫酸氢根离子处理的基因序列与寡聚核苷酸接触,所述的寡聚核苷酸可选择性地与含有尿嘧啶残基的基因5’调控区杂交,和检测所述寡聚核苷酸的选择性杂交。
42.权利要求41中的方法,其中所述的寡聚核苷酸具有在SEQ IDNO23,24,111,112,115,116,119,120,125,126,129,130,133,134,139,140,143或144中所示的核苷酸序列。
43.权利要求41中的方法,其中所述的寡聚核苷酸包括可被检测的标记,其中检测选择性杂交包括检测所述的标记。
44.权利要求43中的方法,其中所述的可被检测的标记是放射性同位素,顺磁性同位素,发光化合物,化学发光化合物,荧光化合物,金属螯合物,酶,酶底物,受体,或受体的配体。
45.权利要求41中的方法,其中所述的寡聚核苷酸是引物延伸反应的底物,其中检测选择性杂交包括检测所述引物延伸反应的产物。
46.权利要求45中的方法,其中所述的寡聚核苷酸具有在SEQ IDNO23,24,111,112,115,116,119,120,125,126,129,130,133,134,139,140,143或144中所示的核苷酸序列。
47.权利要求39中的方法,其中检测尿嘧啶残基的数量或分布包括将所述基因的5’调控区与含有正向和反向引物的扩增引物对在适合扩增的条件下接触,其中所述引物对的至少一条引物包括可选择性地与含尿嘧啶残基的5’调控区的核苷酸序列杂交的寡聚核苷酸,因而扩增产物的产生可以作为指示在所述基因5’调控区中CpG二核苷酸中胞嘧啶残基甲基化的标志,由此检测受测细胞中所述基因的甲基化沉默。
48.权利要求47中的方法,其中所述的扩增引物对包括在SEQ IDNO23和24,SEQ ID NOS111和112,SEQ ID NOS115和116,SEQ IDNOS119和120,SEQ ID NOS125和126,SEQ ID NOS129和130,SEQID NOS133和134,SEQ ID NOS139和140,或SEQ ID NOS143和144中所示的引物对。
49.权利要求39中的方法,其中检测尿嘧啶残基的数量或分布包括将所述基因的5’调控区与含有正向和反向引物的扩增引物对在适合扩增的条件下接触,其中所述引物对的两条引物可选择性地与含有胞嘧啶残基的5’调控区的核苷酸序列杂交,但不与含尿嘧啶残基的5’调控区的对应核苷酸序列杂交,和因而扩增产物的产生可作为指示在所述基因5’调控区中CpG二核苷酸中缺少胞嘧啶残基甲基化的标志,由此检测受测细胞中所述基因的甲基化沉默。
50.权利要求49中的方法,其中所述的扩增引物对包括在SEQ IDNOS25和26,SEQ ID NOS113和114,SEQ ID NOS117和118,SEQ IDNOS121和122,SEQ ID NOS127和128,SEQ ID NOS131和132,SEQID NOS135和136,SEQ ID NOS141和142或SEQ ID NOS145和146中所示的引物对。
51.权利要求39中的方法,其中检测尿嘧啶残基的数量或分布包括将所述基因的5’调控区与第一扩增引物对和第二扩增引物对在适合扩增的条件下接触,其中所述第一扩增引物对含有一条正向引物和一条反向引物,其中所述第一引物对的至少一条引物包括可与含尿嘧啶残基的基因5’调控区的核苷酸序列选择性杂交的寡聚核苷酸,其中所述第二扩增引物对含有一条正向引物和一条反向引物,其中所述第二引物对的两条引物可与含胞嘧啶残基的基因5’调控区的核苷酸序列选择性杂交,但不与含尿嘧啶残基的基因5’调控区的对应核苷酸序列杂交,和其中如果由所述第一引物对可获得扩增产物的话,其具有第一长度,其中如果由所述第二引物对可获得扩增产物的话,其具有与第一长度不同的第二长度,因而所述扩增产物的长度可作为指示尿嘧啶残基的标志,并因此可作为指示所述基因5’调控区中CpG二核苷酸中胞嘧啶残基甲基化的标志,由此检测受测细胞中所述基因的甲基化沉默。
52.权利要求30中的方法,其中检测甲基化沉默包括a)将受测细胞与脱甲基试剂接触,和b)检测与不接触脱甲基试剂的受测细胞中RNA的表达水平相比,由所述基因编码的RNA的表达增加。
53.权利要求52中的方法,其中所述的脱甲基试剂包括甲基转移酶抑制剂。
54.权利要求53中的方法,其中所述的甲基转移酶抑制剂包括5-氮杂-2′-脱氧胞苷。
55.权利要求23中的方法,该方法可以高通量的形式实施,其中所述的受测细胞或受测细胞的提取物包括多份受测细胞或其提取物中的一份,或其组合。
56.权利要求55中的方法,其中所述的多份受测细胞或其提取物中的各份是相同的或不同的,或其组合。
57.权利要求55中的方法,进一步包括检测在相应的表现出受控的生长的细胞,或相应细胞的提取物中所述基因5’调控区的CpG岛中CpG二核苷酸的胞嘧啶残基甲基化,如果存在的话。
58.权利要求55的方法,其中所述受测细胞或受测细胞的提取物在阵列中进行排列。
59.权利要求58中的方法,其中所述的阵列是可寻址的阵列。
60.权利要求55中的方法,其中所述受测细胞或受测细胞的提取物位于微芯片,玻璃板或小珠上。
61.权利要求23中的方法,其中所述受测细胞包括从受试者中获得的样本。
62.权利要求61中的方法,其中所述的受试者是人类受试者。
63.权利要求61中的方法,其中所述的样本包括器官样本,组织样本或细胞样本。
64.权利要求63中的方法,其中所述的样本包括胃肠道样本,肝样本,皮肤样本,淋巴结样本,肾样本,肺样本,肌肉样本,骨样本,或脑样本。
65.权利要求64中的方法,其中所述的胃肠道样本包括胃样本,小肠样本,结肠样本,或直肠样本。
66.权利要求61中的方法,其中所述的样本包括生物流体。
67.权利要求66中的方法,其中所述的生物流体包括骨髓,血清,淋巴,脑脊液,唾液,痰液,粪便,尿液或精液。
68.一种减缓或抑制细胞的无调控生长的方法,所述细胞中至少一种与癌症有关的基因的转录表现出表观遗传学上的沉默,所述方法包括恢复由所述的表观遗传学沉默基因编码的多肽在所述细胞中的表达,由此减缓或抑制所述细胞的无调控生长。
69.权利要求68中的方法,其中恢复多肽的表达包括将细胞与一种脱甲基试剂,一种组蛋白脱乙酰酶抑制剂,或其组合接触。
70.权利要求69中的方法,其中所述的脱甲基试剂包括甲基转移酶抑制剂。
71.权利要求68中的方法,其中所述的表观遗传学沉默基因包括甲基化沉默基因,所述的方法包括将细胞与至少一种脱甲基试剂接触。
72.权利要求71中的方法,其中所述的细胞与脱甲基试剂的接触是在培养中进行。
73.权利要求71中的方法,其中所述的细胞与脱甲基试剂的接触包括将所述试剂施予含有所述细胞的受试者。
74.权利要求71中的方法,其中所述的脱甲基试剂是5-氮杂-2′-脱氧胞苷。
75.权利要求68中的方法,其中恢复多肽的表达包括将编码所述多肽的多聚核苷酸导入进所述细胞中,而所述多肽由所述多聚核苷酸表达出来。
76.权利要求75中的方法,其中所述的多聚核苷酸包含在载体中。
77.权利要求76中的方法,其中所述的载体是病毒载体。
78.权利要求75中的方法,其中将多聚核苷酸导入进细胞包括将所述细胞与所述多聚核苷酸离体接触。
79.权利要求75中的方法,其中将多聚核苷酸导入进细胞包括将所述细胞与所述多聚核苷酸在体内接触。
80.权利要求75中的方法,其中所述的表观遗传学沉默基因包括在表1中所示的核酸分子。
81.权利要求68中的方法,其中所述的表观遗传学沉默基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,SFRP2,SFRP4,SFRP5,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,或其组合。
82.权利要求68中的方法,其中所述的表观遗传学沉默基因包括POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPP1R21A,FPGT,TRIM32,或其组合。
83.一种治疗癌症患者的方法,其中所述患者中的癌症细胞显示至少一种基因的表达在表观遗传学上被沉默化,所述方法包括恢复所述的至少一种表观遗传学沉默基因在患者的癌症细胞中的表达,由此治疗癌症患者。
84.权利要求83中的方法,其中所述的至少一种表观遗传学沉默基因包括甲基化沉默基因。
85.权利要求84中的方法,包括将脱甲基试剂施予受试者,其量足以恢复所述的甲基化沉默基因在受试者癌症细胞中的表达。
86.权利要求83中的方法,包括对受试者施用至少一种多聚核苷酸,所述多聚核苷酸编码由所述的至少一种表观遗传学沉默基因编码的至少一种多肽,并且施用量足以使所述的至少一种多肽在患者的癌症细胞中表达。
87.权利要求86中的方法,其中所述的多聚核苷酸包含在载体中。
88.权利要求87中的方法,其中所述的载体是病毒载体。
89.权利要求86中的方法,其中所述的多聚核苷酸包括基质。
90.权利要求89中的方法,其中所述的基质是脂质体。
91.权利要求83中的方法,其中所述的癌症是癌或肉瘤。
92.权利要求83中的方法,其中所述的癌症是结直肠癌,胃癌,或结直肠癌和胃癌。
93.权利要求92中的方法,其中所述的至少一种表观遗传学沉默基因包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,POR1,MBNL,TRADD,PDIP,RAD23B,RPL13,GNAI2,PPP1R21A,FPGT,TRIM32,其家族成员,或其组合。
94.权利要求92中的方法,其中所述的至少一种表观遗传学沉默基因包括SFRP1,SFRP2,SFRP4,SFRP5或其组合。
95.一种为治疗癌症患者而选择治疗策略的方法,包括a)鉴定与所述癌症相关的至少一种甲基化沉默基因,该方法的实施是通过在适合于核酸扣除产物与阵列上的互补核苷酸序列选择性杂交的条件下,将代表基因组的核苷酸序列阵列与核酸扣除产物接触,所述核酸扣除产物包含对应于在用至少一种可以重新激活甲基化沉默基因的表达的试剂接触过的患者癌症细胞中表达的,但不在所述癌症细胞的对应正常细胞中表达的RNA的核酸分子;和检测核酸扣除产物与所述阵列的一部分核苷酸序列的选择性杂交,其中对应于在与所述患者癌症细胞对应的正常细胞中表达的RNA的核酸分子在适合于选择性杂交的条件下不与所述的那部分核苷酸序列杂交,从而与所述阵列的那部分核苷酸序列选择性杂交的核酸扣除产物代表了所述患者癌症细胞中甲基化沉默的基因;以及b)选择用于恢复所述的至少一种甲基化沉默基因在患者癌症细胞中的表达的试剂,由此为治疗癌症患者选择治疗策略。
96.权利要求95中的方法,其中所述的试剂包括编码所述的至少一种甲基化沉默基因的多聚核苷酸。
97.权利要求96中的方法,其中所述的多聚核苷酸包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,其家族成员,或其组合。
98.权利要求97中的方法,其中所述的试剂包括含有SFRP1,SFRP2,SFRP4,SFRP5或其组合的多聚核苷酸。
99.权利要求95中的方法,其中所述的试剂包括脱甲基试剂。
100.权利要求99中的方法,其中所述的脱甲基试剂是5-氮杂-2′-脱氧胞苷。
101.一种治疗患有结直肠癌,胃癌或同时患有结直肠癌和胃癌的受试者的方法,其中与结直肠癌或胃癌相关的细胞含有至少一种甲基化沉默基因,所述方法包括将一定量的可恢复所述的至少一种甲基化沉默基因的表达的试剂施予受试者,所述量足以恢复与结直肠癌,胃癌或结直肠癌和胃癌相关的细胞中甲基化沉默基因的表达。
102.权利要求101中的方法,其中所述的试剂包括编码所述的至少一种甲基化沉默基因的多聚核苷酸。
103.权利要求102中的方法,其中所述的多聚核苷酸包括PTGS2,CDKN2A,TIMP3,S100A10,SFRP1,CXX1,SEZZ6L,KIAA0786,TIMP2,PCDH8,FOLH1,SNRPN,HOXA1,GRO3,DLX7,其家族成员,或其组合。
104.权利要求103中的方法,其中所述的多聚核苷酸包括SFRP1,SFRP2,SFRP4,SFRP5或其组合。
105.权利要求102中的方法,其中所述的多聚核苷酸包含在载体中。
106.权利要求105中的方法,其中所述的载体是病毒载体。
107.权利要求102中的方法,其中所述的多聚核苷酸包括基质。
108.权利要求107中的方法,其中所述的基质是脂质体。
109.权利要求101中的方法,其中所述的试剂包括脱甲基试剂。
110.权利要求105中的方法,其中所述的脱甲基试剂是5-氮杂-2′-脱氧胞苷。
111.权利要求101中的方法,其中施用所述试剂包括将结直肠癌,胃癌,结直肠癌和胃癌的细胞与所述试剂离体接触,所述的方法进一步包括将离体接触的细胞注入患者体内。
112.权利要求101中的方法,其中施用所述试剂包括将所述试剂施于患者的结直肠癌,胃癌,结直肠癌和胃癌细胞所在的部位。
113.一种分离的寡聚核苷酸,包括SEQ ID NOS1至296中的任何一个。
114.多种分离的寡聚核苷酸,包括权利要求113中所述的分离的寡聚核苷酸中的至少两种。
115.一对扩增引物,包括在SEQ ID NOS1至296中所示的一条正向引物和一条反向引物,其中所述的扩增引物对可扩增表1中的核酸分子的部分序列。
116.权利要求115中的扩增引物对,其可特异地扩增所述核酸分子的甲基化的5’调控区域。
117.权利要求116中的扩增引物对,包括SEQ ID NOS23和24,SEQ ID NOS111和112,SEQ ID NOS115和116,SEQ ID NOS119和120,SEQ ID NOS125和126,SEQ ID NOS129和130,SEQ ID NOS133和134,SEQ ID NOS139和140或SEQ ID NOS143和144。
118.权利要求115中的扩增引物对,其可特异地扩增所述核酸分子的未甲基化的5’调控区域。
119.权利要求118中的扩增引物对,包括SEQ ID NOS25和26,SEQ ID NOS113和114,SEQ ID NOS117和118,SEQ ID NOS121和122,SEQ ID NOS127和128,SEQ ID NOS131和132,SEQ IDNOS135和136,SEQ ID NOS141和142或SEQ ID NOS145和146。
120.试剂盒,其含有权利要求113中的至少一种分离的寡聚核苷酸。
121.权利要求120中的试剂盒,其含有多种分离的寡聚核苷酸。
122.权利要求121中的试剂盒,其中所述的多种包括至少一个含有一正向引物和一反向引物的扩增引物对。
123.权利要求122中的试剂盒,其含有多个扩增引物对。
124.权利要求122中的试剂盒,其中所述的扩增引物对包括一个甲基化特异扩增引物对,一个未甲基化特异扩增引物对,或含有至少一个甲基化特异扩增引物对和至少一个未甲基化特异扩增引物对的组合。
125.权利要求120中的试剂盒,进一步包含可修饰甲基化胞嘧啶残基的试剂。
126.权利要求120中的试剂盒,进一步包含甲基化敏感的限制性核酸内切酶。
127.权利要求120中的试剂盒,进一步包含用于进行扩增反应的试剂。
全文摘要
提供了一种鉴定癌症细胞中的表观遗传学沉默基因例如甲基化沉默基因的方法。另外,提供了通过检测基因表达的表观遗传学沉默来鉴定癌症的方法,还提供了治疗患有这样的癌症的患者的方法,所述的癌症例如结直肠癌和/或胃癌。还提供了用于实施这些方法的试剂。
文档编号A61K48/00GK1650033SQ03810154
公开日2005年8月3日 申请日期2003年3月7日 优先权日2002年3月7日
发明者S·B·贝林, D·西德兰斯基, J·G·赫尔曼, H·铃木 申请人:约翰霍普金斯大学医学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1