Apc基因及其单核苷酸多态性的应用的制作方法

文档序号:584104阅读:287来源:国知局
专利名称:Apc基因及其单核苷酸多态性的应用的制作方法
技术领域
本发明涉及一种DNA测序技术,尤其是一种检测APC基因和其它基因的单核苷酸多态性的技术。
背景技术
目前在西方国家和中国,结直肠癌是一种常见的恶性肿瘤。腺瘤性结肠息肉病(adenomatous polyposis coli,以下简称APC)基因突变首次在家族性腺瘤息肉症 (familial adenomatous polyposis,FAP)基因座位上发现,并认为该基因与结直肠肿瘤的发生相关。APC是肿瘤抑制基因(见美国专利RE36,713)。基因组和表观遗传共同作用引起APC基因功能丧失,这在结直肠肿瘤的发生过程中发挥着非常重要的作用。APC基因有多个结构域,可以结合不同蛋白,包括0-连环素、轴蛋白、以8 、六紹作、106六 1381和微管。 美国专利5,998,600号披露了 APC肿瘤抑制蛋白与β -连环素结合对APC肿瘤的抑制效果起着非常重要的作用,APC或连环素突变可破坏上述调节机制。通过形成由轴蛋白、 GSK-3b和酪蛋白激酶组成的降解复合物,APC可调节WNT/ β -连环素信号传导通路。许多不同类型的突变可引起上述关键功能域的功能丢失。美国专利6,013,461号披露了无义突变可能与结直肠癌有关,有许多例子包括突变影响结合结构域中关键氨基酸,在无主要结构域处形成截短蛋白,干扰编码主要结构域的外显子剪切等。另外,APC在其他许多基本细胞活动中也都发挥着重要作用,包括细胞黏附和迁移、形成肌动蛋白和微管网络、纺锤体形成及染色体分离。APC突变所引起的上述细胞活动的失调提示其可能与结直肠癌的发生相关。Wood及同事已经对来自许多结直肠患者的基因转录物进行了测序并且发现APC基因在结直肠癌中是一种最常见的突变基因(L.D.Wood等,Science,2007,318,1108-1113),但他们的结果均来自于对常规PCR扩增基因的外显子序列测定。单核苷酸多态性(single-nucleotide polymorphism,以下简称 SNP)由 Steve Ligget博士首先提出,是DNA序列变异的一种表现,即在同一种族的不同个体(或同一个体的两条染色体)在基因组(或其它序列)中存在单个核苷酸-A,T,C或G的差异。举例来说,来自不同个体的两个DNA片段测定序列AAGCCTA和AAGCTTA中包含有单个不同核苷酸, 那么我们就称之为有两个等位基因C与T。所有常见的单核苷酸多态性序列几乎都只含有两个等位基因 ° 见 http //en. wikipedia. org/wiki/Single-nucleotide—polymorphism 或其他关于SNP的广泛报道.在人群中,单核苷酸多态性序列被认为是一种次等位基因率。在某一特定人群中也观察到了转座子的等位基因频率是最低的。两个等位基因频率相对于单核苷酸多态性来说是简单而且小的,但在人群中出现时则会有很多变异,因此一片地理分布或种族人群中出现的SNP等位基因极少与另一片地理分布或种族人群中的相同。随着新一代测序技术的发展,人们已经对肿瘤基因组序列测定及再测定,其中有两个主要研究方向其一是许多技术主要通检测全基因组外显子的扩增产物的突变,之后再进行序列测定,最近已完成了许多肿瘤全基因组外显子序列测定,包括乳腺癌、结直肠癌(L. D.Wood等,Science,2007,318,1108-1113)、胰腺癌(S. Jones 等,Science,2008,321,1801-1806)和恶性胶质瘤 (D. W. Parsons等,Science,2008,321,1807-1812);另一个方法是肿瘤基因全基因组序列测定。第一个被报道的例子的是由Ley等和Mardis等所做的研究,他们采用Illumina测序技术对一个原发、细胞遗传学正常的急性粒细胞白血病未分化型(AML-Ml)患者新的基因组及与其相匹配的正常皮肤基因组进行测序,检测到了基因编码序列的12种继发(体细胞)突变与基因组中保守的或调节部位的52个体细胞点突变(T.J.Ley等,Nature, 2008,456,66-72 ;and Ε. R. Mardis Ε. R.等,N. Engl. J. Med.,2009,361,1058-1066.)。之后,Siah等人以Illumina测序技术为基础,对原发肿瘤患者当时及该患者9年后转移病灶进行基因组测序后发现,在转移灶中有32个体细胞突变,而在原发肿瘤部位仅检测到了 11 个(S. P. Shah 等,Nature,2009,461,809-813 ;M. J. Clark 等,PLoS Genet.,6,2010, el000832)。

发明内容
从一个方面来说,本发明提供了一种检测机体疾病的方法,其方法包括以下步骤
(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;
(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。从另一个方面来说,本发明提供了一种临床预测疾病的方法,其方法包括以下步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。还是从另一方面来说,本发明提供了一种用来评估机体患有某种疾病风险的方法,该方法包括以下步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。在本发明的一些例子里,检测到基因表示该疾病处于抑制状态。在本发明的一些例子里,检测到的基因是APC基因。在本发明的一些例子里,该疾病与APC基因失调有关。在本发明的一些例子里,该疾病是结直肠癌(colorectal cancer)。在本发明的一些例子里,步骤(a)包括APC基因或APC基因中一种或更多单核苷酸序列多态性的检测。例如,步骤(a)可以由包括以下几步的方法来完成(i)获取APC基因全长基因组区域,( )扩增APC基因的上游序列,外显子,内含子和下游序列;(iii)在APC基因的片段矩阵上获取特定DNA片段;(iv)对获取的DNA片段快速测序;(ν)检测获取的DNA序列单核苷酸多态性。步骤(a)的备选方案可以是以下其中一种等位基因特异的寡核苷酸杂交技术、 等位基因特异PCR、固相支持微测序技术、寡核苷酸连接测定技法、5-氟尿嘧啶核酸酶测定法或限制性片段长度多态性。在本发明的一些例子里,通过检测多态性的特殊类型PCR来测定基因座位(通常称为Tagman分析法)采用AB7700仪器(Biosystems,Warrington, UK)完成。该方法需咬合成探针,使其能与含有多态性的感兴趣片段杂交,而探针由三部分组成一个荧光受体分
5子,一个荧光淬灭剂分子和一个能与化学物质结合的小沟来增强与基因组DNA链的结合。 探针可以结合到DNA双链任何一条链上。例如,当结合到编码链时,当Taq聚合酶从5’上游启动子区开始合成DNA,若聚合酶遇到探针后就可以通过5’ -3’核酸外切酶活性一个个地去除探针上的碱基。当荧光分子标记的碱基被去除后,荧光分子不再被淬灭剂淬灭,因此就会发光,该反应只有在探针特异性地与其互补的基因组序列杂交后才可发生。在连续扩增后,如有更多的探针和引物会结合到反应体系中的DNA上,荧光被增强,因此可以检测到阳性结果。如果基因组DNA不包含与探针互补的序列,就检测不到荧光信号。PCT专利申请 WO 05/008555A1有关于该方法的更详细说明。在本发明的另外一些例子里,步骤(b)包括检测该基因或基因中一个或多个单核苷酸多态性的存在或缺失。本发明还提供了一种用来评估患者疾病治疗的药物潜在有效性的方法。该方法包括以下几步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)使用该药物之前,检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失;(c)应用该治疗药物于该患者(即治疗该患者);(d)检测治疗后该基因或该基因中一个或多个单核苷酸多态性的存在或缺失;(e)比较治疗前后该基因或该基因中一个或多个单核苷酸多态性的存在或缺失的情况。在这一方法的一些例子中,该基因为APC基因。在这一方法的另外一些例子中,该疾病是指结直肠癌。本发明还从另外一个方面提供了调节APC基因活性的方法,包括在APC基因中引入一个或多个单核苷酸多态性。例如,可以在APC基因启动子区域、外显子、内含子或内含子和外显子连接处引入一个或多个单核苷酸多态性。另外,本发明的应用范围还包括上述方法中使用或产生的物质。本文所用术语“个体”是指患病的或无病的哺乳动物,可以是人或诸如狗或猫之类的动物。本文所用术语“检测”是指有合理的科学或医学的支持或证据的的诊断、推测或预见。本文所用术语“治疗物质”是指对某种疾病有治疗效果的物质。该物质可以是化学的或生物复合物或组成物或混合物。本文所用术语“疾病”是指一个机体患有肿瘤的或未患有肿瘤的病理状态。肿瘤 (可以是“恶性新生物”)是一类因为一群细胞的生长失去控制(无限分裂)、浸润(侵入或破坏邻近组织)和有时候向远处转移(通过淋巴或血压扩散到身体的其它部位)的疾病。 这些肿瘤可以是本发明中所提到的包括的结直肠癌、直肠癌、肾癌、肝癌、胰腺癌或其它类型肿瘤。本文所用术语“抑制”是指减轻疾病的严重程度或发生频率,或是消除该疾病。


图1显示了结直肠癌的APC基因每个SNP的浓度及分布。直方图中每一个柱高表示相对应的SNP序列的浓度,X轴表示APC参照位置(包括开始的IOk上游和最后的证下游)。红色区域是APC的结直肠癌,绿色区域表示非编码区。黑色标记的是保守转录因子结合位点,蓝色标记的是指miRNA靶位点。图2显示的是通过AS-PCR证实了 SNP定位在5号染色体112074356 (C > T),16 个标本中有T等位基因特异性PCR产物出现,8个标本中存在C等位基因,表明8个标本是 C/T杂合子,另外8个是T等位基因纯合子。图3是对采用长距离PCR或NimbleGen序列捕获技术检测到的结直肠癌和邻近组织的SNP序列比较。PCR-C :PCR扩增结直肠癌标本中SNP序列测定;PCR-N 正常邻近组织标本中SNP序列测定;NG-C,NimbleGen捕获结直肠癌标本中的SNP序列测定NG-N =NimbleGen 捕获正常组织标本中的SNP序列测定。图4显示了新一代基因序列测定技术检测APC基因的序列分布图,其中红线表示相关碱基的序列检测浓度,绿线表示IOObp范围内GC含量,蓝块表示通过交叉匹配分布识别的低复杂性区域。PCR_C 癌组织的长距离PCR ;PCR_N 正常邻近组织的长距离PCR ;NG_ C =NimbleGen测序捕获癌组织DNA序列;NG_N =NimbleGen测序捕获正常邻近组织的DNA序列。
具体实施例方式本发明提供了一种包括上游序列、外显子、内含子和下游序列的全基因组的靶向扩增或捕获技术,然后通过新一代测序技术在有效检测大量样本中的SNP序列。APC基因因为其在结直肠癌的发生中起着非常重要的作用而被人们详细研究并测序,我们就以该基因为例详细解说本发明。目前本发明使用了靶向扩增技术来获取包括上游序列、外显子、内含子和下游序列在内的APC基因全基因组序列,同时需要合成特殊的引物对,其数量在10 16对不等, 如12 14对引物设计较为常用。因为目前APC基因序列已知,引物的合成可以用现有的成熟技术。参考人类APC基因(Ensembl Gene IDENSG00000i;34982)包括上游IOk序列和下游5k序列区域,采用Primer 3系统来设计好的引物(S. Rozen and H. Skaletsky,Methods Mol. Biol.,2000,132,365-386)。扩增可以采用现有成熟的技术。其中一个方法就是25 μ L体系PCR,包括IX长距离PCR缓冲液,2. 5mM Mg2+,每一种dNTP500 μ Μ,每一种引物0. 4 μ Μ,1个单位长距离PCR酶混合物(QIAGEN Inc.,美国加州Valencia市)。PCR反应在以下热循环反应中进行起始变性温度93°C X3分钟;93°C条件下每 15秒为一个循环,共进行10个循环反应;退火温度(见下表1)30秒,68°C下持续11分钟; 93°C下每15秒为一循环,共观个循环反应;退火温度68°C下每30秒为一循环,共11分钟, 每个附加的循环延长20秒;在68°C最终延伸温度下反应10分钟。扩增反应后,PCR产物可以经过现有的成熟技术进行纯化。举例来说,特定片段已被切割的PCR产物经过电泳分离后,可采用QIAquick PCR纯化试剂盒和QIAquick DNA回收试剂盒QIAGEN Inc.)将其回收纯化。也可以采用目前已知技术进行DNA序列测定及扩增。比如可以采用常规的38 平铺序列捕获矩阵进行靶向APC序列测定(5号染色体,对应112091483-112214834bp),采用Roche NimbleGen的序列测定捕获技术来获取该捕获矩阵(见http://www. nimblegen. com/products/seqcap/)。另外一个方法是采用Agilent的Sureklect靶向选择系统。为检测SNP,我们收集来自30个患者的基因组DNA,其中包括结肠癌患者、其它类型肿瘤患者或患有其它疾病的患者,把所有的DNA混合并切割成片段,再将片段与序列捕获矩阵序杂交,洗去未杂交的片段,最后洗脱和扩增靶向富集DNA序列。还可以采用其他的已知技术来扩增DNA,比如超声处理扩增的DNA片段10分钟 (130w, Cole-Parmer CPX 130,美国依利诺州)使其形成平均大小为500碱基对的DNA片段, 然后采用Qiaquick PCR纯化旋转柱Oliagen ^ic)进一步纯化和浓缩。用T4DNA聚合酶, Klenow DNA聚合酶和T4TNK混合物(ftOmega,美国威斯康星州Madison市)末端修复基因组DNA片段。Klenow核酸外切酶在3’添加(ftOmega)多聚A尾结构,然后根据Illumina 说明书将合成的片段在DNA T4连接酶(!Iomega)作用下在其两端加上Illumina接头,之后再用琼脂糖凝胶电泳分离连接有接头的DNA片段。进一步处理150-200碱基对之间的合适大小片段,用QIAquick胶回收试剂盒Oliagen Inc.)从琼脂糖凝胶中切割回收DNA片段, 然后IIlumina接头经过18个循环,使切割的DNA片段扩增。按照IIlumina说明书,被纯化和鉴定DNA片段的测序工作可以在36个循环之后完成。备选方案通过新一代序列测定设备包括ABI,S0LID系统也可进行序列测定,测序循环可以是任一循环数(通常> 18个循环,当技术许可时可增至几百个循环)。采用目前已知的技术来检测SNP,如通过Illumina的Firecrest and Bustard系统可以对短序列片段进行分离和胶片成像,然后使用BWA(0. 5. 3版本),在参数默认的条件下记录到人类APC参照基因组序列中(ENSG00000134982,包括101Λ上游和51Λ下游区域)。BWA是一个包含相对短序列的有效系统,不容许有错配和空隙的长参照序列存在,因此可以找到SNP序列和缺失多态性(H. Li等,Bioinformatics,2009,25,1754-1760)。使用Samtools (0. 1. 6版本)可以检测SNP序列和缺失多态性,该系统可以迁移和改进其下游数据处理的方法,如索引、重叠、浏览器和共享调和。Samtools可以与植入到MAQ中的数据模型共同产生一个共享序列,可能的PCR重复可以根据“Samtools rmdupse”命令去除。在系统默认参数情况下原始变异可能被称为“Samtools pileup”命令,然后由系统默认下被 "Samtools.pl varFilter”命令滤过,但除了以下情况最小可读长度(_5字节)以去重复区,最大可读长度(-255字节)也去除了随机置换的重复的问题。依赖于SNP识别选择不同SNP评分,为获得高质量SNP,SNP评分大于45是可以接受的。实验中可能因为无效序列的获取,或不正确短片段定位,备选方法适用于那些存在无或低阅读覆盖区段。GC含量和可读覆盖区可能在一个100碱基对范围内,由此可以计算相关系数。在一个100个碱基对的范围内,也可计算PCR重复序列去除前后的平均有效范围,通过交叉配对系统及系统默认设置可能发现重复和低复杂区域。为预测SNP序列影响效果,去除的SNP序列需要在Ensembl变异数据库中比较。使用SNPnexus对SNP序列进行功能注释,包括基因和调控元件的影响效果。采用目前成熟的技术,如ESEf inder,或用于ESE预测的RESCUE-ESE及PAS-ESS系统,可能需要不同的工具整合所预测结果,包括在线FASTSNP工具的使用。为预测SNP是否影响转录因子的结合,我们需要使用其它的分析工具,如PR0M0, 这是一个通过使用物种专用搜索来检测转录调控元件的系统。使用新一代基因测序技术检测SNP序列,可能需要应用等位基因特异性PCR,举例来说可能需要使用四引物扩增耐突变系统。
以下用几个实例来详细说明本发明。在此引用的所有参考文献(包括网页内容) 均以引文的方式并入到本文本中。例1 方法来自对照组中6个健康正常个体和另外37个结肠癌患者的组织标本,所有的个体均为华裔。标本采集征得机构审查委员会批准,采用动物细胞组织,血液等总DNA纯化试剂盒OiIAGEN Inc.)并按照其说明书分离DNA。使用靶向扩增技术获取APC全基因组基因,包括上游序列、外显子、内含子和下游序列。例如,在扩增APC基因的基因组时,按照人类APC基因的上游IOk序列和下游证序列区域,使用 Primer 3 系统设计 14 对特异性引物(S. Rozenand H. Skaletsky,Methods Mol. Biol.,2000,132,365-386)。DNA扩增采用25 μ LPCR反应体系,混合物包括1 X长距离PCR缓冲液,2. 5mM Mg2+, 每种dNTP 500 μ M,每种引物0.4 μ M,1单位长距离PCR酶OiIAGEN he. )。PCR反应按照以下热循环参数起始变性93°C共3分钟;93°C下每15秒为一循环,共10个循环反应;退火温度68°C下每个循环持续30秒,共11分钟;93°C每15秒为一循环,经过观个循环反应; 退火温度68°C下每30秒为一循环,共11分钟,每个附加的循环延长20秒;在68°C最终延伸温度下反应10分钟。在扩增反应后,特定片段已被切割的PCR产物经过电泳分离后,可采用QIAquick PCR纯化试剂盒和QIAquick DNA回收试剂盒OiIAGEN Inc.)。采用由Roche NimbleGen设计和制造的38 平铺序列捕获矩阵捕获和扩增DNA序列的,同时进行靶向APC序列测定(5号染色体,对应112091483-112214834碱基对)来自30 位结肠癌患者的基因组DNA按1 1比例组成混合物并运送至Roche NimbleGen.简短来说,将基因组DNA标本切割成一定大小的片段,与常规MmbleGen序列捕获阵列杂交,洗去未杂交片段,洗脱和扩增探针标记的DNA (T. J. ALBERT等,Nat. Methods, 2007,4,903-905 ; M.D' Ascenzo 等,Mammalian Genome, 2009,20 (7),424-436 ;Μ· Droege 等,J. Biotechnol., 2008,136,3-10 ;and D. Τ. Okou, Nat. Methods,2007,4,907-909)。有其它许多成熟的技术用于测定核苷酸差异的方法(如SNP序列),包括以下方法但并不限于此等位基因特异寡核苷酸杂交(ASO) (R. B. Wallace等,Nucleic Acids Research,1981,9,879-894 ;S.Ikuta φ, Nucleic Acids Research,1987,15,797-811 ; D. A. Nickerson 等,Proc. Nat' 1. Acad. Sci. USA, 1990,87,8923-8927 ;M. Verlaan-de Vries 等,Gene,1986,50,313-320 ;R. K. Saiki 等,Proc. Nat' l.Acad. Sci. USA, 1989, 86, 6230-6234 ;Y. Zhang 等,Nucleic AcidsResearch,1991,19,3929-3933);等位基因特异性 PCR(C. R. Newton 等,Nucleic Acids Research, 1989,17,2503-2516 ;R. A. Gibbs 等,Nucleic AcidsResearch, 1989,17,2437-2448);固相支持微测序技术(A. C. Syvanen 等,Am. J. Human Genetics,1993,52,46-59);寡核苷酸连接测定技法(OVA) (D. Y. Wu 等,Genomics, 1989, 4,560-569 ;F. Barany, Proc. Nat' 1. Acad. Sci. USA, 1991,88,189-193 ;K. Abravaya 等, Nucleic Acids Research,1995,23,675-682) ;5-氟尿嘧啶核酸酶测定法(Holland,1991 & 1992,E. Lee 等,J. Toxicologicai Society, 1998,23,140-142 ;美国专利号4,683,202, 4,683,195,5,723,591 和 5,801,155);限制性片段长度多态性(BEEP) (H. Donis-Keller 等, Cell,1987,51,319-337)。对扩增DNA序列进行测时,超声处理10分钟(130w,Cole-Parmer CPX130)形成平均大小为500碱基对的DNA片段,并且通过Qiaquick PCR纯化旋转柱OiIAGEN Inc.)进一步纯化和浓缩。由T4DNA聚合酶、Klenow DNA和T4PNK(Promega)组成的混合物对基因组 DNA片段末端修复,Klenow核酸外切酶在3’添加(ftOmega)多聚A尾结构,根据Illumina 说明书合成的片段在DNA T4连接酶(!Iomega)作用下在其两端加上Illumina接头,之后用琼脂糖凝胶电泳分离连接接头的DNA片段。进一步处理成150-200碱基对之间的合适大小片段,用QIAquick胶回收试剂盒Oliagen Inc.)从琼脂糖凝胶中切割回收DNA片段,然后Illumina接头经过18个循环,使切割的DNA片段扩增。根据Illumina说明书,被纯化和鉴定DNA片段其测序工作在36个循环之后完成。通过Illumina的Firecrest和Bustard系统可以对短序列片段进行分离和胶片成像,然后使用BWA(0. 5. 3版本),在参数默认的条件下记录到人类APC参照基因组序列中 (ENSG00000134982,包括101Λ上游和51Λ下游区域)。BWA是一个包含相对短序列的有效系统,不容许有错配和空隙的长参照序列存在,因此可以找到SNP序列和缺失多态性(H. Li 等,Bioinformatics,2009,25,1754-1760)。使用Samtools (0. 1. 6版本)可以检测SNP序列和缺失多态性,该系统可以迁移和改进其下游数据处理的方法,如索引、重叠、浏览器和共享调和。Samtools可以与植入到 MAQ中的数据模型共同产生一个共享序列,可能的PCR重复可以根据“Samtools rmdupse" 命令去除。在系统默认参数情况下原始变异可能被称为“Samtools pileup”命令,然后由系统默认下被“Samtools. pi varFilter”命令滤过,但除了以下情况最小可读长度(_5字节)以去重复区,最大可读长度(-255字节)也去除了随机置换的重复的问题。SNP评分大于45被认为是高质量的。因为无效序列的获取,或不正确短片段定位可能导致形成无或低阅读覆盖区段。 GC含量可能影响Solexa碱基识别和PCR扩增,低复杂性区域可能会影响短片段定位。GC 含量和可读覆盖区在一个100碱基对范围内,使用R(www. r-project. org)可计算相关系数 (Spearman方法)。在一个100个碱基对的范围内,也可计算PCR重复序列去除前后的平均有效范围,通过交叉配对系统(Phrap package)及系统默认设置可能发现重复和低复杂性区域。当时当这些低复杂性区域与在人类基因组中发现的其它序列有相似性时可导致定位困难。为预测SNP序列功能影响效果,去除的SNP序列需要在Ensembl变异数据库(第55 版)中比较。使用在线SNPnexus对SNP序列进行功能注释,这是一个提供SNP序列的成套功能注释的数据库,包括基因和调控元件的影响效果(Chelala等,Bioinformatics, 2009, 25,655-661)。这些剪接的SNP序列的功能影响效果可以通过ESEfinder系统(L. Cartegni 等,Nucleic Acids Res.,2003,31,3568-3571),或用于 ESE 预测的 RESCUE-ESE (W. G. Fairbrother 等,Science,2002,297,1007-1013)及 PAS-ESS 系统(Wang 等,Cell, 2004,119,831-845)来预测。预测结果可能需要使用在线FASTSNP(H. Y. Yuan等,Nucleic AcidsRes. ,2006,34, W635-641)工具对其进行整合,因为FASTSNP可以通过中心服务器连接到不同的SNP功能预测系统。我们采用PR0M0系统中物种专用搜索(D. Farre等,Nucleic Acids Res.,2003, 31,3651-3653 ;X. Messeguer 等,Bioinformatics, 2002,18,333-334)来检测已知转录调控元件,预测SNP序列是否影响转录因子的结合。输入SNP序列任何一侧DNA序列10个核苷酸,选择人类物种转录因子并选择所有物种的转录因子位点。APC基因SNP序列组成。对于M对08个标本)结直肠癌患者和6个健康志愿者标本的异质性分析,使用等位基因特异PCR(AS-PCR) (Wangkumhang等,BMC Genomics, 2007, 8,275 ;S. Ye 等,Nucleic Acids Res.,2001,29,E88_88)确认新一代测序技术对测定的 SNP 序列。四引物扩增耐突变系统(ARMQ-PCR是由如等人改进的,可以有效测定基因表型单核苷酸多态性。简言之,可以使用在线引物设计系统(http://cedar, genetics, soton. ac.uk/ public_html/primerl. html)设计合成四引物ARMS-PCR。每一个PCR反应在10 μ 1反应体系中进行,该体系包含lXTAKARAEx Taq缓冲液,2. 5mM Mg2+,每种dNTP 250 μ Μ,每种引物 0. 2 μ M,TaKaRaEx Taq 5U/ μ L。由2%琼脂糖凝胶电泳分析结果。例2 识别APC基因中210个高度保守的SNP序列把27对结直肠癌患者和邻近组织标本用长距离PCR在14个101Λ大小的PCR反应体系中进行APC全基因组(1231Λ)扩增,包括101Λ上游序列和51Λ下游序列。长距离PCR 中使用的引物见上表1。当我们成功扩增APC基因的每个区域时,长距离PCR的覆盖范围达到100%。我们把来自27个结直肠癌标本(总共378个PCR产物)14个与上述一致的PCR 产物DNA序列混合以利于新一代测序技术测定,其它27个邻近直结肠癌的正常组织标本采用同样的处理方法。在混合前对每一个体的标本进行扩增来替代标本混合后再使用PCR扩增,以确定27对标本最后测定结果的平均代表性。这一点很重要,因为不同基因组处理时 PCR效率不同(数据已示),因此在PCR之前将标本混合可能引起标本最终代表性的偏倚。另外,NimbleGen序列捕获技术(Roche Diagnostics)被用来捕获同一个基因组区域,用于检测其是否可以替代劳动强度大的长距离PCR。NimbleGen捕获每一个标本的花费是非常昂贵的,我们打算将肿瘤标本库和正常邻近组织标本库共同使用,运送至 NimbleGen进行序列捕获。APC基因的区域中重复或低复杂性序列在NimbleGen序列捕获技术中不进行测定,不用合成针对上述区域的探针。使用BWA (0. 5. 3 版本)(H. Li 等,Bioinformatics,2009,25,1754-1760),在参数默认的条件下,短序列片段首次与人类APC基因参照基因组序列一致(ENSG00000134982),包括101Λ上游和51Λ下游区域。BWA是一个包含相对短序列的有效系统,不容许有错配和空隙的长参照序列存在,因此可以找到SNP序列和缺失多态性。除去与一个以上区域配对的重复序列,SNP序列和缺失多态性由samtools(0. 1. 6版)和MAQ (见Li等,supra)检测。 在进行分析之后,SNP序列和缺失多态性的质量评分大于45分的被认为是高质量的序列。最后我们测定了 APC基因中的210个SNP序列,其中69个是正常SNP序列(见表1和表幻,在SNP数据库中不能找到相关序列。将所有检测到的SNP序列创建成一个 bedGraph格式文件,便于上传至USCS基因组浏览器上用于分析其中的内含子。检测到7个 SNP序列在上游区域,11个SNP序列定位在外显子(表幻。其中10个是已命名的SNP序列,另外一个是未命名的SNP序列。检测到了一个新的既往没有报道过的SNP (人类基因组 HG19。Chr5 :112179745)(表2)。另外,我们还发现SNP平均地分布在APC基因上(图1)。 图1显示了结直肠癌患者APC基因SNP序列浓度和分布,直方图中每一个柱高表示相对应的SNP序列的浓度表示相关SNP序列的浓度,X轴表示APC参照位置(包括开始的IOk上游和最后的证下游)。红色区域是APC的结直肠癌,绿色区域是指非编码区。黑色标记的是保守转录因子结合位点,蓝色标记的是指miRNA靶位点。但是所观察到的这些SNP功能影响效果有待于进一步研究。表1.中国结直肠癌患者APC基因SNP序列测定总结
权利要求
1.一种检测机体疾病的技术,包括以下步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。
2.根据权利要求1所述的检测机体疾病的技术,其特征在于检测到该基因表示该疾病处于抑制状态。
3.根据权利要求2所述的检测机体疾病的技术,其特征在于待检测疾病是结直肠癌。
4.根据权利要求2所述的检测机体疾病的技术,其特征在于该基因是APC基因。
5.根据权利要求2所述的检测机体疾病的技术,其特征在于步骤(a)包括APC基因或 APC基因中一种或更多单核苷酸序列多态性的检测。
6.根据权利要求2所述的检测机体疾病的技术,其特征在于步骤(b)包括检测该基因或基因中一个或多个单核苷酸多态性的存在或缺失。
7.根据权利要求6所述的检测机体疾病的技术,其特征在于步骤(a)包括APC基因或 APC基因中一种或更多单核苷酸序列多态性的检测。
8.根据权利要求7所述的检测机体疾病的技术,其特征在于被检测的疾病是结直肠癌。
9.根据权利要求1所述的检测机体疾病的技术,其特征在于所述步骤(a)是对APC基因中一种或更多单核苷酸序列多态性的检测。
10.根据权利要求9所述的检测机体疾病的技术,其特征在于步骤(a)包括以下几个步骤(i)获取APC基因全长基因组区域,( )扩增APC基因的上游序列,外显子,内含子和下游序列;(iii)在APC基因的片段矩阵上获取特定DNA片段;(iv)对获取的DNA片段快速测序;和(ν)检测获取的DNA序列单核苷酸多态性。
11.根据权利要求9所述的检测机体疾病的技术,其特征在于所述的步骤(a)包括等位基因特异的寡核苷酸杂交技术,等位基因特异PCR,固相支持微测序技术,寡核苷酸连接测定技法,5-氟尿嘧啶核酸酶测定法或限制性片段长度多态性。
12.一项用于临床预测某种疾病的技术,包括几下几个步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。
13.根据权利要求12所述的临床预测某种疾病的技术,其特征在于所述的基因是APC基因。
14.根据权利要求12所述的临床预测某种疾病的技术,其特征在于所述的疾病是结直肠癌。
15.一种用来评估机体患有某种疾病的风险的方法,包括以下步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。
16.根据权利要求15所述的评估机体患有某种疾病的风险的方法,其特征在于所述的基因是APC基因。
17.根据权利要求15所述的评估机体患有某种疾病的风险的方法,其特征在于所述的疾病是结直肠癌。
18.一种用来评估患者疾病治疗的药物潜在有效性的方法,包括以下几步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)使用该药物之前,检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失;(c)应用该治疗药物于该患者;(d)检测治疗后该基因或该基因中一个或多个单核苷酸多态性的存在或缺失;和(e)比较治疗前后该基因或该基因中一个或多个单核苷酸多态性的存在或缺失的情况。
19.根据权利要求18所述的方法,其特异性在于所述的基因是APC基因。
20.根据权利要求18所述的方法,其特征在于所述的疾病是结直肠癌。
21.一种调节APC基因活性的方法,包括在APC基因中引入一种或多种单核苷酸多态性。
22.根据权利要求21所述的方法,包括在APC基因启动子区域、外显子、内含子或内含子和外显子连接处引入一个或多个单核苷酸多态性。
全文摘要
本发明提供了一项检测患者疾病的方法,包括以下步骤(a)识别显示该疾病或抑制该疾病的基因,或识别该基因中一个或多个单核苷酸多态性;(b)检测该基因或该基因中一个或多个单核苷酸多态性的存在或缺失。
文档编号C12Q1/68GK102277417SQ201010201050
公开日2011年12月14日 申请日期2010年6月13日 优先权日2010年6月13日
发明者林标扬 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1