外显子保守序列扩增多态性分子标记及其分析方法

文档序号:399639阅读:508来源:国知局
专利名称:外显子保守序列扩增多态性分子标记及其分析方法
技术领域
本发明属于基因组学、生物信息学领域,涉及外显子保守序列扩增多态性分子标记(Conserved sequence of exon amplified polymorphism, CSEAP)及其分析方法。
背景技术
分子标记是以生物大分子(主要是遗传物质DNA)的多态性为基础的一种遗传标记,具有数量多、多态性高、不受季节、环境影响、检测手段简单迅速等多种优点。分子标记已经成为生命科学的前沿领域,广泛应用于生物遗传多样性分析、遗连锁图谱构建、种质资源鉴定、基因定位、亲缘关系分析、性别鉴定、基因组作图、基因克隆、文库构建和分子标记辅助选择育种等多个方面。自1980年首次提出分子标记的概念以来,分子标记的研究不断有相关的文献报道,特别是上世纪90年代以来,发展十分迅速。目前,可用于分子标记的方法超过十种,在植物的分子遗传研究中应用比较多的有DNA限制性片段长度多态性(Restriction Fragment Length Polymorphism, RFLP)、随机扩增多态性 DNA(Random amplified polymorphism,RAPD)、简单重复序列(Simple Sequence R印eat,SSR)、扩增片段长度多态性(Amplified Fragment Length Polymorphism, AFLP)和单核苷酸多态性(Sigle nucleotide polymorphisms, SNP)等,分子标记体系类型多样,应用广泛,但各自的技术复杂性、可靠性与提供的遗传信息丰富度不同。1980 年Botstein 等提出了 RFLP 分子标记技术(Botstein D, White R L, Skolnick Μ, Davis R W. Construction of a genetic linkage map in man using restriction fragment length polymorphisms. American Journal of Human Genetics,1980,32 314-331),从此开创了利用DNA多态性进行分子标记的新阶段。该方法的基本原理为将基因组DNA用已知的限制性内切酶消化,电泳经Southern印迹后,用放射性同位素或非放射性物质标记探针,与转移于支持膜上的DNA杂交,经放射自显影显示出基因组DNA中与探针同源的DNA序列片段的大小。RFLP标记呈共显性,标记准确,不影响表型,数目也较多,但其分析程序复杂,有放射性污染,技术难度大,费时,成本较高,需要的DNA量较大,难以大范围推广应用。1990 年,Williams 等(Williams J G,Kubelik A R, Livak K J, Rafalski J A, Tingey S V. DNA polymorphisms amplified by arbitrary primers are useful as genetic markers. Nucleic Acids Res,1990,18(22) :6531_6535)和 Welsh 等(Welsh J, McClelland M. Fingerprinting genomes using PCR with arbitrary primer. Nucleic Acids Res, 1990,18 (24) :7213_7218)几乎同时将PCR技术应用于分子标记,发展出一种新型的分子标记技术RAPD,该方法是用短的(通常为IObp)随机序列DNA作为引物,对目的基因组DNA进行PCR扩增而产生多态性。RAPD技术快速、简便、成本低廉。但随着研究的深入,人们发现该技术存在一定的缺陷=RAPD为显性标记,不能提供完整的信息;易受实验条件影响;稳定性差;结果不能区分纯合体和杂合体。1989年Tautz提出了 SSR分子标记方法(Rautz D. Hypervariability of simple sequences as a general source forpolymorphic DNA markers. Nucleic Acids Research, 1989,17 :6463_6471),该方法是根据微卫星DNA两端的单拷贝序列设计一对特异引物,利用PCR技术,扩增每个位点的微卫星DNA序列,通过电泳分析核心序列的长度多态性。SSR具有很好的稳定性和多态性,DNA 用量少,重复性高。但要获得SSR引物需要进行大量克隆、测序和杂交验证工作。1992年, Vos等人把RAPD和RFLP技术结合起来,发明了新的分子标记AFLP技术(Vos P, Hogers R, Bleeker M,Reijans M,van de Lee Τ, Hoernes Μ,Frijters A, Pot J, Peleman J, kuiper M,Zabeau M. AFLP :a new technique for DNA fingerprinting. Nucleic Acids Res. 1995, 23 =4407-4414),该发明于1993年获欧洲专利局专利,专利号为EP0534858A1。该法先设计针对某种限制性内切酶的通用接头,以及可与接头序列和限制性酶切位点的序列配对的专用引物,用上述内切酶消化基因组DNA,将通用接头与限制性片段两端连接,再用专用引物扩增,最后电泳显示结果。AFLP具有标记多态性强、准确性高、重复性好以及可用于没有任何分子生物学研究基础的物种等优点,很快被推广到生物学的各个领域。但也存在明显的缺点技术繁琐、过程时间长、检测的不是等位片段、费用昂贵,且AFLP标记是显性标记, 不能提供完整信息。1996 年,Lander 提出了 SNP 技术(Lander E S. The new genomics Global views of biology. Science,1996,274 :536_539),SNP 数量最为丰富,其遗传稳定性远高于SSR,可以进行快速、规模化筛查,易于基因分型,正成为一种极具应用潜力的新型分子标记。SNP既可以用PCR,又可以用DNA芯片来检测,但目前对SNP的检测在技术上还显得太复杂,难度较大,因而还难以广泛应用。近年来也发展了不少新的分子标记技术。主要有中国专利CN200410084499. 5,一种分子标记及其开发方法。该发明利用已完成测序的基因组及cDNA序列,将它们进行联配,得到每个基因的内含子数量及长度,对相应的内含子进行比较,从而得到两基因组间的长度差异的内含子,在该内含子两侧的外显子上或在其内部差异位点两侧的保守序列上设计引物,利用设计和引物和基因组序列进行电子 PCR,选择只有一个PCR产物的标记作为分子标记。中国专利CN 200710026739. X,一种基于功能基因多态性的分子标记方法。该方法是针对现有分子标记技术,尤其是TRAP和SNP标记技术的不足之处,利用已知物种的公用数据库中的gDNA、cDNA或EST序列信息,设计不同基因的特异引物和高频序列引物并配合其相应的退火温度,作为基于PCR的功能基因扩增多态性标记方法。中国专利CN 200710150329. 6,保守序列扩增多态性分子标记及其分析方法。该方法是根据表达序列标签EST和内含子的保守序列充计固定引物,设计随机引物的核心序列为CACGC,所用的固定引物序列为El :5,ATTCAGCCGATTGCAAGAGA3,/CVl71606 ;E2 :5,TATCTTGACCAGGCGAGACCT3,/CV171904。随机引物的序列如下Cl 5,GACTGCGTACGCACGCTGA3,,C2 5,GACTGCGTACGCACGCTGA3,,C3 5,GACTGCGTACGCACGCAAC3,。将上述固定引物和随机引物组合进行PCR检测多态性。Bertrand 等提出了 SCoT 分子标记方法(Bertrand C. Y.,Collard, David J.,Mackill.Start codon targeted (SCoT) polymorphism :a simple novel DNA marker technique for generating gene-targeted markers in plants. Plant Mol Biol Rep, 2009,27 :86-93),该方法是通过在基因的起码密码子的保守区域设计引物,对基因组DNA 进行单引物扩增产生多态性。综上所述,除最早提出的RFLP技术外,其余的分子标记方法都是以PCR为基础,相对比较简单,被大多数的实验室和研究人员所采用。但它们大部分都属于传统意义上的随机DNA分子标记,扩增的片段可能是非编码区域,也可能随机在基因组中扩增,得到的位点一般与目标性状基因距离较远,不能很好地与目标性状联系起来,这使得分子标记在应用上与其目标有一定的偏差,因而限制了它们的应用。因此,开发一种简单、有效、重复性好、 与功能基因相关联的分子标记技术十分必要,使分子标记的分析结果与目标性状密切联系,从而加快遗传育种的进程。

发明内容
本发明的目的在于克服现有技术的不足,提供操作简便、有效、重复性好、减少引物筛选的时间和成本、能够与目标性状联系密切的一种外显子保守序列扩增多态性的分子标记方法。本发明的技术方案是外显子保守序列扩增多态性分子标记及其分析方法,利用已知物种的公用数据库中的mRNA序列信息,找出基因外显子的5碱基寡聚核苷酸保守序列,以这个保守序列为核心,在其3’端连接6碱基随机序列构成11碱基序列,与5’端的固定序列共同组成20bp的引物。通过mRNA数据库,初步筛选出11碱基序列出现频率较高的引物,再用PCR对其进行重复性筛选,得到作为基于FCR的外显子保守序列扩增多态性标记,主要技术步骤是(1)序列下载及分析从NCBI网站下载已公布的本物种或近缘物种mRNA序列,构建 mRNA 数据库,用编程软件 Delphi 7. O (Borland Software Corporation,USA)进行编程, 将四种碱基(A、T、C、G)组合产生1024种5碱基寡聚核苷酸序列。通过编制的程序把这些寡聚核苷酸序列与mRNA数据库的每一条记录逐一进行比较,得出在数据库的mRNA序列中出现频率较高的5碱基寡聚核苷酸序列;(2)引物设计引物由三个部分组成,即核心区域、3’端随机序列及5’端序列。引物的核心区域为步骤(1)搜索得到的出现频率较高的5碱基寡聚核苷酸序列,在核心区域外的3’端为6碱基随机序列,与核心区域构成11碱基序列,5’端固定为GTGTGCCAG,所有引物长度为20bp;(3)引物初步筛选通过编制的程序,把11碱基序列与本物种或与其近缘物种的 mRNA数据库的每一条记录逐一进行比较,筛选出11碱基序列在数据库的核苷酸序列中出现频率较高的引物;(4)引物的重复性筛选用步骤3筛选的出现频率较高的引物进行PCR筛选出重复性好的引物。以上所述出现频率是指含5碱基寡聚核苷酸序列的mRNA序列数占数据库中mRNA 序列总数的比例。以上所述本物种是指要进行分子标记的物种。
以上近缘物种是指与要进行分子标记的物种在进化上较近的物种。以上所述PCR反应程序为95°C初始变性5min,接下来进行35个循环,每个循环进行为95°C 30sec、50-55°C 30sec 和 72°C 1. 5_2min,最后一个循环延伸为 72°C IOmin0 PCR产物采用8 %的聚丙烯酰胺胶电泳分离,用硝酸银染色观察。所述的外显子保守序列扩增多态性的分子标记方法是在植物分类、植物种质资源识别方面的应用。本发明的优点和积极效果 1、本发明的分子标记方法CSEAP设计的弓丨物充分利用了已公布的mRNA序列,引物设计成本低,简单高效,扩增条带量多。2、本发明的分子标记方法CSEAP的PCR退火温度为50°C,在保证扩增条带数量的前提下,大大提高实验的重复性和可靠性。3、本发明的CSEAP引物扩增条带的数量可用相关的mRNA数据库来预测,大大地减少引物筛选的时间和成本。4、本发明的CSEAP引物的核心区域为外显子的保守序列,因此其能够与基因组 DNA中的外显子特定位点匹配,扩增片段就是目标基因的一部分,这一特点为CSEAP法进行遗传多样性分析的结果与性状之间产生密切联系提供可能。5、本发明的CSEAP引物的核心区域GAAGA序列在绝大多数mRNA序列都存在,因此,以CSEAP方法可以对不同的物种进行分子标记研究。另外,CSEAP方法也可以用于对 mRNA的表达差异进行研究。可广泛应用于遗传图谱构建、基因或QTL定位、分子标记辅助育种、遗传多样性分析、基因组研究和mRNA表达差异分析等多种领域。


图1 查找基因外显子保守序列程序流程图。图1的说明序列程序流程是首先利用程序将四种碱基(A、T、C、G)随机组合,生成5碱基寡聚核苷酸序列,然后在数据库内的每一个记录进行自动搜索,计算包含5碱基寡聚核苷酸序列的记录数,再除以总记录数,则得到5碱基寡聚核苷酸序列在数据库中出现的频率,最后把这些数据写进文件进行记录。图2 =CSEAP引物结构示意图。图2的说明CSEAP引物是由三个部分组成的20碱基引物核心区域、3’端6碱基随机序列、5’端序列。核心区域是植物mRNA序列的保守寡聚核苷酸序列GAAGA ;5’端序列固定为GTGTGCCAG ;3,端是CSEAP引物产生多态性的基础,它是由4种碱基(A、T、C、G)组合产生的6碱基序列,与CSEAP的核心序列构成11碱基序列。图3 CSEAP原理图解。图3的说明图3是在基因型A的一条DNA链的3’端有TCTTC序列,且5’端有 GAAGA序列,如果这两个序列之间内测的6个碱基能与CSEAP引物的6个随机碱基配对,则能进行指数扩增,在凝胶电泳上呈阳性。相对应的,基因型B的DNA链上的TCTTC和GAAGA 序列之间内测的6碱基在遗传过程中产生变异,而不能与CSEAP引物的6个随机碱基配对, 从而不能进行指数扩散,在凝胶电泳中呈阴性。图4 部分CSEAP引物对甘蔗DNA扩增结果。
图 4 的说明最左边泳道为 100+2+3kb DNA Ladder-M(Sangon Biotech, cat. No SDM37),泳道1-37分别为37个甘蔗品种。图5 37个甘蔗品种间的UPGMA聚类树状图。图5的说明A为CSEAP法,B为ISSR法。两种分子标记方法都能把37个甘蔗品种分成两大类,一类包括GT28和GT99-107两个品种,其他的品种属于另一类群。另外对一些亲缘比较近的品种,如YT55、HD28,YL6、GT02-833、GT02-619、LC03-1137等,两种方法均把它们分别划分为同一小类。
具体实施例方式本发明通过以下实例进一步详述,下述实例是说明性的,不是限定性的,不能以下述实例来限定本发明的保护范围。实施例1本实施例是以甘蔗品种资源为材料,以拟南芥和水稻为近缘物种进行外显子保守序列扩增多态性的分子标记。1、选用37个甘蔗品种资源为材料,从甘蔗植株取心叶,去除中脉后剪取中间部分用于提取DNA,采用CTAB法提取DNA。2、从NCBI网站下载拟南芥、甘蔗和水稻的mRNA序列,分别构建这几种作物的mRNA 数据库,拟南芥mRNA数据库包含78301条记录,其中的mRNA序列有完全序列和部分序列。 甘蔗和水稻的mRNA数据库分别由75和3990条mRNA完全序列组成。用编程软件Delphi 7. 0 (Borland Software Corporation, USA)进行编程,将四种碱基(Α、Τ、C、G)组合产生 1024种5碱基寡聚核苷酸序列。通过编制的程序把这些寡聚核苷酸序列与上面的三个数据库的每一条记录逐一进行比较,得出在数据库的mRNA序列中出现频率较高的5碱基寡聚核苷酸序列GAAGA。3、依据查找到的外显子保守序列来设计CSEAP引物,引物由三个部分组成,即核心区域、3’端随机序列及5’端序列。CSEAP引物的核心区域为外显子保守序列GAAGA,在核心区域外的3’端为6碱基随机序列,与核心区域构成11碱基序列,5’端固定为GTGTGCCAG, 所有引物长度为20bp。通过编制的程序,把11碱基序列与拟南芥的mRNA数据库的每一条记录逐一进行比较,计算出引物序列在数据库的核苷酸序列中出现的频率,选用出现频率最高的引物序列进行PCR筛选出重复性好的引物。4、贞_ CSEAPl弓L$Tprofession£il Thermocycler PCRft (Biometra)
PCR 扩增,PCR 反应体系的总体积为 25 μ 1,包括2. 5μ 1 IOXReaction buffer (BioFlux, withl5mM MgCl2)、0· 5 μ 1 dNTP 混合物(各 IOmM)、1U rTaq聚合酶(BioFlux)禾口 3 μ 1 CSEAP 引物(稀释到10 μ Μ)。每个反应的DNA模板浓度为50ng。PCR反应程序为95°C初始变性 5min,接下来进行35个循环,每个循环进行95°C 30sec、50°C 30sec和72°C 2min,最后一个循环延伸为72°C 7min。所有的CSEAP产物用8%的聚丙烯酰胺胶电泳分离,用硝酸银染色观察。5、扩增的CSEAP产物以0、1统计建立数据库。在相同迁移位置,有带(显性)记为1,无带(隐性)记为0,依此构成0/1遗传相似矩阵。仅记清晰、稳定且可重复的条带。 二元数据矩阵用NTSYS-PC 2. 1软件中的UPGMA法进行聚类分析,绘制树状聚类图。
结果显示,从拟南芥mRNA数据库中搜索到的出现频率最高的19条引物中,有18 条引物都出现很好的重复性,且扩增的条带数较多,说明引物的设计是正确的和可行的。 用CSEAP法能够把供试的37个品种区分开来,且其聚类分析结果与ISSR法基本一致,即 CSEAP法是用于对物种的遗传多样性分析的一种新的、有效的分子标记方法。
权利要求
1.外显子保守序列扩增多态性分子标记及其分析方法,其特征在于利用己知物种的公用数据库中的HiRNA序列信息,找出基因外显子的5碱基寡聚核苷酸保守序列,以这个保守序列为核心,在其3’端连接6碱基随机序列构成11碱基序列,与5’端的固定序列共同组成20bp的引物。
2.通过mRNA数据库初步筛选出11碱基序列出现频率较高的引物,再用PCR对其进行重复性筛选,得到作为基于FCR的外显子保守序列扩增多态性标记,主要技术步骤是(1)序列下载及分析从NCBI网站下载已公布物种的mRNA序列,构建mRNA数据库,用编程软件 Delphi 7.0 (Borland Software Corporation, USA)进行编程,将四种碱基(A、 Τ、C、G)组合产生1024种5碱基寡聚核苷酸序列,通过编制的程序把这些寡聚核苷酸序列与mRNA数据库的每一条记录逐一进行比较,得出在数据库的mRNA序列中出现频率较高的 5碱基寡聚核苷酸序列;(2)引物设计引物由三个部分组成,即核心区域、3’端随机序列及5’端序列,引物的核心区域为步骤(1)搜索得到的出现频率较高的5碱基寡聚核苷酸序列,在核心区域外的3’端为6碱基随机序列,与核心区域构成11碱基序列,5’端固定为GTGTGCCAG,所有引物长度为20bp ;(3)引物初步筛选通过编制的程序,把11碱基序列与本物种或与其近缘物种的mRNA 数据库的每一条记录逐一进行比较,筛选出11碱基序列在数据库的核苷酸序列中出现频率较高的引物;(4)引物的重复性筛选用步骤3筛选的出现频率较高的引物进行PCR筛选出重复性好的引物。
3.根据权利要求1所述的外显子保守序列扩增多态性分子标记及其分析方法,其特征在于所述出现频率是指含5碱基寡聚核苷酸序列的mRNA序列数占数据库中mRNA序列总数的比例。
4.根据权利要求1所述的外显子保守序列扩增多态性分子标记及其分析方法,其特征在于所述本物种是指要进行分子标记的物种。
5.根据权利要求1所述的外显子保守序列扩增多态性分子标记及其分析方法,其特征在于所述近缘物种是指与要进行分子标记的物种在进化上较近的物种。
6.根据权利要求1所述的外显子保守序列扩增多态性分子标记及其分析方法,其特征在于所述PCR反应程序为95°C初始变性5min,接下来进行35个循环,每个循环进行为95°C 30sec、50-55°C 30sec 和 72°C 1. 5_2min,最后一个循环延伸为 72°C 1 Omin, PCR 产物用8%的聚丙烯酰胺胶电泳分离,用硝酸银染色观察。
7.权利要求1所述的外显子保守序列扩增多态性分子标记及其分析方法在农作物品种资源遗传多样性和识别方面的应用。
全文摘要
本发明公开了一种外显子保守序列扩增多态性分子标记及其分析方法,能利用己知物种的公用数据库中的mRNA序列信息,找出基因外显子的5碱基寡聚核苷酸保守序列,以这个保守序列为核心,在其3’端连接6碱基随机序列构成11碱基序列,与5’端的固定序列共同组成20bp的引物。通过mRNA数据库初步筛选出11碱基序列出现频率较高的引物,再用PCR对其进行重复性筛选,得到作为基于FCR的外显子保守序列扩增多态性标记。本方法操作简便、有效、重复性好、减少引物筛选的时间和成本。这是遗传多样性分析的一种新的、有效的分子标记方法。可广泛应用于遗传图谱构建、基因或QTL定位、标记辅助育种、遗传多样性分析、基因组研究和mRNA表达差异分析等多种领域,应用前景广阔。
文档编号C12N15/11GK102443583SQ20111034165
公开日2012年5月9日 申请日期2011年11月2日 优先权日2011年11月2日
发明者何海旺, 何龙飞, 李创珍, 许春燕, 韦善清 申请人:广西大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1