一种利用snp开发与snp紧密连锁的snp-ssr分子标记的方法

文档序号:477234阅读:313来源:国知局
一种利用snp开发与snp紧密连锁的snp-ssr分子标记的方法
【专利摘要】本发明涉及一种利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法,步骤如下:(1)根据待开发样品的已知SNP分子标记在遗传图谱上的位置,查找获得SNP标记延伸序列;(2)将SNP标记延伸序列在待开发样品的基因组测序数据库进行比对,选取序列片段;(3)以重复序列长度≥20bp,对完全型、不完全型、复合型三种SSR进行查找,获得SSR位点;(4)根据SSR位点的侧翼区域设计引物,经PCR扩增和测序,选取带型稳定清晰的,获得待验证分子标记;(5)利用待验证分子标记的引物,制得SNP-SSR分子标记。本发明所述方法能够快速大量的筛选与SNP紧密连锁的SNP-SSR分子标记。
【专利说明】—种利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法
【技术领域】
[0001]本发明涉及一种利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法,属于小麦分子生物技术与分子标记应用【技术领域】。
【背景技术】
[0002]小麦是异源六倍体,基因组结构复杂,每个基因组上存在的分子标记的多态也有较大差异。通过前人构建的分子遗传图谱发现A、B基因组上分子标记较多,而D基因组各个染色体上的标记较少,尤其是4D和5D染色体,这也为存在这些染色体上控制重要性状的基因的克隆带来了较大的困难。因此,开发4D和染色体上新的分子标记不仅能够加密饱和分子遗传图谱,而且对克隆控制重要性状(如矮败不育性状、抽穗期等性状)的基因奠定良好的基础。
[0003]在各类分子标记中,基于PCR的SSR(simple sequence repeat)标记及其丰富,且广泛分布于基因组中。因具有超变异性及位点专一性、共显性和多等位基因等优越性得到广泛应用。但由于受小麦基因组测序困难的限制,以前的SSR标记只能计算出遗传位置,没有确定的物理位置,不利于基因的精细定位及克隆。
[0004]但随着A基因组和D基因组测序工作的完成,以及D基因组物理图谱的构建为开发物理位置确定的SSR标记提供了帮助,但目前仍然没有一种有效的SSR标记定位方法。

【发明内容】

[0005]本发明针对现有技术的不足,提供一种利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法。
[0006]本发明技术方案如下:
[0007]一种利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法,步骤如下:
[0008](I)根据待开发样品的已知SNP分子标记在遗传图谱上的位置确定该标记所在区段对应的已知遗传物理图谱的近缘物种的位置,查找获得SNP标记延伸序列;
[0009](2)将步骤(1)的SNP标记延伸序列在待开发样品的基因组测序数据库进行比对,根据相似度≥ 99%的条件,选取长度范围为50kb到IOOkb的序列片段;
[0010](3)以重复序列长度≥20bp,按照二碱基重复型的重复次数不小于10次,三碱基重复型的重复次数不小于7次,四碱基重复型的重复次数不小于5次的标准,对完全型、不完全型、复合型三种SSR进行查找,获得SSR位点;
[0011](4)根据步骤(3)获得的SSR位点的侧翼区域设计引物,经PCR扩增和测序,选取带型稳定清晰的,获得待验证分子标记;
[0012](5)利用步骤⑷的待验证分子标记的引物,PCR扩增不同品系的待开发样品,选取结果具有多样性的分子标记,制得SNP-SSR分子标记。
[0013] 上述SNP标记延伸序列英文名称:SNP extended sequences。其在Ming-ChengLuoj Yong Q.Guj Frank M.You, Karin R.Deal,Yaqin Mu,Yuqin Huj Naxin Hu0.Yi Wang.A4-gigabase physical map unlocks the structure and evolution ofthe complex genome of Aegilops tauschii, the wheat D—genome progenitor.PNASj 2013,110(19):7940-7945.中有相关的报道。
[0014]上述近缘物种为遗传学领域专业术语,指包括袓先物种及与其有一定亲缘关系的物种。
[0015]根据本发明优选的,所述的待开发样品为小麦,所述的已知遗传物理图谱的近缘物种为粗山羊草。
[0016]根据本发明进一步优选的,所述的小麦的已知SNP分子标记在遗传图谱上的位置确定该标记所在区段对应的粗山羊草的位置,为登陆数据库查找SNP标记延伸序列;数据库为 http: //probes, pw.usda.gov/ffheatDMarker/?
[0017]根据本发明进一步优选的,所述的待开发样品为小麦D基因组。
[0018]根据本发明更优选的,所述SNP标记延伸序列在待开发样品的基因组测序数据库进行比对,为登陆小麦D基因组测序数据库进行比对;
[0019]所述数据库选用Jizeng Jia, Shancen zhao, Xiuying Kong, Yingrui Li, GuangyaoZhao, Weiming He, Rudi Appels.Aegilops tauschii draft genome sequence reveals agene repertoire for wheat adaptation.Nature Letter, 2013, 496:91-95.或 http://wheat-urg1.Versailles, inra.fr/Seq-Repository/BLAST 的数据库。
[0020]根据本发明优选的 ,所述步骤(3)中的查找,为采用SSRHunter软件进行查找。
[0021]根据本发明优选的,所述步骤(4)中的设计引物,为采用Primerf.0软件进行引物设计。
[0022]根据本发明进一步优选的,所述步骤(4)中设计引物的条件为:
[0023]SSR位点的开始和结束位置分别距5'和3'端不少于20bp ;引物长度18~25bp ;退火温度Tm值50~65°C,且上游引物和下游引物的Tm值相差不大于5°C ;PCR扩增产物长度100~400bp ;软件评分80分以上,引物不能产生二级结构。
[0024]根据本发明优选的,所述步骤(5)中的多样性为PCR产物带型清晰且在不同的材料中带型有差异。
[0025]有益效果
[0026]1、本发明首次公开了利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法,该方法能够快速大量的筛选与SNP紧密连锁的SNP-SSR分子标记,对丰富染色体分子标记的多态性、构建高密度的遗传图谱及其克隆控制重要性状如抽穗期的基因具有重要的意义。
[0027]2、通过本发明所述方法获得的与SNP紧密连锁的SNP-SSR分子标记可应用于品种多态性的筛选、高密度遗传图谱的构建及制重要产量和品质性状的基因的精细定位和克隆,能够极大缩短研究周期,加快速度,降低成本,具有操作简单,成本低廉,周期短的优点,适于推广应用,为控制小麦重要性状基因的克隆提供了技术支持,提高了效率和质量。
【专利附图】

【附图说明】
[0028]图1、SNP-SSR引物Xtdc38和Xtdc44PCR在不同材料中的扩增结果;[0029]图中:1、山农19,2、山农 20,3、衡 6632,4、衡 6503,5、衡 4568,6、衡观 76,7、科农1006,8、科农 2009,9、郑麦 0856,10、郑麦 7698,11、西农 529,12、西农 157,13、泛 7030,14、10 繁 27,15、花培 3 号,16、豫麦 57,17、SDAUl, 18、SDAU2,19、SDAU3,20、SDAU4,21、SDAU5,22、N5A,23、N5B,24、N5D ;
[0030]图2、标记Xtdcll、Xtdc31、Xtdc38和Xtdc44在在DH群体部分家系中的多态性;
[0031]图中:箭头所示为多态性位点,自左向右的泳道对应DH群体家系编号从97到145,其中 140 缺失,M =Marker0
[0032]图3、添加Xtdcll、Xtdc31、Xtdc38、Xtdc44分子标记后的小麦分子遗传图谱。【具体实施方式】
[0033]下面结合实施例对本发明的技术方案做进一步说明,但本发明所保护范围不限于此。
[0034]实验材料
[0035]普通小麦品种:
[0036]山农19和山农20购自山东圣丰种业科技有限公司;
[0037]衡6632、衡6503、衡4568和衡观76购自河北省农林科学院旱作农业研究所;
[0038]科农1006和科农2009购自中国科学院遗传与发育生物学研究所农业资源研究中心;
[0039]郑麦0856购自北京德农种业公司;郑麦7698购自河南新木种业公司;
[0040]西农529和西农157购自西北农林科技大学农学院;
[0041]泛7030和10繁27购自中国农业科学院作物所;
[0042]花培3号和豫麦57购自河南省农业科学院;
[0043]人工合成六倍体材料和中国春缺体-四体系材料:
[0044]人工合成六倍体材料:采用四倍体材料TK98-506H83-1631-1和二倍体材料新疆节节麦(AE.SQUARR0SA),将上述四倍体材料和二倍体材料通过常规杂交后经秋水仙素处理使染色体加倍而获得,命名为:SDAU1、SDAU2、SDAU3、SDAU4和SDAU5 ;上述四倍体材料TK98-506H83-1631-1和二倍体材料新疆节节麦(AE.SQUARR0SA)为本领域常用育种材料;
[0045]中国春缺体-四体系材料由来源于国家小麦改良分中心的中国春材料按照SearsE.R.(1958).1n:Proc.1st Int.Wheat Genet.Symp.,pp.221-228 中记载的内容方法制备获得,命名为 N5AT5D、N5BT5D 和 N5DT5B ;
[0046]DH群体购自山东农业大学农学院农业部谷物品质检测中心品质育种研究室;
[0047]所用Contig序列公开于 http://probes.pw.usda.gov/ffheatDMarker/ 网站上,序列可以通过该网站下载。
[0048]PCR仪型号为德国Eppendorf5531梯度PCR仪;
[0049]实施例1
[0050]小麦OTL上与SNP紧密连锁的新SNP-SSR分子标记的获取方法,包括以下步骤:[0051 ] (I)根据5DL上分子标记Xbarc320-Xwmc215在遗传图谱上的位置确定此区段在粗山羊草物理图谱http://probes, pw.usda.gov/ffheatDMarker/上的大体位置为ATro4910-AT5D5010,包含90个SNP标记延伸序列;[0052](2)将步骤(1)中90个SNP标记延伸序列对小麦D基因组测序数据库(JizengJia, Shancen zhao, Xiuying Kong, Yingrui Li, Guangyao Zhao, Weiming He, Rudi Appels.Aegilops tauschii draft genome sequence reveals a gene repertoire for wheatadaptation.Nature Letter, 2013, 496:91-95.)讲行本地 blast 或 http://wheat-urg1.Versailles, inra.fr/Seq-Repository/BLAST提供的小麦基因组序列数据库进行比对,根据相似度> 99%的条件,选取长度范围为50kb到IOOkb的序列片段;
[0053] 以Xtdc38为例,以罗明成等构建的物理图谱上(http: //probes, pw.usda.gov/ffheatDMarker/)的ATOT4993的contig序列对贾继增等建立的D基因组数据库进行Blast,找到相匹配的序列是KD546761。
[0054](3)以重复序列长度≥20bp,按照二碱基重复型的重复次数不小于10次,三碱基重复型的重复次数不小于7次,四碱基重复型的重复次数不小于5次的标准,对完全型、不完全型、复合型三种SSR进行查找,获得SSR位点;
[0055]如,用SSRhunter软件对KD546761进行SSR位点搜索,设定最小重复单元为20bp,按照二碱基重复型的重复次数不小于10次,三碱基重复型的重复次数不小于7次,四碱基重复型的重复次数不小于5次的标准,找到重复序列:
[0056]GGATGACGATGCGCCACGTGGTGGTGAGGCTGAAGAAGATCAAAGCTGAGTTCACTGGGCGGACAGTGAAGACATCGTGTAGTGCAACAGAGTGATCGAGCTACCTAGTTTCTTGCCTCCTGTCCCATCTATAAATGTGCATTCATGTATTTGTTTCTCTTCTTATTCCAATGTATTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCATCACAGTAATCACGTCTACCTTAAGTAGAAAGCAAAGCCAGGGAAAATGTAGTCCTTCTAGCAAATGTATTTGCAGATTGTTCTCTGAGCAAGTGGAGTACGTCGGTCACTTATAATTGTGCTAGTCAAATGAAGATCAACCAATAACGTATTCTTTTGCGTTGGTGGAGCGACCAGTGAGCTGATo
[0057]对ATro4920-AT5D5010的约90条SNP序列对小麦的D基因组进行blast,搜索SSR位点,共发现109个SSR位点。其中二、三、四核苷酸重复基元各有67个,34个,8个,各占61.47%,31.19%,7.34%。在109个SSR中二核苷酸基元TC/AG或CT/GA出现频率最高,共 37 个,占 SSR 总数的 33.94%。AC/GT 或 CA/GT 共 17 个,占 15.60 %。AT/TA (占 11%)也有较高的出现频率。三核苷酸基元TTC/AAG出现频率最高,占SSR总数的11.93%。其次是CCT/GGA、CAT/GTA、CGG/GCC,出现频率分别为3.67%, 3.67%, 2.75%,其他类型出现频率较低。四核苷酸基元个类型出现的频率均较低。
[0058]对于重复次数,二核苷酸基元的重复次数类型多、跨度大。其中GA/CT或AG/TC的重复次数类型最多,跨度最大,为16种,从重复10次到50次;其次是AC/TG或CA/GT,重复次数类型为12种,重复11次到38次;AT/TA或TA/AT也有较大的重复次数跨度,有9种重复类型,重复次数为10-30次。三核苷酸基元的重复次数类型和跨度小于二核苷酸。其中TTC/AAG或CTT/GAA有10种重复类型,重复次数8_38次,重复次数类型最多,跨度最大;其次是CCT/GGA,CAT/GTA。如表1所示。
[0059]表1主要重复基元类型及跨度分布
[0060]
[0061]
【权利要求】
1.一种利用SNP开发与SNP紧密连锁的SNP-SSR分子标记的方法,其特征在于,步骤如下: (1)根据待开发样品的已知SNP分子标记在遗传图谱上的位置确定该标记所在区段对应的已知遗传物理图谱的近缘物种的位置,查找获得SNP标记延伸序列; (2)将步骤(1)的SNP标记延伸序列在待开发样品的基因组测序数据库进行比对,根据相似度> 99%的条件,选取长度范围为50kb到IOOkb的序列片段; (3)以重复序列长度>20bp,按照二碱基重复型的重复次数不小于10次,三碱基重复型的重复次数不小于7次,四碱基重复型的重复次数不小于5次的标准,对完全型、不完全型、复合型三种SSR进行查找,获得SSR位点; (4)根据步骤⑶获得的SSR位点的侧翼区域设计引物,经PCR扩增和测序,选取带型稳定清晰的,获得待验证分子标记; (5)利用步骤(4)的待验证分子标记的引物,PCR扩增不同品系的待开发样品,选取结果具有多样性的分子标记,制得SNP-SSR分子标记。
2.如权利要求1所述的方法,其特征在于,所述步骤(1)中的待开发样品为小麦,所述的已知遗传物理图谱的近缘物种为粗山羊草。
3.如权利要求2所述的方法,其特征在于,所述的小麦的已知SNP分子标记在遗传图谱上的位置确定该标记所在区段对应的粗山羊草的位置,为登陆数据库查找SNP标记延伸序列。
4.如权利要求2所述的方法,其特征在于,所述的待开发样品为小麦D基因组。
5.如权利要求4所述的方法,其特征在于,所述SNP标记延伸序列在待开发样品的基因组测序数据库进行比对是指登陆小麦D基因组测序数据库进行比对。
6.如权利要求1所述的方法,其特征在于,所述步骤(3)中的查找,为采用SSRHunter软件进行查找。
7.如权利要求1所述的方法,其特征在于,所述步骤(4)中的设计引物,为采用Primer5.0软件进行引物设计。
8.如权利要求7所述的方法,其特征在于,所述步骤(4)中设计引物的条件为: SSR位点的开始和结束位置分别距5'和3'端不少于20bp;引物长度18~25bp;退火温度Tm值50~65°C,且上游引物和下游引物的Tm值相差不大于5°C ;PCR扩增产物长度100~400bp ;软件评分80分以上,引物不能产生二级结构。
9.如权利要求1所述的方法,其特征在于,所述步骤(5)中的多样性为PCR产物带型清晰且在不同的材料中带型有差异。
【文档编号】C12Q1/68GK103966335SQ201410220172
【公开日】2014年8月6日 申请日期:2014年5月22日 优先权日:2014年5月22日
【发明者】邓志英, 田纪春, 陈芳, 李文静, 陈建省 申请人:山东农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1