玉米高密度全基因组SNP固相芯片Mazie15K及其应用的制作方法

文档序号:40136156发布日期:2024-11-29 15:21阅读:127来源:国知局
技术简介:
本发明针对现有玉米SNP芯片品种代表性不足、探针序列不准确的问题,基于国内外广泛玉米品种重测序数据,结合B73 refgen_v4基因组,筛选出200万+ SNP标记,设计包含3105个与国标SSR关联的功能基因探针、352个农艺性状相关SNP及96个品种真实性鉴定位点的Mazie15K芯片,提升分子鉴定与辅助育种的准确性与适用性。
关键词:玉米SNP芯片,分子育种

本发明涉及分子生物学、基因组学、生物信息学及植物分子育种,尤其是涉及一种玉米高密度全基因组snp固相芯片mazie15k及其应用。


背景技术:

1、随着基因组学生物技术平台的快速发展,农作物基因型分析进入了新的时代。各作物陆续开展大样本重测序工作,建立全基因组遗传信息库。在全基因组遗传信息库建立的基础上,优异分子标记开发、单倍型图谱绘制、基因组多样性评估等方面开始系统展开。分子标记(molecular markers),指可遗传并可检测的dna序列,是以个体间核苷酸序列变异为基础的遗传标记,是dna水平遗传多态性的直接反映。

2、自从2005年454测序仪问世以来的十多年时间,二代测序技术不断完善,基因组测序效率大大提高,测序成本大幅度下降,大量物种的全基因组参考序列组装完成,极大地推进了功能基因组研究的进展。同时高密度芯片技术分型平台陆续发布,并将其陆续应用于分子鉴定、分子育种以及基础研究之中。snp(single nucleotide polymorphism,单核苷酸多态性)作为第三代遗传标记,在基因组上分布最为丰富,具有二态性,单个snp位点突变率低,易于通过芯片技术实现自动化和规模化,snp标记具有在基因组上分布密度高、分布均匀的特性,最适于开发芯片的标记,受到众多研究者的重视。

3、玉米为二倍体杂交作物,重组率高、遗传多样性丰富、拥有较好的基因组学研究基础,其snp位点开发、评估具有较好的背景支持。玉米基因组是拟南芥的18倍,水稻的5倍,亲缘物种高粱的3倍,拥有高达85%的重复序列,借助bac-by-bac的方法,玉米自交系b73的参考基因组于2009年发布,并随着测序技术的不断发展而逐步完善(schnable等,the b73maize genome:complexity,diversity,and dynamics.science,326:1112-5)。2010年,赖锦盛等针对我国6份重要玉米骨干亲本,构建了其全基因组的单核苷酸多态性、插入/缺失多态性及基因获得和缺失变异图谱(lai等,genome-wide patterns of geneticvariation among elite maize inbred lines.nat genet,42:1027-30);2013年,王国英及严建兵等合作利用mrna测序的策略获得了368份具有广泛代表性的玉米自交系约360万个基于转录序列的snp标记位点(fu等,rna sequencing reveals the complexregulatory network in the maize kernel.nat commun,4:2832);玉米hapmap第二版测序了共计103个玉米品种、野生种和农家种自交系,得到5500万个snp和indel标记位点(chia等,maize hapmap2 identifies extant variation from a genome in flux.natgenet,44:803-807);玉米hapmap第三版综合了916份更广泛的玉米自交系的测序数据,鉴定了超过6000万snp及indel变异(bukowski等,construction of the third generationzea mays haplotype map.gigascience,7:1-12)。2021年,美国爱荷华州立大学matthewb.hufford等人报告了25个从头组装的玉米自交系基因组以及进一步完善的b73基因组,这26个自交系是玉米巢式关联作图群体(nested association mapping,nam)的创建系(denovo assembly,annotation,and comparative analysis of 26diverse maizegenomes.science,373:655-662)。

4、全基因组snp芯片技术就是将snp标记固定在载体上形成密集的寡核苷酸探针阵列,再与目标dna进行等位基因特异性反应,根据反应后信号的有无和强弱确定snp位点的多态性,该技术可以对作物全基因组实现快速、高密度的扫描,特别针对育种工作中的大量群体样本进行基因型鉴定,单个检测位点成本很低,是一种高集成、高通量、微型化和自动化的snp位点检测手段。

5、目前,在多个作物物种中都开发出了snp基因芯片,甘蓝型油菜的illuminainfinium brassica 60k(wayne e.clarke等,a high-density snp genotyping arrayfor brassica napus and its ancestral diploid species based on optimisedselection of single-locus markers in the allotetraploid genome.theoreticaland applied genetics,2016,1887–1899)、水稻的illumina infinium rice6k(yu等,awhole genome snp array(rice6k)for genomic breeding in rice.plant biotech j,2014,12:28-37)、cornell_6k_array_infinium_rice(thomson等,large-scaledeploymentof a rice 6k snp array for genetics and breeding applications.rice(n y),2017,10:40)、illumina goldengate(parida等,snps in stress-responsive rice genes:validation,genotyping,functional relevance and population structure.bmcgenomics.2012,13:426-443;)、affymetrix genechip rice 44k(zhao等,genome-wideassociation mapping reveals a rich genetic architecture of complex traits inoryza sativa.nat commun.2011,13:467)、illumina infinium ricesnp50(chen等,ahigh-density snp genotyping array for rice biology and molecularbreeding.molecular plant,2014,7(3):541-553)已经广泛的应用于种质资源筛选、品种真实性和纯度鉴定、育种材料遗传背景分析等工作;ganal等(a large maize(zea maysl.)snp genotyping array:development and germplasm genotyping,and geneticmapping to compare with the b73 reference genome.plos one.2011,6:e28334)利用illumina infinium maize snp50基因芯片对两个玉米重组自交系群体进行分析,获得分别包含20913和14524个标记的高密度遗传连锁图;在大豆的驯化历史研究中,affymetrixaxiom全基因组snp芯片njau 355ksoysnp分析了105个野生和262个栽培品种,得出大豆栽培品种起源于中国的中部和北部的结论(wang等,development and application of anovel genome-wide snp array reveals domestication history in soybean.scirep.2016,6:20728-20737);为构建小麦的高密度遗传连锁图,以小麦90k infiniumiselect snp芯片对4个小麦群体进行了扫描,将29692个snp标记定位到了6倍体小麦的21条染色体上(wen等,a high-density consensus map of common wheat integratingfour mapping populations scanned by the 90k snp array.front plant sci.2017,doi:10.3389/fpls.2017.01389)。

6、玉米高密度snp芯片主要以美国illumina商业化发布芯片为主,其评估材料基本以美国为主,导致分析中国材料出现数据质量低、多态性低的情况。为了加快我国玉米遗传研究和育种应用,不仅需要加大评估材料的背景,尤其是国内种质,还需要利用高质量测序数据结合已有芯片的研究基础,构建拥有自主知识产权的国产化芯片。因此开发一种拥有自主知识产权、自主制造、覆盖全基因组、数据共享性高、通量高、适用于多平台检测的国产化玉米全基因组snp芯片便是重中之重。

7、有鉴于此,特提出本发明。


技术实现思路

1、本发明的目的之一在于提供一种玉米高密度全基因组snp固相芯片mazie15k及其应用,以至少解决现有技术中存在的技术问题之一。

2、本发明为基于大量玉米自交系重测序数据的2000000余个snp标记设计的15k基因芯片。考虑在育种中的应用,针对与352个已发表的影响育性、开花期、株型、产量、品质和抗性的功能基因相连锁的snp标记位点设计探针,同时找到3105个与40个国标ssr标记高度关联的、与功能基因相连锁snp核心位点。实验结果表明,maize 15k国产玉米全因组芯片的探针在测试品种中具有丰富的多态性,因此,maize 15k芯片在玉米基因组育种研究中具有很好的应用前景。

3、基于此,第一方面,本发明提供了一种玉米高密度全基因组snp固相芯片mazie15k,所述固相芯片mazie15k的核心位点信息如表1所示。

4、进一步地,所述核心位点通过如下方法获取:

5、利用玉米自交系重测序结果,并将重测序结果比对至玉米参考基因组上进行核心位点的筛选;

6、所述参考基因组版本为b73 refgen_v4。

7、进一步地,基于如下(a)~(g)过滤所述核心位点:

8、a.保留只存在两种基因型,次等位基因频率大于0.05的snp标记位点;

9、b.根据40个国标ssr标记位置上下游各拓展5mb为划分为区段,筛选位于区段内的原始变异snp标记位点;

10、c.去除重复及物理距离<100bp的snp标记,构成待选标记集;

11、d.使用tassel软件提取待选标记集的chr.、pos.,并在待选标记上下游各拓展50bp;

12、e.使用samtools软件在参考基因组中提取并去除含n碱基序列,构成待选标记探针序列集;

13、f.将待选标记探针序列集进行全基因组blast,选择e-value最低且唯一项进行保留;

14、g.对所筛选出的snp标记探针序列按照40个国标ssr标记位点上游3mb、下游2mb中的功能基因位置再次进行筛选,每个功能位置中至多保留3个snp标记,得到上游1731个,下游1374个,共计3105个标记。

15、其中,40个国标ssr标记位置参考中华人民共和国农业行业标ny/t1432-2014。

16、进一步地,还包括:

17、h.增加96个玉米品种真实性鉴定的snp;

18、其中,所述玉米品种真实性鉴定的snp参考中华人民共和国农业行业标准ny/t4022-2021。

19、进一步地,还包括:

20、i.增加影响育性、开花期、株型、产量、品质和抗性表型的snp位点。

21、其中,株型包括穗型、叶夹角、株高等;产量包括穗行数、籽粒大小等;品质包括伽马氨基丁酸、脂肪酸、生育酚、花青素含量等;抗性包括盐、高温、低温、干旱、大斑病、灰斑病、南方锈病等相关的重要snp位点,共计352个。

22、进一步地,还包括:

23、j.确定标记密度,增加染色体均一分布snp标记9281个,和/或,

24、k.集成已知芯片中高质量位点544个。

25、其中已知芯片例如mazie50k。

26、第二方面,本发明还提供了上述的玉米高密度全基因组snp固相芯片mazie15k在分子鉴定和分子辅助育种中的应用。

27、此外,根据本发明的第三方面,还提供了玉米分子鉴定的方法,包括如下步骤:

28、将待测样本dna进行预处理,之后使用高通量基因芯片扫描仪进行扫描,分析软件分析并用r语言编程获得基因型比较结果;

29、优选地,所述预处理包括:

30、(a)确保dna浓度在50ng/μl以上,260/280在18-2.0之间,260/230在1.6以上;

31、(b)对dna进行琼脂糖凝胶电泳检测,确保主带明显且大于5kb;

32、(c)将dna的浓度统一稀释到50-100ng/μl的范围内。

33、与现有技术相比,本发明具有如下有益效果:

34、本发明与同类型的maize snp50、maize 600k、maize 55k和maize 6h-60k芯片相比,具有更好的品种代表性及/或更准确的探针序列。maize snp50和maize 600k主要以美国和欧洲材料进行评估,maize 55k的大部分探针来自maize 600k芯片,以上三款全基因组芯片设计得较早,探针基于早期的玉米基因组序列设计。maize 6h-60k由北京市农林科学院于2020年研制,其snp位点由388份玉米自交系的全基因组重测序数据中筛选而来。

35、本发明的玉米高密度全基因组snp固相芯片mazie15k的snp标记位点来源于大量国内外具有广泛代表性的玉米品种的重测序结果,探针来源的品种更多,探针序列基于经第三代测序技术更新过的b73基因组(b73 refgen_v4)设计,探针序列更准确。

36、除此之外,玉米高密度全基因组snp固相芯片mazie15k中包含96个玉米品种真实性鉴定snp探针,352个影响玉米重要农艺性状的snp探针,更重要的是玉米高密度全基因组snp固相芯片mazie15k中包含3105个与国标ssr标记上下游2-3mb区间内的功能基因相连锁的邻近探针,能够更有效地鉴定功能基因和育种材料的遗传背景。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!