玉米穗位高相关的ZmRzf基因SNP分子标记及应用

文档序号:24660104发布日期:2021-04-13 23:16阅读:399来源:国知局
玉米穗位高相关的ZmRzf基因SNP分子标记及应用
玉米穗位高相关的zmrzf基因snp分子标记及应用
技术领域
1.本发明属于作物分子标记制备技术领域,具体涉及与玉米雄穗分枝数性状相关的snp分子标记及应用。


背景技术:

2.玉米的产量高、用途广是我们国家重要的粮食、饲用、能源及经济作物。提高种植密度是当前玉米高产栽培的主要途径。但是,密度大、穗位过高在不利气象条件下,容易产生群体倒伏和茎秆折断。例如2020年夏季,我国东北春玉米主产区由于台风暴雨天气,导致大面积的严重减质和减产。穗位高指的是玉米果穗着生节位距地面的距离,穗位高是决定玉米抗倒伏能力大小的一个重要性状,果穗的着生节位越高,玉米的重心也就越高,在利用中秆或中高秆这一有利性状的前题条件下,降低穗位高可以较好的提高玉米品种的抗倒性。穗位高是一个连续分布的、典型的多基因控制的数量性状,同时它的广义和狭义遗传力都比较高,说明其中有对性状贡献较大的主效基因在发挥作用。
3.目前通过qtl定位和候选基因法已经确定了许多与穗位高相关的qtl区域及候选基因,但是qtl定位的区域一般跨度很大,通常会有几个厘摩(centimorgan,cm),定位的区域中包括大量的候选基因,基因的精细定位较困难。候选基因法是根据已有的生命科学背景知识,直接从已知或潜在的基因库中挑选出可能对该性状有影响的基因,但它的缺点是不能识别新的基因。
4.因此,开发玉米育种过程中穗位高性状的辅助选择标记,提高选择的准确性,加快品种培育进程,对于玉米穗位高性状相关的分子标记辅助育种及相关性状的遗传改良具有重要意义。


技术实现要素:

5.本发明的目的之一在于提供与玉米状穗位高相关的snp分子标记。
6.本发明提供的与玉米状穗位高相关的snp分子标记的开发方法是:运用全基因组关联分析的方法,寻找穗位高性状相关的snp分子标记,以此作为玉米育种过程中穗位高性状的辅助选择标记,提高选择的准确性,加快品种培育进程。
7.本发明中snp分子标记的开发过程如下:
8.步骤(1)、通过431份不同亲缘关系的玉米自交系构建gwas分析的群体,群体种植于大田后,取玉米的幼苗作为提取基因组dna的样本,玉米授粉后调查穗位高性状作为全基因组关联分析(genome

wide association study,gwas)的表型数据。基因组dna经酶切后与适当的接头连接,构建基因组测序文库,采用illumina nova seq 6000测序平台,对文库进行双末端测序(pe150),读长(reads)为2
×
150bp。对产出的测序数据的进行质控与过虑,将质控合格的数据比对b73参考基因组序列,获得群体基因组中snp信息。
9.步骤(2)、对步骤(1)中获得的snp数据进行质控,质控标准为maf<0.05,缺失率>0.8,hw(哈迪

温伯格指数)>0.0001,利用软件snp eff(版本4.3t)的基因组结构注释数据
(gtf文件)对vcf文件中的snp/indel信息进行注释,即是否能够对基因编码蛋白造成影响,包括snp的突变类型和突变位置,氨基酸的变异类型和效应等。使用软件gapit(3.1.0)中的cmlm模型(compressed mixed linear model)对行粒数性状进行关联分析。关联分析时基于贝叶斯信息准则(bayesian information criterion,bic)的模型选择,找到gwas模型中最优的pcs数量,用以拟合最优的性状因子。
10.步骤(3)、对步骤(2)中获得的549211个合格的snp用于全基因组关联分析,当检出的snp的p值小于10

5时,认为这个snp达到了基因组水平的显著,经过全基因组关联分析,zmrzf基因的内含子区域检出3个snp位点符合上述条件,分别位于玉米第8号染色体chr8:156959358、chr8:156959642和chr8:156959657位置。
11.步骤(4)、对步骤(3)检出的显著位点不同基因型样本进行组间比较:
12.chr8:156959358位点t/t与(c/c+c/t)之间差异极显著(p<0.0001),组间均值差为10.637cm,基因型t/t为低穗位的极显著分子标记;基因型c/c和c/t为高穗位的极显著分子标记;
13.chr8:156959642位点g/g与(a/a+a/g)之间差异极显著(p<0.0001),组间均值差为10.215cm。基因型g/g是低穗位的极显著分子标记,基因型a/a及a/g是高穗位的极显著分子标记;
14.chr8:156959657位点g/g与(a/a+a/g)之间差异极显著(p<0.0001),组间均值差为10.637cm基因型g/g是低穗位的极显著分子标记,基因型a/a及a/g是高穗位的极显著分子标记。
15.利用上述技术措施,本发明最终获得了3个snp标记,分别位于玉米第8号染色体chr8:156959358、chr8:156959642和chr8:156959657位置:
16.位于玉米第8号染色体chr8:156959358位置,其核苷酸序列如seq id n01所示,序列159位的碱基y为c或t;
17.位于玉米第8号染色体chr8:156959642位置,其核苷酸序列如seq id n02所示,序列143位的碱基r为a或g;
18.位于玉米第8号染色体chr8:156959657位置,其核苷酸序列如seq id n02所示,序列158位的碱基r为a或g。
19.本发明的另一目的是提供所述snp分子标记在玉米穗位高性状相关的分子标记辅助育种中的应用。
20.位于玉米第8号染色体chr8:156959358位置的snp标记,基因型t/t为低穗位的极显著分子标记;基因型c/c和c/t为高穗位的极显著分子标记。
21.位于玉米第8号染色体chr8:156959642位置的snp标记,基因型g/g是低穗位的极显著分子标记,基因型a/a及a/g是高穗位的极显著分子标记。
22.位于玉米第8号染色体chr8:156959657位置的snp标记,基因型g/g是低穗位的极显著分子标记,基因型a/a及a/g是高穗位的极显著分子标记。
23.本发明通过全基因组关联分析(genome

wide association study,gwas)研究群体中多态性位点与性状的关联,进而研究未知基因的功能是一个非常有效的途径。
24.锌指(zinc finger)蛋白在真核生物基因组中分布很广、具重要作用,富含半胱氨酸和组氨酸残基构成的与锌结合的结构域,在序列上相当保守的一类蛋白质。据半胱氨酸
和组氨酸残基的数目和位置可将锌指蛋白分为c2h2、c2hc、c3hc4、c4hc3、c4、c6等多种类型,c和h分别代表cys和his。很多转录因子就是一类具有手指状结构域的锌指蛋白,对基因调控起重要的作用,锌指通过与靶分子dna、rna、dna-rna的序列特异性结合,以及与自身或其他锌指蛋白的结合,在转录和翻译水平上调控基因的表达。在蛋白质的降解,dna的修复,细胞的迁移、细胞分化以及胚胎发育等方面发挥重要的作用。
25.环锌指结构域(ring zinc finger domain)是锌指结构域的一类,它包括40

60个氨基酸残基,基序为cys

x2

cys

x9

39

cys

x1
‑3‑
his

x2
‑3‑
cys

x2

cys

x4

48

cys

x2

cys,x代表任何氨基酸残基,cys和his有时候可以互换。泛素化,是指泛素(一类低分子量的蛋白质)分子在一系列特殊的酶作用下,将细胞内的蛋白质分类,并对靶蛋白进行特异性修饰的过程。泛素化即通过加入泛素对蛋白质进行共价修饰,该过程依赖于一系列的酶对蛋白质进行作用,最后是由e3连接酶促进泛素从e2酶转移到靶蛋白。最普遍的e3连接酶含有一种称为环的锌指结构域,尽管环锌指结构域在泛素转移中的重要作用已被广泛认识,但它的分子机制目前仍不清楚。泛素化对蛋白质的代谢与功能起重要的作用,它参与了细胞周期、增殖、凋亡、分化、转移等许多重要的生命活动。
26.本发明首次发现zmrzf基因(zea mays ring zinc finger domain,zm00001d011636)的3个位点与玉米穗位高性状存在极显著的关联,其中,位于玉米第8号染色体chr8:156959358位置,核苷酸序列如seq id n01所示,序列159位的碱基y为c或t,导致供试玉米自交系群体基因多态性及穗位高性状极显著差异;位于玉米第8号染色体chr8:156959642及chr8:156959657位置,核苷酸序列如seq id n02所示,序列143位和158位的碱基r为a或g,导致供试玉米自交系群体基因多态性及穗位高性状极显著差异。以此作为玉米育种过程中穗位高性状的辅助选择标记,提高选择的准确性,加快品种培育进程。
附图说明
27.图1玉米研究群体穗位高性状次数分布的方柱形图;
28.图2玉米基因组dna检测电泳图(部分);
29.图3玉米穗位高性状全基因组关联分析的曼哈顿图;
30.图4玉米穗位高性状的全基因组关联分析的qq图;
31.图5zmrzf基因chr8:156959358位点不同基因型样本的穗位高次数分布的箱形图;
32.图6zmrzf基因chr8:156959642位点不同基因型样本的穗位高次数分布的箱形图;
33.图7zmrzf基因chr8:156959657位点不同基因型样本的穗位高次数分布的箱形图。
具体实施方式:
34.实施例1
35.1.1、gwas群体的构建
36.玉米全基因组关联分析群体包括431份不同亲缘关系的自交系。所有的自交系都由吉林大学植物科学学院提供,种植于吉林大学植物科学学院教学与科研实验基地(吉林省长春市绿园区)。小区排列遵循随机区组设计,区组3次重复,单行小区,行长3m,行距65厘米,株距20厘米,田间管理措施与大田相同。
37.1.2、样品的采集和表型数据的调查
38.小区玉米幼苗出苗后的5

6叶期,采集3株幼苗,清洗干净后置于

20℃冰箱冻存。玉米授粉后20天,每个小区调查有代表性的5个植株的穗位高(ear height,eh),以区组三次重复的平均值作为gwas分析的表型数据,调查数据采用excel 2013软件进行整理。
39.1.3玉米基因组dna的提取与检测
40.(1)取50

100mg玉米幼苗用液氮研磨成粉末,转移至1.5ml离心管中,加入400ul buffer pcl,8ulβ

巯基乙醇,震荡混匀。65℃水浴45min至样品完全裂解。
41.(2)加入200ul buffer pp,充分颠倒混匀,

20℃冰箱放置5min,室温10000rpm离心5min,将上清液(500

550ul)转移到新的1.5ml离心管中。若上清液混浊,可再加入等体积氯仿混匀,12000rpm离心取上清。
42.(3)加入等体积的异丙醇,颠倒5

8次使之充分混匀,室温放置2

3min。室温10000rpm离心5min,弃上清。
43.(4)加入1ml 75%乙醇,颠倒漂洗1

3min,10000rpm离心2min,弃上清。重复上述操作一次,开盖室温倒置5

10min至残留的乙醇完全挥发。
44.(5)得到的dna用50

100ul te buffer溶解。提取的dna可立即进行下一步实验或

20℃保存。
45.(6)1%琼脂糖凝胶(200v电泳30min)检测dna完整性,qubit2.0定量检测dna样本浓度。
46.1.4研究结果
47.自交系群体玉米穗位高性状样本均值61.82cm,中位数为60.40cm,平均偏差11.77cm,极差83.84cm,标准差14.91cm,变异系数0.241,95%置信区间为60.407

63.23cm,穗位高性状次数分布情况见图1。
48.玉米幼苗基因组dna采用rapid plant genomic dna isolation kit提取后,裂解液作用下裂解消化rna,有机相洗脱蛋白等杂质,得到纯净dna,dna样本经电泳检测合格后(>10ng/ul)、可用于基因组文库构建,电泳检测结果见图2。
49.实施例2
50.2.1、测序文库的构建
51.(1)200ng基因组dna用限制性内切酶ecori酶切,酶切消化完全后磁珠纯化回收。
52.(2)酶切后纯化的dna用t4 dna ligase连接barcode adapters pi,连接产物磁珠纯化回收,记录合格的p1引物标签。
53.(3)所有样本按要求等比例混合为一个总dna mix,使用covaris220将dna片段化,打断后的dna的碎片长度约为200

500bp。
54.(4)end repair&da

tailing后,连接adaptor p2,连接产物磁珠纯化回收。
55.(5)利用kapa 2g robust pcr kit扩增并富集接头连接产物,利用磁珠对pcr反应产物进行纯化分选,通过2%琼脂糖凝胶电泳检测构建完成的文库pcr纯化产物质量,合格的pcr产物进行二代测序。
56.2.2简化基因组测序(restriction site

associated dna sequencing,rad)
57.(1)采用illumina novaseq 6000测序平台进行双末端测序(pe150),读长(reads)为2
×
150bp。
58.(2)产出数据的质控与过虑:对碱基检出的错误发生几率进行预测,如果质量分值
(q

score)为低质量(q≤5(e))的碱基数占整条read的一半以上,则去掉该read,同时还去除用于样品识别的标签序列。
59.(3)利用stacks

1.08(http://creskolab.uoregon.edu/stacks/)分别对所有样品进行stack聚类分析,检测获得各样本tag序列,以及snp信息。
60.(4)数据比对以及snp

callling:采用bwa软件(版本0.7.17

r1188)进行基因组比对,将质控合格的数据比对b73参考基因组序列。
61.2.3、基因型检测与gwas
62.(1)变异检测和筛选:使用picard软件标记重复,samtools(1.9)对bam进行排序,bcftools(1.9)进行call snp。
63.(2)snp质控:质控软件为vcf tools(0.1.16)对snp,质控标准为maf<0.05,缺失率>0.8,hw(哈迪

温伯格指数)>0.0001。
64.(3)snp注释:软件snp eff(版本4.3t)利用基因组结构注释数据(gtf文件)对vcf文件中的snp/indel信息进行注释,即是否能够对基因编码蛋白造成影响,包括snp的突变类型和突变位置,氨基酸的变异类型和效应等。
65.(4)gwas:使用软件gapit(3.1.0)中的cmlm模型(compressed mixed linear model)对性状进行关联分析。
66.2.4研究结果
67.snp质控后,获得549211个合格的snp用于全基因组关联分析,关联分析时基于贝叶斯信息准则(bayesian information criterion,bic)的模型选择,找到gwas模型中最优的pcs数量,用以拟合最优的性状因子。玉米穗位高性状的gwas分析结果的见图3和图4,图3是关联分析结果的曼哈顿图,x轴是每个snp所在的基因组上的位置,y轴为cmlm模型下每个snp位点p值的以10为底的负对数。图4是关联分析的qq图,y轴是观察到p值以10为底的负对数,x轴是假设p值服从均匀[0,1]分布,所预期观察的p值以10为底的负对数;
[0068]
当检出的snp的p值小于10
‑5时,我们认为这个snp达到了基因组水平的显著,zmrzf基因的内含子区域检出3个snp位点符合上述条件,这三个位点分别位于玉米的第8号染色体的156959358、156959642、156959657位,生物信息学功能注释表明它们属于环锌指域蛋白超家族基因(ring zinc finger domain super family protein),已有的研究结果表明e3连接酶含有环锌指结构域,e3连接酶可以促进泛素从e2酶转移到靶蛋白上,而蛋白质泛素化参与了细胞周期、增殖、凋亡、分化、转移等许多重要的生命活动,结果详见表1。
[0069]
表1 zm00001d011636基因3个位点的关联分析
[0070]
[0071][0072]
实施例3检出显著位点不同基因型的组间比较
[0073]
3.1、zmrzf基因chr8:156959358位点组间比较
[0074]
zmrzf基因chr8:156959358位点包括三种基因型即c/c、t/t、c/t,不同基因型样本的穗位高分布的箱形图见图5;c/c组中位数为66.94cm、下四分位数q1为60.89cm、上四分位数q3为81.39cm;t/t组中位数为58.33cm、下四分位数q1为50.11cm、上四分位数q3为69.22cm;c/t中位数为68.48cm、下四分位数q1为59.67cm、上四分位数q3为72.66cm。
[0075]
不同基因型组间表型均值差异的t测验结果见表2,由表2可知c/c与t/t组间差异极显著(p<0.0001),组间均值差为10.084cm;t/t与(c/c+c/t)之间差异极显著(p<0.0001),组间均值差为10.637cm。因此,基因型t/t是更低穗位高的极显著分子标记,基因型c/c和c/t是穗位更高的极显著分子标记。
[0076]
表2 zmrzf基因chr8:156959358位点穗位高的组间均值比较
[0077][0078]
3.2、zmrzf基因chr8:156959642位点组间比较
[0079]
zmrzf基因chr8:156959642位点包括三种基因型即g/g、a/a、a/g,不同基因型样本的穗位高性状分布的箱形图见图6;g/g组中位数为58.17cm、下四分位数q1为49.87cm、上四分位数q3为68.56cm;a/a组中位数为68.31cm、下四分位数q1为61.31cm、上四分位数q3为79.95cm;a/g组中位数为64.10cm、下四分位数q1为59.67cm、上四分位数q3为76.78cm。
[0080]
不同基因型组间表型均值差异的t测验结果见表3,由表3可知a/a与g/g组间差异极显著(p<0.0001),组间均值差为9.489cm;a/g与g/g组间差异极显著(p=0.0006),组间均值差为11.919cm;g/g与(a/a+a/g)之间差异极显著(p<0.0001),组间均值差为10.215cm。因此,基因型g/g是较低穗位高的极显著分子标记,基因型a/a及a/g是较高穗位高的极显著分子标记。
[0081]
表3 zmrzf基因chr8:156959642位点穗位高的组间均值比较
[0082][0083]
3.3、zmrzf基因chr8:156959657位点组间比较
[0084]
zmrzf基因chr8:156959657位点包括三种基因型即g/g、a/a、a/g,不同基因型样本的穗位高性状分布的箱形图见图7;g/g组中位数为58.45cm、下四分位数q1为50.03cm、上四分位数q3为69.33cm;a/a组中位数68.31cm、下四分位数q1为61.72cm、上四分位数q3为82.06cm;a/g中位数为64.10cm、下四分位数q1为58.34cm、上四分位数q3为72.67cm。
[0085]
不同基因型组间表型均值差异的t测验结果见表4,由表4可知a/a与g/g组间差异极显著(p<0.0001),组间均值差为11.023cm;a/g与g/g组间差异显著(p=0.0194),组间均值差为9.149cm;g/g与(a/a+a/g)之间差异极显著(p<0.0001),组间均值差为10.637cm。因此,基因型g/g是较低穗位高的极显著分子标记,基因型a/a及a/g是较高穗位高的极显著分子标记。
[0086]
表4 zmrzf基因chr8:156959657位点穗位高的组间均值比较
[0087]
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1