与棉花衣分性状显著相关的基因、SNP标记及其应用的制作方法

文档序号:17423429发布日期:2019-04-17 02:32阅读:268来源:国知局
与棉花衣分性状显著相关的基因、SNP标记及其应用的制作方法
本发明涉及棉花衣分性状分子生物学领域,具体而言,涉及与棉花衣分性状显著相关的基因、snp标记及其应用。
背景技术
:棉花是天然纺织纤维的主要来源,也是世界上重要的经济作物。陆地棉(gossypiumhirsutuml.),是一种异源四倍体棉种,约占全球棉花产量的95%。提高棉花产量一直是棉花育种工作的重要目标。其中,皮棉产量是衡量棉花产量的重要指标,由单株铃数、衣分、单铃重等性状构成。众多研究发现,衣分与棉花产量之间存在显著的正相关,并且衣分也是棉花高产量育种的重要性状指标。然而,传统育种工作仅仅通过田间表型鉴定的方式对衣分性状进行改良,效率低下,假阳性高。因此,鉴定衣分性状紧密相关的分子标记和基因,通过分子育种手段针对性改良衣分性状,对棉花育种具有重要的理论和应用价值。有关研究表明,有利的遗传变异可以提高植物环境适应性和产量性状。然而,大多数植物的性状都为复杂数量性状,受多基因的微效效应控制。因此,对目标性状的基因鉴定相对来说是很困难的。连锁分析和全基因组关联分析是目前挖掘复杂性状遗传变异最常用的研究方法。棉花的衣分性状是典型复杂的数量性状,由微效多基因调控。在以往的研究中,基于双亲的杂交后代群体剖析棉花衣分性状遗传机理是最常用的策略。在棉花中,基于连锁分析的作图群体,构建了多张种间和种内遗传图谱,并被广泛用于棉花复杂数量性状的相关研究之中。棉花产量和纤维品质性状的qtl定位研究取得了不错的成果。目前,研究者利用不同的作图群体共鉴定4882个与棉花产量、纤维品质、抗逆性和种子等性状相关的qtls。其中,与衣分性状相关的qtl位点有327个,分布于不同的染色体上。由于作图群体构建的耗时性及连锁分析定位精度低等条件的限制,衣分性状qtl位点的精细定位和关键基因克隆难以实现。近年来,全基因组关联分析(genomewideassociationstudy,gwas)逐渐成为挖掘植物复杂数量性状的遗传变异及候选基因的一种快捷、方便及有效的研究方法,已经被广泛应用于水稻,玉米,油菜和大豆等作物复杂数量性状的研究中。与其他模式作物相比,棉花基因组庞大,结构复杂及分子标记多态性低,因此,关联分析在棉花中的应用相对滞后。随着棉花基因组测序的完成、基因芯片和高通量测序技术的快速发展,棉花中挖掘了大量的snp标记,极大地促进了全基因组关联分析在棉花上的应用。近年来,利用高密度snp标记的全基因组关联分析策略,研究人员发现了许多与棉花产量、纤维品质和抗性有关的遗传位点。其中,利用全基因组关联分析策略探析目标性状的遗传机理,在棉花衣分性状也有相关报道。su等利用简化基因组测序技术(slaf)对355份陆地棉材料进行基因型鉴定,结合多个环境目标性状表型的调查,开展了衣分性状的gwas研究及相关候选基因的挖掘。通过整合gwas及rna-seq分析的方法,鉴定到了一个可能调控衣分性状的候选基因gh_a02g1268。另外,huang等利用cottonsnp63k基因芯片及gwas分析方法对503份陆地棉自然群体重要农艺性状进行遗传解析,共鉴定到了21个与衣分显著相关的snp位点。通过显著snp侧翼区域的连锁不平衡分析来进行候选基因的挖掘,共发现17个控制衣分性状候选基因。进而,通过生物信息学方法分析发现gh_d08g2376与at3g07020及ghsgt1基因同源,推测gh_d08g2376可能通过调控种子大小及纤维发育进而影响衣分性状。总的来说,对衣分性状遗传基础的研究相对有限,还需要进一步的相关研究。有鉴于此,特提出本发明。技术实现要素:本发明的第一目的在于提供与棉花衣分性状显著相关的基因,以276份陆地棉为材料,采用分子生物学手段和性状进行大量生物信息分析得到,为棉花性状改良育种工作提供良好的基础。本发明的第二目的在于提供与棉花衣分性状显著相关的基因中的snp标记,可应用于种质鉴定、育种或遗传多样性分析,为棉花性状的研究提供良好的基础。本发明的第三目的在于提供用于检测该snp标记的产品,为该snp标记的检测提供便利。为了实现本发明的上述目的,特采用以下技术方案:与棉花衣分性状显著相关的基因,为基因gh_d05g1124和/或gh_d05g0313,其中,基因gh_d05g1124的核酸序列如seqidno:1所示,基因gh_d05g0313的核酸序列如seqidno:2所示。本发明以276份陆地棉材料为材料,种植于多个环境中。采用cottonsnp63k基因芯片进行基因分型,共获得10660个高质量的snps,并用于遗传结构分析和gwas。通过gwas分析,共发现23个与衣分性状显著相关snps,对应15个qtls。另外,通过qrt-pcr分析,确定了gh_d05g1124和gh_d05g0313为调控衣分性状的候选基因。基因gh_d05g1124和gh_d05g0313均位于棉花第dt05条染色体上。对基因gh_d05g1124和gh_d05g0313进一步分析发现,基因gh_d05g1124的第10个外显子区域序列和基因gh_d05g0313的第1个外显子区域序列对衣分性状有显著影响。进一步地,与棉花衣分显著相关的基因为基因gh_d05g1124的第10个外显子区域序列和/或基因gh_d05g0313的第1个外显子区域序列。本发明还提供了含有上述的与棉花衣分显著相关的基因或其反义链的载体。本发明还提供了含有上述的载体的宿主。本发明还提供了与棉花衣分显著相关的snp标记,所述的snp标记包括以下中的任一种或两种:位于基因gh_d05g1124第10个外显子区域,以基因gh_d05g1124的起始密码子计算,位于第6498碱基处,其核苷酸为g/a;位于基因gh_d05g0313第1个外显子区域,以基因gh_d05g0313的起始密码子计算,位于第176碱基处,其核苷酸为g/a。即snp标记位于如seqidno:1所示的核酸序列的第6498位碱基,和/或位于如seqidno:2所示的核酸序列的第176位碱基。本发明进一步分析发现,衣分性状主要与snp位点核酸变化相关,得到与衣分显著相关的snp标记,并且衣分性状的表型值与snp位点有利等位变异的聚集呈正相关。因此,与衣分显著相关的snp标记对棉花衣分性状的研究和应用提供理论支持。本发明还提供了用于检测上述的snp标记的引物对、探针或芯片。检测上述的snp标记的引物对、探针或芯片根据上述的基因序列进行设计即可。如检测基因gh_d05g1124上的snp标记的引物对如seqidno:3-4所示;检测基因gh_d05g0313上的snp标记的引物对如seqidno:5-6所示。本发明还提供了含有上述的引物对、探针或芯片的试剂盒。本发明还提供了所述的snp标记在棉花种质鉴定、育种或遗传多样性分析中的应用。本发明还提供了一种高产棉的鉴定方法,包括以下步骤:提取待检测的棉花的基因组,对上述的snp标记进行检测,若为gg基因型则为高产植株。本发明还提供了一种棉花育种方法,包括以下步骤:提取待检测的棉花的基因组,对上述的snp标记进行检测,挑选出gg基因型作为高产植株继续杂交繁殖。进一步地,所述待检测的棉花包括适宜于有性繁殖、植物性繁殖或可再生的细胞的组织培养的材料;适宜于有性繁殖的材料选自花粉,子房,胚珠,胚囊和卵细胞;适宜于植物性繁殖的材料选自插枝,根,茎,细胞,原生质体;适宜于可再生的细胞的组织培养的材料选自叶,花粉,胚,子叶,下胚轴,分生组织细胞,根,根端,花药,花,种子和茎。进一步地,检测所述snp标记的方法包括以下一种或几种:基于凝胶电泳的snp检测法、dna测序法、dna芯片法、变性高效液相色谱法或质谱检测法。与现有技术相比,本发明的有益效果为:(1)本发明提供了与棉花衣分显著相关的基因,以276份陆地棉为材料,采用分子生物学手段和性状进行大量生物信息分析得到,为棉花性状改良育种工作提供良好的基础。(2)本发明还提供了与棉花衣分显著相关的基因中的snp标记,可应用于种质鉴定、育种或遗传多样性分析,为棉花性状的研究提供良好的基础。(3)本发明提供了用于检测该snp标记的产品,为该snp标记的检测提供便利。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。图1为本发明实施例1中snps在陆地棉26条染色体上的分布图;图2为本发明实施例1中276份陆地棉衣分性状在多个环境下的表型表现图;图3为本发明实施例3中自然群体种群结构图;图4为本发明实施例3中276份陆地棉亲缘关系热图;图5为本发明实施例3中自然群体亲缘系数分布图;图6为本发明实施例3中自然种群的全基因组ld衰退距离估算图;图7为本发明实施例4中衣分性状blup值的全基因组关联分析图;图8为本发明实施例5中候选基因gh_d05g1124的相关分析图;图9为本发明实施例5中候选基因gh_d05g0313的相关分析图;图10为本发明实施例5中优异等位变异的聚合效应图。具体实施方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。实施例11、材料与方法试验材料选取和田间试验设计在本研究中,主要收集了来自中国农业科学院棉花研究所国家棉花种质资源中期库中在不同历史阶段发挥过重要作用及有代表性的棉花品种和本研究团队长期高产育种实践中积累的育种基础材料,共276份陆地棉材料,用于后续的关联分析。这些材料按地理来源可分为五大类:黄河流域品种(yrr),长江流域品种(ytrr),西北内陆流域材料(nw),北方早熟品种(nsemr)及来自世界其他国家的品种。所有材料分别于2016年-2017年在五个地点种植。即:河南安阳(2016-2017)、湖北荆州(2016-2017)、江西九江(2016)、湖北黄冈(2017)和安徽安庆(2017),分别标记为16ay、16jz、16jj、17ay、17jz、17hg及17aq。田间试验均采用完全随机分组设计,两个重复。在每个环境中,所有材料都单行种植,行长6.0米,行宽0.8米,每行种植20-25株。每个种植环境均以当地常规方法进行田间管理。2、农艺性状的鉴定及表型数据统计分析在吐絮盛期,每行随机摘取10个植株中部吐絮正常的25个棉铃,计算衣分。衣分计算公式为:衣分率(lintpercentage,简称lp)(%)=皮棉产量/籽棉产量。利用r软件包对多个环境下衣分性状的表型数据进行基本描述统计分析、不同环境间衣分性状的皮尔逊相关性分析(pearsoncorrelationanalysis)及双因素方差分析(two-wayanova)。另外,利用r语言lme4软件包对所有环境衣分性状进行最佳线性无偏估计(blup)及广义遗传力的计算。衣分的广义遗传力(h2)的计算公式为h2=δ2g/(δ2g+σ2ge/n+σ2e/nr),σ2g是遗传方差,σ2ge是基因型和环境(g×e)方差,σ2e是误差方差,n代表环境个数及r代表重复数。其中,σ2g,σ2ge及σ2e等参数利用lme4软件包中的lmer函数进行估算。3、lp表型变异分析本研究中,收集了来自不同生态区的276份陆地棉,并构成自然群体,用于全基因组关联分析。在不同的环境下对表型进行了考察,表型数据呈现出丰富的变异。在7个环境中lp分布于12.89%-49.62%之间,平均值为31.26%。在不同环境中变异系数的变化范围为7.68%-11.20%,衣分均值为35.97%-39.53%(表1)。另外,在不同环境中性状峰度及偏度的绝对值小于1或近似1。由此可知,衣分性状在所有环境下近似连续的正态分布(图1)。表1衣分性状表型数据的基本描述统计为了减少环境对性状表型的影响,对所有环境的衣分表型的blup值进行了估计。衣分性状blup值变化范围为22.37%-43.28%,平均值为37.51%,变异系数为7.78%。方差分析结果表明,基因型(g)、环境(e)及基因型与环境(g×e)间的互作都达到极显著性水平(表2)。表2方差分析结果另外,lp的广义遗传力高达90.7%(表2)。然后,通过对不同环境间衣分性状的相关性分析发现,不同环境间的衣分表型间存在显著的正相关关系(图2)。总的来说,衣分性状还是相对稳定的,主要受遗传效应控制,适合用于关联分析。实施例2采用改良的ctab法提取每个材料幼叶组织的dna。利用cottonsnp63k芯片对材料进行基因分型。利用genomestudiov2011.1分析软件对snp分型结果进行质量控制。然后,根据检出率(callrate)>85%及最小等位基因频率(maf)>0.05等标准对snp进行进一步的筛选。最后,把snp的探针序列与陆地棉参考基因组tm-1(gossypiumhirsutum(ad1)genomenau-nbiassemblyv1.1&annotationv1.1)进行序列比对,以此来获取snp的物理位置。比对结果显示,14977个snp比对到未确定染色位置的scaffold区域,48081个snp比对到染色体上,这些比对到染色体上的snp将用于进一步分析。然后,根据设定的过滤标准,即callrate>85%及maf>0.05。最后,获得10660个高质量的snps,并用于后续相关分析中。这些高质量的snp标记不均匀地分布在26条染色体上,发现在dt亚基因组(6480)上的snp数目多于在at亚基因组(4180)上的snp。snp标记在26条染色体上的分布密度范围为86.43kb/snp(dt07)-502.70kb/snp(at02),平均标记密度为237.32kb/snp。此外,在26条染色体中,pic值也有所不同,从0.2(dt06)到0.29(at13),平均值为0.25。所有染色体的基因多样性平均值为0.31,变化范围为0.24(dt06)到0.37(at01、at05及at13)(表3)。表3陆地棉26条染色体上的snps,pic及genediversity等信息统计表实施例3基于structure2.3.4软件中的贝叶斯模型对276份陆地棉材料进行群体结构分析。群体数(k)设定为1-10,其中不作数迭代(lengthofburn-inperiod)设置为10000,蒙特卡罗迭代(markochainmontecarlo,mcmc)设置为100000,每个k值独立的运行5次。然后,参考evanno等方法,根据lnp(k)及δk值来推测群体的最优亚群数目。利用clumpp软件对最优k值的五次运行的结果进行了整合,以此获得群体结构矩阵(q矩阵)。此外,使用gapit软件包进行主成分分析(pca)和亲缘关系分析。利用powermarkerv3.25软件计算多态性信息含量(polymorphicinformationcontent,pic)、基因多样性(genediversity)及nei’s遗传距离。然后,使用mega6.0软件基于nei遗传距离,构建进化树。最后,利用plink软件,计算不同位点之间的连锁不平衡系数r2,参数设置为:--ld-window-r20--ld-window99999--ld-window-kb1000。基于r语言gapit软件包中的混合线性模型(mlm)方法,并以群体结构矩阵(前三个主成分构成)及亲缘关系矩阵(k)作为协变量,整合多个环境的衣分表型数据及基因型数据进行全基因组关联分析。关联结果显著性阈值(p)是根据标记数进行计算的(p=1/n,n是使用的snps总数)。利用haploview4.2软件进行ld区块分析及绘制。曼哈顿图由r语言qqman软件包绘制。在全基因组关联分析中,关联群体的遗传结构可能会影响结果的可靠性。因此,有必要对关联群体的群体结构进行评估。这里,基于10660个基因分型结果,采用三种不同的方法对群体结构进行分析,具体见图3。其中,(a)k=1-10时,lnp(k)的变化图;(b)δk与k值的关系图;(c)k=2时,自然群体的群体结构;(d)主成分分析;(e)基于nei’s遗传距离的nj聚类树。首先,structure软件对群体的遗传结构分析结果显示,当k从1增加到10时,lnp(k)值不断增大(图3a)。当k=2时,δk达到最大值(图3b)。这表明该群体存在两个亚群(图3c)。主成分分析与群体结构分析结果相似。其中,这两个亚群之间有一些材料混杂在一起(图3)。nj聚类树结果显示关联群体可划分为两个类群(图3e)。同样地,亲缘关系分析的聚类图结果也于上述结果相吻合(图4)。综上所述,本研究中的自然群体可分为两个亚群。群体内个体间的亲缘关系是影响关联分析定位精度的另一个因素。在本研究中,大多数材料间的亲缘关系都小于0.2,约占88.71%。其中,亲缘关系系数为0的材料占58.74,只有2.37%的材料间的亲缘关系系数大于0.5(图5)。这些结果表明,本研究选取的自然群体个体间的亲缘关系较远。我们对snp位点间的连锁不平衡参数r2进行统计发现,该群体的ld距离约530kb(图6)。综合上述结果可知,我们选取的自然群体群体结构不复杂,个体间亲缘关系较远以及群体ld衰减距离适中。因此,该群体适合用于全基因组关联分析。实施例41、衣分性状的全基因组关联分析本研究中,为了减少关联结果的假阳性,利用混合线性模型(mlm)方法,并以主成分分析的群体结构(pcs)及亲缘关系(k矩阵)作为关联分析的协变量。整合已鉴定的高质量的snp数据及田间表型数据(包括单独环境的表型数据及bulp值)进行关联分析,以探析调控衣分性状的遗传位点或候选基因。根据不同环境中衣分性状的关联结果,将显著性阈值调整为p=1.0×10-3。最后,共鉴定到23个与lp显著关联的snps,它们随机分布在13条染色体上(图7a)。其中,7个位于dt05染色体、4个位于dt10染色体及2个位于dt13染色体,剩下的10个snps位于其他10条不同的染色体上,即at01、at03、at05、at07、at10、dt01、dt02、dt04、dt09和dt11。这些snp解释的表型变异范围为4.20%-10.23%,平均为5.68%。另外,有11个snps在至少两个环境中被同时检测到。其中,位于at03及dt05染色体上的4个snps(i56741gb、i61131gt、i08888gh和i00252gh)在5个环境中被同时检测到。位于at03染色体上的snp位点i56741gb具有最高的-log10(p)值即5.10,同时也解释了最多的表型变异率。而位于dt05染色体上的snp位点i00252gb是dt05染色体上-log10(p)值最高(5.06)及对性状具有最大的表型贡献率(8.05%)。图7中,(a)blup值关联分析的曼哈顿图。(b)blup值关联分析的q-q图。考虑本研究关联群体的连锁不平衡衰减距离及参考前人对qtl的定义,我们将与lp显著关联的snp上下游各延伸200kb的区域视为一个qtl,当相邻qtl的物理区间有重叠时,则认为是同一个qtl。根据这一原则,检测到了15个qtls,分布于不同的染色体上。除qlp-dt05-1(含5个)、qlp-dt05-2(含2个)、qlp-dt10-2(含3个)及qlp-dt13(含2个)四个qtls以外,其余qtl只含有一个显著的snp位点。2、与已报道qtl进行共定位为了验证gwas方法的可行性和本研究关联结果的可靠性,把本文中检测到的qtl与前人利用连锁分析或关联分析方法报道的lp性状qtl进行比较。首先,从cottonqtldb数据库中收集已报道的lp性状的qtl及gwas位点。然后,从cottongen数据库下载ssr标记的引物序列。最后,利用e-pcr程序将引物序列与参考基因组进行比对,确定ssr标记的物理位置。即将snp位点与ssr标记整合到一张物理图谱上,然后进行比较。通过这种方法,鉴定到9个qtls与11个前人报道的qtl共区间,它们分别分布于at03、at05、at10、dt02、dt04、dt05、dt09、dt10和dt11等不同染色体上。其中,有6个qtls与已报道的qtl(qlp-a-1、qlp-chr10-1、qlp-chr14-1、qlp-chr21-2、tmb0206和mghes46)有重叠区域,其余qtl分别与qghlp-c5、jespr220、nau3269、qlp-19或qlp-d10_16相邻。这些结果证实了我们试验方法及关联结果的可靠性。实施例51、转录组测序数据及荧光定量pcr分析在公共数据库ncbi上,下载陆地棉参考基因组(tm-1)的棉花组织(根、茎、叶、胚珠和纤维发育时期)的转录组测序数据。利用tophat及cufflinks软件对转录组测序数据进行序列比对及基因表达分析。最后,用fpkm(fragmentsperkbmillionfragments)值来表示基因的表达量。使用trizol试剂盒提取棉花胚珠不同发育时期(0,10,20,30dpa)及纤维不同发育时期(10,20,30dpa)rna,并利用nanodrop2000超微量分光光度计检测rna的浓度,然后使用takara反转录试剂盒进行反转录。该实验基于染料法(sybr)在lightcycler480荧光定量pcr仪上进行。试验选用ghhistone3基因作为内参基因,并采用2-δct方法分析荧光定量pcr试验结果。基因特异性引物如表4所示。表4荧光定量引物信息genenameforwardprimer(5'-3')reverseprimer(5'-3')gh_d05g1124ggattctgaaagctggtggtcaatttgcctttcagcaggtgh_d05g0313tgccttttggaaagcaaatcgcaactctcgttccttgctcghhis3tcaagactgatttgcgtttccagcgcaaaggttggtgtcttc2、候选基因的鉴定本研究中,共鉴定出434个候选基因。陆地棉参考系tm-1不同组织的rna-seq数据分析结果显示,263个基因在不同的组织及器官中优势表达。其中一些基因已经被确定参与棉纤维发育,如ghupl7、ghtub5和ghck1等。这说明本发明鉴定候选基因方法的可靠性。为了进一步确定与lp性状的snp位点或基因,我们重点考察在多个环境中被连续鉴定到的及显著性最高snp位点。位于dt05染色体上的snp位点i00252gh不仅在5个环境中同时被鉴定到,且具有最低的p值及解释最大的表型变异。因此,i00252gh作为进一步研究对象。本研究中,利用显著snp位点侧翼200kb进行候选区域的鉴定。基于此,在dt05上鉴定到了一个候选区间9.41-9.81mb(图8a,b)。其中,图8a:dt05染色体候选区间9.41-9.81mb曼哈顿图图;图8b:候选区间的ld区块分析。ldblock分析表明,该候选区域存在两个blocks(图8b)。其中,一个block长度为7kb,含有2个snps,另一个跨越71kb的区域,含有5个snp。然而,重点研究的snp位点i00252gh没有落入任何一个block区域内。但发现i00252gh位点位于基因gh_d05g1124第10外显子区域上,并且i00252gh是一个非同义突变snp。具体地,i00252gh在陆地棉d亚基因组第5条染色体9611840碱基处。碱基的突变导致了氨基酸的变化,即由天冬氨酸转换为甘氨酸(图8c)。图8c:候选基因的结构及其非同义突变位点。该基因在拟南芥中的同源基因是编码蛋白磷酸酶2c家族蛋白。另外,还研究了相同位点不同等位基因对lp性状的影响。研究发现,等位基因g对lp的表型有正效应,即携带g等位基因的材料lp显著高于a等位基因的材料(图8d)。图8d:具有不同等位基因的材料衣分性状的差异表现。此外,陆地棉tm-1不同组织的rna-seq数据显示,gh_d05g1124在胚珠和纤维发育过程中优势表达(图8e)。图8e:候选基因在胚珠及纤维发育时期的表达水平。qrt-pcr分析表明,该基因在胚珠和纤维发育过程中表达量逐渐增加,在30dpa胚珠及30dpa纤维时表达量达到峰值。这些结果表明,gh_d05g1124基因参与了陆地棉胚珠及纤维的发育过程,可能是调控陆地棉衣分性状的候选基因之一。前人研究表明,位于基因区域导致氨基酸变化多态性标记最有可能是与目标性状有关的功能位点。基于此,我们发现一个非同义snp位点i08888gh,位于基因gh_d05g0313的外显子区域,并且造成氨基酸由天冬氨酸转变为丝氨酸(图9a-c)。具体地,i08888gh在陆地棉d亚基因组第5条染色体2687718碱基处。图9a:dt05染色体候选区间2.48-2.88mb曼哈顿图;图9b:候选区间的ld区块分析;图9c:候选基因的结构及其非同义突变位点。此外,根据该位点的等位基因类型a和g,可将本研究材料的lp分为两组。携带g等位基因的材料lp显著高于携带a等位基因的材料(图9d)。图9d:具有不同等位基因的材料衣分性状的差异表现。此外,qrt-pcr分析表明gh_d05g0313在30dpa胚珠中表达量高(图9e)。图9e:候选基因在胚珠及纤维发育时期的表达水平。gh_d05g0313在拟南芥中的同源基因是atlut2,该基因在植物光合作用中起着重要的作用。由于棉花胚珠和纤维的发育同样需要光合作用,因而我们推测该基因是调控衣分的另一个候选基因。棉纤维是来源于胚珠表皮的高度伸长细胞,与胚珠表皮纤维细胞突起、纤维伸长和次生壁增厚等过程密切相关。据先前的研究报道,调控lp的基因可能在纤维发育时期高度表达。到目前为止,研究者使用不同的关联群体通过gwas方法鉴定出一些与lp相关的基因,如gh_a02g1268,gh_d08g2376,ail6和eil,gh_d03g1064和gh_d12g2354,和gh_d02g0025。本研究中,鉴定到的15qtls区间内含有434个基因,其中263个基因在不同组织及器官中优势表达。本发明重点关注gh_d05g1124和gh_d05g0313这两个基因,因为显著snp位于它们的外显子区域并导致氨基酸的变化。同时,rna-seq和qrt-pcr分析表明,这两个基因在30dpa胚珠中表达量高。另外,它们在拟南芥中的同源基因是pp2c及atlut2,分别参与了蛋白质磷酸化和光合作用。由于这两个过程与纤维的发育有关,因此,推测gh_d05g1124和gh_d05g0313这两个基因是调控lp的候选基因。3、优异等位变异位点分析优异等位变异是作物育种的宝贵资源,优异等位变异位点的积累能有效改善作物目标性状。优异等位变异位点的利用已经在多种作物中报道过。例如,通过gwas鉴定到一些小麦中优异的等位变异位点,同时发现9个优良的等位基因的聚合使得小麦栽培种品东34的千粒重在多个环境下被提高,因而提出适当的优势等位基因的聚合将有利于改善小麦的产量性状。同样地,在油菜中,研究者发现与早熟显著相关的优势等位基因的聚集可导致花期或成熟期提前。棉花中也有类似地报道,li等选择3个有利的snp等位基因来鉴定等位基因变异对陆地棉黄萎病抗性的影响,发现通过聚合有利的snp等位基因可以提高材料的抗病性。相应地,本研究中发现i00252gh和i08888gh这两个与lp显著关联的snp位点,对lp表型变异有积极的影响,即i00252gh和i08888gh位点携带g等位基因的材料lp高于携带a等位基因的材料。同时,发现lp的表型值随着有利等位基因数的增加而不断增加(图10)。即图10中,0表示不具有本发明提供的i00252gh和i08888gh两个位点的有利等位变异的材料,1表示具有本发明提供的i00252gh和i08888gh两个位点的任一个有利等位变异的材料,2表示具有本发明提供的i00252gh和i08888gh两个位点的有利等位变异的材料。因此,我们可以通过分子标记辅助将这些优异等位位点聚集到一起,进而促进棉花衣分性状改良育种。然而,在276份陆地棉材料中,只有16个品种含有两个有利等位基因。这些优异等位变异位点还没有得到很好的利用,但这些有利等位变异在棉花育种中的应用前景十分广阔。总之,本发明以276份陆地棉材料为材料,种植于多个环境中。采用cottonsnp63k基因芯片进行基因分型,共获得10660个高质量的snps,并用于遗传结构分析和gwas。通过gwas分析,共发现23个snps及相应15个qtls与lp显著相关。另外,通过qrt-pcr分析,确定gh_d05g0313和gh_d05g1124为调控lp性状的候选基因。此外,还发现lp性状的表现与有利snp等位基因的聚集呈正相关。因此,这些优良等位基因的聚合可能有利于棉花性状改良育种工作。总的来说,上述的发现增强了对棉花lp性状遗传基础的认识,并有助于探索衣分性状的分子机制。尽管已用具体实施例来说明和描述了本发明,然而应意识到,在不背离本发明的精神和范围的情况下可以作出许多其它的更改和修改。因此,这意味着在所附权利要求中包括属于本发明范围内的所有这些变化和修改。sequencelisting<110>中国农业科学院棉花研究所<120>与棉花衣分性状显著相关的基因、snp标记及其应用<130>2018<160>6<170>patentinversion3.3<210>1<211>6526<212>dna<213>gossypiumhirsutuml.a<220><221>misc_feature<222>(712)..(712)<223>nisa,c,g,ort<400>1atgggggtatatctcagcaccccaaaaactgagaagttatcagaagatggtgaaaatgac60aagcttcgatttggattgtcgtccatgcaaggatggcgtgcatctatggaagatgctgta120agttctctctctaccttctcattgtttgacttaatatactatctttgaatcattaactaa180agccatcggacttgccttctgttaacgacaaatcgtaatatctgcttttcatatatctag240tatacgtctcttaacaaggcattaaataatatctagtcttggccaatatcctatgtctag300tgtattgaataaatactaataactgcttatcttacacctattacatgcttcttgacatgg360tattaagaatcatataacttttaagctgagtgttaagatcgcatcatcacaaggcagtga420gaaagttccttagccttttactgattctatttttttgaatatcaaatcagattataaaga480tttcaaaagttaatctgctactttcttaaagttatttcacattgattggaatgttgtgag540tcatgacaataaattgacatgtaatttcttaaagttatttcatattgatgctaaggaatc600aaattacatgatatccatgctaaagatagacatgagacttagctggtaatattagtctga660tatctatggcacaagggatttttttcttttcttttttttttttttttttttngtacttgg720tgctggttggagcgtgggggttagcacctatggtacccaacctcgaggatgagtgtttga780tatgggtatatgtccaaaactggcatgctctatttttttctaagttttttcacatgtttg840gaagatcacacttcgatatccatgtctaaatatgtgccaaacacaagtgtcaaacatgca900tatttggaaaatgaagagtctaggtaacataggacagaagagtgtcagtttggactttag960aaatatttatcccaggttacacttttctaaaattttccatttagtcctgataacatagga1020aaatgaagagtctaggaaacataggatacaaaaacatgtccttttaatttgagctgtgct1080gaaacctaacgtatttatctcaagagataatttttgcttcttatgcgtgcacacatgctt1140ttttttggaagtaattgcttgatgcatttccaactatgttggaaacctgttatatctatg1200atgtttgagggatacaggtccttgttaaaagcatgtctgctataataattgatgattatt1260tccattttaactacaggccatttttgtacctcttgataactcaatttgccttcaatgatg1320ccatgaatttgtttttatggtttttgcagcatgcagcatatctggatctggacgactcaa1380catcattttttggtgtttatgatggtcatggaggtaaggattgagctcccttttttttgt1440ttgttcctttaatttttatcacatcactttattttttctttaaaaagttcacaaagttta1500gatttcagtgaagtttttcttccctttgctggtgctgtttgtattccttcttccgaatat1560aattttagttattcctttagcaaatcttaactgaccagtatgtgtgttggtcttgcactg1620gtaaagctactagagcaaaattatgtctttaaatactgaggttttatgatattacaagag1680accgacctgttgacacctgagtgtgtttaatacatatcattggaggcattagctttctct1740gtttgtatgcgtgtgtccttttctttttggttttgtgcaaatattattatataacttttc1800cttaactgtaggcgaaaggtgcaaccttgtttgtttagaaacggttattgtaacaacttt1860tatgttttcaattcataaaaaggagacaaagagaaagctaaaaacttggatctaaggatg1920tatctcatcaaatcttgttttttcttttcttgtttttgtttttagcactctttcggtaca1980aaataatatctgaagataatgttgagttgacagttcagtcccatatagtatacggtgcct2040taattggtggagctattttcttttatttgaaggtcgtttgtagtgtccagttgagcccaa2100taatccttttaaaatttgacttgcactgacactccattaatgattctgaatataccatca2160ccctttgattaccagtagagagcaagctgcattttgggcttgcttttcttgtattatgat2220gatattttctattagaaaatgagaaagggattggagctggttaatcacattactggatgg2280gtaagacctgcatgtacaggccatgccttagttggcaaaaagttcagcttccaccacagt2340tgggttcttaagatgcttctttgtaattgatagagttaagggcctagacactcaactcat2400tcttgagtttctatgcaatgcatgcttatgtctggctgcaaagtttcttcttgatttctc2460tgctaaaattggatttgaatgctttgaaatattgatgcatcttggagagtttccgggatg2520gagggtaccttcctttctcaggcagcttttgataaactgagattatgttctgcatagtta2580atagtatttgtaacatttcatgtttgtaaacttatagagaaagtttttagttcatataag2640ttgtgtaggtaaatattggtttctgtggaatgctttaaacaaaaaggttgagctgctcac2700aacagaattgttacttttgctcttgttcccttttttcttattgatgctttcatgattttc2760acagcttttatacataaaattagttgttgatctgattaaattctttgtacctagtcattt2820aagcatattatatgtgggtccatttatctgtaggcaaagcagtggctaagttttgtgcca2880agcatcttcatcagcaggtgctcaagcatgaggcgtattcagctggagatattgggactt2940cagtacagaaagcttttctcaggttcctttactggatttatttgtgtattcttttggtag3000caatatacggaagatatgtcatagctcaaccacaaggcagctgaaaaattgcctttgaca3060tgtaagtaatatgttctaagtttcctaggaatcaggcaatggaccatgtgcttggagctc3120catgatcattgccactcaaaatttgttaatgccatacatggttgtttaaagtttttcctt3180ttcatctaatgaatcccttatgacactgatgaaattgcattttgttatttacataaatgt3240tactgtttttaatggatagtttatttatagctccattctggcatatgctagtgccactgc3300atttttgactgtttaggtcattgttctctagcatattttgcttttttcactcatgaactt3360gaaatttaagagtatgatcaacttcattttactggataaaatatgatatagtaaggctgc3420ttcttgttaattgtttcttctgctatacatgcattcaactgctattttttttatcataca3480gaatggatgagatgatgtgtggacaaagaggatggagagaattagcagtcctgggagata3540aaatggacaaagtttctggttttgttgaagggtttgtatggtctcctaagggtgatgaag3600ccaatgaccattttgatgattggcctcctgaggaggtatttttgtgatagaaaactaaat3660ttttgtcttaggtgtatgaagcaatttcattttgtatgttactagacaatgtttcagtaa3720gatctaagctgcaagaccttaagtttttcttaagttgccgtgctcattcatgcaaaggag3780tccaagttttcaactaacccattacctgttctatagtaatatgctctagattttggtttt3840aggagtattcttgcataataaactctttataaattagttttgttatttgcttatttggta3900aactggaaaattgttatgggaataccactaacagaagcttcgtgtcttgtgaactttata3960caaacactttttatactatttttagtgaacttagacgtttttaattttaccaatcaatac4020ttttttagggaaatgacttaattgaaccaactctatgaagtatgctaattttaattgagg4080taggatatagtcaggaattgaacatgattagttaagttcactatattgtttttaggccta4140gatcaagagagggttgttaacaaaggaagaggaaagttattagaaacttttttgagttct4200atgagcctttgagaagcctaaacaacggagagtggatataattaaggagaaggaagatct4260ttgcttgaggttttaagatttattacaaggaatttgatacaaactggattggaaataata4320taaaaggggcatgtggacccttcttatgttaaaaggggttggatttcttcttattttgcc4380ctatgattctgtagaagaaaattggaaaacatgaaggaaactagcattctgtcgataagt4440acactctggttgtatgtttaagaattttctgcaggttacctaggactgtcatttactgtg4500gttacttgaagtatcatttgtgtttgagactttactatgattcatttaattctttcaatg4560caataccactaagtaagaagcttttgtttgattggtcaaatatgtctattacttgtgaga4620ttccgatgttgacttttctgttggttgccaactagggttctcactctgattttcatggac4680ctacttctggatgcacagcctgtgttgcaataattcgaaacaagcaactagttgttgcta4740atgctggtgattcccgttgtgtaatatctagaaaggggcaggtacaattttcttttctgc4800agaaccctgaaaacagaatttcagaattttgtttatttccacagagcctttccttaaggc4860ctctcaaagttgtgagatgaaaggatttacaagttgaatgacaagtagtgcttttgtcgt4920aagttaatattctagcacttttaagggactgttgttcttgcccttttaactgcatggaaa4980tggttgtagaaagtagcacatgcttttaccattttcaattttattgatgatattagagtg5040aaaaacatttgctctaagtgtaatagtcactatatttattgctgaactagcatgtaaagc5100atttatcaatgctccacgttcagattcctttttccttttacctctctcctttggatacac5160aatatggttcctctttaatacggcatagcttagctgctgcatgctttatttcatagatgt5220cactttttacaggcatataatttgtctaaagatcacaagccagaccttgaactggagaaa5280gataggattctgaaagctggtggttttattcaagtcggacgtgtcaatggaagtttaaac5340ttggccagggctattggtaccttctagatccaaggggacaatggatctaatatttatttg5400cttgttggtttatgattgtctttcacttgcaggagatgcggagttcaaacagaacaaaac5460tttacctgctgaaaggcaaattgtaacagctaatccagacatcaacactgtaagtgaatt5520gctttagcctttaatatttgtgttatattctagctctttcagtaaaatttgatgatggtc5580aattgatttagtaaagcgactaacttttgtagtattctttaagcaaaattaaaaacttct5640ttttgtattttttaaaaaaatcagacgcatgtataaaacttttgctgccatttaagcaaa5700agatacatcgttcccaattagtatccatatttatccacatgtttataatctggttttacc5760ctctttaaaataggttgagatctgcgatgacgatgagtttcttgttttagcttgtgatgg5820gatttggtgagtctcctattgtaagaacttgctttccttttaccctcctgctctgaaatc5880aaccttcagtcctacctggataccattcagaacacttaggtaatttgcagtagatggttc5940caggcctgtgacacattctggatgcacacatgcctacttgctaatcattctcaaagatta6000aatatcaagcaatctgtcataggaaatatatacataacatatatatgctttgctcatatt6060tgtttatgtatgtattatgcattgacatgtgtatatattaatttgctaaaaagataaaga6120gaacgtagtgtaccatttatagattcccttgggaattgggagcttgtaagatggccattg6180ctgaggatttttgttttcattaatttgaagatagcattgttgtgttttgttgattaggga6240ctgtatgtcaagtcaacaactagtggattatgtacgagagcagttgaattctgtaagttc6300cttcacaaaacattataaacctatcaatataaagattccattaattaactacagatctct6360tcccatggtgcaggaaactaaactttcagcaatctgtgaaagagtattcgacaggtgctt6420ggctccaacagctggtggggagggatgcgacaacatgacaatgatccttgttcagttcaa6480aaaacctgttggttcaggtacttctttgagcagcacccagcattga6526<210>2<211>3943<212>dna<213>gossypiumhirsutuml.a<400>2atgtgtttattagtttcgatggtgataacaatggagtgtgtcggagctcggaacttcgcg60gcaatggcggttcctacacgtgccttttggaaagcaaatctgatgaggactaaaacagcg120attccaagtcataatcggcttatttccttaaaggtgagagctagtggagcaaggagcgag180agttgcgttgcggttaaagaagatttcgccgacgaagaagatttcataaaggccggtggc240tctgagattctctttgttcaaatgcaacaaaataaagaaatggataaacagtcgaaatta300gcggataaggttttcactttgctcactttagttcgattttcatttgttggaactaatatc360gggagatatatggatattttccctttttttttggttatttctgcgtgtaaatatggaggc420cctactggtggcttttgagccacaagaatttacataaattggaaaaaaaatagttaaata480ctcatgaaagttatgacatatgatggtcacgtgcatctggtcaatagtatttggccgcct540tctttgcccttaatttttgtggtaccactaactagttagctttgttatttgatgttcgat600tggtattttctatttttgattttattttttaaaaaattgaagaaagattgcattttatta660gtgggttttactgtttcgttgaaatatccattttgagcctttgtgatagcatatatgttt720ttcacagttaccgcccatatcaactggggaaaacgtattggacctggtagttattggttg780tggtccggctggtcttgctcttgctgcagagtctgctaagttgggtttaaatgttggact840aattggccctgatcttccttttaccaataattatggagtatgggaagatgagtttaaagg900tattcacttcattttctaagcaatttatgtaagattcatttcgaagcaatcaaataaaca960ccaagttaatctaatgttcgttttcagatcttggccttgaaagatgtattgagcatgttt1020ggcgggacaccatagtataccttgatgatgataagcctattatgattggtcgtgcttatg1080gacgtgttagtcgatacttgctccatgaggagttgttgaggaggtaacaacagctccttg1140tcaatgatatttatggtcatttttctcttggttattgcttcttctactttcccgatcatc1200aatgtttaatttgtattaattttccctaggtgtatcgagtcaggtgtaatgtatcttaac1260tcgaaggtagagacgattgttgaagctaccgatggtcataatcttgtagtttgtgaacac1320aatcgtgtcgttccttgctggtactataatttctttttctcgtactgctattcctaaact1380tttaaccttttagtatcacaactcctttcaagcccctaatgtgctattataggcttgcta1440ctgttgcttcaggagcagcttcaggtaaactgttgcaatatgaggtagggggtccaaggg1500tctctgttcaaacagcttatggcgtcgaggttgaggtacgtatgatacactaactgtgat1560tgttaacagttgtacatatctttgcatttgttattttaatctcactgcagcatgaacaga1620agattactctttaagagggcgatggaagaaaaaatttctgaacttatttaacaggatacc1680tttttcttattacatcaggtggataacaatccttatgatccaagcctgatggttttcatg1740gattacagagactatgctaaacaagaagttcaatctttagaagcacaatatccaacattt1800ctttatgccatgcccatgtcttcaacaagagttttttttgaggtttgcaccatgcaatta1860atttgtttattgtttatgttgtatgccatgattaaatgcaaaatgatttagaaagttgca1920ttgcaggaaacttgtttggcctcaaaagatgccatgccttttgatttattaaagaagaag1980ctcatgtcaaggttagagagcatgggaatccggattttaaaagtttatgaagaggtaaac2040tgcatggtctaataagataccagattcattccgatataatgtatggattactttttatca2100ttactcagcaccaaaatagggctgcatgtcagtcatctccttgccattttataaattggt2160gttgatggtcaaaagatgactttctccacaagtcatttttctttactattcctcattcac2220gaacagcccctcaaatttgttagtagaaaatcagagaaaacagctcgtcacaaacaatgc2280cacatcaaattcaggattcacctttctatcatagtagcacataatttgctatcgacttgg2340tttttattcattattctggtcaatgatggagtgcagagcccaatgctcttaatcctggct2400tacttagaattaatgcccatctatctttgcacttctcaattagtagtctatctcatttca2460ttcctcacatttccatgttccaactgcatcatgaagtaacatgtgttgaatgccaatttt2520tattagcaagatgccatgtttcaatcttttgcaggagtggtcttacatcccagttggtgg2580ttccttgccaaacacagagcagaagaaccttgcatttggtgctgcagcaagcatggtgca2640tccagctactggtaggaattgggttaatagatatttccttcaataattaagacttaatac2700tgccaatctaaaccttcttaaacaggttattcggttgtcagatcattgtcagaggctcca2760aattatgcttctgtaattgcaaatatcctaaagaaggataattctaatggcttgcttacc2820agtgaaagaaataatgggaatatctcaatgcaaggtatgctgtgtgatttatcttctttt2880cctctcaacttcacccatttaagggtttgtaaacaagttcttcatcttaagcaagccaca2940gtaatggaaatctttttttttttagtaataaaagtcattaacaaatcaaaacaaactaaa3000ctgaagctcttaacgtattctggacatcatttttgagcaaggagcaacagcttggaatca3060gatgctcagaacaatgaactgctccatcttgaacagactcaatctttgccataaaatcag3120ccactttgtttgcttatactgcatatgcattatttgggtttagtaacatgattaatttct3180cttggtaaacgtgatgtcaattgtcatccttggtagttgttgtctttatgatttgtcatt3240tttcttttgcttggcttgtatgattaatttctcttcataaacgtgatgttaattgtgtgc3300cgtaatgctatggcgttttgtataatgtattaacaacttaaaattcaacgcatggtatca3360ccctcttaggatgtgttattataatttgattcagcttgggatactctttggccacaagaa3420aggaaacgccagaggtcattctttctctttgggctagcactcatactgcaactagatatt3480gaaggcattcgaacattcttccatacattcttccgtttgccaagttggtatgacttcata3540tttaccatcttttggtgtttatttataaagaaagccaagataactaacctttccctttcc3600acatcacccaaatattcagcttttaaacttgagacagaaaacataactccatgaataaac3660aaacctatcattaattttttttaaaattcatcattataaaagaaataatgcttgactagc3720atgagttgcatacttaaaattttactttgtaataactaaggaatatatttattgcaggat3780gtggcaaggatttcttggttctaatctttcctctgccgatctcattctgtttgcctttta3840tatgtttgtcatagcaccaaacgatatgagaatgtcccttgtcaggcacttaatctcaga3900tccaactggagcaactatgataagaacatatctcacaatatag3943<210>3<211>20<212>dna<213>人工序列<400>3ggattctgaaagctggtggt20<210>4<211>20<212>dna<213>人工序列<400>4caatttgcctttcagcaggt20<210>5<211>20<212>dna<213>人工序列<400>5tgccttttggaaagcaaatc20<210>6<211>20<212>dna<213>人工序列<400>6gcaactctcgttccttgctc20当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1