一个同时改良棉花纤维长度、强度、伸长率的ROPGEF基因及其应用

文档序号:33504968发布日期:2023-03-17 23:44阅读:75来源:国知局
一个同时改良棉花纤维长度、强度、伸长率的ROPGEF基因及其应用
一个同时改良棉花纤维长度、强度、伸长率的ropgef基因及其应用
技术领域
1.本发明属于生物技术应用领域,涉及一个与棉花纤维长度、纤维强度、纤维伸长率均相关的ropgef家族基因及应用。


背景技术:

2.棉花作为天然纤维的主要来源,是一种重要的经济作物。棉花生产不仅对我国农业乃至国民经济的发展有着重要的影响,而且在世界棉花贸易市场上也起着举足轻重的作用。此外,棉花纤维是优良的、使用最为广泛的天然纤维,更是纺织工业的重要原材料,在国民经济发展中具有举足轻重的地位。随着人们生活水平的提高,对天然纯棉织物的需求不断增加,对纤维品质的要求也愈来愈高。因此,深入挖掘和利用棉花品质相关的遗传变异就显得格外重要。
3.全基因组关联分析(genome-wide association study;gwas)是以基因组中数以百万计的单核苷酸多态性(single nucleotide ploymorphism,snp)为分子遗传标记,进行全基因组水平上的相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。随着基因组测序技术的提高及测序成本的降低,并结合生物信息学的高度发展,gwas成为挖掘和剖析人类疾病及作物农艺性状及抗性性状基因及其相关遗传机制最有效的方法之一。利用全基因组关联分析挖掘和克隆农艺性状相关基因,无需事先假定候选基因,其检测能力强,精度高,是分子育种研究的热点。belo等(2008)对553份优良自交系的8,950的snp进行了gwas分析,鉴定出与油酸含量相关的位点,这是玉米首次真正意义上的全基因组关联分析。huang等(2011)利用第二代测序技术对517份水稻地方种进行了重测序并获得上百万的snp,然后对水稻的14个农艺性状进行gwas分析,并成功鉴定出80个性状关联的位点。此外,他们还对多达950份水稻群体进行重测序,对开花期和10个产量相关性状进行gwas分析,鉴定出了很多已知功能基因(huang et al.2012)。lin等(2014)对世界各地的360份番茄种质进行全基因组重测序,通过群体分化分析,首次发现决定粉果果皮颜色的关键变异位点,即slmyb12基因启动子区域的603bp缺失,进而抑制该基因的表达,从而使得成熟的粉果番茄果皮中不能积累类黄酮,导致鲜食番茄和加工番茄的差异。zhou等(2015)对302份大豆野生、地方品种以及改良品种进行重测序,结合gwas分析技术,发现96个gwas关联位点与之前报道的qtl有关联,并鉴别出含油量、株高和茸毛生成相关的新的关联位点。fang等(2017)通过对318份陆地棉材料进行全基因组重测序,鉴定出25个棉花改良过程中的选择信号,通过gwas分析,共鉴定出119个关联位点,其中产量相关的关联位点71个,纤维品质相关的位点45个,还有3个位点与黄萎病抗性相关(fang et al,2017)。ma等(2018)重测序分析419个核心种质的陆地棉材料,发现7383个snp与这些性状显著相关,位于4820个基因内或基因附近。并且对控制开花,影响纤维长度,纤维强度的部分候选基因进行了重点分析(ma et al.,2018)。liu等(2021)则利用290份陆地棉栽培种组成的自然群体经过多年田间鉴定,结合高密度的snp标记对棉花枯萎病抗性进行了全基因组关联分析,鉴定得到主效抗
病位点fov7,并确定基因ghglr4.8是一种新的植物非典型主效抗病基因(liu et al.,2021)。以上结果充分说明,全基因组关联分析具有很高的定位精度,甚至可以达到单基因的水平,利用获得的与目标性状相关的功能标记,进行目标性状的筛选,可以大大加快育种进程和效率。
4.ropgef家族是植物所特有的,能够特异性催化rops,使其由gdp结合的非活跃形式转化为gtp结合的活跃形式,从而调控植物的生长发育和抗逆反应。ropgef家族含有保守的prone结构域,还有一个可变的n端和c端,研究显示,只有保守的prone结构域对植物的rop蛋白有催化作用。目前在拟南芥中有大量研究表明ropgef家族的基因可以调控植物组织的极性生长,如根毛突起和伸长,花粉管的伸长等(张志伟,2019)。


技术实现要素:

5.本发明的目的是提供一个ropgef家族基因long strong fiber(ghlsf)。全基因组关联分析结果表明该基因与棉花纤维长度、纤维强度和纤维伸长率这三个重要的纤维品质性状均密切相关。
6.本发明的另一目的是提供该基因的应用。
7.本发明的目的可通过如下技术方案实现:
8.一个同时改良棉花纤维长度、强度、伸长率的ropgef基因,该基因是ropgef家族基因ghropgef5包含一个碱基c的删除形成的,位于基因编码区序列的1988bp-1990bp位置处,该位点原有的碱基的缺失导致对应的蛋白质提前终止,该基因的基因组序列为:seq idno.2;并且ropgef基因(基因型为tca)的棉花品种的纤维长度,纤维强度,纤维伸长率等纤维品质性状均显著高于ghropgef5基因(基因型为tcc)的棉花品种。有意思的是,很多新疆培育的品种单倍型为tcc,表明本发明提供的ropgef基因有很大的利用价值。
9.本发明所述的基因ghlsf在鉴定优质纤维品质陆地棉品种中的应用。具体地,通过鉴定棉花中前述同时改良棉花纤维长度、强度、伸长率的ropgef基因的基因型,其中基因组序列的1988bp-1990bp位置上的碱基为tca的棉花鉴定为优质纤维品质陆地棉品种。
10.本发明所述的基因ghlsf在改良棉花纤维品质性状中的应用。具体地,可以通过基因工程及杂交设计的手段将含有优质单倍型tca的基因转入棉花品种中以提高棉花品质,也可以将单倍型tcc中的位点进行定点突变,改造成优质单倍型从而培育优质纤维棉花新品种。
11.本发明所述的转录因子基因ghlsf在通过基因工程手段培育棉花优质纤维新品种中的应用。
12.一种筛选优质棉花品种的方法,检测棉花中染色体a10上a10:112656815-a10:112656817位点的基因型,选择基因型为tca的的棉花即为优质纤维棉花品种。
13.进一步地,检测基因型的引物具体为:上游引物为:seq id no.5,下游引物为:seq idno.6。
14.进一步地,基因型为tca的棉花表达前述同时改良棉花纤维长度、强度、伸长率的ropgef基因,该基因中基因组序列的1988bp-1990bp位置上的碱基为tca。基因型为tcc的棉花表达ropgef家族基因ghropgef5,基因中基因组序列的1988bp-1990bp位置上的碱基为tcc。
15.本发明的优点表现在:
16.本发明通过棉花magic(多亲本高世代重组自交群体)的重测序和全基因组关联分析挖掘了一个与棉花品质性状,纤维长度、纤维强度和纤维伸长率这三个重要的纤维品质性状同时密切关联的ropgef家族基因ghlsf。本发明的基因ghlsf在全基因组关联分析中与棉花品质性状密切相关。本发明提供的ghlsf cdna和基因组序列由pcr技术获得,该技术具有起始模板量小,试验步骤简单易行而且灵敏度高的优点。
17.ghlsf在棉花不同组织和发育时期的表达水平分析由转录组测序所得。该基因与纤维品质性状构成因子相关。
18.ghlsf在相对高纤维品质和低纤维品质品种群体中的碱基缺失基因型通过pcr技术进行了验证,较易操作、灵敏度高和准确性好。
19.根据ghlsf的不同基因型可以将magic群体分为两大类,统计学分析方法发现,这两类群体之间的纤维长度、纤维强度和纤维伸长率存在显著性差异,进一步证明该基因与棉花品质性状之间的相关性。
附图说明
20.图1.棉花不同产量性状gwas关联分析结果。
21.横坐标为陆地棉a10染色体及位置(mb),纵坐标表示snp位点关联的显著性,用-log
10
(pvalue)表示。
22.图2.ghropgef5基因在棉花不同组织和发育时期的表达水平。
23.横坐标代表不同组织,包括根(root)、茎(stem)、叶(leaf)、花托(torus)、花瓣(petal)、雌蕊(stamen)、雄蕊(psitil)、萼片(calycle)、胚珠(ovule)和纤维(fiber)。胚珠组织包括了开花前3和1天、开花当天(0天)、开花后1到25天。纤维组织包括开花后5到25天。
24.图3.ghlsf的序列信息和不同单倍型的鉴定。
25.在magic群体中检测到ghlsf序列存在一个碱基c的删除,位于基因编码区序列的1988bp-1990bp位置处,该位点原有的碱基的缺失导致对应的蛋白质提前终止。左图展示了两种单倍型的基因组序列差异,右图则为两种单倍型导致的蛋白质结构变化。
26.图4.ghlsf的不同单倍型之间产量性状的比较分析。
27.箱图代表magic群体的品质性状的分布情况。横坐标为不同的单倍型,纵坐标为相应的品质性状数值,分别为品质性状中的纤维伸长率、纤维强度和纤维长度。含有tcc和tca两种单倍型的品种分别是36和720个。白色代表单倍型tca的品质性状分布,黑色代表tcc的品质性状分布。方框内的横线代表性状分布的中值。**表示在0.01水平上有差异;*表示在0.05水平上有差异。
具体实施方式
28.实施例1棉花品质性状关联的基因ghlsf的挖掘:
29.针对920个株系构建的多亲本高世代重组自交群体(magic群体),从2019到2020年,分别在新疆库尔勒、新疆石河子和安徽当涂县,每个株系田间种植三个重复进行了纤维品质性状(纤维伸长率、纤维强度、纤维长度、马克隆值、纤维整齐度)的详细调查。同时,对这920个株系进行了全基因组重测序,获得4.4tb测序数据,平均测序深度3.5
×
。将这些序
列比对到棉花陆地棉tm-1的基因组序列,利用生物信息学软件进行全基因组变异的鉴定,共挖掘到4,774,181个高质量的变异(最小基因频率》0.05)用于后续分析。首先进行全基因组关联分析,再根据p《1
×
10-6
筛选关联信号位点。对这些关联位点进行分析,我们发现了a10染色体上的一个信号关联位点(a10:112656815)可以同时关联纤维伸长率、纤维强度、纤维长度三个品质性状(图1)。这个关联位点正好处于基因外显子区,并造成了氨基酸序列的改变和编码提前终止。该关联位点位于ropgef家族ghropgef5基因,本实验采集了棉花tm-1品种不同组织和不同发育时期的rna样本进行转录组测序。样本材料包括了根、茎、叶、胚珠和纤维。胚珠组织包括了开花前3和1天、开花当天、开花后1到25天。纤维组织包括开花后5到25天。转录组测序采用illumina hiseq 2500平台,每个样本平均测序深度达到6gb。ghropgef5基因的基因表达水平的计算是将测序得到的reads与陆地棉基因组进行比对,计算出的表达水平以每百万测序碱基中每千个转录子测序碱基中所包含的测序片断数(fpkm)表示。实验结果如图2所示,该基因在tm-1棉花开花前-3、-1天的胚珠,开花后1天、3天、5天、10天、20天胚珠种子和5天、10天纤维中优势表达,表明该基因与纤维品质性状构成因子相关,是同时改良棉花纤维长度、强度、伸长率的基因。本发明将ghropgef5基因中a10:112656815位点基因缺失形成的新基因命名为ghlsf。该基因的cdna和基因组序列分别如seq id no.1和seq id no.2所示。
30.实施例2ropgef基因ghlsf的获得:
31.根据ghlsf基因的cdna两端设计基因全长引物,进行pcr扩增,引物序列为f1(seq id no.3):ttcttcaacaatggctccat和r1(seq id no.4):cctcaagcttgctccatctgg。pcr反应程序如下:94℃预变性5min;94℃变性30sec,60℃退火1min,72℃延伸1min,30个循环;最后72℃延伸10min。pcr扩增产物进行测序,与cdna进一步比对确定序列的准确性。
32.实施例3ropgef基因ghlsf在鉴定高品质棉花品种和改良品质性状中的应用:
33.基于碱基缺失位点(a10:112656815-a10:112656817)在染色体a10上的位置,在其两端设计基因组扩增引物,引物序列为f2(seq id no.5):gctaaaaacggcaaaaacaggc;和r2(seq id no.6):aatgccattaccaatctctgtggt。利用这对引物,在920个品种的dna中进行pcr扩增并测序。pcr反应程序如下:94℃预变性5min;94℃变性30sec,58℃退火1min,72℃延伸45sec,30个循环;最后72℃延伸10min。根据测序结果分析该碱基缺失位点上每个株系的基因型。我们证实了ghlsf序列中含有一个碱基的缺失,位于基因组序列的1988bp-1990bp的位置处,该碱基的缺失导致这一范围内原本的tcc碱基变为tca,从而导致对应的蛋白序列在第183个氨基酸处提前终止。根据该碱基缺失信息,将陆地棉株系分为tcc及tca两种单倍型(图3)。
34.根据ghlsf基因组序列1988bp-1990bp位置上碱基缺失基因型,我们从magic群体中鉴定出单倍型tca材料36个,单倍型tcc的材料720个(图3)。在已发表的公共数据中寻找了优异单倍型的分布,对于我国陆地棉品种选育工作做出了突出贡献的108ф,c1470等均为高纤维品质单倍型tca,且高品质的单倍型主要分布在新疆和辽宁的棉花品种中,反映了乌兹别克斯坦等中亚国家品种对我国新疆地区棉花品种改良的深远影响(fang et al.,2017;han et al.,2020)。大部分新疆选育的品种为tcc单倍型,说明高纤维品质单倍型tca还有很重要的利用价值。
35.利用t-test统计学检测方法,我们计算了两组单倍型之间品质性状的相关性(图
4)。结果显示,单倍型tca的纤维伸长率、纤维强度、纤维长度在所有的种植环境中,均呈现出极显著差异(p《0.01);
36.通过以上结果可以看出,基因ghlsf在改良棉花品质性状和培育棉花优质纤维新品种中具有重要的研究价值。一方面可以根据基因ghlsf的单倍型设计分子标记,从而有效的鉴定棉花品质性状,在优质纤维棉花品种选育研究中具有很好的应用价值。另一方面,可以通过基因工程及杂交设计的手段将含有优质单倍型tca的基因转入棉花品种中以提高棉花品质,也可以将单倍型tcc中的位点进行定点突变,改造成优质单倍型从而培育优质纤维棉花新品种。
37.显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法把所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1