用于鉴定棉花品种的InDel分子标记组合及其开发方法和应用与流程

文档序号:24123164发布日期:2021-03-02 12:21阅读:472来源:国知局
用于鉴定棉花品种的InDel分子标记组合及其开发方法和应用与流程
用于鉴定棉花品种的indel分子标记组合及其开发方法和应用
技术领域
[0001]
本发明涉及生物信息学及分子标记遗传学技术领域,更具体地,涉及棉花indel分子标记技术领域,特别是指一种用于鉴定棉花品种的indel分子标记组合及其开发方法和应用。


背景技术:

[0002]
棉花作为我国主要的经济作物,新品种选育与推广对人民生活水平的提高和经济的发展具有重要意义。近年来,我国棉花育种成绩显著,棉花新品种的数量明显增加,产量和纤维品质也有极大提高,促进了棉花的生产发展。每年约有许多棉花新品种通过审定,棉花的鉴定工作越来越繁重。通过棉花的表型可以区分不同材料之间存在的形态学差异,但通过田间种植鉴定棉种的真实性和纯度的方法不仅受栽培条件影响,而且耗时长,成本高,并且能够用来鉴定的性状少,使用分子标记能有效地在dna水平上区分材料之间的差异。
[0003]
分子标记已逐渐取代了形态学、物理化学、生化技术等鉴定方法。分子标记是以分子多态性为基础的一种遗传标记,能稳定遗传,可以反映个体和群体基因组之间某种差异特征。目前许多分子标记已用于棉花品种鉴定等研究中,一种理想的分子标记应具有稳定性好、多态性高、操作简便、带型清晰易判别、在基因组上分布均匀及开发使用成本低等特点。
[0004]
indel(insertion-deletion)分子标记是碱基的插入/缺失现象,是基于pcr扩增技术的碱基序列长度多态性标记。大量研究表明,indel标记不仅具有来源广泛、重复性好、开发成本低、结果准确等优点,而且基因型判别简单并快速。indel分子标记已经被认定为一个重要的分子标记来源,并成功应用于水稻、玉米等作物的遗传研究和品种鉴定中。但是利用indel分子标记在解析棉花的遗传组成差异、棉花品种鉴定和纯度检测等方面的报道较少。二代测序数据提供了丰富的indel变异位点,为开发indel分子标记提供了便利。通过生物信息学手段对测序数据进行筛选、过滤,和对多态性的评价,能够挖掘有效的indel分子标记。
[0005]
因此,希望提供一种棉花indel分子标记组合,其能够用于鉴定棉花品种,具有高度稳定性、准确性和低成本的特点。


技术实现要素:

[0006]
为了克服上述现有技术中的缺点,本发明的一个目的在于提供一种用于鉴定棉花品种的indel分子标记组合,其能够用于鉴定棉花品种,具有高度稳定性、准确性和低成本的特点,适于大规模推广应用。
[0007]
本发明的另一目的在于提供一种用于鉴定棉花品种的indel分子标记组合,其设计巧妙,鉴定简便快捷,成本低,不受环境影响,适于大规模推广应用。
[0008]
本发明的另一目的在于提供一种用于鉴定棉花品种的indel分子标记组合的开发
galante 36、marie-galante 62、marie-galante 71、latifolium 1、latifolium 3、latifolium 13、latifolium 39、latifolium 64、latifolium 161、latifolium 178、palmeri 5、palmeri 2、5904、8763、910、910、ba3119、cccp 1243、cccp b154(91-486)、cccp b51、cccp b9102、dj-07-136、k388、9899-i、buharaztw、vir-29tv、vir-4tv、coastland r4-4、giza 29、giza 36、giza 67、giza 80、karnak、menoufi、pima sj-1、pima sj-2、pima sj-4、seabrook、yuma、sudan chongrong mian、huadonghaidaomian、west of andes、changrong 3#、changrong 5#、h7124、hai 92-138、junhai 1#、shengli 1#、tuhai 2#、yunnan 8040-2、xinhai 3#、xinhai 5#、xinhai 10#、xinhai 13#、xinhai 16#、xinhai 21#、xinhai 2#、xinhai 33#、tanguis、g.purpurascens、kaiyuanlianhemumian、alabolihemumian、yuanmoulihemumian、g.darwinii、g.mustelinum、g.tomentosum、thespesia populneoides(roxb.)kostel;所述棉花品种的个数为66个,66个所述棉花品种分别为新植5号、新植一号、新植杂2号、鑫秋1号、鑫秋4号、星棉2号、兴杂二号、徐棉18、徐杂3号、徐州抗86、盐1115、银康1号、银棉2号、银棉8号、银瑞361、银山1号、银山2号、银山4号、银兴棉4号、银兴棉5号、豫宝杂6号、豫超棉1号、豫棉13、豫棉19号、豫棉21号、豫棉22、豫棉668、豫杂0568、豫杂35、豫杂37、郑农棉4号、郑育棉2号、郑杂棉2号、中棉所28、中棉所12、中棉所17、中棉所19、中棉所23、中棉所27、中棉所29、中棉所30、中棉所35、中棉所36、中棉所42、中棉所43、中棉所44、中棉所45、中棉所46、泗棉3号、泗阳3、华惠15、中棉所41、苏棉22号、中棉所94、中棉所50、苏机棉211、泗阳119、湘杂棉7号、湘k27、湘xp63、湘k26、思福棉1号、华杂棉h922、绿亿棉19、湘杂棉8号、亚华棉19号;所述indel分子标记的数目为53个,53个所述indel分子标记分别特异性检测53个棉花indel位点indeljs0001~indeljs0053。
[0020]
更佳地,每个所述indel分子标记分别包括一条正向引物和一条反向引物,53个所述indel分子标记的序列依次如seq id no:1~seq id no:106所示。
[0021]
较佳地,在所述步骤(1)中,利用vcftools软件计算所述最小等位基因频率和所述多态信息含量;或者,在所述步骤(2)中,采用primer5.0或mindel软件设计所述indel引物组合。
[0022]
较佳地,在所述步骤(4)后,所述的用于鉴定棉花品种的indel分子标记组合的开发方法还包括:
[0023]
(5)基于所述indel分子标记对应的indel位点和所述基因分型结果,计算该多个所述棉花品种之间的遗传距离并构建聚类图。
[0024]
更佳地,在所述步骤(5)中,采用tasselv5.0软件的邻接算法n-j进行所述计算。
[0025]
在本发明的第三方面,提供了一种用于鉴定棉花品种的indel分子标记组合,其特点是,采用上述的用于鉴定棉花品种的indel分子标记组合的开发方法获得。
[0026]
在本发明的第四方面,提供了上述的用于鉴定棉花品种的indel分子标记组合或者上述的用于鉴定棉花品种的indel分子标记组合的开发方法获得的用于鉴定棉花品种的indel分子标记组合在鉴定棉花品种中的应用。
[0027]
本发明的有益效果在于:
[0028]
a.本发明的用于鉴定棉花品种的indel分子标记组合包括53个indel分子标记,53个indel分子标记分别特异性检测53个棉花indel位点indeljs0001~indeljs0053,因此,其能够用于鉴定棉花品种,具有高度稳定性、准确性和低成本的特点,适于大规模推广应
用。
[0029]
b.本发明的用于鉴定棉花品种的indel分子标记组合包括53个indel分子标记,53个indel分子标记分别特异性检测53个棉花indel位点indeljs0001~indeljs0053,因此,其设计巧妙,鉴定简便快捷,成本低,不受环境影响,适于大规模推广应用。
[0030]
c.本发明的用于鉴定棉花品种的indel分子标记组合的开发方法通过下载多份棉花的二代原始序列,然后采用生物信息学分析技术对这些材料的序列进行筛选和选择,获得靶标indel变异位点,再设计indel引物组合,对多个棉花品种进行实验验证,获得相应的基因型分型结果,根据基因型分型结果以及indel引物组合在棉花染色体上的分布情况,从中挑选有效的多个目的indel引物组合,作为多个indel分子标记,形成用于鉴定棉花品种的indel分子标记组合,因此,由其开发的棉花indel分子标记组合能够用于鉴定棉花品种,具有高度稳定性、准确性和低成本的特点,适于大规模推广应用。
[0031]
d.本发明的用于鉴定棉花品种的indel分子标记组合的开发方法通过下载多份棉花的二代原始序列,然后采用生物信息学分析技术对这些材料的序列进行筛选和选择,获得靶标indel变异位点,再设计indel引物组合,对多个棉花品种进行实验验证,获得相应的基因型分型结果,根据基因型分型结果以及indel引物组合在棉花染色体上的分布情况,从中挑选有效的多个目的indel引物组合,作为多个indel分子标记,形成用于鉴定棉花品种的indel分子标记组合,因此,其设计巧妙,操作简便快捷,成本低,不受环境影响,适于大规模推广应用。
[0032]
e.本发明的用于鉴定棉花品种的indel分子标记组合在鉴定棉花品种中的应用,从而能够鉴定棉花品种,具有高度稳定性、准确性和低成本的特点,适于大规模推广应用。
[0033]
f.本发明的用于鉴定棉花品种的indel分子标记组合在鉴定棉花品种中的应用,从而设计巧妙,鉴定简便快捷,成本低,不受环境影响,适于大规模推广应用。
[0034]
本发明的这些和其它目的、特点和优势,通过下述的详细说明,附图和权利要求得以充分体现,并可通过所附权利要求中特地指出的手段、装置和它们的组合得以实现。
附图说明
[0035]
图1是本发明的用于鉴定棉花品种的indel分子标记组合的其中2个棉花indel分子标记jsc009和jsc071在66个棉花品种中的琼脂糖凝胶检测结果,其中1~66泳道分别对应编号为1~66的棉花品种的扩增条带。
[0036]
图2是本发明的用于鉴定棉花品种的indel分子标记组合的53个indel分子标记的遗传多态性。
[0037]
图3是66个棉花品种基于53个indel位点的neighbor-joining(n-j)树分析图。
具体实施方式
[0038]
为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。
[0039]
本发明中所使用的术语,除非有另外说明,一般具有本领域普通技术人员通常理解的含义。实施实例中,未详细描述的各种过程和方法是本领域中公知的常规方法。
[0040]
选取121份棉花:mebane triumph、paymaster 54、paymaster 54b、malone、stoneville2b、trice、86-1、cir7、cir10、cir12、cir35、esha 28、j8891、jimian 1#、
junmian 1#、lumian 1#、shiyuan 321、simian 2#、simian 3#、sumian 12#、xinluzao 26#、xinluzao 1#、xinluzao 42#、brazil 011、brazil 014、brazil 0101、india 941、ma-6、nv50-70、tashkent 1、tashkent 2、tashkent 3、66-241、108?、punctatum 3、punctatum 5、punctatum 12、punctatum 14、punctatum 25、punctatum 24、punctatum 31、morrilli 2、morrilli 38、morrilli 45、yucatanense 1、yucatanense 3、yucatanense 2、yucatanense 5a、yucatanense 6、richmondi 7、richmondi 2、richmondi 3、marie-galante 7、marie-galante 17、marie-galante 36、marie-galante 62、marie-galante 71、latifolium 1、latifolium 3、latifolium 13、latifolium 39、latifolium 64、latifolium 161、latifolium 178、palmeri 5、palmeri 2、5904、8763、910、910、ba3119、cccp 1243、cccp b154(91-486)、cccp b51、cccp b9102、dj-07-136、k388、9899-i、buharaztw、vir-29tv、vir-4tv、coastland r4-4、giza 29、giza 36、giza 67、giza 80、karnak、menoufi、pima sj-1、pima sj-2、pima sj-4、seabrook、yuma、sudan chongrong mian、huadonghaidaomian、west of andes、changrong 3#、changrong 5#、h7124、hai 92-138、junhai 1#、shengli 1#、tuhai 2#、yunnan 8040-2、xinhai 3#、xinhai 5#、xinhai 10#、xinhai 13#、xinhai 16#、xinhai 21#、xinhai 2#、xinhai 33#、tanguis、g.purpurascens、kaiyuanlianhemumian、alabolihemumian、yuanmoulihemumian、g.darwinii、g.mustelinum、g.tomentosum、thespesia populneoides(roxb.)kostel。
[0041]
从ncbi(www.ncbi.nlm.nih.gov)的sra(sequence read archive)数据库prjna82843、srp011907和prjna260788下载这些棉花的二代原始序列,选择最小等位基因频率(maf)大于0.05的indel位点,删除基因型缺失率超过20%的indel位点,以哈迪温伯格平衡显著性阀值(hwe)p<0.001为标准再次过滤,最终保留多态信息含量(pic)>0.4并且是二态性的候选indel位点,共10,967个,其中,利用vcftools软件(版本:v0.1.16;来源:https://vcftools.github.io/examples.html)计算indel位点的最小等位频率(maf)和多态信息含量(pic)。再进一步筛选出插入或缺失大于20nt的85个靶标indel位点。
[0042]
根据85个靶标indel位点和侧翼序列由mindel软件(来源:www.github.com/lyd0527/mindel)设计用于pcr扩增的indel引物组合,用以开发indel分子标记。每个indel引物组合设计一条正向引物(f)和一条反向引物(r)。
[0043]
对66个棉花品种(详见表1,获得自江苏省农业科学院作物分子育种实验室)的叶片进行取样。
[0044]
表1 66个棉花品种的详细信息
[0045]
[0046][0047]
按照上海浦迪植物基因组提取试剂盒操作步骤提取基因组dna。pcr反应总体系为12μl,包含1μl上下游引物(浓度为10μmol/l)、6μl 2
×
taq master mix、3.2μl ddh2o、模板dna 1.8μl。pcr反应程序为,第一步:94℃,3min;第二步:94℃,30s、58℃,30s、72℃,30s,共进行35个循环;第三步:72℃,5min。pcr扩增产物在2%的琼脂糖凝胶上进行电泳分离,经溴化乙锭(eb)染色,在凝胶成像仪拍照、记录(图1示出了其中2个棉花indel分子标记jsc009和jsc071在66个棉花品种中的琼脂糖凝胶检测结果)。
[0048]
位点判读和数据分析,凝胶上的带型读取方式:短片段读成a、长片段读成b、两条带型读成h,根据基因型分型结果,以及标记在棉花基因组染色体上的分布等信息,挑选53个有效的indel标记。53对引物均显示了多态性,27对at亚组的专化引物和26对是dt亚组的专化引物均可追溯到祖先二倍体at、dt基因组的差异,且产物片段大小与预测结果相吻合。采用vcftools软件计算分析二态性indel标记对应的53个indel位点(请参见表2)的最小等位频率(maf)、多态信息含量(pic),请参见图2所示,at亚组染色体的最小等位频率(maf)的变化范围为0.15-0.49,平均值为0.45;dt亚组染色体的最小等位频率(maf)的变化范围为0.14-0.49,平均值为0.32;at亚组染色体的多态信息含量(pic)的变化范围0.16-0.49,平均值为0.49;dt亚组染色体的多态信息含量(pic)的变化范围0.18-0.49,平均值为0.40。
[0049]
表2 indel分子标记对应的53个indel位点信息
[0050]
[0051][0052]
基于53个indel分子标记对应的53个indel位点和上述66个棉花品种的基因型数据即上述基因型分型结果,利用tasselv5.0软件的邻接算法(n-j)计算棉花之间的遗传距离并构建聚类图。结果表明,所用的66份棉花品种的遗传距离变化范围是0.04cm-0.65cm,平均为0.39cm,表明所用的棉花品种存在着丰富的遗传多样性。遗传距离最大的两个品种是泗棉3号(编号no.为49)和中棉所36(编号no.为43),遗传距离为0.65cm,表明二者的遗传差异较大,亲缘关系较远;遗传距离最小是徐棉18(编号no.为8)和徐杂3号(编号no.为9),遗传距离为0.04cm,表明两者遗传差异较小(表3)。
[0053]
表3遗传距离统计
[0054]
[0055][0056]
图3显示,在group 1中,来自河南的新植5号、豫杂35、豫杂37、中棉所12、中棉所45聚集在一起;鑫秋1号和鑫秋4号聚集,通过对这两个品种遗传系谱查询表明,两者均来自山东;同样来自河南的郑农棉4号、郑育棉2号、郑杂棉2号聚类在一起。group 2群体结构显示,来自徐州的两个品种,徐棉18和徐杂3号聚类,来自湖南的湘k27、湘xp63、湘k26聚类在一起。在group 3中,同样来自河南的银山2号、豫棉13、中棉所17、中棉所19聚类在一起。具有相同地理来源的多数品种聚为一类,但也有例外,如安徽省的2个品种,绿亿棉19划分在
group 1中,思福棉1号划分为group 2;江苏省的其他7个品种散落于三组之间。
[0057]
从而,本发明的53个indel分子标记能够有效地揭示棉花基因组的变异,为棉花分子育种提供了dna水平上的信息。
[0058]
因此,本发明通过下载多份棉花的二代原始序列,然后采用生物信息学分析技术对这些材料的序列进行筛选和选择,获得靶标indel变异位点,再设计indel引物组合,对多个棉花品种进行实验验证,获得相应的基因型分型结果,根据基因型分型结果以及indel引物组合在棉花染色体上的分布情况,从中挑选有效的多个目的indel引物组合,作为多个indel分子标记,形成用于鉴定棉花品种的indel分子标记组合,能够用于鉴定棉花品种,具有高度稳定性、准确性和低成本的特点。
[0059]
综上所述,本发明的用于鉴定棉花品种的indel分子标记组合能够用于鉴定棉花品种,具有高度稳定性、准确性和低成本的特点,设计巧妙,鉴定简便快捷,成本低,不受环境影响,适于大规模推广应用。
[0060]
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。
[0061]
[0062]
[0063]
[0064]
[0065]
[0066]
[0067]
[0068]
[0069]
[0070]
[0071]
[0072]
[0073]
[0074]
[0075]
[0076]
[0077]
[0078]
[0079]
[0080]
[0081]
[0082]
[0083]
[0084]
[0085]
[0086]
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1