【技术领域】
本发明涉及分子生物学技术领域,具体涉及一种基于茄子转录组测序数据开发的ssr引物组及其应用。
背景技术:
茄子(solanummelongenal.)是我国重要的茄果类蔬菜作物,全国各地均有种植,具有重要的经济和营养价值。中国是世界第一茄子生产及消费的国家。近年来我国在茄子种质资源的评价、育种材料的创新、新品种选育、遗传规律、育种技术和方法的研究等方面都取得了明显的进展。但与其他茄科作物如番茄、辣椒等相比,茄子在遗传多样性分析、种质资源鉴定、分子育种等方面有很大的差距,特别是缺乏大量的多态性分子标记,造成茄子分子研究比较滞后。
简单重复序列(simplesequencerepeat,ssr)广泛分布于各类真核生物基因组的不同位置,由于ssr的重复次数不同和重复程度不同,使其呈现高度的多态性。与其它分子标记技术相比,ssr标记具有多态信息含量高、共显性遗传、技术简单、重复性好、特异性强、操作便利、并在基因组中分散分布等优点已成为最受人们欢迎的分子标记之一,被认为是可靠性最高的分子标记类型之一,在许多领域广泛应用。目前,虽然国内外在茄子ssr方面做了不少研究,但现有的茄子ssr分子标记数量远远不能满足茄子分子生物学研究的需求,可供使用的ssr标记过少,ssr标记多态性低,因此大量开发ssr标记仍是目前茄子研究的重要工作之一。鉴于此,开发基于茄子转录组测序数据的ssr引物组,将会对茄子遗传多样性分析、亲缘关系鉴定、dna指纹图谱构建、重要性状基因的定位、克隆及分子标记辅助选择育种和比较基因组学研究等起重要推动作用。
技术实现要素:
针对现有技术的不足,本发明的目是提供一种基于茄子转录组测序数据开发的ssr引物组及其应用,该引物组具有多态性丰富、重复性好、扩增稳定、电泳条带清晰等优点,同时由于这些引物均来自茄子转录组表达基因,能够反映基因组中功能序列的变异,从而能够更好的区分茄子遗传种质的多样性。
本发明是这样实现的:
一种基于茄子转录组测序数据开发的ssr引物组,所述ssr引物组有30对引物;各所述引物分别为:
第1对引物,其序列如seqidno:1和seqidno:2所示;
第2对引物,其序列如seqidno:3和seqidno:4所示;
第3对引物,其序列如seqidno:5和seqidno:6所示;
第4对引物,其序列如seqidno:7和seqidno:8所示;
第5对引物,其序列如seqidno:9和seqidno:10所示;
第6对引物,其序列如seqidno:11和seqidno:12所示;
第7对引物,其序列如seqidno:13和seqidno:14所示;
第8对引物,其序列如seqidno:15和seqidno:16所示;
第9对引物,其序列如seqidno:17和seqidno:18所示;
第10对引物,其序列如seqidno:19和seqidno:20所示;
第11对引物,其序列如seqidno:21和seqidno:22所示;
第12对引物,其序列如seqidno:23和seqidno:24所示;
第13对引物,其序列如seqidno:25和seqidno:26所示;
第14对引物,其序列如seqidno:27和seqidno:28所示;
第15对引物,其序列如seqidno:29和seqidno:30所示;
第16对引物,其序列如seqidno:31和seqidno:32所示;
第17对引物,其序列如seqidno:33和seqidno:34所示;
第18对引物,其序列如seqidno:35和seqidno:36所示;
第19对引物,其序列如seqidno:37和seqidno:38所示;
第20对引物,其序列如seqidno:39和seqidno:40所示;
第21对引物,其序列如seqidno:41和seqidno:42所示;
第22对引物,其序列如seqidno:43和seqidno:44所示;
第23对引物,其序列如seqidno:45和seqidno:46所示;
第24对引物,其序列如seqidno:47和seqidno:48所示;
第25对引物,其序列如seqidno:49和seqidno:50所示;
第26对引物,其序列如seqidno:51和seqidno:52所示;
第27对引物,其序列如seqidno:53和seqidno:54所示;
第28对引物,其序列如seqidno:55和seqidno:56所示;
第29对引物,其序列如seqidno:57和seqidno:58所示;
第30对引物,其序列如seqidno:59和seqidno:60所示。
进一步地,所述基于茄子转录组测序数据开发的ssr引物组在鉴定茄子亲缘关系和遗传特性中的应用。
本发明具有如下优点:
1)本发明以提取的茄子总dna为鉴定材料,在任何生长时期和部位取材都不影响反应结果;2)本发明的30对ssr引物多态性丰富,扩增稳定,重复性好,扩增条带清晰,具有简便、快捷、特异等特点;3)通过大量的筛选工作,得到了多态性的ssr引物组,可用于茄子质资源遗传多样性分析、亲缘关系鉴定和dna指纹图谱构建等领域,进行茄子多样性评价、亲缘关系分析、品种鉴定和品种权保护等提供分子水平上的依据,促进了茄子遗传育种水平的提高和茄子产业的发展。
【附图说明】
下面参照附图结合实施例对本发明作进一步的描述。
图1为本发明引物q10对29份茄子材料的扩增结果。其中,m:marker;1-29:茄子材料。
图2为本发明引物q19对29份茄子材料的扩增结果。其中,m:marker;1-29:茄子材料。
图3为本发明基于30对茄子ssr引物组对29份茄子材料聚类分析。其中,m:marker;1-29:茄子材料。
【具体实施方式】
下面结合实施例对本发明作进一步的说明,但并不局限于此。
一、转录组数据来源
茄子转录组数据来源于发明人2019年对茄子进行illumina高通量深度测序的结果。
二、转录组ssr位点鉴别及ssr引物设计
使用软件misa对茄子转录组中的ssr位点搜索,搜索标准为:重复单元长度2~6bp,二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重复次数分别为6、5、5、4和4次。用primer3.0软件对ssr重复单元前后的序列进行引物设计及评价,每条ssr产生3对引物。引物序列长度18~25bp,引物太短不能保证扩增出来序列的独特性,引物较长可能会与错误配对序列杂交,降低了特异性,扩增产物长度100~280bp,gc含量40%~60%,退火温度55~65℃,上、下游引物的退火温度值相差不大于5℃。尽量避免出现发卡结构、二聚体、错配和引物二聚体等。
设计引物时,引物不能存在ssr,此外与unigene序列比对时,其5′端允许有3个碱基的错配,3′端允许有1个碱基的错配,最后筛选出唯一匹配的引物。从中随机挑选100对20bp以上的2~6不同重复单元核苷酸引物。
三、dna提取
采用ctab(十六烷基三乙基溴化铵)法提取29个茄子(如表1所示)基因组dna,具体步骤:
(1)用酒精擦拭所选取的长势良好,形态完整的茄子幼嫩叶片,之后快速剪取0.3g嫩叶放入研钵中,加入液氮和0.1g的pvpp快速充分研磨至粉末状,之后将粉末放入1.5ml的离心管中;
(2)向离心管中加入600μl预热至65℃的2%ctab提取缓冲液和7μlβ-琉基乙醇,充分混匀后,放入65℃水浴锅中1h,期间多次摇匀;
(3)从水浴锅中取出离心管冷却至室温,加入等体积的氯仿/异戊醇(24:1),轻缓颠倒混匀,静置10min,后于4℃下12000rpm离心10min;
(4)用移液枪取离心管中的上清液加入另一新的1.5ml离心管中,随后加入100μl3mol/lnaac和300μl的氯仿/异戊醇充分混匀,在4℃下12000rpm离心10min;
(5)再次用移液枪吸取上清液至新的1.5ml离心管中,并加入0.6倍体积异丙醇,轻轻颠倒混匀至能看到白色絮状物,后于4℃冰箱静置30~60min,之后于4℃下12000rpm离心10min;
(6)用75%的乙醇洗涤dna2-3次,随后放于超净工作台上。将风干后的dna溶于100μlte溶液,再加入2.5μlrnasea去除rna,并存于37℃的水浴锅中20min-30min保存备用;
(7)吸取4μldna溶液与2μl溴酚蓝混合,在1%的琼脂糖凝胶进行电泳检测dna纯度,保存于4℃或-20℃备用。
表129份茄子种质资源材料
四、ssr引物筛选
选择一个茄子品种dna进行扩增,验证引物的有效性。结果表明,92对引物实现有效扩增,占100对ssr引物的92%。
选择形态差异大的6个茄子品种基因组dna为模板,对上述92对有效引物进行多态性丰富、重复性好、扩增稳定验证,筛选出30对多态性丰富、重复性好、扩增稳定茄子ssr引物组,如下表2所示。
表230对ssr引物组
五、ssr引物组的有效性检验
利用30对ssr引物组对从国内外收集的29份茄子种质资源材料(见表1)进行多样性分析。发现这30对引物在29个不同茄子品种上均有扩增产物,且多态性高(部分引物对扩增结果如图1、2所示);聚类分析结果(见图3)表明这30对引物能将29个不同茄子品种分为三大类,即说明本发明所述的30对ssr引物组可以用于茄子种质资源遗传多样性分析、亲缘关系和遗传特性等研究中。
综上,本发明具有如下优点:
1)本发明以提取的茄子总dna为鉴定材料,在任何生长时期和部位取材都不影响反应结果;2)本发明的30对ssr引物多态性丰富,扩增稳定,重复性好,扩增条带清晰,具有简便、快捷、特异等特点;3)通过大量的筛选工作,得到了多态性的ssr引物组,进行茄子多样性评价、亲缘关系分析、品种鉴定和品种权保护等提供分子水平上的依据,促进了茄子遗传育种水平的提高和茄子产业的发展。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
序列表
<110>福建省农业科学院作物研究所
<120>基于茄子转录组测序数据开发的ssr引物组及其应用
<130>100
<160>60
<170>siposequencelisting1.0
<210>1
<211>20
<212>dna
<213>(人工序列)
<400>1
caagagggagatggagttcg20
<210>2
<211>22
<212>dna
<213>(人工序列)
<400>2
caatctgttgttgctgatgaca22
<210>3
<211>22
<212>dna
<213>(人工序列)
<400>3
tctttgaaactcctgcacaatg22
<210>4
<211>20
<212>dna
<213>(人工序列)
<400>4
tgctgctcgagatgattcac20
<210>5
<211>20
<212>dna
<213>(人工序列)
<400>5
ctcctagagactcatgcccg20
<210>6
<211>20
<212>dna
<213>(人工序列)
<400>6
gctttttctttcatcggtgg20
<210>7
<211>21
<212>dna
<213>(人工序列)
<400>7
tgggaacatttagagacacca21
<210>8
<211>20
<212>dna
<213>(人工序列)
<400>8
ttccacaagacacccctttc20
<210>9
<211>27
<212>dna
<213>(人工序列)
<400>9
aaattctacactcgatcaaattattca27
<210>10
<211>22
<212>dna
<213>(人工序列)
<400>10
ttttgaaacaaaaattggagca22
<210>11
<211>20
<212>dna
<213>(人工序列)
<400>11
gcatggctgctttaggaatc20
<210>12
<211>20
<212>dna
<213>(人工序列)
<400>12
ctcgtttaaaggcgctgaag20
<210>13
<211>20
<212>dna
<213>(人工序列)
<400>13
cggtgggttggattatgact20
<210>14
<211>24
<212>dna
<213>(人工序列)
<400>14
gaatcattccaaaaaggaaagaaa24
<210>15
<211>20
<212>dna
<213>(人工序列)
<400>15
ggggaatttttggaggattc20
<210>16
<211>20
<212>dna
<213>(人工序列)
<400>16
gccttgcttcccattcatta20
<210>17
<211>20
<212>dna
<213>(人工序列)
<400>17
gggcgtcttgtatccttgaa20
<210>18
<211>20
<212>dna
<213>(人工序列)
<400>18
aagctttgaaggcaaaggaa20
<210>19
<211>20
<212>dna
<213>(人工序列)
<400>19
tctccagagagctgatgcaa20
<210>20
<211>20
<212>dna
<213>(人工序列)
<400>20
ttgcagaggttgaacaatgc20
<210>21
<211>20
<212>dna
<213>(人工序列)
<400>21
ttgacttttgaccccagtcc20
<210>22
<211>23
<212>dna
<213>(人工序列)
<400>22
tctcacaccctaccaaaatagga23
<210>23
<211>20
<212>dna
<213>(人工序列)
<400>23
accgccgtcatcatctaaag20
<210>24
<211>20
<212>dna
<213>(人工序列)
<400>24
gccatgaatacttcctccgt20
<210>25
<211>20
<212>dna
<213>(人工序列)
<400>25
tcgcatgacgaaaatctcac20
<210>26
<211>20
<212>dna
<213>(人工序列)
<400>26
gaccgattcaaatgcacctt20
<210>27
<211>20
<212>dna
<213>(人工序列)
<400>27
gcagacggatgcataatcct20
<210>28
<211>21
<212>dna
<213>(人工序列)
<400>28
tggacaatgttgaagaatcca21
<210>29
<211>20
<212>dna
<213>(人工序列)
<400>29
ggtaccgcgctaaacaacat20
<210>30
<211>21
<212>dna
<213>(人工序列)
<400>30
tgaatggtttctgtattggca21
<210>31
<211>20
<212>dna
<213>(人工序列)
<400>31
ctcactcccacacacagtcg20
<210>32
<211>20
<212>dna
<213>(人工序列)
<400>32
atctgacattccggcgttat20
<210>33
<211>20
<212>dna
<213>(人工序列)
<400>33
gttttggttgccctttgtgt20
<210>34
<211>27
<212>dna
<213>(人工序列)
<400>34
ttcaatttgtaaacactagtaccatca27
<210>35
<211>20
<212>dna
<213>(人工序列)
<400>35
ccattgtagaacgaaacgca20
<210>36
<211>20
<212>dna
<213>(人工序列)
<400>36
accacagcgaccaaaagatt20
<210>37
<211>20
<212>dna
<213>(人工序列)
<400>37
ggtgtgttggcttaggcagt20
<210>38
<211>21
<212>dna
<213>(人工序列)
<400>38
tctgattcttgagcacaatgg21
<210>39
<211>20
<212>dna
<213>(人工序列)
<400>39
tgggaagaagcttcacaagg20
<210>40
<211>20
<212>dna
<213>(人工序列)
<400>40
catgcttagccaactcacca20
<210>41
<211>26
<212>dna
<213>(人工序列)
<400>41
tgatctttttggcgtatacatattct26
<210>42
<211>22
<212>dna
<213>(人工序列)
<400>42
tgcatgattgcatcaataacaa22
<210>43
<211>20
<212>dna
<213>(人工序列)
<400>43
tggaggaagaggagatgtcg20
<210>44
<211>20
<212>dna
<213>(人工序列)
<400>44
tcttggtggaaaatgcagtg20
<210>45
<211>20
<212>dna
<213>(人工序列)
<400>45
caacaagggagatcttggga20
<210>46
<211>20
<212>dna
<213>(人工序列)
<400>46
atggtggtgcaattgtggta20
<210>47
<211>20
<212>dna
<213>(人工序列)
<400>47
ccgatggctcctatgtcaat20
<210>48
<211>20
<212>dna
<213>(人工序列)
<400>48
gagaccgaacctcatttgga20
<210>49
<211>20
<212>dna
<213>(人工序列)
<400>49
agtgcatatttgacgcatcg20
<210>50
<211>20
<212>dna
<213>(人工序列)
<400>50
cagccatgtccatgcaataa20
<210>51
<211>20
<212>dna
<213>(人工序列)
<400>51
ctctatgctgctaccgcctc20
<210>52
<211>20
<212>dna
<213>(人工序列)
<400>52
gcttgacttctccctctccc20
<210>53
<211>20
<212>dna
<213>(人工序列)
<400>53
aagcgaactacttggcctca20
<210>54
<211>20
<212>dna
<213>(人工序列)
<400>54
tctgtcattggcaccaccta20
<210>55
<211>20
<212>dna
<213>(人工序列)
<400>55
tgataccatcggtttgggtt20
<210>56
<211>20
<212>dna
<213>(人工序列)
<400>56
ggctttatgggctcggtaat20
<210>57
<211>20
<212>dna
<213>(人工序列)
<400>57
acgaggccctgtcctatctt20
<210>58
<211>20
<212>dna
<213>(人工序列)
<400>58
cgtactagaccaccccgaga20
<210>59
<211>20
<212>dna
<213>(人工序列)
<400>59
tccgggagaattagacgatg20
<210>60
<211>20
<212>dna
<213>(人工序列)
<400>60
tttttacgagcagcctggtt20