一种开发甘蔗SSR标记和鉴定甘蔗亲本亲缘关系的方法与流程

文档序号:15396693发布日期:2018-09-08 02:27阅读:335来源:国知局

本发明属于甘蔗分子育种技术领域,涉及一种开发甘蔗ssr标记和鉴定甘蔗亲本亲缘关系的方法。



背景技术:

甘蔗为禾本科(poaceae)甘蔗属(sacchruml.)植物,是一种多年生、可宿根栽培的c4作物,具有生物量高、二氧化碳补偿点低等优点,是世界上最重要的糖料作物之一,是人类食糖的重要来源。现代甘蔗栽培品种绝大多数都是由两个甘蔗祖先种热带种(saccharumofficinaruml.,2n=80,x=10)和割手密(saccharumspontaneuml.,2n=40~128,x=8)种间杂交而来,且与热带种进行了多次回交,其染色体数目在2n=100-130之间,其中80-90%的染色体来自于热带种,10-20%来自于割手密种,而染色体的5-17%为两个种间的染色体重组类型。由于甘蔗的高度多倍体及非整倍体的复杂遗传背景,使得甘蔗的遗传、育种及基因组测序等都面临巨大的困难和挑战,培育成一个甘蔗新品种往往需要长达10年或更长时间,加之,甘蔗属于无性繁殖作物,繁殖系数高,如何准确、快速进行新品种甘蔗鉴定工作,对于甘蔗品种审定、真假鉴定和品种的产权保护具有重要意义。传统的品种鉴定方法是田间表型鉴定,依据甘蔗生长的不同阶段表现出的多个质量性状、数量性状及病虫害的抗性等,与对照品种进行比较,找出品种间的差异。这种传统鉴定方法存在鉴定周期长、易受环境影响(病虫害抗性),需要比较的性状多、工作量大、人为因素影响等问题,无法适应新时期甘蔗品种的鉴定要求。

简单重复序列(simplesequencerepeats,ssr),也被称为微卫星(microsatellites)序列,是指由1-6个核苷酸组成的不同类型基序进行多次重复而形成的相对较短的、广泛分布于真核生物的基因组上dna序列。它们在基因组上虽然是随机分布,但更偏向于低重复、富含基因的区域。由于每一个ssr序列在dna复制时产生错误的概率较高,因而可以在种内或种间产生大量的ssr序列长度的变异,即为分子多态性。ssr分子标记具有多态性高、重复性好、操作简便及共显性等优点,因而被广泛应用于各种动、植物的品种指纹图谱鉴定、遗传图谱构建及目标性状关联标记开发等领域。

ssr标记在甘蔗属植物上也得到了较为广泛的应用,但是目前可公开获得的甘蔗属的ssr分子标记数量仍然十分有限的,大部分甘蔗属的ssr标记引物序列依然没有公开,而传统的ssr标记开发存在诸多缺点,耗费人力、物力、且效率低下,尤其是对于多倍体的甘蔗,其基因组大小预测为10gb,远远高于其他禾本科作物。与水稻、小麦、高粱等作物相比,现有的甘蔗ssr标记数量有限,不能满足在甘蔗属植物上开展各项研究的需要,严重制约了甘蔗的分子遗传育种的研究进展,而大规模开发覆盖基因组的ssr标记仍然是目前甘蔗分子育种研究的重要工作之一。



技术实现要素:

本发明的目的在于提供一种基于甘蔗基因组序列开发的ssr核心引物,开发的引物具有扩增结果稳定、电泳条带清晰可辨、多态性位点高的优点,可以用于甘蔗遗传多样性分析、品种鉴定和保护、dna指纹图谱及遗传连锁图谱的构建。

本发明的技术方案是:

基于甘蔗栽培种全基因组序列开发的ssr核心引物组,其包括28对引物,分别如seqidno.1-56所示。

上述的ssr核心引物组在甘蔗遗传多样性分析、品种鉴定和保护、dna指纹图谱及遗传连锁图谱的构建方面的应用。

本发明的有益效果:本发明筛选出的28对ssr核心引物在甘蔗基因组中多态性信息丰富、带型清晰容易判读,而且适合聚丙烯酰胺凝胶电泳和毛细管电泳检测平台检测分析,主要用于甘蔗遗传多样性分析、品种鉴定和保护、dna指纹图谱及遗传连锁图谱的构建,不仅仅有利用保护育种者的合法权益,打击甘蔗假冒品种传播和销售,也有利于促进甘蔗遗传育种水平提高和甘蔗产业的发展壮大。

附图说明

图1为开发的ssr标记引物在不同甘蔗属不同种间的扩增效率和多态性验证:其中1-a多态性引物,1-b为没有多态性引物。

图2为28对引物对40个品种的聚类图。

具体实施方式

1.甘蔗基因组ssr引物的开发

1.1甘蔗基因组测序数据的获得

甘蔗全基因组测序结果从ncbi数据库下载(https://www.ncbi.nlm.nih.gov/pmc/articles/pmc5499785/),约1169mb,包含199028条序列。

1.2甘蔗全基因组序列中ssr序列的查找和ssr引物的设计

本研究采用perl语言编写了misa(microsatelliteidentificationtool)软件扫描甘蔗基因组序列,查找序列中的ssr位点,该软件下载自http://pgrc.ipk-gatersleben.de/misa/,misa工具提供高通量的识别和查找简单重复序列。另外,该软件还提供一个与批量设计引物primer3的接口工具,通过这个工具,可以把misa识别出来的ssr序列,转为primer3需要的格式,从而方便批量设计引物。ssr位点查找标准条件为:对于核苷酸重复基序(motif)分别为二(dinucleotiderepeatsdnrs)、三(trinucleotiderepeatstnrs)、四(tetranucleotiderepeatsttnrs)、五(pentanucleotiderepeatspnrs)、六(hexanucleotiderepeatshnrs),要求最低重复数分别定为6、5、4、3、3;剔除掉重复的ssr引物设计位点,对ssr位点两侧保守序列设计引物,用primer3(http://frodo.wi.mit.edu/primer3/)在线设计引物,引物设计参数为:primerlength:18-28bp;annealingtemperature:55-65℃;ampliconsize:100-500bp;gccontent:45-65%。成功设计出240对引物,由上海生工生物科技有限公司成。

1.3甘蔗基因组ssr引物的筛选

选择12份甘蔗属不同种,用于检测甘蔗全基因组ssr标记的扩增效率及多态性。采用合成的240对引物,在12份材料的基因组dna进行扩增,根据扩增结果,筛选出扩增结果稳定、特异性高及多态性丰富的引物。pcr(eppendorf5331)反应体系25μl,其中25ng/μldna样品2.0μl、含10×pcrbuffer(mg2+plus)2.5μl、25mmoll-1dntps1.2μl、10μmoll-1引物各0.5μl、0.5uμl-1taq酶0.1μl,最后用ddh2o补足25μl。pcr扩增程序为94℃预变性5min;94℃变性30s,65℃退火30s,72℃延伸30s,共10个循环,每个循环退火温度降低0.7℃;94℃变性30s,55℃退火30s,72℃延伸30s,共25个循环;最后72℃延伸7min,4℃保存。taq酶、dntp等试剂购自北京康为世纪生物科技有限公司。所有pcr产物在6%的聚丙烯酰胺凝胶中进行分离,160v恒压下,电泳1.5h,进行染色、拍照及保存。根据12个甘蔗属材料的筛选结果,选择28对多态性最丰富且带型清晰的引物。

供试甘蔗种质资源名称及来源

表280份供试甘蔗种质资源名称

1.4利用28对ssr引物对40份甘蔗品种进行pcr扩增及毛细管电泳分离

采用fam(蓝色)或hex(绿色)荧光集团标记上游引物,荧光引物用200μlte溶解,-20℃保存,使用时稀释100倍,所有引物均有生工生物(上海)技术有限公司合成)。

pcr(eppendorf5331)反应体系25μl,其中25ng/μldna样品2.0μl、含10×pcrbuffer(mg2+plus)2.5μl、25mmoll-1dntps1.2μl、10μmoll-1引物各0.5μl、0.5uμl-1taq酶0.1μl,最后用ddh2o补足25μl。pcr扩增程序为94℃预变性5min;94℃变性30s,65℃退火30s,72℃延伸30s,共10个循环,每个循环退火温度降低0.7℃;94℃变性30s,55℃退火30s,72℃延伸30s,共25个循环;最后72℃延伸7min,4℃保存。

pcr产物的毛细管电泳和数据处理按照下述方法进行:扩增结束后,首先,取1μl用fam或者hex标记的pcr物,每孔加入9μl去离子甲酰胺(hidi:liz500(体积比:250:1))(appliedbiosystems,fostercity,ca),离心、震荡混匀、再离心。其次,95℃变性5min,迅速降到4℃,置于冰上10分钟后,上abi3730xl荧光测序仪(appliedbiosystems,fostercity,ca)检测,进行数据分析。最后,使用genemarkersoftwarex1.70(softgenetics,statecollegepa,usa)软件将扩增片段进行统计分析,并最终获得1/0矩阵的数据表。对于每一对引物的不同水平的多态位点按照条带大小选择100-500bp,其中有条带的记为“1”,无条带的记为“0”,缺失数据记为“9”。多态性位点信息含量pic(polymorphicinformationcontent)值的计算采用smith的方法,计算公式:

pic=1-k∑pi2

其中,pi是第i个等位基因的频率,k是一个ssr位点检测到的等位基因数量。利用ntsys-pc2.1软件对40份供试甘蔗材料进行遗传相似性系数计算,首先是采用软件中的子程序simqual对矩阵进行样本间的相似性系数(sm)计算,其次用子程序sahn中的非加权类平均法(upgma)进行聚类分析,最后用treeplot绘制树状聚类图。

通过应用28对引物对40个不同甘蔗属的材料(表3)进行毛细管电泳分析,根据生成的0-1表数据,进行upgma聚类分析(见图2),28对ssr标记在40份甘蔗样品中共检测出605个多态性标记位点,检测出的等位基因数介于2-23之间,平均每对引物检测出13.5个等位基因。在遗传距离为0.56的地方分为6个亚群,详细结果见表4。尽管在两个不同软件分析出的结果中每个亚群所包含的品种不尽相同,但相似系数高的品种基本都划分在同一个亚群。在聚类图中,供试的40份材料遗传相似性系数为0.54-0.84之间,变异幅度较大,平均值为0.62,而来自国外的cp96-1602、q200、q202和国内的桂糖02-351、桂糖73-167桂糖96-211、粤甘16号、粤糖86-368较早的与其余32个甘蔗材料分开,表明其具有较远的亲缘关系,在选配杂交组合时应予以考虑。q209与fr99-49、cp85-1308和cp88-1762在聚类时,没有分开,表明这两种材料保育时很可能出现了混杂,应该进一步进行形态学分类确定。

表328对在具有扩增多态性的甘蔗ssr引物信息表

表440分甘蔗样品聚类分析结果

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

sequencelisting

<110>福建农林大学

<120>一种开发甘蔗ssr标记和鉴定甘蔗亲本亲缘关系的方法

<130>56

<160>56

<170>patentinversion3.3

<210>1

<211>20

<212>dna

<213>人工序列

<400>1

ttcctcgccaagtactcgat20

<210>2

<211>20

<212>dna

<213>2

<400>2

gcatcacacactggcaaaat20

<210>3

<211>19

<212>dna

<213>人工序列

<400>3

cttccgtgtcgatcgtttg19

<210>4

<211>20

<212>dna

<213>人工序列

<400>4

tcaagtacgtatggcaccga20

<210>5

<211>21

<212>dna

<213>人工序列

<400>5

tggctttacgaccaatttctg21

<210>6

<211>20

<212>dna

<213>人工序列

<400>6

ctgattctatttcggccacc20

<210>7

<211>20

<212>dna

<213>人工序列

<400>7

cagggattagggacgaagag20

<210>8

<211>20

<212>dna

<213>人工序列

<400>8

ccaccacttcacctccagtt20

<210>9

<211>20

<212>dna

<213>人工序列

<400>9

ccaccacttcacctccagtt20

<210>10

<211>20

<212>dna

<213>人工序列

<400>10

cagggattagggacgaagag20

<210>11

<211>24

<212>dna

<213>人工序列

<400>11

tcaaagtgttattctgtagccagc24

<210>12

<211>20

<212>dna

<213>人工序列

<400>12

tttcgtggtactgtgcgtag20

<210>13

<211>20

<212>dna

<213>人工序列

<400>13

atggtggtgggtccactatg20

<210>14

<211>21

<212>dna

<213>人工序列

<400>14

tccatgcattttaagcatttt21

<210>15

<211>20

<212>dna

<213>人工序列

<400>15

actcgcatggtccttcaact20

<210>16

<211>22

<212>dna

<213>人工序列

<400>16

tctttttatgatttttcgcgct22

<210>17

<211>24

<212>dna

<213>人工序列

<400>17

tgcatagattcacttttcaattcc24

<210>18

<211>24

<212>dna

<213>人工序列

<400>18

tcgtaaatagaggtggctacaaaa24

<210>19

<211>22

<212>dna

<213>人工序列

<400>19

ggccttgggtatgtaagttgtg22

<210>20

<211>20

<212>dna

<213>人工序列

<400>20

tgagtcaaggatgtcaccca20

<210>21

<211>21

<212>dna

<213>人工序列

<400>21

ttgcattgacacaaattgcat21

<210>22

<211>22

<212>dna

<213>人工序列

<400>22

tcgagttttgcagacaagaaga22

<210>23

<211>21

<212>dna

<213>人工序列

<400>23

ttatgctgtattgagcgcaga21

<210>24

<211>20

<212>dna

<213>人工序列

<400>24

cgtaaatggaggtggctaca20

<210>25

<211>20

<212>dna

<213>人工序列

<400>25

aggaaggctcttggagatga20

<210>26

<211>20

<212>dna

<213>人工序列

<400>26

tggaagcaacaagagaaggg20

<210>27

<211>20

<212>dna

<213>人工序列

<400>27

caccgtttcattcctccatc20

<210>28

<211>22

<212>dna

<213>人工序列

<400>28

cacagcaaacaacagatcatca22

<210>29

<211>23

<212>dna

<213>人工序列

<400>29

tcgtaactcaaagtggctacaaa23

<210>30

<211>20

<212>dna

<213>人工序列

<400>30

atgcatggggtccttgataa20

<210>31

<211>24

<212>dna

<213>人工序列

<400>31

caaaaattctcctttgatgctttt24

<210>32

<211>24

<212>dna

<213>人工序列

<400>32

tgctgaaaataacaatttatgcca24

<210>33

<211>20

<212>dna

<213>人工序列

<400>33

ccgggatcttgaagaagcta20

<210>34

<211>20

<212>dna

<213>人工序列

<400>34

tcgcagtacgactcctgatg20

<210>35

<211>20

<212>dna

<213>人工序列

<400>35

atttacccttccgtgtcgat20

<210>36

<211>20

<212>dna

<213>人工序列

<400>36

cgagggtaattgtcgcctac20

<210>37

<211>20

<212>dna

<213>人工序列

<400>37

ccgtagcattcttcggtgtt20

<210>38

<211>20

<212>dna

<213>人工序列

<400>38

tacggcatgttgattcctca20

<210>39

<211>20

<212>dna

<213>人工序列

<400>39

tgaaatgtcacatgattgcg20

<210>40

<211>20

<212>dna

<213>人工序列

<400>40

cctcatgggatctagaggca20

<210>41

<211>23

<212>dna

<213>人工序列

<400>41

tctgaatctgcctaccctagttg23

<210>42

<211>20

<212>dna

<213>人工序列

<400>42

tcataccttgtttccaccgc20

<210>43

<211>22

<212>dna

<213>人工序列

<400>43

agccagttacagaacagtggtt22

<210>44

<211>20

<212>dna

<213>人工序列

<400>44

gtttggcgtagaatagcacg20

<210>45

<211>20

<212>dna

<213>人工序列

<400>45

cagtgggctagccaagaaac20

<210>46

<211>20

<212>dna

<213>人工序列

<400>46

taggcgcctcaaatttagca20

<210>47

<211>20

<212>dna

<213>人工序列

<400>47

tggcaattattgtccgatca20

<210>48

<211>20

<212>dna

<213>人工序列

<400>48

tctttggacacatgcctgaa20

<210>49

<211>20

<212>dna

<213>人工序列

<400>49

ctggacagtgtttggccttt20

<210>50

<211>19

<212>dna

<213>人工序列

<400>50

tatttgcagtctccgcagc19

<210>51

<211>22

<212>dna

<213>人工序列

<400>51

aagcaaattggtggctaaaatc22

<210>52

<211>20

<212>dna

<213>人工序列

<400>52

tgcaaatggctctcaaaatg20

<210>53

<211>23

<212>dna

<213>人工序列

<400>53

tctgaatctgcctaccctagttg23

<210>54

<211>20

<212>dna

<213>人工序列

<400>54

gacccttgtttcttcaccca20

<210>55

<211>21

<212>dna

<213>人工序列

<400>55

catcggcagcttacttcctaa21

<210>56

<211>21

<212>dna

<213>人工序列

<400>56

cgagtcttcttcgaatgttgc21

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1