一种甘蔗栽培种基因组SSR分子标记开发方法和应用与流程

文档序号:19376143发布日期:2019-12-10 23:53阅读:341来源:国知局
一种甘蔗栽培种基因组SSR分子标记开发方法和应用与流程

本发明属于甘蔗分子育种技术领域,涉及一种基于甘蔗全基因组数据进行ssr标记开发和应用。



背景技术:

甘蔗(sacchrumspp.hybrid)是一种重要的c4植物,具有适应性强、生物量高、光合作用效率高、可连续多年种植及固定co2多的低碳作物,是世界上重要的糖料作物(占比世界上食糖总量的80%)和生物能源作物(占世界上生物乙醇的40%)之一。在1887年,soltwedel和jbharrison,jrbovell分别在爪哇和西印度巴巴多斯试验场发现甘蔗种子可以产生幼苗,开启了甘蔗有性杂交的历史(骆君骕1992)。而现代甘蔗栽培种是由甘蔗祖先种热带种(saccharumofficinaruml.,2n=80,x=10)和割手密(saccharumspontaneuml.,2n=40~128,x=8)进行种间杂交,产生真正意义上的甘蔗杂种,选育出的新品种即为现代甘蔗栽培种。由于甘蔗栽培种的高度多倍体及非整倍体的复杂遗传背景,且复杂性超过了大多数甚至所有其他作物,造成甘蔗的遗传、育种及基因组测序等都面临巨大的困难(piperidisetal.2010;wangetal.2017)。

由于简单重复序列(simplesequencerepeats,ssr)具有高度的多态性、广泛分布于真核生物的基因组上重复序列(piperidisetal.2010;wangetal.2017),且分布随机(smithanddevey1994),但更偏向于低重复、富含基因的区域(morganteetal.2002)。由于ssr位点在dna复制时产生错误的比率较高,因而可以在种内或种间产生大量的长度的变异,(michaelklintscharetal.2004),开发和筛选出作多态性高、重复性好的ssr分子标记,可以广泛应用于各种动、植物的品种指纹图谱鉴定、遗传多样性分析、遗传图谱构建及重要性状(基因)的遗传定位或解析等领域。然而,相对于其他禾本科作物等模式作物,甘蔗ssr分子标记开发及遗传连锁图谱构建都比较落后,相关的国内外报道都比较少。与其它禾本科作物相比较,甘蔗已开发ssr标记存在标记数量少、多态性低,无法满足甘蔗分子标记辅助育种和遗传作图等工作的要求。近年来,ssr分子标记在甘蔗栽培种上的应用也在逐步展开,但是目前可公开获得的甘蔗栽培种的ssr分子标记数量有限,由于目前甘蔗栽培种的尚未完成基因组序列测定,大规模开发ssr分子标记无法进行。而传统的ssr标记开发方法存在诸多缺点,耗费人力、物力、且效率低下,尤其是对于多倍体的甘蔗,开发难度更加大。

基于甘蔗和高粱存在较高的基因共线性和序列保守性,且甘蔗单倍体基因组接近高粱基因组大小。最近,garsmeuretal.(2018)用全基因组分析(wgptm)技术将r570甘蔗品种的bacs与高粱基因组进行比对,确定了一个由4660个甘蔗bacs文库片段组成的覆盖甘蔗单倍体基因组常染色质的bacs的最小标记路径。本发明基于甘蔗栽培种单倍体全基因组序列,利用生物信息学方法,分析基因组上ssr位点的特征和分布规律,设计和合成ssr引物,验证ssr分子标记的多态性,为甘蔗栽培种的分子指纹图谱、品种间遗传多样性、重要农艺性状的遗传机理研究及开展分子育种研究提供分子标记支撑。



技术实现要素:

本发明的目的在于一种基于4460个bac文库片段构成的甘蔗栽培种r570单倍体全基因组数据,利用misa软件进行全基因组扫描,根据已报到多态性高的基元类型,设计、合成和验证的ssr标记引物,开发的引物应具有扩增结果稳定、电泳条带清晰可辨、多态性位点高的优点,可以广泛应用于甘蔗栽培种遗传多样性分析、新品种鉴定和保护、dna指纹图谱及遗传连锁图谱的构建。

本发明的技术方案是:基于全基因组单倍体序列开发的ssr引物,共找到27241个ssr位点,设计引物,其特征是,选择以tg和ca基元类型的ssr引物共计50对,重复次数分别在tg(11-69)、ca(23-38)之间的ssr位点,对其进行了引物设计和合成,筛选出20对引物,序列如seqidno.1-40所示。

上述的ssr核心引物组在甘蔗遗传多样性分析、新品种鉴定和保护、dna指纹图谱及遗传连锁图谱的构建方面的应用。

本发明的有益效果:本发明筛选出的20对ssr核心引物主要是由tg基元和ag基元类型的ssr引物,覆盖面更加广泛,在甘蔗栽培种中多态性信息丰富、带型清晰容易判读,而且适合聚丙烯酰胺凝胶电泳和毛细管电泳检测平台检测分析,主要用于甘蔗遗传多样性分析、品种鉴定和保护、dna指纹图谱及遗传连锁图谱的构建,不仅仅有利用保护育种者的合法权益,打击甘蔗假冒品种传播和销售,也有利于促进甘蔗遗传育种水平提高和甘蔗产业的发展壮大。

附图说明

图1为部分ssr引物4个供试甘蔗材料上的pcr扩增电泳图谱,其中泳道1-4,5-8,9-12,13-16分别是引物fafur-s1,fafur-s2,fafur-s3,fafur-s4。

图2为ssr引物(fafur-s32)在24个供试甘蔗材料上的pcr扩增电泳图谱,其中m:代表50bpmarker。

图3为基于20对ssr分子标记的24份甘蔗属材料的upgma聚类分析。

具体实施方式

1.甘蔗全基因组ssr引物的开发

1.1甘蔗全基因组测序数据的获得

通过embl-欧洲生物信息学研究所的公共数据库,登录号为erz654945,获得甘蔗栽培种r570全基因组数据,或者也可以在法国农业研究所甘蔗基因组中心(http://sugarcane-genome.cirad.fr)上获得。

1.2甘蔗全基因组序列中ssr序列的查找和ssr引物的设计

本研究应用misa(microsatelliteidentificationtool)软件扫描甘蔗栽培种基因组序列,该软件下载自http://pgrc.ipk-gatersleben.de/misa/,在配置文件中设置参数,核苷酸重复基序(motif)分别为单(mononucleotiderepeatsmdrs)、二(dinucleotiderepeatsdnrs)、三(trinucleotiderepeatstnrs)、四(tetranucleotiderepeatsttnrs)、五(pentanucleotiderepeatspnrs)、六(hexanucleotiderepeatshnrs),最序列长度分别定为10、12、15、16、15、18。对ssr位点两侧截取各200bp序列设计引物,misa软件还提供一个与批量设计引物primer3的接口工具,可以把misa识别出来的ssr序列,转为primer3需要的格式,从而方便批量设计引物。用primer3(http://frodo.wi.mit.edu/primer3/)在线设计引物,引物设计参数为:primerlength:18-28bp;annealingtemperature:55-65℃;ampliconsize:100-500bp;gccontent:45-65%。

1.3甘蔗栽培种全基因组ssr引物的筛选

分别选择4份和24份甘蔗属材料,用于检测ssr标记的扩增效率及其在群体中的多态性。合成的50对引物,在4份材料的基因组dna进行初步的扩增,根据扩增结果,筛选出扩增结果稳定、特异性高及多态性丰富的引物。pcr反应体系25μl,其中25ng/μldna样品2.0μl、含10×pcrbuffer(mg2+plus)2.5μl、25mmoll-1dntps1.2μl、10moll-1引物各0.5μl、0.5uμl-1taq酶0.1μl,最后用ddh2o补足25μl。pcr扩增程序为94℃预变性5min;94℃变性30s,65℃退火30s,72℃延伸30s,共10个循环,每个循环退火温度降低0.7℃;94℃变性30s,55℃退火30s,72℃延伸30s,共25个循环;最后72℃延伸7min,4℃保存。taq酶、dntp等试剂购自北京康为世纪生物科技有限公司。所有pcr产物在6%的聚丙烯酰胺凝胶中进行分离,160v恒压下,dna分析仪(北京六一,dycz-20c)上进行电泳,电泳1.5h,电泳结束后,采用核酸染料(gelstain,购自北京全式金生物技术有限公司,货号:gs101-01),泡染法进行染色、拍照及保存。若有100-350bp扩增产物检测到,即为有效扩增引物,如果在4个个甘蔗属材料间存在不同等位基因扩增,视为多态性高的引物。

1.4多态性位点数据的读取

ssr位点:以引物名称后面加一个下划线紧跟扩增片段的大小,例如:est40_152对目标片段统计。表示引物est40在150bp的位置有一个多态性片段,有效片段范围在100bp至500个bp,“1”表示存在,“0”表示不存在,“-”表示条带缺失。

实施例1:

应用上述方法从法国农业研究所甘蔗基因组中心(http://sugarcane-genome.cirad.fr)上共计下载到序列4460条,找到27241个ssr位点,成功设计ssr引物22932对,具体操作如下:

从22932对设计的引物中,查找以tg和ca基元类型的ssr引物,随机选取其中的50对,利用4个甘蔗属材料(栽培种r570,栽培种roc1,热带种lapurple和割手密种ses208)进行扩增效率验证(见表1)。扩增结果表明:共有45对引物能够扩增出清晰的扩增条带,其余的5对引物没有扩增条带或者扩增产物量较弱,另有35对引物在4个材料上呈现多态性,多态率为70%(35/50),其中tg重复类型的引物有28对,ag重复类型的引物有7对。图1为部分ssr引物4个供试甘蔗材料上的pcr扩增电泳图谱,泳道1-4,5-8,9-12,13-16分别是引物fafur-s1,fafur-s2,fafur-s3,fafur-s4扩增结果。

表14份供试甘蔗种质信息

实施例2:

为了进一步验证本研究鉴定到ssr引物对的多态性,从上述筛选到的35对引物中,选用了20对多态性较高的ssr引物,对我国的18个骨干亲本(它们的血缘来自热带种,割手密种、大茎野生种和印度种的2-4个种)(见表2),2个甘蔗祖先种(割手密种ses208和热带种lapurple)和4个世界上重要的甘蔗栽培种(lcp85-384,r570,roc16和roc22)进行遗传多样性分析和ssr引物的多态性评价。结果表明:20对引物在24个甘蔗实验材料上呈现明显的多态性,共扩增得到等位基因95个,每对扩增出1-7个等位基因,平均每一对引物扩增出4.75个等位基因。图2展示了其中2对ssr引物在24个供试甘蔗材料上的pcr扩增电泳图谱,对电泳图进行数据读取,建立0-1数据矩阵。同时,利用upgma软件分析数据矩阵,聚类分析后生成亲缘关系进化树,结果见图3。

由图3可见供试材料之间的遗传相似系数分布在0.40~0.82之间,在遗传相似性系数为0.525,可将24个甘蔗材料分成5种类型,第一类型包含2个甘蔗栽培种co1001和co419;第二种类型有19个甘蔗材料;第三种类型仅有1个热带种类型lapurple;第四种有1个甘蔗栽培种材料cp28-11;第五种有1个甘蔗属割手密种ses208,其中ses208在相似性系数为0.4时,与其他甘蔗栽培种和热带种(lapurple)较早的分开,表明割手密种与甘蔗栽培种具有较远的亲缘关系。根据张琼etal.(2009)等分析结果cp28-11具有热带种(0.5)、割手密(0.125)和印度种(0.375)的血缘关系,遗传关系介于割手密和热带种之间,本研究结果与上述研究基本一致。而热带种(lapurple)在相似性系数为0.525与其他甘蔗栽培种分开,随后是印度种co1001和co419在相似性系数为0.551与其他栽培种分开,结果表明印度种亲缘关系介于热带种与甘蔗栽培种之间,也具有较丰富的遗传多样性。

表224份供试甘蔗栽培种种质信息

表320对具有扩增多态性的ssr引物信息表

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

sequencelisting

<110>福建农林大学

<120>一种甘蔗栽培种基因组ssr分子标记开发方法和应用

<130>40

<160>40

<170>patentinversion3.3

<210>1

<211>20

<212>dna

<213>人工序列

<400>1

tcatacccattggaagaagc20

<210>2

<211>20

<212>dna

<213>人工序列

<400>2

gttatgttgccgtgccaagt20

<210>3

<211>20

<212>dna

<213>人工序列

<400>3

tagcctttggtcgttcttgg20

<210>4

<211>20

<212>dna

<213>人工序列

<400>4

aatgcttcatccatagggga20

<210>5

<211>20

<212>dna

<213>人工序列

<400>5

gcctggggaactatgctgta20

<210>6

<211>20

<212>dna

<213>人工序列

<400>6

caagcattgaagttgccaaa20

<210>7

<211>20

<212>dna

<213>人工序列

<400>7

cgtcagttgctcagctcttg20

<210>8

<211>20

<212>dna

<213>人工序列

<400>8

ccctgggaagaagaggtagg20

<210>9

<211>20

<212>dna

<213>人工序列

<400>9

aatgatgtttcgcctgatcc20

<210>10

<211>20

<212>dna

<213>人工序列

<400>10

accaacacaactcgctaccc20

<210>11

<211>20

<212>dna

<213>人工序列

<400>11

ccacattcttcgaccctgtt20

<210>12

<211>20

<212>dna

<213>人工序列

<400>12

ccatcctgcgaactaaccat20

<210>13

<211>20

<212>dna

<213>人工序列

<400>13

agggcacgaggtattgctta20

<210>14

<211>20

<212>dna

<213>人工序列

<400>14

aaccggtcaaatcacacaca20

<210>15

<211>20

<212>dna

<213>人工序列

<400>15

atctttcggcatcaacttgg20

<210>16

<211>20

<212>dna

<213>人工序列

<400>16

gcttcaagccatctgtctcc20

<210>17

<211>20

<212>dna

<213>人工序列

<400>17

caacgaattccacttgcaca20

<210>18

<211>20

<212>dna

<213>人工序列

<400>18

tcatggctattgtggtctgg20

<210>19

<211>20

<212>dna

<213>人工序列

<400>19

ctcctctgtcacccagcact20

<210>20

<211>20

<212>dna

<213>人工序列

<400>20

gatcaccccagatccagaga20

<210>21

<211>20

<212>dna

<213>人工序列

<400>21

tgctgattatgtgctgcctc20

<210>22

<211>20

<212>dna

<213>人工序列

<400>22

cacgcctagggcataagaga20

<210>23

<211>20

<212>dna

<213>人工序列

<400>23

gacacccaccacaggacttt20

<210>24

<211>20

<212>dna

<213>人工序列

<400>24

ccctccccaatcctatcagt20

<210>25

<211>21

<212>dna

<213>人工序列

<400>25

gaacttccgcaagacaattca21

<210>26

<211>20

<212>dna

<213>人工序列

<400>26

cacacacacacacacaagcg20

<210>27

<211>20

<212>dna

<213>人工序列

<400>27

gctgatgtttggtcatgtgg20

<210>28

<211>20

<212>dna

<213>人工序列

<400>28

tgcagactcagaagtagccg20

<210>29

<211>20

<212>dna

<213>人工序列

<400>29

tgtttcaggcactgttttgg20

<210>30

<211>20

<212>dna

<213>人工序列

<400>30

agcaatgtgttctccatcca20

<210>31

<211>20

<212>dna

<213>人工序列

<400>31

cggcacaagtaaatgcaaga20

<210>32

<211>20

<212>dna

<213>人工序列

<400>32

agtactgccaacaaggcagg20

<210>33

<211>20

<212>dna

<213>人工序列

<400>33

cttgagctcgtagcctcctc20

<210>34

<211>20

<212>dna

<213>人工序列

<400>34

gcctctgctgtctgctctct20

<210>35

<211>20

<212>dna

<213>人工序列

<400>35

agtgcaggttggctttctgt20

<210>36

<211>20

<212>dna

<213>人工序列

<400>36

ggggattccaagtctcaaca20

<210>37

<211>20

<212>dna

<213>人工序列

<400>37

gtaccagcccaaaaactgga20

<210>38

<211>20

<212>dna

<213>人工序列

<400>38

ttgtcactgggaacacggta20

<210>39

<211>20

<212>dna

<213>人工序列

<400>39

ttctccgtcaactgtcatgc20

<210>40

<211>20

<212>dna

<213>人工序列

<400>40

tcctacggagggaaatcaaa20

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1