本发明涉及分子生物学技术领域,具体涉及一种基于牛膝转录组开发的est-ssr引物组及其获取方法。
背景技术:
牛膝为苋科牛膝属的植物,具有引火下行、补肝肾、活血通经、利尿通淋、强筋骨等功效。临床用于治疗月经不调、痛经、小便不利、尿道涩痛等病症。
牛膝品种繁多,遗传背景模糊,品种混杂现象严重,同名异物问题时常出现,市场上也常出售有牛膝的代用、混用品,给中药材市场的规范和用药安全带来一定的不利因素;同时加之以管理不当,种植区域的限制以及品种间混杂因素,严重影响着牛膝品种的选育及市场流通。
est-ssr分子标记的原理是由1-6个核苷酸组成的简单重复序列,广泛分布于真核生物基因组中;ssr序列两侧一般是相对保守的单拷贝序列,可以设计一对特异引物来扩增该位点,经聚丙烯酰胺凝胶电泳,获知不同个体在这个位点上由于基本单元重复次数不同而形成的多态性。传统的基因组ssr标记开发过程较慢,需要进行基因组文库的构建、重复序列克隆、筛选、测序、引物设计等环节,费时耗力、成本高、效率低。随着功能基因组学的发展,大量的植物est已经成为开发以pcr为基础的新型分子标记的重要资源
est-ssr作为一种新型分子标记,由于重复序列信息直接来源于mrna,因此检测的是不同种质材料间基因表达差异的信息,这种差异可以和表现型直接联系。est-ssr作为基因的一部分,通常其侧翼序列保守性较高,因而,基于est序列开发的ssr标记在不同物种间具有良好的通用性,从一个物种开发的est-ssr标记可用于其他物种的研究,利用该标记遗传作图将使物种之间连锁信息的转换更快,能用作校正标记,实现多个图谱整合,进而为比较基因组学和同源基因克隆提供新的途径。同时省去了基因组ssr引物开发过程中的克隆和测序步骤,充分利用了现有测序数据,降低了开发成本。由于上述优点,使得est-ssr标记在遗传图谱构建、亲缘关系鉴定、功能基因定位和比较作图以及分子标记辅助选择育种等众多研究领域具有更高的应用价值。
随着现代分子生物技术的快速发展,采用计算机方法大规模发掘est-ssr多态性位点极大地提高了ssr标记开发效率。更为重要的是,est-ssr标记技术的应用为基因组信息匮乏物种的种质资源研究提供了强有力的工具。利用转录组开发est-ssr,将大力推进药用植物种质资源的研究和优良新品种选育。
由于牛膝遗传基础匮乏,基因组信息尚未公开,目前,牛膝分子标记的相关研究均是根据其他植物分子标记位点的通用引物来进行牛膝种质资源的研究,无法发现牛膝中特异的分子标记,由于所用的这些标记不具有特异性,不能准确评价牛膝种质资源的遗传背景。因此,亟待建立有效的est-ssr分子标记,进而构建快速、高效的品种(系)鉴定体系,用于分析牛膝种质的亲缘进化关系,构建其遗传指纹图谱,为牛膝优良新品种的选育奠定基础。
技术实现要素:
本发明要解决的技术问题是提供一种基于牛膝转录组开发的est-ssr引物组及其获取方法。
为解决上述技术问题,具体采用的技术方案如下:
设计一种基于牛膝转录组开发的est-ssr引物组,该引物组包括下述23对引物,每对引物由上游引物和下游引物组成,每对引物的核苷酸序列如序列表seqidno:1至seqidno:48所示。
设计一种获取基于牛膝转录组开发的est-ssr引物组的方法,包括以下步骤:
(1)构建牛膝转录组文库,对文库中转录组测序数据拼接,去冗余得到unigenes;
(2)利用misa软件对unigenes进行est-ssr位点筛选;
(3)用primer3软件对est-ssr位点进行引物设计得到设计的est-ssr引物;
(4)采用ctab法提取牛膝基因组dna,用est-ssr引物对牛膝dna进行pcr扩增,然后进行琼脂糖凝胶电泳,根据电泳结果验证est-ssr分子标记引物。
基于牛膝转录组开发的est-ssr引物组的获取方法步骤(2)中,ssr可被检测到的重复序列的参数设置为:单核苷酸至少重复10次,二核苷酸至少重复6次,三核苷酸至少重复5次,四核苷酸至少重复5次,五核苷酸至少重复5次,六核苷酸至少重复5次。
基于牛膝转录组开发的est-ssr引物组的获取方法步骤(4)中,pcr扩增的反应体系为:总反应体系为20μl,体系中包含2~24mg/l的dna;0.05~0.6μmol/l的引物;50~400μmol/l的dntps和5~80u/l的dna聚合酶,在退火温度为57~60℃下反应25~35个pcr循环。
优选的pcr扩增反应体系为20μl,体系中包含6mg/l的dna、0.2μmol/l的引物、200μmol/l的dntps和60u/l的dna聚合酶,在退火温度为57℃下反应35个pcr循环。
本发明的有益技术效果在于:
1.本发明利用牛膝转录组的est序列,首次批量开发了牛膝的est-ssr序列,由于获得的ssr重复序列信息直接来源于mrna,而不是基因组,因此检测的是不同种质材料间基因表达差异的信息,使得这种差异可以和表现型直接联系。
2.本发明开发了牛膝特有的est-ssr标记,为牛膝种质资源的准确评价、特异性状基因的定位、遗传图谱的构建等研究提供了重要的信息平台。
3.本发明在节约资源的基础上,通过pcr反应体系及其程序的优化,建立了一种适合鉴定牛膝est-ssr标记的pcr扩增体系,为从牛膝中鉴定出新型的est-ssr标记提供了有力的工具。
附图说明
图1是提取的牛膝dna琼脂糖电泳检测结果图;
图2是不同的dna浓度对est-ssr的pcr扩增产物的影响图;
图3是不同的引物浓度对est-ssr的pcr扩增产物的影响图;
图4是不同的dntps浓度对est-ssr的pcr扩增产物的影响图;
图5是不同的dna聚合酶浓度对est-ssr的pcr扩增产物的影响图;
图6是不同的pcr反应程序对est-ssr的pcr扩增产物的影响图;
图7是鉴定的est-ssr序列pcr扩增产物电泳结果图。
具体实施方式
下面结合附图和实施例来说明本发明的具体实施方式,但以下实施例只是用来详细说明本发明,并不以任何方式限制本发明的范围。在以下实施例中所涉及的仪器设备如无特别说明,均为常规仪器设备;所涉及的试剂如无特别说明,均为市售常规试剂。所涉及的实验方法,如无特别说明,均为常规实验方法。
实施例1:
(1)构建的牛膝转录组文库,
分别收集种植1年(r1)和连续种植2年(r2)“怀牛膝1号”品种籽形成期的根系(重复3次,共6个样品),用trizol法提取总rna后,用带有oligo(dt)的磁珠富集mrna。加入fragmentationbuffer将mrna打断成短片段,以mrna为模板,用6碱基随机引物(randomhexamers)反转录合成第一条cdna链,然后加入缓冲液、dntps、rnaseh和dnapolymerasei合成双链cdna链,再用ampurexpbeads纯化双链cdna、加接头,cdna先进行末端修复、加a尾并连接测序接头,再用ampurexpbeads进行片段大小选择。最后进行pcr扩增,并用ampurexpbeads纯化pcr产物,建好的6个测序文库illuminahiseq™4000测序仪进行测序。6个测序库共产生的原始reads,原始reads经去接头、去低质量的reads后,6个库共产生268,190,758个cleanreads序列,利用trinity软件进行序列拼接,最终获得平均长度为1060bp的87,256个unigenes序列,详细数据如表1所示,其中其中,r1-1、r1-2、r1-3分别表示r1样品的三个生物学重复;r2-1,r2-2、r2-3分别表示r2样品的三个生物学重复;q20、q30分别表示phred数值大于20、30的碱基占总体碱基的百分比。
表1牛膝根部的6个测序库产生的reads数量和质量汇总
(2)对转录组文库进行测序,测序总长度为92,453,545bp,利用misa软件对牛膝87,256个unigenes进行est-ssr位点筛选,各个ssr可被检测到的重复序列的参数设置分别为:单核苷酸至少重复10次,二核苷酸至少重复6次,三核苷酸至少重复5次,四核苷酸至少重复5次,五核苷酸至少重复5次,六核苷酸至少重复5次。鉴定的长度大于18bp的ssr有23,844个;包含ssr所含序列的unigenes有19,045个;其中超过1个ssr的unigenes有3,822个;ssr重复出现在2个以上的unigenes数量为1,371。
(3)根据ssr侧翼序列保守原则,用primer3软件设计ssr位点两侧引物,引物设计的参数设置为默认参数,随机选择的23个est-ssr序列及其引物如表2所示。
表2基于牛膝转录组鉴定的est-ssr引物组
(4)采用ctab法提取待广泛种植的“怀牛膝1号”的基因组dna,用1%的琼脂糖凝胶电泳检测dna完整性及rna污染情况,用nandrop1000检测仪检测dna浓度和纯度。如图1所示,提取的dna经电泳检测的条带明亮、清晰、无脱带。1~4泳道的dna量分别为2µg、1.5µg、1µg、0.5µg。
用所述设计的est-ssr引物cluster-6082.39339对牛膝dna进行pcr扩增,然后进行琼脂糖凝胶电泳,根据电泳结果验证est-ssr分子标记引物。
实施例2
在不同pcr处理条件下分析对est-ssr的pcr扩增产物的影响情况,实验及分析结果如下:
(1)pcr扩增反应体系为20μl,taqdna聚合酶浓度(60u/l)、正反引物浓度(0.2μmol/l)、dntp浓度(200μmol/l),模板dna设置8个用量梯度,分别为2、4、6、8、10、12、14、16、18、20、22、24mg/l,在美国abi2720型pcr扩增仪上进行。反应程序为:94℃预变性2分钟;94℃变性30秒、57℃退火30秒、72℃延伸40秒,30个循环;72℃延伸5分钟;用1%的琼脂糖凝胶电泳检测。
结果如图2所示,m泳道为dl2000marker,牛膝dna浓度在2~24mg/l范围内均能获得特异的清晰条带,其中在dna浓度为6mg/l(第3泳道)时获得的条带最为明亮。
(2)在其他实验条件与步骤(1)中pcr扩增反应体系相同的情况下,引物浓度设置12个梯度(正反引物相同),即0.05、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6μmol/l。用1%的琼脂糖凝胶电泳检测。
结果如图3所示,引物浓度为0.2μmol/l(第4泳道)时获得的条带最为特异、明亮,且无拖带现象。
(3)在其他实验条件与步骤(1)中pcr扩增反应体系相同的情况下,dntps浓度设置8个梯度,分别为50、100、150、200、250、300、350、400μmol/l。用1%的琼脂糖凝胶电泳检测。
结果如图4所示,ntps浓度为200μmol/l(第4泳道)时获得的条带最为特异、清晰。
(4)在其他实验条件与步骤(1)中pcr扩增反应体系相同的情况下,dna聚合酶浓度设置9个梯度,分别为5、10、20、30、40、50、60、70、80u/l。用1%的琼脂糖凝胶电泳检测。
结果如图5所示,dna聚合酶浓度为60u/l(第7泳道)和80u/l(第9泳道)时均能获得特异、清晰的条带;考虑到经济实用性,以最少的酶量达到最优的效果,故dna聚合酶浓度为60u/l时应为本发明的pcr反应体系中最佳用量。
(5)在其他实验条件与步骤(1)中pcr扩增反应体系相同的情况下,设置反应程序:退火温度57℃、25个循环,57℃、30个循环,57℃、35个循环,58℃、25个循环,58℃、30个循环,58℃、35个循环,59℃、25个循环,59℃、30个循环,59℃、35个循环,60℃、25个循环,60℃、30个循环,60℃、35个循环。
结果如图6所示,在退火温度55℃、35个循环(第3泳道)的反应条件下,获得的条带最为特异、明亮。
综上所述,本发明最优pcr扩增反应体系为20μl体系中包含6mg/l的dna、0.2μmol/l的引物、200μmol/l的dntps和60u/l的dna聚合酶,在退火温度为57℃下反应35个pcr循环。
实施例3
选取表1中采用primer3软件进行设计所有引物。基于实施例2中优化的牛膝est-ssr扩增体系,并随机选择22个est-ssr验证所建立的扩增体系的有效性。如图7所示,21个est-ssr序列被检测到特异的目的条带,说明本发明所建立的鉴定est-ssr序列的pcr检测方法可用于鉴定牛膝est-ssr标记研究的后续实验。
上面结合附图和实施例对本发明作了详细的说明,但是,所属技术领域的技术人员能够理解,在不脱离本发明宗旨的前提下,还可以对上述实施例中的各个具体参数进行变更,形成多个具体的实施例,均为本发明的常见变化范围,在此不再一一详述。
sequencelisting
<110>河南工业大学
<120>基于牛膝转录组开发的est-ssr引物组及其获取方法
<130>2017
<160>46
<170>patentinversion3.2
<210>1
<211>20
<212>dna
<213>人工序列
<400>1
cctggtttgggtggagatcc20
<210>2
<211>20
<212>dna
<213>人工序列
<400>2
acgaccaccatgagtccaac20
<210>3
<211>20
<212>dna
<213>人工序列
<400>3
ttaatgtgagctgccctggg20
<210>4
<211>20
<212>dna
<213>人工序列
<400>4
tactgctgttgcccagatgg20
<210>5
<211>20
<212>dna
<213>人工序列
<400>5
cggacttagacccggtgatg20
<210>6
<211>20
<212>dna
<213>人工序列
<400>6
tcgcttttctcccccaactc20
<210>7
<211>20
<212>dna
<213>人工序列
<400>7
cccccaagaaggtacaaggg20
<210>8
<211>20
<212>dna
<213>人工序列
<400>8
ccaagttggacgctacccaa20
<210>9
<211>20
<212>dna
<213>人工序列
<400>9
cgggcccggaaataatggta20
<210>10
<211>20
<212>dna
<213>人工序列
<400>10
atttgggctatgggtggcat20
<210>11
<211>20
<212>dna
<213>人工序列
<400>11
tcgtaataaccgacggcagg20
<210>12
<211>20
<212>dna
<213>人工序列
<400>12
ccgtctctccctttgccttt20
<210>13
<211>20
<212>dna
<213>人工序列
<400>13
ccaagcaatgttggtccagc20
<210>14
<211>20
<212>dna
<213>人工序列
<400>14
aatggtagcggcttagaggc20
<210>15
<211>20
<212>dna
<213>人工序列
<400>15
tcgacacgagtttcgaggtt20
<210>16
<211>22
<212>dna
<213>人工序列
<400>16
gtctcaccattaccaaacccct22
<210>17
<211>20
<212>dna
<213>人工序列
<400>17
aagatacggttgtcgacggc20
<210>18
<211>21
<212>dna
<213>人工序列
<400>18
tggcaatctcaactccaacct21
<210>19
<211>20
<212>dna
<213>人工序列
<400>19
caagcgcgatcatacgttcg20
<210>20
<211>20
<212>dna
<213>人工序列
<400>20
cctcccttcagaaaacggca20
<210>21
<211>20
<212>dna
<213>人工序列
<400>21
ccggtttgaatgctgccaaa20
<210>22
<211>20
<212>dna
<213>人工序列
<400>22
tggggcctcaatttcgatga20
<210>23
<211>20
<212>dna
<213>人工序列
<400>23
ccaagatcaccgtctccacc20
<210>24
<211>20
<212>dna
<213>人工序列
<400>24
tggccttccacaattccgtt20
<210>25
<211>20
<212>dna
<213>人工序列
<400>25
ggagctgcccagaagaaact20
<210>26
<211>21
<212>dna
<213>人工序列
<400>26
acgtccaatcatcacctcgag21
<210>27
<211>20
<212>dna
<213>人工序列
<400>27
gttggttcttacggcgcttg20
<210>28
<211>20
<212>dna
<213>人工序列
<400>28
attgcctgcacgaccaaatg20
<210>29
<211>20
<212>dna
<213>人工序列
<400>29
gcaagccgttgattagcacc20
<210>30
<211>20
<212>dna
<213>人工序列
<400>30
gagaagtaccaccaccacca20
<210>31
<211>20
<212>dna
<213>人工序列
<400>31
gaggagtccattagagcggc20
<210>32
<211>20
<212>dna
<213>人工序列
<400>32
gagctaaggaggacaagggc20
<210>33
<211>20
<212>dna
<213>人工序列
<400>33
gctgttgttgctgttgttgc20
<210>34
<211>20
<212>dna
<213>人工序列
<400>34
ggagagggtgtgtttgaggg20
<210>35
<211>20
<212>dna
<213>人工序列
<400>35
cggtgttaaaaagcgcccaa20
<210>36
<211>20
<212>dna
<213>人工序列
<400>36
cgtaaagcaaagcggtggtt20
<210>37
<211>20
<212>dna
<213>人工序列
<400>37
gactgctgttgctgctgttg20
<210>38
<211>20
<212>dna
<213>人工序列
<400>38
ggtagcaatagactcccgcc20
<210>39
<211>20
<212>dna
<213>人工序列
<400>39
tgtggtggttctaggtcgga20
<210>40
<211>20
<212>dna
<213>人工序列
<400>40
gagctaaggaggacaagggc20
<210>41
<211>20
<212>dna
<213>人工序列
<400>41
gcagcaagatcagaacgctg20
<210>42
<211>20
<212>dna
<213>人工序列
<400>42
acagcagcagaaccaacatt20
<210>43
<211>19
<212>dna
<213>人工序列
<400>43
atcaccagcacaagcagct19
<210>44
<211>20
<212>dna
<213>人工序列
<400>44
ctagcatgccaggtgatgct20
<210>45
<211>22
<212>dna
<213>人工序列
<400>45
tgtccccttcaatccctattcc22
<210>46
<211>20
<212>dna
<213>人工序列
<400>46
accccaaaacctcctcatcc20