一种基于RNA-Seq开发的小扁豆KASP标记及应用的制作方法

文档序号：18009395发布日期：2019-06-25 23:48阅读：868来源：国知局

本发明涉及一种基于rna-seq开发的小扁豆kasp标记及应用，涉及分子标记技术领域。

背景技术：

小扁豆是一年生自花受粉、长日性草本植物，同时也是一种重要的冷季食用豆，二倍体(2n＝2x＝14)植物，基因组大小约为4g。小扁豆是世界第六大食用豆。小扁豆是人类饮食中蛋白质、糖类、维他命和微量元素的重要来源，同时也是牲畜高价值饲料。小扁豆因其固氮能力而有益于作物轮作。但是，由于小扁豆常被种植在贫瘠的土壤中，并且受到干旱、高温胁迫以及各种病害，诸如枯萎病、炭疽病、锈病、颈腐病、根腐病和白霜病等原因的影响，小扁豆的单产量仍然较低。根据fao数据，世界平均单产只有1,152kg/ha。因此，利用合适的育种策略提高小扁豆的产量显得十分迫切。

kasp标记技术(即竞争性等位基因特异性pcr)是目前国际上主流的基因分型方法之一，基于引物末端碱基的特异匹配来对snp和特定位点上的indel进行精准的双等位基因判断。引物采用3条特异性引物，其中上游引物2条，3′端为等位变异碱基，5′端添加通用荧光接头序列，下游引物为普通引物，常规pcr扩增，终点法荧光信号检测。该技术准确率高，灵活性超强，无需昂贵的双色标记探针，最低的dna样本需求，无需全基因组扩增，快速高效，可以高通量检测大量样本的少数几个标记。

目前，kasp标记在小麦、玉米、大豆和花生等作物应用十分广泛。遗憾的是，在小扁豆中没有任何报道。

技术实现要素：

本发明克服了上述现有技术的不足，提供一种基于rna-seq开发的小扁豆kasp标记及应用。本发明通过kasp技术大规模开发了78个小扁豆kasp标记，并且阐述了这些标记在小扁豆种质资源遗传多样性分析方面的应用。

一组基于rna-seq开发的小扁豆kasp标记，包括如下78个kasp标记所对应的正向引物1、正向引物2和反向引物：

本发明还提供了所述小扁豆的kasp标记在小扁豆种质遗传多样性分析中的应用。

进一步的，上述小扁豆的kasp标记的引物通过如下步骤获得：

1)选取6份来源地不同的小扁豆材料，提取rna建立cdna文库，并在illumina平台上测序，获得原始reads；

2)将上述步骤1)获得的原始reads通过数据处理获得cleanreads，将cleanreads组装拼接后形成transcript和unigene；

3)利用步骤2)获得的unigene，依据过滤标准检测出snp位点，选用检测的snp位点设计kasp引物组；

4)提取步骤1)中所述的6份小扁豆材料和另外的选取的88份小扁豆材料(共计94份)的dna作为pcr扩增的dna模板，步骤3)中获得的每组kasp引物构成一个primermix，加入荧光标签后进行pcr扩增，利用带有荧光标签的扩增产物进行基因分型从而验证步骤3)中设计的kasp引物。

进一步的，步骤1)中所述的6份小扁豆材料为小扁豆苗期的整个植株。

进一步的，步骤2)中所述的数据处理包括如下步骤：删除包含adapter的reads、包含ploy-n的reads和低质量reads。

进一步的，步骤3)中所述的过滤标准为：集群：3；windowsize：35；qd<2.0或fs>60.0；mq<40.0或sor>4.0；mqranksum<-12.5或readposranksum<-8.0或dp<10。

进一步的，步骤3)中所述的kasp引物组包括两条特异性正向引物和一条通用反向引物。

进一步的，步骤4)中所述的pcr扩增的反应体系：总体积为4μl：dna模板、2.0μl2×mastermix、0.064μlprimermix、1.936μlddh2o。

进一步的，步骤4)中所述的pcr扩增的反应程序：94℃5min；94℃20s，61℃1min，10循环；94℃20s，55℃1min，26循环；72℃1min。

有益效果：

(1)本发明kasp标记的转化率较高，可以达到60％以上，与snp关联的性状可以很容易地转化为kasp标记，为将来用于小扁豆分子标记辅助育种提供支撑。

(2)kasp标记检测更方便，检测时间短、成本低。在96孔板上可以同时对多个体进行基因分型，增加了检测到稀有杂种个体的可能性。

(3)kasp标记更加灵活，可以通过在引物序列中加入简并或混合碱基来覆盖包含多个snp的序列。

(4)kasp标记检测是定量的，因此可以进行统计分析。

(5)本发明首次设计127个kasp标记对94份小扁豆种质进行基因分型，结果表明78(61.42％)个kasp标记是可用的，其中76(59.84％)个标记具有多态性，2(1.57％)个是单态的，其余标记检测失败。这76个kasp多态标记给小扁豆分子辅助育种提供一种全新的思路。

附图说明

图1kasp引物wd_snp1基于sequencedetectionsystemsv2.4的检测结果。

图2基于kasp标记的三维pca分析图。

图3基于kasp标记的upgma系统树图。

图4基于kasp标记的群体结构分析图。

具体实施方式

一、材料与方法

1、植物材料

选取6份小扁豆(lensculinarismedikus)作为试验材料，分别为a0000008来自中国山西，a0000094来自中国青海，a0000170来自中国陕西，a0000370来自摩洛哥，a0000669来自加拿大，a0000677来自日本。每份材料重复三次取样，并标记为a0000008-1，a0000008-2，a0000008-3，a0000094-1，a0000094-2，a0000094-3，a0000170-1，a0000170-2，a0000170-3，a0000370-1，a0000370-2，a0000370-3，a0000669-1，a0000669-2，a0000669-3，a0000677-1，a0000677-2和a0000677-3，同时利用illuminahiseq进行rna-seq。

进行rna-seq的6份小扁豆种质和另外的88份小扁豆种质同时用于kasp检测分析。另外的88份种质来源于3个大的地理区域：79份来自东亚的中国(其中10份来自新疆，9份来自内蒙古，7份来自宁夏，9份来自青海，10份来自山西，7份来自陕西，9份来自甘肃，9份来自湖北，9份来自云南)；6份来自西亚，(其中3份来自土耳其，3份来自叙利亚)；3份来自北美，(其中2份来自加拿大，1份来自美国)。

实验样品来自于山东省农作物种质资源中心，中国济南。详细信息在表1中给出。

表1.94份小扁豆种质来源地.

2、试验方法

(1)小扁豆illumina测序和转录组组装

利用trizol提取法(tiangen，中国北京)对6份小扁豆苗期(播种后4周)整株(包括根，茎和叶)材料的rna进行分别提取。每个样品取1.5μgrna作为rna样品制备材料。

利用nebnextultrarnalibraryprepkitforillumina(neb,usa)制备测序文库，并将索引代码添加到每个样品的属性序列中。简言之，利用oligo-dt连接的磁珠从总rna中纯化mrna。高温条件下在nebnext第一链合成反应缓冲液(5x)中利用二价阳离子进行破碎，利用随机六聚体引物和m-mulvreversetranscriptase(rnaseh-)合成第一链cdna，随后利用dna聚合酶i和rna酶h合成第二链cdna，通过核酸外切酶/聚合酶活性将剩余的突出末端转化为平末端，将dna片段的3'末端腺苷酸化后，连接具有发夹环结构的nebnext衔接子以准备杂交。，利用ampurexp系统(beckmancoulter，beverly，usa)纯化文库片段从而选择长度为150～200bp的cdna片段，使用3μl的user酶(neb，usa)与大小选择合适、有接头连接的cdna片段在37℃下下共同处理15min，然后在pcr之前95℃下灭活5min。然后以上述处理后的dna片段为模板，用phusionhigh-fidelitydna聚合酶、通用pcr引物和index(x)primer进行pcr。最后，在ampurexp系统中纯化pcr产物，并在agilentbioanalyzer2100系统上评估文库质量。随后，利用truseqpeclusterkitv3-cbot-hs(illumia)在cbotclustergeneration系统上进行索引编码样本的聚类。在簇生成后，制备的文库在illuminahiseq平台上进行测序，并产生双末端reads(即原始reads)。原始数据按顺序存储读取存档(sra)，并在ncbi中标记为sub5351043。

上述获得的fastq格式的原始数据(原始reads)首先通过内部perl脚本进行处理。在此步骤中，通过从原始数据中删除包含adapter的reads、包含ploy-n的reads(未知碱基比例大于10％)和低质量reads(q<＝20的碱基数占整个read50％以上的reads)来获得cleandata。同时计算了cleandata的q20、q30、gc-含量和序列重复水平。所有的下游分析都是基于高质量的清洁数据。

基于left.fq和right.fq，利用trinity将min_kmer_cov设置为2，而所有其他参数设置为默认值的情况下进行转录组组装。数据去冗余可通过corset(https://code.google.com/p/corset-project/)。corset可以利用比对上transcript的reads数和表达模式对transcript进行层次聚类形成簇，将每个簇中最长的一条transcript保留，称为unigene，并以此进行后续的注释等分析。

为获得全面的基因功能信息，基于以下七大数据库对unigene的功能进行注释：ncbinon-redundantproteinsequences(nr，usingdiamondv0.8.22withe-value＝1e^-5)；ncbinucleotidesequences(nt，usingncbiblast2.2.28+withe-value＝1e^-5)；proteinfamily(pfam，usinghmmer3.0packageandhmmscanwithe-value＝0.01)；eukaryoticorthologgroups(kog，usingdiamondv0.8.22withe-value＝1e^-3)；swissprot(usingdiamondv0.8.22withe-value＝1e^-5)；kyotoencyclopediaofgenesandgenomes(ko，usingkeggautomaticannotationserverwithe-value＝1e^-10)；geneontology(go，usingblast2gov2.5andself-writingscriptwithe-value＝1e^-6)。

(2)小扁豆dna提取

利用天根生化科技(北京)公司新型植物基因组dna提取试剂盒(dp320-03)，对94份材料(包括rna-seq的6份)的幼苗鲜叶(播种后4周)进行基因组dna的提取，并严格按照厂家的指示进行实验室处理。用nanodropone检测dna质量和浓度，并将dna稀释至25ng/μl储存在-20℃以备pcr所用。

(3)snp搜寻

picard-toolsv1.41和samtoolsv0.1.18用于排序、删除重复读取和合并每个示例的bam对齐结果。使用gatk3软件进行snp调用。使用gatk标准过滤方法和其他参数对原始vcf文件进行过滤(集群：3；windowsize：35；qd<2.0或fs>60.0；mq<40.0或sor>4.0；mqranksum<-12.5或readposranksum<-8.0或dp<10)。

(4)kasp引物设计及检测

根据开发商推荐的标准进行kasp引物设计。两条特异性正向引物3′末端碱基为snp位点变异碱基，5′端分别加上荧光标签fam(gaaggtgaccaagttcatgct)和hex(gaaggtcggagtcaacggatt)序列，同时还有一条通用反向引物，三条引物构成primermix。384孔模块的kasp基本反应体系为4μl：dna模板、2.0μl2×mastermix、0.064μlprimermix、1.936μlddh2o。kasp的pcr反应程序为：94℃5min；94℃20s，61℃1min，10循环；94℃20s，55℃1min，26循环；72℃1min。荧光标签fam和hex用于基因分型。实验所用仪器主要有abi7900ht荧光定量pcr仪(abi7900fast)和9700型双384孔pcr仪(geneamppcrsystem9700)。荧光引物由京梓熙生物科技有限公司合成。sequencedetectionsystemsv2.4用于检测kasp标记结果。

二、数据统计与分析

根据genemapperv4.0分析结果，读取各个荧光标记每个等位基因的数值，低于500的被认为是无效峰，舍弃不用。记录每个等位基因的大小，存储成excel表格，再根据不同软件的格式要求作相应转换。利用ntsys-pcv2.10e进行pca分析。利用powermarkerv3.25计算每个kasp标记的遗传多样性参数，包括：主要等位基因频率、等位基因数、基因多样性、杂合度和多态信息含量(pic)等。结合megav6.0分析软件对参试材料进行基于upgma法的系统发育树构建。利用structurev2.3.4对参试材料进行群体结构分析，参数设定如下：lengthofburninperiod＝10000，numberofmcmcrepsafterburnin＝10000，亚群数量k(numberofpopulation)＝1-20，循环数(numberofiterations)＝20。根据deltak(δk)值确定最佳群体结构和亚群数(在线分析的网址为http://taylor0.biology.ucla.edu/struct_harvest/)。

三、结果

(1)小扁豆illumina测序及转录组组装

18个小扁豆样品a0000008-1，a0000008-2，a0000008-3，a0000094-1，a0000094-2，a0000094-3，a0000170-1，a0000170-2，a0000170-3，a0000370-1，a0000370-2，a0000370-3，a0000669-1，a0000669-2，a0000669-3，a0000677-1，a0000677-2和a0000677-3通过illuminahiseq系统测序分别产生了0.677、0.713、0.746、0.684、0.816、0.755、0.888、0.890、0.749、0.810、0.756、0.690、0.704、0.701、0.737、0.884、0.991和0.961亿个rawreads。经过过滤后的测序数据分别为0.657、0.684、0.731、0.657、0.802、0.742、0.873、0.876、0.738、0.798、0.744、0.681、0.675、0.673、0.710、0.852、0.954和0.927亿个cleanreads。这些cleanreads的被拼接成217,836个转录本和161,095个unigene，分别合计2.571和2.406亿个核苷酸。transcript的平均长度为1,180bp，n50和n90分别为2,075bp和479bp；unigene的平均长度为1,494bp，n50和n90分别为2,203bp和714bp(表2)。

表2.小扁豆转录组测序组装结果.

(2)kasp标记的多态性分析

根据rna-seq结果，总共检测出130,073个snp。从中选取127个snp位点用于kasp标记的开发，并设计了127对kasp引物，最终有78个snp位点成功地转化为kasp标记，转化率为61.42％(表3)。利用78个kasp标记对94份小扁豆种质进行验证，其中76个标记是多态的，只有2个标记是单态的，分别占59.84％和1.57％。图1是引物wd_snp1基于sequencedetectionsystemsv2.4的检测结果。椭圆表示检测到的两个等位基因同为g，方框表示检测到的两个等位基因同为a，三角表示检测到的两个等位基因一个为g，另一个为a。表3结果显示，主要等位基因频率范围从0.5172到1.0000，平均值为0.8198；genotypenumber范围从1到3，平均值为2.7564；allelenumber范围从1到2，平均值为1.9744；genediversity范围从0到0.4994，平均值为0.2665；heterozygosity范围从0到0.9524，平均值为0.0846；pic范围从0到0.3747，平均值为0.2229。由此可得出，由snp到kasp标记的转化率较高，达到61.42％，因此与snp关联的性状可以很容易地转化为kasp标记，为将来用于小扁豆分子标记辅助育种提供支撑。

表3成功转化的78个kasp标记

(3)kasp标记的遗传多样性分析

pca分析

利用ntsys-pcv2.10e对全部参试的94份小扁豆种质进行基于kasp标记的pca分析，得到三维空间聚类图(图2)。前三维贡献率为79.35％。结果显示，中国资源(黑色椭圆)与国外资源(灰色椭圆)在空间上的分布是明显分离的，表明两者之间的亲缘关系较远，与地理来源显著相关。中国资源显著地聚集在一起，主要分布在聚类图的右侧，只有2份资源除外，这表明中国资源的遗传基础总体一致且较为狭窄，与国外资源显著不同；而国外资源呈现了宽广、均匀分布的空间特征，表明它们的遗传背景广泛且多样性分布较中国资源均匀。

upgma聚类分析

利用powermarkerv3.25计算获得遗传距离，结合megav6.0分析软件，对94份小扁豆种质(包括6份rna-seq种质和其余的88份验证种质)绘制基于kasp标记的upgma系统树图(图3)，开放圆代表rna-seq的6份小扁豆资源；填充圆代表剩余的88份小扁豆种质；没有方框的圆代表中国小扁豆种质；被方框框出来的圆代表外国小扁豆资源。结果显示，94份小扁豆种质同样被分成了2大组群。第一组群内又分成了2个亚群，第一亚群全部是中国资源，第二亚群只有2份资源，分别来自日本和西亚的叙利亚。中国资源同样呈现两大特点与est-ssr标记一致，表明两种标记在区分中国资源时惊人的一致。第二组群同样被分成2个亚群，大多数为国外资源。第一亚群中只有2份资源，分别来自西亚的叙利亚和土耳其，第二亚群来源地较多，又被分成2个更小的分支，第一个分支中有5份资源，分别来自西亚的土耳其、北非的摩洛哥和北美的美国、加拿大，第二个分支也有5份资源，分别2份来自中国的陕西和新疆，2份来自西亚的土耳其和叙利亚，1份来自北美的加拿大。国外资源之间的遗传关系较远，表明其遗传基础更为宽泛。

群体结构分析

利用structurev2.3.4对94份小扁豆种质进行基于kasp标记的群体结构分析(图4)。结果显示，deltak(δk)值在k＝2时数值最高，参试材料同样被分为2个亚群。其中深色表示第一亚群，有2份国外资源(a0000677来自日本，a0000279来自叙利亚)；浅色表示第二亚群，大多数为国外资源，同样有2份中国资源(a0000170和a0000491)，分别来自中国的陕西和新疆。此结果与pca分析和upgma聚类分析一致。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁汉凤;王栋;宗绪晓;杨涛;李娜娜;刘荣;王效睦;张晓冬;李润芳;李群
技术所有人：山东省农作物种质资源中心;中国农业科学院作物科学研究所
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。