黄麻中耐盐性状的分子标记及其应用的制作方法

文档序号:15601052发布日期:2018-10-02 20:16阅读:408来源:国知局

本发明涉及植物育种技术领域,具体而言,涉及一种黄麻中耐盐性状的分子标记及其应用。



背景技术:

土壤盐渍化已经演变为一个全球性问题,是导致土地荒漠化和耕地退化的重要因素之一,也已成为人类面临的重大危机。土壤盐渍化问题严重影响了植物的生长和发育,已经成为自然界主要的非生物胁迫之一。目前,全球盐碱地面积已达9.5亿hm2。土壤盐渍化已成为制约粮食生产和影响粮食安全的重要因素。然而人口的快速增长与粮食短缺的矛盾日益加重,通过筛选和培育耐盐作物新品种的方法来改良、利用盐碱地,被认为是一种具有经济和生态双重效益的解决方案。

黄麻为椴树科(tiliaceae),黄麻属(corchorus)植物,一年生草本韧皮纤维作物,目前世界上主栽的黄麻主要有两种,即圆果种黄麻(corchorus.capsularis,南亚的印度、孟加拉、尼泊尔等国称为whitejute)和长果种黄麻(corchorus.olitorius,南亚称为tossajute)。

黄麻是世界上最重要的韧皮纤维作物之一,其纤维吸湿性好,散水快,具有抗菌抑菌、可降解和环境友好等特性,在商业上拥有“金色纤维”的美称,是麻纺工业的重要原料,在世界上黄麻产量与种植面积仅次于棉花。黄麻又是一种重要的耐盐经济作物,它能够在沿海滩涂、盐碱土地大面积种植。

目前,黄麻耐盐性研究进展缓慢,人们对黄麻耐盐性方面的认识还处于初始阶段,有关黄麻耐盐性分子机制的报道较少,前人对黄麻耐盐性的报道也相对较少。总体来说黄麻分子生物学基础比较薄弱。分析黄麻在盐胁迫下的基因表达变化,寻找黄麻盐胁迫响应基因,并对其进行功能预测及代谢通路分析,加深对黄麻耐盐机理研究,这将有利于培育黄麻优良耐盐品种,对其他植物耐盐性的研究也具有重要意义。

有鉴于此,特提出本发明。



技术实现要素:

本发明涉及一种新颖的与黄麻耐盐性状有关的snp位点,并对该snp位点的检测、应用等方面进行研究。

该snp位点存在于黄麻基因组中,与影响黄麻耐盐性状的qtlqjst-1连锁,因而能够用于黄麻耐盐性状的相关研究。

采用该snp位点能够用于耐盐抗性的黄麻植物的培育和鉴定。

与现有技术相比,本发明的有益效果为:

本发明提供的mk7047snp位点能够应用于黄麻耐盐品种的培育中,还可以用于种群遗传结构和遗传变异水平等方面的研究。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中所采用的gbs技术路线示意图;

图2为本发明实施例中遗传图谱信息分析内容的流程示意图;

图3为本发明实施例中gbs文库构建流程示意图;

图4为本发明实施例中150个f2:3lines的stig和两个盐胁迫条件(图4a:140mm盐浓度;图4b:160mm盐浓度)下处理第四天的stig数据显示正态分布;

图5为在140mm(n=5)盐胁迫条件下黄麻耐盐性的qtl作图结果;

图6为在160mm(n=8)盐胁迫条件下黄麻耐盐性的qtl作图结果;

图7为lg4上的部分连锁群标记分布。

具体实施方式

本发明可通过后续对于本发明一些实施方案描述以及其中所包括的实施例的详细内容而更容易被了解。

在进一步叙述本发明之前,应明了本发明不会被局限于所述特定实施方案中,因为这些实施方案必然是多样的。亦应明了本说明书中所使用的用语仅是为了阐述特定实施方案,而非作为限制,因为本发明的范围将会被仅仅界定在所附的权利要求中。

名词定义

在陈述本发明的详细内容之前,应当了解被使用于本说明书中的数个用语。

农学上优良的:如本文使用的,指基因型,其具有许多可辨别性状的最佳表现,如种子产量、突出体、萌发势、营养势、抗病性、种子结实、站立能力(standability)和脱粒能力,其允许生产者收获具有商业重要性的产品。

杂交:两种亲本植物的交配。

f1杂种/f1代:两种非等基因植物杂交的第一代子代。

f2杂种/f2代:f1代自交所产生的子代。

snp:当对比2个同源序列时,指单核苷酸多态性或单核苷酸突变。

数量性状基因座(qtl):数量性状基因座(qtl)指在一定程度上控制通常连续分布的以数值表示的性状的遗传基因座。

连锁:一种现象,其中相同染色体上的等位基因比如果等位基因的传递是独立的而偶然预期的更倾向于一起分离。

本发明的示例性实施方案

本发明涉及一种鉴定和/或选择显示新赋予的或增强的耐盐抗性的黄麻植物的方法,包括:

a.在所述黄麻植物的dna中检测mk7047snp位点的存在;以及

b.选择具有与新赋予的或增强的耐盐抗性相关的所述等位基因的所述黄麻植物;

其中所述mk7047snp位点标记所在scaffold编号为awue01014583.1,在scaffold上的位置为47766位,参考序列的碱基为g,变异的碱基为t。

本发明涉及mk7047snp位点用于在黄麻植物中鉴定赋予耐盐抗性的qtl的用途。

qtl可通过使用分子标记进行鉴定。qtl可通过遗传图谱上的位置、或通过指示连锁群或染色体上的位置来鉴定。因此,qtl赋予的遗传性状可通过分子标记进行鉴定与表征。

在一些实施方式中,所述检测mk7047snp位点的存在的方法为pcr扩增。

在一些实施方式中,所述检测mk7047snp位点的存在的方法为测序。

根据本发明的一方面,本发明还涉及一种黄麻育种的方法,其包括下述步骤:

1).采用如上所述的方法测定黄麻植物是否具有mk7047snp位点;

2).选择包含所述mk7047snp位点的第一种黄麻植物,并将其与第二种黄麻植物杂交,以产生包含所述mk7047snp位点的子代植物。

根据本发明的一方面,所述方法还包括:

3).使用步骤2)中所述的子代植物作为原材料,重复步骤1)-2)2-10次,以产生其它子代植物。

根据本发明的一方面,所述第二种黄麻植物属于农学上优良的品种。

根据本发明的一方面,所述方法还包括选择包含所述mk7047snp位点和农学上优良特征的黄麻植物。

根据本发明的另一方面,本发明还涉及由如上所述的方法产生的黄麻植物用于产生具有耐盐抗性的黄麻繁殖材料的用途,所述繁殖材料适合于产生具有耐盐抗性的,且包含如上提及的mk7047snp位点的黄麻植物或其种子;

其中繁殖材料适宜于有性繁殖、植物性繁殖或可再生的细胞的组织培养。

在一些实施方式中,适宜于有性繁殖的所述繁殖材料选自小孢子,花粉,子房,胚珠,胚囊和卵细胞;

适宜于植物性繁殖的所述繁殖材料选自插枝,根,茎,细胞,原生质体;

适宜于可再生的细胞的组织培养的所述繁殖材料选自叶,花粉,胚,子叶,下胚轴,分生组织细胞,根,根端,花药,花,种子和茎。

本发明也涉及种子生产的方法,包括使包含耐盐特性的黄麻植物生长,允许植物产生种子,及收获那些种子。种子的产生适宜地通过杂交或自交进行。

根据本发明的另一方面,本发明还涉及如上提及的mk7047snp位点在研究黄麻种群中的遗传多样性中的应用。

下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

实施例

一、项目背景

gbs(genotyping-by-sequencing)技术指通过测序进行基因分型,通过选取合适的限制性内切酶结合高通量群体测序构建snp分子标记,可用于分子标记开发、超高密度遗传图谱构建、群体遗传分析、群体gwas分析等领域。

gbs技术路线如图1所示,主要包括三个部分:

1)实验部分:电子酶切评估,根据物种、科研目的选择合适内切酶,样本检测合格后建库,于hiseqpe150测序平台上测序;

2)标准信息分析:原始测序数据经过基本质控后,与参考基因组进行比对,进行变异检测及筛选;

3)高级信息分析:包括亲本间多态性分析、子代基因分型、标记筛选、遗传图谱构建,以及结合表型性状进行qtl定位等分析。

遗传图谱信息分析内容包括:数据质控(去除接头和低质量数据)、gbs产出数据统计、与参考基因组进行比对、群体snp检测、遗传标记开发、遗传标记筛选、遗传图谱构建、qtl定位、其他定制化分析等(图2)。

二、实验策略

2.1实验设计

本研究中使用的两种亲本植物是野生的c.olitoriusl.种质j009和c.olitorinasl.品种广丰长果(gfg),其耐盐性低于j009。150株f2群体用于构建高分辨率遗传图谱并结合其f2:3后代耐盐性状进行耐盐qtl定位。收集来自150个f2个体和两个亲本的幼叶组织用于基因组dna提取。使用dneasyplantminikit【天根生化科技(北京)有限公司】提取每个个体的总基因组dna,并制备用于测序的gbs文库制备。在1%琼脂糖凝胶上监测dna降解和污染。使用nanophotometer分光光度计(implen,ca,usa)检查dna纯度,并使用qubitdna测定试剂盒和qubit2.0荧光计(lifetechnologies,ca,usa)测量dna浓度。

植物野生种质资源通常携带大量的抗性基因,是抗逆境育种的天然基因库,因而很适合于黄麻耐盐基因的筛选。

2.2文库构建及测序

gbs文库构建流程示意图如图3所示。首先应用限制性内切酶对基因组进行酶切,加上带有barcode的接头后,对每个样品进行扩增,然后对样品进行混合,选择需要的片段进行文库构建。利用illuminahiseqtm测序平台,进行双末端(paired-end)150测序:

1)酶切:0.1-1μg基因组dna用限制性内切酶进行酶切,以得到适合的marker密度;

2)加p1和p2接头:酶切后的片段两端加p1和p2adapter(可与酶切dna缺口互补);

3)片断选择:pcr扩增两端分别含有p1和p2接头的tag序列,dna片段pooling,电泳回收需要区间的dna;

5)高通量测序:cluster制备,上机测序。

三、信息分析方法及结果

3.1测序数据统计及质量评估

检测合格的dna文库进行illuminahiseqtm测序,产出原始数据(即rawdata或rawreads),结果以fastq文件格式存储(文件名:*.fq)。原始测序数据中会包含接头信息,低质量碱基,未测出的碱基(以n表示),为保证信息分析质量,这些信息会对后续的信息分析造成很大的干扰,分析前需将这些干扰信息去除掉,最终得到的数据即为有效数据,我们称之为cleandata或cleanreads。原始数据过滤方法如下:

(1)需要过滤掉含有接头序列的readspair;

(2)当单端测序read中含有的n的含量超过该条read长度比例的10%时,需要去除此对pairedreads;

(3)当单端测序read中含有的低质量(质量值q≤5)碱基数超过该条read长度比例的50%时,需要去除此对pairedreads。

经过上述对测序数据的严格过滤,获得高质量的cleandata。对亲本和子代所有样本测序数据进行统计,包括测序reads数量、数据产量、测序错误率、q20、q30、gc含量等。亲本与子代测序数据质量统计结果见表1。

表1测序数据产出及质量统计

注:sample:样本名称;rawbase:原始数据的碱基个数;cleanbase:原始数据经过滤后的高质量碱基数;effectiverate:数据有效利用率,即cleanbase与rawbase的百分比;q20,q30:phred数值大于20、30的碱基占总体碱基的百分比;gccontent(%):gc含量。

此外,将cleandata与ncbi的核苷酸数据库进行比对,没有发现其他来源的dna污染。

该项目总共测序了2个黄麻亲本样本,总的测序数据量为16.78gb,平均每个样本83.88gb;高质量的cleandata数据量为16.68gb,平均每个样本83.41gb。测序质量高(q20≥90%、q30≥85%),gc分布正常。150个黄麻子代样本,总的测序数据量为113.48gb,平均每个样本756.57mb;高质量的cleandata数据量为113.47gb,平均每个样本756.51mb。测序质量高(q20≥90%、q30≥85%),gc分布正常。

综上,此次建库测序成功。

3.2比对分析

将测序数据与参考基因组进行比对。样本比对率可以反映样本测序数据与参考基因组的相似性,覆盖深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。

具体分析步骤如下:

(1)使用bwa比对软件(参数:mem-t4-k32-m-r),将亲本和子代cleandata的pereads与参考基因组进行比对;

(2)使用samtools将比对结果进行格式转换,转换成sam/bamfiles;

(3)使用perl脚本统计比对率和覆盖度;

(4)使用samtools对比对结果进行排序(参数:sort),用于后续分析。

3.2.1参考基因组基本情况

参考基因组基本情况:

https://www.ncbi.nlm.nih.gov/genome/?term=olitorius

参考基因组基本情况统计详细内容如下:

表2参考基因组基本情况统计

3.3群体snp检测

snp(单核苷酸多态性)主要是指在基因组水平上由单个核苷酸的变异所引起的dna序列多态性,包含单个碱基的转换、巅换等。我们采用gatk等软件进行群体snp的检测。

具体分析步骤如下:

(1)对bwa比对结果进行过滤:将比对到基因组上唯一位置的reads挑选出来,进行后续分析;

(2)snp检测:采用gatk(-typeunifiedgenotyper)对过滤后的bam文件进行群体snp的检测;

(3)snp过滤:为减少测序错误造成的假阳性snp,亲本与子代要求snp碱基支持数不少于4。

(4)snp相关信息统计:杂合snp数,纯合snp数,杂合snp比率;

3.3.1snp检测结果展示

亲本snp检测结果见表3。

表3亲本snp检测结果统计

注:homozygoussnp:纯合snp,如aa;

heterozygosissnp:杂合snp,如ac;

hetrate:heterozygosissnp/total;

total:所有snp的个数。

3.4snp标记开发

3.4.1亲本间标记开发

基于2个亲本基因型检测结果,进行亲本间多态性标记开发。过滤掉亲本信息缺失的位点;筛选父母本都为纯合且亲本间具有多态性的位点(例如:在某个snp位点亲本1基因型为“gg”,亲本2基因型为“aa”,亲本基因型都为纯合,且亲本间基因型不相同)。该项目共获得多态性位点1959620个,其中f2群体可用标记类型为“aa×bb”型,多态性标记217356个。所有开发的标记类型及数量见表4。亲本间多态性标记展示形式见表5。

表4标记开发类型

注:markertype:亲本基因型,如abxcc,ab和cc为父本和母本的基因型;

p1genotype:亲本1基因型;

p2genptype:亲本2基因型;

markernumber:各类型标记数;

percentage:各类型标记占有效标记总数百分比;total:有效标记总数。

表5f2群体亲本间部分多态性标记展示

注:chr:标记所在染色体(或scaffold)编号;

position:标记所在染色体(或)scaffold上的位置;

ref:参考基因组碱基型;

p1:亲本1基因型;

p2:亲本2基因型。

3.4.2子代基因分型

完成亲本间标记开发后,提取150子代在上述2个亲本多态性标记位点的基因型。部分子代在个别标记位点的基因分型结果如表6所示。

表6子代基因分型

注:chr:标记所在scaffold编号;

position:标记所在scaffold上的位置;

ref:参考基因组碱基型;

p1:亲本1基因型;

p2:亲本2基因型;

j382-1-j382-102:部分子代个体在标记位点的基因型;

“--”:表示缺失。

3.4.3遗传标记筛选

对分型后的子代标记进行筛选,具体筛选步骤如下:

异常碱基检查。

子代分型结果中,可能会出现少数亲本中没有出现的碱基型。例如,某snp位点,亲本基因型分别为“aa”和“tt”,若子代中出现“a或t”以外的其他碱基(g或c),则该碱基被认为是异常碱基。异常碱基的出现可能受参考基因组组装质量,亲本测序数据质量,基因分型准确性等因素影响,也有可能是子代群体中出现的变异。对于子代中出现而亲本中不存在的异常碱基,我们将其视为缺失,用符号“--”表示。经检查,未发现有异常碱基,说明基因分型准确性较好。

完整度过滤。

筛选基因型至少覆盖所有子代75%以上个体的标记(该标准根据实际标记数据量进行适当调整)。即对于单个多态性标记位点,100个子代中至少有75个个体有确定基因型。通过对基因型完整性覆盖情况差的标记进行过滤,最终得到9019个标记。

偏分离标记(segregationdistortion)过滤。

偏分离标记普遍存在,并且会影响图谱构建结果及qtl定位,借鉴多数文献对偏分离处理方法,采用卡方检验,对上述9019个候选标记进行偏分离过滤,偏分离设定的阈值p为0.001。经过偏分离分析,剩余有效标记共8150个将进入连锁性分析。

3.5遗传图谱构建

3.5.1连锁群构建

对筛选后得到的高质量遗传标记,采用joinmap4.0软件遗传图谱构建:1)连锁群划分,lod值设置为2~30;2)对每个连锁群采用最大似然法进行排序;3)采用kosambi函计算标记间的遗传距离。

3.5.2遗传图谱结果

每个连锁群上snp标记数量及每条连锁群的遗传距离总长见表7。

表7遗传连锁群信息统计

注:group:连锁群编号;

snpmarkers:snp标记数量;

maplength:遗传距离长度;

averagedistance(cm):平均遗传距离;

max.gap(cm):标记间最大遗传距离;

对每条染色体上gap的分布情况进行统计,结果见表8。

表8遗传图谱gap大小在染色体上的分布统计

注:chr:染色体名称;

<5cm:标记间遗传距离小于5cm的个数;

5to10cm:标记间遗传距离在5cm~10cm之间的gap个数;

10to20cm:标记间遗传距离在10cm~20cm之间的gap个数;

>20cm:标记间遗传距离大于20cm的gap个数;

ratio:标记间遗传距离小于5cm的gap个数占总标记数的百分比;

3.5.3标记分布图

用perlsvg模块绘制连锁图;其中,lg4上的部分连锁群标记分布如图7所示。

3.6图谱质量评估

利用连锁群热图,评价标记见连锁关系;标记正确,则标记间的连锁关系随着标记间距离增大而变弱。

本项目物种为黄麻,f2代群体,个体数为150个。使用mapqtl中的pt(permutationtest)确定每个表型的lod值阈值,使用winqtl软件中的cim算法进行qtl定位,依据前面置换检验获得的阈值确定每个表型对应的qtl区段。

四snp与qtl连锁分析方法

耐盐性实验在两种盐浓度环境下进行,140mm和160mm,均为12h-12h昼/夜光周期,在照明培养箱中进行培养,培养温度28±0.5℃/25±0.5℃,湿度为75%。将qtl定位所用群体的表面灭菌后的种子(150f2:3lines)播种到具有两个均匀无菌滤纸的干净且无菌的培养皿上。每个line播种在两个培养皿上,每个培养皿有30粒种子。一个培养皿用作盐胁迫处理,另一个培养皿用作对照。对于盐胁迫诱导,在第一天分别向盐胁迫和对照培养皿施加3mlnacl溶液和3ml水,然后向每个相应的培养板中加入2mlnacl溶液和2ml水处理六天。在每个盐胁迫环境中采用具有三个生物重复的随机完整设计。在整个六天的实验中,每天观察并记录种子萌发的条件。当芽长于3mm时,将种子定义为发芽种子。种子萌发的耐盐指数(stig)根据以下等式评估:

耐盐指数=(盐胁迫下发芽种子的数量÷种子总数)/(在对照组条件下发芽种子的数量÷种子总数)。

本次实验lod阈值选取,在95%置信度选取每条连锁群对应的lod值(即选取第六列在0.95时对应的第二列的lod为该连锁群的lod阈值;当第六列没有0.95时,选取大于0.95且最接近0.95的值);

每个表型lod阈值的选择:在全基因组水平上,选取95%置信区间下的lod(即interval栏的值)为阈值,结果如下表所示:

表9lod阈值

我们记录了来自150个f2:3lines的stig和两个盐胁迫条件下的两个亲本6天。第四天的stig数据显示正态分布(图4),并用作qtl的表型数据。根据1000个排列测试,在两个盐胁迫条件下lod评分阈值确定为约3.5。我们在两种盐胁迫条件下鉴定了lg4上的三个明显的qtl,并且在两种环境下同时检测到一个主要的qtl,命名为qjst-1。在140mm盐胁迫条件下,qtlqjst-1位于lg4上的标记mk5633和mk6723之间的11.4-23.7cm,并且在160mm盐胁迫条件下,在lg4上的标记mk6160和mk6484之间的16.9-21.6cm。在140mm和160mm盐胁迫条件下,qjst-1的lod峰在lg4上以19.31cm定位,分别解释了总表型变异的11.81%和19.61%。在140mm盐胁迫条件下,qtlqjst-2位于标记mk7047和mk5638(在lg4的9-11.4cm位置)之间,并且lg4上的lod峰在10.01cm处定位,解释了3.74%的表型变异。在160mm盐胁迫条件下检测到qtlqjst-3,其位于lg4上与qjst-2部分重叠的标记mk6393和mk6391(10.4-16.9cm)之间。qjst-3的lod峰值在lg4上以13.41cm定位,解释了8.84%的表型变异。qtl的所有加性效应均为阴性,表明j009等位基因赋予增加的耐盐性值。

表10在两种盐浓度胁迫条件下与黄麻耐盐性状相关的qtl

注:

additive_effect:加性效应

leftmarker:qtl左边界对应的标记名称

rightmarker:qtl右边界对应的标记名称

pve:表型变异百分比

在本研究中,我们使用gbs方法开发了第一个高密度和最完整的黄麻遗传图谱。该遗传图包含7个lg上的4839个标记,与黄麻中的染色体数量一致(n=7),跨越1375.41cm,每个基因座的平均距离为0.28cm,低于之前报道的值。因此,该遗传图谱将极大地增强黄麻中的qtl/基因定位和标记辅助育种。

耐盐性是许多作物中由多个基因控制的定量遗传特征。准确的表型分型是qtl定位的重要组成部分;因此,我们测量了盐胁迫和对照品系在两个盐胁迫环境下六天内的相对种子发芽百分比,其中三个生物学重复。在盐胁迫下,实验的前两天所有f2:3品系的发芽率都非常低。在最后两天,耐盐表型极化为二级分布,然后与第四天的正分布最一致。因此,我们在第四天选择了耐盐性表型数据进行qtl定位。

盐胁迫是限制植物发育和限制作物产量的主要环境压力因素。通过精确育种可以提高作物耐盐性,这需要鉴定耐盐相关基因或分子标记。然而,大多数先前对黄麻耐盐性的研究只关注形态学、生理学和蛋白质组学成分。据我们所知,只有两项与黄麻耐盐性相关的研究已经通过转录组测序进行,揭示了大量差异表达的耐盐基因。然而,大量差异表达的基因使得难以鉴定与实际应用的耐盐性相关的最佳候选基因。

因此,我们进行了qtl定位以在基因组的有限区间内定位候选基因。我们成功找到了16个与耐盐性相关的qtl。

对于三个明显的qtl,所有加性效应都是阴性的,这表明增加的性状值是由j009等位基因赋予的。总体而言,这些结果突出了野生黄麻材料中优异的抗性基因的存在。利用野生种质资源有利于加快黄麻抗病品种的培育。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1