一种位于大豆1号染色体上与高油分相关的分子标记及其应用

文档序号：26667488发布日期：2021-09-17 21:12阅读：98来源：国知局

1.本发明属于生物技术，具体涉及一种位于大豆1号染色体上与高油分相关的分子标记及其应用。

背景技术：

2.大豆有着丰富的营养成分，油分在20％左右。人们可以通过食用大豆用以补充所需的营养物质，并且可以预防人体的心血管疾病，大豆同时是重要的油料作物，可以被加工为食用油，可以满足人们的饮食需求，同时主要由五种脂肪酸组成，而脂肪酸可以预防心脏病、癌症等。随着人们的生活水平日益提高，越来越多的人更多的注重于食用健康与食物的营养价值，因此对大豆的需求很大，但我国的大豆更多的是依赖于从其他国家进口，所以我国急需提高大豆油分含量及培育高油大豆品种，满足人们的日常所需。
3.大豆子粒的油分是品质相关性状，比较复杂的数量性状，受到多个基因控制，一直以来受到遗传特性和育种方法的限制，传统方法过于缓慢，随着科技的不断进步，分子辅助选择被提出，在传统杂交育种方法的基础上利用分子标记与决定目标性状的基因紧密连锁，通过对标记的选择来实现对性状的选择，大幅度提高育种效率，实现定向改良大豆品种的作用即可以选择出高油分的大豆品种。

技术实现要素：

4.本发明的目的是为了快速和准确的筛选高油分优质大豆品种，本发明提供了一种位于大豆1号染色体上与高油分相关的分子标记，所述分子标记的核苷酸序列为snp1，所述snp1的序列为大豆1号染色体上39.67mb
‑
41.16mb位置的的核苷酸序列，且gm01号染色体的第40386604核苷酸位点为t或c。
5.在一种实施方式中，扩增snp1的上游引物的核苷酸序列如seq id no.4或如seq id no.5所示，扩增snp1的下游引物的核苷酸序列如seq id no.6所示。
6.在一种实施的方式中，所述snp1的序列上第40780703核苷酸位点为c或g。
7.在一种实施方式中，扩增snp1的上游引物的核苷酸序列如seq id no.7或如seq id no.8所示，扩增snp1的下游引物的核苷酸序列如seq id no.9所示。
8.在一种实施方式中，所述snp1的序列上第41034358核苷酸位点为a或g。
9.在一种实施方式中，扩增snp1的上游引物的核苷酸序列如seq id no.16或如seq id no.17所示，扩增权利要求1所述的snp1的上游引物的核苷酸序列如seq id no.18所示。
10.本发明还提供了一种分子标记在制备鉴定高油分含量的大豆的试剂盒中的应用，用(a)～(c)任一组引物扩增snp1分子标记：
11.(a)seq id no.4或seq id no.5和seq id no.6；
12.(b)seq id no.7或seq id no.8和seq id no.9；
13.(c)seq id no.16或seq id no.17和seq id no.18。
14.本发明还提供了一种鉴定高油分含量大豆的方法，所述方法的具体步骤为：
15.(1)提取待检测大豆的dna；
16.(2)利用seq id no.4或seq id no.5和seq id no.6进行pcr反应，检测待检测品种的大豆为 cc基因型则待检测品种的大豆为高油分含量的大豆，若为tt基因型则待检测品种的大豆为低蛋白含量的大豆。
17.本发明还提供了一种鉴定高油分含量大豆的方法，所述方法的具体步骤为：
18.(1)提取待检测大豆的dna；
19.(2)利用seq id no.7或seq id no.8和seq id no.9进行pcr反应，检测待检测品种的大豆为 cc基因型则待检测品种的大豆为高油分含量的大豆，若为gg基因型则待检测品种的大豆为低油分含量的大豆。
20.本发明还提供了一种鉴定高油分含量大豆的方法，所述方法的具体步骤为：
21.(1)提取待检测大豆的dna；
22.(2)利用seq id no.16或seq id no.17和seq id no.18进行pcr反应，检测待检测品种的大豆为aa基因型则待检测品种的大豆为高油分含量的大豆，若为gg基因型为低油分的大豆。
23.有益效果：本研究利用643份经过全基因组重测序的资源群体结合其2年3次重复的大豆子粒贮藏物质的表型数据，利用分层评价的方法筛选出与油分极显著相关的snp位点，采用snp分子标记技术中的kasp在162份大豆非测序极端油分资源材料中进行验证，根据其分型结果及其表型数据，开发出与油分相关的分子标记，用以在生产中提前筛选高油分优质品种提供一种高速准确的方法。
附图说明
24.图1为2018、2019年资源测序材料油分含量及blup分布直方图，其中，图a为2018年油分含量分布直方图，b是2019年油分含量分布直方图，c是2年油分blup分布直方图，横坐标是组别，纵坐标是频率；
25.图2为20条染色体上snp位点数目分布，其中，横坐标是染色体，纵坐标是snp个数；
26.图3为20条染色体上与油分相关的snp位点数目分布，其中，横坐标是染色体，纵坐标是snp个数；
27.图4为与油分相关的snp位点突变基因组对应等位基因与参考基因组对应表型效应值差值，其中，横坐标是组别，纵坐标是表型效应之差值；
28.图5为与油分相关snp位点的高油分优异单倍型与低油分单倍型表型均值，其中，横坐标是组别，纵坐标是蛋白质含量；
29.图6为snp标记在162份个大豆极端油分资源材料中的kasp基因分型。
具体实施例
30.大豆油分含量的mqtl记载在文献qi et al.2018meta
‑
analysis and transcriptome profiling reveal hubgenes for soybean seed storage composition during seed development。
31.实施例1.
32.实验群体：选取643份东北地区大豆核心种质测序资源作为实验群体，于2018、2019年在吉林省农科院及东北农业大学向阳农场试验田中种植且3次重复，1m行长，每1行播撒20粒种子，播种的深度为3
‑
4cm，田间管理方法同大田管理，收获后考察各个性状，选择长势一致的5株进行测量。在营养生长阶段，采取植株顶端最幼嫩处叶片用于提取dna，收获时每个株系随机取5株进行脱粒，用于测定油分含量。
33.一、大豆子粒油分含量测定及处理：使用foss谷物分析仪(infratec1241)用大量法测出实验材料及验证材料的油分含量，该仪器利用近红外透射技术进行全谱扫描，可获得丰富的光谱信息，通过对比定标数据库从而获得精度非常高的油分含量表型数据。测量时要保证子粒在安全含水量范围内，每份单株子粒重复测量3次，取3次测量数据的平均值作为最终油分含量表型数据。利用microsoft office excel2013进行表型数据处理，取其平均值，利用spss统计分析2年3次重复的大豆子粒油分数据，包括显著性检验，频率分布直方图，计算均值等。通过r软件进行最佳线性无偏预测值(the best linear unbiasedpredictions，blup)的计算。
34.由表1可知，该群体1个品质相关性状两年均无较大变幅，变异系数在4％
‑
5％之间，其中油分的变异系数最小，达到4.73％。油分性状标准差较小，2年分别为0.98、0.99。通过分析峰度、偏度发现，该群体的1个品质相关性状的油分表现为高度偏态分布。将2018、2019两年油分表型数据进行blup分析，并将2018、2019两年油分均值(图1中a和b)及blup值利用spss软件做了正态分布图(图1中c)，从图中可看出测得的大豆子粒油分的两年数据和blup值均显示连续分布，而且分布趋势均很明显，从正态曲线上也能得知大豆子粒油分均呈现出正态分布。其次，从油分的2年及其blup值的图中也可以看出，blup值的峰值较两年数据也是较低一些，数据分布也较广且较均匀，且该品质性状的blup值分布特征也符合数量性状遗传特点，更适合利用blup值进行后续分析研究。
35.表1大豆测序材料2018、2019年油分品质性状的描述性分析
[0036][0037]
dna提取方法：取大豆3
‑
4g新鲜叶片装入1.5ml离心管，再加入3颗3mm灭菌的小钢珠。将离心管浸于液氮中，应用组织研磨仪将冻干的叶片组织震荡成粉末。加入650
‑
700μl预先在65℃水浴锅中水浴的ctab提取液，置于涡旋震荡仪上充分混匀，65℃水浴1小时，每15min颠倒混匀一次。加入等体积氯仿充分混匀，12,000rpm离心20min，吸取上清液注入新的离心管中，重新加入700μl氯仿，充分颠倒混匀后离心12,000rpm，20min，吸取上清匀速滴加入预先装有
‑
20℃预冷异丙醇的离心管中，
‑
20℃环境下保存20min。8,000rpm离心10min，将上清液倒入废液缸，分别用无水乙醇和75％乙醇洗涤底部团状dna。将离心管开盖置于超净工作台中吹干，加入灭菌水。用分光光度计(nanodrop)检测提取得到的dna的质量水平，利用琼脂糖凝胶电泳检测出dna浓度，统一稀释到工作液浓度20ng/μl。
[0038]
二、资源测序材料snp位点的分层评价：选取643份大豆资源群体进行重测序，20条染色体共获得 snp位点53,946个，snp质量控制maf<0.05，杂合率<10％，平均每条染色体含有2,697个。其中chr18 染色体中snp数量最多，有4,462个；chr11染色体中snp数量最少，有862个，其余染色体上的snp 数目见图2。
[0039]
三、重要等位基因挖掘：(1)针对表型将材料进行分类，分别按照研究的性状不同即大豆油分，求其所有数据平均值及其标准差，将平均值分别加减标准差所得数据分别作为临界，高于平均值加标准差材料作为高油分材料。
[0040]
(2)把研究的该snp位点的测序结果根据是参考基因组的等位基因还是突变后基因组对应的等位基因统计分析，并且结合表型数据即油分按照平均值加减一倍标准差作为标准将材料进行分类，取两端高于和低于该标准材料，将所统计得到的数据列入如下四联表如表2中，进行卡方检测：
[0041]
表2卡方分析的四联表
[0042][0043]
注：i为a/c/t/g，a
11
为高油分中有i等位基因的数量，a
21
为高油分中无i等位基因的数量，a
12
为低油分中有i等位基因的数量，a
22
为低油分中无i等位基因的数量，c1为高油分的总数，c2为高油分的总数， r1为有i等位基因的总数，r2为无i等位基因的总数，n为材料的总数。
[0044]
(3)原假设h0：油分含量的大小与i等位基因相互独立，ha：2个变数有关联。通过下列公式得到χ2结果，当所得到的χ2＜χ2α时，同意h0成立；当所得到的χ2≥χ2α时，不同意h0成立，ha 成立。因此根据得到的χ2值与α＝0.001时的阈值针对研究的snp位点进行判断。
[0045][0046]
(4)重复(2)、(3)步骤，对油分性状的所有snp位点进行独立性检验，用以来判断对该研究性状的具体影响，本实验以alpha＝0.001作为阈值，当所得到的结果对应的p＜0.001时，则判断该snp位点为影响该性状的显著位点，进行后续研究，而p≥0.001时，则放弃继续研究该位点。
[0047]
(5)对于(4)步骤所选出的显著位点进行下一步的表型效应值验证，在所有材料中对显著位点进行表型效应计算，通过以下公式：
[0048][0049]
注：rate of change表示效应值，a等位基因表示该snp位点的参考基因组对应的等位基因，value a 表示有着a样品的油分含量的均值，b等位基因表示该snp位点的突变基因组对应的等位基因，value b 表示有着b样品的油分含量的均值。
[0050]
结果：采取卡方分析时针对油份表型数据即其平均值加减一倍标准差为标准取两端油分表型及测序结果，将其进行分层评价，通过利用卡方分析方法，依旧选择显著性alpha＝0.001作为分层阈值，将分析所得到结果进行分层，当检验p值小于0.001时，则认为是与油分相关的极显著的snp位点，其余p值大于0.001的相较之下效应相对小，选择意义甚小，因此得到与油分相关极显著位点个数9,211，其中9 号染色体上最多为1,448个，其他染色体上数目见图3，为进一步挖掘好的位点因此针对其snp位点突变分别在高低表型中占比
进行进一步限制，并且将其得到极显著位点与大豆油分mqtl结果相比较找到重合区间的位点，比较后得到的相关snp位点个数为193个，与油分相关的snp位点在20号染色体上最多，达73个。
[0051]
经卡方检测及与mqtl对比得到的关键snp位点突变前后的效应各不相同，有些是对油分含量起正向效应，有些为负向效应：如果含有某等位基因的油分含量平均值比所有资源的油分含量平均值高，那么该等位基因能够增加油分含量；相反，如果含有其突变等位基因的油分含量平均值比所有资源油分含量平均值低，那么该等位基因具有能够减少油分含量的作用。snp位点对油分含量的效应值有所不同(如图4)，图中上方的点列出的是突变对应等位基因的表型效应值与参考基因组对应等位基因的表型效应值的差值为正值，即突变后油分含量增加，图中下方的点是突变对应等位基因的表型效应值与参考基因组对应等位基因的表型效应值的差值为负值，即突变后油分含量减少。
[0052]
在1号染色体上39.67
‑
41.16的28个snp位点，其占高油分的比例为60％
‑
69.23％，其表型效应率在 1.03％
‑
2.83％；在2号染色体上45.78
‑
46.05的32个snp位点，其占高油分的比例为64.66％
‑
72.31％，其表型效应率在0.96％
‑
2.21％；在3号染色体上38904164处的snp位点，其占高油分的比例为61.54％，其表型效应率均为2.17％；在5号染色体上3.79
‑
40.12的22个snp位点，其占高油分的比例为60％
‑
73.85％，其表型效应率在1.39％
‑
2.28％；在6号染色体上6.67
‑
38.79的4个snp位点，其占高油分的比例为 60％
‑
69.23％，其表型效应率在1.47％
‑
2.26％；在11号染色体上7.61
‑
9.07的6个snp位点，其占高油分的比例为60％
‑
63.08％，其表型效应率为1.47％
‑
1.58％；在13号染色体上20.17
‑
20.33的15个snp位点，其占高油分的比例为72.31％
‑
78.46％，其表型效应率1.59％
‑
2.40％；在14号染色体上30524559、31571725 的2个snp位点，其占高油分的比例为76.92％，其表型效应率分别为1.92％、2.24％；在16号染色体上 31468397处的snp位点，其占高油分的比例为61.54％，其表型效应率2.37％；在18号染色体上50.33
‑
55.08 的9个snp位点，其占高油分的比例为61.54％
‑
76.92％，其表型效应率在1.92％
‑
2.63％；在20号染色体上13.66
‑
41.76的73个snp位点，其占高油分的比例为60％
‑
75.38％，其表型效应率在1.48％
‑
2.63％(表 3)。以上大豆的染色体的信息是来自于网站： https://phytozome.jgi.doe.gov/pz/portal.html#！info？alias＝org_gmax。
[0053]
表3筛选后的与油分相关的snp位点
[0054][0055]
四、油分相关snp位点单倍型分析：分析193个其变异位点的单倍型，将接近的位点分为一组共同分析，共得到44组，每组均产生不同单倍型，分析得到该单倍型在643份测序
材料中所占比例，并计算出该单倍型的表型均值，最后分析得到分析17组位点的最优单倍型和最差单倍型的油分表型均值有较大差异，能够较好的达到油分的分离见图5。
[0056]
在1号染色体上40386604处分析得到，高油分优异单倍型hap_1(tgattctagtcgttc)和低油分单倍型hap_9(cagcgactagtagag)，高油分优异单倍型占47.83％，油分主要分布在20
‑
23左右，低油分单倍型占8.36％，油分主要分布在20
‑
21，达到明显差异；在1号染色体上40780703处分析得到，高油分优异单倍型hap_1(gaagaaag)和低油分单倍型hap_9(cggccacc)，高油分优异单倍型占 48.33％，油分主要分布在20
‑
23左右，低油分单倍型占1.34％，油分主要分布在20.5
‑
21，达到明显差异；在1号染色体上40884357处分析得到，高油分优异单倍型hap_1(aac)和低油分单倍型hap_5(gat)，高油分优异单倍型占48.66％，油分主要分布在20
‑
23左右，低油分单倍型占2.01％，油分主要分布在19
‑
20，达到明显差异；在1号染色体40959307、41034358、41037022、41156486处也均得到高油分优异单倍型及低油分单倍型，油分的分布均达到差异明显，在2、5、6、11、13号染色体上的位点处也均产生高油分优异单倍型及低油分单倍型，油分的分布均达到差异明显。
[0057]
五、验证群体：162份东北地区大豆核心非测序极端油分资源材料，如表4用于重要等位基因挖掘的验证，种植、管理、采样、收获方法同实验材料。
[0058]
snp位点的标记筛选及方法：kasp反应体系由混合引物，master mix和样本dna组成。根据分层评价得到的snp位点，通过本地blast提取snp位点上下游各50bp的碱基序列，利用primer 5.0软件设计kasp引物。每一个位点的引物皆由2条具有不同等位基因和荧光标签的特异性正向引物(f1/f2) 以及1条公共的反向引物(r)构成，其中各组分主要配方分别是46μl的ddh2o，正向引物各 12μl(100μmol
·
l
‑
1)和反向引物30μl(100μmol
·
l
‑
1)，master mix来自于lgc公司。荧光标签fam： gaaggtgaccaagttcatgct(seq id no.79)，荧光标签hex：gaaggtcggagtcaacggatt (seq id no.80)引物序列信息如表5所示。
[0059]
kasp反应所需组分加于384孔板，采用罗氏lightcycler480ⅱ实时荧光定量pcr仪并在反应终止后读取终端荧光信号，其pcr扩增程序：95℃，15min；95℃，20s；65℃，25s；go to step 2，10cycles，
ꢀ‑
0.8℃ per cycle；95℃，10s；57℃，1min；go to step 4，35cycles；4℃，∞。
[0060]
表4 162份大豆非测序极端油分材料品种名称及油分含量
[0061][0062][0063]
表5引物序列信息
[0064][0065][0066]
kasp分型验证：罗氏lightcycler480ⅱ得到分型结果，转置到excel软件，进行分析，计算该位点符合率，基本思路为：
[0067]
(1)根据不同的极端大豆油分非测序材料，统计出每个引物在高油分、低油分材料中snp位点的参考基因组对应的等位基因及突变基因组对应的等位基因的个数及分布，构建符合率的四格表如表6所示：
[0068]
表6符合率的四格表
[0069][0070]
注：x、y为snp位点设计引物的kasp分型的基因型，a为非测序高油分材料分型结果中有x等位基因数量，b为非测序低油分材料分型结果中有x等位基因数量，c为非测序高油分材料分型结果中有y等位基因数量，d为非测序低油分材料分型结果中有y等位基因数量，m为非测序高油分材料总数，n为非测序低油分材料的总数。
[0071]
(2)原假设h0：含量的大小与x/y等位基因相互独立，h
a
：2个变数有关联。通过下列得到符合率 p1、p2，当所得到的p1<p
α
或p2<p
α
时，同意h0成立；当所得到的p1≥p
α
且p2≥p
α
时，不同意h0成立， h
a
成立。故依据计算出来的p1、p2值与α＝60％时的阈值对每个引物的结果进行判断。
[0072][0073]
(3)重复(1)、(2)步骤，对油分性状的所有引物分型结果进行独立性检验，用以来验证对该性状的影响，对于(3)步骤所得到的所有结果进行进一步表型效应验证，在所有材料中对主效位点进行表型效应计算，利用以下公式：
[0074][0075]
为验证snp位点挖掘优异等位基因，选取与油分相关的21个snp位点，根据kasp引物设计原则查找是否有特异性，并加上荧光标签最终设计出21个引物，引物序列信息见表5，利用kasp平台分别对162份极端油分资源材料进行验证分析，进一步得到关键snp位点。
[0076]
与油分相关的标记最终21个分型成功，图6表示1个kasp分型成功标记的的结果示意图，图中表明2种不同的纯合等位基因型(cc、tt)，还有表示杂合基因型(ct)。表示的是与油分相关的标记利用 kasp进行分型的结果及符合率，分析比较得知与油分相关的gm01_40386604标记在高油分材料中62份 cc基因型，低油分材料中51份为tt基因型，分别占高油分、低油分材料为76.92％和55.95％，其表型效应值为5.42％；与油分相关的gm01_40780703标记在高油分材料中78份cc基因型，低油分材料中65 份为gg基因型，分别占高油分、低油分材料为94.87％和72.62％，其表型效应值为10.17％；与油分相关的gm01_41034358标记在高油分材料中52份aa基因型，低油分材料中51份为gg基因型，分别占高油分、低油分材料为64.10％和59.52％，其表型效应值为4.86％；
[0077]
综上所述，分子标记的核苷酸序列为snp1，所述snp1的序列为大豆1号染色体上39.67mb
‑
41.16mb 位置的的核苷酸序列，且gm01号染色体的第40386604核苷酸位点为t或c。snp1的序列上第40780703 核苷酸位点为c或g。snp1的序列上第41034358核苷酸位点为a或g。
[0078]
实施例2.
[0079]
一、一种筛选高油分大豆的试剂盒：为(a)～(c)引物：
[0080]
(a)seq id no.4或seq id no.5和seq id no.6；
[0081]
(b)seq id no.7或seq id no.8和seq id no.9；
[0082]
(c)seq id no.16或seq id no.17和seq id no.18。
[0083]
二、筛选方法：
[0084]
选择未知大豆油分含量的样品，利用步骤一所述的筛选高油分大豆的试剂盒，进行pcr扩增程序： 95℃，15min；95℃，20s；65℃，25s；go to step 2，10cycles，
‑
0.8℃ per cycle；95℃，10s；57℃，1 min；go to step 4，35cycles；4℃，∞。方法如下：
[0085]
本发明还提供了一种鉴定高油分含量大豆的方法，所述方法的具体步骤为：
[0086]
(1)提取待检测大豆的dna；
[0087]
(2)利用seq id no.4或seq id no.5和seq id no.6进行pcr反应，检测待检测品种的大豆为 cc基因型则待检测品种的大豆为高油分含量的大豆，若为tt基因型则待检测品种的大豆为低蛋白含量的大豆。利用seq id no.7或seq id no.8和seq id no.9进行pcr反应，检测待检测品种的大豆为 cc基因型则待检测品种的大豆为高油分含量的大豆，若为gg基因型则待检测品种的大豆为低油分含量的大豆。利用seq id no.16或seq id no.17和seq id no.18进行pcr反应，检测待检测品种的大豆为aa基因型则待检测品种的大豆为高油分含量的大豆，若为gg基因型为低油分的大豆。
[0088]
结果：检测未知的大豆蛋白含量的样品中大豆油分含量有大于20％，利用(a)组引物标记标记为cc基因型，利用利用(b)组引物标记标记为cc基因型，利用(c)组引物标记标记为aa基因型，大豆高油分的含量与标记检测得到的基因型是相符的。大豆低油分的含量与标记检测得到的基因型是相符的。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈庆山;齐照明;张战国;刘珊珊;黄仕钰;胡振帮;杨明亮;武小霞
技术所有人：东北农业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。