一种建立核心种质研究群体的计算机模拟方法

文档序号：6571613阅读：153来源：国知局

专利名称：一种建立核心种质研究群体的计算机模拟方法
一种建立核心种质研究群体的计算机模拟方法技术领域
本发明属于植物育种中的种质资源研究领域，具体涉及一种建立核心种质研究群体的计算机模拟方法。
背景技术：
丰富的种质资源是育种工作能够顺利开展的必要条件。种质资源的征集保存对作物新品种的选育、特异种质材料的利用以及种质创新具有重要意义。世界各地育种机构近百年来相继建立了众多种质资源库，不断搜集和保存各类种质资源。然而，随着种质资源的不断搜集，种质资源库变得越来越大，庞大的种质资源规模给保存、评价、研究和利用带来了众多困难。近年来，核心种质研究越来越受到广泛重视。核心种质(core collection)是用科学方法，从整个种质资源中选择一部分样本，以最小的遗传资源数量，尽可能最大限度的代表整个遗传资源的多样性。原始群体中未包含在核心种质中的种质材料并不被丢弃，而是被用做核心种质的补充，称为保留种质(reserve collection)。建立核心种质的目的是为了对其进行优先评价和利用，从而提高整个种质资源库的管理和利用水平。构建核心种质是研究和利用植物遗传资源的便捷途径，受到了世界各国的广泛重视。
核心种质是种质资源研究的新领域，其构建方法还在不断摸索与完善中。核心种质构建策略通常包括分组方法、取样方法、取样比例、评价方法等。在核心种质构建策略研究中，常采用作物田间农艺性状测得的数据构建研究群体。然而，作物农艺性状多为数量性状，表现型值易于受环境影响导致测量不准确，经常会影响核心种质构建结果的有效性。因此，许多学者采用计算机模拟群体进行核心种质研究，取得了一系列重要成果。将计算机模拟应用于核心种质研究，不但能够节省大量的人力物力，而且模拟群体不受传统试验环境误差的影响，可以得到更加稳健可靠的结果。传统的种质资源群体模拟方法，常基于人为设置数量性状微效基因型值构建模拟群体。然而，人为设置数量性状微效基因型值有很大的盲目性，构建的模拟群体容易脱离实际，常常会导致核心种质构建策略研究得到错误的结论。发明内容
针对上述现有技术存在的问题，本发明提供一种基于田间小样本实际数据的计算机模拟构建核心种质研究群体的方法。为实现上述目的，本发明通过以下技术方案实现。
一种建立核心种质研究群体的计算机模拟方法，包括以下步骤
(I)田间小样本实际数据的获取，将8 30个种质资源样品田间种植。根据种质资源本身特点参考“植物新品种特异性、一致性和稳定性测试国家标准”确定种植方案。
考察记录一系列田间数量性状数据，考察的性状为8-15个。数量性状因种质资源本身特点而异，应选择变异幅度相对较大的性状进行记录，如株高、生育期、产量等。
(2)基于田间小样本实际数据模拟核心种质研究群体包括以下步骤
I)计算每个性状的均值M和标准差S。
2)将实际群体个体数根据需要扩大为N倍，得到模拟群体初步规模。
3)利用常用的构造正态分布伪随机数方法，根据每个性状的标准差S，在计算机中模拟出性状数目和实际群体相同但大小为N的随机数群体(随机化标准差群体)，群体中每个性状均满足正态分布，且均值为O,标准差为诉,
4)将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M，得到初步模拟群体P。
5)将该初步模拟群体P的个体随机删除n%，得到最终的模拟群体p。
其中，在步骤(2)的2)中，所述N倍的选择在于构建核心种质之前，通常要进行分组，将所有样品按生态区、地理起源、植物学分类等分成一系列群体，然后在各个群体内构建核心种质，最后将所有核心种质整合。因此，分组后用于核心种质研究的群体规模通常在100 2000之间，据此来确定N的大小。
其中，在步骤(2)的5)中，所述n%的选择在于为了使模拟群体更加接近实际情况，将初步模拟群体P的个体随机删除n%，这里n%的范围通常为总数的十分之一到五分之一(10% 20%) ο
本发明与现有技术相比具有以下优点
本发明在构建核心种质模拟群体过程中，不需考虑数量性状基因层面的问题，减少了盲目性，避免了构建的模拟群体脱离实际的风险。
本发明投入较少的成本采用田间种植种质资源小样本的方式获得基础模拟数据。小样本使得控制田间环境条件的难度大大降低，使得测量的田间数量性状数据可靠性大大增加，进而使模拟群体更加接近真实情况。
具体实施方式
下面给出本发明的较佳的实施例，这些实施例并非限制本发明的内容。
实施例I
9个大棚毛豆品种(购于浙江省杭州市石桥路种子市场)测定12个数量性状(单株有效荚数、3粒荚数、2粒荚数、I粒荚数、3粒荚比例、2粒荚比例、I粒荚比例、豆荚长、豆荚宽、小区产量、调整小区产量和折合亩产)，计算出每个性状的均值M和标准差S (表I)。将规模为9的实际群体大小扩大15倍，得到模拟群体初步规模为135。然后，利用常用的构造正态分布伪随机数方法，根据每个性状的标准差S，在计算机中模拟出包含12个性状135 个体的随机化标准差群体，群体中每个性状均满足正态分布，且均值为0，标准差为Vi .:再将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M，得到初步模拟群体 P(表2)。最后将初步模拟群体P随机删除20%的个体，得到包含108个体的大棚毛豆品种模拟群体。
用目前较为有效的最小距离逐步取样法在模拟群体中抽取核心种质。最小距离逐步取样法需要结合有效的遗传距离和取样比例才能构成完整的核心种质构建策略。本实施例采用了 5种常用遗传距离(欧氏距离、马氏距离、曼哈顿距离、夹角余弦距离和相关系数距离)和从小到大8个取样比例(5%、10%、15%、20%、25%、30%、35%、40%)来筛选有效的大棚毛豆核心种质构建策略。采用目前国际上常用的2种评价参数(极差符合率和变异系数变化率)评价核心种质的代表性。具体步骤为采用最小距离逐步取样法在每个遗传距离和每个取样比例上均构建一次核心种质，计算极差符合率和变异系数变化率的值，结果汇总成表3o
结果表明欧氏距离在不同取样比例下均表现为极差符合率和变异系数变化率最高。15%取样比例下，欧氏距离构建核心种质的极差符合率超过85% ;25%取样比例下，欧氏距离构建核心种质的极差符合率超过95%。因此，大棚毛豆核心种质构建过程中，欧氏距离为最佳遗传距离，15%以上为有效取样比例，25%为最佳取样比例(表3)。
表19个大棚毛豆品种12个数量性状的测定值、均值和标准差
权利要求
1.一种建立核心种质研究群体的计算机模拟方法，包括以下步骤 (1)田间小样本实际数据的获取，将8 30个种质资源样品田间种植；考察记录一系列田间数量性状数据，考察的性状为8-15个； (2)基于田间小样本实际数据模拟核心种质研究群体包括以下步骤 1)计算每个性状的均值M和标准差S； 2)将实际群体个体数根据需要扩大为N倍，得到模拟群体初步规模； 3)利用常用的构造正态分布伪随机数方法，根据每个性状的标准差S，在计算机中模拟出性状数目和实际群体相同但大小为N的随机数群体，群体中每个性状均满足正态分布，且均值为0，标准差为# ； 4)将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M，得到初步模拟群体P ; 5)将该初步模拟群体P的个体随机删除n%，得到最终的模拟群体p。
2.如权利要求I所述的计算机模拟方法，其特征在于，在步骤(2)的2)中，所述N倍的范围是100-2000。
3.如权利要求I所述的计算机模拟方法，其特征在于，在步骤(2)的5)中，所述11%的范围是10%-20%。
全文摘要
本发明提供一种建立核心种质研究群体的计算机模拟方法，包括以下步骤田间小样本实际数据的获取，考察记录一系列田间数量性状数据；计算每个性状的均值M和标准差S；将实际群体个体数根据需要扩大为N倍，得到模拟群体初步规模；利用构造正态分布伪随机数方法，根据每个性状的标准差S，在计算机中模拟出性状数目和实际群体相同但大小为N的随机数群体，且均值为0，标准差为将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M，得到初步模拟群体P；将该初步模拟群体P的个体随机删除n％，得到模拟群体p。本发明不需考虑数量性状基因层面的问题，减少了盲目性，减小了成本，也避免了构建的模拟群体脱离实际的风险。
文档编号G06F19/00GK102982228SQ201210270088
公开日2013年3月20日申请日期2012年8月1日优先权日2012年8月1日
发明者胡晋, 王建成, 关亚静, 徐盛春申请人:浙江大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡晋;王建成;关亚静;徐盛春
技术所有人：浙江大学
我是此专利的发明人

上一篇：基于周长阈值的结构拓扑优化设计灵敏度过滤方法
上一篇：一种用于潮流计算稀疏方程组的链表处理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。