一种通过基因组数据对遗传力进行评估的算法_2

文档序号:9751164阅读:来源:国知局
程的截距a即是遗传力的倒数,通过求该方程的截距的倒数,求出遗传力的估计值。
[0015] 对所有个体基因组进行测序,获得SNP信息,所有个体的SNP位点对应,缺失数据通 过imputation方法补齐;为防止单次估计误差较大,采用多次杂交验证的方法,反复从总体 中随机抽取参考群体和估计群体,来获得接近真实值的估计结果;使用不同的参考群数目 结合GBLUP算法来计算基因组各个标记的效应值,以得到估计群的育种值,通过对估计群的 育种值和表型值进行分析得到估计准确度,解决了系谱记录工作繁琐甚至很难完成的问 题,同时准确捕获等位基因在传递过程中的孟德尔抽样误差。
[0016] 实施例1 1.试验对象为500条大黄鱼,采用人工催卵技术,所有的大黄鱼在同一天出生,即年龄 全部相同;试验时间为大黄鱼两年龄时,测量性状为所有大黄鱼的体重和体长。
[0017] 2.采用GBS(geno typing-by-sequencing)测序技术对所有要研究的个体进行基因 组测序,筛选合格的SNP位点,参数控制如下:将MAF>0.05,哈代-温伯格平衡检验P-value >0.001,单个位点的缺失率低于20%的标记位点留下;最终一共筛选出29748个合格的SNP 标记,对于缺失的位点,通过软件Beagle 3.3.2版本的imputation程序补齐。
[0018] 3.在所有500个体中,随机抽样抽出20 %即100个体作为估计群体,剩下的按照个 体数100、200、300、400分成四个等级,观察四个不同级别的参考群个体数对应于估计准确 度的变化趋势;使用GBLUP算法估计每个等级下的所有标记效应,得到估计群的每个个体的 育种值GEBV,通过计算估计群的GEBV和表型值的相关系数,得到估计准确度,即r (GEBV, Y)。
[0019] 为了降低单次抽样误差过大的影响,将步骤3重复操作20次,由于每次估计群和参 考群的个体都是随机抽样而来,因此每次重复的结果会略有不同,但20次结果的平均值会 更加接近真实结果,20次平均值的结果附图2所示。
[0020] 4.对每个等级的参考群大小(即NP)取倒数,对每个等级的估计准确度(即r( GEBV,Y)) 的20次结果的平均值取平方的倒数,二者之间的关系如附图3所示,根据公式(4)来拟合最 终的回归方程,如下表所示:
根据上表结果,可求得体重的遗传力估计值为0.227,体长为0.196。
[0021] 上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方 式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下 做出各种变化。
【主权项】
1. 一种通过基因组数据对遗传力进行评估的算法,对于某一数量性状,通过使用不同 数量的参考群个体进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出 估计准确度;通过基因组估计准确度与参考群体大小进行曲线直线化拟合,拟合出的回归 方程的截距的倒数为遗传力的估计值;其特征在于:基因组选择的具体过程采用GBLUP作为 计算标记效应的算法,基因组所有标记位点的效应方差是相等的,标记效应通过W下公式 计算得出:a)其中,薦为总体平均值;I为所有标记位点的效应向量;基因组估计育种值(GEBV)通过 将所有标记位点的效应相加获得,即GEBV= I: Xigi; GEBV估计准确性通过计算GEBV与真实育 种值(TBV)的相关系数,即r仰BV TBV)得出;在GBLUP算法估计育种值的情况下,r仰BV TBV)的另 一计算公式为: (I) 其中,Np为参考群的个体数量;h2为所研究的性状的遗传力;M为决定该性状的有效基因 组片段的数目;在实际生产中,无法得知TBV的具体数值,因此用表型值(Y)替代TBV,推导出 GEBV与Y的关系为:(凌} 在公式(3)中,通过调整Np的大小可获得不同的r他BV, Y)的值,拟合该曲线方程,拟合的 方式采用曲线直线化,对公式(3)进行整理,得到线性方程:(4) 该方程相当于线性回归模型y = a+bx,其中y为r他BV,Y)的平方的倒数,X为Np的倒数,方 程的截距a即是遗传力的倒数,通过求该方程的截距的倒数,求出遗传力的估计值。2. 根据权利要求1所述的通过基因组数据对遗传力进行评估的算法,其特征在于,对所 有个体基因组进行测序,获得SNP信息,所有个体的SNP位点对应,缺失数据通过imputation 方法补齐。3. 根据权利要求1所述的通过基因组数据对遗传力进行评估的算法,其特征在于,为防 止单次估计误差较大,采用多次杂交验证的方法,反复从总体中随机抽取参考群体和估计 群体,来获得接近真实值的估计结果。4. 根据权利要求1所述的通过基因组数据对遗传力进行评估的算法,其特征在于,使用 不同的参考群数目结合GBLUP算法来计算基因组各个标记的效应值,W得到估计群的育种 值,通过对估计群的育种值和表型值进行相关分析得到估计准确度。
【专利摘要】本发明公开了一种通过基因组数据对遗传力进行评估的算法,对于某一数量性状,通过使用不同数量的参考群个体利用GBLUP算法进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出估计准确度;通过基因组估计准确度与参考群体大小进行曲线直线化拟合,拟合出的回归方程的截距的倒数为遗传力的估计值;本发明通过基因组的数据对数量性状的遗传力进行评估,所研究的成果可直接应用于动植物数量性状育种中,本发明的算法不对个体进行系谱记录而是对个体基因组进行测序,通过全基因组标记来预测性状的遗传力,遗传力估计结果主要用于将来的育种工作中,另外,测序可以捕获到孟德尔抽样误差,相对记录系谱数据能够获得更准确的系谱信息。
【IPC分类】G06F19/18
【公开号】CN105512510
【申请号】CN201510873172
【发明人】肖世俊, 董林松, 王志勇
【申请人】集美大学
【公开日】2016年4月20日
【申请日】2015年12月3日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1