使用dna标记和数量性状数据产生遗传预测器的方法

文档序号:6593513阅读:226来源:国知局
专利名称:使用dna标记和数量性状数据产生遗传预测器的方法
技术领域
本发明涉及产生遗传预测器的方法,特别涉及使用脱氧核糖核酸(DNA)标记和 数量性状数据产生遗传预测器的方法。
背景技术
在近20年中,通过记录系谱和性状数据并分析这些数据以估计表型的继承(遗 传)成分的最佳线性无偏预测法(BLUP),在各种植物和动物种类中已经实现了遗传改 进。对于这种方法,有很多修正和改进。最近,方法的发展取得了显著的进步,可以使用分子标记促进遗传预测。初期 主要关注标记辅助选择(MAS),其经常涉及合适的标记或连锁的多态性(经常称作数量 性状位点,QTL),作为BLUP分析中的固定或随机效应。这个领域最新的进展是全基因 组MAS或基因组选择,其中同时确定大量标记(例如60000个)的遗传型。使用反复取 样方法产生遗传性能的SNP键预测器。这些方法的主要缺陷如下(1)数量测定要使用BLUP估计遗传或育种值,动物通常需要有系谱和性状记 录,并可以在环境/彼此间有遗传联系的组间理性地比较动物。这极大地限制了遗传预 测器的范围,使其只能用于可以进行大量记录,并且在不同的组中和环境条件下存在遗 传联系(例如有共同的父亲)连接不同动物时。大多数数量估计的另一个缺陷是只有在 动物有大量后代时估计才准确,并且因此子畜中的准确率通常为低至中等水平,高度可 遗传的性状除外。很多BLUP系统的另一个缺陷是它们只提供种群内比较,因为缺乏合 适的在相同环境中培养的物种与杂交物种的遗传型数据结构。尽管有种群比较实验,并 且存在世界上广泛承认的杂交物种遗传评价体系,但是环境交互作用仍然使确定基因型 存在很多问题。(2)MAS ;尽管理论上可行,但是MAS和上述(1)有很多相同的问题,并且此 外,已经证明标记辅助选择(MAS)在实践中难于执行。原因之一是,在实践中,会大量 丢失遗传型和/或表型数据。方法如遗传型干扰可以容许丢失一些遗传型数据。已经在 个别的管理较好的大型育种计划中成功使用了 MAS,但是参数估计和遗传型数据非常稀 少的问题意味着很难在对农牧业的遗传育种值服务中使用MAS。(3)基因组选择表现出能提供可以不需要数量信息而使用的稳健的预测器,但是 (1)基因组选择需要的非常大量的标记目前很昂贵,并且(2)产生的SNP键倾向于只与来 自相同种群/群体的动物有关,除非密度非常高。在不同群体中应用时,SNP键预测器 的能力会迅速下降。针对以上问题,需要在多种条件下精确而稳定的产生遗传预测器的方法,并且 能跨种群和种群组成进行比较。此外,需要产生这种遗传预测器的方法,所述遗传预测器在参数估计中的误差 相对较少。

发明内容
本发明通过提供基于DNA标记和数量性状数据而产生遗传预测器的方法来满足 上述需要。在本发明中,通过将价值的分子估计值(estimates)与由数量性状测定推导出的 至少一个遗传值的估计混合,产生遗传预测器。个体分子估计值可以包括分子性状估计 或分子性状变异。个体分子估计值可以通过应用个体脱氧核糖核酸(DNA)标记、DNA 标记组、其具体的参数估计和特定参数变化,和测试样本的遗传型而确定。数量性状测 定可以包括估计育种值、原始性状数据,和根据动物祖先信息记录的种群组成数据,和 祖先的种群状态。本发明的遗传预测器在多种条件下有益并有用,而且对于大于零的参 数值,在参数估计中误差相对较少。根据本发明的一个方面,提供针对动物或植物种类产生遗传性状预测器的方 法,其包括产生个体分子估计值;和将所述个体分子估计值与由数量性状测定推导出的至少一个遗传值的估计混 合,其中所述遗传器与通过所述数量性状测定而测得的性状相关。在一个方面,通过分析来自动物的不同群体的参比数据集而针对个体DNA标记 或DNA标记组推导参数,描述标记对于具体性状的效应随遗传距离的衰退或变化,从而 产生个体分子估计值。在另一个方面,通过比较来自测试样本和参比数据集的DNA标记信息,计算测 试样本和参比验证数据集之间的遗传距离,从而产生个体分子估计值。在另一个方面, 在简单的情况下,杂交繁育的动物的种群类型或种群类型的百分比可以用作遗传距离的 替代指标。在这种情况下,可以根据分子数据计算动物的种群组成,并且使用对于指定 种群合适的个体分子效应成比例地产生个体分子估计值。或者,可以根据父母的种群组 成鉴定种群组成。在另一个方面,使用方法更准确和简单地提供来自不同种群和种群混合群体的 动物的相对遗传价值的估计。在这种情况下,通过将动物遗传型与种群参比群体比较而 估计动物的种群组成,并且使用种群组成(1)产生动物的合适的基线性能(例如在杂交品 种中,种群针对性状的权重平均性能)和⑵如上所述计算合适的种群特异性混合参数。通过使用测试样本和参比样本之间的遗传距离,并使用上述计算的参数,推导 针对测试样本的每个个体标记/标记组的特定参数估计值和变异,产生个体分子估计 值。然后对个体/标记/生状特异性参数和测试样本的遗传型应用混合算法,其可计算 分子性状估计和变异,可用于估计任何动物的遗传价值。在一个方面,遗传价值是饲养 场畜肉脂肪纹路(大理石纹,feedlot marbling)。然而这可以用于对于任何性状的遗传 价值的任何估计,其中有分子预测器和收集与性状相关的表型数据的能力。这包括繁殖 性状比如,性成熟时的年龄、性成熟时的体重、生育能力、繁殖能力、产犊间隔、人工 受精的产出率、怀孕期时长、生产难度、胚胎或婴儿存活率、抚育能力;乳汁性状,比 如体积、蛋白质和脂肪百分比和组成、体细胞数、泌乳曲线线型;生长和屠体组成性状 比如出生体重、断乳体重、周岁体重、成年体重、屠宰体重、屠体重、断乳前和断乳后每天平均体重增加量、屠体肌肉和脂肪和骨骼比例和屠体中的位置或分布、疾病耐受性 和免疫性状比如对于内部和外部寄生虫、细菌、病毒或朊病毒病的响应;代谢性状比如 对于毒素的耐受性、饲养效率、碳排放量;物理性状比如畸形、足部结构、种群定义特 性、颜色类型、是否有角;纤维性状比如纤维量、纤维直径、纤维曲度、纤维强度、纤 维颜色、纤维本体;行为性状比如飞行距离、好斗性、温顺性、抚育能力;肉质性状, 比如柔软度、质量等级、颜色、颜色稳定性、肌肉类型、切开形状、畜肉脂肪纹路、代 谢物或脂肪质量和容量;生物化学或基因表达性状比如组织样本中RNA或特定基因产物 的量。在另一个方面,使用本文提供的公式,将个体分子估计值与由数量性状测定推 导的遗传值的估计混合。在另一个方面,由数量性状测定推导的遗传值的估计包括估计育种值、原始性 状数据或种群组成数据(由可视、系谱或DNA标记信息推导)。


图1是流程图,阐述根据本发明用于产生遗传预测器的步骤。
具体实施例方式如上所述,本发明涉及使用脱氧核糖核酸(DNA)标记和数量性状数据产生遗传 预测器的方法,现在详细描述所述方法。如本文所使用的,在介绍本发明或其优选实施 方案的元素是,冠词和“所述”意欲表示有一个或多个元素。定义。提供下述定义以帮助本领域的普通数量或分子遗传学者或动物育种者更 容易和更完整地了解本发明。本文提供的定义并不意欲作为唯一的定义,而是作为优选 定义给出,意欲辅助技术人员理解本发明。通过“等位基因”,表示特定基因的特别版 本或变体。通过“动物”,表示所有动物比如牲畜,包括但不限于牛、羊、猪,水生种 类包括但不限于鱼、软体动物和甲壳纲动物,和家畜比如狗、猫和马。通过“混合指 数”,表示标记分数Xm和针对目标性状α)的多性状BLUP估计育种值的组合,通过公 式(Ib)表示。Mb = y ‘ Im+β · Ir其中γ和β是混合修正因子。通过“BLUP”,表示最佳线性无偏预测(best linear unbiased prediction)的首字母缩略词,并且指由 Henderson(1959-HENDERSON, C.R. ; KEMPTHORNE, O. ; SEARLE, S.R. ; VON KROSIGK, Biometrics
195913192-218)介绍的统计方法,其已经成为动物育种行业预测个体动物育种值的标 准。BLUP程序和本领域已知的算法的常用输入参数包括遗传和表型参数估计、表型、 系谱和固定效应。通过“育种值”,表示作为针对限定性状或性能特性的母体的动物的 真实值。与本发明联用时也理解为动物净育种值的量度。通过“性能性状”,表示一组 性状,其以数量方式限定饲养牲畜的期望和/或不期望的属性。这种性状的实例包括但 不限于平均每天体重增加值、平均每天饲料摄入量、饲养效率、背膘厚度、腰眼肌面 积,和瘦肉百分比。通过“估计育种值”(EBV),表示预测其“育种值”的动物的具体 数值。通过“DNA标记”或“DNA标记组”,表示与各种动物性状相关的基因标记,比如但不限于畜肉脂肪纹路、肌内脂肪、柔软度、乳汁量等。标记是能在实验室测定的、 在染色体上有特殊定位的DNA的序列。本发明期望的标记包括,但不限于RFLP(限 制性片段长度多态性)、SSR(简单序列重复或微卫星标记)和SNP (单核苷酸多态性)。 通过“遗传距离”,表示与两个群体之间进化遗传距离有关的量度,理想地,其应该精 确测量两个个体之间的减数分裂次数(或两个群体之间的减数分裂平均值)和它们最近的 共同祖先。通过“遗传价值”,表示选择作为繁殖亲本而对遗传后代将来性状性能水平 改进有贡献的待研究动物的值。在一个实施方案中,对于指定性状,动物的遗传价值越 高,越可能提供该性状水平改进的后代。通过“固定效应”,表示可对表型引起系统效 应的季节、空间、地理或环境影响。通过“群”或“群体”,表示育种动物的任何组, 其具有足够数量的动物,可有效使用本发明。这些术语可以用于动物如猪、牛、羊、鱼 或任何其它可以通过商业育种的动物,包括,但不限于鸟或任何其它种类,其无论出于 何种原因,对于作为遗传改进项目的一部分在选择育种动物以产生后代之前分析一个或 多个性状是理想的。动物还可以包括家畜,例如,比如狗、猫和马。通过“基因座”, 表示染色体上的特定位置(例如基因或DNA标记所在处)。通过“多态性”,表示对于 特定标记或基因,在DNA序列中存在的变化。通过“数量性状”,表示由大量基因控制 的性状,所述基因中每个基因具有小至中等的效应。对于数量性状的观察通常遵循正态 分布。术语“数量性状基因座(QTL) ”,表示包含多态性的基因组,所述多态性对于数 量性状有影响。“选择指数”指不同经济性状的EBV的加权总和。参照图1,表示阐述了根据本发明用于产生遗传预测器的步骤的流程图。参照步骤10,分析来自动物的不同群体的数据集,为个体DNA标记或DNA标 记组推导出参数,描述标记对于特定性状的效应随遗传距离的衰退或变化。参照步骤20,通过比较来自测试样本和参比数据集的DNA标记信息,计算测试 样本和参比验证数据集之间的遗传距离。可选地,可以使用种群类型组成作为遗传距离 的替代指标。参照步骤30,使用测试样本和参比样本之间的遗传距离[步骤20]和步骤10中 计算的参数,计算每个个体DNA标记或标记组的特定参数估计值和变异。参照步骤40,通过应用个体/标记/性状特异性参数和测试样本的遗传型,计算 分子估计值。参照步骤50,至少一个遗传值的估计由数量性状测定推导而来。数量性状测定 的非限定性实例包括估计育种值51、原始性状数据52和种群组成数据53。数量性状测 定可以是估计育种值51、原始性状数据52和种群组成数据53中的至少一个。数量性状 测定可以是估计育种值51、原始性状数据52和种群组成数据53中至少两个的组合。数 量性状测定可以是估计育种值51、原始性状数据52和种群组成数据53。数量性状测定 包括通过现场观察产生的原始性状数据,繁殖状态或动物行为,颜色和一致性;不同时 间生物体或生物体部位的重量或长度;身体组成测定比如通过用声波(超声)扫描或电磁 辐射(χ-射线、近红外)或直接测定确定的瘦肉、脂肪分布;取自组织样本的免疫或代谢 或基因表达状态的分析;肉质测定,其通过机械测定,比如剪切力,化学测定比如脂肪 组成,或者通过消费者口感调查。实施例
A.选择指数理论i.概述根据本发明,针对影响利润的单性状(后文称作目标性状),用于比较一组选择 候选体的性能的标准选择指数定义为
权利要求
1.产生遗传性状预测器的方法,其包括产生个体分子估计值;并将所述个体分子估计值与来自数量性状测定的至少一个遗传值的估计混合,其中所 述遗传性状预测器与通过所述数量性状测定得到的性状相关联。
2.权利要求1的方法,其中所述数量性状测定包括估计育种值。
3.权利要求1的方法,其中所述数量性状测定包括通过实地观察繁殖状态或动物行 为、颜色和一致性而产生的原始性状数据;不同时刻生物体或生物体部位的重量或长 度;通过声波(超声)扫描或电磁辐射或直接测量而确定的机体组成测量值,比如瘦肉、 脂肪分布;取自组织样本的免疫或代谢或基因表达状态的分析;采用机械比如剪切力, 化学比如脂肪组成,或者通过消费者口味调查而得到的肉质测量值。
4.权利要求1的方法,其中所述数量性状测定包括种群组成数据。
5.权利要求1的方法,其中所述数量性状测定包括至少两个估计育种值、原始性状数 据和种群组成数据的组合。
6.权利要求1的方法,其中所述个体分子估计值通过分析来自动物或植物群体的参比 数据集而产生。
7.权利要求6的方法,其中所述分析产生针对个体脱氧核糖核酸(DNA)标记或DNA 标记组而推导出的参数,其描述标记对于具体性状的效应随遗传距离的衰退或变化。
8.权利要求7的方法,其中所述个体分子估计值通过确定种群类型而产生。
9.权利要求7的方法,其中所述个体分子估计值通过确定测试样本和所述参比数据集 之间的遗传距离而产生。
10.权利要求9的方法,其进一步包括针对所述测试样本的每个所述个体DNA标记和 所述DNA标记组推导出特定参数估计值和特定参数变化。
11.权利要求10的方法,其中所述特定参数估计值的所述变异使用所述测试样本和所 述参比数据集之间的遗传距离。
12.权利要求10的方法,其中所述特定参数估计值的推导使用针对所述个体DNA标 记或所述DNA标记组的参数。
13.权利要求10的方法,其中所述特定参数估计值的推导使用所述测试样本和所述参 比数据集之间的遗传距离,和针对所述个体DNA标记或所述DNA标记组的参数。
14.权利要求13的方法,其进一步包括确定至少一个所述遗传值的估计,其中至少一 个所述遗传值的估计包括分子性状估计和分子性状变异中的至少一个。
15.权利要求14的方法,其中通过使用所述个体DNA标记、所述特定参数估计值和 所述测试样本的遗传型中的至少一个确定所述分子性状估计。
16.权利要求14的方法,其中通过使用所述个体DNA标记、所述特定参数估计值和 所述测试样本的遗传型中的至少一个确定所述分子性状变异。
17.权利要求14的方法,其中通过使用所述个体DNA标记、所述特定参数估计值和 所述测试样本的遗传型确定所述分子性状估计。
18.权利要求14的方法,其中所述数量性状测定包括估计育种值、原始性状数据和种 群组成数据中的至少一个。
19.权利要求18的方法,其中所述数量性状测定包括所述估计育种值、所述原始性状数据和所述种群组成数据中至少两个的组合。
20.权利要求19的方法,其中所述数量性状测定包括所述估计育种值、所述原始性状 数据和所述种群组成数据。
21.权利要求19的方法,其中所述种群组成数据源自可视信息、系谱信息,或DNA 标记信息。
22.产生遗传性状预测器的方法,其包括产生个体分子估计值;和将所述个体分子估计值和由数量性状测定推导出的至少一个遗传值的估计混合,其 中所述个体分子估计值通过分析来自动物或植物群体的参比数据集而产生,并且其中所 述分析产生针对个体脱氧核糖核酸(DNA)标记或DNA标记组推导出的参数,描述标记 对具体性状的效应随遗传距离的衰退和变化,其中所述个体分子估计值通过确定种群类 型而产生,并且其中所述个体分子估计值通过测试样本和所述参比数据集之间的遗传距 离相关性而产生。
23.产生遗传性状预测器的方法,其包括产生个体分子估计值;和将所述个体分子估计值和由数量性状测定推导出的至少一个遗传值的估计混合,其 中所述个体分子估计值通过分析来自动物或植物群体的参比数据集而产生,并且其中所 述分析产生针对个体脱氧核糖核酸(DNA)标记或DNA标记组推导出的参数,描述标记 对具体性状的效应随遗传距离的衰退和变化,其中所述个体分子估计值通过确定种群类 型而产生,并且其中所述个体分子估计值通过测试样本和所述参比数据集之间的种群类 型相关性而产生。
全文摘要
本发明涉及通过将个体分子估计值与来自数量性状测定的至少一个属值的估计混合而产生遗传性状预测器。所述个体分子估计值可以包括分子性状估计或分子性状变异。所述个体分子估计值可以通过应用个体脱氧核糖核酸(DNA)标记物、DNA标记组、其具体的参数估计和特定参数变化,和测试样本的遗传型而确定。数量性状测定可以包括估计的育种数据、原始性状数据和种群组成数据。所述遗传预测器在各种条件下精确而稳定,并且参数估计中的误差相对减少。
文档编号G06F19/18GK102016858SQ200980116660
公开日2011年4月13日 申请日期2009年5月6日 优先权日2008年5月9日
发明者彼得·R·阿默, 迈克尔·L·泰特 申请人:美国辉瑞有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1