遗传标记和相关上位相互作用的使用方法

文档序号:311605阅读:534来源:国知局
专利名称:遗传标记和相关上位相互作用的使用方法
技术领域
本发明涉及对乳牛中的期望特征的提高。更具体而言,本发明涉及基因和遗传标 记在用遗传标记来改善乳牛适合度和/或生产力性状的方法中的使用,包括多个遗传标记 的同时应用和这些标记处的特定等位基因之间的相互作用。
背景技术
乳品工业的未来活力和竞争力取决于对牛奶生产力(例如,牛奶、脂肪、蛋白产 量、脂肪%、蛋白%和泌乳持久力)、健康(例如,体细胞计数、乳腺炎发病率)、繁殖力(例 如,受孕率、发情期表现、产犊间歇和公牛不归率)、产犊容易性(例如,直接产犊容易性和 母畜产犊容易性)、寿命(例如,生产寿命)和功能性构造(例如,乳房支撑、合适的足和腿 的形状、合适的臀部角度等)的连续改善。不幸的是,效率性状往往不利地与适合度性状相 关。尽管在商品化牛群中适合度性状都具有某种程度的基础遗传变异,选择带有优异的遗 传优点的育种动物的准确性对于它们中的许多而言是较低的,这是因为较低的遗传力和无 法在候选动物上有效测定性状成本。另外,许多生产力和适合度性状仅能在雌性上测定。因 此,对这些性状的常规选择的准确性是中低等的并且通过选择进行遗传改变的能力有限, 尤其是对于适合度性状而言。另外,在多个基因座处的特定等位基因之间存在频繁的相互作用,这使对遗传优 点的预测混乱。换言之,等位基因的组合对于性状的效果可能不是严格的加合性的,而是协 同性的(或拮抗性的)。在缺乏对这些相互作用的理解下,对遗传优点的先验估计显然更加 困难和更不准确。基因组学提供了通过发现负责遗传变异的基因或与基因相连的遗传标记来更 大地改善生产力和适合度性状的可能性,并且可以将其用于更直接和准确的选择。已经 报道了接近1000个与生产力和适合度性状相关的标记(对于已报道的QTL的可搜索数 据库,参见www. bovineqtl. tamu. edu/),然而,QTL位置的分辨率仍然较低,这使得难以 将这些QTL在工业规模上用于标记辅助选择(MAS)中。仅有少数QTL已经用强推定性 或得到良好确证的以下因果突变进行了完全表征染色体14上的DGATl (Grisard等, 2002 ;Winter 等,2002 ;Kuhn 等,2004)、染色体 20 上的 GHR(Blott 等,2003)、染色体 6 上的
5ABCG2 (Cohen-Zinder等,2005)或SPPl (Schnabel等,2005)。然而,这些发现较为罕有且仅 解释了小部分生产力性状的遗传差异,而尚未完全表征任何控制适合度性状的基因。更成 功的策略采用了其中用足够的分辨率测绘了 QTL的整个牛基因组的全基因组高密度扫描 的应用来解释有关生产力和适合度性状的大部分遗传变异。世界各地的产奶用牛群主要源自已知具有高生产水平的荷斯坦(Holstein)种或 荷斯坦-弗里塞(Holstein-Friesian)种。然而,荷斯坦种的高生产水平也已经与其更大的 产犊难度和降低的繁殖力水平相联系。尚不清楚的是,这些不利的相关性是否是由于多效 基因效应或仅仅是由于连锁基因。如果是后者,有可能利用标记知识来选择含有来自数个 连锁基因的有利等位基因的有利重组物,所述有利等位基因往往频率极低而使得用传统选 择无法取得较大进展。由于荷斯坦种质已经在全球销售和运输了数十年,荷斯坦种已经有 效地成为一个保持于相对中等的近交率(inbreeding rate)的大全球种群。此外,这类大 种群的经数代选择的远交性质已使得能够打破除了在相对较短距离内(即,少于数厘摩) 以外的连锁不平衡(Hayes等,2006)。另外,作为在具有不同育种目标的几个国家中选择的 结果,相对较近的基因座之间的连锁不平衡可能因已经通过数代的全球选择和育种成为混 血种的亚群内的偏移的影响而较为易变。考虑到连锁不平衡的这种模式,需要非常密集的 标记覆盖率来以足够的精确性细调QTL位置以便找到与其处于非常紧密的连锁不平衡的 标记。因此,与QTL处于非常紧密的连锁不平衡的标记对于有效的种群范围MAS或全基因 组选择(WGS)至关重要。大多数生产力和适合度性状是定量性的,因而受到具有中小级别效果的数百个 QTL的控制。因为,为了表征足够的QTL以便解释这些性状的大多数变异,必须用一组以高 分辨率(即,大于1标记/cM)定位至基因组的标记扫描整个基因组;也称作全基因组分析。
此外,必须在MAS中使用足够数目的QTL以便在没有近亲或动物自身的表型记录 时能准确预测该动物的育种值。本文说明了这种用以发现和精细定位解释生产力和适合度 性状的变异的QTL的高密度全基因组标记定位图(marker map)的应用。大量的所得连锁 标记可以用于包括全基因组选择(WGS) (Meuwissen等,Genetics 2001)的数种标记选择方 法或标记辅助选择方法中以针对这些性状改善种群的遗传优点并在乳品工业中制造价值。与可以通过一个因果突变完全解释的某些简单性状不同,许多生产力和适合度性 状需要大量标记以准确预测动物的表型性能。定量表型通常涉及多个基因、多个途径和复 杂的相互作用。在某些情况下,该复杂性导致极其难以预测的标记之间的相互作用。几乎没有研究已经对候选基因SNP之间的相互作用对于乳品性状中的定量变异 的贡献进行了研究。对于这些相互作用研究的缺乏可能有几种原因。首先,不同的候选基 因通常被不同的小组研究,而不同候选基因的基因型收集于不同的动物;大多数候选基因 研究都集中在发现/确认性状与其感兴趣的SNP的关联上;相互作用影响的研究通常需要 更大的样本大小。然而,定量性状的表达是多个生理学途径(例如,脂代谢、食欲/饱腹感等)相互 作用的结果,且每个生理学途径中往往有大量基因参与。因此,似乎合理的是,与其参与相 同或不同途径的基因之间有某种程度的相互作用,和与其一部分遗传定量变异是因为这类 相互作用而造成的。本发明人已经鉴定了与奶牛的重要基因中的新型性状相关的标记,以及这些基因
6之间的包括上位效应的多种相互作用的效果,这可用于显著改善遗传评估、预测和选择的 准确性。

发明内容
本部分提供了对本发明的非穷尽性总结。本发明的各个实施方式提供了用于评估在动物基因组中的一个或多个位置处的 动物基因型的方法。在这些实施方式的各个方面,在DNA片段(等位基因)内含有至少两 个选自“表格与序列列表”中所述的SNP的SNP的位置对动物基因型进行评估。对于表1和 3中所列的每个SNP,有关SNP位置、SNP长度和等位基因的细节可以见于表4中。本发明的其它实施方式提供了用于针对生产力和/或适合度性状根据动物的的 预测标记育种值来分配待用动物的方法。本发明的该实施方式的各个方面提供了包括如下 步骤的方法a)分析两个以上的多态性处的动物基因组序列(其中所分析的等位基因各自 包含至少两个SNP)以确定这些多态性的每一个处的动物基因型;b)分析针对每个多态性 所确定的基因型以确定存在的SNP的等位基因;c)基于动物在所分析的两个以上多态性处 的基因型来分配待用动物。该实施方式的各个方面提供了基于在本发明所公开的两个以上 多态性处的动物基因型与所需表型之间的有利关联来分配待用动物的方法。替代性地,所 述方法提供了由于动物具有两个以上的与不必要的表型相关或者不与所需表型相关的SNP 等位基因而不分配该动物用于特定用途。本发明的其它实施方式提供了选择动物用于育种以产生后代的方法。这些方法的 各个方面包括A)确定两个以上的基因座处的至少两个可能的亲本动物的基因型,其中至 少两个所分析的基因座含有选自表1和3所述SNP的SNP的等位基因。B)对于至少两只动 物分析两个以上的位置处的所确定的基因型以确定存在的SNP等位基因。C)将所分析的等 位基因与两种以上表型相关联。D)分配至少两只动物以用于生产后代。替代性实施方式包 括分析两个以上的基因座处的动物基因型,其中该分析包括评估相互作用效应。本发明的其它实施方式提供了子代动物(后代动物)的生产方法。本发明该实 施方式的各方面提供了包括如下的方法使已通过本文所述的方法选择用于育种的动物进 行育种以产生子代。子代可以通过纯天然方法或者通过使用任何适当的技术手段来生产, 所述技术手段包括但不限于人工授精、胚胎移植(ET)、多排卵胚胎移植(MOET)、体外受精 (IVF)或其任何组合。本发明的其它实施方式提供了选择动物用于育种以产生后代的方法,其中在分析 中应用了多个标记之间的相互作用效应。定义提供以下定义以辅助本领域技术人员更容易地理解和认知本发明的全部范围。但 是,如下文所提供的定义中所表明,除非明确指明,所提供的定义并非是有意排他性的。更 确切地说,它们是提供给本领域熟练技术人员以集中于本发明的各种说明性实施方式上的 优选定义。如本文所用的术语“等位基因关联”优选是指MAi)与f(Bp的乘积得到的 f (AiBj)的非随机偏差,由r2 > 0. 2具体限定该非随机偏差,其中r2从相当大的动物样本 (例如,彡100)中测定并且定义为
一 = If(A1B1)^(A1)f(B1)F
RA1Xl-RA1 ^fiB1 )(1-RB1))其中A1表示一个基因座处的等位基因,表示另一个基因座处的等位基因;MA1B1) 是指同时具有A1和B1的频率,f (A1)是A1的频率,f (B1)是种群中B1的频率。如本文所用,术语“分配待用动物”和“分配使用,,优选是指决定如何将动物在畜 群内使用或者将其从畜群中移除以便实现所需的畜群管理目标。例如,可能将动物分配用 作育种动物或分配用于作为非育种动物销售(例如,分配为待作为肉用销售的动物)。在本 发明的某些方面,可以将动物分配用于育种程序内具有非常具体目标(例如,生产力或适 合度)的亚组中。于是,即使在分配用于育种目的的动物组内,还有针对实现更具体和/或 专门化的育种目的的用途的更具体的分配。如本文所述,术语“动物”优选是指奶牛。如本文所述,“适合度(fitness)”优选是指包括但不限于以下的性状妊娠 率(PR)、子系妊娠率(Dra)、生产寿命(PL)、体细胞计数(SCC)和体细胞评分(SCS)。PR 和Dra是指非妊娠动物在每个21日周期中怀孕的百分比。PL计算为每个泌乳期的产 奶月数,将所有泌乳期的产奶月数相加直到将奶牛从畜群移除(剔除或死亡)。SCS = Iog2 (SCC/100, 000) +3,其中SCC是每毫升牛奶中的体细胞。如本文所用,术语“生长”是指与动物的尺寸/重量的增加有关的各种参数的测定。如本文所用,术语“连锁不平衡(linkage disequilibrium) ”优选是指其中在相同 染色体上存在A1和B1 (如上文等位基因关联的定义中所用)的等位基因关联。如本文所用,术语“标记辅助选择(MAS) ”优选是指基于系谱和表型数据的可能组 合中的标记信息的动物选择。如本文所用,术语“标记育种值(MBV) ”和“预测标记育种值(PMBV) ”是指对关于 特定性状而言且基于其基因型的动物遗传传递能力的估计。如本文所用,术语“天然育种”优选是指在受精过程中在没有人的干预时使动物交 配。换言之,不使用如人工授精或胚胎移植等机械或技术性方法。该术语不涉及亲本动物 的选择。如本文所述,术语“净优点,,优选是指包括几种通常测定的性状的复合指标,所述 性状根据典型生产设定中的相对经济值而进行衡量并被表达为相对于工业基础的每只奶 牛的终生经济价值。净优点指标的实例包括但不限于美国的$匪或TPI、加拿大的LPI等 (计算这些指标的公式是本领域内公知的,例如,$匪可见于USDA/AIPL的网站胃w. aipl. arsusda. gov/reference. htm)0如本文所用,术语“预测值”优选是指基于动物的基因型和系谱对动物的育种值或 传递能力的估计。如本文所用,“生产力”和“生产”优选是指产生包括但不限于以下的性状总乳产 率、乳脂百分比、乳脂产率、乳蛋白百分比、乳蛋白产率、终生总产量、挤奶速度和泌乳持续 性。如本文所用,术语“定量性状(quantitative trait) ”用于指代受多个(两个以 上,往往是很多个)基因控制的性状,每个基因贡献出较小至中等的对该新性状的影响。通
8常在正常分步之后进行对定量性状的观察。如本文所用,术语“定量性状基因座(QTL) ”用于描述含有影响定量性状的多态性 的基因座。如本文所用,术语“繁殖材料”包括但不限于精液、精子、卵子和受精卵。如本文所用,术语“单核苷酸多态性”或“SNP”是指在种群内是多态性的动物基因 组中的位置。即,在种群内,某些个体动物在该位置具有一种碱基类型,而其它动物具有不 同的碱基。例如,SNP可以指其中某些动物在其DNA序列中具有“G”而其它动物具有“T”的 基因组中的位置。如本文所用,术语“在严格条件下杂交”和“严格杂交条件”优选是指其中“探针” 与其靶标序列以比与其它序列可检测的更大程度杂交(例如,至少比背景高5倍)的条件。 严格条件是靶标序列依赖性的,且会根据多核苷酸的结构而有差异。通过控制杂交和/或 洗涤条件的严格性,可以鉴定出与探针100%互补的靶标序列(同源探测)。替代性地,可以 对严格条件进行调节以允许序列中一定程度的错配从而可检测到较低程度的相似性(异 源探测)。通常,严格条件是其中盐浓度在7.0 8.3的pH下小于约1.5M Na离子、通常为约 0. OlM 1. OM Na离子浓度(或其它离子)且温度对于短探针(例如,10 50个核苷酸) 至少为30°C而对于长探针(例如,大于50个核苷酸)至少为60°C的条件。也可以以添加如 甲酰胺等去稳定剂来调节严格性。低严格条件的实例包括用30% 35%甲酰胺、IM NaCl, 1% SDS(十二烷基硫酸钠)的缓冲溶液在37°C杂交以及在50°C 55°C的2XSSC(20XSSC =3. 0MNaCl/0. 3M柠檬酸三钠)中洗涤。中等严格条件的实例包括在40% 45%甲酰胺、 IM NaClU% SDS中于37°C杂交以及在55°C 60°C的0. 5XSSC IXSSC中洗涤。高严 格条件的实例包括在50%甲酰胺、IM NaClU % SDS中于37°C杂交以及在60°C 65°C的 0. IXSSC中洗涤。杂交持续时间一般小于约24小时,通常为约4小时 约12小时。特异性通常是杂交后洗涤的函数,关键因素在于最终洗涤溶液的离子强度和 温度。对于DNA-DNA杂交物而言,热熔点(Tm)可以由Meinkoth和Wahl (1984) Anal. Biochem. 138 :267_284 的以下等式估算:Tm = 81. 5°C +16. 6 (IogM) +0. 41(GC% )_0· 61 (甲 酰胺% )"500/L ;其中M是单价阳离子的摩尔浓度,6(%是DNA中鸟嘌呤和胞嘧啶核苷酸的 百分比,甲酰胺%是杂交溶液中甲酰胺的百分比,而L是以碱基对计的杂交物长度。Tm是 50%的互补靶标序列与完美匹配的探针(在所限定的离子强度和pH下)杂交时的温度。每
的错配使Tm下降约1°C;因而,可以调节Tm、杂交条件和/或洗涤条件来与所需同一性的 序列进行杂交。例如,如果寻求具有90%同一性的序列,则可以使Tm减小10°C。通常,将 严格条件选择为在限定的离子强度和PH下比特定序列及其互补物的Tm低约5°C。然而,高度严格条件可以利用在低于热熔点(1^11、21、31或41时的杂交和/ 或洗涤;中等严格条件可以利用在低于热熔点(Tm)6°C、7°C、8°C、9°C或10°C时的杂交和/ 或洗涤;低严格条件可以利用在低于热熔点00111、121、131、141、151或201时的杂 交和/或洗涤。使用上述等式、杂交和洗涤条件和所需Tm,本领域技术人员应该理解,已固 有地描述了杂交严格性和/或洗涤溶液的变化。如果所需错配程度导致低于45°C (水 溶液)或32°C (甲酰胺溶液),优选增加SSC浓度以便可以使用更高的温度。核酸杂交的 详尽指弓丨可见于 Ti jssen (1993) Laboratory Techniques inBiochemistry and Molecular
9Biology—Hybridization with Nucleic Acid Probes,第 I 部分,第 2 章(Elsevier, N. Y.);和 Ausubel 等编著,(1995) Current Protocolsin Molecular Biology,第 2 章 (Greene Publishing and Wiley-Interscience,NewYork)中。也参见 Sambrook 等,(1989) Molecular Cloning :A Laboratory Manual(第 2 片反,Cold Spring Harbor Laboratory Press,Plainview, N· Y·)。如本文所用,术语“标记育种值(MBV) ”和“预测标记育种值(PMBV) ”分别是指基 于动物的基因型的就生产力性状或适合度性状而言的动物遗传传递能力的估计。如本文所用,术语“全基因组分析”优选是指在高标记密度(即约1标记/cM)的 整个基因组的QTL定位过程和处在与QTL的种群范围连锁不平衡的标记物的检测。
如本文所用,术语“全基因组选择(WGS) ”优选是指基于基因组范围的标记辅助选 择(MAS)过程,其中以中等至较高的密度(例如,约1标记/IcM 1标记/5cM)跨越整个 基因组、或以中等至较高的密度跨越QTL区、或者与QTL直接相邻或将其侧包围的标记解释 了极大部分的控制两种以上性状的遗传变异。如本文所用,术语“相互作用效应”优选是指第一标记的预测表型效果根据第二标 记的等位基因状态的改变。例如,如果SNPl在SNP2为A时对于阳性等位基因关联具有10 的效果估计值,而SNPl在SNP2为T时对于阳性等位基因关联具有5的效果估计值,则10 5的效果估计值变化将被认为是相互作用效应。基于标记的相互作用效应必须涉及至少两 个标记。如本文所用,术语“上位相互作用,,优选是指基因的等位基因之间的相互作用,例 如,当一个基因的作用被一个或数个独立分类(但可能相连)的基因修饰的时候。
具体实施例方式本发明的各个实施方式提供了评估在动物基因组中的一个以上位置处的动物 (尤其是乳畜)的基因型的方法。本发明的这些实施方式的各方面提供了包括确定在包含 单核苷酸多态性(SNP)的一个以上位置(基因座)处的动物基因组序列的方法。具体而 言,本发明提供了通过确定对于选自表1和3所述SNP的一个以上SNP中的每一个而言针 对SNP的两个以上等位基因中何者存在来评估动物基因型的方法。在这些实施方式的优选方面,对动物基因型进行评估以确定对于选自表1和3所 述SNP的10个以上SNP而言存在哪个等位基因。此外,针对对应于2个、10个、100个、200 个、500个或1000个以上的SNP(其中至少两个描述于表1和3中)的位置确定动物基因 型。在本发明的某些实施方式中,两个SNP之间的相互作用被用于分析动物的基因型。在本实施方式的其它方面,就至少已显示出与生产力和/或适合度相关的一个以 上SNP(与这些性状相关的SNP列表见表1)而言分析动物的基因型。此外,本发明的实施方 式提供了用于对2个以上、10个以上、10个以上、50个以上、100个以上、200个以上或500 个以上或者1000个以上的SNP进行基因分型的方法,其中所述SNP中的至少一个已被确定 为与如表1所述的生产力或适合度性状显著相关。本发明的各方面还提供了全基因组分析和全基因组选择(WGS)(即为基于基因组 范围的标记辅助选择(MAS))。本发明的该实施方式的各个方面提供了其中针对所分析的标 记物以中等至较高密度跨越动物的整个基因组的全基因组分析或WGS。即,采用平均以至少约1次/1厘摩 1次/5厘摩出现的标记来分析动物基因组。而且,本发明确定在包括2 个以上、10个以上、10个以上、50个以上、100个以上、200个以上、500个以上或1000个以 上的标记的用于进行全基因组分析或WGS的标记中,至少一个标记选自表1和3所述的标 记。在该实施方式的优选方面,所述标记可以与适合度或生产力性状相关,或者可以与适合 度和生产力性状两者均相关。在本发明的任何实施方式中,SNP基因座处的基因组序列可以通过与本发明相容 的任何方法来确定。合适的方法是本领域技术人员公知的,并且包括但不限于直接测序、 通过合成测序、引物延伸、基质辅助激光解吸/离子化-时间飞行(MALDI-T0F)质谱、聚合 酶链式反应-限制性片段长度多态性、微阵列/多重阵列系统(例如,可获自Affymetrix, Santa Clara, California的那些微阵列/多重阵列系统)和等位基因特异性杂交。本发明的其它实施方式提供了用于根 据动物的生产力或适合度预测值来分配动 物用于后续应用(例如,用作销售用于肉品或乳品目的的公畜或母畜)的方法。本发明的 该实施方式的各个方面包括针对选自表1和3所述的SNP的至少两个SNP确定至少两个动 物基因型(针对两个以上SNP确定动物基因型的方法如上所述)。因此,可以基于一个以 上、2个以上、10个以上、10个以上、50个以上、100个以上、300个以上、500个以上或1000 个以上的SNP处的动物基因型来确定动物的使用分配。动物的分配还可以包括对至少两个 SNP之间的相互作用效应的分析。本发明提供了其中唯一进行的分析是对表1和3所述SNP的基因型的分析的实施 方式。其它实施方式提供了其中将本文所公开的SNP分析与任何其它所需类型的基因组分 析或表型分析(例如,除本发明所公开的那些遗传标记以外的其它任何遗传标记的分析) 结合的方法。而且,所分析的SNP可以选自仅与生产力相关、仅与适合度相关的那些SNP,或 者可以对选自适合度和生产力的任何所需组合的SNP进行分析。与各种性状相关的SNP列 于表1中。根据本发明的这些实施方式的各个方面,一旦已经对所选SNP确定了动物的基因 序列,就对该信息进行评估以确定对于至少两个所选SNP所存在的SNP等位基因。优选的 是,对于所有已确定的SNP评估动物的等物基因互补物。最后,基于动物对于两个以上的所 评估的SNP位置的基因型来分配动物的使用。优选的是,考虑到动物在每个所评估的SNP 处的基因型而进行分配,但其分配可以基于所评估的SNP的任何一个或多个亚组。根据本发明的这些实施方式的各个方面,一旦已经对所选SNP确定了动物的基因 序列,就对该信息进行评估以确定对于至少两个所选SNP所存在的SNP等位基因。优选的 是,对于所有已确定的SNP评估动物的等物基因互补物。进行SNP的等位基因取向分析,且 分析结果优选包括与至少一个相互作用效应有关的信息。最后,基于动物对于两个以上的 所评估的SNP位置的基因型来分配动物的使用。优选的是,考虑到动物在每个所评估的SNP 处的基因型而进行分配,但其分配可以基于所评估的SNP的任何一个或多个亚组。可以基于任何合适标准进行分配。对于任何SNP而言,可以根据等位基因之一是 否与所需特征相关/关联或是否与不需要的特征相关来进行决定。此外,该决定可以优选 包括与多个标记之间的相互作用效应相关的信息。该决定往往取决于育种或畜群管理目 标。可以通过任何合适的方法来确定与所需表型特征相关的等位基因。这些相关性的确定 方法是本领域内公知的;而且,这些方法的使用的各方面通常描述于下文“实施例”中。
可能与本发明的SNP相关的表型性状包括但不限于适合度性状和生产力性状。适 合度性状包括但不限于妊娠率(PR)、子系妊娠率(DPR)、生产寿命(PL)、体细胞计数(SCC) 和体细胞评分(SCS)。生产力性状包括但不限于总乳产率、乳脂百分比、乳脂产率、乳蛋白 百分比、乳蛋白产率、终生总产量、挤奶速度和泌乳持续性。根据本发明该实施方式的各个方面,动物的使用分配可以对具有所需基因型的动 物施加阳性选择(例如,针对生产力性状选择具有所需基因型的动物)、阴性选择具有不需 要的基因型的动物(例如,将具有不需要的基因型的动物从畜群中剔除)或这些方法的任 意组合。根据本 发明的该实施方式的优选方面,经鉴定为具有与所需基因型相关的SNP等 位基因的动物被分配用于与该表型相一致的应用(例如,基于与适合度阳性相关的表型而 分配用于育种)。替代性地,没有与所需基因型阳性相关的SNP基因型的动物不被分配用于 与那些具有与该性状的阳性相关性的动物相同的应用。本发明的其它实施方式提供了用于选择潜在亲本动物(即分配用于育种)以改善 潜在子代中的适合度和/或生产力的方法。本发明的该实施方式的各个方面包括针对选自 表1和3所述的SNP的至少两个SNP确定至少两个动物基因型。此外,对于是否和如何将 动物用作潜在亲本动物的决定可以基于该动物在包括表1和3所述SNP中的至少一个的两 个以上、2个以上、10个以上、50个以上、100个以上、300个以上或500个以上的SNP处的基 因型。而且,如同其它的使用分配类型那样,本发明的这些实施方式的各个方面提供了其中 唯一进行的分析是对动物针对表1和3所述的两个以上SNP进行基因分型的方法。这些实 施方式的其它方面提供了其中将本文所公开的两个以上的SNP分析与任何其它所需基因 组分析或表型分析(例如,除本发明公开的那些遗传标记物以外的其它任何遗传标记物的 分析)组合的方法。而且,所分析的SNP均可选自仅与适合度性状相关或仅与生产力性状 相关的那些SNP。相反地,可以对选自这些性状或其它性状的任何所需组合的SNP进行分 析。根据本发明的这些实施方式的各个方面,一旦所选SNP的位点处的动物基因序列 已被确定,就对该信息进行评估以确定对于至少两个所选SNP所存在的SNP等位基因。优 选对所有测序SNP的动物等物基因互补物进行评估。另外,对动物的等位基因互补物进行 分析并将其与动物后代会表达两个以上的表型性状的概率相关联。最后,基于对于所评估 的两个以上SNP位置的动物基因型和动物可将所需基因型/等位基因传给其后代的概率来 将动物分配用于育种应用。优选的是,考虑到所评估的每个SNP的动物基因型处的动物基 因型来进行育种分配。然而,动物的育种分配可以基于所评估的SNP的任何一个或多个亚 组。育种分配可以基于任何合适的标准进行。例如,可以进行育种分配以便增加增强 种群中单个特定期望特征优于其它特征(例如,增加的适合度,甚至特异性地降低作为适 合度的一部分的体细胞评分(SCS))的概率;替代性地,可以进行选择以便基于性状组合使 总产量一般性地最大化。选定的分配取决于育种目标。属于适合度内的子范畴特别包括 子代妊娠率(DPR)、生产寿命(PL)和体细胞评分。属于生产力的子范畴特别包括乳脂百 分比、乳脂产率、总乳产率、乳蛋白百分比和总乳蛋白。本发明的其它实施方式提供了生产后代动物的方法。根据本发明该实施方式的各 个方面,用于生产后代的动物是那些已根据本发明的任何实施方式分配用于育种的动物。使用动物来生产后代的本领域技术人员可以进行必要的分析,或者替代性地,生产后代的 本领域技术人员可以获得已经由本领域其它技术人员分析的动物。后代可以通过任何适当 方法生产,所述方法包括但不限于(i)天然育种,( )人工授精,(iii)体外受精(IVF)或 (iv)从动物收集精液/精子和/或至少两个卵子并让其分别与来自第二动物的卵子或精液 /精子接触以通过任何方式产生孕体。根据本发明该实施方式的优选方面,通过包括天然育种的方法来产生后代。在 该实施方式的其它方面,通过包括使用标准人工授精(Al)、体外受精、多排卵胚胎抑制 (MOET)或其任意组合的方法来生产后代。本发明的其它实施方式提供了包括分配动物用于育种目的并从该动物收集/分 离遗传材料的方法其中遗传材料包括但不限于精液、精子、卵子、受精卵、血液、组织、血 清、DNA 禾口 RNA。可以理解,本发明所提供的方法和信息的最高效和有效的应用采用计算机程序和 /或包括全部或一部分的本发明中公开的序列的可电子登入的数据库。于是,本发明的各 个实施方式提供了包括全部或一部分的对应于表1和3所述的至少两个SNP的序列的数据 库。在这些实施方式的优选方面,所述数据库包括表1和3中所述的1个以上、5个以上、10 个以上、20个以上、50个以上或基本所有的SNP。
此外还可以理解,本发明所提供的方法和信息的有效分析和应用将采用自动基因 分型;特别是当评估大量标记时(例如,100个)。可以使用包括但不限于使用微阵列的本 领域内已知的任何合适方法来进行这种基因分型。本发明的其它实施方式提供了其中通过两种以上的计算机可执行程序来登入两 个以上的SNP序列数据库的方法。这类方法包括但不限于通过程序来使用数据库以分析 SNP与表型性状或其它用户限定的性状(例如,使用两种以上的如基因表达水平、蛋白表达 水平或化学概况等度量测定的性状)之间的相关性,和用于分配动物用于育种或售卖的程序。本发明的其它实施方式提供了包括从已被分配用于育种的动物收集遗传材料的 方法。其中,所述动物已通过作为本发明一部分公开的任何方法而分配用于育种。本发明的其它实施方式提供了用于确定样品中存在何种SNP等位基因的诊断试 剂盒或其它诊断装置;其中所述SNP选自表1和3所述的SNP。在本发明的该实施方式的 各个方面,所述试剂盒或装置提供了有助于决定是否存在对应于所述SNP的核酸的试剂/ 仪器。这类试剂盒或装置还可以有助于确定所存在的SNP等位基因。在本发明的该实施方 式的某些方面,所述试剂盒或装置包含适用于DNA扩增(例如,通过聚合酶链式反应)的至 少两个核酸寡核苷酸。在本发明的其它方面,所述试剂盒或装置包含能在严格条件下与表 1和3中所述的至少两个SNP处的至少两个等位基因特异性杂交的纯化核酸片段。在本发明的该实施方式的特别优选方面,所述试剂盒或装置包含能够确定样品中 所存在的表1和3所述的两个以上SNP的等位基因的至少两个核酸阵列(例如,DNA微阵 列)。本发明的该实施方式的优选方面提供了能够针对两个以上的SNP同时确定样品中 所存在的等位基因的DNA微阵列。优选的是,所述DNA微阵列能够针对10个以上、50个以 上、100个以上、200个以上、500个以上或1000个以上的SNP确定样品中所存在的SNP等 位基因。这类阵列的制备方法是本领域技术人员已知的,且这类阵列可商购(例如,来自Affymetrix, Santa Clara,California) 0与表中所述的任何SNP由等位基因关联的适合度和/或生产力的遗传标记可以通 过本领域技术人员已知的任何适合方法进行鉴定。例如,可以使用对于表中所述任何SNP 序列特异的探针来筛选基因组库。通过这种方式,可以鉴定出包含至少该序列的一部分的 克隆体,然后可以确定多达300k碱基(300kilobases)的3’和/或5’侧翼染色体序列。通 过这种方式,可鉴定出与表中所述SNP有等位基因关联的遗传标记。本发明的其它实施方式提供了用于鉴定可能与表型变异相关的基因的方法。根据 这些实施方式的各个方面,可以通过本领域技术人员公知的方法来确定与特定表型变异相 关的SNP的染色体位置。一旦确定了染色体位置,就可以对疑似参与确定该表型的基因进 行分析。这类基因可以通过对该染色体的相邻部分进行测序或通过与人类遗传图谱(或其 它物种的已知遗传图谱)的类似部分进行比较而鉴定出来。保守基因簇存在的早期实例在 Womack(1987)中进行了综述,其中观察到定位至一个物种中的相同染色体的基因定位至其 它紧密相关物种中的相 同染色体。随着定位图分辨率的改善,发表了对保守染色体区内的 基因结合和顺序的保留的报道(例如,Grosz等,1992)。更近期以来,大规模放射杂交体定 位和BAC序列已经产生了人类与牛基因组之间(Everts-van der Wind等,2005)、人类基因 组与猪基因组之间(Yasue等,2006)以及脊椎动物基因组当中(Demars等,2006)的染色体 规模的比较定位预测。本发明的其它实施方式提供了用于鉴定作为两个以上的定量性状基因座(QTL) 的挤出的因果突变的方法。本发明的该实施方式的各个方面提供了对处在与表1和3所述 的两个以上SNP的等位基因关联中的QTL的鉴定。一旦这些SNP被鉴定出,本领域熟练技 术人员就能够鉴定处在临近这些SNP的位置的突变。此外,本领域技术人员能鉴定位于所 鉴定的SNP临近位置处的基因并评估这些基因以便选择有可能含有所述因果突变的那些 基因。一旦这些基因得到鉴定,就可以分析这些基因和周围序列所存在的突变,从而鉴定所 述因果突变。此外,一旦已将与表型变异相关的基因鉴定出,就能通过研究相互作用效应来改 善分析的准确性。在QTL中不存在相互作用效应时,可以利用单个QTL的边际效应来进行 更快的遗传改良。一般而言,可以估计各个等位基因或基因型的育种值并将所估计的育种 值与动物的多基因育种值联合用于作出育种决定。在存在相互作用效应时,由来自多个QTL的多态性构成的单体型的真育种值不同 于在每个QTL处的单个多态性的育种值的总和。因此,设计用于不存在非等位基因相互作 用的情况的上述方法不是最理想的。替代性地,应该估计单体型或基因型配制的育种值以 进行遗传改良的优化。使用单体型的种群频率来估计单体型的育种值。在存在种群范围的连锁不平衡 时,单体型的频率不同于对应等位基因频率的产物。在这种情况下,更适当的是使用单体型 频率以用于育种值估计。在育种程序中适当使用相互作用的其它益处来自单体型的真育种值与对应等位 基因的育种值之和的差异。差异的大小由相互作用的幅度和相互作用的QTL之间的种群范 围连锁不平衡的程度决定。相互作用效应还可以用于产生遗传性优异的杂交育种或杂交动物以用于更高效的商业生产。举例而言,假设基因型A1A2B1B2是最佳基因型且优于基因型A1A2和B1B2的育 种值(和基因型值)的总和。利用它的一种方式是用基因型A1A1B1B1和A2A2B2B2分别创建 两系。这两系可以来自不同的品种以创建一个理想的杂交育种,或者来自现存品种群内以 创建理想的杂交种。从这两系创建的杂交育种或杂交种都会具有基因型A1A2B1B2,从而提高 了商业生产效率。相互作用效应也可以用在计算机交配程序内以产生遗传性优异的子代以用于更 高效的商业生产。举例而言,假设基因型A1A2B1B2是最佳基因型并且优于基因型A1A2和B1B2 的育种值(和基因型值)的总和。利用它的一种方式是鉴定出具有基因型A1A1B1B1和A2A2B2B2 的母牛和公牛。当在交配程序中将潜在配偶排序后,在计算估计的潜在子代的育种值时也 可以包括相互作用效应。例如,对于具有A1A1B1B1的个体,具有A2A2B2B2基因型的潜在配偶 从有利相互作用而言将具有额外的配种值。当然,可以将这一思路扩展用于具有有利或不 利相互作用的多组基因座之间的多重相互作用。由于在正常人工授精应用中管理如此量的 信息将会极为困难,因而可以使用计算机配种来管理和优化配种。如上所述(参见第15页第20行-25行),可以在现存育种群内创建两个不同亚系 以便通过使这两个亚系杂交来创建理想杂交种,从而所有商用子代都具有基因型A1A2B1B2, 这提高了商业生产效率。然而,优化用于使多重相互作用的相互作用时期最大化的亚系的 创建可能非常复杂。一个解决方案是使用计算机交配来创建理想的亚系以用于优化杂交种 的生产中的最终使用。根据不同性状的最终商业价值,可以创建数个亚系来优化相互作用 效应以用于不同的育种目标。
实施例本发明包括了以下实施例以展示本发明的一般实施方式。本领域技术人员应该理 解,下文实施例中公开的技术代表了本发明人所发现的在本发明的实践中很好地起作用的 技术,因而可以认为其构成了本发明的优选实施方式。然而,根据本公开,本领域技术人员 应该理解,在不背离本发明的情况下可以在所公开的具体实施方式
中进行许多变化而仍然 获得相似的或类似的结果。根据本公开,本文公开和要求的所有组合物和方法可以在不进行不必要的实验的 情况下制备和执行。尽管已经就优选实施方式而言对本发明的组合物和方法进行了说明, 然而对于本领域技术人员显而易见的是,可以在不背离本发明的概念和范围的情况下应用 各种变化。实施例1 确定遗传标记与表型性状之间的关联基于基因组范围的基因基础定量性状(定量性状基因座QTL)的同时发现和精细 定位需要密集覆盖整个基因组的遗传标记。如本实施例中所述,从具有在牛基因组中的此 前估计位置的微卫星(microsatellite)标记和单核苷酸多态性(SNP)标记、以及从具有在 牛基因组中的基于与人类序列的同源性和人类/牛比较定位图的推断位置的SNP标记构 建了全基因组的密集覆盖的标记定位图。开发了作为CRIMAP软件(Green等,Washington UniversitySchool of Medicine, St. Louis, 1990)的扩展的新连锁定位软件包以使得能 够在血统明确的家畜群中的基因组范围上进行更有效的密集分布的标记的定位(Liu和 Grosz, Abstract C014 ;Grapes 等,Abstract W244 ;2006 Proceedings ofthe XIV Plant and Animal Genome Conference, www. intl-pag. org)。新连锁定位工具建立于 CRIMAP 中编程的基本定位原则上以通过较大系谱的配分、染色体指派的自动化和两点连锁分析以及 将子定位图合并为完整染色体来提高效率。所得的全基因组发现图(WGDM)包括6,966个 标记和长度为3,290cM的定位图并且平均定位图密度为2. 18标记/cM。标记之间的平均间 隔为0. 47cM且最大间隔为7. ScM0该定位图为有助于乳牛中的生产力和适合度变异的QTL 的全基因组分析和精细定位提供了基础。发现和定位种群用于发现和定位种群的系统可以采取许多形式。用于确定种群范围的标记/QTL 关联的最有效策略包括在允许对非遗传效应的解释且包含有关于受测个体的系谱的信息 的设计中收集具有表型测定的感兴趣的个体的较大且遗传多样性的样品。在本实施例中, 使用了遵循孙代设计(Weller等,1990)的后代群来发现和定位QTL 来自荷斯坦种的种群 各有平均具有6. 1个基因分型的雄性子代的529只公畜,且每个雄性子代平均具有4216个 带有产奶数据的雌性子代。从约3,200只荷斯坦公牛和来 自其它产乳品种的约350只公牛 收集DNA样品;代表多个公畜和祖父代公畜家系。表型分析受到评估的产乳性状包括如乳产量(“MILK” )(磅)、脂肪产量(“FAT”)(磅)、 脂肪百分比(“FATPCT”)(% )、生产寿命(“PL”)(月)、体细胞评分(“SCS”)(Log)、子代 妊娠率("DPR") (% )、蛋白产量(“PR0T”)(磅)、蛋白百分比(“PR0TPCT”)(% )和净价 值(net merit)( “匪”)(美元)等传统性状。这些性状是受性别限制的,这是因为在雄性 动物上无法测定个体表型。相反,定义为PTA (预测传递能力)的这些性状的遗传价值使用 所有近亲的表型来估计。大多数产乳公牛是用相当大数量的雌性子代(例如,> 50)测试 过的后代,且其PTA估计值比个体乳牛表型数据通常更加准确或更准确得多。对于美国荷 斯坦种群的传统产乳性状的遗传评估每季度由USDA进行。性状、遗传评估步骤和评估中所 用遗传参数的详细说明可见于USDA AIPL网站(www. aipl. arsusda. gov)。重要的是应注意 至丨J,本实施例中评估的产乳性状不是独立的FAT和PROT分别是MILK和FATPCT、以及MILK 和PR0TPCT的复合性状。匪是基于蛋白产量、脂肪产量、生产寿命、体细胞评分、子代妊娠 率、产犊难度和数类性状而计算的指标性状。蛋白产量和脂肪产量共同占> 50%的匪,而 乳产量、脂肪含量和蛋白含量的值由蛋白产量和脂肪产量来说明。从2005年11月公布于AIPL网站的USDA评估下载了带有后代测试数据的所有公 牛的PTA数据。使用以下两个模型来分析PTA数据Yij = SjPTAdij[等式 2]Yi = μ +β ! (SPTA) i+PTAdi [等式 3]其中Yi (YiJ)是第i只公牛的PTA(第i只公畜的第j个子代的PTA) ;Si是第i只 公畜的效应;(SPTA) i是整个样本的第i只公牛的公畜PTA ; μ是种群平均值;PTAdi (PTAdij) 是残余公牛ΡΤΑ。等式2称作公畜模型,其中将公畜作为固定因子进行拟合。在所有美国荷斯坦 后代受测公牛中,相当大量的公畜仅有非常少量的后代受测子代(例如,某些仅有一个子 代),在这些情况中将公畜作为固定因子拟合是显然不合需要的。公知的是,在前几十年中 美国荷斯坦畜群已经在传统产乳性状上得到了稳定和快速的遗传进步,这暗示着公畜的效 应可能部分地通过拟合公牛的出生年份来得到解释。对于具有少于10个后代受测子代的公畜,在等式2中用子代的出生年份替代公畜。等式3称作SPTA模型,其中将公畜的PTA 拟合为协变量。使用线性回归来估计残余PTA (PTAdi或PTAdij)。SNP-性状关联分析
在本实例中,在上述发现种群中使用基于个体有序基因型的概率的统计分析进行 连锁不平衡(LD)定位,所述概率是在所观测标记基因型的条件下估计的。第一步是在祖父 代公畜的标记基因型数据和子代标记基因型数据的条件下估计在所有连锁标记处的公畜 有序基因型概率。随着系谱的大小和复杂性以及连锁标记的数目的增加,确切计算很快在 计算上变得无法实现。例如,当公畜具有k个连锁杂合基因座时,对于所有连锁基因座总共 存在2k个有序基因型。使用基于似然比(likelihood ratio)测试开发的逐步程序来估计 在所有连锁标记处的公畜有序基因型。如下在侧翼信息化标记的条件下估计感兴趣的基因座处的有序基因型的概率PiHsikH μ\Μ) = ;^工户佴力仙丨肘”八丑诚付观旧幼扎“肘^等式幻
a b其中P (HsaHdb IM)是在所观测的基因型数据M的条件下在所有连锁基因座处具有一 对单体型(或有序基因型)HsaHdbW公畜的概率,P(HsikHdlk|HsaHdb,M)是在所有连锁基因座处 的公畜有序基因型HsaHdb和所观测基因型数据M的条件下具有在感兴趣的基因座处的有序 基因型HsikHdlk的子代的概率。为了确定单体型概率与性状表型之间的关联,通过设定染色体间距的最大长度以 及所包括的标记的最小数目和最大数目来定义各个染色体上相邻(和/或非相邻)标记的 单体型。显而易见,必须设定相似的参数来形成或定义用于单体型评估的标记基因座的组。 通过采用以下模型的回归法评估了经预调节的性状表型与单体型(或单体型对,另称为有 序基因型)之间的关联PTAdk = ΣΑ 7^)+ [等式 5]
iPTAdk =尸(付观)+ Q [等式 6]P k = Σ 凡 Wd ) + PiHdik )] + [等式 7]PTAdk = ΧβJP(HsikH耿)+ P(HsjkHdik)] + ek [等式 8]
i其中,PTAdk是在公畜模型下的等式3中定义的第k只公牛的预调节PTA,且其可 在SPTA模型下用等式3中定义的PTAdi替代,而ek是残余;P (Hsik)和P (Hdik)是作为单体 型i的个体k的父系单体型和母系单体型的概率;P (HsikHdik)是具有能用等式4估计的父系 单体型i和母系单体型j的个体k的概率;所有β对应于回归系数。等式5、6、7和8分别 被设计来模拟父系单体型、母系单体型、加合性单体型和基因型效应。使用最小二乘法来估计单体型或单体型对在表型性状上的效应,并用常规F测试 来测试该效应的显著性。基于每个半同胞家系内的表型置换(20,000)进行置换检验以估 计I型误差率(P值)。实施例2 多个遗传标记之间的相互作用效应的分析来自候诜基因的SNP聚类主要由于较小的有效种群大小和较强的诜择的原因, 在动物种群中来自紧密相连的SNP的等位基因通常是相关的(例如,Farnir等,2000 ;Du等,2007)。显然,如果两个SNP处在完美LD中,它们与感兴趣的性状的关联以及与其感 兴趣的性状上的其它SNP的相互作用都将相似,这不会提供多少额外的统计证据。因此, 有用的是在对单一基因处的多个SNP进行基因分型时将来自相同候选基因的SNP聚类 (clustering)。件状表型预调节该研究集中与传统产乳件状,包括乳产量(“MILK”)(磅)、脂 肪产量(“FAT”)(磅)、脂肪百分比(“FATPCT”)(% )、生产寿命(“PL”)(月)、体细胞 评分(“SCS”)(Log)、子代妊娠率(“DPR”)(%)、蛋白产量(“PR0T”)(磅)、蛋白百分比 (“PR0TPCT”)(% )和净价值(“匪”)(美元)。这些性状是受性别限制的,这是因为在雄 性动物上无法测定个体表型。相反,定义为PTA (预测传递能力)的这些性状的遗传价值使 用所有近亲的表型来估计。大多数产乳公牛是用相当大数量的雌性子代(例如,> 50)测 试过的后代,且其PTA估计值比个体乳牛表型数据通常更加准确或更准确得多。对于美国 荷斯坦种群的传统产乳性状的遗传评估每季度由USDA进行。性状、遗传评估步骤和评估中 所用遗传参数的详细说明可见于USDA AIPL网站(http://aipl. arsusda. gov)。重要的是 应注意到,本实施例中评估的产乳性状不是独立的FAT和PROT分别是MILK和FATPCT、以 及MILK和PR0TPCT的复合性状。匪是基于蛋白产量、脂肪产量、生产寿命、体细胞评分、子 代妊娠率、产犊难度和数类性状而计算的指标性状。从公布于AIPL网站的2007 年2月USDA评估下载了带有后代测试数据的所有公 牛的PTA数据。使用以下两个模型来分析PTA数据Yij = S^PTAdij[等式 9]Yi = μ + β (SPTA) ^PTAdi [等式 10]其中yi (YiJ)是第i只公牛的PTA (第i只公畜的第j个子代的PTA) ;Si是第i只 公畜的效应;(SPTA) i是整个样本的第i只公牛的公畜PTA ; μ是种群平均值;PTAdi (PTAdij) 是残余公牛ΡΤΑ。等式9称作公畜模型,其中将公畜作为固定因子进行拟合。在所有美国荷斯坦 后代受测公牛中,相当大量的公畜仅有非常少量的后代受测子代(例如,某些仅有一个子 代),在这些情况中将公畜作为固定因子拟合是显然不合需要的。公知的是,在前几十年中 美国荷斯坦畜群已经在传统产乳性状上得到了稳定和快速的遗传进步,这暗示着公畜的效 应可以部分地通过拟合公牛的出生年份来得到解释。对于具有少于10个后代受测子代的 公畜,在等式9中用子代的出生年份替代公畜。等式10称作SPTA模型,其中将公畜的PTA 拟合为协变量。使用SAS PROC GLM法来估计残余PTA (PTAdi或PTAdu)并将其用于本研究 的进一步候选基因分析中。候诜基因相互作用分析使用以下线性模型分析了每个产乳性状的SNP与残余 PTA的关联PTAdj =2 Sm2Ah + A [等式 11]
j=l k=l k=l其中,PTAdi是在公畜模型下的等式10中定义的第i只公牛的预调节PTA,且能被 SPTA模型下的等式9中定义的PTAdi替代;ngj是在SNPj(j = 1,2)处的无序基因型的数目; ei是残余效应;β k是基因型指示物Iijk的效应,S kh是第1个SNP处的基因型指示物Iilk与 第2个SNP处的基因型指示物Ii2h之间的相互作用效应;且基因型指示物Iijk被定义为— 如果基因型是第j个SNP处的k‘ — {θ否则[等式 12]总体分析由两步组成。首先使用所有由USDA评估的公牛对原始PTA数据进行预 调节(等式9和10),然后使用等式11来分析经预调节的PTA以进行SNP与性状之间的统 计关联。等式9和11的组合以及等式10和11的组合分别称为公畜模型和SPTA模型。该分析的结果如表1中所示。实施例3 使用单核苷酸多态性(SNP)改善子代性状为了改善种群对于选定的性状的平均遗传价值,可以在选择 育种动物时使用与该 性状显著相关的两个以上的标记。在每个发现的基因座的情形中,在具有有利QTL等位基 因的种群范围LD中使用拥有标记等位基因(或多个标记等位基因的单体型)的动物将增 加用于育种的动物的育种值、随时间推移增加该QTL等位基因在种群中的频率并由此增加 该种群对于该性状的平均遗传价值。可以将这一增加的遗传价值散布至商业种群以完全实 现价值。例如,后代测试方案能通过将标记用于筛选幼年公牛而极大改善了其遗传进步速 率或分级(graduation)成功率。通常,后代测试程序会使用系谱信息和近亲的表现来以约 0. 5的准确性选择幼年公牛作为候选者进入该程序。然而,通过添加标记信息,可以以高得 多的准确性来筛选和选择幼公牛。在该实施例中,可以采用处在与QTL的连锁不平衡中的 基因组范围标记组来筛选来自潜在公牛母亲及其雄性子代的DNA样本,并可以收缩具有最 佳标记概况图的公牛母亲候选者以用于与特定公牛交配。如果采用超数排卵和胚胎移植 (ET),则每个公牛母亲每次冲洗步骤都能产生一组5 10个子代。然后可以将标记组再次 用于选择最佳雄性子代作为候选者以用于后代测试程序。如果使用基因组范围标记,则据 估计标记选择的准确性能达到最高0. 85 (Meuwissen等,2001)。这一额外准确性能被用来 极大改善进入后代测试程序的候选者的遗传价值并由此增加将可销售的经后代测试的公 牛成功分级的概率。这一信息还能被用于通过减少受测幼年公牛候选者的数量同时维持相 同的成功分级者的数量来减少程序成本。在极端情况下,可以使用非常准确的标记育种值 (MBV)在根本无需后代测试的情况下将来自幼年公畜的精液直接销售。出于现在可以将幼 犊从青春期而不是4. 5 5岁时开始销售,可以将世代间隔减少超过一半且获益率能增加 多达68. 3% (Schrooten等,2004)。随着对后代测试的需求的消除,人工授精工业的遗传改 良成本将大大改善(Schaeffer,2006)。在一个替代性实例中,可以维持集中的或分散的牛遗传核心(GN)种群来生产用 于后代测试或基于MBV直接销售的幼年公牛。假设将前10% 15%的雌性用作超数排卵和 胚胎抑制(MOET)方案中的ET供体,可以预测1000只乳牛的GN畜群每年会产生大约3000 个子代。然而,标记能改变MOET方案和体外胚胎制备的有效性。此前已据证实,MOET核心 方案从额外遗传收益的角度而言是有前途的,但对核心畜群以及幼年动物的有限信息的操 作成本已限制了广泛的采用。但采用标记信息时,可以比以前更准确得多地选择幼犊从而 导致世代间隔的极大减小和遗传响应速率的提高。这对于MOET核心中却方案尤其正确,因 为此前全同胞的育种值会完全相同,但采用标记信息可以在寿命早期鉴定出最佳全同胞。 标记信息还能帮助限制近交,这是因为更少的选择压力被放在系谱信息上而更多的选择压 力在个体标记信息上。早期研究(Meuwissen和van Arendonk,1992)发现,当在核心畜群情况下采用标记时具有高达26%额外遗传收益的优势;然而,常规后代测试的益处要少得
^^ ο连同MAS,雌性选择也能成为遗传改良的重要来源,特别是如果标记解释了显著 量的遗传变异的话。通过在植入前对胚胎的标记测试可以获得更高的效率(Bredbacka, 2001)。这将使得能够在胚胎上产生相当大的选择从而具有可以在植入之前弃去较差标记 概况的胚胎并减少接受者成本。这还可增加核心畜群的成本有效性,因为胚胎预选择将使 得能用较小的核心畜群获得等同的进步。替代性地,这在公牛进入后代测试之前提供了进 一步的预选择机会并且据预测遗传响应速率比常规后代测试要快上高达31% (Schrooten 等,2004)。使用SNP来估计育种值和在GN中进行选择的第一步是从将成为候选者的所有子 代收集DNA,所述候选者将用于选择作为GN中的种畜或其它商业种群中的种畜(在本实施 例中,每年在GN中产生3,000个子代)。一种方法是在出生后不久从每只牛犊获取少量耳 组织、毛发样本或血液置于标记(条纹码标记)的试管中。可以在动物达到育种年龄以前将 从这些组织提取的DNA用于测试基本无限数量的SNP标记并可将结果包括在选择决定中。
用于将确定为处在具有有价值的QTL等位基因的种群范围LD(参见实施例1)中 的标记(或标记单体型)并入选择决定的一种方法是基于经典定量遗传学和选择指标理论 (Falconer 和 Mackay,1996 ;Dekkers 和 Chakraborty,2001)。为了估计标记在用于选择的 靶标种群中的效果,可以在将标记拟合为固定效应或作为协变量(等位基因拷贝数上的表 型回归)时用混合动物模型来分析具有对感兴趣的性状的表型测定值的动物的随机样本。 可以使用来自任一个标记效应拟合方法的结果来推导等位基因取代效应,和相应地推导标 记的育种值α i = q[a+d(q_p)][等式 13]α2 = -p[a+d(q-p)][等式 14]α = a+d(q-p)[等式 15]gA1A1 = 2 ( α[等式 16]gA1A2 = ( !) + (α 2)[等式 17]gA2A2 = 2 ( α 2)[等式 18]其中,α工和α 2分别是等位基因1和2的平均效应;α是等位基因取代的平均效 应;P和q分别是等位基因种群中的频率;a和d分别是加合性效应和显性效应;gA1A1、gA1A2 和gA2A2分别是具有标记基因型A1A1、A1A2和A2A2的动物的(标记)育种值。动物的总性 状育种值是对于所考虑的每个标记(或单体型)的育种值与残余多基因育种值之和EBVij = Egj +[等式 19]其中,EBVij是第i只动物的估计性状育种值,Σ I是从j = 1到j = η相加的标 记育种值(其中N是受考虑的标记(单体型)的总数),而Oi是拟合标记基因型后的第i只 动物的多基因育种值。可以将这些方法容易地扩展以估计对于多重性状的选择候选者的育种值,对于每 个性状的育种值包括来自多个标记(单体型)的信息,均处在选择指标理论的背景和设定 每个性状的相对重要性的特定育种目标之内。也存在其它方法用于在估计多个性状的育种值时对标记信息进行优化,这些方法包括负责标记和QTL之间的重组的随机模型(例如, Fernando和Grossman,1989)和对在全基因组选择中所有发现的标记信息的潜在性包括 (Meuwissen等,Genetics 2001)。通过这些方法中的任何一种可以将本文报道的已被确定 处在具有有价值的QTL等位基因的种群范围LD中的标记用于在乳品工业中提供更高的选 择准确性、更大的遗传改良速率和更大的价值积累。实施例4 使用具有相互作用效应的多个SNP改良子代性状
为了说明相互作用效应在育种程序中的使用,考虑在两个双等位基因QTL (由A和 B表示)处的两个因果突变。令A1和A2以及B1和B2分别为QTL A和B的两个等位基因。 模拟两种相互作用和主要效应的一种方式是拟合所有基因型配置的效应Yi = Σ β (AtAj ;BsBk) I (AtAj ;BsBk) + + Si [等式 20]其中 表示多基因随机效应;(AtAj ;BsBk)表示由A和B处的基因型构成的基因型 配置;β (AtAj ;BsBk)是基因型配置(AtAj ;BsBk)的回归系数;I (AtAj ;BsBk)是如下定义的指标 函数
_6]- J如果細,;柳[等式叫等式[20]可以用于检测和利用相互作用效应。等式20中的基因型配置(AtAj ; BsBk)的效应可以被拟合为固定效应或随机效应。由来自每个QTL的一个等位基因组成的单体型的育种值可以使用下式进行计算α (AiBj) = β (AiA1 ;BjB1) f (A1B1) + β (AiA1 ;BjB2) f (A1B2)[等式 22]+β (AiA2 ;BjB1) f (A2B1) + β (AiA2 ;BjB2) f (A2B2)其中,f (AkBs) (k,s = 1,2)表示单体型AkBs的频率。应该注意,f (AkBs)不等于在 种群范围的连锁不平衡存在时的对应等位基因频率的产物。具有(AiAj ;BkBs)基因型配置的动物的育种值可以如下计算BV (AiAj ;BkBs) = 2 [p (AiBk) α (AiBk)+ρ (AiBs) α (AiBs)[等式 23]+ρ (AjBk) α (AjBk) +ρ (AjBs) α (AjBs)]其中,P(AiBj)是由该动物产生的具有配子单体型的配子的概率。应该注意,所有可 能的单体型的概率之和等于1,且在基因型配置在两个基因座处均为杂合的情况下P(AiBj) 的值是QTLA和B之间的重组分数的函数。为了进一步解释连锁效应,考虑具有A1B1A2B2基 因型的动物(即由单体型A1B1和A2B2组成)。该动物的四种不同单体型的概率可以如下计 算ρ (A1B1) = P (A2B2) = 0. 5 (1_ θ ΑΒ)[等式 24]禾口ρ (A1B2) = ρ (A2B1) = 0. 5 θ ΑΒ[等式 25]其中,θ ΑΒ表示基因座A和B之间的重组分数。可以以与常规多基因育种值相同的方式将基因型配置的育种值用于遗传改良目 的。应该注意,可以使用各种统计模型来估计相互作用效应。还应注意,可以将上述步骤轻易扩展用于具有多个等位基因和/或多个基因座的情形(例如,通过在等式20中包括 所有可能的基因型配置)。实施例5:SNP的鉴定如果核酸序列包含至少20个连续的包含表1和3以及序列表所述的多态性和/或 与之相邻的核苷酸,则该核酸序列含有本发明的SNP。替代性地,在其中较短的连续核苷酸 序列在牛基因组中是独特的情况下,可以通过包含表1和3以及序列表所述的多态性或与 之相邻的较短的连续核苷酸片段来鉴定本发明的SNP。通常,SNP位点的特征在于其中包含 有多态位点(polymorphic site)的共有序列、多态位点的位置和多态位点处的各种等位基 因。“共有序列”是指构建为在比对的序列簇的每个核苷酸位置处一致的DNA序列。这些簇 通常用于鉴定基因座的等位基因中的SNP和得失位(Indel)(插入/缺失)多态性。共有 序列可以基于基因座处的DNA链,并且使用简并代码来描述基因座中每个SNP等位基因的 任意一个的核苷酸碱基或者两个SNP等位基因(IUPAC代码M代表A或C ;R代表A或G ;W 代表A或T ;S 代表C或G ;Y代表C或T ;Κ代表G或T ;V代表A或C或G ;H代表A或C或 T ;D代表A或G或T ;B代表C或G或T ;N代表A或C或G或T ;此处采用的其它代码包括 I代表“_”或A ;0代表“_”或C ;E代表“_”或G ;L代表“_”或T ;其中“_”是指缺失)。因 此,尽管共有序列可能不是实际DNA序列的拷贝,但共有序列可用于准确地设计用于基因 座中的实际多态性的引物和探针。这些SNP具有如下核酸序列所述核酸序列具有与包含所述多态性或与之相 邻的动物DNA片段的任一条链中相同数目的核苷酸的序列的至少90%的序列同一性 (identity)、更优选为至少95%的序列同一性、甚至对于某些等位基因至少98%且在某些 情况下至少99%的序列同一性。这种动物DNA片段的一条链的核苷酸序列可见于由SEQ ID NO :1 SEQ ID N0:175构成的组中的序列。通过多态性的真实特性可以理解,对于某些等 位基因而言,在多态位点自身处不存在同一性。因此,可以对排除于多态性序列之外的序列 确定序列同一性。每个基因座中的多态性如表1和3中所述。下文显示了彼此匹配的公共牛SNP的实例经确定,SNP ss38333809与ss38333810相同,这是因为来自各序列的41个碱基 (多态位点处于中间)与另一个完全匹配(匹配长度=41,同一性=100% )。ss38333809 :tcttacacatcaggagatagytccgaggtggatttctacaaι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι Iss38333810 :tcttacacatcaggagatagytccgaggtggatttctacaass38333809 是 SEQ ID NO :172,ss38333810 是 SEQ ID NO 173经确定,SNP ss38333809与ss38334335相同,这是因为来自各序列的41个碱基 (多态位点处于中间)与另一个除一个碱基外均匹配(匹配长度=41,同一性=97% )。ss38333809 :tcttacacatcaggagatagytccgaggtggatttctacaaι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι ι Iss38334335 :tcttacacatcaggagatggytccgaggtggatttctacaass38333809 是 SEQ ID NO :174,SS38334335 是 SEQ ID NO 175实施例6 对生产性状的定量和遗传评估可以通过测定每次挤奶时或仅在一定时间间隔时的乳牛的奶和乳组成来对生产性状进行定量。在USDA产量评估中,产乳数据由乳牛牛群改良协会(DHIA)使用ICAR认可 方法进行收集。遗传评估包括采用已知公畜且初次产犊在I960年以后的所有乳牛和出生 年在1950以后的谱系。少于350天的泌乳期被延长至305天。针对产犊时畜龄、产犊月份、 每日挤奶次数、此前开放天数和不均勻变化的影响来预先调节所有记录。使用单性状BLUP 重复性模型来进行遗传评估。该模型包括管理组(畜群X年X季外加注册状态)、产次 (parity) X畜龄的固定效果和永久环境和公畜互动对畜群的随机效果。每年评估和发布4 次PTA(2月、5月、8月和11月)。相对于5年逐步基础(即作为与2000年出生的所有乳牛 的平均值的差异)来计算PTA。对于具有有着有效泌乳记录的10个雌性子代的公牛,发布 公牛PTA以便估计雌性子代的表现。
实施例7.对雌性子代(乳牛)和公畜的PTA的繁殖性状的定量对如产犊容易性(CE)、死产发生率(SB)和子代妊娠率(DPR)等繁殖能力的定量和 遗传评估。产犊容易性测定特定乳牛(雌性子代)容易地产犊的能力。CE由场主在1 5 的规模上进行评分,1意味着未遇到问题或未观察到的分娩,而5意味着极其困难。公畜的 CE PTA表达为初次分娩的子代母牛的难产百分比(% DBH),其中难产是被评为需要相当大 的外力或极为困难的那些分娩(5分体系中为4或5)。SB由场主在1 3的规模上进行评 分,1意味着牛犊出生时存活并且产后48小时仍存活,2意味着牛犊出生时死亡,而3表明 牛犊在出生时存活但在产后48小时内死亡。2和3的SB评分被合并为一个类别以用于评 估。公畜的SB PTA表达为子代母牛的死产百分比(% SBH),其中死产牛犊是被评为出生时 死亡或出生时存活但在出生48小时内死亡的那些牛犊(3分体系中为2或3)。妊娠率是开 放天数(产犊和成功育种之间的天数)的函数。Dra被定义为非妊娠乳牛(子代)在每个 21日周期中怀孕的百分比。DPRPTA为“1”表示来自该公畜的雌性子代比具有0的DPRPTA 的公牛在该发情周期中怀孕的容易性高出1%。实施例8 对生产寿命(PL)的定量和遗传评估生产寿命(PL)被定义为在自愿或非自愿剔除(因健康或繁殖力问题)而移 除或死亡之前乳牛在产乳畜群中保留的时长。PL通常以天数、月数或从初次产犊至 该乳牛离开畜群(因死亡、剔除或出于非乳用目的销售)当日的产乳天数(DIM)来测 定。由于某些乳牛在收集数据时仍然存活,将它们的记录进行推想(VanRaden,P.M.和 Ε. J. H. Klaaskate. 1993)或作为经删减处理(Ducrocq,1987)。针对PL的USDA遗传评估包 括在1960年以后初次产犊的所有乳牛(对于谱系而言出生于1950年以后)。考虑了在评 估之前至少3年出生、具有有效公畜ID和初次泌乳记录的乳牛。在7岁龄时认为PL完全。 对于因其仍然存活、或处于乳用目的销售或畜群中断测试而没有机会达到7岁龄的乳牛将 记录扩展。处于乳用目的销售或处于中断测试的畜群中的乳牛如果其有机会达到3岁龄则 得到扩展的记录;否则将其记录废弃。遗传评估方法是单性状BLUP动物模型。该统计模型 包括管理组(基于首次泌乳的畜群和出生日期)和畜群互动对公畜的效果。相对于5年逐 步基础(即作为与2000年出生的所有乳牛的平均PL的差异)来计算公畜的PL PTA。实施例9 对子代(乳牛)和公畜PTA中的体细胞评分的定量通过计算log2(SCC/100,000)+3来进行体细胞评分(SCS)定量,其中SCC是来自 乳牛(子代)的每毫升乳中的体细胞数。公畜的SCS PTA被表达为从为零的SCS PTA的偏 差。
实施例10 候选基因内的新型SNP相关性的发现动物样品和基因分型。从USDA AIPL网站(http://aipl. arsusda. gov)下载 具有NAAB代码的共3145只荷斯坦乳牛以形成用于本研究的资源种群。将来自10个候 选基因(瘦素、poulFl、κ酪蛋白、骨桥蛋白、β 2-肾上腺素能受体、生长激素受体、蛋白 酶抑制剂、抗乳腺癌蛋白、甘油二酯酰基转移酶)的共22个SNP(单核苷酸多态性)用 ABI Taqman平台进行内部基因分型或利用各种化学方法进行外部基因分型(Genaissance Pharmaceuticals,Inc.,New Haven, CT)0本研究中所用的所有SNP都具有两个等位基因,从而对于每个SNP产生总共3个 无序基因型(两个纯合子和一个杂合子)。如果对于次等位基因(minor allele)而言少 于300只公牛是纯合的,则可以将该次等位基因纯合子类与杂合子合并以形成复合基因型 (基因型iiij是指基因型ii和ij两者)或将其从分析中排除。因此,可以使用原始基因 型、复合基因型和在具有最少出现的基因型的公牛数小于300时将最少出现的基因型排除 的数据进行分析。
性状基因型预调节。受分析的性状包括乳产量(“MILK”)(磅)、脂肪产量(“FAT”) (磅)、脂肪百分比(“FATPCT”)(% )、生产寿命(“PL”)(月)、体细胞评分(“SCS”) (Log)、子代妊娠率(“DPR”)(% )、蛋白产量(“PR0T”)(磅)、蛋白百分比(“PR0TPCT”) (% )和净价值(“匪”)(美元)。这些性状是受性别限制的,并将这些性状的遗传价值定 义为PTA(预测传递能力)且使用所有近亲的基因型进行估计。评估中所用的性状、遗传评 估步骤和遗传参数的具体说明可见于USDA AIPL网站(http://aipl.arsusda.gov)。值得 注意的是,本研究中所评估的产乳性状并非独立性的。具有后代测试数据的所有公牛的PTA数据均下载自2005年11月发布于AIPL站 点的USDA评估。使用以下两个模型来分析PTA数据Yij = S^PTAdij[等式 26]Yi = μ + β ! (SPTA) i+PTAdi [等式 27]其中yi(yij)是第i只公牛的PTA(第i只公畜的第j只雄性子代的PTA) ;Si是 第i只公畜的效应;(SPTA)i是整个样本的第i只公牛的公畜PTA ; μ是种群平均值; PTAdi (PTAdij)是残余公牛 ΡΤΑ。等式26称作公畜模型,其中将公畜作为固定因子进行拟合。对于具有少于10个 后代受测子代的公畜,在等式26中用子代的出生年份替代公畜。等式27称作SPTA模型, 其中将公畜的PTA拟合为协变量。使用SAS PR0CGLM程序来估计残余PTA (PTAdi或PTAdij) 并将其用于本研究中的进一步候选基因分析。候选基因分析。使用以下线性模型来分析每个产乳性状的SNP和残余PTA之间的 相关性PTAdi = μ + β lXi+ei [等式 28]PTAdi = £ IikPk+e.[等式 29]
k=l其中,PTAdi是如在公畜模型下的等式26中定义的第i只公牛的预调节PTA,并且 可以由SPTA模型下的等式27中定义的PTAdi所替代;Xi是第i只公牛具有的特定SNP等 位基因的拷贝数,而日2是\的回归系数;ng是无序基因型的数目Wi是残余效应;而是基因型指示物Iik的效应,Iik定义如下
权利要求
一种根据每只动物针对生产力和/或适合度的预测标记育种值来分配一只或多只动物的用途的方法,所述方法包括a.评估一只或多只动物以确定每只动物在一个或多个基因座处的基因型;其中至少一个基因座包含具有至少两个等位基因变异体且选自表1所述单核苷酸多态性(SNP)的SNP;b.在选自表1所述SNP的一个或多个SNP处分析所确定的至少一个受评估动物的基因型以确定存在的等位基因变异体;c.将所述等位基因变异体与表1所述的至少一个生产力性状或适合度性状相关联;d.根据所确定的基因型分配所述动物的用途。
2.如权利要求1所述的方法,其中所述分析还包括对表1所述的至少一种相互作用效 应的分析。
3.如权利要求1或2所述的方法,其中在含有选自表1所述SNP的SNP的两个以上基 因座处对所述动物基因型进行评估。
4.如权利要求1或2所述的方法,其中在10个以上基因座处对所述动物基因型进行评估。
5.如权利要求1或2所述的方法,其中在100个以上基因座处对所述动物基因型进行 评估。
6.如权利要求1或2所述的方法,其中在200个以上基因座处对所述动物基因型进行 评估。
7.如权利要求1或2所述的方法,其中将评估的SNP与选自妊娠率(PR)、雌性子代妊 娠率(DPR)、生产寿命(PL)、体细胞计数(SCC)和体细胞评分(SCS)的适合度性状相关联。
8.如权利要求1或2所述的方法,其中将评估的SNP与选自总乳产量、乳脂百分比、乳 脂产量、乳蛋白百分比、乳蛋白产量、终生总产量、产乳速度和泌乳持续性的生产力性状相 关联。
9.如权利要求1或2所述的方法,所述方法包括全基因组分析。
10.一种选择一只或多只育种用潜在亲本动物以改善潜在子代的适合度和/或生产力 的方法a.确定在至少一个基因组基因座处的至少一个潜在亲本动物的基因型;其中至少一 个基因座含有具有至少两个等位基因变异体并且选自表1所述单核苷酸多态性(SNP)的 SNP ;b.针对选自表1所述SNP的一个或多个SNP分析所确定的至少一个受评估动物的基因 型以确定存在的等位基因;c.将所鉴定的等位基因与适合度和/或生产力表型相联系;d.基于动物的基因型将至少一个动物分配用于育种用途。
11.如权利要求10所述的方法,其中所述分析包括对表1所述的相互作用效应的至少 一次评估。
12.如权利要求10或11所述的方法,其中在含有选自表1所述SNP的SNP的五个以上 基因座处对潜在亲本动物的基因型进行评估。
13.如权利要求10或11所述的方法,其中在10个以上基因座处对潜在亲本动物的基因型进行评估,所述10个以上基因座包括含有选自表1所述SNP的SNP的至少2个基因座。
14.如权利要求10所述的方法,其中在20个以上基因座处对潜在亲本动物的基因型进 行评估,所述20个以上基因座包括含有选自表1所述SNP的SNP的至少2个基因座。
15.如权利要求10或11所述的方法,其中选择所述潜在亲本动物以改善潜在子代的适^.FtF 口 /又O
16.如权利要求10或11所述的方法,其中选择所述潜在亲本动物以改善潜在子代的生产力。
17.如权利要求10或11所述的方法,所述方法包括全基因组分析。
18.—种生产后代动物的方法,所述方法包括a)对已根据权利要求1或2所述的方法被分配用于育种的至少一个潜在亲本动物进行鉴定;b)通过包括以下方法在内的方法从所分配的动物生产后代 i)天然育种; )人工授精;iii)体外受精;和/或iv)从动物收集精液/精子或至少两个卵子并通过任何方式将其分别与来自第二动物 的卵子或精液/精子接触以产生孕体。
19.如权利要求18所述的方法,所述方法包括通过天然育种生产后代。
20.如权利要求18所述的方法,所述方法包括通过人工授精、胚胎移植和/或体外受精 来生产子代。
21.如权利要求18所述的方法,其中在含有选自表1所述SNP的SNP的两个以上基因 座处对潜在亲本动物的基因型进行评估。
22.如权利要求18所述的方法,其中在含有选自表1所述SNP的SNP的五个以上基因 座处对潜在亲本动物的基因型进行评估。
23.如权利要求18所述的方法,其中在10个以上基因座处对潜在亲本动物的基因型进 行评估,所述10个以上基因座包括含有选自表1所述SNP的SNP的至少两个基因座。
24.如权利要求18所述的方法,其中在20个以上基因座处对潜在亲本动物的基因型进 行评估,所述20个以上基因座包括含有选自表1所述SNP的SNP的至少两个基因座。
25.如权利要求18所述的方法,其中选择所述潜在亲本动物以改善子代的适合度。
26.如权利要求18所述的方法,其中选择所述潜在亲本动物以改善子代的生产力。
27.如权利要求18 26中任一项所述的方法,所述方法还包括全基因组分析。
28.一种用于确定存在至少100个多态性的等位基因的核酸阵列;其中所述阵列包 含能在严格条件下与选自以下多态性的一个或多个多态性进行杂交的一个或多个核酸序 列a.表3和序列表中所述的多态性;和/或b.位于表3中所述的基因中的多态性。
29.如权利要求28所述的核酸阵列,其中所述阵列包含选自以下多态性的两个以上多 态性a.表3和序列表中所述的多态性;和/或b.位于表3中所述的基因中的多态性。
30.如权利要求29所述的核酸阵列,其中所述阵列包含选自以下多态性的五个以上多 态性a.表3和序列表中所述的多态性;和/或b.位于表3中所述的基因中的多态性。
31.一种评估在10个以上基因组基因座处的动物基因型的方法,其中至少一个基因座 包含选自表3和序列表中所述多态性的多态性。
32.如权利要求31所述的方法,其中在10个以上基因座处对动物基因型进行评估,其 中至少两个基因座包含选自表3和序列表中所述多态性的多态性。
33.如权利要求31所述的方法,其中在20个以上基因座处对动物基因型进行评估,其 中至少两个基因座包含选自表3和序列表中所述多态性的多态性。
34.如权利要求31 33中任一项所述的方法,所述方法包括全基因组分析。
全文摘要
本发明提供了用于改善包括产乳动物中的改良的适合度和生产力的期望动物性状的方法。本发明还提供了用于确定有关于适合度和/或生产力相关的多个标记的产乳动物基因型的方法。本发明还提供了用于选择或分配动物用于如后代测试或核心畜群育种等预定用途,用于潜在亲本动物用于育种和用于生产改良的后代动物的方法。上述方法中的每一种都可以通过并入多个SNP之间的相互作用效应来进一步改进。
文档编号A01K67/027GK101970688SQ200880115702
公开日2011年2月9日 申请日期2008年9月8日 优先权日2007年9月12日
发明者杜峰行, 爱德华·J·卡吉尔, 迈克尔·D·格罗斯, 迈克尔·D·路易斯 申请人:美国辉瑞有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1