鉴定期望的单倍型中外来等位基因的存在的方法与流程

文档序号:14953814发布日期:2018-07-17 23:08阅读:287来源:国知局

本专利申请要求2015年9月1日提交的美国临时申请号62/212,840以及2016年4月13日提交的62/321,942的优先权,其均在此通过引用以其整体并入本文。

发明领域

本公开涉及用于检测期望的单倍型中插入的目标等位基因的方法和试剂盒。

发明背景

自文明开始以来,家畜和其它动物就被人类所驯化。人类驯化动物的原因包括食物、衣服、保护、抵抗疾病和陪伴。已经开发出具有令人满意的性状,或缺乏不期望的或危险的性状的家畜的特殊品种。例如,牛因为许多原因而繁殖,包括肉类生产,皮革质量,顺从性以及甚至是侵略性(想到斗牛)。类似地,马已被培育成具有各种适用于特定用途的性状,包括大小和力量(驮马)、速度(纯种马)、耐力和耐热性(阿拉伯马(arabians))和一般安排、速度和抗寒(夸特马(quarterhorses))。类似地,在某种程度上,所有其它家畜动物都已“近亲配种”,以从亲本或祖先获得期望的性状或以排除不期望的性状。在每种情况下,动物的有性生殖需要亲本基因的混合使得来自亲本双方的许多性状都会赋予给后代。

根据定义,繁殖动物的所有方法都需要有性繁殖。在有性繁殖中,各自携带来自其母本和父本单组染色体的雄性和雌性性腺的二倍体配子发生细胞(gametogeniccell)(与所有其它细胞一样)经历减数分裂i中的减少(reduction)和分裂。在减数分裂i期间,可发生染色体加倍(4n)和同源染色体之间交换,导致每个染色体内新的遗传信息组。减数分裂i后面是两个细胞分裂阶段,导致各自携带独特的遗传信息组的四个单倍体配子。由于基因重组导致新的基因序列或基因组合,增加了多样性。

然而,家畜动物中,仔细培育数百年(如果不是数千年的话),增加的多样性是不期望的。期望的是该动物例示并维持其培育所针对的性状。例如,全世界有超过800种牛品种。有些牛是为适应特定气候而培育的,而大多数是为了特定农业用途而培育的,这包括牛奶生产和/或牛肉生产或用于征募(draft)目的。例如,herefords主要培育用于肉类,而荷斯坦牛(holstein)是主要的乳制品动物并且西门塔尔(simmental)牛育种用于肉类和乳制品目的。此外,此类品种也具有可预测的、非度量性状,诸如气质和生殖能力。可以理解的是,大多数家畜动物(包括马、绵羊、猪等)都类似地表达特定的性状,这些性状被认为是可靠的和期望的,并以排除不期望的性状,诸如攻击性或对不希望的疾病的易感性。

为了在动物中装入有益的性状,已经对家畜培育了数千年,以在单一品种中包含特别期望的性状。一般来说,动物品种是具有均匀外观(表型)、均一行为和/或将它们与其物种的其他动物区分开来并由选择性育种产生的其它特征的特定家养动物群。选择育种需要将具有期望的性状的个体与其它个体进行性交配,以育种“真的”期望性状以及作为整体的育种性状。在那些品种中育种出期望的品种和期望的性状的动物育种有一项长期以来确立的科学,要求进行近亲繁殖、同种异系交配(linebreeding)和异型杂交(outcrossing)。然而,在开发家畜的理想品种所需的许多世代中,尽管品种实际数量可能非常大,品种的实际遗传多样性已经大大降低。因此,对于任何特定品种而言,有效种群规模(ne)已经变得非常小。例如,hayes等人(公开的美国专利申请2014/0220575,在此以其整体并入)估计,在牛中,holstein-friesians的ne估计为50和100之间;瑞士褐牛(brownswiss)约为46;荷斯坦牛(holstein)为49和丹麦红牛(danishred)为47。在羊中,对于dorset-rarnboulliet-finnsheep杂交(cross)为35。猪具有稍高的ne,对于harmegnies估计为<200;85对于duroc/largewhite以及300对于长白猪(largewhite)。鸡显示出品种的相似的小的ne,如layers估计在91和123之间。

这种低遗传多样性意味着每个品种的物理特征都得到了充分认可并且在广泛使用的品种中发生不期望特征的机会非常低并且一般限于自发突变的发生。

因此,在各种家畜品种中引入新性状的能力是有限的和耗时的。例如,向期望的家养品种中引入新性状需要将具有期望的性状的动物与期望品种的高质量雌性杂交育种,选择期望品种的具有其杂交育种所针对的期望性状的表型上可接受的后代,并且在从异型杂交亲本除去所有其它性状的情况下将阳性后代与期望品种的进一步雄性或雌性进行回交以获得动物,该动物具有品种的所有特征但也包含期望的性状。因此,将新的性状引入有价值的品种花费许多代育种以将稳定引入的性状提供给动物,但缺少引入的物种的所有其它特性,并在有价值的品种的所有其它特性上培育出真的。

育种有价值的动物需要许多代的选择性育种来稳定地引入单一性状并且回交后代以提供动物,该动物在所有其它特征上与该品种公认的性状一致。因此,需要更简单的方式以在家畜动物中引入期望的性状和以测试那些动物以确定是否它们可以表达的新性状是有性生殖的结果或是由期望的家畜品种的基因型内特定基因所携带的特定性状的定向引入的结果。

最近,基因修饰和动物克隆的新技术已经提供了将特定基因或等位基因引入动物基因组的能力,如通过基因编辑(例如参见,重组股份有限公司(recombinetics,inc.)公开的美国专利申请2014033807、20140201857、20140041066、20130117870和20130090522,其各自通过引用以其整体并入本文)。这些技术允许将新性状直接引入有价值的动物品种的基因组而没有添加有害或不期望的性状至该品种的风险,并且在少于一代的动物中完成。

目前,有价值的家畜品种被列入品种登记册或试验册,其列出了每只动物的血统并可以追踪数代。该书面的登记册允许动物育种者识别有价值且多产的雌性和雄性血统(stock)和以鉴定和避免用不期望的动物的育种。然而,具有新型性状的已知品种的动物的呈现要求动物育种者鉴定新性状是如何引入的,如通过有计划的与已知品种杂交或与未知或不期望的动物的不曾预料到的性发生。因此,鉴定将帮助鉴定特定家畜品种中的新性状来源的技术和/或方法将是有帮助的。

发明概述

本发明公开提供了方法和试剂盒来鉴定遗传操作产品的动物以在家畜动物的目标基因座处引入外来或外源等位基因而维持宿主动物(hostanimal)的天然基因组。

因此,在一个示例性的实施方案中,本公开提供了鉴定动物的方法,所述动物具有在目标基因座处插入的目标等位基因并且在含有目标基因座的天然单倍型内具有遗传标记物。在各种实施方案中,本公开还包括使用southern杂交、原位杂交、pcr、基于阵列的分析、高分辨率熔解(hrm)分析、片段分析、桑格尔(sanger)片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)来鉴定外源等位基因。在各种示例性实施方案中,鉴定天然标志物包括使用southern杂交、原位杂交、pcr、基于阵列的分析、高分辨率熔解(hrm)分析、片段分析、桑格尔(sanger)片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)。在各种示例性实施方案中,标志物在目标基因座的500bp内。在各种其他示例性实施方案中,存在至少5种标志物。在其他示例性实施方案中,存在至少4种标志物、3种标志物或2种标志物。在其他示例性实施方案中,至少两种标志物侧接(flank)于目标基因座。在这些示例性实施方案中,通过检测天然单倍型内目标基因座处外源等位基因的存在,可以排除由于用另一动物育种而存在的外源等位基因,而天然单倍型内目标基因座处存在的外源等位基因在鉴定由遗传修饰产生的动物方面起决定性作用。

在又一示例性实施方案中,本公开提供了用于确定动物是否为性繁殖的产物或是否为遗传修饰的产物的试剂盒。在该示例性实施方案中,试剂盒包含针对已知单倍型的两个或多个探针和/或引物。另外,在该示例性实施例中,试剂盒还包括针对等位基因的一个或多个探针,该等位基因位于对单倍型是外来的目标基因座处。在各种示例性实施方案中,试剂盒还附带使用说明。在又一示例性实施方案中,试剂盒还含有在容器中。在又一示例性实施方案中,试剂盒还附带确定动物是否为性育种或遗传修饰的产物的试剂、安瓿或试管。在各种示例性实施方案中,试剂盒包含邮寄标签。

本公开的这些和其它特征和优点将被列出或将在下面的描述和所附权利要求中变得更加明显。这些特征和优点可以通过在所附权利要求中特别指出的手段和组合来实现和获得。此外,本公开的特征和优点可以通过本文公开的方法和技术的实践来了解,或者将从下面阐述的描述中显而易见。

附图简述

将参照以下附图详细描述根据本公开的组合物和方法的各种示例性实施例,其中:

图1,talen介导的无角(polled)渐渗。(a)将pc等位基因渐渗入荷斯坦(horned)细胞的策略。pc等位基因是具有10bp缺失(未显示)的212bp的串联重复序列(红色箭头)。开发了talen以特异性靶向horned等位基因(绿色垂直箭头),其可以通过使用pchdr质粒的同源重组来修复。描绘了b中使用的引物组。(b)具有pc的纯合或杂合渐渗的集落的代表性图像。由数字指示的三个引物组用于候选集落的阳性分类:组1,fl+rl;组2,f2+r2;和组3,fl+p(pc-特异性)。显示了使用阳性对照模板产生的扩增子(p,质粒模板,其含有引物f1和r1之间的序列验证的pc1,748-bp插入物;h,荷斯坦公牛基因组dna)。通过对fl+rl扩增子测序来确认pcr产物的身份。

图2的示意图说明了减数分裂重组过程中的交换。

图3的示意图说明了通过重组、自发突变或非减数分裂渐渗引入的等位基因的遗传鉴定。

发明详述

本公开提供了鉴定作为遗传操作的产品的动物的方法和试剂盒,以目标基因座处引入外来或外源等位基因而维持宿主动物(hostanimal)的天然基因组。

除非另有定义,本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。出于所有目的,本文特别提及的所有出版物和专利都通过引用并入,这包括描述和披露出版物中报道的可能与披露有关的化学品,仪器,统计分析和方法。本说明书中引用的所有参考文献都被认为是本领域技术水平的指示。本文中的任何内容都不应解释为承认本公开由于先前发明而无权先于这种公开。

必须注意的是,如本文和所附权利要求中所用,除非上下文另外明确指出,否则单数形式“一(a)”,“一个(an)”和“该(the)”包括复数形式。同样,术语“一(a)”(或“一个(an)”),“一个或多个(oneormore)”和“至少一个(atleastone)”在本文中可互换使用。还应注意的是,术语“包含”,“包括”,“由...表征”和“具有”可以互换使用。

如本文所用,“基因相加效应”意指可以从亲本传递给后代的平均个体基因效应。

如本文所用,“等位基因”意指基因的另一种形式。也可以将其认为是dna序列的变体。例如,如果动物具有bb特定基因的基因型,则b和b是等位基因。

“dna标志物”指可以测试与特定物理特性相关的特定dna变异。

“基因型”指动物的基因组成。

“基因分型(dna标志物测试)”指测试动物以确定其携带的特定基因测试的特定等位基因的过程。

“简单性状”指由单一基因携带的性状,诸如毛色和角状况以及一些疾病。

“复杂性状”指由多个基因控制的性状,诸如繁殖,生长和胴体。

“复杂等位基因”--在其内具有多于一个突变的编码区。这使得确定给定突变的效果变得更加困难,因为研究人员无法确定等位基因内哪个突变导致了该效应。

“拷贝数变异(cnv)”结构变异的形式—是基因组的dna的改变,这导致具有异常的细胞,或者(对于某些基因)dna的一个或多个区段的拷贝数的正常变化.cnv对应于在某些染色体上已被删除(比正常数量少)或重复(比正常数量多)的相对大的基因组区域。例如,通常具有a-b-c-d顺序的区段的染色体可能具有核酸(dna或rna)的a-b-c-“重复元件”模式,其在整个基因组的多个拷贝中出现。因为重复dna具有快速的重缔合动力学,它被首先检测到。

“定量变异”在连续集(continuum)上而非不连续的单元或类别上测量的变异(如人类的高度)。参见连续变异。特定特征的一系列表型的存在,区别在于程度而非明显的定性差异。

“纯合的”指对于单个基因具有两个相同等位基因的拷贝,如bb。

“杂合的”指具有单个基因的不同等位基因拷贝,如bb。

“基因座”指染色体上标志物或基因的特定位置。

“厘摩(cm)”测量遗传连锁的重组频率单位。它被定义为染色体位置之间的距离(也称为基因座或标志物),其中在单一世代中期望的平均居间染色体交换数为0.01。它通常用于推断染色体上的距离。然而,它不是一个真正的物理距离。

“染色体交换”(“交换(crossingover)”)是由个体从其母本和父本继承的同源染色体之间遗传物质的交换。每个个体具有二倍体组(两个同源染色体,如2n),各自从其母本和父本继承。减数分裂i期间,染色体加倍(4n)并且可能发生从母本和父本获得的染色体的同源区域之间的交换,导致每个染色体内的新的遗传信息集。减数分裂i之后是细胞分裂的两个阶段,导致四个各自携带独特的遗传信息集的单倍体配子。由于遗传重组导致新的基因序列或基因组合,增加了多样性。交换通常发生在同源染色体上的同源区域断裂并然后重新连接到其它染色体时。

“标志物辅助选择(mas)”指dna标志物信息用于协助作出管理决策的过程。

“标志物组(panel)”两种或更多种与特定性状相关的dna标志物的组合。

“非相加遗传效应”指诸如显性和上位性的效应。共显性是同一基因座处等位基因的相互作用,而上位性是不同基因座处等位基因的相互作用。

“核苷酸”指dna的结构成分,其包含四种碱基化学物质之一:腺嘌呤(a),胸腺嘧啶(t),鸟嘌呤(g)和胞嘧啶(c)。

“表型”指可以测量的动物的外观。表型受动物的基因组成和环境的影响。

“单核苷酸多态性(snp)”是dna序列中的单个核苷酸改变。

“单倍体基因型”或“单倍型”指连接的等位基因、基因座或dna多态性的组合从而在减数分裂过程中在显著比例的配子中共分离。单倍型的等位基因可能处于连锁不平衡(ld)中。

“连锁不平衡(ld)”是在不同基因座处的等位基因的非随机关联,即如果等位基因基于其个体等位基因频率进行独立地、随机地抽样,则不同基因座的等位基因之间的统计学关联的存在与预期的情况不同。如果在不同基因座的等位基因之间没有连锁不平衡,则称它们处于连锁平衡中。

术语“限制性片段长度多态性”或“rflp”指通过用一种或多种内切核酸酶限制性消化基因组dna或cdna产生的任何一种不同的dna片段长度,其中群体中个体之间的片段长度不同(vane)。

“渐渗”也称为“渐渗杂交”是指通过种间杂种与其亲本物种之一的反复回交,基因或等位基因(基因流)从一个物种运动到另一个物种的基因池。有目的的渐渗是一个长期的过程;在回交发生之前可能需要许多杂交世代。

“非减数分裂渐渗”经由将基因或等位基因引入二倍体(非配子)细胞中的遗传渐渗。非减数分裂渐渗不依赖有性生殖并且不需要回交并且,显著地,在单个世代中进行。在非减数分裂渐渗中,等位基因经由同源重组引入单倍型中。可以在基因组中要编辑的现有等位基因的位点处引入等位基因,或者可以在任何其它期望的位点处引入等位基因。

“转录激活剂样效应核酸酶(talen)”是通过将tal效应dna结合结构域与dna切割结构域融合而产生的人工限制酶。

如本文所用,“indel”是“插入”或“缺失”的缩写,指生物体中dna的修饰。

如本文所用,“遗传标志物”指在染色体上具有已知位置的基因/等位基因或dna序列。所述标志物可以是任何遗传标志物,如一个或多个等位基因、单倍型、单倍型类群(haplogroup)、基因座、定量性状基因座,或dna多态性[限制性片段长度多态性(rflp)、扩增片段长度多态性(aflp)、单核苷酸多态性(snp)、indels、短串联重复序列(str)、微卫星和小卫星]。方便地,标志物是snp或str,如微卫星和更优选地snp。优选地,在每个染色体区段内的标志物处于连锁不平衡。

如本文所用,术语“宿主动物”意指具有公认的动物物种或品种的天然遗传互补的动物。

如本文所用,“天然单倍型”或“天然基因组”意指选择作为不存在于宿主动物中的基因或等位基因的接受者的特定动物物种或品种的天然dna。

如本文所用,术语“遗传修饰”指使用生物技术直接操纵生物体的基因组。

如本文所用,术语“目标基因座”意指染色体上已知等位基因的特定位置。

如本文所用,术语“数量性状”指归类于离散类别的性状。数量性状以连续的变化范围出现,例如特定品种可给出的奶量或尾巴长度。一般来说,数量性性状由一大组基因控制。

如本文所用,术语“定性性状”用于指落入不同类别的性状。这些类别没有任何特定的顺序。一般来说,定性性状是单基因的,意味着性状受单一基因影响。例如,定性性状的例子包括血型和花色。

如本文所用,术语“数量性状基因座(qtl)”是与表型的变化(数量性状)相关的dna的区段(基因座)。

如本文所用,术语“克隆”意指无性生产基因相同的生物体。

“体细胞核移植”(“scnt”)是从体细胞和卵细胞中克隆可行胚胎的一种策略。该技术由以下组成:取出去核卵母细胞(卵细胞)并从体细胞(身体)植入供体细胞核。

如本文所用,“直系同源”指与进化相关物种中的基因具有相似功能的基因。直系同源物的鉴定有助于基因功能预测。在家畜的情况下,直系同源基因遍布整个动物界,并且在其它哺乳动物中发现的那些可能对转基因置换特别有用。这对于同一物种,品种或者谱系的动物尤为正确,其中物种定义为两个如此密切相关以至于能够通过有性生殖产生可育后代的动物;品种定义为具有均质表型,均质行为和其它定义动物与同一物种的其他动物的特征的特定家畜组;并且其中谱系定义为由祖先/后代关系连接的连续的家系(descent)系;一系列生物体、群体、细胞或基因。例如,家养的牛有来自古代的野牛的两种截然不同的谱系。一种谱系是中东野牛(aurochs)的驯化的后代,而第二种不同的谱系是印度次大陆上野牛的驯化的后代。

“基因分型”或“遗传测试”通常指在来自要检测的个体的样本中检测感兴趣的一个或多个标志物(如snp),并分析获得的结果以确定受试者的单倍型。从本文的公开内容显而易见的是,使用高通量系统来检测感兴趣的一个或多个标志物是一个示例性实施方案,所述高通量系统包含固体支持物,其基本由直接或间接连接至该固体支持物上的不同序列的核苷酸组成或具有所述核苷酸,其中不同序列的每个核酸包含源自代表当前群体的祖先或者建立者的多态性遗传标志物,并且更优选地,其中所述高通量系统包含足以代表当前群体基因组的标志物。基因分型的优选的样品包括核酸,如rna或基因组dna,并且优选为基因组dna。家畜动物品种可以通过评估其遗传标志物来容易地建立。

可以对家畜进行基因分型以鉴定各种遗传标志物。术语基因分型指通过使用生物测定确定个体的dna序列并比较其与其它个体序列或与参考序列来确定个体的遗传组成(基因型)的差异的方法。遗传标志物是在染色体上具有已知位置的已知的dna序列;它们始终通过育种传递,因此可以通过系谱或系统发育来追踪它们。遗传标记物可以是包含多个碱基的序列,或在已知位置处的单核苷酸多态性(snp)。家畜动物品种可以通过评估其遗传标志物容易地建立。已知许多标志物,并且有许多不同的测量技术,其试图将标志物与感兴趣的性状相关联,或为未来的育种或期望值的目的而建立动物遗传价值。

可以使用极小的组织样品进行动物的遗传检测,例如可以使用从待测动物的尾巴分离的毛囊。易于获取的样品的其它例子包括例如皮肤或体液或其提取物或其部分。例如,容易获取的体液包括例如全血、唾液、精液或尿液。示例性的全血部分选自下组:血沉棕黄层部分、可通过cohn的乙醇分级获得的部分ii+iii(e.j.cohnetal.,j.am.chem.soc,68:459(1946))、可通过cohn的乙醇分级获得的部分ii(e.j.cohnetal.,j.am.chem.soc,68:459(1946))、白蛋白部分、含免疫球蛋白的部分及其混合物。优选地,先前通过例如手术,或使用注射器或拭子从动物受试者分离或衍生来自动物的样品。

在另一个实施方案中,样品可以包含源自如上文所述的组织或器官的细胞或细胞提取物或其混合物。源自器官、组织或细胞的核酸制备物也是特别有用的。

样品可以在固体基质上制备用于组织学分析,或者可选地在合适的溶液中(例如如提取缓冲液或悬浮缓冲液中)制备,并且本公开显然延伸到测试如此制备的生物溶液。然而,在一个示例性的实施方案中,使用溶液中的样品,采用本公开的高通量系统。

在根据本公开的其它示例性实施方案中,可测试被认为是通过遗传操作产生的动物以确定该动物所展示的性状是否由于性繁殖所致或者所呈现的性状是否由遗传操作所致,随后克隆动物,例如通过scnt。

因此,本领域技术人员可设计探针和/或引物以确定表型或基因型性状的来源。本领域技术人员知道合适的探针或引物,即,能够特异性检测目标基因座上的标志物或外来等位基因的引物或探针,将与包含标志物或等位基因的要测试个体的基因组dna中的基因组区域特异性杂交。如本文所用,“选择性杂交”意指在发现靶多核苷酸在显著高于背景的水平与探针杂交的条件下使用用作探针的多核苷酸。背景杂交可以由于存在于例如筛选的基因组dna中的其它多核苷酸而发生。在该事件中,背景意味着由探针和非特异性dna之间的相互作用产生的信号水平,其为与靶dna观察到的特异性相互作用的强度的小于10倍,优选小于100倍。例如通过放射性标记探针(例如用32p)来测量相互作用的强度。

如本领域技术人员将知道的那样,探针或引物包含核酸,并且可由通常长达约100-300个核苷酸长度的合成寡核苷酸组成,并且在一些实施方案中由长达约50-100个核苷酸长度或由约8-100或8-50个核苷酸长度组成。例如,用于检测一个或多个snp的锁定核酸(lna)或蛋白质-核酸(pna)探针或分子信标通常长度至少约8至12个核苷酸。也可以使用长达几千个碱基长度的较长的核酸片段,例如来源于已用一种或多种限制性内切核酸酶剪切或消化的基因组dna。或者,探针/引物可以包含rna。然而,技术人员会立即明白,明确规定的界限之间的所有范围和值都是可以预期的,以下任何一个都可以作为上限或下限:10、50、100、120、130、150、200、250、300、350、400、450例如高达至少1000个核苷酸。

用于本公开的示例性探针或引物将与本文所述的高通量系统兼容。示例性的探针和引物将包含优选结合固相的锁定核酸(lna)或蛋白质-核酸(pna)探针或分子信标。例如,使用与固体支持物结合的lna或pna探针,其中探针各自包含snp并且足够的探针结合到固体支持物上以跨越要测试个体所属的物种的基因组。

探针或引物的数量将根据要筛选的基因座或qtl的数量(并且在全基因组筛选的情况下),要筛选的基因组的大小而变化。本领域技术人员可容易地确定此类参数,而无需过度实验。

探针或引物的特异性还可以取决于用于基因分型的杂交或扩增反应的形式。

在本公开的方法中使用的任何特定探针或引物的序列将取决于要筛选的基因座或qtl或其组合。在这方面,本公开通常可以应用于任何基因座或qtl的基因分型,或者任何数量的qtl或基因座的同时或序贯基因分型,包括全基因组基因分型。这种一般性不会减去(takeaway)或向下读到(readdownto)特定的基因座或qtl或其组合。本领域技术人员可以容易地确定探针/引物序列而无需过多的实验。

标准方法用于设计探针和/或引物,例如,如dveksler(编)(于:pcrprimer:alaboratorymanual,coldspringharbourlaboratories,ny,1995)所述。软件包也可公开用于设计用于各种测定的最佳探针和/或引物,例如可从美国马萨诸塞州剑桥的基因组研究中心获得的primer3。优选对探针和/或引物评估以确定不形成发夹、自我引发或形成引物二聚体(例如与在检测测定中使用的另一种探针或引物)的那些。此外,优选评估探针或引物(或其序列)以确定其从靶核酸变性的温度(即探针或引物的解链温度,或tm)。确定tm的方法在本领域中是已知的并且例如描述于santalucia,proc.natl.acad.sci.usa,95:1460-1465,1995或bresslaueretal.,proc.natl.acad.sci.usa,83:3746-3750,1986中。

对于lna或pna探针或分子信标,在一些示例性实施方案中,探针或分子信标长度至少约8至12个核苷酸,并且更为优选地,对于大致位于探针的中心的snp,从而促进选择性杂交和准确检测。

为了使用等位基因特异性pcr测定或连接酶链式反应测定来检测一个或多个snp,通常设计探针/引物使得3’末端核苷酸与snp的位点杂交。3’末端核苷酸可以与已知存在于snp位点的任何核苷酸互补。当互补核苷酸出现在探针/引物和多态性位点时,探针或引物的3’末端完全与感兴趣的标志物杂交,并促进例如pcr扩增或与另一种核酸连接。因此,与靶核酸完全杂交的探针或引物在测定中产生阳性结果。

对于引物延伸反应,通常将探针/引物设计为使其与特定感兴趣核苷酸(例如snp)相邻的区域特异性杂交。虽然探针或引物的特异性杂交可通过使用软件(例如blast)确定探针或引物与任何核酸的同源性程度来估计,探针或引物的特异性通常使用本领域已知的方法经验地确定。

生产/合成用于本公开内容的探针和/或引物的方法是本领域已知的。例如,在gait(ed)(in:oligonucleotidesynthesis:apracticalapproach,irlpress,oxford,1984)中描述了寡核苷酸合成;例如在nielsenetal.,j.chem.soc.perkintrans.,1:3423,1997;singhandwengel,chem.commun.1247,1998中描述了lna合成;并且例如在egholmetal.,am.chem.soc.,114:1895,1992;egholmetal.,nature,365:566,1993;以及orumetal.,nucl.acidsres.,21:5332,1993中描述了pna合成。

本领域已知许多方法用于检测样品中特定标志物的出现。

在一个示例性的实施方案中,使用探针或引物来检测标志物,所述探针或引物在中等严谨性下,并且优选地在高度严谨性下与来自个体的样品中的所述标志物杂交。如果探针或引物用合适的报道分子(例如化学发光标记、荧光标记、放射性标记、酶、半抗原,或独特寡核苷酸序列等)可检测地标记,则可通过确定报道分子的结合直接检测所述杂交。或者,可以通过进行扩增反应如聚合酶链式反应(pcr)或类似的形式并检测扩增的核酸来检测杂交的探针或引物。优选地,探针或引物结合固体支持物,例如在本公开的高通量系统中。

出于定义杂交中使用的严谨性水平的目的,本文中将低严谨性定义为在2-6xssc缓冲液,0.1%(w/v)sds于28℃或同等条件下进行的杂交和/或洗涤步骤。本文中将中等严谨性定义为在0.2-2xssc缓冲液,0.1%(w/v)sds于45℃至65℃的温度范围内或同等条件下进行的杂交和/或洗涤步骤。本文中将高严谨性定义为在0.1xssc缓冲液,0.1%(w/v)sds或更低盐浓度于至少65℃的温度或同等条件下进行的杂交和/或洗涤步骤。本文提及的特定严谨性水平包括使用本领域技术人员已知的除ssc以外的洗涤/杂交溶液的同等条件。

通常,通过降低ssc缓冲液的浓度和/或增加sds的浓度和/或增加杂交和/或洗涤的温度来增加严谨性。本领域技术人员将意识到,杂交和/或洗涤的条件可以根据用于支持样品dna的杂交基质的性质或所使用的杂交探针的类型而变化。

也可以使用逐渐更高的严谨性条件,其中严谨性从较低至较高的严谨性条件逐步增加。示例性的逐步的严谨性条件如下:2xssc/0.1%sds于约室温(杂交条件);0.2xssc/0.1%sds于约室温(低严谨性条件);0.2xssc/0.1%sds于约42℃(中度严谨性条件);和0.1xssc于约68℃(高严谨性条件)。只能使用这些条件之一进行洗涤,例如高严谨性条件,或可以使用每个条件,例如每个10-15分钟,以如上列出的顺序,重复列出的任何或全部步骤。然而,如上所述,取决于所涉及的特定杂交反应,最佳条件将会变化,并且可以凭经验确定。

例如,使用诸如聚合酶链式反应(pcr)、链置换扩增、连接酶链式反应、循环探针技术或dna微阵列芯片等方法来检测基因组或其表达产物的区域(单倍型)序列的修饰,诸如,例如,插入(例如,在目标基因座处引入外来等位基因)、缺失、颠换或转换。

pcr的方法是本领域已知的并且例如描述于dieffenbach(编)和dveksler(编)(于:pcrprimer:alaboratorymanual,coldspringharbourlaboratories,ny,1995)中。通常,对于pcr,两个包含至少约15个核苷酸,更优选至少20个核苷酸长度的非互补核酸引物分子与核酸模板分子的不同链杂交,并且酶促扩增模板的特异性核酸分子拷贝。可以使用电泳检测pcr产物,并使用与核酸结合的可检测标志物检测。或者,一个或多个寡核苷酸用可检测标志物(例如荧光团)标记,并且使用例如lightcycler(perkinelmer,wellesley,ma,usa)检测扩增产物。显然,本公开还包括定量形式的pcr,例如taqman测定。

链置换扩增(sda)利用寡核苷酸、dna聚合酶和限制性内切核酸酶来扩增靶序列。寡核苷酸与靶核酸杂交并且聚合酶用于产生该区域的拷贝。然后复制的核酸和靶核酸的双链体用特异性识别复制的核酸开始处序列的内切核酸酶产生切口。dna聚合酶识别带切口的dna并产生靶区域的另一个拷贝,同时取代先前产生的核酸。sda的优势在于它以等温格式发生,从而促进高通量自动分析。

连接酶反应(描述于例如ep320,308和美国专利号4,883,750中)使用至少两种寡核苷酸,所述寡核苷酸以使得它们相邻的方式与靶核酸结合。然后,使用连接酶来连接寡核苷酸。使用热循环,连接的寡核苷酸然后成为其他寡核苷酸的靶物。然后例如使用电泳或maldi-tof检测连接的片段。或者或另外,用可检测标志物标记一个或多个探针,从而促进快速检测。

循环探针技术使用包含能够与靶序列杂交的dna-rna-dna的嵌合合成探针。杂交到靶序列后,形成的rna-dna双链体是rnaseh的靶物,从而切割探针。然后使用例如电泳或maldi-tof来检测切割的探针。

用于检测snp的其它方法在本领域中是已知的,并且例如综述于landegrenetal,genomeresearch8:769-776,1998)中(通过引用以其整体并入本文)。

例如,通过用内切核酸酶消化dna并使用例如southern印迹(描述于ausubeletal(于:currentprotocolsinmolecularbiology.wileyinterscience,isbn047150338,1987)(通过引用以其整体并入本文)和sambrooketal(in:molecularcloning:molecularcloning:alaboratorymanual,coldspringharborlaboratories,newyork,thirdedition2001)(通过引用以其整体并入本文))检测感兴趣片段,检测了引入或改变作为限制性内切核酸酶识别序列的序列的snp。或者,使用上文所述的核酸扩增方法来扩增snp周围的区域。然后将扩增产物与内切核酸酶一起温育并且例如通过电泳、maldi-tof或pcr来检测任何产生的片段。

可以使用双脱氧链终止法或maxam-gilbert法来实现本公开的多态性序列的直接分析(参见sambrooketal.,molecularcloning,alaboratorymanual(2nded.,cshp,newyork1989);zyskindetal.,recombinantdnalaboratorymanual,(acad.press,1988)(通过引用以其整体并入本文)。例如,使用扩增反应(例如pcr)来扩增包含一个或多个标志物的基因组dna的区域,并纯化扩增产物后,扩增的核酸用于测序反应以确定感兴趣的snp的位点处一个或两个等位基因的序列。

或者,使用单链构象多态性(sscp)来检测一个或多个snp。sscp依赖于核酸中二级结构的形成以及这些二级结构的序列依赖性质。在这种分析的一种形式中,使用扩增方法(例如上面描述的方法)来扩增包含snp的核酸。然后变性、冷却扩增的核酸并使用例如非变性聚丙烯酰胺凝胶电泳、质谱法或液相色谱法(例如hplc或dhplc)来分析该扩增的核酸。包含不同序列的区域形成不同的二级结构,并因此通过例如凝胶和/或带电场以不同的速率迁移。显然,可以将可检测标志物结合到用于sscp分析的探针/引物中,以促进快速标志物检测。

或者,可使用例如质谱法或毛细管电泳来检测任何核苷酸变化。例如,将包含snp的来自测试样品的dna区域的扩增产物与来自snp位点处具有已知基因型的个体的扩增产物相混合。产物被变性并允许重新退火。当与完全退火的核酸相比时,snp位置处包含不同核苷酸的那些样品将不会与来自对照样品的核酸分子完全退火,从而改变核酸的电荷和/或构象。可使用例如质谱法来检测此类不正确的碱基配对。

等位基因特异性pcr(如例如liuetal,genomeresearch,7:389-398,1997中所述)(通过引用以其整体并入本文)也可用于确定snp的一个或其它等位基因的存在。设计了寡核苷酸,其中寡核苷酸的最3’碱基与感兴趣的snp的特定形式(即等位基因)杂交。在pcr反应过程中,寡核苷酸的3’末端不与不包含检测的snp的特定形式的靶序列杂交。因此,很少或没有产生pcr产物,这说明碱基,而非存在于寡核苷酸中的碱基存在于样品中的snp位点处。然后使用例如凝胶或毛细管电泳或质谱法来检测pcr产物。

引物延伸方法(例如描述于dieffenbach(编)和dveksler(编)(于:pcrprimer:alaboratorymanual,coldspringharbourlaboratories,ny,1995)中)也可用于检测snp。使用与邻近snp的核酸区域杂交的寡核苷酸。该寡核苷酸用于具有聚合酶和游离核苷酸二磷酸的引物延伸方案,该游离核苷酸二磷酸对应于在snp位点发生的任一或任何可能的碱基。优选地,用可检测的标志物(例如荧光团)标记核苷酸二磷酸。引物延伸后,例如使用尺寸排阻色谱法或电泳除去未结合的标记的核苷酸二磷酸,或使用例如碱性磷酸酶水解,并且检测了掺入该寡核苷酸的标记的核苷酸,这说明该碱基存在于snp的该位点处。或者或另外,如本文所例示,使用质谱法(例如maldi-tof)来检测引物延伸产物。

本公开扩展至引物延伸分析的高通量形式,如例如微测序(syvamenetal.,genomics9:341-342,1995)(通过引用以其整体并入)其中探针或引物或多个探针或引物固定在固体支持物(例如载玻片)上,使包含核酸的样品与探针或引物接触,进行引物延伸反应,其中用不同的可检测标志物标记每个游离核苷酸碱基a、c、g、t,并且通过确定与每个探针和/或引物结合的可检测标志物来确定一个或多个snp的存在或缺失。

荧光标记的锁核酸(lna)分子或荧光标记的蛋白质-核酸(pna)分子可用于检测snp(如simeonovandnikiforov,nucleicacidsresearch,30(17):1-5,2002中所述)。lna和pna分子以高亲和力与核酸(特别是dna)结合。与未与靶核酸杂交的探针相比,与lna或pna探针缀合的荧光团(特别是罗丹明或六氯荧光素)在探针与靶核酸杂交时以显著更高的水平发荧光。然而,即使当发生单核苷酸错配时,荧光增加的水平也不会增强到相同的水平。因此,例如在存在snp的情况下,样品中检测到的荧光程度指示lna或pna探针与靶核酸之间存在错配。优选地,荧光标记的lna或pna技术用于检测先前已经使用例如如上所述的扩增方法扩增的核酸中单碱基变化。

对于本领域技术人员显而易见的是,如drumetal.,clin.chem,45:1898-1905,1999(以其整体并入本文)所述,lna或pna检测技术适用于将lna或pna探针固定到固体支持物上的一个或多个标志物的高通量检测。

类似地,分子信标适用于在样品中或扩增产物中直接检测snp(参见例如mhlangandmalmberg,methods25:463-471,2001)(以其整体并入本文)。分子信标是具有茎环结构的单链核酸分子。环结构与感兴趣的snp周围的区域互补。茎结构通过在探针(环)的任一侧退火两个彼此互补的“臂”而形成。荧光部分与一个臂和一个猝灭部分结合,所述猝灭部分当分子信标未与结合到另一个臂的靶序列结合时抑制任何可检测的荧光。在环区域与其靶核酸结合后,臂被分开并且荧光是可检测的。然而,即使单碱基错配也显著改变样品中检测到的荧光水平。因此,通过检测到的荧光水平来确定snp位点处特定碱基的存在或缺失。

本公开还包括检测遗传标志物(例如独特序列、snp或外来等位基因)的其它方法,如例如微阵列(可从例如affymetrix商购获得,或例如描述于美国专利号6,468,743(以其整体并入本文)或haciaetal.,naturegenetics,14:441,1996)(以其整体并入本文))、测定(可从例如lifetechnologies购获得,并描述于livaketal.,naturegenetics,9:341-342,1995)(以其整体并入本文))、固相微测序(如描述于syvamenetal.,genomics,13:1008-1017,1992(通过引用以其整体并入本文))、具有fret的微测序(如描述于chenandkwok,nucleicacidsres.25:347-353,1997)(通过引用以其整体并入本文))或焦磷酸微测序(pyrominisequencing)(综述于landegrenetal.,genomeres.,8(8):769-776,1998)(通过引用以其整体并入本文))。

在其中多态性或标志物出现在编码rna的核酸区域中的那些情况下,使用如例如rt-pcr、nasba或tma(转录介导的扩增)的方法来检测所述多态性或标志物。

rt-pcr的方法在本领域中是已知的并例如描述于dieffenbach(编)和dveksler(编)(于:pcrprimer:alaboratorymanual,coldspringharbourlaboratories,ny,1995(通过引用以其整体并入本文)中。

tma或自我维持序列复制(3sr)的方法使用两个或更多个位于靶序列侧翼的寡核苷酸、rna聚合酶、rna酶h和逆转录酶。一个寡核苷酸(也包含rna聚合酶结合位点)与包含靶序列的rna分子杂交,并且逆转录酶产生该区域的cdna拷贝。rna酶h用于消化rna-dna复合物中的rna,并且第二寡核苷酸用于生产cdna的拷贝。然后用rna聚合酶生产cdna的rna拷贝并重复该过程。

nasba系统依靠三种酶(逆转录酶、rna酶h和rna聚合酶)的同时活性来选择性扩增靶mrna序列。使用与靶序列杂交的寡核苷酸,通过逆转录将mrna模板转录成cdna,并在其5’端包含rna聚合酶结合位点。用rna酶h消化模板rna并合成双链dna。rna聚合酶然后生产cdna的多个rna拷贝并重复该过程。

使用例如电泳和/或质谱可检测标志物的杂交和/或扩增。就此而言,扩增反应中使用的一种或多种探针/引物和/或一种或多种核苷酸可以用可检测标志物标记以促进标志物的快速检测,所述标志物例如荧光标记物(如cy5或cy3)或放射性同位素(如32p)。

或者,可以使用如美国专利号6,174,670中描述的熔解曲线分析法来连续监测核酸的扩增。此类方法适合于确定生物样品中可变剪接形式的水平。

本公开的方法可以使用全基因组测序或“微测序”方法鉴定snp处的核苷酸发生。个体的全基因组测序可在单个分析中鉴定所有snp基因型。微测序方法仅在“预先确定”的位点处确定单核苷酸的身份。此类方法在确定靶多核苷酸中多态性的存在和身份方面具有特别的实用性。此类微测序方法以及用于确定snp基因座处核苷酸发生的其它方法在boyce-jacino等人美国专利号6,294,336中讨论,通过引用并入本文。

微测序方法包括goelet,p.etal.(wo92/15712,通过引用并入本文)中公开的geneticbitanalysis法。另外,还描述了用于测定dna中多态性位点的引物引导的核苷酸引入程序(komheretal.,nucl.acids.res.17:7779-7784,1989;sokolov,nucl.acidsres.18:3671(1990);syvanenetal.,genomics8:684-692,1990;kuppuswamyetal.,proc.natl.acad.sci.(u.s.a.)88:1143-1147,1991;prezantetal.,hum.mutat.1:159-164,1992;ugozzolietal.,gata9:107-112,1992;nyrenetal.,anal.biochem.208:171-175,1993;wallace,wo89/10414;mundy,u.s.pat.no.4,656,127;cohenetal.,frenchpat.no.2,650,840;wo91/02087)。针对使用凝胶电泳分析序列时遇到的困难,开发了微测序的替代方法,例如macevicz,美国专利号5,002,867通过引用并入本文。boyce-jacinoetal.,美国专利号6,294,336提供了用于确定核酸分子(dna或rna)序列的固相测序方法,该方法通过利用在位点处选择性地结合多核苷酸靶的引物,其中snp是选择性结合靶物的最3’的核苷酸。oliphantetal.,suppl.biotechniques,june2002描述使用beadarraytm技术以确定snp的核苷酸发生,或者,snp的核苷酸发生可以通过用使用dnamassarray系统(sequenom,inc.,sandiego,calif.)来确定,其中所述系统组合了spectrochipstm、微流控、纳米分配(nanodispensing)、生物化学,和maldi-tofms(基质辅助激光解吸电离飞行时间质谱)。

特别有用的方法包括容易适应于高通量格式、多重格式或两者的方法。分析标志物(特别是snp)的高通量系统可以包括例如平台,诸如uhtsnp-ittm平台(orchidbiosciences,princeton,n.j.,usa)、massarraytm系统(sequenom,inc.,sandiego,calif.,usa)、整合的snp基因分型系统(illumina,sandiego,calif.,usa)、taqman.tm.(abi,fostercity,calif.,usa)、滚环扩增、荧光偏振、等等。通常,snp-ittm是3步引物延伸反应。第一步中,通过与捕获引物杂交(其提供第一水平的特异性)而从样品中分离目标多核苷酸。在第二步中,捕获引物从目标snp位点处的终止核苷酸三磷酸延伸,这提供第二水平的特异性。在第三步中,可以使用各种已知形式检测延伸的核苷酸三磷酸,包括:直接荧光、间接荧光、间接比色测定、质谱法、荧光偏振等。使用snpstreamtm仪器可以以自动格式在384孔格式中处理反应(orchidbiosciences,princeton,n.j.)。

基因型选择的高通量系统

本公开还提供了在具有小的有效群体大小的群体中用于基因型选择的高通量系统,在一些实施方案中,系统包含固体支持物,所述固体支持物基本上组成有或具有直接或间接与其结合的不同序列的核酸,其中不同序列的每个核酸包含源自代表当前种群的祖先或者建立者的多态性遗传标志物。

示例性高通量系统是杂交介质,例如微流控装置或均质测定介质。已知的多种微流控装置包括具有微通道的固体支持物(参见例如美国专利号5,304,487;5,110,745;5,681,484;和5,593,838)。在一个示例性的实施方案中,高通量系统包含snp芯片,该芯片包含其各自由包含snp的序列组成的10,000-100,000个寡核苷酸。这些杂交基质的每个适合用于确定与性状相关的标志物的存在或不存在。

核酸通常是直接或间接附着到固体支持物上的寡核苷酸。因此,凭借来自测试的受试者的核酸与结合至受讨论的标志物的核苷酸存在(例如受试者核酸中snp存在或不存在)影响的固体支持物的一系列寡核苷酸的寡核苷酸杂交,使用寡核苷酸来确定与性状相关的标志物的核苷酸发生。因此,可以选择在每个标志物的基因组位置处或附近结合的寡核苷酸。此类寡核苷酸可以包括可以支持存在于获得自测试的受试者的模板核酸中的特定多态性标志物扩增的正向和反向寡核苷酸。或者,或另外,寡核苷酸可以包括在标志物附近杂交的延伸引物序列以从而出于鉴定的目的支持对标志物的延伸。合适的检测方法将检测寡核苷酸的结合或加标签,例如在本文所述的基因分型方法中。

本领域已经描述了用于产生dna分子的固定阵列的技术。通常,大多数方法描述如何合成单链核酸分子阵列,例如使用掩蔽技术(maskingtechniques)在固体基底上的各个离散位置建立各种序列的排列。美国专利号5,837,832(通过引用以其整体并入本文)(其内容通过引用并入)描述了基于超大规模集成技术生产固定在硅基底上的dna阵列的改进方法。特别地,美国专利号5,837,832(通过引用以其整体并入本文)描述了称为“盖瓦(tiling)”的策略以在用于产生固定化dna阵列的基底上空间限定的位置处合成特定的探针组。美国专利号5,837,832(通过引用以其整体并入本文)也提供了也可以使用的早期技术的参考。

dna可以在基底表面上原位合成。然而,也可以使用例如配备有针脚或压电装置的机器人装置将dna直接印刷到基底上。微阵列一般通过将靶物直接原位合成到支持物上,或备选通过外源沉积预先制备的靶物而逐步产生。光刻、机械微点样(mechanicalmicrospotting),和喷墨技术通常用于生产微阵列。

在光刻法中,通过将光照射通过光掩模来选择性地激活用光不稳定的保护基修饰的玻璃晶片,用于例如dna合成。重复的去保护和偶联循环能够制备高密度寡核苷酸微阵列(参见例如美国专利号5,744,305,1998年4月28日公告)(通过引用以其整体并入本文)。

微点样包括通过将少量的预先制备的靶物质打印在固体表面上而能够自动化地产生微阵列的沉积技术。通过打印基底与诸如针或毛细管的递送装置之间的直接表面接触完成打印。机器控制系统和多元的打印头允许自动化的微阵列制作。

喷墨技术利用压电和其它推进形式将生物化学物质从微型喷嘴转移到固体表面。使用压电性,通过使电流流过压电晶体而将目标样品排出,所述压电晶体膨胀以排出样品。压电推进技术包括连续和按需滴落(drop-on-demand)设备。除压电喷墨之外,使用喷泡或热喷墨头,热可以用于形成并推进流体液滴;然而,由于对生物样品常常有应激的热量,此类热喷墨一般不适用于生物材料的转移。使用喷墨技术的例子包括美国专利号5,658,802(通过引用以其整体并入本文)。

多种核酸通常固定在固体基底上或固体基底的分散的区域中。基底是多孔的以允许在基底内固定,或者基本上无孔以允许表面固定。

固体基底可由能够直接或间接结合多肽的任何材料制成。合适的固体基底的例子包括平板玻璃、硅片、云母、陶瓷和有机聚合物如塑料,包括聚苯乙烯和聚甲基丙烯酸酯。也可以使用半透膜例如硝化纤维素或尼龙膜,它们是广泛可得的。半透膜可安置在更坚固的固体表面例如玻璃上。表面可选地可以包被有一层金属,例如金、铂或其它过渡金属。

优选地,固体基底一般是具有刚性或半刚性表面的材料。在一些实施方案中,基底的至少一个表面将基本上是平的,虽然在一些实施方案中期望用例如凸起区域或蚀刻的沟槽物理分隔合成区域。还在一个实施方案中,固体底物适用于在通常为50至100μm的分散区域中,给定密度为10,000至40,000cm-2下高密度应用dna序列。

将固体基底方便地分成几个区段。这通过诸如光刻的技术,或通过应用疏水墨水(例如基于teflon的墨水(cel-line,usa))实现。

阵列中每个不同成员所在的分散位置可以具有任何方便的形状,例如圆形、矩形、椭圆形、楔形等。

核酸与底物的连接可以是共价或非共价的,一般通过核酸所结合的分子层。例如,可用生物素标记核酸探针/引物,并用抗生物素蛋白和/或链霉抗生物素蛋白包被底物。使用生物素化探针/引物的便利特征在于容易确定与固体底物偶联的效率。

可以在固体基底(如在玻璃的情况下)与探针/引物之间提供化学基底。合适的化学基底的例子包括六乙二醇,聚赖氨酸。例如,可以使用标准程序对聚赖氨酸进行化学修饰以引入亲和配体。

将探针/引物附着到固体基底表面的其它方法包括使用本领域已知的偶联剂,如描述于wo98/49557(通过引用以其整体并入本文)。

设计了本公开的高通量系统以确定一个snp或一系列snp的核苷酸发生。该系统可以确定整个全基因组高密度snp图谱的核苷酸发生。

用于分析标志物尤其是snp的高通量系统可以包括例如平台,诸如uhtsnp-it平台(orchidbiosciences,princeton,n.j.,usa)、massarraytm系统(sequenom,sandiego,calif.,usa)、整合的snp基因分型系统(illumina,sandiego,calif.,usa)、taqmantm(abi,fostercity,calif.,usa)。示例性的核酸阵列是wo95/11995中描述的类型(通过引用以其整体并入本文),wo95/11995(通过引用以其整体并入本文)还描述了优化的用于检测预先表征的多态性的变体形式的子阵列。此类子阵列包含设计为与第二参考序列互补的探针,所述第二参考序列是第一参考序列的等位变体。第二组(或另外的组)的包括可以特别用于分析预期在与探针的长度(例如,在9至21个碱基内的两个或更多个突变)相称的短距离内发生多个突变的主要(primary)参考序列的短子序列。更优选地,高通量系统包含snp微阵列,诸如可获得自affymetrix或描述于例如美国专利号6,468,743(通过引用以其整体并入本文)或haciaetal.,naturegenetics,14:441,1996(通过引用以其整体并入本文)中的那些。

通常通过电荷耦合设备(ccd)相机或共焦成像系统同时读取dna阵列。或者,可以将dna阵列放置在可以沿x-y方向移动的合适设备(例如读板器(platereader))中进行检测。以这种方式,通过计算机控制的阵列移动以使每个离散元件依次与检测装置一致,自动测量了每个离散位置的特性变化。

检测手段能够光学地或电子地询问文库阵列中的每个位置。合适的检测手段的例子包括ccd相机或共焦成像系统。

系统还可以包括用于检测一系列寡核苷酸与一系列snp的结合的检测机制。此类检测机制是本领域已知的。

本公开的高通量系统可以包括试剂处理机构,其可以用于将试剂(通常为液体)施加到固体支持物上。

高通量系统还可以包括有效移动固体支持物的机制和检测机制。

最近已经鉴定了使用定制核酸酶(talen)来制备遗传修饰的动物以给予将外来等位基因有效非减数分裂渐渗入单倍型。此类修饰可以通过鉴定基因或等位基因的特定序列结构以及其染色体上围绕该基因或等位基因的序列来进行。由于分子生物学、基因测序和动物克隆的迅速发展,由于与其它物种的已知基因的同源性而鉴定离散基因以及鉴定或假设其功能的能力已经为科学家提供了能力,该能力不仅试图修饰动物天然遗传材料,还试图将来自其它动物(如不同品种、谱系、株或种)的同源基因(即外源基因)插入鉴定的基因座,该基因座可以是宿主物种的天然基因或等位基因的位点。此外,此类插入或渐渗的优点在于可以在一代中赋予物种或品种以特定性状,而不是通过家畜育种、杂交育种和回交的传统方法以赋予宿主动物性状而无需添加来自供体的不需要的基因。例如,公布的美国专利申请2012/0222143,出于所有目的以其整体并入本文,描述了使用非减数分裂渐渗以将期望的性状引入家畜基因组的方法以产生稳定表达的表型的方法。

使用精确的基因编辑,可以根据需要使用插入或删除编辑动物基因组中的靶等位基因和更具体地宿主动物公认的单倍型内的靶等位基因。例如,有效的非减数分裂渐渗可用于改变单个碱基或者它可用于定相(inphase)插入单个等位基因或复杂等位基因以表达新性状而无需改变对任何家畜品种特定的其它基因、等位基因或表型性状

在此类实例中,可能有必要确定是否特定家畜动物展示(或缺乏)对其公认的表型而言外来的一些性状,以及确定是否该性状的存在(或其缺失)是精确基因编辑的结果或是随机突变或用赋予此类性状的其它动物有性杂交育种的结果。在此类情况下,可以鉴定家畜动物的已知单倍型内外来或外源等位基因的存在。本领域技术人员将理解,如果可以鉴定单倍型中所含的已知dna序列(或标志物),并且如果将外来dna在目标基因座处引入该单倍型,则有可能由于单倍型内天然等位基因(如目标基因座)的位点处插入的dna的存在而鉴定所述动物。

染色体上彼此邻近的等位基因展示出显著的连锁不平衡,使得等位基因不会独立分离。相反,即使当展示那些等位基因的动物是有性繁殖的产物时,彼此500个碱基内的等位基因也很有可能一起分离。此外,本领域技术人员会认识到染色体上约接近的等位基因,它们将共分离的可能性越大。因此,比500个碱基更接近靶基因座的等位基因和/或snp也可用作单倍型标志物,在一些情况下将鉴定200个碱基、100个碱基或50个碱基内的等位基因。

技术的进步提供了对动物全基因组测序的能力。例如,具有定位家畜基因组测序的目标的国立动物基因组研究项目,所述家畜包括牛,猪,鸡,棉羊,马和水产养殖中使用的生物体(参见,例如http://www.animalgenome.org/)。在一些情况下,由于家畜已经成为几个世纪繁殖和杂交育种以获得期望品种的对象,此类品种的遗传多样性是有限的。例如,hayesetal.,(公开的美国专利申请2014/0220575)估计,当与它们巨大的数目和地理分布相比时,流行家畜品种的有效群体规模(ne)是极小的。例如,在牛中,holstein-friesians的ne估计为在50和100之间;瑞士褐牛(brownswiss)为约46;荷斯坦牛(holstein)为49和丹麦红牛(danishred)为47。棉羊中,dorset-rarnboulliet-finnsheep交换(cross)的ne为35。猪具有稍高的ne,估计harmegnies为<200;对于duroc/largewhite为85和对于长白猪为300。鸡显示了相似的小的ne,对于品种如layers,其估计为在91和123之间。

因此,从繁殖的角度和从经济学的角度来看,识别动物外来表型性状的来源是重要的,无论其来自天然突变、来自有性繁殖,或无论该性状是否由引入克隆动物的外来等位基因引起的。如上所讨论的,如果性状(如polled)经由从例如有角的牛品种和无角的品种(安格斯牛)的杂交和回交而引入有角的牛品种,并接着将无角的后代与荷斯坦牛回交以达到通常可以接受的(如主观表型上的)polled荷斯坦牛,除了需要许多代,该杂交的基因型结果将包括与无角的等位基因(无论是否表达)处于连锁不平衡的无角基因组的部分。引入安格斯牛基因组的此类部分可能对荷斯坦牛品种没有益处并且也可能改变其它性状或特征。此外,荷斯坦牛单倍型中与无角等位基因连锁的安格斯牛等位基因的存在将确定通过有性杂交的无角基因的引入。反过来,如果无角基因由于通过遗传操作(即非减数分裂渐渗)引入单倍型而存在于单倍型中,则除了引入的安格斯牛等位基因、一个核苷酸或多个核苷酸之外,宿主品种(荷斯坦牛)的天然单倍型其余部分保持不变。

在这方面,虽然使用特定基因编辑(如例如使用talen以引入同源定向修复(hdr))需要知道替换或中断的天然核苷酸序列,上游或下游序列是不相关的。然而,如本发明人所认可的,通过鉴定对宿主单倍型天然的标志物以及对于引入的(外源)dna的正确插入位点,有可能确定是否已经将外来等位基因以分子引入宿主动物,或者通过随机突变或通过有性繁殖在动物中是否出现非天然等位基因。参见图3。这一知识为动物拥有者、动物的育种者和此类动物的消费者提供了知道除了引入的外源等位基因外,动物仍然遗传上与其宿主/亲本相同的舒适性。

因此,在一个示例性的实施方案中,本公开包括鉴定是否表达外来等位基因的宿主动物的表型是自发突变、选择育种的结果还是遗传修饰的结果的方法。因此,在本实施方案中,该方法包括在单倍型内的特定、限定的基因座处鉴定已知外源等位基因的存在。所述方法还包括鉴定对单倍型天然的两个或多个标志物。在一些示例性的实施方案中,标志物在染色体上的目标基因座的侧翼。在其它实施方案中,标志物在染色体上的目标基因座的同侧。当然,本领域技术人员将理解,可能有超过两个单倍型标志物。例如,可以有三个、四个或五个单倍型标志物。标志物可以在染色体上的目标基因座的侧翼,或者标志物可以在染色体上的目标基因座的同侧。

将通过参考以下实施例更容易地理解如上面大致描述的装置和化合物以及根据本公开的方法的各种示例性实施方式,所述实施例以示例的方式提供,并且不旨在以任何方式限制本公开。

实施例

实施例1

家畜中有效非减数分裂等位基因渐渗

一些牛品种(如安格斯牛)是天然无角的,称为polled的显性性状(27)。已经在染色体1上鉴定了赋予无角(polledness)的两个等位变体(28)。polled性状进入有角的乳品种的减数分裂渐渗可通过传统杂交育种实现,但由于净价值(如奶产量)的未选择的(劣等)等位基因混合到群体中,所得动物的遗传价值的等级将会降低。本发明人着手将celticpolled等位基因(取代10bp的212bp的重复)(称为pc)非减数分裂渐渗入源自有角奶牛的成纤维细胞。构建了含有包含来自安格斯牛品种的pc等位基因的1,594-bp片段的质粒hdr模板(图1a)。设计了talen使得它们能够切割horned等位基因但不影响pc等位基因。另外,在发现作为mrna递送的一对talen具有与质粒dna相似的活性后(tanetal.,procnatlacadsciusa.2013oct8;110(41):16526-31.),我们选择递送作为mrna的talen以消除talen表达质粒可能的基因组整合。266集落中的5个(2%)通过了显示为确认pc渐渗的每个pcr测试(图1b)。

pchdr模板。从安格斯牛基因组dnapcr扩增(f1:5’-gggcaagttgctcagctgtttttg(seqid1);r1-5’-tccgcatggtttagcaggattca(seqid2))包含celticpolled等位基因的1,784bp片段,并topo克隆入pcr2.1载体(lifetechnologies)。该质粒用作阳性对照模板,该模板用于分析引物组和用于通过pcr用以下引物(1594f1:5’-atcgaacctgggtcttctgcattg(seqid3);r1:5’-tccgcatggtttagcaggattca(seqid4))pcr衍生1,592bphdr模板,并topo克隆,如前。使用前对每个质粒进行序列验证。使用fast-ionmidi质粒endo-free试剂盒(ibiscientific)来制备转染级质粒并且将5μg或10μg与2μghp1.3talenmrna一起转染。

实施例2

组织培养和转染

将牛polled等位基因渐渗入有角牛成纤维细胞。在30℃维持牛纤维细胞。每次转染包含500,000-600,000个重悬于与mrna和寡聚物混合的缓冲液“r”中的细胞,并且使用100ul枪头,通过以下参数电穿孔:输入电压;1800v;脉冲宽度;20ms;和脉冲数;1。通常,每个转染中包含2-4μg的talen表达质粒或1-2μg的talenmrna和2-3μm的对感兴趣的基因特异的寡聚物。talen和crispr/cas9实验两者的图例中标明了与那些量的偏差。转染后,将细胞以60:40分到6孔皿的两个分开的孔中,分别在30℃或37℃培养3天。3天后,扩增细胞群并在37℃下直至至少第10天以评估编辑的稳定性。

转染后三天,将50至250个细胞接种到10cm皿上并培养直到个体集落到达直径约5毫米。在这一点,添加于pbs中1:5(体积/体积)稀释的6ml的tryple(lifetechnologies),并吸出集落,转移至24孔皿孔的孔中并在相同条件下培养。收集达到汇合的集落并分开用于冷冻保存和基因分型。

实施例3

渐渗的确认

如本领域已知的,五个克隆中的三个对于pc渐渗是纯合的并且通过测序确认。简而言之,通过使用f1引物(见上)和“p”引物(5’-acgtactcttcatttcacagcctac)(seqid5),使用1xmytaqred混合物(bioline)进行38个循环(95℃,25s;62℃,25s;72℃,60s)的pcr来进行pc渐渗的检测。使用(f2:5’-gtctggggtgagatagttttcttgg(seqid6);r2-5’-ggcagagatgttggtcttgggtgt(seqid7))进行第二pcr测定。通过使用侧翼f1和f2引物的pcr,然后top克隆和测序来分析通过两个测试的候选物。

实施例4

确认等位基因渐渗的单倍型标志物的鉴定

由于定义了外源dna的插入基因座的位置,可以设计用于检测单倍型的存在的标志物。如上所讨论的,遗传标志物可以是染色体区段内任何已知dna序列。由于连锁不平衡和非独立性分类(non-independentassortment),由于各种因素(但包括与目标基因座的距离),单倍型内的等位基因在交换期间一起分离(图2)。通过鉴定已知序列(优选地自目标基因座500bp内,或更优选地目标基因座的200个碱基对内,但在一些实施方案中可以沿染色体跨越高达8mbp)来鉴定合适的标志物。在一些实施方案中,标志物在靶物的侧翼,图3。本领域技术人员将会理解,目标基因座侧翼的两个标志物足以鉴定单倍型中外源等位基因的存在。然而,鉴定对于天然单倍型独特的五种或更多种标志物在本公开的范围内。在一些实施方案中,图谱(map)由对任何单倍型特异的标志物制成,使得可以在任何时间访问该图谱以鉴定动物的任何特定基因座的任何染色体上特定标志物的存在。一旦鉴定了合适的标志物,确定那些标志物的存在的方法可用于制备通过(例如)用特定探针原位杂交来识别期望的靶物的探针,或用于制备将扩增期望的标志物(如通过pcr)的引物。其他策略包括对包含外源等位基因和数个标志物的大型染色体区段测序、确认合适的染色体区段内外源dna(如设计的那样插入)的存在。在这种情况下,引物可以设计为在单倍型中的目标基因座的侧翼。例如,单分子实时测序(pacificbiosciences)每次运行可读取从10,000至15,000bp,而链终止测序(sanger)可读取从约400bp至900bp。此类距离可以适合于确认例如212bppolled等位基因刚好在牛(欧洲牛)的染色体1上其基因座处定义的有角单倍型内的正确插入。

实施例5

确认slick表型渐渗的单倍型标志物的鉴定

“slick”是在新世界牛(包括senepol、carora、criollolimonero和romosinuano)中发现的突变。术语“slick”是指牛的“短而光滑的外层”。该表型也包括以下中的差异:毛发密度(较少)、发轴(hairshaft)结构型、汗腺密度、平均正常体温,和温度调节效率。具有slick表型的牛显示出在热带环境中热调节能力大大提高,并因此在炎热的环境中经受的应激要小得多。

“slick”突变已经定位在牛基因组的染色体20,且该表型下的突变与催乳激素受体(prlr)的基因一同存在。该基因具有能够编码581个氨基酸的多肽的九个外显子。先前在senepol牛中的研究已经显示,该表型由于外显子10(没有外显子1,公认的外显子是2-10)中单个碱基缺失导致,所述缺失引入提前终止密码子(p.leu462)并且从受体丧失末端120个氨基酸。该表型在本文中称为slick1。senepol牛是极度耐热的并且已经与许多其它牛品种杂交以提供该显性耐热性状的优势。

现在有可能将产生slick表型的一个或多个等位基因引入其它牛而无需性杂交(例如参见fahrenkrugetal.的美国临时专利申请62/221,444)。因此重要的是能够鉴定出展示slick表型的动物是遗传修饰而不是有性育种的产物。这有几个原因。首先,大多数牛品种得到充分表征,并且具有预测的有效种群大小在50(荷斯坦牛/friesans)和114(braunvieh)之间的近交种。众所周知,这些动物的价值在于它们的特征,如大小、产肉量、产奶量、牛可以生产的小牛数量、抗病等。因此,根据动物匹配其品种特征的能力预测动物的经济价值。第二,通过凭借遗传渐渗知道动物是否表现出性状,可以跟踪和确认动物遗传史。

下表1提供了slick基因座周围的snp的标志物分析。如所示,标志物1-5在染色体20上的slick基因座的上游并且标志物6-10在slick基因座的下游。标记为“snp等位基因”的行是染色体上的基因座,其中所述标志物(snp)天然存在于senepol牛中。标记为“其他等位基因”的行是在有毛发的牛中较高次要等位基因频率的核苷酸残基并且通常不存于单倍型连接的slick或含有slick的单倍型中。maf是基因分型dna的实验组内相较于wt的每个snp的频率。最后一列显示10个侧翼标志物中具有snp等位基因且不具有slick突变的概率是约8x10-5。然而,应当注意,本研究的动物取样严重向源自受criollo遗传碱基影响的动物的牛dna(slick突变的天然来源)样品偏倚。因此,每个标志物的频率比其在这些标志物的任何全局/随机分布中普遍得多。非senepol动物在chr20-39136558处展示缺失而不具有任何连接的标志物的几率将为8x10-5并且由于严重影响的criollo群体的取样,这个值偏向于更可能。如表1所示,验证区域的总长度为296,033bp,从39,047,501至39,343,534。

表1:

表1:继续

maf=次要等位基因频率;snp=单核苷酸多态性并且由umd3.1版牛基因组组装的chr20上的snp的坐标位置表示。行指定的snp等位基因指用于源自carribbeancriollo牛的变体的slick单倍型中所代表的snp等位基因(即,存在于senepo牛中的slick致病突变)。其它等位基因代表由标志物试剂盒检测的该位置处的备选snp。本表中所列的所有snp均是双等位基因的。10个侧翼标志物中具有snp等位基因且不具有slick突变的概率是约8x10-5

表2鉴定由表1的标志物所鉴定的主要单倍型

表2

在slick验证区域中鉴定了7个主要单倍型。如表2所示,前两个单倍型是slick和wt。

因此,可靠标志物的鉴定是朝向鉴定靶序列(例如slick)来源的步骤。在slick的情况下,没有鉴定出任何具有胞嘧啶碱基缺失的单倍型,该单倍型也不共享slick单倍型的所有等位基因。因此,来自任何群体的动物将会具有胞嘧啶缺失并且不具有鉴定的10个其它标记物的机会非常低以至于不可能。

实施例6

荷斯坦牛中针对hh1的单倍型标志物的鉴定

染色体5上的hh1单倍型与荷斯坦牛中受孕率降低和纯合子缺陷相关。使用预测的建立者(chief)和三个其子代的全基因组再测序鉴定了hh1内apaf1中的无义突变(apaf1p.q579x)。预测该突变截短编码的apaf1蛋白的670个氨基酸(53.7)百分率,其包含对蛋白质-蛋白质相互作用至关重要的wd40结构域。246,773头荷斯坦牛的市售基因分型显示突变的5,299个apaf1杂合子和零个纯合子。2011年时使用findhap.f90在78,465头具有54,001个snp基因型的动物的谱系中检测到重组单倍型(定义为chief的hh1来源单倍性的部分而非全部),如前所述(vanradenetal.,2011a;sonstegardetal.,2013)。跨越含有假定突变的7.1mbp的75标记物来源单倍型的所有拷贝似乎追溯到chief且似乎没有其他突出的祖先。具有仅对于源单倍型的一部分而言纯合的重组单倍型的活动物可以排除不含致死突变的单倍型的该部分。处理完所有重组单倍型后,没有排除的区域定义为突变关键区域,如sonstegardetal.(2013)所述。

使用wiggansetal.(2010)的编辑并且从findhap.f90(vanradenetal.,2011a)版本2的标准输出在对来自illuminabovinesnp50beadchips(illumina,sandiego,ca)的43,385个snp基因分型的78,465头动物中检测出重组事件,所述findhap.f90(vanradenetal.,2011a)版本2首先检查长度600个标志物的单倍型,然后200个标志物的单倍性,并且最后输出≤75个标志物的单倍型。该程序将基因型定相为单倍型并检测每个基因分型的亲本的母本和父本单倍型之间的重组点。重组单倍型含有源单倍型的部分和非源单倍型的部分,并且当交换发生时,后代的表型状态可能是未知的。通过直接比较后代与谱系内的亲本单倍型,从基因型中检测到交换。对于每个交换,输出已知来自第一亲本单倍型的最后标志物和已知来自第二亲本单倍型的第一标志物。如果亲本单倍型在该区域中是相同的,一些基因型未被调用,或两个亲本是杂合的且不能定相等位基因,这导致未知交换位置,则那两个标志物之间可以仍然存在缺口。由于少量母兽(dam)被基因分型,发生在母体祖先中的交换常常检测不到(sonstegardetal.,2013)。

从携带致病hh1突变的考虑中除去对源单倍型区段同源的区域。例如,如果活的动物从一亲本接受原始hh1单倍型,并从另一亲本接受hh1单倍型的剩余20个标志物,则不考虑含有那20个标志物的区域,完全如sonstegardetal.(2013)中针对jersey单倍型1所描述的。

使用合成测序化学在illuminahiseq2000平台(illuminainc.,sandiego,ca)上对chief和其两个后代ivanhoechief和valiant的基因组进行测序。从纯化自精液管的5μg基因组dna中制备文库,并且使用由制造商提供的标准测序方案产生数据。还使用了用454钛技术的mark(12x)和chief(6x)的先前的测序结果(larkinetal.,2012)。

snp和基因的检测

使用freebayes鉴定bta5可疑区域中的snp(garrisonandmarth,2012)。推测的snp在它们符合以下标准时被接受:每个方向(正向,逆向)中具有至少两个读段对齐的4x最小读段覆盖,和最小等位基因测序质量≥20。在获得区域中的snp列表后,使用annovar(wangetal.,2010)进行变体的功能注释。annovar程序通过牛基因组内snp的基因或基因间位置来归类snp。该程序报告位于注释基因的内含子和外显子、5’和3’utr区域内的snp以及基因位置上游和下游的那些snp。为了与单倍型和基因型数据集的一致性,使用由ucsc基因组生物信息学集团(http://genome.ucsc.edu/cgi-bin/hgliftover)创建的程序liftover,将所有关于snp和基因位置的坐标从btau4.0转换到umd3.1基因组组装。

通过查询对于54,001个snp基因分型的33,415头荷斯坦牛的大数据库来选择动物进行验证,如以前构建的(wiggansetal.,2010)。基因型归属和单倍型频率包括所有33,415头动物,但选择用于进一步验证的758个样品来自cooperativedairydnarepository,其含有北美测试公牛的几乎所有后代的dna。单倍型鉴定是基于75个snp标志物,其被指定为bta5上含有7.1mbphh1的间隔(umd3.1坐标58,638,702至65,743,920;vanradenetal.,2011b)。实施额外的查询以选择在该间隔中具有独特的杂合单倍型组合的多种多样的一组非携带者。

设计用于验证测试的snp基因分型组(sequenominc.,sandiego,ca)(pageetal.,2004)由24个双向测定组成,该测定用于精修的(refined)hh1区间区域中12个推定snp。这包括在此间隔内发现的具有基因边界的所有snp,以及在该间隔中或距apaf1终止获得突变的远侧侧翼区域中邻近基因附近观察到的另外5个snp。24个snp测定中总共22个是有功能的;一个snp基因座是单态的。除了umd3_63107293(99.3%)和umd3_62591311(99.9%)以外,所有snp基因座的调用率为100%。比较了每个snp基因座的双向测定结果的一致性并且整合到11个snp基因座间的每个动物的单个标志物基因型得分。通过phasev2.1.1确定了11个信息性snp的单倍型(stephensetal.,2001),并且鉴定了总共24个可能的单倍型(表3)。这些单倍型比由75-标志物窗口(源自54,001芯片)最初定义的那些要短得多,所述窗口跨越用于查找hh1的7.1mbp。存在两个不同的编号系统:一个针对该7.1mbp窗口中超过2,000个不同的单倍型,且第二个针对用于验证的11个snp的窄窗口中的24个单倍型(表3)。

表3:

表3:荷斯坦牛单倍型(hh1)验证区域中11个信息性snp的单倍型。将等位基因调用指定为0或1--意味着将基因组参考等位基因指定为0且将备选等位基因的存在指定为1。1apaf1终止获得突变是该单倍型的第7标志物,并且是携带该apaf1标志物的唯一单倍型。在这个位置处的动物纯合1在子宫内丢失。注意到该标志物试剂盒中仅有一个单倍型,指示在标志物7处携带致死突变(111100-1-0111)的动物。具有在该位置处的零个等位基因和此单倍型的任何动物将必须是基因组编辑的结果。在这个url-http://omia.angis.org.au/omia000001/9913/中可以找到hhi信息。该突变仅存在于荷斯坦牛中,因此它只会被编辑为荷斯坦牛中的野生型等位基因。chr5上的snp位置-umd3_62591311、umd3_63051612、umd3_63052631、umd3_63088973、umd3_63091578、umd3_63107293、umd3_63150400、umd3_63198664、umd3_63209396、umd3_63228106、umd3_63486133。

使用具有不同标志物和动物的多个数据集进行验证测试后(adamsetal.;j.dairysci,jdairysci.2016aug;99(8):6693-701),将用于终止获得突变的测试添加到geneseekgenomicprofiler(ggp)beadchip(geneseek-neogen,lincoln,ne;neogencorp.,2013)和后续芯片上,并且接受了246,773荷斯坦牛的基因型,作为常规基因组预测的一部分。

如表3中所示,在第7标志物(umd3_63150400)处具有零个等位基因并且具有111100-x-0111单倍型的任何动物将必须是基因组编辑的结果。此外,单倍型在第7标志物处可以具有随机突变的概率仅为28.5亿分之一。从而,消除第7标志物处的0存在可以是随机发生的任何可能性。

尽管已经结合上面概述的各种示例性实施方案描述了本公开,无论已知或目前无法或可能无法预见,各种替代、修改、变化、改进和/或实质等同物对于本领域中具有至少部分普通技术的那些人员可以是显而易见的。因此,根据本公开的示例性实施方案(如上所述)旨在说明而非限制。在不脱离本公开的精神和范围的情况下可以做出各种改变。因此,本公开旨在涵盖这些示例性实施方案的所有已知或后来开发的替代方案、修改、变化、改进和/或实质等同物。

以下从1至43连续列举的段落提供了本公开的各种附加方面。在一个实施方案中,第一段(1)中,本公开提供:

1.制备用于检测家畜动物以鉴定天然单倍型中外源等位基因的试剂盒的方法,其包括:

鉴定潜在包含所述外源等位基因的天然单倍型;

鉴定所述外源等位基因;

制备对所述单倍型特异的两个或更多个探针。

2.段落1的方法,其中鉴定所述单倍型包括检测所述单倍型中对于所述家畜而言天然的标志物的存在。

3.段落1和2的方法,其中鉴定所述外源等位基因包括鉴定所述单倍型内外来等位基因的存在。

4.段落3的方法,其中通过非减数分裂渐渗来引入所述外源等位基因。

5.段落1至4的方法,其中通过两个或更多个标志物来确定期望的单倍型。

6.段落1至5的方法,其中所述两个或更多个标志物存在于所述外源等位基因的任一侧上。

7.段落1至6的方法,其中所述两个或更多个标志物存在于所述等位基因的2mb内。

8.段落1至7的方法,其中其中所述两个或更多个标志物存在于所述等位基因的1mb内。

9.段落1至8的方法,其中检测对于所述家畜而言天然的标志物的存在包括对每个标志物特异的探针。

10.段落1至9的方法,其中所述标志物选自欧洲牛(bostaurus),并包含:chr20-39047501、chr20-39067164、chr20-39107872、chr20-39118063、chr20-39126055、chr20-39136558、chr20-39179498、chr20-39179527、chr20-39235859、chr20-39343400、chr20-39343534、chr5-umd3_62591311、chr5-umd3_63051612、chr5-umd3_63052631、chr5-umd3_63088973、chr5-umd3_63091578、chr5-umd3_63107293、chr5-umd3_63150400、chr5-umd3_63198664、chr5-umd3_63209396、chr5-umd3_63228106、chr5-umd3_63486133。

11.段落9的方法,其中所述探针用于pcr、基于阵列的测定、高分辨率熔解(hrm)分析、片段分析、桑格尔(sanger)片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)。

12.段落1至10的方法,其中所述标志物是所述单倍型的序列特异性区域。

13.段落1至12的方法,其中所述外源等位基因与天然等位基因源自不同的谱系、品种或物种。

14.段落1至13的方法,其中鉴定所述外源等位基因包括使用对所述外源等位基因特异的探针。

15.段落1至14的方法,其中所述探针用于pcr、基于阵列的测定、高分辨率熔解(hrm)分析、片段分析、桑格尔片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)。

16.段落1至15的方法,其中所述外源等位基因包含至少一个对于所述家畜的天然等位基因而言外来的碱基。

17.鉴定家畜动物中外源目标等位基因的存在的方法,其包括:

i)鉴定所述家畜动物中的天然单倍型;

ii)鉴定对于所述单倍型而言外源的等位基因;

iii)确定所述单倍型内所述外源等位基因的存在。

18.段落1至17的方法,其中鉴定期望的单倍型包括检测所述单倍型中对于所述家畜而言天然的标志物的存在。

19.段落1至18中任一项的方法,其中鉴定所述单倍型中的所述外源等位基因包括鉴定所述单倍型内外来等位基因的存在。

20.段落1至19中任一项的方法,其中通过非减数分裂渐渗来引入所述外源等位基因。

21.段落1至20中任一项的方法,其中通过两个或更多个标志物来鉴定所述单倍型。

22.段落1至21中任一项的方法,其中所述两个或更多个标志物存在于所述外源等位基因的任一侧上。

23.段落1至22中任一项的方法,其中使用对每个标志物特异的探针鉴定所述两个或更多个标志物。

24.段落1至23中任一项的方法,其中所述两个或多个标志物存在于所述等位基因的2mb内。

25.段落1至24中任一项的方法,其中其中所述两个或多个标志物存在于所述等位基因的1mb内。

26.段落1至25中任一项的方法,其中所述标志物选自欧洲牛,并包含:chr20-39047501、chr20-39067164、chr20-39107872、chr20-39118063、chr20-39126055、chr20-39136558、chr20-39179498、chr20-39179527、chr20-39235859、chr20-39343400、chr20-39343534、chr5-umd3_62591311、chr5-umd3_63051612、chr5-umd3_63052631、chr5-umd3_63088973、chr5-umd3_63091578、chr5-umd3_63107293、chr5-umd3_63150400、chr5-umd3_63198664、chr5-umd3_63209396、chr5-umd3_63228106、chr5-umd3_63486133。

27.段落1至26中任一项的方法,其中检测对于所述家畜而言天然的标志物的存在包括对每个标志物特异的探针。

28.段落1至27中任一项的方法,其中所述探针能用于pcr、基于阵列的测定、高分辨率熔解(hrm)分析、片段分析、桑格尔片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)。

29.段落1至28中任一项的方法,其中所述标志物是所述单倍型的序列特异性区域。

30.段落1至29中任一项的方法,其中所述外源等位基因源自与所述家畜不同的谱系、品种或物种。

31.段落1至30中任一项的方法,其中鉴定所述外源等位基因包括使用对所述外源等位基因特异的探针。

32.段落1至31中任一项的方法,其中所述探针用于pcr、基于阵列的测定、高分辨率熔解(hrm)分析、片段分析、桑格尔片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)。

33.段落1至32中任一项的方法,其中所述外源等位基因包含至少一个对于所述家畜的天然单倍型而言外来的碱基。

34.用于确定使用非减数分裂渐渗引入单倍型中的外源等位基因的存在的试剂盒,其包含:

对对于动物而言外来的等位基因特异的探针,

对动物的单倍型特异的两个或更多个探针。

35.段落34的试剂盒,其还包含使用说明。

36.段落34和35的试剂盒,其还包含容纳反应混合物的容器。

37.段落34至36的试剂盒,其还包含试剂。

38.段落34至38的试剂盒,其中所述探针用于:pcr、基于阵列的测定、高分辨率熔解(hrm)分析、片段分析、桑格尔片段分析、扩增片段长度多态性(aflp)分析、限制性片段长度多态性(rflp)分析,或单链构象多态性分析(sscp)。

39.段落34至38的试剂盒,其中所述探针对标志物是特异性的,所述标志物包括:chr20-39047501、chr20-39067164、chr20-39107872、chr20-39118063、chr20-39126055、chr20-39136558、chr20-39179498、chr20-39179527、chr20-39235859、chr20-39343400、chr20-39343534、chr5-umd3_62591311、chr5-umd3_63051612、chr5-umd3_63052631、chr5-umd3_63088973、chr5-umd3_63091578、chr5-umd3_63107293、chr5-umd3_63150400、chr5-umd3_63198664、chr5-umd3_63209396、chr5-umd3_63228106、chr5-umd3_63486133。

40.遗传修饰的动物,其由在欧洲牛的约chr5-umd3_63150400或约chr20-39136558处编辑的基因组。

41.制备具有光滑(slick)表型的遗传修饰的动物的方法,其包括在欧洲牛的约chr20-39136558基因座处的修饰。

42.体外动物细胞,其包含在欧洲牛的约chr5-umd3_63150400或约chr20-39136558处的修饰。

43.上述段落中的任一项在鉴定期望的单倍型中外来等位基因的存在中的用途。

在此列出的所有专利,出版物和期刊文章都通过引用结合于此;在冲突的情况下,以本说明书为准。

尽管已经结合上面概述的各种示例性实施方案描述了本公开,无论已知或目前无法或可能无法预见,各种替代、修改、变化、改进和/或实质等同物对于本领域中具有至少部分普通技术的那些人员可以是显而易见的。因此,根据本公开的示例性实施方案(如上所述)旨在说明而非限制。在不脱离本公开的精神和范围的情况下可以做出各种改变。因此,本公开旨在涵盖这些示例性实施方案的所有已知或后来开发的替代方案、修改、变化、改进和/或实质等同物。

序列表

<110>重组股份有限公司

sonstegard,tad

carlson,daniel

fahrenkrug,scott

<120>鉴定期望的单倍型中外来等位基因的存在的方法

<130>5054.38wo-01

<150>us62/212,840

<151>2015-09-01

<150>us62/321,942

<151>2016-04-13

<160>14

<170>patentinversion3.5

<210>1

<211>24

<212>dna

<213>人工

<220>

<223>f1pcr引物

<400>1

gggcaagttgctcagctgtttttg24

<210>2

<211>23

<212>dna

<213>人工

<220>

<223>r1pcr引物

<400>2

tccgcatggtttagcaggattca23

<210>3

<211>24

<212>dna

<213>人工

<220>

<223>f1pcr引物

<400>3

atcgaacctgggtcttctgcattg24

<210>4

<211>23

<212>dna

<213>人工

<220>

<223>r1pcr引物

<400>4

tccgcatggtttagcaggattca23

<210>5

<211>25

<212>dna

<213>人工

<220>

<223>ppcr引物

<400>5

acgtactcttcatttcacagcctac25

<210>6

<211>25

<212>dna

<213>人工

<220>

<223>f2pcr引物

<400>6

gtctggggtgagatagttttcttgg25

<210>7

<211>24

<212>dna

<213>人工

<220>

<223>r2pcr引物

<400>7

ggcagagatgttggtcttgggtgt24

<210>8

<211>10

<212>dna

<213>欧洲牛

<400>8

gacggtggtt10

<210>9

<211>11

<212>dna

<213>欧洲牛

<400>9

tgtatcccacc11

<210>10

<211>11

<212>dna

<213>欧洲牛

<400>10

tgtatcccgcc11

<210>11

<211>11

<212>dna

<213>欧洲牛

<400>11

tgtagcccacc11

<210>12

<211>11

<212>dna

<213>欧洲牛

<400>12

tgtagcccgcc11

<210>13

<211>11

<212>dna

<213>欧洲牛

<400>13

tgtagctgacc11

<210>14

<211>11

<212>dna

<213>欧洲牛

<400>14

tgtatcccgtt11

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1