采用寡核苷酸介导的基因修复提高靶向基因修饰的效率的方法和组合物与流程

文档序号:15983698发布日期:2018-11-17 00:37阅读:694来源:国知局
本申请要求2013年3月15日提交的美国临时专利申请61/801,333的优先权,所述专利申请特此以引用的方式并入。发明领域本发明总体上涉及用于改进对基因组或其他核苷酸序列中的特定位置的修饰的靶向效率的新颖方法。另外,本发明涉及已经通过本文所公开的方法修饰、突变或标记的靶dna。本发明还涉及已经通过本发明的方法修饰的细胞、组织和生物体。发明背景以下发明背景论述仅提供来帮助读者理解本发明,且并非承认描述或构成本发明的现有技术。基因组dna的修饰一般来说对生物技术的进步是至关重要的并且具体地说是生物技术上基于医学进步的。用于位点定向基因组修饰的有效方法对于研究且可能地对于基因疗法应用来说是合乎需要的。一种方法利用三链体形成寡核苷酸(tfo),所述寡核苷酸以序列特异性方式结合双链dna作为第三链以介导定向诱变。这种tfo可通过递送键结诱变剂如补骨脂素或苯丁酸氮芥(havre等,procnat’lacadsci,u.s.a.90:7879-7883,1993;havre等,jvirol67:7323-7331,1993;wang等,molcellbiol15:1759-1768,1995;takasugi等,procnat’lacadsci,u.s.a.88:5602-5606,1991;belousov等,nucleicacidsres25:3440-3444,1997)或通过以足够亲和力结合以引起易错修复(wang等,science271:802-805,1996)来作用。用于基因组修饰的另一策略涉及诱导外源性dna片段与靶基因之间的同源重组。这种方法已经成功地用于靶向并破坏哺乳动物中的选定基因并且已经实现携带特异性基因敲除的转基因小鼠的产生(capeechi等,science244:1288-1292,1989;wagner的美国专利号4,873,191)。然而,这种方法依赖于转移选择性标记物以允许所需重组体的分离。在无选择的情况下,典型基因转移实验中转染的dna的同源与非同源整合的比例较低,通常在1:1000或更小的范围内(sedivy等,genetargeting,w.h.freemanandco.,newyork,1992)。同源整合的这种低效率限制基因转移用于实验用途或基因疗法的效用。同源重组的频率可通过对来自uv照射和选定致癌物的靶位点的损伤(wang等,molcellbiol8:196-202,1988)以及通过位点特异性核酸内切酶(sedivy等,genetargeting,w.h.freemanandco.,newyork,1992;rouet等,procnat’lacadsci,u.s.a.91:6064-6068,1994;segal等,procnat’lacadsci,u.s.a.92:806-810,1995)来增强。此外,由三链体定向补骨脂素光加成物诱导的dna损伤能够刺激染色体外载体之内和之间的重组(segal等,procnat’lacadsci,u.s.a.92:806-810,1995;faruqi等,molcellbiol16:6820-6828,1996;glazer的美国专利号5,962,426)。其他工作已经帮助定义影响哺乳动物细胞中的重组的参数。一般来说,线性供体片段比其环状对应物重组发生更强(folger等,molcellbiol2:1372-1387,1982)。重组还受供体与靶部位两者之间的不间断同源性的长度影响,其中较短片段似乎是对于重组的无效底物(rubnitz等,molcellbiol4:2253-2258,1984)。然而,一些最近努力集中于使用dna或dna/rna杂合体的较短片段用于基因校正。(kunzelmann等,genether3:859-867,1996)。tfo的序列特异性结合特性已经用于将一系列不同分子递送至dna中的靶位点。例如,用于检查三链体相互作用的诊断方法利用偶联至fe-edta(一种dna裂解剂)的tfo(moser等,science238:645-650,1987)。其他已经在生物学上将活性酶像微球菌核酸酶和链球菌核酸酶与tfo相联系并且展示dna的位点特异性裂解(pei等,procnat’lacadsciu.s.a.87:9858-9862,1990;landgraf等,biochemistry33:10607-10615,1994)。此外,位点定向dna损伤和诱变可使用缀合至补骨脂素(havre等,procnat’lacadsciu.s.a.90:7879-7883,1993;takasurgi等,procnat’lacadsciu.s.a.88:5602-5606,1991)或烷化剂(belousov等,nucleicacidsres25:3440-3444,1997;posvic等,jamchemsoc112:9428-9430,1990)的tfo来实现。wipo专利申请wo/2001/025460描述了用于突变植物的靶dna序列的方法,所述方法包括以下步骤:(1)将重组基因寡核碱基电穿孔至所述植物的小孢子中,所述寡核碱基含有第一同源区,所述第一同源区具有与靶dna序列的第一片段的至少6个碱基对的序列相同的序列;和第二同源区,所述第二同源区具有与靶dna序列的第二片段的至少6个碱基对的序列相同的序列;以及插入区,所述插入区含有至少1个与靶dna序列异源的核碱基,所述插入区连接所述第一同源区和所述第二同源区;(2)培养小孢子以产生胚芽;并且(3)从所述胚芽产生具有位于所述靶dna序列的第一片段与第二片段之间的突变的植物,例如通过胚芽所述小孢子以产生体细胞胚且从所述胚芽再生植物。在本发明的不同实施方案中,重组基因寡核碱基是mdon并且所述同源区各自含有至少6个rna型核苷酸的rna区段;所述插入区是至少3个核苷酸长;所述第一和或第二rna区段含有至少8个连续2'-取代的核糖核苷酸。生物学研究的主要目标之一是基因组的靶向修饰。如上所述,虽然用于将基因递送至哺乳动物细胞中的方法是发展良好的,但修饰和/或同源重组的频率受限制(hanson等,molcellbiol15:45-511995)。因此,基因的修饰是费时的过程。已经考虑或尝试了多种方法来增强供体与基因组dna之间的修饰和/或重组。然而,当前技术经常展示较低修饰和/或重组率,或者修饰和/或重组率的不一致性,从而妨碍研究和基因疗法技术。发明概述本发明提供用于提高对基因组或其他核苷酸序列中的特定位置的修饰的靶向效率的新颖方法和组合物。如下文所述,引导对基因组的特异性变化的核酸可与不同方法组合以增强存在于被靶向以用于修饰的细胞中的天然修复系统的组分的可用性。在第一方面,本发明涉及用于将基因修复寡核碱基(gron)介导的突变引入至植物细胞中的靶脱氧核糖核酸(dna)序列中的方法。所述方法尤其包括在将gron递送至植物细胞中之前和/或同时在增加一种或多种细胞dna修复过程的条件下培养细胞;和/或将gron递送至大于55个碱基长的植物细胞中,所述gron任选地包含用于引入至靶dna中的两个或更多个突变位点。在某些实施方案中,增加一种或多种细胞dna修复过程的条件包括以下中的一种或多种:将一个或多个位点引入至gron中或至植物细胞dna中,所述位点是用于碱基切除修复的靶标;将一个或多个位点引入至gron中或至植物细胞dna中,所述位点是用于非同源末端连接的靶标;将一个或多个位点引入至gron中或至植物细胞dna中,所述位点是用于微同源介导的末端连接的靶标;将一个或多个位点引入至gron中或至植物细胞dna中,所述位点是用于同源重组的靶标;以及将一个或多个位点引入至gron中或至植物细胞dna中,所述位点是用于推动修复的靶标。如下文所述,用于本发明的gron可包含来自常规rna和dna核苷酸的以下改变中的一种或多种:一个或多个无碱基核苷酸;一个或多个8’氧代da和/或8’氧代dg核苷酸;在其3’端处的反向碱基;一个或多个2’o-甲基核苷酸;在其5’端处的一个或多个2’o-甲基rna核苷酸,并且优选2、3、4、5、6、7、8、9、10个或更多个;嵌入染料;5’末端帽;选自由以下组成的组的主链修饰:硫代磷酸酯修饰、膦酸甲酯修饰、锁核酸(lna)修饰、o-(2-甲氧基乙基)(moe)修饰、二ps修饰以及肽核酸(pna)修饰;一个或多个链内交联;缀合至其、优选地在所述gron的5’或3’端处的一种或多种荧光染料;以及增加杂交能量的一个或多个碱基。此列表不意图是限制性的。如下文所述,在某些实施方案中,gron质量和转化效率可通过使用改进其纯度的核苷酸多聚体如二聚体、三聚体、四具体等合成gron的全部或一部分来改进。在某些实施方案中,靶脱氧核糖核酸(dna)序列是在植物细胞基因组内。植物细胞可以是非转基因或转基因的,并且靶dna序列可以是所述植物细胞的转基因或内源基因。在某些实施方案中,增加一种或多种细胞dna修复过程的条件包括引入一种或多种化合物,所述化合物在将gron递送至植物细胞中之前或同时诱导单或双dna链分解至植物细胞中。示例性化合物在下文描述。本文所述的方法和组合物适用于一般植物。仅作为举例,植物物种可选自由以下组成的组:芥花、向日葵、玉米、烟草、甜菜、棉花、玉米、小麦、大麦、水稻、苜蓿(alfafa)、大麦、高粱、西红柿、芒果、桃子、苹果、梨、草莓、香蕉、甜瓜、土豆、胡萝卜、莴苣、洋葱、大豆、大豆属、甘蔗、豌豆、鹰嘴豆、紫花豌豆(fieldbean)、蚕豆、扁豆、萝卜、芜菁甘蓝、球芽甘蓝(brusselsprouts)、羽扇豆、花椰菜、羽衣甘蓝、菜豆、杨树、松树、桉树、葡萄、柑橘、黑小麦、苜蓿、黑麦、燕麦、草皮和牧草、亚麻、油菜、芥菜、黄瓜、牵牛花、香脂、辣椒、茄子、万寿菊、莲花、卷心菜、菊花、康乃馨、郁金香、鸢尾以及百合。这些还可全部或部分地适用于所有其他生物系统,包括但不限于细菌、真菌和哺乳动物细胞以及甚至其细胞器(例如,线粒体和叶绿体)。在某些实施方案中,所述方法还包括从植物细胞再生具有通过gron引入的突变的植物,并且可包括从所述植物采集种子。在相关方面,本发明涉及包含根据本文所述的方法通过gron引入的基因组修饰的植物细胞,包含根据本文所述的方法通过gron引入的基因组修饰的植物,或包含根据本文所述的方法通过gron引入的基因组修饰的种子。本发明的其他实施方案将是从以下详述、示例性实施方案和权利要求书显而易见的。附图简述图1描绘通过硫代磷酸酯(ps)标记的gron(在gron的每一端具有3ps部分)和5’cy3/3’idc标记的gron介导的bfp至gfp转化。图2描绘包含rna/dna的gron(本文被称为“冈崎片段gron”)。图3描绘了嵌合crrna的表达载体的示意图。发明详述在过去几年内发展,通过寡核苷酸介导的靶向遗传修饰已被证明是用于dna的短链段的特异性改变以产生缺失、短插入和点突变的有价值的技术。这些方法涉及dna配对/退火,接着dna修复/重组事件。首先,核酸在由细胞蛋白质因子介导的过程中与双链dna中的其互补链退火。这种退火产生位于中心的错配碱基对(在点突变的情况下),从而导致最可能刺激内源性蛋白质机器以起始修复过程的第二阶段的结构微扰:染色体序列和甚至其细胞器(例如,线粒体和叶绿体)的位点特异性修饰。这种新引入的错配诱导dna修复机器进行第二修复事件,从而导致靶位点的最终修改。本方法通过提供创新颖方法来改进这些方法,所述方法增加dna修复组分的可用性,从而增加对靶核酸的基因修复介导的修饰的效率和可再现性。定义为了有助于理解本发明,在下文定义多个术语。如本文所用的“核酸序列”、“核苷酸序列”和“多核苷酸序列”是指寡核苷酸或多核苷酸以及其片段或部分,并且是指基因组或合成来源的dna或rna,其可以是单链或双链的并且表示有义链或反义链。如本文所用,术语“寡核苷酸”和“寡聚物”是指至少约10个核苷酸且多达约201个核苷酸、优选约15至30个核苷酸且更优选约20-25个核苷酸的核酸序列,其可用作探针或扩增引物。如本文所用的术语“dna修饰分子”和“dna修饰试剂”是指能够识别且特异性地结合细胞基因组中的核酸序列并且能够修饰基因组内的靶核苷酸序列的分子,其中dna修饰分子识别和特异性结合核酸序列是蛋白质独立性的。如本文结合dna修饰分子所用的术语“蛋白质独立性的”意指dna修饰分子不需要蛋白质和/或酶的存在和/或活性来用于识别和/或特异性地结合核酸序列。dna修饰分子举例说明但不限于三链体形成寡核苷酸、肽核酸、聚酰胺和寡核苷酸,其意图促进基因转换。本发明的dna修饰分子与用于同源重组的现有技术核酸序列[wong&capecchi,molec.cell.biol.7:2294-2295,1987]的区别在于用于同源重组的现有技术核酸序列是蛋白质依赖性的。如本文结合分子所用的术语“蛋白质依赖性的”意指分子需要蛋白质和/或酶的存在和/或活性来用于分子对核酸序列的识别和/或特异性地结合。用于确定dna修饰分子是否需要蛋白质和/或酶的存在和/或活性来识别和/或特异性地结合核酸序列的方法在本领域的技术内[参见例如,dennis等nucl.acidsres.27:4734-4742,1999]。例如,dna修饰分子可在不存在任何蛋白质和/或酶的情况下在体外与核酸序列一起孵育。dna修饰分子与核酸序列之间的特异性结合的检测证明dna修饰分子是蛋白质独立性的。另一方面,dna修饰分子与核酸序列之间的特异性结合的不存在证明dna修饰分子是蛋白质依赖性的和/或需要另外的因子。“三链体形成寡核苷酸”(tfo)被定义为能够结合在双链dna或rna螺旋的大沟中以形成三螺旋的dna或rna的序列。虽然tfo不限于任何具体长度,但tfo的优选长度是200个核苷酸或更少,更优选100个核苷酸或更少,仍然更优选地5至50个核苷酸,甚至更优选10至25个核苷酸,并且最优选15至25个核苷酸。虽然tfo与双链dna之间的序列特异性程度对于三螺旋的形成来说是必要的,但不需要特定特异性程度,只要三螺旋能够形成即可。同样,不需要tfo与双螺旋之间的特定亲合力或亲和力程度,只要三螺旋能够形成即可。虽然不意图限制在一个实施方案中tfo所特异性地结合的核苷酸序列的长度,但tfo所特异性结合的核苷酸序列是1至100、更优选5至50、仍然更优选10至25且最优选15至25个核苷酸。此外,“三螺旋”被定义为具有结合至双螺旋核酸内的靶序列的寡核苷酸的双螺旋核酸。“双螺旋”核酸可以是任何双链核酸,包括双链dna、双链rna和dna与rna的混合双链。双链核酸不限于任何具体长度。然而,在优选的实施方案中,它具有大于500bp、更优选大于1kb且最优选大于约5kb的长度。在许多应用中,双螺旋核酸是细胞、基因组核酸。三链体形成寡核苷酸可以平行或反平行方式结合靶序列。“肽核酸”、“聚酰胺”或“pna”是其中磷酸主链被基于n-氨基乙基甘氨酸的聚酰胺结构置换的核酸。pna具有比遵循沃森-克里克(watson-crick)碱基配对规则的其天然对应物对于互补核酸的更高亲和力。pna可形成具有以下化学计量学的dna的高度稳定的三螺旋结构:(pna)2.dna。虽然肽核酸和聚酰胺不限于任何具体长度,但肽核酸和聚酰胺的优选长度是200个核苷酸或更少,更优选100个核苷酸或更少,且最优选5至50个核苷酸长。虽然不意图限制在一个实施方案中肽核酸和聚酰胺所特异性地结合的核苷酸序列的长度,但肽核酸和聚酰胺所特异性地结合的核苷酸序列是1至100、更优选5至50、仍然更优选5至25且最优选5至20个核苷酸。术语“细胞(cell)”是指单个细胞。术语“细胞(cells)”是指细胞的群体。群体可以是包含一种细胞类型的纯群体。同样,群体可包含多于一种细胞类型。在本发明中,关于细胞群体可包含的细胞类型的数目不存在限制。当提及细胞的样品时术语“同步”或“同步的”,或“同步细胞”或“同步细胞群体”是指已经处理以引起细胞群体处于细胞周期的同一阶段的多个细胞。样品中的所有细胞不必要是同步的。一小部分细胞可能不与样品中的大多数细胞同步。同步细胞的优选范围是10%-100%之间。更优选的范围是30%-100%之间。此外,细胞不必是单一细胞类型的纯群体。多于一种细胞类型可包含于样品中。在此方面,如与样品中的另一种细胞类型相比,仅一种细胞类型可同步或可处于细胞周期的不同阶段。当提及单个细胞时术语“同步细胞”意指细胞已进行操作以使得其处于与在操作之前细胞的细胞周期阶段不同的细胞周期阶段。或者,“同步细胞”是指已进行操作以在与对照细胞(例如,不存在操作的细胞)相比时改变(即,增加或减少)在操作之前细胞所处的细胞周期阶段的持续时间。术语“细胞周期”是指当分裂(即增殖)时细胞所经历的变化的生理学和形态学进展。细胞周期通常被认为包括被称为“间期”、“前期”、“中期”、“后期”和“末期”的阶段。此外,细胞周期的部分可被称为“m(有丝分裂)”、“s(合成)”、“g0”、“g1(间隙1期)”和“g2(间隙2期)”。此外,细胞周期包括以上所述阶段中间的进展时期。术语“细胞周期抑制”是指细胞或细胞群体中细胞周期进展的终止。细胞周期抑制通常通过使细胞暴露于干扰细胞生理学的方面以防止细胞周期继续的药剂(化学的、蛋白质的或其他)来诱导。“增殖”或“细胞生长”是指亲本细胞重复地分裂成两个子代细胞、从而导致群体中细胞的总体增加的能力。细胞群体可处于生物体或培养设备中。术语“能够修饰dna”或“dna修饰方式”是指具有诱导或能够帮助诱导dna的靶向区段的核苷酸序列的变化的工序以及内源性或外源性药剂或试剂。这类变化可通过基于靶向dna区段一个或多个的缺失、添加或取代来进行。dna序列变化不必赋予由靶向序列编码的任何基因的功能性变化。此外,dna的变化不必对任何特定部分或百分比的细胞进行。术语“目标核苷酸序列”是指任何核苷酸序列,所述核苷酸序列的操作可出于任何原因由本领域的普通技术人员认为是合乎需要的。这类核苷酸序列包括但不限于结构基因(例如,报道基因、选择性标志物基因、致癌基因、耐药基因、生长因子等)的编码序列以及不编码mrna或蛋白质产物的非编码调控序列(例如,启动子序列、增强子序列、聚腺苷酸化序列、终止序列、调控rna如mirna等)。“氨基酸序列”、“多肽序列”、“肽序列”和“肽”在本文中可互换使用来指代氨基酸的序列。如本文所用的“靶序列”是指包含长度优选大于8个核苷酸但长度少于201个核苷酸的序列的双螺旋核酸。在一些实施方案中,靶序列优选地在8至30个碱基之间。一般来说,靶序列由双螺旋核酸上的链之一上的核苷酸序列限定。如本文所用,当提及双螺旋核酸序列的链之一上的核苷酸序列时,“富含嘌呤的序列”或“多嘌呤序列”被定义为核苷酸的连续序列,其中靶序列的多于50%的核苷酸包含嘌呤碱基。然而,优选的是,富含嘌呤的靶序列含有多于60%的嘌呤核苷酸,更优选多于75%的嘌呤核苷酸,下一最优选多于90%的嘌呤核苷酸且最优选100%嘌呤核苷酸。如本文所用,当提及双螺旋核酸序列的链之一上的核苷酸序列时,“富含嘧啶的序列”或“多嘧啶序列”被定义为核苷酸的连续序列,其中靶序列的多于50%的核苷酸包含嘧啶碱基。然而,优选的是,富含嘧啶的靶序列含有多于60%的嘧啶核苷酸,且更优选地多于75%的嘧啶核苷酸。在一些实施方案中,序列含有优选多于90%的嘧啶核苷酸并且在其他实施方案中最优选100%的嘧啶核苷酸。第一核苷酸序列的“变体”被定义为与所述第一核苷酸序列不同的核苷酸序列(例如,通过具有可使用杂交测定或使用dna测序检测的一个或多个缺失、插入或取代)。检测第一核苷酸序列的基因组序列的改变或修饰包括在此定义内。例如,杂交测定可用于检测:(1)当包含在基因组中时能够与第一核苷酸序列杂交的限制酶片段的模式的改变(即,rflp分析),(2)第一核苷酸序列的选定部分不能与含有第一核苷酸序列的基因组dna的样品杂交(例如,使用等位基因特异性寡核苷酸探针),(3)不适当或出人意料的杂交,如与除第一核苷酸序列的正常染色体基因座之外的基因座杂交(例如,使用荧光原位杂交法(fish)用于中期染色体播散等)。变体的一个实例是突变的野生型序列。如本文所用的术语“核酸”和“未修饰的核酸”是指已知的四种脱氧核糖核酸碱基(即鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶)中的任一种。术语“修饰的核酸”是指其结构相对于未修饰的核酸的结构改变的核酸。这类修饰的示例性将是碱基的置换共价修饰,如氨基和环氮的烷基化以及双键的饱和。如本文所用,当用于提及核酸序列时术语“突变”和“修饰”以及其语法等效物可互换地用来指代缺失、插入、取代、链分解和/或加合物的引入。“缺失”被定义为其中一个或多个核苷酸不存在的核酸序列的变化。“插入”或“添加”是已经导致添加一个或多个核苷酸的核酸序列的变化。“取代”由一个或多个核苷酸被为与所置换的一个或多个核苷酸不同的分子的分子置换引起。例如,核酸可被不同的核酸置换,如通过胸腺嘧啶被胞嘧啶、腺嘌呤、鸟嘌呤或尿苷置换来举例说明。嘧啶至嘧啶(例如,c至t或t至c核苷酸取代)或嘌呤至嘌呤(例如,g至a或a至g核苷酸取代)被称为转换,而嘧啶至嘌呤或嘌呤至嘧啶(例如g至t或g至c或a至t或a至c)被称为颠换。或者,核酸可被修饰的核酸置换,如通过胸腺嘧啶被胸腺嘧啶乙二醇置换来举例说明。突变可导致错配。术语“错配”是指两个核酸之间的非共价相互作用,每个核酸驻留在不同的多核酸序列上,所述核酸不遵循碱基配对规则。例如,对于部分互补的序列5′-agt-3′和5′-aat-3′来说,存在g-a错配(转换)。术语“加合物的引入”或“加合物形成”是指分子与dna序列中的一个或多个核苷酸的共价或非共价键联以使得所述键联导致dna复制和/或转录水平的降低(优选从10%至100%,更优选从50%至100%,且最优选从75%至100%)。当提及双链核酸序列时术语“链分解”包括单链分解和/或双链分解。单链分解(缺口)是指双链核酸序列的两条链之一中的中断。这与双链分解形成对比,双链分解是指双链核酸序列的两条链中的中断。链分解可直接地(例如,通过电离辐射或用某些化学品处理)或间接地(例如,通过在核酸碱基处的酶切割)引入至双链核酸序列中。术语“突变细胞”和“修饰的细胞"是指在细胞的基因组序列中含有至少一种修饰的细胞。当用于提及核苷酸序列时术语“部分”是指所述核苷酸序列的片段。所述片段大小在5个核苷酸残基至整个核苷酸序列减去一个核酸残基的范围内。dna分子被说成具有“5′端”和“3′端”,因为单核苷酸以使得一个单核苷酸戊糖环的5′磷酸通过磷酸二酯键联连接至在一个方向上的其邻居的3′氧的方式反应以制备寡核苷酸。因此,如果寡核苷酸的5′磷酸未连接至单核苷酸戊糖环的3′氧,则寡核苷酸的那端被称为“5′端”。如果寡核苷酸的3′氧未连接至另一个单核苷酸戊糖环的5′磷酸,则寡核苷酸的那端被称为“3′端”。如本文所用,即使在较大寡核苷酸内部,核酸序列也可被称为具有5′端和3′端。在线性或环状dna分子中,离散元件被称为在5′元件或3′元件的“上游”或“下游”。此术语反映转录沿dna链在5′至3′方向上进行。引导所连接的基因的转录的启动子和增强子元件通过位于编码区的5′或上游。然而,增强子元件即使在位于启动子元件和编码区的3′时也可施加其作用。转录终止和多腺苷酸化信号位于编码区的3′或下游。如本文所用的术语“重组dna分子”是指通过分子生物学技术连接在一起的dna区段构成的dna分子。如本文所用的术语“重组蛋白”或“重组多肽”是指使用重组dna分子表达的蛋白质分子。如本文所用,术语“载体”和“媒介物”可互换用于指将dna区段从一个细胞转移至另一个细胞的核酸分子。如本文所用的术语“处于可操作的组合中”、“处于可操作的顺序”以及“可操作地连接”是指核酸序列的键联处于这种方式,所述方式使得产生能够引导给定基因的转录和/或所需蛋白质分子的合成的核酸分子。所述术语还指氨基酸序列的键联处于这种方式,所述方式使得产生功能性蛋白质。如本文所用的术语“转染”是指将外来dna引入至细胞中。。转染可通过本领域已知的各种方式来完成,包括磷酸钙-dna共沉淀、deae葡聚糖介导的转染、聚凝胺介导的转染、电穿孔、显微注射、脂质融合、脂质转染剂、原生质体融合、逆转录病毒感染、基因枪(即,粒子轰击)等等。如本文所用,术语“互补的”或“互补性”用于指通过碱基配对规则相关的“多核苷酸”和“寡核苷酸”(其是指核苷酸序列的可互换的术语)。例如,序列“5′-cagt-3′”与序列“5′-actg-3′”互补。互补性可以是“部分的“或”全部”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则不匹配。核酸之间的“全部”或“完全”互补性是其中每一个核酸碱基在碱基配对规则下与另一碱基匹配。核酸链之间的互补性程度可对核酸链之间杂交的效率和强度具有重要作用。这在扩增反应以及依赖于核酸之间的结合的检测方法中可能具有特殊重要性。为方便起见,术语“多核苷酸”和“寡核苷酸”包括包含核苷的分子。如本文所用关于核苷酸序列的术语“同源性”和“同源的”是指与其他核苷酸序列的互补性程度。可存在部分同源性或完全同源性(即,同一性)。当关于双链核酸序列如cdna或基因组克隆使用时,术语“基本上同源”是指能够在如上所述的低严格度条件下与双链核酸序列的任一链或两个链杂交的任何核酸序列(例如,探针)。与核酸序列部分互补,即“基本上同源”的核苷酸序列是至少部分地抑制完全互补的序列与靶核酸序列的杂交的核苷酸序列。完全互补核酸序列与靶序列的杂交的抑制可使用杂交测定(dna印迹或rna印迹、溶液杂交等)在低严格度条件下来检查。基本上同源的序列或探针将在低严格度条件下竞争并且抑制完全同源序列与靶序列的结合(即,杂交)。这并不是说低严格度条件使得允许非特异性结合,因为低严格度条件要求两个序列彼此的结合是特异性(即,选择性)相互作用。不存在非特异性结合可通过使用缺乏甚至部分互补性程度(例如,小于约30%同一性)的第二靶序列来测试;在不存在非特异性结合的情况下,探针将不与第二非互补靶标杂交。低严格度条件包括等效于以下的条件:在68℃下在由以下组成的溶液中结合或杂交:5×sspe(43.8g/lnacl、6.9g/lnah2po4·h2o和1.85g/ledta,用naoh将ph调节至7.4)、0.1%sds、5×登哈特氏试剂(50×登哈特氏含有每500ml:5gficoll(400型,pharmacia)、5gbsa(级分v;sigma))和100μg/ml变性的鲑鱼精子dna,接着当采用长度为约100至约1000个核苷酸的探针时在室温下在包含2.0×sspe、0.1%sds的溶液中洗涤。此外,促进在高严格度条件下杂交(例如,增加杂交和/或洗涤步骤的温度,在杂交溶液中使用甲酰胺等)的条件是本领域中熟知的。当关于核酸杂交使用时,高严格度条件包括等效于以下的条件:在68℃下在由以下组成的溶液中结合或杂交:5×sspe、1%sds、5×登哈特氏试剂和100μg/ml变性的鲑鱼精子dna,接着当采用长度为约100至约1000个核苷酸的探针时在68℃下在包含0.1×sspe和0.1%sds的溶液中洗涤。本领域中熟知多种等效条件可用于包括低严格度条件;可改变因素如探针的长度和性质(dna、rna、碱基组成)和靶标的性质(dna、rna、碱基组成,存在于溶液中或固定的等)以及盐和其他组分的浓度(例如,甲酰胺、硫酸葡聚糖、聚乙二醇的存在或不存在)以及杂交溶液的组分以产生不同于但等效于上文列举的条件的低严格度杂交条件。当在涉及目标杂交条件时提及杂交条件时,术语“等效”意指杂交条件和目标杂交条件导致具有相同范围的同源性百分比(%)的核酸序列的杂交。例如,如果目标杂交条件导致第一核酸序列与具有与所述第一核酸序列50%至70%同源性的其他核酸序列的杂交,那么另一种杂交条件在以下情况下被说成等效于所述目标杂交条件:此另一杂交条件也导致所述第一核酸序列与具有与所述第一核酸序列50%至70%同源性的其他核酸序列的杂交。如本文所用,术语“杂交”用于指使用任何方法进行互补核酸的配对,通过所述方法核酸的一条链通过碱基配对与互补链连接以形成杂交复合物。杂交和杂交的强度(即,核酸之间的缔合强度)受这类因素如核酸之间的互补性程度、所涉及的条件的严格度、所形成的杂合体的tm以及核酸内的g:c比例影响。如本文所用,术语“杂交复合物”是指通过在互补g和c碱基之间和互补a和t碱基之间形成氢键在两个核酸序列之间形成的复合物;这些氢键可通过碱基堆叠相互作用进一步稳定。两个互补核酸序列氢键呈反平行构型。杂交复合物可在溶液中(例如,科特(cot)或罗特(rot)分析)或在存在于溶液中的一个核酸序列与固定至固相支持体(例如,如用于dna印迹和rna印迹、斑点印迹中的尼龙膜或硝基纤维素滤膜,或如用于原位杂交、包括fish(荧光原位杂交)中的载玻片)的另一个核酸序列之间形成。如本文所用,术语“tm”用于指“解链温度”。解链温度是双链核酸分子的群体变成半数解离成单个链的温度。用于计算核酸的tm的等式是本领域中熟知的。如由标准参考文献所指示,tm值的简单估算可通过以下等式计算:tm=81.5+0.41(%g+c),当核酸处于1mnacl下的水溶液中时(参见,例如anderson和young,quantitativefilterhybridization,innucleicacidhybridization,1985)。其他参考文献包括更复杂的计算,所述计算将结构以及序列特征考虑在内用于计算tm。如本文所用,术语“严格度”用于指进行核酸杂交的温度条件、离子强度和其他化合物如有机溶剂的存在。“严格度”通常在约tm℃到低于tm约20℃至25℃的范围内发生。如本领域的技术人员将了解,严格杂交可用于鉴别或检测相同的多核苷酸序列或用于鉴别或检测类似或相关的多核苷酸序列。当提及第一核苷酸序列与第二核苷酸序列的结合时,术语“特异性结合”、“结合特异性”以及其语法等效物是指相较于所述第二核苷酸序列与第三核苷酸序列之间的相互作用,所述第一核苷酸序列与第二核苷酸序列之间的优先相互作用。特异性结合时不要求绝对结合特异性的相关术语;换言之,术语“特异性结合”不要求所述第二核苷酸序列与所述第一核苷酸序列在不存在所述第二核苷酸序列和第三核苷酸序列的相互作用的情况下相互作用。而是,所述第一核苷酸序列与所述第二核苷酸序列之间的相互作用水平足够大于所述第二核苷酸序列与所述第三核苷酸序列之间的相互作用水平。第一核苷酸序列与第二核苷酸序列的“特异性结合”还意指所述第一核苷酸序列与所述第二核苷酸序列之间的相互作用依赖于所述第一核苷酸序列之上或之内的特定结构的存在;换言之,所述第二核苷酸序列识别且结合所述第一核苷酸序列之上或之内的特异性结构而不是总体上结合核酸或结合核苷酸序列。例如,如果第二核苷酸序列对于第一核苷酸序列之上或之内的结构“a”具有特异性,则含有结构a的第三核酸序列的存在将减少结合至第一核苷酸序列的第二核苷酸序列的量。如本文所用,术语“可扩增的核酸”用于指可通过任何扩增方法扩增的核酸。考虑“可扩增的核酸”通常将包括“样品模板”。术语“异源核酸序列”或“异源dna”可互换地用于指连接至核酸序列的核苷酸序列,在自然中所述核苷酸不与所述核酸序列连接或在自然中所述核苷酸序列与所述核酸序列在不同位置连接。异源dna对于其所引入的细胞不是内源的,而是获自另一细胞。通常但不是必须地,这种异源dna编码通常不由表达其的细胞产生的rna和蛋白质。异源dna的实例包括报道基因、转录和翻译调控序列、选择性标志物蛋白(例如,赋予耐药性的蛋白质)等。“扩增”被定义为产生核酸序列的另外拷贝,并且通常使用本领域中熟知的聚合酶链式反应技术来进行(dieffenbachcw和gsdveksler(1995)pcrprimer,alaboratorymanual,coldspringharborpress,plainview,n.y.)。如本文所用,术语“聚合酶链式反应”(“pcr”)是指特此以引用的方式并入的k.b.mullis美国专利号4,683,195和4,683,202的方法,所述专利描述用于在无克隆或纯化的情况下增加基因组dna的混合物中靶序列的区段浓度的方法。所需靶序列的扩增区段的长度由两个寡核苷酸引物相对于彼此的相对位置决定,并且因此此长度是可控制的参数。通过所述方法的重复方面,所述方法被称为“聚合酶链式反应”(下文“pcr”)。因为靶序列的所需扩增区段变成混合物中的主要序列(就浓度而言),所以它们被称为“pcr扩增的”。使用pcr,有可能将基因组dna中的特定靶序列的单个拷贝扩增至可通过几种不同方法(例如,与标记的探针杂交;并入生物素化的引物,接着抗生物素蛋白-酶缀合物检测;将32p标记的脱氧核苷三磷酸如dctp或datp并入至扩增区段中)检测的水平。除了基因组dna之外,任何寡核苷酸序列可用适当组的引物分子扩增。具体地说,通过pcr方法本身产生的扩增区段本身是用于后续pcr扩增的有效模板。这样一种优选的方法(特别是对于商业应用来说)是基于广泛使用的实时pcr技术,并且组合等位基因特异性pcr与阻断剂(asb-pcr)来抑制野生型等位基因的扩增。asb-pcr可用于检测从任何类型的组织(包括福尔马林固定的石蜡包埋的肿瘤标本)提取的dna或rna中的种系或体细胞突变。发展了一组试剂设计规则,从而实现针对野生型等位基因的背景呈千倍或更大过量的单个点取代、插入或缺失的敏感性和选择性检测。(morlanj,bakerj,sinicropidmutationdetectionbyreal-timepcr:asimple,robustandhighlyselectivemethod.plosone4(2):e4584,2009)术语“逆转录聚合酶链式反应”和“rt-pcr”是指一种用于逆转录rna序列以产生cdna序列的混合物,接着在无克隆或纯化的情况下增加所述混合物中所转录cdna序列的所需区段的浓度的方法。通常,在使用两种引物pcr扩增所转录dna的所需区段之前使用单个引物(例如,寡-dt引物)逆转录rna。如本文所用,术语“引物”是指无论是作为纯化的限制性酶切消化物天然存在的还是合成产生的寡核苷酸,当置于诱导与核酸链互补的引物延伸产物的合成的条件下(即,在核苷酸和诱导剂如dna聚合酶的存在下和在适合的温度和ph下)时所述寡核苷酸能够充当合成起始点。引物优选地是单链的以获得最大扩增效率,但可替代地是双链的。如果是双链的,首先对引物进行处理以在用于制备延伸产物之前分离其链。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长以在诱导剂存在下引发延伸产生的合成。引物的确切长度将取决于许多因素,包括温度、引物来源和方法的使用。如本文所用,术语“探针”是指无论是作为纯化的限制性酶切消化物天然存在还是合成、重组或通过pcr扩增产生的寡核苷酸(即,核苷酸的序列),所述寡核苷酸能够与另一目标寡核苷酸杂交。探针可以是单链的或双链的。探针适用于特定基因序列的检测、鉴别和分离。考虑用于本发明的任何探针将用任何“报道分子”标记,以使得它可在任何检测系统中检测,所述系统包括但不限于酶(例如,elisa以及基于酶的组织化学测定)、荧光系统、放射性系统和发光系统。不意图本发明限于任何特定检测系统或标记。如本文所用,术语“限制性核酸内切酶”和“限制酶”是指细菌酶,其各自在特异性核苷酸序列处或附近切割双链或单链dna或使其缺口,例如可使用iis型限制性核酸内切酶的核酸内切酶结构域(例如,foki),如由kim等,1996,proc.nat’l.acad.sci.usa,6:1156-60)所教导。如本文所用,术语“具有编码基因的核苷酸序列的寡核苷酸”意指包含基因的编码区的核酸序列,即编码基因产物的核酸序列。编码区可以cdna、基因组dna或rna形式存在。当以dna形式存在时,寡核苷酸可以是单链的(即,有义链)或双链的。另外,如果需要允许正确起始初级rna转录物的转录和/或正确加工,“具有编码基因的核苷酸序列的寡核苷酸”可包括适合的控制元件,如增强子、启动子、剪接点、多腺苷酸化信号等。此外,本发明的编码区可包含内源性增强子、剪接点、插入序列、多腺苷酸化信号等。真核细胞中的转录控制信号包含“增强子”元件。增强子包括与参与转录的细胞蛋白质特异性地相互作用的dna序列的较短阵列(maniatis,t.等,science236:1237,1987)。增强子元件已经从多种真核细胞来源分离,包括植物、酵母、昆虫和哺乳动物和细胞和病毒中的基因。特定增强子的选择取决于将使用什么细胞类型来表达目标蛋白质。表达载体上“剪接信号”的存在经常导致较高水平的重组转录物表达。剪接信号介导从初级rna转录物除去内含子并且包括剪接供体和受体位点(sambrook,j.等,molecularcloning:alaboratorymanual,第2版,coldspringharborlaboratorypress,newyork,第16.7-16.8页,1989)。通常使用的剪接供体和受体位点是来自sv40的16srna的剪接点。真核细胞中重组dna序列的有效表达需要表达引导所得到的转录物的有效终止和多腺苷酸化的信号。转录终止信号通常见于多腺苷酸化信号的下游并且长度是数百个核苷酸。如本文所用的术语“聚a位点”或“聚a序列”表示引导新生rna转录物的终止和多腺苷酸化两者的dna序列。重组转录物的有效多腺苷酸化是合乎需要的,因为缺乏聚a尾的转录物是不稳定的且快速降解。表达载体中使用的聚a信号可以是“异源性的”或“内源性的”。内源性聚a信号是在基因组中给定基因的编码区的3′端天然发现的聚a信号。异源性聚a信号是与一种基因分离且位于另一基因的3′的聚a信号。如本文所用的术语“启动子”、“启动子元件”或“启动子序列”是指当置于寡核苷酸序列的5′端(即,在其前面)时能够控制寡核苷酸序列转录成mrna的dna序列。启动子通常位于寡核苷酸序列的5′(即,上游),其控制寡核苷酸转录成mrna,并且提供用于由rna聚合酶特异性结合和用于起始转录的位点。当提及核酸序列时,术语“启动子活性”是指核酸序列起始寡核苷酸序列转录成mrna的能力。术语“组织特异性”在其应用于启动子时是指能够在于不同类型的组织中寡核苷酸的表达的相对不存在下引导针对特定类型的组织选择性表达相同寡核苷酸序列的启动子。启动子的组织特异性可通过以下方式来评估:例如,将报道基因可操作地连接至启动子序列以产生报道基因构建体,将所述报道基因构建体引入至植物或动物的基因组中,以使得所述报道基因构建体被整合至所得到的转基因动物的每一组织中,并且检测所述转基因植物或动物的不同组织中报道基因的表达(例如,检测mrna、蛋白质或由报道基因编码的蛋白质的活性)。选择性不必是绝对的。在一种或多种组织中检测到报道基因相对于在其他组织中报道基因的表达水平更高的表达水平表明启动子对于其中检测到更高表达水平的组织来说是特异性的。术语“细胞类型特异性”在应用于启动子时是指能够在于同一组织内的不同细胞类型中寡核苷酸序列的表达的相对不存在下引导相同寡核苷酸序列在特定细胞类型中的选择性表达的启动子。术语“细胞类型特异性”当应用于启动子时也意指能够促进寡核苷酸在单一组织内的区域中的选择性表达的启动子。再次,选择性不必是绝对的。启动子的细胞类型特异性可使用本领域中熟知的方法来评定,例如,如本文所述的免疫组织化学染色。简言之,将组织切片包埋于石蜡中,并且使石蜡切片与第一抗体反应,所述第一抗体对由寡核苷酸序列编码的多肽产物具有特异性,所述寡核苷酸序列的表达受启动子控制。作为石蜡切片的替代方案,可将样品冷冻切片。例如,可在切片之前或期间冷冻切片,从而避免残余石蜡的潜在干扰。允许对第一抗体具有特异性的标记的(例如,过氧化物酶缀合的)第二抗体结合切片的组织且通过显微术检测特异性结合(例如,用抗生物素蛋白/生物素)。术语“选择性表达”、“选择性地表达"及其语法等效物是指在两个或更多个目标区域中相对表达水平的比较。例如,“选择性表达”当与组织结合使用时是指目标基因在特定组织中或表达所述基因的细胞在所述组织内分别与同一基因在另一组织中的表达水平和表达所述基因的细胞在另一组织中的数目相比基本上更高的表达水平或基本上更大的细胞数目(即,选择性不必是绝对的)。选择性表达不要求(但它可包括)目标基因在特定组织中的表达和同一基因在另一组织中表达的总体不存在。类似地,如本文关于细胞类型所用的“选择性表达”是指目标基因在特定细胞类型中或表达所述基因的细胞在特定细胞类型中当分别与所述基因在另一细胞类型中的表达水平或表达所述基因的细胞在另一细胞类型中的数目相比时基本上更高的表达水平或基本上更大的细胞数目。当关于两个或更多个核苷酸序列使用时术语“连续的”意指核苷酸序列在不存在插入序列的情况下或在存在不包含一个或多个控制元件的插入序列的情况下串联连接。如本文所用,术语“编码……的核酸分子”、“编码……的核苷酸”、“编码……的dna序列”和“编码……的dna”是指沿着脱氧核糖核酸链的脱氧核糖核苷酸的顺序或序列。这些脱氧核糖核苷酸的顺序确定沿着多肽(蛋白质)链的氨基酸顺序。因此,dna序列编码氨基酸序列。当关于核酸使用时,术语“分离的”(如在“分离的寡核苷酸”中)是指在其天然来源中通常与之缔合的至少一种污染物核酸分离的核酸序列。分离的核酸是以不同于在自然中发现它的形式或布置存在的核酸。相比之下,未分离的核酸是以它们存在于自然中的状态发现的核酸如dna和rna。例如,给定dna序列(例如,基因)接近邻近基因在宿主细胞染色体上发现;rna序列如编码特定蛋白质的特异性mrna序列在细胞中作为与编码众多蛋白质的多种其他mrna的混合物发现。然而,编码目标多肽的分离的核酸作为举例包括通常表达目标多肽的细胞中的核酸,其中所述核酸处于不同于天然细胞的核酸的染色体或染色体外位置中,或以另外的方式由与在自然中发现的不同的核酸序列侧接。分离的核酸或寡核苷酸可以单链或双链形式存在。分离的核酸可通过多种技术(例如杂交、斑点印迹等)容易地鉴别(如果需要)。当分离的核酸或寡核苷酸待用于表达蛋白质时,所述寡核苷酸将最低限度含有有义链或编码链(即,寡核苷酸可以是单链的)。或者,它可含有有义链和反义链(即,寡核苷酸可以是双链的)。如本文所用,术语“纯化的”或“以纯化”是指从样品中除去一种或多种(不需要的)组分。例如,在重组多肽在细菌宿主细胞中表达的情况下,通过除去宿主细胞蛋白质纯化多肽,从而增加重组多肽在所述样品中的百分比。如本文所用,术语“基本上纯化的”是指从其天然环境中除去、分离或分开的并且至少60%不含、优选地75%不含且更优选地90%不含与它们所天然缔合的其他组分的分子(核酸或氨基酸序列)。因此“分离的多核苷酸”是基本上纯化的多核苷酸。如本文所用,当关于结构基因使用时术语“编码区”是指编码由于mrna分子的翻译而在初生多肽中发现的氨基酸的核苷酸序列。在真核生物中编码区在5'侧的边界通常为编码起始子甲硫氨酸的核苷酸三联体“atg”,而在3'侧的边界为规定终止密码子的三个三联体(即,taa、tag、tga)之一。“编码序列”意指可转录和/或翻译以产生mrna和/或多肽或其片段的核酸或其补体或其部分的序列。编码序列包括基因组dna或不成熟的初级rna转录物中的外显子,所述外显子通过细胞的生物化学机器连接在一起以提供成熟的mrna。反义链是这种核酸的补体,并且编码序列可从其中推断出。“非编码序列”意指不体内转录成氨基酸或其中trna不相互作用以放置或试图放置氨基酸的核酸或其补体或其部分的序列。非编码序列包括基因组dna或不成熟的初级rna转录物中的内含子序列和基因相关序列如启动子、增强子、沉默子等两者。如本文所用,术语“结构基因”或“结构核苷酸序列”是指编码rna的dna序列或不控制其他基因的表达的蛋白质。相比之下,“调控基因”或“调控序列”是编码控制其他基因的表达的产物(例如,转录因子)的结构基因。如本文所用,术语“调控元件”是指控制核酸序列的表达的一些方面的遗传元件。例如,启动子是有助于起始可操作地连接的编码区的转录的调控元件。其他调控元件包括剪接信号、多腺苷酸化信号、终止信号等。如本文所用,术语“肽转录因子结合位点”或“转录因子结合位点”是指结合蛋白质转录因子并且从而控制核酸序列表达的一些方面的核苷酸序列。例如,sp-1和ap1(激活蛋白1)结合位点是肽转录因子结合位点的实例。如本文所用,术语“基因”意指包含结构基因的编码区的脱氧核糖核苷酸序列。“基因”还可包括在5'端和3'端两者上与编码区相邻定位的非翻译序列,以使得所述基因对应于全长mrna的长度。位于编码区的5'且存在于mrna上的序列被称为5'非翻译序列。位于编码区的3'或下游且存在于mrna上的序列被称为3'非翻译序列。术语“基因”涵盖基因的cdna和基因组形式。基因的基因组形式或克隆含有以被称为“内含子”或“插入区域”或“插入序列”的非编码序列来间断的编码区域。内含子是转录至异源核rna(hnrna)中的基因区段;内含子可含有调控元件如增强子。内含子从核或初级转录物中除去或“剪除”;因此,内含子不存在于信使rna(mrna)转录物中。mrna在翻译期间起作用以指定新生多肽中的氨基酸的序列或顺序。除了含有内含子以外,基因的基因组形式还可包括位于rna转录物上存在的序列的5'和3'端上的序列。这些序列被称为“侧接”序列或区域(这些侧接序列位于存在于mrna转录物上的非翻译序列的5'或3')。5'侧接区域可含有控制或影响基因转录的调控序列如启动子和增强子。3'侧接区域可含有引导转录终止、转录后裂解和多腺苷酸化的序列。“非人动物”是指不为人的任何动物并且包括脊椎动物如啮齿类动物、非人灵长类动物、绵羊、牛、反刍动物、兔类动物、猪、山羊、马、犬科动物、猫科动物、鸟类等。优选的非人动物选自啮齿目。“非人动物”另外是指两栖动物(例如非洲蟾蜍属)、爬行动物、昆虫(例如果蝇属)和其他非哺乳动物物种。如本文所用,术语“转基因”是指具有来源于另一种生物体的dna插入的生物体或细胞,所述dna变得整合至植物或动物的体细胞和/或种系细胞任一者的基因组中。“转基因”意指对于其中发现其的植物或动物来说部分或完全异源(即,在自然中不存在)或对于内源序列(即,在自然中在动物中发现的序列)来说同源且在与天然存在的序列的位置不同的位置处插入至植物或动物的基因组中的dna序列。包含一种或多种转基因的转基因植物或动物在本发明的范围之内。另外,如本文所用的“转基因的”是指通过本发明的方法、通过同源重组、tfo突变或通过类似的过程修饰和/或“敲除”一种或多种基因(使无功能或使在降低的水平下起作用,即“敲除”突变)的动物。例如,在一些实施方案中,转基因生物体或细胞包括包含外来启动子和/或编码区的插入的dna。“转化的细胞”是已经获得在细胞培养物中生长以获得多个代的能力、在软琼脂中生长的能力和/或不具有通过细胞与细胞接触抑制的细胞生长的能力的细胞或细胞系。在此方面,转化是指外来遗传物质引入至细胞或生物体中。转化可通过已知的任何方法完成,所述方法允许核酸成功引入至细胞中且导致所引入的核酸的表达。“转化”包括但不限于这类方法,如转染、显微注射、电穿孔、核转染和脂质转染(脂质体介导的基因转移)。转化可通过使用任何表达载体完成。例如,考虑使用杆状病毒以将外来核酸引入至昆虫细胞中。术语“转化”还包括方法如p-元件介导的整个昆虫的种系转化。另外,转化是指已经自然地转化(通常通过遗传突变)的细胞。如本文所用,“外源性”意指编码蛋白质的基因通常不在细胞中表达。此外,“外源性”是指转染至细胞中以增加所述基因的正常(即自然)表达水平。肽序列和核苷酸序列可以是“内源性的”或“异源的”(即“外来的”)。术语“内源性的”是指在其所引入的细胞中天然发现的序列,只要其不含相对于天然存在的序列的一些修饰。术语“异源性的”是指对于它所引入的细胞来说不是内源性的序列。例如,异源dna包括连接至或进行操作以变得连接至核酸序列的核苷酸序列,在自然中所述核苷酸序列不与所述核酸序列连接或在自然中所述核苷酸序列与所述核酸序列在不同位置连接。异源性dna还包括在其所引入的细胞中天然发现的且含有相对于天然存在的序列的一些修饰的核苷酸序列。通常但不是必须地,异源dna编码通常不由其所引入的细胞产生的异源rna和异源蛋白质。异源dna的实例包括编码选择性标志物蛋白(例如,赋予耐药性的蛋白质)的报道基因、转录和翻译调控序列、dna序列等。构建体本文所公开的核酸分子(例如,位点特异性核酸酶或crispr的引导rna)可用于产生重组核酸构建体。在一个实施方案中,本公开的核酸分子可用于制备核酸构建体,例如,用于在目标植物中表达的表达盒。这种表达可以是瞬时的,例如当构建体未整合至宿主基因组中或在由启动子和构建体在宿主基因组内的位置(如果构建体变得整合)提供的控制下维持。表达盒可包括可操作地连接至本文所公开的位点特异性核酸酶或引导rna序列的调控序列。所述盒可另外地包含至少一种待共转化至生物体中的另外基因。或者,可在多个表达盒上提供另外基因。所述核酸构建体可配备有多个限制位点,所述限制位点用于插入位点特异性核酸酶编码序列以便处于调控区的转录调控之下。核酸构建体可另外地包含编码选择性标志物基因的核酸分子。任何启动子可用于产生核酸构建体。启动子对于本文所公开的植物宿主核酸序列而言可以是天然的或类似的、或外来的或异源的。另外地,启动子可以是天然序列或可替代地是合成序列。在启动子对于植物宿主而言是“外来的”或“异源的”的情况下,意图启动子是在所述启动子所引入的天然植物中未发现的。如本文所用,嵌合基因包含可操作地连接至对于编码序列而言异源的转录起始区的编码序列。本文公开的位点定向核酸酶序列可使用异源启动子表达。任何启动子可用于制备构建体以控制位点定向核酸酶序列的表达,如提供用于在植物中表达的组成型、组织优选的、诱导型或其他启动子的启动子。组成型启动子包括例如,rsyn7启动子的核心启动子和在wo99/43838和美国专利号6,072,050中公开的其他组成型启动子;核心camv35s启动子(odell等nature313:810-812;1985);稻肌动蛋白(mcelroy等,plantcell2:163-171,1990);泛素(christensen等,plantmol.biol.12:619-632,1989和christensen等,plantmol.biol.18:675-689,1992);pemu(last等,theor.appl.genet.81:581-588,1991);mas(velten等,emboj.3:2723-2730,1984);als启动子(美国专利号5,659,026)等。其他组成型启动子包括例如美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142以及6,177,611。组织优选的启动子可用于引导特定植物组织内的位点定向核酸酶表达。这类组织优选的启动子包括但不限于叶优选的启动子、根优选的启动子、种子优选的启动子以及干优选的启动子。组织优选的启动子包括yamamoto等,plantj.12(2):255-265,1997;kawamata等,plantcellphysiol.38(7):792-803,1997;hansen等,mol.gengenet.254(3):337-343,1997;russell等,transgenicres.6(2):157-168,1997;rinehart等,plantphysiol.112(3):1331-1341,1996;vancamp等,plantphysiol.112(2):525-535,1996;canevascini等,plantphysiol.112(2):513-524,1996;yamamoto等,plantcellphysiol.35(5):773-778,1994;lam,resultsprobl.celldiffer.20:181-196,1994;orozco等plantmolbiol.23(6):1129-1138,1993;matsuoka等,procnat’l.acad.sci.usa90(20):9586-9590,1993;以及guevara-garcia等,plantj.4(3):495-505,1993。核酸构建体还可包括转录终止区。在使用转录终止区的情况下,任何终止区可用于制备核酸构建体。例如,终止区可源自另一来源(即,对于启动子而言外来或异源的)。可供用于本公开的构建体中的终止区的实例包括来自根癌农杆菌(a.tumefaciens)的ti质粒的那些,如章鱼碱合酶和胭脂碱合酶终止区。还参见guerineau等,mol.gen.genet.262:141-144,1991;proudfoot,cell64:671-674,1991;sanfacon等,genesdev.5:141-149,1991;mogen等,plantcell2:1261-1272,1990;munroe等,gene91:151-158,1990;ballas等,nucleicacidsres.17:7891-7903,1989;以及joshi等,nucleicacidres.15:9627-9639,1987。与本文公开的任何方面、实施方案、方法和/或组合物结合,核酸可进行优化以获得在转化的植物中增加的表达。即,编码位点定向核酸酶蛋白质的核酸可使用植物优选的密码子进行合成以获得改进的表达。关于宿主优选的密码子使用的讨论,参见例如,campbell和gowri,(plantphysiol.92:1-11,1990)。用于合成植物优选的基因的方法在本领域内是可供使用的。参见,例如美国专利号5,380,831和5,436,391,以及murray等,nucleicacidsres.17:477-498,1989。此外,可对本文公开的核酸序列进行其他序列修饰。例如,另外的序列修饰已知增强在细胞宿主中的基因表达。这些包括消除编码假多腺苷酸化信号、外显子/内含子剪接位点信号、转座子样重复序列的序列以及对于基因表达可能有害的其他这类良好表征的序列。还可将序列的g-c含量调整至靶细胞宿主的平均水平,如参照在所述宿主细胞中表达的已知基因来计算。此外,可对序列进行修饰以避免预测的发夹mrna二级结构。其他核酸序列也可用于制备本公开的构建体,例如以增强位点定向核酸酶编码序列的表达。这类核酸序列包括来自烟草花叶病毒(tmv)、玉米枯黄斑点病毒和苜蓿花叶病毒的玉米adhi、内含子基因(callis等,genesanddevelopment1:1183-1200,1987)以及前导序列(w-序列)的内含子(gallie等,nucleicacidres.15:8693-8711,1987;和skuzeski等,plantmol.biol.15:65-79,1990)。来自玉米的萎缩-1基因座的第一内含子已经显示增加嵌合基因构建体中基因的表达。美国专利号5,424,412和5,593,874公开了在基因表达构建体中使用特异性内含子,并且gallie等(plantphysiol.106:929-939,1994)也已经显示内含子适用于在组织特异性基础上调控基因表达。为了进一步增强或优化位点定向核酸酶基因表达,本文公开的植物表达载体还可包含含有基质结合区(mar)的dna序列。用这类修饰的表达系统转化的植物细胞然后可展示本公开的核苷酸序列的过量表达或组成型表达。本文公开的表达构建体还可包括能够引导针对叶绿体的位点定向核酸酶序列的表达的核酸序列。这类核酸序列包括叶绿体靶向序列,所述序列编码叶绿体转运肽以将目标基因产物引导至植物细胞叶绿体。这类转运肽是本领域中已知的。关于叶绿体靶向序列,“可操作地连接”意指编码转运肽的核酸序列(即,叶绿体靶向序列)连接至本文公开的位点定向核酸酶核酸分子,以使得两个序列是连续的且在同一阅读框中。参见例如,vonheijne等,plantmol.biol.rep.9:104-126,1991;clark等,j.biol.chem.264:17544-17550,1989;della-cioppa等,plantphysiol.84:965-968,1987;romer等,biochem.biophys.res.commun.196:1414-1421,1993;以及shah等,science233:478-481,1986。叶绿体靶向序列是本领域中已知的并且包括核酮糖-1,5-双磷酸羧化酶的叶绿体小亚基(rubisco)(decastrosilvafilho等,plantmol.biol.30:769-780,1996;schnell等,j.biol.chem.266(5):3335-3342,1991);5-(烯醇丙酮酰)莽草酸-3-磷酸合酶(epsps)(archer等,j.bioenerg.biomemb.22(6):789-810,1990);色氨酸合酶(zhao等人,j.biol.chem.270(11):6081-6087,1995);质体蓝素(lawrence等,j.biol.chem.272(33):20357-20363,1997);分支酸合酶(schmidt等,j.biol.chem.268(36):27447-27457,1993);以及光收获叶绿素a/b结合蛋白(lhbp)(lamppa等,j.biol.chem.263:14996-14999,1988)。还参见,vonheijne等,plantmol.biol.rep.9:104-126,1991;clark等,j.biol.chem.264:17544-17550,1989;della-cioppa等,plantphysiol.84:965-968,1987;romer等,biochem.biophys.res.commun.196:1414-1421,1993;以及shah等,science233:478-481,1986。与本文公开的任何方面、实施方案、方法和/或组合物结合,可制备核酸构建体以引导从植物细胞叶绿体表达突变体位点定向核酸酶编码序列。用于叶绿体转化的方法是本领域中已知的。参见例如,svab等,proc.nat’l.acad.sci.usa87:8526-8530,1990;svab和maliga,proc.nat’l.acad.sci.usa90:913-917,1993;svab和maliga,emboj.12:601-606,1993。所述方法依赖于通过同源重组将含有选择性标志物的dna粒子枪递送至质体基因组中。另外地,质体转化可通过核编码的和质体引导的rna聚合酶的组织优选的表达、通过沉默的携带质体的转基因的反式活化来完成。这种系统已经在mcbride等proc.nat’l.acad.sci.usa91:7301-7305,1994中报道。可针对在叶绿体中的表达来优化待靶向叶绿体的目标核酸,以便考虑在所述植物细胞核与这种细胞器之间在密码子使用方面的差异。按照这种方式,可使用叶绿体优选的密码子来合成目标核酸。参见例如美国专利号5,380,831,其以引用的方式并入本文。核酸构建体可用于转化植物细胞且再生包含位点定向核酸酶编码序列的转基因植物。用于转化植物的多种植物转化载体和方法是可供使用的。参见例如美国专利号6,753,458,an,g.等,plantphysiol.,81:301-305,1986;fry,j.等,plantcellrep.6:321-325,1987;block,m.,theor.applgenet.76:767-774,1988;hinchee等,stadler.genet.symp.203212.203-212,1990;cousins等,aust.j.plantphysiol.18:481-494,1991;chee,p.p.和slightom,j.l.,gene.118:255-260,1992;christou等,trends.biotechnol.10:239-246,1992;d'halluin等,bio/technol.10:309-314,1992;dhir等,plantphysiol.99:81-88,1992;casas等,proc.nat’l.acadsci.usa90:11212-11216,1993;christou,p.,invitrocell.dev.biol.-plant29p:119-124,1993;davies,等,plantcellrep.12:180-183,1993;dong,j.a.和mchughen,a.,plantsci.91:139-148,1993;franklin,c.i.和trieu,t.n.,plant.physiol.102:167,1993;golovkin等,plantsci.90:41-52,1993;guochinsci.bull.38:2072-2078;asano,等,plantcellrep.13,1994;ayeresn.m.和park,w.d.,crit.rev.plant.sci.13:219-239,1994;barcelo等,plant.j.5:583-592,1994;becker,等,plant.j.5:299-307,1994;borkowska等,acta.physiolplant.16:225-230,1994;christou,p.,agro.food.ind.hitech.5:17-27,1994;eapen等,plantcellrep.13:582-586,1994;hartman等,bio-technology12:919923,1994;ritala等,plant.mol.biol.24:317-325,1994;以及wan,y.c.和lemaux,p.g.,plantphysiol.104:3748,1994。所述构建体还可使用同源重组转化至植物细胞中。当提及肽序列和核苷酸序列时术语“野生型”分别是指当从天然存在的来源分离时具有所述肽序列和核苷酸序列的特征的肽序列和核苷酸序列(基因座/基因/等位基因)。野生型肽序列和核苷酸序列是在群体中最经常观察到的序列,并且因此分别任意指定所述肽序列和核苷酸序列的“正常”或“野生型”形式。“野生型”还可指在一个或多个特定核苷酸位置处的序列,或在一个或多个特定密码子位置处的序列,或在一个或多个特定氨基酸位置处的序列。“共有序列”被定义为对于至少25%的序列含有相同的氨基酸或核苷酸或功能上等效的氨基酸或核苷酸的氨基酸或核苷酸的序列。相同的或功能上等效的氨基酸或核苷酸不必是连续的。如本文所用的术语“芸苔属”是指芸苔属的植物。示例性芸苔属物种包括但不限于埃塞俄比亚芥(b.carinata)、长芥(b.elongate)、地中海包心菜(b.fruticulosa)、芥菜型油菜(b.juncea)、甘蓝型油菜(b.napus)、塌棵菜(b.narinosa)、黑芥(b.nigra)、甘蓝(b.oleracea)、小松菜(b.perviridis)、芜菁(b.rapa)(合成白菜型油菜(b.campestris))、褐芥(b.rupestris)、b.septiceps以及亚洲芥(b.tournefortii)。核碱基是碱基,在某些优先的实施方案中其是嘌呤、嘧啶或其衍生物或类似物。核苷是含有戊呋喃糖基部分的核碱基,例如,任选取代的核糖核苷或2'-脱氧核糖核苷。核苷可通过一些键联部分中的一种连接,所述连接部分可能含磷或不含磷。通过未取代的磷酸二酯键联连接的核苷被称为核苷酸。如本文所用的术语“核碱基”包括肽核碱基、肽核酸的亚基和吗啉核碱基以及核苷和核苷酸。寡核碱基是包含核碱基的聚合物;优选地所述聚合物的至少一部分可通过沃森-克里克(watson-crick)碱基配对与具有互补序列的dna杂交。寡核碱基链可具有单个5'和3'末端,其是聚合物的最终核碱基。特殊的寡核碱基链可含有所有类型的核碱基。寡核碱基化合物是含有一个或多个可为互补的且通过沃森-克里克碱基配对杂交的寡核碱基链的化合物。核糖型核碱基包括含有戊呋喃糖基的核碱基,其中2'碳是被羟基、烷氧基或卤素取代的亚甲基。脱氧核糖型核碱基是不同于核糖型核碱基的核碱基且包括所有不含有戊呋喃糖基部分的核碱基。在某些实施方案中,寡核碱基链可包括寡核碱基链和寡核碱基链的区段或区域两者。寡核碱基链可具有3'端和5'端,并且当寡核碱基链与一条链同延时,所述链的3'和5'端也是所述链的3'和5'末端。如本文所用的术语“基因修复寡核碱基”表示寡核碱基,包括混合双链寡核苷酸、含非核苷酸的分子、单链寡脱氧核苷酸以及其他基因修复分子。如本文所用,术语“密码子”是指构成遗传密码的三个相邻核苷酸(rna或dna)的序列,所述序列决定在蛋白质合成期间特异性核酸插入多肽链中或用于终止蛋白质合成的信号。术语“密码子”还用于指原始dna所转录至其中的信使rna中的三个核苷酸的对应(和互补)序列。如本文所用,术语“同源性”是指在蛋白质和dna之中的序列相似性。术语“同源性”或“同源的”是指同一性程度。可存在部分同源性或完全同源性。部分同源序列是当与另一序列相比时具有小于100%序列同一性的序列。“杂合的”是指在同源染色体区段中在一个或多个遗传基因座处具有不同的等位基因。如本文所用,“杂合的”还可指样品、细胞、细胞群体或生物体,其中可检测到在一个或多个遗传基因座处的不同等位基因。杂合样品还可通过本领域中已知的方法例如像核酸测序来测定。例如,如果测序电泳图谱显示在单个基因座处的两个峰且两个峰大约是相同大小,则样品可被表征为杂合的。或者,如果一个峰小于另一个,但是较大峰的大小的至少约25%,则样品可被表征为杂合的。在一些实施方案中,较小峰是较大峰的至少约15%。在其他实施方案中,较小峰是较大峰的至少约10%。在其他实施方案中,较小峰是较大峰的至少约5%。在其他实施方案中,检测到最小量的较小峰。如本文所用,“纯合的”是指在同源染色体区段中在一个或多个遗传基因座处具有相同的等位基因。“纯合的”还可指样品、细胞、细胞群体或生物体,其中可检测到在一个或多个遗传基因座处的相同等位基因。纯合样品可通过本领域中已知的方法例如像核酸测序来测定。例如,如果测序电泳图谱显示在特定基因座处的单个峰,则样品可关于所述基因座被称为“纯合的”。术语“半合子的”是指因为检测到第二等位基因而在细胞或生物体的基因型中仅出现一次的基因或基因区段。如本文所用,“半合子的”还可指样品、细胞、细胞群体或生物体,其中在基因型中仅可检测到一次在一个或多个遗传基因座处的基因。如本文所用的术语“接合性状态”是指如通过本领域中已知和本文所述的测试方法所测定出现杂合、纯合或半合子的样品、细胞群体或生物体。术语“核酸的接合性状态”意指测定核酸的来源是否出现杂合、纯合或半合子的。“接合性状态”可指序列中的单个核苷酸中的差异。在一些方法中,关于单个突变样品的接合性状态可被分类为纯合野生型、杂合(即,一个野生型等位基因和一个突变体等位基因)、纯合突变体或半合子的(即,野生型或突变体等位基因的单个拷贝)。如本文所用,术语“rtds”是指由cibus开发的therapidtraitdevelopmentsystemtm(rtds)。rtds是在不并入外来基因或控制序列的情况下有效于进行基因序列中的精确变化的位点特异性基因修饰系统。如本文所用的术语“约”意指数量上加或减10%。例如,“约3%”将涵盖2.7%-3.3%,并且“约10%”将涵盖9%-11%。修复寡核苷酸本发明总体上涉及用于改进对基因组或其他核苷酸序列中的特定位置的修饰的靶向效率的新颖方法。另外,本发明涉及已经通过本文所公开的方法修饰、突变或标记的靶dna。本发明还涉及已经通过本发明的方法修饰的细胞、组织和生物体。本发明依赖于与成功的转化系统rapidtraitdevelopmentsystem(rtdstm,cibususllc)部分相关的组合物和方法的发展。rtds是基于酮利用细胞自己的基因修复系统来特异性地修饰原位基因序列并且不插入外来dna和基因表达控制序列而改变靶向基因。这种工序实现基因序列中的精确变化,而基因组的剩余部分保持未改变。与常规转基因gmo相比,既不不存在外来遗传物质的整合,也不存在任何外来遗传物质留在植物中。通过rtds引入的基因序列的变化不是随机插入的。因为受影响的基因保持在其天然位置中,所以未发生随机、不受控制的或不利的表达模式。实现这种变化的rtds是化学合成的寡核苷酸,其可由dna和修饰的rna碱基两者以及其他化学部分组成,并且被设计成在靶向基因位置处杂交以产生错配的碱基对。这种错配的碱基对充当信号以将细胞自身的天然基因修复系统吸引至所述位点并且校正(置换、插入或缺失)所述基因内的指定核苷酸。一旦校正过程完成,rtds分子降解并且现在修饰的或修复的基因在所述基因的正常内源性控制机制下表达。本文公开的方法和组合物可用具有如下文详述描述的构象和化学的“基因修复寡核碱基”(gron)实践或进行。如本文考虑的“基因修复寡核碱基”还已经使用其他名称描述在公布的科学和专利文献中,所述名称包括“重组诱发性(recombinagenic)寡核碱基”;“rna/dna嵌合寡核苷酸”;“嵌合寡核苷酸”;“混合双链寡核苷酸(mdon)”;“rnadna寡核苷酸(rdo)”;“基因靶向寡核苷酸”;“genoplasts”;“单链修饰的寡核苷酸”;“单链寡脱氧核苷酸突变载体”(ssomv);“双链突变载体”和“异源双链突变载体”。基因修复寡核碱基可使用本领域中通常使用的任何方法引入至植物细胞中,所述方法包括但不限于微载体(生物射弹递送)、微纤维、聚乙二醇(peg)介导的摄取、电穿孔和显微注射。在一个实施方案中,基因修复寡核碱基是混合双链寡核苷酸(mdon),其中混合双链寡核苷酸的rna型核苷酸通过用氟、氯或溴官能团置换2'-羟基或通过在2'-o上安置取代基而成为rna酶抗性的。适合的取代基包括kmiecii中教导的取代基。替代取代基包括美国专利号5,334,711(sproat)教导的取代基和专利公布ep629387和ep679657(总称martin申请案)教导的取代基,其特此以引用的方式并入。如本文所用,核糖核苷酸的2'-氟、2'-氯或2'-溴衍生物或者其t-oh被martin申请案或sproat中所述的取代基取代的核糖核苷酸被称为“t-取代的核糖核苷酸”。如本文所用,术语“rna型核苷酸”意指通过未取代的磷酸二酯键联或由kmieci或kmiecii教导的任何非天然键联与混合双链寡核苷酸的其他核苷酸连接的t-羟基或2'-取代核苷酸。如本文所用,术语“脱氧核糖型核苷酸”意指具有t-h的核苷酸,其可通过未取代的磷酸二酯键联或由kmieci或kmiecii教导的任何非天然键联与基因修复寡核碱基的其他核苷酸连接。在本发明的一个具体实施方案中,基因修复寡核碱基是单独通过未取代的磷酸二酯键连接的混合双链寡核苷酸(mdon)。在替代实施方案中,通过由kmiecii教导的取代的磷酸二酯、磷酸二酯衍生物和无磷基键联进行连接。在又一个实施方案中,混合双链寡核苷酸中的每个rna型核苷酸是2'-取代的核苷酸。2'-取代的核糖核苷酸的具体优选实施方案是2'-氟、t-甲氧基、2'-丙氧基、2'-烯丙氧基、2'-羟乙氧基、2'-甲氧基乙氧基、t-氟丙氧基和2'-三氟丙氧基取代的核糖核苷酸。2'-取代的核糖核苷酸的更优选的实施方案是2'-氟、2'-甲氧基、2'-甲氧基乙氧基和2'-烯丙氧基取代的核苷酸。在另一个实施方案中,混合双链寡核苷酸通过未取代的磷酸二酯键连接。虽然仅具有单一类型的2'-取代的rna型核苷酸的混合双链寡核苷酸(mdon)更方便合成,但本发明的方法仍可用具有两种或更多种类型的rna型核苷酸的混合双链寡核苷酸实践。由在两个rna型三核苷酸之间引入脱氧核苷酸引起的中断可能不会影响rna区段的功能,因此,术语rna区段涵盖术语如“中断的rna区段”。未中断的rna区段被称为连续rna区段。在一个替代实施方案中,rna区段可含有交替的抗rna酶核苷酸和未取代的2'-oh核苷酸。混合双链寡核苷酸优选地具有少于100个核苷酸且更优选地少于85个核苷酸、但多于50个核苷酸。第一条链和第二条链进行沃森-克里克碱基配对。在一个实施方案中,混合双链寡核苷酸的链通过接头如单链六、五或四核苷酸共价键合,以使得第一条链和第二条链是具有单个3'端和单个5'端的寡核苷酸单链的区段。通过添加“发夹帽”可保护3'端和5'端,借此3'端和5'端核苷酸与邻近核苷酸进行沃森-克里克配对。另外,可在远离3'端和5'端的第一条链与第二条链之间的接点处安置第二发夹帽,以使得第一条链和第二条链之间的沃森-克里克配对稳定。第一条链和第二条链含有与靶基因的两个片段同源的两个区域,即,具有与靶基因相同的序列。同源区含有rna区段的核苷酸,并且可含有连接dna区段的一种或多种dna型核苷酸,并且还可含有不在插入dna区段内的dna型核苷酸。具有同源性的两个区域被一个区域分开且各自与所述区域相邻,所述区域具有与靶基因的序列不同的序列,被称为“异源区”。异源区可含有一个、两个或三个错配的核苷酸。错配的核苷酸可以是连续的或者可替代地被与靶基因同源的一个或两个核苷酸分开。或者,异源区还可含有插入或一个、两个、三个或五个或更少的核苷酸。或者,混合双链寡核苷酸的序列可能与靶基因序列不同,差别在于从混合双链寡核苷酸中缺失一个、两个、三个或五个或更少的核苷酸。在这种情况下,异源区的长度和位置被视为缺失的长度,即使没有混合双链寡核苷酸的核苷酸在异源区内。当意图一个或多个取代时,与两个同源区互补的靶基因片段之间的距离与异源区的长度相同。当异源区含有插入时,同源区在混合双链寡核苷酸中分开的距离因而比其互补同源片段在基因中分开的距离要远,而当异源区编码缺失时情况相反。混合双链寡核苷酸的rna区段各自是同源区的一部分,即,序列中与靶基因的片段相同的区域,其区段一起优选含有至少13个rna型核苷酸且优选16至25个rna型核苷酸或更优选18-22个rna型核苷酸或最优选20个核苷酸。在一个实施方案中,同源区的rna区段被插入dna区段分开且与其相邻,即,由插入dna区段“连接”。在一个实施方案中,异源区的每个核苷酸是插入dna区段的核苷酸。含有混合双链寡核苷酸的异源区的插入dna区段被称为“突变区段(mutatorsegment)”。在本发明的另一个实施方案中,基因修复寡核碱基(gron)是单链寡脱氧核苷酸突变载体(ssomv),其公开于国际专利申请pct/usoo/23457、美国专利号6,271,360、6,479,292和7,060,500中,其以引用的方式整体并入。ssomv的序列与美国专利号5,756,325;5,871,984;5,760,012;5,888,983;5,795,972;5,780,296;5,945,339;6,004,804和6,010,907以及国际公布号wo98/49350;wo99/07865;wo99/58723;wo99/58702;和wo99/40789中描述的突变载体基于相同的原理。ssomv的序列含有与靶序列同源、被一个区域分开的两个区域,所述区域含有所需的遗传改变,其被称为突变区。突变区可具有与靶序列中分开同源区的序列相同长度的序列,但是具有不同的序列。这样的突变区可引起取代。或者,ssomv中的同源区可彼此邻接,而具有相同序列的靶基因中的区域被一个、两个或更多个核苷酸分开。这样的ssomv引起不在ssomv上的核苷酸从靶基因缺失。最后,与同源区相同的靶基因的序列可能在靶基因中相邻,但被ssomv序列中的一个、两个或更多个核苷酸分开。这样的ssomv引起靶基因序列中的插入。ssomv的核苷酸是通过未修饰的磷酸二酯键连接的脱氧核糖核苷酸,除了3'末端和/或5'末端核苷酸间键联或者可替代地两个3'末端和/或5'末端核苷酸间键联可以是硫代磷酸酯或氨基磷酸酯。如本文所用,核苷酸间键联是ssomv的核苷酸之间的键联,并且不包括3'端核苷酸或5'端核苷酸与封闭取代基之间的键联。在一个具体的实施方案中,ssomv的长度在21与55个脱氧核苷酸之间,并且相应地,同源区的长度具有至少20个脱氧核苷酸的总长度且至少两个同源区应各自具有至少8个脱氧核苷酸的长度。ssomv可被设计为与靶基因的编码链或非编码链互补。当所需的突变是单碱基取代时,优选突变核苷酸和靶向核苷酸是嘧啶。在与实现所需的功能结果一致的程度上,优选突变核苷酸和互补链中的靶核苷酸都是嘧啶。特别优选是编码颠换突变的ssomv,即,c或t突变核苷酸分别与互补链中的c或t核苷酸错配。提高效率本发明描述多种方法以使用修复寡核苷酸增加靶基因的转化效率,并且所述方法可单独地或彼此组合使用。这些包括:1.将修饰引入至修复寡核苷酸,其将dna修复机器吸引至靶向(错配)位点。a.在寡核苷酸中引入一个或多个无碱基位点(例如,10个碱基内,并且更优选地具有所需错配位点的5个碱基)产生为碱基切除修复(ber)中的中间体并且将ber机器吸引至靶向通过修复寡核苷酸转化的位点附近的损害。dspacer(无碱基呋喃)修饰的寡核苷酸可如在例如takeshita等,j.biol.chem.,262:10171-79,1987中所描述来制备。b.包括诱导单链或双链断裂成寡核苷酸或与寡核苷酸一起断裂的化合物产生通过非同源末端连接(nhej)、微同源介导的末端连接(mmej)和同源重组修复的损害。作为举例,抗生物素的博来霉素家族、锌指、foki(或限制酶的任何iis型类别)可共价连接至修复寡核苷酸的3’或5’端,以便在靶向通过修复寡核苷酸转化的位点附近引入双链断裂。抗生物素的博来霉素家族是dna裂解糖肽,包括博来霉素、博莱霉素(zeocin)、腐草霉素(phleomycin)、他利霉素(tallysomycin)、培洛霉素以及其他。c.引入并入寡核苷酸中的一个或多个8’氧代da或dg(例如,在10个碱基内,并且更优选地具有所需错配位点的5个碱基)产生与由活性氧物种产生的损害类似的损害。这些损害诱导所谓的“推动修复”系统。参见例如,kim等,j.biochem.mol.biol.37:657-62,2004。2.增加修复寡核苷酸的稳定性:在寡核苷酸的3’端引入反向碱基(idc)在修复寡核苷酸上产生3’封闭端。在修复寡核苷酸的5’和/或3’引入一个或多个2’o-甲基核苷酸或碱基,所述核苷酸或碱基增加杂交能量(参见例如wo2007/073149)。在修复寡核苷酸的5’端引入多个2’o-甲基rna核苷酸,从而导致dna碱基,所述碱基提供所需的错配位点,从而产生冈崎片段样核酸结构。缀合的(5’或3’)嵌入燃料如吖啶、补骨脂素、溴化乙锭和赛博(syber)染料。引入5’末端帽如t/a钳夹、胆固醇部分、sima(hex)、riboc和亚磷酰胺(amidite)。主链修饰如硫代磷酸酯、2’-o甲基、膦酸甲酯、锁核酸(lna)、moe(甲氧基乙基)、dips和肽核酸(pna)。使修复寡核苷酸例如与链内交联试剂如顺铂和丝裂霉素c交联。与荧光染料如cy3、dy547、cy3.5、cy3b、cy5和dy647缀合。3.通过并入增加杂交能量的碱基增加修复寡核苷酸的杂交能量(参加例如wo2007/073149)。4.通过使用核苷酸多聚体(二聚体、三聚体、四聚体等)作为合成的结构单元提高修复寡核苷酸合成的质量。这导致更少的偶联步骤和更容易地分离全长产物与结构单元。5.使用较长修复寡核苷酸(即,长度大于55核苷酸,优选长度在75与300个核苷酸之间,更优选长度为至少100个核苷酸,仍然更优选长度为至少150个核苷酸、并且最优选长度为至少200个核苷酸),优选具有在修复寡核苷酸中靶向的两个或更多个突变。前述方法的实例提供在以下表中。表1.待测试的gron化学。前述修饰还可包括已知的核苷酸修饰如甲基化、5’嵌入染料、对5’和3’端的修饰、主链修饰、交联剂、环化和“帽”以及用类似物如肌苷取代一个或多个天然存在的核苷酸。核苷酸的修饰包括添加吖啶、胺、生物素、瀑布蓝、胆固醇、cy3@、cy5@、cy5.5@daboyl、地高辛、二硝基苯基、edans、6-fam、荧光素、3'-甘油基、hex、ird-700、ird-800、joe、磷酸补骨脂素、若丹明、rox、硫醇(sh)、间隔基、tamra、tet、amca-s"、se、bodipyo、marinablue@、pacificblue@、oregongreen@、rhodaminegreen@、rhodaminered@、rhodolgreen@和texasred@。多核苷酸主链修饰包括膦酸甲酯、2'-ome-膦酸甲酯rna、硫代磷酸酯、rna、2'-omerna。碱基修饰包括2-氨基-da、2-氨基嘌呤、3'-(dda)、3'da(蛹虫草菌素)、7-脱氮-da、8-br-da、8-氧代-da、n6-me-da、无碱基位点(dspacer)、生物素dt、2'-ome-5me-c、2'-ome-丙基-c、3'-(5-me-dc)、3'-(ddc)、5-br-dc、5-1-duc、5-me-dc、5-f-dc、羧基-dt、可转化的da、可转化的dc、可转化的dg、可转化的dt、可转化的du、7-脱氮-dg、8-br-dg、8-氧代-dg、o6-me-dg、s6-dnp-dg、4-甲基-吲哚、5-硝基吲哚、2'-ome-肌苷、2'-dl、o6-苯基-dl、4-甲基-吲哚、2'-脱氧水粉菌素、5-硝基吲哚、2-氨基嘌呤、dp(嘌呤类似物)、dk(嘧啶类似物)、3-硝基吡咯、2-硫代-dt、4-硫代-dt、生物素-dt、羧基-dt、04-me-dt、04-三唑dt、2'-ome-丙炔基-u、5-br-du、2'-du、5-f-du、5-l-du、04-三唑du。所述术语还涵盖肽核酸(pna)、dna类似物,其中主链是由n-(2-氨基乙基)-甘氨酸单元而不是糖组成的假肽。pna模拟dna的行为并且结合互补核酸链。pna的中性主链导致比正常所实现的更强结合和更大特异性。此外,已经利用pna的独特化学、物理和生物特性以产生强大的生物分子工具、反义和反义剂、分子探针和生物传感器。寡核苷酸可具有缺口、间隙、修饰的寡核苷酸如修饰的寡核苷酸主链、无碱基核苷酸或其他化学部分。在另一实施方案中,寡核碱基的至少一个链包括至少一个另外修饰的核苷酸,例如,2′-o-甲基修饰的核苷酸如moe(甲氧基乙基)、具有5′-硫代磷酸酯基的核苷酸、连接至胆固醇基衍生物、2′-脱氧-2′-氟修饰的核苷酸、2′-脱氧-修饰的核苷酸、锁核苷酸、无碱基核苷酸(核碱基缺失或具有替代其的羟基(参见例如,glenresearch,http://www.glenresearch.com/glenreports/gr21-14.html))、2′-氨基修饰的核苷酸、2′-烷基修饰的核苷酸、吗啉代核苷酸、亚磷酰胺以及包含核苷酸的非天然碱基。还包括各种盐、混合盐以及游离酸形式。优选的修饰的寡核苷酸主链包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基以及其他烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯以及手性膦酸酯)、亚膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯以及氨基烷基氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基膦酸三酯、具有正常3'-5'键联、这些键联的2'-5'连接类似物的硒代磷酸酯和硼烷磷酸酯,以及具有其中一个或多个核苷酸间键联为3'至3'、5'至5'或2'至2'键联的那些。具有反向极性的优选的寡核苷酸在3'最末端的核苷酸间键联处包含单个3'至3'键联,即可为无碱基(核碱基缺失或其被羟基替代)的单个反向核苷残基。键联翻转的最常见用途是添加3'-3'键联至具有硫代磷酸酯主链的反义寡核苷酸的末端。3'-3'键联通过产生具有两个5'-oh端和无3'-oh端的寡核苷酸使反义寡核苷酸至外切核酸酶降解稳定。可通过使用“逆转亚磷酰胺”在寡核苷酸合成期间将键联翻转引入至特定位置中。这些试剂在5'-oh位置上具有亚磷酰胺基团且在3'-oh位置上具有二甲氧基三苯甲基(dmt)保护基。通常,dmt保护基是在5'-oh上且亚磷酰胺是在3'-oh上。修饰碱基的实例包括但不限于2-氨基嘌呤、2′-氨基-丁酰芘-尿苷、2'-氨基尿苷、2′-脱氧尿苷、2′-氟-胞苷、2′-氟-尿苷、2,6-二氨基嘌呤、4-硫代-尿苷、5-溴-尿苷、5-氟-胞苷、5-氟尿苷、5-吲哚-尿苷、5-甲基-胞苷、肌苷、n3-甲基-尿苷、7-脱氮-鸟嘌呤、8-氨基己基-氨基-腺嘌呤、6-硫代-鸟嘌呤、4-硫代-胸腺嘧啶、2硫代-胸腺嘧啶、5-碘-尿苷、5-碘-胞苷、8-溴-鸟嘌呤、8-溴-腺嘌呤、7-脱氮-腺嘌呤、7-二氮杂-鸟嘌呤、8-氧代-鸟嘌呤、5,6-二氢-尿苷以及5-羟基甲基-尿苷。这些合成单元是可商购的(例如,购自glenresearch公司)并且可通过化学合成并入至dna中。糖部分的修饰的实例是3′-脱氧化2′-氟化和阿拉伯糖苷化,然而,它不应被解释为限于此。通过化学合成也可能将这些并入dna中。5′端修饰的实例是5′-胺化、5′-生物素化、5′-荧光素化、5′-四氟-荧光素化、5′-硫化以及5′-丹磺酰化,然而,它不应被解释为限于此。3′端修饰的实例是3′-胺化、3′-生物素化、2,3-二脱氧化、3′-硫化、3′-丹磺酰化、3′-羧化以及3′-胆固醇化,然而,它不应被解释为限于此。在一个优选的实施方案中,寡核苷酸可含有5'封闭取代基,其通过接头连接至5'末端碳。接头的化学结构并不重要,除了它的长度,长度优选应为至少6个原子长,且接头应当灵活。可使用多种无毒取代基,如生物素、胆固醇或其他类固醇或非嵌入的阳离子荧光染料。特别优选的制造寡核碱基的试剂是由glenresearch,sterlingva.(现在gehealthcare)作为cy3tm和cy5tm销售的试剂,所述试剂是封闭的亚磷酰胺,其并入寡核苷酸后分别产生3,3,3',3'-四甲基n,n'-异丙基取代的吲哚单碳菁染料和吲哚二碳菁染料。cy3是特别优选的。当吲哚碳菁是n-氧基烷基取代的时,其可通过具有5'端磷酸酯的磷酸二酯,方便地与寡脱氧核苷酸的5'末端连接。当直接使用可商购的cy3亚磷酰胺时,所得的5'修饰包括封闭取代基和接头,所述封闭取代基和接头一起是n-羟丙基、n'-磷脂酰丙基3,3,3',3'-四甲基吲哚单碳菁。所考虑的其他染料包括若丹明6g、四甲基若丹明、磺酰若丹明101、部花青540、atto565、atto55026、cy3.5、dy547、dy548、dy549、dy554、dy555、dy556、dy560、mstrawberry和mcherry。在一个优选实施方案中,吲哚碳菁染料在吲哚环的3和3'位置被四次取代。不受理论的限制,这些取代防止染料变成嵌入染料。在这些位置处的取代基的身份不重要。本文所述的寡核苷酸设计还可与其他dna编辑或重组技术组合用作更有效的供体模板,所述技术包括但不限于使用位点特异性同源重组通过锌指核酸酶基因靶向、转录活化因子样效应物核酸酶(talen)或成簇的规律间隔的短回文重复序列(crispr)。本发明总体上涉及用于有效修饰基因组细胞dna和/或将dna重组至细胞的基因组dna中的方法。虽然不限于任何具体用途,但本发明的方法适用于例如将修饰引入细胞的基因组中以便测定所述修饰对细胞的作用。例如,可将修饰引入编码酶的核苷酸序列中以测定所述修饰是否改变酶的酶活性,和/或测定酶的催化区的位置。或者,可将修饰引入dna结合蛋白的编码序列中以测定所述蛋白质的dna结合活性是否被改变,并且因此以描述蛋白质内的特定dna结合区。另一个替代方案是将修饰引入非编码调控序列(例如,启动子、增强子、调控rna序列(mirna)等)中以便测定修饰修饰对可操作地连接至非编码调控序列的第二序列的表达水平的作用。这对于例如限定具有调控活性的特定序列来说可能是合乎需要的。用于产生靶向基因破坏的一种策略是通过产生由位点特异性核酸内切酶引起的单链或双链dna断裂。核酸内切酶最常用于生物体中的靶向基因破坏,所述生物体在传统上对于更常规的基因靶向方法难治,如海藻、植物和较大动物模型,包括人。例如,存在涉及用于治疗和预防hiv感染的锌指核酸酶的进行中的当前人临床试验。另外,核酸内切酶工程化当前用于尝试破坏作物中产生不希望的表型的基因。归巢核酸内切酶(还被称为大范围核酸酶)是序列特异性核酸内切酶,所述核酸内切酶由于其较大(例如,>14bp)裂解位点而以较高特异性程度产生基因组dna中的双链断裂。虽然归巢核酸内切酶对于其靶位点的特异性允许所诱导的dna断裂的确切靶向,但归巢核酸内切酶裂解位点是罕见的并且发现靶向基因中的天然存在的裂解位点的概率较低。一类人工核酸内切酶是锌指核酸内切酶。锌指核酸内切酶将非特异性裂解结构域(通常foki核酸内切酶的非特异性裂解结构域)与工程化以结合特异性dna序列的锌指蛋白结构域组合。锌指核酸内切酶的分子结构使得它们是用于将位点特异性双链断裂递送至基因组的通用平台。锌指核酸内切酶的一个限制是对于靶位点的低特异性或基因组中多个靶位点的存在可导致脱靶裂解事件。因为foki核酸内切酶裂解为二聚体,所以防止脱靶裂解事件的一种策略一直是设计在相邻的9碱基对位点处结合的锌指结构域。talen是用于诱导单链或双链断裂成特异性dna位点的可靶向的核酸酶,其然后通过可用于产生裂解位点处的序列改变的机制修复。用于工程化talen的dna结合区的基本结构单元是源自天然存在的由黄单胞菌属变形菌门编码的tale的高度保守的重复结构域。通过talen结合dna由高度保守的33-35个氨基酸的重复序列的阵列介导,所述重复序列由在重复序列的氨基末端和羧基末端处的另外tale源性的结构域侧接。这些tale重复序列特异性地结合dna的单个碱基,所述碱基的身份由通常在重复序列的位置12和13处发现的两个高变残基确定,其中阵列中重复序列的数目对应于所需靶核酸的长度,选择重复序列的身份以匹配靶核酸序列。靶核酸优选地在15与20个碱基对之间以便最大化靶位点的选择性。靶核酸的裂解通常在talen结合的50个碱基对内发生。用于talen识别位点设计的计算机程序已经在本领域中描述。参见例如,cermak等,nucleicacidsres.2011年7月;39(12):e82。一旦被设计来匹配所需的靶序列,talen可重组表达且引入至原生质体中作为外源蛋白质,或从原生质体内的质粒表达。另一类人工核酸内切酶是工程化的大范围核酸酶。工程化的归巢核酸内切酶通过修饰现有归巢核酸内切酶的特异性产生。在一种方法中,将变异引入天然存在的归巢核酸内切酶的氨基酸序列中并且然后筛选所得到的工程化的归巢核酸内切酶以选择裂解靶向结合位点的功能性蛋白质。在另一种方法中,嵌合归巢核酸内切酶通过组合两种不同归巢核酸内切酶的识别位点来进行工程化以产生由每个归巢核酸内切酶的半位点组成的新识别位点。其他dna修饰分子可用于靶向基因重组中。例如,肽核酸可用于将修饰诱导至一个或多个靶细胞的基因组中(参见例如,ecker的美国专利号5,986,053,其以引用的方式并入)。简言之,包含至少部分肽主链的合成寡核苷酸用于靶向同源基因组核苷酸序列。在结合双螺旋dna之后或通过连接至肽核酸的诱变剂,诱导靶dna序列的修饰和/或重组发生。靶向特异性通过靶向序列与基因组序列之间的序列同源性程度测定。此外,本发明不限于本文用于执行基因组序列的修饰的具体方法。确实,考虑多种方法。例如,可使用三链体螺旋形成寡核苷酸(tfo)靶向基因。tfo可例如通过pcr或通过使用基因合成仪设备合成产生。另外,在发现适合的天然序列的情况下tfo可分离自基因组dna。tfo可以多种方式使用,包括例如通过键结至诱变剂如包括但不限于补骨脂素或苯丁酸氮芥(参见例如,havre等,procnat’lacadsci,u.s.a.90:7879-7883,1993;havre等,jvirol67:7323-7331,1993;wang等,molcellbiol15:1759-1768,1995;takasugi等,procnat’lacadsci,u.s.a.88:5602-5606,1991;belousov等,nucleicacidsres25:3440-3444,1997)。此外,例如,tfo可键结至供体双链dna(参见例如,chan等,jbiolchem272:11541-11548,1999)。tfo还可通过以足够亲和力结合以引起易错修复来起作用(wang等,science271:802-805,1996)。本发明的方法不限于所使用的dna修饰试剂的性质或类型。例如,这类dna修饰试剂释放自由基,所述自由基导致dna链断裂。或者,所述试剂烷基化dna以形成将阻断复制和转录的加合物。在另一个替代方案中,所述试剂产生抑制细胞酶、从而导致链断裂的交联或分子。已经连接至寡核苷酸以形成tfo的dna修饰试剂的实例包括但不限于,吲哚并咔唑、萘二咸亚安(ndi)、反铂、博来霉素、环丙烷并吡咯并吲哚的类似物以及菲并二氢二噁英。具体地说,吲哚并咔唑是拓扑异构酶i抑制剂。这些酶的抑制导致链断裂和dna蛋白质加合物形成[arimondo等,bioorganicandmedicinalchem.8,777,2000]。ndi是可氧化鸟嘌呤的光氧化剂,所述鸟嘌呤可能引起鸟嘌呤残基的位点处的突变[nunez,等,biochemistry,39,6190,2000]。反铂已经显示在tfo连接至所述试剂时与三链体靶标中的dna反应。这种反应引起将是致突变的dna加合物的形成[columbier,等,nucleicacidsresearch,24:4519,1996]。博来霉素是广泛作用辐射模拟物的dna断裂剂。它已经连接至寡核苷酸并且显示作为呈所述型式的断裂剂是活性的[sergeyev,nucleicacidsresearch23,4400,1995;kane,等,biochemistry,34,16715,1995]。环丙烷并吡咯并吲哚的类似物已经连接至tfo并且显示烷基化三链体靶序列中的dna。烷基化dna然后将含有将是致突变的化学加合物[lukhtanov,等,nucleicacidsresearch,25,5077,1997]。菲并二氢二噁英是在光活化时释放自由基种类的掩蔽醌。它们已经连接至tfo且已经显示在光活化时将断裂引入双链dna中[bendinskas等,bioconjugatechem.9,555,1998]。本发明考虑诱导修饰和/或重组的其他方法。例如,另一个实施方案涉及诱导外源dna片段与靶基因之间的同源重组(参见例如,capecchi等,science244:1288-1292,1989)或通过使用具有针对靶向位点的亲和力的肽核酸(pna)。仍然其他方法包括通过聚酰胺进行的序列特异性dna识别和靶向(参见例如,dervan等,curropinchembiol3:688-693,1999;biochemistry38:2143-2151,1999)和使用具有位点特异性活性的核酸酶(例如,锌指蛋白、talen、大范围核酸酶和/或crispr)。本发明不限于修饰和/或重组的任何特定频率。本发明的方法导致把核苷酸序列中0.2%至3%的修饰频率。然而,考虑任何修饰和/或重组频率(即,0%与100%之间)在本发明的范围内。修饰和/或重组频率取决于用于诱导修饰和/或重组的方法、所使用的细胞类型、所靶向的特定基因以及所使用的dna突变试剂(如果存在)。另外,由于检测方法的限制,用于检测修饰和/或重组的方法可能不能检测修饰和/或重组的所有发生。此外,一些修饰和/或重组事件可能是沉默的,从而未给出已发生修饰和/或重组的可检测的指示。不能检测沉默的修饰和/或重组事件提供修饰和/或重组的人工低估。由于这些原因及其他原因,本发明不限于任何具体修饰和/或重组频率。在一个实施方案中,修饰和/或重组的频率在0.01%与100%之间。在另一个实施方案中,修饰和/或重组的频率在0.01%与50%之间。在另一个实施方案中,修饰和/或重组的频率在0.1%与10%之间。在另一个实施方案中,修饰和/或重组的频率在0.1%与5%之间。如本文关于用能够将突变引入细胞基因组中的靶位点的dna修饰分子处理的细胞群体所用的术语“突变频率”是指在处理的群体中与用dna修饰分子处理的细胞的总数目相比含有在靶位点处的突变的细胞的数目。例如,相对于用被设计来在细胞基因组中的靶位点处引入突变的键结至补骨脂素dna修饰分子tfo处理的细胞群体,5%的突变频率意指在用tfo-补骨脂素处理的总计100个细胞之中,5个细胞含有靶位点处的突变。虽然本发明不限于细胞中dna修饰和/或重组的任何精确度,但应考虑取决于所需结果,本发明的一些实施方案要求较高精确度。例如,基因修复所需的特异性序列变化(例如,特定碱基变化)要求与产生仅需要破坏基因的基因敲除相比更高的精确度。使用本发明的方法,实现大于现有技术方法的修饰和/或同源重组的更高精确度水平。基因修复寡核碱基至植物细胞中的递送用于转化植物细胞的任何通常已知的方法可用于递送基因修复寡核苷酸。说明性方法在以下列出。本发明考虑许多方法来用一种或多种dna修饰试剂转染细胞。确实,本发明不限于任何具体方法。用于将dna修饰试剂引入一种或多种细胞的方法是本领域中熟知的并且包括但不限于,显微注射、电穿孔、被动吸附、磷酸钙-dna共沉淀、deae葡聚糖介导的转染、聚凝胺介导的转染、脂质融合、脂质转染剂、核转染、原生质体融合、逆转录病毒感染、基因枪(即,粒子轰击)等。用于通过射弹穿透将dna的较大片段引入具有纤维素细胞壁的植物细胞中的金属微载体(微球体)的使用是相关领域的技术人员所熟知的(自此生物射弹递送)。美国专利号4,945,050;5,100,792和5,204,253描述用于选择用于发射它们的微载体和装置的一般技术。在本发明的方法中使用微载体的具体条件描述于国际公布wo99/07865中。在说明性技术中,按顺序添加冰冷的微载体(60mg/ml)、混合双链寡核苷酸(60mg/ml)、2.5mcacl2和0.1m亚精胺;例如通过涡旋轻轻搅拌混合物10分钟,并且然后在室温下静置10分钟,随后将微载体在5体积的乙醇中稀释,离心并重悬于100%乙醇中。在粘附溶液使用8-10μg/μl微载体、14-17μg/ml混合双链寡核苷酸、1.1-1.4mcacl2和18-22mm亚精胺的浓度可获得良好结果。在8μg/μl微载体、16.5μg/ml混合双链寡核苷酸、1.3mcacl2和21mm亚精胺的条件下观察到最佳结果。还可使用微纤维将基因修复寡核碱基引入用于实践本发明的植物细胞中以穿透细胞壁和细胞膜。coffee等的美国专利号5,302,523描述使用碳化硅纤维来促进黑色墨西哥甜的玉米悬浮培养物的转化。可用于使用微纤维引入用于植物细胞转化的dna的任何机械技术可用于递送用于衍变的基因修复寡核碱基。用于基因修复寡核碱基的微纤维递送的示例性技术是如下:将无菌微纤维(2μg)悬浮在150μl的含有约10μg的混合双链寡核苷酸的植物培养基中。使悬浮培养物沉降并且将等体积的压积细胞和无菌纤维/核苷酸悬浮液涡旋10分钟并接种。立即或在达约120小时的延迟情况下(如对于特定性状适当的)施加选择性培养基。在替代实施方案中,基因修复寡核碱基可通过来源于植物部分的原生质体的电穿孔递送至植物细胞。根据本领域的技术人员熟知的技术通过植物部分、特别是叶的酶处理来形成原生质体。参见,例如gallois等,1996,methodsinmolecularbiology55:89-107,humanapress,totowa,n.j.;kipp等,1999,methodsinmolecularbiology133:213-221,humanapress,totowa,nj。原生质体不需要在电穿孔之前在生长培养基中培养。用于电穿孔的示例性条件是0.3ml总体积中的3×105个原生质体,其中基因修复寡核碱基的浓度是0.6-4μg/ml之间。在一个替代实施方案中,根据本领域的技术人员熟知的技术在膜修饰剂聚乙二醇的存在由植物原生质体摄取核酸。在另一个替代实施方案中,基因修复寡核碱基可通过用微毛细管将其注射至植物细胞中或至原生质体中来递送。在一个替代实施方案中,将核酸包埋在由藻酸钙组成的微珠中并且在存在膜修饰剂聚乙二醇的情况下由植物原生质体摄取(参见例如,sone等,2002,liu等,2004)。在一个替代实施方案中,将核酸冷冻在水中并且通过轰击以微颗粒的形式引入植物细胞中(参见例如,gilmore,1991,美国专利5,219,746;brinegar等)。在一个替代实施方案中,将连接至纳米颗粒的核酸通过在含有所述纳米颗粒的悬浮液中孵育细胞来引入完整植物细胞中(参见例如,pasupathy等,2008)或通过经由颗粒轰击将它们递送至完整细胞或通过共孵育将它们递送至原生质体中(参见,例如torney等,2007)。在一个替代实施方案中,使核酸与穿透肽复合且通过共孵育递送至细胞中(参见例如,chugh等,2008,wo2008148223a1;eudes和chugh)。在一个替代实施方案中,通过电穿孔将核酸引入完整细胞中(参见例如,he等,1998,us2003/0115641al,dobres等)。在一个替代实施方案中,通过将干燥胚胎细胞浸渍在具有核酸的溶液中来将核酸递送至细胞中(通过将干胚胎浸渍在(参见例如,等,1989,senaratna等,1991)。植物的选择在不同实施方案中,如本文所公开的植物可以是双子叶植物、单子叶植物或裸子植物的任何物种,包括作为树或灌木生长的任何木本植物物种、任何草本物种或产生食用水果、种子或蔬菜的任何物种或产生彩色或芳香花的任何物种。例如,植物可选自由以下组成的组的植物物种:芥花、向日葵、玉米、烟草、甜菜、棉花、玉米、小麦、大麦、水稻、苜蓿、大麦、高粱、西红柿、芒果、桃子、苹果、梨、草莓、香蕉、甜瓜、土豆、胡萝卜、莴苣、洋葱、大豆、大豆属、甘蔗、豌豆、鹰嘴豆、紫花豌豆、蚕豆、扁豆、萝卜、芜菁甘蓝、球芽甘蓝、羽扇豆、花椰菜、羽衣甘蓝、菜豆、杨树、松树、桉树、葡萄、柑橘、黑小麦、苜蓿、黑麦、燕麦、草皮和牧草、亚麻、油菜、芥菜、黄瓜、牵牛花、香脂、辣椒、茄子、万寿菊、莲花、卷心菜、菊花、康乃馨、郁金香、鸢尾、百合以及产坚果植物(在它们尚未具体地提及的情况下)。可使用本领域中通常已知的方法针对对除草剂的抗性或耐受性对植物和植物细胞进行测试,例如通过在存在除草剂的情况下生长植物或植物细胞且测量相较于在不存在除草剂情况下的生长的生长速率。如本文所用,植物、植物器官、植物组织或植物细胞的基本上正常生长被定义为植物、植物器官、植物组织或植物细胞的生长率或细胞分裂率为表达野生型ahas蛋白的对应植物、植物器官、植物组织或植物细胞的生长率或细胞分裂率的至少35%、至少50%、至少60%或至少75%。如本文所用,植物、植物器官、植物组织或植物细胞的基本上正常发育被定义为植物、植物器官、植物组织或植物细胞中的一个或多个发育事件的出现与在表达野生型蛋白质的对应植物、植物器官、植物组织或植物细胞中发生的那些发育事件基本上相同。在某些实施方案中,本文提供的植物器官包括但不限于叶、茎、根、叶芽、花芽、分生组织、胚芽、子叶、胚乳、萼片、花瓣、雌蕊、心皮、雄蕊、花药、小孢子、花粉、花粉管、胚珠、子房和果实或从其取得的切片、薄片或盘。植物组织包括但不限于愈伤组织、基本组织、维管组织、贮藏组织、分生组织、叶片组织、茎组织、根组织、冠瘿组织、植物肿瘤组织以及再生组织。植物细胞包括但不限于具有细胞壁的分离的细胞、其各种大小的聚集体以及原生质体。当与由类似经受的非耐受样植物提供的相比,植物当其经受相关除草剂时是对所述除草剂基本上“耐受性的”并且提供转移至右侧的剂量/响应曲线。这类剂量/响应曲线具有绘制在x轴上的“剂量”和绘制在y轴上的“致死百分比”、“除草作用”等。耐受性植物将需要比非耐受性样植物更多的除草剂,以便产生给定除草作用。当经受在通常由农用化学品团体用于杀死地中的杂草的浓度和比例下的除草剂时,对除草剂基本上“抗性”的植物展示很少(如果有)坏死、溶解、褪绿或其他损害。对除草剂具有抗性的植物还是能够容忍除草剂的。植物的产生植物物种的不同组织的组织培养和自其再生植物是已知的。例如,通过组织培养繁育芥花栽培品系在以下的任一者中描述但不限于以下中的任一者:chuong等,"asimpleculturemethodforbrassicahypocotylsprotoplasts,"plantcellreports4:4-6,1985;barsby,t.l.,等,"arapidandefficientalternativeprocedurefortheregenerationofplantsfromhypocotylprotoplastsofbrassicanapus,"plantcellreports(spring,1996);kartha,k.,等,"invitroplantformationfromstemexplantsofrape,"physiol.plant,31:217-220,1974;narasimhulu,s.,等,"speciesspecificshootregenerationresponseofcotyledonaryexplantsofbrassicas,"plantcellreports(spring1988);swanson,e.,"microsporecultureinbrassica,"methodsinmolecularbiology,第6卷,第17章,第159页,1990。变种的进一步繁殖可通过组织培养和再生发生。大豆的不同组织的组织培养和自其再生植物是熟知的和广泛公布的。例如,可参考komatsuda,t.等,"genotypexsucroseinteractionsforsomaticembryogenesisinsoybeans,"cropsci.31:333-337,1991;stephens,p.a.,等,"agronomicevaluationoftissue-culture-derivedsoybeanplants,"theor.appl.genet.82:633-635,1991;komatsuda,t.等,"maturationandgerminationofsomaticembryosasaffectedbysucroseandplantgrowthregulatorsinsoybeansglycinegracilisskvortzandglycinemax(l.)merr."plantcell,tissueandorganculture,28:103-113,1992;dhir,s.等,"regenerationoffertileplantsfromprotoplastsofsoybean(glycinemaxl.merr.);genotypicdifferencesincultureresponse,"plantcellreports11:285-289,1992;pandey,p.等,"plantregenerationfromleafandhypocotylexplantsofglycinewightii(w.anda.)verdc.var.longicauda,"japanj.breed.42:1-5,1992;以及shetty,k.,等,"stimulationofinvitroshootorganogenesisinglycinemax(merrill.)通过尿囊素和酰胺,"plantscience81:245-251,1992。collins等的1991年6月18日颁布的美国专利号5,024,944和ranch等的1991年4月16日颁布的美国专利号5,008,200特此以引用的方式整体并入本文。实施例实施例1:gron长度sommer等(molbiotechnol.33:115-22,2006)描述了用于检测体内基因转化的报道系统,所述系统依赖于单核苷酸变化在绿色荧光蛋白(gfp)变体中在蓝色与绿色荧光之间转换。这种报道系统适用于使用拟南芥作为模型物种以便评定在gron长度的修饰之后gron转化的效率的以下实验中。简言之,对于此实施例和后续实施例,通过本领域的技术人员已知的方法产生具有蓝色荧光蛋白基因的多个拷贝的拟南芥品系(参见例如,clough和brent,1998)。用此品系建立源自根的分生组织培养物,其用于原生质体分离和培养(参见例如,mathur等,1995)。gron递送至原生质体中通过聚乙二醇(peg)介导的gron摄取至原生质体中来实现。使用与由fujiwara和kato(2007)描述的方法类似的使用96孔型式的方法。在以下简要描述方案。所给出的体积是施加至96孔培养皿的单独孔的体积。1.将6.25μl的gron(80μm)与25μl的拟南芥bfp转基因根分生组织源性的原生质体在于96孔板的每个孔中5x106个细胞/ml下进行混合。2.添加31.25μl的40%peg溶液并且混合原生质体。3.将处理的细胞在冰上孵育30分钟。4.向每个孔添加200μl的w5溶液且混合细胞。5.使板在冰上孵育30分钟,从而允许原生质体沉降至每个孔的底部。6.除去在沉降的原生质体以上的200μl培养基。7.添加85μl的培养基(msap,参见mathur等,1995)。8.将板在室温下在黑暗中孵育48小时。在添加培养基之后gron的最终浓度是8μm。在gron递送之后四十八小时,通过流式细胞术对样品进行分析以便检测绿色和黄色荧光不同于对照原生质体的绿色和黄色荧光的原生质体(bfp0指示与bfp靶标相比非靶向gron无变化;c是编码链设计且nc是非编码链设计)。单一c至t核苷酸差异(编码链)或g至a核苷酸靶向bfp4分子中心中的突变(非编码链)。绿色荧光由在bfp基因中引入靶向突变引起,从而导致gfp的合成。图1中示出了结果。以下表示出被设计用于将蓝色荧光蛋白(bfp)基因转化成绿色荧光的示例性101聚体和201聚体bfp4/nc5’-3ps/3’-3psgron。(3ps指示在5’和3’寡核苷酸端中的每个处的3硫代磷酸酯键联)。表1:*=ps键联(硫代磷酸酯)实施例2:使用5’cy3/3’idc标记的gron的转化率这一系列实验的目的是比较硫代磷酸酯(ps)标记的gron(在gron的每一端具有3ps部分)至5’cy3/3’idc标记的gron的效率。5’cy3/3’idc标记的gron具有5’cy3荧光团(亚磷酰胺)和3’idc反向碱基。使用蓝色荧光蛋白(bfp)至绿色荧光的转化评定效率。在所有三个实验中,通过将gronpeg递送至单独falcon管(标记的“管”)或96孔板(标记的“96孔培养皿”)中的原生质体进行,如通过细胞计量术所测定,在bfp至gfp转化效率方面在不同gron化学之间不存在显著差异(图1)。实施例3:41聚体bfp4/nc5’-3ps/3’-3psgron与冈崎片段gron之间的比较这一系列实验的目的是在存在和不存在多种博来霉素家族zeocintm(1mg/ml)以诱导dna断裂的情况下,比较在gron的各端具有3ps部分的硫代磷酸酯(ps)标记的gron与“冈崎片段gron”的转化效率。这些gron的设计在图2中描绘。通过peg处理将gron递送至拟南芥bfp原生质体中,并且通过细胞计量术在处理后24小时测定bfp至gfp转化。将用博来霉素(1mg/ml)处理的样品在peg处理之前与博来霉素一起在冰上孵育90分钟。一般来说,博来霉素(1mg/ml)的存在增加bfp至gfp转化,如通过细胞计量术所测定(表2)。在博来霉素存在和不存在的情况下,当与在前九个5’rna碱基中的每个上含有一个2’-ome基团的nc冈崎gron相比时,在gron的5’端处的第一rna碱基上含有一个2’-ome基团的nc冈崎gron在将bfp转化至gfp方面更有效(图2和表2)。在所有实验中,在存在或不存在1mg/ml的博来霉素的情况下,在41聚体bfp4/nc5’3ps/3’3ps与在第一5’rna碱基上含有一个5’2’-ome基团的71聚体冈崎片段bfp4/ncgron(指代为bfp471聚体(1)nc)之间在bfp至gfp转化方面不存在显著差异,如通过细胞计量术所测定(图2和表2)。重要的是注意在博来霉素存在下(并且预期对于博来霉素、腐草霉素、他利霉素、培洛霉素以及此抗生素家族的其他成员来说),所述转化变成链独立性(即,具有在这些实验中测试的设计的c和ncgron展示大约相等活性)。表2:在存在和不存在糖肽抗生素博来霉素的情况下标准gron设计与冈崎片段gron设计的比较。实施例4:41聚体、101聚体和201聚体bfp4/nc5’-3ps/3’-3psgron之间的比较这一系列实验的目的是比较在不同长度的gron的各端处具有3ps部分的硫代磷酸酯(ps)标记的gron的转化效率(在存在或不存在博来霉素的情况下):表1中所示的41聚体、101聚体和201聚体。再次,博来霉素(1mg/ml)的存在增加bfp至gfp转化率,如通过细胞计量术所测定(表3)。在存在或不存在博来霉素的两者情况下在ncgron长度增加的情况下所有三个实验的总体趋势是线性的。除了在博来霉素存在下bfp-4/nc/101和bfp-4/c/101,这具有接近于等于但小于41聚体ncgron的转化率。这与使用bfp-4/41编码和非编码gron的所有先前实验形成对比,其中非编码总是远远优异于编码gron。转化频率的这种不对称还适用于在此实验系列中使用的bfp-4/201gron。表3:实施例5:crispr与gron组合以改进植物中的转化。当组装crispr复合物时必须考虑三种设计组分:cas9、grna(引导rna)和靶区域(内源性靶基因中的原型间隔区)。cas9-从分别由35s或玉米泛素驱动的针对拟南芥或玉米优化的酿脓链球菌密码子瞬时表达cas9基因。通过genewiz或dna2.0合成优化的基因。nb必须确保未产生隐蔽型内含子。-根据g1155的rbcse9终止子-单一sv40nls(pkkrkv)作为c-末端融合-载体主链将是根据所有瞬时表达系统–g1155。grna-建议使用嵌合tracrrna–根据lecong等,2013和jinek等,2013的pre-crerna。注意lecong等显示天然全长tracr+pre-crrna复合物比嵌合型式更有效地裂解。选择因此将是使用全长(89bp)tracrrna制备嵌合体。-grna的序列((n)20表示引导序列)。加括号的序列包含全长89bp形式。以下来自cong等的图显示天然复合物和嵌合体:-grna将在拟南芥(以下给出的序列)中在atu6rnapoliii启动子下表达。在玉米中,可使用zmu6rnapoliii启动子。这些选择是基于wang等2008。-根据g1155的rbcse9终止子或根据wang等2013的一串t’以及以下所示的单组分方法。在来自wang等的u6启动子序列处靶区域-引导序列特异性由靶区域序列限定。不管模型生物体的选择,这将是bfp的y66h基因座。在y66h附近的pam(ngg)序列是唯一设计限制。此外,在引导序列(“种子序列”)的3’12bp中包括y66h位置将意味着一旦修复已经实现,位点将不会得到再切割。将需要来自g1155的独特载体主链以便实现cas9和grna的共递送。此问题在单组分方法情况下将被规避:单组分方法lecong等(2013)使用简化方法,从而由poliiiu6启动子驱动表达grna和cas9作为瞬时构建体,如以下所概述。以此方式,对于给定玉米,可通过在引导插入序列中简单交换来靶向多个基因。将使ef1α启动子置换为适合于作物的一种(pmas对于at,ubi对于zm)。对于终止子,将使用rbcse9。用于植物中的nls将是如上所概述的单一c末端sv40。注意在以下的构建体中,截短grna在不包括示踪rna区域的情况下使用。作者表明,在人中,这在引导全长型式的cas9方面不那么有效。因此建议在此使用全长grna。值得注意的是,在酵母中使用crispr的后续论文中,dicarlo等(2013)使用了全长型式。所述盒将被克隆至g1155背景中。嵌合crrna的表达载体的示意图。可使用退火的寡核苷酸将引导序列插入在两个bbsi位点之间。载体已经含有部分指导重复序列(灰色)和部分tracrrna(红色)序列。wpre,土拨鼠肝炎病毒转录后调控元件。体内测定瞬时选择-用于确认植物中的靶标识别和核酸酶活性的一种方法将是模拟zhang等(2013)用于talen的yfp单链退火测定。间隔区序列(靶序列)加pam将需要插入yfp或等效基因中。-瞬时选择-talen-bfp系统可用作对照。-虽然上述方法将是用于确认给定crispr系统对于给定间隔区序列的功能性的进行中工具,但在植物中crispr的活性概念的证据将是使用gfp系统。-在此用于bfp→gfp的设计将与g1155一起共转化成at并且无gron。如果切割足够有效,gfp表达的降低将是明显的。这将可能需要质粒负载的优化。-一旦活性得以确认,基因组bfp靶标将以可视和基于序列的读数靶向。体外测定-为了快速确认crispr系统的活性,可根据jinek等2012使用体外测定。将在此预先制备的和纯化的酿脓链球菌cas9与合成grna和含有识别序列的质粒一起孵育。通过凝胶电泳分析成功的裂解以寻找切割质粒。详细方案:质粒dna裂解测定。在反应之前通过加热至95℃且缓慢冷却至室温来将合成或体外转录的tracrrna和crrna预先退火。将天然或限制酶切消化线性化质粒dna(300ng(~8nm))与纯化的cas9蛋白(50-500nm)和tracrrna:crrna双链体(50-500nm,1:1)一起在cas9质粒裂解缓冲液(20mmhepesph7.5,150mmkcl,0.5mmdtt,0.1mmedta)中在有或无10mmmgcl2的情况下在37℃下孵育60分钟。用含有250mmedta的5xdna加载缓冲液终止反应,通过0.8%或1%琼脂糖凝胶电泳解析且通过溴化乙锭染色可视化。对于cas9突变体裂解测定,在负载于琼脂糖凝胶上之前用5xsds加载缓冲液(30%甘油、1.2%sds、250mmedta)终止反应。作物中的性状靶标鉴于crispr识别序列的灵活性,不难发现如由3’nggpam序列限定的潜在原型间隔区序列。zmepsps以下实施例示出适合的原型间隔区序列(黄色)和pam(蓝色)以便在zmepsps的催化位点中形成ds断裂,其中在t97和p101处的突变已知引起草甘膦抗性。断裂的随后寡核苷酸介导的修复(odm)将产生所需变化。以下表给出目标作物中的目标基因的原型间隔区序列:作物基因原型间隔区序列芥花epsps2-22p101ccgctgccgttactgctgcaepsps-2-23p101cggctgcagttactgctgctepsps2-25p101ccgctgcagttactgctgcaepsps2-28p101ccgctgcagttacagctgca亚府epspsp101cagctgctgtaacagccgct土豆epsp5-2.1/2.2/2.3p101cagcagcagttgctgtagctepspsgene1p101cagcagcagttacagtagct土豆ppxr144tgcgcctcgctttgtcttgtppxa220attttacaggtgtttacgcc设计约束的限制在于经常难以发现被odm改变的核苷酸的12bp内的ngg序列。这是重要的,因为如果事实如此,则成功odm将意味着随后切割将是不可能的,因为原型间隔区种子序列将被改变。jinek等(2012)表面这对于切割效率来说是有害的。参考文献lecong等2013science:第339卷第6121期第819-823页。jinek等2012science.337:816-21wang等2008rna14:903-913zhang等2013.plantphysiol.161:20-27本领域技术人员易于了解,本发明充分适于执行目标并且获得所提到的以及其中固有的结果和优点。本文中提供的实施例代表优选实施方案,为示例性的,并且并非意图作为本发明的范围的限制。本领域技术人员将易于显而易见的是,在不脱离本发明的范围和精神的情况下可对本文中所公开的发明进行可变的替换和修改。说明书中提到的所有专利和公布指示本发明所属领域中的普通技术人员的水平。所有专利和公布在本文中以引用的方式并入,其程度等同于仿佛特定且个别地指示每一单独的公布以引用的方式并入。本文中适当地说明性地描述的发明可在缺少在本文中并未具体公开的任何一个或多个元件、一个或多个限制的情况下实践。因此,例如,在本文中的每一个例子中,术语“包括”、“主要由……组成”和“由……组成”中的任何术语可由其它两个术语中的任何一个代替。已使用的术语和措辞是用作描述而非限制的术语,并且在使用这类术语和措辞时并非旨在排除所示出和描述的特征或其部分的任何等同物,但是应认识到,各种修改在本发明要求的范围内是可能的。因此,应理解,尽管本发明已由优选实施方案和任选特征具体公开,但是本领域技术人员可采用本文中公开的概念的修改和变化,并且应理解,所述修改和变化被视为在如由所附权利要求书定义的本发明的范围内。在以下权利要求书内阐述其它实施方案。序列表<110>cibususllccibuseuropeb.v.<120>采用寡核苷酸介导的基因修复提高靶向基因修饰的提高的效率的效率的方法和组合物<130>cibus-024-pct<140>pct/us2014/029566<141>2014-03-14<150>61/801,333<151>2013-03-15<160>38<170>patentin3.5版<210>1<211>99<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(96)..(99)<223>核苷酸之间的硫代磷酸酯键联<400>1gtcgtgctgcttcatgtggcggggtagcggctgaagcactgcacgccgtaggtgaaggtg60gtcacgagggtgggccaggcacgggcagcttgccggtgg99<210>2<211>101<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(98)..(101)<223>核苷酸之间的硫代磷酸酯键联<400>2gtcgtgctgcttcatgtggtcggggtagcggctgaagcactgcacgccgtgggtgaaggt60ggtcacgagggtgggccagggcacgggcagcttgccggtgg101<210>3<211>101<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(98)..(101)<223>核苷酸之间的硫代磷酸酯键联<400>3ccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccttcacctacggcgtgc60agtgcttcagccgctaccccgaccacatgaagcagcacgac101<210>4<211>101<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(98)..(101)<223>核苷酸之间的硫代磷酸酯键联<400>4ccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccttcacccacggcgtgc60agtgcttcagccgctaccccgaccacatgaagcagcacgac101<210>5<211>201<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(198)..(201)<223>核苷酸之间的硫代磷酸酯键联<400>5aagatggtgcgctcctggacgtagccttcgggcatggcggacttgaagaagtcgtgctgc60ttcatgtggtcggggtagcggctgaagcactgcacgccgtaggtgaaggtggtcacgagg120gtgggccagggcacgggcagcttgccggtggtgcagatgaacttcagggtcagcttgccg180taggtggcatcgccctcgccc201<210>6<211>201<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(198)..(201)<223>核苷酸之间的硫代磷酸酯键联<400>6aagatggtgcgctcctggacgtagccttcgggcatggcggacttgaagaagtcgtgctgc60ttcatgtggtcggggtagcggctgaagcactgcacgccgtgggtgaaggtggtcacgagg120gtgggccagggcacgggcagcttgccggtggtgcagatgaacttcagggtcagcttgccg180taggtggcatcgccctcgccc201<210>7<211>201<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(198)..(201)<223>核苷酸之间的硫代磷酸酯键联<400>7gggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaa60gctgcccgtgccctggcccaccctcgtgaccaccttcacctacggcgtgcagtgcttcag120ccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggcta180cgtccaggagcgcaccatctt201<210>8<211>201<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>misc_feature<222>(1)..(4)<223>核苷酸之间的硫代磷酸酯键联<220><221>misc_feature<222>(198)..(201)<223>核苷酸之间的硫代磷酸酯键联<400>8gggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaa60gctgcccgtgccctggcccaccctcgtgaccaccttcacccacggcgtgcagtgcttcag120ccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggcta180cgtccaggagcgcaccatctt201<210>9<211>6<212>prt<213>人工序列<220><223>人工序列的描述:合成肽<400>9prolyslysarglysval15<210>10<211>110<212>dna<213>人工序列<220><223>人工序列的描述:合成多核苷酸<220><221>修饰的碱基<222>(1)..(20)<223>a、c、t、g未知或其他<400>10nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatgttcttgaaaaaagtgagtggcaccgagtcggtggtgctttttt110<210>11<211>48<212>rna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>修饰的碱基<222>(3)..(32)<223>a、c、u、g未知或其他<400>11acnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnguuuuagagcuaugcu48<210>12<211>67<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<400>12agcauagcaaguuaaaauaaggctaguccguuaucaacuugaaaaaguggcaccgagucg60gugcuuu67<210>13<211>62<212>rna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(20)<223>a、c、u、g未知或其他<400>13nnnnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60cg62<210>14<211>23<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>14tcgtgaccaccttcacccacggc23<210>15<211>7<212>prt<213>人工序列<220><223>人工序列的描述:合成肽<400>15glyvalthrthrphethrtyr15<210>16<211>84<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>16gtggaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaag60ttaaaataaggctagtccgttttt84<210>17<211>84<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>17aaaaacggactagccttattttaacttgctatttctagctctaaaacaggtcttctcgaa60gacccggtgtttcgtcctttccac84<210>18<211>24<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>修饰的碱基<222>(6)..(24)<223>a、c、t、g未知或其他<400>18caccgnnnnnnnnnnnnnnnnnnn24<210>19<211>24<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>修饰的碱基<222>(5)..(23)<223>a、c、t、g未知或其他<400>19aaacnnnnnnnnnnnnnnnnnnnc24<210>20<211>11<212>prt<213>人工序列<220><223>人工序列的描述:合成肽<400>20thralametargproleuthrvalalaalaval1510<210>21<211>41<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>21actgcaatgcggccattgacagcagctgttactgctgctgg41<210>22<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>22ccgctgccgttactgctgca20<210>23<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>23cggctgcagttactgctgct20<210>24<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>24ccgctgcagttactgctgca20<210>25<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>25ccgctgcagttacagctgca20<210>26<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>26cagctgctgtaacagccgct20<210>27<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>27cagcagcagttgctgtagct20<210>28<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>28cagcagcagttacagtagct20<210>29<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>29tgcgcctcgctttgtcttgt20<210>30<211>20<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>30attttacaggtgtttacgcc20<210>31<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(1)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>31uucauguggucggggtagcggctgaagcactgcacgccgtaggtgaaggtggtcacgagg60gtgggccaggg71<210>32<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(1)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>32uucauguggucggggtagcggctgaagcactgcacgccgtgggtgaaggtggtcacgagg60gtgggccaggg71<210>33<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(1)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>33gcugcccgugccctggcccaccctcgtgaccaccttcacctacggcgtgcagtgcttcag60ccgctaccccg71<210>34<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(1)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>34gcugcccgugccctggcccaccctcgtgaccaccttcacccacggcgtgcagtgcttcag60ccgctaccccg71<210>35<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(9)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>35uucauguggucggggtagcggctgaagcactgcacgccgtaggtgaaggtggtcacgagg60gtgggccaggg71<210>36<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(9)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>36uucauguggucggggtagcggctgaagcactgcacgccgtgggtgaaggtggtcacgagg60gtgggccaggg71<210>37<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(9)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>37gcugcccgugccctggcccaccctcgtgaccaccttcacctacggcgtgcagtgcttcag60ccgctaccccg71<210>38<211>71<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><223>组合dna/rna分子的描述:合成寡核苷酸<220><221>修饰的碱基<222>(1)..(9)<223>2'-o-me修饰的核苷酸<220><221>修饰的碱基<222>(11)..(71)<223>2'-o-me修饰的核苷酸<400>38gcugcccgugccctggcccaccctcgtgaccaccttcacccacggcgtgcagtgcttcag60ccgctaccccg71当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1