使用多核苷酸指导的核酸内切酶的细胞器基因组修饰的制作方法

文档序号:21046824发布日期:2020-06-09 20:58阅读:157来源:国知局
使用多核苷酸指导的核酸内切酶的细胞器基因组修饰的制作方法
序列表援引并入本申请包含序列表,该序列表已经通过efs-web提交并通过引用全文并入于此。交叉引用本申请与2017年8月22日提交的美国临时专利申请第62/548,723号相关,该临时申请通过引用全文并入本文。技术实现要素:在一方面,用于改变细胞器的基因组的方法可以包括:(a)向细胞器中引入包括以下项:(i)编码至少一个指导多核酸的第一多核苷酸,其中至少一个指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)编码多核苷酸指导的多肽的第二多核苷酸,其中多核苷酸指导的多肽在与指导多核酸相关联时切割至少一个靶序列;(iii)任选地,编码至少一个同源细胞器dna序列的第三多核苷酸,其中至少一个同源细胞器dna具有足以进行同源重组的大小,其中将至少一个同源细胞器dna序列整合到细胞器基因组中导致至少一个靶序列的去除;(iv)任选地,编码至少一个选择标记或至少一个筛选标记或两者的第四多核苷酸;其中第四多核苷酸可操作地连接至在细胞器中具有功能的启动子;和(v)任选地,编码在细胞器中具有功能的复制起点的第五多核苷酸;以及(b)在(i)的第一多核苷酸和(ii)的第二多核苷酸均表达的条件下使包含(a)的细胞器的细胞生长。在另一方面,用于改变细胞器的基因组的方法可以包括:(a)将包含以下项的重组dna构建体引入细胞器中:(i)编码至少一个指导多核酸的第一多核苷酸,其中至少一个指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)编码多核苷酸指导的多肽的第二多核苷酸,其中多核苷酸指导的多肽在与指导多核酸相关联时切割至少一个靶序列;(iii)任选地,编码至少一个同源细胞器dna序列的第三多核苷酸,其中至少一个同源细胞器dna具有足以进行同源重组的大小,其中将至少一个同源细胞器dna序列整合到细胞器基因组中导致至少一个靶序列的去除;(iv)任选地,编码至少一个选择标记或至少一个筛选标记或两者的第四多核苷酸;其中第四多核苷酸可操作地连接至在细胞器中具有功能的启动子;和(v)任选地,编码在细胞器中具有功能的复制起点的第五多核苷酸;以及(b)在(i)的第一多核苷酸和(ii)的第二多核苷酸均表达的条件下使包含(a)的细胞器的细胞生长在一些实施方案中,该方法可以进一步包括步骤(c)——选择具有包含改变的基因组的细胞器的细胞。在一些实施方案中,该方法可以进一步包括步骤(d)——选择对于细胞器的改变的基因组是同质的细胞。在一些实施方案中,该方法可以包括将(iii)的第三多核苷酸引入细胞器中,其中(iii)的第三多核苷酸可以包含第六多核苷酸和第七多核苷酸,其中第六多核苷酸和第七多核苷酸对应于细胞器基因组中两个同源的相邻区域,其中第六多核苷酸和第七多核苷酸被与细胞器dna异源的序列隔开。在一些实施方案中,与细胞器dna异源的序列可以包含选自以下的至少一项:第一多核苷酸、第二多核苷酸、第四多核苷酸、第八多核苷酸及其任何组合,其中第八多核苷酸编码与细胞器异源的rna。在另一个实施方案中,至少一个指导多核酸可以存在于多顺反子转录单元上。在一些实施方案中,在多顺反子转录单元转录后,可以通过使用选自以下的至少一项从多顺反子rna加工出至少一个指导多核酸:rna切割位点、csy4切割位点、核酶切割位点、多核苷酸指导的多肽切割位点、trna序列的存在及其任何组合。在一些实施方案中,多顺反子rna可以包含在至少一个指导rna的5’的第一trna序列和在至少一个指导rna的3’的第二trna序列。在另一个实施方案中,该方法可以包括第八多核苷酸,其中第八多核苷酸可以编码选自以下的至少一项:除草剂耐受性蛋白、杀虫蛋白、与杀虫蛋白结合的辅助蛋白、dsrna、sirna、mirna及其任何组合,其中dsrna、sirna和mirna抑制植物害虫中存在的至少一个靶基因。在一些实施方案中,该方法可以包括第八多核苷酸,其中第八多核苷酸可以可操作地连接至在细胞器中有活性的至少一个调控元件。在一些实施方案中,至少一个调控元件可以是启动子。在另一个实施方案中,选自以下的至少一项:第一多核苷酸、第二多核苷酸、第四多核苷酸、第五多核苷酸及其任何组合,可以位于以第六多核苷酸和第七多核苷酸为边界的区域之外。在另一个实施方案中,该方法可以包括第四多核苷酸和第五多核苷酸,其中第四多核苷酸和第五多核苷酸均可以位于以第六多核苷酸和第七多核苷酸为边界的区域之外。在另一个实施方案中,该方法可以包括第四多核苷酸,其中第四多核苷酸可以包含编码正选择标记的第一序列和编码负选择标记的第二序列,其中第一序列和第二序列可以各自可操作地连接至在细胞器中具有功能的启动子。在另一个实施方案中,该方法可以包括第五多核苷酸,其中第五多核苷酸可以编码在质体(例如,叶绿体)中具有功能的复制起点,其中在质体中具有功能的复制起点可以对应于来自质体rrna基因间区域的dna序列。在另一个实施方案中,该方法可以包括第五多核苷酸,其中第五多核苷酸可以编码在线粒体中具有功能的复制起点。在一些实施方案中,多核苷酸指导的多肽可以选自:cas9蛋白、mad2蛋白、mad7蛋白、crispr核酸酶、cas蛋白的核酸酶结构域、cpf1蛋白、argonaute、其修饰形式及其任何组合。在一些实施方案中,重组dna构建体可以进一步包含彼此有至少100个核苷酸具有100%序列同一性的第九多核苷酸和第十多核苷酸,其中第九多核苷酸和第十多核苷酸作为直接重复序列排列在重组dna构建体中。在一些实施方案中,重组dna构建体可以是线性的,并且进一步地,其中第九多核苷酸和第十多核苷酸可以存在于重组dna构建体的5’和3’端在另一个实施方案中,该方法可以包括重组dna构建体,其包含选自以下的至少一项:第一多核苷酸、第二多核苷酸、第三多核苷酸、第四多核苷酸、第五多核苷酸及其任何组合。在一些实施方案中,该方法可以包括超过一个此类重组dna构建体。在另一个实施方案中,重组dna构建体可以进一步包含第九多核苷酸和第十多核苷酸,其中第九多核苷酸和第十多核苷酸可以彼此具有100%序列同一性,并且进一步地,其中第九多核苷酸和第十多核苷酸可以作为直接重复序列排列在重组dna构建体中。在一些实施方案中,第九多核苷酸和第十多核苷酸可以彼此有至少20、21、22、23、24、25、30、40、50、60、70、80、90或100个核苷酸具有100%的序列同一性。任选地,重组dna构建体可以是线性的,并且第九多核苷酸和第十多核苷酸存在于重组dna构建体的5’和3’端。在另一个实施方案中,本文的任何方法均可以进一步涉及将编码至少一个选择标记的多核苷酸引入细胞器中,该至少一个选择标记选自:正选择标记、负选择标记及其任何组合。在一些实施方案中,正选择标记可以是除草剂耐受性蛋白。在一些实施方案中,除草剂耐受性蛋白可以是选自以下的至少一项:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽、乙酰辅酶a羧化酶(acc酶)及其任何组合。在一些实施方案中,该方法可以进一步涉及在正选择剂的存在下使细胞生长,并选择对于细胞器的改变的基因组是同质的细胞。在一些实施方案中,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。在一些实施方案中,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后在负选择剂的存在下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。在一些实施方案中,细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞、分离和纯化的人类细胞,以及哺乳动物组织培养物细胞。在一些实施方案中,在用于植物细胞的方法中,细胞器可以是质体(例如,叶绿体)或线粒体。在一些实施方案中,该方法可以进一步涉及从包含改变的细胞器基因组的植物细胞再生或生长植物。在一些实施方案中,植物细胞可以是单子叶植物细胞,例如,玉米细胞。植物细胞可以是双子叶植物细胞,例如,大豆细胞。在一些实施方案中,细胞可以是植物细胞,其中细胞器是质体或线粒体,并且其中该方法进一步包括从包含改变的细胞器基因组的植物细胞再生植物。在一些实施方案中,细胞可以是酵母细胞或藻类细胞。在一些实施方案中,通过本文公开的方法产生的植物、种子、根、茎、叶、花、果实或豆可以包含具有改变的基因组的细胞器。在另一个实施方案中,细胞器基因组的改变可以包括表达盒的插入。在一些实施方案中,表达盒可以是多顺反子表达盒。在一些实施方案中,多顺反子表达盒可以编码选择标记或筛选标记或两者。另一方面,重组dna构建体可以包含以下项:(i)编码至少一个指导多核酸的第一多核苷酸,其中至少一个指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)编码多核苷酸指导的多肽的第二多核苷酸,其中多核苷酸指导的多肽在与指导多核酸相关联时切割至少一个靶序列;(iii)任选地,编码至少一个同源细胞器dna序列的第三多核苷酸,其中至少一个同源细胞器dna具有足以进行同源重组的大小,其中将至少一个同源细胞器dna序列整合到细胞器基因组中导致至少一个靶序列的去除;(iv)任选地,编码至少一个选择标记或至少一个筛选标记或两者的第四多核苷酸;其中第四多核苷酸可操作地连接至在细胞器中具有功能的启动子;和(v)任选地,编码在细胞器中具有功能的复制起点的第五多核苷酸。在一些实施方案中,(iii)的第三多核苷酸可以包含第六多核苷酸和第七多核苷酸,其中第六多核苷酸和第七多核苷酸对应于细胞器基因组中两个同源的相邻区域,其中第六多核苷酸和第七多核苷酸被与细胞器dna异源的序列隔开。在一些实施方案中,酵母细胞、藻类细胞、植物细胞、植物、种子、根、茎、叶、花、果实或豆可以包含重组dna构建体。另一方面,重组dna构建体可以包含以下项:(i)编码至少一个指导rna的第一多核苷酸,其中至少一个指导rna引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)编码多核苷酸指导的多肽的第二多核苷酸,其中多核苷酸指导的多肽在与指导rna相关联时切割至少一个靶序列;(iii)包含第六多核苷酸和第七多核苷酸的第三多核苷酸,其中第六多核苷酸和第七多核苷酸对应于细胞器基因组中两个同源的相邻区域,其中第六多核苷酸和第七多核苷酸被与细胞器dna异源的序列隔开,其中与细胞器dna异源的序列包含选自以下的至少一项:第一多核苷酸、第二多核苷酸、第四多核苷酸、第八多核苷酸及其任何组合,其中第八多核苷酸编码与细胞器异源的rna;(iv)任选地,编码至少一个选择标记或至少一个筛选标记或两者的第四多核苷酸;其中第四多核苷酸可操作地连接至在细胞器中具有功能的启动子;和(v)任选地,编码在细胞器中具有功能的复制起点的第五多核苷酸。另一方面,用于改变细胞器的基因组的方法可以包括:(a)向细胞中引入:(i)编码包含可操作地连接至指导多核酸的靶向细胞器的rna的rna序列的多核苷酸,其中指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列,其中多核苷酸可操作地连接至至少一个调控元件;和(ii)编码修饰的多核苷酸指导的多肽的第二多核苷酸,其中第二多核苷酸可操作地连接至至少一个调控元件,并且其中修饰的多核苷酸指导的多肽包含可操作地连接至靶向细胞器的肽的多核苷酸指导的多肽;其中(i)的靶向细胞器的rna和(ii)的靶向细胞器的肽均靶向同一细胞器;以及(b)在(i)的多核苷酸和(ii)的第二多核苷酸都表达的条件下使细胞生长。在一些实施方案中,该方法可以进一步包括步骤(c)——选择具有包含改变的基因组的细胞器的细胞。在一些实施方案中,该方法可以进一步包括步骤(d)——选择对于细胞器的改变的基因组是同质的细胞。另一方面,用于改变细胞器的基因组的方法可以包括:(a)向细胞中引入:(i)编码包含可操作地连接至指导多核酸的靶向细胞器的rna的rna序列的多核苷酸,其中指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列,其中多核苷酸可操作地连接至至少一个调控元件;和(ii)第三多核苷酸,其中第三多核苷酸可操作地连接至至少一个调控元件,其中第三多核苷酸编码rna分子,该rna分子包含可操作地连接至编码多核苷酸指导的多肽的rna序列的靶向细胞器的rna;其中(i)的靶向细胞器的rna和(ii)的靶向细胞器的rna均靶向同一细胞器;以及(b)在(i)的多核苷酸和(ii)的第三多核苷酸都表达的条件下使细胞生长。在一些实施方案中,该方法可以进一步包括步骤(c)——选择具有包含改变的基因组的细胞器的细胞。在一些实施方案中,该方法可以进一步包括步骤(d)——选择对于细胞器的改变的基因组是同质的细胞。在另一个实施方案中,本文的任何方法均可以进一步包括将包含至少一个供体多核苷酸(例如供体dna)的多核苷酸引入细胞器中,其中至少一个供体多核苷酸(例如供体dna)以相对于细胞器基因组的至少一个同源序列为边界,其中将至少一个供体多核苷酸的全部或部分整合到细胞器基因组中导致指导多核酸的靶位点的去除。在一些实施方案中,至少一个供体多核苷酸(例如供体dna)可以包含与细胞器基因组异源的第一核酸序列,其中第一核酸序列以第二核酸序列和第三核酸序列为边界,其中第二核酸序列和第三核酸序列对应于细胞器基因组中两个同源的相邻区域。在一些实施方案中,第二核酸序列或第三核酸序列或两者可以包含至少一个改变的序列,其中至少一个改变的序列相对于细胞器基因组中的至少一个另外的靶位点被改变,其中至少一个改变的序列不被至少一个另外的指导多核酸识别,其中至少一个另外的指导多核酸可以引导多核苷酸指导的多肽切割细胞器基因组中的至少一个另外的靶位点。在一些实施方案中,细胞器基因组中的至少一个另外的靶位点可以存在于至少一个必需编码区中。在一些实施方案中,引入细胞器中的多核苷酸可以进一步包含第四核酸序列,其中第四核酸序列编码至少一个另外的指导多核酸。在一些实施方案中,至少一个另外的指导多核酸可以可操作地连接至在细胞器中有活性的启动子。在一些实施方案中,引入细胞器中的多核苷酸进一步可以包含第四核酸序列,其中第四核酸序列编码至少一个另外的指导rna,该至少一个另外的指导rna可操作地连接至在细胞器中有活性的启动子。在一些实施方案中,通过本文公开的方法产生的细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞、分离和纯化的人类细胞,以及哺乳动物组织培养物细胞。在一些实施方案中,通过本文公开的方法产生的植物、种子、根、茎、叶、花、果实或豆可以包含具有改变的基因组的细胞器。另一方面,用于改变细胞器的基因组的方法可以包括:(a)向细胞的细胞器中引入以下项:(i)至少一个指导rna,其中至少一个指导rna引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)多核苷酸指导的多肽,其中多核苷酸指导的多肽在与至少一个指导rna相关联时切割至少一个靶序列;和(iii)替代dna;以及(b)选择包含含有替代dna的细胞器的细胞。在一些实施方案中,步骤(a)部分(iii)的替代dna可以包含来自栽培种、品系、亚种和其他物种并且不同于步骤(a)的细胞器的基因组的细胞器dna片段或完整细胞器dna。在一些实施方案中,替代dna可以缺少至少一个靶序列。在一些实施方案中,在步骤(a)部分(ii)之后并在步骤(a)部分(iii)之前,可以选择其中细胞器的基因组已被消除的细胞。在一些实施方案中,至少一个靶序列可以不存在于替代dna中。在一些实施方案中,本文所述的方法和物质组合物中的指导多核酸可以包含以下项:i)与靶多核酸的至少17个核苷酸互补的至少17个核苷酸,其中所述靶多核酸位于细胞器的基因组中;和ii)与多核苷酸指导的多肽接触的区域。指导多核酸可以包含一个或多个rna碱基。在一些实施方案中,指导多核酸可以是指导rna。指导多核酸可以是双指导rna。在一些实施方案中,指导多核酸可以是单指导rna。在另一个实施方案中,本文所述的方法和物质组合物中的多核苷酸指导的多肽可以选自:cas9蛋白、mad2蛋白、mad7蛋白、crispr核酸酶、cas蛋白的核酸酶结构域、cpf1蛋白、argonaute、其修饰形式及其任何组合。在一些实施方案中,编码多核苷酸指导的多肽的序列可以对于人、酵母、藻类或植物物种是密码子优化的。在另一个实施方案中,细胞可以是植物细胞,细胞器可以是质体(例如叶绿体)或线粒体,并且该方法可以进一步包括从包含改变的细胞器基因组的植物细胞再生或生长植物。在另一个实施方案中,通过本文公开的任何方法产生的细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞、分离和纯化的人类细胞,以及哺乳动物组织培养物细胞。在另一个实施方案中,通过本文公开的任何方法产生的植物、种子、根、茎、叶、花、果实或豆可以包含具有改变的基因组的细胞器。在另一个实施方案中,包含本文所述的任何重组dna构建体的细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞、分离和纯化的人类细胞,以及哺乳动物组织培养物细胞。在另一个实施方案中,包含本文所述的任何重组dna构建体的植物、种子、根、茎、叶、花、果实或豆可以包含具有改变的基因组的细胞器。在一个实施方案中,多核苷酸可以包含:a)靶向细胞器的序列;和b)指导多核酸,其中指导多核酸包含i)与靶多核苷酸的至少17个核苷酸互补的至少17个核苷酸,其中所述靶多核酸位于细胞器的基因组中;和ii)与多核苷酸指导的多肽接触的区域,其中所述靶向细胞器的序列和所述指导多核酸序列可操作地连接。在另一个实施方案中,多核苷酸包含一个或多个rna碱基。在另一个实施方案中,多核苷酸进一步包含编码多核苷酸指导的多肽的序列。在另一个实施方案中,所述多核苷酸指导的多肽是cas9蛋白。在另一个实施方案中,所述多核苷酸指导的多肽是argonaute蛋白。在另一个实施方案中,所述多核苷酸指导的多肽是crispr家族中的核酸酶。在另一个实施方案中,所述多核苷酸指导的多肽是cpf1。在另一个实施方案中,编码所述多核苷酸指导的多肽的序列对于人是密码子优化的。在另一个实施方案中,编码所述多核苷酸指导的多肽的序列对于植物物种是密码子优化的。在另一个实施方案中,所述靶多核酸包含前间隔区邻近基序(pam)序列。在另一个实施方案中,所述cas9已经被工程化以与改变的pam序列相关联。在另一个实施方案中,所述多核苷酸指导的多肽选择性地切割靶多核酸。在另一个实施方案中,所述多核苷酸指导的多肽选择性地诱导靶多核酸中的双链断裂。在另一个实施方案中,所述多核苷酸指导的多肽包含在靶多核酸中诱导切口的核酸酶结构域。在另一个实施方案中,多核苷酸包含两个或更多个不同的指导多核酸。在另一个实施方案中,指导多核酸由双指导rna组成。在另一个实施方案中,指导多核酸是单指导rna。在另一个实施方案中,指导多核酸由crrna和trrna组成,其中所述crrna和所述trrna任选地连接。在另一个实施方案中,所述指导多核酸包含被工程化为与细胞的细胞器中的靶多核酸的至少18个核苷酸互补的区域。在另一个实施方案中,所述指导多核酸被工程化为与细胞的细胞器中的靶多核酸的至少22个核酸基本互补。在另一个实施方案中,所述至少17个核苷酸是连续的。在另一个实施方案中,所述细胞器是线粒体。在另一个实施方案中,所述细胞器是质体。在另一个实施方案中,所述指导多核酸被工程化以与本文公开的靶基因的区域杂交。在另一个实施方案中,多核苷酸进一步包含修饰的rna供体序列,其中修饰的rna供体序列包含可操作地连接至供体rna的靶向细胞器的rna。在另一个实施方案中。当被翻译成rna时可以产生本公开内容的多核苷酸的dna序列。在另一个实施方案中,编码rna序列的多核苷酸可以包含可操作地连接至指导rna的靶向细胞器的rna,其中指导rna引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列。rna序列可以进一步包含编码多核苷酸指导的多肽的序列,以及任选地,在指导rna与编码多核苷酸指导的多肽的序列之间的rna切割位点。在另一个实施方案中,细胞器可以包含本公开内容的多核苷酸。在一些实施方案中,细胞器是线粒体。在一些实施方案中,细胞器是质体。在另一个实施方案中,细胞可以包含本公开内容的任何多核苷酸。细胞可以进一步包含编码修饰的多核苷酸指导的多肽的多核苷酸,其中修饰的多核苷酸指导的多肽包含可操作地连接至靶向细胞器的肽的多核苷酸指导的多肽。在另一个实施方案中,用于将指导多核酸引入细胞的细胞器中的方法可以包括:(a)将编码rna序列的多核苷酸引入细胞中,该rna序列包含可操作地连接至指导多核酸的靶向细胞器的rna,其中指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列,进一步地,其中多核苷酸可操作地连接至至少一个调控元件;以及(b)在表达多核苷酸的条件下使细胞生长。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)向细胞中引入:(i)编码包含可操作地连接至指导多核酸的靶向细胞器的rna的rna序列的多核苷酸,其中指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列,其中多核苷酸可操作地连接至至少一个调控元件;和(ii)编码修饰的多核苷酸指导的多肽的第二多核苷酸,其中第二多核苷酸可操作地连接至至少一个调控元件,并且其中修饰的多核苷酸指导的多肽包含可操作地连接至靶向细胞器的肽的多核苷酸指导的多肽;其中(i)的靶向细胞器的rna和(ii)的靶向细胞器的肽均靶向同一细胞器;以及(b)在(i)的多核苷酸和(ii)的第二多核苷酸都表达的条件下使细胞生长。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)向细胞中引入:(i)编码包含可操作地连接至指导多核酸的靶向细胞器的rna的rna序列的多核苷酸,其中指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列,其中多核苷酸可操作地连接至至少一个调控元件;和(ii)第三多核苷酸,其中第三多核苷酸可操作地连接至至少一个调控元件,其中第三多核苷酸编码rna分子,该rna分子包含可操作地连接至编码多核苷酸指导的多肽的rna序列的靶向细胞器的rna;其中(i)的靶向细胞器的rna和(ii)的靶向细胞器的rna均靶向同一细胞器;以及(b)在(i)的多核苷酸和(ii)的第三多核苷酸都表达的条件下使细胞生长。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)将编码rna序列的多核苷酸引入细胞中,该rna序列包含:(i)可操作地连接至指导多核酸的靶向细胞器的rna,其中指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的靶序列,(ii)编码多核苷酸指导的多肽的序列,和(iii)在指导多核酸与编码多核苷酸指导的多肽的序列之间的rna切割位点,其中多核苷酸可操作地连接至至少一个调控元件;以及(b)在表达(a)的多核苷酸的条件下使细胞生长。在另一个实施方案中,本文的任何方法均可以进一步包括将包含至少一个供体多核苷酸(例如供体dna)的多核苷酸引入细胞器中,其中至少一个供体多核苷酸(例如供体dna)以相对于细胞器基因组的至少一个同源序列为边界,其中将至少一个供体多核苷酸的全部或部分整合到细胞器基因组中导致指导多核酸的靶位点的去除。至少一个供体多核苷酸(例如供体dna)可以包含与细胞器基因组异源的第一核酸序列,其中第一核酸序列以第二核酸序列和第三核酸序列为边界,其中第二核酸序列和第三核酸序列对应于细胞器基因组中两个同源的相邻区域。另外,第二核酸序列或第三核酸序列或两者可以包含至少一个改变的序列,其中至少一个改变的序列相对于细胞器基因组中的至少一个另外的靶位点被改变,其中至少一个改变的序列不被至少一个另外的指导多核酸识别,其中至少一个另外的指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中的至少一个另外的靶位点。细胞器基因组中的至少一个另外的靶位点可以存在于至少一个必需编码区中。引入细胞器中的多核苷酸可以进一步包含第四核酸序列,其中第四核酸序列编码可操作地连接至在细胞器中有活性的启动子的至少一个另外的指导多核酸。在另一个实施方案中,多核苷酸可以编码修饰的rna供体序列,其中修饰的rna供体序列可以包含可操作地连接至供体rna的靶向细胞器的rna。修饰的rna供体序列可以包含逆转录酶引物位点。另外,一种细胞,其包含多核苷酸,并且进一步包含编码修饰的逆转录酶的多核苷酸,其中修饰的逆转录酶包含可操作地连接至靶向细胞器的肽的逆转录酶。在另一个实施方案中,改变细胞器的基因组的方法可以进一步包括将供体多核苷酸引入细胞器中,其中将供体多核苷酸引入细胞器中是通过:(a)将编码修饰的rna供体序列的多核苷酸引入细胞中,其中多核苷酸可操作地连接至至少一个调控元件;(b)将编码修饰的逆转录酶的多核苷酸引入细胞中,其中修饰的逆转录酶包含可操作地连接至靶向细胞器的肽的逆转录酶,其中多核苷酸可操作地连接至至少一个调控元件,其中(a)的靶向细胞器的rna和(b)的靶向细胞器的肽均靶向同一细胞器;以及(c)在(a)和(b)的多核苷酸都表达的条件下使细胞生长。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)将包含以下项的重组dna构建体引入细胞器中:(i)编码至少一个指导多核酸的第一多核苷酸,其中至少一个指导多核酸引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)编码多核苷酸指导的多肽的第二多核苷酸,其中多核苷酸指导的多肽在与指导多核酸相关联时切割至少一个靶序列;(iii)编码至少一个同源细胞器dna序列的第三多核苷酸,其中至少一个同源细胞器dna具有足以进行同源重组的大小,其中将至少一个同源细胞器dna序列整合到细胞器基因组中导致至少一个靶序列的去除;(iv)任选地,编码至少一个选择标记的第四多核苷酸;其中第四多核苷酸可操作地连接至在细胞器中具有功能的启动子;和(v)任选地,编码在细胞器中具有功能的复制起点的第五多核苷酸;以及(b)在(i)的第一多核苷酸和(ii)的第二多核苷酸均表达的条件下使包含(a)的细胞器的细胞生长。(iii)的第三多核苷酸可以包含第六多核苷酸和第七多核苷酸,其中第六多核苷酸和第七多核苷酸对应于细胞器基因组中两个同源的相邻区域,其中第六多核苷酸和第七多核苷酸被与细胞器dna异源的序列隔开,其中与细胞器dna异源的序列包含选自以下的至少一项:第一多核苷酸、第二多核苷酸、第四多核苷酸和第八多核苷酸,其中第八多核苷酸编码与细胞器异源的rna。在另一个实施方案中,一种方法,其中选自以下的至少一项:第一多核苷酸、第二多核苷酸、第四多核苷酸和第五多核苷酸,可以位于以第六多核苷酸和第七多核苷酸为边界的区域之外。在另一个实施方案中,一种方法,其中第四多核苷酸和第五多核苷酸均可以位于以第六多核苷酸和第七多核苷酸为边界的区域之外。在另一个实施方案中,第四多核苷酸包含编码正选择标记的第一序列和编码负选择标记的第二序列,其中第一序列和第二序列各自可操作地连接至在细胞器中具有功能的启动子。在另一个实施方案中,第五多核苷酸编码质体复制起点,其中质体复制起点对应于来自质体rrna基因间区域的dna序列。在另一个实施方案中,第五多核苷酸编码线粒体复制起点。在另一个实施方案中,重组dna构建体进一步包含第八多核苷酸和第九多核苷酸,其中第八多核苷酸和第九多核苷酸彼此有至少100个核苷酸具有100%的序列同一性,其中第八多核苷酸和第九多核苷酸作为直接重复序列排列在重组dna构建体中。任选地,重组dna构建体是线性的,并且第八多核苷酸和第九多核苷酸存在于重组dna构建体的5’和3’端。在另一个实施方案中,重组dna构建体是线性和单链的,并且重组dna构建体可操作地连接至修饰的vird2蛋白,其中修饰的vird2蛋白包含可操作地连接至靶向细胞器的肽的vird2蛋白,其中修饰的vird2蛋白也已被修饰,使得vird2蛋白的每个天然核定位序列不再具有功能。任选地,重组dna构建体可操作地连接至至少一个修饰的vire2蛋白,其中至少一个修饰的vire2蛋白包含可操作地连接至靶向细胞器的肽的vire2蛋白,其中至少一个修饰的vire2蛋白也已被修饰,使得vire2蛋白的每个天然核定位序列不再具有功能。任选地,重组dna构建体可操作地连接至至少一个修饰的reca蛋白,其中至少一个修饰的reca蛋白包含可操作地连接至靶向细胞器的肽的reca蛋白。任选地,重组dna构建体可操作地连接至至少一个嵌合多肽,其中至少一个嵌合多肽包含靶向细胞器的肽和细胞穿透肽。在另一个实施方案中,本文的任何方法均可以进一步涉及将编码至少一个选择标记的多核苷酸引入细胞器中,该至少一个选择标记选自:正选择标记、负选择标记及其任何组合。正选择标记可以是除草剂耐受性蛋白。除草剂耐受性蛋白可以是选自以下的至少一项:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽和乙酰辅酶a羧化酶(acc酶)。该方法可以进一步涉及在正选择剂的存在下使细胞生长,并选择对于细胞器的改变的基因组是同质的细胞。任选地,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。可替代地,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后在负选择剂的存在下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。在该方法中,细胞可以是植物细胞,细胞器可以是质体。该方法可以进一步涉及从包含改变的细胞器基因组的植物细胞再生植物。植物细胞可以是单子叶植物细胞,例如,玉米细胞。植物细胞可以是双子叶植物细胞,例如,大豆细胞。在另一个实施方案中,在本文的用于将细胞器的基因组改变成含有异源多核苷酸的任何方法中,异源多核苷酸可以编码选自以下的至少一项:除草剂耐受性蛋白、杀虫蛋白、与杀虫蛋白结合的辅助蛋白、dsrna、sirna和mirna,其中dsrna、sirna和mirna抑制植物害虫中存在的至少一个靶基因。除草剂耐受性蛋白可以是选自以下的至少一项:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽和乙酰辅酶a羧化酶(acc酶)。杀虫蛋白可以是选自以下的至少一项:cry1ac、cyt1aa、cry1ab、cry2aa、cry1i、cry1c、cry1d、cry1e、cry1be、cry1fa和vip3a。与杀虫蛋白结合的辅助蛋白可以是选自以下的至少一项:20kda辅助蛋白和19kda辅助蛋白。dsrna、sirna和mirna可以抑制选自以下的至少一个靶基因:蛋白酶体a型亚基肽(pas-4)、act、shr、epic2b和pnpmai。异源多核苷酸可以可操作地连接至在细胞器中有活性的至少一个调控元件。至少一个调控元件可以选自:与玉米clpp5’-utr组合的玉米clpp启动子、与来自噬菌体t7的基因10的5’-utr组合的玉米clpp启动子、与来自噬菌体t7的基因10的5’-utr组合的番茄psba启动子以及与修饰的accd5’-utr组合的番茄rrn16启动子。细胞可以是植物细胞,其中细胞器是质体,并且其中该方法进一步包括从包含改变的细胞器基因组的植物细胞再生植物。植物细胞可以是大豆细胞。在另一个实施方案中,细胞可以包含具有改变的基因组的细胞器,其中细胞可通过任何上述方法产生。细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞、分离和纯化的人类细胞,以及哺乳动物组织培养物细胞。在另一个实施方案中,一种方法可以包括如上所述改变细胞中细胞器的基因组,其中细胞是植物细胞并且进一步地,其中植物从植物细胞再生,其中植物包含具有改变的基因组的细胞器。而且,从再生植物产生的植物(例如,后代植物)或种子,其中植物或种子包含具有改变的基因组的细胞器。在另一个实施方案中,植物、种子、根、茎、叶、花、果实或豆可以通过本公开内容的方法产生。在一些实施方案中,植物、种子、根、茎、叶、花、果实或豆包含具有改变的基因组的细胞器。在另一个实施方案中,植物、种子、根、茎、叶、花、果实或豆可以包含本公开内容的多核苷酸。援引并入本说明书中提及的所有出版物、专利和专利均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。附图说明本发明的新颖特征在所附权利要求中具体阐述。通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述和附图,将会获得对本发明的特征和优点的更好的理解,在这些附图中:图1显示了从转化的酵母线粒体dna中的替换的dna基因座的pcr扩增获得的序列,该dna通过编辑质粒方法修饰;并且图2显示了从转化的衣藻(chlamydomoas)质体dna中的替换的dna基因座的pcr扩增获得的序列,该dna通过编辑质粒方法修饰。序列表的简要说明通过构成本申请的一部分的以下详细描述和序列表可以更全面地理解本公开内容。seqidno:1对应于编码mcas9-a的核酸序列;即,包含atp酶β线粒体靶向肽的cas9。seqidno:2对应于编码mcas9-b的核酸序列;即,包含70kd线粒体靶向肽的cas9。seqidno:3对应于编码指导rna-trnalys(trk1)融合体的核酸序列(“n”残基指示指导rna的可变靶向结构域)。seqidno:4对应于编码指导rna-trnalys融合体的核酸序列(用于线粒体导入的trk2-2形式;“n”残基指示指导rna的可变靶向结构域)。seqidno:5对应于编码具有改变的5’trna端的指导rna-trnalys融合体的核酸序列。seqidno:6对应于编码指导rna-trnalys融合体的核酸序列(具有改变的5’端的修饰的trk2形式;5’端的“n”残基指示指导rna的可变靶向结构域)。seqidno:7对应于编码嵌入在trk2-2主链中的trk2内含子中的grna的核酸序列(“n”残基的20聚体指示可变靶向结构域;“n”残基的3聚体与可变靶向结构域的前三个核苷酸互补,以保留用于剪接的二级结构)。seqidno:8对应于编码嵌入在trk1主链中的trk2型内含子中的grna的核酸序列(“n”残基的20聚体指示可变靶向结构域;“n”残基的3聚体与指导rna的前三个核苷酸互补,以保留用于剪接的二级结构)。seqidno:9对应于编码与trk1的后半部分融合的grna(b形式)的核酸序列。seqidno:10对应于编码与指导rna-b形式融合体共表达的一种trk1形式的核酸序列。seqidno:11对应于编码在d臂与f发夹结构之间构建的grna的核酸序列。seqidno:12对应于编码与d臂融合的grna的核酸序列。seqidno:13对应于编码与f发夹结构融合的grna的核酸序列。seqidno:14对应于靶向线粒体中的细胞色素b基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:15对应于靶向线粒体中的cox1基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:16对应于靶向线粒体中的cox1基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:17对应于靶向线粒体中的cox2基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:18对应于与可变靶向结构域的3’端融合以产生用于cas9的功能性指导rna的核酸序列。seqidno:19对应于编码snr52启动子的核酸序列。seqidno:20对应于编码sup4终止子的核酸序列。seqidno:21对应于用于巴龙霉素耐受性模板dna的寡核苷酸引物的核酸序列。seqidno:22对应于互补寡核苷酸引物的核酸序列,用于与seqidno:21的引物一起制备模板dna。seqidno:23对应于编码靶向线粒体中的15srrna基因的指导rna的可变靶向结构域的核酸序列。seqidno:24对应于编码为在酵母线粒体中表达而优化的cas9基因的核酸序列。seqidno:25对应于编码cox2启动子的核酸序列。seqidno:26对应于编码cox2终止子的核酸序列。seqidno:27对应于靶向酵母中的线粒体21srrna基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:28对应于编码15srrna基因的启动子序列的核酸序列。seqidno:29对应于编码15srrna基因的终止子序列的核酸序列。seqidno:30对应于靶向线粒体中的cob基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:31对应于靶向线粒体中的atp9基因的指导rna的可变靶向结构域的核苷酸序列。seqidno:32对应于ndufv2线粒体靶向肽的氨基酸序列。seqidno:33对应于编码与衍生自ndufv2的线粒体靶向肽融合的cas9的核酸序列。seqidno:34对应于柠檬酸合酶的线粒体靶向肽的氨基酸序列。seqidno:35对应于编码与衍生自人柠檬酸合酶的线粒体信号肽融合的cas9的核酸序列。seqidno:36对应于编码用于线粒体导入的人5srrna基因的核酸序列(可以将4聚体“gtct”替换为指导rna)。seqidno:37对应于靶向线粒体中的人cox3基因的grna序列的可变靶向结构域的核苷酸序列。seqidno:38对应于利用人5srrna基因的启动子和终止子的指导rna的表达盒的核酸序列。seqidno:39对应于靶向小鼠线粒体dna中的capr基因座的指导rna的可变靶向结构域的核苷酸序列(capr等位基因在残基17处具有a至g置换)。seqidno:40对应于具有capr突变的多核苷酸修饰模板的核苷酸序列(小鼠16srrna的一部分)。seqidno:41对应于编码不具有nls和flag结构域,但是具有马铃薯iv内含子的pcocas9的核苷酸序列。该序列对于拟南芥(genbankid:kf264451)是密码子优化的。seqidno:42对应于pcocas9的氨基酸序列。seqidno:43对应于atrbcs(at1g67090)的转运肽的氨基酸序列。切割发生在位置54的“n”残基之后。seqidno:44对应于atcab(np_001078288.1)的转运肽的氨基酸序列。切割发生在位置55的“p”残基之后。seqidno:45对应于atdnaj8(np_178207.1)的转运肽的氨基酸序列。切割发生在位置47的“v”残基之后。seqidno:46对应于编码具有at-rbcs转运肽(具有马铃薯内含子)的pcocas9的核苷酸序列。seqidno:47对应于具有at-rbcs叶绿体转运肽的pcocas9的氨基酸序列。seqidno:48对应于编码vd5’utr(gi|301016157|gb|hm136583.1|的核苷酸序列。seqidno:49对应于编码ateif4e1全长cdna的核苷酸序列。seqidno:50对应于编码典型grna模块的核苷酸序列(“n”残基的5’末端20聚体对应于可变靶向结构域)。seqidno:51对应于编码csy4的核苷酸序列。seqidno:52对应于csy4多肽的氨基酸序列。seqidno:53对应于csy4识别位点的核苷酸序列。seqidno:54对应于编码侧翼为csy4识别位点的指导rna的核苷酸序列(多聚体形式)。seqidno:55对应于编码nt_chl_rpob(烟草(nicotianatabacum)rna聚合酶β链)的核苷酸序列。seqidno:56对应于靶向来自烟草的质体rpob基因的指导rna的可变靶区域的核苷酸序列。seqidno:57对应于靶向来自烟草的质体rpob基因的指导rna的可变靶区域的核苷酸序列。seqidno:58对应于编码nt_cp_psba(烟草光系统ii蛋白d1)的核苷酸序列。seqidno:59对应于靶向来自烟草的质体psba基因的指导rna的可变靶区域的核苷酸序列。seqidno:60对应于靶向来自烟草的质体psba基因的指导rna的可变靶区域的核苷酸序列。seqidno:61对应于编码nt_cp_rps15(烟草核糖体蛋白s15)的核苷酸序列。seqidno:62对应于靶向来自烟草的质体rps15基因的指导rna的可变靶区域的核苷酸序列。seqidno:63对应于靶向来自烟草的质体rps15基因的指导rna的可变靶区域的核苷酸序列。seqidno:64对应于编码nt_cp_rpl33(烟草50s核糖体蛋白l33)的核苷酸序列。seqidno:65对应于靶向来自烟草的质体rpl33基因的指导rna的可变靶区域的核苷酸序列。seqidno:66对应于靶向来自烟草的质体rpl33基因的指导rna的可变靶区域的核苷酸序列。seqidno:67对应于编码glmacprpob(大豆(glycinemax)rna聚合酶β链)的核苷酸序列。seqidno:68对应于靶向来自大豆的质体rpob基因的指导rna的可变靶区域的核苷酸序列。seqidno:69对应于靶向来自大豆的质体rpob基因的指导rna的可变靶区域的核苷酸序列。seqidno:70对应于编码glmacppsba(大豆光系统ii蛋白d1)的核苷酸序列。seqidno:71对应于靶向来自大豆的质体psba基因的指导rna的可变靶区域的核苷酸序列。seqidno:72对应于靶向来自大豆的质体psba基因的指导rna的可变靶区域的核苷酸序列。seqidno:73对应于编码glmacp_rps15(大豆核糖体蛋白s15)的核苷酸序列。seqidno:74对应于靶向来自大豆的质体rps15基因的指导rna的可变靶区域的核苷酸序列。seqidno:75对应于靶向来自大豆的质体rps15基因的指导rna的可变靶区域的核苷酸序列。seqidno:76对应于编码glmacp_rpl33(大豆50s核糖体蛋白l33)的核苷酸序列。seqidno:77对应于靶向来自大豆的质体rpl33基因的指导rna的可变靶区域的核苷酸序列。seqidno:78对应于靶向来自大豆的质体rpl33基因的指导rna的可变靶区域的核苷酸序列。seqidno:79对应于编码具有内含子的本生烟(nicotianabenthamiana)rps16的核苷酸序列(核糖体蛋白s16,gi:kc495035.1)。seqidno:80对应于靶向来自本生烟的质体rps16基因的指导rna的可变靶区域的核苷酸序列。seqidno:81对应于靶向来自本生烟的质体rps16基因的指导rna的可变靶区域的核苷酸序列。seqidno:82对应于编码本生烟matk的核苷酸序列(成熟酶k,gi:ab040014)。seqidno:83对应于靶向来自本生烟的质体matk基因的指导rna的可变靶区域的核苷酸序列。seqidno:84对应于靶向来自本生烟的质体matk基因的指导rna的可变靶区域的核苷酸序列。seqidno:85对应于靶向来自烟草的基因间区域(ntchrc;57408..57389)的指导rna的可变靶区域的核苷酸序列。seqidno:86对应于靶向来自烟草的基因间区域(ntchrc;59412..59393)的指导rna的可变靶区域的核苷酸序列。seqidno:87对应于靶向来自烟草的基因间区域(ntchrc;59622..59603)的指导rna的可变靶区域的核苷酸序列。seqidno:88对应于靶向来自烟草的基因间区域(ntchrc;65704..65723)的指导rna的可变靶区域的核苷酸序列。seqidno:89对应于靶向来自大豆的基因间区域(glmacp_nc_007942.1_59039-59058)的指导rna的可变靶区域的核苷酸序列。seqidno:90对应于靶向来自大豆的基因间区域(glmacp_nc_007942.1_59100-59119)的指导rna的可变靶区域的核苷酸序列。seqidno:91对应于靶向来自大豆的基因间区域(glmacp_nc_007942.1_62057-62038)的指导rna的可变靶区域的核苷酸序列。seqidno:92对应于靶向来自大豆的基因间区域(glmacp_nc_007942.1_62361-62380)的指导rna的可变靶区域的核苷酸序列。seqidno:93对应于质体psba基因的靶位点的核苷酸序列。seqidno:94对应于多核苷酸修饰模板的区域的核苷酸序列,该区域对应于质体psba基因的靶位点。seqidno:95对应于由seqidno:1编码的atp酶β线粒体靶向肽的氨基酸序列。seqidno:96对应于与由seqidno:1编码的atp酶β线粒体靶向肽融合的cas9多肽的氨基酸序列。seqidno:97对应于由seqidno:2编码的70kd线粒体靶向肽的氨基酸序列。seqidno:98对应于与由seqidno:2编码的70kd线粒体靶向肽融合的cas9多肽的氨基酸序列。seqidno:99对应于正向引物zmpclpp-forward的核苷酸序列,与clpp5’-utr结合(zmpclpp:clpp)用于玉米clpp启动子的pcr扩增。该正向引物还可以与来自噬菌体t7的基因10的5’-utr结合(zmpclpp:g10)用于玉米clpp启动子的pcr扩增。seqidno:100对应于反向引物zmpclpp-reverse的核苷酸序列,与clpp5’-utr结合(zmpclpp:clpp)用于玉米clpp启动子的pcr扩增。seqidno:101对应于与来自噬菌体t7的基因10的5’-utr结合(zmpclpp:g10)用于玉米clpp启动子的pcr扩增的反向引物的核苷酸序列。seqidno:102对应于与来自噬菌体t7的基因10的5’-utr结合(slpsba:t7g10)用于番茄psba启动子的pcr扩增的正向引物的核苷酸序列。seqidno:103对应于与来自噬菌体t7的基因10的5’-utr结合(slpsba:t7g10)用于番茄psba启动子的pcr扩增的反向引物的核苷酸序列。seqidno:104对应于与accd-mod5’-utr结合用于番茄rrn16启动子的siprrn16启动子部分的pcr扩增的正向引物的核苷酸序列。seqidno:105对应于与accd-mod5’-utr结合用于番茄rrn16启动子的siprrn16启动子部分的pcr扩增的反向引物的核苷酸序列。seqidno:106对应于与accd-mod5’-utr结合用于番茄rrn16启动子的accd-mod5’-utr部分的pcr扩增的正向引物的核苷酸序列。seqidno:107对应于与accd-mod5’-utr结合用于番茄rrn16启动子的accd-mod5’-utr部分的pcr扩增的反向引物的核苷酸序列。seqidno:108对应于来自苏云金芽孢杆菌库斯塔克亚种(bacillusthuringiensiskurstaki)血清变型hd73的核苷酸序列,其编码cry1acδ-内毒素(u89872)。seqidno:109对应于由seqidno:108编码的cry1acδ-内毒素的氨基酸序列。seqidno:110对应于来自苏云金芽孢杆菌库斯塔克亚种血清变型hd73的核苷酸序列,其编码具有杀虫活性的cry1acδ-内毒素的截短形式。seqidno:111对应于来自苏云金芽孢杆菌以色列亚种血清变型的核苷酸序列,其编码cyt1aa蛋白(geneid:5759908)。seqidno:112对应于来自苏云金芽孢杆菌以色列亚种血清变型的核苷酸序列(pbt024),其编码20kda辅助蛋白。seqidno:113对应于来自苏云金芽孢杆菌以色列亚种血清变型的核苷酸序列(pbt022),其编码19kda辅助蛋白。seqidno:114对应于编码本文称为pas-4(us8067671)的大豆异皮线虫(heteroderaglycines)(scn)特异性蛋白酶体a型亚基肽的开放阅读框的核苷酸序列。seqidno:115对应于seqidno:114的核苷酸552-699。seqidno:116对应于酿酒酵母(saccharomycescerevisiae)线粒体dna的cox1基因中的第一指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。seqidno:117对应于酿酒酵母线粒体dna的cox1基因中的第二指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。seqidno:118对应于酿酒酵母线粒体dna的cox1基因中的第三指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。seqidno:119对应于酿酒酵母线粒体dna的cox1基因中的第四指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。该靶位点序列存在于基因序列的反向互补序列上。seqidno:120对应于编码spcas9的核苷酸序列,spcas9是来自酿脓链球菌(streptococcuspyogenes)的cas9。编码序列被优化以在酵母线粒体中表达。seqidno:121对应于酿酒酵母线粒体dna的cox2基因的最小启动子和5’utr的核苷酸序列。seqidno:122对应于酿酒酵母线粒体dna的cox2基因的最小终止子的核苷酸序列。seqidno:123对应于编码tracrrna的核苷酸序列,其用于产生靶向酿酒酵母的cox2基因的指导rna。seqidno:124对应于酿酒酵母线粒体dna的cox3基因的最小启动子的核苷酸序列。seqidno:125对应于编码来自酿酒酵母线粒体dna的tf(gaa)基因的trna的核苷酸序列。seqidno:126对应于编码来自酿酒酵母线粒体dna的tw(uca)基因的trna的核苷酸序列。seqidno:127对应于来自酿酒酵母线粒体dna的cox3基因的最小终止子的核苷酸序列。seqidno:128对应于编码来自酿酒酵母线粒体dna的tm(cau)基因的trna的核苷酸序列。seqidno:129对应于编码gfp的核苷酸序列。编码序列被优化以在酵母线粒体中表达。seqidno:130对应于编码来自酿酒酵母的命名为hr1的同源区域的核苷酸序列,其与cox1基因中的第一指导rna靶位点(seqidno:116)相邻。seqidno:131对应于编码来自酿酒酵母的命名为hr2的同源区域的核苷酸序列,其与cox1基因中的第二指导rna靶位点(seqidno:117)相邻。seqidno:132对应于编码来自酿酒酵母的命名为hr3的同源区域的核苷酸序列,其与cox1基因中的第三指导rna靶位点(seqidno:118)相邻。seqidno:133对应于编码来自酿酒酵母的命名为hr4的同源区域的核苷酸序列,其与cox1基因中的第四指导rna靶位点(seqidno:119)相邻。seqidno:134对应于供体dna中存在的核苷酸序列,该核苷酸序列编码cox1基因中的第一指导rna靶位点(seqidno:116)的变体。该变体中七个核苷酸已被改变。seqidno:135对应于供体dna中存在的核苷酸序列,该核苷酸序列编码cox1基因中的第二指导rna靶位点(seqidno:117)的变体。该变体中5’端的十六个核苷酸已被删除。seqidno:136对应于供体dna中存在的核苷酸序列,该核苷酸序列编码cox1基因中的第三指导rna靶位点(seqidno:118)的变体。该变体中3’端的五个核苷酸已被删除。seqidno:137对应于供体dna中存在的核苷酸序列,该核苷酸序列编码cox1基因中的第四指导rna靶位点(seqidno:119)的变体。该变体中3’端的十七个核苷酸已被删除。seqidno:138对应于存在于酿酒酵母的cox1基因中的pcr引物c的核苷酸序列。seqidno:139对应于存在于酿酒酵母的cox1基因中的pcr引物d的核苷酸序列。seqidno:140对应于存在于酿酒酵母的cox1基因中的pcr引物e的核苷酸序列。seqidno:141对应于存在于酿酒酵母的cox1基因中的pcr引物f的核苷酸序列。seqidno:142对应于存在于供体dna的gfp编码区中的pcr引物11的核苷酸序列。seqidno:143对应于存在于供体dna的gfp编码区中的pcr引物12的核苷酸序列。seqidno:144对应于衍生自转化酵母线粒体dna中gfp整合区域的pcr扩增产物的核苷酸序列。seqidno:145对应于莱茵衣藻(chlamydomonasreinhardtii)质体dna的psaa基因中的第一指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。seqidno:146对应于莱茵衣藻质体dna的psaa基因中的第二指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。该靶位点序列存在于基因序列的反向互补序列上。seqidno:147对应于莱茵衣藻质体dna的psaa基因中的第三指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。seqidno:148对应于莱茵衣藻质体dna的psaa基因中的第四指导rna靶位点的核苷酸序列。最后三个核苷酸是pam序列;这三个核苷酸在相应的指导rna的可变靶向结构域中不存在。该靶位点序列存在于基因序列的反向互补序列上。seqidno:149对应于编码spcas9的核苷酸序列,spcas9是来自酿脓链球菌的cas9。编码序列对于在衣藻叶绿体中表达是密码子优化的。seqidno:150对应于spcas9的氨基酸序列,spcas9是来自酿脓链球菌的cas9,其由seqidno:150和seqidno:120的核苷酸序列编码。seqidno:151对应于莱茵衣藻质体dna的psaa-外显子1基因的启动子和5’utr的核苷酸序列。seqidno:152对应于莱茵衣藻质体dna的psbd基因的启动子和5’utr的核苷酸序列。seqidno:153对应于莱茵衣藻质体dna的rbcl基因的终止子的核苷酸序列。seqidno:154对应于莱茵衣藻质体dna的trnw基因的启动子的核苷酸序列。seqidno:155对应于莱茵衣藻质体dna的trnw基因的3’utr的核苷酸序列。seqidno:156对应于编码莱茵衣藻质体dna的trnw基因的trna的核苷酸序列。seqidno:157对应于编码莱茵衣藻质体dna的trnk基因的trna的核苷酸序列。seqidno:158对应于编码莱茵衣藻质体dna的trnl基因的trna的核苷酸序列。seqidno:159对应于编码aada选择标记的核苷酸序列。seqidno:160对应于莱茵衣藻质体dna的rbcl基因的启动子和5’utr的核苷酸序列。seqidno:161对应于莱茵衣藻质体dna的psba基因的3’utr的核苷酸序列。seqidno:162对应于编码gfp的核苷酸序列。编码序列对于在衣藻叶绿体中表达是密码子优化的。seqidno:163对应于编码hr1的核苷酸序列,hr1是来自莱茵衣藻质体dna的同源区域,存在于供体dna中。seqidno:164对应于编码hr2的核苷酸序列,hr2是来自莱茵衣藻质体dna的同源区域,存在于供体dna中。seqidno:165对应于编码hr3的核苷酸序列,hr3是来自莱茵衣藻质体dna的同源区域,存在于供体dna中。seqidno:166对应于编码hr4的核苷酸序列,hr4是来自莱茵衣藻质体dna的同源区域,存在于供体dna中。seqidno:167对应于引物组1的正向引物(ps1fwd引物)的核苷酸序列,该引物被设计用于扩增转化的莱茵衣藻质体dna中的852bpgfp整合区域。ps1fwd引物是叶绿体基因组区域特异性引物。seqidno:168对应于引物组1的反向引物(ps1rev引物)的核苷酸序列,该引物被设计用于扩增转化的莱茵衣藻质体dna中的852bpgfp整合区域。ps1rev引物是gfp基因特异性引物。seqidno:169对应于引物组2的正向引物(ps2fwd引物)的核苷酸序列,该引物被设计用于扩增转化的莱茵衣藻质体dna中的712bpgfp整合区域。ps2fwd引物是gfp基因特异性引物。seqidno:170对应于引物组2的反向引物(ps2rev引物)的核苷酸序列,该引物被设计用于扩增转化的莱茵衣藻质体dna中的712bpgfp整合区域。ps2rev引物是叶绿体基因组区域特异性引物。seqidno:171对应于衍生自转化的莱茵衣藻质体dna中gfp整合区域的pcr扩增产物的核苷酸序列。seqidno:172对应于衍生自黑腹果蝇(drosophilamelanogaster)转录因子触足蛋白(antennapaedia)的第三α螺旋的渗透肽的氨基酸序列。具体实施方式现在将在下文中更全面地描述本公开内容,但是不应将其解释为限于本文阐述的实施方案。缩写的含义可以如下:“sec”可以表示秒,“min”可以表示分钟,“h”可以表示小时,“d”可以表示天,“μl”可以表示微升,“ml”可以表示毫升,“l”可以表示升,“μm”可以表示微摩尔,“mm”可以表示毫摩尔,“m”可以表示摩尔,“mmol”可以表示毫摩尔,“μmole”可以表示微摩尔,“g”可以表示克,“μg”可以表示微克,“ng”可以表示纳克,“u”可以表示单位,“nt”可以表示核苷酸;“bp”可以表示碱基对,“kb”可以表示千碱基,而“kbp”可以表示千碱基对。“转基因”可以指任何细胞、细胞系、愈伤组织、组织、生物体部分或整个生物体(例如,植物),其基因组已被诸如重组dna构建体的异源核酸的存在改变。转基因事件可以包括有性杂交或无性繁殖造成的事件。在一些实施方案中,术语“转基因”可以不包括由育种方法或由自然发生的事件(诸如随机异体受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)造成的基因组改变(例如,染色体或染色体外的改变)。在一些实施方案中,术语“转基因”可以包括由育种方法或由自然发生的事件(诸如随机异体受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)造成的基因组改变(例如,染色体或染色体外的改变)。例如,细胞或整个生物体的“基因组”可以包括在细胞核内发现的染色体dna(核dna)和在细胞的亚细胞组分内发现的细胞器dna(例如,线粒体dna、质体dna)。本公开内容的方法和组合物可用于编辑核基因组、细胞器基因组(例如,线粒体、叶绿体)或两者。术语“完全互补序列”和“全长互补序列”在本文可以互换使用,并且可以指给定核苷酸序列的互补序列。在一些方面,互补序列和核苷酸序列包含相同数目的核苷酸。在一些方面,互补序列和核苷酸序列可以包括100%互补。互补序列和核苷酸序列的核苷酸数目可以不同。互补性(例如,互补序列与核苷酸序列之间)可以为至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99%或100%。互补性(例如,互补序列与核苷酸序列之间)可以为至多约10%、至多约20%、至多约30%、至多约40%、至多约50%、至多约60%、至多约65%、至多约70%、至多约75%、至多约80%、至多约85%、至多约90%、至多约95%、至多约97%、至多约98%、至多约99%或100%。可以互换使用的“多核苷酸”、“核酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可以指核酸的聚合物(例如,rna、dna或两者,及其类似物),其可以是单链或双链的,任选地含有合成的、非天然的或改变的核苷酸碱基。核苷酸(例如,其5’-单磷酸形式)可通过其单字母名称表示,如下所示(分别用于rna或dna):“a”代表腺苷酸或脱氧腺苷酸,“c”代表胞苷酸或脱氧胞苷酸,“g”代表鸟苷酸或脱氧鸟苷酸,“u”代表尿苷酸,“t”代表脱氧胸苷酸,“r”代表基于嘌呤的核苷酸(a或g),“y”代表基于嘧啶的核苷酸(c或t),“k”代表g或t,“h”代表a或c或t,“i”代表肌苷以及“n”代表任何核苷酸。在本文中可以互换使用的“多肽”、“肽”、“氨基酸序列”和“蛋白质”可以指氨基酸残基的聚合物。该术语可以应用于其中一个或多个氨基酸残基可以是例如相应的天然存在的氨基酸和/或天然存在的氨基酸聚合物的人工化学类似物的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白质”可以包含修饰,修饰包括但不限于糖基化、脂质附接、硫酸化、谷氨酸残基的γ-羧化、羟基化和adp-核糖基化。多核苷酸或多肽的“功能片段”可以分别指连续核苷酸或连续氨基酸的任何子集,其中多核苷酸或多肽的原始(例如,野生型)活性(或基本相似的活性)可以保留。术语“功能片段”、“功能亚片段”、“功能上等同的片段”、“功能上等同的亚片段”、“功能等同片段”和“功能等同亚片段”在本文中可以互换使用。术语“功能变体”、“功能上等同的变体”和“功能等同变体”在本文中可以互换使用。在多核苷酸或多肽的上下文中,这些术语可以分别指核酸序列或氨基酸序列的变体,其中多核苷酸或多肽的原始活性(或基本相似的活性)可以保留。片段和变体可以通过诸如定点诱变和合成构建等方法获得。功能片段或功能变体的活性可以是,例如,大约:原始(例如,野生型)活性的100%、95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、40%、30%、20%、10%或小于10%。“rna转录物”可以指rna聚合酶催化的dna序列转录所产生的产物。当rna转录物是dna序列的完美互补拷贝时,其可以称为初级转录物。rna转录物可以称为成熟rna,例如当其为衍生自初级转录物的转录后加工的rna序列时。“信使rna”或“mrna”可以指没有内含子并且可以由细胞翻译成蛋白质的rna。“有义”rna可以指包括mrna的rna转录物。有义rna可以在细胞内或体外翻译成蛋白质。“反义rna”可以指可以与靶rna(例如,初级转录物或mrna)的全部或部分互补的rna转录物。反义rna可用于阻断靶基因的表达。反义rna的互补性可以是相对于特定基因转录物的任何部分,即,在5’非编码序列、3’非编码序列、内含子或编码序列处。“功能rna”可以指反义rna、核酶rna,或其他可以不被翻译但对细胞过程有影响的rna。例如关于mrna转录物,术语“互补序列”和“反向互补序列”在本文中可以互换使用,并且可以用于定义信息的反义rna。“cdna”可以指可以与mrna模板互补并且使用逆转录酶从mrna模板合成的dna。cdna可以是单链的或者使用dna聚合酶i的klenow片段转化为双链形式。“编码区”可以指信使rna的可以编码蛋白质或多肽的部分(或诸如dna分子的另一核酸分子的相应部分)。“非编码区”可以指信使rna或其他核酸分子的不是编码区的部分,包括但不限于例如启动子区、5’非翻译区(“utr”)、3’utr、内含子和终止子。术语“编码区”和“编码序列”在本文中可以互换使用。术语“非编码区”和“非编码序列”在本文中可以互换使用。“编码序列”可以缩写为“cds”。“开放阅读框”可以缩写为“orf”。“表达序列标签”(“est”)可以是衍生自cdna文库的dna序列。est可以是已转录的序列。est可以通过cdna插入片段的单次测序获得。整个cdna插入片段的序列可以称为“完全插入序列”(“fis”)。“重叠群”序列可以是由两个或更多个序列组成的序列,该两个或更多个序列可以选自但不限于est、fis和pcr序列。编码完整或功能蛋白质的序列可以称为“完整基因序列”(“cgs”)。cgs可以衍生自fis或重叠群。“基因”可以指可以表达诸如但不限于特定蛋白质的功能分子的核酸片段,包括:内含子、外显子、在编码序列之前的调控序列(5’非编码序列)和在编码序列之后的调控序列(3’非编码序列)。“天然基因”可以指在自然界中发现的基因,例如,具有其自身调控序列的基因。“突变的基因”可以是相对于相应的天然存在基因已经改变的基因;例如,通过人工干预改变。这样的“突变的基因”可以具有通过至少一个核苷酸的添加、删除或置换而与相应的非突变基因的序列不同的序列。在本公开内容的某些实施方案中,突变的基因可以包含由本文公开的多核苷酸指导的多肽系统引起的改变。突变生物体可以是包含突变的基因的生物体;例如,具有包含突变的基因的细胞器基因组的突变植物。术语“突变的基因”和“突变基因”在本文中可以互换使用。“沉默突变”可以指具有与野生型序列相同的功能的突变序列;例如,用可以编码相同氨基酸的同义密码子替换蛋白质编码区中的密码子。如本文所用,“靶向突变”可以是在基因组中特定靶位点处或附近进行的dna修饰。靶向突变可以与天然基因中的单个核苷酸变化一样小。靶向突变可涉及更大的dna修饰,诸如插入一个或多个异源dna;例如,异源调控元件、异源蛋白质编码序列或编码异源蛋白质或功能rna的表达盒。靶向突变也可涉及靶位点的序列的变化。术语“sdn”可以指“定点核酸酶”。以下是sdn诱导的突变的非限制性实例:(1)诱导位点特异性随机突变;(2)诱导特定基因的预定序列中的突变;和(3)整个基因的替换或插入。这些sdn诱导的突变可以分别称为sdn-1、sdn-2和sdn-3。“密码子修饰的基因”或“密码子优选的基因”或“密码子优化的基因”可以是其密码子使用频率被设计为模拟宿主细胞在感兴趣的区室(例如核、线粒体或叶绿体)中的优选密码子使用频率的基因。“成熟”蛋白质可以指翻译后加工的多肽;例如,已除去存在于初级翻译产物中的任何前体肽或前肽的多肽。“前体”蛋白可以指mrna翻译的初级产物;例如,前体肽和前肽仍然存在。例如,前体肽和前肽可以包含细胞内定位信号。“分离的”可以指物质,诸如核酸分子、蛋白和细胞,其可以基本上不含或以其他方式除去在天然存在的环境中通常与物质伴随出现或相互作用的组分。分离的多核苷酸可以从天然存在它们的宿主细胞中纯化。核酸纯化方法可用于获得分离的多核苷酸。分离的多核苷酸可以包括,例如,重组多核苷酸和化学合成的多核苷酸。例如,就序列而言,“异源”可以意指源自外来物种的序列,或者,如果来自同一物种,则是通过故意人为干预在组成和/或基因组基因座方面从其天然形式进行充分修饰的序列。术语“异源核苷酸序列”、“异源序列”、“异源核酸片段”和“异源核酸序列”在本文中可以互换使用。“重组”可以指两个或更多个原本分开的序列片段的人工组合,例如通过化学合成或通过经由遗传工程技术来操作分离的核酸片段。“重组”也可以包括指代细胞或载体,例如已经通过引入异源核酸而被修饰的细胞或载体,或源自如此修饰的细胞的细胞。“重组dna构建体”可以指在自然界中通常不会一起发现的核酸片段的组合。重组dna构建体可以包含,例如,衍生自不同来源的调控序列和编码序列,或衍生自相同来源的调控序列和编码序列。重组dna构建体中的序列可以以不同于自然界通常发现的方式排列。术语“重组dna构建体”、“重组dna分子”、“重组构建体”、“dna构建体”和“构建体”在本文中可以互换使用。“表达”可以指功能产物的产生。例如,核酸片段的表达可以指核酸片段的转录(例如,产生mrna或功能rna的转录)和/或mrna向前体或成熟蛋白质的翻译。“表达盒”可以指含有例如多核苷酸、调控元件和允许该多核苷酸在宿主中表达的多核苷酸的构建体。术语“表达盒”和“表达构建体”在本文中可以互换使用。术语“入门克隆”和“入门载体”在本文中可以互换使用。“调控序列”可以指核苷酸序列,例如位于编码序列的上游(例如,5’非编码序列)、内部(例如,内含子)或下游(例如,3’非编码序列)的核苷酸序列。调控序列可以影响,例如,相关联的编码序列的转录、rna加工或稳定性,或翻译。调控序列可以包括但不限于启动子、翻译前导序列、5’非翻译序列、3’非翻译序列、内含子、聚腺苷酸化靶序列、rna加工位点、效应子结合位点和茎环结构。调控序列可以“顺式”或“反式”起作用。由调控序列调控的核酸分子不一定必须编码功能肽或多肽,例如,调控序列可以调节短干扰rna或反义rna的表达。术语“调控序列”和“调控元件”在本文中可以互换使用。“启动子”可以指可以控制另一个核酸片段的转录的核酸片段。启动子可以包括核心启动子(也称为最小启动子)序列。核心启动子可以是直接转录起始的最小序列。核心启动子可以任选地包括增强子或其他调控元件。启动子可以整体地衍生自天然基因,或由衍生自自然界中发现的不同启动子的不同元件组成,或甚至包含合成的dna片段。不同的启动子可以引导基因在不同的组织或细胞类型中、或在不同的发育阶段、或响应于不同的环境条件而表达。“在植物中具有功能的启动子”可以是可以控制植物细胞中的转录的启动子。启动子可以来自任何合适的来源,该来源可以包括植物细胞和非植物细胞。“组织特异性启动子”和“组织优选的启动子”可以互换使用,并且可以指主要在一种组织、一种器官或一种细胞类型中表达的启动子。组织特异性启动子可以不一定在一种组织、一种器官或一种细胞类型中独有。根优选的启动子包括例如以下项:大豆根特异性谷氨酰胺合酶基因;细胞溶质谷氨酰胺合酶(gs);菜豆(frenchbean)grp1.8基因中的根特异性控制元件;根癌农杆菌(a.tumefaciens)甘露碱合酶(mas)的根特异性启动子;分离自糙叶山黄麻(parasponiaandersonii)和山黄麻(trematomentosa)的根特异性启动子;发根农杆菌(a.rhizogenes)rolc和rold根诱导基因;农杆菌创伤诱导的tr1’和tr2’基因;vfenod-grp3基因启动子;和rolb启动子。种子优选的启动子包括在种子发育过程中有活性的种子特异性启动子,以及在种子发芽过程中有活性的种子发芽启动子。种子优选的启动子包括但不限于以下项:cim1(细胞分裂素诱导的信息);cz19b1(玉米19kda玉米醇溶蛋白);milps(肌醇-1-磷酸合酶);end1;和end2。对于双子叶植物,种子优选的启动子包括但不限于以下项:豆β-菜豆素;油菜籽蛋白;β-伴大豆球蛋白(β-conglycinin);大豆凝集素;十字花科蛋白(cruciferin)等。对于单子叶植物,种子优选的启动子包括但不限于以下项:玉米15kda玉米醇溶蛋白;22kda玉米醇溶蛋白;27kdaγ玉米醇溶蛋白;waxy;shrunken1;shrunken2;球蛋白1;油质蛋白;nud;和玉米(zeamays)-rootmet2启动子。叶优选的启动子包括但不限于以下项:植物rbcs启动子,诸如大豆rbcs启动子和玉米rbcs启动子;玉米pepc1启动子。“发育调控的启动子”可以指其活性可以由发育事件决定的启动子。“诱导型启动子”可以指响应于内源性或外源性刺激的存在而选择性表达可操作连接的dna序列的启动子,该刺激是例如通过化学化合物(例如,化学诱导剂)或对环境、激素、化学和/或发育信号的响应。诱导型或调控的启动子包括,例如,受光、热、胁迫、洪水或干旱、植物激素、创伤或诸如乙醇、茉莉酸、水杨酸或安全剂的化学物质调控的启动子。病原体感染后诱导的病原体诱导型启动子包括但不限于调控pr蛋白、sar蛋白、β-1,3-葡聚糖酶、几丁质酶等表达的启动子。胁迫诱导型启动子包括植物rab17启动子,如玉米rab17启动子。化学诱导型启动子包括但不限于以下项:由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子;由被用作发芽前除草剂的疏水性亲电子化合物激活的玉米gst启动子;以及由水杨酸激活的烟草pr-1a启动子。其他化学物质调控的启动子包括类固醇响应性启动子,例如糖皮质激素诱导型启动子,以及四环素诱导型和四环素抑制型启动子。“组成型启动子”可以指在所有或大多数发育阶段在生物体的所有或大多数组织或细胞类型中有活性的启动子。与分类为“组成型”的其他启动子(例如泛素)一样,在不同组织或阶段之间可以存在绝对表达水平的一些变化。术语“组成型启动子”或“非组织依赖型启动子”在本文可以互换使用。组成型启动子包括以下项:rsyn7启动子的核心启动子;核心camv35s启动子;植物肌动蛋白启动子,诸如水稻肌动蛋白启动子和玉米肌动蛋白启动子;植物泛素启动子,诸如玉米泛素启动子和大豆泛素启动子;pemu;mas启动子;als启动子;植物gos2启动子,诸如玉米gos2启动子;大豆gm-ef1a2启动子;植物u6聚合酶iii启动子,诸如玉米u6聚合酶iii启动子和大豆u6聚合酶iii启动子(gm-u6-9.1和gm-u6-13.1)。增强子元件可以是在功能性地连接至启动子时,无论其相对位置如何,都增加核酸分子转录的任何核酸分子。增强子可以是启动子的固有元件或是被插入以增强启动子的水平或组织特异性的异源元件。阻遏物(有时在本文中也称为沉默子)可以定义为在功能性地连接至启动子时,无论相对位置如何,都抑制转录的任何核酸分子。“翻译前导序列”可以指位于基因的启动子序列与编码序列之间的多核苷酸序列。翻译前导序列可以存在于在翻译起始序列上游的完全加工的mrna中。翻译前导序列可以影响初级转录物向mrna的加工、mrna稳定性或翻译效率。“转录终止子”、“终止序列”或“终止子”可以是指当可操作地连接至待表达的多核苷酸序列的3’端时,可以终止从多核苷酸序列的转录的dna序列。转录终止可以指通过其可以停止经由rna聚合酶的rna合成并且rna和酶都从dna模板释放的过程。“可操作地连接”可以指片段相关联在单个片段(例如,多核苷酸或多肽)中或单个复合物中,从而一个片段的功能可以被另一个片段调控。连接可以是共价的或非共价的。例如,对于核酸片段,如果启动子可以调控核酸片段的转录,该启动子可以与该核酸片段可操作地连接。例如,对于多肽,如果靶向细胞器的肽可以将多肽运输到相关细胞器中,该靶向细胞器的肽可以与该多肽可操作地连接。例如,对于复合物,如果指导rna/cas多肽复合物可以按照指导rna的引导切割靶序列,该指导rna可以可操作地连接至cas多肽。“表型”可以指细胞或生物体的可检测特性。术语“引入”可以意指向细胞内提供多核酸(例如表达构建体)或蛋白。引入可以包括指代将核酸掺入到真核或原核细胞中,例如,其中该核酸可掺入到细胞的基因组中。引入可以包括指代向细胞瞬时提供核酸或蛋白质。引入可以包括指代稳定或瞬时转化方法。引入可以包括有性杂交。例如,在将核酸片段(例如重组dna构建体)插入细胞中的情况下,引入可以包括“转染”或“转化”或“转导”。引入可以包括指代将核酸片段掺入到真核或原核细胞中,其中该核酸片段可掺入到细胞的基因组(例如,染色体、质粒、质体或线粒体dna)中、转变为自主复制子或瞬时表达(例如,转染的mrna)。“转化的细胞”可以是已被引入核酸片段(例如,重组dna构建体)的任何细胞。如本文所用,“转化”可以指稳定转化。转化可以指瞬时转化。“稳定转化”可以指将核酸片段引入宿主生物体的基因组中,导致遗传学上稳定的遗传。一旦稳定转化,核酸片段就可以稳定整合到宿主生物体的基因组和任何后续世代中。“瞬时转化”可以指将核酸片段引入宿主生生物体的细胞核或含dna细胞器中,导致基因表达而没有遗传学上稳定的遗传。含有转化的核酸片段的宿主生物体可以被称为“转基因”生物体。“转化盒”可以指具有促进特定宿主细胞的转化的元件的构建体。术语“转化盒”和“转化构建体”在本文中可以互换使用。“等位基因”可以是占据染色体上给定基因座的基因的几种替代形式之一。当在二倍体植物中的一对同源染色体上的给定基因座上存在的等位基因相同时,该植物在该基因座上可以是纯合的。如果在二倍体植物中的一对同源染色体上的给定基因座上存在的等位基因不同,该植物在该基因座上可以是杂合的。如果在二倍体植物中的一对同源染色体之一上存在转基因,该植物在该基因座上可以是半合的。“叶绿体转运肽”可以是可以将蛋白质引导至在细胞中存在的叶绿体或其他质体类型的氨基酸序列。叶绿体转运肽可以与可以在生成蛋白质的细胞中与该蛋白质共同翻译。术语“叶绿体转运肽”、“质体转运肽”、“叶绿体靶向肽”和“质体靶向肽”在本文中可以互换使用。“叶绿体转运序列”可以指可以编码叶绿体转运肽的核苷酸序列。“信号肽”可以是可以将蛋白质引导至分泌系统的氨基酸序列。信号肽可以与蛋白质共同翻译。例如,如果将蛋白质引导至液泡,则可以进一步添加液泡靶向信号(同上),或者如果将蛋白质引导至内质网,则可以添加内质网保留信号(同上)。如果将蛋白质引导至核,则可以除去存在的任何信号肽并且可以包含核定位信号。“线粒体信号肽”可以是可以将前体蛋白质引导至线粒体的氨基酸序列。术语“线粒体信号肽”、“线粒体转运肽”和“线粒体靶向肽”在本文中可以互换使用。“靶向细胞器的多核苷酸”可以是可以引导多核苷酸导入细胞器中的核苷酸序列。术语“靶向细胞器的多核苷酸”、“靶向细胞器的核酸”和“靶向细胞器的核酸序列”在本文中可以互换使用。靶向细胞器的多核苷酸可以被引导至,例如,质体(“质体靶向多核苷酸”)或线粒体(“线粒体靶向多核苷酸”)。多核苷酸可以是rna(“靶向细胞器的rna”)、dna(“靶向细胞器的dna”)或rna与dna的组合。被引导至质体的靶向细胞器的rna可以被称为“质体靶向rna”。术语“质体靶向rna”、“叶绿体靶向rna”和“转运rna”在本文可互换使用。被引导至线粒体的靶向细胞器的rna可以被称为“线粒体靶向rna”。rna可以被导入线粒体中。一种这样的线粒体靶向rna可以是酵母trnalys。酵母trnalys及其变体可以被导入人线粒体中。另一种可以被导入线粒体中的rna可以是5srrna。5srrna可以充当用于将异源rna序列递送到例如线粒体(例如,人线粒体)中的载体。此类rna可以与本公开内容的组合物和方法一起使用,例如,用于靶向细胞器(例如,线粒体)。rna可以被导入质体中。可以介导附接的异源rna的导入的质体靶向rna可以包括vd-5’utr(例如,充当5’utr的类病毒衍生的ncrna序列,和eif4e1mrna)。此类rna可以与本公开内容的组合物和方法一起使用,用于靶向细胞器(例如,质体)。如本文所用,“融合体”可以指包含一个或多个非天然序列(例如,部分)的蛋白质和/或核酸。可将本文所述的任何分子(例如,核酸、蛋白质、多肽、多核酸、cas蛋白、指导多核苷酸)工程化为融合体。融合体可以包含一个或多个相同的非天然序列。融合体可以包含一个或多个不同的非天然序列。融合体可以是嵌合体。融合体可以包含核酸亲和标签。融合体可以包含条形码。融合体可以包含肽亲和标签。融合体可以提供定点多肽的亚细胞定位。融合体可以提供可用于追踪或纯化的非天然序列(例如,亲和标签)。融合体可以是诸如生物素的小分子,或染料,诸如alexafluor染料、cyanine3染料和cyanine5染料。融合体可以指具有功能作用的任何蛋白质。例如,融合蛋白可以包含脱氨酶活性、胞苷脱氨酶活性(美国专利公开号us20150166980,通过引用并入本文)、腺嘌呤脱氨酶活性(美国专利公开号us20180073012,通过引用并入本文)、尿嘧啶糖基化酶抑制剂活性(美国专利公开号us20170121693,通过引用并入本文)、甲基转移酶活性、脱甲基酶活性、歧化酶活性、烷化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖苷酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、苏素化活性、去苏素化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性、重塑活性、蛋白酶活性、氧化还原酶活性、转移酶活性、水解酶活性、裂解酶活性、异构酶活性、合酶活性、合成酶活性或脱豆蔻酰化活性。效应蛋白可以修饰基因组基因座。融合蛋白可以是cas蛋白中的融合体。cas蛋白可以是具有切口酶活性的修饰形式或没有实质的核酸切割活性的修饰形式。融合蛋白可以是cas蛋白中的非天然序列。如本文所用,“核酸”可以指多核苷酸序列或其片段。核酸可以包含核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞的环境中。核酸可以是基因或其片段。核酸可以是dna。核酸可以是rna。核酸可以包括一个或多个类似物(例如改变的主链、糖或核碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、异种核酸、吗啉基、锁核酸、乙二醇核酸、苏糖核酸、双脱氧核苷酸、虫草菌素、7-脱氮-gtp、荧光团(例如罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、与生物素连接的核苷酸、荧光碱基类似物、cpg岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷和怀俄苷。基因表达的抑制“抑制dna构建体”可以是重组dna构建体,当其被转化或稳定地整合到植物的基因组中时,可以导致靶基因的“沉默”(例如,在植物中)。靶基因可以对靶细胞(例如植物)是内源性或转基因的。如本文所用,关于靶基因的“沉默”可以指抑制靶基因表达的mrna或蛋白质/酶的水平,和/或酶活性或蛋白功能的水平。可以在本文中互换使用的术语“抑制”和“沉默”可以包括降低、缩减、下降、减少、抑制、消除或预防。“沉默”或“基因沉默”可以通过任何合适的机制发生。沉默的非限制性实例可以包括反义、共抑制、病毒抑制、发夹抑制、茎环抑制、基于rnai的方法和基于小rna的方法抑制dna构建体可以包含衍生自感兴趣靶基因的区域。抑制dna构建体可以包含感兴趣靶基因的有义链(或反义链或两者)的全部或部分核酸序列。该区域可以与感兴趣基因的全部或部分有义链(或反义链或两者)100%相同或小于100%相同(例如,至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)。抑制dna构建体可以包含感兴趣基因的有义链(或反义链或两者)的20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个连续核苷酸,及其组合。例如一旦选择了感兴趣的靶基因,就可以容易地构建抑制dna构建体。抑制dna构建体可以包括但不限于共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制构建体、茎环抑制构建体、产生双链rna的构建体,以及更一般地,rnai(rna干扰)构建体和小rna构建体,诸如sirna(短干扰rna)构建体和mirna(微rna)构建体。基因表达的抑制也可以通过例如使用人工mirna前体、核酶构建体和基因破坏来实现。可以使用修饰的植物mirna前体,其中该前体已被修饰,例如用被设计用于产生导向感兴趣的核苷酸序列的mirna的序列替代mirna编码区。基因破坏可以通过使用可转座元件或通过使用引起位点特异性突变的化学剂来实现。“反义抑制”可以指可以抑制靶基因或基因产物的表达的反义rna转录物的产生。“反义rna”可以指与靶标初级转录物或mrna的全部或部分互补的rna转录物。反义rna可以阻断靶标分离的核酸片段的表达。反义rna的互补性可以是相对于特定基因转录物的任何部分,即,在5’非编码序列、3’非编码序列、内含子或编码序列处。“共抑制”可以指可以抑制靶基因或基因产物的表达的有义rna转录物的产生。“有义”rna可以指可以包括mrna的rna转录物。有义rna可以在细胞内或体外翻译成蛋白质。植物中的共抑制构建体可以被设计成有义定向,例如通过聚焦于与天然mrna具有同源性的核酸序列的过表达,这可以导致与过表达序列具有同源性的rna的减少。植物病毒序列可用于引导近端mrna编码序列的抑制。rna干扰可以指由例如短干扰rna(sirna)介导的序列特异性转录后基因沉默的过程(例如,在动物中)。植物中的相应过程可以称为转录后基因沉默(ptgs)或rna沉默,在真菌中还可以称为压抑。转录后基因沉默的过程可以是用于防止外源基因表达的进化保守的细胞防御机制。转录后基因沉默可以由不同的植物区系和门类共享。小rna在控制基因表达中可以发挥重要作用。小rna可以通过与互补rna或dna靶序列进行碱基配对来发挥功能。当与rna结合时,小rna可以触发靶序列的rna切割或翻译抑制。当与dna靶序列结合时,小rna可以介导靶序列的dna甲基化。小rna可以导致基因表达的抑制。微rna(mirna)可以是长度为例如约19至约24个核苷酸(nt)的非编码rna。微rna可以存在于动物和植物中。可以从较长的前体转录物加工出mirna,该较长的前体转录物的大小范围可以为例如从大约70到200nt。前体转录物可以形成稳定的发夹结构。微rna(mirna)可以调控靶基因,例如通过结合位于靶基因所产生的转录物中的互补序列。mirna可以进入例如靶基因调控的至少两种途径:(1)翻译抑制;和/或(2)rna切割。进入rna切割途径的微rna可以类似于在动物的rna干扰(rnai)和植物的转录后基因沉默(ptgs)期间产生的21-25nt短干扰rna(sirna)。可以将这些进入rna切割途径的微rna掺入rna诱导的沉默复合物(risc)中,该复合物可以与见于rnai的那些相似或相同。术语“mirna-星号序列”和“mirna*序列”在本文中可以互换使用,并且可以指mirna前体中可以与mirna序列高度互补的序列。mirna和mirna*序列可以形成mirna前体发夹结构的茎区域的一部分。序列同一性、相似性和变化序列比对和同一性或相似性百分比计算可以使用被设计用于检测同源序列的多种比较方法来确定,该方法包括但不限于lasergenetm生物信息学计算套件(dnastartminc.,madison,wl)的megaligntm程序。在一些实施方案中,在使用序列分析软件进行分析的情况下,分析的结果可以基于所指程序的“默认值”。如本文所用,“默认值”可以表示在首次初始化时最初随软件加载的任何一组值或参数。“clustalv比对方法”可以对应于被称为clustalv的比对方法,并且例如,可以在lasergenetm生物信息学计算套件(dnastartminc.,madison,wl)的megaligntm程序中找到。对于多重比对,默认值可以对应于空位罚分(gappenalty)=10和空位长度罚分(gaplengthpenalty)=10。使用clustal方法进行蛋白质序列的成对比对和同一性百分比计算的默认参数可以为,例如,k元组(ktuple)=1,空位罚分=3,窗口(window)=5和保存的对角线(diagonalssaved)=5。对于核酸,这些参数可以是例如k元组=2,空位罚分=5,窗口=4和保存的对角线=4。使用clustalv程序进行序列比对后,可以通过查看同一程序中的“序列距离”表来获得“同一性百分比”和“分歧度”值。“clustalw比对方法”可以对应于被称为clustalw的比对方法,并且例如,可以在lasergenetm生物信息学计算套件(dnastartminc.,madison,wl)的megaligntmv6.1程序中找到。用于多重比对的默认参数可以对应于例如:空位罚分=10,空位长度罚分=0.2,延迟分歧度序列(delaydivergencesequences)=30%,dna转换权重(dnatransitionweight)=0.5,蛋白质权重矩阵(proteinweightmatrix)=gonnetseries,dna权重矩阵(dnaweightmatrix)=iub。使用clustalw程序对序列进行比对后,可以通过查看同一程序中的“序列距离”表来获得“同一性百分比”值。序列同一性/相似性值也可以使用gap版本10(gcg,accelrys,sandiego,ca)采用例如以下参数来获得:核苷酸序列的同一性%和相似性%,其使用空位产生罚分权重50和空位长度延伸罚分权重3以及nwsgapdna.cmp评分矩阵得到;氨基酸序列的同一性%和相似性%,其使用空位产生罚分权重8和空位长度延伸罚分2以及blosum62评分矩阵得到。空位可以使用算法来查找两个完整序列的比对,该比对可以使匹配数最大化并使空位数最小化。空位可以考虑所有可能的比对和空位位置。空位可以使用例如以匹配碱基为单位的空位产生罚分和空位延伸罚分来创建具有最多匹配碱基数和最少空位的比对。“blast”可以是由国家生物技术信息中心(ncbi)提供的搜索算法,其可以用于发现生物序列之间的相似性区域。该程序可以将核苷酸或蛋白质序列与序列数据库进行比较。该程序可以计算匹配的统计显著性,以识别与查询序列具有足够相似性的序列,使得相似性可以不被预测为随机发生。blast可以报告已识别的序列及其与查询序列的局部比对。术语“保守结构域”或“基序”可以意指沿着进化相关蛋白质的比对序列在特定位置保守的一组氨基酸。尽管在同源蛋白质之间其他位置的氨基酸可以变化,但在特定位置高度保守的氨基酸可以指示,例如,对于蛋白质的结构、稳定性或活性必不可少的氨基酸。保守结构域或基序可以通过它们在蛋白质同系物家族的比对序列中的高度保守来识别。保守结构域可以用作标识符或“签名”,例如,用于确定具有新确定的序列的蛋白质是否属于先前识别的蛋白质家族。多核苷酸和多肽序列、其变体以及这些序列的结构关系可以通过在本文中可以互换使用的术语“同源性”、“同源”、“基本相同”、“基本相似”和“基本对应”来描述。这些术语可以指这样的多肽或核酸片段,其中一个或多个氨基酸或核苷酸碱基的变化可以不影响分子的功能,诸如介导基因表达或产生某种表型的能力。这些术语也可以指相对于初始的未修饰片段,可以基本上不改变所得核酸片段的功能特性的核酸片段的修饰。这些修饰可以包括核酸片段中一个或多个核苷酸的删除、置换和/或插入。所涵盖的基本上相似的核酸序列可以通过它们与本文例示的序列或与本文公开的核苷酸序列的任何部分杂交(例如,在适度严格条件下,例如,0.5xssc,0.1%sds,60℃)的能力来定义。基本相似的核酸序列可以在功能上等同于本文公开的任何核酸序列。可以调整严格性条件以筛选适度相似的片段(诸如来自关系疏远的生物体的同源序列)到高度相似的片段(诸如复制来自关系紧密的生物体的功能酶的基因)。杂交后洗涤可以确定严格性条件。术语“选择性杂交”可以包括指代例如在严格杂交条件下核酸序列与指定的核酸靶序列的杂交,该杂交的程度可检测地高于其与非靶核酸序列的杂交(例如,为背景的至少2倍)并且基本上排除非靶核酸。选择性杂交的序列可以彼此具有例如至少约80%的序列同一性,或90%的序列同一性,直至并包括100%的序列同一性(即,完全互补)。术语“严格条件”或“严格杂交条件”可以包括指代在体外杂交测定中探针可以选择性地与其靶序列杂交的条件。严格条件可以是序列依赖性的。严格条件在不同情况下可以有所不同。通过控制杂交和/或洗涤条件的严格性,可以识别与探针100%互补的靶序列(同源探测)。可替代地,可以调整严格性条件以允许序列中的一些错配,从而检测到较低的相似度(异源探测)。在一些实施方案中,探针的长度可以小于约1000个核苷酸,任选地长度小于500个核苷酸。在一些实施方案中,严格条件可以是其中盐浓度小于约1.5mna离子的条件,例如,在ph7.0至8.3下约0.01至1.0mna离子浓度(或其他盐),以及例如,对于短探针(例如,10至50个核苷酸)至少约30℃,以及例如,对于长探针(例如,大于50个核苷酸)至少约60℃。通过添加去稳定剂如甲酰胺也可以达到严格条件。示例性的低严格性条件可以包括例如在37℃下用30%至35%甲酰胺、1mnacl、1%sds(十二烷基硫酸钠)的缓冲溶液进行杂交,并在50℃至55℃下在1x至2xssc(20xssc=3.0mnacl/0.3m柠檬酸三钠)中洗涤。示例性的适度严格性条件可以包括在37℃下在40%至45%甲酰胺、1mnacl、1%sds中杂交,并在55至60℃在0.5x至1xssc中洗涤。示例性的高严格性条件可以包括例如在37℃下在50%甲酰胺、1mnacl、1%sds中杂交,并在60℃至65℃下在0.1xssc中洗涤。在核酸或多肽序列的情况下,“序列同一性”或“同一性”可以指两个序列中当在指定的比较窗口上比对成最大对应性时是相同的核酸碱基或氨基酸残基。术语“序列同一性百分比”可以指通过在比较窗口上比较两个最佳比对的序列而确定的值。与参考序列(其可以或可以不包含添加或缺失)相比,比较窗口中的多核苷酸或多肽序列的部分可以包含添加或缺失(即,空位),以实现两个序列的最佳比对。百分比的计算可以通过例如确定在两个序列中出现相同的核酸碱基或氨基酸残基的位置数以产生匹配位置数,用匹配位置数除以在比较窗口中的位置总数并将结果乘以100可得出序列同一性的百分比。序列同一性百分比可以包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或从50%至100%之间的任何百分比。序列同一性可以包括从50%到100%的整数百分比。可以使用本文所述的任何程序来确定这些同一性。序列同一性可用于识别来自其他物种的多肽或天然或合成修饰的多肽,其中此类多肽具有相同或相似的功能或活性。同一性百分比可以包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。序列同一性(例如,氨基酸序列同一性)可以包括从50%至100%的整数百分比。序列(例如,氨基酸)同一性可以包括例如约:50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。与植物相关的定义、性状和过程“植物”可以包括指代完整植物、植物器官、植物组织、植物繁殖体、种子和植物细胞及其后代。植物细胞包括但不限于来自种子、悬浮培养物、胚胎、分生组织区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子的细胞。“繁殖体”可以包括能够繁殖新植物的减数分裂和/或有丝分裂产物。繁殖体可以包括种子、孢子和可以用作营养繁殖手段的植物部分,诸如球茎、块茎、短匐茎或匍匐枝。繁殖体可以包括嫁接物,其中可以将植物的一部分嫁接到不同植物(甚至是不同物种的植物)的另一部分以产生活生物体。繁殖体可以包括通过克隆或将减数分裂产物聚集在一起,或使减数分裂产物聚集在一起以形成胚胎或受精卵(自然地或在人类干预下)而产生的植物和种子。“后代”可以包括植物的任何后续世代。术语“单子叶植物”和“单子叶的植物”在本文中可以互换使用。单子叶植物可以包括禾本科(gramineae)。术语“双子叶植物”和“双子叶的植物”在本文中可以互换使用。双子叶植物可以包括例如以下科:十字花科(brassicaceae)、豆科(leguminosae)和茄科(solanaceae)。“转基因植物”可以包括指代在其基因组中包含异源多核苷酸的植物。例如,异源多核苷酸可以稳定地整合在基因组(例如,核、质体、线粒体)内,使得该多核苷酸可以传递给连续的世代。异源多核苷酸可以单独或作为重组dna构建体的一部分整合到基因组中。“转基因植物”可以包括指代在其基因组内可以包含超过一个异源多核苷酸的植物。每个异源多核苷酸可以赋予转基因植物不同的性状。可以将多种性状引入作物植物,并且这可以称为基因堆叠方法。基因堆叠可用于例如遗传改良的种质的开发。在这种方法中,可以将赋予不同感兴趣特性的多个基因引入植物。基因堆叠可以通过许多手段来完成,包括但不限于共转化、再转化以及与不同转基因的品系杂交。如本文所用,术语“堆叠的”可以包括在同一植物中存在多个性状(例如,两种性状都掺入到核基因组中,一种性状掺入到核基因组中并且一种性状掺入到细胞器的基因组中,或两种性状都整合到细胞器的基因组中。)在本公开内容的情况下,术语“杂交的”或“杂交(cross)”可以指配子融合(例如,通过授粉)以产生后代(例如,细胞、种子或植物)。该术语可以涵盖有性杂交(例如,一株植物被另一株植物授粉)和自交(例如,自花传粉;当花粉和胚珠来自同一植物或遗传上相同的植物时)。术语“母系遗传”可以指可以仅依赖于雌性配子基因组的特性的性状传递。术语“父系遗传”可以指可以仅依赖于雄性配子基因组的特性的性状传递。术语“渐渗现象”可以指遗传基因座的期望等位基因从一种遗传背景向另一种遗传背景的传递。例如,在特定基因座处的期望等位基因的渐渗现象可以通过两个亲本植物之间的有性杂交传递给至少一个后代植物,其中至少一个亲本植物在其基因组内具有期望的等位基因。可替代地,例如,等位基因的传递可通过两个供体基因组之间的重组发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有期望的等位基因。期望的等位基因可以是例如转基因,或标记或qtl的选定的等位基因。“植物优化的核苷酸序列”可以是已被优化以增加植物中的表达的核苷酸序列,特别是增加在植物中或在一个或多个感兴趣的植物中的表达。例如,可以通过使用一个或多个用于增强表达的植物优选的密码子来修饰编码蛋白质(诸如,例如,本文公开的双链断裂诱导剂(例如,核酸内切酶))的核苷酸序列来合成植物优化的核苷酸序列。可以将宿主优选的密码子使用用于密码子优化。可以合成植物优选的基因。另外的序列修饰可以增强在植物宿主中的基因表达。这些修饰可以包括,例如,消除:编码伪多腺苷酸化信号的一个或多个序列,一个或多个外显子-内含子剪接位点信号,一个或多个转座子样重复序列,以及可能对基因表达有害的序列。序列的g-c含量可以调整至例如给定植物宿主的平均水平,该平均水平通过参照宿主植物细胞中表达的基因来计算。如果可能的话,可以修饰该序列以避免一个或多个预测的发夹二级mrna结构。因此,本公开内容的“植物优化的核苷酸序列”可以包含一个或多个这样的序列修饰。“性状”可以指例如植物或特定植物物质或细胞的生理、形态、生化或物理特性。在一些情况下,该特性对于人眼来说可以是可见的,诸如种子或植物的大小,或者可以通过生化技术来测量,诸如检测种子或叶的蛋白质、淀粉或油含量,或者通过观察代谢或生理过程(例如通过测量对缺水或特定盐或糖浓度的耐受性),或者通过观察一个或多个基因的表达水平,或者通过农业观察,诸如渗透胁迫耐受性或产量。“农艺特性”可以是可测量的参数,包括但不限于非生物胁迫耐受性、绿度、产量、生长速度、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物氮含量、果实氮含量、种子氮含量、营养组织中的氮含量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织中的游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织中的蛋白质含量、耐旱性、氮素吸收、根系倒伏、收获指数、茎秆倒伏、株高、穗高、穗长、耐盐性、早期幼苗活力和低温胁迫下的出苗。特定的表型可以包括但不限于籽粒数目、籽粒面积、谷粒重量和穗上谷粒的预测重量(基于籽粒面积相对于谷粒重量的校准)。非生物胁迫可能是选自以下的至少一项条件:干旱、缺水、洪水、高光强、高温、低温、盐度、黄化、脱叶、重金属毒性、厌氧生活、缺素、养分过量、紫外线照射、大气污染(例如、臭氧)和暴露于诱导活性氧(ros)产生的化学物质(例如,百草枯)。植物的“增加的胁迫耐受性”可以相对于参照或对照植物来测量,并且可以是该植物在胁迫条件下存活较长时间的性状,而没有表现出相对于在相似胁迫条件下生长的参照或对照植物相同程度的生理或物理退化。具有“增加的胁迫耐受性”的植物可表现出对一个或多个不同胁迫条件的耐受性增加。多肽的“胁迫耐受性活性”可以表明相对于参照或对照植物,在转基因植物中该多肽的过表达可以赋予转基因植物增加的胁迫耐受性。增加的生物量可以被测量为例如与对照植物相比植物高度、植物总叶面积、植物鲜重、植物干重或植物种子产量的增加。增加植物的生物量或大小的能力可以具有若干重要的商业应用。可以生成可产生更大栽培种的作物物种,在例如植物的营养部分可用作食物、生物燃料或两者的植物中生成更高的产量。可以通过本公开内容的方法和组合物产生增加的叶大小。叶生物量的增加可以用于增加植物衍生的药物或工业产品的产生。总植物光合作用的增加可以通过例如增加植物的叶面积来实现。可以使用附加的光合作用能力来增加源自特定植物组织(包括叶、根、果实或种子)的产量,或允许植物在降低的光强或高光强下生长。对组织(诸如根组织)的生物量的修饰可用于改良植物在恶劣环境条件(包括干旱或营养缺乏)下的生长能力。较大的根可能会更好地到达水分或养分或吸收水分或养分。例如对于某些观赏植物,提供更大品种的能力可以是非常需要的。对于许多植物,包括结果实的树木、用于木材生产的树木或用作风景或挡风屏的树木和灌木,材质增加可以以更高的产量或增强的屏蔽作用的形式提供增强的益处。植物中的除草剂“除草剂耐受性蛋白”或由“编码除草剂耐受性的核酸分子”的表达产生的蛋白质可以包括可以赋予细胞,例如,与不表达该蛋白的细胞相比,耐受更高浓度除草剂的能力的蛋白质。除草剂耐受性蛋白或由编码除草剂耐受性的核酸分子的表达产生的蛋白质可以包括可以赋予细胞,与不表达该蛋白质的细胞相比,更长时间地耐受除草剂浓度的能力的蛋白质。可以通过例如编码对除草剂的耐受性的基因将除草剂耐受性性状引入植物。编码对除草剂的耐受性的基因包括,例如,具有抑制乙酰乳酸合酶(als)作用的基因,诸如磺酰脲类除草剂,具有抑制谷氨酰胺合酶作用的基因,诸如膦丝菌素或basta(例如,bar基因),草甘膦(例如,epsp合酶基因),hppd抑制剂(例如,hppd基因)。除草剂耐受性蛋白可以包括以下项:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽和乙酰辅酶a羧化酶(acc酶)。可用于赋予植物除草剂耐受性的基因的非限制性实例可以包括编码上述蛋白质的基因。如本文所用,“羟基苯丙酮酸双加氧酶”和“hppd”、“4-羟基苯丙酮酸(或丙酮酸)双加氧酶(4-hppd)”和“对羟基苯丙酮酸(或丙酮酸)双加氧酶(p-ohpp)”可以是同义词并且可以指非血红素铁依赖性加氧酶,其催化4-羟基苯丙酮酸转化为尿黑酸。在降解酪氨酸的生物体中,hppd催化的反应可以是该途径的第二步。在植物中,尿黑酸的形成对于合成可以用作氧化还原辅因子的质体醌和生育酚可能是必需的。编码羟基苯丙酮酸双加氧酶(hppd)的多核苷酸分子可以提供对hppd抑制剂的耐受性。如本文所用,“hppd抑制剂”可以包括可降低hppd催化4-羟基苯丙酮酸转化成尿黑酸的能力的任何化合物或化合物的组合。在特定的实施方案中,hppd抑制剂可以包括hppd的除草剂抑制剂。hppd抑制剂的非限制性实例包括三酮(诸如,硝磺草酮、磺草酮、苯唑草酮和环磺酮);异噁唑(诸如,磺酰草吡唑和异噁唑草酮);吡唑(诸如,吡草酮、苄草唑和吡唑特);和苯并双环酮。各种抑制剂的农业上可接受的盐可以包括用于形成农业或园艺用途的盐的盐(例如,阳离子或阴离子盐)。“耐als抑制剂的多肽”可以包括任何在植物中表达时可以赋予对至少一种als抑制剂耐受性的多肽。als抑制剂包括,例如,磺酰脲、咪唑啉酮、三唑并嘧啶、嘧啶氧基(硫代)苯甲酸酯和/或磺酰氨基羰基三唑啉酮除草剂。就例如对磺酰脲、咪唑啉酮、三唑并嘧啶和嘧啶基(硫代)苯甲酸酯的耐受性而言,als突变可以分为不同的类别。als突变可以包括具有以下一项或多项特性的突变:(1)对所有这四组的广泛耐受性(例如,磺酰脲、咪唑啉酮、三唑并嘧啶和嘧啶基(硫代)苯甲酸酯);(2)对咪唑啉酮和嘧啶基(硫代)苯甲酸酯的耐受性;(3)对磺酰脲类和三唑并嘧啶的耐受性;和(4)对磺酰脲和咪唑啉酮的耐受性。编码涉及除草剂耐受性的蛋白质的多核苷酸分子可以包括编码5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)的多核苷酸分子,例如用以赋予草甘膦耐受性。草甘膦耐受性也可以通过表达编码草甘膦氧化还原酶(gox)或草甘膦-n-乙酰转移酶(gat)的多核苷酸分子而获得。编码外源的膦丝菌素乙酰转移酶的多核苷酸可以用于除草剂耐受性。含有外源的膦丝菌素乙酰转移酶的植物可以表现出对可以抑制例如谷氨酰胺合酶的草铵膦除草剂的耐受性增强。赋予改变的原卟啉原氧化酶(protox)活性的多核苷酸可以用于除草剂耐受性。含有此类多核苷酸的植物可以表现出对可以靶向例如protox酶(也称为“protox抑制剂”)的多种除草剂的耐受性增强。麦草畏单加氧酶可以用于提供麦草畏耐受性。编码aad12或编码aad1的多核苷酸分子可以用于提供对例如生长素除草剂的耐受性。p450序列可以用于赋予除草剂耐受性。p450序列可以通过例如除草剂的代谢提供对hppd抑制剂的耐受性。这样的序列包括但不限于nsf1基因。通过基因沉默在植物中产生抗虫性“植物害虫”可以指可以直接或间接伤害任何植物或植物产物、对其造成损害或引起疾病的实体的任何生命阶段。植物害虫可以包括原生动物、非人类动物、寄生植物、细菌、真菌、病毒、类病毒、传染原、病原体或与其相似或相关的任何物体。双链rna(dsrna)可以用于提供对植物害虫的耐受性。植物害虫无脊椎动物可以包括但不限于有害线虫、有害软体动物(蛞蝓和蜗牛)和有害昆虫。植物病原体可以包括真菌和线虫。植物病原体可以是真核植物病原体。这包括例如真菌病原体,诸如植物病原性真菌。真菌植物病原体的非限制性实例包括,例如,引起白粉病、锈病、叶斑病和枯萎病、猝倒病、根腐病、冠腐病、棉花铃腐病、茎溃疡病、小枝溃疡病、维管萎蔫病、黑穗病或发霉的真菌,包括但不限于镰孢属(fusariumspp.)、层锈菌属(phakosporaspp.)、丝核菌属(rhizoctoniaspp.)、曲霉属(aspergillusspp.)、赤霉属(gibberellaspp.)、梨孢属(pyriculariaspp.)、链格孢属(alternariaspp.)和疫霉属(phytophthoraspp.)。真菌植物病原体的具体实例包括豆薯层锈菌(phakosporapachirhizi)(亚洲大豆锈病)、高粱柄锈菌(pucciniasorghi)(玉米普通锈病)、多堆柄锈菌(pucciniapolysora)(玉米南方锈病)、尖镰孢(fusariumoxysporum)和其他镰孢属、链格孢属、青霉属(penicilliumspp.)、瓜果腐霉(pythiumaphanidermatum)和其他腐霉属(pythiumspp.)、立枯丝核菌(rhizoctoniasolani)、大斑病突脐蠕孢(exserohilumturcicum)(玉米大斑病)、玉米双极蠕孢(bipolarismaydis)(玉米小斑病)、玉米黑粉菌(ustilagomaydis)(玉米黑粉病)、禾谷镰孢(fusariumgraminearum)(玉米赤霉(gibberellazeae))、轮状镰孢(fusariumverticilliodes){串珠状赤霉(gibberellamoniliformis))、增生镰孢(f.proliferatum)(藤仓赤霉中间变种(g.fujikuroivar.intermedia))、半粘镰孢(f.subglutinous)(半粘赤霉(g.subglutinans))、玉米色二孢(diplodiamaydis)、丝轴团散黑粉菌(sporisoriumholci-sorghi)、禾生刺盘孢(colletotrichumgraminicola)、大斑病毛球腔菌(setosphaeriaturcica)、玉米出芽短梗霉(aureobasidiumzeae)、致病疫霉(phytophthorainfestans)、大豆疫霉(phytophthorasojae)、油菜核盘菌(sclerotiniasclerotiorum)和真菌物种。无脊椎害虫的非限制性实例可以包括胞囊线虫异皮线虫属(heteroderaspp.)如大豆异皮线虫、根瘤线虫根结线虫属(meloidogynespp.)、矛线虫纽带线虫属(hoplolaimusspp.)、矮化线虫矮化线虫属(tylenchorhynchusspp.)、螺旋形线虫螺旋线虫属(helicotylenchusspp.)、根腐线虫短体线虫属(pratylenchusspp.)、环形线虫环线虫属(criconemaspp.)、叶线虫真滑刃线虫属(aphelenchusspp.)或滑刃线虫属(aphelenchoidesspp.)、玉米根虫、盲蝽属(lygusspp.)、蚜虫和类似的吸取汁液的昆虫诸如葡萄根瘤蚜(daktulosphairavitifoliae)、玉米螟、切根虫、粘虫、叶蝉、日本甲虫、蝗虫和其他有害鞘翅目昆虫、双翅目昆虫和鳞翅目昆虫。无脊椎害虫的其他实例可以包括能够侵害作物植物根系的害虫,例如,北方玉米根虫(巴氏根萤叶甲(diabroticabarberi))、南方玉米根虫(黄瓜十一星根萤叶甲(diabroticaundecimpunctata))、西方玉米根虫(玉米根萤叶甲(diabroticavirgifera))、玉米根蚜(玉蜀黍根蚜(anuraphismaidiradicis))、黑色切根虫(小地老虎(agrotisipsilon))、玻璃状切根虫(透翅切根夜蛾(crymodesdevastator))、脏切根虫(番茄褐夜蛾(feltiaducens))、粘土状后背的切根虫(泥背地老虎(agrotisgladiaria))、金针虫(梳爪叩头虫属(melanotusspp.)、aeolusmanllillus)、小麦金针虫(aeolusmancus)、砂地金针虫(horistonotusuhlerii)、玉米象甲(玉米尖隐喙象(sphenophorusmaidis))、梯牧草象甲(sphenophoruszeae)、早熟禾象甲(牧草尖隐喙象(sphenophorusparvulus))、南方玉米象甲(sphenophoruscallosus)、蛴螬(鳃角金龟(phyllophagaspp.))、玉米种蝇(灰地种蝇(deliaplatura))、葡萄肖叶甲(褐斑肖叶甲(colaspisbrunnea))、玉米籽步甲(stenolophusslecontei)和玉米籽细步甲(cliviniaimpressifrons)和寄生线虫。感兴趣的靶基因(例如,用于基因沉默的靶基因)可以包括来自任何物种(包括但不限于,真核生物诸如真菌;植物,包括单子叶植物和双子叶植物,诸如作物植物、观赏植物和非家养植物或野生植物;无脊椎动物诸如节肢动物、环节动物、线虫和软体动物;和脊椎动物诸如两栖动物、鱼、鸟和哺乳动物)的任何编码或非编码序列。非编码序列的非限制性实例(例如,可以由基因表达元件诸如调控序列表达的非编码序列)包括但不限于5’非翻译区、启动子、增强子或其他非编码转录区域、3’非翻译区、终止子、内含子、微rna、微rna前体dna序列、小干扰rna、核糖体或核酶的rna组分、小核仁rna和其他非编码rna。感兴趣基因的非限制性实例进一步包括但不限于可翻译的(编码)序列,诸如编码转录因子的基因和编码涉及感兴趣分子(诸如氨基酸、脂肪酸和其他脂质、糖和其他碳水化合物、生物聚合物以及包括生物碱、萜类化合物、聚酮化合物、非核糖体肽和混合生物合成来源的次生代谢产物)的生物合成或分解代谢的酶的基因。靶基因(例如,用于基因沉默的靶基因)可以是植物害虫或植物病原体的必需基因。必需基因可以包括害虫或病原体发育为可繁殖的生殖成年可能所需的基因。必需基因可以包括当被沉默或抑制时可以导致生物体(例如,作为成年体或在任何发育阶段,包括配子)死亡或导致生物体无法成功繁殖(例如,雄性或雌性亲本不育或对合子、胚胎或幼虫致死)的基因。线虫必需基因的非限制性实例包括主要精子蛋白、rna聚合酶ii和几丁质合酶。在美国专利公开us20070271630中提供了另外的大豆异皮线虫必需基因,其通过引用并入本文。该基因可以是果蝇必需基因。该基因可以是真菌必需基因。靶基因(例如,来自害虫的靶基因)可以包括用于主要精子蛋白、α微管蛋白、β微管蛋白、液泡atp酶、甘油醛-3-磷酸脱氢酶、pvna聚合酶ττ、几丁质合酶、细胞色素、mirna、mirna前体分子和mirna启动子的无脊椎动物基因。靶基因(例如,来自病原体的靶基因)可以包括用于mirna、mirna前体分子、真菌微管蛋白、真菌液泡atp酶、真菌几丁质合酶、真菌map激酶、真菌padtyr/thr磷酸酶、涉及营养物转运的酶(例如,氨基酸转运蛋白或糖转运蛋白)、涉及真菌细胞壁生物合成的酶、角质酶、黑色素生物合成酶、多聚半乳糖醛酸酶、果胶酶、果胶裂解酶、纤维素酶、蛋白酶的基因,与植物无毒力基因相互作用的基因以及在被感染的植物中涉及病原体入侵和复制的基因。可用编码例如dsrna、sirna或mirna的表达盒转化植物(例如,在核、细胞器或两者中转化)。dsrna、sirna或mirna可以抑制植物害虫中存在的至少一个(例如,至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个)靶基因(例如,抑制其表达)。例如,dsrna、sirna或mirna可以抑制植物害虫的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多靶基因。抑制植物害虫中存在的靶基因可以提供针对该植物害虫的完全或几乎完全的保护。“完全保护”可以指植物害虫不会对植物造成(例如,基本的)损害。可以将dsrna、sirna或mirna设计为抑制选自以下的基因:蛋白酶体a型亚基肽(pas-4)、act、shr、epic2b和pnpmai。seqidno:114对应于编码大豆异皮线虫(scn)特异性蛋白酶体a型亚基肽(其在本文中可称为pas-4)的开放阅读框。seqidno:115对应于seqidno:114的核苷酸552-699。seqidno:115或seqidno:114可用于dsrna介导的pas-4抑制。act可以编码β-肌动蛋白,β-肌动蛋白可以是必需的细胞骨架蛋白。shr可以编码shrub(也称为vps32或snf7),shrub可以是涉及用于囊泡转运的膜重塑的蛋白复合物的必需亚基。epic2b可以编码致病疫霉蛋白,该蛋白可以与新型木瓜蛋白酶样胞外cys蛋白酶例如疫霉抑制的蛋白酶1相互作用并且/或者对其进行抑制,。来自寄生疫霉(phytophthoraparasitica)的pnpma基因可以编码质膜h+atp酶。植物的抗虫性植物的抗虫性可以通过例如转基因控制来实现。例如,可以通过诸如来自苏云金芽孢杆菌的晶体(cry)δ内毒素基因和/或营养期杀虫蛋白(vip)的植物表达来实现对例如对昆虫害虫的植物内转基因控制。cry毒素的非限制性实例包括例如“cry”毒素的60个主要组(例如,cry1-cry59)和vip毒素。cry毒素可以包括cry毒素的亚组,例如cry1a。可以使用例如cry序列来构建用于转化(例如,进入细胞器)的表达盒。cry序列可以包括例如编码选自以下的至少一种蛋白质的野生型(例如,天然)核酸序列:cry1ac、cyt1aa、cry1ab、cry2aa、cry1i、cry1c、cry1d、cry1e、cry1be、cry1fa和vip3a。cry序列可以包括例如编码选自以下的至少一种蛋白质的修饰的(例如,截短的或融合的)核酸序列:cry1ac、cyt1aa、cry1ab、cry2aa、cry1i、cry1c、cry1d、cry1e、cry1be、cry1fa和vip3a。修饰的(如截短的)核酸序列可以编码可以保留杀虫活性的修饰的(如截短的)蛋白质片段。编码全长或修饰的(例如,截短的)蛋白质的核酸序列可以对于感兴趣的细胞器是密码子优化的。cry蛋白可以是cyt1aa蛋白(例如,来自苏云金芽孢杆菌以色列亚种血清变型;geneid:5759908;seqidno:111)。辅助蛋白,例如用于cry蛋白的辅助蛋白,可以被引入细胞中(例如,进入细胞器)。例如,辅助蛋白可以增加例如cry蛋白的表达、稳定性和/或功能。辅助蛋白的非限制性实例包括20kda辅助蛋白(例如,来自苏云金芽孢杆菌以色列亚种血清变型)和19kda辅助蛋白(例如,来自苏云金芽孢杆菌以色列亚种血清变型)。辅助蛋白可以是来自苏云金芽孢杆菌以色列亚种血清变型的20kda辅助蛋白(pbt024;seqidno:112)。辅助蛋白可以是来自苏云金芽孢杆菌以色列亚种血清变型的19kda辅助蛋白(pbt022;seqidno:113)。辅助蛋白可以作为多顺反子单元包含在表达盒中。辅助蛋白可以从单独的表达盒表达。编码可用于赋予植物昆虫耐受性的蛋白质的多核苷酸可以作为多顺反子单元包含在表达盒中,或者可以从单独的表达盒表达。在一些实施方案中,这些多核苷酸可以编码以下项:(a)来自苏云金芽孢杆菌以色列亚种血清变型的cyt1aa蛋白(geneid:5759908;seqidno:111);(b)来自苏云金芽孢杆菌以色列亚种血清变型的20kda辅助蛋白(pbt024;seqidno:112);和(c)来自苏云金芽孢杆菌以色列亚种血清变型的19kda辅助蛋白(pbt022;seqidno:113)。基因组修饰本公开内容提供了可用于对例如生物体或细胞(例如,植物或植物细胞)的基因组(例如,质体或线粒体基因组)中的靶序列进行基因组修饰、用于选择修饰的生物体或细胞、用于基因编辑以及用于将供体多核苷酸插入生物体或细胞的基因组中的组合物和方法。该方法可以采用多核苷酸指导的多肽系统;例如,指导多核苷酸/cas蛋白系统。cas蛋白可以由指导多核苷酸指导以识别靶多核酸。cas蛋白可以在特定靶位点将单链或双链断裂引入细胞的基因组。指导多核苷酸/cas多肽系统可以提供用于修饰植物、植物细胞或种子的基因组内的靶位点的有效系统。可以采用多种方法来进一步修饰靶位点以引入感兴趣的供体多核苷酸。待编辑的核苷酸序列(例如,感兴趣的核苷酸序列)可以位于被多核苷酸指导的多肽识别的靶位点之内或之外。进一步提供了采用多核苷酸指导的多肽系统修饰细胞器基因组内的多个靶位点的方法和组合物。细胞器基因组内的多个靶位点的修饰可以促进同型转化事件的产生。多核苷酸指导的多肽系统多核苷酸指导的多肽可以是可以结合靶核酸的多肽。多核苷酸指导的多肽可以是核酸酶。多核苷酸指导的多肽可以是核酸内切酶。多核苷酸指导的多肽可以是cas蛋白。多核苷酸指导的多肽可以是argonaut蛋白。多核苷酸指导的多肽可以与指导多核苷酸形成复合物。多核苷酸指导的多肽可以被指导多核苷酸引导至靶核酸。多核苷酸指导的多肽可以与指导多核苷酸复合以识别靶核酸。多核苷酸指导的多肽可以在特定靶位点(例如,细胞的基因组)处引入单链或双链断裂。a.crispr基因座crispr基因座(成簇的规律间隔的短回文重复序列)(也称为spidrs-spacer散布的直接重复序列)可以构成dna基因座家族。crispr基因座可以由短而高度保守的dna重复序列组成(例如,24至40bp,重复从1至140次——也称为crispr重复序列)。crisprdna重复序列可以部分回文。重复序列(例如,通常对一个物种特异)可以由恒定长度的可变序列(例如,根据crispr基因座而定为20至58个)间隔开。crispr基因座可存在于例如大肠杆菌(e.coli)、地中海富盐菌(haloferaxmediterranei)、酿脓链球菌、项圈藻(anabaena)和结核分枝杆菌(mycobacteriumtuberculosis)中。crispr基因座可以包含短的规律间隔的重复序列(srsr)。重复序列可以是可以成簇出现的短元件。重复序列可以由恒定长度的可变序列规律地隔开。crispr系统可以属于不同的类别,具有不同的重复模式、基因集和物种范围。在给定的crispr基因座处,cas基因的数目可能因物种而异。b.cas蛋白cas蛋白可以是crispr/cas系统的蛋白。cas蛋白可以是1类或2类cas蛋白。cas蛋白可以是i型、ii型、iii型、iv型、v型或vi型cas蛋白。“cas基因”可以指编码cas蛋白的基因。术语cas蛋白和cas多肽在本文中可以互换使用。cas基因可以与侧翼crispr基因座偶联、相关联或与之接近或相邻。术语“cas基因”、“crispr相关(cas)基因”在本文中可以互换使用。cas蛋白可以结合靶核酸。cas蛋白可以是cas核酸酶。cas蛋白可以是cas核酸内切酶。cas蛋白可以与指导多核苷酸复合。cas蛋白可以被指导多核苷酸引导至靶核酸。cas蛋白可以与指导多核苷酸复合以识别靶核酸。cas蛋白可以在靶核酸序列(例如,dna或rna)处引入单链或双链断裂。指导多核苷酸可以使cas蛋白在特定靶位点处识别并将单链或双链断裂引入到细胞基因组中。cas蛋白可以包含一个或多个结构域。结构域的非限制性实例包括指导核酸识别和/或结合结构域、核酸酶结构域(例如,dna酶或rna酶结构域、ruvc、hnh)、dna结合结构域、rna结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域。指导核酸识别和/或结合结构域可以与指导核酸相互作用。核酸酶结构域可以包含用于核酸切割的催化活性。核酸酶结构域可以缺乏催化活性以阻止核酸切割。cas蛋白可以是与其他蛋白质或多肽融合的嵌合cas蛋白。cas蛋白可以是各种cas蛋白的嵌合体,例如,包含来自不同cas蛋白(例如,同系物)的结构域。cas蛋白的非限制性实例包括c2c1、c2c2、c2c3、casl、caslb、cas2、cas3、cas4、cas5、cas5e(casd)、cas6、cas6e、cas6f、cas7、cas8a、cas8al、cas8a2、cas8b、cas8c、cas9(csnl或csxl2)、cas10、cas10d、caslo、caslod、casf、casg、cash、cpf1、csyl、csy2、csy3、csel(casa)、cse2(casb)、cse3(case)、cse4(casc)、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csxlo、csxl6、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4和cul966及其同系物或修饰形式。cas蛋白可以来自任何合适的生物体。非限制性实例包括酿脓链球菌、嗜热链球菌(streptococcusthermophilus)、链球菌属(streptococcussp.)、金黄色葡萄球菌(staphylococcusaureus)、达松维尔拟诺卡氏菌(nocardiopsisdassonvillei)、始旋链霉菌(streptomycespristinaespiralis)、绿色产色链霉菌(streptomycesviridochromogenes)、绿色产色链霉菌(streptomycesviridochromogenes)、玫瑰链孢囊菌(streptosporangiumroseum)、玫瑰链孢囊菌(streptosporangiumroseum)、酸热脂环酸芽孢杆菌(alicyclobacillusacidocaldarius)、假蕈状芽孢杆菌(bacilluspseudomycoides)、硒还原芽孢杆菌(bacillusselenitireducens)、西伯利亚微杆菌(exiguobacteriumsibiricum)、德氏乳杆菌(lactobacillusdelbrueckii)、唾液乳杆菌(lactobacillussalivarius)、海洋微颤菌(microscillamarina)、伯克氏菌目(burkholderiales)细菌、食萘极单胞菌(polaromonasnaphthalenivorans)、单胞菌属(polaromonassp.)、瓦氏鳄球藻(crocosphaerawatsonii)、蓝丝菌属(cyanothecesp.)、铜绿微囊藻(microcystisaeruginosa)、铜绿假单胞菌(pseudomonasaeruginosa)、聚球藻属(synechococcussp.)、阿拉伯糖醋盐杆菌(acetohalobiumarabaticum)、丹氏制氨菌(ammonifexdegensii)、热解纤维素菌(caldicelulosiruptorbecscii)、candidatusdesulforudis、肉毒梭菌(clostridiumbotulinum)、艰难梭菌(clostridiumdifficile)、大芬戈尔德菌(finegoldiamagna)、嗜热盐碱厌氧菌(natranaerobiusthermophilus)、pelotomaculumthermopropionicum、喜温嗜酸硫杆菌(acidithiobacilluscaldus)、氧化亚铁嗜酸硫杆菌(acidithiobacillusferrooxidans)、酒色别样着色菌(allochromatiumvinosum)、海杆菌属(marinobactersp.)、嗜盐亚硝化细菌(nitrosococcushalophilus)、瓦松亚硝化球菌(nitrosococcuswatsoni)、游海假交替单胞菌(pseudoalteromonashaloplanktis)、消旋纤线杆菌(ktedonobacterracemifer)、调查甲烷盐菌(methanohalobiumevestigatum)、多变鱼腥藻(anabaenavariabilis)、泡沫节球藻(nodulariaspumigena)、念珠藻属(nostocsp.)、极大节旋藻(arthrospiramaxima)、钝顶节旋藻(arthrospiraplatensis)、节旋藻属(arthrospirasp.)、鞘丝藻属(lyngbyasp.)、喜泥微鞘藻(microcoleuschthonoplastes)、颤藻属(oscillatoriasp.)、运动石袍菌(petrotogamobilis)、非洲栖热腔菌(thermosiphoafricanus)、acaryochlorismarina、沙氏纤毛菌(leptotrichiashahii)和新凶手弗朗西丝菌(francisellanovicida)。在某些方面,该生物体可以是酿脓链球菌。如本文所用,cas蛋白可以是cas蛋白的野生型或修饰形式。cas蛋白可以是野生型或修饰的cas蛋白的活性变体、无活性变体或片段。cas蛋白可以包含相对于cas蛋白的野生型形式的氨基酸变化,诸如缺失、插入、置换、变体、突变、融合体、嵌合体或其任何组合。cas蛋白可以是与野生型示例性cas蛋白(例如,来自酿脓链球菌的cas9)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性或序列相似性的多肽。cas蛋白可以是与野生型示例性cas蛋白具有至多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的多肽。变体或片段可以包含与野生型或修饰的cas蛋白或其部分的至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性或序列相似性。变体或片段可以与指导核酸复合地靶向核酸基因座,而缺乏核酸切割活性。cas蛋白可以包含一个或多个核酸酶结构域,诸如dna酶结构域。例如,cas9蛋白可以包含ruvc样核酸酶结构域和/或hnh样核酸酶结构域。ruvc和hnh结构域可以分别切割双链dna的不同链以在dna中形成双链断裂。cas蛋白可以只包含一个核酸酶结构域(例如,cpf1包含ruvc结构域但缺少hnh结构域)cas蛋白可以包含与野生型cas蛋白的核酸酶结构域(例如,ruvc结构域、hnh结构域)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性或序列相似性的氨基酸序列。可以修饰cas蛋白以优化活性,例如,切割、基因表达的调控。可以修饰cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和/或酶活性。还可以修饰cas蛋白以改变该蛋白质的任何其他活性或特性,诸如稳定性。例如,cas蛋白的一个或多个核酸酶结构域可以被修饰、删除或灭活,或者cas蛋白可以被截短以去除对于该蛋白质的功能非必需的结构域或优化(例如,增强或减弱)cas蛋白的活性。cas蛋白可以是融合蛋白。例如,cas蛋白可以与切割结构域、表观遗传修饰结构域、转录激活结构域或转录阻遏物结构域融合。cas蛋白也可与提供增强或减弱的稳定性的异源多肽融合。融合的结构域或异源多肽可以位于cas蛋白内的n端、c端或内部。cas蛋白可以包含易于追踪或纯化的异源多肽,诸如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如,gfp、gfp-2、taggfp、turbogfp、egfp、emerald、azamigreen、monomericazamigreen、copgfp、acegfp、zsgreenl)、黄色荧光蛋白(例如,yfp、eyfp、citrine、venus、ypet、phiyfp、zsyellowl)、蓝色荧光蛋白(例如ebfp、ebfp2、azurite、mkalamal、gfpuv、sapphire、t-sapphire)、蓝绿色荧光蛋白(例如ecfp、cerulean、cypet、amcyanl、midoriishi-cyan)、红色荧光蛋白(mkate、mkate2、mplum、dsredmonomer、mcherry、mrfpl、dsred-express、dsred2、dsred-monomer、hcred-tandem、hcredl、asred2、eqfp611、mraspberry、mstrawberry、jred)、橙色荧光蛋白(morange、mko、kusabira-orange、monomerickusabira-orange、mtangerine、tdtomato)和任何其他合适的荧光蛋白。标签的实例包括谷胱甘肽-s-转移酶(gst)、几丁质结合蛋白(cbp)、麦芽糖结合蛋白、硫氧还蛋白(trx)、聚(nanp)、串联亲和纯化(tap)标签、myc、acv5、au1、au5、e、ecs、e2、flag、血凝素(ha)、nus、softag1、softag3、strep、sbp、glu-glu、hsv、kt3、s、si、t7、v5、vsv-g、组氨酸(his)、生物素羧基载体蛋白(bccp)和钙调蛋白。可以以任何形式提供cas蛋白。例如,cas蛋白可以以蛋白质的形式提供,诸如单独或与指导核酸复合的cas蛋白。cas蛋白可以以编码cas蛋白的核酸的形式提供,诸如rna(例如,信使rna(mrna))或dna。编码cas蛋白的核酸对于在特定细胞、细胞器或生物体中有效翻译成蛋白质可以是密码子优化的。编码cas蛋白的核酸可以稳定地整合在细胞器或细胞的基因组中。编码cas蛋白的核酸可以可操作地连接至在细胞中有活性的启动子。编码cas蛋白的核酸可以可操作地连接至在表达构建体中的启动子。表达构建体可以包括可以引导基因或其他感兴趣核酸序列(例如,cas基因)的表达的任何核酸构建体。表达构建体可以包括可以将这样的感兴趣核酸序列转移至靶细胞(例如,进入细胞器)的任何核酸构建体。在一些方面,cas蛋白可以是2类cas蛋白。在一些方面,cas蛋白可以是ii型cas蛋白。在一些方面,cas蛋白可以是cas9蛋白、cas9蛋白的修饰形式或衍生自cas9蛋白。cas9可以指与野生型示例性cas9多肽(例如,来自酿脓链球菌的cas9)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的多肽。cas9可以指与野生型示例性cas9多肽(例如,来自酿脓链球菌)具有至多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的多肽。cas9可以指cas9蛋白的野生型形式或指可以包含诸如缺失、插入、置换、变体、突变、融合体、嵌合体或其任何组合的氨基酸变化的修饰形式。在一个实施方案中,多核苷酸指导的多肽基因可以是cas9蛋白,诸如但不限于wo2007/025097的seqidno:462、474、489、494、499、505和518中列出并通过引用并入本文的cas9序列。cas9蛋白可以解开紧邻基因组靶位点的dna双链体。当通过指导多核酸识别靶序列时,cas9蛋白可以切割例如两条dna链。在一些方面,仅当正确的前间隔区邻近基序(pam)大约定向在靶序列的3’端时,cas9核酸内切酶才可以进行切割。酿脓链球菌cas9催化结构域的诱变可以产生“切口”酶(cas9n),该酶可以诱导单链切口而不是双链断裂。在另一个实施方案中,可以将编码多核苷酸指导的多肽的序列修饰成使用靶生物体优选的密码子,例如编码cas(例如,cas9)蛋白的植物、玉米或大豆的密码子优化的序列。在另一个实施方案中,编码多核苷酸指导的多肽的序列可以可操作地连接至编码核定位信号的一个或多个序列;例如,连接至cas蛋白编码区上游的sv40核靶向信号和cas蛋白编码区下游的二分vird2核定位信号。在另一个实施方案中,多核苷酸指导的多肽可以是argonaute蛋白,例如格氏嗜盐碱杆菌(natronobacteriumgregoryi)argonaute(“ngago”)。argonaute蛋白可以是dna引导的核酸内切酶。argonaute蛋白可以结合指导dna,如5’-磷酸化的单链指导dna(gdna)的例如24个核苷酸。当装载有gdna时,argonaute蛋白可以产生位点特异性靶核酸(例如,dna)断裂(例如,双链断裂)。argonaute蛋白–gdna系统可以不需要前间隔区邻近基序(pam)即可识别靶核酸。在一些方面,多核苷酸指导的多肽可以是死亡的cas蛋白。cas蛋白可以是死亡的cas蛋白。死亡的cas蛋白可以是缺乏核酸切割活性的蛋白。cas蛋白可以包含野生型cas蛋白的修饰形式。野生型cas蛋白的修饰形式可以包含降低cas蛋白的核酸切割活性的氨基酸变化(例如,缺失、插入或置换)。例如,cas蛋白的修饰形式可以具有野生型cas蛋白(例如,来自酿脓链球菌的cas9)的小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于小于20%、小于10%、小于5%或小于1%的核酸切割活性。cas蛋白的修饰形式可以没有实质的核酸切割活性。当cas蛋白是没有实质的核酸切割活性的修饰形式时,其可以被称为无酶活性的和/或“死亡的”(缩写为“d”)。死亡的cas蛋白(例如dcas,dcas9)可以与靶多核苷酸结合,但无法切割靶多核苷酸。在一些方面,死亡的cas蛋白可以是死亡的cas9蛋白。无酶活性可以指可以以序列特异性方式结合多核苷酸中的核酸序列,但是无法切割靶多核苷酸的多肽。无酶活性的定点多肽可以包含无酶活性的结构域(例如核酸酶结构域)。无酶活性可以指无活性。无酶活性可以指实质上无活性。无酶活性可以指基本上无活性。无酶活性可以指与野生型示例性活性(例如,核酸切割活性、野生型cas9活性)相比小于1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%或小于10%的活性。可以删除cas蛋白的一个或多个核酸酶结构域(例如,ruvc、hnh)或使之突变,使得它们不再具有功能或包含降低的核酸酶活性。例如,在包含至少两个核酸酶结构域的cas蛋白(例如,cas9)中,如果其中一个核酸酶结构域被删除或突变,所得的cas蛋白(称为切口酶)可以在双链dna中的crisprrna(crrna)识别序列处产生单链断裂而不是双链断裂。这样的切口酶可以切割互补链或非互补链,但不能同时切割两者。如果cas蛋白的所有核酸酶结构域(例如,cas9蛋白中的ruvc和hnh核酸酶结构域;cpf1蛋白中的ruvc核酸酶结构域)都被删除或突变,所得的cas蛋白切割双链dna的两条链的能力可能降低或消失。可以将cas9蛋白转变成切口酶的突变的实例可以是来自酿脓链球菌的cas9的ruvc结构域中的d10a(在cas9的位置10上的天冬氨酸变成丙氨酸)突变。来自酿脓链球菌的cas9的hnh结构域中的h939a(在氨基酸位置839上的组氨酸变成丙氨酸)或h840a(在氨基酸位置840上的组氨酸变成丙氨酸)可以将cas9转变为切口酶。可以将cas9蛋白转变为死亡的cas9的突变的实例是ruvc结构域中的d10a(在cas9的位置10位上的天冬氨酸变成丙氨酸)突变和在来自酿脓链球菌的cas9的hnh结构域中的h939a(在氨基酸位置839上的组氨酸至丙氨酸)或h840a(在氨基酸位置840上的组氨酸变成丙氨酸)。死亡的cas蛋白相对于该蛋白的野生型可以包含一个或多个突变。突变可能导致在野生型cas蛋白的多个核酸切割结构域的一个或多个中,核酸切割活性小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%,小于5%或小于1%。突变可以导致多个核酸切割结构域中的一个或多个保留切割靶核酸的互补链的能力,但降低其切割靶核酸的非互补链的能力。突变可以导致多个核酸切割结构域中的一个或多个保留切割靶核酸的非互补链的能力,但降低其切割靶核酸的互补链的能力。突变可以导致多个核酸切割结构域中的一个或多个缺乏切割靶核酸的互补链和非互补链的能力。核酸酶结构域中待突变的残基可以对应于核酸酶的一个或多个催化残基。例如,野生型示例性酿脓链球菌cas9多肽中的残基如asp10、his840、asn854和asn856可以突变以使多个核酸切割结构域(例如,核酸酶结构域)中的一个或多个失活。例如,如通过序列和/或结构比对确定,cas蛋白的核酸酶结构域中待突变的残基可以对应于野生型酿脓链球菌cas9多肽中的残基asp10、his840、asn854和asn856。作为非限制性实例,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987(或任何cas蛋白的相应突变)可以是突变的。例如,d10a、g12a、g17a、e762a、h840a、n854a、n863a、h982a、h983a、a984a和/或d986a。除丙氨酸置换以外的突变可以是合适的。d10a突变可以与h840a、n854a或n856a突变中的一个或多个结合以产生基本上缺乏dna切割活性(例如,死亡的cas9蛋白)的多核苷酸指导的多肽(例如,cas9蛋白)。在另一个实施方案中,多核苷酸指导的多肽可以是可以与赋予特异性的核酸(scna)形成可编程核蛋白分子复合物的多肽部分(例如,嵌合多肽)。可编程核蛋白分子复合物可以在体内、在靶细胞内或在细胞器内组装。可编程核蛋白分子复合物可以与预定的靶核酸序列相互作用。可编程核蛋白分子复合物可以包含编码嵌合多肽的多核苷酸分子。嵌合多肽可以包含可以修饰靶核酸位点的功能域。该功能域可以没有特异性核酸结合位点。嵌合多肽可以包含可以与scna相互作用的连接结构域。该连接结构域可以没有特异性靶核酸结合位点。scna可以包含与靶位点侧翼的靶核酸区域互补的核苷酸序列。scna可以包含可以特异性地附接至嵌合多肽的连接结构域的识别区。嵌合多肽和scna在靶细胞内的组装可以形成功能性核蛋白复合物。核蛋白复合物可以在靶位点特异性地修饰靶核酸。在另一个实施方案中,多核苷酸指导的核酸内切酶基因可以是全长多核苷酸指导的核酸内切酶(例如,cas核酸内切酶、cas9核酸内切酶)或其任何功能片段或功能变体。术语“功能片段”、“在功能上等同的片段”和“功能等同片段”在本文中可以互换使用。在编码多核苷酸指导的多肽的序列的情况下,这些术语可以指多核苷酸指导的多肽序列的一部分或子序列。该多核苷酸指导的多肽序列的一部分或子序列可以包含产生单链或双链断裂的能力。术语“功能变体”、“功能上等同的变体”和“功能等同变体”在本文中可以互换使用。在多核苷酸指导的多肽的情况下,这些术语可以指多核苷酸指导的多肽的变体。该变体可以包含产生单链或双链断裂的能力。片段和变体可以通过诸如定点诱变和合成构建的方法获得。在一个实施方案中,多核苷酸指导的多肽编码序列可以是植物密码子优化的酿脓链球菌cas9编码序列。密码子优化的cas9序列可以识别任何基因组序列,例如n(12-30)ngg形式的基因组序列。在一个实施方案中,可以通过任何合适的方法将多核苷酸指导的多肽直接引入细胞中,例如但不限于瞬时引入方法、转染和/或局部施加。本公开内容的组合物和方法可以使用核酸内切酶。核酸内切酶可以是在多核苷酸链内切割磷酸二酯键的酶。核酸内切酶可以包括在特定位点切割dna而不会破坏碱基的限制性核酸内切酶。限制性核酸内切酶可以包括i型、ii型、iii型和iv型核酸内切酶,其可以进一步包括亚型。在i型和iii型系统中,甲基化酶和限制性活性都可以包含在单个复合物中。核酸内切酶还可以包括大范围核酸酶,也称为归巢核酸内切酶(he酶)。大范围核酸酶可以在特定的识别位点处结合并切割,该位点可以为约18bp或更大。根据保守的序列基序,大范围核酸酶可分为四个家族。大范围核酸酶家族可以是laglidadg、giy-yig、h-n-h和his-cys盒家族。这些基序可以参与金属离子的配位和磷酸二酯键的水解。he酶可以具有长识别位点,并且可以耐受其dna底物中的序列多态性。大范围核酸酶的命名约定可以类似于其他限制性核酸内切酶的命名约定。大范围核酸酶还可以以分别用于由独立的orf、内含子和内含肽编码的酶的前缀f-、i-或pi-为特征。重组过程中的一个步骤可以涉及在识别位点处或附近切割多核苷酸。该切割活性可用于产生双链断裂。在一些实例中,重组酶可以来自整合酶或解离酶家族。本公开内容的组合物和方法可以使用转录激活因子样效应物核酸酶(talen;tal效应物核酸酶),其可以是一类序列特异性核酸酶。talen可以用于在特异性靶序列(例如,在植物或其他生物体的基因组中的)处进行切割(例如,双链断裂)。tal效应子核酸酶可以通过将天然或工程化的转录激活因子样(tal)效应物或其功能部分与核酸内切酶(诸如,例如,foki)的催化结构域融合而产生。独特的模块化tal效应物dna结合结构域可以允许设计具有潜在任何给定dna识别特异性的蛋白质。本公开内容的组合物和方法可以使用锌指核酸酶(zfn)。zfn可以是由锌指dna结合结构域和双链断裂诱导剂结构域组成的工程化的切割(例如,双链断裂)诱导剂。锌指结构域可以赋予识别位点特异性,锌指结构域可以包括两个、三个或四个锌指,例如具有c2h2结构。锌指结构域可以适合于设计与选定的多核苷酸识别序列特异性结合的多肽。zfn可以由连接至非特异性核酸内切酶结构域(例如,来自iis型核酸内切酶(诸如foki)的核酸酶结构域)的工程化的dna结合锌指结构域组成。可以将另外的功能性与锌指结合结构域融合,包括转录激活因子结构域、转录阻遏物结构域和甲基化酶。在一些实例中,切割活性可能需要核酸酶结构域的二聚化。每个锌指可以识别例如靶dna中的三个连续碱基对。例如,3指结构域识别9个连续核苷酸的序列,在核酸酶的二聚化需要下,两组锌指三联体可以用于结合18个核苷酸的识别序列。c.指导多核酸细菌和古细菌可以进化出称为成簇的规律间隔的短回文重复序列(crispr)/crispr相关的(cas)系统的适应性免疫防御系统,其可以使用短rna引导外源核酸的降解。来自细菌的ii型crispr/cas系统可以采用crrna和tracrrna来将cas多肽引导至核酸靶标。crrna(crisprrna)可以包含与双链dna靶标的一条链互补的区域。crrna可以与tracrrna(反式激活crisprrna)碱基配对以形成rna双链体,该双链体可以引导cas多肽识别并任选地切割dna靶标。如本文所用,术语“指导多核苷酸”可以指可以与多核苷酸指导的多肽(例如,cas蛋白)形成复合物的多核苷酸序列。指导多核苷酸可以引导多核苷酸指导的多肽识别并任选地切割(或切口)dna靶位点。术语“指导多核苷酸”和“指导多核酸”在本文中可以互换使用。指导多核苷酸可以由单个分子(单分子)或两个分子(双分子)组成。指导多核苷酸序列可以是rna序列、dna序列或其组合(rna-dna组合序列)。任选地,指导多核苷酸可以包含至少一个核苷酸、磷酸二酯键或连接修饰,诸如但不限于锁核酸(lna)、5-甲基dc,2,6-二氨基嘌呤、2’-氟a、2’-氟u、2’-o-甲基rna、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔区18(六乙二醇链)分子的连接或导致环化的5’至3’的共价连接。仅包含核糖核酸的指导多核苷酸也可以称为“指导rna”(grna)。在一些实施方案中,指导多核酸可以是指导rna。如本文所用,术语“单指导rna”(sgrna)可以指两个rna分子的合成融合体,这两个分子例如是包含可变靶向结构域的crrna(crisprrna)和tracrrna。在一个实施方案中,指导rna可以包含12至30个核苷酸序列的可变靶向结构域和可与cas蛋白相互作用的rna片段。如本文所用,“crrna”可以指与野生型示例性crrna(例如,来自酿脓链球菌的crrna)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的核酸。crrna可以指与野生型示例性crrna(例如,来自酿脓链球菌的crrna)具有至多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的核酸。crrna可以指可以包含诸如缺失、插入或置换、变体、突变或嵌合体等核苷酸变化的修饰的crrna形式。crrna可以是在至少6个连续核苷酸的一段序列上与野生型示例性crrna(例如,来自酿脓链球菌的crrna)序列具有至少约60%同一性的核酸。例如,crrna序列可以在至少6个连续核苷酸的一段序列上与野生型示例性crrna序列(例如,来自酿脓链球菌的crrna)具有至少约60%同一性、至少约65%同一性、至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约98%同一性、至少约99%同一性或100%同一性。如本文所用,“tracrrna”可以指与野生型示例性tracrrna序列(例如,来自酿脓链球菌的tracrrna)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的核酸。tracrrna可以指与野生型示例性tracrrna序列(例如,来自酿脓链球菌的tracrrna)具有至多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的核酸。tracrrna可以指可以包含诸如缺失、插入或置换、变体、突变或嵌合体等核苷酸变化的修饰的tracrrna形式。tracrrna可以是指在至少6个连续核苷酸的一段序列上与野生型示例性tracrrna(例如,来自酿脓链球菌的tracrrna)序列可具有至少约60%同一性的核酸。例如,tracrrna序列可以在至少6个连续核苷酸的一段序列上与野生型示例性tracrrna(例如,来自酿脓链球菌的tracrrna)序列具有至少约60%同一性、至少约65%同一性、至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约98%同一性、至少约99%同一性或100%同一性。指导多核苷酸可以是双分子的(即,两个分子;也称为“两分子”、“双”或“双链体”指导多核苷酸),其包含例如与靶多核酸(例如,靶dna)中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或vt结构域)和与cas多肽相互作用的第二核苷酸序列结构域(称为cas核酸内切酶识别结构域或cer结构域)。vt结构域可以指指导多核酸的间隔区。vt结构域可以包含指导多核酸的间隔区。间隔区可以通过杂交(例如,碱基配对)以序列特异性的方式与靶核酸的前间隔区区域相互作用。双分子指导多核苷酸的cer结构域可以包含两个单独的分子,这两个分子可沿着互补性区域杂交以形成例如双链体或部分双链体。两个单独的分子可以是rna、dna和/或rna-dna组合序列。在一些实施方案中,包含连接至cer结构域的vt结构域的双链体指导多核苷酸的第一分子可以被称为“crdna”(当由一段连续的dna核苷酸组成时)或“crrna”(当由一段连续的rna核苷酸组成时)或“crdna-rna”(当由dna核苷酸和rna核苷酸的组合组成时)。cr核苷酸可以包含天然存在于细菌和古细菌中的crrna的片段。在一个实施方案中,本文公开的cr核苷酸中可存在的在细菌和古细菌中天然存在的crrna的片段大小的范围可以是但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸。在一些实施方案中,包含cer结构域的双链体指导多核苷酸的第二分子可以被称为“tracrrna”(当由一段连续的rna核苷酸组成时)或“tracrdna”(当由一段连续的dna核苷酸组成时)或“tracrdna-rna”(当由dna核苷酸和rna核苷酸的组合组成时)。在一个实施方案中,指导rna/cas9多肽复合物的rna可以是包含双链体crrna-tracrrna的双链体rna。指导多核酸(例如,vt结构域、间隔区)与靶多核酸(例如,前间隔区)之间的互补性可以是完美互补、基本互补或充分互补的。两个核酸之间的完美互补性可以指两个核酸可以形成双链体,其中双链体中的每个碱基都可以通过watson-crick配对与互补碱基键合。基本或充分的互补可以指一条链中的序列可能没有与相对链中的序列彻底和/或完美互补,但是在两条链上的碱基之间发生足够的键合,从而在一组杂交条件(例如,盐浓度和温度)中形成稳定的杂交复合物。指导多核苷酸还可以是单个分子的(即,单分子),其包含可以与靶多核酸(例如,靶dna)中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或vt结构域)和与cas多肽相互作用的第二核苷酸结构域(称为cas核酸内切酶识别结构域或cer结构域)。对于单个分子的指导多核苷酸,cer结构域可以由可以是rna、dna和/或rna-dna组合序列的一段连续的核苷酸形成。单指导多核苷酸的vt结构域和/或cer结构域可以包含rna序列、dna序列或rna-dna组合序列。在一些实施方案中,单指导多核苷酸包含连接至tracr核苷酸(包含cer结构域)的cr核苷酸(包含连接至cer结构域的vt结构域),其中该连接可以是包含rna序列、dna序列或rna-dna组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列组成的单指导多核苷酸可以被称为“单指导rna”(sgrna;当由一段连续的rna核苷酸组成时)或“单指导dna”(sgdna;当由一段连续的dna核苷酸组成时)或“单指导rna-dna”(sgdna-rna;当由dna核苷酸和rna核苷酸的组合组成时)。在本公开内容的一个实施方案中,单指导rna(sgrna)包含ii型crispr/cas系统的crrna或crrna片段和tracrrna或tracrrna片段,其可以与ii型cas多肽形成复合物,其中所述指导rna/cas多肽复合物可以将cas多肽引导至植物基因组靶位点,从而使cas多肽能够将双链断裂引入基因组靶位点。术语“可变靶向结构域”或“vt结构域”在本文中可以互换使用,并且可以指可以存在于指导多核苷酸中的核苷酸序列。vt结构域可以与双链dna靶位点的一条链互补。第一核苷酸序列结构域(vt结构域)与靶序列之间的互补百分比可以为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可变靶向结构域的长度可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些实施方案中,可变靶向结构域可以包含与靶多核酸的至少17个核苷酸互补的至少17个核苷酸。在一些实施方案中,可变靶向结构域可以包含与靶多核酸互补的一段连续的核苷酸。在一些实施方案中,与靶多核酸互补的指导多核酸的核苷酸可以是不连续的。在一些实施方案中,可变靶向结构域可以包含一段连续的12至30个核苷酸。可变靶向结构域可以由dna序列、rna序列、修饰的dna序列、修饰的rna序列或其任何组合组成。靶多核苷酸可以通过在感兴趣区域内识别出前间隔区邻近基序(pam)并选择在pam上游或下游的所需大小的区域作为前间隔区来进行识别。可以通过确定前间隔区区域的互补序列来设计相应的间隔区序列。指导多核苷酸的术语“cas核酸内切酶识别结构域”或“cer结构域”在本文中可以互换使用,并且可以指与cas多肽相互作用的核苷酸序列(诸如指导多核苷酸的第二核苷酸序列结构域)。cer结构域可以由dna序列、rna序列、修饰的dna序列、修饰的rna序列(例如参见本文所述的修饰)或其任何组合组成。连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含rna序列、dna序列或rna-dna组合序列。在一个实施方案中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列的长度可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸。在另一个实施方案中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含四核苷酸环序列,诸如但不限于gaaa四核苷酸环序列。指导多核苷酸、vt结构域和/或cer结构域的核苷酸序列修饰可以选自但不限于5’帽、3’聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsrna双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供追踪的修饰或序列、提供蛋白质的结合位点的修饰或序列、锁核酸(lna)、5-甲基-2’-脱氧胞嘧啶核苷(5mdc)、2,6-二氨基嘌呤核苷酸、2’-氟腺苷核苷酸、2’-氟尿苷核苷酸;2’-o-甲基rna核苷酸、硫代磷酸酯(ps)键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔区18分子的连接、5’至3’共价连接或其任何组合。这些修饰可以产生至少一个附加的有益特征,其中该附加的有益特征可以选自:修饰或调控的稳定性、亚细胞靶向、追踪、荧光标记、蛋白质或蛋白质复合物的结合位点、对互补靶序列的修饰的结合亲和力、对细胞降解的修饰的耐受性和增加的细胞通透性。在一个实施方案中,指导rna和cas多肽可以形成复合物,该复合物可使cas多肽能够在dna靶位点引入单链或双链断裂。在一个实施方案中,可变靶向结构域的长度可以是12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一个实施方案中,指导rna可以包含ii型crispr/cas系统的crrna(或crrna片段)和tracrrna(或tracrrna片段),该系统可以与ii型cas多肽形成复合物。指导rna/cas多肽复合物可以将cas多肽引导至靶核酸位点(例如,dna靶标)。cas多肽可以将双链断裂引入dna靶位点。在一个实施方案中,可以使用任何合适的方法将指导多核酸直接引入细胞中,诸如但不限于粒子轰击或局部施加。在另一个实施方案中,可以通过引入重组dna分子来间接引入指导多核酸,该重组dna分子包含编码可操作地连接至核启动子或细胞器启动子的指导多核酸的多核苷酸,该核启动子或细胞器启动子可以分别在所述核或细胞器中转录多核苷酸。在一些实施方案中,可以通过重组dna构建体的粒子轰击或农杆菌转化将指导多核酸引入植物细胞中,该重组dna构建体包含编码可操作地连接至在植物中具有功能的的启动子(例如,植物u6聚合酶iii启动子、camv35s聚合酶ii启动子)的指导多核酸的多核苷酸。在一个实施方案中,指导多核酸可以是包含双链体crrna-tracrrna的双链体rna。单指导多核酸(例如,单指导rna)可能需要一个表达盒来表达单指导rna。双链体crrna-tracrrna可能需要一个或多个所需的表达盒来表达双链体crrna-tracrrna。可以将多个多核酸多重化以靶向多个靶核酸。例如,可以同时或迭代地靶向2、3、4、5、6、7、9、10个或超过10个靶核酸。作为非限制性实例,多重化可以用来生成大的基因组缺失、一次性修饰多个不同的序列和/或结合双切口酶来靶向基因。在一些实例中,可以递送多于一个的crispr/cas系统以靶向两个或更多个核酸序列靶标。同源cas蛋白可用于多重化应用。基因组修饰的靶位点术语“靶位点”、“靶序列”、“靶多核苷酸”、“靶多核酸”、“靶基因座”、“基因组靶位点”、“基因组靶序列”和“基因组靶基因座”在本文中可互换使用。靶多核酸可以指例如植物细胞的基因组(例如,质体或线粒体基因组)中的多核苷酸序列。靶多核酸可以指由指导多核酸识别的位点(例如,在基因组中)。靶多核酸可以指可以在其上诱导(例如,通过cas多肽)单链或双链断裂的位点(例如,在基因组中)。靶位点可以是基因组中的内源位点。靶位点对于生物体可以是异源的,因此并未天然存在于基因组中。与其在天然存在的位置相比,靶位点可以在异源基因组位置中找到。如本文所用,术语“内源靶序列”和“天然靶序列”在本文中可以互换使用,并且可以指对于生物体基因组可以是内源的或天然的靶序列。内源靶序列可以出现在生物体基因组中该靶序列的内源或天然位置。靶多核酸可以是dna、rna或两者。在一些实施方案中,靶多核酸可以是dna(例如,靶dna)。在一些实施方案中,靶多核酸可以是基因组dna。在一些实施方案中,靶多核酸可以是核基因组dna。在一些实施方案中,靶多核酸可以是细胞器基因组dna。在一些实施方案中,靶多核酸可以是核基因组dna和细胞器基因组dna。术语“人工靶位点”和“人工靶序列”在本文中可以互换使用,并且可以指已经引入植物基因组中的靶序列。此类人工靶序列在序列上可以与生物体基因组中的内源或天然靶序列相同,但是可以位于生物体基因组中的不同位置(即,非内源或非天然位置)。“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可以互换使用,并且可以指本文公开的与未改变的靶序列相比可以包含至少一个改变的靶序列。此类“改变”可以包括,例如:(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的删除,(iii)至少一个核苷酸的插入,或(iv)(i)-(iii)的任何组合。本文公开了用于修饰细胞器基因组靶位点的方法。在一个实施方案中,一种用于修饰细胞器的基因组中的靶位点的方法可以包括将指导多核酸(例如,指导rna、单指导rna)引入植物细胞中。植物细胞可以包含多核苷酸指导的多肽(例如,cas多肽)。指导多核酸和多核苷酸指导的多肽可以形成复合物,该复合体可以引导多核苷酸指导的多肽在靶位点引入单链或双链断裂。还提供了一种用于修饰细胞器的基因组中的靶位点的方法。该方法可以包括将指导多核酸和多核苷酸指导的多肽(例如,cas多肽)引入细胞器中。指导多核酸和多核苷酸指导的多肽可以形成复合物。该复合物可以引导多核苷酸指导的多肽在细胞器的基因组中的靶位点处引入单链或双链断裂。进一步提供了一种用于修饰细胞器的基因组中的靶位点的方法。该方法可以包括将指导多核酸和供体多核苷酸(例如,供体dna)引入细胞器中。细胞器可以包含多核苷酸指导的多肽(例如,cas多肽)。指导多核酸和多核苷酸指导的多肽可以形成复合物,该复合物可以引导多核苷酸指导的多肽在靶位点引入单链或双链断裂。可以将供体多核苷酸插入基因组中的切割位点。还提供了一种用于修饰细胞器的基因组中的靶位点的方法。该方法可以包括:a)将包含可变靶向结构域的指导多核酸和多核苷酸指导的多肽(例如,cas多肽)引入细胞器中,其中所述指导多核酸和所述多核苷酸指导的多肽可以形成复合物,该复合物可以使多核苷酸指导的多肽在所述靶位点引入单链或双链断裂;以及b)识别在所述靶位点具有修饰的至少一个细胞器,其中该修饰包括在所述靶位点中的一个或多个核苷酸的至少一个删除或置换。进一步提供了一种用于修饰细胞器的基因组中的靶多核酸(例如,靶dna)序列的方法,该方法包括:a)将可表达指导多核酸的第一重组dna构建体和可表达多核苷酸指导的多肽(例如,cas多肽)的第二重组dna构建体引入细胞器中,其中所述指导多核酸和所述多核苷酸指导的多肽可以形成复合物,该复合物可以使多核苷酸指导的多肽在所述靶位点引入单链或双链断裂;以及b)识别在所述靶位点具有修饰的至少一个细胞器,其中该修饰包括在所述靶位点中的一个或多个核苷酸的至少一个删除或置换。靶位点的长度可以变化,并且包括例如长度为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个核苷酸的靶位点。靶位点可以是回文的,也就是说,一条链上的序列在互补链上的相反方向上读起来相同。切口/切割位点可以在靶序列内。切口/切割位点可以在靶序列外。在另一种变化中,切割可发生在直接彼此相对的核苷酸位置以产生平端切割,或者在其他情况下,切口可以交错以产生单链突出端,也称为“粘性末端”,其可以是5’突出端或3’突出端。靶核酸序列可以是pam的5’或3’。靶核酸序列可以是,例如,pam的第一个核苷酸的5’紧邻的16、17、18、19、20、21、22或23个碱基。靶核酸序列可以是,例如,pam的最后一个核苷酸的3’紧邻的16、17、18、19、20、21、22或23个碱基。靶核酸序列可以是pam的第一个核苷酸5’紧邻的20个碱基。靶核酸序列可以是pam的最后一个核苷酸的3’紧邻的20个碱基。多核苷酸指导的多肽(例如,cas蛋白)对靶核酸的位点特异性切割可发生在由指导核酸与靶核酸之间的碱基配对互补性确定的位置。多核苷酸指导的多肽(例如,cas蛋白)对靶核酸的位点特异性切割可发生在由前间隔区邻近基序(pam)确定的位置。例如,cas(例如,cas9)的切割位点可以是pam序列上游或下游的约1至约25,或约2至约5,或约19至约23个碱基对(例如,3个碱基对)。在一些实施方案中,cas(例如,cas9)的切割位点可以是pam序列上游的3个碱基对。在一些实施方案中,cas(例如,cpf1)的切割位点可以为在(+)链上的19个碱基和在(-)链上的23个碱基,从而产生长度为5nt的5’突出端。在一些情况下,切割可产生平端。在一些情况下,切割可产生具有5’突出端的交错或粘性末端。在一些情况下,切割可产生具有3’突出端的交错或粘性末端。不同的生物体可以包含不同的pam序列。不同的cas蛋白可以识别不同的pam序列。例如,在酿脓链球菌中,pam可以是靶核酸中包含序列5’-xrr-3’的序列,其中r可以是a或g,其中x可以是任何核苷酸,并且x可以与间隔区序列所靶向的靶核酸序列的3’紧邻。酿脓链球菌cas9(spycas9)的pam序列可以是5’-xgg-3’,其中x可以是任何dna核苷酸,并且可以与靶dna非互补链的crispr识别序列的3’紧邻。cpf1的pam可以是5’-ttx-3’,其中x可以是任何dna核苷酸,并且可以与crispr识别序列的5’紧邻。也可以使用基因组靶位点的活性变体。此类活性变体可以包含与给定靶位点至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。活性变体可以保留生物学活性。活性变体可以被多核苷酸指导的多肽(例如,cas蛋白)识别。活性变体可以被多核苷酸指导的多肽(例如,cas蛋白)切割。可以使用测定法来测量由核酸内切酶产生的靶位点的双链断裂。测定法可以测量核酸内切酶对含有识别位点(例如,靶位点、活性变体)的dna底物的总体活性和/或特异性。整合供体多核苷酸的方法本公开内容提供了获得包含供体多核苷酸的细胞器的方法。此类方法可以采用同源重组来提供多核苷酸在靶位点的整合。感兴趣的多核苷酸可以在供体dna分子中提供给细胞器。供体多核苷酸可以是可以整合到靶核酸(例如,细胞器基因组)中的核酸序列(例如dna、rna或两者)。供体多核苷酸可以插入基因组中,例如,在多核苷酸指导的多肽的切割位点处。供体多核苷酸可以通过同源重组插入基因组中。在一些实施方案中,供体多核苷酸可以包含dna,并且可以被称为供体dna。可以将任何合适大小的供体多核苷酸整合到基因组中。在一些实施方案中,整合到基因组中的供体多核苷酸的长度可以小于3、为约3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、16、17、18、19、20、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500或大于500千碱基(kb)。在一些实施方案中,整合到基因组中的供体多核苷酸的长度可以为至少约2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、16、17、18、19、20、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500或大于500(kb)。在一些实施方案中,整合到基因组中的供体多核苷酸的长度可以为至多约3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、16、17、18、19、20、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500或大于500(kb)。供体多核苷酸可以包含感兴趣的多核苷酸、多核苷酸修饰模板、异源表达盒或以上全部。供体多核苷酸(例如供体dna)的侧翼可为第一和第二同源性区域。多核苷酸修饰模板可以是例如单个核苷酸改变,用以在细胞器基因组中产生不同的等位基因。供体多核苷酸(例如,供体dna)的第一和第二同源性区域可以分别与存在于靶位点(例如,细胞器基因组的)中或侧翼的第一和第二基因组区域享有同源性。“同源性”可以意指相似的dna序列。同源性可以意指例如具有约:50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同源性或同一性的核酸序列。例如,“与基因组区域同源的区域”可以是具有与细胞器基因组中给定的“基因组区域”相似的序列的dna区域。同源性区域可以具有能够足以促进在切割的靶位点处进行同源重组的任何长度。例如,同源性区域的长度可以包含至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100或更多个碱基,使得同源性区域具有足够的同源性以与相应的基因组区域进行同源重组。“足够的同源性”可以指示两个多核苷酸序列可以具有足够的结构相似性以充当同源重组反应的底物。供体多核苷酸(例如,供体dna)可以包含表达盒(例如,编码感兴趣的异源多核苷酸)。供体多核苷酸可以包含多个表达盒。表达盒可以是多顺反子表达盒;例如,其中在单个启动子的控制下表达多个蛋白质编码区、功能rna或两者的组合。“供体rna”可以是相应的rna分子,其包含例如与供体dna相同的核酸序列;即,用尿苷酸(“u”)代替脱氧胸苷酸(“t”)。“供体多核苷酸”可以是供体dna或供体rna,或dna和rna的组合。供体多核苷酸可以是单链或双链的。修饰细胞器基因组的另一种方法可以是用“替代dna”替换部分或全部细胞器dna。可以通过使用位点特异性核酸内切酶如多核苷酸指导的多肽(例如,cas多肽、cas9多肽)来减少或消除内源细胞器dna。同时或随后,可以引入替代dna。术语“替代dna”可以指当转化进入细胞器时可以表达新的基因型和相应的性状的细胞器dna片段或完整细胞器dna。术语“替代dna”和“替代细胞器dna”在本文中可以互换使用。在细胞器dna片段的情况下,它们可以通过同源重组整合到剩余的内源细胞器dna中。在完整细胞器dna替换的情况下,可以从具有不同于受体细胞的内源细胞器dna的dna组合物的栽培种、品系、亚种和其他物种中分离替代dna。在一些实施方案中,替代dna可以包含在受体细胞器中具有dna复制起点功能的dna元件。具有dna复制起点功能的序列可以包含在本公开内容的组合物(例如,多核苷酸、构建体、盒)中。此类序列可以包括用于细胞器的复制起点。复制起点序列可以是质体复制起点(例如,质体rrna基因间区域)序列。复制起点序列可以是线粒体复制起点序列。如本文所用,“基因组区域”可以指例如细胞器的基因组中的染色体的片段。基因组区域可以存在于靶位点的任何一侧。基因组区域可以包含靶位点的一部分。基因组区域可以包含至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100或更多碱基。基因组区域可以包含足够的同源性,以与相应的同源性区域进行同源重组。供体多核苷酸、感兴趣的多核苷酸和/或性状可以在复杂性状基因座中堆叠在一起。指导多核苷酸/多肽系统可用于生成双链断裂并用于在复杂性状基因座中堆叠性状。两个或更多个编码rna和/或蛋白质的多核苷酸可以作为多顺反子单元包含在盒中。编码rna的多核苷酸可以从单独的盒中表达。在一个实施方案中,通过提供一个或多个指导多核苷酸、一个或多个多核苷酸指导的多肽(例如,cas多肽)和任选的一个或多个针对植物细胞的供体多核苷酸(例如,供体dna),可以使用指导多核苷酸/多肽系统将一个或多个供体多核苷酸或一个或多个感兴趣的性状引入一个或多个靶位点。可以从在细胞器dna的所述一个或多个靶位点处包含改变的此细胞产生生物体,其中该改变可以选自:(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的删除,(iii)至少一个核苷酸的插入,和(iv)(i)-(iii)的任何组合。给定基因组区域与在供体多核苷酸(例如,供体dna)侧翼的相应的同源性区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如,由在供体多核苷酸(例如,供体dna)侧翼的“同源性区域”和植物基因组的“基因组区域”共享的同源性或序列同一性的量可以为至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,以使这些序列进行同源重组在供体多核苷酸(例如,供体dna)侧翼的同源性区域可以与在靶位点侧翼的任何序列具有同源性。尽管在一些实施方案中,同源性区域与直接在靶位点的侧翼的基因组序列共享显著的序列同源性,但是同源性区域可以被设计为与在靶位点的更远的5’或3’处的区域具有足够的同源性。在其他实施方案中,同源性区域还可以与靶位点的片段以及下游基因组区域具有同源性。在一个实施方案中,第一同源性区域进一步包含靶位点的第一片段,而第二同源性区域包含靶位点的第二片段,其中第一片段和第二片段是不同的。如本文所用,“同源重组”可以指在同源性位点处的两个dna分子之间的dna片段的交换。同源重组的频率可受许多因素影响。同源性区域的长度可以影响同源重组事件的频率,例如,同源性区域越长,频率越高。观察到同源重组所需的同源性区域的长度可以因物种而异。分子间重组可以发生在质体中,例如,通过经由与转化载体上的侧翼序列进行同源重组而位点特异性地整合外源序列,可以形成转质体植物。通过转化生成新的原质体系基因型可以依靠通过分子间同源重组(hr)的外源序列的整合。在机制上与基因转换相似,hr和修复途径可以参与随后的事件,这些事件产生同质的转质体细胞,并最终产生稳定的转质体植物。在野生型原质体系中重复序列之间的分子内或分子间重组可以,例如,当重复序列是回文时生成倒置,或当正向时生成缺失。hr蛋白质在损伤修复中的作用可能受到损害(例如,当引入外源dna时)并且这是通过相关的组织培养和选择性压力,因为这些操作可能给重组机制带来额外的应激,从而导致意外事件。在稻(oryza)和拟南芥(arabidopsis)的核基因组中识别出的dna修复和重组基因中,分别约有19%和17%可以靶向质体。质体定位的reca(例如,来自豌豆(p.sativum))可以包含dna链转移活性。reca可与受损ptdna的重组介导的修复有关。reca1(at1g79050)活性降低可导致ptdna不稳定和减少。相对于野生型而言,突变品系中原质体系拷贝数的减少可表明reca1可参与重组介导的复制。本公开内容的方法可以使用任何合适的质体酶用于同源dna重组途径。质体中同源重组的优势可以归因于单链dna结合蛋白的whirly家族中定位于质体的成员对非常规重组的抑制。可以通过增加hr途径成员来优化细胞中的hr活性。为了通过同源重组实现有效的外源序列整合,内源性原质体系序列可用于靶向插入。重组速率与序列同源性的长度和/或程度之间可以存在正相关。用于质体转化的最小侧翼序列长度可以在表达盒的任一侧上小至400bp,并且足以以合理的频率获得转化。在表达盒的任一侧上,靶向序列可延伸1到1.5kb。非同源末端连接(nhej)可以是真核细胞核中的主要dna修复途径。nhej还可以在细菌和植物线粒体中具有活性。在一些情况下,nhej可以不出现在被子植物质体中。nhej产物可以在拟南芥中产生。在一些情况下,可以检测到i-creii活性后低频率的nhej对dsb的修复。nhej修复事件占whirly敲除品系中重排产物的17%。nhej可以发生在质体中。nhej可以是在数量上次要的途径。本公开内容的方法可以使用同源性引导的修复(hdr)或nhej。在一些实施方案中,可以使用hdr。在一些实施方案中,可以通过例如增加hdr中涉及的蛋白质和酶的表达来增加hdr的效率。在一些实施方案中,可以通过例如靶向nhej中涉及的基因和/或蛋白质(例如,dna连接酶)来降低nhej的效率。在一些实施方案中,所公开的用于基因组工程化或修饰的方法的效率可以为约20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%。在本文提供的一个实施方案中,该方法可以包括使植物细胞的细胞器与供体多核苷酸(例如,供体dna)、指导多核酸和多核苷酸指导的多肽接触。可以通过多核苷酸指导的多肽将至少一个单链或双链断裂引入靶位点,在供体多核苷酸(例如,供体dna)侧翼的第一和第二同源性区域可以与其相应的基因组同源性区域进行同源重组,导致供体与基因组之间交换dna。照此,所提供的方法可以导致供体多核苷酸(例如,供体dna)整合到细胞器基因组的靶位点中的单链或双链断裂中,从而改变原始靶位点并产生改变的基因组靶位点。供体多核苷酸(例如,供体dna)可以通过任何合适的方式引入。例如,可以提供具有靶位点的植物。供体多核苷酸(例如,供体dna)可以通过任何合适的转化方法提供,包括例如农杆菌介导的转化或生物弹射粒子轰击。供体多核苷酸(例如,供体dna)可以瞬时存在于细胞中,或者可以通过病毒复制子引入。在指导多核苷酸(例如,指导rna)、多核苷酸指导的多肽(例如,cas多肽)和靶位点的存在下,可以将供体多核苷酸(例如,供体dna)插入细胞器基因组中。供体多核苷酸可以反映商业市场。供体多核苷酸可以反映用于作物生长的性状。感兴趣的作物和市场可以变化,并且随着发展中国家开放世界市场,新的作物和技术也可以出现。此外,随着对农艺性状和特性(诸如产量和杂种优势)的了解增加,用于转化的基因的选择也会随之改变。调节基因表达的方法在一些方面,提供了用于调节宿主细胞或细胞器中靶核酸(例如,基因)的表达(例如,转录)的方法。该方法可以涉及使靶核酸与无酶活性的cas蛋白(例如,死亡的cas)和指导多核酸接触。在一些方面,本公开内容提供了选择性地调节靶核酸在宿主细胞中的转录的方法。该方法可以涉及将无酶活性的cas蛋白(例如,死亡的cas)和指导多核酸引入宿主细胞中。指导核酸和死亡的cas蛋白可以在宿主细胞中形成复合物。该复合物可以选择性地调节在宿主细胞或细胞器中靶多核酸(例如,靶dna)的转录。在一些方面,本公开内容提供了在宿主细胞中靶核酸的选择性转录调节(例如,减少或增加)。靶核酸的转录的选择性调节可以减少或增加靶核酸的转录,但是可以不实质性地调节非靶核酸或脱靶核酸的转录,例如,与在不存在指导核酸/无酶活性或酶活降低的cas蛋白复合物的条件下的非靶核酸的转录水平相比,非靶核酸的转录可以被调节小于1%、小于5%、小于10%、小于20%、小于30%、小于40%或小于50%。例如,与在不存在指导核酸/无酶活性或酶活降低的cas蛋白复合物的条件下的靶核酸的转录水平相比,靶核酸的转录的选择性调节(例如,减少或增加)可以使靶核酸的转录减少或增加至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或大于90%。在一些方面,本公开内容提供了用于增加靶核酸的转录的方法。与在不存在指导核酸/无酶活性或酶活降低的cas蛋白复合物的条件下的靶多核酸(例如,靶dna)的转录水平相比,靶核酸的转录可以增加至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约12倍、至少约15倍、至少约20倍、至少约50倍、至少约70倍或至少约100倍。选择性地增加靶核酸的转录会增加靶核酸的转录,但可以不实质性地增加非靶多核酸的转录,例如,与在不存在指导核酸/无酶活性或酶活降低的cas蛋白复合物的条件下的非靶dna的转录水平相比,非靶核酸的转录如有增加,则可增加小于约5倍、小于约4倍、小于约3倍、小于约2倍、小于约1.8倍、小于约1.6倍、小于约1.4倍、小于约1.2倍或小于约1.1倍。在一些方面,本公开内容提供了用于减少靶核酸的转录的方法。与在不存在指导核酸/无酶活性或酶活降低的cas蛋白复合物的条件下的靶多核酸(例如,靶dna)的转录水平相比,靶核酸的转录可以减少至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约12倍、至少约15倍、至少约20倍、至少约50倍、至少约70倍或至少约100倍。选择性地减少靶核酸的转录会减少靶核酸的转录,但可以不实质性地减少非靶dna的转录,例如,与在不存在指导核酸/无酶活性或酶活降低的cas蛋白复合物的条件下的非靶dna的转录水平相比,非靶核酸的转录如有减少,则可减少小于约5倍、小于约4倍、小于约3倍、小于约2倍、小于约1.8倍、小于约1.6倍、小于约1.4倍、小于约1.2倍或小于约1.1倍。可以通过将无酶活性的cas蛋白与异源序列融合来实现转录调节。异源序列可以是合适的融合伴侣,例如,通过直接作用于靶核酸或作用于与靶核酸相关联的多肽(例如,组蛋白或其他dna结合蛋白)而提供间接增加、减少或以其他方式调节转录的活性的多肽。合适的融合伴侣的非限制性实例包括提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、苏素化活性、去苏素化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性或脱豆蔻酰化活性的多肽。合适的融合伴侣可以包括直接提供靶核酸的增加的转录的多肽。例如,转录激活因子或其片段、募集转录激活因子的蛋白质或其片段,或小分子/药物响应性转录调节因子。合适的融合伴侣可以包括直接提供靶核酸的减少的转录的多肽。例如,转录阻遏物或其片段、募集转录阻遏物的蛋白质或其片段,或小分子/药物响应性转录调节因子。异源序列或融合伴侣可以与死亡的cas蛋白的c-末端、n-末端或内部部分(即,除n-或c-末端以外的部分)融合。递送方法可以用任何合适的递送方法将本公开内容的组合物和分子引入宿主细胞或细胞器中。该组合物(例如,cas蛋白、多核苷酸指导的多肽、指导多核酸、供体多核苷酸)可以同时或暂时单独地递送。基因修饰方法的选择可以取决于被转化的细胞的类型和/或发生转化的环境(例如,体外、离体或体内)。一种递送方法可以涉及接触靶多核苷酸或将一个或多个包含编码本公开内容的组合物的核苷酸序列的核酸引入细胞(或细胞群)中。包含编码本公开内容的组合物的核苷酸序列的合适核酸可以包括表达载体,其中包含编码本公开内容的一个或多个组合物的核苷酸序列的表达载体可以是重组表达载体。递送方法或转化的非限制性实例包括,例如,病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(pei)介导的转染、deae-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接显微注射和纳米粒子介导的核酸递送。在一些方面,本公开内容提供了包括方法,其包括将一个或多个多核苷酸,或本文所述的一个或多个载体,或其一个或多个转录物和/或从其转录的一个或多个蛋白质递送至宿主细胞或细胞器。在一些方面,本公开内容进一步提供了通过此类方法产生的细胞,以及包含此类细胞或由此类细胞产生的生物体(诸如动物、植物或真菌)和细胞器。在一些实施方案中,可以将与指导序列组合并且任选地与指导序列复合的cas蛋白递送至细胞或细胞器。基于病毒和非病毒的基因转移方法可用于引入核酸。此类方法可用于将编码本公开内容的组合物的核酸施用于培养中或宿主生物体中的细胞。非病毒载体递送系统可以包括dna质粒、rna(例如本文所述载体的转录物)、裸核酸以及与诸如脂质体的递送载体复合的核酸。病毒载体递送系统可以包括dna和rna病毒,其在递送至细胞后可以具有游离或整合的基因组。核酸的非病毒递送的方法可以包括脂质转染、核转染、显微注射、生物弹射、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸dna、人工病毒粒子以及试剂增强的dna吸收。可以使用适合于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质。可以递送至细胞(例如体外或离体施用)或靶组织(例如体内施用)。可以使用脂质:核酸复合物的制备,包括诸如免疫脂质复合物的靶向脂质体。基于rna或dna病毒的系统可用于靶向特定细胞并将病毒有效负载运输至细胞的细胞器。病毒载体可以直接(体内)施用,或者其可以用于体外处理细胞,并且修饰的细胞可以任选地(离体)施用。基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。采用逆转录病毒、慢病毒和腺相关病毒基因转移方法可以发生宿主基因组中的整合,从而导致插入的转基因长期表达。可以在许多不同的细胞类型和靶组织中观察到高转导效率。可以通过掺入外源包膜蛋白来改变逆转录病毒的向性,从而扩大靶细胞的潜在靶群体。慢病毒载体是可以转导或感染非分裂细胞并产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择可以取决于靶组织。逆转录病毒载体可以包含顺式作用的长末端重复序列,其包装能力为多达6-10kb的外源序列。最小顺式作用ltr可以足以复制和包装载体,其可用于将治疗性基因整合到靶细胞中以提供永久性转基因表达。逆转录病毒载体可以包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人免疫缺陷病毒(hiv)及其组合的载体。可以使用基于腺病毒的系统。基于腺病毒的系统可以导致转基因的瞬时表达。基于腺病毒的载体可以在细胞中具有高转导效率,并且可以不需要细胞分裂。可以用基于腺病毒的载体获得较高的滴度和表达水平。腺相关病毒(“aav”)载体可用于例如在核酸和肽的体外生产中以及在体内和离体基因治疗程序中用靶核酸转导细胞。包装细胞可用于形成可感染宿主细胞的病毒颗粒。此类细胞可以包括293细胞(例如,用于包装腺病毒)和.psi.2细胞或pa317细胞(例如,用于包装逆转录病毒)。病毒载体可以由产生将核酸载体包装到病毒颗粒中的细胞系来生成。载体可以包含包装和随后整合入宿主中所需的最小病毒序列。载体可以包含由用于待表达的多核苷酸的表达盒替换的其他病毒序列。缺失的病毒功能可以通过包装细胞系反式提供。例如,aav载体可以包含来自aav基因组的itr序列,该itr序列是包装和整合到宿主基因组中所需要的。病毒dna可以包装在细胞系中,该细胞系可以包含编码其他aav基因(即rep和cap)而缺少itr序列的辅助质粒。该细胞系也可以被作为辅助的腺病毒感染。辅助病毒可以促进aav载体的复制和来自辅助质粒的aav基因的表达。腺病毒的污染可以通过例如热处理来减少,腺病毒对热处理可能比aav更敏感。可以使用用于将核酸递送至细胞的其他方法,例如us20030087817中所述的方法,其通过引用并入本文。可以用本文所述的一个或多个载体瞬时或非瞬时地转染宿主细胞。细胞可以以自然发生在受试者体内的方式而被转染。细胞可以取自或衍生自受试者并被转染。细胞可以衍生自取自受试者的细胞,诸如细胞系。在一些实施方案中,用本文所述的一个或多个载体转染的细胞可用于建立包含一个或多个载体衍生的序列的新细胞系。在一些实施方案中,用本公开内容的组合物瞬时转染(诸如通过一个或多个载体的瞬时转染,或用rna转染)并通过crispr复合物的活性修饰的细胞可用于建立包含含有修饰但缺乏任何其他外源序列的细胞的新细胞系。与宿主细胞相容的任何合适的载体均可以与本公开内容的方法一起使用。载体的非限制性实例包括pxt1、psg5(stratagenetm)、psvk3、pbpv、pmsg和psvlsv40(pharmaciatm)。在一些实施方案中,编码指导核酸和/或cas蛋白的核苷酸序列可以可操作地连接至控制元件,例如,转录控制元件,诸如启动子。在一些实施方案中,编码指导核酸和/或cas蛋白的核苷酸序列可以可操作地连接至多个控制元件,该多个控制元件允许编码指导核酸和/或cas蛋白或嵌合体的核苷酸序列的表达。取决于所使用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(例如,u6启动子,h1启动子等;请参见上文)。在一些实施方案中,本公开内容的组合物可以作为rna提供。在此类情况下,本公开内容的组合物可以通过直接化学合成来产生,或者可以从dna体外转录。可以使用rna聚合酶(例如,t7聚合酶、t3聚合酶、sp6聚合酶等)在体外合成本公开内容的组合物。一旦合成,rna可以直接接触靶多核酸(例如,靶dna),或者可以使用用于将核酸引入细胞的任何合适的技术(例如,显微注射、电穿孔、转染等)引入细胞。可以使用合适的转染技术将编码指导核酸(以dna或rna引入)和/或cas蛋白(以dna或rna引入)的核苷酸提供给细胞。可以在载体或盒(例如,dna载体)上提供编码本公开内容的组合物的核酸。可用于将核酸转移到靶细胞中的载体有多种,例如,质粒、粘粒、小环、噬菌体、病毒等。包含该核酸的载体可以维持游离,例如,作为质粒、小环dna、病毒诸如巨细胞病毒、腺病毒等,或者它们可以通过同源重组或随机整合整合到靶细胞基因组中,例如逆转录病毒衍生的载体,诸如mmlv、hiv-1和alv。可以将cas蛋白作为多肽提供给细胞。此类蛋白可以任选地与增加产物溶解度的多肽结构域融合。该结构域可以通过确定的蛋白酶切割位点连接至多肽,该切割位点是例如可以被tev蛋白酶切割的tev序列。接头也可以包括一个或多个柔性序列,例如,从1至10个甘氨酸残基。在一些实施方案中,融合蛋白的切割可以在维持产物的溶解度的缓冲液中进行,例如,在0.5至2m尿素的存在下,在增加溶解度的多肽和/或多核苷酸的存在下,等等。感兴趣的结构域包括内溶酶结构域,例如,流感ha域;和其他有助于生产的多肽,例如if2域、gst域、grpe域等。可以配制多肽以提高稳定性。例如,肽可以被聚乙二醇化,其中聚氧乙烯基团提供了在血流中延长的寿命。本公开内容的组合物可以与多肽渗透结构域融合以促进细胞摄取。许多渗透结构域可用于本公开内容的非整合多肽,包括肽、模拟肽和非肽载体。例如,渗透肽可以衍生自黑腹果蝇转录因子触角足蛋白的第三α螺旋,其称为penetratin且包含氨基酸序列rqikiwfqnrrmkwkk。作为另一个实例,渗透肽可以包含hiv-1tat碱性区域氨基酸序列,该序列可以包括例如天然存在的tat蛋白的氨基酸49-57。其他渗透结构域可以包括聚精氨酸基序,例如hiv-1rev蛋白的氨基酸34-56、九聚精氨酸和八聚精氨酸的区域。可以使用九聚精氨酸(r9)序列。可以选择可以进行融合的位点,以优化多肽的生物学活性、分泌或结合特性。本公开内容的组合物可以在体外或由宿主细胞产生,并且可以通过展开例如热变性、dtt还原等来进一步加工,并且可以进一步重折叠。可以通过体外合成来制备本公开内容的组合物。可以使用各种商业合成设备。通过使用合成仪,天然存在的氨基酸可以被非天然氨基酸置换。特定的顺序和制备方式可通过所需的便利性、经济性和纯度来确定。本公开内容的组合物也可以根据重组合成方法来分离和纯化。可以制备表达宿主的裂解物,并使用hplc、排阻色谱、凝胶电泳、亲和色谱或其他纯化技术纯化裂解物。相对于与产品制备和纯化方法有关的污染物,组合物可以占例如所需产物的至少20wt%、至少约75wt%、至少约95wt%,而用于治疗目的,则占例如至少约99.5wt%。百分比可以基于总蛋白。本公开内容的组合物,无论是以核酸还是多肽形式引入,都可以提供至细胞持续约30分钟至约24小时,例如,1小时、1.5小时、2小时、2.5小时、3小时、3.5小时、4小时、5小时、6小时、7小时、8小时、12小时、16小时、18小时、20小时或从约30分钟至约24小时的其他任何时间段,其可以以每天至约每4天的频率重复,例如,以每1.5天、每2天、每3天或从约每天到约每4天的其他任何频率重复。可以将组合物一次或更多次提供至受试者细胞,例如一次、两次、三次或超过三次,并且在每次接触事件之后,允许细胞与试剂一起温育一段时间,例如16-24小时,此后可用新鲜介质替换该介质并进一步培养细胞。在向细胞提供两种或更多种不同的靶向复合物(例如,与相同或不同的靶多核酸(例如,靶dna)内的不同序列互补的两种不同的指导核酸)的情况下,该复合物可以同时提供(例如,作为两种多肽和/或核酸)或同时递送。可替代地,它们可以被相继地提供,例如首先提供靶向复合体,然后提供第二靶向复合体,依此类推,反之亦然。可以将有效量的本公开内容的组合物提供至靶多核酸(例如,靶标dna)或细胞。有效量可以是例如相对于阴性对照(例如与空载体或无关多肽接触的细胞),诱导出在两个同源序列之间观察到的靶核酸调节(例如,表达)的量的至少约2倍或更多的变化(增加或减少)的量。有效的量或剂量可以诱导靶基因调节(例如,表达)的例如约2倍的变化、约3倍的变化、约4倍的变化、约7倍、约8倍的增加、约10倍、约50倍、约100倍、约200倍、约500倍、约700倍、约1000倍、约5000倍或约10000倍的变化。靶基因调节的量可以通过任何合适的方法来测量。使细胞与本公开内容的组合物接触可以在任何培养基中和在任何促进细胞存活的培养条件下发生。例如,细胞可以悬浮在任何合适的营养介质中。培养物可以包含细胞对其有响应的生长因子。生长因子可以是可以例如通过对跨膜受体的特异性作用来促进细胞(例如,在培养物中、在完整组织中)存活、生长和/或分化的分子。生长因子可以包括多肽和非多肽因子。在许多实施方案中,所选择的递送系统可以靶向特定的细胞类型。在一些情况下,可以通过将递送系统与组织或细胞特异性标记物如细胞表面蛋白结合,来实现递送系统的组织或细胞靶向。可以定制病毒和非病毒递送系统,以靶向感兴趣的组织或细胞类型。使用多核苷酸指导的多肽系统的基因组编辑如本文所述,多核苷酸指导的多肽系统可以与共递送的多核苷酸修饰模板结合使用,以允许编辑感兴趣的细胞器核苷酸序列。同样,如本文所述,对于使用rna指导的多肽系统的每个实施方案,可以部署相似的多核苷酸指导的多肽系统,其中指导多核苷酸可以不仅包含核糖核酸,而是其中指导多核苷酸包含rna-dna分子的组合或仅包含dna分子。基因组修饰方法可以依靠同源重组系统。同源重组(hr)可以提供用于寻找感兴趣的基因组dna序列并根据实验规范对其进行修饰的分子手段。通过在选定的核酸内切酶靶位点引入双链断裂(dsb),可以增强同源重组。本文描述了多核苷酸指导的多肽系统的用途,该系统可以提供灵活的基因组切割特异性,并且可以在细胞器dna靶位点导致高频率的双链断裂。该特异性切割可以实现对感兴趣的核苷酸序列的有效基因编辑。待编辑的感兴趣的核苷酸序列可以位于由多核苷酸指导的多肽(例如,cas多肽)识别和/或切割的靶位点的内部或外部。术语“多核苷酸修饰模板”可以指与待编辑的核苷酸序列相比可以包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸置换、添加或缺失。通过使用多核苷酸修饰模板产生的较小基因组修饰的实例包括突变等位基因(例如,抗生素耐受性rrna基因)的产生和用于多核苷酸指导的多肽的靶位点的去除。任选地,多核苷酸修饰模板的侧翼可以为同源核苷酸序列,其中侧翼的同源核苷酸序列可以提供与待编辑的期望核苷酸序列的足够同源性。多核苷酸修饰模板可以是供体多核苷酸。在一个实施方案中,本公开内容提供了一种用于编辑细胞的细胞器基因组中的核苷酸序列的方法。该方法可以包括向细胞器提供指导多核苷酸(例如,指导rna)、多核苷酸修饰模板和至少一个多核苷酸指导的多肽(例如,cas多肽)。多核苷酸指导的多肽可以在细胞的细胞器基因组中的靶序列处引入单链或双链断裂。多核苷酸修饰模板可以包括所述核苷酸序列的至少一个核苷酸修饰。细胞包括但不限于通过本文所述的方法产生的人、动物、细菌、真菌、昆虫和植物的细胞,以及生物体和组织,例如植物和种子。细胞可以是分离和纯化的人细胞。待编辑的核苷酸可以位于由多核苷酸指导的多肽识别和切割的靶位点的内部或外部。在一个实施方案中,至少一个核苷酸修饰可以不是在由多核苷酸指导的多肽识别和切割的靶位点处的修饰。在另一个实施方案中,在至少一个待编辑的核苷酸与细胞器dna靶位点之间可以存在至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、40、50、100、200、300、400、500、600、700、900或1000个核苷酸。在另一个实施方案中,本公开内容提供了一种用于编辑细胞的细胞器基因组中的核苷酸序列的方法。该方法可以包括向细胞器提供指导多核苷酸(例如,指导rna)、多核苷酸修饰模板和至少一个多核苷酸指导的多肽(例如,cas多肽),其中所述指导多核苷酸和所述多核苷酸指导的多肽可以形成复合物,该复合物可以使多核苷酸指导的多肽在细胞器靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。在另一个实施方案中,本公开内容提供了一种用于编辑植物细胞的细胞器基因组中的核苷酸序列的方法。该方法可以包括将指导多核苷酸(例如,指导rna)、多核苷酸修饰模板和至少一个细胞器密码子优化的多核苷酸指导的多肽(例如,cas9多肽)引入细胞器中,其中该细胞器优化的多核苷酸指导的多肽可以在细胞器靶序列处引入单链或双链断裂,其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。待编辑的核苷酸序列可以是对于被编辑的细胞可以是内源的、人工的、预先存在的或转基因的的序列。例如,细胞的细胞器基因组中的核苷酸序列可以是被稳定地掺入到细胞的细胞器基因组中的转基因。此类转基因的编辑可导致更期望的表型或基因型。细胞的基因组中的核苷酸序列也可以是突变的或预先存在的序列,其是内源的或人工的,来源于例如内源基因或感兴趣的突变基因。在一个实施方案中,感兴趣的区域的侧翼可以为两个独立的指导多核苷酸/多肽靶序列。切割可以同时进行。删除事件可以是没有感兴趣区域的两个染色体末端的修复。替代的结果可以包括感兴趣区域的倒置、切割位点处的突变以及感兴趣区域的复制。用于识别在细胞器基因组中包含整合在靶位点的感兴趣多核苷酸的至少一个植物细胞的方法。进一步提供了用于识别在细胞器基因组中包含整合在靶位点的感兴趣多核苷酸的至少一个植物细胞的方法。供体多核苷酸可以包含感兴趣的多核苷酸。感兴趣的多核苷酸可以整合在细胞的靶位点(例如,基因组)处。在不使用筛选标记表型的情况下,可以使用多种方法来识别那些在基因组中的靶位点处或附近具有插入的植物细胞。此类方法可以看作直接分析靶序列以检测靶序列中的任何变化,包括但不限于pcr方法、测序方法、核酸酶消化、dna印迹及其任何组合。该方法还可以包括从包含整合到其细胞器基因组中的感兴趣多核苷酸的植物细胞恢复植物。该植物可以是不育的或可育的。任何感兴趣的多核苷酸均可以提供,在靶位点处整合到植物细胞器基因组中,并在植物中表达。感兴趣的多核苷酸可以反映商业市场和参与该作物生长的人群的利益。感兴趣的作物和市场会变化,并且随着发展中国家开放世界市场,新的作物和技术也可以出现。此外,随着我们对农艺性状和特性(诸如产量、胁迫耐受性和杂种优势)的了解增加,用于转化的基因的选择也会随之改变。感兴趣的多核苷酸/多肽包括但不限于除草剂耐受性编码序列、杀虫编码序列、杀线虫编码序列、抗微生物编码序列、抗真菌编码序列、抗病毒编码序列、非生物和生物胁迫耐受性编码序列,或修饰植物性状(诸如产量、谷粒品质、营养含量、淀粉质和量、氮固定和/或利用以及油含量和/或组成)的序列。感兴趣的多核苷酸可以包括但不限于提高作物产量的基因、提高作物理想性的多肽、编码赋予对非生物胁迫(诸如干旱、氮、温度、盐度、有毒金属或微量元素)的耐受性的蛋白质的基因,或赋予对毒素(诸如杀虫剂和除草剂)或生物胁迫(诸如真菌、病毒、细菌、昆虫和线虫的侵袭)以及与这些生物体有关的疾病的发展的耐受性的那些蛋白质的基因。感兴趣的基因可以包括,例如,涉及信息的那些基因,诸如锌指,涉及通讯的那些基因,诸如激酶,以及涉及持家的那些基因,诸如热休克蛋白。感兴趣的多核苷酸可以包括编码对于农业经济学、抗虫性、疾病耐受性、除草剂耐受性、可育性或不育性、谷粒特性和商业产品的重要性状的基因。感兴趣的基因通常可以包括涉及油、淀粉、碳水化合物或营养物质代谢的那些基因,以及影响光合作用、光呼吸和atp代谢的那些基因。商业性状也可通过编码在多核苷酸上的蛋白质的表达而获得。转化植物的商业用途可以是聚合物和生物塑料的产生。感兴趣的多核苷酸可以包括基因诸如β-酮硫解酶、phb酶(聚羟基丁酸酯合酶)和乙酰乙酰辅酶a还原酶,其可以促进聚羟基脂肪酸酯(pha)的表达。可影响氨基酸生物合成的多核苷酸/多肽包括,例如,邻氨基苯甲酸合酶(as;ec4.1.3.27),该酶可催化在植物、真菌和细菌中从芳香族氨基酸途径分支到色氨酸生物合成的第一反应。在植物中,色氨酸生物合成的化学过程可以局限在叶绿体中。另外的感兴趣的供体序列可以包括分支酸丙酮酸裂合酶(cpl),其可以指编码可以催化分支酸转化为丙酮酸和phba的酶的基因。cpl基因的一个实例来自大肠杆菌,并具有genbank登录号m96268。感兴趣的多核苷酸序列可以编码涉及提供疾病耐受性或抗虫性的蛋白质。“疾病耐受性”或“抗虫性”可以意指植物可以避免作为植物-病原体相互作用的结果的有害症状。抗虫性基因可以编码对具有高产量阻碍的害虫(诸如根虫、切根虫、欧洲玉米螟等)的耐受性。用于抗菌保护的疾病耐受性和抗虫性基因,诸如溶菌酶或天蚕素(cecropin),或用于抗真菌保护的蛋白质,诸如防卫素、葡聚糖酶或几丁质酶,或用于控制线虫或昆虫的苏云金芽孢杆菌内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶都是有用的基因产物的实例。编码疾病耐受性性状的基因包括解毒基因,诸如针对烟曲霉毒素的解毒基因;无毒力(avr)和疾病耐受性(r)基因;等等。抗虫性基因可以编码对具有高产量阻碍的害虫(诸如根虫、切根虫、欧洲玉米螟等)的耐受性。此类基因包括,例如,苏云金芽孢杆菌毒性蛋白基因;等等。“除草剂耐受性蛋白”或由“编码除草剂耐受性的核酸分子”的表达产生的蛋白质可以包括赋予细胞比不表达该蛋白质的细胞耐受更高浓度的除草剂的能力,或赋予比不表达该蛋白质的细胞耐受一定浓度的除草剂更长时间的能力的蛋白质。可以通过编码对具有抑制乙酰乳酸合酶(als)的作用的除草剂(例如磺酰脲类除草剂)具有耐受性的基因,编码对具有可以抑制谷氨酰胺合酶的作用的除草剂(诸如膦丝菌素或basta(例如,bar基因),草甘膦(例如,epsp合酶基因和gat基因)、hppd抑制剂(例如,hppd基因))具有耐受性的基因或其他此类基因,来将除草剂耐受性性状引入植物。bar基因可以编码对除草剂basta的耐受性,aada可以编码对奇霉素和链霉素的耐受性,nptii基因可以编码对抗生素卡那霉素和遗传霉素的耐受性,而一些als基因突变体可以编码对除草剂氯磺隆的耐受性。不育性基因也可以编码在表达盒中或整合到基因组中。不育性基因可以提供物理去雄的替代方法。以此类方式使用的基因的实例包括雄性可育性基因,诸如ms26、ms45或msca1。玉米植物(zeamaysl.)可以通过自花传粉和异花传粉技术进行育种。玉米可以在同一植物上有在雄穗上的雄花和在雌穗上的雌花。它可以自花传粉(“自交”)或异花传粉。当风将花粉从雄穗吹到从初生雌穗的顶部伸出的须时,玉米中可以发生自然授粉。授粉可以通过合适的方法容易地控制。玉米杂交种的开发可能需要开发纯合近交系,这些品系的杂交以及对杂交的评估。系谱育种和轮回选择是可用于从种群中开发近交系的两种育种方法。育种计划可以将来自两个或更多个近交系或广泛来源的理想性状组合到育种库中,通过自交和选择所需的表型而从中开发出新的近交系。玉米杂交品种可以是两个此类近交系的杂交,每个近交系可以具有一个或多个彼此缺乏或者可以相互补充的理想特性。新的近交系可以与其他近交系杂交,并且可以评估来自这些杂交的杂交种以确定哪些具有商业潜力。第一代的杂交后代可以称为f1。f1杂交种可能比其近交系亲本更有活力。这种杂交活力,或杂种优势,可以以多种方式体现出来,包括营养生长增加和产量提高。可以通过结合有手动去雄的雄性不育系统产生杂交玉米种子。为了产生杂交种子,可以从正在生长的雌性近交系亲本中除去雄穗,该雌性近交系亲本可以与雄性近交系亲本以各种交替行模式种植。因此,如果与外来玉米花粉的来源有足够的隔离,雌性近交系的雌穗只能用雄性近交系的花粉受精。因此,所得种子可以是杂交种(f1),并且可以形成杂交植物。影响植物发育的田间变化可以导致雌性亲本的手动去雄完成后的植物去雄。或者,在去雄过程中,雌性近交系植物雄穗可能无法完全去除。无论如何,结果可以是雌性植物可以成功散发花粉,并且一些雌性植物可以自花传粉。这可以导致雌性近交系的种子与可以正常产生的杂交种子一起被收获。雌性近交系种子可能没有杂种优势,因此可能不如f1种子高产。此外,雌性近交系种子的存在可以代表生产杂交种的公司的种质安全风险。可替代地,雌性近交系可以通过机器机械去雄。机械去雄的可靠性可能与手动去雄大致相同,但是可以更快且成本更低。但是,大多数去雄机器可能对植物产生比手动去雄更大的伤害。因此,目前没有任何形式的去雄方法是完全令人满意的,并且对进一步降低生产成本并消除杂交种子生产中雌性亲本的自花传粉的替代方法的需求仍然存在。一种在不进行机械去雄的情况下表达雄性不育的方法可以是使用细胞质雄性不育(cms)基因。可以发现嵌合线粒体orf导致雄性不育,从而产生单性雌性植物。本文所述的方法可用于将定制设计的cmsorf引入玉米优良近交系的线粒体中。另外,这些方法可以提供将cms系统引入其他作物(例如,水稻、小麦和大豆)的方法。供体多核苷酸还可编码可与来自植物害虫或植物病原体的靶基因互补的rna或双链rna。减轻植物的害虫侵害的方法可以包括,例如,a)从所述害虫中识别对其存活、生长、增殖或繁殖可以是关键的dna序列,b)将所述序列或其片段克隆至相对于一个或多个启动子的合适的载体中,在适当的转录因子与所述启动子结合后,该启动子可将所述序列转录成rna或dsrna,和/或c)将所述载体引入植物中。植物害虫可以是线虫。用于减轻害虫侵害的另一种方法可以包括,例如,提供:a)dna序列,其在转录时产生可减少吸取植物汁液的昆虫的必需基因表达的双链rna分子;b)使用此类dna序列和用此类dna序列转化的植物或植物细胞的方法;以及c)促进dsrna或sirna分子进入昆虫细胞(诸如吸取植物汁液的昆虫的细胞)的阳离子寡肽的使用。供体多核苷酸可以包含和/或导致与用于感兴趣的靶基因序列(例如,来自植物害虫或植物病原体的靶基因)的信使rna(mrna)的至少一部分互补的反义序列的表达。可以构建反义核苷酸以与相应的mrna杂交。可以靶向反义核苷酸,以结合前mrna上的剪接位点并修饰mrna的外显子含量,从而调节(例如破坏)靶基因的表达。可以进行反义序列的修饰,只要该序列与相应的mrna杂交并干扰相应的mrna的表达即可。以此类方式,可以使用与相应的反义序列具有70%、80%或85%的序列同一性的反义构建体。此外,反义核苷酸的部分可用于破坏靶基因的表达。通常,可以使用至少50个核苷酸、100个核苷酸、200个核苷酸或更长的序列。供体多核苷酸也可以是表型标记。表型标记可以是筛选标记或选择标记,包括视觉标记和无论是正选择标记还是负选择标记的选择标记。可以使用任何表型标记。具体地,选择标记或筛选标记可以包含dna片段,该dna片段可以允许例如在特定条件下识别或选择或不选择含有该标记的分子或细胞。这些标记可以编码活性,诸如但不限于rna、肽或蛋白质的生产,或者可以提供rna、肽、蛋白质、无机和有机化合物或组合物等的结合位点。选择标记的实例包括但不限于包含限制酶位点的dna区段;编码提供对原本有毒化合物的耐受性的产物的dna片段,该化合物包括抗生素,诸如奇霉素、氨苄青霉素、卡那霉素、四环素、basta、新霉素磷酸转移酶ii(neo)和潮霉素磷酸转移酶(hpt);编码受体细胞中原本缺乏的产物的dna区段(例如trna基因、营养缺陷型标记);编码可以容易地识别的产物的dna区段(例如,表型标记,诸如β-半乳糖苷酶,gus;荧光蛋白,诸如绿色荧光蛋白(gfp)、蓝绿色荧光蛋白(cfp)、黄色荧光蛋白(yfp)、红色荧光蛋白(rfp)和细胞表面蛋白);用于pcr的新引物位点的生成(例如,先前未并列的两个dna序列的并列)、由限制性核酸内切酶或其他dna修饰酶、化学试剂等作用于或不作用于的dna序列的包含;以及,允许其识别的特定修饰(例如,甲基化)所需的dna序列的包含。另外的选择标记包括可以赋予对除草剂化合物的耐受性的基因,该除草剂化合物诸如草甘膦、磺酰脲、草丙膦铵、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-d)。商业性状也可以编码在一个或多个可以增加例如用于乙醇生产的淀粉或提供蛋白质表达的基因上。转化植物的另一种重要用途可以是聚合物和生物塑料的生产。诸如β-酮硫解酶、phb酶(聚羟基丁酸酯合酶)和乙酰乙酰辅酶a还原酶的基因可以促进聚羟基脂肪酸酯(pha)的表达。外源产物包括植物的酶和产物以及来自包括原核生物和其他真核生物在内的其他来源的那些酶和产物。此类产物包括酶、辅因子、激素等。可以增加蛋白质的水平,特别是具有改善的氨基酸分布以改善植物的营养价值的修饰的蛋白质的水平。这可以通过表达具有增强的氨基酸成分的此类蛋白质来实现。转基因、重组dna分子、感兴趣的dna序列和供体多核苷酸可以包含一个或多个用于对靶基因(例如,植物害虫或植物病原体中的靶基因)进行基因沉默的dna序列。用于涉及植物中dna序列表达的基因沉默的方法可以包括但不限于共抑制、反义抑制、双链rna(dsrna)干扰、发夹rna(hprna)干扰、含内含子的发夹rna(ihprna)干扰、转录基因沉默和微rna(mirna)干扰。在一个实施方案中,靶向突变可涉及使用双链断裂诱导剂,其可以诱导靶序列的dna中的双链断裂。在一个实施方案中,靶向突变可以是如本文所述的指导多核苷酸/多肽诱导的基因编辑的结果。指导多核苷酸/多肽诱导的靶向突变可以发生在核苷酸序列中,该核苷酸序列可以位于可由多核苷酸指导的多肽识别和切割的基因组靶位点之内或之外。在一些实施方案中,可育植物可以是可以产生有活力的雄配子和雌配子并且可以自体能育的植物。此类自体能育植物可以产生后代植物,而没有任何其他植物的配子和其中包含的遗传物质的贡献。其他实施方案可涉及使用可以不是自体能育的植物,例如,因为该植物无法产生有活力或以其他方式能够受精的雄配子或雌配子或两者。如本文所用,“雄性不育植物”可以是不产生有活力或以其他方式能够受精的雄配子的植物。如本文所用,“雌性不育植物”可以是不产生有活力或以其他方式能够受精的雌配子的植物。雄性不育植物和雌性不育植物分别可以是雌性可育的和雄性可育的。雄性可育(但雌性不育)植物与雌性可育植物杂交时可产生有活力的后代,并且雌性可育(但雄性不育)植物与雄性可育植物杂交时可产生有活力的后代。育种方法和利用两组分rna指导和cas多肽系统选择植物的方法本公开内容可用于包含一个或多个转基因性状的植物的育种。由于基于农杆菌、生物弹射或其他合适程序的转化系统,转基因性状可随机插入整个植物基因组中。可以使用定向转基因插入。位点特异性整合(ssi)可以使转基因靶向与先前插入的转基因相同的染色体位置。定制设计的大范围核酸酶和定制设计的锌指大范围核酸酶可用于设计靶向特定的染色体位置的核酸酶,并且这些试剂可允许将转基因靶向由这些核酸酶切割的染色体位点。使用归巢核酸内切酶、大范围核酸酶、锌指核酸酶和转录激活因子样效应物核酸酶(talen)对真核生物基因组(例如植物基因组)的遗传工程化可能需要对每个新的靶基因座进行从头蛋白质工程化。本文所述的高度特异性多核苷酸指导的多肽系统(例如,指导rna/cas多肽系统)可以更易于定制,并且当目标是修饰许多不同靶序列时可以更有用。多核苷酸指导的多肽系统可以是两组分系统,例如,具有其恒定的蛋白质组分——多核苷酸指导的多肽(例如,cas多肽),及其可变且易于重编程的靶向组分——指导多核苷酸(例如,指导rna或crrna)。在核酸内切酶脱靶切割可能对靶细胞有毒性的情况下,本文所述的多核苷酸指导的多肽系统对于基因组工程化特别有用。在本文所述的多核苷酸指导的多肽系统的一个实施方案中,恒定组分,即编码靶向细胞器的多核苷酸指导的多肽的多核苷酸,可以稳定地整合到细胞的核基因组中。该多核苷酸可以编码修饰的多核苷酸指导的多肽,该多肽包含与细胞器转运序列(例如,线粒体靶向肽或叶绿体靶向肽)融合的具有酶活性的多核苷酸指导的多肽(例如,cas多肽)。编码修饰的多核苷酸指导的多肽的多核苷酸的表达可以在启动子的控制下。该启动子可以是组成型启动子,组织特异性启动子或诱导型启动子,例如温度诱导型、胁迫诱导型、发育阶段诱导型或化学诱导型的启动子。在没有可变组分(例如,指导rna或crrna)的情况下,多核苷酸指导的多肽无法切割靶核酸。在没有可变组分(例如,指导rna或crrna)的情况下,植物细胞中多核苷酸指导的多肽的存在可以几乎没有后果。多核苷酸指导的多肽系统可用于产生和/或维持能够有效表达多核苷酸指导的多肽的细胞系或转基因生物体。多核苷酸指导的多肽在细胞系或转基因生物体中的表达可以对细胞活力几乎没有影响。为了在所需的基因组位点诱导切割以实现靶向遗传修饰,可以通过多种方法将指导多核苷酸(例如,指导rna或crrna)引入含有多核苷酸指导的多肽的稳定整合和表达的表达盒的细胞中。例如,指导多核苷酸(例如,指导rna或crrna)可以化学或酶促合成,并通过诸如粒子轰击或电穿孔的直接递送方法而引入表达多核苷酸指导的多肽的细胞中。指导多核酸可以与允许转运进入细胞器中的rna分子融合。可替代地,指导多核酸可以与允许与促进转运进入细胞器的蛋白质结合的rna分子融合。可替代地,可以在靶细胞中有效表达指导多核苷酸(例如,指导rna或crrna)的基因可以化学合成,酶促合成或在生物系统中合成。这些基因可以例如通过诸如粒子轰击、电穿孔或生物递送方法(诸如农杆菌介导的dna递送)的直接递送方法被引入表达多核苷酸指导的多肽的细胞中。本公开内容的一个实施方案可以是用于选择在其细胞器基因组中包含改变的靶位点的植物的方法。该方法可以包括:a)获得第一植物,其可以包含至少一种可以被运输到细胞器中并且可以在细胞器基因组的靶位点引入单链或双链断裂的多核苷酸指导的多肽(例如,cas多肽)。在一些情况下,多核苷酸指导的多肽(例如,死亡的cas)可以不切割靶位点。该方法可以进一步包括b)获得第二植物,其包含可以被运输到细胞器中并且可以与(a)的多核苷酸指导的多肽形成复合物的指导多核苷酸(例如,指导rna)。该方法可以进一步包括c)使(a)的第一植物与(b)的第二植物杂交。该方法可以进一步包括d)评估(c)的后代的靶位点中的改变。该方法可以进一步包括e)选择具有所述靶位点的所需改变的后代植物。当使用无酶活性的多核苷酸指导的多肽时,该方法可以包括评估和选择具有改变的靶基因调控或表达的后代。本公开内容的另一个实施方案可以是用于选择在其细胞器基因组中包含改变的靶位点的植物的方法。该方法可以包括:a)获得第一植物,其包含至少一种可以被运输到细胞器中并且可以在细胞器基因组的靶位点引入单链或双链断裂的多核苷酸指导的多肽(例如,cas多肽)。该方法可以进一步包括b)获得第二植物,其包含指导多核苷酸(例如,指导rna)和供体多核苷酸(例如,供体dna)。指导多核苷酸和供体多核苷酸(例如,供体dna)可以被运输进入细胞器中。指导多核苷酸可以与(a)的多核苷酸指导的多肽形成复合物。该方法可以进一步包括c)使(a)的第一植物与(b)的第二植物杂交。该方法可以进一步包括d)评估(c)的后代的靶位点中的改变。该方法可以进一步包括e)选择包含插入在所述靶位点处的供体多核苷酸的后代植物。本公开内容的另一个实施方案可以是用于选择在其细胞器基因组中包含改变的靶位点的植物的方法。该方法可以包括选择至少一种在其细胞器基因组的靶位点处包含改变的后代植物。后代植物可以是例如通过使表达至少一种可以被运输到细胞器中的多核苷酸指导的多肽(例如,cas多肽)的第一植物与包含指导多核苷酸(例如,指导rna)和任选的供体多核苷酸(例如,供体dna)的第二植物而获得的植物,其中所述指导多核苷酸和所述供体多核苷酸(例如,供体dna)可以被运输进入细胞器中,其中所述多核苷酸指导的多肽可以在所述靶位点处引入单链或双链断裂。可以使用合适的方法来识别那些在靶位点处或附近具有改变的基因组的细胞,而无需使用筛选标记表型。此类方法可以看作直接分析靶序列以检测靶序列中的任何变化,包括但不限于pcr方法、测序方法、核酸酶消化、dna印迹及其任何组合。可以以多种方式改变蛋白质,包括氨基酸置换、删除、截短和插入。例如,可以通过dna中的突变来制备蛋白质的氨基酸序列变体。可以使用用于诱变和核苷酸序列改变的方法。可以确定关于不太可能影响蛋白质的生物学活性的氨基酸置换的指导。可以进行保守置换,例如将一个氨基酸与具有相似特性的另一个氨基酸交换。保守的删除、插入和氨基酸置换可以不在蛋白质的特性上产生根本性的变化。任何置换、删除、插入或其组合的影响可以通过筛选测定法来评估。针对诱导双链断裂的活性的测定法可以测量例如试剂在含有靶位点的dna底物上的总体活性和特异性。足够的同源性或序列同一性可以指示两个多核苷酸序列具有足以充当同源重组反应的底物的结构相似性。结构相似性可以包括每个多核苷酸片段的全长,以及多核苷酸的序列相似性。序列相似性可以通过序列全长上的序列同一性百分比来描述,和/或通过包含局部相似性的保守区域(诸如具有100%序列同一性的连续核苷酸)以及在序列的一部分长度上的序列同一性百分比来描述。靶标和供体多核苷酸共享的同源性或序列同一性的量可以变化。例如,序列同源性的长度可以是以下至少一项:20bp、50bp、100bp、150bp、250bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1250bp、1500bp、1750bp、2000bp、2.5kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。同源性的量还可以通过两个多核苷酸的完整比对长度上的序列同一性百分比来描述,其包括至少以下任意一项的序列同一性百分比:50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。足够的同源性可以包括多核苷酸长度、总体序列同一性百分比以及任选的保守连续核苷酸区域或局部序列同一性百分比的任何组合,例如,足够的同源性可以被描述为与靶基因座的区域具有至少80%序列同一性的75-150bp的区域。足够的同源性也可以通过两个多核苷酸在高严格性条件下特异性杂交的预测能力来描述。多种方法可用于将核苷酸序列和多肽引入生物体中,包括例如,转化、有性杂交以及将多肽、dna或mrna引入细胞中。用于将组合物接触、提供和/或引入各种生物体的方法可以包括但不限于稳定转化方法、瞬时转化方法、病毒介导的方法和有性繁殖。稳定转化可以指示,所引入的多核苷酸可以整合进入生物体的基因组中,并且可以被其后代遗传。瞬时转化可以指示,所引入的组合物只能在生物体中暂时地表达或存在。用于将多核苷酸和多肽引入植物中的方案可以根据转化所靶向的植物或植物细胞的类型(诸如单子叶植物或双子叶植物)而改变。将多核苷酸和多肽引入植物细胞并随后插入植物基因组中的合适方法包括显微注射、分生组织转化、电穿孔、农杆菌介导的转化、直接基因转移和弹射粒子加速。可替代地,可通过使植物与病毒或病毒核酸接触而将多核苷酸引入植物中。此类方法可以涉及将多核苷酸掺入病毒dna或rna分子中。在一些实例中,感兴趣的多肽可以作为病毒多蛋白的一部分首先合成,其随后可以在体内或体外通过蛋白水解而加工以产生所需的重组蛋白。用于将多核苷酸引入植物并表达其中编码的蛋白质的方法可以涉及病毒dna或rna分子。瞬时转化方法包括但不限于直接向生物体中引入多肽(诸如双链断裂诱导剂)、引入多核苷酸(诸如dna和/或rna多核苷酸),以及向生物体中引入rna转录物(诸如编码双链断裂诱导剂的mrna)。此类方法包括例如显微注射或粒子轰击。细胞器基因组的dna转化可以在例如质体和线粒体(例如,酵母)中进行。选择标记基因可以包括例如光合作用基因(atpb、tsca、psaa/b、petb、peta、ycf3、rpoa、rbcl)、抗生素耐受性基因(rrns、rrnl、aada、nptii、apha-6)、除草剂耐受性基因(psba、bar、ahas(als)、epsps、hppd)和代谢基因(badh、coda、arg9、asa2)。例如,通过开发可以在大肠杆菌和酵母中作为自主质粒复制的穿梭载体,可以促进例如酵母核基因组的dna转化。载体系统可以包括低拷贝数的质粒和通过同源重组的整合dna。本发明的方法可以提供为例如至少约:1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的转换效率的向细胞器(例如,线粒体、质体)中的转换效率。在一个实施方案中,本公开内容的表达构建体可以包含可操作地连接至编码cas基因的核苷酸序列的启动子和可操作地连接至指导rna的启动子。该启动子可以驱动细胞中可操作地连接的核苷酸序列的表达。具有引入序列的细胞可以生长或再生为植物。然后可以生长这些植物,并用相同的转化株系或不同的转化或未转化株系授粉,并且识别出具有所需特性和/或包含引入的多核苷酸或更多肽的所得子代。可以生长两个或更多个世代,以确保多核苷酸可以稳定地维持和遗传,并收获种子。可以使用任何植物,包括单子叶植物和双子叶植物。可以使用的单子叶植物的实例包括但不限于玉米(zeamays)、水稻(oryzasativa)、黑麦(secalecereale)、高粱(sorghumbicolor、sorghumvulgare)、谷子(例如,珍珠粟(penensetumglaucum)、黄米(panicummiliaceum)、小米(setariaitalica)、龙爪稷(eleusinecoracana))、玉米、小麦(triticumaestivum)、甘蔗(saccharumspp.)、燕麦(avena)、大麦(hordeum)、柳枝稷(panicumvirgatum)、菠萝(ananascomosus)、香蕉(musaspp.)、棕榈、观赏植物、草坪草和其他草。可以使用的双子叶植物的实例包括但不限于大豆(glycinemax)、油菜(brassicanapus和b.campestris)、苜蓿(medicagosativa)、烟草(nicotianatabacum)、拟南芥(arabidopsisthaliana)、向日葵(helianthusannuus)、棉花(gossypiumarboreum)和花生(arachishypogaea)、番茄(solanumlycopersicum)、马铃薯(solanumtuberosum)等。转基因、重组dna分子、感兴趣的dna序列和供体多核苷酸可以包含一个或多个感兴趣的基因。此类感兴趣的基因可以编码例如可以为植物提供农艺优势的蛋白质。同样,如本文所述,对于引用指导rna的每个实例或实施方案,可以设计相似的指导多核苷酸,其中指导多核苷酸不仅包含核糖核酸,而是其中指导多核苷酸包含rna-dna分子的组合,或仅包含dna分子。为了用多核苷酸指导的(例如,rna指导的)方法编辑细胞器基因组,可以将两个分子组分,即多核苷酸指导的多肽(例如,cas蛋白、cas9)和指导多核苷酸(例如,指导rna)引入细胞器中。这些组分的引入可以通过适当方法的组合来完成。一种方法可以是通过多核苷酸指导的多肽与可以允许蛋白质导入细胞器中的靶向细胞器的肽的翻译融合体来产生修饰的多核苷酸指导的多肽。另一种方法可以是产生指导多核酸与可被导入细胞器中的rna分子的转录融合体。对于后者,可以设计导入的指导多核酸(例如,指导rna)的构型以实现适当的功能,即,指导rna的5’端可以是可及的,以与细胞器dna上的靶位点结合。这两种组分的组合足以编辑细胞器基因组以产生小的缺失(例如,sdn1修饰)和在切割位点处添加一些核苷酸(例如,sdn2修饰)。为了用更广泛的sdn2和sdn3修饰实现细胞器基因组编辑,可以将多核苷酸修饰模板引入相应的细胞器中。在细胞器dna中产生设计上的改变后,下一步可以是在未修饰细胞器dna的库中维持经编辑的细胞器dna并改变细胞器dna之间的平衡,从而有利于基因组经编辑的细胞器dna的维持。这可以通过减少未修饰的细胞器dna的扩增来实现。在一种方法中,可以为未修饰的细胞器基因组中的多个靶位点设计指导多核酸。可以设计供体多核苷酸(例如,供体dna),使得这些靶位点已被改变成不再被相关的多核苷酸指导的多肽系统识别。多核苷酸指导的多肽的表达可导致将单链或双链断裂引入未修饰的细胞器dna中,从而可增加修饰的基因组的比例。在一种变化中,可以用相关的多核苷酸指导的多肽系统预处理细胞以在细胞器dna中引入切割。预处理可以减少可用于同源重组的细胞器dna分子的数目。实施方案可以涉及单指导rna(sgrna),即,其中可变靶向结构域可以与包含tracrrna序列的多核苷酸融合。可替代地,实施方案可涉及双链体指导rna,即,其中可变靶向结构域和tracrrna序列存在于单独的rna分子上。术语“双链体指导rna”和“双指导rna”在本文可互换使用。在一些情况下,与在核中转化相比,在向细胞器(例如质体,线粒体)中转化时的蛋白质和/或rna表达水平可以更高。例如,与核转化相比,在细胞器转化的情况下的蛋白质表达水平可以高至少约:1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。与核转化相比,在细胞器转化的情况下的转录物的表达稳定性更高。实施方案在一个实施方案中,编码rna序列的多核苷酸可以包含可操作地连接至指导多核酸(例如,单指导rna)的靶向细胞器的rna,其中指导多核酸可以引导多核苷酸指导的多肽(例如,cas多肽;cas9多肽)切割细胞器基因组中存在的靶序列。指导多核酸可以是单指导rna或双链体指导rna;对于双链体rna,每个组成rna可操作地连接至靶向细胞器的rna。rna序列可以进一步包含编码多核苷酸指导的多肽(例如,cas多肽;cas9多肽)的序列。rna序列可以进一步包含在指导多核酸与编码多核苷酸指导的多肽的序列之间的rna切割位点。rna切割位点可以是选自以下的至少一项:csy4切割位点、c2c2切割位点、核酶切割位点、rna酶iii切割位点及其任何组合。在另一个实施方案中,细胞可以包含本公开内容的任何多核苷酸。在另一个实施方案中,细胞可以包含上述多核苷酸中的任何一个,其中该细胞进一步包含编码修饰的多核苷酸指导的多肽的多核苷酸,其中修饰的多核苷酸指导的多肽包含可操作地连接至靶向细胞器的肽的多核苷酸指导的多肽(例如,cas多肽;cas9多肽)。在另一个实施方案中,用于将指导多核酸引入细胞的细胞器中的方法可以包括:(a)将任何上述多核苷酸引入细胞中,其中该多核苷酸可操作地连接至至少一个调控元件;以及(b)使细胞在表达该多核苷酸的条件下生长。该方法可以进一步包括(c)选择具有包含指导多核酸的细胞器的细胞。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)向细胞中引入:(i)编码包含可操作地连接至指导多核酸的靶向细胞器的rna的rna序列的第一多核苷酸,其中指导多核酸可以引导多核苷酸指导的多肽(例如,cas多肽;cas9多肽)切割细胞器基因组中存在的靶序列,其中多核苷酸可操作地连接至至少一个调控元件;和(ii)编码修饰的多核苷酸指导的多肽的第二多核苷酸,其中第二多核苷酸可操作地连接至至少一个调控元件,并且其中修饰的多核苷酸指导的多肽包含可操作地连接至靶向细胞器的肽的多核苷酸指导的多肽(例如,cas多肽;cas9多肽);其中(i)的靶向细胞器的rna和(ii)的靶向细胞器的肽均靶向同一细胞器;以及(b)在(i)的第一多核苷酸和(ii)的第二多核苷酸都表达的条件下使细胞生长。该方法可以进一步包括(c)选择具有包含改变的基因组的细胞器的细胞。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)向细胞中引入:(i)编码包含可操作地连接至指导多核酸的靶向细胞器的rna的rna序列的第一多核苷酸,其中指导多核酸可以引导多核苷酸指导的多肽(例如,cas多肽;cas9多肽)切割细胞器基因组中存在的靶序列,其中多核苷酸可操作地连接至至少一个调控元件;和(ii)第三多核苷酸,其中第三多核苷酸可操作地连接至至少一个调控元件,其中第三多核苷酸编码包含可操作地连接至编码多核苷酸指导的多肽(例如,cas多肽;cas9多肽)的rna序列的靶向细胞器的rna的rna分子;其中(i)的靶向细胞器的rna和(ii)的靶向细胞器的rna均靶向同一细胞器;以及(b)在(i)的多核苷酸和(ii)的第三多核苷酸都表达的条件下使细胞生长。该方法可以进一步包括(c)选择具有包含改变的基因组的细胞器的细胞。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)将编码rna序列的多核苷酸引入细胞中,该rna序列包含可操作地连接至指导多核酸的靶向细胞器的rna,其中指导多核酸可以引导多核苷酸指导的多肽(例如,cas多肽;cas9多肽)切割细胞器基因组中存在的靶序列,其中rna序列进一步包含编码多核苷酸指导的多肽(例如,cas多肽;cas9多肽)的第二rna序列,其中多核苷酸可操作地连接至至少一个调控元件;以及(b)在表达(a)的多核苷酸的条件下使细胞生长。该方法可以进一步包括(c)选择具有包含改变的基因组的细胞器的细胞。在上述任何一种用于改变细胞器的基因组的方法中,该方法可以进一步包括将包含至少一个供体多核苷酸(例如,供体dna)的多核苷酸引入细胞器中,其中至少一个供体多核苷酸以相对于细胞器基因组的至少一个同源序列为边界,其中将至少一个供体多核苷酸的全部或部分整合到细胞器基因组中导致指导多核酸的靶位点的去除。至少一个供体多核苷酸可以包含与细胞器基因组异源的第一核酸序列,其中第一核酸序列以第二核酸序列和第三核酸序列为边界,其中第二核酸序列和第三核酸序列对应于细胞器基因组中两个同源的相邻区域。与细胞器基因组异源的第一核酸序列可以编码选择标记。选择标记可以是aada,并且选择剂可以是奇霉素或链霉素。与细胞器基因组异源的第一核酸序列可以可操作地连接至在细胞器中有活性的至少一个调控元件。第二核酸序列或第三核酸序列或两者可以包含至少一个改变的序列,其中至少一个改变的序列相对于细胞器基因组中的至少一个另外的靶位点被改变,其中至少一个改变的序列不能被至少一个另外的指导多核酸切割,其中至少一个另外的指导多核酸可以引导多核苷酸指导的多肽(例如,cas多肽;cas9多肽)切割细胞器基因组中的至少一个另外的靶位点。细胞器基因组中的至少一个另外的靶位点可以存在于至少一个必需编码区中。引入细胞器中的多核苷酸可以进一步包含第四核酸序列,其中第四核酸序列编码可操作地连接至在细胞器中有活性的启动子的至少一个另外的指导多核酸。在另一个实施方案中,多核苷酸可以编码修饰的rna供体序列,其中修饰的rna供体序列可以包含可操作地连接至供体rna的靶向细胞器的rna。修饰的rna供体序列可以包含逆转录酶引物位点。在另一个实施方案中,细胞可以包含编码修饰的rna供体序列的多核苷酸,并且进一步包含编码修饰的逆转录酶的多核苷酸,其中修饰的逆转录酶包含可操作地连接至靶向细胞器的肽的逆转录酶。在上述任何一种用于改变细胞器基因组的方法中,该方法可以进一步包括将包含至少一个供体多核苷酸(例如,供体dna)的多核苷酸引入细胞器中,其中将供体多核苷酸引入细胞器中是通过:(a)将编码修饰的rna供体序列的多核苷酸引入细胞中,其中修饰的rna供体序列包含可操作地连接至供体rna的靶向细胞器的rna,其中修饰的rna供体序列包含逆转录酶引物位点,并且其中多核苷酸可操作地连接至至少一个调控元件;(b)将编码修饰的逆转录酶的多核苷酸引入细胞中,其中修饰的逆转录酶包含可操作地连接至靶向细胞器的肽的逆转录酶,其中多核苷酸可操作地连接至至少一个调控元件,其中(a)的靶向细胞器的rna和(b)的靶向细胞器的肽均靶向同一细胞器;以及(c)在(a)和(b)的多核苷酸都表达的条件下使细胞生长。该方法可以进一步包括(d)选择具有包含改变的基因组的细胞器的细胞。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)向细胞器中引入以下项:(i)编码至少一个指导多核酸的第一多核苷酸,其中至少一个指导多核酸可以引导多核苷酸指导的多肽(例如,cas多肽;cas9多肽)切割细胞器基因组中存在的至少一个靶序列;(ii)编码多核苷酸指导的多肽(例如,cas多肽;cas9多肽)的第二多核苷酸,其中多核苷酸指导的多肽在与指导多核酸(例如,指导rna)相关联时可以切割至少一个靶序列;(iii)任选地,编码至少一个同源细胞器dna序列的第三多核苷酸,其中至少一个同源细胞器dna具有足以进行同源重组的大小,其中将至少一个同源细胞器dna序列整合到细胞器基因组中导致至少一个靶序列的去除;(iv)任选地,编码至少一个选择标记或至少一个筛选标记或两者的第四多核苷酸,其中编码至少一个选择标记或者至少一个筛选标记或两者的序列可操作地连接至在细胞器中具有功能的启动子;和(v)任选地,编码在细胞器中具有功能的复制起点的第五多核苷酸;以及(b)在(i)的第一多核苷酸和(ii)的第二多核苷酸均表达的条件下使包含(a)的细胞器的细胞生长。该方法可以进一步包括步骤(c)——选择具有包含改变的基因组的细胞器的细胞。该方法可以进一步包括步骤(d)——选择对于细胞器的改变的基因组是同质的细胞。(iii)的第三多核苷酸可以包含第六多核苷酸和第七多核苷酸,其中第六多核苷酸和第七多核苷酸对应于细胞器基因组中两个同源的相邻区域,其中第六多核苷酸和第七多核苷酸被与细胞器dna异源的序列隔开。与细胞器dna异源的序列可以包含选自以下的至少一项:(i)的第一多核苷酸、(ii)的第二多核苷酸、(iv)的第四多核苷酸、第八多核苷酸及其任何组合,其中第八多核苷酸编码与细胞器异源的rna或包含与细胞器异源的非编码序列(例如,调控序列,诸如启动子)或两者。与细胞器异源的rna可以是选自以下的至少一项:mrna、功能rna及其任何组合。功能rna可以是选自以下的至少一项:指导rna、sirna、mirna、dsrna、trna、rrna及其任何组合。可以在以第六多核苷酸和第七多核苷酸为边界的区域之外定位选自以下的至少一项:(i)的第一多核苷酸、(ii)的第二多核苷酸、(iv)的第四多核苷酸、(v)的第五多核苷酸及其任何组合。(v)的第五多核苷酸可以编码质体复制起点、线粒体复制起点或两者。质体复制起点可以对应于来自质体rrna基因间区域的dna序列。在本文所述的任何方法中,本文所述的一个或多个多核苷酸可以存在于重组dna构建体上。在本文所述的任何方法中,该方法可以包括超过一个此类重组dna构建体。在本文所述的任何方法中,重组dna构建体可以进一步包含第九多核苷酸和第十多核苷酸,其中第九多核苷酸和第十多核苷酸彼此具有100%序列同一性,并且进一步地,其中第九多核苷酸和第十多核苷酸作为直接重复序列排列在重组dna构建体中。第九多核苷酸和第十多核苷酸可以彼此有至少20、21、22、23、24、25、30、40、50、60、70、80、90或100个核苷酸具有100%的序列同一性。重组dna构建体可以是线性的,并且第九多核苷酸和第十多核苷酸可以分别存在于重组dna构建体的5’和3’端。在本文所述的用于改变细胞器的基因组的任何方法中,重组dna构建体可以是线性的、单链的并且可操作地连接至修饰的vird2蛋白。修饰的vird2蛋白可以包含可操作连接至靶向细胞器的肽的vird2蛋白,其中修饰的vird2蛋白也已被修饰,使得vird2蛋白的至少一个天然核定位序列不再具有功能。在上述改变细胞器的基因组的方法中,重组dna构建体可以可操作地连接至至少一种修饰的vire2蛋白。至少一种修饰的vire2蛋白可以包含可操作连接至靶向细胞器的肽的vire2蛋白,其中至少一种修饰的vire2蛋白也已被修饰,使得vire2蛋白的至少一个天然核定位序列不再具有功能。在本文所述的用于改变细胞器的基因组的任何方法中,重组dna构建体可以可操作地连接至至少一种修饰的reca蛋白。至少一种修饰的reca蛋白可以包含可操作地连接至靶向细胞器的肽的reca蛋白。在本文所述的用于改变细胞器的基因组的任何方法中,重组dna构建体可以可操作地连接至至少一种嵌合多肽。至少一种嵌合多肽可以包含靶向细胞器的肽和细胞穿透肽,以及任选的dna结合多肽。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括使用定点核酸酶(例如,talens、锌指核酸酶或大范围核酸酶)和多核苷酸指导的多肽。可以通过定点核酸酶(例如,talens、锌指核酸酶、大范围核酸酶)完成细胞器基因组的初始切割,以促进与供体多核苷酸的同源重组。供体多核苷酸可以包含不被多核苷酸指导的多肽识别的修饰的靶位点。通过用多核苷酸指导的多肽处理,在靶位点切割未修饰的细胞器基因组可以促进同质状态。在另一个实施方案中,任何的上述方法均可以进一步包括将编码至少一个标记的多核苷酸引入细胞器中,该标记选自:正选择标记、负选择标记、筛选标记及其任何组合。正选择标记可以是除草剂耐受性蛋白。除草剂耐受性蛋白可以是选自以下的至少一项:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽、乙酰辅酶a羧化酶(acc酶)及其任何组合。该方法可以进一步涉及在正选择剂的存在下使细胞生长,并选择对于细胞器的改变的基因组是同质的细胞。任选地,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。可替代地,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后在负选择剂的存在下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。在该方法中,细胞可以是植物细胞,细胞器可以是质体,并且该方法可以进一步涉及从包含改变的细胞器基因组的植物细胞再生植物。植物细胞可以是单子叶植物细胞,例如,玉米细胞。植物细胞可以是双子叶植物细胞,例如,大豆细胞。在另一个实施方案中,用于改变细胞器的基因组的方法可以包括:(a)向细胞的细胞器中引入以下项:(i)至少一个指导rna,其中至少一个指导rna引导多核苷酸指导的多肽切割细胞器基因组中存在的至少一个靶序列;(ii)多核苷酸指导的多肽,其中多核苷酸指导的多肽在与至少一个指导rna相关联时切割至少一个靶序列;和(iii)替代dna;以及(b)选择包含含有替代dna的细胞器的细胞。步骤(a)部分(iii)的替代dna可以包含来自栽培种、品系、亚种和其他物种并且不同于步骤(a)的细胞器的基因组的细胞器dna片段或完整细胞器dna。替代dna可以缺少至少一个靶序列。另外,在步骤(a)部分(ii)之后并在步骤(a)部分(iii)之前,可以选择其中细胞器的基因组已被消除的细胞。在另一个实施方案中,本文所述的方法和物质组合物中的指导多核酸可以包含以下项:i)与靶多核酸的至少17个核苷酸互补的至少17个核苷酸,其中所述靶多核酸位于细胞器的基因组中;和ii)与多核苷酸指导的多肽接触的区域。指导多核酸可以包含一个或多个rna碱基。指导多核酸可以是指导rna。指导多核酸可以是双指导rna。指导多核酸可以是单指导rna。在另一个实施方案中,本文所述的方法和物质组合物中的多核苷酸指导的多肽可以选自:cas9蛋白、mad2蛋白(美国专利号10,011,849;通过引用并入本文)、mad7蛋白(美国专利号9,982,279;通过引用并入本文)、crispr核酸酶、cas蛋白的核酸酶结构域、cpf1蛋白、argonaute、其修饰形式及其任何组合。编码多核苷酸指导的多肽的序列可以对于人、酵母、藻类或植物物种是密码子优化的。在本文所述的用于改变细胞器的基因组的任何方法中,该方法可以进一步涉及在正选择剂的存在下使细胞生长,并选择对于细胞器的改变的基因组是同质的细胞。该方法可以进一步涉及:(i)在不存在正选择剂的情况下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞;或(ii)在不存在正选择剂的情况下使细胞生长,然后在负选择剂的存在下使细胞生长,然后选择缺乏非整合的重组dna构建体的细胞。在本文所述的涉及指导多核酸和多核苷酸指导的多肽的任何方法中,与缺少指导多核酸、多核苷酸指导的多肽或两者都缺少的相应方法相比,该方法可以包括转化效率提高至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%或500%。在本文所述的涉及指导多核酸和多核苷酸指导的多肽的任何方法中,该方法可以包括减少达到同质状态所需的时间量,其中与缺少指导多核酸、多核苷酸指导的多肽或两者都缺少的相应方法所需的时间量相比,该减少为至少10%、20%、30%、40%、50%、60%、70%、80%或90%。在另一个实施方案中,重组dna构建体(例如,用于本文所述的任何方法)可以包含本文所述的任何一个或多个多核苷酸。在另一个实施方案中,细胞可以包含细胞器,其中细胞器可以包含上述重组dna构建体中的至少一种。细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞以及哺乳动物组织培养物细胞。在另一个实施方案中,植物或种子可以包含任何上述细胞器、细胞或重组dna构建体。在另一个实施方案中,包含具有改变的基因组的细胞器的细胞可以通过任何上述方法产生。细胞可以选自:酵母细胞、藻类细胞、植物细胞、昆虫细胞、非人类动物细胞以及哺乳动物组织培养物细胞。在另一个实施方案中,一种方法可以改变细胞中细胞器的基因组,其中该细胞是植物细胞。此外,可以从包含具有改变的基因组的细胞器的植物细胞再生植物,其中再生的植物包括具有改变的基因组的细胞器。而且,可以从再生的植物产生植物(例如,后代植物)或种子,其中植物或种子包含具有改变的基因组的细胞器。在涉及指导多核酸(例如,指导rna)的任何上述实施方案中,指导多核酸可以是单指导rna(单分子)或双链体指导rna(双分子)。在涉及多个指导rna的任何实施方案中,多个指导rna可以是单指导rna、双链体指导rna或两者。在任何上述实施方案中,多个指导rna(和/或其他异源rna)可以编码在单独的转录单元上或可以编码在多顺反子转录单元上。转录后,可以从多顺反子rna加工出指导rna;例如,通过使用rna切割位点(例如,csy4;c2c2)、核酶切割位点、多核苷酸指导的多肽切割位点或trna序列的存在。通过使指导rna的5’具有第一trna序列并且使指导rna的3’具有第二trna序列,可以从多顺反子rna加工出指导rna。多个指导rna可以与多个trna序列(在每个指导rna的5’和3’端)一起排列,以用于从多顺反子rna加工。在任何上述实施方案中,可以引入细胞器中的多核苷酸(例如,供体dna、供体rna)可以包含选自以下的至少一项:编码感兴趣的多核苷酸的表达盒和编码包含多个感兴趣的多核苷酸的多顺反子转录物的表达盒;例如,包含多个蛋白质编码区、多个功能rna或两者的组合的多顺反子转录物。感兴趣的多核苷酸相对于细胞器的基因组可以是异源的。在任何上述用于将细胞器的基因组改变成含有异源多核苷酸的任何方法中,异源多核苷酸可以编码选自以下的至少一项:除草剂耐受性蛋白、杀虫蛋白、与杀虫蛋白结合的辅助蛋白、dsrna、sirna、mirna及其任何组合,其中dsrna、sirna和mirna可以抑制植物害虫中存在的至少一个靶基因。除草剂耐受性蛋白可以是选自以下的至少一项:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽、乙酰辅酶a羧化酶(acc酶)及其任何组合。杀虫蛋白可以是选自以下的至少一项:cry1ac、cyt1aa、cry1ab、cry2aa、cry1i、cry1c、cry1d、cry1e、cry1be、cry1fa和vip3a。与杀虫蛋白结合的辅助蛋白可以是选自以下的至少一项:20kda辅助蛋白和19kda辅助蛋白。dsrna、sirna和mirna可以抑制选自以下的至少一个靶基因:蛋白酶体a型亚基肽(pas-4)、act、shr、epic2b、pnpmai及其任何组合。异源多核苷酸可以可操作地连接至在细胞器中有活性的至少一个调控元件。至少一个调控元件可以选自:与玉米clpp5’-utr组合的玉米clpp启动子、与来自噬菌体t7的基因10的5’-utr组合的玉米clpp启动子、与来自噬菌体t7的基因10的5’-utr组合的番茄psba启动子、与修饰的accd5’-utr组合的番茄rrn16启动子及其任何组合。细胞可以是植物细胞,其中细胞器是质体(例如,叶绿体),并且其中该方法进一步包括从包含改变的细胞器基因组的植物细胞再生植物。植物细胞可以是大豆细胞。在用于将细胞器的基因组改变成包含异源多核苷酸的任何上述方法中,异源多核苷酸的侧翼可以为直接重复序列。直接重复序列可以彼此有至少20、21、22、23、24、25、30、40、50、60、70、80、90、100、200、300、400、500或600个核苷酸具有100%的序列同一性。直接重复序列可以包含位点特异性重组酶位点(例如,loxp、attp、attb)。异源多核苷酸可以编码选自以下的至少一个标记:正选择标记、负选择标记、筛选标记及其任何组合。任选地,该方法可以进一步涉及在不存在正选择剂的情况下使细胞生长,然后选择对于缺乏异源多核苷酸的细胞器是同质的细胞。可替代地,该方法可以进一步涉及在存在负选择剂的情况下使细胞生长,然后选择对于缺乏异源多核苷酸的细胞器是同质的细胞。任选地,该方法可以涉及其中异源位点特异性重组酶(例如,cre、phic31、bxb1)在细胞器中表达的条件下使细胞生长。在上述实施方案中,靶细胞器可以是质体(例如,叶绿体)或线粒体。靶向细胞器的多核苷酸可以是trna、类病毒rna或eif4erna。在上述实施方案中,抗生素标记基因的表达可以与抗生素选择结合使用,以获得(和选择)质体或线粒体转化事件(例如,同质事件)。包含供体多核苷酸(例如,供体dna)的多核苷酸还可以包含用于抗生素标记基因的表达盒;表达盒可以在供体多核苷酸区域内(即,用于整合到细胞器基因组中)或在供体多核苷酸区域外。实施例在以下实施例中进一步定义本公开内容,除非另有说明,其中份数和百分数均以重量计,度数为摄氏度。应当理解,这些实施例虽然说明了实施方案,但仅以举例说明的方式给出。从上面的讨论和这些实施例中,本领域技术人员可以确定本公开内容的基本特征,并且在不脱离本公开内容的精神和范围的情况下,可以对本公开内容进行各种改变和修改以使其适应各种用途和条件。此类修改也意在落入所附权利要求的范围内。实验通常涉及单指导rna(sgrna),即其中可变靶向结构域与含有tracrrna序列的多核苷酸融合。可替代地,实验可以涉及双链体指导rna,即其中可变靶向结构域和tracrrna序列存在于单独的rna分子上。实施例1将cas9和指导rna靶向至酵母线粒体中为了产生用于线粒体基因组编辑的cas9蛋白,通过在氨基末端融合线粒体靶向肽并删除任何nls(核定位信号)元件来修饰在核基因组编辑中具有功能的蛋白质。将atp酶β亚基的靶向细胞器的肽和70kd蛋白质用于修饰,分别产生mcas9-a(由seqidno:1编码)和mcas9-b(由seqidno:2编码)。将每个编码修饰的cas9的多核苷酸克隆到酵母穿梭载体中,其中多核苷酸的表达处在gal1启动子的控制下,该启动子的活性由作为介质中的碳源的半乳糖诱导。为了产生用于线粒体基因组编辑的指导rna,使用可被导入线粒体中的trnalys(trk1形式和修饰的trk2形式)。制备了trna与指导rna之间的几种形式的融合体rna。一种方法是将指导rna融合到trna的5’端(seqidno:3和4)。为了抑制rna酶p的5’端切割,在替代构建体中修饰了trna的第一个碱基以防止与trna接纳茎上的相应碱基配对(seqidno:5和6)。第二种方法是通过在trk2-2和trk1的主链中进行有效的线粒体导入来替换trk2的内含子(分别为seqidno:7和8)。第三种方法是利用trk1(trnalys)可以分裂为两个分子,它们一起保留线粒体导入的特性的事实。在这种情况下,指导rna以保留trna剪接位点的二级结构的方式与trk1后半部分的5’端在trna结构中被称为可变环的区域中融合(seqidno:9)。与b形式融合的指导rna(seqidno:10)与a形式共表达以促进向线粒体中的共导入。采用作为用于线粒体导入的有效媒介物的rna产生合成的指导rna的一种变型是使用trk1的f发夹和d臂结构的组合。这些结构被证明有助于向线粒体中的导入。用此类方法,将指导rna置于两个结构之间(seqidno:11)或在5’或3’端与它们之一融合(例如seqidno:12和13)。对于位点特异性切割位点,以下线粒体序列被识别为用于指导rna的靶位点;指导rna可变靶向结构域如下所示:1.actgatagaagtgtagtaag(细胞色素b基因)(seqidno:14)2.atgattattgcaattccaac(cox1基因)(seqidno:15)3.attccacgatacttactacg(cox1基因)(seqidno:16)4.tcagcaacaccaaatcaaga(cox2基因)(seqidno:17)以上每个可变靶向结构域都位于pam序列之前。seqidno:14–17分别位于以下pam序列之前:agg、agg、tgg和agg。基于blast分析,被认为对cas9靶位点识别至关重要的来自每个下划线序列(与pam序列相邻)的3’端的11个核苷酸是酵母线粒体基因组所特有的。每个上述可变靶向结构域在3’端与tracrrna序列融合,用于cas9识别(seqidno:18)。编码每个工程化指导rna的多核苷酸在snr52启动子和sup4终止元件的控制下在核中表达(分别为seqidno:19和20)。在该实验中,使用了用于转化的酵母穿梭载体。例如,将snr52表达盒克隆到酵母表达载体诸如p416-gal1(ura3+,购自atcc的多拷贝质粒)中。将编码线粒体靶向的cas9(“mcas9”)的表达盒克隆到着丝粒p415-gall载体(leu+)的sali-xhoi位点,该表达盒的表达处在gall启动子的控制下,该启动子的活性由介质中作为唯一碳源的半乳糖诱导。将载体转化到允许增养作用(auxotropy)选择的酵母菌株(诸如by4733(mata)品系)中,并针对leu和ura独立生长进行选择。在针对相应增养作用的选择性介质上选择mcas9与指导rna构建体的每一种和/或组合的转化体作为单集落品系。通过将介质换为含有半乳糖作为唯一碳源的介质诱来导mcas9核酸内切酶的表达。源自单个集落的细胞在诱导介质中生长数个世代。分析这些品系在分子水平上的基因组编辑效率。将来自每种构建体和每种构建体组合的多个品系的细胞合并在一起,并通过使用标准dna分离方案(诸如,通过使用来自theromofisher的酵母dna提取试剂盒(目录号78870))分离其dna。使用对相应的基因组编辑位点有特异性的pcr引物组,通过pcr反应扩增每个编辑位点的dna。对pcr产物进行高通量测序,诸如通过使用由制造商提供的illuminahiseq方案。与相应的对照构建体相比,评估了每个靶位点处的位点特异性突变的频率。基因组编辑的功效也在功能水平上进行了分析。在获得单集落品系后,每个品系在非选择性葡萄糖介质中进一步生长另外若干世代,以促进线粒体基因组的同质状态。将酵母细胞铺板在葡萄糖介质如yd介质上。通过影印培养将各个集落转移至甘油介质诸如yg介质。通过无法在甘油介质上生长(即由于分别在cob、cox1和cox2基因中的突变而导致的呼吸缺陷)的集落的输出频率来评估基因组编辑的功效。细胞器基因组编辑的下一步是在线粒体中创建经编辑dna的显性和可持续状态,该线粒体最初含有多个(即使没有数百个)未编辑dna的池。这可以通过延长细胞器中位点特异性修饰的酶反应时间来实现。取决于多种因素,诸如mcas9和指导rna进入线粒体的导入效率,以及指导rna、导入的cas9与靶位点之间的亲和力,适合于每次细胞器修饰的延长时间的长度会有所不同。为了评估延长时间的影响,在数小时、数天和数周的时程中,将用适当的mcas9和指导rna对转化的酵母品系在用于相应构建体的选择性介质中生长。然后,对每种培养物进行如上所述的在分子水平和功能水平上的评估。从时程实验中确定对经编辑线粒体基因组历经世代的维持和表型表达而言足够的酶状态时间。实施例2将cas9、指导rna和供体dna靶向至酵母线粒体中为了精确地在核苷酸水平上编辑细胞器基因组,将供体dna(包含多核苷酸修饰模板)添加到位点特异性核酸内切酶系统。在一种方法中,将供体dna与cas9和指导rna一起引入线粒体中;如实施例1中所述地将cas9和指导rna引入线粒体中。在该实施例中,设计供体dna以在线粒体基因组中的15srrna基因中产生特异性突变,从而赋予巴龙霉素耐受性。位置1514的核苷酸置换(c至g)可以赋予巴龙霉素耐受性。为了产生具有耐受性等位基因的供体dna,设计一对引物以进行相应的置换(seqidno:21)。通过使用引物组(seqidno:21和22)和酵母总dna作为底物,按照标准pcr方案进行pcr扩增。所得模板dna通过dna转化程序(诸如生物弹射法)转化到线粒体中。为了用供体dna转化,使用如实施例1中所述的表达cas9和指导rna的细胞,不同之处在于该指导rna被设计为在线粒体dna的巴龙霉素耐受性位点附近进行切割,如seqidno:23所示。指导rna的这种设计使得切割位点被供体dna覆盖,其中重叠序列足以在两端进行同源重组,但是供体dna不被识别为位点特异性核酸内切酶活性的底物。例如,供体dna被修饰为不包括由相应的指导rna靶向的pam序列。指导rna的可变靶向结构域在3’端与tracrrna序列融合,用于与cas核酸内切酶相关联;通过使用实施例1中描述的trnalys衍生的方法制备指导rna表达构建体。在用供体dna转化后,将细胞合并在一起并在半乳糖介质中生长以诱导cas9蛋白持续数个世代,随后通过在介质中逐渐添加增加量的巴龙霉素历经额外的世代,对工程化的dna进行有利的扩增。将细胞铺板以制备单个集落。在存在和不存在巴龙霉素的情况下,将单个集落影印培养在以甘氨酸为唯一碳源的介质上,以识别巴龙霉素耐受性的集落。与未用供体dna转化的对照细胞相比,产生的具有模板dna的巴龙霉素耐受性细胞的比率增加表明了通过此方法进行基因组编辑的有效性。通过对工程化的位点进行测序来确认基因编辑。进行随后的基因组编辑步骤以消除不携带设计的修饰的细胞器dna。这可以通过几种方法中的任何一种来实现。一种方法是如上所述将细胞暴露在正选择压力下。另一种方法是消除或降低未修饰细胞器dna的复制速率。这可以通过使用位点特异性核酸内切酶(诸如锌指蛋白、talen和cas9系统)切割未修饰的dna来实现。在cas9方法中,特异性指导rna的表达被用于切割未修饰的细胞器dna,从而增加修饰的dna的数量。实施例3内源细胞器dna的替换这是修饰细胞器基因组的替代方法。在此方法中,第一步是通过使用位点特异性核酸内切酶(诸如cas9系统)减少或消除内源细胞器dna。同时或随后,引入替代细胞器dna。替代dna可以是在转化到细胞器中时表达新的基因型和相应性状的细胞器dna片段或完整细胞器dna。在细胞器dna片段的情况下,它们可以通过同源重组整合到剩余的细胞器dna中。在完整细胞器dna替换的情况下,可以从具有不同于受体细胞的内源细胞器dna的dna组成的栽培种、品系、亚种和其他物种中分离替代dna。替代dna的一个要求可以是含有在受体细胞器中具有dna复制起点功能的dna元件。替代dna也可以部分和/或完全合成。当在体外产生替代dna时,它可以是末端带有反向重复序列的线性dna。该末端可以促进体外或体内的同源重组,以产生用于细胞中细胞器dna复制的环状dna。体外产生的dna还可以包括外源dna元件,诸如允许在细菌细胞中进行选择扩增的元件。为了减少或消除线粒体dna,将酵母细胞暴露于被设计用于如实施例1中所述被导入线粒体中或如实施例4中所述在细胞器中直接合成的指导rna和cas9蛋白的持久表达。靶位点被选择为是内源线粒体dna特有的并且不存在于核基因组中,以减少采用实施例1中所述的方法时在核基因组上发生任何损害的机会。靶位点也被选择为不存在于替代dna中。多个切割位点提高了取代内源细胞器dna的速率。这可以通过表达靶向内源线粒体dna中的不同的独特序列的多个指导rna来实现(例如,参见实施例1的靶位点)。经过cas9/指导rna处理后,通过缺乏呼吸、无法在以甘油作为唯一碳源的介质上生长以及缺少线粒体dna来识别已丧失线粒体dna的酵母细胞。也可以通过按照实施例1中所述的方法,通过在cscl梯度中不存在线粒体dna条带来确认所得的rho0条件。一旦线粒体dna被删除,则用体外或体内产生的替代dna转化细胞;例如,衍生自具有与受体细胞不同的性状的不同品系或物种的线粒体dna。在该实施例中,通过使用实施例2中所述的转化方法,将来自抗生素耐受性品系(例如il8-8c/r53)的线粒体dna分离并转化到缺乏该耐受性性状的受体细胞中。用于转化的线粒体dna也可以通过使用引物组对细胞器dna进行pcr扩增而产生,该引物组的3’端彼此互补,足以在体内退火。所得的线性dna分子被转化到线粒体中。存在于细胞器中的同源重组活性在转化时产生环状细胞器dna。可替代地,可以以线性和环状形式合成产生用于转化的dna。实施例4将供体dna以及用于cas9和指导rna的表达盒引入酵母线粒体中在该实例中,可在细胞器中复制并编码位点特异性核酸内切酶系统的组分(诸如cas9、指导rna和供体dna)的dna质粒(“编辑质粒”)被直接引入细胞器中。核酸和蛋白质的递送可以通过利用诸如轰击(“生物弹射”)、电穿孔和其他合适方法的方法来完成。在酵母中,具有细菌载体序列(pbr322)的环状形式的dna可以通过利用生物弹射方法转化到线粒体中。所得的细胞与线粒体dna中携带点突变的品系杂交。它们表明,通过质粒dna与线粒体dna之间的重组可以使点突变恢复。为了有效地进行基因组编辑,使用为在线粒体中表达而定制的用于cas9和指导rna的表达盒来产生要转化到酵母线粒体中的质粒dna。质粒dna还含有供体dna,以促进位点特异性基因组编辑。cas9基因针对线粒体表达进行了优化(seqidno:24),并可操作地连接至cox2启动子和终止子(分别为seqidno:25和26)。通过将ctn密码子更改为tta、将ggg/ggc更改为ggt、将gcg/gcc更改为gct、将cgg/cgc更改为cgt、将ccg/ccc更改为cct、将agc更改为agt、将agg更改为aga、将acg/acc更改为act、将tcg/tcc更改为tct,和将gag更改为gaa以及将tga终止密码子更改为taa来进行优化。编码含有针对线粒体21srrna基因设计的可变靶向结构域(seqidno:27)的指导rna的多核苷酸可操作地连接至用于表达线粒体15srrna基因的启动子和终止子(分别为seqidno:28和29)。供体dna片段携带具有氯霉素耐受性等位基因cr321的21srrna基因。线粒体21srrna基因中的cr321突变可赋予酵母氯霉素耐受性。为了在线粒体中选择质粒,质粒还可以携带正选择标记,诸如具有上述巴龙霉素耐受性突变的活性15srrna基因。将该质粒与用于核转化的另一质粒一起转化到酵母品系(诸如mcc123[rho0])的线粒体中,以选择酵母中两个质粒的共转化事件。首先将转化的酵母细胞定殖在介质上,以允许选择核转化体。通过将定殖细胞影印培养在铺有携带相反交配型和野生型线粒体基因组的酵母品系的平板上,可以通过随后将交配细胞影印培养在不可发酵的介质(诸如具有氯霉素(4mg/ml)的ypge)上来识别对氯霉素具有耐受性的集落。通过与由不具有cas9和指导rna的质粒产生的氯霉素耐受性集落的频率进行比较,证实了氯霉素耐受性集落的频率增加。通过对线粒体dna中的经编辑位点进行测序,进一步证实了成功的基因组编辑。实施例5外源基因插入线粒体dna中和消除未修饰的线粒体dna在该实施例中,类似于实施例4,用编辑质粒转化线粒体。编辑质粒含有允许在线粒体中复制的元件,以及位点特异性核酸内切酶系统(如cas9)的另外组件,诸如指导rna和供体dna。供体dna被设计成以与线粒体基因组同源的两个区域为边界,以进行由位点特异性dna切割促进的同源重组。在两个同源区域之间展示了表达单元的插入,该单元由coxii启动子、编码gfp荧光蛋白的多核苷酸和终止子组成。供体dna可以具有有或没有多顺反子表达的多个表达单元;即其中在一个启动子下表达多个编码区。在一个展示中,cas9-grna复合物靶向两个单独的位点。设计了cob基因中的一个cas9切割位点(tgtcccattaagacataaggtacttctacaseqidno:30的可变靶向结构域;其位于tggpam序列之前)和atp9基因中的另一个切割位点(tggagcaggtatctcaacaattggtttattaggagcseqidno:31的可变靶向结构域;其位于aggpam序列之前)。包含多核苷酸的供体dna的一端覆盖cob切割位点,而另一端覆盖atp9基因,以促进供体dna与线粒体dna之间的同源重组。供体dna在cas9-grna切割位点附近的序列中携带突变,以消除同源重组事件后的后续dna切割。这些突变被设计为“沉默的”,即突变的序列具有与野生型相同的功能,例如用编码相同氨基酸的同义密码子替换一个密码子。除了在切割位点进行修饰外,我们还设计了cas9-grna复合物,该复合物可切割野生型线粒体dna中两个主要靶位点之间的另外的位点,但不能切割供体dna和由供体dna同源重组产生的线粒体dna。另外的切割位点促进了“基因组清扫”动作;即消除野生型线粒体dna而不消除工程化的线粒体dna。在一个不同的展示中,供体dna在gfp处含有编码乳铁蛋白的多核苷酸。实施例6哺乳动物线粒体dna的基因组编辑为了将cas9导入哺乳动物的线粒体,将不具有核定位信号元件的cas9蛋白与线粒体靶向肽融合。一种此类肽是具有32个氨基酸残基的ndufv2mts,nh2-mffsaalraraagltahwgrhvrnlhktvmqn-cooh(seqidno:32)。在此情况下,将ndufv2信号序列与cas9的氨基末端融合以得到修饰的cas9(seqidno:33)。可替代地,可以在人细胞中起作用的另一种信号肽,例如来自柠檬酸合酶的一种信号肽(nh2-malltaaarllgtknasclvlaarh-cooh;seqidno:34),可以用于产生修饰的cas9(seqidno:35)。通过使用购自sigmaaldrich的人转染载体psf-cmv-amp,将编码修饰的cas9基因(具有线粒体靶序列)的多核苷酸可操作地连接至启动子元件如cmv,或将其可操作地连接至诱导型启动子,诸如可从clontech购买的ptre2hyg载体的tet诱导型启动子。类似于其他实施例,指导rna与线粒体靶向rna融合;即允许rna导入线粒体的序列。在该实验中,使用了可被导入人线粒体中的rna。其中之一是酵母trnalys。酵母trnalys及其变体可以导入人线粒体中。使用的另一rna是5srrna,其可以导入人线粒体中。在后一种情况下,将指导rna克隆到对于线粒体导入可能是必不可少的环c中(seqidno:36)。在该实验中,指导rna被设计成靶向cox3基因(seqidno:37)。在指导rna中,可变靶向结构域与tracrrna序列以及线粒体靶向rna融合。grna表达盒由编码可操作地连接至在人细胞中具有功能的启动子和终止子的指导rna的多核苷酸组成。在该实施例中,使用了用于组成型表达的u6启动子。对于5srrna融合,还使用5srrna基因的启动子和终止子(seqidno:38)。将指导rna表达盒克隆到携带cas9表达盒的质粒中,或克隆到不同的转染载体中。将构建的质粒转染至人细胞系(诸如hela和hek293以及hela和hepg2tet-off细胞)中,以从基于ptre2hyg的构建体中诱导型地表达cas9。转染的细胞在潮霉素存在下进行选择。进行细胞培养物的制备和转染以用于诱导型表达。转染三天后收获细胞,并使用dna提取试剂盒提取约106个细胞的总dna。进行pcr以扩增包含靶位点的区域,并且通过使用高通量测序仪(例如,miseqillumina测序仪)对扩增的dna进行深度测序。分析序列数据以确认在靶位点处的修饰。实施例7对哺乳动物线粒体dna进行基因组编辑以赋予对氯霉素的耐受性在针对哺乳动物细胞的该实施例中,通过16srrna基因中的核苷酸置换来编辑线粒体dna以赋予氯霉素耐受性。为此目的,cas9蛋白、指导rna和供体dna三个组分被靶向至线粒体。小鼠细胞系中的氯霉素耐受性可以映射到线粒体16srrna基因中的单个核苷酸变化(capr)。指导rna被设计为包含野生型16srrna基因的capr突变位点。还以将其按照识别野生型序列但不识别具有capr突变的供体dna的方式设计(seqidno:39)。供体dna通过pcr扩增小鼠capr细胞的16srrna区域产生或人工合成(seqidno:40)。如实施例5中所述将cas9和指导rna靶向至线粒体。如上所述将具有cas9和指导rna表达盒的质粒转染到小鼠细胞系如nih3h3中。供体dna被转化到线粒体中。将转染的细胞培养在含有氯霉素(cap)的介质上。在cap上选择后,与对照相比,证实了通过基因组编辑产生耐受性细胞。最后,对capr细胞的16srrna进行测序,以在分子水平上确认基因组编辑。实施例8将供体dna以及用于cas9和指导rna的表达盒引入哺乳动物线粒体中在该实施例中,基因组编辑的包括供体dna在内的所有组分都被克隆到质粒dna中,该质粒dna被引入哺乳动物的线粒体中。将质粒dna以环状形式或以能够在线粒体中环化的线性形式引入线粒体中。质粒dna含有允许在线粒体中自主复制的序列。它还可以编码至少一种选择标记,以允许在转化进入线粒体后进行选择。此选择标记可以是具有capr突变的活性16srrna基因。存在于质粒dna上的线粒体中用于基因表达的rep/ori和其他元件可以衍生自不同于线粒体dna编辑的靶物种的物种。如先前实施例中所述,可以为不同于供体dna的野生型序列设计另外的dna切割位点。实施例9将cas核酸内切酶和指导rna引入质体中为了编辑叶绿体基因组,将cas9修饰为在蛋白质的n-末端具有叶绿体靶向氨基酸序列(也称为转运肽,tp),并去除任何核定位信号。另外,cas9的核苷酸序列对于植物物种是密码子优化的,以实现最佳表达(seqidno:41和42;分别用于核酸和氨基酸序列)。实验中使用了来自叶绿体靶向蛋白(诸如核酮糖二磷酸羧化酶/加氧酶小亚基(rbcs)、叶绿素a/b结合蛋白(cab)和dnaj8)的转运肽。每个修饰的cas9被工程化成具有与cas9的氨基末端翻译融合的转运肽,以产生tp-cas9(seqidno:46)。编码此类融合蛋白的多核苷酸的表达处在在植物中具有功能的启动子诸如camv35s启动子的控制下。没有转运肽的cas9用作对照(seqidno:41和42)。为了将指导rna转运到叶绿体中,使用可以导入叶绿体中的rna序列。可以介导附接的异源rna的导入的这些质体靶向rna(在本文中也称为“转运rna”)包括vd-5’utr(seqidno:48)和eif4e1mrna(seqidno:49)。编码这些融合体转录物的多核苷酸的转录处在在植物中具有功能的核启动子的控制下,诸如35scamv启动子(例如,pbc-yellow的1.3-kb35s启动子或u6启动子;染色体8玉米u6聚合酶iii启动子)。没有质体靶向rna的指导rna用作对照(seqidno:50)。作为产生grna的替代方法,使用序列特异性核糖核酸内切酶,诸如负责处理来自铜绿假单胞菌的crispr转录物的csy4(seqidno:51-52,分别用于核酸和氨基酸序列)。csy4识别序列是:5’-gttcactgccgtataggcag-3’(seqidno:53)。在初级转录物当中,grna序列的侧翼为csy4识别序列(seqidno:54)。编码与5’质体靶向rna融合的该序列的多核苷酸在核中从35scamv启动子或u6启动子转录,并靶向叶绿体中。为了将csy4蛋白靶向叶绿体中,使用seqidno:43–45中列出的叶绿体转运肽之一作为与csy4的n末端翻译融合体。实施例10将编码cas核酸内切酶和指导rna的rna引入质体中质体靶向rna可以将异源rna转运到质体中,该异源rna然后由叶绿体翻译机制翻译。利用该特性将所有基因组编辑组分作为rna分子转运到叶绿体中;转运的mrna随后被翻译,并且产生的蛋白质参与编辑过程。在该方法中,制备包含可操作地连接至编码rna的多核苷酸的启动子的表达盒,该rna包含以下各项:质体靶向rna、rbs(核糖体结合位点)、cas9编码序列、rbs、csy4编码序列、csy4识别序列、grna和csy4识别序列。该表达盒通过转化而整合到核基因组中。上述重组dna构建体中的启动子是在植物中具有功能的启动子,诸如camv35s启动子。所得的rna分子被转运到叶绿体中。一旦其进入叶绿体,cas9和csy4蛋白就会由叶绿体翻译机制产生。由csy4从转运的rna分子加工而成的cas9和grna的复合物在叶绿体基因组中找到并编辑靶位点。实施例11指导rna靶位点选择指导rna靶位点选自叶绿体基因组的基因间区域以及基因区域。后者的实例包括rpob、psba、rps15和rpl33。rpob基因的删除可以显示出光合作用缺陷的表型。psba基因的删除可以产生光系统ii缺陷。rps15和rpl33的双重删除可以在自养条件下导致合成致死性。使用基于网络的生物信息学程序ape(http://biologylabs.utah.edu/jorgensen/wayned/ape/)来促进针对grna靶位点的选择过程。为了选择烟草的grna靶位点,使用烟草的叶绿体基因组序列。对于本生烟的grna靶位点,由于本生烟的总叶绿体基因组序列不可用,因此使用本生烟叶绿体基因组中的靶区域的公开序列保藏(publicsequencedeposition)或直接测序。另外,由于紧密相关的植物物种可以具有高度保守的叶绿体dna序列,因此也将烟草叶绿体dna序列用于设计本生烟的grna靶位点。同样,来自ncbi细胞器基因组资源的大豆(株系:william82)叶绿体基因组序列被用作参考基因组,用于设计大豆叶绿体dna中的试验性grna靶位点,尚待对转化的特定品系进行测序。为了编辑指示的基因序列区域,选择以下序列用于可变靶向结构域。术语“nt”对应于“烟草”,术语“cp”对应于“叶绿体”,而术语“glma”对应于“大豆”。当可变靶向结构域在基因序列的反向互补序列上时,指示术语“反向”。用于ntcp_rpob(rna聚合酶β链)(seqidno:55)1.ttagaggaagagccaaacag(seqidno:56)2.cttgctatagccgaacgcga(seqidno:57)用于ntcp_psba(光系统ii蛋白d1)(seqidno:58)1.gttgatgaatggttatacaa(seqidno:59)2.gatgatccctaccttattga(seqidno:60)用于ntcp_rps15(核糖体蛋白s15)(seqidno:61)1.atttctcaagaagaaaagag(seqidno:62)2.tcaatttcaccaataagata(seqidno:63)用于ntcp_rpl33(50s核糖体蛋白l33)(seqidno:64)1.gatatattactcaaaagaac(seqidno:65)2.agtgttgataaggtatcaag(seqidno:66)用于glmacprpob(rna聚合酶β链)(seqidno:67)1.tgtctaaaactacctacagg(seqidno:68)2.agcggaatttcggtctatac(seqidno:69)(反向)用于glmacppsba(光系统ii蛋白d1)(seqidno:70)1.ggtgtagctggtgtattcgg(seqidno:71)2.tctagatctagctgcgatcg(seqidno:72)(反向)用于glmacp_rps15(核糖体蛋白s15)(seqidno:73)1.atagaatacgaagacttact(seqidno:74)(反向)2.tgtcaaagaaagatagaata(seqidno:75)用于glmacp_rpl33(50s核糖体蛋白l33)(seqidno:76)1.cgttgttgcaaacatacaat(seqidno:77)(反向)2.acagaatacgcctagtcgat(seqidno:78)用于本生烟rps16(核糖体蛋白s16)(seqidno:79)1.ttgtggatttgtacatccac(seqidno:80)(反向)2.ttgaactgtttgaaagttat(seqidno:81)(反向)用于本生烟matk(成熟酶k)(seqidno:82)1.cttgtgctagaactttagct(seqidno:83)2.cgttcatctggaaatcttgg(seqidno:84)(反向)为了编辑基因间区域,选择以下序列用于可变靶向结构域。烟草:1.aagaacttcccccttgacag(ntchrc;57408..57389)(seqidno:85)2.tatacaggatgggtagaaag(ntchrc;59412..59393)(seqidno:86)3.atataatttttaataaaggg(ntchrc;59622..59603)(seqidno:87)4.ctagtcttcgacacaagaaa(ntchrc;65704..65723)(seqidno:88)大豆:1.ataacagaagttaaagaaga(glmacp_nc_007942.1_59039-59058)(seqidno:89)2.atctggaaaccatagaacag(glmacp_nc_007942.1_59100-59119)(seqidno:90)3.ctatttcgacacaaacaaga(glmacp_nc_007942.1_62057-62038)(seqidno:91)4.ctttctttgacgaattcgag(glmacp_nc_007942.1_62361-62380)(seqidno:92)实施例12用编码cas核酸内切酶和指导rna的多核苷酸进行转化如上所述的编码(a)与转运肽融合的cas9;和(b)与vd-5’utr或eif4e1mrna融合的grna的基因盒被亚克隆到二元载体(诸如如ppzp)中,并引入到植物中以进行瞬时表达或稳定表达。在一些实验中,与转运肽融合的编码csy4的dna也被转化到植物中。可以使用几种方法中的任何一种,用dna序列来转化植物。这些方法包括农杆菌渗入法、生物弹射轰击和花浸泡法。类似的方法也适用于其他植物物种,包括双子叶植物如油菜和单子叶植物如水稻、小麦和玉米。实施例13通过逆转录酶将供体dna引入质体中将供体dna引入质体基因组中,以按照选自以下的至少一种方式编辑基因组:(1)在靶基因中产生点突变;(2)用异源dna序列替换内源编码区或调控序列;以及(3)插入异源dna序列(例如,用于表达异源蛋白或rna;用于调节内源基因)。在以上实施例中,提出了几种用于将cas9和grna递送到叶绿体中的方法。在当前实施例中,供体dna也被递送到叶绿体中。在一种方法中,通过rna供体分子的逆转录而生成用于在叶绿体中进行同源重组的供体dna,该rna供体分子通过转运rna指导的转运被转运到叶绿体中。从转化的核基因组转录的rna供体分子含有以下项:(1)转运rna,(2)用于同源重组的序列;(3)多核苷酸修饰模板序列,其具有以下至少一项:具有预期突变(例如,16srrna中的位点特异性突变)的内源序列和异源序列(例如,异源蛋白质编码序列);以及(4)用作逆转录酶的引发位点的序列。在同源dna区域中,将另外的突变例如沉默点突变引入序列中,以将这些区域与叶绿体dna上的另外的grna靶位点区分开。另外的grna靶位点用于切割叶绿体dna的未转化拷贝。通过与seqidno:43-45中描述的任何质体靶向肽的翻译融合体,将逆转录酶蛋白靶向到叶绿体中。可替代地,将编码逆转录酶的mrna分子(具有质体rbs)作为与seqidno:48-49中描述的任何一质体靶向rna的融合体分子转运到叶绿体中,并通过内源翻译机制在叶绿体中翻译。实施例14通过与两个多核苷酸的共轰击将供体dna引入质体中另一种将供体dna与cas9和grna共同递送的方法是通过两个dna分子的共轰击来实现的。在此方法中,编码cas9和grna的第一dna分子(采用先前实施例中描述的叶绿体转运方法)被靶向用于转化到核基因组中。具有供体dna序列和同源重组序列的第二dna分子被靶向用于转化到叶绿体基因组中。第二dna分子也可以含有叶绿体复制起点。为了进行转化,两种dna分子均通过生物弹射轰击递送至植物细胞。生物弹射颗粒的制备如下:(1)同时或依次用两种dna分子包被颗粒;或(2)用每种dna分子单独包被颗粒,然后以相同的摩尔比率混合。为了选择核转化,可以使用常用的抗生素标记(诸如nptii和bar)和/或荧光蛋白标记。为了选择叶绿体转化,使用抗生素标记(诸如aada)和/或荧光蛋白标记。用于叶绿体转化选择标记的表达盒或是整合到质体基因组中的携带多核糖核酸的供体dna的一部分,或位于供体dna区域的之外,但保留在递送的dna分子上而不整合到叶绿体基因组中。在将多核苷酸修饰模板递送至叶绿体中的上述实施例的变型中,首先将编码cas9和grna(具有或不具有csy4)的多核苷酸转化到核基因组中。这些组分的基因表达在诱导型启动子的控制下。借助于选择标记(抗生素标记和/或荧光标记蛋白),选择稳定转化的植物。进行第二次转化,以用含有多核苷酸修饰模板dna、同源重组序列和选择标记(诸如aada和/或荧光标记蛋白)的dna分子转化叶绿体dna。在用于核和叶绿体转基因的选择剂的存在下,以及在核转基因上的诱导型启动子具有转录cas9和grna(随后通过上述实施例中所述的机制将其转运到叶绿体中)的活性的条件下进行转化体的选择。实施例15通过农杆菌介导的转化将供体dna引入质体中供体dna转运到叶绿体中还通过农杆菌介导的转化进行。如上所述,产生了稳定的转基因品系,其含有具有诱导型启动子的编码cas9和grna的多核苷酸。然后用修饰的农杆菌菌株转化该品系,其中该修饰包括以下项:(1)添加与vird2融合的叶绿体转运肽;(2)删除vire2;以及(3)从vird2去除核定位信号。构建在右边t-dna边界与左边t-dna边界之间具有多核苷酸修饰模板、同源重组序列和选择标记(诸如aada和/或荧光标记蛋白)的二元载体,并将其转化到农杆菌中。为了进行转化,将具有编码cas9和grna的多核苷酸的稳定转基因品系与农杆菌一起温育。与单链t-dna共价连接的vird2蛋白进入植物细胞,并通过n末端转运肽转运到叶绿体中。通过利用核标记(nptii)和叶绿体标记(aada)的双重选择并在诱导型启动子具有转录编码cas9和grna(随后通过上述实例中所述的机制将其转运到叶绿体中)的多核苷酸的活性的条件下进行转基因选择。实施例16将供体dna以及用于cas9和指导rna的表达盒引入质粒中在该实施例中,可在质体中复制并编码位点特异性核酸内切酶系统的组分(诸如cas9、指导rna和供体dna)的dna质粒(“编辑质粒”)被直接引入质体中。核酸和蛋白质的递送可以通过利用诸如轰击(生物弹射)、电穿孔和其他可用方法的方法来完成。此处显示了烟草叶绿体的一个实例。烟草叶绿体的编辑质粒的构建如下。将编码cas9和指导rna的多核苷酸克隆到载体中,并可操作地连接至适当的启动子和终止子,以允许在烟草叶绿体中表达。可替代地,这两个编码区可以被连接并在一个启动子下多顺反子地转录。可以加工多顺反子rna以产生用于基因组编辑的单独的功能rna分子,一个用于cas9翻译,另一个用于指导rna。编码能够在叶绿体中选择质粒的选择标记(诸如赋予奇霉素耐受性的aada基因)的多核苷酸也存在于质粒dna上,与在叶绿体中有活性的合适的启动子和终止子可操作地连接。质粒上还存在编码负选择标记基因的表达盒以允许反向选择,即在编辑后选择没有编辑质粒的叶绿体,并随后实现野生型叶绿体dna的消除。dao基因就是一种这样负选择标记基因。此外,载体中还存在允许编辑质粒复制的元件。此元件可以衍生自靶物种的叶绿体dna,或者可替代地衍生自另一物种的叶绿体dna,以及衍生自完全合成的来源。另外,供体dna存在于载体上以允许精确的dna编辑和/或异源dna元件在叶绿体dna中的特异性位点的精确插入。作为一个实例,将烟草叶绿体dna中的野生型psba基因替换为携带赋予对除草剂三嗪的耐受性的单核苷酸置换的等位基因。此突变可以天然存在于耐受除草剂的植物中。为了在突变位点附近进行dna切割,设计了指导rna以靶向以下dna序列。pam序列(tgg)为粗体。供体dna含有以下序列,其中五个突变以粗体显示。阿特拉津耐受性突变(g)加下划线。存在不改变蛋白质序列的另外四个改变,以使该供体dna免于作为设计用于内源野生型psba序列的指导rna的靶标。特别地,一个改变消除了对于指导rna与靶多核酸(例如,靶dna)位点配对至关重要的pam序列。为了促进同源重组,供体dna在上述序列的上游和下游以更长的同源序列为边界。如chloroplastbiotechnologymethodsandprotocols,palmaliga(编者),methodsinmolecularbiology,springer,newyork(2014)中所述,通过生物弹射方法将编辑质粒转化到烟草叶绿体中。在含有奇霉素的介质上选择具有转化的叶绿体的细胞。在选择介质上培养愈伤组织细胞后,将愈伤组织转移至含有阿特拉津的介质中,以评估用供体dna编辑位点特异性基因组的频率。对该除草剂有耐受性的愈伤组织细胞的测序在分子水平上证实了成功的基因组编辑。为了提高获得具有工程化dna的同质叶绿体的速率,在野生型序列中设计了由与供体dna相邻的相应同源区域覆盖的另外的靶位点。为了保护叶绿体中的供体dna和经编辑dna,供体dna带有避免被cas9核酸内切酶切割的沉默突变;例如,用编码相同氨基酸的同义密码子替换密码子。将编码对应于那些另外的靶位点的grna的表达盒克隆到编辑质粒载体中,以在叶绿体中表达。编辑质粒中也存在具有经突变的(保护免于cas9核酸内切酶切割)另外的grna靶位点的供体dna。如上所述,将具有增加的基因组清扫活性的上述编辑质粒转化到烟草叶绿体中。在含有奇霉素的介质上选择具有转化的叶绿体的细胞。在选择介质上培养愈伤组织细胞后,将愈伤组织转移至含有阿特拉津的介质中,以评估用模板dna编辑位点特异性基因组的频率。对该除草剂有耐受性的愈伤组织细胞的测序在分子水平上证实了成功的基因组编辑。当实现经编辑细胞器dna的稳定遗传时,可以在对编辑质粒的非选择性条件下在后代植物中分离出编辑质粒。可以通过使用编辑质粒中编码的负选择标记来促进分离过程,例如对dao基因的d-缬氨酸选择。实施例17质体基因表达的调控元件可以构建具有在质体中有功能的启动子的表达盒,该启动子可操作地连接至以下任一项:(a)供体多核苷酸;或(b)作为多顺反子单元排列的多个供体多核苷酸。期望的5’-utr也可以存在于表达盒中,可操作地连接至启动子的3’端。在一个表达盒中,待转录的多核苷酸(或多个多核苷酸)可以可操作地连接至以下启动子::5’-utr调控元件:(a)与玉米clpp5’-utr组合的玉米clpp启动子;(b)与来自噬菌体t7基因10的5’utr组合的玉米clpp启动子;(c)与t7g105’–utr组合的番茄psba启动子;和(d)与accd-mod5’–utr组合的番茄rrn16启动子。上述调控元件可以通过pcr扩增获得。实施例18用于在细胞器中表达的抗虫性基因使用编码全长天然hd73cry1acδ-内毒素(seqidno:109)的来自苏云金芽孢杆菌库斯塔克亚种血清变型的野生型核酸序列(u89872;seqidno:108)构建用于细胞器转化的表达盒。可替代地,使用编码有活性的截短cry1ac片段的截短天然核酸序列(seqidno:110)。另外,在一些情况下,编码全长或截短cry1ac蛋白的核酸序列对于感兴趣的细胞器是密码子优化的。在一些情况下,将编码在赋予植物抗虫性方面有用的蛋白质的另外多核苷酸作为多顺反子单元包含在上述表达盒中,或从单独的表达盒表达。这些多核苷酸编码以下项:(a)来自苏云金芽孢杆菌以色列亚种血清变型的cyt1aa蛋白(geneid:5759908;seqidno:111);(b)来自苏云金芽孢杆菌以色列亚种血清变型的20kda辅助蛋白(pbt024;seqidno:112);以及(c)来自苏云金芽孢杆菌以色列亚种血清变型的19kda辅助蛋白(pbt022;seqidno:113)。实施例19具有增强的抗虫性的工程化植物在该实施例中,对植物(例如,大豆植物)进行工程化,以增强抗虫性。任选地,该植物还具有增强的对除草剂的耐受性。本公开内容的位点特异性核酸内切酶系统(例如,cas9、指导rna和供体dna)被用于将一个或多个杀虫蛋白引入植物细胞(例如,大豆细胞)的细胞器(例如,质体)基因组中。一个或多个杀虫蛋白或其片段选自:cry1ac、cyt1aa(例如,seqidno:109或seqidno:110)、cry1ab、cry2aa、cry1i、cry1c、cry1d、cry1e、cry1be、cry1fa和vip3a。在一些情况下,一个或多个辅助蛋白也被引入植物细胞的细胞体(例如,质体)基因组中。一个或多个辅助蛋白可以与杀虫蛋白结合,并选自:20kda辅助蛋白和19kda辅助蛋白。另外或独立地,在一些情况下,位点特异性核酸内切酶系统(例如,cas9、指导rna和供体dna)被用于将一个或多个编码dsrna、sirna和/或mirna的异源供体多核苷酸引入植物细胞(例如,大豆细胞)的细胞器(例如,质体)基因组中,其中dsrna、sirna和mirna可以抑制植物害虫中存在的至少一个靶基因。dsrna、sirna和mirna可以抑制选自以下的至少一个靶基因:蛋白酶体a型亚基肽(pas-4)、act、shr、epic2b和pnpmai。基于rna干扰的机制可以用于保护工程化植物免遭害虫。任选地,在一些情况下,还使用本公开内容的位点特异性核酸内切酶系统(例如,cas9、指导rna和供体dna)将一个或多个除草剂耐受性蛋白引入植物细胞的细胞器(例如,质体)基因组中。除草剂耐受性蛋白可以是选自以下的至少一种:4-羟基苯丙酮酸双加氧酶(hppd)、耐磺酰脲的乙酰乳酸合酶(als)、耐咪唑啉酮的乙酰乳酸合酶(als)、耐草甘膦的5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)、耐草甘膦的草甘膦氧化还原酶(gox)、草甘膦n-乙酰转移酶(gat)、膦丝菌素乙酰转移酶(pat)、原卟啉原氧化酶(protox)、生长素酶或受体、p450多肽和乙酰辅酶a羧化酶(acc酶)。实施例20通过编辑质粒方法对酵母线粒体dna的遗传修饰为了显示用我们的方法在酵母酿酒酵母中进行线粒体基因组编辑,设计了各种编辑质粒构建体。使用的参考序列是来自酿酒酵母基因组数据库(sgd)(https://www.yeastgenome.org/)的竞争线粒体基因组序列。靶基因是cox1基因(也称为oxi3基因)。先前已经显示该基因的突变体具有呼吸缺陷表型(https://www.yeastgenome.org/locus/s000007260)。使用了cox1基因中的以下四个指导rna靶位点(当靶向序列位于基因序列的反向互补序列上时,指示术语“反向”):1)ttctttgaagtatcaggaggtgg(seqidno:116);2)atgattattgcaattccaacagg(seqidno:117);3)gctatttttagtggtatggcagg(seqidno:118);和4)accatgtaaatattgtgaaccagg(seqidno:119)(反向)。每个序列中的最后三个核苷酸对应于pam序列。第一个靶位点位于外显子5中,第二个位于外显子4中,第三个位于外显子1中,并且第四个位于线粒体cox1基因的外显子1的3’端的接点处。每个编辑质粒含有编码指导rna的指导rna表达盒,该指导rna引导至四个cox1靶位点中的一个或两个。每个指导rna的可变靶向结构域不含有上文列出的3核苷酸pam序列。按照fox实验室开发的方案进行酵母线粒体转化(fox等人,1988procnatlacadsciusa85:7288-7292;bonnefoy和fox2001methodsenzymol350:97-111)。先前已经显示,衍生自pbr322的质粒能够在酵母线粒体中复制(fox等人,1988)。使用衍生自pbr322的一种质粒phd6,并且该质粒过去已经成功地转化到酵母线粒体中(green-willms等人,2001jbiolchem276:6392-6397)。除了cox3基因的基因组片段外,通过用psti和hindiii消化的phd6的所有克隆片段都被删除,剩下pbr322主链来产生我们的构建体。cox3片段(0.75kbpaci-mboi)以其挽救cox3缺失突变体cox3-10的能力被用作线粒体转化体的筛选标记,如fox等人,1988中所述。编辑质粒构建体在pbr322主链中含有以下元件:cas9表达盒、指导rna表达盒,以及在dna替换实验的情况下的供体dna。cas9表达盒具有针对在酵母线粒体中的表达而优化的cas9编码序列(seqidno:120)。作为密码子优化的一部分,将在酵母线粒体中根本不使用或很少使用的cas9密码子替换为经常使用的密码子。同样,许多色氨酸密码子被tga替换,tga是通用密码子表中的终止密码子,但在酵母线粒体中被翻译成色氨酸(fox1979procnatlacadsciusa76:6534-6538)。这被设计用于在微粒dna转化后防止cas9在核中表达。用具有5’utr的最小启动子和cox2基因的终止子合成具有优化的cas9orf的表达盒;这些调控元件分别以psti和hindiii位点(seqidno:121和seqidno:122)为侧翼。选择长度分别为71bp和119bp的最小启动子和终止子(mireau等人,2003molgengenomics270:1-8),目的是抑制该位点的同源重组,并避免整合进入线粒体基因组。在hindiii端包含几个独特的限制位点(xbai、noti和ncoi位点),以方便克隆另外的元件。此类元件之一是指导rna表达盒。通过将每个靶向序列与tracrrna序列(seqidno:123)融合来产生靶向上述cox1序列的指导rna。每个指导rna表达盒均编码一个或两个指导rna,其被引导至四个cox1靶位点中的相应的一个或两个。指导rna表达盒以5’至3’方向含有以下元件:最小cox3启动子(seqidno:124);trna基因tf(gaa)(seqidno:125);被引导至cox1位点的单指导rna;第二trna基因tw(uca)(seqidno:126);和最小cox3终止子元件(seqidno:127)。通过将被引导至cox1位点1和位点2的指导rna,以及被引导至位点3和位点4的指导rna结合在一起产生具有两个指导rna的构建体。当存在两个指导rna编码序列时,第二个指导rna直接融合在tw(uca)序列之后,并且侧翼为在3’端处并在cox3终止子之前的第三trna基因tm(cau)(seqidno:128)。合成具有启动子和终止子元件的指导rna表达盒,其在5’端有noti位点并且在3’端有ncoi位点,以允许定向克隆到携带cas9表达盒的pbr322主链中。对于dna替换实验,合成携带gfp基因的供体dna,并将其克隆到编码两个指导rna的构建体的ncoi位点中。编码gfp的核苷酸序列(seqidno:129)对于在酵母线粒体中表达是密码子优化的,如对cas9所做的那样(参见上文)。将色氨酸的几个密码子更改为tga,以确保gfp仅在线粒体中表达。同样,将gfp编码区设计为与dna替换后的cox1基因在同一框内。gfporf的两端在cas9切割位点的外部接点处与cox1基因组序列融合。hr1-hr4对应于编辑质粒的构建中所使用的四个短同源性区域;它们各自紧邻相应的指导rna靶位点。选择每一端的同源区域的长度为相对短,以尽可能减少在没有cas9切割的情况下的内源同源重组,即与#1指导rna位点相邻的144bp(hr1;seqidno:130)、与#2指导rna位点相邻的115bp(hr2;seqidno:131)、与#3指导rna位点相邻的64bp(hr3;seqidno:132)和与#4指导rna位点相邻的93bp(hr4;seqidno:133)。该设计会促进由cas9活性而非一般同源重组诱导的dna替换。另外,编辑质粒会保持自主而不整合到基因组中。此外,在供体dna内的指导rna识别位点处包括序列变化,使得替换后的线粒体dna将不再被指导rna/cas9复合物识别。这样做是为了防止从经基因编辑的线粒体基因组中删除替换的dna。第一靶位点的变体在seqidno:134下列出,其中指导rna识别位点中的20个核苷酸中的7个已被改变。通过删除识别位点5’端的16个核苷酸来产生第二位点的变体(seqidno:135)。通过删除最后五个核苷酸来修饰第三靶位点(seqidno:136)。通过删除5’端的14个核苷酸来修饰第四靶位点(seqidno:137)。表1列出了为此实验制备的构建体。表1用于酵母线粒体的编辑质粒的组分构建体表达盒1*表达盒2**供体dnahs1cas9mtf:sgrna-3:twn/ahs2cas9mtf:sgrna-4:twn/ahs3cas9mtf:sgrna-3:tw:sgrna-4:tmn/ahs4cas9mtf:sgrna-3:tw:sgrna-4:tmhr3:gfpm:hr4hs5cas9mtf:sgrna-3:tw:sgrna-4:tmhr3:gfpm:hr4***hs6n/atf:sgrna-2:tw:sgrna-1:tmhr1:gfpm:hr2hs7n/atf:sgrna-3:tw:sgrna-4:tmhr3:gfpm:hr4hs8cas9mtf:sgrna-2:tw:sgrna-1:tmhr1:gfpm:hr2hs9cas9mtf:sgrna-2:tw:sgrna-1:tmn/ahs10cas9mtf:sgrna-1:twn/ahs11cas9mtf:sgrna-2:twn/a*每个表达盒1均具有带有5’utr的cox2启动子和cox2终止子。**每个表达盒2均具有cox3启动子和cox3终止子。***供体dna相对于构建体hs4反向定向。使用bonnefoy和fox,2001中所述的生物弹射微弹方法,将产生的构建体转化到缺少线粒体dna(rho0)的酵母品系mcc109rho0(matαade2ura3kar1)中。与作为载体质粒的具有ura3选择标记的pyes2一起进行转化,使得ura+核转化体可以在补充物中缺乏尿嘧啶的基本培养基上被首先选择。为了识别线粒体转化体,测定了ura+集落通过与mcc125(matalys2rho+cox3-10)杂交来挽救cox3缺失突变体的能力。将该测定法重复至少两次以获得线粒体中具有编辑质粒的干净集落。然后将含有编辑质粒的分离的品系与含有野生型线粒体基因组的品系cuy563(mataura3ade2leu2ade3rho+)和nb80(matalys2arg8ura3leu2rho+)杂交,以分析cas9在靶位点处的基因组编辑作用。在经历双链断裂的核染色体中,可能会预期在靶位点处有高频的突变,诸如小缺失或插入。它们是由指导rna依赖性cas9活性触发的dna切割的位点处的非同源末端连接(nhej)修复的结果。在酵母中,染色体中双链断裂的修复的90%通过同源重组发生(ricchetti等人,1999nature402:96-100)。在一个细胞器中存在多个拷贝的线粒体dna的线粒体中,预期通过同源重组对dsdna断裂的修复会比在核中明显更加频繁。在此情况下,在线粒体中由dna末端重新连接引起的插入缺失突变的频率预期会极低。出于这一考虑,我们专注于检测由通过同源重组进行的修复导致的事件,即用人工供体dna替换。为了测定通过cas9诱导的切割进行的dna替换,如上所述地将构建体hs8及其对照构建体hs6各自转化到缺乏线粒体dna的菌株中。每种构建体都携带具有gfp的供体dna以及两个相应的指导rna基因(#1和#2),但是hs6缺少cas9表达盒。通过随后筛选其挽救cox3缺失突变体的能力来识别含有每种构建体的品系。然后将分离的线粒体转化体与携带野生型线粒体基因组的菌株cuy563和nb80杂交,以观察编辑质粒对线粒体基因组dna的影响。在杂交后两天,通过对合并的细胞进行pcr扩增来分析切割位点处的dna替换事件。使用引物组,其中一个引物来自切割位点附近的线粒体基因组区域,而另一个引物来自供体dna区域,如此选择使得只能从线粒体基因组中正确替换的dna扩增出所需的pcr产物,而无法从野生型线粒体dna和编辑质粒中扩增出所需的pcr产物。使用了以下四个引物对:用于5’端接点的引物c和引物12;用于3’端接点的引物d和引物11、引物e和引物11以及引物f和引物11。引物c、d、e和f对于cox1基因的基因组区域是特异性的(分别为seqidno:138、139、140和141)。引物11和引物12对gfp基因是特异性的(分别为seqidno:142和143)。pcr扩增按以下步骤进行:步骤1:94℃持续7分钟,步骤2:94℃持续30秒,步骤3:52℃持续30秒,步骤4:60℃持续1分钟30秒,步骤5:步骤2进行39次,步骤6:60℃持续10分钟。选择延伸反应的低温以适应富含at的基因组序列。pcr扩增后,通过使用上述四个不同的引物对,我们观察到了来自替换的dna的两端的预期大小的dna片段。在与携带对照构建体的品系杂交的细胞样品中,没有扩增出相应的dna片段。将扩增的dna片段直接测序。图1显示了从通过编辑质粒方法修饰的经转化酵母线粒体dna中的替换dna基因座的pcr扩增获得的序列。在5’和3’端的下划线序列指示编辑质粒上不存在的野生型线粒体基因组序列。粗体的序列指示供体dna中存在的并与相应的指导rna靶位点相邻的短同源区域。带有双下划线的序列指示供体dna中存在的修饰的指导rna靶位点;改变的核苷酸以粗体显示。替换的dna中的指导rna靶位点已被修饰,以防止整合到线粒体基因组中后的核酸酶活性。密码子优化的gfp编码区以斜体显示。小写字母表示的序列对应于用于扩增替换的dna基因座的引物c和引物f。同源重组按预期发生;即替换的dna和周围的野生型线粒体dna均无序列变化。覆盖替换区域的序列(seqidno:144;图1)与构建体完全匹配。图1中也示出了在5’和3’端的序列(以下划线显示),其是编辑质粒上不存在的野生型线粒体基因组序列,与编辑质粒中存在的hr区域(以粗体显示)连续。总之,通过使用编码cas9表达盒、多个指导rna表达盒和供体dna模板的编辑质粒,在酵母线粒体中观察到dna替换。此外,从携带编辑质粒的hs8品系与野生型菌株nb80之间的杂交中分离出单集落。当通过荧光显微镜观察时,从一部分集落确认了gfp信号。为了显示编辑质粒在线粒体中的自主复制性质,我们尝试在上述杂交后从细胞中挽救质粒。每次杂交后取样1ml过夜细胞培养物,并进行总dna分离。将通过使用quick-dnaminiprepplus试剂盒(zymoresearch)获得的200ng总dna用apai和sphi消化,以切割总dna部分中的pyes2质粒dna;hs8质粒由于不具有这些限制位点,应该会保持完整。在65℃将限制酶灭活20min后,该dna被用于转化大肠杆菌细胞。识别了在含有羧苄青霉素的lb介质上生长的多个集落。分离dna,用几种限制酶消化,并通过凝胶电泳分离消化产物。从两个独立的杂交中识别出许多质粒,其展示出与原始hs8构建体相同的消化模式,表明原始编辑质粒hs8的挽救是成功的。这表明在野生型线粒体dna的存在下,编辑质粒作为自主复制dna保留,而没有整合到细胞器基因组中。实施例21通过编辑质粒方法对莱茵衣藻叶绿体dna的遗传修饰指导rna靶位点选自莱茵衣藻叶绿体基因组的基因区域。使用的参考序列是来自ncbi的竞争叶绿体基因组序列(登录号:nc_005353,版本号:nc_005353.1)。靶基因是psaa。先前已经显示该基因的突变体具有光合作用缺陷的表型(redding等人,1999,jbiol.chem.274:10466–10473)。为了帮助设计和选择指导rna靶位点,使用了基于网络的生物信息学程序——crispor(http://crispor.tefor.net/,haeussler等人,2016genomebiology17:148-159)。选择以下序列作为指导rna靶向位点,用于编辑psaa基因中的外显子3。当靶向序列在基因序列的反向互补序列上时,指示术语“反向”。对于下面列出的每个23个核苷酸的靶位点,前20个核苷酸是每个相应的指导rna中存在的靶向序列,而最后3个核苷酸是pam序列。1.ggtttaaaccctgttactggtgg(seqidno:145)2.cttcacctgtaaatggaccacgg(seqidno:146)(反向)3.tttacaggtgaaggtcacgttgg(seqidno:147)4.gtagctaaataagggtatggagg(seqidno:148)(反向)图2显示了从通过用编辑质粒方法修饰的经转化衣藻质体dna中的替换dna基因座的pcr扩增获得的序列。在5’和3’端的下划线序列指示编辑质粒上不存在的野生型叶绿体基因组序列。粗体的序列指示编辑质粒上的供体dna中存在的短同源区域。粗体并且带下划线的序列指示替换的dna中存在的指导rna靶位点。供体dna中的指导rna靶位点已被修饰,以防止整合到质体基因组中后的核酸酶活性。带有双下划线的序列指示在指导rna位点3’侧的沉默突变,用以防止通过cas9/sgrna再次切割。密码子优化的gfp编码区以斜体显示。同源重组按预期发生;即替换的dna和周围的野生型质体dna均无序列变化。衣藻叶绿体的编辑质粒的构建如下。将编码cas9和指导rna的多核苷酸克隆到载体中,并可操作地连接至适当的启动子和终止子,以允许在叶绿体中表达。载体是pbr322或puc19,其各自含有先前已显示在叶绿体中复制的pmb1复制起点(boynton等人,1988science240:1534-1538)。编码spcas9(seqidno:150)的核酸序列(seqidno:149)对于衣藻叶绿体表达是密码子优化的。使用基于网络的密码子使用数据库(nakamura等人,2000nucleicacidsres.28:292)进行优化。优化的基因通过genscript(piscataway,nj)合成。用于cas9基因表达的启动子是具有其5’utr的衣藻psaa-外显子1启动子或具有其5’utr的衣藻psbd启动子(分别为seqidno:151和seqidno:152)。用于cas9基因表达的终止子是rbcl3’utr(seqidno:153)。为了sgrna的表达,从衣藻质体trnw基因基因座获得了trna启动子及其相应的3’utr(分别为seqidno:154和seqidno:155)。为了在转录后对sgrna进行适当加工,如xie等人,2015(procnatlacadsciusa112:3570–3575)中所述,使用内源性叶绿体trna加工系统。例如,为了一种指导rna的表达,将sgrna序列置于两个trna之间。构型为“trna-1–sgrna–trna-2”。为了表达两个sgrna,构型为“trna-1–sgrna-1–trna-2–sgrna-2–trna-3”。使用了来自衣藻质体dna的以下trna序列:trnw(seqidno:156)、trnk(seqidno:157)和trnl(seqidno:158)。在所有编辑质粒构建体上也存在用于提供奇霉素耐受性的针对aada编码区(seqidno:159)的选择标记表达盒。用于选择标记表达盒的启动子和终止子分别是具有其5’utr的衣藻rbcl启动子(seqidno:160)和衣藻psba3’utr(seqidno:161)。构建仅携带cas9表达盒和选择标记表达盒的质粒以用作对照。为了dna替换实验,设计了由被同源重组区域包围的gfp编码区组成的供体dna。根据franklin等人,2002(plantj30:733-744)的方法,将gfp编码序列(seqidno:162)设计成对于衣藻叶绿体基因表达是密码子优化的。为了在通过cas9/双sgrna产生双链断裂后进行供体dna的同源重组,我们从衣藻叶绿体基因psaa-exon3中的grna靶位点选择了各自74bp或76bp的同源区域(hr1-hr4;seqidno:163–seqidno:166)。选择较短的每个同源序列的长度(74或76bp),以尽可能减少在没有通过cas9/指导rna介导的双链断裂的情况下发生的内源同源重组(dauvillee等人,2004photosynthesisresearch79:219–224)。供体dna及其组分的构型是“1sthr–gfp–2ndhr”。gfp序列衍生自franklin等人,2002(plantj.30:733-744)。为了保护供体dna免受cas9进一步切割并促进基因组清扫过程,同源重组序列在靶位点还含有阻止cas9和指导rna切割的沉默突变。设计同源重组以提供gfp与psaa基因产物的框内融合体。用于dna替代实验的编辑质粒中的组分包括供体dna以及前一节中所述的cas9、双sgrna和选择标记表达盒。同样,使用了与前一节相同的载体主链。作为阴性对照,使用缺少cas9表达盒的质粒。表2和表3列出了本节所述的构建体的组分。表2用于衣藻叶绿体的编辑质粒的组分构建体表达盒1*表达盒2**供体dnayp5ppsaa:cas9con/an/ayp7ppsaa:cas9co1x-sgrna-1n/ayp8ppsaa:cas9co1x-sgrna-2n/ayp9ppsaa:cas9co1x-sgrna-3n/ayp10ppsaa:cas9co1x-sgrna-4n/ayp11ppsaa:cas9co2x-sgrna-1n/ayp12ppsaa:cas9co2x-sgrna-2n/ayp13ppsaa:cas9co2x-sgrna-1hr1:gfpco:hr2yp14ppsaa:cas9co2x-sgrna-2hr3:gfpco:hr4yp6ppsbd:cas9con/an/ayp15ppsbd:cas9co1x-sgrna-1n/ayp16ppsbd:cas9co1x-sgrna-2n/ayp17ppsbd:cas9co1x-sgrna-3n/ayp18ppsbd:cas9co1x-sgrna-4n/ayp19ppsbd:cas9co2x-sgrna-1n/ayp20ppsbd:cas9co2x-sgrna-2n/ayp21ppsbd:cas9co2x-sgrna-1hr1:gfpco:hr2yp22ppsbd:cas9co2x-sgrna-2hr3:gfpco:hr4yp23n/a2x-sgrna-1hr1:gfpco:hr2yp24n/a2x-sgrna-2hr3:gfpco:hr4yp25ppsaa:cas9co2x-sgrna-1hr1:gfpco:hr2yp26ppsaa:cas9co2x-sgrna-2hr3:gfpco:hr4yp27ppsbd:cas9co2x-sgrna-1hr1:gfpco:hr2yp28ppsbd:cas9co2x-sgrna-2hr3:gfpco:hr4yp29n/a2x-sgrna-1hr1:gfpco:hr2yp30n/a2x-sgrna-2hr3:gfpco:hr4yp31ppsaa:cas9co2x-sgrna-1n/ayp32ppsaa:cas9co2x-sgrna-2n/ayp33ppsbd:cas9co2x-sgrna-1n/ayp34ppsbd:cas9co2x-sgrna-2n/a*每个表达盒1均使用rbcl终止子。**每个表达盒2均编码一个(1x)或两个(2x)指导rna。表3编码一个或两个指导rna的表达盒2的组分*每个表达盒2均使用trnw启动子和trnw终止子。根据barrera等人,2014(methodsmol.biol.1132:391-399)和ramesh等人,2011(methodsmol.biol.684:313-320)的方法,将编辑质粒转化到野生型衣藻(cc-125)中。使用补充有100μg/ml奇霉素的tris-醋酸-磷酸盐(tap)介质来选择叶绿体转化体。为了评估dna替换事件,我们将含有供体dna的编辑质粒yp13转化到cc-125(野生型莱茵衣藻)中,并随机选择奇霉素耐受性集落。对照构建体是yp23。根据barrera等人,2014(methodsmol.biol.1132:391-399),使用合并的转化细胞系制备叶绿体dna。用于yp13的池大小为20个独立集落,用于yp23的池大小为16个独立集落。为了靶重组区域的pcr扩增,我们使用由叶绿体基因组区域特异性引物和gfp基因特异性引物组成的引物组。引物组1(ps1)被设计用于扩增gfp整合区域的5’端,而引物组2(ps2)被设计用于扩增3’端。1.ps1fwd引物gctggttggttccactaccac(seqidno:167)2.ps1rev引物caccttcaaattttacttcagcacgtg(seqidno:168)3.ps2fwd引物catacggtgtacaatgtttcagtcg(seqidno:169)4.ps2rev引物gtgagaaataatagcatcacggtgac(seqidno:170)设计引物组以避免野生型叶绿体基因组或编辑质粒的扩增。使用上述引物组,每个扩增子的预期大小如下:852bp用于引物组1和712bp用于引物组2。pcr扩增后,我们成功地从用yp13转化的衣藻细胞系的两个独立池中获得了预期大小的扩增子。从没有cas9表达盒的对照构建体yp23中没有扩增出相应的dna片段。我们对扩增的dna片段进行了测序,以通过cas9活性确认成功的dna替换。我们获得了在经转化衣藻叶绿体dna中包含供体dna基因座的序列(参见图2)(seqidno:171)。基因组序列对应于来自供体dna在两个cas9切割位点的插入的预期序列。如图2所示,替换的dna含有在供体dna中编码的psaa基因中的两个修饰的指导rna靶位点。另外,3-ntpam序列不再与每个靶序列相邻存在,对应于供体dna的确切序列。图2中也示出了在5’和3’端的序列(以下划线显示),其是编辑质粒上不存在的野生型叶绿体基因组序列,与编辑质粒中存在的hr区域(以粗体显示)连续。总之,通过使用编码cas9表达盒、多个指导rna表达盒和供体dna模板的编辑质粒,在衣藻叶绿体中观察到正如设计的dna替换。一旦cas9切割了叶绿体dna位点,dna修复应该能通过以下任何一项的存在来识别:核苷酸置换、小插入或小缺失。我们分析了用yp11和yp31编辑质粒构建体转化的奇霉素耐受性集落,用于证明此类dna修复。我们将没有cas9表达盒的构建体yp29包括在内作为对照。为了丰富编辑事件,我们利用了在cas9/grna切割位点之一(seqidno:146,cttcacctgtaaatggaccacgg)处avaii识别序列(ggwcc,其中w为a或t)的存在。首先,我们从随机选择的衣藻集落(来自yp11转化体有15个集落,来自yp31转化体有10个集落,来自yp29转化体有5个集落)中提取dna。然后,我们将提取的dna合并,以用于含有靶位点的基因组区域的基于高保真聚合酶的pcr扩增(newenglandbiolabs)(一个池含有来自五个集落的dna)。我们使用了以下引物:ps1fwd引物(seqidno:167)和ps2rev引物(seqidno:170)。将扩增的dna产物纯化,并进行avaii消化过夜。在凝胶电泳后,从琼脂糖凝胶切出含有795bp的未消化dna的对应于每个池的700–900bp的区域,并且提取dna。然后根据制造商的方案(newenglandbiolabs,ipswich,ma)将提取的dna直接克隆到pminit2.0载体中。我们随机地从yp11和yp31转化体的每个池中选择12个大肠杆菌集落,并从对照yp29池中选择8个集落,并使用相同的引物对——ps1fwd引物和ps2rev引物进行pcr扩增。将pcr反应的等分试样再次用avaii消化,以进一步选择用于dna修复事件的候选物。从yp11构建体的两个池各识别出一个,从一个yp31转化体池识别出一个,从另一个yp31转化体池识别出四个,并且从yp29转化体识别出三个,并对它们进行sanger测序,以推导每个候选克隆的核苷酸组成。另外,我们将从yp29对照池中随机选择的15个集落的pcr扩增子包括在内以用于测序。测序结果分析显示,分别来自不同池的两个yp11转化体和两个yp31转化体在靶位点处具有单核苷酸置换。相对于野生型序列ggacc,我们观察到以下两种类型的置换:g至a,产生gaacc;以及a至g,产生gggcc。在来自两个构建体yp11和yp31的转化体中检测到这两种变化中的每一种;然而,来自对照yp29转化体的测序克隆均未在靶位点处显示任何变化(即,每个对照转化体均保留avaii位点)。总而言之,我们已经显示,在指导rna靶位点发生了四个独立的核苷酸置换事件,与cas9切割和随后叶绿体中的dna修复一致。序列表<110>纳匹基因公司哈吉米·萨凯俞炳春小艾米·迈耶·奥罗斯科罗杰·怀斯加内什·基肖尔杰伊·基斯林纳伦德拉·辛格·亚达夫<120>使用多核苷酸指导的核酸内切酶的细胞器基因组修饰<130>51090-701.601<150>us62/548,723<151>2017-08-22<160>172<170>patentin版本3.5<210>1<211>4163<212>dna<213>人工序列<220><223>合成构建体<400>1aaaaaagaatggttctaccaagactatatacagctacaagtcgtgctgctctgtcgaccg60acaagaagtactccattgggctcgatatcggcacaaacagcgtcggctgggccgtcatta120cggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccaca180gcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagcca240cgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacc300tgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctgg360aggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaata420tcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagc480ttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatga540tcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcg600acaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatca660acgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggc720tcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatctta780tcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatg840ccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccaga900tcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgc960tgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatga1020tcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagc1080aactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggat1140acattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaa1200aaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaac1260agcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgcta1320tcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgaga1380aaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagat1440tcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcg1500tggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatc1560tgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttata1620acgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctg1680gagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtga1740aacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcg1800gagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcatta1860aagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctca1920cccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatc1980tcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggc2040tgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggatt2100ttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctc2160tcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacg2220agcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgtta2280aggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcg2340agatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatga2400agaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttg2460aaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggaca2520tgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatcatatcg2580tgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgata2640aaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaatt2700attggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgacta2760aggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttg2820ttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacacca2880agtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagc2940tggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattacc3000accatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatc3060ccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatga3120tcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaata3180ttatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccac3240ttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcga3300cagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacaga3360ccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcac3420gcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttaca3480gtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaagg3540aactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttc3600tcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtact3660ctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcaga3720aaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccact3780atgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaac3840acaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcc3900tcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagccca3960tcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctg4020cagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggagg4080tcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacc4140tctctcagctcggtggagactga4163<210>2<211>4145<212>dna<213>人工序列<220><223>合成构建体<400>2gatccatgaaaagcttcattacaaggaacaagacagccattgacaagaagtactccattg60ggctcgatatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgc120cgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctca180ttggcgccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacag240cacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagta300atgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtgg360aggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgt420accatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgata480aggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacact540tcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaac600tggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacg660ccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcac720agctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggc780tgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagca840aagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcag900acctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgag960tgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagc1020accaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtaca1080aggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaa1140gccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgagg1200agctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatg1260gaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagagg1320atttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcgga1380taccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgca1440aatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctg1500cccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgc1560ttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtca1620aatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagcta1680tcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagact1740atttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttca1800acgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctgg1860acaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaag1920atagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtca1980tgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatca2040atgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggat2100ttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggaca2160tccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttg2220caggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcg2280tcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaacc2340aaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggta2400taaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcaga2460atgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaac2520tggacatcaatcggctctccgactacgacgtggatcatatcgtgccccagtcttttctca2580aagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtg2640ataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctga2700acgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcc2760tgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatca2820ccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgaca2880aactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaa2940aggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcct3000acctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaat3060ttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcagg3120aaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaaga3180ccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggag3240aaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgt3300ccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaagg3360aaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggacc3420ccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggcca3480aagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaa3540tcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatata3600aagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaa3660acggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcac3720tgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggt3780ctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatg3840agatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcg3900ataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaa3960acattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcg4020acaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactga4080ttcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggag4140actga4145<210>3<211>342<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>3nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtggtgcgccttgttggcgcaatcggta120gcgcgtatgactcttaatcataaggttaggggttcgagcccccatcagggctccattctt180tttttttttaaaacacgatgacataaatttcctttgtatgaaccgtacccttaataataa240aaggaaaaatcatgctttaggtataagattttctgttatattaaaatttagtatttattt300ttattatgctattatttttttcggtctcaaatgttacttagt342<210>4<211>343<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>4nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtggtgcgccttgttagctcagttggta120gagcgttcggctcttaaccgaaatgtcaggggttcgagccccctatgaggcgccatttct180ttttttttttaaaacacgatgacataaatttcctttgtatgaaccgtacccttaataata240aaaggaaaaatcatgctttaggtataagattttctgttatattaaaatttagtatttatt300tttattatgctattatttttttcggtctcaaatgttacttagt343<210>5<211>342<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>5nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtggtgctccttgttggcgcaatcggta120gcgcgtatgactcttaatcataaggttaggggttcgagcccccatcagggctccattctt180tttttttttaaaacacgatgacataaatttcctttgtatgaaccgtacccttaataataa240aaggaaaaatcatgctttaggtataagattttctgttatattaaaatttagtatttattt300ttattatgctattatttttttcggtctcaaatgttacttagt342<210>6<211>343<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>6nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtggtgctccttgttagctcagttggta120gagcgttcggctcttaaccgaaatgtcaggggttcgagccccctatgaggcgccatttct180ttttttttttaaaacacgatgacataaatttcctttgtatgaaccgtacccttaataata240aaaggaaaaatcatgctttaggtataagattttctgttatattaaaatttagtatttatt300tttattatgctattatttttttcggtctcaaatgttacttagt343<210>7<211>358<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(39)..(58)<223>n为a、c、g或t<220><221>杂项特性<222>(138)..(140)<223>n为a、c、g或t<400>7gccttgttagctcagttggtagagcgttcggctcttaannnnnnnnnnnnnnnnnnnngt60tttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgg120caccgagtcggtggtgcnnnttaagcaaggataccgaaatgtcaggggttcgagccccct180atgaggatccattctttttttttttaaaacacgatgacataaatttcctttgtatgaacc240gtacccttaataataaaaggaaaaatcatgctttaggtataagattttctgttatattaa300aatttagtatttatttttattatgctattatttttttcggtctcaaatgttacttagt358<210>8<211>358<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(37)..(56)<223>n为a、c、g或t<220><221>杂项特性<222>(136)..(138)<223>n为a、c、g或t<400>8gccttgttggcgcaatcggtagcgcgtatgactcttnnnnnnnnnnnnnnnnnnnngttt60tagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggca120ccgagtcggtggtgcnnnttaagcaaggataaatcataaggttaggggttcgagccccca180tcagggctccattctttttttttttaaaacacgatgacataaatttcctttgtatgaacc240gtacccttaataataaaaggaaaaatcatgctttaggtataagattttctgttatattaa300aatttagtatttatttttattatgctattatttttttcggtctcaaatgttacttagt358<210>9<211>293<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>9nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtggtgcggggttcgagcccccatcagg120gctccattctttttttttttaaaacacgatgacataaatttcctttgtatgaaccgtacc180cttaataataaaaggaaaaatcatgctttaggtataagattttctgttatattaaaattt240agtatttatttttattatgctattatttttttcggtctcaaatgttacttagt293<210>10<211>76<212>dna<213>人工序列<220><223>合成构建体<400>10gccttgttggcgcaatcggtagcgcgtatgactcttaatcataattctttttttttttaa60aacacgatgacataaa76<210>11<211>136<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(18)..(37)<223>n为a、c、g或t<400>11gcgcaatcggtagcgcannnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaag60ttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgcgagc120cccctacagggctctt136<210>12<211>116<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(18)..(37)<223>n为a、c、g或t<400>12gcgcaatcggtagcgcannnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaag60ttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgc116<210>13<211>118<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>13nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtggtgcgagccccctacagggctct118<210>14<211>17<212>dna<213>酿酒酵母<400>14actgatagaagtgtagt17<210>15<211>20<212>dna<213>酿酒酵母<400>15atgattattgcaattccaac20<210>16<211>20<212>dna<213>酿酒酵母<400>16attccacgatacttactacg20<210>17<211>20<212>dna<213>酿酒酵母<400>17tcagcaacaccaaatcaaga20<210>18<211>79<212>dna<213>人工序列<220><223>合成构建体<400>18gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60ggcaccgagtcggtggtgc79<210>19<211>269<212>dna<213>酿酒酵母<400>19tctttgaaaagataatgtatgattatgctttcactcatatttatacagaaacttgatgtt60ttctttcgagtatatacaaggtgattacatgtacgtttgaagtacaactctagattttgt120agtgccctcttgggctagcggtaaaggtgcgcattttttcacaccctacaatgttctgtt180caaaagattttggtcaaacgctgtagaagtgaaagttggtgcgcatgtttcggcgttcga240aacttctccgcagtgaaagataaatgatc269<210>20<211>20<212>dna<213>酿酒酵母<400>20tttttttgttttttatgtct20<210>21<211>23<212>dna<213>酿酒酵母<400>21actaatcactcatcaggcgttga23<210>22<211>21<212>dna<213>酿酒酵母<400>22caatggcatccccttggacgc21<210>23<211>20<212>dna<213>酿酒酵母<400>23agttaccgtaggggaacctg20<210>24<211>4107<212>dna<213>人工序列<220><223>合成构建体<400>24atggacaagaagtactctattggtttagatatcggtacaaacagtgtcggttgggctgtc60attactgacgaatacaaggtgcctagtaaaaaattcaaagttttaggtaatactgatcgt120cacagtataaagaagaacttaattggtgctttattattcgactctggtgaaactgctgaa180gctactcgtttaaaaagaacagcacgtcgtagatatactcgtagaaagaatcgtatctgc240tacttacaggaaatctttagtaatgaaatggctaaggtggatgactctttcttccataga300ttagaagaatcttttttggtggaagaagataaaaagcacgaacgtcacccaatctttggt360aatatcgtggacgaagtggcttaccatgaaaagtacccaactatatatcatttaagaaag420aagttagtagacagtactgataaggctgacttgcgtttgatctatttagctttagctcat480atgatcaaatttcgtggacacttcttaatcgaaggtgacttaaacccagacaacagtgat540gtcgacaaattatttatccaattagttcagacttacaatcagttattcgaagaaaaccct600atcaacgcatctggagttgacgctaaagcaatcttaagtgctagattatctaaatctcgt660cgtttagaaaacttaatcgcacagttacctggtgaaaagaagaacggtttatttggtaat720ttaatcgctttatcattaggtttaactcctaactttaaatctaacttcgacttagctgaa780gatgctaagttacaattaagtaaagacacttacgatgatgatttagacaatttattagct840cagatcggtgaccagtacgcagacttatttttggctgcaaagaacttatcagacgctatt900ttattaagtgatattttacgagtgaacactgaaatcactaaagctcctttaagtgctagt960atgatcaagcgttatgatgaacaccaccaagacttgactttgttaaaggctttagtcaga1020cagcaattacctgaaaagtacaaggaaattttcttcgatcagtctaaaaatggttacgct1080ggatacattgacggtggagcaagtcaggaagaattttacaaatttattaagcctatcttg1140gaaaaaatggacggtactgaagaattattagtaaagttaaacagagaagatttattgcgt1200aaacagcgtactttcgacaatggaagtatccctcaccagattcacttaggtgaattacac1260gctatcttaagacgtcaagaagatttctacccttttttgaaagataacagagaaaagatt1320gaaaaaatcttaacatttcgtataccttactatgtaggtcctttagctcgtggaaattct1380agattcgcttggatgactcgtaaatcagaagaaactatcactccttggaacttcgaagaa1440gtcgtggataagggtgcttctgctcagtctttcatcgaaagaatgactaactttgataaa1500aatttacctaacgaaaaggtgttacctaaacactctttattatacgaatacttcacagtt1560tataacgaattaactaaggtcaaatacgtcacagaaggtatgagaaagccagcattctta1620tctggagaacagaagaaagctatcgtggacttattattcaagactaaccgtaaagttact1680gtgaaacagttaaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatc1740agtggagtggaagatcgtttcaacgcatctttaggaacttatcacgatttattaaaaatc1800attaaagacaaggacttcttagacaatgaagaaaacgaagacattttagaagacattgtc1860ttaactttaactttgtttgaagatagagaaatgattgaagaacgtttgaaaacttacgct1920catttattcgacgacaaagtcatgaaacagttaaagagacgtcgatatacaggatggggt1980cgtttatcaagaaaattaatcaatggtatccgagacaagcagagtggaaagacaatctta2040gattttttaaagtctgatggatttgctaaccgtaacttcatgcagttgatccatgatgac2100tctttaacttttaaggaagacatccagaaagcacaagtttctggtcagggtgacagttta2160cacgaacacatcgctaatttagcaggtagtccagctatcaaaaagggaatattacagact2220gttaaggtcgtggatgaattagtcaaagtaatgggaagacataagcctgaaaatatcgtt2280atcgaaatggctcgagaaaaccaaactactcagaagggacagaagaacagtagagaaaga2340atgaagagaattgaagaaggtataaaagaattaggttctcaaatcttaaaggaacaccca2400gttgaaaacactcagttacagaatgaaaagttatacttatactacttacagaacggtaga2460gacatgtacgtggatcaggaattagacatcaatcgtttatctgactacgacgtggatcat2520atcgtgcctcagtcttttttaaaagatgattctattgataataaagtgttgacaagatct2580gataaaaatagaggtaagagtgataacgtcccttcagaagaagttgtcaagaaaatgaaa2640aattattggcgtcagttattaaacgctaaattaatcacacaacgtaagttcgataattta2700actaaggctgaacgaggtggtttatctgaattggataaagctggtttcatcaaaagacag2760ttagttgaaacacgtcagatcactaagcacgtggctcaaattttagattcacgtatgaac2820actaagtacgatgaaaatgacaaattaattcgagaagtgaaagttattactttaaagtct2880aagttagtctcagatttcagaaaggactttcagttttataaggtgagagaaatcaacaat2940taccaccatgctcatgatgcttacttaaatgcagtggtaggtactgcattaatcaaaaaa3000tatcctaagttagaatctgaatttgtttacggagactataaagtgtacgatgttagaaaa3060atgatcgcaaagtctgaacaggaaataggtaaggctactgctaagtacttcttttacagt3120aatattatgaattttttcaagactgaaattacattagctaatggagaaattcgtaagcga3180ccattaatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagagatttc3240gctacagtccgtaaggtcttatctatgcctcaggtgaacatcgttaaaaagactgaagta3300cagactggaggtttctctaaggaaagtatcttacctaaaagaaacagtgacaagttaatc3360gcacgtaaaaaagattgggaccctaagaaatacggtggattcgattctcctacagtcgct3420tacagtgtattagttgtggctaaagtggaaaaaggtaagtctaaaaaattaaaaagtgtc3480aaggaattattaggtatcacaatcatggaacgatcaagtttcgaaaaaaaccctatcgac3540tttttagaagctaaaggatataaagaagtcaaaaaagacttaatcattaagttacctaag3600tactctttatttgaattagaaaacggtcgtaaacgaatgttagctagtgctggtgaatta3660cagaaaggtaacgaattagcattaccttctaaatacgttaatttcttgtatttagctagt3720cactatgaaaagttaaaaggttctcctgaagataatgaacagaagcagttattcgtggaa3780caacacaaacactacttagatgaaatcatcgaacaaataagtgaattctctaaaagagtg3840atcttagctgacgctaacttagataaggtgttatctgcttacaataagcacagagataag3900cctatcagagaacaggcagaaaacattatccacttgtttactttaactaacttgggtgct3960cctgcagctttcaagtacttcgacactactatagacagaaagcgttacacttctacaaag4020gaagtcttagacgctacattaattcatcagtcaattactggtttatatgaaacaagaatc4080gacttatctcagttaggtggagactaa4107<210>25<211>1037<212>dna<213>酿酒酵母<400>25tttatatatattaaaataatattaataaataattactcctcctagcaggattcacatctc60cttcggccggactccttcggggtccgccccgcgggggcgggccggactattttattatta120ttaaatagatgttcattaaataattataaatataatttatcttttaaatatatatatata180atataatatttaaatatatattataaataaataaataaataattaattaataaaaacata240taatgtatatttatctataaaaaatattaattaaattaatatattattacagttccgggg300gccggccacgggagccggaaccccgaaggagataaataaataaataaatataaataattc360ttcttctttaaaattaaataaaataaaataaaaaggggggcggactccttcggggtcccg420cccccctccgcggggcggactattttatttttaaatatatattatattaataatataaat480ataagtccccgccccggcggggaccccgaaggagtataaataaaaattaataatatatta540tatatatattatattaataataataataataataataataataaataataactccttgct600tcatacctttataaataaggtaatcactaatatattataataataaaaattatatatatt660atatataatctaaatattatatattttaataaatattaatatatatgatatgaatattat720tagtttttgggaagcgggaatcccgtaaggagtgagggacccctccctaacgggaggagg780accgaaggagttttagtatttttttttttttaataaaatatatatttatatgattaataa840tattatatatattatttataaaaataatatataattttaattatttttaataaaaaaagg900tggggttgataatataatataatattttttattttaatttataatatataataataaatt960ataaataaattttaattaaaagtagtattaacatattataaatagacaaaagagtctaaa1020ggttaagatttattaaa1037<210>26<211>619<212>dna<213>酿酒酵母<400>26ttaatatttacttattattaatatttttaattattaaaaataataataataataataatt60ataataatattcttaaatataataaagatatagatttatattctattcaatcaccttata120ttaaaaatataaatattattaaaagaggttatcatacttctttaaataataaattaatta180ttgttcaaaaagataataaaaataataataagaataatttagaaatagataatttttata240aatgattagtaggatttacagatggagatggtagtttttatattaaattaaatgataaaa300aatatttaagatttttttatggttttagaatacatattgatgataaagcatgtttagaaa360agattagaaatatattaaatataccttctaattttgaagaactacttaaaacaattatat420tagtaaattcacaaaagaaatggttatattctaatattgtaactatttttgataagtatc480cttgtttaacaattaaatattatagttattataaatgaaaaatagctataattaataatt540taaatggtatatcttataataataaagatttattaaatattaaaaatacaattaataatt600atgaagtataatatccata619<210>27<211>23<212>dna<213>酿酒酵母<400>27gaggaaatgttgagtcgacatcg23<210>28<211>1000<212>dna<213>酿酒酵母<400>28taataaatatttataaaaagaataatttatatttataatatataatttatatattttatt60tttattatacaattaatataaaatataaaatattaaatattaaatattaaatattaaata120ttaaatattaatttttataggggttatataataattatatttataattatataatattaa180aaagggtatttttataattattacatttttattttatttataaaaatattaattttaata240agtattgaatactttatataatataaatattaattacataattaataattaaataatatt300taataatattatttaaatttattatttataattatttatttataaaattctatttttatt360attattatttttattttattattaaagattaatataataattattaatatattaaaaatc420ttttattatattaatatttataaaaaagtatttaataaaaaagatgtataaatttataaa480ttatataatattattaatttatataataataatattataactttgtgattgtcaatttag540ttaatcattgttattaataaaggaaagatataaaaaatattctccttcttaaaaaggggt600tcggttcccccccgtaaggggggggtccctcactcctttggtcggactccttcggggtcc660gccccgcgggggcgggccggactaatttaacttttaatattaatattaatattatttata720tttttaatatataaaaataaataattttatttttattaatagtatattatataaacaata780aaatagtattaattatataaaatttatataaaatatatataaatttattatatatatata840tattaatattttaataaagtttttattataaatttatttatttatttattataatattaa900taatttatttattattatataagtaataaataatagttttatataataataataatatat960atatatatatattattatattagttatataataaggaaaa1000<210>29<211>531<212>dna<213>酿酒酵母<400>29taaatattaatctaaatattaatataaatattaatattaatagttccggggcccggccac60gggagccggaaccccgaaaggagaaatattaatataaatataaatattaatataaatata120aatataaatataaatatattttaatataatataatataatatataatatattatataaat180ataatatataaataatataataaaatattttaatatatatataatataatataattatta240ttataatttaatataaattattattataatttaatataataaataaataaataattataa300ttataattataattataatctcaatatataaatgataaattattataaatacaaaggaaa360taattgatttttaaaatatatttaataaaatatataatataaattatactttttttgtta420ttatataataattatattaatatatttaatagaattaaactccttcggccggactattat480tcattttatatattaatgataaatcattaattattattaataaatttattt531<210>30<211>30<212>dna<213>酿酒酵母<400>30tgtcccattaagacataaggtacttctaca30<210>31<211>36<212>dna<213>酿酒酵母<400>31tggagcaggtatctcaacaattggtttattaggagc36<210>32<211>32<212>prt<213>智人<400>32metphepheseralaalaleuargalaargalaalaglyleuthrala151015histrpglyarghisvalargasnleuhislysthrvalmetglnasn202530<210>33<211>4200<212>dna<213>人工序列<220><223>合成构建体<400>33atgttcttctccgcggcgctccgggcccgggcggctggcctcaccgcccactggggaaga60catgtaaggaatttgcataagacagttatgcaaaatgacaagaagtactccattgggctc120gatatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgccgagc180aaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggc240gccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacagcacgg300cgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgag360atggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggag420gataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccat480gaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggct540gacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctc600atcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggtt660cagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaa720gcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctc780cctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacc840cccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagac900acctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctt960tttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaac1020acggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccac1080caagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaa1140attttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccag1200gaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctg1260ctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagc1320atcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttc1380tacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccc1440tactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatca1500gaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccag1560tccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcct1620aaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatac1680gtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtg1740gacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttc1800aaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgca1860tccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaat1920gaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagg1980gagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaa2040cagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatggg2100atccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgcc2160aaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccag2220aaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggt2280agcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaa2340gtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaact2400acccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaa2460gaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgag2520aagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggac2580atcaatcggctctccgactacgacgtggatcatatcgtgccccagtcttttctcaaagat2640gattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataac2700gtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgcc2760aaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtct2820gagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaag2880cacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactg2940attcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggac3000tttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctg3060aatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtt3120tacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaata3180ggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgag3240attacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaaca3300ggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatg3360ccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagt3420atcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaag3480aaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtg3540gagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatg3600gagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagag3660gtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggc3720cggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccc3780tctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctccc3840gaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatc3900atcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataag3960gtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacatt4020atccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacacc4080accatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcat4140cagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagactga4200<210>34<211>25<212>prt<213>智人<400>34metalaleuleuthralaalaalaargleuleuglythrlysasnala151015sercysleuvalleualaalaarghis2025<210>35<211>4227<212>dna<213>人工序列<220><223>合成构建体<400>35atggctttacttactgcggccgcccggctcttgggaaccaagaatgcatcttgtcttgtt60cttgcagcccggcatatggctttacttactgcggccgcccggctcttgggaaccaagaat120gcagacaagaagtactccattgggctcgatatcggcacaaacagcgtcggctgggccgtc180attacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgc240cacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaa300gccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgc360tacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccatagg420ctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggc480aatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaag540aagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcat600atgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgat660gtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccg720atcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccgg780cggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaat840cttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaa900gatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcc960cagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccatt1020ctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagt1080atgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcaga1140cagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgcc1200ggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttg1260gaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgc1320aaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcac1380gctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagatt1440gagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattcc1500agattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaa1560gtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaa1620aatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtt1680tataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctg1740tctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttacc1800gtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatc1860agcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatc1920attaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtc1980ctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgct2040catctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatggggg2100cggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctg2160gattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgac2220tctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtctt2280cacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagacc2340gttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgtt2400atcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaagg2460atgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacaccca2520gttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagg2580gacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatcat2640atcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatcc2700gataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaa2760aattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctg2820actaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcag2880cttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaac2940accaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtct3000aagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaat3060taccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaa3120tatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaa3180atgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagc3240aatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcga3300ccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttc3360gcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagta3420cagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatc3480gcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgct3540tacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtc3600aaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgac3660tttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaag3720tactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctg3780cagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagc3840cactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaa3900caacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtg3960atcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataag4020cccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcg4080cctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaag4140gaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatc4200gacctctctcagctcggtggagactga4227<210>36<211>120<212>dna<213>智人<400>36gcctacggccataccaccctgaacgcgcccgatctcgtctgatctcggaagctaagcagg60gtcgggcctggttagtacttggatgggagaccacctgggaataccgggtgctgtaggctt120<210>37<211>22<212>dna<213>智人<400>37gtctggtgagtagtgcatggct22<210>38<211>460<212>dna<213>智人<400>38agccccgcggccccgggctggcggtgtcggctgcaatccggcgggcacggccgggccggg60ctgggctcttggggcagccaggcgcctccttcagcgcctacggccataccaccctgaacg120cgcccgatctcgtctgatctcggaagctaagcagggtcgggcctggttagtacttggatg180ggagaccacctgggaataccgggtgctgtaggctttttctttggctttttgctgtttctt240tccttttcttccagacggagtctcgccctctcgcccaggctggagtgcggtggcgccatc300tcggctcactgcaagctccgcctcccgggtccacgccattccccggcctcagcctcccga360gtagctgggcctacaggcgcccgccaccacgcccggccactttgttctatttttcctaga420gacgggctttcaccctgttagccgggatggtctggagctc460<210>39<211>20<212>dna<213>小家鼠<400>39gatgtcctgatccaacatcg20<210>40<211>432<212>dna<213>小家鼠<400>40tttcggttggggtgacctcggagaataaaaaatcctccgaatgattataacctagactta60caagtcaaagtaaaatcaacatatcttattgacccagatatattttgatcaacggaccaa120gttaccctagggataacagcgcaatcctatttaagagttcatatcgacaattagggttta180cgacctcgacgttggatcaggacatcccaatggtgtagaagctattaatggttcgtttgt240tcaacgattaaagtcctacgtgatctgagttcagaccggagcaatccaggtcggtttcta300tctatttacgatttctcccagtacgaaaggacaagagaaatagagccaccttacaaataa360gcgctctcaacttaatttatgaataaaatctaaataaaatatatacgtacaccctctaac420ctagagaaggtt432<210>41<211>4296<212>dna<213>人工序列<220><223>合成构建体<400>41atggataagaagtactctatcggacttgacatcggaaccaactctgttggatgggctgtt60atcaccgatgagtacaaggttccatctaagaagttcaaggttcttggaaacaccgataga120cactctatcaagaagaaccttatcggtgctcttcttttcgattctggagagaccgctgag180gctaccagattgaagagaaccgctagaagaagatacaccagaagaaagaacagaatctgc240taccttcaggaaatcttctctaacgagatggctaaggttgatgattctttcttccacaga300cttgaggagtctttccttgttgaggaggataagaagcacgagagacacccaatcttcgga360aacatcgttgatgaggttgcttaccacgagaagtacccaaccatctaccaccttagaaag420aagttggttgattctaccgataaggctgatcttagacttatctaccttgctcttgctcac480atgatcaagttcagaggacacttccttatcgagggagaccttaacccagataactctgat540gttgataagttgttcatccagcttgttcagacctacaaccagcttttcgaggagaaccca600atcaacgcttctggagttgatgctaaggctatcctttctgctagactttctaagtctcgt660agacttgagaaccttatcgctcagcttccaggagagaagaagaacggacttttcggaaac720cttatcgctctttctcttggacttaccccaaacttcaagtctaacttcgatcttgctgag780gatgctaagttgcagctttctaaggatacctacgatgatgatcttgataaccttcttgct840cagatcggagatcagtacgctgatcttttccttgctgctaagaacctttctgatgctatc900cttctttctgacatccttagagttaacaccgagatcaccaaggctccactttctgcttct960atgatcaagagatacgatgagcaccaccaggatcttacccttttgaaggctcttgttaga1020cagcagcttccagagaagtacaaggaaatcttcttcgatcagtctaagaacggatacgct1080ggatacatcgatggaggagcttctcaggaggagttctacaagttcatcaagccaatcctt1140gagaagatggatggaaccgaggagcttcttgttaagttgaacagagaggatcttcttaga1200aagcagagaaccttcgataacggatctatcccacaccagatccaccttggagagcttcac1260gctatccttcgtagacaggaggatttctacccattcttgaaggataacagagagaagatc1320gagaagatccttaccttcagaatcccatactacgttggaccacttgctagaggaaactct1380cgtttcgcttggatgaccagaaagtctgaggagaccatcaccccttggaacttcgaggag1440gtaagtttctgcttctacctttgatatatatataataattatcattaattagtagtaata1500taatatttcaaatatttttttcaaaataaaagaatgtagtatatagcaattgcttttctg1560tagtttataagtgtgtatattttaatttataacttttctaatatatgaccaaaatttgtt1620gatgtgcaggttgttgataagggagcttctgctcagtctttcatcgagagaatgaccaac1680ttcgataagaaccttccaaacgagaaggttcttccaaagcactctcttctttacgagtac1740ttcaccgtttacaacgagcttaccaaggttaagtacgttaccgagggaatgagaaagcca1800gctttcctttctggagagcagaagaaggctatcgttgatcttcttttcaagaccaacaga1860aaggttaccgttaagcagttgaaggaggattacttcaagaagatcgagtgcttcgattct1920gttgaaatctctggagttgaggatagattcaacgcttctcttggaacctaccacgatctt1980ttgaagatcatcaaggataaggatttccttgataacgaggagaacgaggacatccttgag2040gacatcgttcttacccttacccttttcgaggatagagagatgatcgaggagagactcaag2100acctacgctcaccttttcgatgataaggttatgaagcagttgaagagaagaagatacacc2160ggatggggtagactttctcgtaagttgatcaacggaatcagagataagcagtctggaaag2220accatccttgatttcttgaagtctgatggattcgctaacagaaacttcatgcagcttatc2280cacgatgattctcttaccttcaaggaggacatccagaaggctcaggtttctggacaggga2340gattctcttcacgagcacatcgctaaccttgctggatctccagctatcaagaagggaatc2400cttcagaccgttaaggttgttgatgagcttgttaaggttatgggtagacacaagccagag2460aacatcgttatcgagatggctagagagaaccagaccacccagaagggacagaagaactct2520cgtgagagaatgaagagaatcgaggagggaatcaaggagcttggatctcaaatcttgaag2580gagcacccagttgagaacacccagcttcagaacgagaagttgtacctttactaccttcag2640aacggaagagatatgtacgttgatcaggagcttgacatcaacagactttctgattacgat2700gttgatcacatcgttccacagtctttcttgaaggatgattctatcgataacaaggttctt2760acccgttctgataagaacagaggaaagtctgataacgttccatctgaggaggttgttaag2820aagatgaagaactactggagacagcttcttaacgctaagttgatcacccagagaaagttc2880gataaccttaccaaggctgagagaggaggactttctgagcttgataaggctggattcatc2940aagagacagcttgttgagaccagacagatcaccaagcacgttgctcagatccttgattct3000cgtatgaacaccaagtacgatgagaacgataagttgatcagagaggttaaggttatcacc3060ttgaagtctaagttggtttctgatttcagaaaggatttccagttctacaaggttagagag3120atcaacaactaccaccacgctcacgatgcttaccttaacgctgttgttggaaccgctctt3180atcaagaagtacccaaagttggagtctgagttcgtttacggagattacaaggtttacgat3240gttagaaagatgatcgctaagtctgagcaggagatcggaaaggctaccgctaagtacttc3300ttctactctaacatcatgaacttcttcaagaccgagatcacccttgctaacggagagatc3360agaaagagaccacttatcgagaccaacggagagaccggagagatcgtttgggataaggga3420agagatttcgctaccgttagaaaggttctttctatgccacaggttaacatcgttaagaaa3480accgaggttcagaccggaggattctctaaggagtctatccttccaaagagaaactctgat3540aagttgatcgctagaaagaaggattgggacccaaagaagtacggaggattcgattctcca3600accgttgcttactctgttcttgttgttgctaaggttgagaagggaaagtctaagaagttg3660aagtctgttaaggagcttcttggaatcaccatcatggagcgttcttctttcgagaagaac3720ccaatcgatttccttgaggctaagggatacaaggaggttaagaaggatcttatcatcaag3780ttgccaaagtactctcttttcgagcttgagaacggaagaaagagaatgcttgcttctgct3840ggagagcttcagaagggaaacgagcttgctcttccatctaagtacgttaacttcctttac3900cttgcttctcactacgagaagttgaagggatctccagaggataacgagcagaagcagctt3960ttcgttgagcagcacaagcactaccttgatgagatcatcgagcaaatctctgagttctct4020aagagagttatccttgctgatgctaaccttgataaggttctttctgcttacaacaagcac4080agagataagccaatcagagagcaggctgagaacatcatccaccttttcacccttaccaac4140cttggtgctccagctgctttcaagtacttcgataccaccatcgatagaaaaagatacacc4200tctaccaaggaggttcttgatgctacccttatccaccagtctatcaccggactttacgag4260accagaatcgatctttctcagcttggaggagattga4296<210>42<211>1368<212>prt<213>人工序列<220><223>合成构建体<400>42metasplyslystyrserileglyleuaspileglythrasnserval151015glytrpalavalilethraspglutyrlysvalproserlyslysphe202530lysvalleuglyasnthrasparghisserilelyslysasnleuile354045glyalaleuleupheaspserglygluthralaglualathrargleu505560lysargthralaargargargtyrthrargarglysasnargilecys65707580tyrleuglngluilepheserasnglumetalalysvalaspaspser859095phephehisargleuglugluserpheleuvalglugluasplyslys100105110hisgluarghisproilepheglyasnilevalaspgluvalalatyr115120125hisglulystyrprothriletyrhisleuarglyslysleuvalasp130135140serthrasplysalaaspleuargleuiletyrleualaleualahis145150155160metilelyspheargglyhispheleuilegluglyaspleuasnpro165170175aspasnseraspvalasplysleupheileglnleuvalglnthrtyr180185190asnglnleupheglugluasnproileasnalaserglyvalaspala195200205lysalaileleuseralaargleuserlysserargargleugluasn210215220leuilealaglnleuproglyglulyslysasnglyleupheglyasn225230235240leuilealaleuserleuglyleuthrproasnphelysserasnphe245250255aspleualagluaspalalysleuglnleuserlysaspthrtyrasp260265270aspaspleuaspasnleuleualaglnileglyaspglntyralaasp275280285leupheleualaalalysasnleuseraspalaileleuleuserasp290295300ileleuargvalasnthrgluilethrlysalaproleuseralaser305310315320metilelysargtyraspgluhishisglnaspleuthrleuleulys325330335alaleuvalargglnglnleuproglulystyrlysgluilephephe340345350aspglnserlysasnglytyralaglytyrileaspglyglyalaser355360365glnglugluphetyrlyspheilelysproileleuglulysmetasp370375380glythrglugluleuleuvallysleuasnarggluaspleuleuarg385390395400lysglnargthrpheaspasnglyserileprohisglnilehisleu405410415glygluleuhisalaileleuargargglngluaspphetyrprophe420425430leulysaspasnargglulysileglulysileleuthrpheargile435440445protyrtyrvalglyproleualaargglyasnserargphealatrp450455460metthrarglysserglugluthrilethrprotrpasnphegluglu465470475480valvalasplysglyalaseralaglnserpheilegluargmetthr485490495asnpheasplysasnleuproasnglulysvalleuprolyshisser500505510leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys515520525tyrvalthrgluglymetarglysproalapheleuserglyglugln530535540lyslysalailevalaspleuleuphelysthrasnarglysvalthr545550555560vallysglnleulysgluasptyrphelyslysileglucyspheasp565570575servalgluileserglyvalgluaspargpheasnalaserleugly580585590thrtyrhisaspleuleulysileilelysasplysasppheleuasp595600605asnglugluasngluaspileleugluaspilevalleuthrleuthr610615620leuphegluaspargglumetileglugluargleulysthrtyrala625630635640hisleupheaspasplysvalmetlysglnleulysargargargtyr645650655thrglytrpglyargleuserarglysleuileasnglyileargasp660665670lysglnserglylysthrileleuasppheleulysseraspglyphe675680685alaasnargasnphemetglnleuilehisaspaspserleuthrphe690695700lysgluaspileglnlysalaglnvalserglyglnglyaspserleu705710715720hisgluhisilealaasnleualaglyserproalailelyslysgly725730735ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly740745750arghislysprogluasnilevalileglumetalaarggluasngln755760765thrthrglnlysglyglnlysasnserarggluargmetlysargile770775780glugluglyilelysgluleuglyserglnileleulysgluhispro785790795800valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu805810815glnasnglyargaspmettyrvalaspglngluleuaspileasnarg820825830leuserasptyraspvalasphisilevalproglnserpheleulys835840845aspaspserileaspasnlysvalleuthrargserasplysasnarg850855860glylysseraspasnvalproserglugluvalvallyslysmetlys865870875880asntyrtrpargglnleuleuasnalalysleuilethrglnarglys885890895pheaspasnleuthrlysalagluargglyglyleusergluleuasp900905910lysalaglypheilelysargglnleuvalgluthrargglnilethr915920925lyshisvalalaglnileleuaspserargmetasnthrlystyrasp930935940gluasnasplysleuilearggluvallysvalilethrleulysser945950955960lysleuvalseraspphearglysasppheglnphetyrlysvalarg965970975gluileasnasntyrhishisalahisaspalatyrleuasnalaval980985990valglythralaleuilelyslystyrprolysleuglusergluphe99510001005valtyrglyasptyrlysvaltyraspvalarglysmetileala101010151020lyssergluglngluileglylysalathralalystyrphephe102510301035tyrserasnilemetasnphephelysthrgluilethrleuala104010451050asnglygluilearglysargproleuilegluthrasnglyglu105510601065thrglygluilevaltrpasplysglyargaspphealathrval107010751080arglysvalleusermetproglnvalasnilevallyslysthr108510901095gluvalglnthrglyglypheserlysgluserileleuprolys110011051110argasnserasplysleuilealaarglyslysasptrpasppro111511201125lyslystyrglyglypheaspserprothrvalalatyrserval113011351140leuvalvalalalysvalglulysglylysserlyslysleulys114511501155servallysgluleuleuglyilethrilemetgluargserser116011651170pheglulysasnproileasppheleuglualalysglytyrlys117511801185gluvallyslysaspleuileilelysleuprolystyrserleu119011951200phegluleugluasnglyarglysargmetleualaseralagly120512101215gluleuglnlysglyasngluleualaleuproserlystyrval122012251230asnpheleutyrleualaserhistyrglulysleulysglyser123512401245progluaspasngluglnlysglnleuphevalgluglnhislys125012551260histyrleuaspgluileilegluglnileserglupheserlys126512701275argvalileleualaaspalaasnleuasplysvalleuserala128012851290tyrasnlyshisargasplysproilearggluglnalagluasn129513001305ileilehisleuphethrleuthrasnleuglyalaproalaala131013151320phelystyrpheaspthrthrileasparglysargtyrthrser132513301335thrlysgluvalleuaspalathrleuilehisglnserilethr134013451350glyleutyrgluthrargileaspleuserglnleuglyglyasp135513601365<210>43<211>80<212>prt<213>拟南芥<400>43metalasersermetleuserseralathrmetvalalaserproala151015glnalathrmetvalalapropheasnglyleulysserseralaala202530pheproalathrarglysalaasnasnaspilethrserilethrser354045asnglyglyargvalasncysmetglnvaltrpproproileglylys505560lyslysphegluthrleusertyrleuproaspleuthraspserglu65707580<210>44<211>80<212>prt<213>拟南芥<400>44metalaserasnserleumetsercysglyilealaalavaltyrpro151015serleuleuserserserlysserlysphevalseralaglyvalpro202530leuproasnalaglyasnvalglyargileargmetalaalahistrp354045metproglygluproargproalatyrleuaspglyseralaprogly505560asppheglypheaspproleuglyleuglygluvalproalaasnleu65707580<210>45<211>80<212>prt<213>拟南芥<400>45metthrilealaleuthrileglyglyasnglypheserglyleupro151015glyserserpheserserserserserserpheargleulysasnser202530argarglysasnthrlysmetleuasnargserlysvalvalcysser354045serserserservalmetaspprotyrlysthrleulysileargpro505560aspserserglutyrgluvallyslysalapheargglnleualalys65707580<210>46<211>4467<212>dna<213>人工序列<220><223>合成构建体<400>46atggcttcctctatgctctcttccgctactatggttgcctctccggctcaggccactatg60gtcgctcctttcaacggacttaagtcctccgctgccttcccagccacccgcaaggctaac120aacgacattacttccatcacaagcaacggcggaagagttaactgcatgcaggtggataag180aagtactctatcggacttgacatcggaaccaactctgttggatgggctgttatcaccgat240gagtacaaggttccatctaagaagttcaaggttcttggaaacaccgatagacactctatc300aagaagaaccttatcggtgctcttcttttcgattctggagagaccgctgaggctaccaga360ttgaagagaaccgctagaagaagatacaccagaagaaagaacagaatctgctaccttcag420gaaatcttctctaacgagatggctaaggttgatgattctttcttccacagacttgaggag480tctttccttgttgaggaggataagaagcacgagagacacccaatcttcggaaacatcgtt540gatgaggttgcttaccacgagaagtacccaaccatctaccaccttagaaagaagttggtt600gattctaccgataaggctgatcttagacttatctaccttgctcttgctcacatgatcaag660ttcagaggacacttccttatcgagggagaccttaacccagataactctgatgttgataag720ttgttcatccagcttgttcagacctacaaccagcttttcgaggagaacccaatcaacgct780tctggagttgatgctaaggctatcctttctgctagactttctaagtctcgtagacttgag840aaccttatcgctcagcttccaggagagaagaagaacggacttttcggaaaccttatcgct900ctttctcttggacttaccccaaacttcaagtctaacttcgatcttgctgaggatgctaag960ttgcagctttctaaggatacctacgatgatgatcttgataaccttcttgctcagatcgga1020gatcagtacgctgatcttttccttgctgctaagaacctttctgatgctatccttctttct1080gacatccttagagttaacaccgagatcaccaaggctccactttctgcttctatgatcaag1140agatacgatgagcaccaccaggatcttacccttttgaaggctcttgttagacagcagctt1200ccagagaagtacaaggaaatcttcttcgatcagtctaagaacggatacgctggatacatc1260gatggaggagcttctcaggaggagttctacaagttcatcaagccaatccttgagaagatg1320gatggaaccgaggagcttcttgttaagttgaacagagaggatcttcttagaaagcagaga1380accttcgataacggatctatcccacaccagatccaccttggagagcttcacgctatcctt1440cgtagacaggaggatttctacccattcttgaaggataacagagagaagatcgagaagatc1500cttaccttcagaatcccatactacgttggaccacttgctagaggaaactctcgtttcgct1560tggatgaccagaaagtctgaggagaccatcaccccttggaacttcgaggaggtaagtttc1620tgcttctacctttgatatatatataataattatcattaattagtagtaatataatatttc1680aaatatttttttcaaaataaaagaatgtagtatatagcaattgcttttctgtagtttata1740agtgtgtatattttaatttataacttttctaatatatgaccaaaatttgttgatgtgcag1800gttgttgataagggagcttctgctcagtctttcatcgagagaatgaccaacttcgataag1860aaccttccaaacgagaaggttcttccaaagcactctcttctttacgagtacttcaccgtt1920tacaacgagcttaccaaggttaagtacgttaccgagggaatgagaaagccagctttcctt1980tctggagagcagaagaaggctatcgttgatcttcttttcaagaccaacagaaaggttacc2040gttaagcagttgaaggaggattacttcaagaagatcgagtgcttcgattctgttgaaatc2100tctggagttgaggatagattcaacgcttctcttggaacctaccacgatcttttgaagatc2160atcaaggataaggatttccttgataacgaggagaacgaggacatccttgaggacatcgtt2220cttacccttacccttttcgaggatagagagatgatcgaggagagactcaagacctacgct2280caccttttcgatgataaggttatgaagcagttgaagagaagaagatacaccggatggggt2340agactttctcgtaagttgatcaacggaatcagagataagcagtctggaaagaccatcctt2400gatttcttgaagtctgatggattcgctaacagaaacttcatgcagcttatccacgatgat2460tctcttaccttcaaggaggacatccagaaggctcaggtttctggacagggagattctctt2520cacgagcacatcgctaaccttgctggatctccagctatcaagaagggaatccttcagacc2580gttaaggttgttgatgagcttgttaaggttatgggtagacacaagccagagaacatcgtt2640atcgagatggctagagagaaccagaccacccagaagggacagaagaactctcgtgagaga2700atgaagagaatcgaggagggaatcaaggagcttggatctcaaatcttgaaggagcaccca2760gttgagaacacccagcttcagaacgagaagttgtacctttactaccttcagaacggaaga2820gatatgtacgttgatcaggagcttgacatcaacagactttctgattacgatgttgatcac2880atcgttccacagtctttcttgaaggatgattctatcgataacaaggttcttacccgttct2940gataagaacagaggaaagtctgataacgttccatctgaggaggttgttaagaagatgaag3000aactactggagacagcttcttaacgctaagttgatcacccagagaaagttcgataacctt3060accaaggctgagagaggaggactttctgagcttgataaggctggattcatcaagagacag3120cttgttgagaccagacagatcaccaagcacgttgctcagatccttgattctcgtatgaac3180accaagtacgatgagaacgataagttgatcagagaggttaaggttatcaccttgaagtct3240aagttggtttctgatttcagaaaggatttccagttctacaaggttagagagatcaacaac3300taccaccacgctcacgatgcttaccttaacgctgttgttggaaccgctcttatcaagaag3360tacccaaagttggagtctgagttcgtttacggagattacaaggtttacgatgttagaaag3420atgatcgctaagtctgagcaggagatcggaaaggctaccgctaagtacttcttctactct3480aacatcatgaacttcttcaagaccgagatcacccttgctaacggagagatcagaaagaga3540ccacttatcgagaccaacggagagaccggagagatcgtttgggataagggaagagatttc3600gctaccgttagaaaggttctttctatgccacaggttaacatcgttaagaaaaccgaggtt3660cagaccggaggattctctaaggagtctatccttccaaagagaaactctgataagttgatc3720gctagaaagaaggattgggacccaaagaagtacggaggattcgattctccaaccgttgct3780tactctgttcttgttgttgctaaggttgagaagggaaagtctaagaagttgaagtctgtt3840aaggagcttcttggaatcaccatcatggagcgttcttctttcgagaagaacccaatcgat3900ttccttgaggctaagggatacaaggaggttaagaaggatcttatcatcaagttgccaaag3960tactctcttttcgagcttgagaacggaagaaagagaatgcttgcttctgctggagagctt4020cagaagggaaacgagcttgctcttccatctaagtacgttaacttcctttaccttgcttct4080cactacgagaagttgaagggatctccagaggataacgagcagaagcagcttttcgttgag4140cagcacaagcactaccttgatgagatcatcgagcaaatctctgagttctctaagagagtt4200atccttgctgatgctaaccttgataaggttctttctgcttacaacaagcacagagataag4260ccaatcagagagcaggctgagaacatcatccaccttttcacccttaccaaccttggtgct4320ccagctgctttcaagtacttcgataccaccatcgatagaaaaagatacacctctaccaag4380gaggttcttgatgctacccttatccaccagtctatcaccggactttacgagaccagaatc4440gatctttctcagcttggaggagattga4467<210>47<211>1424<212>prt<213>人工序列<220><223>合成构建体<400>47metalasersermetleuserseralathrmetvalalaserproala151015glnalathrmetvalalapropheasnglyleulysserseralaala202530pheproalathrarglysalaasnasnaspilethrserilethrser354045asnglyglyargvalcysmetglnvalasplyslystyrserilegly505560leuaspileglythrasnservalglytrpalavalilethraspglu65707580tyrlysvalproserlyslysphelysvalleuglyasnthrasparg859095hisserilelyslysasnleuileglyalaleuleupheaspsergly100105110gluthralaglualathrargleulysargthralaargargargtyr115120125thrargarglysasnargilecystyrleuglngluilepheserasn130135140glumetalalysvalaspaspserphephehisargleuglugluser145150155160pheleuvalglugluasplyslyshisgluarghisproilephegly165170175asnilevalaspgluvalalatyrhisglulystyrprothriletyr180185190hisleuarglyslysleuvalaspserthrasplysalaaspleuarg195200205leuiletyrleualaleualahismetilelyspheargglyhisphe210215220leuilegluglyaspleuasnproaspasnseraspvalasplysleu225230235240pheileglnleuvalglnthrtyrasnglnleupheglugluasnpro245250255ileasnalaserglyvalaspalalysalaileleuseralaargleu260265270serlysserargargleugluasnleuilealaglnleuproglyglu275280285lyslysasnglyleupheglyasnleuilealaleuserleuglyleu290295300thrproasnphelysserasnpheaspleualagluaspalalysleu305310315320glnleuserlysaspthrtyraspaspaspleuaspasnleuleuala325330335glnileglyaspglntyralaaspleupheleualaalalysasnleu340345350seraspalaileleuleuseraspileleuargvalasnthrgluile355360365thrlysalaproleuseralasermetilelysargtyraspgluhis370375380hisglnaspleuthrleuleulysalaleuvalargglnglnleupro385390395400glulystyrlysgluilephepheaspglnserlysasnglytyrala405410415glytyrileaspglyglyalaserglnglugluphetyrlyspheile420425430lysproileleuglulysmetaspglythrglugluleuleuvallys435440445leuasnarggluaspleuleuarglysglnargthrpheaspasngly450455460serileprohisglnilehisleuglygluleuhisalaileleuarg465470475480argglngluaspphetyrpropheleulysaspasnargglulysile485490495glulysileleuthrpheargileprotyrtyrvalglyproleuala500505510argglyasnserargphealatrpmetthrarglysserglugluthr515520525ilethrprotrpasnpheglugluvalvalasplysglyalaserala530535540glnserpheilegluargmetthrasnpheasplysasnleuproasn545550555560glulysvalleuprolyshisserleuleutyrglutyrphethrval565570575tyrasngluleuthrlysvallystyrvalthrgluglymetarglys580585590proalapheleuserglygluglnlyslysalailevalaspleuleu595600605phelysthrasnarglysvalthrvallysglnleulysgluasptyr610615620phelyslysileglucyspheaspservalgluileserglyvalglu625630635640aspargpheasnalaserleuglythrtyrhisaspleuleulysile645650655ilelysasplysasppheleuaspasnglugluasngluaspileleu660665670gluaspilevalleuthrleuthrleuphegluaspargglumetile675680685glugluargleulysthrtyralahisleupheaspasplysvalmet690695700lysglnleulysargargargtyrthrglytrpglyargleuserarg705710715720lysleuileasnglyileargasplysglnserglylysthrileleu725730735asppheleulysseraspglyphealaasnargasnphemetglnleu740745750ilehisaspaspserleuthrphelysgluaspileglnlysalagln755760765valserglyglnglyaspserleuhisgluhisilealaasnleuala770775780glyserproalailelyslysglyileleuglnthrvallysvalval785790795800aspgluleuvallysvalmetglyarghislysprogluasnileval805810815ileglumetalaarggluasnglnthrthrglnlysglyglnlysasn820825830serarggluargmetlysargileglugluglyilelysgluleugly835840845serglnileleulysgluhisprovalgluasnthrglnleuglnasn850855860glulysleutyrleutyrtyrleuglnasnglyargaspmettyrval865870875880aspglngluleuaspileasnargleuserasptyraspvalasphis885890895ilevalproglnserpheleulysaspaspserileaspasnlysval900905910leuthrargserasplysasnargglylysseraspasnvalproser915920925glugluvalvallyslysmetlysasntyrtrpargglnleuleuasn930935940alalysleuilethrglnarglyspheaspasnleuthrlysalaglu945950955960argglyglyleusergluleuasplysalaglypheilelysarggln965970975leuvalgluthrargglnilethrlyshisvalalaglnileleuasp980985990serargmetasnthrlystyraspgluasnasplysleuileargglu99510001005vallysvalilethrleulysserlysleuvalseraspphearg101010151020lysasppheglnphetyrlysvalarggluileasnasntyrhis102510301035hisalahisaspalatyrleuasnalavalvalglythralaleu104010451050ilelyslystyrprolysleuglusergluphevaltyrglyasp105510601065tyrlysvaltyraspvalarglysmetilealalysserglugln107010751080gluileglylysalathralalystyrphephetyrserasnile108510901095metasnphephelysthrgluilethrleualaasnglygluile110011051110arglysargproleuilegluthrasnglygluthrglygluile111511201125valtrpasplysglyargaspphealathrvalarglysvalleu113011351140sermetproglnvalasnilevallyslysthrgluvalglnthr114511501155glyglypheserlysgluserileleuprolysargasnserasp116011651170lysleuilealaarglyslysasptrpaspprolyslystyrgly117511801185glypheaspserprothrvalalatyrservalleuvalvalala119011951200lysvalglulysglylysserlyslysleulysservallysglu120512101215leuleuglyilethrilemetgluargserserpheglulysasn122012251230proileasppheleuglualalysglytyrlysgluvallyslys123512401245aspleuileilelysleuprolystyrserleuphegluleuglu125012551260asnglyarglysargmetleualaseralaglygluleuglnlys126512701275glyasngluleualaleuproserlystyrvalasnpheleutyr128012851290leualaserhistyrglulysleulysglyserprogluaspasn129513001305gluglnlysglnleuphevalgluglnhislyshistyrleuasp131013151320gluileilegluglnileserglupheserlysargvalileleu132513301335alaaspalaasnleuasplysvalleuseralatyrasnlyshis134013451350argasplysproilearggluglnalagluasnileilehisleu135513601365phethrleuthrasnleuglyalaproalaalaphelystyrphe137013751380aspthrthrileasparglysargtyrthrserthrlysgluval138513901395leuaspalathrleuilehisglnserilethrglyleutyrglu140014051410thrargileaspleuserglnleuglyglyasp14151420<210>48<211>330<212>dna<213>人工序列<220><223>合成构建体<400>48ttggcgaaaccccatttcgacctttcggtctcatcaggggtggcacacaccaccctatgg60ggagaggtcgtcctctatctctcctggaaggccggagcaatccaaaagaggtacacccac120ccatgggtcgggactttaaattcggaggattcgtcctttaaacgttcctccaagagtccc180ttccccaaacccttactttgtaagtgtggttcggcgaatgtaccgtttcgtcctttcgga240ctcatcagggaaagtacacactttccgacggtgggttcgtcgacacctctccccctccca300ggtactatcccctttccaggatttgttccc330<210>49<211>942<212>dna<213>拟南芥<400>49acgagaggaagtacattagtttggagaagagtaatagacagagagatagagagaaagaga60agcagttcggagaaacaatggcggtagaagacactcccaaatctgttgtaacggaagaag120ctaagcctaattcaatagagaatccgattgatcgataccatgaggaaggtgatgatgccg180aagaaggagagatcgccggaggagaaggagacggaaacgttgacgaatcgagcaaatccg240gtgttcctgaatcgcatcctctggaacattcatggactttctggttcgataatcctgctg300tgaaatcgaaacaaacctcttggggaagttccttgcgacccgtgtttacgttttcaactg360ttgaggaattttggagtttgtacaacaacatgaagcatccgagcaagttagctcacggag420ctgacttctactgtttcaaacacatcattgaacctaagtgggaggatcctatttgtgcta480atggaggaaaatggactatgactttccctaaggagaagtctgataagagctggctctaca540ctttgcttgcattgattggagagcagtttgatcatggagatgaaatatgtggagcagttg600tcaacattagaggaaagcaagaaaggatatctatttggactaaaaatgcttcaaacgaag660ctgctcaggtgagcattggaaaacaatggaaggagtttctcgattacaacaacagcatag720gtttcatcatccatgaggatgcgaagaagctcgacaggaatgcaaagaacgcttacaccg780cttgaaacctctcaaatctttgcattgtttcaattacagttttgtatgtgagagatctct840atttatctaaacatgacttgacagtctgtctttgctagtgttgattgttcacgaagctct900aacatttcatttagtaatatattagtatggttcttcataata942<210>50<211>96<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(20)<223>n为a、c、g或t<400>50nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>51<211>567<212>dna<213>铜绿假单胞菌<400>51atgggtgatcattatctggatattcggctgaggcctgatccagagttcccacctgcgcag60ctgatgtctgtcctttttggcaaacttcatcaggccctggttgcccagggcggagatcgg120ataggggtaagctttccagacctcgacgaaagccggagccgcctgggagaacgcctgcgg180atccacgcttctgccgacgatctgagagccttgctggcaaggccatggcttgaggggctc240cgggatcacctgcagtttggcgaacccgccgttgttccccacccaaccccttatcggcag300gtgtctagagtgcaggccaaatctaatccagaacggctgcgacggcgactcatgcggcga360catgatcttagcgaggaagaggcccgaaaaagaatccctgataccgtggcccgcgccctt420gacttgccttttgtcacactgcggtcccagagtacggggcagcatttcagacttttcatt480cgacacgggccactgcaagttaccgccgaagaaggaggctttacttgttatggactctcc540aagggaggtttcgtgccctggttttga567<210>52<211>188<212>prt<213>铜绿假单胞菌<400>52metglyasphistyrleuaspileargleuargproaspprogluphe151015proproalaglnleumetservalleupheglylysleuhisglnala202530leuvalalaglnglyglyaspargileglyvalserpheproaspleu354045aspgluserargserargleuglygluargleuargilehisalaser505560alaaspaspleuargalaleuleualaargprotrpleugluglyleu65707580argasphisleuglnpheglygluproalavalvalprohisprothr859095protyrargglnvalserargvalglnalalysserasnprogluarg100105110leuargargargleumetargarghisaspleusergluglugluala115120125arglysargileproaspthrvalalaargalaleuaspleuprophe130135140valthrleuargserglnserthrglyglnhispheargleupheile145150155160arghisglyproleuglnvalthralaglugluglyglyphethrcys165170175tyrglyleuserlysglyglyphevalprotrpphe180185<210>53<211>20<212>dna<213>铜绿假单胞菌<400>53gttcactgccgtataggcag20<210>54<211>272<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(21)..(40)<223>n为a、c、g或t<220><221>杂项特性<222>(137)..(156)<223>n为a、c、g或t<400>54gttcactgccgtataggcagnnnnnnnnnnnnnnnnnnnngttttagagctagaaatagc60aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcgttc120actgccgtataggcagnnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagt180taaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcgttcactg240ccgtataggcaggttcactgccgtataggcag272<210>55<211>3213<212>dna<213>烟草<400>55atgctcggggatggaaatgagggaatatctacaatacctggatttaatcagatacaattt60gaaggattttgtaggttcattgatcaaggtttgacggaagaactttataagtttccaaaa120attgaagatacagatcaagaaattgaatttcaattatttgtggaaacatatcaattggtc180gaacccttgataaaggaaagagatgctgtgtatgaatcactcacatattcttctgaatta240tatgtatccgcgggattaatttggaaaaacagtagggatatgcaagaacaaacaattttt300atcggaaacattcctctaatgaattccctgggaacttctatagtcaatggaatatataga360attgtgatcaatcaaatattgcaaagtcccggtatttattaccgatcagaattggaccat420aacggaatttcggtctataccggcaccataatatcagattggggaggaagatcagaatta480gaaattgatagaaaagcaaggatatgggctcgtgtaagtaggaaacaaaaaatatctatt540ctagttctatcatcagctatgggtttgaatctaagagaaattctagagaatgtttgctat600cctgaaatttttttgtcttttctgagtgataaggagagaaaaaaaattgggtcaaaagaa660aatgccattttggagttttatcaacaatttgcttgtgtaggtggcgatccggtattttct720gaatccttatgtaaggaattacaaaagaaattctttcaacaaagatgtgaattaggaagg780attggtcgacgaaatatgaaccgaagactgaaccttgatataccccagaacaatacattt840ttgttaccacgagatatattggcagccgccgatcatttgattgggctgaaatttggaatg900ggtgcacttgacgatatgaatcatttgaaaaataaacgtattcgttctgtagcagatctt960ttacaagatcaattcggattggctctggttcgtttagaaaatgtggttcgggggactata1020tgtggagcaattcggcataaattgataccgacacctcagaatttggtaacctcaactcca1080ttaacaactacttatgaatcctttttcggtttacacccattatctcaagttttggatcga1140actaatccattgacacaaatagttcatgggagaaaattaagttatttgggccctggagga1200ctgacagggcgcactgctagttttcggatacgagatatccatcctagtcactatggacgt1260atttgcccaattgacacatctgaaggaatcaatgttggacttattggatccttagcaatt1320catgcgaggattggtcattggggatctctagaaagccctttttatgaaatttctgagagg1380tcaaccggggtacggatgctttatttatcaccaggtagagatgaatactatatggtagcg1440gcaggaaattctttagccttaaatcaggatattcaggaagaacaggttgttccagctcga1500taccgtcaagaattcttgactattgcatgggaacaggttcatcttcgaagtatttttcct1560tttcaatatttttctattggagcttccctcattccttttatcgaacataatgatgcgaat1620cgagctttaatgagttctaatatgcaacgtcaagcagttcctctttctcgctccgagaaa1680tgcattgttggaactgggttggaacgacaagcagctctagattcgggggctcttgctata1740gccgaacgcgagggaagggtcgtttataccaatactgacaagattcttttagcaggtaat1800ggagatattctaagcattccattagttatatatcaacgttccaataaaaatacttgtatg1860catcaaaaactccaggttcctcggggtaaatgcattaaaaagggacaaattttagcggat1920ggtgctgctacggttggtggcgaacttgctttggggaaaaacgtattagtagcttatatg1980ccgtgggagggttacaattctgaagatgcagtacttattagcgagcgtttggtatatgaa2040gatatttatacttcttttcacatacggaaatatgaaattcagactcatgtgacaagccaa2100ggccctgaaaaagtaactaatgaaataccgcatttagaagcccatttactccgcaattta2160gataaaaatggaattgtgatgctgggatcttgggtagagacaggtgatattttagtaggt2220aaattaacaccccaggtcgtgaaagaatcgtcgtatgccccggaagatagattgttacga2280gctatacttggtattcaggtatctacttcaaaagaaacttgtctaaaactacctataggt2340ggcaggggtcgggttattgatgtgaggtggatccagaagaggggtggttctagttataat2400cccgaaacgattcgtgtatatattttacagaaacgtgaaatcaaagtaggcgataaagta2460gctggaagacacggaaataaaggtatcatttccaaaattttgcctagacaagatatgcct2520tatttacaagatggaagatccgttgatatggtctttaacccattaggagtaccttcacga2580atgaatgtaggacagatatttgaatgttcactagggttagcagggagtctgctagacaga2640cattatcgaatagcaccttttgatgagagatatgaacaagaagcttcgagaaaacttgtg2700ttttctgaattatatgaagccagtaagcaaacagcgaatccatgggtatttgaacccgaa2760tatccaggaaaaagcagaatatttgatggaaggacggggaatccttttgaacaacccgtt2820ataataggaaagccttatatcttgaaattaattcatcaagttgatgataaaatccatggg2880cgctccagtggacattatgcgcttgttacacaacaaccccttagaggaagagccaaacag2940gggggacagcgggtaggagaaatggaggtttgggctctagaagggtttggggttgctcat3000attttacaagagatgcttacttataaatcggatcatattagagctcgccaggaagtactt3060ggtactacgatcattgggggaacaatacctaatcccgaagatgctccagaatcttttcga3120ttgctcgttcgagaactacgatctttagctctggaactgaatcatttccttgtatctgag3180aagaacttccagattaataggaaggaagcttaa3213<210>56<211>20<212>dna<213>烟草<400>56ttagaggaagagccaaacag20<210>57<211>20<212>dna<213>烟草<400>57cttgctatagccgaacgcga20<210>58<211>1062<212>dna<213>烟草<400>58atgactgcaattttagagagacgcgaaagcgaaagcctatggggtcgcttctgtaactgg60ataactagcactgaaaaccgtctttacattggatggtttggtgttttgatgatccctacc120ttattgacggcaacttctgtatttattattgccttcattgctgctcctccagtagacatt180gatggtattcgtgaacctgtttcagggtctctactttacggaaacaatattatttccggt240gccattattcctacttctgcagctataggtttacatttttacccaatctgggaagcggca300tccgttgatgaatggttatacaacggtggtccttatgaactaattgttctacacttctta360cttggcgtagcttgttacatgggtcgtgagtgggagcttagtttccgtctgggtatgcga420ccttggattgctgttgcatattcagctcctgttgcagctgctaccgcagttttcttgatc480tacccaattggtcaaggaagtttttctgatggtatgcctctaggaatctctggtactttc540aatttcatgattgtattccaggctgagcacaacatccttatgcacccatttcacatgtta600ggcgtagctggtgtattcggcggctccctattcagtgctatgcatggttccttggtaact660tctagtttgatcagggaaaccacagaaaatgaatctgctaatgaaggttacagattcggt720caagaggaagaaacttataacatcgtagccgctcatggttattttggccgattgatcttc780caatatgctagtttcaacaactctcgttcgttacacttcttcctagctgcttggcctgta840gtaggtatctggtttaccgctttaggtatcagcactatggctttcaacctaaatggtttc900aatttcaaccaatctgtagttgacagtcaaggccgtgtaattaatacttgggctgatatc960attaaccgtgctaaccttggtatggaagttatgcatgaacgtaatgctcacaacttccct1020ctagacctagctgctatcgaagctccatctacaaatggataa1062<210>59<211>20<212>dna<213>烟草<400>59gttgatgaatggttatacaa20<210>60<211>20<212>dna<213>烟草<400>60gatgatccctaccttattga20<210>61<211>264<212>dna<213>烟草<400>61atggtaaaaaattctgtcatttcagttatttctcaagaagaaaagagaggatctgttgaa60tttcaagtattcaatttcaccaataagatacggagacttacttcacatttagaattgcac120aaaaaagactatttatctcagagaggtttgaagaaaattttgggaaaacgtcaacgactc180ctagcttatttgtcaaaaaaaaatagagtacgttataaagaattaattaatcagttggac240attcgagagacaaaaactcgttaa264<210>62<211>20<212>dna<213>烟草<400>62atttctcaagaagaaaagag20<210>63<211>20<212>dna<213>烟草<400>63tcaatttcaccaataagata20<210>64<211>201<212>dna<213>烟草<400>64atggccaaggggaaagatgtccgagtaacggtgattttggaatgtactagttgtgtccga60aacagtgttgataaggtatcaagaggtatttccagatatattactcaaaagaaccggcac120aatacgcctaatcgattagaattgaaaaaattctgtccctattgttacaaacatacgatt180catggggagataaagaaatag201<210>65<211>20<212>dna<213>烟草<400>65gatatattactcaaaagaac20<210>66<211>20<212>dna<213>烟草<400>66agtgttgataaggtatcaag20<210>67<211>3213<212>dna<213>大豆<400>67atgcttggggatggaaatgaaggaatgtctacactacctggattgaatcagatacaattt60gaagggttttgtaggttcattgatcggggcttaccagaagggctttttaagtttccaaaa120attgaggatacagatcaagaaattgaatttcaattatttgtagaaacatatcaattatta180gaacccttgataaacgaaaaagatgctgtatatgaatcgcttacatattctgctgaatta240tatgtatctgcgggattaatttggaaaagtagtagggacatacaagaacaaactattttt300gttggaaacattcctttaatgaattctctgggaacttctatagtaaatggaatatacaga360attgtaatcaatcaaatattgcaaagccctggtatttattaccgttcagaattggaccct420agcggaatttcggtctatactggcaccataatatcagactgggggggtagattagaatta480gagattgatagaaaagcaaggatatgggctcgtgtgagtaggaaacagaaaatatctatt540ctagttttatcatcagctatgggttcgaatttaagcgaaattctagagaatgtttgttat600cctgaaattttcgtttctttcctaaatgataaggataaaaaaaaaatagggtcaaaagaa660aatgccattttggagttttatcgacaatttgcttgtgttggtggagatccagtattttct720gaatctttatgtaaagaattacaaaaaaaattttttcaacaaagatgtgaattaggaagg780attggtcgacgaaatatgaaccaaaagcttaatcttgatatacctcagaacaatacattt840ttgttaccacgagatatattgacagctgcggatcatttgattggaatgaaatttggaatg900ggtatacttgacgatataaatcatttgaaaaataaacgtattcgttcggtagcagatcta960ttacaagatcaatttggattggccctggttcgtttagaaaatatggttagaggaactata1020tgtggagcaattagacataaattgataccgactcctcagaatttggtgacttcaactcca1080ttaacaactacttatgaatctttttttggattacatccattatctcaagttttggatcaa1140actaatccattgacccaaatagttcatgggagaaaattgagttatttgggccctggagga1200ttgacggggcgaactgctagttttcggatacgagatatccaccctagtcactatggacgc1260atttgtccaattgacacgtcggaaggaatcaatgttggacttattggatctctagcaatt1320catgcgaggattggtagttgggggtccatagaaagtccattttatgaaatatctgagaga1380tcaaaaagaatacgcatgctttatttatcaccaagtagagatgaatactatatggtagca1440acaggaaattctttggcacttaatcgagatattcaggaggaacagactgttccagcccga1500taccgtcaagaatttcttacgattgcatgggaacaggttcatcttcgaagtatttttccc1560ttccaatatttttctattggagcttctctgattccttttattgaacataatgatgccaat1620cgagctttaatgagttctaatatgcaacgtcaagcagttccgctttctcagtccgaaaaa1680tgcattgttggaactggattggaacgccaagtagctttagattcaggggtttccgctata1740gccgaacacgagggaaacatcatttataccaatactgacaggatatttttatttggtaat1800ggagatactctaagcattccattaactatatatcaacgttccaacaaaaatacttgtatg1860catcaaaaaccccaggttcgccgaggtaaatgtataaaaaagggacaaattttagcggat1920ggtgctgctacagttgacggcgaactcgctttgggaaaaaacgtcttagtagcttatatg1980ccatgggaaggttacaattctgaagatgctgtactcattaatgagcgtctggtctatgaa2040gatatttatacttcttttcacatacggaaatatgaaattcagactcatatgacaagctat2100ggttctgaaagaatcactaataaaattccacatctagaagcccatttactcagaaattta2160gacaaaaatggaattgtgatcctcgggtcgtgggtagaaacgggtgatattttagtgggt2220aaattaacacctcaaatggcaaaagaatcctcgtattcccccgaagatagattattacga2280gctatacttggcattcaggtatccacctcaaaggaaacttgtctaaaactacctacaggc2340ggtaggggtagagttattgatgtgagatggatccaaaaaaaggggggttccagttataat2400ccagaaacgattcgtatatatattttacagaaacgtgaaattaaagtaggagataaagtg2460gctgggagacatggaaataaaggtatcgtttcaaaaattttgtctagacaggatatgcct2520tatttgcaagatggaagacccgttgatatggtcttcaatccactaggggtaccttcacga2580atgaatgtaggacaaatatttgaatgctcgctcgggttagcaggaggtatgctagaaaga2640cattatcgaataacaccttttgatgagagatatgaacaagaagcttcgagaaaactagtg2700ttttctgaattatatgaagccagtaaacaaacatctaatccatggatatttgaacccgag2760tatccaggaaaaagcaaaatctttgatggaagaacagggaattcttttaaacagcctgct2820ataatgggaaaaccttatattttgaaattaattcatcaagttgatgataaaatacatgga2880cgttccagtggacattatgcacttgttacacaacaaccacttagaggaagggccaagcag2940ggaggacaacgggtaggcgaaatggaggtttgggccttggaaggatttggtgttgctcat3000attttacaagagatgcttacttataaatctgatcatattaaaactcgccaagaagtactc3060gggactacgatcattggaggaacaatacctaaacctacagatgctccagaatcttttaga3120ttgctagttcgagaattacgatctttagctatggaactgaatcatttccttgtatccgag3180aagaacttccggattcataggaaggaagcttaa3213<210>68<211>20<212>dna<213>大豆<400>68tgtctaaaactacctacagg20<210>69<211>20<212>dna<213>大豆<400>69agcggaatttcggtctatac20<210>70<211>1062<212>dna<213>大豆<400>70atgactgcaattttagagagacgcgagagcgaaagcctatggggtcgcttctgtaactgg60ataaccagcaccgaaaatcgtctttacattggatggtttggtgttttgatgattcctact120ttattgaccgcaacttctgtatttattatcgcttttattgctgcccctccagtagatatt180gatggtattcgtgagcctgtttctggatctctactttatggaaacaatatcatttctggt240gccattattcctacttctgcggctataggtttgcacttttatcctatttgggaagcggca300tctgttgatgaatggttatacaacggcggtccttatgaactaattgttctacacttctta360cttggtgtagcttgctacatggggcgtgagtgggaacttagttttcgtttgggtatgcgt420ccttggattgctgttgcatattcagctcctgttgcagccgctactgctgttttcttgatc480tatcctattggtcagggaagcttttcagatggtatgcctctaggaatttcaggtactttc540aattttatgattgtatttcaggctgagcataatattcttatgcatccatttcacatgtta600ggtgtagctggtgtattcggcggctccctattcagtgctatgcatggttccttggtaact660tctagtttgatcagggaaaccacagaaaatgaatctgctaatgaaggttacagatttggt720caagaggaagaaacctataatattgtagctgctcatggttattttggccgattgatcttc780caatatgcaagtttcaacaattctcgttctttacatttcttcttagctgcttggcctgta840gtaggtatttggtttaccgctttaggtatcagcactatggctttcaacttaaatggtttc900aatttcaaccaatccgtagttgatagtcaaggtcgtgtaattaatacctgggctgatatt960attaaccgagctaaccttggtatggaagtaatgcatgaacgtaatgctcataatttccct1020ctagatctagctgcgatcgacgctccatctattaatggataa1062<210>71<211>20<212>dna<213>大豆<400>71ggtgtagctggtgtattcgg20<210>72<211>20<212>dna<213>大豆<400>72tctagatctagctgcgatcg20<210>73<211>273<212>dna<213>大豆<400>73atggtaaaaaattcaattatacctgttatttcacaagaaaaaaaagaaaaaaacccagga60tcggttgaatttcaaatattcaaatttaccgatagaatacgaagacttacttcacatttt120gaattgcaccgaaaagactatttatctcaaagaggtttacgtaaaattttgggaaaacga180caaagattgctgtcttatttgtcaaagaaagatagaatacggtataaaaaattaataaat240cagtttgatattcgagagtcacaaattcgttaa273<210>74<211>20<212>dna<213>大豆<400>74atagaatacgaagacttact20<210>75<211>20<212>dna<213>大豆<400>75tgtcaaagaaagatagaata20<210>76<211>201<212>dna<213>大豆<400>76atggccaaaggtaaagatatccgagtaattgttattttggaatgtaccggttgtgataaa60aagagtgttaataaggaatcaacgggtatttctagatatataactaaaaagaatcgacag120aatacgcctagtcgattggaattgagaaaattttgtccccgttgttgcaaacatacaatt180cacgcagaaataaagaaatag201<210>77<211>20<212>dna<213>大豆<400>77cgttgttgcaaacatacaat20<210>78<211>20<212>dna<213>大豆<400>78acagaatacgcctagtcgat20<210>79<211>864<212>dna<213>本生烟<400>79gtgcgacttgaaggacaggatccgttgtggatttgtacatccaccattttatgtaggaat60gaaggtgctcttggctcgacatcattggttctgtttcattagattagaacccctcttttt120tgttgtcttggaatgtaaatagtccatgatggagctcgagtagaaagtattaatttattt180ctcggggcaagagtctagggttaatgccaatcaataaaaaaattggaacaacttcgtaaa240tgtattttcggtatggaaatcgaaagaatccaattcgagcaagtttccaattcaaaaatt300tcttggaattgatcaaactttttcgatccaaagtgtttcacgcgggaatccatcgtctgt360aggattctttcatagaaatcgcaaaaggggtatgttgctgccattttgaaaggattaaaa420agcaccgaagtaatgtctaaacccaatgatttaaaataaaacaaagataaaggatcccag480aacaaggaaacaccttttttattgtcttaataactggatcgaactgaagaatccaaatcc540attttaaacgagacaaacataaaaggaggaaagaccgctcaataaatgaaattgccgaaa600gattttcctttgaactgtttgaaagttatccaacttgagttatgagagtacgaatggttt660ctttttcattttcaggaagaaagaagaaaaaaaagacttacatctttaattgatttgatc720attttatggacccagttgtcatttcttagatagaattccatacagagataaaacctcgaa780tcaatcatttttctcgagccgtacgaggagaaagcttcctatacgtttctagggggggtg840ttgttcatctacatctatcccaat864<210>80<211>20<212>dna<213>本生烟<400>80ttgtggatttgtacatccac20<210>81<211>20<212>dna<213>本生烟<400>81ttgaactgtttgaaagttat20<210>82<211>1578<212>dna<213>本生烟<400>82tttcaaatggaagaaatccaaagatatttacagccagatagatcgcaacaacacaacttc60ctatatccacttatctttcaggagtatatttatgcacttgctcatgatcatggtttaaat120agaaacaagtcgattttgttggaaaatccaggttataacaataaatttagtttcctaatt180gtgaaacgtttaattacccgaatgtatcaacagaatcattttcttatttctactaatgat240tctaacaaaaattcatttttggggtgcaacaagagtttgtattctcaaatgatatcagag300ggatttgcgtttattgtggaaattccgttttctctacgattaatatcttctttatcttct360ttcgaaggcaaaaaggtttttaaatctcataatttacgatcaattcattcaacatttcct420tttttagaggacaatttttcacatctaaattatgtattagatatactaataccctacccc480gttcatctggaaatcttggttcaaactcttcgctattgggtaaaagatgcctcttcttta540catttattacgattctttctccatgaatattggaatttgaatagtcttattacttcaaag600aagcccggttactccttttcaaaaaaaaatcaaagattcttcttcttcttatataattct660tatgtatatgaatgcgaatccactttcgtctttctacggaaccaatcttctcatttacga720tcaacatcttttggagcccttcttgaacgaatatatttctatggaaaaatagaacgtctt780gtagaagtctttgctaaggattttcaggttaccctatggttattcaaggatcctttcatg840cattatgttaggtatcaaggaaaatccattctggcttcaaaagggacgtttcttttgatg900aataaatggaaattttaccttgtcaatttttggcaatgtcatttttctctgtgctttcac960acaggaaggatccatataaaccaattatccaatcattcccgtaactttatgggctatctt1020tcaagtgtgcgactaaatccttcaatggtacgtagtcaaatgttagaaaattcatttcta1080atcaataatgcaattaagaagttcgatacccttgttccaattattcctttgattggatca1140ttagctaaagcaaacttttgtaccgtattagggcatcccattagtaaaccggtttggtcc1200gatttatcagattctgatattattgaccgatttgggcgtatatgcagaaatctttttcat1260tattatagcggatcttccaaaaaaaagactttatatcgaataaagtatatacttcgactt1320tcttgtgctagaactttagctcggaaacacaaaagtactgtacgcacttttttgaaaaga1380tcgggctcggaattattggaagaatttttaacgtcggaagaacaagttctttctttgacc1440ttcccacgagcttcttctagtttgtggggagtatatagaagtcggatttggtatttggat1500attttttgtatcaatgatctggcgaattatcaatgattcattcttagattttctaaatat1560aaatttgtttctaaatga1578<210>83<211>20<212>dna<213>本生烟<400>83cttgtgctagaactttagct20<210>84<211>20<212>dna<213>本生烟<400>84cgttcatctggaaatcttgg20<210>85<211>20<212>dna<213>烟草<400>85aagaacttcccccttgacag20<210>86<211>20<212>dna<213>烟草<400>86tatacaggatgggtagaaag20<210>87<211>20<212>dna<213>烟草<400>87atataatttttaataaaggg20<210>88<211>20<212>dna<213>烟草<400>88ctagtcttcgacacaagaaa20<210>89<211>20<212>dna<213>大豆<400>89ataacagaagttaaagaaga20<210>90<211>20<212>dna<213>大豆<400>90atctggaaaccatagaacag20<210>91<211>20<212>dna<213>大豆<400>91ctatttcgacacaaacaaga20<210>92<211>20<212>dna<213>大豆<400>92ctttctttgacgaattcgag20<210>93<211>36<212>dna<213>烟草<400>93acgagagttgttgaaactagcatattggaagatcaa36<210>94<211>36<212>dna<213>人工序列<220><223>合成构建体<400>94acgagagttattgaatgtagcatactgaaagatcaa36<210>95<211>14<212>prt<213>酿酒酵母<400>95metvalleuproargleutyrthralathrserargalaala1510<210>96<211>1384<212>prt<213>人工序列<220><223>合成构建体<400>96metvalleuproargleutyrthralathrserargalaalaleuser151015thrasplyslystyrserileglyleuaspileglythrasnserval202530glytrpalavalilethraspglutyrlysvalproserlyslysphe354045lysvalleuglyasnthrasparghisserilelyslysasnleuile505560glyalaleuleupheaspserglygluthralaglualathrargleu65707580lysargthralaargargargtyrthrargarglysasnargilecys859095tyrleuglngluilepheserasnglumetalalysvalaspaspser100105110phephehisargleuglugluserpheleuvalglugluasplyslys115120125hisgluarghisproilepheglyasnilevalaspgluvalalatyr130135140hisglulystyrprothriletyrhisleuarglyslysleuvalasp145150155160serthrasplysalaaspleuargleuiletyrleualaleualahis165170175metilelyspheargglyhispheleuilegluglyaspleuasnpro180185190aspasnseraspvalasplysleupheileglnleuvalglnthrtyr195200205asnglnleupheglugluasnproileasnalaserglyvalaspala210215220lysalaileleuseralaargleuserlysserargargleugluasn225230235240leuilealaglnleuproglyglulyslysasnglyleupheglyasn245250255leuilealaleuserleuglyleuthrproasnphelysserasnphe260265270aspleualagluaspalalysleuglnleuserlysaspthrtyrasp275280285aspaspleuaspasnleuleualaglnileglyaspglntyralaasp290295300leupheleualaalalysasnleuseraspalaileleuleuserasp305310315320ileleuargvalasnthrgluilethrlysalaproleuseralaser325330335metilelysargtyraspgluhishisglnaspleuthrleuleulys340345350alaleuvalargglnglnleuproglulystyrlysgluilephephe355360365aspglnserlysasnglytyralaglytyrileaspglyglyalaser370375380glnglugluphetyrlyspheilelysproileleuglulysmetasp385390395400glythrglugluleuleuvallysleuasnarggluaspleuleuarg405410415lysglnargthrpheaspasnglyserileprohisglnilehisleu420425430glygluleuhisalaileleuargargglngluaspphetyrprophe435440445leulysaspasnargglulysileglulysileleuthrpheargile450455460protyrtyrvalglyproleualaargglyasnserargphealatrp465470475480metthrarglysserglugluthrilethrprotrpasnphegluglu485490495valvalasplysglyalaseralaglnserpheilegluargmetthr500505510asnpheasplysasnleuproasnglulysvalleuprolyshisser515520525leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys530535540tyrvalthrgluglymetarglysproalapheleuserglyglugln545550555560lyslysalailevalaspleuleuphelysthrasnarglysvalthr565570575vallysglnleulysgluasptyrphelyslysileglucyspheasp580585590servalgluileserglyvalgluaspargpheasnalaserleugly595600605thrtyrhisaspleuleulysileilelysasplysasppheleuasp610615620asnglugluasngluaspileleugluaspilevalleuthrleuthr625630635640leuphegluaspargglumetileglugluargleulysthrtyrala645650655hisleupheaspasplysvalmetlysglnleulysargargargtyr660665670thrglytrpglyargleuserarglysleuileasnglyileargasp675680685lysglnserglylysthrileleuasppheleulysseraspglyphe690695700alaasnargasnphemetglnleuilehisaspaspserleuthrphe705710715720lysgluaspileglnlysalaglnvalserglyglnglyaspserleu725730735hisgluhisilealaasnleualaglyserproalailelyslysgly740745750ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly755760765arghislysprogluasnilevalileglumetalaarggluasngln770775780thrthrglnlysglyglnlysasnserarggluargmetlysargile785790795800glugluglyilelysgluleuglyserglnileleulysgluhispro805810815valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu820825830glnasnglyargaspmettyrvalaspglngluleuaspileasnarg835840845leuserasptyraspvalasphisilevalproglnserpheleulys850855860aspaspserileaspasnlysvalleuthrargserasplysasnarg865870875880glylysseraspasnvalproserglugluvalvallyslysmetlys885890895asntyrtrpargglnleuleuasnalalysleuilethrglnarglys900905910pheaspasnleuthrlysalagluargglyglyleusergluleuasp915920925lysalaglypheilelysargglnleuvalgluthrargglnilethr930935940lyshisvalalaglnileleuaspserargmetasnthrlystyrasp945950955960gluasnasplysleuilearggluvallysvalilethrleulysser965970975lysleuvalseraspphearglysasppheglnphetyrlysvalarg980985990gluileasnasntyrhishisalahisaspalatyrleuasnalaval99510001005valglythralaleuilelyslystyrprolysleugluserglu101010151020phevaltyrglyasptyrlysvaltyraspvalarglysmetile102510301035alalyssergluglngluileglylysalathralalystyrphe104010451050phetyrserasnilemetasnphephelysthrgluilethrleu105510601065alaasnglygluilearglysargproleuilegluthrasngly107010751080gluthrglygluilevaltrpasplysglyargaspphealathr108510901095valarglysvalleusermetproglnvalasnilevallyslys110011051110thrgluvalglnthrglyglypheserlysgluserileleupro111511201125lysargasnserasplysleuilealaarglyslysasptrpasp113011351140prolyslystyrglyglypheaspserprothrvalalatyrser114511501155valleuvalvalalalysvalglulysglylysserlyslysleu116011651170lysservallysgluleuleuglyilethrilemetgluargser117511801185serpheglulysasnproileasppheleuglualalysglytyr119011951200lysgluvallyslysaspleuileilelysleuprolystyrser120512101215leuphegluleugluasnglyarglysargmetleualaserala122012251230glygluleuglnlysglyasngluleualaleuproserlystyr123512401245valasnpheleutyrleualaserhistyrglulysleulysgly125012551260serprogluaspasngluglnlysglnleuphevalgluglnhis126512701275lyshistyrleuaspgluileilegluglnileserglupheser128012851290lysargvalileleualaaspalaasnleuasplysvalleuser129513001305alatyrasnlyshisargasplysproilearggluglnalaglu131013151320asnileilehisleuphethrleuthrasnleuglyalaproala132513301335alaphelystyrpheaspthrthrileasparglysargtyrthr134013451350serthrlysgluvalleuaspalathrleuilehisglnserile135513601365thrglyleutyrgluthrargileaspleuserglnleuglygly137013751380asp<210>97<211>12<212>prt<213>酿酒酵母<400>97metlysserpheilethrargasnlysthralaile1510<210>98<211>1379<212>prt<213>人工序列<220><223>合成构建体<400>98metlysserpheilethrargasnlysthralaileasplyslystyr151015serileglyleuaspileglythrasnservalglytrpalavalile202530thraspglutyrlysvalproserlyslysphelysvalleuglyasn354045thrasparghisserilelyslysasnleuileglyalaleuleuphe505560aspserglygluthralaglualathrargleulysargthralaarg65707580argargtyrthrargarglysasnargilecystyrleuglngluile859095pheserasnglumetalalysvalaspaspserphephehisargleu100105110glugluserpheleuvalglugluasplyslyshisgluarghispro115120125ilepheglyasnilevalaspgluvalalatyrhisglulystyrpro130135140thriletyrhisleuarglyslysleuvalaspserthrasplysala145150155160aspleuargleuiletyrleualaleualahismetilelysphearg165170175glyhispheleuilegluglyaspleuasnproaspasnseraspval180185190asplysleupheileglnleuvalglnthrtyrasnglnleupheglu195200205gluasnproileasnalaserglyvalaspalalysalaileleuser210215220alaargleuserlysserargargleugluasnleuilealaglnleu225230235240proglyglulyslysasnglyleupheglyasnleuilealaleuser245250255leuglyleuthrproasnphelysserasnpheaspleualagluasp260265270alalysleuglnleuserlysaspthrtyraspaspaspleuaspasn275280285leuleualaglnileglyaspglntyralaaspleupheleualaala290295300lysasnleuseraspalaileleuleuseraspileleuargvalasn305310315320thrgluilethrlysalaproleuseralasermetilelysargtyr325330335aspgluhishisglnaspleuthrleuleulysalaleuvalarggln340345350glnleuproglulystyrlysgluilephepheaspglnserlysasn355360365glytyralaglytyrileaspglyglyalaserglnglugluphetyr370375380lyspheilelysproileleuglulysmetaspglythrglugluleu385390395400leuvallysleuasnarggluaspleuleuarglysglnargthrphe405410415aspasnglyserileprohisglnilehisleuglygluleuhisala420425430ileleuargargglngluaspphetyrpropheleulysaspasnarg435440445glulysileglulysileleuthrpheargileprotyrtyrvalgly450455460proleualaargglyasnserargphealatrpmetthrarglysser465470475480glugluthrilethrprotrpasnpheglugluvalvalasplysgly485490495alaseralaglnserpheilegluargmetthrasnpheasplysasn500505510leuproasnglulysvalleuprolyshisserleuleutyrglutyr515520525phethrvaltyrasngluleuthrlysvallystyrvalthrglugly530535540metarglysproalapheleuserglygluglnlyslysalaileval545550555560aspleuleuphelysthrasnarglysvalthrvallysglnleulys565570575gluasptyrphelyslysileglucyspheaspservalgluileser580585590glyvalgluaspargpheasnalaserleuglythrtyrhisaspleu595600605leulysileilelysasplysasppheleuaspasnglugluasnglu610615620aspileleugluaspilevalleuthrleuthrleuphegluasparg625630635640glumetileglugluargleulysthrtyralahisleupheaspasp645650655lysvalmetlysglnleulysargargargtyrthrglytrpglyarg660665670leuserarglysleuileasnglyileargasplysglnserglylys675680685thrileleuasppheleulysseraspglyphealaasnargasnphe690695700metglnleuilehisaspaspserleuthrphelysgluaspilegln705710715720lysalaglnvalserglyglnglyaspserleuhisgluhisileala725730735asnleualaglyserproalailelyslysglyileleuglnthrval740745750lysvalvalaspgluleuvallysvalmetglyarghislysproglu755760765asnilevalileglumetalaarggluasnglnthrthrglnlysgly770775780glnlysasnserarggluargmetlysargileglugluglyilelys785790795800gluleuglyserglnileleulysgluhisprovalgluasnthrgln805810815leuglnasnglulysleutyrleutyrtyrleuglnasnglyargasp820825830mettyrvalaspglngluleuaspileasnargleuserasptyrasp835840845valasphisilevalproglnserpheleulysaspaspserileasp850855860asnlysvalleuthrargserasplysasnargglylysseraspasn865870875880valproserglugluvalvallyslysmetlysasntyrtrparggln885890895leuleuasnalalysleuilethrglnarglyspheaspasnleuthr900905910lysalagluargglyglyleusergluleuasplysalaglypheile915920925lysargglnleuvalgluthrargglnilethrlyshisvalalagln930935940ileleuaspserargmetasnthrlystyraspgluasnasplysleu945950955960ilearggluvallysvalilethrleulysserlysleuvalserasp965970975phearglysasppheglnphetyrlysvalarggluileasnasntyr980985990hishisalahisaspalatyrleuasnalavalvalglythralaleu99510001005ilelyslystyrprolysleuglusergluphevaltyrglyasp101010151020tyrlysvaltyraspvalarglysmetilealalysserglugln102510301035gluileglylysalathralalystyrphephetyrserasnile104010451050metasnphephelysthrgluilethrleualaasnglygluile105510601065arglysargproleuilegluthrasnglygluthrglygluile107010751080valtrpasplysglyargaspphealathrvalarglysvalleu108510901095sermetproglnvalasnilevallyslysthrgluvalglnthr110011051110glyglypheserlysgluserileleuprolysargasnserasp111511201125lysleuilealaarglyslysasptrpaspprolyslystyrgly113011351140glypheaspserprothrvalalatyrservalleuvalvalala114511501155lysvalglulysglylysserlyslysleulysservallysglu116011651170leuleuglyilethrilemetgluargserserpheglulysasn117511801185proileasppheleuglualalysglytyrlysgluvallyslys119011951200aspleuileilelysleuprolystyrserleuphegluleuglu120512101215asnglyarglysargmetleualaseralaglygluleuglnlys122012251230glyasngluleualaleuproserlystyrvalasnpheleutyr123512401245leualaserhistyrglulysleulysglyserprogluaspasn125012551260gluglnlysglnleuphevalgluglnhislyshistyrleuasp126512701275gluileilegluglnileserglupheserlysargvalileleu128012851290alaaspalaasnleuasplysvalleuseralatyrasnlyshis129513001305argasplysproilearggluglnalagluasnileilehisleu131013151320phethrleuthrasnleuglyalaproalaalaphelystyrphe132513301335aspthrthrileasparglysargtyrthrserthrlysgluval134013451350leuaspalathrleuilehisglnserilethrglyleutyrglu135513601365thrargileaspleuserglnleuglyglyasp13701375<210>99<211>39<212>dna<213>人工序列<220><223>合成构建体<400>99aaagagctcggatcctctatgtattaatagaatctatag39<210>100<211>33<212>dna<213>人工序列<220><223>合成构建体<400>100aaaccatggtagattaatattattaaatttaag33<210>101<211>48<212>dna<213>人工序列<220><223>合成构建体<400>101aaaccatgggtatatctccttctttaaatttaagtaaaaaaactacac48<210>102<211>80<212>dna<213>人工序列<220><223>合成构建体<400>102aaaagagctcacatataccttggttgacacgagtatataagtcatgttatactgttgaat60gggagaccacaacggtttcc80<210>103<211>37<212>dna<213>人工序列<220><223>合成构建体<400>103ttttatgcatatgtatatctccttcttaaagttaaac37<210>104<211>27<212>dna<213>人工序列<220><223>合成构建体<400>104aaaagagctcgctcccccgccgtcgtt27<210>105<211>43<212>dna<213>人工序列<220><223>合成构建体<400>105ctgaatctgggggaacactttcccagaaatatagtcatccctg43<210>106<211>42<212>dna<213>人工序列<220><223>合成构建体<400>106gggatgactatatttctgggaaagtgttcccccagattcaga42<210>107<211>33<212>dna<213>人工序列<220><223>合成构建体<400>107ttttatgcatagagttttcttgccccctatttg33<210>108<211>3537<212>dna<213>苏云金芽孢杆菌<400>108atggataacaatccgaacatcaatgaatgcattccttataattgtttaagtaaccctgaa60gtagaagtattaggtggagaaagaatagaaactggttacaccccaatcgatatttccttg120tcgctaacgcaatttcttttgagtgaatttgttcccggtgctggatttgtgttaggacta180gttgatataatatggggaatttttggtccctctcaatgggacgcatttcttgtacaaatt240gaacagttaattaaccaaagaatagaagaattcgctaggaaccaagccatttctagatta300gaaggactaagcaatctttatcaaatttacgcagaatcttttagagagtgggaagcagat360cctactaatccagcattaagagaagagatgcgtattcaattcaatgacatgaacagtgcc420cttacaaccgctattcctctttttgcagttcaaaattatcaagttcctcttttatcagta480tatgttcaagctgcaaatttacatttatcagttttgagagatgtttcagtgtttggacaa540aggtggggatttgatgccgcgactatcaatagtcgttataatgatttaactaggcttatt600ggcaactatacagattatgctgtacgctggtacaatacgggattagaacgtgtatgggga660ccggattctagagattgggtaaggtataatcaatttagaagagaattaacactaactgta720ttagatatcgttgctctgttcccgaattatgatagtagaagatatccaattcgaacagtt780tcccaattaacaagagaaatttatacaaacccagtattagaaaattttgatggtagtttt840cgaggctcggctcagggcatagaaagaagtattaggagtccacatttgatggatatactt900aacagtataaccatctatacggatgctcataggggttattattattggtcagggcatcaa960ataatggcttctcctgtcggtttttcggggccagaattcacgtttccgctatatggaacc1020atgggaaatgcagctccacaacaacgtattgttgctcaactaggtcagggcgtgtataga1080acattatcgtccactttatatagaagaccttttaatatagggataaataatcaacaacta1140tctgttcttgacgggacagaatttgcttatggaacctcctcaaatttgccatccgctgta1200tacagaaaaagcggaacggtagattcgctggatgaaataccgccacagaataacaacgtg1260ccacctaggcaaggatttagtcatcgattaagccatgtttcaatgtttcgttcaggcttt1320agtaatagtagtgtaagtataataagagctcctatgttctcttggatacatcgtagtgct1380gaatttaataatataattgcatcggatagtattactcaaatccctgcagtgaagggaaac1440tttctttttaatggttctgtaatttcaggaccaggatttactggtggggacttagttaga1500ttaaatagtagtggaaataacattcagaatagagggtatattgaagttccaattcacttc1560ccatcgacatctaccagatatcgagttcgtgtacggtatgcttctgtaaccccgattcac1620ctcaacgttaattggggtaattcatccattttttccaatacagtaccagctacagctacg1680tcattagataatctacaatcaagtgattttggttattttgaaagtgccaatgcttttaca1740tcttcattaggtaatatagtaggtgttagaaattttagtgggactgcaggagtgataata1800gacagatttgaatttattccagttactgcaacactcgaggctgaatataatctggaaaga1860gcgcagaaggcggtgaatgcgctgtttacgtctacaaaccaactagggctaaaaacaaat1920gtaacggattatcatattgatcaagtgtccaatttagttacgtatttatcggatgaattt1980tgtctggatgaaaagcgagaattgtccgagaaagtcaaacatgcgaagcgactcagtgat2040gaacgcaatttactccaagattcaaatttcaaagacattaataggcaaccagaacgtggg2100tggggcggaagtacagggattaccatccaaggaggggatgacgtatttaaagaaaattac2160gtcacactatcaggtacctttgatgagtgctatccaacatatttgtatcaaaaaatcgat2220gaatcaaaattaaaagcctttacccgttatcaattaagagggtatatcgaagatagtcaa2280gacttagaaatctatttaattcgctacaatgcaaaacatgaaacagtaaatgtgccaggt2340acgggttccttatggccgctttcagcccaaagtccaatcggaaagtgtggagagccgaat2400cgatgcgcgccacaccttgaatggaatcctgacttagattgttcgtgtagggatggagaa2460aagtgtgcccatcattcgcatcatttctccttagacattgatgtaggatgtacagactta2520aatgaggacctaggtgtatgggtgatctttaagattaagacgcaagatgggcacgcaaga2580ctagggaatctagagtttctcgaagagaaaccattagtaggagaagcgctagctcgtgtg2640aaaagagcggagaaaaaatggagagacaaacgtgaaaaattggaatgggaaacaaatatc2700gtttataaagaggcaaaagaatctgtagatgctttatttgtaaactctcaatatgatcaa2760ttacaagcggatacgaatattgccatgattcatgcggcagataaacgtgttcatagcatt2820cgagaagcttatctgcctgagctgtctgtgattccgggtgtcaatgcggctatttttgaa2880gaattagaagggcgtattttcactgcattctccctatatgatgcgagaaatgtcattaaa2940aatggtgattttaataatggcttatcctgctggaacgtgaaagggcatgtagatgtagaa3000gaacaaaacaaccaacgttcggtccttgttgttccggaatgggaagcagaagtgtcacaa3060gaagttcgtgtctgtccgggtcgtggctatatccttcgtgtcacagcgtacaaggaggga3120tatggagaaggttgcgtaaccattcatgagatcgagaacaatacagacgaactgaagttt3180agcaactgcgtagaagaggaaatctatccaaataacacggtaacgtgtaatgattatact3240gtaaatcaagaagaatacggaggtgcgtacacttctcgtaatcgaggatataacgaagct3300ccttccgtaccagctgattatgcgtcagtctatgaagaaaaatcgtatacagatggacga3360agagagaatccttgtgaatttaacagagggtatagggattacacgccactaccagttggt3420tatgtgacaaaagaattagaatacttcccagaaaccgataaggtatggattgagattgga3480gaaacggaaggaacatttatcgtggacagcgtggaattactccttatggaggaatag3537<210>109<211>1178<212>prt<213>苏云金芽孢杆菌<400>109metaspasnasnproasnileasnglucysileprotyrasncysleu151015serasnprogluvalgluvalleuglyglygluargilegluthrgly202530tyrthrproileaspileserleuserleuthrglnpheleuleuser354045gluphevalproglyalaglyphevalleuglyleuvalaspileile505560trpglyilepheglyproserglntrpaspalapheleuvalglnile65707580gluglnleuileasnglnargileglugluphealaargasnglnala859095ileserargleugluglyleuserasnleutyrglniletyralaglu100105110serpheargglutrpglualaaspprothrasnproalaleuargglu115120125glumetargileglnpheasnaspmetasnseralaleuthrthrala130135140ileproleuphealavalglnasntyrglnvalproleuleuserval145150155160tyrvalglnalaalaasnleuhisleuservalleuargaspvalser165170175valpheglyglnargtrpglypheaspalaalathrileasnserarg180185190tyrasnaspleuthrargleuileglyasntyrthrasptyralaval195200205argtrptyrasnthrglyleugluargvaltrpglyproaspserarg210215220asptrpvalargtyrasnglnpheargarggluleuthrleuthrval225230235240leuaspilevalalaleupheproasntyraspserargargtyrpro245250255ileargthrvalserglnleuthrarggluiletyrthrasnproval260265270leugluasnpheaspglyserpheargglyseralaglnglyileglu275280285argserileargserprohisleumetaspileleuasnserilethr290295300iletyrthraspalahisargglytyrtyrtyrtrpserglyhisgln305310315320ilemetalaserprovalglypheserglyprogluphethrphepro325330335leutyrglythrmetglyasnalaalaproglnglnargilevalala340345350glnleuglyglnglyvaltyrargthrleuserserthrleutyrarg355360365argpropheasnileglyileasnasnglnglnleuservalleuasp370375380glythrgluphealatyrglythrserserasnleuproseralaval385390395400tyrarglysserglythrvalaspserleuaspgluileproprogln405410415asnasnasnvalproproargglnglypheserhisargleuserhis420425430valsermetpheargserglypheserasnserservalserileile435440445argalaprometphesertrpilehisargseralaglupheasnasn450455460ileilealaseraspserilethrglnileproalavallysglyasn465470475480pheleupheasnglyservalileserglyproglyphethrglygly485490495aspleuvalargleuasnserserglyasnasnileglnasnarggly500505510tyrilegluvalproilehispheproserthrserthrargtyrarg515520525valargvalargtyralaservalthrproilehisleuasnvalasn530535540trpglyasnserserilepheserasnthrvalproalathralathr545550555560serleuaspasnleuglnserserasppheglytyrphegluserala565570575asnalaphethrserserleuglyasnilevalglyvalargasnphe580585590serglythralaglyvalileileaspargpheglupheileproval595600605thralathrleuglualaglutyrasnleugluargalaglnlysala610615620valasnalaleuphethrserthrasnglnleuglyleulysthrasn625630635640valthrasptyrhisileaspglnvalserasnleuvalthrtyrleu645650655seraspgluphecysleuaspglulysarggluleuserglulysval660665670lyshisalalysargleuseraspgluargasnleuleuglnaspser675680685asnphelysaspileasnargglnprogluargglytrpglyglyser690695700thrglyilethrileglnglyglyaspaspvalphelysgluasntyr705710715720valthrleuserglythrpheaspglucystyrprothrtyrleutyr725730735glnlysileaspgluserlysleulysalaphethrargtyrglnleu740745750argglytyrilegluaspserglnaspleugluiletyrleuilearg755760765tyrasnalalyshisgluthrvalasnvalproglythrglyserleu770775780trpproleuseralaglnserproileglylyscysglygluproasn785790795800argcysalaprohisleuglutrpasnproaspleuaspcyssercys805810815argaspglyglulyscysalahishisserhishispheserleuasp820825830ileaspvalglycysthraspleuasngluaspleuglyvaltrpval835840845ilephelysilelysthrglnaspglyhisalaargleuglyasnleu850855860glupheleugluglulysproleuvalglyglualaleualaargval865870875880lysargalaglulyslystrpargasplysargglulysleuglutrp885890895gluthrasnilevaltyrlysglualalysgluservalaspalaleu900905910phevalasnserglntyraspglnleuglnalaaspthrasnileala915920925metilehisalaalaasplysargvalhisserileargglualatyr930935940leuprogluleuservalileproglyvalasnalaalailepheglu945950955960gluleugluglyargilephethralapheserleutyraspalaarg965970975asnvalilelysasnglyasppheasnasnglyleusercystrpasn980985990vallysglyhisvalaspvalglugluglnasnasnglnargserval99510001005leuvalvalproglutrpglualagluvalserglngluvalarg101010151020valcysproglyargglytyrileleuargvalthralatyrlys102510301035gluglytyrglygluglycysvalthrilehisgluilegluasn104010451050asnthraspgluleulyspheserasncysvalgluglugluile105510601065tyrproasnasnthrvalthrcysasnasptyrthrvalasngln107010751080gluglutyrglyglyalatyrthrserargasnargglytyrasn108510901095glualaproservalproalaasptyralaservaltyrgluglu110011051110lyssertyrthraspglyargarggluasnprocysglupheasn111511201125argglytyrargasptyrthrproleuprovalglytyrvalthr113011351140lysgluleuglutyrpheprogluthrasplysvaltrpileglu114511501155ileglygluthrgluglythrpheilevalaspservalgluleu116011651170leuleumetgluglu1175<210>110<211>1848<212>dna<213>苏云金芽孢杆菌<400>110atggataacaatccgaacatcaatgaatgcattccttataattgtttaagtaaccctgaa60gtagaagtattaggtggagaaagaatagaaactggttacaccccaatcgatatttccttg120tcgctaacgcaatttcttttgagtgaatttgttcccggtgctggatttgtgttaggacta180gttgatataatatggggaatttttggtccctctcaatgggacgcatttcttgtacaaatt240gaacagttaattaaccaaagaatagaagaattcgctaggaaccaagccatttctagatta300gaaggactaagcaatctttatcaaatttacgcagaatcttttagagagtgggaagcagat360cctactaatccagcattaagagaagagatgcgtattcaattcaatgacatgaacagtgcc420cttacaaccgctattcctctttttgcagttcaaaattatcaagttcctcttttatcagta480tatgttcaagctgcaaatttacatttatcagttttgagagatgtttcagtgtttggacaa540aggtggggatttgatgccgcgactatcaatagtcgttataatgatttaactaggcttatt600ggcaactatacagattatgctgtacgctggtacaatacgggattagaacgtgtatgggga660ccggattctagagattgggtaaggtataatcaatttagaagagaattaacactaactgta720ttagatatcgttgctctgttcccgaattatgatagtagaagatatccaattcgaacagtt780tcccaattaacaagagaaatttatacaaacccagtattagaaaattttgatggtagtttt840cgaggctcggctcagggcatagaaagaagtattaggagtccacatttgatggatatactt900aacagtataaccatctatacggatgctcataggggttattattattggtcagggcatcaa960ataatggcttctcctgtcggtttttcggggccagaattcacgtttccgctatatggaacc1020atgggaaatgcagctccacaacaacgtattgttgctcaactaggtcagggcgtgtataga1080acattatcgtccactttatatagaagaccttttaatatagggataaataatcaacaacta1140tctgttcttgacgggacagaatttgcttatggaacctcctcaaatttgccatccgctgta1200tacagaaaaagcggaacggtagattcgctggatgaaataccgccacagaataacaacgtg1260ccacctaggcaaggatttagtcatcgattaagccatgtttcaatgtttcgttcaggcttt1320agtaatagtagtgtaagtataataagagctcctatgttctcttggatacatcgtagtgct1380gaatttaataatataattgcatcggatagtattactcaaatccctgcagtgaagggaaac1440tttctttttaatggttctgtaatttcaggaccaggatttactggtggggacttagttaga1500ttaaatagtagtggaaataacattcagaatagagggtatattgaagttccaattcacttc1560ccatcgacatctaccagatatcgagttcgtgtacggtatgcttctgtaaccccgattcac1620ctcaacgttaattggggtaattcatccattttttccaatacagtaccagctacagctacg1680tcattagataatctacaatcaagtgattttggttattttgaaagtgccaatgcttttaca1740tcttcattaggtaatatagtaggtgttagaaattttagtgggactgcaggagtgataata1800gacagatttgaatttattccagttactgcaacactcgaggctgaatag1848<210>111<211>750<212>dna<213>苏云金芽孢杆菌<400>111atggaaaatttaaatcattgtccattagaagatataaaggtaaatccatggaaaacccct60caatcaacagcaagggttattacattacgtgttgaggatccaaatgaaatcaataatctt120ctttctattaacgaaattgataatccgaattatatattgcaagcaattatgttagcaaat180gcatttcaaaatgcattagttcccacttctacagattttggtgatgccctacgctttagt240atgccaaaaggtttagaaatcgcaaacacaattacaccgatgggtgctgtagtgagttat300gttgatcaaaatgtaactcaaacgaataaccaagtaagtgttatgattaataaagtctta360gaagtgttaaaaactgtattaggagttgcattaagtggatctgtaatagatcaattaact420gcagcagttacaaatacgtttacaaatttaaatactcaaaaaaatgaagcatggattttc480tggggcaaggaaactgctaatcaaacaaattacacatacaatgtcctgtttgcaatccaa540aatgcccaaactggtggcgttatgtattgtgtaccagttggttttgaaattaaagtatca600gcagtaaaggaacaagttttatttttcacaattcaagattctgcgagctacaatgttaac660atccaatctttgaaatttgcacaaccattagttagctcaagtcagtatccaattgcagat720cttactagcgctattaatggaaccctctaa750<210>112<211>549<212>dna<213>苏云金芽孢杆菌<400>112atgacagaaaatggagtgttttataaaatattcacaacagaaaataataatttttgtata60aatcctactttgttagaaagggtttttaaaaataatttagatgaatttgatttttcgcta120gtaaaaaaaaacttagaacatgagaagaattgtgtgattacttctacaatgaatcaaaca180atttctttcgagaatatgaatagtacagaaatggggcataagacatattcttttttaaat240caaacagtattaaataataaggggaattcttctttagaggaacaagtctctaatattttt300tatagatgtgtatatatggaagttggaaaatcaagttcatatattaaacctcttgagcag360gattctaataaaataaggtatgtttgtagtttgctctttatagtgccctataagaataac420ataacatcaattattccagtaaatttacaactaacattattatcgaaaaatgtaaaacaa480tcctcttctacaaatatattttcaggagatatacattttaatatggtaacaatgacttat540ttaacttaa549<210>113<211>540<212>dna<213>苏云金芽孢杆菌<400>113atgaatatgaattttgatttcgaggatcatgaaaataagaatttatctgtgcaggaggaa60catcaccattgtagtgaaggaggggaacataaaatagcattttgttgtgtagtctcaatt120ccaaaaggttttaaatatgttgcccattgtgatccgaaatttgtatataaccttgattgt180ctatccgtttcaaaagaaaaatgccgtaaggttgttcctatagaaggatgtggatgtgca240gaggtagatttacatgtattaaaggtaaagggatgcatctcatttgtatcgaatatagaa300atagaacctattcatgaatgcatgacctgctcagcaaatccacataaagaaaacattgct360gtgagttgccaagatactgtctgcgtagatcaagttttgtattgcagtgtagattgtttg420ccagattgtgatattaattgtgataatgtaaaaatttgcgatgtgagcattgaaccaatt480ggagattgtgattgtcacgcggtgaaaattaaagggaaattttcacttcactataaataa540<210>114<211>2155<212>dna<213>大豆异皮线虫<400>114tattcttgggtctgcaactaacaaatcccaaagaatttttccggtagaaacatgttttgg60acacgttggagaggaatcaaaatatgttgctgtgatccaaataagaaaacaaatttatat120caaacatttagatccaaattcaatcattttctaaacaacagctgacaaataattgaattc180atcaagaagtttccatcggtttctgttgttcgataggcccaatttgactcaacagcgctc240caatcgcttcgacatttaaaatttgctgctcacaatacccaggctgaatagttacaacag300ttctgttagtatttattagctttctaaaaatgaacttgcctccccattggtgccatccac360ccatttgagcaccttaaaaatgaattgctagtaaattaacgtgtatttttgtattcaccg420caatttcgatattctgcgcccccgattggaccactggggctaaagacttgagcatcagtt480taagcgtagactcctcatcagctgtgttgtcgttgccgtattctttctccagatactcct540tcacaatcttttcatttcgccctattgaaccggccaacaattcgtagtaaactccggacg600gttccgtcttgaaaagatgaggggtcccatcagaatcgaagcctccgacaagcattgaaa660ttccaaaaggccgacggccagtggtttgagtgtatctctaaacaaacaaaaagttactca720gatgttgtaagtcaattgacctgttttatatcagctatgatgcgagagatatgcatgaca780gatacgcggtcctcaagcgtcaatttgtaattttcgcattcaactcgagcacggtcgata840aggacgcgtgcatcggcgctgagtccggcgaatgcgaccataacatgctaaacataggcg900tgcattgaagaggaataaggaatttaccgaatccaatgcatgtattttacgaatggtacg960ttcgtcttgcagagtcgggatagatttctgcaaaataaaagttcaccagaacagtttaag1020caatttttatgtctgtgaatacactagctaaaaataatttactttttcgactccaattac1080aacacaattttttcctttcacggcaacctaaagcaatgcacattaatatttttaaaaagc1140aataaaacgcaccgctgttgagcccttcttcactgcttcttgcgcatagtcaacttgaaa1200aagtctgccatccggagaaaaaatcgtaattgcacgatcataacgctccatagtttattt1260gctaaaatcaagcttacaaaaagcggttaggcatttaaaatttaagctccgtaaaaattc1320aattaaaaatcatcacatttatttttttaatttttcaatttttaaatttttcttttttgg1380cgaactgtctacccttgtaacttctaaaaaaggagttgagactgaaatcccgcgccagat1440cccgtcccgacctgtctctgttttccatagtgaacaaataattattgttgtatttttact1500ctttcgctgctccacacacatctctttcatgaactttagacaaaaagtattttaatgcgt1560cttgagaagtgttggttttgttcatcaacaatttatccgggccacggaattcaattcgta1620cgtaacgacgcaacggtgaaaacaatttattgttatagtacataataaattaaaattttt1680gtttaggttttcaagttttgtaggtcaaaatgcaacaaattatttaaaaagaagaagaac1740ccgcgcaaattgaaatggacgaaggcatcgcggcgaattcggggaaaagttagtgtttga1800tttttgtttttactcttttacatttattgtaaatttaaatttcttttactctttaggaat1860tggtcaacgatgttactcaagcgatggaaattcgcagaaacgaaccgacaaaatatgata1920gaaacctttgggaaactgcaggtaaatcgtccatatataccaacaaaccgtaacgacgaa1980aaaaagtaccggaagggagaatccgcaaaatctttgctctcggacacttaaacatttttc2040ctgttttaaatttttcatggacgaaaaaacatatacagcggttttcgccaaaaaaaaaat2100aaccaatttgggtagacaagtatgtctaataaatcttccatttgaattttgattt2155<210>115<211>148<212>dna<213>大豆异皮线虫<400>115tcatttcgccctattgaaccggccaacaattcgtagtaaactccggacggttccgtcttg60aaaagatgaggggtcccatcagaatcgaagcctccgacaagcattgaaattccaaaaggc120cgacggccagtggtttgagtgtatctct148<210>116<211>23<212>dna<213>酿酒酵母<400>116ttctttgaagtatcaggaggtgg23<210>117<211>23<212>dna<213>酿酒酵母<400>117atgattattgcaattccaacagg23<210>118<211>23<212>dna<213>酿酒酵母<400>118gctatttttagtggtatggcagg23<210>119<211>24<212>dna<213>酿酒酵母<400>119accatgtaaatattgtgaaccagg24<210>120<211>4107<212>dna<213>人工序列<220><223>合成构建体<400>120atggataaaaaatattcaatcggtttagatatcggtacaaattcagtaggttgagctgta60atcacagatgaatataaagtaccttcaaaaaaatttaaagtattaggtaatacagataga120cattcaatcaaaaaaaatttaatcggtgctttattatttgattcaggtgaaacagctgaa180gctacaagattaaaaagaacagctagaagaagatatacaagaagaaaaaatagaatctgt240tatttacaagaaatcttttcaaatgaaatggctaaagtagatgattcatttttccataga300ttagaagaatcatttttagttgaagaagataaaaaacatgaaagacatcctatctttggt360aatatcgtagatgaagtagcttatcatgaaaaatatcctacaatctatcatttaagaaaa420aaattagtagattcaactgataaagctgatttaagattaatctatttagctttagctcat480atgatcaaatttagaggtcatttcttaatcgaaggtgatttaaatcctgataattcagat540gtagataaattattcatccaattagtacaaacatataatcaattatttgaagaaaatcct600atcaatgcttcaggtgtagatgctaaagcaatcttatcagctagattatcaaaatcaaga660agattagaaaatttaatcgctcaattacctggagaaaaaaaaaatggtttatttggtaat720ttaatcgcattatcattaggtttaactcctaatttcaaatcaaatttcgatttagctgaa780gatgcaaaattacaattatctaaagatacatatgatgatgatttagataatttattagct840caaatcggtgatcaatatgctgatttattcttagctgctaaaaatttatcagatgctatc900ttattatcagatatcttaagagtaaatacagaaatcacaaaagcacctttatcagcttca960atgatcaaaagatatgatgaacatcatcaagatttaacattattaaaagctttagtaaga1020caacaattaccagaaaaatataaagaaatcttctttgatcaatcaaaaaatggttatgct1080ggttatatcgatggtggtgcttctcaagaagaattctataaattcatcaaacctatctta1140gaaaaaatggatggtacagaagaattattagtaaaattaaatagagaagatttattaaga1200aaacaaagaacatttgataatggttcaatccctcatcaaatccatttaggtgaattacat1260gcaatcttaagaagacaagaagatttttatcctttcttaaaagataatagagaaaaaatc1320gaaaaaatcttaacatttagaatcccttattatgtaggtcctttagctagaggtaattca1380agatttgcttgaatgacaagaaaatcagaagaaacaatcacaccttggaattttgaagaa1440gtagtagataaaggagcttcagcacaatcatttatcgaaagaatgacaaattttgataaa1500aatttacctaatgaaaaagttttacctaaacattcattattatatgaatatttcacagta1560tataatgaattaacaaaagtaaaatatgtaacagaaggtatgagaaaacctgctttttta1620tcaggtgaacaaaaaaaagcaatcgtagatttattatttaaaacaaatagaaaagtaaca1680gtaaaacaattaaaagaagattatttcaaaaaaatcgaatgttttgattcagtagaaatc1740tctggtgtagaagatagatttaatgcttctttaggtacatatcatgatttattaaaaatc1800atcaaagataaagatttcttagataatgaagaaaatgaagatatcttagaagatatcgta1860ttaacattaactttattcgaagatagagaaatgatcgaagaaagattaaaaacatatgct1920catttatttgatgataaagtaatgaaacaattaaaaagaagaagatatactggttgaggt1980agattatcaagaaaattaatcaatggtatcagagataaacaatctggtaaaacaatctta2040gatttcttaaaatcagatggttttgctaatagaaatttcatgcaattaatccatgatgat2100agtttaacttttaaagaagatatccaaaaagctcaagtatcaggtcaaggtgattcatta2160catgaacatatcgctaatttagctggttctcctgctatcaaaaaaggtatcttacaaact2220gtaaaagttgtagatgaattagttaaagttatgggtagacataaacctgaaaatatcgta2280atcgaaatggcaagagaaaatcaaacaacacaaaaaggacaaaaaaattcaagagaaaga2340atgaaaagaatcgaagaaggtatcaaagaattaggttcacaaatcttaaaagaacatcct2400gtagaaaatacacaattacaaaatgaaaaattatatttatattatttacaaaatggtaga2460gatatgtatgtagatcaagaattagatatcaatagattatctgattatgatgtagatcat2520atcgtacctcaatcattcttaaaagatgattcaatcgataataaagtattaacaagatca2580gataaaaatagaggtaaaagtgataatgtaccttctgaagaagttgtaaaaaaaatgaaa2640aattattgaagacaattattaaatgctaaattaatcacacaaagaaaattcgataattta2700acaaaagctgaaagaggtggtttatcagaattagataaagctggtttcatcaaaagacaa2760ttagttgaaacaagacaaatcactaaacatgttgctcaaatcttagatagtagaatgaat2820acaaaatatgatgaaaatgataaattaatcagagaagtaaaagtaatcacattaaaatct2880aaattagtatcagattttagaaaagattttcaattctataaagtaagagaaatcaataat2940tatcatcatgctcatgatgcttatttaaatgctgtagtaggtacagctttaatcaaaaaa3000tatccaaaattagaatcagaatttgtatatggagattataaagtatatgatgttagaaaa3060atgatcgctaaatcagaacaagaaatcggtaaagctactgctaaatatttcttttattca3120aatatcatgaattttttcaaaactgaaatcactttagctaatggtgaaatcagaaaaaga3180cctttaatcgaaacaaatggtgaaactggtgaaatcgtatgagataaaggtagagatttt3240gctacagtaagaaaagtattatcaatgcctcaagtaaatatcgttaaaaaaactgaagta3300caaactggtggtttttctaaagaatcaatcttaccaaaaagaaattcagataaattaatc3360gctagaaaaaaagattgagatccaaaaaaatatggtggtttcgattcacctacagtagca3420tattcagtattagtagtagcaaaagtagaaaaaggtaaatctaaaaaattaaaatcagta3480aaagaattattaggtatcacaatcatggaaagatcatcattcgaaaaaaatccaatcgat3540tttttagaagctaaaggttataaagaagttaaaaaagatttaatcatcaaattacctaaa3600tatagtttatttgaattagaaaatggaagaaaaagaatgttagcatcagctggtgaatta3660caaaaaggtaatgaattagcattaccatctaaatatgttaatttcttatatttagcatca3720cattatgaaaaattaaaaggttctcctgaagataatgaacaaaaacaattatttgtagaa3780caacataaacattatttagatgaaatcatcgaacaaatctcagaattttcaaaaagagta3840atcttagcagatgcaaatttagataaagttttatctgcttataataaacatagagataaa3900cctatcagagaacaagcagaaaatatcatccatttattcacattaacaaatttaggtgct3960cctgctgctttcaaatatttcgatacaacaatcgatagaaaaagatatacttcaacaaaa4020gaagtattagatgcaacattaatccatcaatcaatcacaggtttatatgaaactagaatc4080gatttatctcaattaggtggtgattaa4107<210>121<211>88<212>dna<213>酿酒酵母<400>121ctgcaggactagtaaataaattttaattaaaagtagtattaacatattataaatagacaa60aagagtctaaaggttaagatttattaaa88<210>122<211>148<212>dna<213>酿酒酵母<400>122ttaatatttacttattattaatatttttaattattaaaaataataataataataataatt60ataataatattcttaaatataataaagatatagatttatattctattcaatcaccttatt120ctagaagcggccgcaccatggaaagctt148<210>123<211>97<212>dna<213>酿酒酵母<400>123ttctttgaagtatcaggagggttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgct97<210>124<211>75<212>dna<213>酿酒酵母<400>124tatatattatgtattattatataaatatatatatatattatattataagtaataataagt60attatattatatata75<210>125<211>75<212>dna<213>酿酒酵母<400>125gcttttatagcttagtggtaaagcgataaattgaagatttatttacatgtagttcgattc60tcattaagggcaata75<210>126<211>76<212>dna<213>酿酒酵母<400>126aggagattagcttaattggtatagcattcgttttacacacgaaagattataggttcgaac60cctatatttcctaaat76<210>127<211>118<212>dna<213>酿酒酵母<400>127ttattaataattaacaataattaatatattataatttatatatatatattttatattatt60ataataatattcttacaaatataattattatatattattccttcaaaactcctaacgg118<210>128<211>76<212>dna<213>酿酒酵母<400>128gagcttgtatagtttaattggttaaaacatttgtctcataaataaataatgtaaggttca60attccttctacaagta76<210>129<211>744<212>dna<213>人工序列<220><223>合成构建体<400>129atgacacatttagaaagaagtagacaaatgtcaaaaggtgaagaattattcactggagta60gtacctatcttagtagaattagatggtgatgtaaatggtcataaattctcagtatcaggt120gaaggtgaaggtgatgctacatatggtaaattaacattaaaattcatctgtacaacaggt180aaattacctgtaccttgacctacattagtaacaacattcggatatggagtacaatgtttc240gcaagatatcctgatcatatgaaacaacatgatttcttcaaatcagcaatgcctgaaggt300tacgtacaagaaagaacaatcttcttcaaagatgatggtaattataaaacaagagctgaa360gtaaaattcgaaggtgatacattagtaaatagaatcgagttaaaaggtatcgatttcaaa420gaagatggtaatatcttaggtcataaattagaatataattataattcacataatgtatat480atcatggctgataaacaaaaaaatggtatcaaagtaaatttcaaaatcagacataatatc540gaagacggttcagtacaattagcagatcattatcaacaaaatacacctatcggtgatggt600cctgtattattacctgataatcattacttaagtacacaatcagctttatcaaaagatcct660aatgaaaaaagagatcatatggtattattagaatttgtaacagctgctggtatcacacat720ggtatggatgaattatataaataa744<210>130<211>144<212>dna<213>酿酒酵母<400>130atgagaacaaatggtatgacaatgcataaattaccattatttgtatgatcaattttcatt60acagcgttcttattattattatcattacctgtattatctgctggtattacaatgttatta120ttagatagaaacttcaatacttca144<210>131<211>115<212>dna<213>酿酒酵母<400>131aattaaaattttctcatgattaataaatccctttagcaaggataaaaataaaaataaaaa60taaaaagttgatcagaaattatcaaaaaataaataataataatataataaaaaca115<210>132<211>64<212>dna<213>酿酒酵母<400>132aatggtacaaagatgattatattcaacaaatgcaaaagatattgcagtattatattttat60gtta64<210>133<211>93<212>dna<213>酿酒酵母<400>133aattcacaattatttaatggtgcgcctctcagtgcgtatatttcgttgatgcgtctagca60ttagtattatgaatcatcaatagatacttaaaa93<210>134<211>23<212>dna<213>人工序列<220><223>合成构建体<400>134tttttcggagtttctggtggagg23<210>135<211>23<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(1)..(16)<223>n为a、c、g或t<400>135nnnnnnnnnnnnnnnncaacagg23<210>136<211>23<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(19)..(23)<223>n为a、c、g或t<400>136gctatttttagtggtatgnnnnn23<210>137<211>24<212>dna<213>人工序列<220><223>合成构建体<220><221>杂项特性<222>(8)..(24)<223>n为a、c、g或t<400>137accatgtnnnnnnnnnnnnnnnnn24<210>138<211>22<212>dna<213>酿酒酵母<400>138ctattcaggcacattcaggacc22<210>139<211>20<212>dna<213>酿酒酵母<400>139ttttatccttgctaaaggga20<210>140<211>20<212>dna<213>酿酒酵母<400>140tttgataatttctgatcaac20<210>141<211>23<212>dna<213>酿酒酵母<400>141agaggtataccaacacaagattc23<210>142<211>22<212>dna<213>人工序列<220><223>合成构建体<400>142caggtgaaggtgaaggtgatgc22<210>143<211>23<212>dna<213>人工序列<220><223>合成构建体<400>143gatctgctaattgtactgaaccg23<210>144<211>1308<212>dna<213>人工序列<220><223>合成构建体<400>144ctattcaggcacattcaggacctagtgtagatttagcaatttttgcattacatttaacat60caatttcatcattattaggtgctattaatttcattgtaacaacattaaatatgagaacaa120atggtatgacaatgcataaattaccattatttgtatgatcaattttcattacagcgttct180tattattattatcattacctgtattatctgctggtattacaatgttattattagatagaa240acttcaatacttcatttttcggagtttctggtggaggtggtggaatgacacatttagaaa300gaagtagacaaatgtcaaaaggtgaagaattattcactggagtagtacctatcttagtag360aattagatggtgatgtaaatggtcataaattctcagtatcaggtgaaggtgaaggtgatg420ctacatatggtaaattaacattaaaattcatctgtacaacaggtaaattacctgtacctt480gacctacattagtaacaacattcggatatggagtacaatgtttcgcaagatatcctgatc540atatgaaacaacatgatttcttcaaatcagcaatgcctgaaggttacgtacaagaaagaa600caatcttcttcaaagatgatggtaattataaaacaagagctgaagtaaaattcgaaggtg660atacattagtaaatagaatcgagttaaaaggtatcgatttcaaagaagatggtaatatct720taggtcataaattagaatataattataattcacataatgtatatatcatggctgataaac780aaaaaaatggtatcaaagtaaatttcaaaatcagacataatatcgaagacggttcagtac840aattagcagatcattatcaacaaaatacacctatcggtgatggtcctgtattattacctg900ataatcattacttaagtacacaatcagctttatcaaaagatcctaatgaaaaaagagatc960atatggtattattagaatttgtaacagctgctggtatcacacatggtatggatgaattat1020ataaataacaacaggaattaaaattttctcatgattaataaatccctttagcaaggataa1080aaataaaaataaaaataaaaagttgatcagaaattatcaaaaaataaataataataatat1140aataaaaacatatttaaataataataatataattataataaatatatataaaggtaattt1200atatgatatttatccaagatcaaatagaaattatattcaaccaaataatattaataaaga1260attagtagtatatggttataatttagaatcttgtgttggtatacctct1308<210>145<211>23<212>dna<213>莱茵衣藻<400>145ggtttaaaccctgttactggtgg23<210>146<211>23<212>dna<213>莱茵衣藻<400>146cttcacctgtaaatggaccacgg23<210>147<211>23<212>dna<213>莱茵衣藻<400>147tttacaggtgaaggtcacgttgg23<210>148<211>23<212>dna<213>莱茵衣藻<400>148gtagctaaataagggtatggagg23<210>149<211>4107<212>dna<213>人工序列<220><223>合成构建体<400>149atggacaaaaaatactcaattggtttagatattggtacaaattcagttggttgggctgtt60attacagatgaatataaagttccaagtaaaaaatttaaagttttaggtaatacagatcgt120cactcaattaagaaaaacttaattggtgctttattatttgattcaggtgaaacagctgaa180gctacacgtttaaaacgtacagctcgtcgtcgttatacacgtcgtaaaaatcgtatttgt240tatttacaagaaattttctcaaatgaaatggctaaagttgatgattcattttttcaccgt300ttagaagaatcatttttagttgaagaagataaaaaacacgaacgtcacccaatttttggt360aatattgttgatgaagttgcttatcacgaaaaatatccaacaatttatcacttacgtaaa420aaattagttgattcaactgataaagctgatttacgtttaatttatttagctttagctcac480atgattaaattccgtggtcacttcttaattgaaggtgatttaaacccagataattcagat540gttgacaaattattcattcaattagttcaaacatataatcaattatttgaagaaaatcca600attaatgcttcaggtgttgatgctaaagcaattttatcagctcgtttatcaaaatcacgt660cgtttagaaaacttaattgctcaattaccaggtgaaaagaaaaatggtttattcggtaac720ttaattgcattatcattaggtttaacaccaaatttcaaatcaaacttcgatttagctgaa780gatgctaaattacaattatcaaaagatacatacgatgatgatttagataacttattagca840caaattggtgatcaatatgctgatttattcttagctgctaaaaacttatcagatgctatt900ttattatcagatattttacgtgttaatacagaaattacaaaagctccattatcagcttca960atgattaaacgttatgatgaacaccaccaagatttaacattattaaaagctttagttcgt1020caacaattacctgaaaaatacaaagaaattttcttcgatcaatctaaaaatggttatgct1080ggttatattgatggtggtgcttcacaagaagaattctataaattcattaaacctatttta1140gaaaaaatggatggtacagaagaattattagttaaattaaatcgtgaagatttattacgt1200aaacaacgtacatttgataatggttcaattcctcaccaaattcatttaggtgaattacac1260gcaattttacgtcgtcaagaagatttttatccattcttaaaagataatcgtgaaaaaatt1320gaaaaaattttaacatttcgtattccatattatgtaggtccattagctcgtggtaattca1380cgtttcgcttggatgacacgtaaatctgaagaaacaattacaccttggaattttgaagaa1440gttgttgataaaggtgctagtgctcaatcatttattgaacgtatgacaaatttcgacaaa1500aacttaccaaatgaaaaagttttaccaaaacactcattattatatgaatatttcacagtt1560tataatgaattaacaaaagttaaatatgttacagaaggtatgcgtaaacctgcattttta1620agtggtgaacaaaagaaagctattgttgacttattattcaaaacaaatcgtaaagttaca1680gttaaacaattaaaagaagattactttaagaaaattgaatgttttgattcagtagaaatt1740tcaggtgtagaagatcgtttcaatgcttcattaggtacataccacgatttattaaaaatt1800attaaagacaaagactttttagataatgaagaaaatgaagatattttagaagatattgtt1860ttaacattaacattattcgaagatcgtgaaatgattgaagaacgtttaaaaacatatgct1920cacttatttgatgataaagttatgaaacaattaaaacgtcgtcgttacacaggttggggt1980cgtttatctcgtaaattaattaacggtattcgtgacaaacaatcaggtaaaacaatttta2040gatttcttaaaatcagatggttttgctaatcgtaactttatgcaattaattcacgatgat2100tctttaacattcaaagaagatattcaaaaagctcaagtttcaggtcaaggtgattcatta2160cacgaacacattgctaacttagctggttctccagctattaaaaaaggtattttacaaaca2220gttaaagttgtagatgaattagtaaaagtaatgggtcgtcacaaaccagaaaacattgtt2280attgaaatggcacgtgaaaatcaaacaacacaaaaaggtcaaaagaactcacgtgaacgt2340atgaaacgtattgaagaaggtattaaagaattaggttcacaaattttaaaagaacaccca2400gttgaaaatacacaattacaaaacgaaaaattatatttatactatttacaaaatggtcgt2460gatatgtatgtagatcaagaattagatattaaccgtttatcagattatgatgttgatcac2520attgttccacaatctttcttaaaagacgattcaattgataacaaagttttaacacgttca2580gataaaaaccgtggtaaatcagataatgtaccatcagaagaagtagttaagaaaatgaaa2640aactattggcgtcaattattaaatgcaaaattaattacacaacgtaaattcgataactta2700acaaaagctgaacgtggtggtttatcagaattagacaaagctggtttcattaaacgtcaa2760ttagtagaaacacgtcaaattactaaacacgttgctcaaattttagactctcgtatgaat2820acaaaatatgatgaaaatgataaattaattcgtgaagttaaagttattacattaaaatca2880aaattagtatcagatttccgtaaagatttccaattctacaaagttcgtgaaattaacaac2940tatcaccacgctcacgatgcttacttaaatgctgttgttggtactgcattaattaaaaaa3000tacccaaaattagaatctgaattcgtttatggtgactataaagtttatgatgtacgtaaa3060atgattgctaaatcagaacaagaaattggtaaagctactgctaaatactttttctattca3120aacattatgaatttctttaaaactgaaattacattagctaacggtgaaattcgtaaacgt3180ccattaattgaaactaatggtgaaactggtgaaattgtatgggataaaggtcgtgatttc3240gctacagttcgtaaagtattatcaatgccacaagttaatattgttaaaaaaactgaagtt3300caaacaggtggtttttcaaaagaatctattttacctaaacgtaactcagacaaattaatt3360gctcgtaaaaaagattgggatcctaaaaaatatggtggtttcgattcaccaacagtagct3420tattcagtattagttgtagctaaagtagaaaaaggtaaatctaaaaaattaaaatcagta3480aaagaattattaggtattacaattatggaacgttcatcattcgagaaaaacccaattgat3540ttcttagaagctaaaggttataaagaagttaaaaaagatttaattattaaattaccaaaa3600tactctttatttgaattagaaaacggtcgtaaacgtatgttagcttctgctggtgaatta3660caaaaaggtaatgaattagcattaccatcaaaatatgtaaatttcttatacttagcttca3720cactacgaaaaattaaaaggttcaccagaagataacgaacaaaaacaattattcgttgaa3780caacataaacactatttagatgaaattattgaacaaatttcagaattttcaaaacgtgtt3840attttagctgatgctaatttagataaagttttatctgcttataacaaacaccgtgataaa3900cctattcgtgaacaagctgaaaacattattcacttatttacattaacaaatttaggtgct3960ccagctgctttcaaatatttcgatacaacaattgaccgtaaacgttacacatcaacaaaa4020gaagttttagacgctacattaattcatcaatcaattacaggtttatatgaaacacgtatt4080gatttaagtcaattaggtggtgattaa4107<210>150<211>1368<212>prt<213>酿脓链球菌<400>150metasplyslystyrserileglyleuaspileglythrasnserval151015glytrpalavalilethraspglutyrlysvalproserlyslysphe202530lysvalleuglyasnthrasparghisserilelyslysasnleuile354045glyalaleuleupheaspserglygluthralaglualathrargleu505560lysargthralaargargargtyrthrargarglysasnargilecys65707580tyrleuglngluilepheserasnglumetalalysvalaspaspser859095phephehisargleuglugluserpheleuvalglugluasplyslys100105110hisgluarghisproilepheglyasnilevalaspgluvalalatyr115120125hisglulystyrprothriletyrhisleuarglyslysleuvalasp130135140serthrasplysalaaspleuargleuiletyrleualaleualahis145150155160metilelyspheargglyhispheleuilegluglyaspleuasnpro165170175aspasnseraspvalasplysleupheileglnleuvalglnthrtyr180185190asnglnleupheglugluasnproileasnalaserglyvalaspala195200205lysalaileleuseralaargleuserlysserargargleugluasn210215220leuilealaglnleuproglyglulyslysasnglyleupheglyasn225230235240leuilealaleuserleuglyleuthrproasnphelysserasnphe245250255aspleualagluaspalalysleuglnleuserlysaspthrtyrasp260265270aspaspleuaspasnleuleualaglnileglyaspglntyralaasp275280285leupheleualaalalysasnleuseraspalaileleuleuserasp290295300ileleuargvalasnthrgluilethrlysalaproleuseralaser305310315320metilelysargtyraspgluhishisglnaspleuthrleuleulys325330335alaleuvalargglnglnleuproglulystyrlysgluilephephe340345350aspglnserlysasnglytyralaglytyrileaspglyglyalaser355360365glnglugluphetyrlyspheilelysproileleuglulysmetasp370375380glythrglugluleuleuvallysleuasnarggluaspleuleuarg385390395400lysglnargthrpheaspasnglyserileprohisglnilehisleu405410415glygluleuhisalaileleuargargglngluaspphetyrprophe420425430leulysaspasnargglulysileglulysileleuthrpheargile435440445protyrtyrvalglyproleualaargglyasnserargphealatrp450455460metthrarglysserglugluthrilethrprotrpasnphegluglu465470475480valvalasplysglyalaseralaglnserpheilegluargmetthr485490495asnpheasplysasnleuproasnglulysvalleuprolyshisser500505510leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys515520525tyrvalthrgluglymetarglysproalapheleuserglyglugln530535540lyslysalailevalaspleuleuphelysthrasnarglysvalthr545550555560vallysglnleulysgluasptyrphelyslysileglucyspheasp565570575servalgluileserglyvalgluaspargpheasnalaserleugly580585590thrtyrhisaspleuleulysileilelysasplysasppheleuasp595600605asnglugluasngluaspileleugluaspilevalleuthrleuthr610615620leuphegluaspargglumetileglugluargleulysthrtyrala625630635640hisleupheaspasplysvalmetlysglnleulysargargargtyr645650655thrglytrpglyargleuserarglysleuileasnglyileargasp660665670lysglnserglylysthrileleuasppheleulysseraspglyphe675680685alaasnargasnphemetglnleuilehisaspaspserleuthrphe690695700lysgluaspileglnlysalaglnvalserglyglnglyaspserleu705710715720hisgluhisilealaasnleualaglyserproalailelyslysgly725730735ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly740745750arghislysprogluasnilevalileglumetalaarggluasngln755760765thrthrglnlysglyglnlysasnserarggluargmetlysargile770775780glugluglyilelysgluleuglyserglnileleulysgluhispro785790795800valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu805810815glnasnglyargaspmettyrvalaspglngluleuaspileasnarg820825830leuserasptyraspvalasphisilevalproglnserpheleulys835840845aspaspserileaspasnlysvalleuthrargserasplysasnarg850855860glylysseraspasnvalproserglugluvalvallyslysmetlys865870875880asntyrtrpargglnleuleuasnalalysleuilethrglnarglys885890895pheaspasnleuthrlysalagluargglyglyleusergluleuasp900905910lysalaglypheilelysargglnleuvalgluthrargglnilethr915920925lyshisvalalaglnileleuaspserargmetasnthrlystyrasp930935940gluasnasplysleuilearggluvallysvalilethrleulysser945950955960lysleuvalseraspphearglysasppheglnphetyrlysvalarg965970975gluileasnasntyrhishisalahisaspalatyrleuasnalaval980985990valglythralaleuilelyslystyrprolysleuglusergluphe99510001005valtyrglyasptyrlysvaltyraspvalarglysmetileala101010151020lyssergluglngluileglylysalathralalystyrphephe102510301035tyrserasnilemetasnphephelysthrgluilethrleuala104010451050asnglygluilearglysargproleuilegluthrasnglyglu105510601065thrglygluilevaltrpasplysglyargaspphealathrval107010751080arglysvalleusermetproglnvalasnilevallyslysthr108510901095gluvalglnthrglyglypheserlysgluserileleuprolys110011051110argasnserasplysleuilealaarglyslysasptrpasppro111511201125lyslystyrglyglypheaspserprothrvalalatyrserval113011351140leuvalvalalalysvalglulysglylysserlyslysleulys114511501155servallysgluleuleuglyilethrilemetgluargserser116011651170pheglulysasnproileasppheleuglualalysglytyrlys117511801185gluvallyslysaspleuileilelysleuprolystyrserleu119011951200phegluleugluasnglyarglysargmetleualaseralagly120512101215gluleuglnlysglyasngluleualaleuproserlystyrval122012251230asnpheleutyrleualaserhistyrglulysleulysglyser123512401245progluaspasngluglnlysglnleuphevalgluglnhislys125012551260histyrleuaspgluileilegluglnileserglupheserlys126512701275argvalileleualaaspalaasnleuasplysvalleuserala128012851290tyrasnlyshisargasplysproilearggluglnalagluasn129513001305ileilehisleuphethrleuthrasnleuglyalaproalaala131013151320phelystyrpheaspthrthrileasparglysargtyrthrser132513301335thrlysgluvalleuaspalathrleuilehisglnserilethr134013451350glyleutyrgluthrargileaspleuserglnleuglyglyasp135513601365<210>151<211>279<212>dna<213>莱茵衣藻<400>151tcttaattcaacatttttaagtaaatactgtttaatgttatacttttacgaatacacata60tggtaaaaaataaaacaatatctttaaaataagtaaaaataatttgtaaaccaataaaaa120atatatttatggtataatataacatatgatgtaaaaaaaactatttgtctaatttaataa180ccatgcattttttatgaacacataataattaaaagcgttgctaatggtgtaaataatgta240tttattaaattaaataattgttattataaggagaaatcc279<210>152<211>414<212>dna<213>莱茵衣藻<400>152aaatggatatttggtacatttaattccacaaaaatgtccaatacttaaaatacaaaatta60aaagtattagttgtaaacttgactaacattttaaattttaaattttttcctaattatata120ttttacttgcaaaatttataaaaattttatgcatttttatatcataataataaaaccttt180attcatggtttataatataataattgtgatgactatgcacaaagcagttctagtcccata240tatataactatatataacccgtttaaagatttatttaaaaatatgtgtgtaaaaaatgct300tatttttaattttattttatataagttataatattaaatacacaatgattaaaattaaat360aataataaatttaacgtaacgatgagttgtttttttattttggagatacacgca414<210>153<211>258<212>dna<213>莱茵衣藻<400>153tttttatttttcatgatgtttatgtgaatagcataaacatcgtttttatttttatggtgt60ttaggttaaatacctaaacatcattttacatttttaaaattaagttctaaagttatcttt120tgtttaaatttgcctgtctttataaattacgatgtgccagaaaaataaaatcttagcttt180ttattatagaatttatctttatgtattatattttataagttataataaaagaaatagtaa240catactaaagcggatgta258<210>154<211>102<212>dna<213>莱茵衣藻<400>154ttaacccatgattaacaactatatcaataaaatcaatttgtagtgaaatactctgattga60cattaaaataataccatgataaaaattataataacaaatttt102<210>155<211>101<212>dna<213>莱茵衣藻<400>155tttttcctaatgtactttgttgtaaaagtggctggtttaacctttttaggtttcggattg60aacaataatggcagttaagagtcactaaagctgctgtatag101<210>156<211>73<212>dna<213>莱茵衣藻<400>156acgtccttagttcagtcggtagaacgcaggtttccaaaacctgatgtcgtgggttcaatt60cctacagggcgtg73<210>157<211>72<212>dna<213>莱茵衣藻<400>157gggttgctaactcaatggtagagtactcggctcttaaccgataagttctgggttcgagtc60ccaggtaaccca72<210>158<211>82<212>dna<213>莱茵衣藻<400>158gccttcgtgatggaactggtagacatcctggttttaggaaccagtgctgaaaggcgtgcc60ggttcaaatccggccgaaggca82<210>159<211>795<212>dna<213>人工序列<220><223>合成构建体<400>159atggctcgtgaagcggttatcgccgaagtatcaactcaactatcagaggtagttggcgtc60atcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctccgcagtggat120ggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgtaaggcttgat180gaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcccctggagag240agcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatcattccgtgg300cgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgacattcttgca360ggtatcttcgagccagccacgatcgacattgatctggctatcttgctgacaaaagcaaga420gaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccggttcctgaa480caggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccgcccgactgg540gctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagcgcagtaacc600ggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctgccggcccag660tatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaagatcgcttg720gcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgagatcactaag780gtagttggcaaataa795<210>160<211>189<212>dna<213>莱茵衣藻<400>160catatacctaaaggccctttctatgctcgactgataagacaagtacataaatttgctagt60ttacattattttttatttctaaatatataatatatttaaatgtatttaaaatttttcaac120aatttttaaattatatttccggacagattattttaggatcgtcaaaagaagttacattta180tttatataa189<210>161<211>400<212>dna<213>莱茵衣藻<400>161tttttttttaaactaaaataaatctggttaaccatacctggtttattttagtttatacac60acttttcatatatatatacttaatagctaccataggcagttggcaggacgtccccttacg120ggacaaatgtatttattgttgcctgccaactgcctaatataaatattagtggacgtcccc180ttccccttacgggcaagtaaacttagggattttaatgctccgttaggaggcaaataaatt240ttagtggcagttgcctcgcctatcggctaacaagttccttcggagtatataaatatcctg300ccaactgccgatatttatatactaggcagtggcggtaccactcgactaatatttatattc360cgtaagacgtcctccttcggagtatgtaaacatgctaagt400<210>162<211>717<212>dna<213>人工序列<220><223>合成构建体<400>162atggctaaaggtgaagaattattcacaggtgttgtacctattttagtagaattagacggt60gatgtaaacggtcacaaattttcagtttctggtgaaggtgaaggtgacgcaacttatggt120aaattaacacttaaattcatttgtactacaggtaaattaccagtaccttggccatcatta180gttacaacttttacatacggtgtacaatgtttcagtcgttaccctgatcacatgaaacaa240catgactttttcaaatctgctatgccagaaggttatgttcaagaacgtactatttttttc300aaagatgacggtaattataaaacacgtgctgaagtaaaatttgaaggtgatactttagtt360aaccgtattgaattaaaaggtattgacttcaaagaagatggtaatattttaggtcacaaa420cttgaatataactacaattcacataacgtatatattatggcagacaaacaaaaaaatggt480attaaagtaaactttaaaattcgtcataatatcgaggatggttctgtacaattagctgac540cactatcaacaaaacacaccaattggtgatggtcctgttttacttccagacaatcattat600ttaagtactcaatctgctttatcaaaagatcctaacgaaaaacgtgaccacatggtatta660cttgaatttgttacagcagctggtattactcacggtatggatgaattatacaaataa717<210>163<211>74<212>dna<213>莱茵衣藻<400>163gctcctttctttactttaaactggagtgaatacagtgatttcttaacatttaaaggtggt60ttaaaccctgttac74<210>164<211>76<212>dna<213>莱茵衣藻<400>164tccatttacaggtgaaggtcacgttggtttatatgaaattttaacaacttcttggcatgc60acaattagctattaac76<210>165<211>76<212>dna<213>莱茵衣藻<400>165gtactaactggggtattggtcacagtatgaaagaaattttagaagctcaccgtggtccat60ttacaggtgaaggtca76<210>166<211>76<212>dna<213>莱茵衣藻<400>166tacccttatttagctactgattacggtacacaattatcattatttacacaccacacatgg60attggtggtttctgta76<210>167<211>21<212>dna<213>莱茵衣藻<400>167gctggttggttccactaccac21<210>168<211>27<212>dna<213>人工序列<220><223>合成构建体<400>168caccttcaaattttacttcagcacgtg27<210>169<211>25<212>dna<213>人工序列<220><223>合成构建体<400>169catacggtgtacaatgtttcagtcg25<210>170<211>26<212>dna<213>莱茵衣藻<400>170gtgagaaataatagcatcacggtgac26<210>171<211>1408<212>dna<213>人工序列<220><223>合成构建体<400>171gctggttggttccactaccacaaagctgctccaaaactagaatggttccaaaacgttgaa60tcaatgttaaaccaccacttaggtggtcttcttggtttaggtagtttagcttgggctggt120caccaaattcacgtttctttaccagtaaacaaattattagatgctggtgtagatccaaaa180gaaattccacttcctcatgatttattattaaatcgtgctattatggctgacttataccca240agttttgctaaaggtattgctcctttctttactttaaactggagtgaatacagtgatttc300ttaacatttaaaggtggtttaaaccctgttacattatcaggttctgctggttcagcagct360ggtatggctaaaggtgaagaattattcacaggtgttgtacctattttagtagaattagac420ggtgatgtaaacggtcacaaattttcagtttctggtgaaggtgaaggtgacgcaacttat480ggtaaattaacacttaaattcatttgtactacaggtaaattaccagtaccttggccatca540ttagttacaacttttacatacggtgtacaatgtttcagtcgttaccctgatcacatgaaa600caacatgactttttcaaatctgctatgccagaaggttatgttcaagaacgtactattttt660ttcaaagatgacggtaattataaaacacgtgctgaagtaaaatttgaaggtgatacttta720gttaaccgtattgaattaaaaggtattgacttcaaagaagatggtaatattttaggtcac780aaacttgaatataactacaattcacataacgtatatattatggcagacaaacaaaaaaat840ggtattaaagtaaactttaaaattcgtcataatatcgaggatggttctgtacaattagct900gaccactatcaacaaaacacaccaattggtgatggtcctgttttacttccagacaatcat960tatttaagtactcaatctgctttatcaaaagatcctaacgaaaaacgtgaccacatggta1020ttacttgaatttgttacagcagctggtattactcacggtatggatgaattatacaaataa1080tccatttacaggtgaaggtcacgttggtttatatgaaattttaacaacttcttggcatgc1140acaattagctattaacttagctttatttggttcgttatcaattattgtagctcaccacat1200gtacgcaatgcctccatacccttatttagctactgattacggtacacaattatcattatt1260tacacaccacacatggattggtggtttctgtattgttggtgctggtgctcacgcagctat1320tttcatggttcgtgactacgatcctactaataactacaacaacttattagaccgtgtaat1380tcgtcaccgtgatgctattatttctcac1408<210>172<211>16<212>prt<213>黑腹果蝇<400>172argglnilelysiletrppheglnasnargargmetlystrplyslys151015当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1