修饰植物中酶的活性的制作方法

文档序号:601436阅读:651来源:国知局
专利名称:修饰植物中酶的活性的制作方法
修饰植物中酶的活性
本发明针对的是修饰对植物中具体酶的活性。具体而言,本发明涉及用于在降低、 抑制或基本上抑制植物中一种或多种内源糖基转移酶的活性,以及通过所述方法获得的植物细胞和植物。
植物和哺乳动物中的N-糖基化过程有很多方面都是类似的,这些过程一般包括大量的顺序酶步骤。然而,植物糖蛋白和哺乳动物糖蛋白的成熟N-聚糖结构之间的关键差异在于所述过程的最后步骤中所添加的具体单糖不同。植物产生的蛋白质的成熟N-聚糖链一般包含α-1,3-连接的岩藻糖残基(α (1,3)_岩藻糖)和β _1,2_连接的木糖残基 (β (I, 2)-木糖),二者在哺乳动物N-聚糖中都不存在。
一般地,N-糖基化以将前体Glc3-Man9-GlcNAc2寡糖添加于糖基化的蛋白质的天冬氨酸残基而开始,然后在内质网(ER)中由大量酶对其进行顺序加工,以三种葡萄糖苷酶开始(葡萄糖苷酶1、葡萄糖苷酶II和葡萄糖苷酶III)并产生Man9-GlcNAc2-Asn N-聚糖。 随后,甘露糖苷酶I酶将富含甘露糖的Man9-GlcNAc2-Asn N-聚糖剪切为Man5-GlcNAc2-Asn N-聚糖。然后将这种糖基化的蛋白质从ER转运到顺面高尔基网。转运是通过囊泡和膜融合介导的。ER衍生的囊泡从ER膜上出芽并融合入顺面高尔基网。真核细胞中的 Man5-GlcNAc2-Asn N-聚糖随后在高尔基体中多个区室内通过大量N-乙酰氨基葡萄糖基转移酶、甘露糖苷酶和糖基转移酶的作用而成熟。
在哺乳动物(包括人)中,糖基化过程的最后步骤中,岩藻糖以α-1,6_连接 (α (1,6)_岩藻糖)加至N-聚糖的非还原性末端的邻近N-乙酰葡萄糖胺残基上。在植物中,α-1,3-连接(a (1,3)-岩藻糖)中的岩藻糖和β _1,2连接(β (1,2)-木糖)中的木糖被加至N-聚糖。岩藻糖残基是通过岩藻糖基转移酶的作用加至N-聚糖链的。更具体地,在植物中,ct -1, 3-连接的岩藻糖(α (I, 3)-岩藻糖)是通过α -1, 3_岩藻糖基转移酶 (α (I, 3)_岩藻糖基转移酶)添加的;木糖是通过β -1, 2-木糖基转移酶(β (I, 2)_木糖基转移酶)以β-1,2-连接(β (1,2)-木 糖)加至三甘露糖基(Man3)核心结构的β_1,4_连接的甘露糖(β (I, 4)-Man)上的。这些碳水化合物在植物产生的蛋白质表面的存在影响到当其被引入动物中时所述蛋白质的免疫原特性。因此不同的糖基化形式为植物产生的蛋白质在哺乳动物(包括人)中的治疗用途提出了一个难题,并且可能影响对所述蛋白质的监管许可。
蛋白质如可治疗性地用于人的蛋白质的重组表达构成转基因动物的一项重要的应用。人们已经考虑过使用烟草植物用于生产重组蛋白质。然而,烟草植物的基因组非常复杂。例如,烟草(Nicotiana tabacum)是一种异源四倍体物种,被认为是樟子松烟草 (Nicotiana sylvestris)和鸾毛烟草(Nicotiana tomentosiformis)之间种内杂交的双二倍体,其具有48条染色体。对于每个基因(包括编码糖基转移酶的基因)都预期存在多种不同的等位基因和变体。进一步地,烟草具有迄今已知的最大的基因组(约4500万个碱基对)之一,包含分散在超过70%的“垃圾"DNA中的30,000-50, 000个基因。因此,烟草基因组的大小和复杂度对基因发现、等位基因和变体鉴别以及具体等位基因或变体的靶向修饰提出了极大的挑战。
考虑到在植物特别是烟草植物中产生重组蛋白质的潜力,因此需要鉴别在蛋白质糖基化过程中有活性的不同内源糖基转移酶的方法,和降低、抑制或基本上抑制所述一种或多种所述糖基转移酶的活性的方法。具体地,可取的是获得能够产生蛋白质的植物和植物细胞,所述蛋白质在其N-聚糖中几乎缺少α-1,3-连接的岩藻糖残基、β-1 ,2-连接的木糖残基或二者。因此这些植物产生的蛋白质可具有有利的免疫原特性可以用于人。本发明的一个目标是解决这些需求。
在本发明的多种实施方式中,提供了(i)用于鉴别编码糖基转移酶的基因序列及其片段,以及这些基因序列的变体和等位基因的方法,(ii)用于修饰这些基因序列的方法, 以及(iii)用于降低、抑制或基本上抑制这些序列编码的糖基转移酶的酶活性的方法。还提供了编码糖基转移酶及其变体和等位基因的多核苷酸,以及其片段和突变体。本发明还包含了用于修饰糖基转移酶基因序列的靶标位点,以及用于在植物细胞中修饰糖基转移酶基因序列的组合物,例如但不限于,包含锌指结构域的蛋白质。本发明还提供了植物细胞或植物用于产生一种或多种异源蛋白质的用途的方法,所述植物细胞或植物包含修饰的糖基转移酶基因序列,其中一种或多种糖基转移酶的酶活性得到降低、抑制或基本上抑制。本发明还提供了植物或植物细胞,特征在于其具有的蛋白质中的N-聚糖基本上缺少以β_1,2-连接的木糖或以α-1,3-连接的岩藻糖,或二者。本发明还包含可得自本发明的植物或植物细胞的组合物,其包含一种或多种基本上缺少α -1, 3-连接的岩藻糖残基或 β -1, 2-连接的木糖残基或二者的异源蛋白质。
本申请范围内使用的技术术语和表达一般是以植物生物学相关领域中通常对其应用的意义给出的。所有以下定义适用于本申请的全部内容。词语“包含”不排除其他成分或步骤,而不定冠词“一”或“一个”不排除复数形式。一个单一步骤可能满足权利要求提出的数种特征的功能。具体关系到一项属性或数值的术语“几乎”、“大约”、“约”等等分别精确地限定了所述属性或精确限定了所述值。在给定的数值化值或范围的上下文中,术语“大约”指的是给定值或范围的20%之内、10%之内或5%之内。
如本发明内所用的,“植物”指的是处于生命周期或发育的任何阶段的任何植物及其后代。
如本发明内所使用的“植物细胞”指的是植物的结构及生理单位。植物细胞可能为以下形式没有细胞壁的原生质、分离的单个细胞或培养的细胞,或为更高级的组织单位的一部分,例如但不限于,植物组织、植物器官或整个植物。
如本发明内使用的,“植物细胞培养物”包括植物细胞的培养物,例如但不限于,原生质、细胞培养物细胞、培养的植物组织中的细胞、外植体细胞及花粉培养物。
如本发明内使用的,“植物材料”包括可获自植物的任何固态、液态或气态组合物, 或其组合,包括植物的叶、茎、根、花或花器部分、果实、花粉、卵细胞、合子、种子、插条、分泌物、提取物、细胞或组织培养物,或任何其他的部分或产物。
如本文所使用的“植物组织”指的是组织形成结构或功能单位的一组植物细胞。植物群内的或培养的植物的任何组织都包括在内。这项术语包括但不限于整个植物、植物器官以及种子。
如本文所使用的,“植物器官”涉及植物的可区分或已分化部分,如根、茎、叶、花芽或胚。·
本文所使用的术语“多核苷酸”指的是核苷酸的多聚体,可以是未修饰或修饰的脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA)。因此,多核苷酸可以为基因组DNA、互补DNA (cDNA)、mRNA或反义RNA,但不限于此。此外,多核苷酸可以为单链或双链DNA、单链和双链区域混合的DNA、包含DNA和RNA的杂交份子、或者单链或双链区域混合的杂交分子。另外, 多核苷酸可由包含DNA、RNA或二者的三链区域组成。多核苷酸可包含一个或多个修饰的碱基,如硫代磷酸酯,也可为肽核酸(PNA)。一般地,本发明提供的多核苷酸可由分离的或克隆的cDNA片段、基因组DNA、寡核苷酸或单个核苷酸或前述的组合而装配而成。
术语“核苷酸序列”指的是核苷酸的多聚体的碱基序列,包括但不限于核糖核苷酸和脱氧核糖核苷酸。
如本文使用的,术语“基因序列”指的是编码多肽或生物学活性RNA的核酸分子或多核苷酸的核苷酸序列,并包括只编码蛋白质片段的部分编码序列的核苷酸序列。基因序列还包括对位于编码序列上游或下游并对基因表达有调控功能的序列,以及基因的内含子序列。
如本文使用的,术语“异源序列”指的是在目的细胞或器官中的具体多核苷酸或多肽的环境下不会天然发生的生物学序列。
如本文使用的,术语“异源蛋白质”指的是细胞产生的但在所述细胞中不会天然发生的蛋白质。例如,植物细胞中所产生的异源蛋白质可以为哺乳动物或人蛋白质。异源蛋白质可在翻译中或翻译后修饰中含有共价连接于多肽的寡糖链(聚糖)。作为一个非限制性实例,这样的蛋白质可包含共价连接于蛋白质骨架上天冬氨酸(Asn )的寡糖,所述蛋白质骨架包含至少一个三甘露糖基(Man3)核心结构,并在连接于蛋白质骨架的非还原性末端具有两个N-乙酰葡萄糖胺(GlcNAc2)残基(Man3-GlcNAc2-Asn)。具体 而言,异源蛋白质包含至少一个N-聚糖。缩写“GnT”指的是N-乙酰葡萄糖氨基转移酶;“Man”指的是甘露糖;“Glc” 指的是葡萄糖;“Xyl”指的是木糖;“Fuc”指岩藻糖;而“61(嫩(3”指的是N-乙酰葡萄糖胺。
如本文所使用的,术语“N-糖基化”指的是这样一个过程,其开始于特定的多萜醇脂连接的前体寡糖D01-PP-GlcNAc2-Man9-Glc3从内质网膜的多萜醇实体向天冬氨酸残基 (Asn)(其为蛋白质骨架中Asn-Xaa-Ybb-Xaa序列基序的一部分)的游离氨基基团上的转移,产生Glc3-Man9-GlcNAc2-Asn糖基化蛋白质,其中Xaa可为除脯氨酸之外的任何氨基酸, 而Ybb可为丝氨酸、苏氨酸或半胱氨酸。
如本文所使用的,术语“N-葡聚糖”指的是连接于多种天冬氨酸残基的碳水化合物,所述天冬氨酸残基各自为蛋白质骨架中Asn-Xaa-Ybb-Xaa序列基序的一部分。
如本文所使用的,术语“N-葡聚糖的非还原性末端”指的是连接于蛋白质骨架的天冬氨酸的N-聚糖的一部分。
如本发明内所使用的,术语“ β -1,2-木糖基转移酶”(β (1,2)-木糖基转移酶) 指的是木糖基转移酶,记为EC2. 4. 2. 38,其将以0-1,2-连接(0 (I, 2)-Xyl)的木糖加至糖蛋白的N-聚糖的三甘露糖基核心结构的β-1,4-连接的甘露糖(β (I, 4)-Man)上。
如本发明内所使用的,术语“α-1,3_岩藻糖基转移酶”(α (1,3)_岩藻糖基转移酶)指的是岩藻糖转移酶,记为EC2. 4.1. 214,其将以α-1,3-连接(α (1,3)-岩藻糖)的岩藻糖加至N-葡聚糖的非还原性末端的近端N-乙酰葡萄糖胺残基。
如本发明内所使用的,“N-乙酰葡萄糖氨基转移酶I”指的是一种记为EC2. 4.1. 101的酶,其将N-乙酰葡萄糖胺加至Man5-GlcNAc2-Asn寡甘露糖基受体的1_3臂上的甘露糖上。
如本文所使用的,术语“降低”或“降低的”指的是数量或活性的大约10%-大约99% 的降低,或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或多至100%的降低,例如但不限于酶活性、 转录活性以及蛋白质表达。
如本文所使用的,术语“基本上抑制”或“基本上抑制的”指的是数量或活性的大约 90%-大约100%的降低,或至少90%、至少95%、至少98%或多至100%的降低,例如但不限于酶活性、转录活性以及蛋白质表达。
如本文所使用的,术语“抑制”或“抑制的”指的是数量或活性的大约98%_大约 100%的降低,或至少98%、至少99%、但特别是100%的降低,例如但不限于酶活性、转录活性以及蛋白质表达。
如本发明内使用的“基因组编辑技术”指的是产生生物体基因组中核苷酸序列的改变的方法,例如但不限于,锌指核酸酶介导的诱变、化学诱变、辐射诱变、“tilling”或大范围核酸酶介导的诱变。
本发明的一个目标是在植物中产生适合用作治疗剂的异源蛋白质,其中的异源蛋白质缺少一种或多种碳水化合物,否则这些化合物会产生不想要的免疫原特性。不受任何理论的束缚,α-1,3-连接的岩藻糖、β-1,2-连接的木糖或二者在植物或植物细胞中产生的异源蛋白质的N-聚糖上的存在可通过(i )在植物或植物细胞中降低、抑制或基本上抑制本发明的一种或多种糖基转移酶的酶活性,或(ii)在植物或植物细胞中抑制或基本上抑制本发明的一种或多种糖基转移酶的表达,或(i)和(ii) 二者得到降低或消除。
在一个具体的实施方式中,本发明的糖基转移酶为⑴N-乙酰葡萄糖氨基转移酶,特别是催化将N-乙酰葡萄 糖胺残基添加至糖蛋白的N-聚糖还原性末端的Man5-GlcNAc2-Asn的1_3臂的甘露糖残基的N-乙酰葡萄糖氨基转移酶;产生 GlcNAc-Man5-GlcNAc2-Asn ;(ii)岩藻糖基转移酶,特别是如下岩藻糖基转移酶,其催化将以α-1,3-连接的岩藻糖实体添加至N-聚糖,特别是催化将以α-1,3_连接(α (1,3)_连接)的岩藻糖实体添加至糖蛋白的N-聚糖非还原性末端的邻近N-乙酰葡萄糖胺上,产生例如但不限于,GlcNAc-Man3-Fuc-GlcNAc2-Asn 或 GlcNAc-Man3-Fuc-Xyl-GlcNAc2-Asn 糖蛋白;或(iii)木糖基转移酶,特别是如下木糖基转移酶,其催化将以β-1,2-连接的木糖实体添加至N-聚糖,特别是催化将以β-1,2-连接(β (1,2)_连接)的木糖添加至N-聚糖的三甘露糖基核心的β_1,4-连接的甘露糖(β (1,4)_连接)甘露糖,产生例如但不限于, GlcNAc-Man3-Xyl-GlcNAc2-Asn 或 GlcNAc-Man3-Fuc-Xyl-GlcNAc2-Asn 糖蛋白。具体而言,本发明的糖基转移酶为烟草糖基转移酶。特别地,本发明的糖基转移酶为烟草或本氏烟草(Nicotiana benthamiana)的糖基转移酶。
在多种实施方式中,本发明涉及烟草、向日葵、豌豆、油菜、甜菜、大豆、生菜、莴苣、 卷心菜、西兰花、花椰菜、苜蓿、浮萍、稻、玉米和胡萝卜。具体而言,本发明针对修饰的烟草植物和修饰的烟草细胞、烟草种属的修饰植物和修饰的细胞,特别是修饰的本氏烟草和烟草植物,以及烟草变种、育种品系和栽培种,或本氏烟草和烟草、烟草变种、育种品系和品种的修饰细胞。
在另一个实施方式中,本发明提供了遗传修饰的烟草变种、育种品系或栽培种。可通过本发明的方法修饰的烟草变种、育种品系和栽培种的非限制性实例包括烟草登记号 PMO16, PM021、PM92、PM102、PM132、PM204、PM205、PM215、PM216 或 PM217 (保藏于 NCMB, Aberdeen, Scotland 或 DAC Mata Fina), P02、BY-64、AS44、RG17、RG8、HB04P、 Basma Xanthi BX 2A、Coker 319、Hicks、McNair 944(MN 944)、Burley 21、K149、Yaka JB 125/3、Kasturi Mawar>NC 297>Coker 371Gold、P02、Wisl.1gil、Simmaba、Turkish Samsun> AA37-1、B13P、BU21x Hoja Parado 系 97 杂交得到的 F4、Samsun NN、Izmir、Xanthi NN、 Karabalgar、Denizli 和 POl0
在一个实施方式中,包含根据本发明并在本文中描述的修饰的植物细胞的修饰的 (即遗传修饰的)烟草植物细胞或烟草植物(包括其后代)还进一步包含(a)至少对第二种 N-乙酰基葡糖氨基转移酶的第二编码序列的修饰或(b)对N-乙酰葡萄糖氨基转移酶的编码序列的基因组区域中至少第三靶标核苷酸序列的修饰或(a)和(b)的组合,使得(i) 修饰的植物细胞中的糖基转移酶的活性或表达相对于未修饰植物细胞得到降低、抑制或基本上抑制,以及(ii)修饰的植物细胞中产生的蛋白质的N-聚糖上的α-1,3-岩藻糖或 β -1, 2-木糖或二者相对于未修饰植物细胞得到降低。在一个具体的实施方式中,所述第二编码序列为第一靶标核苷酸序列的等位基因变体,或第三靶标核苷酸序列为第二靶标序列的等位基因变体。
具体而言,本发明在一个实施方式中涉及修饰的(即遗传修饰的)烟草植物细胞, 或烟草植物(包括其后代),其包含修饰的植物细胞,其中修饰的植物细胞包含至少对在包含N-乙酰基-葡糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列的修饰, 使得(i )修饰的植物细胞中的糖基转移酶的活性或表达相对于未修饰植物细胞得到降低、 抑制或基本上抑制,以及(ii)修饰的植物细胞中产生的蛋白质的N-聚糖上的α-1,3-岩藻糖或β -1, 2-木糖或二者相对于未修饰植物细胞得到降低。
在一个实施方式中,包含根据本发明并在本文中描述的修饰的植物细胞的修饰的 (即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代)进一步包含(a)在β (1,2)_木糖基转移酶的编码序列的基因组区域中包含至少第二靶标核苷酸序列的修饰或(b)在 α (I, 3)_岩藻糖基转移酶的编码序列的基因组区域中包含至少第三靶标核苷酸序列的修饰,或(a)和(b)的组合。在一个实施方式中,包含根据本发明并在本文中描述的修饰的植物细胞的修饰的(即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代)进一步包含第一靶标核苷酸序列、第二靶标核苷酸序列、第三靶标核苷酸序列或前述靶标核苷酸序列中任何两种或多种的组合的等位基因变体的修饰。
在一个实施方式中,本发明涉及修饰的(即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代),其包含根据本发明并在本文描述的修饰的植物细胞,其中第一靶标核苷酸序列为
a.与选自 SEQ ID NO: 12、13、40、41、233、256、259、262、265、268、271、274、277、280 的核苷酸序列有至少95%、96%、97%、98%、99%或100%的同一性;
b.与选自 SEQ ID NO:20、21、212、213、219、220、223、227、229、234、257、260、263、 266、269、272、275、278、281 的核苷酸序列有至少 95%、96%、97%、98%、99% 或 100% 的同一性。
在一个实施方式中,本发明涉及修饰的(即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代),其包含根据本发明并如本文描述的修饰的植物细胞,其中第二靶标核苷酸序列为
a.与选自SEQ ID N0:l、4、5和17的核苷酸序列有至少95%、96%、97%、98%、99%或 100%的同一性;
b.与选自SEQ ID NO: 8和18的核苷酸序列有至少95%、96%、97%、98%、99%或100% 的同一'I"生。
在一个实施方式中,本 发明涉及修饰的(即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代),其包含根据本发明并如本文描述的修饰的植物细胞,其中第三靶标核苷酸序列为
a.与选自 SEQ ID NO:27、32、37、和47 的核苷酸序列有至少95%、96%、97%、98%、99% 或100%的同一性;
b.与选自 SEQIDN0:28、33、38、和 48 的核苷酸序列有至少 95%、96%、97%、98%、99% 或100%的同一性。
在一个实施方式中,包含根据本发明并如本文描述的修饰的植物细胞的修饰的(即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代)为烟草品种PM132,其种子于2011年I月6日保藏于NCIMBLtd( “达佩斯条约下的国际保藏单位,位于Ferguson Building, Craibstone Estate, Bucksburn, Aberdeen, AB21 9YA, United Kingdom),登记号为NCMB 41802。在另一个实施方式中,包含根据本发明的并如本文描述的修饰的植物细胞的修饰的(即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代),为烟草系PM016,其种子以登记号NCMB 41798保藏;烟草系PM021,其种子以登记号NCMB 41799保藏;烟草系PM092,其种子以登记号NCMB 41800保藏;烟草系PM102,其种子以登记NCMB 41801保藏烟草系PM204,其种子于2011年I月6日以登记号NCMB 41803保藏于NCMB Ltd,烟草系PM205,其种子以登记号NCMB 41804保藏;烟草系PM215,其种子以登记号NCMB 41805 保藏;烟草系PM216,其种子以登记号NCMB 41806保藏;以及烟草系PM217,其种子以登记 NCIMB 41807 保藏。
在本发明的另一个实施方式中,以登记号NCMB 41802保存的烟草栽培种PM132 包含的靶标核苷酸序列与选自SEQ ID N0:256、259、262、265、268、271、274、277和280的核苷酸序列有至少95%、96%、97%、98%、99%或100%的同一性,其序列用于设计能够识别并结合于所述位点处或附近的诱变的寡核苷酸,以使得修饰的植物或植物细胞中的所述糖基转移酶(可选地还有其至少一个等位基因变体)的活性或表达相对于未修饰的植物细胞得到降低、抑制或基本上抑制,且所述修饰植物或植物细胞产生的糖蛋白在其N-聚糖上缺少 α -1, 3-连接的岩藻糖残基和β -1, 2-连接的木糖残基。
在一个具体的实施方式中,所述靶标核苷酸序列为如SEQ ID No :256所示的序列。
在另一个具体的实施方式中,所述靶标核苷酸序列为如SEQ ID No:259所示的序列。
在另一个具体的实施方式中,所述靶标核苷酸序列为如SEQ ID No:262所示的序列。
在本发明的另一个实施方式中,以登记号NCMB 41802保存的烟草栽培种PM132 包含的靶标核苷酸序列与选自SEQ ID NO: 257、260、263、266、269、272、275、278和281的核苷酸序列有至少95%、96%、97%、98%、99%或100%的同一性,其序列被用于设计能够识别并结合于所述位点处或附近的诱变的寡核苷酸,以使得修饰的植物或植物细胞中的所述糖基转移酶(可选地还有其至少一个等位基因变体)的活性或表达相对于未修饰的植物细胞得到降低、抑制或基本上抑制,且所述修饰植物或植物细胞产生的糖蛋白在其N-聚糖上缺少 α -1, 3-连接的岩藻糖残基和β -1, 2-连接的木糖残基。
在一个具体的实施方式中,所述靶标核苷酸序列为如SEQ ID Νο:257所示的序列。
在另一个具体的实施方式中,所述靶标核苷酸序列为如SEQ ID Νο:260所示的序列。
在另一个具体的实施方式中,所述靶标核苷酸序列为如SEQ ID Νο:263所示的序列。
在特定实施方式中,本发明涉及根据本发明并如本文所描述的修饰的烟草植物的后代,其中所述的后代植物包含至少一种前文限定的修饰,如糖基转移酶的活性或表达相对于未修饰的植物得到降低、抑制或基本上抑制,以及(ii)所述修饰的植物中产生的蛋白质的N-聚糖上的α -1, 3-岩藻糖或β -1, 2-木糖或二者相对于未修饰的植物是降低的。
在一个实施方式中,包含根据本发明并如本文描述的修饰的植物细胞的修饰的 (即遗传修饰的)烟草植物细胞,或烟草植物(包括其后代)可用于生产异源蛋白质的方法,所述方法包括将包含编码异源蛋白质的核苷酸序列的表达构建体引入如本文限定的修饰的烟草植物细胞或植物,所述异源蛋白质特别是疫苗抗原、细胞因子、激素、凝血蛋白质、载脂 蛋白、用于人类替代疗法的酶、免疫球蛋白或其片段;以及培养包含所述表达构建体的修饰的植物细胞以产生异源蛋白质,以及可选地,由所述植物细胞再生植物并培养所述植物及其后代。
在一个实施方式中,本发明提供方法用于降低、抑制或基本上抑制涉及植物中蛋白质N-糖基化的一种或多种糖基转移酶的酶活性。具体地,该方法包括修饰植物或植物细胞中的一种或多种糖基转移酶的编码序列,具体而言是其基因组核苷酸序列,可选地,还包括选择和/或分离修饰的植物细胞,其中一种或多种糖基转移酶的酶活性或所有糖基转移酶活性得到降低、抑制或基本上抑制。该方法可选地可包括对糖基转移酶、其片段或其等位基因或变体的鉴别。
具体而言,本发明涉及生产能够产生人源化糖蛋白的烟草植物或植物细胞的方法,该方法包括
(i)修饰烟草植物细胞的基因组
a.包含N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列;或
b. a)的第一靶标核苷酸序列以及包含β (I, 2)_木糖基转移酶或α (I, 3)_岩藻糖基转移酶的编码序列的基因组区域中的第二靶标核苷酸序列;或
c. a)的第一靶标核苷酸序列;b)的第二靶标核苷酸序列;以及包含β (I, 2)_木糖基转移酶或α (1,3)_岩藻糖基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列;以及备选地
d.包含(a),(b)或(C)的等位基因变体的基因组区域中的靶标核苷酸,或前述靶标核苷酸序列中任何两个或更多个的组合。
(ii)鉴别并可选地选择包含靶标核苷酸序列的修饰的植物或植物细胞,
其中修饰的植物或植物细胞中的如a)、b)、c)和d)中限定的糖基转移酶,以及可选地其至少一种等位基因变体的活性或表达相对于未修饰的植物细胞得到降低、抑制或基本上的抑制,且所述修饰植物或植物细胞所产生的糖蛋白的N-聚糖缺少α -1, 3-连接岩藻糖残基及β-1,2-连接的木糖残基。
具体而言,本发明涉及用于生产能够产生人源化糖蛋白的烟草植物或植物细胞的方法,该方法包括
(i)修饰烟草植物细胞的基因组
a.包含N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列;或
b. a)的第一靶标核苷酸序列以及编码N-乙酰基葡萄糖氨基转移酶第二靶标核苷酸序列;或
c. a)的第一靶标核苷酸序列和b)的第二靶标核苷酸序列以及包含N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列;其中第二或第三靶标核苷酸序列,或第二和第三靶标核苷酸序列包含(a)的等位基因变体。
(ii)鉴别及可选地,选择在靶标核苷酸序列中包含修饰的植物或植物细胞,
其中修饰的植物或植物细胞中的如a)、b)和c)中限定的糖基转移酶的活性或表达相对于未修饰的植物细胞得到降低、抑制或基本上的抑制,且所述修饰植物或植物细胞所产生的糖蛋白在其N-聚糖缺少α-1,3-连接岩藻糖残基及β-1,2-连接的木糖残基。
具体而言,用于生产根据本发明并如本文所描述的能够产生人源化糖蛋白的烟草植物或植物细胞的方法中,对烟草植物或植物细胞的基因组的修饰包括
a.鉴定在烟草植物或植物细胞中的靶标核苷酸序列中且可选地在其至少一种等位基因变体中的靶标位点,
b.基于根据本发明的靶标核苷酸序列,设计能够识别并结合于所述靶标位点处或附近诱变的寡核苷酸,及
c.在使得基因组修饰的条件下,将该诱变的寡核苷酸结合于烟草植物或植物细胞的基因组中的靶标核苷酸序列上。
在一个实施方式中,该诱变的寡核苷酸用于基因组编辑技术,尤其是用于锌指核酸酶介导的诱变、tilling、同源重组、寡核苷酸定点诱变或大范围核酸酶介导诱变,或前述技术的组合。
在一个实施方式中,本发明涉及烟草植物细胞或烟草植物,其包含根据本发明且如本文描述的方法产生的修饰的植物细胞。
在本发明另一个实施方式中,根据本发明的修饰为能够产生人源化糖蛋白的植物为烟草栽培种PM132,其以登记号NCMB 41802保藏。
在本发明的另一个实施方式中,在烟草栽培种PM132 (以登记号NCMB 41802保藏)中鉴别的并用于设计能够识别并结合于所述靶标位点处或附近的诱变的寡核苷酸的靶标核苷酸序列与选自SEQ IDN0:256、259、262、265、268、271、274、277和280的核苷酸序列有至少 95%、96%、97%、98%、99% 或 100% 的同一性。
在一个具体的实施方式中,所述靶标核苷酸序列如SEQ ID No:256所示。
在本发明的另一个实施方式中,在烟草栽培种PM132 (以登记号NCMB 41802保藏)中鉴别的并用于设计能够识别并结合于所述靶标位点处或附近的诱变的寡核苷酸的靶标核苷酸序列与选自SEQ ID NO: 257、260、263、266、269、272、275、278和281的核苷酸序列有至少 95%、96%、97%、98%、99% 或 100% 的同一性。·
在一个具体的实施方式中,所述靶标核苷酸序列如SEQ ID No:257所示。
在一个实施方式中,包含根据本发明并在本文中描述的修饰的植物细胞的修饰的 (即遗传修饰的)烟草植物细胞或烟草植物(包括其后代)为烟草栽培种PM132 (以登记号 NCIMB 41802保藏),其进一步地(a)在包含β (1,2)-木糖基转移酶的编码序列的基因组区域中包含至少第二靶标核苷酸序列的修饰,其序列分别与选自SEQ ID N0:l、4、5和17及 SEQ ID Ν0:8和18的核苷酸选序列有95%、96%、97%、98%、99%或100%的同一性;或(b)在包含α (1,3)_岩藻糖基转移酶的编码序列的基因组区域中包含至少第三靶标核苷酸序列的修饰,其序列分别与选自SEQ ID N0:27、32、37和47以及SEQ ID NO:28、33、38和48的核苷酸选序列有95%、96%、97%、98%、99%或100%的同一性;或(8)和(b)的组合。
由于烟草基因组的大小和复杂度以及潜在的多种变体和等位基因的存在,需要想出鉴别这些糖基转移酶的基因序列的策略。根据本发明,提供了用于鉴别编码植物糖基转移酶的基因序列的方法。在一个具体的实施方式中,本发明的方法可包括Q)根据本领域已知方法构建植物基因组DNA文库,如细菌人工染色体(BAC)基因组DNA文库,(ii)将多聚核苷酸探针与基因组DNA文库中的基因组克隆如BAC克隆在允许探针结合于同源核苷酸序列的条件下进行杂交,以及(iii)鉴别杂交于探针的基因组DNA克隆。探针是根据编码糖基转移酶的核苷酸序列或其片段而设计的。包括编码糖基转移酶的片段或部分的基因组 DNA克隆的核苷酸序列可根据本领域已知方法进行测序。
备选地,包含编码已知的糖基转移酶的序列的多核苷酸,如在第一种植物中已经鉴别的多核苷酸,可用于筛选第二种植物如烟草植物的外显子序列集合。与编码已知糖基转移酶的多核苷酸有同源性的外显子序列可用于开发探针以筛选第二种植物的基因组DNA 文库如烟草BAC文库,以鉴别BAC克隆并确定第二种植物的糖基转移酶的基因组序列。
为帮助鉴别编码本发明的糖基转移酶的基因组序列,将这些基因组核苷酸序列与已知在具体植物器官如叶中表达的外显子核苷酸序列数据库进行计算机相比较。选择匹配所需表达谱的基因组核苷酸序列,如叶中表达的基因或只在叶中表达的基因,进行进一步定性。本发明的该方面将鉴别过程聚焦于相关序列并降低了候选序列的数量。这样排除了在具体器官(如叶)中不表达的假基因、失活等位基因或变体。
因此,作为一个非限制性实例,编码烟草的β_(1,2)_木糖基转移酶的基因组 DNA序列或其片段可通过使用多核苷酸探针筛选烟草BAC文库而鉴别。该探针可根据烟草的β_(1,2)-木糖基转移酶的外显子的核苷酸序列而设计,可通过编译与拟南芥 (Arabidopsis thaliana) β -(1,2)-木糖基转移酶有同源性的烟草属序列而装配。外显子的表达可通过使用包含烟草外显子的多核苷酸的微阵列对烟草叶中的其mRNA进行检测而得到测试。
在另一个非限制性实例中,编码烟草的α (1,3)_岩藻糖基转移酶的基因组DNA 序列或其片段可通过使用多核苷酸探针筛选烟草BAC文库而鉴别。该探针可根据烟草的α (1,3)_岩藻糖基转移酶的外显子的核苷酸序列而设计,可通过鉴别显示与拟南芥(Arabidopsis thaliana)的α (1,3)-岩藻糖基转移酶的同源性的烟草属序列而编译,并通过使用包含烟草外显子的多核苷酸的微阵列对其表达进行检测而得到测试。
用于在植物细胞中鉴别编码本发明的糖基转移酶的基因组DNA序列的备选方法还可用在根据本发明的方法中。根据上文描述的方法,本发明公开的糖基转移酶的多核苷酸序列可用于鉴别这些糖基转移酶和其他相关糖基转移酶的其他的等位基因。
在本发明的另一个实施方式中,包含糖基转移酶的编码序列的基因组DNA序列或其片段可通过聚合酶链式反应(PCR)而鉴定,使用的核酸引物是根据编码糖基转移酶的序列而设计的。具体而言,下文的正向引物和反向引物可组合使用以鉴别本发明的糖基转移酶和其他相关糖基转移酶的其他的等位基因
SEQ ID NO:2的正向引物和SEQ ID NO:3的反向引物;
SEQ ID NO: 10的正向引物和SEQ ID NO: 11的反向引物;
SEQ ID NO: 15的正向引物和SEQ ID NO: 16的反向引物;
SEQ ID NO:23的正向引物和SEQ ID NO:24的反向引物;
SEQ ID NO:25的正向引物和SEQ ID NO:26的反向引物;
SEQ ID NO:30的正向引物和SEQ ID NO:31的反向引物;
SEQ ID NO:35的正向引物和SEQ ID NO:36的反向引物;
SEQ ID NO:45的正向引物和SEQ ID NO:46的反向引物;或0100]SEQIDN0:231的正向引物和SEQIDNO:232的反向引物, 0101]SEQIDNO :236的正向引物和SEQIDNO:237的反向引物,0102]SEQIDNO :238的正向引物和SEQIDNO:239的反向引物,0103]SEQIDNO :240的正向引物和SEQIDNO:241的反向引物,0104]SEQIDNO :242的正向引物和SEQIDNO:243的反向引物,0105]SEQIDNO :244的正向引物和SEQIDNO:245的反向引物,0106]SEQIDNO :246的正向引物和SEQIDNO:247的反向引物;0107]SEQIDNO :248的正向引物和SEQIDNO:249的反向引物;0108]SEQIDNO :250的正向引物和SEQIDN0:251的反向引物;0109]SEQIDNO :252的正向引物和SEQIDNO :253的反向引物,或0110]SEQIDNO :254的正向引物和SEQIDNO :255的反向引物
本发明提供的引物具有如SEQ ID Ν0:2和SEQ ID NO:3所示的序列,用于扩增叠连群gDNA_cl736055的片段;具有如SEQ ID N0:10和SEQ ID NO: 11所示的序列,用于扩增烟草和本氏烟草的GnT1-B的片段;具有如SEQ ID NO: 15和SEQ ID NO: 16所示的序列,用于扩增叠连群CH0_0F4335xnl3fI的片段;具有如SEQ ID N0:23和SEQ ID N0:24所示的序列,用于扩增烟草和本氏烟草的GnT1-A的片段;具有如SEQ ID N0:25和SEQ ID NO:26 所示的序列,用于扩增叠连群CH0_0F3295xjl7fl的片段;具有如SEQ ID N0:30和SEQ ID NO:31所示的序列,用于扩增叠连群gDNA_cl765694的片段;具有如SEQ ID NO:35和SEQ ID N0:36所示的序列,用于扩增叠连群CH0_0F4881xd22drl的片段;或有如SEQ ID NO:45 和SEQ ID N0:46所示的序列,用于扩增叠连群CH0_0F4886xdllfl的片段;具有如SEQ ID N0:231和SEQ ID NO:232所示的序列,用于扩增叠连群gDNA_cl690982的片段,其含有烟草 N-乙酰葡萄糖氨基转移酶I内含子-外显子序列,具有SEQ ID N0:236和SEQ ID N0:237所示的序列,用于扩增烟草PM132的FABIJ1-同源物,具有SEQ ID N0:238和SEQ ID NO:239 所示的序列,用于扩增烟草PM132的CPOGnTI基因组序列,具有SEQ ID NO:240和SEQ ID 勵:241所示的序列,用于扩增烟草?] 132的04080702.1同源物,具有SEQ ID N0:242和SEQ ID NO: 243所示的序列,用于扩增烟草希克斯阔叶的GnTI序列,具有SEQ ID NO: 244和SEQ ID NO: 245所示的序列,用于扩增烟草希克斯阔叶的GnTI序列,具有SEQ ID NO: 246和SEQ ID NO: 247所示的序列,用于扩增烟草PM132的gDNA,其含有5’UTR及外显子1_7,具有SEQ ID N0:248和SEQ ID NO:249所示的序列,用于扩增烟草PM132的gDNA,其含有外显子4 一 13;具有SEQ ID N0:250和SEQ ID NO:251所示的序列,用于扩增烟草PM132的gDNA,其含有及外显子12-19及3’UTR,具有SEQ ID N0:252和SEQ ID N0:253所示的序列,用于扩增烟草 PM132 的 gDNA,其含有外显子 12-19 及 3’UTR,具有 SEQ ID NO: 254 和 SEQ ID NO: 255, 用于扩增烟草PM132的gDNA,其含有及外显子12-19及3’ UTR,
本发明还包含了多核苷酸,其包含SEQ ID N0:2、3、10、ll、15、16、23、24、25、26、 30、31、35、36、45、或 46、231、232、236、237、238、239、240、241、242、243、244、245、246、247、 248、249、250、251、252、253、254或255中所示的引物之一的核苷酸序列或者大于或等于10 碱基对长的其亚序列。然而,技术人员能够修饰及修改这些弓丨物、引物序列或引物对,例如通过延长或缩短这些序列或二者的组合或特异的核苷酸交换。
根据本发明如上文所描述的方法,本发明提供了核苷酸序列,其编码本发明的糖基转移酶的至少片段,特别是 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41、和 47、 233。在另一个实施方式中,本发明提供了核苷酸序列,其编码本发明的糖基转移酶的至少片段,特别是 SEQ ID N0:256、259、262、265、268、271、274、277 和 280。在另一个实施方式中,本发明提供了核苷酸序列,其编码本发明的糖基转移酶的至少片段,特别是SEQ ID N0:18、20、21、22、28、33、38、48、212、213、219、220、223、225、227、229、234。在另一个实施 方式中,本发明提供了核苷酸序列,其编码本发明的糖基转移酶的至少片段,特别是SEQ ID N0:257、260、263、266、269、272、275、278、281。
本发明还包含的是与SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 和 47、 233 中任何一项的核苷酸序列,与 SEQ ID N0:SEQ ID NO:256、259、262、265、268、271、274、 277 和 280 中任何一项的核苷酸序列,与 SEQ ID NO: 18、20、21、22、28、33、38、48、212、213、 219、220、223、225、227、229、234 中任何一项的核苷酸序列,与 SEQ ID NO:257、260、263、 266、269、272、275、278、281中任何一项的核苷酸序列共享至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多核苷酸。本发明中还包含的是多核苷酸,其具体而言在严格的条件下杂交于核酸探针,所述探针包含(i)SEQ ID N0:l、4、5、7、12、13、 14、17、27、32、37、40、41、和47、233 中任何一项的核苷酸序列;或(ii)SEQ ID N0:l、4、5、7、 12、13、14、17、27、32、37、40、41和47,233中任何一项的核苷酸序列的互补序列。
本发明中还包含的是多核苷酸,其具体而言在严格的条件下杂交于核酸探针,所述探针包含(i)SEQ ID N0:256、259、262、265、268、271、274、277 和 280 中任何一项的核苷酸序列,或(ii)SEQ ID NO:SEQ ID NO:256、259、262、265、268、271、274、277 和 280 中任何一项的核苷酸序列的互补序列。
本发明中还包含的是多核苷酸,其具体而言在严格的条件下杂交于核酸探针,所述探针包含(i)SEQ ID N0:257、260、263、266、269、272、275、278、281 中任何一项的核苷酸序列,或(ii)SEQ ID N0:257、260、263、266、269、272、275、278、281 中任何一项的核苷酸序列的互补序列。
本发明中还包含的是多核苷酸,其具体而言在严格的条件下杂交于核酸探针,所述探针包含(i)SEQ ID N0:18、20、21、22、28、33、38、48、212、213、219、220、223、225、227、 229、234 中任何一项的核苷酸序列;或(ii)SEQ ID NO: 18、20、21、22、28、33、38、48、212、 213、219、220、223、225、227、229、234中任何一项的核苷酸序列的互补序列。
本发明中还包含的是上文所公开的多核苷酸的片段。
本发明的多核苷酸的片段包括但不限于寡核苷酸或引物,其长度可为至少16个核苷酸。在多种实施方式中,片段长度可为至少20、30、40、50、60、70、80、90、100、200、300、 400、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000 或更多的连续核苷酸。备选地,这些片段可包含编码本 发明的糖基转移酶的大约10、20、25、30、 35、40、45、50、55、60、65、70、75、80、85、90、100、150、200、250、300、350、400、450、500、600、 700、800、900、1000或更多的连续氨基酸残基的核苷酸序列。本发明的多核苷酸片段还可指本发明的糖基转移酶的外显子或内含子,以及这些多核苷酸编码区的部分,其编码功能结构域如酶的信号序列和活性位点。许多这些片段可用作核酸探针用于鉴别本发明的多核苷酸。
本发明进一步涉及上文鉴定的本发明的多核苷酸所编码的糖基转移酶,其中所述糖基转移酶为
a. N-乙酰葡萄糖氨基转移酶,其氨基酸序列如SEQ ID NO: 214、215、217、218、221、 222、224、228、230、235、258、264、267、270、273、276、279 和 282 所示;
b. β (I, 2)-木糖基转移酶,其氨基酸序列如SEQ ID NO:9和19所示;
c. α (1,3)-岩藻糖基转移酶,其氨基酸序列如SEQ ID NO: 29、34、39和49所示;
d.氨基酸序列,其与(i)、(ii)、或(iii)的氨基酸序列有至少95%、96%、97%、98%、 99%的同一性。
在本发明的一个实施方式中,如本文限定的基因组核苷酸序列被用于在以下序列中鉴别靶标位点,
a.包含N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列;或
b. a)的第一靶标核苷酸序列和包含β (I, 2)_木糖基转移酶的编码序列的基因组区域中的第二靶标核苷酸序列;或
c. a)的第一靶标核苷酸序列和包含α (I, 3)-岩藻糖基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列;或
d. a)、b)和c)的所有靶标核苷酸序列;
以进行修饰使得(i)包含该修饰的植物细胞中的N-乙酰基葡萄糖氨基转移酶, 或N-乙酰基葡萄糖氨基转移酶和β (1,2)_木糖基转移酶,或N-乙酰基葡萄糖氨基转移酶和α (1,3)_岩藻糖基转移酶或N-乙酰基葡萄糖氨基转移酶、β (1,2)_木糖基转移酶、 α (1,3)_岩藻糖基转移酶以及可选地其至少一种等位基因变体的活性或表达,相对于未修饰的植物细胞得到降低,(ii)包含该修饰的修饰的植物细胞中蛋白质的N-聚糖上的 α -1, 3-岩藻糖或β -1, 2-木糖,或二者相对于未修饰的植物细胞得到降低。
在本发明的一个实施方式中,如本文限定的基因组核苷酸序列被用于在以下序列中鉴别靶标位点,
a.包含N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列;或
b. a)的第一靶标核苷酸序列和包含第二种N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第二靶标核苷酸序列;或
c. a)的第一靶标核苷酸序列和包含第三种N-乙酰基葡萄糖氨基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列;或
d. a)、b)和c)的所有靶标核苷酸序列;
以进行修饰,使得(i)包含该修饰的修饰的植物细胞中的N-乙酰基葡萄糖氨基转移酶,或者两种或更多种N-乙酰基葡萄糖氨基转移酶的活性或表达得到降低,和(ii)包含该修饰的修饰的植物细胞中蛋白质的N-聚糖上的α-1,3-岩藻糖或β-1,2-木糖,或二者相对于未修饰的植物细胞得到降低。所述第二或第三核苷酸序列或第二和第三核苷酸序列可为第一核苷酸序列的等位基因变体。
在本发明一个具体 实施方式中,使用了选择性结合于如本文所限定的基因组核苷酸序列或编码序列的非天然锌指蛋白质,用于产生锌指核酸酶,其在至少一靶标核苷酸序列中引入双链断裂。
在另一个实施方式中,本发明针对本文公开的编码序列上游和下游的调控区域, 这些可容易地由本文提供的基因组序列进行确定和分离。这些调控区域内包括而不限于, 启动子序列、上游激活子序列以及调制本文鉴别的基因表达的调节蛋白质的结合位点。
对应于本发明的糖基转移酶的基因组DNA序列的RNA1、shRNA (McIntyre和 Fanning(2006), BMC Biotechnology 6:1)、核酶、反义核苷酸序列(如反义DNA或反义 RNA)、siRNA(Hannon(2003),Rna1:A Guide to Gene Silencing, Cold Spring Harbor Laboratory Press, USA),及 PNA 也包括在内。
在具体的实施方式中,本发明提供四个编码α-l,3-岩藻糖基转移酶的基因序列、其片段、变体或等位基因形式;两个编码β-1,2-木糖基转移酶的基因序列、其片段、变体或等位基因形式;以及一个编码N-乙酰基葡萄糖氨基转移酶I的基因序列、其片段、变体或等位基因形式。具体而言,本发明的糖基转移酶表达于叶中。
在两种或多种核酸或蛋白质序列的情况下,术语“同一性百分比”指的是两种或多种序列或亚序列在比较和比对其最大对应性时,其为相同的或具有特定百分比的氨基酸残基或核苷酸是相同的,如使用下列序列对比算法之一或通过目测所测量的。术语“同一性”用于本文的核苷酸序列或氨基酸序列的情况下,其描述了两个序列彼此有至少50%、至少55%、至少60%、具体地为至少70%、至少75%、更具体地为至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少 96%、至少97%、至少98%、至少99%或100%的同一性。
如果两个要相互比较的序列长度有差异,则序列同一性优选地涉及较短序列中与较长序列中核苷酸残基相同的核苷酸残基的百分比。如本文所使用的,两个序列间的同一性百分比为这些序列共有的相同位置数量的函数(即,同一性%=相同位置#/位置#x 100),其中考虑到了对两个序列进行最佳比对需要引入的缺口数量以及每个缺口的长度。两个序列之间的序列比较及同一性百分比的确定可使用数学算法进行,如本文下面所描述的。例如,序列同一'I"生可常规地使用计算机程序如Bestfit程序(Wisconsin Sequence Analysis Package, Version 8for Unix, Genetics Computer Group, University Research Park, 575Science Drive Madison, WI 53711)而确定。Bestfit 使用了 Smith 和 Waterman 的局部同源性算法(Advances in Applied Mathematics 2 (1981),482-489)以寻找两个序列间具有最高序列同一性的区段。在使用Bestfit或其他序列比对程序确定某具体序列与本发明的参考序列是否有例如95%的同一性时,优选地调整这些参数以使同一性百分比在整个参考序列长度范围内得到计算,且允许存在参考序列中核苷酸总数的多至5%的同源缺口。当使用Bestfit时,优选地使所述可选参数处于其预设(“缺省”)值。在比较给定序列和上文描述的本发明的序列之间出现的偏差可例如由于添加、删除、置换、插入或重组而造成。优选地还可使用程序“fasta20u66”(版本 2. 0u66, September 1998 by William R. Pearson and the University of Virginia;另 JAL ff. R. Pearson (1990), Methods in Enzymology 183, 63-98,附录实施例及 http://workbench, sdsc. edu/)进行这样的序列比较。为此目的,可使用“缺省”参数设置。
如果要通过序列比较来比较的两个核苷酸序列在同一性上有差异,指的是较短序列和匹配较短序列的较长序列部分。换言之,当进行比较的序列不具有相同的长度时,则同一性程度优选地指的是较短序列中与较长序列核苷酸残基同一的核苷酸残基百分比或指的是较长序列中与较短序列的核苷酸序列同一的核苷酸百分比。在此情况下,技术人员可容易地确定较长序列中“匹配”较短序列的部分。
与本文描述的核苷酸或氨基酸序列有至少50%、至少55%、至少60%、特别是70%、至少75%、更优选地为至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%,或至少99%的同一性的核苷酸或氨基酸可为这些序列的等位基因、衍生物或变体,其优选地具有类似的生物学功能。其可为天然发生的变异如等位基因序列,来自 其他生态型、变种、物种等的序列或突变。这些突变可能是天然形成的或通过人为的诱变方法产生的,如本发明中所公开的。进一步地,这些变异可为人工产生的序列。这些等位基因变体可为天然发生的变体或合成产生的变体或由重组DNA技术产生的变体。可例如通过删除、置换、添加、插入或重组或插入重组产生上述多核苷酸的衍生物。术语“添加”指的是在给定序列的末端添加至少一个核酸残基或氨基酸,而“插入”指的是将至少一个核酸残基或氨基酸插入给定序列之内。
两个核苷酸序列基本上相同的另外一种表示为所述两个多核苷酸在严格条件下相互杂交。词语“特异性杂交于”指的是当序列存在于复合物混合物(如,总细胞)DNA或RNA 中时,分子在严格条件下仅仅结合、复合或杂交于具体核苷酸序列。“基本上结合”指的是核酸探针和靶标核酸之间的互补杂交,并包含少量的错配,这是通过降低杂交介质的严格性达到的,以对靶标核酸序列进行可取的检测。
能够杂交于本文提供的多核苷酸序列的多核苷酸序列可例如分离自植物的基因组DNA文库或cDNA文库。具体而言,这些多核苷酸来自植物来源,尤其优选地来自烟草属的植物,特别是本氏烟草或烟草。备选地,这些核苷酸序列可通过遗传工程或化学合成而制备。
这些能够杂交的多核苷酸序列可使用本文描述的多核苷酸序列或其部分或反向互补物而鉴别和分离,例如通过根据标准方法的杂交(见例如,Sambrook and Russell(2001), Molecular Cloning:A Laboratory Manual, CSH Press, Cold Spring Harbor, NY, USA)。包含与所列出的SEQ ID NO中所示的核苷酸序列相同或基本上相同的核苷酸序列或其部分或片段可例如用作杂交探针。用作杂交探针的片段也可为通过通常的合成技术制备的合成片段,其序列与根据本发明的核苷酸序列基本上同一。
“严格杂交条件”和“严格杂交洗涤条件”在核酸杂交实验如DNA和RNA杂交的情况下为序列依赖性的,在不同的环境参数下也有不同。较长序列在较高温度下特异性地杂交。对核酸杂交的深入指导见于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2〃0verview of principles of hybridization and the strategy ofnucleic acid probe assays〃Elsevier, New York。一般地,高度严格的杂交和洗漆条件选择为比限定离子强度和pH下具体序列的热熔点低大约5°C。通常,在“严格条件”下探针会杂交于其靶标亚序列而不杂交于其他序列。
热解链点为(限定离子强度和pH下)50%的靶标序列杂交于完全匹配探针的温度。 非常严格的条件选择为等于具体探针的解链温度(Tm)。用于Southern或Northern印迹中对于滤纸上具有超过100个互补残基的互补核酸的杂交的一个严格杂交条件的实例为, 使用50%甲醛(含有Img的肝素),在42°C下杂交过夜。高度严格洗涤条件的一个实例为以O.15M NaCl在72°C洗涤大约15分钟。严格洗涤条件的一个实例为以O. 2倍的SSC在65°C 下洗涤15分钟(SSC缓冲液的配制见Sambrook,见下文)。通常在低严格洗涤后会进行高度严格的洗涤条件,以移除背景探针信号。用于例如超过100个核苷酸的双链的中等严格洗涤的实例为I倍的SSC在45 °C下洗涤15分钟。用于例如超过100个核苷酸的双链的中等严格洗涤的实例为4-6倍的SSC在40°C下洗涤15分钟。对于短探针(例如,大约10-50个核苷酸),严格的条件一般涉及的盐浓度为低于大约1. OM Na离子,一般浓度为大约O. 01-1. OM 的Na离子浓度(或其他盐),pH为7. 0-8. 3 ,温度一般至少为大约30°C。严格的条件还可通过添加去稳定试剂如甲酰胺而达到。通常,在具体的杂交测定中信噪比为不相关探针观察到的比率的2倍(或更高)表明检测的是特异性杂交。如果其编码的蛋白质基本上是同一的,则严格条件下不相互结合的核酸还是基本上同一的。例如当使用遗传密码允许的最大密码子简并性制造出一个的核酸拷贝时会发生此种情况。
在鉴别出至少编码本发明的糖基转移酶的一个片段的核苷酸序列后,本发明进一步提供了用于在植物或植物细胞中修饰核苷酸序列的方法,产生的植物或植物细胞显示糖基转移酶的酶活性的降低、抑制或基本上的抑制,或显示了糖基转移酶表达水平的降低。所述酶活性的降低、抑制或基本上的抑制或者表达水平的变化是相对天然发生的植物细胞、 未修饰植物细胞或不是用本发明的方法修饰的植物细胞而言的,其中任何一种都可用作对照。针对这样的对照的酶活性或表达水平的比较可通过任何本领域已知方法进行。
术语“修饰的植物细胞”或“修饰的植物”在本文与术语“遗传修饰的植物细胞”或 “遗传修饰的植物”交换使用,指的是受到人工修饰而在植物细胞基因组内部包含的核苷酸序列中的一个当中含有突变或修饰(这是通过应用本领域已知方法进行的,包括但不限于, 化学诱变或基因组编辑技术,如本文下文中详述的)的植物细胞以及包含这样的修饰的植物细胞的植物。
本领域许多已知方法可用于突变本发明的糖基转移酶基因的核苷酸序列。向基因序列中随机引入突变的方法可以为化学诱变,例如但不限于EMS诱变和辐射诱变。向细胞引入靶向突变的方法包括但不限于基因组编辑技术,特别是锌指核酸酶介导的诱变、 tilling (革巴向基因组中诱导的局部损伤,如McCallum等人,Plant Physiol, June2000, Vo1.123, pp. 439-442 以及 Henikoff 等人,Plant Physiologyl35:630-636 (2004)中所描述的)、同源重组、寡核苷酸定向诱变、以及大范围核酸介导的诱变。本领域许多已知用于筛选突变的基因序列的方法可用于对突变进行鉴别或确认。
锌指核酸酶介导的诱变的一般用途在本领域已知,并描述于专利出版物,例如但不限于,W002057293、W002057294、W00041566、W00042219,和 W02005084190,其以全文并入本文作为参考。大范围核酸酶介导的诱变的一般用途在本领域已知,并描述于专利出版物, 例如但不限于,W096/14408、W02003025183、W02003078619、W02004067736、W02007047859 和 W02009059195,其以全文并入本文作为参考。
因此本发明的一个方法包括通过应用诱变如化学诱变或放射性诱变,对植物细胞中的编码本发明的糖基转移酶的序列进行修饰。本发明的另一个方法包括通过应用基因组编辑技术(例如但不限于,锌指核酸酶介导的诱变)、“tilling”(定向诱导基因组局部突变技术)、同源重组、寡核苷酸定向诱变及大范围核酸介导的诱变)对编码本发明的糖基转移酶的序列中的靶标位点进行修饰。
考虑到植物细胞中可能有多种有活性的糖基转移酶、变体和等位基因,为达到酶活性的降低、基本上抑制或完全抑制,包括在植物细胞中修饰超过一种编码糖基转移酶的基因序列。在本发明的优选的实施方式中,是通过应用一种或多种本领域已知的基因组编辑技术产生修饰的。本发明的修饰的植物细胞可使用大量的策略而产生。
在本发明的一个实施方式中,修饰了植物细胞中编码第一种糖基转移酶的第一基因序列或其片段, 随后鉴别并分离显示第一种糖基转移酶活性降低的修饰的植物细胞。然后包含修饰的第一种糖基转移酶基因的修饰的植物细胞经过诱变,其中修饰了编码第二种糖基转移酶的第二基因序列或其片段。随后鉴别并分离修饰的植物细胞,其显示第二种糖基转移酶的活性降低,或糖基转移酶活性相对于仅携带第一种修饰的细胞的进一步降低。 鉴定后可对修饰的植物细胞进行分离。在此阶段获得的修饰的植物细胞包含两个基因序列中的两种修饰,所述基因序列编码了两种糖基转移酶,或一种糖基转移酶的两种变体或等位基因。
本发明的修饰的植物细胞或修饰的植物可通过产生与未修饰植物或植物细胞中产生的糖基转移酶不同分子量的突变糖基转移酶而得到鉴别。突变的糖基转移酶可以为在未修饰的植物或植物细胞中产生的糖基转移酶的截短形式或延长形式,并可用作标记物以帮助鉴别修饰的植物或植物细胞。多肽的截短或延长通常是由于在编码序列中引入终止密码子或在阅读框中引入移码导致使用了备选的阅读框中的终止密码子。
本发明进一步提供了修饰的植物细胞经历编码其他糖基转移酶的基因或糖基转移酶的其他变体或等位基因的一轮或多轮连续修饰,例如编码糖基转移酶的第三、第四、第五、第六、第七或第八基因序列或者其变体或等位基因。预期的是受到修饰的第一基因序列编码本发明的糖基转移酶,例如但不限于β_1,2-木糖基转移酶、α-1,3_岩藻糖基转移酶或N-乙酰葡萄糖氨基转移酶。编码糖基转移酶的第二、第三、第四、第五、第六、第七或第八基因或其等位基因各自独立地可编码β_1,2-木糖基转移酶、α-1,3-岩藻糖基转移酶或N-乙酰葡萄糖氨基转移酶。所述修饰的植物细胞显示了降低的酶活性或者酶活性的抑制或基本上抑制,其可包含一个、两个、三个、四个、五个、六个、七个、八个或更多的分别编码了本发明的一种糖基转移酶的修饰的基因序列,其中所述糖基转移酶各自独立地为 β -1, 2-木糖基转移酶、α -1, 3-岩藻糖基转移酶或N-乙酰葡萄糖氨基转移酶。
因此,本发明提供了修饰的植物细胞,其包含两个或更多个修饰的β-1, 2-木糖基转移酶基因组DNA序列、两个或更多个修饰的α -1, 3-岩藻糖基转移酶基因组DNA序列、 或者两个或更多个修饰的N-乙酰葡萄糖氨基转移酶基因组DNA序列。包含一个或更多个修饰的β -1, 2-木糖基转移酶基因组DNA序列和一个或更多个修饰的N-乙酰葡萄糖氨 基转移酶基因组DNA序列的修饰的植物细胞也包括在内。还提供了包含一个或更多个修饰的 α -1, 3-岩藻糖基转移酶基因组DNA序列和一个或更多个修饰的N-乙酰葡萄糖氨基转移酶基因组DNA序列的修饰的植物细胞。还包括的是包含一个或更多个修饰的α-1,3-岩藻糖基转移酶基因组DNA序列和一个或更多个修饰的β -1, 2-木糖基转移酶基因组DNA序列的修饰的植物细胞。
另一种用于产生包含超过一个修饰的糖基转移酶基因序列的修饰植物或植物细胞的策略包括将两种不同的植物进行杂交,其中所述两种植物中每种都包含一个或更多个不同的修饰的糖基转移酶基因序列。用于杂交的修饰的植物可通过上文描述的本发明的方法而产生。
用于如上文描述的杂交或基因组修饰的修饰植物或植物细胞可通过以下特征而鉴别或选择(i) 一种或多种糖基转移酶的活性降低或不可检测;(ii) 一种或多种糖基转移酶的表达降低或不可检测;(iii)植物蛋白质或异源蛋白质的N-聚糖上的α-1,3_连接果糖β -1, 2-连接的木糖或二者的水平降低或不可检测;或(iv)修饰植物或植物细胞中的高甘露糖型N-聚糖的增加或累积。
在本发明的一个实施方式中,修饰的植物或修饰的植物细胞可通过锌指核酸酶介导的诱变而产生。锌指DNA-结合结构域或基序由大约30个氨基酸构成,其折叠成一种 β β α结构,其中的α-螺旋插入DNA双螺旋中。如本发明中所使用的,术语“ α -螺旋” 指的是一种蛋白质二级结构中的基序,其为右手或左手卷曲,其中氨基酸的每个N-H基团的氢键都结合于相对于第一个氨基酸为-4位置的氨基酸的C=O基团上。如本文所使用的, “β_桶”指的是一种蛋白质二级结构中的基序,其包含两条β_链,其中第一条链与第二条链以氢键相连而形成闭合结构。如本文所使用的,“β β α结构”指的是蛋白质中的一种结构,其由包含两条反向平行的β链的桶以及一个α-螺旋构成。如本发明中所使用的,术语“锌指DNA-结合结构域”指的是一种蛋白质结构域,其包含了锌离子并能够结合于特定的三碱基对DNA序列。如本文所使用的,术语“非天然锌指DNA-结合结构域”指的是在包含要修饰的DNA的细胞或生物体中不产生的锌指DNA-结合结构域。
锌指DNA-结合结构域或基序中结合于靶标DNA中的三碱基对序列的关键氨基酸为相对α -螺旋起始氨基酸-1、+1、+2、+3、+4、+5和+6。可修饰相对锌指DNA-结合结构域或基序的α -螺旋起始的氨基酸-1、+1、+2、+3、+4、+5和+6而同时维持β -桶骨架以产生结合于不同的三碱基对序列的新的DNA-结合结构域或基序。这样的新DNA-结合结构域可以为非天然发生的锌指DNA-结合结构域。除了由相对^-螺旋起始点位置为_1、+1、+2、+3、+4、+5和+6的氨基酸识别的三碱基对序列外,这些氨基酸中有一些还与三碱基对序列识别位点之外的一个碱基对相互作用。通过组合两种、三种、四种、五种、六种或更多锌指 DNA-结合结构域或基序,可产生特异性结合于更长的DNA序列的锌指蛋白质。例如,包含两个锌指DNA-结合结构域或基序的锌指蛋白质可识别特异的六碱基对序列,而包含四个锌指DNA-结合结构域或基序的锌指蛋白质可识别特异的十二碱基对序列。锌指蛋白质可包含两种或多种天然锌指DNA-结合结构域或基序,或两种或多种通过截短或延长或结合特定选择方法(例如但不限于噬菌体展示选择、细菌双杂交选择或细菌单杂交选择)的定点诱变的衍生自天然或野生型锌指蛋白质非天然锌指DNA-结合结构域或基序或天然和非天然锌指DNA-结合结构域的任何组合。如本文上下文中所使用的,“截短”指的是含有少于天然锌指蛋白质中所见的锌指DNA-结合结构域或基序的完全数量的锌指蛋白质。如本文上下文中所使用的,“延长”指的是含有多于天然锌指蛋白质中所见的锌指DNA-结合结构域或基序的全部数量的锌指蛋白质。本领域已知的用于选择基因组序列之内的锌指蛋白质的多核苷酸技术可用于本发明。用于构建结合于这种多核苷酸序列的非天然锌指蛋白质的方法也对本领域技术人员已知,并可用于本发明。
在本发明一个具体实施方式
中,包含本发明的糖基转移酶的部分或全部编码序列的基因组DNA序列是通过锌指核酸酶介导的诱变修饰的。对所述基因组DNA序列搜寻用于锌指蛋白质结合的独特位点。备选地,对所述基因组DNA序列搜寻用于锌指蛋白质结合的两个独特位点,其中两个位点在相反的链上并相互闭合。所述两个锌指蛋白质靶标位点可相 距0、1、2、3、4、5、6或更多碱基对。所述锌指蛋白质靶标位点可在糖基转移酶基因序列的编码序列或控制糖基转移酶表达的调控元件中,例如但不限于糖基转移酶基因的启动子区域。具体而言,所述一种或两种锌指蛋白质为非天然锌指蛋白质。
因此,本发明提供结合于本发明的糖基转移酶的锌指蛋白质,例如但不限于, β -1, 2-木糖基转移酶或其片段、α -1, 3-岩藻糖基转移酶或其片段、N-乙酰葡萄糖氨基转移酶或其片段。在一个优选的实施方式中,锌指蛋白质结合于本发明的烟草的糖基转移酶。
预期的是用于通过锌指核酸酶介导诱变来突变编码本发明的糖基转移酶的基因序列如基因组DNA序列的方法可选地包括以下一个或多个步骤(i)提供至少两种选择性结合于基因序列中不同靶标位点的锌指蛋白质;(ii)构建两种表达构建物,其各自编码了包含步骤(i)中的两种不同非天然锌指蛋白质之一的不同锌指核酸酶,以及可操作地连接于在植物细胞中可操作的表达对照序列的核酸酶;(iii)将所述两种表达构建物引入其中产生所述两种不同锌指核酸酶的植物细胞,这样在植物细胞基因组的基因组DNA序列中或在至少一个所述靶标位点处或附近引入双链断裂。所述两种表达构建物向植物细胞的引入可同时或顺序完成,其可选地包括对摄取了第一种构建物的细胞的选择。
如本文所使用的,双链断裂(DSB)指的是DNA或RNA的两条链上都有断裂。双链断裂可发生在基因组DNA序列上的位点处,其从一个靶标位点去除不超过5碱基对-1500碱基对,特别是不超过5碱基对-200碱基对,特别是不超过5碱基对-20碱基对。双链断裂可促进非同源末端连接,导致基因组DNA序列中的靶标位点处或附近产生突变。如本文所使用的,“非同源末端连接(NHEJ)”指的是一种修复机制,其通过直接连接修复双链断裂而不需要同源模板,因此可在双链断裂发生前对序列有诱变性。
所述方法可选地可进一步包含步骤(iv)将至少包含双链断裂上游核苷酸序列的第一同源区域和双链断裂上游核苷酸序列的第二同源序列的多核苷酸引入所述植物细胞。 所述多核苷酸可包含的核苷酸序列对应于含有异源核苷酸序列的删除或插入的糖基转移酶基因序列。因此,该多核苷酸可促进靶标位点处或附近的同源重组,导致同源序列插入基因组或基因组DNA序列从基因组删除。在植物细胞中所得的基因组DNA序列可包含破坏所表达的突变体糖基转移酶的酶活性的突变、早期翻译终止密码子或干扰前体-mRNA成为 mRNA的适当加工过程的序列基序,导致基因表达降低或失活。用于通过突变编码蛋白质的基因而破坏蛋白质合成的方法对本领域技术人员已知。
根据本发明的锌指核酸酶可通过制造第一种多核苷酸(其编码结合于涉及N-糖基化的基因的基因序列的锌指蛋白质,例如但不限于本发明的糖基转移酶)和第二种多核苷酸(其编码非特异性内切核酸酶,例如但不限于IIS型内切核酸酶)的融合物而构建。IIS 型内切核酸酶为具有分开的识别结构域和内切核酸酶裂解结构域的限制性内切酶,其中酶在识别位点以外的位点裂解DNA。IIS型内切核酸酶的非限制性实例为Aarl、BaeI, CdiI, Drdll、Ecil、Fok1、Faul、Gdill、Hgal、Ksp6321、MboI1、Pflll081、Rlel081、RleAI, Sap I, TspDTI或UbaPI,但不限于此。
用于涉及和构建融合蛋白质的方法,用于从IIS型内切核酸酶的序列识别结构域选择和分离内切核酸酶结构域的方法,用于设计和构建包含锌指蛋白质和内切核酸酶的融合蛋白质的锌指核酸酶的方法在本领域已知,并可用于本发明。在一个具体的实施方式中, 锌指核酸酶的核酸酶结构域为FokI的核酸酶结构域。锌指蛋白质和FokI的核酸酶之间的融合蛋白质可包含间隔子,其由两个碱基构成,或备选地,所述间隔子可由三个、四个、五个、六个或更多碱基对构成。在一个方面,本发明提供了具有七个碱基对间隔子的融合蛋白质,使得第一锌指核酸酶的内切核酸酶在与第二锌指核酸酶接触时二聚化,其中构成所述锌指核酸酶的这两种锌指蛋白质可结合于靶标DNA序列的上游和下游。在二聚化时,锌指核酸酶可在靶标核苷酸序列上引入双链断裂,随后可发生非同源末端连接或与具有与双链断裂两端包围的序列有同源性的外源核苷酸发生同源重组。
在另一个实施方式中,本发明提供了包含锌指蛋白质以及增强子蛋白质的融合蛋白质,形成锌指激活子。锌指激 活子可用于在植物细胞中上调或激活靶标基因的转录,例如但不限于,参与植物细胞中N-糖基化的基因,包括步骤(i)根据本发明的方法工程改造结合于启动子或可操作性连接于靶标基因的编码序列的序列之内的锌指蛋白质,(i i )制造所述锌指蛋白质和转录激活子之间的融合蛋白质,(iii)制造包含编码在植物细胞中有活性的启动子的控制下的所述锌指激活子的多核苷酸序列的表达载体,(iv)将所述基因构建物引入植物细胞,以及(V)培养所述植物细胞并使锌指激活子进行表达,以及(vi)鉴定靶标基因表达增加的植物细胞。用于本发明的靶标基因为编码蛋白质的基因或调控本发明的糖基转移酶表达的核酸。
在另一个实施方式中,本发明提供了包含锌指蛋白质以及基因抑制子的融合蛋白质,形成锌指抑制子。锌指抑制子可用于在植物细胞中下调或抑制靶标基因的转录,例如但不限于,参与植物细胞中N-糖基化的基因,包括步骤(i)根据本发明的方法工程改造结合于启动子或可操作性连接于靶标基因的编码序列的序列之内的锌指蛋白质,和(ii )制造所述锌指蛋白质和转录抑制子之间的融合蛋白质,(iii)开发包含编码在植物细胞中有活性的启动子的控制下的所述锌指抑制子的多核苷酸序列的基因构建物,和(iv)根据本发明的方法将所述基因构建物引入植物细胞,以及(V)使锌指激活子进行表达,以及(Vi)鉴定靶标基因转录降低的植物细胞。锌指抑制子可用于在植物细胞中降低本发明的糖基转移酶的表达水平。
在另一个实施方式中,本发明提供了包含锌指蛋白质以及甲基化酶的融合蛋白质,形成锌指甲基化酶。所述锌指甲基化酶可用于下调或抑制参与植物细胞中N-糖基化的基因表达,是通过对所述参与N-糖基化的基因启动子区域内的区域进行甲基化,例如但不限于本发明的糖基转移酶,包括步骤(i )根据本发明的方法工程改造能够结合于参与N-糖基化的基因启动子内区域的锌指蛋白质,(ii)制造所述锌指蛋白质和甲基化酶之间的融合蛋白质,以及(iii)根据本发明的方法开发包含编码在植物细胞中有活性的启动子的控制下的所述锌指甲基化酶的多核苷酸序列的基因构建物,(iv)根据本发明的方法将所述基因构建物引入植物细胞,以及(V)使锌指甲基化酶进行表达,以及(vi)鉴定植物细胞中本发明的糖基转移酶表达降低或几乎无表达的植物细胞。
在本发明的多种实施方式中,可根据本发明的方法选择结合于本发明的糖基转移酶的调控序列的锌指蛋白质。所述糖基转移酶可为参与植物N-糖基化的糖基转移酶,例如但不限于,N-乙酰葡萄糖氨基转移酶、木糖基转移酶或岩藻糖基转移酶,或更具体地为, N-乙酰葡萄糖氨基转移酶1、β-1,2-木糖基转移酶或α-1,3-岩藻糖基转移酶。更具体地,参与植物中N-糖基化的基因调控序列可包含转录起始位点、起始密码子、外显子区域、 外显子-内含子边界、终止子或终止密码子。该锌指蛋白质可融合于核酸酶、激活子或抑制子蛋白质。
在本发明的多种实施方式中,锌指核酸酶在本发明的糖基转移酶的基因组DNA序列的调控区域、编码区或非编码区引入双链断裂,并导致所述糖基转移酶表达水平的降低、 抑制或基本上抑制,或所述糖基转移酶活性的降低、抑制或基本上抑制。
根据本发明的用于降低、抑制或基本上抑制植物细胞中内源糖基转移酶的活性的方法可包括选择修饰的细胞,其具有降低、抑制或基本上抑制的糖基转移酶活性。
在另一个实施方式中,本发明包括本发明的基因序列或其片段用于在所述序列中鉴别靶标位点以修饰植物细胞中糖基转移酶表达的方法,使得(i)所述糖基转移酶的活性得到降低、抑制或基本上抑制植物细胞中一种或多种蛋白质的N-聚糖上的 α -1, 3-岩藻糖或β -1, 2-木糖水平得到降低。为鉴别本发明基因序列上的这种靶标位点, 提供了计算机程序以允许对一段输入查询序列筛选出由固定长度间隔子序列分开的两条固定长度的亚串DNA基序的发生率,使用了用于选择锌指蛋白质结合的两个靶标位点(其在参考DNA数据库内发生给定次数,并由限定数量的核苷酸(本文称为间隔子序列)分开) 的DNA数据库内部的后缀阵列。所述基因序列可为基因组DNA或cDNA序列,例如但不限于 α -1, 3-岩藻糖基转移酶、β -1, 2-木糖基转移酶或N-乙酰葡萄糖氨基转移酶的基因组DNA 或cDNA序列。具体而言,基因序列为烟草种属的基因序列,例如但不限于烟草。在本文的一个具体实施方式
中,DNA数据库为烟草DNA数据库。
具体而言,所述计算机程序可用于搜索本发明的烟草基因序列以寻找两个锌指蛋白质结合位点,其中每种锌指蛋白质包含四个锌指DNA结合结构域,其所述两个锌指蛋白质结合位点由0、1、2或3个碱基对分开。在本发明的其他实施方式中,所述计算机程序可用于预测两种锌指蛋白质的靶标位点用于设计一对锌指核酸酶。在本发明的其他实施方式中,所述计算机程序被用于预测大范围核酸酶的靶标位点。本发明中还包括的是本发明的基因序列中存在的靶标位点,如由上文描述的计算机程序预测的那些,以及其用于修饰植物或植物细胞中基因序列的用途,这些是通过本发明描述的或本领域已知的基因组标记技术进行的。
在本发明的多种实施方式中,将表达构建物(其包含可操作地连接于在植物细胞中有效的表达控制序列的编码序列)引入植物细胞以促进异源蛋白质的表达。“可操作地连接”指的是一种连接,其中控制序列和要表达的DNA序列以能够允许转录以及转录物翻译的方式连接排列在一起。在一个具体的实施方式中,表达构建物被用于产生非天然锌指蛋白质、锌指核酸酶、锌指抑制子、锌指激活子。在本发明的其他实施方式中,表达构建物是用来产生有商业意义的异源蛋白质的,例如哺乳动物或人蛋白质。预期的是被修饰的植物细胞或者在染色体DNA上整合有表达构建物,或在染色体外携带有表达构建物。还预期的是,用于产生异源蛋白质的修饰植物细胞或者在染色体DNA稳定整合了包含异源蛋白质编码序列的重组转录单元,或者在一段有限的时间内在染色体外携带有所述重组转录单元。
包含在植物和植物细胞中有活性的调控元件的表达构建物是已知的,其可含有植物病毒启动子和终止子序列,例如但不限于,花椰菜花叶病毒35S启动子和终止子序列、质体蓝素的启动子和终止子序列;或泛素的的启动子和终止子区域。在本发明的具体实施方式
中,可克隆第一种锌指核酸酶的编码序列使其受到一种启动子和终止子序列的控制,并克隆第二种锌指核酸酶使其受到第二种启动子和终止子序列的调控,这二者都在植物细胞中有活性。两种锌指核酸酶的表达构建物还可都受到相同启动子和终止子序列的控制,且可将这两种锌指核酸酶的编码序列置于一个载体或分开的载体上。
如本文所使用的,“转化”指的是多核苷酸向生物体中的转移,例如但不限于,转移至植物细胞。含有转化的多核苷酸的宿主生物体被称为“转基因”生物体。植物转化方法的实例包括但不限于,农癌杆菌介导的转化(De Blaere等人,Meth. Enzymol. 143:277 (1987)) 以及粒子加速的或“基因枪”转化技术(Klein等人,Nature, London327:70-73 (1987) ;US 4,945,050)。
因此,已知的许多植物细胞转化操作流程和许多用于将所述外源DNA引入植物细胞的方法允许在外源DNA中包含 的基因进行表达。用于将表达构建物引入植物细胞的载体可为二元载体并可通过根癌农杆菌(Agrobacterium tumefaciens)转化引入植物细胞。根癌农杆菌转化系统对本领域技术人员已知。用于感染和转染植物细胞的根癌农杆菌菌株是已知的。可合适地用于本发明目的的根癌农杆菌菌株为GV3101或Agl0、Agll、LBA4404,或任何其他Ach5或C58衍生的根癌农杆菌菌株,其能够感染植物细胞并将T-DNA转移至植物细胞核的菌株。
在一个非限制性实例中,农癌杆菌-介导的转化可如下进行可使用本领域中描述的标准方法将包含用于两种锌指核酸酶表达(其成为一对,靶向烟草糖基转移酶基因组基因序列)的表达盒的植物表达载体,如二元载体引入根癌农杆菌菌株。可将重组根癌农杆菌菌株在含有适当抗生素的液体培养基中培养过夜,可通过离心、弃去上清并重悬于新鲜培养基而收集细胞(根据 Murashige&Skoog(1962,PhysiolPlant 15(3) :473-497))。可根据标准方法(见Horsch等人,1985)转化无菌培养的烟草植物的叶植体,并在含根据 Murashige&Skoog (1962)的培养基的皮氏培养皿中于本领域描述的适当条件下进行两天的共培育。在两天的共培育后,可将外植体置于含有适当量卡那霉素的选择性培养基中进行选择,其还补充含有抗生素万古霉素和头孢噻肟,以及萘乙酸和苄基腺嘌呤激素。可将所述二元载体引入根癌农杆菌菌株。备选地,可将所述二元载体弓I入其他根癌农杆菌菌株或由其衍生的适合于植物叶植体(尤其是烟草叶外植体)转化的菌株。备选地,外植体可为苗、下胚轴或茎组织或任何其他适合转化的组织。包含表达盒的二元载体的引入是经由根癌农杆菌菌株的转染而进行的。
备选地,所述的引入可使用粒子轰击或本领域技术人员已知的任何备选的植物转化方法进行。例如,使用粒子枪或基因枪粒子输送系统可将外源DNA加至钨颗粒或金颗粒上,并使用Helios PDS 1000/He基因枪粒子输送系统将其引入植物细胞。
作为一个非限制性实例,转染植物细胞后对植物的再生和选择可在本发明的范围内进行,如下可根据本领域描述的标准方法(见例如,Horsch等人,1985,Science 227:1229)使如本文上述方法转染后获得的转基因植物细胞再生出芽和苗株。可例如通过使用 PowerPlant DNA 分离试剂盒(Mo Bio Laboratories Inc.,Carlsbad, CA, USA)从芽和苗株中分离基因组DNA。可使用所述基因序列根据本领域描述的标准方法扩增包含靶标区域的DNA片段。对于本领域技术人员清楚的是,例如所列出的SEQ ID NO中限定的引物对可用于扩增包含靶标区域的片段。然后使用标准测序操作流程对PCR产物进行整体测序,并可通过与起始序列比较鉴别祀标位点如锌指核酸酶祀标位点处或附近的突变或修饰情况。
根据本发明的基因组核苷酸序列的修饰可按如下方法鉴定在靶向糖基转移酶编码区用于植物细胞中修饰后,可对由修饰细胞获得的mRNA而合成的cDNA进行克隆和测序以确认修饰的存在。对于本领域技术人员清楚的是,任何能导致各自序列的开放阅读框破坏的删除可对功能性酶的生物合成有不利影响。
本发明的每种糖基转移酶的活性可使用酶测定而测量。本发明的糖基转移酶的活性可为但不限于, 将N-乙酰葡萄糖胺添加至Man5-GlcNAc2-Asn寡甘露糖基受体的1-3臂的甘露糖上;将岩藻糖实体以α-1,3-连接添加至N-聚糖上,特别是将岩藻糖以α -1,3-连接添加至糖蛋白的N-聚糖非还原性末端的邻近N-乙酰葡萄糖胺上; 或将木糖实体以β_1,2-连接添加至N-聚糖上,特别是将木糖以β(1,2)_连接添加至N-聚糖的三甘露糖基核心结构的β (1,4)-连接甘露糖上。糖基转移酶可分离自植物,例如通过从植物细胞中分离富含糖基转移酶的微体(microsome)。酶活性可使用酶测定法以及特异性底物和供体分子进行测量,例如用UDP-[14C]_木糖作为供体,用 GlcNAc^ -l-2-Man-a 1-3-[Man-a 1-6]Man-β _0_ (CH2) 8_C00H3 或 GlcNAc β-1-2-Man-α1-3-OilcNAc-β1-2-Man- α 1-6) Man-β l_4GlcNAc-^ 1-4 (Fuc-α 1-6) GlcNAc-1gG 糖肽作为受体用于测量β_1,2-木糖基转移酶活性。
具体而言,微体可在早花期阶段分离自成熟的、发育完全的植物(特别是烟草植物)的新鲜的植物叶子,方法如下移除中脉,将叶子切成小片并在预冷的不锈钢瓦林混碎机中进行均质化,其中含有微体分离缓冲液,其含有例如250mM山梨醇、5mM Tris、2mM DTT 和7. 5mM EDTA;使用IM的Mes (2-(N-吗啉代)乙磺酸溶液将pH设置为7. 8。加入蛋白酶抑制剂混合物或混合液,例如Complete Mini (Roche Diagnostics)。使用烟草叶子鲜重的冰冷的微体分离缓冲液。过滤通过尼龙布并使用Sorvall SS34转头于4°C下以12,OOOg 离心IOmin以移除碎片和叶材料。将含有微体的上清转移至新的离心管中并在CentriconT-2070超速离心机中用固定角转头Centrikon TFT 55. 38在4 °C下以100,OOOg离心 60min。在不含EDTA的微体分离缓冲液中重悬含有微体的沉淀,其中已经加入了甘油(终浓度为4%)。该方法可用于测量β_1,2-木糖基转移酶(β (1,2)_木糖基转移酶)活性。
作为一个非限制性实例,编码β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶) 的基因,活性可按如下方法确定可将cDNA序列克隆于哺乳动物表达载体并电穿孔转化至正常条件下内源糖蛋白的N-聚糖上不含β-1,2-木糖(β (1,2)_木糖)的哺乳动物细胞中。通过用识别N-聚糖上β-1,2-木糖(β (1,2)_木糖)的抗体如特异性地与结合于蛋白质N-聚糖的木糖残基交叉反应的兔源抗辣根过氧化物酶抗体(如货号AS07267,Agrisera AB( VSnilSs,Sweden))对细胞染色观察到互补现象。备选地,木糖基转移酶的酶测定可用在合适的缺少木糖基转移酶活性的宿主系统中表达β_1,2-木糖基转移酶(β (1,2)_木糖基转移酶)cDNA时获得的重组蛋白质进行。木糖基转移酶测定可在如下反应混合物中进行,包含IOmM的二甲胂酸缓冲液(pH7. 2)、4mM ATP、20mM MnCl2, O. 4%Triton X_100、0.1mM UDP-[14C]-木糖和 ImMGlcNAc β -1-2-Man-α 1-3-[Man-α 1-6]Man-β -O-(CH2) 8_C00H3,使用 GlcNAc β -1-2-Man-α 1-3-(GlcNAc-β1-2-Man-α 1-6) Man-β l-4GlcNAc-^ 1-4 (Fuc-α 1-6) GlcNAc-1gG 糖肽作为受体。
为促进从植物或植物细胞中对本发明的修饰的糖基转移酶或目的异源蛋白质的分离,许多本领域已知的技术和纯化形式都可使用。作为一个非限制性实例,His标签、GST 和麦芽糖结合蛋白质为具有易得的亲和柱(其可结合于柱上并洗脱下来)的那些肽。因此, 当肽为N-端His标签如六组氨酸(His. sub. 6tag)时,可使用包含金属螯合树脂的基质纯化异源蛋白质,基质如镍氮基三乙酸(N1-NTA)、镍亚氨基二乙酸(N1-1DA)及含钴树脂(钴树脂)(见例如,Steinert等人(1997) QIAGEN News 4:11-15)。当肽为GST时,可使用包含谷胱甘肽琼脂糖微珠(Sigma或Pharmacia Biotech)的基质纯化异源蛋白质;其中蛋白质片段为麦芽糖结合蛋白质(MBP),可使用包含以直链淀粉衍生化的琼脂糖树脂的基质纯化修饰的糖基转移酶或异源蛋白质。
其他可结合于本发明的修饰的糖基转移酶或目的异源蛋白质的分子的非限制性实例可选自适体(Klussmann(2006),The Aptamer Handbook:Functional Oligonucleotides and their applications, ffiley-VCH, USA)> 抗体((Howard and Bethell (2000)Basic Methods in Antibody Production and Characterization, Crc. Pr.1nc)> (Hansson, Immunotechnology 4 (1999),237-252;Henning, Hum Gene Ther. 13(2000),1427-1439))、亲和体、凝集素、三联素(Phylos Inc. , Lexington, Massachu setts, USA;Xu, Chem. Biol. 9 (2002),933)、anticalin (EPB11017814)等等。
在本发明的多种实施方式中,本发明提供了修饰的植物、修饰的植物组织、来自修饰植物的植物材料、修饰的植物细胞或者来自修饰植物的修饰的植物组织或植物组合物, 其包含的在N-聚糖上的异源蛋白质具有降低水平或不可检测水平的α -1, 3-连接岩藻糖、 β-1-2-连接的木糖,或二者。在其他实施方式中,本发明提供了修饰的植物、修饰的植物组织、来自修饰植物的植物材料、修饰的植物细胞或者来自修饰植物的修饰的植物组织或植物组合物,其显示了降低的糖基转移酶活性或基本上没有此活性。本发明的修饰植物可包含修饰的细胞和未修饰的细胞。并不需要本发明的修饰的植物中每个细胞都包含修饰。
可通过本领域已知技术富集、分离或纯化所述异源蛋白质。因此,本发明提供了富集有异源蛋白质的植物组合物,或相对于所述异源蛋白质在所述植物或植物细胞中发生的浓度包含较高浓度的异源蛋白质的植物组合物。还提供了药用或化妆品组合物,其包含获自包含在连接于异源蛋白质的N-聚糖上降低或不可检测的水平的α -1, 3-连接岩藻糖和 /或β -1,2-连接的木糖的植物细胞特别是烟草属细胞的异源蛋白质,以及载体,如药用可接受载体。
可表达于修饰的植物细胞的异源蛋白质可为用于疫苗的抗原,包括但不限于病原体蛋白质、病毒蛋白质、细菌蛋白质、原虫蛋白质、线虫蛋白质;酶类,包括但不限于用于治疗人类疾病的酶、用于工业用途的酶;细胞因子;细胞因子受体片段;血液蛋白质;激素;激素受体片段、脂蛋白;抗体或抗体片段。
术语“抗体”和“多个抗体”指的是单克隆抗体、多特异性抗体、人抗体、人源化抗体、骆骑化抗体、嵌合抗体、单链Fvs (scFv)、单链抗体、单结构域抗体、Fab片段、F(ab’ )片段、二硫键连接Fvs (SdFv)以及上述任何类型的表位结合片段。具体而言,抗体包括免疫球蛋白分子和免疫球蛋白分子的免疫学活性片段,即,含有抗原结合位点的分子。免疫球蛋白分子可为任何类型(例如IgG、IgE、IgM、IgD、IgA和IgY)、类别(例如IgGU IgG2、IgG3、 IgG4、IgAl 和 IgA2)或亚类。
在本发明的特异性实施方式中,本发明提供了产生异源蛋白质的方法,其包含的 N-聚糖含有降低或不可检测水平的α-1,3_岩藻糖或β-1,2_木糖或二者。所述方法包括在本发明的修饰的植物细胞中表达包含异源蛋白质的编码序列的多核苷酸以产生异源蛋白质。该方法可包含步骤(i)将包含异源蛋白质编码序列的多核苷酸引入本发明的修饰的植物细胞;(ii)使所述多核苷酸进行表达以在修饰的植物细胞中产生异源蛋白质,可选地还包括(iii)将异源蛋白质从所述修饰的植物细胞中分离。该方法可进一步包括对包含含有异源蛋白质编码序列的多核苷酸的修饰的植物细胞进行培养。该方法可选地包括以下步骤,将包含含有异源蛋白质编码序列的多核苷酸的修饰的植物细胞培育成植物组织、植物器官或植物,并培养或种植所述植物组织、植物器官或植物。该植物细胞可为在无菌条件下生长于水溶液培养基的细胞培养物中的细胞,或单子叶植物细胞,例如但不限于高粱、玉米、小麦、大米、小米 、大麦或浮萍,或双子叶植物如向日葵、豌豆、油菜、甜菜、大豆、生菜、莴苣、卷心菜、甘蓝、花椰菜、苜蓿、胡萝卜和烟草。根据本发明的烟草细胞可为烟草属植物细胞,尤其是选自本氏烟草或烟草、烟草变种、育种品系和栽培种的植物细胞或本氏烟草和烟草烟草变种、育种品系和栽培种的细胞的修饰的细胞。
在另一个实施方式中,本发明提供了烟草变种、育种品系或栽培种的遗传修饰的细胞。可通过本发明的方法修饰的烟草变种、育种品系或栽培种的非限制性实例包括登记号为 PM016、PM021、PM92、PM102、PM132、PM204、PM205、PM215、PM216 或 PM217 的烟草 (其保藏于 NCIMB, Aberdeen、Scotland)或 DAC Mata Fina, P02、BY-64、AS44、RG17、RG8、 HB04P、Basma Xanthi BX 2A、Coker 319、Hicks、McNair 944(MN 944)、Burley 21、K149、Yaka JB125/3,Kasturi Mawar.NC 297,Coker 371Gold、P02、\¥isli a、 Simmaba、Turkish Samsun、AA37_l、B13P、BU21x Hoja Parado 系 97 杂交的 F4、Samsun NN、Izmir、Xanthi NN、 Karabalgarλ Denizli 和 POl0
本发明的药用组合物优选地包含药用可接受载体。通过“药用可接受载体”,指的是非毒性的固体、半固体或液体填充剂、稀释剂、胶囊材料或任何类型的制剂辅料。如本文所使用的,术语“肠道外的”指的是施用的方式,其包括静脉内、肌内、腹膜内、胸骨内、皮下和关节内注射和灌注。载体可为肠道外载体,更具体地为与受用者血液等渗的溶液。这种载体媒介物的实例包括水、生理盐水、林格氏溶液和葡萄糖溶液。非水溶液的媒介物如固定油和油酸乙酯,以及脂质体也在本文使用。所述载体合适地含有少量的添加剂如增强等离子性和化学稳定性的物质。这些材料在所采用的剂量和浓度下对受用者无毒,包括缓冲液如磷酸、柠檬酸、月桂酸、乙酸和其他有机酸或其盐类;抗氧化剂如抗坏血酸;低分子量(低于大约10个残基)的(多)肽、例如多聚精氨酸或三肽;蛋白质如血清白蛋白、明胶、或免疫球蛋白;亲水多聚物如聚乙烯基吡咯烷酮;氨基酸、如甘氨酸、谷氨酸、天冬氨酸、或精氨酸; 单糖、二糖、以及其他碳水化合物(包括纤维素或其衍生物)、葡萄糖、甘露糖、或糊精;螯合剂如EDTA ;糖醇如甘露糖醇或山梨糖醇;平衡离子如钠;和/或非离子表面活性剂、如聚山梨酯、泊洛沙姆或PEG。
在本发明的优选的实施方式中,提供了用于降低植物细胞的糖基转移酶活性的方法,包括修饰植物细胞基因组中的基因组核苷酸序列,其中基因组核苷酸序列包括以下的编码序列N-乙酰葡萄糖氨基转移酶,特别是N-乙酰基葡萄糖氨基转移酶I ;岩藻糖基转移酶,特别是α -1, 3-岩藻糖基转移酶;或木糖基转移酶,特别是β -1, 2-木糖基转移酶; 或前述蛋白质的片段。在一个具体的实施方式中,本发明提供了降低植物细胞中糖基转移酶活性的方法,包括修饰植物细胞基因组中的基因组核苷酸序列,其中基因组核苷酸序列包含(i)核苷酸序列,其由如 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47 所示的核苷酸序列组成;(ii)核苷酸序列,其与SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、 40,41或47中所示的核苷酸序列有至少95%、特别是至少98%、特 别是至少99%的同一性; (iii)核苷酸序列,其允许有(i)或(ii)中的核苷酸序列或其互补物组成的多核苷酸探针 (具体而言在严格条件下)进行杂交。本发明的方法进一步包括鉴别及可选地,选择修饰的植物细胞,其中修饰的植物细胞中的糖基转移酶(其基因组核苷酸序列已经得到修饰)的活性或修饰的植物细胞中总糖基转移酶活性相对于未修饰植物细胞是降低的。这种用于降低植物细胞的糖基转移酶活性的方法可应用于向日葵、豌豆、油菜、甜菜、大豆、生菜、莴苣、卷心菜、西兰花、花椰菜、苜蓿、浮萍、水稻、玉米、红萝卜、或烟草的细胞。具体而言,其中的糖基转移酶活性有降低的植物细胞为烟草种属的细胞,特别是本氏烟草或烟草,或其栽培种。
本发明的以下实施方式为非限制性的,其包括在本文内是为了阐明本发明的各个方面。在具体实施方式
中,本发明进一步提供的方法还包括步骤(a)在植物细胞的基因组中鉴别包含糖基转移酶的编码序列的基因组核苷酸序列或其片段;具体而言,所述基因组核苷酸序列可通过使用至少一对选自以下的寡核苷酸进行聚合酶链式反应而鉴别正向引物SEQ ID N0:2及反向引物SEQ ID N0:3;正向引物SEQ ID NO: 10及反向引物SEQ ID NO: 11 ;正向引物SEQ ID NO: 15及反向引物SEQ ID NO: 16 ;正向引物SEQ ID N0:23及反向引物SEQ ID N0:24 ;正向引物SEQ ID NO:25及反向引物SEQ ID NO:26 ;正向引物SEQ ID N0:30及反向引物SEQ ID NO:31;正向引物SEQ ID NO:35及反向引物SEQ ID N0:36;正向引物SEQ ID N0:45及反向引物SEQ ID N0:46 ;或正向引物SEQ ID NO: 231及反向引物SEQ ID NO:232 ;以及(b)在所述基因组核苷酸序列中鉴别靶标位点,用于进行修饰使得在所述植物细胞中糖基转移酶的活性或表达相对未修饰植物细胞得到降低。
在另一个实施方式中,本发明提供了分离的多核苷酸,其包含的核苷酸序列由如SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47 所示的核苷酸序列构成;提供了核苷酸序列,其与 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47 所示的核苷酸序列有至少95%、特别是至少98%,特别是至少99%的同一性;或提供了核苷酸序列,其允许由(i)或(ii)的核苷酸序列或其互补物组成的多核苷酸探针(具体而言在严格条件下)与所述分离的多核苷酸进行杂交。还提供了本发明的基因组核苷酸序列的用途,用于鉴别基因组核苷酸序列中的靶标位点进行修饰,使得(i)包含该修饰的修饰的植物细胞中的糖基转移酶的活性或表达相对未修饰植物细胞是降低的,或(ii)包含该修饰的修饰的植物细胞中蛋白质的N-聚糖上的α-1,3-岩藻糖或β-1,2-木糖或二者相对于未修饰植物细胞是降低的。本发明还提供了用于降低植物细胞中糖基转移酶的活性的方法,包括,鉴别基因组核苷酸序列中的靶标位点进行修饰,使得(i)包含该修饰的修饰的植物细胞中的糖基转移酶的活性或表达相对未修饰植物细胞是降低的,或(ii)包含该修饰的修饰的植物细胞中蛋白质的N-聚糖上的α-1,3-岩藻糖或β-1,2-木糖或二者相对于未修饰植物细胞是降低的。
本发明还提供了用于修饰植物细胞的方法,其中植物细胞的基因组是通过锌指核酸酶介导的诱变而修饰,包括(a)鉴别并制造至少两种非天然锌指蛋白质,其选择性结合于不同靶标位点用于在基因组核苷酸序列中进行修饰;(b)在植物细胞中表达至少两种融合蛋白质,其各自包含核酸酶以及所述至少两种非天然锌指蛋白质中的一种,这样可在植物基因组核苷酸序列中引入双链断裂,特别是在基因组核苷酸序列的靶标位点处或附近发生断裂;以及可选地(C)将包含含有与双链断裂上游序列的第一同源区域以及与双链断裂下游序列的第二有同源区域的核苷酸序列的多核苷酸引入植物细胞,使得所述多核苷酸与基因组中DNA发生重组。本发明还包括的是植物细胞,其包含一种或多种包含了编码一种或多种所述融合蛋白质的表达构建物。
本发明还提供了修饰的植物细胞或包含所述修饰的植物细胞的植物,其中的修饰的植物细胞在编码糖基转移酶或其片段的基因组核苷酸序列中包含至少一种修饰,特别是 SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41、47、233 或 SEQ ID NO:256、259、262、 265、268、271、274、277、280 或 SEQ ID NO:257、260、263、266、269、272、275、278、281 中所示的任何基因组核苷酸序列、或在上述序列的任何组合中,且其中(i)所述修饰的植物细胞的总的糖基转移酶活性或其基因组核苷酸序列已经得到修饰的糖基转移酶的活性或表达相对于未修饰植物细胞是降低的,或(ii)所述修饰的植物细胞中产生的蛋白质的N-聚糖上的α-1,3-岩藻糖或β-1,2-木糖或二者相对于未修饰植物细胞是降低的。
本发明还提供了用于产生异源蛋白质的方法,所述方法包括将包含编码异源蛋白质的核苷酸序列的表达构建物引入修饰的植物细胞,所述异源蛋白质特别是疫苗抗原、细胞因子、激素、凝血蛋白质、免疫球蛋白或其片段,所述植物细胞在如SEQ ID N0:l、4、5、7、 12、13、14、17、27、32、37、40、41 或 47、233 或在 SEQ ID NO: 18、20、21、22、28、33、38、48、212、 213、219、220、223、225、227、229、234;或在SEQ ID NO:256、259、262、265、268、271、274、277 和280、或在SEQ ID Ν0:257、260、263、266、269、272、275、278、281 所示的基因组核苷酸序列中或在上述序列的任何组合中包含修饰;以及培养包含表达构建物的修饰的植物细胞以产生异源蛋白质,并且可选地,从植物细胞再生植物,并种植该植物及其后代。本发明还提供了用于产生异源蛋白质的方法,所述方法包括在能产生所述异源蛋白质的条件下培养修饰的植物细胞,其包含(i)SEQ ID N0:l、4、5、7、12、13、14、17、27、32、37、40、41 或 47、233 或在 SEQ IDN0:18、20、21、22、28、33、38、48、212、213、219、220、223、225、227、229、234;或 SEQ ID N0:256、259、262、265、268、271、274、277 和 280、或 SEQ ID NO:257、260、263、266、269、272、 275、278、281中所示的基因组核苷酸序列中至少一个中的修饰;(ii)包含编码异源蛋白质的核苷酸序列的表达构建物,所述异源蛋白质特别是疫苗抗原、细胞因子、激素、凝血蛋白质、免疫球蛋白或其片段。本发明的方法还包括从修饰的植物细胞或包含修饰的植物细胞的修饰的植物中富集或分离所述异源蛋白质的步骤。本发明还包括的是包含异源蛋白质的植物组合物,所述异源蛋白质可获自包含修饰的植物细胞(其在如SEQ ID N0:l、4、5、7、 12、13、14、17、27、32、37、40、41 或 47、233 或在 SEQ ID NO: 18、20、21、22、28、33、38、48、212、 213、219、220、223、225、227、229、234;或在SEQ ID NO:256、259、262、265、268、271、274、277 和 280 中、或在 SEQ ID N0:257、260、263、266、269、272、275、278、281 中所示的基因组核苷酸序列或在上述序列的任何组合中包含修饰)的植物,其中所述异源蛋白质相对于未修饰的植物细胞中所产生的异源蛋白质其的N-聚糖上的α-1,3-岩藻糖或β-1,2-木糖或二者是降低的。
在详述和实施例中,提到了以下序列,其列于序列列表中
SEQ ID NO:1:叠连群 gDNA_cl736055 核苷酸序列
SEQ ID NO: 2:NGSG10043正向引物的核苷酸序列,适合用于扩增叠连群gDNA_ C1736055的片段,含有烟草属β-1,2-木糖基转移酶(β (1,2)-木糖基转移酶)内含子-外显子序列。
SEQ ID NO: 3:NGSG10043反向引物的核苷酸序列,适合用于扩增叠连群gDNA_ C1736055的片段, 含有烟草属β-1,2-木糖基转移酶(β (1,2)-木糖基转移酶)内含子-外显子序列。
SEQ ID N0:4:NtPMI_BAC_TAK0MI_6的核苷酸序列(含有烟草β_1,2_木糖基转移酶(β (1,2)_木糖基转移酶)基因变体I)的1-6,000碱基对。
SEQ ID N0:5:NtPM1-BAC-TAK0MI_6 的 β_1,2_木糖基转移酶(β (1,2)-木糖基转移酶)变体I的编码片段的基因组核苷酸序列
SEQ ID Ν0:6: β-1,2-木糖基转移酶(β (1,2)-木糖基转移酶)基因变体I上游的NtPM1-BAC-TAK0MI_6的启动子区域核苷酸序列
SEQ ID N0:7:NtPM1-BAC_TAK0MI_6 片段的核苷酸序列,其为由引物组 NGSG10043 所扩增并用于鉴别NtPM1-BAC-TAK0MI_6
SEQ ID NO: 8:烟草β-1,2-木糖基转移酶(β (1,2)_木糖基转移酶)基因变体I 的cDNA序列ο
SEQ ID N0:9:烟草β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶)蛋白质变体 I的氨基酸序列
SEQ ID Ν0:10:扩增烟草和本氏烟草的片段GnT1-B的引物序列Big3FN
SEQ ID N0:11:扩增烟草和本氏烟草的片段GnT1-B的引物序列Big3RN
SEQ ID NO: 12:烟草片段GnT1-B的3504bp的基因组片段的核苷酸序列
SEQ ID NO: 13:烟草片段GnT1-B的2283bp的基因组片段的核苷酸序列
SEQ ID NO: 14:本氏烟草片段GnT1-B的3765bp的基因组片段的核苷酸序列
SEQ ID NO: 15:NGSG10046正向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F4335xnl3fl的片段,含有烟草属β_1,2_木糖基转移酶(β (1,2)-木糖基转移酶)内含子-外显子序列。
SEQ ID NO: 16:NGSG10046反向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F4335xnl3fl的片段,含有烟草属β_1,2_木糖基转移酶(β (1,2)-木糖基转移酶)内含子-外显子序列。
SEQ ID NO: 17:NtPMI_BAC_SANIKI_l (含有烟草 β _1,2_ 木糖基转移酶 (β (I, 2)-木糖基转移酶)基因变体2)的核苷酸序列的15,921-23,200碱基对。
SEQ ID NO: 18:烟草β_1,2_木糖基转移酶(β (1,2)-木糖基转移酶)基因变体 2的cDNA序列
SEQ ID NO: 19:烟草β _1,2_木糖基转移酶(β (1,2)_木糖基转移酶)蛋白质变体2的氨基酸序列。
SEQIDNO:20:烟草片段GnT1-B的部分cDNA序列变体I
SEQIDN0:21:烟草片段GnT1-B的部分cDNA序列变体I
SEQIDNO:22:本氏烟草片段GnT1-B的部分cDNA序列变体I
SEQIDNO:23:扩增烟草和本氏烟草的片段GnT1-A的引物序列BiglFN。
SEQIDN0:24:扩增烟草和本氏烟草的片段GnT1-A的引物序列BigIRN。
SEQIDNO: 25:NGSG10041正向引物的核苷酸序列,适合用于扩增叠连群CHO0F3295xjl7fl的片段,含有烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 26:NGSG10041反向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F3295xjl7fl的片段,含有 烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 27: NtPM1-BAC-FETILA_9 (含有烟草 α -1,3_ 岩藻糖基转移酶 (a (I, 3)-岩藻糖基转移酶)基因变体I)的核苷酸序列的2,961-10,160碱基对。
SEQ ID NO: 28:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体I的cDNA序列。
SEQ ID NO: 29:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)蛋白质变体I的氨基酸序列。
SEQ ID NO: 30:NGSG10032正向引物的核苷酸序列,适合用于扩增叠连群gDNA_ c 1765694的片段,含有烟草属α -1,3_岩藻糖基转移酶(α (I, 3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 31 :NGSG10032反向引物的核苷酸序列,适合用于扩增叠连群 gDNA_1765694的片段,含有烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 32: NtPM1-BAC-JUMAKE_4 (含有烟草 α -1,3_ 岩藻糖基转移酶 (α (I, 3)-岩藻糖基转移酶)基因变体2)的核苷酸序列的1,041-7,738碱基对。
SEQ ID NO: 33:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体2的部分cDNA序列。
SEQ ID NO: 34:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体2的部分氨基酸序列。
SEQ ID NO: 35:NGSG10034正向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F4881xd22rl的片段,含有烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 36:NGSG10034反向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F4881xd22rl的片段,含有烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 37:NtPM1-BAC-JEJ0L0_22 (包含部分烟草 α-1,3_ 岩藻糖基转移酶 (a (I, 3)-岩藻糖基转移酶)基因变体3)的核苷酸序列的19,001-23, 871碱基对。
SEQ ID NO: 38:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体3的部分cDNA序列。
SEQ ID NO: 39:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)蛋白质变体3的部分氨基酸序列。
SEQ ID NO:40:烟草片段GnT1-A的3152bp的基因组片段的核苷酸序列。
SEQ ID NO:41:烟草片段GnT1-A的3140bp的基因组片段的核苷酸序列。
SEQ ID N0:42:用于大范围核酸酶介导的诱变的、SEQ ID N0:5的外显子2中独特的22bp的靶向序列
SEQ ID NO:43:代表SEQ ID NO:42左半部分的回文形式的第一衍生靶标。
SEQ ID N0:44:代表SEQ ID NO:42右半部分的回文形式的第二衍生靶标。
SEQ ID NO:45:NGSG10035正向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F4486xellfl的片段,含有烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO:46:NGSG10035反向引物的核苷酸序列,适合用于扩增叠连群CH0_ 0F4486xellfl的片段,含有烟草属α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶内含子-外显子序列。
SEQ ID NO: 47: NtPM1-BAC-JUD0SU_1 (含有烟草 α -1,3_ 岩藻糖基转移酶 (a (I, 3)-岩藻糖基转移酶)基因变体4)的核苷酸序列的1-11,000碱基对。
SEQ ID NO: 48:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体4的部分cDNA序列。
SEQ ID NO: 49:烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)蛋白质变体4的部分氨基酸序列。
SEQ ID NO:50:实施例1中在烟草基因组数据库中有4次命中的SEQ ID NO:5的 15碱基对输出核苷酸序列。
SEQ ID NO:51:实施例1中在烟草基因组数据库中有5次命中的SEQ ID NO:5的 15碱基对输出核苷酸序列。
SEQ ID NO:52:实施例1中在烟草基因组数据库中有5次命中的SEQ ID NO:5的 15碱基对输出核苷酸序列。
SEQ ID NO:53:实施例1中在烟草基因组数据库中有5次命中的SEQ ID NO:5的15碱基对输出核苷酸序列。
SEQ ID NO:54:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:55:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:56:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:57:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:58:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:59:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:60:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:61:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:62:实施侈 15碱基对输出核苷酸序列。
SEQ ID NO:63:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:64:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:65:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:66:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:67:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:68:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:69:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:70:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:71:实施侈列以及烟草基因组序列拼接。
SEQ ID NO:72:实施侈列以及烟草基因组序列拼接。I中在烟草基因组数据库中有5次命中的SEQ ID NO:5的I中在烟草基因组数据库中有5次命中的SEQ ID NO:5的I中在烟草基因组数据库中有4次命中的SEQ ID NO:5的I中在烟草基因组数据库中有3次命中的SEQ ID NO:5的I中在烟草基因组数据库中有4次命中的SEQ ID NO:5的I中在烟草基因组数据库中有3次命中的SEQ ID NO:5的I中在烟草基因组数据库中有4次命中的SEQ ID NO:5的I中在烟草基因组数据库中有4次命中的SEQ ID NO:5的I中在烟草基因组数据库中有5次命中的SEQ ID NO:5的I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序I中用SEQ ID NO: 5的O次命中的阈值运行的24碱基对序
SEQ ID NO:73:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:74:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:75:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:76:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:77:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:78:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:79:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:80:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:81:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:82:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:83:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:84:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:85:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:86:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:87:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:88:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:89:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:90:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:91:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:92:实施例1 中用 SEQD NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序 D NO: 5的O次命中的阈值运行的24碱基对序列以及烟草基因组序列拼接。
SEQ ID NO:93:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:94:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:95:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:96:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:97:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:98:实施例1 中用 SEQ 列以及烟草基因组序列拼接。
SEQ ID NO:99:实施例列以及烟草基因组序列拼接。
SEQ ID NO: 100:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 101:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 102:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 103:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 104:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 105:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 106:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 107:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 108:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 109:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 110:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 111:实施例序列以及烟草基因组序列拼接。ID NO: 5的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对序的O次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对次命中的阈值运行的24碱基对ID NO:5ID NO:5ID NO:5ID NO:5ID NO:5I 中用 SEQ ID NO:5I 中用 SEQ ID NO:5I 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 OI 中用 SEQ ID NO:5 的 O
SEQ ID NO: 112:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 113:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 114:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 115:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 116:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 117:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 118:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 119:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 120:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 121:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 122:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 123:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 124:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 125:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 126:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 127:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 128:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 129:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 130:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 131:实施例1 中用 SEQD N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对序列以及烟草基因组序列拼接。
SEQ ID NO: 132:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 133:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 134:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 135:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 136:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 137:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 138:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 139:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 140:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 141:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 142:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 143:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 144:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 145:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 146:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 147:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 148:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 149:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 150:实施例序列以及烟草基因组序列拼接。中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQ中用SEQD N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对D N0:5的O次命中的阈值运行的24碱基对
SEQ ID NO: 151:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 152:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 153:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 154:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 155:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 156:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 157:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 158:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 159:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 160:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 161:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 162:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 163:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 164:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 165:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 166:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 167:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 168:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 169:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 170:实施例1 中用 SEQ40D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对序列以及烟草基因组序列拼接。
SEQ ID NO: 171:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 172:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 173:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 174:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 175:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 176:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 177:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 178:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 179:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 180:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 181:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 182:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 183:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 184:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 185:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 186:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 187:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 188:实施例序列以及烟草基因组序列拼接。
SEQ ID NO: 189:实施例序列以及烟草基因组序列拼接。中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对中用SEQ ID N0:5的O次命中的阈值运行的24碱基对
SEQ ID NO: 190:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 191:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 192:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 193:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 194:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 195:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 196:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 197:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 198:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO: 199:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:200:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:201:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:202:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:203:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:204:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:205:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:206:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:207:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:208:实施例1 中用 SEQ 序列以及烟草基因组序列拼接。
SEQ ID NO:209:实施例1 中用 SEQ42D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对 D N0:5的O次命中的阈值运行的24碱基对序列以及烟草基因组序列拼接。
SEQ ID N0:210:实施例1中用SEQ ID NO:5的O次命中的阈值运行的24碱基对序列以及烟草基因组序列拼接。
SEQ ID NO:211:实施例1中用SEQ ID N0:5的O次命中的阈值运行的24碱基对序列以及烟草基因组序列拼接。烟草片段GnT1-A变体I的部分cDNA序列。烟草片段GnT1-A变体I的部分cDNA序列。烟草片段GnT1-B cDNA变体I的部分氨基酸序列。烟草片段GnT1-B cDNA变体I的部分氨基酸序列。本氏烟草片段GnT1-B cDNA变体I的部分氨基酸序列。烟草片段GnT1-A cDNA变体I的部分氨基酸序列。烟草片段GnT1-A cDNA变体I的部分氨基酸序列。烟草片段GnT1-B变体2的部分cDNA序列。烟草片段GnT1-A变体3的部分cDNA序 列。烟草片段GnT1-B cDNA变体2的部分氨基酸序列。烟草片段GnT1-B cDNA变体3的部分氨基酸序列。烟草片段GnT1-B的部分cDNA序列变体2 烟草片段GnT1-B的cDNA序列变体2的部分氨基酸序列。本氏烟草片段GnT1-B的部分cDNA序列变体2。本氏烟草片段GnT1-B的cDNA序列变体2的部分氨基酸序列。烟草片段GnT1-A变体2的部分cDNA序列。烟草片段GnT1-A cDNA变体2的部分氨基酸序列。烟草片段GnT1-A变体2的部分cDNA序列。烟草片段GnT1-A cDNA变体2的部分氨基酸序列。:NGSG12045正向引物的核苷酸序列,适合于扩增叠连群gDNA_ C1690982的片段,包含烟草N-乙酰葡萄糖氨基转移酶I的内含子-外显子序列。
SEQ ID NO: 232:NGSG12045反向引物的核苷酸序列,适合于扩增叠连群gDNA_ C1690982的片段,包含烟草N-乙酰葡萄糖氨基转移酶I的内含子-外显子序列。
SEQ ID NO: 233: NtPM1-BAC-FABI JI_1 (包含烟草N-乙酰葡萄糖氨基转移酶I基因变体2)的核苷酸序列的1-15,000碱基对。
SEQIDN0:212:
SEQIDN0:213:
SEQIDN0:214:
SEQIDN0:215:
SEQIDN0:216:
SEQIDN0:217:
SEQIDN0:218:
SEQIDN0:219:
SEQIDNO :220:
SEQIDN0:221:
SEQIDNO :222:
SEQIDNO :223:
SEQIDNO :224:
SEQIDNO :225:
SEQIDNO :226:
SEQIDNO :227:
SEQIDNO :228:
SEQIDNO :229:
SEQIDNO :230:
SEQIDN0:231
SEQID
SEQID
SEQID
SEQID
SEQID列。
SEQID列。
SEQIDID NO:239: CPO-反向引物序列,用于扩增烟草PM132的CPO GnTI基因组序ID N0:240:CAC80702. 1_正向引物序列,用于扩增烟草PM132的CAC80702.同源物O
SEQIDN0:241:CAC80702. 1_反向引物序列,用于扩增烟草PM132的CAC80702.1同源物O
SEQIDNO:242:FABIJ1-1同源物正向引物序列,用于扩增烟草希克斯阔叶的GnTI序列。
SEQIDNO:243:FABIJ1-1同源物反向引物序列,用于扩增烟草希克斯阔叶的GnTI序列。
SEQIDNO:244:FABIJ1-1同源物正向引物序列,用于扩增烟草希克斯阔叶的GnTI序列。
SEQIDNO:245:FABIJ1-1同源物反向引物序列,用于扩增烟草希克斯阔叶的GnTI序列。
SEQIDNO:246:PC181F引物序列,用于扩增烟草PM132中含有5’ UTR及外显子1-7 的 gDNA ο
SEQIDNO:247:PC190R引物序列,用于扩增烟草PM132中含有5’ UTR及外显子 1-7 的 gDNA ο
SEQIDNO:248:PC191F引物序列,用于扩增烟草PM132中含有外显子4-13的gDNA ο
SEQIDNO:249:PC192R引物序列,用于扩增烟草PM132中含有外显子4-13的gDNA ο
SEQIDNO:250:PC193F引物序列,用于扩增烟草PM132中含有外显子2-19及3,UTR 的 gDNA ο
SEQIDN0:251:PC187R引物序列,用于扩增烟草PM132中含有外显子12-19及3,UTR 的 gDNA ο
SEQIDNO :252:PC193F引物序列,用于扩增烟草PM132中含有外显子12-19及3,UTR 的 gDNA ο
SEQIDNO :253:PC188R引物序列,用于扩增烟草PM132中含有外显子12-19及3UTR 的 gDNA
SEQIDNO :254:PC193F引物序列,用于扩增烟草PM132中含有外显子12-19及3,UTR 的 gDNA ο
SEQIDNO :255:PC189R引物序列,用于扩增烟草PM132中含有外显子12-19及3,UTR 的 gDNA
SEQIDNO :256:烟草PM132的基因组FABIJI同源物的核苷酸序列。
SEQIDNO :257:烟草PM132的FABIJI同源物的编码序列的核苷酸序列。
SEQIDNO :258:烟草PM132的FABIJI同源物的氨基酸序列。
SEQIDNO :259:烟草PM132的基因组CPO-gDNA的核苷酸序列。
SEQIDNO :260:烟草PM132CP0基因的预测编码区的核苷酸序列。
SEQIDNO:261:烟草PM132CP0基因的编码区的预测氨基酸序列。
SEQIDNO :262:烟草PM132CAC80702.1同源物的核苷酸序列。
SEQIDNO :263:烟草PM132CAC80702.1同源物的编码区核苷酸序列。
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQID
SEQIDNO:264:烟草PM132CAC80702.1同源物的预测氨基酸序列。 NO: 265:烟草PM132的GnTI叠连群1#5的核苷酸序列。NO:266:GnTI编码区叠连群1#5的预测核苷酸序列。NO: 267:烟草PM132的GnTI叠连群1#5的预测氨基酸序列。 NO: 268:烟草PM132的GnTI叠连群1#8的核苷酸序列。NO:269:GnTI编码区叠连群1#8的预测核苷酸序列。NO: 270:烟草PM132的GnTI叠连群1#8的预测氨基酸序列。 NO: 271:烟草PM132的GnTI叠连群1#9的核苷酸序列。NO:272:GnTI编码区叠连群1#9的预测核苷酸序列。NO: 273:烟草PM1329的GnTI叠连群1#的预测氨基酸序列 NO: 274:烟草PM132的GnTI T10702的核苷酸序列。NO:275:GnTI编码区T10702的预测核苷酸序列。NO:276:烟草PM132的GnTI T10702的预测氨基酸序列。NO: 277:烟草PM132的GnTI叠连群1#6的核苷酸序列。NO:278:GnTI编码区叠连群1#6的预测核苷酸序列。NO: 279:烟草PM132的GnTI叠连群1#6的预测氨基酸序列。 NO: 280:烟草PM132的GnTI叠连群1#2的核苷酸序列。 N0:281:GnTI编码区叠连群1#2的预测核苷酸序列。NO: 282:烟草PM132的GnTI叠连群1#2的预测氨基酸序列。实施例
提供以下实施例作为解释而不是用于限制。除非另有指出,本发明采用的是分子生物学、植物生物学及植物育种的常规技术和方法。
实施例1:鉴别烟草β (I, 2)-木糖基转移酶变体I的基因组序列
此实施例阐明了如何鉴别烟草的β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶)的基因组核苷酸序列。
烟草BAC文库。按如下方法制备细菌人工染色体(BAC)文库从温室生长的烟草希克斯阔叶变种植物的叶中分离细胞核。根据标准操作流程将高分子量DNA从核中分离, 并用BamHI和HindIII进行部分消化,将其克隆至BAC载体pINDIG05的BamHI或HindIII 位点。获得了超过320,000个克隆,平均插入长度为135兆碱基对,这覆盖了大约9. 7倍的烟草基因组。
烟草基因组序列拼接。提交大量随机挑取的BAC克隆用Sanger法测序,产生超过 1,780,000个原始序列,平均长度为550碱基对。通过使用大肠埃希氏菌Mcr+菌株用于转化和分离低甲基化DNA的方式进行甲基过滤。使用CELERA基因组拼接程序拼接所有序列, 生成超过800,000个序列,其包含超过200,000个叠连群及596,970个单一序列。叠连群的大小为120-15,300碱基对之间,平均长度为1,100碱基对。
烟草外显子阵列的开发与分析。通过组合并比较公共烟草EST数据以及获自BAC 测序的甲基过滤序列得到272,342个外显子。对每个外显子设计了四个25聚体的寡核苷酸,用于构建烟草外显子阵列。外显子阵列是使用标准操作流程通过Affymetrix(SantaClara, USA)创造的。在这272,432个外显子中,有^ (11)个被鉴定为与公共数据库注释的β-1,2-木糖基转移酶(β (1,2)_木糖基转移酶)基因序列具有同源性。这11个外显子属于6个叠连群。使用标准杂交操作流程及分析工具,发现这11个外显子中有十(10)个在烟草叶组织中有活性。选择显示了最高表达值的叠连群,gDNA_cl736055,用于引物设计以鉴别BAC克隆而获得全长的基因组DNA序列。SEQ ID NO:1为叠连群gDNA_c1736055的全长序列。
引物设计。使用Primer3 (Rozen 和 Skaletsky, 2000)为叠连群 gDNA_cl736055 设计了引物对NGSG10043,是以这样的方式设计的,两条引物形成一对,位于在外显子非编码序列边界周围,计算的产物长度为250-500碱基对。NGSG10043是按如下方法设计的将引物SEQ ID勵:2作图于80應_(31736055的不翻译部分,位于正链的推定起始密码子之前,而引物SEQ ID N0:3位于所述序列的预测外显子部分以增加特异性。将包含SEQ ID N0:2和 SEQ ID N0:3的引物对NGSG10043用于筛选BAC文库。此项策略可用于区分基因组中存在的不同的多种变体和等位基因。
筛选BAC文库。DNA分离自BAC克隆,后者以三维的方式汇集而促进对与特定序列有同源性的个体克隆进行鉴别。使用PCR及标准BAC筛选步骤及引物对NGSG10043筛选完全 BAC文库,鉴别给出预测片段大小的单一克隆。选择了一个BAC克隆,NtPM1-BAC-TAK0MI_6, 用于进一步分析,并使用454测序法在基因组测序仪FLX System (Roche Diagnostics Corporation)上对纯化的NtPMI_BAC_TAK0MI_6的DNA进行测序。使用Newbler拼接程序(454 Life Sciences, Branford, USA)拼接所有的原始 NtPMI_BAC_TAK0MI_6 序列,并用 TAIR和Uniprot入口进行注释,由此鉴别出了一个28,936碱基对的叠连群257B4-叠连群 00006,其包含与拟南芥β-1,2-木糖基转移酶(AT5G55500.1; TAIR登记基因2173891)同源的序列。SEQ ID勵:4公开了财 10-84^八1(010_6的6,000碱基对的片段,其包含负链上大约3,465 碱基对的片段(显示了与拟南芥基因AT5G55500.1 (SEQ ID Ν0:5)的同源性) 以及预测基因(SEQ ID NO: 6)的推定终止密码子后的1,430碱基对的片段以及推定起始密码子之前的1,140碱基对的片段。使用引物组NGSG10043扩增的NtPMI_BAC_TAK0MI_6的 358碱基对的片段如SEQ ID N0:7所示。
β (I, 2)_木糖基转移酶基因序列的鉴别。使用预测真核基因组序列的基因搜寻程序 Augustus (University of G6ttingen,Gottillgeil, Germany)和 FgeneSH (Softberry Inc. , Mount Kisco,USA)对显示与拟南芥β-1,2-木糖基转移酶(β (1,2)-木糖基转移酶) 基因序列有同源性的NtPM1-BAC-TAK0MI_6的6,000碱基对的基因组序列进行进一步注释。 两个基因搜寻程序对已知烟草基因进行第一次训练。进一步通过与已知的β (1,2)_木糖基转移酶cDNA和氨基酸序列进行比较手动注释与显示了与拟南芥AT5G55500.1同源的 3,430碱基对片段重叠的预测的FgeneSH和Augustus基因。SEQ ID N0:8公开了与SEQ ID N0:5相关的cDNA序列。SEQ ID N0:8包括1,572碱基对,包括了终止密码子,其编码了 523 个氨基酸的多肽(SEQ ID N0:9)。
烟草β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶)基因结构。通过比较基因组DNA序列SEQ ID NO: 5和β-1,2-木糖基转移酶(β (1,2)-木糖基转移酶)cDNA序列SEQ ID N0:8,可得出结论该基因组基因编码序列包含三个负链上的外显子(跨度为SEQ ID NO: 4的负链上的4,894-大约4,196 (起始密码子-外显子I),大约2,899—2,750 (外显子2)即大约2,152-1,430 (外显子3-终止密码子))及两个插入的内含子。
实施例2:鉴别烟草β-12-木糖基转移酶(β (I,2)_木糖基转移酶)变体2
烟草的β -1, 2-木糖基转移酶(β (I, 2)-木糖基转移酶)基因变体2是如实施例1中描述的方法鉴别的,但分别使用的是基于CH0_0F4335xnl3fl的引物对NGSG10046 (SEQ ID NO: 15 和 16)。SEQ ID NO: 12 表示 NtPM1-BAC-GEJUJ0_2(含有烟草 β_1,2_ 木糖基转移酶(β (1,2)_木糖基转移酶)基因变体2)的核苷酸序列的60,001-65,698碱基对。SEQ ID NO: 13表示烟草β-1,2-木糖基转移酶(β (1,2)_木糖基转移酶)基因变体2的cDNA序列。 SEQ ID勵:17表示财卩]\0-84(-34犯1(1_1(含有烟草β_1,2_木糖基转移酶(β (1,2)-木糖基转移酶)基因变体2)的核苷酸序列的15,921-23,200碱基对。SEQ ID NO: 18表示烟草 β-1,2-木糖基转移酶(β (1,2)_木糖基转移酶)基因变体2的cDNA序列。SEQ ID NO: 19 表示烟草β-1,2-木糖基转移酶(β (1,2)_木糖基转移酶)蛋白质变体2的氨基酸序列。
实施例3:鉴别烟草α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)变体 I至4
基本上用实施例1中描述的方法鉴别出烟草的四个α-1,3_岩藻糖基转移酶 (α (l,3)-岩藻糖基转移酶)基因变体,使用了引物对NGSG10032(SEQ ID SEQ ID NO:30和 31),NGSG10034(SEQ ID NO:35 和 36),NGSG10035(SEQ ID N0:45 和 46)和 NGSG10041(SEQ ID N0:25 和 26)。SEQ ID NO:27 表示 NtPMI_BAC_FETILA_9 (含有烟草 α-1,3_ 岩藻糖基转移酶(α (1,3)_岩藻糖基转移酶)基因变体I)的核苷酸序列的2,961-10,160碱基对, SEQ ID NO:28表示α-1,3-岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体I的 cDNA序列,而SEQ ID Ν0:29为α _1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)蛋白质变体I的氨基酸序列。SEQ ID NO: 32表示NtPM1-BAC-JUMAKE_4 (含有烟草α-l, 3-岩藻糖基转移酶(α (1,3)_岩藻糖基转移酶)基因变体2)的核苷酸序列的1,041-7,738碱基对,SEQ ID NO: 33为α-1,3_岩藻糖基转移酶(α (1,3)-岩 藻糖基转移酶)基因变体2 的部分cDNA序列,而SEQ ID NO: 34为α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)蛋白质变体2的部分氨基酸序列。SEQ ID NO:37表示NtPM1-BAC-JEJ0L0_22 (包含部分烟草α-1,3_岩藻糖基转移酶(α (1,3)_岩藻糖基转移酶)基因变体3)的核苷酸序列的 19,001-23,871碱基对,SEQ ID NO: 38为α-1,3-岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体3的部分cDNA序列,而SEQ ID NO: 39为α (1,3)-岩藻糖基转移酶蛋白质变体3的部分氨基酸序列。SEQ ID NO: 47表示NtPM1-BAC-JUD0SU_1(包含烟草α-l, 3-岩藻糖基转移酶(α (1,3)_岩藻糖基转移酶)基因变体4)的核苷酸序列的1-11,000碱基对,SEQ ID NO: 48为α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶)基因变体4的部分cDNA序列,而SEQ ID NO:49为α-1,3_岩藻糖基转移酶(α (1,3)-岩藻糖基转移酶) 蛋白质变体4的部分氨基酸序列。
实施例4:用于选择锌指核酸酶靶标位点的搜索操作流程
此实施例阐明了如何搜索给定基因的基因组核苷酸序列以比较给定基因组数据库而筛选给定基因序列内独特靶标位点的发生率,这样可开发修饰所述基因表达的工具。 通过本发明的方法鉴别的祀标位点(包括下文公开的位点),包括序列基序以及任何这些位点或基序用于修饰植物如烟草中对应基因序列的用途都在本发明范围内。
搜索算法。开发了一项计算机程序以允许对一段输入查询(靶标)核苷酸序列筛选由固定间隔子大小序列分开的两条固定长度的亚串DNA基序的发生率,使用了 DNA 数据库内的后缀阵列,如实施例1中的烟草基因组序列的拼接。所述后缀阵列的构建及搜索使用了 开放资源 libdivsufsort library-2. O. O (http: //code, google, com/p/ libdivsufsort/),其将任何输入串直接转换为Burrows-Wheeler转化串。该程序扫描全长的输入(靶标)核苷酸序列并返回所有在选定DNA数据库中发生少于选定次数的亚串组合。
选择靶标位点用于对查询序列进行锌指核酸酶介导的诱变。锌指DNA结合结构域识别一段三碱基的核苷酸序列。锌指核酸酶包含的锌指蛋白质包含一个、两个、三个、四个、 五个、六个或更多锌指DNA结合结构域,以及非特异性核酸酶,IIS型限制性内切酶。锌指核酸酶可用于向靶标序列中引入双链断裂。为引入双链断裂,需要一对锌指核酸酶,其中之一结合于靶标序列的正(上)链而另一个结合于相同的靶标序列的负(下)链,相隔0、1、2、 3、4、5、6或更多的核苷酸。通过对所述两个固定长度亚串DNA基序的每个使用3次重复,可使用该程序鉴别由给定间隔子长度隔开的两个锌指蛋白质靶标位点。
程序输入
1.靶标查询DNA序列
2.要搜索的DNA数据库
3.第一个亚串DNA基序的固定大小
4.间隔子的固定大小
5.第二个亚串DNA基序的固定大小
6.在所选择的程序输入2的DNA数据库中的程序输入3和5 (其由程序输入4隔开)的组合发生率的阈值数量
程序输出
1. 一列核苷酸序列,以及对于每个序列的其在DNA数据库中发生的次数,最大值为程序输入6的阈值。
实施例5:在烟草β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶)变体I核苷酸序列内选择靶标位点,其具有固定的6碱基对的第一和第二个亚串、固定的3碱基对的间隔子以及在烟草基因组序列拼接中最大阈值为5次命中。
程序输入
1.烟草β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶)SEQ ID NO: 5作为靶标查询DNA序列
2.实施例1的烟草基因组序列拼接物作为要搜索的DNA数据库
3.固定的6碱基对的第一亚串DNA基序
4.固定的3碱基对的间隔子
5.固定的6碱基对的第二亚串DNA基序
6.在所选择的有5次命中的程序输入2的DNA数据库中的程序输入3和5 (其由程序输入4隔开)的组合发生率的最大阈值数量
程序输出
ACCGTA NNN GGCGAC (SEQ ID NO:50):4 次命中
CCGTAT NNN GCGACG(SEQ ID NO:51):5 次命中
TATCCG NNN ACGGCG(SEQ ID NO:52) :5 次命中
GCGAGGNNNGTGCTA(SEQIDNO:53)5次命中
TCTCGTNNNGGCGAG(SEQIDNO:54)5次命中
CGGTTANNNGTAGGA(SEQIDNO:55)5次命中
AGTTAGNNNGCGCCG(SEQIDNO:56)4次命中
CGTGGCNNNCAGGGT(SEQIDNO:57)3次命中
CCTTACNNNACGTCT(SEQIDNO:58)4次命中
GGCCATNNNGGGGGC(SEQIDNO:59)3次命中
GCCATANNNGGGGCG(SEQIDNO:60)4次命中
GCACGGNNNTCCGAG(SEQIDΝ0:61)4次命中
GCGAATNNNGGCGCC(SEQIDNO:62)5次命中
此实施例阐明了对于给定的靶标序列SEQ ID N0:5(其包含β (I, 2)-木糖基转移酶的完全基因组序列,从ATG起始密码子到TAA终止密码子,并含有两个外显子和两个内含子)的任何锌指核酸酶对(其中每个锌指蛋白质包含两个固定的6碱基对长的DNA结合结构域,以及3碱基对的固定的插入间隔子序列)会靶向烟草基因组内部的至少三个其他位点。 此实施例还阐明了,在烟草基因组中只有13对发生次数小于或等于5,而其他对都超过5 次。
实施例6 :选择靶标位点用于对烟草β-1,2_木糖基转移酶(β (1,2)_木糖基转移酶)变体I的编码序列 的外显子2片段进行锌指核酸酶基因组编辑
此实施例阐明
1.如何对一列用于对SEQ ID NO: 5的烟草β _1,2_木糖基转移酶(β (1,2)_木糖基转移酶)变体I的外显子2进行锌指介导的诱变的靶标位点进行编译
2.如何对一对用于设计两种形成一对以诱变编码序列的锌指核酸酶的靶标位点进行选择
3.如何使用程序的输出开发一对锌指核酸酶
程序输入
1. SEQ ID NO:5的2,750-2,899碱基对(负链为编码序列)的外显子2片段作为靶标查询DNA序列
2.实施例1的烟草基因组序列拼接物作为要搜索的DNA数据库
3.固定的12碱基对的第一亚串DNA基序
4.固定的O碱基对的间隔子
5.固定的12碱基对的第二亚串DNA基序
6.在所选的DNA数据库中发生I次的最大阈值数
程序输出
在烟草基因组数据库中运行程序生成的具有最大I次发生的阈值的所有为外显子2设计的12-0-12的24个碱基对序列如下,其中第一个数字表示第一亚串的固定长度, 第二个数字为间隔子的固定长度,而第三个数字为第二亚串的固定长度,都为上文的输入设置)
TTTTCATTTCAG TGGATTGAGGAG(SEQ ID NO:63) :O 次命中
TTTCATTTCAGT GGATTGAGGAGC(SEQ ID NO:64) :O 次命中
TTCATTTCAGTGGATTGAGGAGCCSEQIDNO :65)0次命中
TCATTTCAGTGGATTGAGGAGCCGSEQIDNO :66)0次命中
CATTTCAGTGGATTGAGGAGCCGTSEQIDNO :67)0次命中
ATTTCAGTGGATTGAGGAGCCGTCSEQIDNO :68)0次命中
TTTCAGTGGATTGAGGAGCCGTCASEQIDNO :69)0次命中
TTCAGTGGATTGAGGAGCCGTCACSEQIDNO :70)0次命中
TCAGTGGATTGAGGAGCCGTCACTSEQIDN0:71)0次命中
CAGTGGATTGAGGAGCCGTCACTTSEQIDNO :72)0次命中
AGTGGATTGAGGAGCCGTCACTTTSEQIDNO :73)0次命中
GTGGATTGAGGAGCCGTCACTTTTSEQIDNO :74)0次命中
TGGATTGAGGAGCCGTCACTTTTGSEQIDNO :75)0次命中
GGATTGAGGAGCCGTCACTTTTGASEQIDNO :76)0次命中
GATTGAGGAGCCGTCACTTTTGATSEQIDNO :77)0次命中
ATTGAGGAGCCGTCACTTTTGATTSEQIDNO :78)0次命中
TTGAGGAGCCGTCACTTTTGATTASEQIDNO :79)0次命中
TGAGGAGCCGTCACTTTTGATTACSEQIDNO :80)0次命中
GAGGAGCCGTCACTTTTGATTACASEQIDN0:81)0次命中
AGGAGCCGTCACTTTTGATTACACSEQIDNO :82)0次命中
GGAGCCGTCACTTTTGATTACACGSEQIDNO :83)0次命中
GAGCCGTCACTTTTGATTACACGASEQIDNO :84)0次命中
AGCCGTCACTTTTGATTACACGATSEQIDNO :85)0次命中
GCCGTCACTTTTGATTACACGATTSEQIDNO :86)0次命中
CCGTCACTTTTGATTACACGATTTSEQIDNO :87)0次命中
CGTCACTTTTGATTACACGATTTGSEQIDNO :88)0次命中
GTCACTTTTGATTACACGATTTGASEQIDNO :89)0次命中
TCACTTTTGATTACACGATTTGAGSEQIDNO :90)0次命中
CACTTTTGATTACACGATTTGAGTSEQIDN0:91)0次命中
ACTTTTGATTACACGATTTGAGTASEQIDNO :92)0次命中
CTTTTGATTACACGATTTGAGTATSEQIDNO :93)0次命中
TTTTGATTACACGATTTGAGTATGSEQIDNO :94)0次命中
TTTGATTACACGATTTGAGTATGCSEQIDNO :95)0次命中
TTGATTACACGATTTGAGTATGCASEQIDNO :96)0次命中
TGATTACACGATTTGAGTATGCAASEQIDNO :97)0次命中
GATTACACGATTTGAGTATGCAAASEQIDNO :98)0次命中
ATTACACGATTTGAGTATGCAAACSEQIDNO :99)0次命中
TTACACGATTTGAGTATGCAAACCSEQIDNO:100):0次命中
TACACGATTTGAGTATGCAAACCTSEQIDNO:101):0次命中
ACACGATTTGAGTATGCAAACCTTSEQIDNO:102):0次命中
CACGATTTGAGTATGCAAACCTTTSEQIDNO:103):0次命中
权利要求
1.遗传修饰的烟草植物细胞或包含所述修饰的植物细胞的烟草植物,其中修饰的植物细胞包含至少对在包含N-乙酰基-葡糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列的修饰,这使得(i)修饰的植物细胞中的糖基转移酶的活性或表达相对于未修饰的植物细胞是降低的,且(ii)修饰的植物细胞中产生的蛋白质的N-聚糖上的α -1, 3-岩藻糖或β -1, 2-木糖或二者相对于未修饰的植物细胞是降低的。
2.权利要求1的修饰的烟草植物细胞或烟草植物,其另外包含(a)至少对包含β (1,2)_木糖基转移酶的编码序列的基因组区域中的第二靶标核苷酸序列的修饰,或(b)至少对包含α (1,3)_岩藻糖基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列的修饰,或(a)和(b)的组合。
3.权利要求1的修饰的烟草植物细胞或烟草植物,其进一步包含在第一靶标核苷酸序列、第二靶标核苷酸序列、第三靶标核苷酸序列或任何两个或更多个前述靶标核苷酸序列的组合的等位基因变体中的修饰。
4.前述权利要求中任何一项的修饰的烟草植物细胞或烟草植物,其中第一靶标核苷酸序列为a.与选自SEQ ID N0:12、13、40、41、233、256、259、262、265、268、271、274、277、280 的核苷酸序列有至少70%、特别是至少80%、特别是至少90%的同一性;b.与选自SEQ ID N0:20、21、212、213、219、220、223、227、229、234、257、260、263、266、269、272、275、278、281的核苷酸序列有至少95%、特别是至少98%、特别是至少99%的同一性。
5.根据权利要求2-4中任何一项的修饰的烟草植物细胞或烟草植物,其中第二靶标核苷酸序列为a.与选自SEQID NO: 1、4、5、和17的核苷酸序列有至少70%、特别是至少80%、特别是至少90%的同一性;b.与选自SEQID N0:8和18的核苷酸序列有至少95%、特别是至少98%、特别是至少99%的同一性。
6.根据权利要求2-5中任何一项的修饰的烟草植物细胞或烟草植物,其中第三靶标核苷酸序列为a.与选自SEQID NO:27、32、37和47的核苷酸序列有至少70%、特别是至少80%、特别是至少90%的同一性;b.与选自SEQID NO:28、33、38和48的核苷酸序列有至少95%、特别是至少98%、特别是至少99%的同一性。
7.根据前述权利要求中任何一项的修饰的烟草植物细胞或烟草植物,其中植物为烟草栽培种PM132,其以登记号NCMB 41802保藏。
8.根据前述权利要求中任何一项的修饰的烟草植物的后代,其中所述后代植物包含如前述权利要求中任何一项中所限定的修饰中的至少一种,其中糖基转移酶的活性或表达相对于未修饰的植物是降低的且Qi)修饰的植物中产生的蛋白质的N-聚糖上的α-1,3-岩藻糖或β -1, 2-木糖或二者相对于未修饰的植物细胞是降低的。
9.用于产生异源蛋白质的方法,所述方法包括将包含编码异源蛋白质的核苷酸序列的表达构建物引入权利要求1-8中任何一项所限定的修饰的烟草植物细胞或植物中,所述异源蛋白质特别是疫苗抗原、细胞因子、激素、凝血蛋白质、载脂蛋白、用于人类替代疗法的酶、免疫球蛋白或其片段;以及培养包含所述表达构建体的修饰的植物细胞以产生异源蛋白质,以及可选地,由所述植物细胞再生植物并培养所述植物及其后代。
10.核苷酸,其包含的核苷酸序列编码a.N-乙酰葡萄糖氨基转移酶或其片段,其核苷酸序列(i)选自SEQ ID 勵12、13、40、41、233、256、259、262、265、268、271、274、277 和 280;(ii)选自SEQ ID N0:20、21、212、213、219、220、223、227、229、234、257、260、263、266、269、272、275、278 和 281 ;(iii)与(i)或(ii)的核苷酸序列有至少95%、特别是至少98%、特别是至少99%的同一 I"生;(iv)允许由或(iii)的核苷酸序列或其互补物组成的多核苷酸探针进行杂交,特别是在严格条件下;b.β (1,2)_木糖基转移酶或其片段,其核苷酸序列(i)选自SEQ ID N0:l、4、5、7 和 17 ;(ii)选自SEQ ID NO:8 和 18 ;(iii)与(i)或(ii)的核苷酸序列有至少95%、特别是至少98%、特别是至少99%的同一 I"生;(iv)允许由或(iii)的核苷酸序列或其互补物组成的多核苷酸探针进行杂交,特别是在严格条件下;C. α (1,3)_岩藻糖基转移酶或其片段,其核苷酸序列(i)选自SEQ ID N0:27、32、37 和 47;(ii)选自SEQ ID N0:28、33、38 和 48;(iii)与(i)或(ii)的核苷酸序列有至少95%、特别是至少98%、特别是至少99%的同一 I"生;(iv)允许由或(iii)的核苷酸序列或其互补物组成的多核苷酸探针进行杂交,特别是在严格条件下。
11.由权利要求10的多核苷酸编码的糖基转移酶,其中所述糖基转移酶为a.氨基酸序列如SEQ ID N0:214、215、217、218、221、222、224、228、230、235、258、264、267、270、273、276、279和282所示的N-乙酰葡萄糖氨基转移酶;b.氨基酸序列如SEQID NO:9和19所示的β (I, 2)-木糖基转移酶;c.氨基酸序列如SEQID N0:29、34、39和49所示的α (1,3)-岩藻糖基转移酶;d.与或(iii)的氨基酸序列有至少95%、特别是至少98%、特别是至少99%的同一性的氨基酸序列。
12.权利要求10中限定的基因组核苷酸序列的用途,用于在以下序列中鉴定靶标位点a.包含N-乙酰葡萄糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列;或b.a)的第一靶标核苷酸序列以及包含β(1,2)_木糖基转移酶的编码序列的基因组区域中的第二靶标核苷酸序列;或c.a)的第一靶标核苷酸序列以及包含α(1,3)_岩藻糖基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列;d.a)、b)和c)的所有靶标核苷酸序列;进行修饰,使得(i)包含所述修饰的植物细胞中的N-乙酰氨基葡萄糖基转移酶、或者N-乙酰葡萄糖氨基转移酶和β (1,2)_木糖基转移酶、或者N-乙酰葡萄糖氨基转移酶和α (1,3)_岩藻糖基转移酶或者N-乙酰氨基葡萄糖基转移酶、β (1,2)_木糖基转移酶和α (I, 3)-岩藻糖基转移酶,以及可选地其至少一种等位基因变体的活性或表达相对于未修饰的植物细胞是降低的,并且(ii)包含所述修饰的植物细胞中的蛋白质的N-聚糖上的α -1, 3-岩藻糖或β -1, 2-木糖或二者相对于未修饰的植物细胞是降低的。
13.选择性结合于权利要求10中限定的基因组核苷酸序列或编码序列的非天然锌指蛋白质的用途,用于产生在至少一靶标核苷酸序列中引入双链断裂的锌指核酸酶。
14.包含异源蛋白质的植物组合物,可获自包含由如权利要求1-8中任何一项限定的修饰的植物细胞,其中异源蛋白质的N-聚糖上的α-1,3-岩藻糖或β-1,2-木糖或二者相对于未修饰的植物细胞中的产生那些是降低的。
15.用于产生包含能够产生人源化糖蛋白的修饰的植物细胞的烟草植物细胞或烟草植物的方法,所述方法包括(i)在烟草植物细胞的基因组中修饰a.包含N-乙酰葡萄糖氨基转移酶的编码序列的基因组区域中的第一靶标核苷酸序列;或b.a)的第一靶标核苷酸序列以及包含β (I, 2)_木糖基转移酶或α (I, 3)_岩藻糖基转移酶的编码序列的基因组区域中的第二靶标核苷酸序列;或c.a)的第一靶标核苷酸序列以及b)的第二靶标核苷酸序列以及包含β (1,2)_木糖基转移酶或α (1,3)_岩藻糖基转移酶的编码序列的基因组区域中的第三靶标核苷酸序列;以及可选的d.包含(a)、(b)或(C)的等位基因变体的基因组区域中的靶标序列,或前述靶标序列中任何两种或多种的组合。(ii)鉴别及可选地,选择在靶标核苷酸序列中包含所述修饰的植物或植物细胞,其中修饰的植物或植物细胞中的如a)、b)、c)和d)中限定的糖基转移酶的活性或表达以及可选地其至少一种等位基因变体的活性或表达相对于未修饰的植物细胞是降低的,而由所述修饰的植物或植物细胞产生的糖蛋白在其N-聚糖上缺少α -1, 3-连接岩藻糖残基及β-1,2-连接的木糖残基。
16.权利要求15的方法,其中靶标核苷酸序列包含如权利要求10中所限定的核苷酸序列。
17.前述权利要求中任何一项的方法,其中植物为烟草栽培种ΡΜ132,其以登记号NCIMB 41802 保藏。
18.前述权利要求中任何一项的方法,其中对烟草植物或植物细胞的基因组的修饰包括a.在烟草植物或植物细胞的靶标核苷酸序列以及可选地在其至少一种等位基因变体中鉴定靶标位点,b.基于如权利要求10中限定的核苷酸序列设计能够识别并结合于所述靶标位点处或邻近的诱变的寡核苷酸,以及c.在使得基因组被修饰的条件下将诱变的寡核苷酸结合于烟草植物或植物细胞的基因组中的靶标核苷酸序列上。
19.权利要求18的方法,其中诱变的寡核苷酸用于基因组编辑技术,特别是用于锌指核酸酶介导的诱变、tilling、同源重组、寡核苷酸定点诱变或大范围核酸酶介导的诱变,或前述技术的组合。
全文摘要
本发明针对的是在植物中靶向基因和基因组、修饰酶活性及蛋白质表达。具体而言,本发明涉及用于降低植物细胞中一种或多种内源糖基转移酶如N-乙酰葡萄糖氨基转移酶、β(1,2)-木糖基转移酶及α(1,3)-岩藻糖基转移酶的活性的方法,并涉及由所述方法获得的植物。
文档编号C12N15/82GK103025866SQ201180023755
公开日2013年4月3日 申请日期2011年3月22日 优先权日2010年3月22日
发明者K·K·奥伊施, D·E·A·佛洛拉克, P·坎帕尼, C·M·波齐, J·卡蒂诺特, N·J·谢罗, N·V·伊万诺夫 申请人:菲利普莫里斯生产公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1