调节植物中的还原糖含量的制作方法

文档序号:22624397发布日期:2020-10-23 19:31阅读:294来源:国知局
调节植物中的还原糖含量的制作方法

本发明公开了编码来自烟草(nicotianatabacum)的蔗糖合酶(sus)的基因的多核苷酸序列及其变体、同源物和片段。还公开了由其编码的多肽序列以及其变体、同源物和片段。还公开了调节一种或多种ntsus基因的表达或由其编码的ntsus多肽的功能或活性,以调节植物或其部分中还原糖的水平。



背景技术:

在本领域中持续需要生产改变了气溶胶和烟雾中风味化合物的释放的烟草材料。在本领域中还持续需要生产改变了气溶胶和烟雾中丙烯酰胺的释放的烟草材料。

本发明试图解决这些和其他需要。



技术实现要素:

蔗糖合酶(sus)是参与蔗糖合成的关键酶,也是驱动干制烟草叶中还原糖(诸如葡萄糖、果糖、乳糖和麦芽糖)积累的关键酶。通过调节sus的表达,可以调节在烟草叶干制期间和之后的还原糖库。干制烟草中还原糖含量的改变可能会导致人们对加热后获得的烟草香料产生不同的感知。如本文所述,某些ntsus基因在干制期间过表达,而其他不会,也不会有助于调节还原糖的水平。然而,这些基因可能参与其他代谢途径,并且它们表达的变化可能导致农艺学上有害的表型(例如,缓慢生长)。知道哪些ntsus基因在干制期间过度表达有利地允许选择仅在相关基因中有变化的植物,并减少对其他代谢过程的潜在负面影响。

本文描述了来自烟草的几种sus基因组多核苷酸序列,包括ntsus1-s(seqidno:1)、ntsus1-t(seqidno:3)、ntsus2-s(seqidno:5)、ntsus2-t(seqidno:7)、ntsus3-s(seqidno:9)、ntsus3-t(seqidno:11)、ntsus4-s(seqidno:13)、ntsus4-t(seqidno:15)、ntsus5-s(seqidno:17)、ntsus5-t(seqidno:19)、ntsus6-s(seqidno:21)和ntsus6-t(seqidno:23)。还公开了ntsus1-s(seqidno:2)、ntsus1-t(seqidno:4)、ntsus2-s(seqidno:6)、ntsus2-t(seqidno:8)、ntsus3-s(seqidno:10)、ntsus3-t(seqidno:12)、ntsus4-s(seqidno:14)、ntsus4-t(seqidno:16)、ntsus5-s(seqidno:18)、ntsus5-t(seqidno:20)、ntsus6-s(seqidno:22)和ntsus6-t(seqidno:24)的相应推导的多肽序列。ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t可在干制期间在糖代谢中起作用。特别地,示出ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s在干制期间在糖代谢中起作用。在烟草干制期间,烟道干制烟草通常包含比晾干的烟草多至少八倍的还原糖,这主要是由于弗吉尼亚烟草中淀粉的高积累。然而,在植物收获之后和衰老过程中,大部分淀粉首先被转化为蔗糖,然后转化为可能涉及sus的还原糖以及转化酶,所述转化酶是蔗糖代谢的关键酶。因此,本公开特别适用于调节干制植物材料中的还原糖含量。

在一个方面,描述了一种植物细胞,所述植物细胞包含:(i)多核苷酸,所述多核苷酸包含与seqidno:1或seqidno:3或seqidno:9或seqidno:11或seqidno:17或seqidno:19或seqidno:21或seqidno:23具有至少95%的序列同一性的序列,或由其组成或基本上由其组成;或多核苷酸,所述多核苷酸包含与seqidno:5或seqidno:7或seqidno:13或seqidno:15具有至少80%的序列同一性的序列,由其组成或基本上由其组成;(ii)多肽,所述多肽由(i)中所示的所述多核苷酸编码;(iii)多肽,所述多肽包含与seqidno:2具有至少94%的序列同一性、或与seqidno:4具有至少93%的序列同一性、或与seqidno:6具有至少95%的序列同一性、或与seqidno:8具有至少96%的序列同一性、或与seqidno:10或seqidno:12具有至少93%的序列同一性、或与seqidno:14具有至少95%的序列同一性、或与seqidno:16具有至少96%的序列同一性、或与seqidno:18具有至少89%的序列同一性、或与seqidno:20具有至少92%的序列同一性、或与seqidno:22具有至少93%的序列同一性、或与seqidno:24具有至少94%的序列同一性的序列,由其组成或基本上由其组成;或(iv)构建体、载体或表达载体,其包含(i)中所示的所述经分离的多核苷酸,其中与所述多核苷酸或多肽的表达或活性未被修饰的对照植物细胞相比,所述植物细胞包含至少一种修饰,所述至少一种修饰调节所述多核苷酸或所述多肽的表达或活性。

还描述了一种多肽,所述多肽包含与seqidno:2或seqidno:4具有至少69%的序列同一性、与seqidno:6或seqidno:8具有至少80%的序列同一性、或与seqidno:10或seqidno:12具有至少74%的序列同一性、或与seqidno:14或seqidno:16具有至少76%的序列同一性、或与seqidno:18或seqidno:20具有至少68%的序列同一性、或与seqidno:22或seqidno:24具有至少69%的序列同一性的序列,由其组成或基本上由其组成。

合适地,所述植物细胞包含多核苷酸,所述多核苷酸包含与seqidno:5或seqidno:13具有至少80%的序列同一性或与seqidno:9或seqidno:11具有至少95%的序列同一性的序列,由其组成或基本上由其组成。

合适地,所述植物细胞包含多肽,所述多肽包含与seqidno:6具有至少81%的序列同一性、或与seqidno:10或seqidno:12具有至少72%的序列同一性、或与seqidno:14具有至少80%的序列同一性的序列,由其组成或基本上由其组成。

合适地,所述植物细胞包含多肽,所述多肽包含与seqidno:6具有至少80%的序列同一性、或与seqidno:10或seqidno:12具有至少74%的序列同一性、或与seqidno:14具有至少76%的序列同一性的序列,由其组成或基本上由其组成。

合适地,所述至少一种修饰是所述植物细胞基因组的修饰,或者是所述构建体、载体或表达载体的修饰,或者是转基因修饰。

合适地,所述植物细胞基因组的所述修饰或所述构建体、载体或表达载体的所述修饰是突变或编辑。

合适地,与所述对照植物细胞相比,所述修饰提高或降低所述多核苷酸或所述多肽的表达或活性。

合适地,所述植物细胞包含干扰多核苷酸,所述干扰多核苷酸包含与从根据权利要求1(i)所述多核苷酸转录的rna的至少19个核苷酸至少80%互补的序列。

合适地,与来源于对照植物的叶子中的还原糖水平相比,所述多核苷酸或所述多肽的经调节的表达或活性调节来源于所述植物细胞的叶子中的还原糖水平,合适地其中所述还原糖是葡萄糖或果糖,或合适地,其中所述叶子是早期干制叶子或干制叶子。

在另一方面,描述了包含如本文所述的植物细胞的植物或其部分。

在另一方面,描述了来源于如本文所述的植物或其部分的植物材料、干制植物材料或均质植物材料。

合适地,所述植物材料包含来自如本文所述的植物或其部分的生物质、种子、茎、花或叶子。

合适地,所述干制植物材料是烟道干制、晒干或晾干的植物材料。

在另一方面,描述了烟草产品,其包含如本文所述的植物细胞、如本文所述的植物的一部分或如本文所述的植物材料。

在另一方面,描述了一种用于产生如本文所述的植物的方法,包括以下步骤:(a)提供植物细胞,所述植物细胞包含多核苷酸,所述多核苷酸包含与seqidno:1或seqidno:3或seqidno:9或seqidno:11或seqidno:17或seqidno:19或seqidno:21或seqidno:23具有至少95%的序列同一性、或与seqidno:5或seqidno:7或seqidno:13或seqidno:15具有至少80%的序列同一性的序列,由其组成或基本上由其组成;(b)与对照植物细胞相比,修饰所述植物细胞以调节所述多核苷酸的表达;以及(c)将所述植物细胞繁殖到植物中。

合适地,步骤(c)包括从包含所述植物细胞的插条或幼苗培养所述植物。

合适地,修饰所述植物细胞的步骤包括通过基因组编辑或基因组工程修饰所述细胞的所述基因组。

合适地,所述基因组编辑或基因组工程选自crispr/cas技术、锌指核酸酶介导的诱变、化学或放射诱变、同源重组、寡核苷酸定向诱变和大范围核酸酶介导的诱变。

合适地,修饰所述植物细胞的步骤包括用构建体转染所述细胞,所述构建体包含可操作地连接到组成型启动子的多核苷酸,所述多核苷酸包含与seqidno:1或seqidno:3或seqidno:9或seqidno:11或seqidno:17或seqidno:19或seqidno:21或seqidno:23具有至少80%的序列同一性、或与seqidno:5或seqidno:7或seqidno:13或seqidno:15具有至少95%的序列同一性的序列,由其组成或基本上由其组成。

合适地,修饰所述植物细胞的步骤包括将干扰多核苷酸引入细胞中,所述干扰多核苷酸包含与从根据权利要求1(i)所述的多核苷酸转录的rna至少80%互补的序列。

合适地,所述植物细胞用表达干扰多核苷酸的构建体转染,所述干扰多核苷酸包含与从如本文所述的多核苷酸转录的rna的至少19个核苷酸至少80%互补的序列。

在另一方面,描述了用于制备干制植物材料的方法,与对照植物材料相比,所述干制植物材料具有改变量的还原糖,所述方法包括以下步骤:(a)提供如本文所述的植物或其部分或植物材料;(b)自其收获所述植物材料;以及(c)干制所述植物材料。

合适地,所述植物材料包括干制叶子、干制茎或干制花或它们的混合物。

合适地,所述干制方法选自由晾干、火烤干制(firecuring)、烟熏干制(smokecuring)和烟道干制(fluecuring)组成的组。

一些优点

有利地,本文所述的ntsus多核苷酸序列在干制期间,特别是从干制开始时表达。调节一种或多种ntsus多核苷酸序列的表达可导致干制烟草叶中还原糖(诸如葡萄糖和果糖)的水平被调节。特别地,提高或降低一种或多种ntsus多核苷酸的表达可导致还原糖水平的提高或降低和加热时由此获得的烟草的不同感觉。

在香烟烟雾中,还原糖影响羰基组分如甲醛、乙醛、丙酮、2-糠醛和丙烯醛的释放(参见thechemicalcomponentsoftobaccoandtobaccosmoke,第2版,rodgman和perfetti,2016)。因此,改变还原糖含量可以改变此类羰基化合物的释放。关于气溶胶和烟雾中的香气释放,当加热时与氨基酸相互作用时,葡萄糖和较小程度的果糖可通过美拉德反应生成amadori化合物。尽管游离氨基酸被认为是该化学反应中的限制因素,但是还原糖的存在对于允许amadori化合物的形成是必需的。面包、坚果或爆米花般风味是通过加热脯氨酸和葡萄糖产生的,从而产生2-乙酰基-1-吡咯啉样产品。由于脯氨酸和还原糖在烟道干制烟草中特别丰富,因此加热或抽吸弗吉尼亚烟草时会获得坚果味。在共混物中,丙烯酰胺(因加热时葡萄糖(果糖)与天冬酰胺相互作用而产生的致癌化合物)通常可能是白肋烟(天冬酰胺含量高)与弗吉尼亚烟(还原糖含量高)烟草的混合所致。因此,改变还原糖与氨基酸的平衡可能会影响风味化合物和丙烯酰胺在气溶胶和烟雾中的释放。

有利地,加热烟草的重组烟草材料通常需要还原糖用于适当的铸叶制备。在叶子干制期间调节sus基因的表达可能会影响还原糖的含量和平衡,从而影响铸叶制备。有利地,可以产生消费者更可接受的非遗传修饰植物。

有利地,本公开不限于ems突变植物的使用。ems突变植物在育种后可能不具有改善作物特性的潜力。一旦开始育种,由于不同的原因,ems突变植物的理想特征可能会丢失。举例来说,可能需要多个突变,突变可以是显性或隐性的,并且可能难以在基因靶标中鉴定点突变。相反,本公开利用了可以被特异性地操作以产生具有所需表型的植物的ntaat多核苷酸的用途。本公开可以应用于各种植物品种或农作物。

附图说明

图1是柱状图,示出了收获(成熟)后、干制两天(干制48小时)后和干制结束时多种还原糖的含量。

具体实施方式

本公开中所用的章节标题用于组织目的并且不旨在进行限制。

1.定义

除非另外定义,否则本文所用的所有技术和科学术语都具有与所属领域普通技术人员通常所理解相同的含义。在有矛盾的情况下,将以本文档(包括定义)为准。下文描述优选方法和材料,但与本文所述的那些类似或等效的方法和材料可用于实施或测试本发明。本文所披露的所述材料、方法和实例仅仅是说明性的并且不打算是限制性的。

如本文所用的术语“包含”、“包括”、“具有(having/has)”、“可以”、“含有”以及它们的变体打算是开放性过渡短语、术语或措辞,不排除额外动作或结构的可能性。

除非上下文另外明确规定,否则单数形式“一(a/an)”以及“所述”包括多个指示物。

术语“和/或”意指(a)或(b)或者(a)和(b)两者。

本公开考虑了“包含”本文呈现的实施方案或要素、“由其组成”和“基本上由其组成”的其他实施方案,无论是否明确地阐述。

为了叙述本文的数值范围,明确涵盖它们之间具有相同精确度的每一个插入数值。举例来说,对于范围6-9,除了6和9之外涵盖数值7和8,并且对于范围6.0-7.0,明确涵盖数值6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9以及7.0。

如整个说明书和权利要求书中所使用,以下术语具有以下含义:

“编码序列”或“多核苷酸编码”是指包含编码多肽的多核苷酸的核苷酸(rna或dna分子)。编码序列还可包括可操作地连接到调节元件的起始和终止信号,所述调节元件包括能够指导在施用多核苷酸的个体或哺乳动物的细胞中表达的启动子和聚腺苷酸化信号。编码序列可以经密码子优化。

“互补”或“互补的”可以指核苷酸或核苷酸类似物之间的watson-crick(例如,a-t/u和c-g)或hoogsteen碱基配对。“互补性”是指两个多核苷酸之间共有的性质,使得当它们彼此反平行排列时,每个位置处的核苷酸碱基将是互补的。

“构建体”是指包含一种或多种多核苷酸的双链重组多核苷酸片段。构建体包括与互补“有义链或编码链”碱基配对的“模板链”。给定构筑体可以在两个可能方向中插入载体内,所述两个可能方向是关于位于载体(例如表达载体)内的启动子方向来说相同(或有义)方向或相反(或反义)方向。

在对照植物或对照植物细胞的上下文中,术语“对照”是指其中一个或多个基因或多肽的表达、功能或活性未被修饰(例如,增加或减少)并且因此其可以与其中相同的一个或多个基因或多肽的表达、功能或活性已被修饰的植物进行比较的植物或植物细胞。如本文所用,“对照植物”是除了测试参数以外全部参数大体上等效于测试植物或经修饰植物的植物。例如,当提及已引入多核苷酸的植物时,对照植物是没有引入这种多核苷酸的等同植物。对照植物可以是已引入对照多核苷酸的等同植物。在此类情况下,对照多核苷酸是预期对植物几乎不产生或不产生表型作用的多核苷酸。对照植物可以包含空白载体。对照植物可对应于野生型植物。对照植物可以是t1分离体不再具有转基因的空分离体。

“供体dna”或“供体模板”是指包括至少一部分目的基因的双链dna片段或分子。供体dna可以编码全功能多肽或部分功能多肽。

“内源基因或多肽”是指源自生物体的基因组并且没有经历改变(诸如遗传物质的丢失、获得或交换)的基因或多肽。内源性基因进行标准基因传递和基因表达。内源多肽经历正常表达。

“增强子序列”是指可以增加基因表达的序列。这些序列可以位于经转录区域的上游、内含子内或下游。经转录区从启动子到转录终止区包含外显子和插入内含子。基因表达的增强可以通过多种机制进行,包括提高转录效率、稳定成熟的mrna和翻译增强。

“表达”是指功能产物的产生。例如,多核苷酸片段的表达可以指多核苷酸片段的转录(例如,产生mrna或功能rna的转录)和/或mrna翻译成前体或成熟多肽。“过表达”指的是转基因生物体中产生的基因产物超过来自同一实验的空分离(或非转基因)生物体产生的水平。

“功能”和“全功能”描述具有生物学功能或活性的多肽。“功能基因”是指转录成mrna的基因,其被翻译成功能或活性多肽。

“基因构建体”是指包含编码多肽的多核苷酸的dna或rna分子。编码序列可包括可操作地连接到调节元件的起始和终止信号,所述调节元件包括能够指导表达的启动子和聚腺苷酸化信号。

“基因组编辑”是指改变编码内源多肽的内源基因,从而获得截短的内源多肽或具有氨基酸取代的内源多肽的多肽表达。基因组编辑可包括用修复机制诸如hdr将待靶向的内源基因的区域或整个内源基因替换为具有截短或氨基酸取代的基因拷贝。基因组编辑还可包括通过在内源基因中产生双链断裂,然后使用nhej修复,从而在内源基因中产生氨基酸取代。在可产生氨基酸取代的修复期间,nhej可添加或缺失至少一个碱基对。基因组编辑还可以包括通过两种核酸酶对同一dna股同时起作用来删除基因区段,从而在两个核酸酶目标位点之间形成截短并且通过nhej修复dna断裂。

关于序列的“异源”是指源自外来物种的序列,或者如果来自相同物种,则是通过有意的人为干预从其天然形式在组成和/或基因组基因座方面基本上修饰的序列。

“同源介导的修复”或“hdr”是指当细胞核中存在同源的dna片段时,主要在细胞周期的g2期和s期,细胞中修复双链dna损伤的机制。hdr使用供体dna或供体模板引导修复并且可用于形成基因组的特异性序列改变,包括靶向添加整个基因。如果供体模板与定点核酸酶一起提供,那么细胞机制将通过同源重组修复断裂,所述同源重组在dna裂解存在下将加强几个数量级。当不存在同源的dna片段时,可以替代地发生nhej。

术语“同源性”或“相似性”是指通过序列比对比较的两个多肽之间或两个多核苷酸分子之间的序列相似性程度。被比较的两个离散多核苷酸之间的同源性程度是在可比较位置处的相同或匹配核苷酸的数目的函数。

在两个或更多个多核苷酸或多肽的上下文中,“相同”或“同一性”是指序列在特定区域上具有特定百分比的相同残基。百分比可以通过最佳比对两个序列,比较两个序列的指定区域,测定两个序列中存在相同残基的位置数产生匹配位置数,匹配位置数除以指定区域中的位置总数,并且结果乘以100产生序列一致性百分比来计算。在两个序列具有不同长度或比对产生一个或多个交错端并且指定比较区域仅包括单个序列的情况下,单个序列的残基包括于计算的分母而非分子中。当比较dna和rna时,胸腺嘧啶(t)和尿嘧啶(u)视为相当。同一性可以人工鉴定或通过使用计算机序列算法诸如clustalw、clustalx、blast、fasta或smith-waterman测定。流行的多重比对程序clustalw(nucleicacidsresearch(1994)22,4673-4680;nucleicacidsresearch(1997),24,4876-4882)是用于产生多肽或多核苷酸的多重比对的合适方式。clustalw的合适参数可能如下:对于多核苷酸比对:缺口开放罚分=15.0,缺口延伸罚分=6.66,并且矩阵=一致性。对于多肽比对:缺口开放罚分=10.o,缺口延伸罚分=0.2,并且矩阵=gonnet。对于dna和蛋白质比对:endgap=-1,并且gapdist=4。本领域技术人员将会意识到,可能有必要改变这些和其他参数以达到最佳序列比对。然后,由这样的比对合适地以(n/t)计算一致性百分比,其中n是序列共享一致残基的位置数,t是比较的位置总数,包含缺口但不包括突出端。

术语“增加”或“增加的”是指增加约10%至约99%,或增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、至少99%、至少100%、至少150%、或至少200%或更多的数量或功能或活性,诸如但不限于多肽功能或活性、转录功能或活性和/或多肽表达。术语“增加的”或短语“增加的量”可以指修饰的植物或由修饰的植物产生的产物中的数量或功能或活性,其大于以相同方式加工的未经修饰的植物或来自相同品种的植物的产物中发现的数量或功能或活性。因此,在一些情况下,将已经以相同方式加工的相同品种的野生型植物用作对照,通过该对照测量是否获得数量的增加。

如本文所用,术语“增加”或“增加的”是指减少约10%至约99%,或减少至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、至少99%、或至少100%、或至少150%、或至少200%或更多的数量或功能,诸如多肽功能、转录功能或多肽表达。术语“增加的”或短语“增加的量”可以指修饰的植物或由修饰的植物产生的产物中的数量或功能,其小于以相同方式加工的未经修饰的植物或来自相同品种的植物的产物中发现的数量或功能。因此,在一些情况下,将已经以相同方式加工的相同品种的野生型植物用作对照,通过该对照测量是否获得数量的减少。

术语“抑制”或“被抑制”是指减少约98%至约100%,或减少至少98%、至少99%,但特别是100%的数量或功能或活性,诸如但不限于多肽功能或活性、转录功能或活性和/或多肽表达。

术语“引入”是指将多核苷酸(例如,构建体)或多肽提供到细胞中。引入包括提及多核苷酸向真核细胞中的掺入,其中多核苷酸可掺入细胞的基因组中,并且包括提及多核苷酸或多肽向细胞的瞬时提供。引入包括稳定或短暂转型法,以及性别交叉。因此,在将多核苷酸(例如,重组构建体/表达构建体)插入细胞的上下文中,“引入”是指“转染”或“转化”或“转导”,并且包括提及多核苷酸向真核细胞中的掺入,其中多核苷酸可以掺入细胞的基因组(例如,染色体、质粒、质体或线粒体dna)中,转化为自主复制子或瞬时表达(例如,转染的mrna)。

术语“分离的”或“纯化的”是指基本上或实质上不含在其天然状态下通常伴随其的组分的材料。纯度和均质性通常使用例如聚丙烯酰胺凝胶电泳或高效液相色谱等分析化学技术测定。作为制剂中存在的主要种类的多肽是基本上纯化的。特别地,分离的多核苷酸与位于所需基因侧面并编码除所需多肽之外的多肽的开放阅读框分离。如本文所用,术语“纯化的”表示多核苷酸或多肽在电泳凝胶中产生实质上一个带。特别地,它是指多核苷酸或多肽的纯度为至少85%,更优选为至少95%,并且最优选为至少99%。分离的多核苷酸可以从其天然存在的宿主细胞纯化。技术人员已知的常规多核苷酸纯化方法可用于获得分离的多核苷酸。术语还涵盖重组多核苷酸和化学合成的多核苷酸。

“调节”是指引起或促进所关注的过程、途径、功能或活性的定性或定量变化、改变或修饰。非限制性地,这样的变化、改变或修饰可以是所关注的相关过程、途径、功能或活性的增加或减少。例如,可以调节基因表达或多肽表达或多肽功能或活性。通常,将通过与对照比较来确定相关变化、改变或修饰。

如本文所用的“非同源端接合(nhej)路径”指的是通过无需同源模板而直接接合断裂端修复dna中的双股断裂的路径。不依赖于模板的通过nhej的dna端再接合是随机易错修复方法,其在dna断点处引入无规微插入和微缺失(插入缺失)。这一方法可用于有意中断、缺失或改变靶向基因序列的读取范围。nhej通常使用称为微同源性的短同源dna序列来引导修复。这些微同源性通常存在于双股断裂的末端上的单股悬垂物中。当悬垂物完全相容时,nhej通常精准修复断裂,但也可能存在导致核苷酸损失的不精确修复,但当悬垂物不相容时更常见。

术语“非天然存在”描述的不是自然界形成的或自然界中不存在的实体,诸如多核苷酸、基因突变、多肽、植物、植物细胞和植物材料。可以通过本文中所描述或本领域已知的方法来制备、合成、起始、修饰、干预或操纵这类非天然存在的实体或人工实体。可以由人制备、合成、起始、修饰、干预或操纵这类非天然存在的实体或人工实体。因此,例如,非天然存在的植物、非天然存在的植物细胞或非天然存在的植物材料,可使用传统植物育种技术(例如回交)或通过遗传操纵技术(例如反义rna、干扰rna、大范围核酸酶等等)进行制备。进一步举例来说,可以通过第一植物或植物细胞基因渗入第二植物或植物细胞(其自身可以是天然存在的)内,或通过将一个或多个基因突变(例如一种或多种多态性)从第一植物或植物细胞转移到第二植物或植物细胞内来制备非天然存在的植物、非天然存在的植物细胞或非天然存在的植物材料,使得所得到的植物、植物细胞或植物材料或其后代包括并非天然形成或在自然界中不存在的基因组成(例如基因组、染色体或其区段)。所得到的植物、植物细胞或植物材料因此是人工的或非天然存在的。相应地,可以通过修饰第一天然存在的植物或植物细胞中的基因序列来制备人工的或非天然存在的植物或植物细胞,即使所得到的基因序列在第二植物或植物细胞中天然存在,所述第二植物或植物细胞包括与第一植物或植物细胞不同的基因背景。在某些实施方案中,突变不是天然存在于多核苷酸或多肽(诸如基因或多肽)中的天然发生的突变。遗传背景的差异可以通过表型差异或通过本领域已知的分子生物学技术来检测,这些分子生物学技术诸如多核苷酸测序、是否存在遗传标记(例如,微卫星rna标记)。

“寡核苷酸”或“多核苷酸”是指共价连接在一起的至少两个核苷酸。单链的描述还定义互补链的序列。因此,多核苷酸也涵盖所描绘的单链的互补链。多核苷酸的许多变体可以用于与给定多核苷酸相同的目的。因此,多核苷酸也涵盖基本上相同的多核苷酸及其互补物。单链提供可以在严格杂交条件下与给定序列杂交的探针。因此,多核苷酸也涵盖在严格杂交条件下杂交的探针。多核苷酸可以是单链或双链的,或者可以包含双链和单链序列的部分。多核苷酸可以是dna(基因组dna和cdna两者)、rna或杂交体,其中多核苷酸可以包含脱氧核糖核苷酸和核糖核苷酸的组合,以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤的碱基的组合。多核苷酸可以通过化学合成方法或通过重组方法获得。

单链dna杂交互补片段的特异性由反应条件的“严格性”决定(sambrook等人,molecularcloningandlaboratorymanual,第二版,coldspringharbor(1989))。杂交严格度随着形成dna双螺旋体的倾向降低而增加。在多核苷酸杂交反应中,可以选择严格性以有利于特异性杂交(高严格性),所述特异性杂交可用于例如从文库中鉴定全长克隆。低特异性交杂(低严格度)可用于鉴别相关但不精确(同源,但不相同)的dna分子或区段。dna双链体根据以下因素稳定:(1)互补碱基对的数目;(2)碱基对的类型;(3)反应混合物的盐浓度(离子强度);(4)反应温度;和(5)存在某些有机溶剂,诸如甲酰胺,其降低dna双链体稳定性。一般来说,探针越长,适当退火所需的温度越高。常见方法是改变温度;较高相对温度导致较严格的反应条件。在“严格条件”下杂交描述了杂交方案,其中彼此至少60%同源的多核苷酸保持杂交。一般来说,选择严格条件比规定的离子强度和ph值下的特异性序列的热熔点(tm)低约5℃。tm是与给定序列互补的50%探针与给定序列在平衡下杂交的温度(在确定的离子强度、ph和多核苷酸浓度下)。由于给定序列通常过量存在,因此在tm下,50%的探针处于平衡状态。

“严格杂交条件”是使探针、引物或寡核苷酸仅与其特定序列杂交的条件。严格条件是序列依赖性的并且将不同。严格条件通常包括:(1)低离子强度和高温洗涤,例如15mm氯化钠、1.5mm柠檬酸钠、0.1%十二烷基硫酸钠,在50℃下;(2)杂交过程中的变性剂,例如,50%(v/v)甲酰胺,0.1%牛血清白蛋白,0.1%ficoll,0.1%聚乙烯吡咯烷酮,50mm磷酸钠缓冲液(750mm氯化钠,75mm柠檬酸钠,ph6.5),在42℃;或(3)50%甲酰胺。洗涤通常还包含42℃下的5xssc(0.75mnacl、75mm柠檬酸钠)、50mm磷酸钠(ph6.8)、0.1%焦磷酸钠、5x邓波特溶液(denhardt'ssolution)、超声处理的鲑鱼精子dna(50μg/ml)、0.1%sds以及10%硫酸葡聚糖,以及42℃下的0.2xssc(氯化钠/柠檬酸钠)中以及55℃下的50%甲酰胺中,随后由55℃下的含有edta的0.1xssc组成的高严格度洗涤。适当地,条件使得彼此至少约65%、70%、75%、85%、90%、95%、98%或99%同源的序列通常保持彼此杂交。

“中等严格条件”使用洗涤溶液和较不严格的杂交条件,使得多核苷酸将与多核苷酸的整体,片段、衍生物或类似物杂交。一个实例包含在55℃下在6xssc、5x邓波特溶液、0.5%sds以及100μg/ml变性鲑鱼精子dna中杂交,随后在37℃下在1xssc、0.1%sds中一次或多次洗涤。可以调整温度、离子强度等来适应实验因素,例如探针长度。其他中等严格条件已经进行了描述(参见ausubel等人,currentprotocolsinmolecularbiology,第1-3卷,johnwiley&sons,inc.,hoboken,n.j.(1993);kriegler,genetransferandexpression:alaboratorymanual,stocktonpress,newyork,n.y.(1990);perbal,apracticalguidetomolecularcloning,第2版,johnwiley&sons,newyork,n.y.(1988))。

“低严格条件”使用洗涤溶液和不如中等严格性的较不严格的杂交条件,使得多核苷酸将与多核苷酸的整体,片段、衍生物或类似物杂交。低严格性杂交条件的非限制性实例包括在35%甲酰胺、5xssc、50mmtrishcl(ph7.5)、5mmedta、0.02%pvp、0.02%ficoll、0.2%bsa、100μg/ml变性鲑鱼精子dna、10%(重量/体积)硫酸葡聚糖在40℃下杂交,然后在2xssc、25mmtrishcl(ph7.4)、5mmedta和0.1%sds中在50℃下洗涤一次或多次。低严格性的其他条件(诸如跨物种杂交的条件)已进行了充分描述(参见ausubel等人,1993;kriegler,1990)。

“可操作地连接”是指基因的表达处于与其空间连接的启动子的控制之下。启动子在其控制下可以位于基因的5'(上游)或3'(下游)。启动子和基因之间的距离可以与启动子和产生启动子的基因中其控制的基因之间的距离大致相同。如所属领域中已知,可以调节这一距离的变化而不损失启动子功能。“可操作地连接”是指多核苷酸片段在单个片段中的缔合,从而一个片段的功能由另一个片段调节。例如,当启动子能够调节多核苷酸片段的转录时,其可操作地与该多核苷酸片段连接。

术语“植物”指处于其生命周期或发育的任何阶段的任何植物及其后代。在一个实施方案中,植物是烟草植物,它指的是属于烟草属的植物。该术语包括提及的完整植物、植物器官、植物组织、植物繁殖体、植物种子、植物细胞及其后代。植物细胞包括(但不限于)来自种子、悬浮培养物、胚芽、分生组织区域、愈伤组织、叶子、根、嫩枝、配子体、孢子体、花粉以及花粉粒的细胞。本文描述了烟草植物的合适的种类、栽培种、杂种和品种。

“多核苷酸”、“多核苷酸序列”或“多核苷酸片段”在本文中可互换使用,并且是指单链或双链的rna或dna的聚合物,任选地包含合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以其5'单磷酸酯形式存在)由其如下的单字母名称指代:"a"针对腺苷酸或脱氧腺苷酸(分别针对rna或dna),"c"针对胞苷酸或脱氧胞苷酸,"g"针对鸟苷酸或脱氧鸟苷酸,"u"针对尿苷酸,"t"针对脱氧胸苷酸,"r"针对嘌呤(a或g),"y"针对嘧啶(c或t),"k"针对g或t,"h"针对a或c或t,"i"针对肌苷并且"n"针对任何核苷酸。多核苷酸可以是(但不限于)基因组dna、互补dna(cdna)、mrna或反义rna或其片段。此外,多核苷酸可以是单链或双链的、单链和双链区的混合物、包括dna和rna的杂交分子或具有单链和双链区的混合物的杂交分子或其片段。另外,多核苷酸可以由包括dna、rna或两者的三链区或者其片段构成。多核苷酸可以含有一个或多个经修饰的碱基,例如硫代磷酸酯,并且可以是肽核酸(pna)。一般来说,多核苷酸可以由分离的或克隆的cdna片段、基因组dna、寡核苷酸或个别核苷酸或前述的组合组装。尽管本文描述的多核苷酸显示为dna序列,但是多核苷酸包括其相应的rna序列以及它们的互补(例如,完全互补)的dna或rna序列,包括其反向互补物。本公开的多核苷酸在所附序列表中列出。

“多肽”或“多肽序列”是指其中一种或多种氨基酸残基是对应的天然存在的氨基酸的人工化学类似物的氨基酸的聚合物,以及天然存在的氨基酸的聚合物。该术语还包括修饰,包括但不限于糖基化、脂质附着、硫酸化、谷氨酸残基的γ-羧化、羟基化和adp-核糖基化。本公开的多肽在所附序列表中列出。

“启动子”是指能够赋予、激活或增强细胞中多核苷酸的表达的合成或天然来源的分子。该术语是指通常位于双链多核苷酸片段的上游并与其可操作地连接的多核苷酸元件/序列。启动子可以完全源自邻近感兴趣的天然基因的区域,或者可以由来源于不同天然启动子或合成多核苷酸片段的不同元件组成。启动子可以包含一个或多个特异性转录调节序列以进一步提高表达和/或改变其的空间表达和/或暂时表达。启动子还可以包含末端强化子或抑制子元件,其可位于来自转录起始位点的多达几千个碱基对。启动子可以来源于包括病毒、细菌、真菌、植物、昆虫以及动物的源。启动子可以关于发生表达的细胞、组织或器官或关于发生表达的发育阶段,或回应于外部刺激(例如生理学压力、病原体、金属离子或诱发剂)组成性或有差异地调节基因组分的表达。

如本文可互换使用的“组织特异性启动子”和“组织优选启动子”指的是主要但并非必须专门在一种组织或器官中表达,而是还可以在一种特异性细胞中表达的启动子。“发育调节型启动子”是指其功能由发育事件决定的启动子。“组成型启动子”是指引起基因在大多数时间在大多数细胞类型中表达的启动子。响应于内源或外源刺激的存在,例如通过化合物(化学诱导剂)或响应于环境、激素、化学和/或发育信号,“诱导型启动子”选择性表达可操作连接的dna序列。诱导型或调节型启动子的实例包括由光、热、压力、洪水或干旱、病原体、植物激素、创伤或化学药品诸如乙醇、茉莉酮酸酯、水杨酸或安全剂调节的启动子。

如本文所用,“重组”是指两个另外分离的序列片段的人工组合,诸如通过化学合成或通过基因工程技术操作分离的多核苷酸片段。该术语还包括提及的已通过引入异源多核苷酸而被修饰的细胞或载体或来源于如此修饰的细胞的细胞,但不涵盖由于天然发生的事件(例如,自发突变、天然转化或转导或转座)诸如在没有人为干预的情况下发生的事件对细胞或载体的改变。

“重组构建体”是指自然界中通常不被一起发现的多核苷酸的组合。因此,重组构建体可包含来源于不同来源的调节序列和编码序列,或来源于相同来源但以不同于自然界通常发现的方式排列的调节序列和编码序列。重组构建体可以是重组dna构建体。

本文可互换使用的“调节序列”和“调节元件”是指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并且影响相关编码序列的转录、rna加工或稳定性或翻译的多核苷酸序列。调节序列包括启动子、翻译前导序列、内含子和多腺苷酸化识别序列。术语“调节序列”和“调节元件”在本文中可以互换使用。

“位点特异性核酸酶”是指能够特异性识别和切割dna序列的酶。定点核酸酶可以经工程改造。工程改造的定点核酸酶的实例包括锌指核酸酶(zfn)、tal效应子核酸酶(talen)、crispr/cas9类系统以及大范围核酸酶。

术语“烟草”在总体意义上用于指烟草作物(例如,在田间生长的多种烟草植物而不是水培生长的烟草)、烟草植物及其部分,包括但不限于如本文所述制备和/或获得的根、茎、叶、花和种子。应当理解,“烟草”包括烟草植物及其产品。

术语“烟草产品”是指消费者烟草产品,包括但不限于吸烟材料(例如,香烟、雪茄和烟斗烟草)、鼻烟、嚼用烟草、口香糖和锭剂,以及用于制造消费者烟草产品的组分、材料和成分。合适地,这些烟草产品由从烟草收获的烟草的叶和茎制造,并根据烟草制备中的常规技术对其进行切割、干燥、干制和/或发酵。

“转录终止子”、“终止序列”或“终止子”是指位于编码序列下游的dna序列,包括聚腺苷酸化识别序列和编码能够影响mrna加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征为影响聚腺苷酸段向mrna前驱体的3'端的添加。

“转基因”是指任何细胞、细胞系、愈伤组织、植物部分或植物,其基因组由于异源多核苷酸诸如重组构建体的存在而被改变,包括那些初始转基因事件以及通过有性杂交或无性繁殖从初始转基因事件产生的那些。该术语不包括通过常规植物育种方法或通过天然发生的事件(诸如随机交叉受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)的基因组(染色体或染色体外)的改变。

“转基因植物”是指在其基因组内包含一种或多种异源多核苷酸的植物,即,含有通常在其中未发现的重组遗传物质并且已通过人工操作引入所述植物中(或引入植物的祖细胞中)的植物。例如,异源多核苷酸可以稳定地整合到基因组内,使得多核苷酸传递到连续的世代。异源多核苷酸可以单独或作为重组构建体的一部分整合到基因组中。基因改良胚质的商业开发还发展到向作物植物中引入多种特性的阶段,通常称为基因堆叠法。在这一方法中,可以向植物中引入赋予所关注的不同特征的多个基因。基因堆叠可以通过许多方式实现,包括(但不限于)共转型、重新转型以及用不同转基因品系交叉。因此,从通过转型引入重组dna的植物细胞生长的植物是转基因植物,全部是含有所以引入转基因的植物的子代(有性产生或无性产生)。应当理解,术语转基因植物包括整个植物或树木以及该植物或树木的部分,例如谷粒、种子、花、叶、根、果实、花粉、茎等。各异源多核苷酸可以赋予转基因植物不同性状。

“转录激活子样效应子”或“tale”是指识别并结合特定dna序列的多肽结构。“taledna结合域”指的是包括串联33-35个氨基酸重复的阵列的dna结合域,也称为rvd模块,其中每一个特异性地识别单个dna碱基对。rvd模块可以任何顺序安排来装配识别已确定序列的阵列。taledna结合域的结合特异性通过rvd阵列随后20个氨基酸的单个截短重复确定。taledna结合域可具有12到27个rvd模块,其中每一个含有rvd并且识别单个dna碱基对。特异性rvd已鉴别四个可能dna核苷酸(a、t、c和g)中每一个的识别。因为taledna结合域是模块,所以识别四个不同dna核苷酸的重复序列可以连接在一起来识别任何具体dna序列。这些靶向dna结合域又可与催化域组合形成功能性酶,包括人工转录因子、甲基转移酶、整合酶、核酸酶以及重组酶。

本文可互换使用的“转录激活子样效应子核酸酶”或“talen”是指核酸酶的催化结构域(例如核酸内切酶foki)和可靶向定制dna序列的设计的taledna结合结构域的工程化融合多肽。

“talen单体”是指具有催化核酸酶结构域和设计的taledna结合结构域的工程化融合多肽。两个talen单体可以设计成目标并且裂解talen目标区域。

“转基因”是指包含已从一种生物中分离并引入到不同生物中的基因序列的基因或遗传物质。这种dna的非天然片段可以保留在转基因生物中产生rna或多肽的能力,或者它可以改变转基因生物遗传密码的正常功能。转基因的引入具有改变生物体的表型的可能。

关于多核苷酸的“变体”是指:(i)多核苷酸的一部分或片段;(ii)多核苷酸或其部分的互补物;(iii)与目的多核苷酸或其互补物基本上相同的多核苷酸;或(iv)在严格条件下与目的多核苷酸、其互补物或与其基本上相同的多核苷酸杂交的多核苷酸。

关于肽或多肽的“变体”是指通过氨基酸的插入、缺失或保守取代而在序列上不同但保留至少一种生物学功能或活性的肽或多肽。变体也可以指保留至少一种生物学功能或活性的多肽。氨基酸的保守取代,即,用性质(例如,亲水性、带电区域的程度和分布)相似的不同氨基酸取代氨基酸,在本领域中被认为通常涉及微小变化。

术语“品种”指共享恒定特征的植物群体,所述恒定特征使其与相同物种的其他植物分开。尽管具有一种或多种独特性状,但品种的特征进一步在于所述品种内个体之间的极小整体变化。品种通常在市场上有出售。

“载体”指包含用于使得能够转运多核苷酸的多核苷酸组分、多核苷酸构建体和多核苷酸缀合物等的组合的多核苷酸媒介物。载体可以是病毒载体、细菌噬菌体、细菌人工染色体或酵母人工染色体。载体可以是dna或rna载体。合适的载体包括能够进行染色体外复制的附加体,例如环状双链核苷酸质粒;线性化的双链核苷酸质粒;以及任何来源的其他媒介。如本文所用,“表达载体”是包含用于使得能够表达多核苷酸的多核苷酸组分、多核苷酸构建体和多核苷酸缀合物等的组合的多核苷酸媒介物。合适的表达载体包括能够进行染色体外复制的附加体,例如环状双链核苷酸质粒;线性化的双链核苷酸质粒;以及任何来源的其他功能等效的表达载体。表达载体包含位于多核苷酸、多核苷酸构建体或多核苷酸缀合物的上游并与其可操作地连接的至少一个启动子,如下文所定义。

“锌指”是指识别并结合dna序列的多肽结构。锌指结构域是人类蛋白质组中最常见的dna结合基元。单个锌指含有约30个氨基酸并且结构域通常通过结合3个连续dna碱基对通过每个碱基对单个氨基酸侧链的相互作用起作用。

“锌指核酸酶”或“zfn”是指嵌合多肽分子,其包含至少一个锌指dna结合结构域,所述至少一个锌指dna结合结构域有效地连接到至少一种核酸酶或核酸酶的一部分,当完全组装时,所述核酸酶或核酸酶的一部分能够切割dna。

除非本文另外定义,否则结合本发明使用的科学与技术术语将具有所属领域普通技术人员通常所理解的含义。例如,本文所述的与细胞和组织培养、分子生物学、免疫学、微生物学、遗传学以及多肽和多核苷酸化学和杂交有关使用的任何命名和技术是本领域熟知和常用的那些。术语的含义和范围应该明确;然而在具有任何潜在不明确性的事件中,本文提供的定义优先于任何词典或外来定义。另外,除非上下文另外需要,否则单数术语应包括复数并且复数术语应包括单数。

2.多核苷酸

在一个实施方案中,提供了一种经分离的多核苷酸,其包含与本文所述的任何序列具有至少60%的序列同一性的序列,由其组成或基本上由其组成,所述序列包括序列表中所示的任何多核苷酸。适当地,经分离的多核苷酸包含序列、由序列组成或基本上由序列组成,所述序列与其具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。

合适地,本文所述的多核苷酸编码具有序列表中所示多肽的至少约50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%或更多的功能或活性的活性多肽。

在另一个实施方案中,提供了一种经分离的多核苷酸,其包含与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23或与seqidno:5、seqidno:9、seqidno:11或seqidno:13具有至少60%的序列同一性的多核苷酸,由其组成或基本上由其组成。

合适地,经分离的多核苷酸包含与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23或与seqidno:5、seqidno:9、seqidno:11或seqidno:13具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

合适地,经分离的多核苷酸包含与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23或与seqidno:5、seqidno:9、seqidno:11或seqidno:13具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

合适地,经分离的多核苷酸包含与seqidno:5、seqidno:7、seqidno:13或seqidno:15具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

合适地,经分离的多核苷酸包含与seqidno:1、seqidno:3、seqidno:9、seqidno:11、seqidno:17、seqidno:19、seqidno:21或seqidno:23具有至少约95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了多核苷酸,其包含与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23或与seqidno:5、seqidno:9、seqidno:11或seqidno:13具有很大同源性(即,序列相似性)或很大同一性的多核苷酸,由其组成或基本上由其组成。

在另一个实施方案中,提供了与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23具有很大同源性(即,序列相似性)或很大同一性的片段,所述片段与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23的对应片段具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性。

在另一个实施方案中,提供了与seqidno:5、seqidno:9、seqidno:11或seqidno:13具有很大同源性(即,序列相似性)或很大同一性的片段,所述片段与seqidno:5、seqidno:9、seqidno:11或seqidno:13的对应片段具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性。

在另一个实施方案中,提供了包含与seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23或与seqidno:5、seqidno:9、seqidno:11或seqidno:13具有足够程度或很大程度的同一性或相似性的多核苷酸,其编码充当sus的多肽。

在另一个实施方案中,提供了一种多核苷酸的聚合物,其包含在本文中命名为seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23或与seqidno:5、seqidno:9、seqidno:11或seqidno:13的多核苷酸,由其组成或基本上由其组成。

合适地,本文所述的多核苷酸编码sus家族的成员。

如本文所描述的多核苷酸可以包含核苷酸聚合物,其可以是未经修饰或经修饰的脱氧核糖核酸(dna)或核糖核酸(rna)。因此,多核苷酸可以是(但不限于)基因组dna、互补dna(cdna)、mrna或反义rna或其片段。此外,多核苷酸可以是单链或双链dna、单链和双链区混合的dna、包括dna和rna的杂交分子或具有单链和双链区的混合物的杂交分子或其片段。另外,多核苷酸可以由包括dna、rna或两者的三链区或者其片段构成。多核苷酸可以含有一个或多个经修饰的碱基,如硫代磷酸酯,并且可以是肽核酸。一般来说,多核苷酸可以由分离的或克隆的cdna片段、基因组dna、寡核苷酸或个别核苷酸或前述的组合组装。尽管本文描述的多核苷酸显示为dna序列,但是它们包括其相应的rna序列以及它们的互补(例如,完全互补)的dna或rna序列,包括其反向互补物。

如本文中所描述的多核苷酸一般将会含有磷酸二酯键,尽管在一些情况下,包含多核苷酸类似物,其可能具有替代主链,包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或o-甲基亚磷酰胺键;以及肽多核苷酸主链和键。其他类似多核苷酸包含具有阳性主链;非离子主链和非核糖主链的多核苷酸。核糖-磷酸主链的修饰可以出于多种原因而完成,例如增加此类分子在生理环境中的稳定性和半衰期,或作为生物芯片上的探针。可以制备天然存在的多核苷酸和类似物的混合物;或者,可以制备不同多核苷酸类似物的混合物,以及天然存在的多核苷酸和类似物的混合物。

多种多核苷酸类似物是已知的,包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯、o-甲基亚磷酰胺键以及肽多核苷酸主链和键。其他类似多核苷酸包含具有阳性主链、非离子主链和非核糖主链的多核苷酸。还包含含有一种或多种碳环糖的多核苷酸。

其他类似物包含作为肽多核苷酸类似物的肽多核苷酸。这些主链在中性条件下是基本上非离子的,与天然存在的多核苷酸的高度荷电的磷酸二酯主链形成对比。这可以产生优势。首先,肽多核苷酸主链可以显示出改善的杂交动力学。对于错配碱基对相对于完全匹配的碱基对,肽多核苷酸在解链温度方面具有更大变化。对于内部错配,dna和rna通常显示出解链温度的2-4℃下降。在非离子肽多核苷酸主链的情况下,下降接近于7-9℃。类似地,由于其非离子性质,连接至这些主链的碱基的杂交对盐浓度相对不敏感。另外,肽多核苷酸可以不被细胞酶降解或更少程度地被细胞酶降解,并且因此可以是更稳定的。

在所公开的多核苷酸及其片段的用途中,有片段在杂交测定中作为探针的用途或在扩增测定中作为引物的用途。这类片段一般包括dna序列的至少约10、11、12、13、14、15、16、17、18、19或20个或更多个邻接核苷酸。在其他实施方案中,dna片段包括dna序列的至少约10、15、20、30、40、50或60个或更多个邻接核苷酸。因此,在一个方面,还提供了一种用于检测多核苷酸的方法,该方法包括使用探针或引物或两者。示例性引物在本文中描述。

影响杂交条件选择的基本参数和设计合适条件的指导由sambrook,j.,e.f.fritsch和t.maniatis(1989,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,coldspringharbor,n.y.)描述。使用遗传密码的知识与本文所述的多肽序列结合,可以制备简并寡核苷酸组。这类寡核苷酸可用作例如聚合酶链反应(pcr)中的引物,由此分离且扩增dna片段。在某些实施方案中,简并引物可以用作基因文库的探针。这样的文库包括cdna文库、基因组文库,以及甚至电子表达序列标签或dna文库。通过这种方法鉴定的同源序列随后用作探针,以鉴定本文中鉴定的序列的同源物。

如本文所述,在降低的严格条件(通常是中等严格条件)和通常高度严格条件下与多核苷酸杂交的多核苷酸和寡核苷酸(例如,引物或探针)也是潜在的用途。影响杂交条件选择的基本参数和设计合适条件的指导由sambrook,j.,e.f.fritsch和t.maniatis(1989,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,coldspringharbor,n.y.阐述,并且可基于例如多核苷酸的长度或碱基组成,由本领域普通技术人员容易地确定。

本文定义了达到中等和高度严格条件的一种方法。应理解,通过应用控制杂交反应和双链体稳定性的基本原则,可以根据需要调整洗涤温度和洗涤盐浓度,以实现所需严格性程度,如本领域技术人员已知的和下文进一步描述的(参见例如,sambrook,j.,e.f.fritsch和t.maniatis(1989,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,coldspringharbor,n.y)。当将多核苷酸与未知序列的多核苷酸杂交时,杂交长度被假定为杂交多核苷酸的长度。当杂交已知序列的多核苷酸时,可以通过比对多核苷酸的序列并且鉴定一个或多个最佳序列互补性区域来确定杂交物长度。预期到长度小于50个碱基对的杂交物的杂交温度应比杂交物的解链温度低5至10℃,其中解链温度根据下述等式确定。对于长度小于18个碱基对的杂交物,解链温度(℃)=2(a+t碱基数目)+4(g+c碱基数目)。对于长度超过18个碱基对的杂交物,解链温度(℃)=81.5+16.6(log10[na+])+0.41(%g+c)-(600/n),其中n是杂交物中的碱基数目,并且[na+]是杂交缓冲液中的钠离子浓度(1×标准柠檬酸钠的[na+]=0.165m)。通常,每种这类杂交多核苷酸的长度是与它杂交的多核苷酸的长度的至少25%(通常至少50%、60%或70%,并且最常至少80%),并且同与它杂交的多核苷酸具有至少60%序列一致性(例如至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)。

如本领域技术人员应理解,线性dna具有两个可能定向:5'-至-3'方向和3'-至-5'方向。例如,如果第一序列以5'-至-3'方向定位,并且如果第二序列以5'-至-3'方向定位在相同多核苷酸分子/链内,则第一序列和第二序列以相同方向定向,或具有相同定向。通常,启动子序列和处于给定启动子调节下的目的基因以相同定向放置。然而,对于以5'-至-3'方向定位的第一序列,如果第二序列以3'-至-5'方向定位在相同多核苷酸分子/链内,则第一序列和第二序列以反义方向定向,或具有反义定向。如果第一序列(5'-至-3'方向)和第一序列(以5'-至-3'定位的第一序列)的反向互补序列定位在相的多核苷酸分子/链内,则相对于彼此具有反义定向的两个序列可以替代地描述为具有相同定向。本文所示的序列以5'-至-3'方向显示。

ntsus1-s、ntsus1-t、ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个可包括至少一种修饰(例如,突变)。ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个可包括至少一种修饰(例如,突变)。

ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个不包括修饰(例如,突变)。

ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个不包括修饰(例如,突变)。

ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus2-t、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s中的一个或多个不包括修饰(例如,突变),并且ntsus6-t未被调节。

ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus2-t、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s中的一个或多个不包括修饰(例如,突变),并且ntsus6-t未被调节。

3.多肽

在另一方面,提供了一种经分离的多肽,其包含与本文所述的任何多肽具有至少60%的序列同一性的多肽,由其组成或基本上由其组成,所述多肽包括序列表中所示的任何多肽。适当地,经分离的多肽包含序列、由序列组成或基本上由序列组成,所述序列具有与其的至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性。

在一个实施方案中,提供了一种多肽,其包含与seqidno:2或seqidno:4具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:2具有至少94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:4具有至少93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在一个实施方案中,提供了一种多肽,其包含与seqidno:6或seqidno:8具有至少80%、81%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:6具有至少95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:8具有至少96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在一个实施方案中,提供了一种多肽,其包含与seqidno:10或seqidno:12具有至少74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:10或seqidno:12具有至少93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在一个实施方案中,提供了一种多肽,其包含与seqidno:14或seqidno:16具有至少76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:14具有至少95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:16具有至少96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在一个实施方案中,提供了一种多肽,其包含与seqidno:18或seqidno:20具有至少68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:18具有至少89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:20具有至少92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在一个实施方案中,提供了一种多肽,其包含与seqidno:22或seqidno:24具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:22具有至少93%、94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在另一个实施方案中,提供了一种多肽,其包含与seqidno:24具有至少94%、95%96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的序列同一性的序列,由其组成或基本上由其组成。

在一个实施方案中,提供了一种多肽,其由seqidno:1、seqidno:3、seqidno:5、seqidno:7、seqidno:9、seqidno:11、seqidno:13、seqidno:15、seqidno:17、seqidno:19、seqidno:21或seqidno:23;或seqidno:5、seqidno:9、seqidno:11或seqidno:13编码。

多肽可包含与seqidno:2、seqidno:4、seqidno:6、seqidno:8、seqidno:10、seqidno:12、seqidno:14、seqidno:16、seqidno:18、seqidno:20、seqidno:22或seqidno:24;或seqidno:6、seqidno:10、seqidno:12或seqidno:14具有足够程度或很大程度的同一性或相似性的序列,以用作sus。

多肽的片段通常保留全长序列的一些或全部功能或活性。

如本文所讨论的,多肽还包括通过引入任何类型的改变(例如,氨基酸的插入、缺失或取代;糖基化状态的改变;影响重折叠或异构化的改变、三维结构或自缔合状态)而产生的突变体,其可以被有意地工程化或天然地分离,条件是它们仍然具有其功能或活性中的一些或全部。合适地,该功能或活性被调节。

缺失是指从多肽中去除一种或多种氨基酸。插入指被引入多肽中的预定位点内的一个或多个氨基酸残基。插入可包含单个或多个氨基酸的序列内插入。置换指多肽的氨基酸由具有相似特性(例如相似疏水性、亲水性、抗原性、形成或破坏a-螺旋结构或β-片层结构的倾向)的其他氨基酸替换。氨基酸置换通常为单个残基,但可以是成簇的,取决于对多肽施加的功能制约,并且范围可为约1至约10个氨基酸。氨基酸置换优选是如下所述的保守氨基酸置换。氨基酸置换、缺失和/或插入可使用肽合成技术例如固相肽合成或通过重组dna操纵进行制备。用于操作dna序列以产生多肽的取代、插入或缺失变体的方法是本领域所熟知的。该变体可具有产生沉默变化并产生功能上等同的多肽的改变。可基于残基的极性、电荷、溶解性、疏水性、亲水性和两亲特性的相似性做出有意的氨基酸取代,只要该物质的次级结合得以保持即可。举例来说,带负电的氨基酸包含天冬氨酸和谷氨酸;带正电的氨基酸包含赖氨酸和精氨酸;并且具有相似亲水性值含不带电极性首基的氨基酸包含亮氨酸、异亮氨酸、缬氨酸、甘氨酸、丙氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。保守取代可以例如根据下表进行。第二列中的相同块和优选第三列中的相同行中的氨基酸可以彼此取代:

多肽可以是成熟多肽或不成熟多肽或来源于不成熟多肽的多肽。多肽可以采取线性形式或使用已知方法环化。多肽通常包含至少10、至少20、至少30或至少40个邻接氨基酸。

ntsus1-s、ntsus1-t、ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个可包括至少一种修饰(例如,突变)。

ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个不包括修饰(例如,突变)。

ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个不包括修饰(例如,突变)。

ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus2-t、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s中的一个或多个不包括修饰(例如,突变),并且ntsus6-t未被调节。

ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s中的一个或多个可包括至少一种修饰(例如,突变),而ntsus1-s、ntsus1-t、ntsus2-t、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s中的一个或多个不包括修饰(例如,突变),并且ntsus6-t未被调节。

修饰植物

a.转化

重组构建体可用于转化植物或植物细胞,以调节多肽表达、功能或活性。重组多核苷酸构建体可以包括编码如本文所述的一种或多种多核苷酸的多核苷酸,所述一种或多种多核苷酸可操作地连接于适合表达多肽的调节区。因此,多核苷酸可以包括编码如本文所述的多肽的编码序列。调节了多肽表达、功能或活性的植物或植物细胞可以包括突变的、非天然存在的、转基因的、人造的或基因工程的植物或植物细胞。适当地,转基因植物或植物细胞包括已通过重组dna的稳定整合而改变的基因组。重组dna包含已在细胞外部经基因工程改造和构建的dna,并且包含含有天然存在的dna或cdna或合成dna的dna。转基因植物可包括由最初转化的植物细胞再生的植物,以及来自经转化的植物的以后世代或杂交的后代转基因植物。合适地,与对照植物相比,转基因修饰改变了本文所述的多核苷酸或多肽的表达、功能或活性。

由重组多核苷酸编码的多肽可以是天然多肽,或对于细胞可以是异源的。在一些情况下,重组构建体含有可操作地连接于调节区的调节表达的多核苷酸。在本文中描述了合适调节区的实例。

还提供含有重组多核苷酸构建体的载体,如本文中所描述的那些。合适的载体主链包含例如本领域常规使用的载体主链,如质粒、病毒、人工染色体、细菌人工染色体、酵母人工染色体或噬菌体人工染色体。合适的表达载体包含但不限于源自例如噬菌体、杆状病毒和逆转录病毒的质粒和病毒载体。众多载体和表达系统是商购可得的。

载体可以包含例如复制起点、支架附着区域或标记。标记基因可以赋予植物细胞可选择表型。举例来说,标记可以赋予杀生物剂抗性,如对抗生素(例如卡那霉素(kanamycin)、g418、博来霉素(bleomycin)或潮霉素(hygromycin))或除草剂(例如草甘膦(glyphosate)、氯磺隆(chlorsulfuron)或草胺膦(phosphinothricin))的抗性。另外,表达载体可以包含设计为促进所表达多肽的操纵或检测(例如纯化或定位)的标签序列。标签序列,诸如荧光素酶、β-葡糖醛酸酶、绿色荧光多肽、谷胱甘肽s-转移酶、聚组氨酸、c-myc或血凝素序列通常表达为与所编码的多肽的融合体。这类标签可以插入多肽内的任何地方,包括在羧基或氨基末端处。

植物或植物细胞可以通过使重组多核苷酸整合到其基因组来进行转化,以变得稳定转化。本文中所描述的植物或植物细胞可以是稳定转化的。稳定转化的细胞在每次细胞分裂中通常保留引入的多核苷酸。植物或植物细胞可以进行瞬时转化,使得重组多核苷酸不整合到其基因组内。瞬时转化的细胞在每次细胞分裂中通常失去引入的重组多核苷酸的全部或一部分,使得在足够数目的细胞分裂后,引入的重组多核苷酸无法在子细胞中检测到。

本领域中的许多方法可用于转化植物细胞,包括生物射弹、基因枪技术、农杆菌介导的转化、病毒载体介导的转化、冻融法、微粒轰击、直接dna摄取、超声处理、显微注射、植物病毒介导的转移和电穿孔。用于将外源dna整合到植物染色体内的农杆菌属系统已被广泛研究、修改和开发用于植物基因工程改造。通过常规方法将裸重组dna分子与适当的t-dna序列连接,所述裸重组dna分子包含以有义或反义方向与调节序列可操作地连接的对应于主题纯化多肽的dna序列。通过聚乙二醇技术或电穿孔技术将这些引入原生质体内,所述两种技术都是标准的。替代地,将包含编码本发明纯化多肽的重组dna分子的此类载体引入活农杆菌细胞,然后将其转移到植物细胞中。通过裸dna而无伴随t-dna载体序列的转化可以经由原生质体与含dna脂质体的融合或经由电穿孔来完成。不伴随t-dna载体序列的裸dna也可以用于经由惰性、高速度微弹转化细胞。

如果细胞或培养的组织用作转化的受体组织,那么需要时,通过本领域技术人员已知的技术,可以由经转化的培养物再生植物。

有待包含在重组构建体中的调节区的选择取决于几个因素,包含但不限于效率、可选择性、可诱导性、所需表达水平和细胞或组织优先表达。通过适当选择调节区且相对于编码序列放置调节区,调节编码序列的表达对于本领域技术人员是常规工作。多核苷酸的转录可以相似方式进行调节。一些合适的调节区仅或占优势地在某些细胞类型中起始转录。用于鉴定且表征植物基因组dna中的调节区的方法是本领域已知的。

合适的启动子包括由组织特异性因子识别的组织特异性启动子,所述组织特异性启动子存在于不同组织或细胞类型中(例如根特异性启动子、枝条特异性启动子、木质部特异性启动子),或存在于不同发育阶段期间,或响应不同环境条件存在。合适的启动子包括组成型启动子,其可在大多数细胞类型中活化,而无需特异性诱导剂。用于控制rnai多肽生产的合适启动子的例子包括花椰菜花叶病毒35s(camv/35s)、ssu、ocs、lib4、usp、stls1、b33、nos或遍在蛋白或菜豆球蛋白启动子。本领域技术人员能够产生重组启动子的多种变体。

组织特异性启动子是仅在植物发育期间的特定时间,在特定细胞或组织中(如在营养组织或生殖组织中)活跃的转录控制元件。例如,当多核苷酸在某些组织中的表达是优选的时,组织特异性表达可以是有利的。在发育控制下的组织特异性启动子的实例包括可仅(或主要仅)在某些组织中起始转录的启动子,所述组织诸如营养组织(例如根或叶)或生殖组织(诸如果实、胚珠、种子、花粉、雌蕊、花或任何胚胎组织)。生殖组织特异性启动子可以是例如花药特异性、胚珠特异性、胚特异性、胚乳特异性、珠被特异性、种子和种皮特异性、花粉特异性、花瓣特异性、萼片特异性或其组合。

合适的叶特异性启动子包括来自c4植物(玉蜀黍)的丙酮酸正磷酸双激酶(ppdk)启动子、来自玉蜀黍的cab-m1ca+2启动子、拟南芥(arabidopsisthaliana)myb相关基因启动子(atmyb5)、二磷酸核酮糖羧化酶(rbcs)启动子(例如,在叶和光生长幼苗中表达的番茄rbcs1、rbcs2和rbcs3a基因,在发育中的番茄果实中表达的rbcs1和rbcs2,或几乎专一地以高水平在叶片和叶鞘的叶肉细胞中表达的二磷酸核酮糖羧化酶启动子)。

合适的衰老特异性启动子包含在果实催熟、叶枯萎和脱落期间活跃的番茄启动子、编码半胱氨酸蛋白酶的基因的玉蜀黍启动子、82e4的启动子和sag基因的启动子。可使用合适的花药特异性启动子。可选择本领域技术人员已知的合适的根优先启动子。合适的种子优选的启动子包括种子特异性启动子(在种子发育期间有活性的那些启动子,诸如种子储存多肽的启动子)和种子发芽启动子(在种子发芽期间有活性的那些启动子)。这种种子优选的启动子包括cim1(细胞分裂素诱导的信使);cz19b1(玉米19kda玉米醇溶蛋白);milps(肌醇-1-磷酸合酶);mze40-2,也称为zm-40;nuclc;以及cela(纤维素合酶)。γ-玉米醇溶蛋白是胚乳特异性启动子。glob-1是胚特异性启动子。对于双子叶植物,种子特异性启动子包括豆β-菜豆蛋白、油菜籽蛋白、-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物,种子特异性启动子包括玉米15kda玉米醇溶蛋白启动子、22kda玉米醇溶蛋白启动子、27kda玉米醇溶蛋白启动子、g-玉米醇溶蛋白启动子、27kdaγ-玉米醇溶蛋白启动子(诸如gzw64a启动子,参见genbank登录号s78780)、waxy启动子、shrunken1启动子、shrunken2启动子、球蛋白1启动子(参见genbank登录号l22344)、itp2启动子、cim1启动子、玉米end1和end2启动子、nuc1启动子、zm40启动子、eep1和eep2;lec1、硫氧还蛋白h启动子;mlip15启动子、pcna2启动子;以及shrunken-2启动子。

诱导型启动子的实例包含响应病原体攻击、厌氧条件、高温、光、干旱、寒冷温度或高盐浓度的启动子。病原体诱导型启动子包括来自与发病机理相关的多肽(pr多肽)的启动子,这些启动子在病原体(例如,pr多肽、sar多肽、β-1,3-葡聚糖酶、几丁质酶)感染后被诱导。

除植物启动子之外,其他合适的启动子可以来源于细菌来源,例如,章鱼碱合酶启动子、胭脂碱合酶启动子,并且其他启动子来源于ti质粒,或者可以来源于病毒启动子(例如,花椰菜花叶病毒(camv)的35s和19srna启动子、烟草花叶病毒的组成型启动子、花椰菜花叶病毒(camv)19s和35s启动子或玄参花叶病毒35s启动子)。

将多核苷酸引入植物细胞并随后插入植物基因组的合适方法包括显微注射(biotechniques(1986)4:320-334)、电穿孔(proc.natl.acad.sci.usa(1986)83:5602-5606)、农杆菌(agrobacterium)介导的转化(us5,981,840和us5,563,055)、直接基因转移(emboj.(1984)3:2717-2722)和弹道粒子加速(us4,945,050、us5,879,918、us5,886,244、us5,932,782;plantcell,tissue,andorganculture:fundamentalmethods,编辑gamborg和phillips(springer-verlag,berlin)(1995);以及biotechnology(1988)6:923-926)。

b.突变

公开了包含本文所述的一种或多种多核苷酸或多肽中的突变的植物或植物细胞,其中所述突变导致调节的ntsus或由其编码的多肽的功能或活性。

提供了一种用于调节(干制)植物或(干制)植物材料中的ntsus多肽的水平的方法,所述方法包括将调节至少一种ntsus基因的表达的一个或多个突变引入所述植物的基因组中,其中所述至少一种基因选自根据本公开的序列。

还提供了一种用于鉴定具有调节的还原糖水平的植物的方法,所述方法包括对于根据本公开的序列中一个或多个突变的存在筛选来自目的植物的多核苷酸样品,并且任选地将所鉴定的突变与已知调节水平的还原糖的突变相关联。

还公开了对于根据本公开的ntsus基因中的一个或多个突变是杂合的或纯合的植物或植物细胞,其中所述突变导致基因的表达或由其编码的ntsus多肽的功能或活性的调节。

大量方法可用于组合一种植物中的突变,包含有性杂交。在根据本公开内容的基因中具有一个或多个有利的杂合或纯合突变(其调节基因的表达或由其编码的多肽的功能或活性)的植物可以与在一个或多个其他基因中具有一个或多个有利的杂合或纯合突变(其调节基因的表达或由其编码的多肽的功能或活性)的植物杂交。在一个实施方案中,进行杂交以在同一植物内在根据本公开的基因内引入一个或多个有利的杂合或纯合突变。

如果植物中本公开的一种或多种多肽的功能或活性低于或高于植物中相同多肽的功能或活性,则功能或活性增加或降低,所述植物未被修饰以抑制所述多肽的功能或活性并且已经使用相同方案培养、收获和干制。

在一些实施方案中,使用诱变方法将突变引入植物或植物细胞中,并且使用本领域技术人员已知的方法诸如southern印迹分析、dna测序、pcr分析或表型分析来鉴定或选择引入的突变。可以使用本领域众所周知的方法来确定影响基因表达或干扰所编码的多肽的功能的突变。基因外显子中的插入突变通常导致空突变。保守残基中的突变在抑制编码的多肽的代谢功能方面可以特别有效。例如,应当理解,一个或多个高度保守区域中的突变可能改变多肽功能,而那些高度保守区域之外的突变可能对多肽功能有很小影响或没有影响。此外,单个核苷酸中的突变可产生终止密码子,这将导致截短的多肽,并且取决于截短的程度,丧失功能。

还公开了用于获得突变型多核苷酸和多肽的方法。任何目的植物,包含植物细胞或植物材料,可以通过多种已知诱导诱变的方法进行遗传修饰,所述方法包含定点诱变、寡核苷酸指导的诱变、化学诱导的诱变、辐射诱导的诱变、利用经修饰的碱基的诱变、利用缺口双链体dna的诱变、双链断裂诱变、利用修复缺陷型宿主株的诱变、通过全基因合成的诱变、dna改组和其他等效方法。

还公开了多核苷酸和多肽的片段。多核苷酸的片段可以编码保留天然多肽的生物学功能并因此参与植物中代谢物转运网络的多肽片段。替代地,用作杂交探针或pcr引物的多核苷酸片段通常不编码保留生物学功能的片段多肽。此外,所公开的多核苷酸的片段包括可以在本文所讨论的重组构建体中组装的那些。多核苷酸的片段的范围可以是至少约25个核苷酸、约50个核苷酸、约75个核苷酸、约100个核苷酸、约150个核苷酸、约200个核苷酸、约250个核苷酸、约300个核苷酸、约400个核苷酸、约500个核苷酸、约600个核苷酸、约700个核苷酸、约800个核苷酸、约900个核苷酸、约1000个核苷酸、约1100个核苷酸、约1200个核苷酸、约1300个核苷酸或约1400个核苷酸,并且至多编码本文所述多肽的全长多核苷酸。多肽的片段的范围可以是至少约25个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸,并且至多本文所述的全长多肽。突变型多肽变体可以用于制备包括一种或多种突变型多肽变体的突变型、非天然存在的或转基因植物(例如,突变型、非天然存在的、转基因、人造或基因工程改造的植物)。合适地,突变多肽变体保留了未突变多肽的功能。突变多肽变体的功能可以更高、更低或与未突变多肽大约相同。

本文所述的多核苷酸和多肽中的突变可包括人为突变或合成突变或基因工程突变。本文所述的多核苷酸和多肽中的突变可以是通过包括体外或体内操作步骤的过程获得或可获得的突变。本文所述的多核苷酸和多肽中的突变可以是通过包括人为干预的过程获得或可获得的突变。

在多核苷酸中随机引入突变的方法可包括化学诱变和放射诱变。化学诱变涉及使用外源添加的化学物质(诸如诱变、致畸或致癌的有机化合物)来诱发突变。主要产生点突变和短缺失、插入、错义突变、简单序列重复、颠换和/或转换的诱变剂(包括化学诱变剂或辐射)可用于产生突变。诱变剂包括甲磺酸乙酯、甲磺酸甲酯、n-乙基-n-亚硝基脲、三乙基三聚氰胺、n-甲基-n-亚硝基脲、丙卡巴肼、苯丁酸氮芥、环磷酰胺、硫酸二乙酯、丙烯酰胺单体、美法仑、氮芥、长春新碱、二甲基亚硝胺、n-甲基-n'-硝基-亚硝基胍、亚硝基胍、2-氨基嘌呤、7,12-二甲基-苯并(a)蒽、环氧乙烷、六甲基磷酰胺、白消安(bisulfan)、二环氧烷烃(二环氧辛烷、二环氧丁烷等)、2-甲氧基-6-氯-9-[3-(乙基-2-氯-乙基)氨基丙基氨基]吖啶二盐酸盐和甲醛。

还设想了可能不是由诱变剂直接引起的基因座中的自发突变,只要它们产生所需表型。合适的诱变试剂还可以包含例如电离辐射,如x射线、γ射线、快中子照射和uv辐射。对于每种类型的植物组织,诱变化学物质或辐射的剂量通过实验确定,使得获得低于以致死性或繁殖不育为特征的阈值水平的突变频率。本领域技术人员已知的任何植物多核苷酸制备方法均可用于制备用于突变筛选的植物多核苷酸。

突变过程可包括一种或多种植物杂交步骤。

在突变后,可以执行筛选,以鉴定产生提前终止密码子或者无功能基因的突变。突变后,可以进行筛选以鉴定产生能够以增加或降低的水平表达的功能基因的突变。突变体的筛选可以通过测序或通过使用对该基因或多肽特异的一种或多种探针或引物来进行。还可在多核苷酸中产生特异性突变,其可导致调节的基因表达、调节的mrna稳定性或调节的多肽稳定性。这类植物在本文中被称为“非天然存在的”或“突变型”植物。通常,突变型或非天然存在的植物将包括在被操作之前在植物中不存在的外来或合成或人造核苷酸的至少一部分(例如,dna或rna)。外来核苷酸可以是单个核苷酸、两个或更多个核苷酸、两个或更多个连续核苷酸或两个或更多个非连续核苷酸,例如至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400或1500或更多个连续或非连续核苷酸。

c.转基因和基因编辑

除诱变之外,可调节由其编码的一种或多种ntsus多核苷酸或多肽的表达或功能或活性的组合物包括可干扰一个或多个内源基因的转录的序列特异性多核苷酸;可干扰rna转录物(例如,双链rna、sirna、核酶)的翻译的序列特异性多核苷酸;可干扰一种或多种多肽的稳定性的序列特异性多肽;可干扰一种或多种多肽的酶功能或一种或多种多肽相对于底物或调节多肽的结合功能的序列特异性多核苷酸;对一种或多种多肽表现出特异性的抗体;可干扰一种或多种多肽的稳定性或一种或多种多肽的酶功能或一种或多种多肽的结合功能的小分子化合物;结合一种或多种多核苷酸的锌指多肽;以及对一种或多种多核苷酸具有功能的大范围核酸酶。基因编辑技术、遗传编辑技术和基因组编辑技术是本领域众所周知的。

d.锌指核酸酶

锌指多肽可用于调节本文所述的一种或多种ntsus多核苷酸的表达或功能或活性。在多个实施方案中,通过锌指核酸酶介导的诱变修饰包括多核苷酸编码序列的一部分或全部的基因组dna序列。在基因组dna序列中搜索锌指多肽结合的独特位点。替代地,在基因组dna序列中搜索锌指多肽结合的两个独特位点,其中两个位点在相对的链上并靠近在一起,例如相隔1、2、3、4、5、6或更多个碱基对。因此,提供了结合多核苷酸的锌指多肽。

锌指多肽可被工程化以识别基因中的选定靶位点。锌指多肽可包含通过截短或扩展或定点诱变过程结合选择方法的来源于天然锌指dna结合结构域和非天然锌指dna结合结构域的基序的任何组合,所述选择方法诸如但不限于噬菌体展示选择、细菌双杂交选择或细菌单杂交选择。术语“非天然锌指dna结合结构域”是指结合多核苷酸靶内的三碱基对序列并且不存在于包含待修饰的多核苷酸的细胞或生物体中的锌指dna结合结构域。设计结合靶基因独特的特异性多核苷酸的锌指多肽的方法是本领域已知的。

在其他实施方案中,可以选择锌指多肽以结合多核苷酸的调节序列。更具体来说,调节序列可以包括转录起始位点、起始密码子、外显子区、外显子-内含子边界、终止子或终止密码子。相应地,本公开提供了在本文所述的一种或多种多核苷酸附近或其内通过锌指核酸酶介导的诱变产生的突变型、非天然存在的或转基因植物或植物细胞,以及通过锌指核酸酶介导的诱变用于制备这类植物或植物细胞的方法。用于将锌指多肽和锌指核酸酶递送到植物的方法与下文所述用于递送大范围核酸酶的方法相似。

e.大范围核酸酶

在另一方面,描述了使用大范围核酸酶如i-crei,用于产生突变型、非天然存在的或转基因或以其他方式遗传修饰的植物的方法。天然存在的大范围核酸酶以及重组大范围核酸酶可以用于特异性引起在植物基因组dna的单个位点或相对少数位点处的双链断裂,以允许破坏本文所述的一种或多种ntsus多核苷酸。大范围核酸酶可以是具有改变的dna识别特性的经工程改造的大范围核酸酶。大范围核酸酶多肽可以通过本领域已知的多种不同机制递送到植物细胞中。

本发明涵盖大范围核酸酶的用途,以使植物细胞或植物中的本文所述一种或多种ntsus多核苷酸(或如本文描述的其任何组合)失活。具体来说,本公开提供了一种使用大范围核酸酶使植物中的ntsus多核苷酸失活的方法,其包括:a)提供包括如本文所述的ntsus多核苷酸的植物细胞;(b)将大范围核酸酶或编码大范围核酸酶的构建体引入所述植物细胞内;和(c)允许大范围核酸酶使ntsus多核苷酸基本上失活

大范围核酸酶可以用于切割在多核苷酸的编码区内的大范围核酸酶识别位点。这类切割通常导致在通过非同源末端连接的诱变dna修复后,在大范围核酸酶识别位点处的dna缺失。基因编码序列中的这类突变通常足以使基因失活。这种修饰植物细胞的方法首先涉及使用合适的转化方法将大范围核酸酶表达盒递送至植物细胞。为了最高效率,期望将大范围核酸酶表达盒连接至可选标记,且在选择剂的存在下选择成功转化的细胞。这种方法使得大范围核酸酶表达盒整合到基因组内,然而,如果植物可能需要监管机构批准,那么这可能是不理想的。在这类情况下,使用常规育种技术,大范围核酸酶表达盒(和连接的可选标记基因)可以在后续植物世代中分离开。

在大范围核酸酶表达盒递送后,植物细胞最初在对于使用的具体转化程序典型的条件下生长。这可能意味着在低于26℃的温度下,通常在黑暗中,使经转化的细胞在培养基上生长。这类标准条件可以使用一段时间,优选1-4天,以允许植物细胞从转化过程恢复。在该初始恢复期之后的任何时间点,可以升高生长温度以刺激工程化的大范围核酸酶切割和突变大范围核酸酶识别位点的功能。

f.talen

一种基因编辑方法涉及转录激活因子样效应物核酸酶(transcriptionactivator-likeeffectornuclease,talen)的使用,其诱导细胞可以修复机制响应的双链断裂。nhej从双链断裂的任一侧重新连接dna,其中有很少或没有用于退火的序列重叠。这一修复机制经由插入或缺失、或染色体重排诱导基因组中的错误。任何这类误差可以致使在所述位置处编码的基因产物无功能。对于某些应用,可能需要从植物基因组中精确除去ntsus多核苷酸。这类应用可能使用一对经工程改造的大范围核酸酶,所述一对大范围核酸酶各自切割在预期缺失的任一侧上的大范围核酸酶识别位点。也可以使用能够识别并结合基因并将双链断裂引入基因组的talen。因此,在另一方面,涵盖了使用tal效应物核酸酶,用于生产如本文所述的突变型、非天然存在的或转基因或以其他方式遗传修饰的植物的方法。

g.crispr/cas

另一种基因编辑方法涉及细菌crispr/cas系统的使用。细菌和古细菌显示出称为规律成簇间隔短回文重复(clusteredregularlyinterspacedshortpalindromicrepeat,crispr)的染色体元件,它是适应性免疫系统的一部分,防止侵入病毒和质粒dna。在ii型crispr系统中,crisprrna(crrna)与反式激活crrna(tracrrna)和crispr相关联的(cas)多肽一起发挥作用,以在靶dna中引入双链断裂。通过cas9的靶切割要求在crrna和tracrrna之间的碱基配对,以及在crrna和靶dna之间的碱基配对。靶识别通过称为原型间隔序列毗邻基序(protospacer-adjacentmotif,pam)的短基序的存在得到促进,所述pam符合序列ngg。这一系统可以用于基因组编辑。cas9通常通过双重rna按程序工作,所述双重rna由crrna和tracrrna组成。然而,这些rna的核心组分可以组合成单一杂交物‘引导rna’用于cas9靶向。对靶dna使用非编码rna引导用于位点特异性切割有希望比现有技术(如talen)明显更直截了当。使用crispr/cas策略,重新靶向核酸酶复合物仅需要引入新的rna序列,而无需重新设计多肽转录因子的特异性。crispr/cas技术是以国际申请wo2015/189693a1的方法在植物中实施的,该方法公开了广泛适用于植物物种的病毒介导的基因组编辑平台。烟草脆裂病毒(trv)的rna2基因组被设计以携带指导rna并将其递送到过表达cas9核酸内切酶的圆叶烟草(nicotianabenthamiana)植物中。在本公开的上下文中,指导rna可以来源于本文公开的任何ntsus多核苷酸序列,并且wo2015/189693a1的教导内容适用于编辑植物细胞的基因组并获得所需的突变型植物。该技术的快速发展产生了在植物中具有广泛适用性的各种方案,这些方案已在许多最近的科学综述文章中很好地编目(例如,plantmethods(2016)12:8;以及frontplantsci.(2016)7:506)。biotechnologyadvances(2015)33,1,p41-52中是对crispr/cas系统的综述,该文献特别关注在植物中的应用。bortesi和fischer还在crispr/cas技术、锌指核酸酶和talens之间进行了比较。actapharmaceuticasinicab(2017)7,3,p292-302和curr.op.inplantbiol.(2017)36,1–8中讨论了crispr/cas用于操作植物基因组的用途的更新进展。非盈利质粒库(addgene.org)“addgene”中列出了用于植物的crispr/cas9质粒,并且crispr/cas质粒是可商购的。

h.反义修饰

反义技术是可以用于调节ntsus多肽表达或活性的另一熟知方法。将待抑制ntsus基因的多核苷酸克隆且可操作地连接于调节区和转录终止序列,使得rna的反义链被转录。重组构建体随后转化到植物细胞内,并且产生rna的反义链。多核苷酸无需是待抑制基因的整个序列,但通常与待抑制基因的有义链的至少一部分基本上互补。

多核苷酸可以转录成核酶,或催化rna,其影响mrna的表达。核酶可以设计为与几乎任何靶rna特异性配对,且切割在特定位置处的磷酸二酯主链,由此使靶rna功能失活。异源多核苷酸可以编码设计为切割特定mrna转录物的核酶,从而阻止多肽的表达。锤头状核酶可用于破坏特定mrna,但可以使用在位点特异性识别序列处切割mrna的多种核酶。锤头状核酶在由侧翼区指示的位置处切割mrna,所述侧翼区与靶mrna形成互补碱基对。唯一的要求是靶rna包含5'-ug-3'多核苷酸。锤头状核酶的构建和产生是本领域已知的。锤头状核酶序列可以嵌入稳定rna如转移rna(trna)内,以增加.体内切割效率。

在一个实施方案中,可以干扰rna转录物翻译的序列特异性多核苷酸是干扰rna。rna干扰或rna沉默是进化上保守的过程,特异性mrna通过其可被靶向用于酶促降解。一种双链rna(双链rna)通过细胞(例如双链rna病毒、或干扰rna多核苷酸)引入或产生,以起始干扰rna途径。双链rna可以通过rnaseiii转化为长度为21-24bp的多个小干扰rna(sirna)双链体,rnaseiii是双链rna特异性核酸内切酶。sirna可以随后被rna诱导的沉默复合物识别,所述沉默复合物通过atp依赖性过程促进sirna的解链。sirna的解开的反义链将激活的rna诱导的沉默复合物引导到靶mrna,所述靶mrna包含与sirna反义链互补的序列。靶向mrna和反义链可以形成a形螺旋,并且a形螺旋的大沟可以由活化rna诱导沉默复合物识别。靶mrna可以在由sirna链5'末端的结合位点限定的单个位点被激活的rna诱导的沉默复合物切割。活化rna诱导沉默复合物可以再循环,以催化另一切割事件。

干扰rna表达载体可包含编码干扰rna多核苷酸的干扰rna构建体,所述干扰rna多核苷酸通过降低mrna、前mrna或相关rna变体的表达水平而表现出rna干扰。表达载体可以包含置于干扰rna构建体上游且可操作地连接于干扰rna构建体的启动子,如本文进一步描述的。干扰rna表达载体可包含合适的最小核心启动子、目的干扰rna构建体、上游(5')调节区、下游(3')调节区,包括转录终止和多腺苷酸化信号,以及其他本领域技术人员已知的序列,例如多种选择标记。

双链rna分子可包括由单个寡核苷酸以茎-环结构组装的sirna分子,其中sirna分子的自身互补有义和反义区通过基于多核苷酸或基于非多核苷酸的接头连接,以及具有两个或更多个环结构和包含自身互补有义和反义链的茎的环状单链rna,其中环状rna可以在体内或体外加工以产生能够介导干扰rna的活性sirna分子。

还涵盖了小发夹rna分子的使用。除了反向互补(有义)序列外,它们还包括特定的反义序列,通常由间隔物或环序列分开。间隔物或环的切割提供了单链rna分子和其反向互补序列,使得它们可以退火以形成双链rna分子(任选具有另外的加工步骤,可以导致来自任一或两条链的3'端或5'端的一个、两个、三个或更多个核苷酸的添加或去除)。间隔物可以具有足够长度,以在间隔物切割(和任选地,可以导致来自任一或两条链的3'端或5'端的一个、两个、三个、四个或更多个核苷酸的添加或去除的后续加工步骤)之前,允许反义和有义序列退火且形成双链结构(或茎)。间隔序列通常是位于两个互补多核苷酸区域之间的不相关多核苷酸,当退火为双链多核苷酸时,所述两个互补多核苷酸区域包含小发夹rna。间隔序列一般包括约3至约100个核苷酸。

可以通过选择用于产生发夹双链体的合适序列组成、环大小和茎长,产生任何目的rna多核苷酸。用于设计发夹双链体的茎长的合适范围包括至少约10、11、12、13、14、15、16、17、18、19或20个核苷酸的茎长,如约14-30个核苷酸、约30-50个核苷酸、约50-100个核苷酸、约100-150个核苷酸、约150-200个核苷酸、约200-300个核苷酸、约300-400个核苷酸、约400-500个核苷酸、约500-600个核苷酸以及约600-700个核苷酸。用于设计发夹双链体的环长的合适范围包括约4-25个核苷酸、约25-50个核苷酸或如果发夹双链体的茎长相当大,那么更长的环长。在某些实施方案中,双链rna或ssrna分子长度在约15与约40个核苷酸之间。在另一个实施方案中,sirna分子是长度在约15与约35个核苷酸之间的双链rna或ssrna分子。在另一个实施方案中,sirna分子是长度在约17与约30个核苷酸之间的双链rna或ssrna分子。在另一个实施方案中,sirna分子是长度在约19与约25个核苷酸之间的双链rna或ssrna分子。在另一个实施方案中,sirna分子是长度在约21至约23个核苷酸之间的双链rna或ssrna分子。在某些实施方案中,具有大于21个核苷酸的双链体区域的发夹结构可以促进有效的sirna定向沉默,而与环序列和长度无关。本文描述了rna干扰的示例性序列。

靶mrna序列通常长度为约14至约50个核苷酸之间。因此,可以扫描靶mrna的长度在约14至约50个核苷酸之间的区域,所述区域优选满足以下一个或多个标准:a+t/g+c之比在约2:1至约1:2之间;5'端的aa二核苷酸或ca二核苷酸;靶mrna特有的至少10个连续核苷酸的序列(即,该序列不存在于来自相同植物的其他mrna序列中);并且没有超过三个连续鸟嘌呤(g)核苷酸或超过三个连续胞嘧啶(c)核苷酸的“运行”。这些标准可以使用本领域已知的各种技术来评估,例如,可以使用计算机程序诸如blast来搜索公众可获得的数据库,以确定所选序列是否是靶mrna所特有的。另选地,可以使用可商购获得的计算机软件(例如,可商购获得的oligoengine,targetfinder和sirna设计工具)来选择序列(并设计sirna序列)。

在一个实施方案中,选择满足上述标准中的一个或多个、长度在约14与约30个核苷酸之间的靶mrna序列。在另一个实施方案中,选择满足上述标准中的一个或多个、长度在约16与约30个核苷酸之间的序列。在又一个实施方案中,选择满足上述标准中的一个或多个、长度在约19与约30个核苷酸之间的序列。在另一个实施方案中,选择满足上述标准中的一个或多个、长度在约19与约25个核苷酸之间的序列。

在一个示例性实施方案中,sirna分子包含与本文所述的任何一种多核苷酸的至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个连续核苷酸互补的特异性反义序列。

sirna分子包含的特异性反义序列可以与互补物相同或基本相同。在一个实施方案中,sirna分子包含的特异性反义序列与靶mrna序列的互补物至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%相同。确定序列一致性的方法是本领域已知的,并且可以例如通过使用universityofwisconsincomputergroup(gcg)软件的或ncbi网站上提供的blastn程序进行确定。

诱导植物中双链rna沉默的一种方法是用产生发夹rna的基因构建体转化(参见nature(2000)407,319-320)。这类构建体包括由适当间隔物分开的靶基因序列的反向区。由于产生了内含子剪接的发夹rna,功能性植物内含子区域作为间隔片段的插入还提高了基因沉默诱导的效率(plantj.(2001),27,581-590)。合适地,茎长为约50个核苷酸至约1千个碱基长度。用于产生内含子剪接的发夹rna的方法在本领域中充分描述(参见例如bioscience,biotechnology,andbiochemistry(2008)72,2,615-617)。

具有双链体或双链结构的干扰rna分子,例如双链rna或小发夹rna可具有平端,或可具有3'或5'突出端。如本文所用,“突出端”指当一个rna链的3'端延伸超出另一条链的5'端(3'突出端),或反之亦然(5'突出端)时,由双链体结构突出的一个或多个不成对的核苷酸。包括突出端的核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或其修饰形式。在一个实施方案中,干扰rna分子的至少一条链具有长度约1至约6个核苷酸的3'突出端。在其他实施方案中,3'突出端长度为约1至约5个核苷酸、约1至约3个核苷酸以及约2至约4个核苷酸。

当干扰rna分子在分子的一端包括3'突出端时,另一端可以是平端的或也具有突出端(5'或3')。当干扰rna分子在分子的两端包括突出端时,突出端的长度可以是相同的或不同的。在一个实施方案中,干扰rna分子在分子的两端包括约1至约3个核苷酸的3'突出端。在另一实施方案中,干扰rna分子是在分子的两端具有2个核苷酸的3'突出端的双链rna。在另一实施方案中,构成干扰rna的突出端的核苷酸是tt二核苷酸或uu二核苷酸。

干扰rna分子可以包括一个或多个5'或3'帽状结构。术语“帽状结构”指在寡核苷酸的任一端处并入的化学修饰,这使分子免于核酸外切酶降解,并且还可以促进在细胞内的递送或定位。

适用于干扰rna分子的另一种修饰是将一个或多个部分或缀合物化学连接到干扰rna分子,所述一个或多个部分或缀合物增强了干扰rna分子的功能、细胞分布、细胞摄取、生物利用度或稳定性。多核苷酸可以通过本领域充分确定的方法进行合成或修饰。化学修饰包括2'修饰、引入非天然碱基、共价联接到配体、以及用硫代磷酸酯键取代磷酸酯键。在这个实施方案中,双链体结构的完整性通过至少一个,且通常为两个化学键得到加强。

可以修饰两条单链中的一条或两条的核苷酸以调节细胞酶的活化,如但不限于某些核酸酶。用于降低或抑制细胞酶活化的技术是本领域已知的,包括但不限于2'-氨基修饰、2'-氟修饰、2'-烷基修饰、不带电的主链修饰、吗啉代修饰、2'-o-甲基修饰和氨基磷酸酯。

配体可以结合至干扰rna分子,例如以增强其细胞吸收。在某些实施方案中,疏水性配体结合至分子,以促进细胞膜的直接渗透。在某些情况下,阳离子配体与寡核苷酸的结合通常使得对核酸酶的抗性改善。

“靶向诱导基因组局部病变”(tilling)是另一种诱变技术,其可用于产生和/或鉴定编码具有修饰的表达、功能或活性的多肽的多核苷酸。tilling还允许选择携带这类突变体的植物。tilling组合高密度诱变与高流通量筛选方法。用于tilling的方法是本领域众所周知的(参见mccallum等人,(2000)natbiotechnol18:455-457和stemple(2004)natrevgenet5(2):145-50)。

多个实施方案涉及包括本文所述的一种或多种ntsus多核苷酸或包含一种或多种ntsus多核苷酸的干扰rna构建体的表达载体。

多个实施方案涉及包括本文所述的ntsus多核苷酸中的一种或多种或者一种或多种干扰rna构建体的表达载体。

多个实施方案涉及包括本文所述的一种或多种ntsus多核苷酸或一种或多种干扰rna构建体的表达载体,所述干扰rna构建体编码一种或多种干扰rna多核苷酸,其能够自我退火以形成发夹结构,其中所述构建体包括(a)本文所述的ntsus多核苷酸中的一种或多种;(b)编码间隔元件的第二序列,所述间隔元件形成发夹结构的环;和(c)置于与第一序列相同的定向、包括第一序列的反向互补序列的第三序列,其中第二序列置于第一序列和第三序列之间,并且第二序列可操作地连接于第一序列和第三序列。

所公开的ntsus多核苷酸可以用于构建不形成发夹结构的多种多核苷酸。举例来说,可以通过(1)通过可操作地连接于第一启动子来转录dna的第一条链,和(2)通过可操作地连接于第二启动子来转录dna片段的第一条链的反向互补序列,来形成双链rna。多核苷酸的每条链可以由相同表达载体或不同表达载体转录。具有rna干扰的rna双链体可被酶促转化为sirna以调节rna水平。

因此,多个实施方案涉及包括本文所述的一种或多种ntsus多核苷酸或编码能够自我退火的干扰rna多核苷酸的干扰rna构建体的表达载体,其中所述构建体包括(a)本文所述的ntsus多核苷酸中的一种或多种;和(b)置于与第一序列相同的定向、包括第一序列的互补(例如反向互补)序列的第二序列。

提供了通过促进基因表达的共抑制,用于调节本文所述ntsus多肽中的一种或多种(或如本文所述的其任何组合)的内源表达水平的多种组合物和方法。

提供了通过调节mrna的翻译用于调节内源基因表达水平的多种组合物和方法。宿主(烟草)植物细胞可用表达载体转化,所述表达载体包括:可操作地连接至ntsus多核苷酸的启动子,所述多核苷酸以就启动子而言的反义定向放置,以允许与mrna的一部分具有序列互补性的rna多核苷酸的表达。

用于调节mrna翻译的多种表达载体可以包括:可操作地连接于ntsus多核苷酸的启动子,其中序列以就启动子而言的反义定向放置。反义rna多核苷酸的长度可以改变,并且可以是约15-20个核苷酸、约20-30个核苷酸、约30-50个核苷酸、约50-75个核苷酸、约75-100个核苷酸、约100-150个核苷酸、约150-200个核苷酸以及约200-300个核苷酸。

i.可动遗传因子

作为另外一种选择,可通过将转座子(例如is元件)引入目的植物的基因组内,靶向基因以灭活。这些可动遗传因子可以通过有性杂交受精来引入,并且插入突变体可以针对多肽功能的丧失来筛选。通过例如伴性异花受精,通过使亲本植物与未实施转座子诱导诱变的植物杂交,可将亲本植物中的破坏基因引入其他植物内。可以利用本领域技术人员已知的任何标准育种技术。在一个实施方案中,可以通过插入一个或多个转座子灭活一种或多种基因。突变可能导致一种或多种基因的纯合破坏、一种或多种基因的杂合破坏,或如果破坏超过一种基因,那么可能导致纯合和杂合破坏两者的组合。合适的转座元件包含反转录转座子、反转座子和sine样元件。这类方法是本领域技术人员已知的。

j.核酶

或者,可以通过将源自许多小环状rna的核酶引入植物中来靶向ntsus多核苷酸以灭活,所述小环状rna能够自切割和复制。这些rna可以单独复制(类病毒rna)或伴随辅助病毒(卫星rna)而复制。合适rna的实例包含源自鳄梨日斑病类病毒的那些,以及源自烟草环斑病毒、苜蓿短暂条纹病毒、绒毛烟草斑驳病毒、莨菪斑驳病毒和地下三叶草斑驳病毒的卫星rna。多种靶rna特异性核酶是本领域技术人员已知的。

4.植物

突变型或非天然存在的植物或植物细胞可以在一个或多个ntsus基因中具有一个或多个突变的任何组合,其导致那些基因或其基因产物的表达或功能或活性的调节。举例来说,突变型或非天然存在的植物或植物细胞可以具有单个ntsus基因中的单个突变;单个ntsus基因中的多个突变;两个或更多个或者三个或更多个或者四个或更多个ntsus基因中的单个突变;或者两个或更多个或者三个或更多个或者四个或更多个ntsus基因中的多个突变。又如,突变型或非天然存在的植物或植物细胞可以在ntsus基因的特定部分(诸如在编码ntsus多肽或其部分的活性位点的ntsus基因的区域)中具有一个或多个突变。又如,突变型或非天然存在的植物或植物细胞可以在一个或多个ntsus基因之外的区域(诸如在其调节的ntsus基因的上游或下游区域)中具有一个或多个突变,条件是它们调节ntsus基因的功能或表达。上游元件可以包括启动子、增强子或转录因子。一些元件如增强子可以置于它调节的基因的上游或下游。元件无需定位接近于它调节的基因,因为一些元件已发现位于它调节的基因上游或下游几十万个碱基对处。突变型或非天然存在的植物或植物细胞可以具有位于基因的前100个核苷酸内、基因的前200个核苷酸内、基因的前300个核苷酸内、基因的前400个核苷酸内、基因的前500个核苷酸内、基因的前600个核苷酸内、基因的前700个核苷酸内、基因的前800个核苷酸内、基因的前900个核苷酸内、基因的前1000个核苷酸内、基因的前1100个核苷酸内、基因的前1200个核苷酸内、基因的前1300个核苷酸内、基因的前1400个核苷酸内、或基因的前1500个核苷酸内的一个或多个突变。突变型或非天然存在的植物或植物细胞可以具有位于基因的100个核苷酸的第一、第二、第三、第四、第五、第六、第七、第八、第九、第十、第十一、第十二、第十三、第十四或第十五集合或其组合内的一个或多个突变。公开了包括突变型多肽变体的突变型或非天然存在的植物或植物细胞(例如,如本文所述的突变型、非天然存在的或转基因植物或植物细胞等)。

在一个实施方案中,使来自植物的种子诱变且随后生长成第一代突变型植物。随后使第一代植物自花授粉,并且使来自第一代植物的种子生长成第二代植物,所述第二代植物随后就其基因座中的突变进行筛选。尽管诱变的植物材料可以针对突变进行筛选,但筛选第二代植物的优点在于所有体细胞突变都对应于生殖系突变。本领域技术人员应理解,包含但不限于种子、花粉、植物组织或植物细胞的多种植物材料可以进行诱变,以便产生突变型植物。然而,当筛选植物多核苷酸的突变时,诱变的植物材料的类型可能有影响。举例来说,当在非诱变植物授粉之前对花粉实施诱变时,使授粉获得的种子生长成第一代植物。第一代植物的每一个细胞将含有在花粉中产生的突变;因此这些第一代植物随后可针对突变进行筛选,而不是等到第二代进行。

a.修饰植物的制备、筛选和杂交

从个体植物、植物细胞或植物材料制备的ntsus多核苷酸可以任选地合并,以加速在源自诱变的植物组织、细胞或材料的植物群体中筛选突变。可以筛选植物、植物细胞或植物材料的一个或多个后续世代。任选合并的群组的大小取决于使用的筛选方法的灵敏度。

任选合并样品后,可以对其进行多核苷酸特异性扩增技术,诸如pcr。对该基因或紧邻该基因的序列特异的任何一种或多种引物或探针可用于扩增任选合并的样品内的序列。合适地,一个或多个引物或探针设计为扩增最可能出现有用突变的基因座的区域。最优选地,引物设计为检测多核苷酸区域内的突变。另外,引物和探针优选避免已知的多态性位点,以便容易筛选点突变。为了便于扩增产物的检测,可以使用任何常规标记方法来标记一个或多个引物或探针。使用本领域充分理解的方法,可以基于本文中所描述的序列来设计引物或探针。

为了便于检测扩增产物,可以使用任何常规标记方法来标记引物或探针。使用本领域充分理解的方法,可以基于本文中所描述的序列来设计这些引物或探针。

可以通过本领域已知的方法鉴定多态性,并且一些多态性已在文献中得到描述。

在一些实施方案中,植物可以从植物、植物组织或植物细胞再生或生长。可以使用从植物细胞或植物组织再生或生长植物的任何适合方法,例如(但不限于)从原生质体组织培养或再生。适当地,植物可以通过在愈伤组织诱导培养基、嫩芽诱导培养基和/或根部诱导培养基上生长经转型植物细胞再生。参看例如mccormick等人,植物细胞报告(plantcellreports)5:81-84(1986)。这些植物接着可生长,并且经相同经转型品系或不同品系授粉,并且鉴别具有所要表型特征表达的所得杂交体。可以生长两代或更多代来确保所要表型特征的表达稳定保持和遗传,并且采摘种子以确保获得所要表型特征的表达。因此如本文所用,“经转型种子”指的是种子含有稳定整合到植物基因组中的核苷酸构筑体。

因此,在另一方面,提供了制备突变型植物的方法。所述方法涉及提供包括编码本文所述的功能性ntsus多核苷酸(或如本文所述的其任何组合)的ntsus基因的植物的至少一个细胞。接下来,在有效调节本文所述ntsus多核苷酸功能的条件下处理植物的至少一个细胞。至少一个突变型植物细胞随后繁殖成突变型植物,其中与对照植物相比较,所述突变型植物具有调节水平的所述ntsus多肽(或如本文所述的其任何组合)。在这一制备突变型植物的方法的一个实施方案中,处理步骤涉及在有效获得至少一个突变型植物细胞的条件下,使至少一个细胞经受如上所述的化学诱变剂。在这一方法的另一个实施方案中,处理步骤涉及在有效获得至少一个突变型植物细胞的条件下,使至少一个细胞经受辐射源。术语“突变型植物”包括其中与对照植物相比基因型被修饰(合适地,通过除基因工程或基因修饰之外的方式)的突变型植物。

在某些实施方案中,突变型植物、突变型植物细胞或突变型植物材料可以包括一个或多个突变,所述一个或多个突变在另一种植物、植物细胞或植物材料中天然存在,且赋予所需性状。该突变可引入(例如基因渗入)另一种植物、植物细胞或植物材料(例如具有与突变源自于其的植物不同的遗传背景的植物、植物细胞或植物材料)内,以对其赋予该性状。因此,例如,可以将在第一植物中天然发生的突变引入第二植物中,诸如具有与第一植物不同的遗传背景的第二植物。技术人员因此能够搜索且鉴定在基因组中天然携带本文中所描述基因的一种或多种突变等位基因的植物,所述基因赋予所需性状。可以通过多种方法(包含育种、回交和基因渗入)将天然存在的突变体等位基因转移到第二植物,以产生在本文中所描述基因中具有一个或多个突变的品系、品种或杂交物。相同的技术也可以应用于一个或多个非天然突变从第一植物到第二植物的基因渗入。可以在突变型植物的库中筛选展示所需性状的植物。合适地,利用如本文所述的多核苷酸的知识进行选择。因此,能够与对照相比筛选基因性状。这样的筛选方法可以涉及如本文讨论的常规扩增和/或杂交技术的应用。因此,本公开的另一方面涉及鉴定突变型植物的方法,该方法包括以下步骤:(a)提供包含来自植物的ntsus多核苷酸的样品;(b)确定ntsus多核苷酸的序列,其中ntsus多核苷酸的序列与对照植物的ntsus多核苷酸相比的差异表明所述植物是突变型植物。在另一方面,提供了鉴定突变型植物的方法,该突变型植物与对照植物相比积聚了增加或降低水平的还原糖,该方法包括以下步骤:(a)提供来自待筛选植物的样品;(b)确定所述样品是否包含在本文所述的一种或多种ntsus多核苷酸中的一个或多个突变;(c)确定所述植物的至少一种还原糖的水平。合适地,确定绿叶、早期干制叶子中或干制叶子中至少一种还原糖的水平。在另一方面,提供了制备突变型植物的方法,该突变型植物与对照植物相比具有增加或降低水平的至少一种还原糖,该方法包括以下步骤:(a)提供来自第一植物的样品;(b)确定所述样品是否包含在本文所述的一种或多种ntsus多核苷酸中的导致调节水平的至少一种还原糖的一个或多个突变;以及(c)将一个或多个突变转移到第二株植物中。合适地,确定绿叶、早期干制叶子中或干制叶子中至少一种还原糖的水平。可以使用本领域已知的多种方法,如通过基因工程改造、基因操纵、基因渗入、植物育种、回交等等,将突变转移到第二植物内。在一个实施方案中,第一植物是天然存在的植物。在一个实施方案中,第二植物具有与第一植物不同的基因背景。在另一方面,提供了制备突变型植物的方法,该突变型植物与对照植物相比具有增加或降低水平的至少一种还原糖,该方法包括以下步骤:(a)提供来自第一植物的样品;(b)确定所述样品是否包含在本文所述的一种或多种多核ntsus苷酸中的导致调节水平的至少一种还原糖的一个或多个突变;(c)将一个或多个突变从第一植物基因渗入到第二植物中。合适地,确定绿叶、早期干制叶子中或干制叶子中至少一种还原糖的水平。在一个实施方案中,基因渗入步骤包括植物育种,任选地包含回交等等。在一个实施方案中,第一植物是天然存在的植物。在一个实施方案中,第二植物具有与第一植物不同的基因背景。在一个实施方案中,第一植物不是栽培品种或优良栽培品种。在一个实施方案中,第二植物是栽培品种或优良栽培品种。另一方面涉及通过本文中所描述的方法获得或可获得的突变型植物(包含栽培品种或优良栽培品种突变型植物)。在某些实施方式中,“突变型植物”可具有仅定位于植物的特定区域,例如在本文所述的一种或多种ntsus多核苷酸的序列内的一个或多个突变。根据这一实施方案,突变型植物的剩余基因组序列将与诱变前的植物相同或基本上相同。

在某些实施方案中,突变型植物可具有位于植物的一个以上基因组区域中的一个或多个突变,诸如在本文所述的一种或多种ntsus多核苷酸的序列内以及在基因组的一个或多个其他区域内。根据这一实施方案,突变型植物的剩余基因组序列将与诱变前的植物不同或基本上不同。在某些实施方案中,突变型植物可能不具有本文所述的ntsus多核苷酸的一个或多个、两个或更多个、三个或更多个、四个或更多个、或者五个或更多个外显子中的一个或多个突变;或可能不具有本文所述的ntsus多核苷酸的一个或多个、两个或更多个、三个或更多个、四个或更多个、或者五个或更多个内含子中的一个或多个突变;或可能不具有本文所述的ntsus多核苷酸的启动子中的一个或多个突变;或可能不具有本文所述的ntsus多核苷酸的3’非翻译区中的一个或多个突变;或可能不具有本文所述的ntsus多核苷酸的5’非翻译区中的一个或多个突变;或可能不具有本文所述的ntsus多核苷酸的编码区中的一个或多个突变;或可能不具有本文所述的ntsus多核苷酸的非编码区中的一个或多个突变;或其部分中的其两个或更多个、三个或更多个、四个或更多个、五个或更多个;或者六个或更多个的任何组合。

在另一方面,提供了鉴定植物、植物细胞或植物材料的方法,该植物、植物细胞或植物材料包含在编码本文所述的ntsus多核苷酸的基因中的突变,该方法包括:(a)使植物、植物细胞或植物材料诱变;(b)从所述植物、植物细胞或植物材料或其后代获得样品;(c)确定ntsus基因或其变体或片段的多核苷酸序列,其中所述序列的差异指示其中的一个或多个突变。该方法还允许选择具有突变的植物,所述突变发生在影响植物细胞中ntsus基因表达的基因组区域中,诸如转录起始位点、起始密码子、内含子区域、外显子-内含子的边界、终止子或终止密码子。

b.植物科、物种、品种、种子和组织培养

适用于基因修饰的植物包括单子叶植物和双子叶植物以及植物细胞系统,包括以下科之一的物种:爵床科(acanthaceae)、葱科(alliaceae)、六出花科(alstroemeriaceae)、石蒜科(amaryllidaceae)、夹竹桃科(apocynaceae)、棕榈科(arecaceae)、菊科(asteraceae)、小檗科(berberidaceae)、红木科(bixaceae)、十字花科(brassicaceae)、凤梨科(bromeliaceae)、大麻科(cannabaceae)、石竹科(caryophyllaceae)、三尖杉科(cephalotaxaceae)、藜科(chenopodiaceae)、秋水仙科(colchicaceae)、葫芦科(cucurbitaceae)、薯蓣科(dioscoreaceae)、麻黄科(ephedraceae)、古柯科(erythroxylaceae)、大戟科(euphorbiaceae)、豆科(fabaceae)、唇形科(lamiaceae)、亚麻科(linaceae)、石松科(lycopodiaceae)、锦葵科(malvaceae)、黑药花科(melanthiaceae)、芭蕉科(musaceae)、桃金娘科(myrtaceae)、蓝果树科(nyssaceae)、罂粟科(papaveraceae)、松科(pinaceae)、车前草科(plantaginaceae)、禾本科(poaceae)、蔷薇科(rosaceae)、茜草科(rubiaceae)、杨柳科(salicaceae)、无患子科(sapindaceae)、茄科(solanaceae)、红豆杉科(taxaceae)、山茶科(theaceae)或葡萄科(vitaceae)。

合适物种可以包含以下各属的成员:黄葵属(abelmoschus)、冷杉属(abies)、槭属(acer)、剪股颖属(agrostis)、葱属(allium)、六出花属(alstroemeria)、凤梨属(ananas)、穿心莲属(andrographis)、须芒草属(andropogon)、蒿属(artemisia)、芦竹属(arundo)、颠茄属(atropa)、小檗属(berberis)、甜菜属(beta)、红木属(bixa)、芸苔属(brassica)、金盏菊属(calendula)、山茶属(camellia)、喜树属(camptotheca)、大麻属(cannabis)、辣椒属(capsicum)、红花属(carthamus)、长春花属(catharanthus)、三尖杉属(cephalotaxus)、菊属(chrysanthemum)、金鸡纳属(cinchona)、西瓜属(citrullus)、咖啡属(coffea)、秋水仙属(colchicum)、鞘蕊花属(coleus)、甜瓜属(cucumis)、南瓜属(cucurbita)、狗牙根属(cynodon)、曼陀罗属(datura)、石竹属(dianthus)、洋地黄属(digitalis)、薯蓣属(dioscorea)、油棕属(elaeis)、麻黄属(ephedra)、蔗茅属(erianthus)、古柯属(erythroxylum)、桉树属(eucalyptus)、羊茅属(festuca)、草莓属(fragaria)、雪花莲属(galanthus)、大豆属(glycine)、棉属(gossypium)、向日葵属(helianthus)、橡胶树属(hevea)、大麦属(hordeum)、天仙子属(hyoscyamus)、麻风树属(jatropha)、莴苣属(lactuca)、亚麻属(linum)、黑麦草属(lolium)、羽扇豆属(lupinus)、番茄属(lycopersicon)、石松属(lycopodium)、木薯属(manihot)、苜蓿属(medicago)、薄荷属(mentha)、芒属(miscanthus)、芭蕉属(musa)、烟草属、稻属(oryza)、黍属(panicum)、罂粟属(papaver)、银胶菊属(parthenium)、狼尾草属(pennisetum)、矮牵牛属(petunia)、虉草属(phalaris)、梯牧草属(phleum)、松属(pinus)、早熟禾属(poa)、一品红属(poinsettia)、杨属(populus)、萝芙木属(rauwolfia)、蓖麻属(ricinus)、蔷薇属(rosa)、甘蔗属(saccharum)、柳属(salix)、血根草属(sanguinaria)、赛莨菪属(scopolia)、黑麦属(secale)、茄属(solanum)、高粱属(sorghum)、米草属(spartina)、菠菜属(spinacea)、菊蒿属(tanacetum)、红豆杉属(taxus)、可可属(theobroma)、小黑麦属(triticosecale)、小麦属(triticum)、北美穗草属(uniola)、藜芦属(veratrum)、长春花属(vinca)、葡萄属(vitis)和玉蜀黍属(zea)。

合适物种可包括:黍属(panicumspp.)、高粱属(sorghumspp.)、芒属(miscanthusspp.)、甘蔗属(saccharumspp.)、蔗茅属(erianthusspp.)、杨属(populusspp.)、须芒草(andropogongerardii)、象草(pennisetumpurpureum)、鹬草(phalarisarundinacea)、狗牙根(cynodondactylon)、高羊茅(festucaarundinacea)、草原网茅(spartinapectinata)、紫花苜蓿(medicagosativa)、芦荻(arundodonax)、裸麦(secalecereale)、柳属(salixspp.)、桉属(eucalyptusspp.)、小黑麦(triticosecale)、竹、向日葵(helianthusannuus)、红花(carthamustinctorius)、麻风树(jatrophacurcas)、蓖麻(ricinuscommunis)、油棕(elaeisguineensis)、亚麻(linumusitatissimum)、芥菜(brassicajuncea)、甜菜(betavulgaris)、木薯(manihotesculenta)、番茄(lycopersiconesculentum)、莴苣(lactucasativa)、香蕉(musyclisealca)、马铃薯(solanumtuberosum)、甘蓝(青花菜、花椰菜、抱子甘蓝)(brassicaoleracea)、山茶(camelliasinensis)、草莓(fragariaananassa)、可可(theobromacacao)、咖啡(coffeycliseca)、葡萄(vitisvinifera)、菠萝(ananascomosus)、辣椒(capsicumannum)、洋葱(alliumcepa)、香瓜(cucumismelo)、黄瓜(cucumissativus)、笋瓜(cucurbitamaxima)、南瓜(cucurbitamoschata)、菠菜(spinaceaoleracea)、西瓜(citrulluslanatus)、秋葵(abelmoschusesculentus)、茄子(solanummelongena)、蔷薇属(rosaspp.)、康乃馨(dianthuscaryophyllus)、碧冬茄属(petuniaspp.)、一品红(poinsettiapulcherrima)、白羽扇豆(lupinusalbus)、燕麦(uniolapaniculata)、翦股颖属(agrostisspp.)、山杨(populustremuloides)、松属(pinusspp.)、冷杉属(abiesspp.)、槭属(acerspp.)、大麦(hordeumvulgare)、草地早熟禾(poapratensis)、黑麦草属(loliumspp.)和貓尾草(phleumpratense)、柳枝稷(panicumvirgatum)、苏丹草(sorghuycliseor)、巨芒(miscanthusgiganteus)、甘蔗属(saccharumsp.)、白杨(populusbalsamifera)、玉米(zeamays)、大豆(glycinemax)、西洋油菜(brassicanapus)、小麦(triticumaestivum)、陆地棉(gossypiumhirsutum)、稻(oryzasativa)、向日葵(helianthusannuus)、紫花苜蓿(medicagosativa)、甜菜(betavulgaris)或御谷(pennisetumglaucum)。

多个实施方式涉及经修饰的突变型烟草、非天然存在的烟草或转基因烟草植物或植物细胞,以调节基因表达水平,由此产生与对照相比较,其中多肽的表达水平在目的组织中经调节的植物或植物细胞(例如烟草植物或植物细胞)。所公开的组合物和方法可以应用于烟草属的任何物种,包括黄花烟草(n.rustica)和烟草(例如,lab21、lnky171、ti1406、basma、galpao、perique、beinhart1000-1和petico)。其他物种包括无茎烟草(n.acaulis)、尖叶烟草(n.acuminata)、非洲烟草(n.africana)、花叶烟草(n.alata)、阿米基诺氏烟草(n.ameghinoi)、抱茎烟草(n.amplexicaulis)、阿伦兹氏烟草(n.arentsii)、渐狭叶烟草(n.attenuata)、阿姆布吉烟草(n.azambujae)、贝纳莫特氏烟草(n.benavidesii)、本赛姆氏烟草(n.benthamiana)、印度烟草(n.bigelovii)、博内里烟草(n.bonariensis)、洞生烟草(n.cavicola)、克利夫兰氏烟草(n.clevelandii)、心叶烟草(n.cordifolia)、伞床烟草(n.corymbosa)、迪伯纳氏烟草(n.debneyi)、木丝烟草(n.excelsior)、福尔吉特氏烟草(n.forgetiana)、香烟草(n.fragrans)、粉蓝烟草(n.glauca)、粘烟草(n.glutinosa)、古特斯比氏烟草(n.goodspeedii)、哥西氏烟草(n.gossei)、杂交烟草(n.hybrid)、因古儿巴烟草(n.ingulba)、卡瓦卡米氏烟草(n.kawakamii)、奈特氏烟草(n.knightiana)、郎氏烟草(n.iangsdorffii)、渐尖叶烟草(n.linearis)、长花烟草(n.iongiflora)、海滨烟草(n.maritima)、特大管烟草(n.megalosiphon)、摩西氏烟草(n.miersii)、夜花烟草(n.noctiflora)、裸茎烟草(n.nudicaulis)、欧布斯特烟草(n.obtusifolia)、西方烟草(n.occidentalis)、西方亚种香芥烟草(n.occidentalissubsp.hesperis)、耳状烟草(n.otophora)、圆维烟草(n.paniculata)、少花烟草(n.pauciflora)、矮牵牛状烟草(n.petunioides)、蓝茉莉叶烟草(n.plumbaginifolia)、夸德瑞伍氏烟草(n.quadrivalvis)、雷蒙德氏烟草(n.raimondii)、波缘烟草(n.repanda)、莲座烟草(n.rosulata)、莲座亚种因古儿巴烟草(n.rosulatasubsp.ingulba)、圆叶烟草(n.rotundifolia)、赛特氏烟草(n.setchellii)、拟似烟草(n.simulans)、前叶烟草(n.solanifolia)、斯佩格茨氏烟草(n.spegazzinii)、斯托可通氏烟草(n.stocktonii)、香甜烟草(n.suaveolens)、美花烟草(n.sylvestris)、拟穗状烟草(n.thyrsiflora)、绒毛烟草(n.tomentosa)、绒毛状烟草(n.tomentosiformis)、三角叶烟草(n.trigonophylla)、荫生烟草(n.umbratica)、波叶烟草(n.undulata)、颤毛烟草(n.velutina)、序叶烟草(n.wigandioides)和花烟草(n.xsanderae)。在一个实施方案中,植物是烟草。

本文还涵盖使用烟草栽培品种和优良烟草栽培品种。因此,转基因、非天然存在的或突变型植物可以是烟草品种或优良烟草栽培品种,其包括一种或多种转基因、或者一个或多个基因突变或其组合。基因突变(例如,一种或多种多态性)可以是非天然存在于个别烟草品种或烟草栽培品种(例如,优良烟草栽培品种)中的突变,或可以是的确天然存在的基因突变,条件是所述突变并非天然存在于个别烟草品种或烟草栽培品种(例如,优良烟草栽培品种)中。

特别有用的烟草品种包括白肋烟型、黑烟型、烤烟型和东方型烟草。品种或栽培品种的非限制性实例是:bd64、cc101、cc200、cc27、cc301、cc400、cc500、cc600、cc700、cc800、cc900、coker176、coker319、coker371gold、coker48、cd263、df911、dt538lcgalpao烟草、gl26h、gl350、gl600、gl737、gl939、gl973、hb04p、hb04plc、hb3307plc、杂交403lc、杂交404lc、杂交501lc、k149、k326、k346、k358、k394、k399、k730、kdh959、kt200、kt204lc、ky10、ky14、ky160、ky17、ky171、ky907、ky907lc、ky14xl8lc、littlecrittenden、mcnair373、mcnair944、msky14×l8、窄叶madole、窄叶madolelc、nbh98、n-126、n-777lc、n-7371lc、nc100、nc102、nc2000、nc291、nc297、nc299、nc3、nc4、nc5、nc6、nc7、nc606、nc71、nc72、nc810、ncbh129、nc2002、nealsmithmadole、oxford207、pd7302lc、pd7309lc、pd7312lc、'perique'烟草、pvh03、pvh09、pvh19、pvh50、pvh51、r610、r630、r7-11、r7-12、rg17、rg81、rgh51、rgh4、rgh51、rs1410、speight168、speight172、speight179、speight210、speight220、speight225、speight227、speight234、speightg-28、speightg-70、speighth-6、speighth20、speightnf3、ti1406、ti1269、tn86、tn86lc、tn90、tn97、tn97lc、tnd94、tnd950、tr(tomrosson)madole、va309、va359、aa37-1、b13p、xanthi(mitchell-mor)、bel-w3、79-615、samsunholmesnn、ktrdc2号杂交49、白肋21、ky8959、ky9、md609、pg01、pg04、po1、po2、po3、rg11、rg8、va509、as44、banketa1、巴斯玛dramab84/31、巴斯玛izichnazp4/b、巴斯玛xanthibx2a、batek、besukijember、c104、coker347、criollomisionero、delcrest、djebel81、dvh405、comum、hb04p、希克斯阔叶、kabakulakelassona、kutsagee1、labu21、nc2326、nc297、pvh2110、redrussian、samsun、saplak、simmaba、talgar28、wislica、yayaldag、prilephc-72、prilepp23、prileppb156/1、prilepp12-2/1、yakajk-48、yakajb125/3、ti-1068、kdh-960、ti-1070、tw136、巴斯玛、tkf4028、l8、tkf2002、gr141、basmaxanthi、gr149、gr153、petithavana。即使本文未特别指明,也设想上述的低转化亚变种。

实施方案还涉及用于产生已被修饰以调节本文所述的ntsus多核苷酸(或如本文所述的其任何组合)的表达或功能的突变型植物、非天然存在的植物、杂交植物或转基因植物的组合物和方法。有利地,所获得的突变型植物、非天然存在的植物、杂交植物或转基因植物可以在整体外观上与对照植物相似或基本上相同。多种表型特征,如成熟程度、每一植物叶数、秆高、叶插入角度、叶大小(宽度和长度)、节间距离以及叶片-中脉比可以通过田地观测进行评价。

一个方面涉及本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物的种子。优选地,所述种子是烟草种子。另一方面涉及本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物的花粉或胚珠。此外,提供了如本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物,其还包含赋予雄性不育的多核苷酸。

还提供了如本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物或其一部分的可再生细胞的组织培养物,其中培养物再生能够表达亲本的所有形态和生理特征的植物。可再生细胞包括来自叶、花粉、胚、子叶、下胚轴、根、根尖、花药、花及其部分、胚珠、芽、茎、柄、髓和囊的细胞或来源于它们的愈伤组织或原生质体。

本文所述的植物材料可以是干制烟草材料,诸如烟道干制的(诸如弗吉尼亚型)或晒干的(诸如白肋烟型和黑烟型)烟草材料。本文所述的植物材料可以是晾干的烟草材料,诸如白肋烟型和黑烟型。

对于烟草干制的coresta推荐描述于:coresta指南第17号,2016年4月,sustainabilityinleaftobaccoproduction。

c.调节还原糖含量

一个目的是提供突变型、转基因或非天然存在的植物或其部分,其表现出植物材料中(例如,干制叶子中)至少一种还原糖的水平被调节。合适地,与对照植物相比,突变型、转基因或非天然存在的植物或其部分表现出至少一种还原糖的水平被调节。适当地,突变型、转基因或非天然存在的植物或其一部分具有与对照植物基本上相同的视觉外观。

因此,本文描述了与对照细胞或对照植物相比具有调节水平的至少一种还原糖的突变型、转基因或非天然存在的植物或其部分或植物细胞。突变型、转基因或非天然存在的植物或植物细胞已被修饰,以通过调节本文所述的一种或多种对应ntsus多核苷酸的表达来调节本文所述的一种或多种ntsus多肽的合成或功能。合适地,至少在绿叶、合适地早期干制叶子或干制叶子中观察到调节水平的至少一种还原糖。在某些实施方案中,可以调节植物(诸如绿叶、适当地早期干制叶子或干制叶子或干制烟草等)中的还原糖水平。在某些实施方案中,可以调节植物(诸如绿叶、适当地早期干制叶子、干制叶子或干制烟草等)中的还原糖水平。

在某些实施方案中,ntsus1-s、ntsus1-t、ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个的活性和/或表达被调节。

在某些实施方案中,ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个的活性和/或表达被调节。

在某些实施方案中,ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t中的一个或多个的活性和/或表达被调节,并且ntsus1-s、ntsus1-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个的活性和/或表达未被调节。

在某些实施方案中,ntsus2-s、ntsus2-t、ntsus3-s、ntsus3-t、ntsus4-s和ntsus4-t的活性和/或表达被调节,并且ntsus1-s、ntsus1-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t的活性和/或表达未被调节。

在某些实施方案中,ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s中的一个或多个的活性和/或表达被调节,并且ntsus1-s、ntsus1-t、ntsus2-t、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t中的一个或多个的活性和/或表达未被调节。

在某些实施方案中,ntsus2-s、ntsus3-s、ntsus3-t和ntsus4-s的活性和/或表达被调节,并且ntsus1-s、ntsus1-t、ntsus2-t、ntsus4-t、ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t的活性和/或表达未被调节。另一方面,涉及突变型、非天然存在的或转基因的植物或细胞,其中与所述ntsus多肽的表达或功能未被调节的对照植物相比,本文所述的一种或多种ntsus多肽的表达或功能被调节,并且植物的一部分(例如,绿叶、合适地早期干制叶子或干制叶子或干制烟草)具有降低水平的其中至少5%的至少一种还原糖。在某些实施方案中,可以调节(例如,至少约5%)植物(诸如绿叶、适当地早期干制叶子或干制叶子或干制烟草等)中的至少一种还原糖水平。

再一方面,涉及来源于或可来源于突变型、非天然存在的或转基因植物或细胞的干制植物材料(诸如干制叶子或干制烟草),其中本文所述的一种或多种ntsus多核苷酸的表达或由其编码的ntsus多肽的功能被调节,并且其中至少一种还原糖的水平与对照植物相比被调节至少5%。

适当地,所述植物或其一部分(例如叶)的视觉外观与对照植物基本上相同。合适地,植物是烟草植物或咖啡植物。

实施方案还涉及用于产生突变型、非天然存在的或转基因的植物或植物细胞的组合物和方法,所述植物或植物细胞已被修饰以调节本文所述的一种或多种ntsus多核苷酸或ntsus多肽的表达或功能,所述一种或多种多核苷酸或多肽可以产生具有调节的还原糖含量的植物或植物组分(例如,叶子(诸如绿叶或早期干制叶子或干制叶子)或烟草)或植物细胞。

根据本公开获得的突变型、非天然存在的或转基因的植物在视觉外观上可以与对应的对照植物相似或基本上相同。在一个实施方案中,突变型、非天然存在的或转基因植物的叶重与对照植物基本上相同。在一个实施方案中,突变型、非天然存在的或转基因植物的叶数目与对照植物基本上相同。在一个实施方案中,突变型、非天然存在的或转基因植物的叶重和叶数目与对照植物基本上相同。在一个实施方案中,例如在田间移植后一、二或三或更多个月或者在打顶后10、20、30或36或更多天,突变型、非天然存在的或转基因植物的秆高与对照植物基本上相同。例如,突变型、非天然存在的或转基因植物的秆高不低于对照植物的秆高。在另一个实施方案中,突变型、非天然存在的或转基因植物的叶绿素含量与对照植物基本上相同。在另一个实施方案中,突变型、非天然存在的或转基因植物的秆高与对照植物基本上相同,并且突变型、非天然存在的或转基因植物的叶绿素含量与对照植物基本上相同。在其他实施方案中,突变型、非天然存在的或转基因植物的叶的大小、或形状、或数目、或着色与对照植物基本上相同。合适地,植物是烟草植物或咖啡植物。

在另一方面,提供了用于调节植物的至少一部分(例如,叶子(诸如干制的叶子)或烟草)中的至少一种还原糖的量的方法,该方法包括以下步骤:(i)调节本文所述的一种或多种ntsus多肽(或如本文所述的其任何组合)的表达或功能,合适地,其中ntsus多肽由本文所述的对应ntsus多核苷酸编码;(ii)测量步骤(i)中获得的突变型、非天然存在的或转基因的植物的至少一部分(例如,叶子(诸如干制的叶子)或烟草或烟雾)中的至少一种还原糖的水平;以及(iii)鉴定与对照植物相比其中至少一种还原糖的水平已被调节的突变型、非天然存在的或转基因的植物。合适地,所述突变型、非天然存在的或转基因植物的视觉外观与对照植物基本上相同。合适地,所述植物是烟草植物。

在另一方面,提供了用于调节干制的植物材料诸如干制的叶子的至少一部分中的至少一种还原糖的量的方法,该方法包括以下步骤:(i)调节一种或多种ntsus多肽(或如本文所述的其任何组合)的表达或功能,合适地,其中ntsus多肽由本文所述的对应ntsus多核苷酸编码;(ii)收获植物材料诸如一种或多种叶子并干制一段时间;(iii)测量在步骤(ii)中或在步骤(ii)期间获得的干制植物材料的至少一部分中的至少一种还原糖的水平;以及(iv)鉴定与对照植物相比其中至少一种还原糖的水平已被调节的干制植物材料。

与对照相比,表达的增加可以为约5%至约100%,或增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或100%或更多,诸如200%、300%、500%、1000%或更多,其包括转录功能或ntsus多核苷酸表达或ntsus多肽表达或它们的组合的增加。

与对照相比,功能或活性的增加可以为约5%至约100%,或增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或100%或更多,诸如200%、300%、500%、1000%或更多。

与对照相比,表达的减少可以为约5%至约100%,或减少至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或100%,其包括转录功能或ntsus多核苷酸表达或ntsus多肽表达或它们的组合的减少。

与对照相比,功能或活性的降低可以为约5%至约100%,或降低至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或100%。

本文所述的多核苷酸和重组构建体可用于调节目的植物物种(合适地为烟草)中的本文所述的ntsus多核苷酸或ntsus多肽的表达或功能或活性。

许多基于多核苷酸的方法可用于增加基因在植物和植物细胞中的表达。作为实例,可以制备与待转化的植物相容的构建体、载体或表达载体,其包括目的基因连同能够在植物或植物细胞中过表达所述基因的上游启动子。示例性启动子在本文中描述。转化后,并且当在合适的条件下生长时,启动子可驱动表达,以调节植物或其特定组织中ntsus的水平。在一个示例性实施方案中,生成携带本文所述的一种或多种ntsus多核苷酸(或如本文所述的其任何组合)的载体,以在植物或植物细胞中过表达所述基因。所述载体携带位于转基因上游的合适启动子(如花椰菜花叶病毒camv35s启动子),从而驱动所述转基因在植物的所有组织中的组成型表达。所述载体还携带抗生素抗性基因,以便对经转化的愈伤组织和细胞系赋予选择。

来自启动子的序列的表达可通过包括表达控制序列(包括增强子、染色质激活元件、转录因子反应元件等)增强。此类控制序列可为组成型的,且以通用方式上调转录;或其可为兼性的,且响应于特定信号上调转录。专门指示与衰老相关的信号和在干制程序期间活跃的信号。

因此,各种实施方案涉及通过将ntsus多核苷酸的多个拷贝整合到植物基因组中来调节本文所述的一种或多种ntsus多核苷酸(或如本文所述的其任何组合)的表达水平的方法,包括:用包含与本文所述的一种或多种ntsus多核苷酸可操作地连接的启动子的表达载体转化植物细胞宿主。由重组多核苷酸编码的多肽可以是天然多肽,或对于细胞可以是异源的。

在一个实施方案中,本公开中使用的植物是烟道干制的植物,因为这样的植物具有高还原糖含量(在干制结束时田间生长时大于约14%干重)。烟道干制的突变型、转基因或非天然存在的植物或其部分可具有在干制结束时田间生长时小于约14%干重的还原糖含量,诸如在干制结束时田间生长时小于约10%干重的还原糖含量,或在干制结束时田间生长时小于约5%干重的还原糖含量,或在干制结束时田间生长时小于约1%干重的还原糖含量。

在一个实施方案中,本公开中使用的植物是晒干的植物,因为这样的植物具有在干制结束时田间生长时大于约6.8%干重的还原糖含量。晒干的突变型、转基因或非天然存在的植物或其部分可具有在干制结束时田间生长时小于约5%干重的还原糖含量,诸如在干制结束时田间生长时小于约2.5%干重的还原糖含量,或在干制结束时田间生长时小于约1%干重的还原糖含量。

在一个实施方案中,本公开中使用的植物是晾干的植物。这样的植物在干制结束时田间生长时具有大于约1.7%干重的还原糖含量。晒干的突变型、转基因或非天然存在的植物或其部分可具有在干制结束时田间生长时小于约1.5%干重的还原糖含量,诸如在干制结束时田间生长时小于约1%干重的还原糖含量,或在干制结束时田间生长时小于约0.5%干重的还原糖含量。

在某些实施方案中,优选使用烟道干制或晒干的植物。测量游离氨基酸含量

氨基酸含量可以使用本领域已知的多种方法来测量。一种这样的方法是methodmp1471rev52011,resana,italy:chelabsillikers.r.l,mérieuxnutrisciencescompany。为了确定干制植物叶子中的氨基酸,如果需要,去除中肋中后,将干制叶子在40℃下干燥2-3天。然后,在分析氨基酸含量之前,将烟草材料磨成细粉(~100um)。测量植物材料中氨基酸含量的另一种方法描述在unieniso13903:2005中。在某些实施方案中,根据unieniso13903:2005进行游离氨基酸含量的测量。

测量还原糖含量

还原糖含量可以使用skalarinstrumentco(westchester,pa)开发并在tobaccoscience20:139-144(1976)中描述的用于分析烟草样品的分段流比色法来测量。还原糖含量的测量也在coresta推荐方法38、crm38、crm和iso15154:2003中有所描述。为了确定干制叶子中的还原糖,如果需要,去除中肋中后,将干制叶子在40℃下干燥2-3天。然后,在分析还原糖之前,将烟草材料磨成细粉(~100um)。在某些实施方案中,还原糖含量的测量是根据iso15154:2003进行的。

育种

携带本文中所描述的一种或多种ntsus多核苷酸(或如本文中所描述的其任何组合)的突变体等位基因的植物可以用于植物育种计划,以产生有用的品系、品种和杂种。特别地,可以使所述突变体等位基因渗入上述商业上重要的品种内。因此,提供了用于植物育种的方法,其包括将如本文所述的突变型植物、非天然存在的植物或转基因植物与含有不同遗传一致性的植物进行杂交。所述方法可以进一步包括将后代植物与另一植物杂交,且任选地重复杂交直到获得具有期望的基因性状或基因背景的后代。这类育种方法发挥的一个目的是将期望的基因性状引入其他品种、育种品系、杂种或栽培品种,尤其是具有商业利益的那些。另一个目的是便于在单个植物品种、品系、杂种或栽培品种中叠加不同基因的基因修饰。考虑种内以及种间交配。源自这类杂交的后代植物,也称为育种品系,是本公开的非天然存在的植物的实例。

在一个实施方案中,提供了用于产生非天然存在的植物的方法,该方法包括:(a)将突变型或转基因植物与第二植物杂交以产生后代烟草种子;(b)在植物生长条件下生长后代烟草种子以产生非天然存在的植物。该方法还可包括:(c)将上一代非天然存在的植物与其自身或另一种植物杂交以产生后代烟草种子;(d)在植物生长条件下生长步骤(c)的后代烟草种子,以产生另外的非天然存在的植物;以及(e)重复(c)和(d)的杂交和生长步骤多次以产生非天然存在的植物的进一步后代。所述方法可以任选包括在步骤(a)之前提供亲本植物的步骤,所述亲本植物包含得到表征且不同于突变型或转基因植物的遗传一致性。在一些实施方案中,取决于育种计划,将杂交和生长步骤重复0至2次、0至3次、0至4次、0至5次、0至6次、0至7次、0至8次,0至9次或0至10次,以便产生非天然存在的植物的世代。回交是这类方法的实例,其中后代与其亲本之一或与其亲本基因相似的另一植物进行杂交,以便获得在下一代中具有更接近于亲本之一的基因一致性的后代植物。用于植物育种,特别是植物育种的技术是众所周知的,并且可用于本公开的方法中。本公开还提供了通过这些方法产生的非天然存在的植物。某些实施方案不包含选择植物的步骤。

在本文中所描述方法的一些实施方案中,使用标准田地程序在田地评估源自育种和筛选变体基因的品系。包含原始未诱变亲本的对照基因型包含在内,并且按随机化完全区组设计或其他适当的田地设计,将入选者(entry)排列于田地。对于烟草,使用标准的农学实践,例如将烟草收获、称量且取样,用于在干制之前和干制期间的化学及其他常见测试。执行数据的统计分析,以确认所选择品系与亲本品系之间的相似性。任选地执行所选植物的细胞基因学分析,以确认染色体组和染色体配对关系。

dna指纹鉴定、单核苷酸多态性、微卫星标记或类似技术可用在标记辅助选择(mas)的育种计划中,以如本文所述的,将基因的突变等位基因转移或培育到其他烟草内。举例来说,育种者可通过含有突变体等位基因的基因型与农学期望的基因型的杂交来产生分离的群体。可使用本文中所列出的技术之一,使用从基因组序列或其片段所开发的标记来筛选f2中的植物或回交世代。鉴定为具有突变体等位基因的植物可以回交或自花授粉,以产生待筛选的第二群体。取决于预期遗传模式或所用mas技术,有必要在每轮回交之前对所选择的植物进行自花授粉,以帮助鉴定所需个体植物。可重复进行回交或其他育种操作,直到恢复轮回亲本的所需表型。

根据本公开内容,在育种计划中,成功的杂交获得能育的f1植物。所选择的f1植物可与亲本之一杂交,并且第一回交世代植物进行自花授粉,以产生再次筛选变体基因表达(例如,基因的无效版本)的群体。将回交、自花授粉和筛选的过程重复例如至少4次,直到最终筛选产生可育且与轮回亲本相当相似的植物。如果需要的话,这种植物进行自花授粉,并且随后再次筛选后代,以确认植物展现变体基因表达。在一些实施方案中,筛选f2代中植物群体的变体基因表达,例如根据标准方法鉴定由于缺乏基因而不能表达多肽的植物,例如通过使用pcr方法,其中引物基于本文所述的多核苷酸(或如本文所述的其任何组合)的多核苷酸序列信息。

杂交烟草品种可通过以下方式产生:阻止第一品种的雌性亲本植物(即,种子亲本)的自花授粉,允许来自第二品种的雄性亲本植物的花粉使雌性亲本植物受精,且允许f1杂种种子在雌性植物上形成。可通过在花发育早期阶段将花朵去雄来阻止雌性植物的自花授粉。或者,可使用雄性不育的形式阻止在雌性亲本植物上形成花粉。举例来说,可通过细胞质雄性不育(cms)或转基因雄性不育来产生雄性不育,其中转基因抑制小孢子和/或花粉形成、或自交不相容。含有cms的雌性亲本植物是特别有用的。在雌性亲本植物是cms的实施方案中,从雄性可育植物收获花粉并人工施用于cms雌性亲本植物的柱头,并且收获所得到的f1种子。

本文所述品种和品系可用于形成单杂交烟草f1杂种。在这类实施方案中,亲本品种的植物可生长为基本上同质的相邻群体,以便于雄性亲本植物与雌性亲本植物的天然异花授粉。通过常规方式选择性地收获在雌性亲本植物上形成的f1种子。还可大批种植两个亲本植物品种,并收获由于自花授粉而在雌性亲本上形成的f1杂种种子和在雄性亲本上形成的种子的掺合物。或者,可进行三系杂交,其中单杂交f1杂种用作雌性亲本,并且与不同的雄性亲本杂交。作为另一替代方案,可产生双杂交杂种,其中两个不同单杂交的f1后代进行自身杂交。

可在突变型、非天然存在的或转基因植物群体中,筛选或选择具有所需性状或表型的那些群体成员。例如,可以筛选单个转化事件的后代群体中的具有所需表达水平或由其编码多肽的功能的那些植物。可使用物理和生物化学方法来鉴定表达或活性水平。这些方法包括用于检测多核苷酸的southern分析或pcr扩增;用于检测rna转录物的northern印迹、s1rnase保护、引物延伸或rt-pcr扩增;用于检测多肽和多核苷酸的酶或核酶功能的酶分析;以及用于检测多肽的多肽凝胶电泳、western印迹、免疫沉淀和酶联免疫分析。其他技术诸如原位杂交、酶染色、免疫染色和酶测定也可用于检测ntsus多肽或ntsus多核苷酸的存在或表达、功能或活性。

如本文所述的突变型、非天然存在的或转基因植物细胞和植物包括一种或多种重组多核苷酸、一种或多种多核苷酸构建体、一种或多种双链rna、一种或多种结合物或者一种或多种载体/表达载体。

5.其他基因的修饰

非限制性地,本文所述的植物及其部分可以在根据本公开的一种或多种ntsus多核苷酸和/或ntsus多肽的表达、功能或活性已被调节之前或之后被修饰。

在突变型、非天然存在的或转基因植物及其部分中可以存在一种或多种下列进一步的基因修饰。

可以修饰涉及氮代谢中间体转化的一个或多个基因,从而降低至少一种烟草特异性亚硝胺(tsna)的水平。此类基因的非限制性实例包括编码尼古丁脱甲基酶的那些(诸如wo2006/091194、wo2008/070274、wo2009/064771和wo2011/088180中所述的cyp82e4、cyp82e5和cyp82e10),以及硝酸还原酶,如wo2016/046288中所述的。

可以修饰参与重金属吸收或重金属转运的一个或多个基因,从而降低重金属含量。非限制性实例包括以下中的基因:多药抗性相关多肽家族、阳离子扩散促进因子(cdf)家族、zrt-irt样多肽(zip)家族、阳离子交换剂(cax)家族、铜转运蛋白(copt)家族、重金属atp酶家族(例如hma,如wo2009/074325和wo2017/129739中所述)、天然抗性相关巨噬细胞多肽(nramp)的同系物家族和atp结合盒(abc)转运蛋白家族的其他成员(例如mrp),如wo2012/028309中所述,其参与重金属诸如镉的转运。

其他示例性修饰可产生具有调节的表达或功能的异丙基苹果酸合酶的植物,这导致蔗糖酯组成的改变,其可用于改变喜好概况(参见wo2013/029799)。

其他示例性修饰可产生具有调节的表达或功能的苏氨酸合酶的植物,其中甲硫氨酸的水平可以被调节(参见wo2013/029800)。

其他示例性修饰可产生具有调节的表达或功能的新黄质合酶、番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶中的一种或多种的植物,以调节β-大马酮含量来改变风味特征(参见wo2013/064499)。

其他示例性修饰可产生具有调节的表达或功能放入氯化物通道的clc家族成员的植物,以调节其中的硝酸盐水平(参见wo2014/096283和wo2015/197727)。

其他示例性修饰可产生具有调节的一种或多种天冬酰胺合成酶的表达或功能的植物,以调节叶子中的天冬酰胺的水平和调节在加热或燃烧叶子时产生的气溶胶中的丙烯酰胺的水平(参见wo2017/042162)。

其他修饰的实例包括调节除草剂耐受性,例如,草甘膦是许多广谱除草剂的活性成分。通过转移aroa基因(来自鼠伤寒沙门氏菌(salmonellatyphimurium)和大肠杆菌(e.coli)的草甘膦epsp合成酶),已开发草甘膦抗性转基因植物。通过转化来自拟南芥的突变als(乙酰乳酸合成酶)基因已产生了抗磺脲植物。来自突变绿穗苋(amaranthushybridus)的光系统ii的ob多肽已被转移到植物中以产生抗阿特拉津转基因植物;并且抗溴苯腈转基因植物已通过掺入来自细菌克雷伯氏肺炎菌(klebsiellapneumoniae)的bxn基因而产生。

另一示例性修饰导致对昆虫具有抗性的植物。苏云金芽孢杆菌(bacillusthuringiensis,bt)毒素可以提供一种有效方式来延迟抗bt害虫的出现,如在花椰菜中最近说明的,其中金字塔形cry1ac和cry1cbt基因控制对任一单个多肽具有抗性的小菜蛾,并且显著延迟抗性昆虫的进化。

另一示例性修饰产生对由病原体(例如病毒、细菌、真菌)引起的疾病具有抗性的植物。已经设计了表达xa21基因(抗白叶枯病)的植物和表达bt融合基因和几丁质酶基因(抗三化螟和耐鞘)的植物。

另一示例性修饰产生改变的生殖能力,例如雄性不育。

另一示例性修饰产生耐受非生物胁迫(例如,干旱、温度、盐度)的植物,并且通过转移来自拟南芥属的酰基甘油磷酸酶,已产生耐受的转基因植物;编码甘露醇脱氢酶和山梨糖醇脱氢酶的基因改善抗旱性,所述甘露醇脱氢酶和山梨糖醇脱氢酶涉及甘露醇和山梨糖醇合成。

另一种示例性修饰产生其中一种或多种内源性糖基转移酶诸如n-乙酰葡糖胺基转移酶、β(1,2)-木糖基转移酶和α(1,3)-岩藻糖基转移酶的活性被调节的植物(参见wo2011/117249)。

另一种示例性修饰产生其中一种或多种尼古丁n-脱甲基酶的活性被调节的植物,使得可以调节在干制期间形成的降烟碱和降烟碱代谢物的水平(参见wo2015169927)。

其他示例性修饰可以产生具有改善的储存多肽和油的植物、具有增强的光合效率的植物、具有延长的保存期限的植物、具有增强的碳水化合物含量的植物和抗真菌的植物。也可设想s-腺苷-l-甲硫氨酸(sam)和/或胱硫醚γ-合酶(cgs)的表达已被调节的转基因植物。

参与尼古丁合成途径的一个或多个基因可以被修饰,从而产生在干制时产生调节水平的尼古丁的植物或植物部分。尼古丁合成基因可以选自由以下组成的组:a622、bbla、bblb、jre5l1、jre5l2、mate1、mate2、mpo1、mpo2、myc2a、myc2b、nbb1、nic1、nic2、nup1、nup2、pmt1、pmt2、pmt3、pmt4和qpt或它们中的一个或多个的组合。

参与控制一种或多种生物碱的量的一个或多个基因可以被修饰,从而得到产生调节水平的生物碱的植物或植物部分。生物碱水平控制基因可以选自由以下组成的组:bbla、bblb、jre5l1、jre5l2、mate1、mate2、myc2a、myc2b、nic1、nic2、nup1和nup2或它们中的一个或多个的组合。

一种或多种此类性状可基因渗入来自另一栽培品种的突变型、非天然存在的或转基因植物,或可直接转化到其内。

各种实施方案提供了突变型植物、非天然存在的植物或转基因植物,以及生物质,其中根据本公开的一种或多种多核苷酸的表达水平被调节,从而调节由其编码的多肽的水平。

6.消耗品

本文所述植物的部分,特别是这些植物的叶片和中脉,可以掺入或用于制备各种消耗品,包括但不限于气溶胶形成材料、气溶胶形成装置、吸烟制品、可抽吸制品、无烟产品、医药或美容产品、静脉内制剂、片剂、粉末和烟草产品。气溶胶形成材料的实例包括烟草组合物、烟草、烟草提取物、烟丝、切丝填料、干制的烟草、膨胀烟草、均质烟草、再造烟草和烟斗烟草。吸烟制品和可抽吸制品是气溶胶形成装置的类型。吸烟制品或可抽吸制品的实例包含香烟、小雪茄和雪茄。无烟产品的实例包括嚼烟和鼻烟。在某些气溶胶形成装置而不是燃烧中,烟草组合物或另一气溶胶形成材料被一个或多个电加热元件进行加热,以产生气溶胶。在另一类型的被加热的气溶胶形成装置中,通过将热量从可燃性燃料元件或热源转移到物理上分开的气溶胶形成材料来产生气溶胶,所述气溶胶形成材料可以位于热源内、热源周围或热源下游。无烟烟草产品和多种含烟草的气雾形成材料可包含任何形式的烟草,包括沉积在其他成分上、混合于其他成分中、由其他成分包围或以其他方式与其他成分组合的干燥颗粒、碎片、小颗粒、粉末或浆料,所述其他成分采取任何形式,例如絮片、膜、卡(tab)、泡沫或珠。如本文中所使用,术语“烟雾”用于描述由例如香烟等吸烟制品或通过燃烧气溶胶形成材料而产生的一类气溶胶。

在一个实施方式中,本发明还提供了来自本文所述的突变型、转基因和非天然存在的植物的干制的植物材料。干制绿色烟叶的工艺是本领域技术人员已知的,并且包括但不限于如本文所述的晾干、火烤干制、烟道干制和晒干。

在另一个实施方式中,本发明描述了包括含有烟草的气雾形成材料的烟草产品,所述气雾形成材料包含来自本文所述的突变型烟草植物、转基因烟草植物或非天然存在的烟草植物的植物材料,例如叶,优选干制的叶。本文中所描述的烟草产品可以是掺合的烟草产品,其还可包括未修饰的烟草。

7.用于作物管理和农业的产品和方法

突变型、非天然存在的或转基因植物可具有在例如农业中的其他用途。例如,本文所述的突变型、非天然存在的或转基因植物可用于制备动物饲料和人类食物产品。

本公开还提供了用于产生种子的方法,其包括培养本文所述的突变型植物、非天然存在的植物或转基因植物,并且从栽培的植物收集种子。来自本文所述植物的种子可通过本领域中已知的方式进行条件处理,且包装在包装材料中,以形成制造物品。如纸和布等包装材料是本领域众所周知的。种子的包装可带有描述其中种子的性质的标记,例如固定到包装材料的标签或标记、印刷在包装上的标记。

用于对植物基因分型以鉴定、选择或育种的组合物、方法和试剂盒可包括检测多核苷酸样品中的ntsus多核苷酸(或如本文中所描述的其任何组合)存在的方式。因此,描述了一种组合物,其包含用于特异性扩增一种或多种ntsus多核苷酸的至少一部分的一种或多种引物,以及用于进行扩增或检测的任选地一种或多种探针和任选地一种或多种试剂。

相应地,公开了基因特异性的寡核苷酸引物或探针,其包含对应于本文所述的ntsus多核苷酸的约10个或更多个邻接多核苷酸。所述引物或探针可包含以下或由以下组成:约15、20、25、30、40、45或50个或更多个邻接多核苷酸,所述引物或探针与本文所述的一种或多种ntsus多核苷酸杂交(例如,特异性地杂交)。在一些实施方案中,引物或探针可包含约10至50个连续核苷酸、约10至40个连续核苷酸、约10至30个连续核苷酸或约15至30个连续核苷酸,或由其组成,其可用于基因鉴定(例如,southern杂交)或分离(例如,细菌菌落或噬菌斑的原位杂交)或基因检测(例如,作为扩增或检测中的一种或多种扩增引物)的序列依赖性方法。可设计一个或多个特异性引物或探针,且用于扩增或检测多核苷酸的部分或全部。作为具体实例,可以在pcr方案中使用两种引物来扩增多核苷酸片段。pcr也可以使用来源于多核苷酸序列的一种引物和与多核苷酸序列上游或下游序列杂交的第二种引物进行,所述多核苷酸序列诸如启动子序列、mrna前体的3'端或来源于载体的序列。用于体外扩增多核苷酸的热和等温技术的实例是本领域众所周知的。样品可以是或可源自植物、植物细胞或植物材料,或者由如本文所述的植物、植物细胞或植物材料制备或衍生的烟草产品。

在另一方面,还提供了检测样品中本文所述的ntsus多核苷酸(或如本文所述的其任何组合)的方法,该方法包括以下步骤:(a)提供包含或疑似包含多核苷酸的样品;(b)使所述样品与一种或多种引物或一种或多种探针接触,以特异性检测ntsus多核苷酸的至少一部分;以及(c)检测扩增产物的存在,其中扩增产物的存在指示样品中ntsus多核苷酸的存在。在另一方面,还提供了一种或多种引物或探针用于特异性检测ntsus多核苷酸的至少一部分的用途。还提供了用于检测至少一部分ntsus多核苷酸的试剂盒,其包含用于特异性检测至少一部分ntsus多核苷酸的一种或多种引物或探针。试剂盒可包含用于多核苷酸扩增(如pcr)的试剂,或用于探针杂交检测技术(如dna印迹、rna印迹、原位杂交或微阵列)的试剂。试剂盒可包括用于抗体结合检测技术(如蛋白质印迹、elisa、seldi质谱法或测试条)的试剂。试剂盒可包括用于dna测序的试剂。试剂盒可包括试剂和使用说明。

在一些实施方案中,试剂盒可包括用于所述方法中的一种或多种的说明书。所述试剂盒可用于遗传一致性确定、系统发生研究、基因分型、单倍体分型、谱系分析或植物育种,特别是共显性评分。

本公开还提供了对包括如本文所述的ntsus多核苷酸的植物、植物细胞或植物材料进行基因分型的方法。基因分型提供了区分染色体对的同源物的手段,并且可用于区分植物群体中的分离体。分子标记方法可用于系统发生研究、表征作物品种之间的遗传关系、鉴定杂交或体细胞杂种、定位影响单基因性状的染色体区段、图位克隆和定量遗传研究。基因分型的具体方法可采用任意数目的分子标记分析技术,包含扩增片段长度多态性(aflp)。aflp是由多核苷酸变异性引起的扩增片段之间的等位基因差异的产物。因此,本公开进一步提供了使用诸如aflp分析的技术来追踪一个或多个基因或多核苷酸以及与这些基因或多核苷酸基因连接的染色体序列的分离的方法。

还在以下实例中描述了本发明,提供所述实例以更详细地描述本发明。这些实例阐述目前设想用于进行本发明的优选模式,意图说明而不是限制本发明。

实施例

实施例1:白肋烟、弗吉尼亚烟和东方烟烟草叶子干制后的关键蔗糖代谢基因的鉴定

为了鉴定在白肋烟、弗吉尼亚烟和东方烟烟草叶子的早期干制期间导致蔗糖代谢的关键功能,在白肋烟、弗吉尼亚烟和东方烟中,对干制48小时后的干制叶子中与收获时成熟的叶子相比上调的基因功能进行了过表达分析(log2倍数变化>2,调整的p值<0.05)。鉴定了涉及产生还原糖的基因,这些基因在干制48小时后是有活性的,与干制类型和烟草品种无关。鉴定了参与还原糖产生的烟草基因。

在叶子的早期干制期间直接参与还原糖产生的关键基因属于sus基因家族。sus可能是驱动还原糖在干制的离体叶子中积累的关键酶。

发现该烟草基因组具有12个ntsus基因产物,分布在6个家族中,每个原型具有一个s和一个t拷贝:ntsus1-s(seqidno:1)、ntsus1-t(seqidno:3)、ntsus2-s(seqidno:5)、ntsus2-t(seqidno:7)、ntsus3-s(seqidno:9)、ntsus3-t(seqidno:11)、ntsus4-s(seqidno:13)、ntsus4-t(seqidno:15)、ntsus5-s(seqidno:17)、ntsus5-t(seqidno:19)、ntsus6-s(seqidno:21)和ntsus6-t(seqidno:23)。

sus转录物来自基因组序列ntsus2-s(seqidno:5)、ntsus3-s(seqidno:9)、ntsus3-t(seqidno:11)和ntsus4-s(seqidno:13)。这些基因在叶子干制(衰老)期间被上调,如表1所示。这证实了s拷贝特别地参与了早期干制叶子的化学修饰,并且在这种特定情况下,葡萄糖和果糖增加。

尽管在白肋烟的干制叶子中发现的还原糖水平较低,但与弗吉尼亚烟和东方烟相比(参见图1),ntsus基因仍在白肋烟中被激活(参见表1),这可能是作为组成型响应,也确保了在早期干制阶段用于氨基酸合成的可用碳源。

在白肋烟(bu)和弗吉尼亚烟(fc)中,在早期干制期间未表达的ntsus1-s和ntsus1-t(见表1)在根和茎中特别表达,表明在这些组织中可能存在特定功能来递送碳水化合物用于细胞壁合成或在缺氧状态下供应碳源。在另一方面,在叶子早期干制期间诱导的ntsus3-s、ntsus3-t、ntsus4-s也在所有器官中表达,而ntsus2-s和ntsus2-t主要在未成熟的花和花瓣中表达。ntsus5-s、ntsus5-t、ntsus6-s和ntsus6-t在所有分析的植物组织中均以低水平表达(见表2)。

为了增加干制叶子中的还原糖库,可以考虑使用衰老诱导型启动子如sag12或e4来过表达ntsus2-s、ntsus3-s、ntsus3-t和/或ntsus4-s(使用组成型启动子可能会强烈改变植物的新陈代谢。在另一方面,敲除ntsus2-s、ntsus3-s、ntsus3-t和/或ntsus4-s可有助于降低干制叶子中还原糖的含量。

实施例2–弗吉尼亚烟烟草叶中ntsus表达的沉默

对白肋烟中ntsus的沉默进行了研究,以确定这些基因是否有助于降低干制的弗吉尼亚烟烟草叶中的还原糖含量。在ntsus的编码序列内的特定dna片段与强组成型紫茉莉花叶病毒(mmv)启动子一起克隆在gateway载体中。在mmv与根癌农杆菌(agrobacteriumtumefaciens)的胭脂碱合酶基因的3’nos终止子序列之间侧接ntsus基因片段。

为了能够选择低还原糖含量的植物,在干制60小时后分析独立的t0植物叶片和相应的对照品系,以确定对还原糖含量的影响。最佳t0品系显示所选择的还原糖的最低水平。从这些最佳t0品系收获种子。通过qpcr测定t1子代以确定与降低还原糖含量相关的ntsus沉默事件的效率。

操作ntsus基因(例如,使用组成型启动子或特定的衰老启动子,诸如sag12或e4)可改变干制烟草叶的化学性质。类似地,使用基因编辑策略(诸如crispr-cas或突变体选择)敲除ntsus基因可改变商品烟草的主要品种的氨基酸叶子化学性质。

在本文中引用的或描述的任何出版物都提供了在本申请的提交日期之前公开的有关信息。本文中的陈述不应解释为承认发明人丧失先于这样的公开的资格。在上面的说明书中提及的所有出版物都通过引用并入本文。在不脱离本发明的范围和精神的情况下,本发明的各种修改和变化对于所属领域的技术人员来说将是显而易见的。尽管已经结合特定优选实施方案来描述本发明,但应理解,如所要求的本发明不应不恰当地限于此类特定实施方案。实际上,细胞生物学、分子生物学和植物生物学或有关领域的技术人员显而易见的用于实现本发明的所描述模式的不同改进意图在以下权利要求书的范围内。

表1

白肋烟(bu)、弗吉尼亚烟(fc)和东方烟(or)在早期干制期间的ntsus基因的表达

表2

ntsus基因在田间生长的白肋烟(bu)和弗吉尼亚烟(fc)植物的根、茎、中叶、未成熟花(imflower)、萼片和花瓣中的表达

序列表

seqidno:1:ntsus1-s的多核苷酸序列

atggcagctagtggtcttagcattaagaaaagtttggaggaatccattttggctcatccagatgaaattttggctctcaagtcaaggtacattactacatataatgatattaagaactagaggcttatccaaggttttgttacatttttgaaattataagtttagaacctaatagtacttggtagcacttgtttccttattatctagctgttgttactgcttgttgctactgctttctgttcatctttccttgagcccggtctatcggaaacaacctctctattctcaaagtataaggtttgcgtacatactacctccccagactctacttgtggaatttactgtttttgttgtgttgttgtaatctaatatttattagaattttactgatttttcacatatatatatctatgtcccctgtcgaaaattctatagctcatgttagctaaatacattagtaccattgtttttaattgttttggttttggcacaggattgaaactgaagggaaaggggtaatgaaaccacttgatctcttgaaccatttggtttctgttactagtaagacaaatggagtaaatattgtacctagtgcacttgtggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtggctgaattaagcattcctgaataccttcaattgaaagagaacactgttgatgaaaggtaaagtattagtctgcgatttcgctttgtgaaattgaagtttttgttttgattcataatgttttgtgtatcaattatgttaccagtggaaacatattggagttggattttgagccatttacaacagttacaccaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcatgataaggagatttccagatgcctccttgacttcctcagaaaccataactacaaaggaaaggtaataaaaaaaagtgtttctttaaacaagttgtatgattatgtgtatatttctaagtatgttaacttgaaaacagtcattgatggtgaaagaaagcattcaaagcctagagagtttccaacttgttctgaaaaaagcagaggaacatttgtgcacattgaatccagaaactccatactccaattttgaatcaaagtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacactatcagtcatcttttgcatctccttgaggctcctaacgcgtcttctttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctaactccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccaatattttgcattcttgatcaagttctttataccatttgaaccaacaatcttnaacattctttttttggttgtgaaatgttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgatgatatcatccctcgcatccttgttgtaagtggccttaattttcctagtttcatttacacctctaaatgaaattgatcttttttgttgttttatatcaggtaacaaggctgctgcctgatgcagtaggaaccacctgtggcgagcggatggagaaagtatatggggcagaacattctcatataattcgtgttccatttagaactgagaagggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaataaaatccattggaatgttccttctgcaattgaaaatgtcttgctaactgaagacccatttttaaattgatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgatcattggaaactacagtgagggaaatcttgctgcctctttgcttgcgaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctctttgccatgaatcacactgatttcatcatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttacccttgtttatactatttccattcaccgaccccgacttgtttaggattgagccatagttgttgttgttgtttgtttatactatttccatttgccgaccacaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccctaacttgtttgggactgaggcatagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgttgtttgtttatactatttccatttgccgaccccaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccccaacttgtttgggactgaggcatagtagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgtttgtttatactatttcaatttgtcgaccccaatttgtttgggaccaaggcatggttgttgttgttgtttgtttgtttttactgtttccattgatattggaacatttgttatttgcagcaaaaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtaccgagtagtccatggaatcgattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaatctacttcccttacactgagaaggagaaaaggctaaccaacttccacccggaaattgaagaactcctctacagtcctgttgagaataaggaccacttgttagtctccttaatttgcttttatttcatcccatttatgatcgcttttatcccaacagatcgattaatcatttgttatcaacataaacagatgtgtgttgaaggaccggaacaagccaattctctttaccatggcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgctaagaatgcaaggctgagggagcttgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagatgaagaagatgtatgatcttatcgaaacctataacctgaacggccaattcaggtggatttcttcccaaatgaatcgtgtgaggaacggagaactctatcgttacattgcagacacgaggggtgctttcgttcaaccagcattctacgaggcttttggtttgacagttgtagagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggtaaatttctttgaaaaatctaaagaagatccaagttattgggatgctatttccaagggaggtctgcaacgtattcttgaaaagtaagcttttgcatttgattagcacaagtgcacaaccaagatttaacttttgaacaaactaaaactaacccttttttgtattttcttttgctaggtatacatggcaaatttattcacagaaagtgatcacactatctgggatttatggattctggaagtatgcaaccaagaatgataaagttgctagtgcaaagaagcgctatcttgagatgttttatgaacttggatttaagaaatcagtaagtgtcaattttaaaggggaaccttggatcaacggttaagttgtctttgtgcaacctataggtcaggggtttgagccgtagaagtagccactaatatttacattagggtagactgtgtacatatcacaccccttggggtacggccctttcctggatcctgtatgaacgcgggatgccttgtgcaccgggctgtatttttttttttagtgtcacttctgtattttgtttgagcttgtttataaagtttggaaatctgctgctaatttgtatatttgttggttgtgtatttcaggctgagaaagttccattggctattgatgaatag

seqidno:2:ntsus1-s的多肽序列

maasglsikksleesilahpdeilalksrietegkgvmkpldllnhlvsvtsktngvnivpsalvevlscsqeavivppklalavrprpgvweylslnlktkkvaelsipeylqlkentvdesgnileldfepfttvtppktlsdsigngleflnrhiaskmfhdkeisrclldflrnhnykgkslmvkesiqslesfqlvlkkaeehlctlnpetpysnfeskfeeiglergwgntaervqdtishllhlleapnasslenflgriplvfnvviltphgyfaqdnvlgypdtggqvvyildqvpameremlhrmklqglddiiprilvvtrllpdavgttcgermekvygaehshiirvpfrtekgmlrkwisrfevwpymetftedvaeelvkelqakpdliignysegnlaasllakkfgatqctiahalektkypnsdlnwkkfddkyhfssqftadlfamnhtdfiitstfqeiagskntvgqyeshtaftmpglyrvvhgidsfdpkfnivspgadmsiyfpytekekrltnfhpeieellyspvenkdhlcvlkdrnkpilftmarldrvknltglvewyaknarlrelvnlvvvggdrrkeskdleeqaemkkmydlietynlngqfrwissqmnrvrngelyryiadtrgafvqpafyeafgltvvesmtcglptfatcnggpfeiivngksgfhidpnqgdkaadmlvnffekskedpsywdaiskgglqrilekytwqiysqkvitlsgiygfwkyatkndkvasakkrylemfyelgfkksaekvplaide

seqidno:3:ntsus1-t的多核苷酸序列

atggcaggcagtggtcttagcattaaggaaagtttggaggaatccattttggctcatccagatgaaattttggctctcaagtcaaggtacattactgcataatgatattaagacctagaagcggatccaagattttgttacatttttgaaattataagtttagaatctaatatttgttatcgcttgtttccttattatcttgctgttgttactgcctgttgctactagtttctgttcatccttccttgagctgagtttctatcggaaacaacctctctactctcaaagtaggaataagttatgcgtacacactaccctccccagactccacttgtgtaatttactgagtttgttgttgttgttgttgtaatctaatacttgttagaattttactgatttttcacatatatatctatgacccatgtcgaaaatactatagctcatgtgctaaatacattagtaccattgttttgtaattgttttggttttggaacaggattgaaactgaagggaaaggggtaatgaaaccagttgatctcttgaaccatttggtttctgttactagtaaaacaaatggagtaaatgttgtacctagtgcacttgtggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtggctgaattgagcattcctgagtaccttcaattgaaagagaatactgttgatgaaaggtaaagtaatagtctgcgatttcgctttgtgaaattgaagttttttgtttgattcttaatgttttgtgtatcaattatgttaccagtggaaacatcttggagttggattttgagccatttacaactgttacaacaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcttgataaggagattgccaagtgcctccttgactttctcagaaaccataactacaaaggaaaggtagtaaaaaaagtgtttctttaaacaagttgtatgattatgtgtgtatttctaaatatgtcaatttgaaaacagtcattgatggtgaaagaaagcattcaaagcctggagagtttccaacttgttctgaaaaaagcagaggaatatttgcacacactgaatccagaaactccatactccaaatttgaatccaagtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacaccattagtcatcttttgcatctccttgaggctcctaacgcgtcttccttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctcaccccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccgatataacatatcaagaaattttgcattcttgatcatgttctttataccatttgaaccaacattctttttttggttgtgaaatgttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgacgatatcatccctcgcatccttgttgtaagtgcccttaattttcctggtttggtttacctctaaatgaaattgattttctggctttctaacttttttggattgatctttttgttgttttatatcaggtaactaggctgctgcctgatgctgtaggaaccacttgtggcgagtggatggagaaagtatatggggcagaacattctcatataattcgtgttccatttagaactgagaaaggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaataaaaatcattggaatgttcttctgcatttgaaaatgtcttgctaactaaagactcatttttaaattaatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgataattggaaactacagtgagggaaatcttgctgcctcattgcttgctaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctttttgccatgaatcacactgatttcattatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttaccctagtttatactatttccatttgtcaactccaacttgtttgggattgaaccatagttgttgtttgtttatactatttccattcgccgaccccaacttatttgggactgagacataattgttgttattattgtttgtttgtttatactatttccattctcagaccccaacttctttgggactgagccgtagattgttgttgttgttgttgttgttgtttgtttatgctatttccgttcaccgaccccaacttatttgggactgaggtgtagaagtagtcgttgttgtttgtttatacgacttccaattgatattcgaatgtttttatttttgcagcaagaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtatcgagtagtccatggaatcaattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaatctacttcccttacactgagaaggagaaaagactaaccaacttccacccggaaattgaagaactcctctacagtcctgttgagaataaggaccacttgttagtcttctttatttcattcatttttctacaccttttttttcaacagattgattgattggttcttatcaacgtaaacagatgtgtgttgaaggaccagaacaagccaattctctttaccatggcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgcaaagaatgcaaggctaagggagctcgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagatgaagaagatgtatgatcttatcgaaacatacaacctgaatggccaattcaggtggatttcttcccaaatgaatcgtgtgaggaacggagaactttatcgatacattgcagacacgaggggtgctttcgttcaaccagcattttatgaggcatttggtttgacagttgttgagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggttaatttcttcgaaaaatctaaagaagatccaagttattgggatactatttccaagggtggtctgcagcgtattcttgaaaagtaagcttttgcatttgattagcacaagtgtacaaccaagatttaacttatgaacaaactaaaactaaccctttttttattttcttttgctaggtatacatggcaaatttattcacagaaagtgatcacattatctgggatttatggattctggaaatatgcaaccaagaatgacaaagttgctagtgcgaagaagcgctatcttgaaatgttttatgaatttgggtttaagaaatcagtaagtgtcacttctgtattttgtttgagcttgtttgtaaagtttggcaatcttctgctaatttgtactatatttgttgacttgtgcatttcaggctgagaaagttccattggctattgatgaatag

seqidno:4:ntsus1-t的多肽序列

magsglsikesleesilahpdeilalksrietegkgvmkpvdllnhlvsvtsktngvnvvpsalvevlscsqeavivppklalavrprpgvweylslnlktkkvaelsipeylqlkentvdesgnileldfepfttvttpktlsdsigngleflnrhiaskmfldkeiakclldflrnhnykgkslmvkesiqslesfqlvlkkaeeylhtlnpetpyskfeskfeeiglergwgntaervqdtishllhlleapnasslenflgriplvfnvviltphgyfaqdnvlgypdtggqvvyildqvpameremlhrmklqglddiiprilvvtrllpdavgttcgewmekvygaehshiirvpfrtekgmlrkwisrfevwpymetftedvaeelvkelqakpdliignysegnlaasllakkfgatqctiahalektkypnsdlnwkkfddkyhfssqftadlfamnhtdfiitstfqeiagskntvgqyeshtaftmpglyrvvhginsfdpkfnivspgadmsiyfpytekekrltnfhpeieellyspvenkdhlcvlkdqnkpilftmarldrvknltglvewyaknarlrelvnlvvvggdrrkeskdleeqaemkkmydlietynlngqfrwissqmnrvrngelyryiadtrgafvqpafyeafgltvvesmtcglptfatcnggpfeiivngksgfhidpnqgdkaadmlvnffekskedpsywdtiskgglqrilekytwqiysqkvitlsgiygfwkyatkndkvasakkrylemfyefgfkksaekvplaide

seqidno:5:ntsus2-2的多核苷酸序列

atggctgaacgtgctctgactcgtgttcacagccttcgtgaacgtcttgatgccactttggctgcacatcgcaatgagatattgctgtttctttcaaggtattgcctaagtagtgttcttgtttcctacaaaagattcagttggtgttcaaaaaacgatatgtgatttgatttatctgcctaagtcttggtagtcataattatccggtacctgtgctggtgcgagttagctggttcggaaactactcttatgaaaacgagagatttagttggtgttgtctgcaattctgtagtatggactattaagcagatagatcatgtttgatatcgaaaaggaatgtatatgtgatgttacttgaactggttttggttattacaggattgaaagccatggaaaagggatcttgaaacctcaccagctattggctgagttcgatgcaattcgccaagatgacaaaaagaagctgaatgatcatgcatttgaagaactcctgaaatctactcaggtaattttgattttggctaaatgtgttaccaagctgaatgatcatgcatttgagtttgtgtccgactactacaatgatatgttataccaggaagcgattgttctgccaccttgggttgcacttgccattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgttaatgctctagtcgttgaggagctgaccgtccctgagtatttgcattttaaggaagaacttgttgatggaacgtaagttttagtctcttatttgatactatgttagagaataggcagtggattcaatttatcagtgttgttttttacctaatgcagctccaatggaaatttcgttctcgagttggattttgagcccttcactgcatcctttcctaaaccgaccctcaccaaatctattgggaatggagttgaattcctcaataggcacctttctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtaactttgttattcccattcatatatatgttcagtttgtgcttatcatgcgcccaatgatgtatgaatatgtactaaaggatagatgtacgatttcgtttgcagacaatgatgctgaatgacagaatacagaatttaaccactctgcaaaatgtcctaaggaaggcagaggaataccttattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactgcggagcgcgtgctagagatgatatgcatgcttcttgatctacttgaggctcccgactcctgtactcttgagaagttcctagggagaattcctatggtgttcaacgtggttatcctttccccccatggatatttcgcccaggaaaatgtcttgggttatcccgacactggtggccaggtgcattactttagtctttgtccgtgagtctatgttgctcagatcctctacaatgccactgtacccgtgtaggatactccaaatataatgcatttttggaggatctgtcaccggtgcaatggcattttggaggtcggagcaacaaacaactgctagtatgcttctaaagcttgcttccataaatgctaaggtccttcacccgtaatgtgcaggttgtctacatattagatcaagttccagccttggagcgtgaaatgcttaaacgcctaaaggagcaaggacttgatataacaccgcgtattcttattgttagtatttcttgtacttgtaattgctgcggattacacaaaattttctctttattggcaacttatcttgatattattcccaggttactcgtctgctgcctgatgcagttggaacaacttgtggtcagcggcttgagaaggtgtatggagccgagcactcacatattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatatctcgctttgaagtgtggccatacatggagactttcactgaggtgacactaagcttccttgtatttgtctatcttctaattggtattaggaacaatttgctaattattaacgctttggcttttcgtacatcaggatgttgcaaaagaacttgctgcagaactgcaggccaagccagatttgataattggcaactatagcgagggaaatcttgtggcttcattgctggctcacaagttaggcgtaacgcaggtctgtgttatttttcacctcttataaatctgattgtatttccattagtctggaactaaaagtactaaaattttcttttcttcgctgtgttatttgccttctgcagtgcaccattgcccatgcattggagaaaacaaagtatcctgattctgacatctactggaaaaaatttgacgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaattgctaattcggttgcagtaacattttgttcgatttcttccccttatgcttaacctaataccctaatgaattttccagcaaggacactgtcggacagtacgagagtcaccaggcattcacaatgcctggattgtacagagtcgttcacggcattgatgtgttcgatcccaaattcaacattgtctcacctggagctgatataaacctgtatttcccatattccgagaaggaaaagagattgacagcacttcacccagaaattgaggagcttctgtacagtgatgttgagaacgaggaacatctgtaagtttctaacttactcgtaccgtcagtggcagagccagaattttcattaaaatggggtcaaaatataaagacataaattcacaaagaagccaaggggtgtcaatatgtagtataaatatattaaaaaaattacctagctacacaatgtaattttccgacaaaggggtatcggttgcacttcttgaatacatgtggctctgccactgggtacagttacaaagtcctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggtaggtgtgtgctaaaggacaggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaacttaaccggacttgttgagtggtacgccaagaacgcacggctaagggagttggttaaccttgttgtcgttggtggagaccgaaggaaggaatccaaagatttggaagagcaagcagagatgaagaagatgtatgagctaataaagactcacaacttaaatggccaattcagatggatttcttcacagatgaaccgagtaaggaacggcgaactctaccgatacattgccgacactaggggagctttcgtgcagcctgcattctatgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatccggcttccatatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaatgtaagacggaaccttctcattgggaaactatttcaaccggtggcctgaagcgcatccaagagaagtaagcaactctttcttgactctagtcattcaaattaacttgggatttgaggcatagttgattgataatttatcgcgtctctactactatatacaggtacacgtggcaaatctactcggagagattattgacgttggctgctgtttacggtttctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatctagaaatgttttatgctctcaaataccggaagatggtgagttcttctgcttcctgctcttctcatagtgtttaatatacacttgattgattgcattcacttagactaagttgctcggacacgggtgtggatgtccgacacgagtgcggatctagagttcagatccttcaagatgtaaattataagattcggggatatggatcctagtacggatacgggtgcgagaatccggctaaaaataattttaaaaaaaattatctctaaattatgagatattatgtggaatacttacgtataacttgtaaagtgtagattttttttaattctcaagttgtagattagtaaatgattgatttcctagataagtatgctattttcttcaaatttactcttctgatttcgaaaatcaaattgtatctcgtctcgaatttttccgtccgttatggtcaaagtacccaaaatcgtttgaccaaatcggtacggatcccatacccacacccacactagtgtcgtattgacacgggtgccgcacctaaactgctatgtcggagcaacttagcacttagagaatcattgatgttaaattttcttaattcttgaatctgctaatgaagattttatcttggtttttgtttaggctgaagctgttccattggctgctgaatga

seqidno:6:ntsus2-2的多肽序列

maeraltrvhslrerldatlaahrneillflsrieshgkgilkphqllaefdairqddkkklndhafeellkstqeaivlppwvalairlrpgvweyvrvnvnalvveeltvpeylhfkeelvdgtsngnfvleldfepftasfpkptltksigngveflnrhlsakmfhdkesmtplleflrvhnykgktmmlndriqnlttlqnvlrkaeeylimlppetpfsefehkfqeiglekgwgdtaervlemicmlldlleapdsctlekflgripmvfnvvilsphgyfaqenvlgypdtggqvvyildqvpaleremlkrlkeqglditprilivtrllpdavgttcgqrlekvygaehshilrvpfrtekgivrkwisrfevwpymetftedvakelaaelqakpdliignysegnlvasllahklgvtqctiahalektkypdsdiywkkfdekyhfssqftadliamnhtdfiitstfqeiagskdtvgqyeshqaftmpglyrvvhgidvfdpkfnivspgadinlyfpysekekrltalhpeieellysdveneehlcvlkdrnkpilftmarldrvknltglvewyaknarlrelvnlvvvggdrrkeskdleeqaemkkmyelikthnlngqfrwissqmnrvrngelyryiadtrgafvqpafyeafgltvveamtcglptfatnhggpaeiivngksgfhidpyhgeqaadlladffekcktepshwetistgglkriqekytwqiyserlltlaavygfwkhvskldrleirrylemfyalkyrkmaeavplaae

seqidno:7:ntsus2-t的多核苷酸序列

atgctttttatgggagtaaattttatggccggtcattcaactttgtgttcattacgcaaaagtcatttttcttggtgtttattacgcaagtcatttttcttttttttttgttacgtaaaaatcattcaactatgtgtttattatctaaaattcaattttttttttccttttgttacacaaaaatcattttactttactctatttatcacaaaagtcaccttggccagattttataataggcttttatcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttataataggcttttatcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttacaatacttttaccttaaaagactattatgcccttgacattataaatcctctcatttatataataccttctatatgatacactatataatatatttttacctaggtattttacttataattaaaataatattaaattattttatttatctattttataatatattcatacatttaattttttcatggcaaatcactttgtttaatcatatttaaacatgaacaaattttaaatatcaaaaaaataaaaaaataaaaaaaatatttatttgaaataataacaaacagatttgtttaacaaatgatagtttttttttatagtcaataaaatttttaaaaaaattcaaagatatttgtttttaatattaatatttttaaagctttatctgttaatattatttatttgaaagtattaatctgatgtgtcattgtgttaaatgtgagtattttatttattggattaatgagtatggcttggctgataaaaagctttgattttataattttcattaaaaatattttattaagctagtacctgacaaatttaatatcttgaaaattaacgttaagaaaaaattaaatataaaaatatattataaaaataataaataaataatatcaagttattttaattataaataaaatacatggttaaaaatatattatatagcatataatatagaaggtattacataaatgagatgatttaaagggcataatagacttttcaggtgaatgatttgtaaaatatggttaaagtgattattgtgataattagagcatagtaaaataatttttatgtaacaaaagaaaaaaaaaatgacttttgggtaatgaacataaatttgaataacttttacgtaacaaaagaataaaataaattttggataataaacataaaattgaatgaccacctataaaatttattatttttttgggctcttcttgatttgattttttagtttagcctttgcagtaatcttggttgtcacgcgtagcgttgtgctttcgccacataagtatttagtagacttaattaatgtcattatatcggttggtgtggttttaattacttaactgtactattatattaggtggaaggtttgaaaatttatagtagtaacattctagatcattgaaaatattggtgtttcagtgactttttagtatgtcattttcattttctaagtggttgtactaatatagtatattaaaattttgattggttgagaaacaatctctctcacctacacggtacgggtaaggtatgcgtatacgcttatcctccctacactccatttgtgggactattgttgttattttggataagctgaggtatccatcttctactaactgcactagtttattttttttgctgtttacagttgaaacaattgtctgaggatttctcacctgctgaatcaactgcaatggctgaacgtgtgctgactcgtgttcacagccttcgtgaacgtcttgatgctactttggctgctcatcgcaatgagatattactgtttctttcaaggtatagccaaagatagtattcttgttaactaaaaaagattcagttggtgttcaaaaaacgatacgtttatctgcctaagtcttggtagtcagaattatccggtacctatgctggtgtgagttagctggctaggaaaccactcttatgaaaacaagagatttagttagagttgtctgtaattctgtagtatggactatgtatgtgatgctatttgaactggttttggttattataggattgaaagccatggaaaagggatcttgaaaccgcatcagctattggctgagtttgatgcaattcgccaagatgacaaaaagaaactgaatgatcatgcatttgaagaactcctgaagtccactcaggtaatatggttttggctatatttgtcgccaacgccaagctcatatttttatattattttgagcttgtgtctgaatacgacgatgatatgttatactaggaagcaattgttctgccaccttgggttgcacttgcgattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgtcaatgcgctagtcgttgaggagctgactgtccctgagtatttgcatttcaaggaagaacttgtcgatggaacgtaagtgttagtcttcaatttgatgctatgttagagaataggctgtggaatttattgatcaatgctgtgctttgtcctgatacagctccaatggaaatttcgttctcgagttggattttgagcccttcaccgcatcctttcctaaaccaaccctcaccaaatctatcggaaatggagttgaattcctcaataggcacctctctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtgacttgctatttccatttatctataggttcggtttgtgcttatcatgcgcccaatgacatatgaatatgcgctaaaggatagatatatgatttcctttgcagacaatgatgctgaacgacagaatacagaatttaaccacactgcaaaatgtcctaaggaaggcagaggaatacctcattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactgcagagcgcgtgctggagatgatatgcatgcttcttgatctcctcgaggctcccgattcctgtactcttgagaagttcttggggagaattcctatggtgttcaatgtggttatcctttccccccacggatatttcgcccaggaaaatgtcttgggttatcccgacactggtggccaggtgcattactttaatctttatccgtgagtctatgtttgttcgaatcctctagaaatgtcactgtacctatgtaggatactccaaatataatgcattttggggggatctgttatgggtgcgatggcatttttggaggtcggagcaacaaacaattgctatgtattcttctaaagcttgctttcataaatgctaaggtccttcacccttaatgtgcaggttgtctatatattagatcaagttccagccttggagcgtgaaatgcttaagcgcctaaaggagcaaggacttgatatcacaccgcgtattcttattgttagtatttcctgtacttgtaattactgcggattacacaaaatttcctttttatcttcttaacaacttatcttgatggtattcccaggttactcgtctgctacctgatgcagttggaacgacttgtggtcagcggcttgagaaggtgtatggagccgagcactcacatattctgagggtcccctttaggactgagaagggcattgttcgtaaatggatctctcgctttgaagtgtggccatatatggagactttcactgaggtgacactaaaacttccttatatttgtctatcttctaattggtattaggaataatttgttaattgttaactctttgtcttttcgtacatcaggatgtcgcaaaagaacttgctgcagaattgcaggccaagccagatttgataataggcaactatagcgagggaaatcttgtggcttcattgctcgctcataagttaggcgtaacacaggtctgtgttgtttttcactctcttaaagatctgattgcatttccattagtctggaactagaagtactaaaaagttcttttcttcactgtgttatttgccgtcggcagtgcaccatagctcatgcattggagaaaacaaagtatcctgattctgacatctactggaaaaaattcgatgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaatttgctacttcgactgcaacagcattgtgttcccatttctttcccttatgcttaacctaataccgtcatgaattttccagcaaggacactgtcggacagtacgagagtcatcaggcattcacaatgcccggattgtacagagttgttcacggcattgatgtgttcgaccccaaattcaacattgtctcacctggagctgacataaacctctatttcccatattccgagaaggaaaagagactgacagcacttcaccctgaaatcgaggagctgctgtacagtgacattgagaacgaggaacatctgtaagtttctaccttactcgtacagtcagtggcggagccagaattttcactaaaataaggtcaaaatataaagacataaatccacaaagaagccaagggtgtcaatatatagtataaatacattaaaaaaattacctatctacacagtgtaattttccgacaaaggggtgtcggttgacactccttgaatacatgtggctctgccactgggtacagttacaaagttctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggcaggtgtgtgctaaaggacaggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaatttaaccggacttgttgagtggtatgccaagaacgcacggctaagggagttggttaaccttgttgtggttggtggagatcgaaggaaagaatccaaagatttggaagagcaaacagaaatgaaaaagatgtatgagctaataaagactcacaatttaaatggccaattcagatggatttcttcacagatgaaccgagtgaggaacggtgaactctaccgatacattgctgacactagaggagctttcgtgcagcctgcattctacgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatctggcttccacatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaatgtaagacagaaccttctcattgggaaaccatttcaacgggtggcctgaagcgcatccaagagaagtaagcaactctttcttgactctagtcattgaaattaactttcttgactctagtcattgaaattaactcgggatttgaggcgtagttgattgatattttatcgcgtctctactactgatatatacaggtacacgtggcaaatctactcggagaggctattgacattggctgctgtttacgggttctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatcttgaaatgttttatgctctcaaataccgcaagatggtgagttcctcttcttccttgcccttctcctagtgtttaagatacaatataattgattgcattatcttagagaatcattaatgttaaattttcttaattcttgaatctgttaatgaagtttttctcttggtttttgtttaggctgaagctgttccattggctgctgagtga

seqidno:8:ntsus2-t的多肽序列

mlfmglkqlsedfspaestamaervltrvhslrerldatlaahrneillflsrieshgkgilkphqllaefdairqddkkklndhafeellkstqeaivlppwvalairlrpgvweyvrvnvnalvveeltvpeylhfkeelvdgtsngnfvleldfepftasfpkptltksigngveflnrhlsakmfhdkesmtplleflrvhnykgktmmlndriqnlttlqnvlrkaeeylimlppetpfsefehkfqeiglekgwgdtaervlemicmlldlleapdsctlekflgripmvfnvvilsphgyfaqenvlgypdtggqvvyildqvpaleremlkrlkeqglditprilivtrllpdavgttcgqrlekvygaehshilrvpfrtekgivrkwisrfevwpymetftedvakelaaelqakpdliignysegnlvasllahklgvtqctiahalektkypdsdiywkkfdekyhfssqftadliamnhtdfiitstfqeiagskdtvgqyeshqaftmpglyrvvhgidvfdpkfnivspgadinlyfpysekekrltalhpeieellysdieneehlcvlkdrnkpilftmarldrvknltglvewyaknarlrelvnlvvvggdrrkeskdleeqtemkkmyelikthnlngqfrwissqmnrvrngelyryiadtrgafvqpafyeafgltvveamtcglptfatnhggpaeiivngksgfhidpyhgeqaadlladffekcktepshwetistgglkriqekytwqiyserlltlaavygfwkhvskldrleirrylemfyalkyrkmaeavplaae

seqidno:9:ntsus3-s的多核苷酸序列

atggcgaatccaaagttcacaagagtacctagcatgagggagagagttgaggatactctctctgctcaccgtaaccagcttgttgctctcctctccaggtatattaataaactctatatacttgttattttctttatttttttgtctttactgataaatttaactgttttcttctttaaatcttgctttcgatgcatgatttctgttgtgttaaattgcgtaaccattttatctaaaagtttatgctgataaacacttttaaattttaatatgtaaattatattatgtctcaacatcaacatgtggatggccaaaaatataaagcttaattttcgttattttgaatgatttttctctgcgagtgttacggtttgcgtacacattacctaaacctcctccctagtccccacttgtgggaatttaattttttttttctttgtttttttttgttgttgttgttgtctgagttcaattcctaccatgttagcttggcaaaaataagttggtaaagcttgaccccaactagttttagttgatcgatttatttggtgatttatagttcaataataataattactattagagaaagttccagcagcttttctgtttgtttttccagttttagtgattgatatatgtgtatatatattctttgtttcttttaagatacgtggcgcaggggaaggggatattgcaacctcaccacttgatcgatgagttcaacaacgctgtatgtgatgacactgcttgtgagaagctcaaagatggtccctttagtgaagtcttgaaagctactcaggtatattcactaatccatgggaatcaagatgatactgtatatctttattatggtgtctttcagaaatttgacgatgatgaaatgcaacttttctctgtttgtcaccttatccagactgtttttttattttttatttttcattttttaacttgaaatgctcttaatttcctttgtttatcgataagaccggatttacaatgtatgaacggagcatcttaagaaccttctggaatgaagatataagatataaaacatggtgtccgttttctcctttgtggaatcagtgtacatatagactgttattttggtcccactttctggatcttctgatcacaccttctcatgcagaggcgagcttgatggtttcaacctttaaattcttactattgaatccatttcactttcgaaattatgagttcgaaatctaatatttgttgaaatttttgcaaatgttcacatataagtttaagctttgtgtcaagaatactgggctcaatggattccaatagaccaggctgtatccgcctctgtctccactctccctgcatccacttctttcgtgtgactaataatgcttaatgagctagaactcgttttaatgtttgaataagttgcttatatcagagcagcttttgatgtttcaatctttaacgggttatgcagtaccagcattctgcggctgaaaaacaggaatctgagatttacttgtctctggctgaatttcttgttcattttgctaacaagtactttggagttaatgcttgctctctgttgtcaaaataggaagccattgtgctgccaccatttgttgccatagcagttcgtccaaggccaggtgtttgggagtatgttcgtgttaatgtatatgatttgagcgttgaacaattgactgttcctgaatatcttcatttcaaggaagaacttgtggatggagagtaagctctttcttatttcaatacgaaacataaaaatttacagaagttgaataattaacaaatttgttgatttttaatgtatgccaggggtaataatcactttgtgcttgagctggattttgagccatttaatgcatcagttcctcgtccatctcgatcgtcatccattggcaatggagtccaattcctcaatcgtcatctttcctcaattatgtttcgcagcaaagactctctggaccccttacttgatttccttagaggacactgtcataaagggaatgtaagtaccaaaagcagttttccctttgtaaatgtctgcttgtccctgattatctactaaatctttcaacacgcgcaaccattataagaaatgtacaatacttctagttagaatttcatcatcgacaaactatctgctttactttttatttttcccatttgatggatgatagtttagtttatataacagatgatattttggttgaagggtaccatgaactttttcacaaccacttaatggatacatagttgtaatagttgacattttggaataatattgtctcacttggaaatgtttaagaagtattactacttctatttgtaagatggattgtttatctatgcaggtcttgatgttgaatgatcgtatacagcgaatctccaggctggagtctgctctttctaaagcagaggattatctctccaagctatcaccagatacatcctataatgagttcgaatacgcgtgagcttgtacacatttgttttgttttctttcaagcatatgtaatttctcaagaaaagggaaatctataggagttgaaacattctttatggaaccatgtgcatgcagattgcaagaaatgggctttgagagaggttggggtgatactgccagacgtgttttggagacgatgcatcttctttctgacattcttcaggctccggatccatcaaccttggagacatttcttggtagactacctatggtgttcaatgtcgtcatattatcccctcatggatattttggccaagcaaatgtcttgggtttgcccgacactggtggccaggtaataacaaggagaatgaggtcttgtattatgtactccctccgttccaatctatatgaacctatttgactgggtatggaaagaaatgaagacttgtaaaacttgtggttctttagaaattccaaacattacatttggttttttccctcttcctggaaattatactactgaatcatctctagatgttccagtttaacttgagacgtaagggtaaataacggaccattactctgtcctttcttgcagtaggcttggtacaatgaatatagttcgcatagttgccggaagctagagctgtgttagaaaactcaggaacattaatttggcgatgctaatcactgctaatgttactgaagcatccatggttttccttgatgttattctccttttggttgcttcacaggttgtctatatactggatcaagtgcgtgccttggaggccgaaatgcttcttagaataaagcaacaaggacttaacttcaagcctagaatccttgtcgtgagtacatatatattatgcaagctcttatttggtttgtgggattgcagttgacatcaatttgcttactctgattactaaaggtcacacggctgatacctgatgctaaaggaaccatgtgcaaccagaggttggagaggattagtggaactgaatactcgcatattttacgtgtcccttttaggacagagaagggaatccttcataaatggatatctaggtttgatgtatggccttacctggagaagttcactgaggtaacctctttgtcccttggaaattgccttttgttgctgatgtttctgctagtgtgcttaaatgacggatgttaactagtcacttgctagcgtttgcaatagcaacgggaaaagaaaggatttttgctagtttgaagtctgcctccaagaaaaattatattaaaagtttatggctagtggaaacatcagtcattcatgtaccttatttctatgcccaagttgtttaagttgaaagtaatttggccaactatgcaaattgggagaacgtgtagccaactattgtgtttgccgacatgttgatatactttttggtcctgatttatatttgttggtttgtcatactggatgaagcaattctcatgtttttctgcttatatatattggaagaagagatacttgtcgtttcatcatttttctcgacctctctattaccaacactttgccaatttaatgtttggaaatgtcttcttgaccaggatgtggcaagtgaaatgaccgctgagctccagggaaagccagatctgattattggcaactacagtgatggaaatttagttgcctcccttttggcatataaaatgggtgtcacacaggtaggaaatacatgattctttatcttgctagcactaagtcttgaggttatgtatctgcaatagaaattttacgctttgccttcatttctttttaattatttttccagtgtaccattgctcatgccttggaaaaaacaaagtatcctgattctgacatctactggaaaaagtttgaggagaaatatcatttttcatgtcagtttactgctgatctactggcaatgaataattcagatttcattatcaccagtacttatcaagagattgcaggaacgtaagtcattttaatctggtcgtttaaatctgatatttcttccctagtagtctattcaatccgaatttcagttcagtatatgatgtcatcggttgaggaactgtgattggtaaccttatcaaatccgtagctgctctataattttatttcgtaattggagaaacaattttttattattgagcttgtagtctgagctagaatttggttctttatctatcaagtagcataatactacaactattttttatgtgtggcaatttgcaatttcaattttctatttctataagttgcagcttttcttcctgttctgatcatatttacatggctgaaactcaatagaaaactaggctagttgatcaaaagtagttggatgctttaaaattagtagacgttttgctaaatgagtgaccaatgttattaaaaaaacgttcatgttttcaacccttttggcatacatttgaccactgcccaagattttggataagtacatgcagtgcttataattataaagcattttatcccaccttgtttttcattatgaaaattaagtaatttacgagtatttgtataagttacttcataaattagaagtaaatctggattgtgtaaagttattcgccccgtatatactgaaagctacttgaacaagcaaaaaaacagacaaacgtaacattctccatggattaatgagacttgtatatatatatatatatatatgtaaagagagagagagagagatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttcaatgtccacgggagttttacgtagagttaagaggagaagagagtgaggaatactaatgtttgatggtaccccttggcttcttgacctggatactcagtgttcttattcatgcctatactttggtccttgatttcattctcccttttctagcttgagctgcatcaaagaaattccactgtaaaaaaaataatgctcaccatattggtgcaacatggcaaacatgtatcctatttgatgatcaatcaactttatttttctcctgttaattgacctcagtgtgtaactctctatgtatgatagcattgtaacttgtgtcatgattcataaatagggtactagaattggatggttgacatagtaaatggtcaattgatgatccacaaaatatgcacctactgattaaaatgtgatagggcaggtttatttttgtttgtggttaacacagtacttaaccctatatttaatacaatttggcttatctacaatcttttcttcagtgtttatgcgaattccttattgcacaacaatattgtctttctgagttctattctgttgttgcttacacttttattattccagtaacatagatgtgaagacattagattggttgcttgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacgagagccatactgcattcaccctcccgggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgacatgacaatttatttcccatattctgacaaggaaaaaagactaacgtctttgcatggctcgattgaaaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtggcatccgtttgtacttaatttttttggaatagatgacatattatttgcatgaatatgaaaaggagggtctgatatgattttctatagataaactaccaatgatattatttaaaaactcctggatactgtattaggagaagaagagaaccaggggtagatggcattagaatcccttaaatcttgaagagtcgtcactaacgctcccaacacttctgcctcagaccctcaactaaatactattattgttgatttctttggagaagctataagaatctctctctccttatggtgaaaattttacttggctttatacttaacttccaaggctccctcttataaaatgcaaaaactgtctgtattcactctcttggttaacaattgatccaatcaaatgcatatggaacatctttctttacgtttcttctaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttagggacggatgtggaaattaacatatgggctcagcttttctgccgagtgcagaccatgtatatgcgttaaaaaattcactaaacaagtaaatgtttgattttgaacccagtaaatcaaatgagttgtggtagaatctcgaactcgaaccgataaagttcaaatccaggatccgcttttaggtaaactctaccttgggaagtgttatatatatgtccctgattatttctttttccgtttcctttctattttaatttttaaagttatttttagatggttttattttttgataagtggtaagttgttaatattccaaattaaatgccattgtcataactatatacatttataaagaatgattgatcctagtttctcattcctaagatccaaataaggcaataaacaatgtcttagtaattggacctgcttctggtgatcaacgcttgatcgcgtagttagttatagatgactgtaaaaactttaaccattttaatggttttgtcaaagaacaaatatcggacatattatagagaatggactattgtactttgcttctgattggtcattttattgtgatccgtaaattggctgtgactgatgtcatatctttgcttacagaggtaatctgaatgataaatcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgctatgctaaaaatgccacattgagggaattggcgaaccttgttgtagtagctggatacaacgatgtaaagaaatccagtgatagagaagaaataacagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattcagatgggtatcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgaccagagaggtatatttgttcaggtatgctatttgtattgtattagtccaatttcattttttgcaccaaaagaaaggttgttattgtgacgtatatgtttgttttagcctgcattttatgaagcatttggactaacggtggttgaagctatgacttgtggtcttccaacatttgcaacttgccatggtggtcctaatgagatcattgaacccggtgtatctgggttccatattgatccttatcatcccgataaagctgctgaactcatgtcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatctggtctccgaaggattcttgagaggtctgtagttgtgtacatgtatagaagattaaagaatgctaccttgatatttatttgaatcaaaaataacaggaacatctcttttttgaacatcactcaagttcttatattaaataatttttaggtatacgtggaagatttactccgagaggctgatgactttatctggcgtatatggtttctggaagcttgtttcaaaacttgagaggcgtgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgccttttagctccttttcagttccaataaactatatatgtggtttaagtaagtattaagcataaacatgtccgtgcttggggctgtcgaaaatgctatggacatatcctgagctaaggatttttcaagaaaattgatgttagctttactctatttacaggcaaaatctgtacctctagcaattgatgacaagtga

seqidno:10:ntsus3-s的多肽序列

manpkftrvpsmrervedtlsahrnqlvallsryvaqgkgilqphhlidefnnavcddtaceklkdgpfsevlkatqeaivlppfvaiavrprpgvweyvrvnvydlsveqltvpeylhfkeelvdgegnnhfvleldfepfnasvprpsrsssigngvqflnrhlssimfrskdsldplldflrghchkgnvlmlndriqrisrlesalskaedylsklspdtsynefeyalqemgfergwgdtarrvletmhllsdilqapdpstletflgrlpmvfnvvilsphgyfgqanvlglpdtggqvvyildqvraleaemllrikqqglnfkprilvvtrlipdakgtmcnqrlerisgteyshilrvpfrtekgilhkwisrfdvwpylekftedvasemtaelqgkpdliignysdgnlvasllaykmgvtqctiahalektkypdsdiywkkfeekyhfscqftadllamnnsdfiitstyqeiagtkntvgqyeshtaftlpglyrvvhgidvfdpkfnivspgadmtiyfpysdkekrltslhgsiekllfdpaqneehignlndkskpiifsmarldhvknitglvecyaknatlrelanlvvvagyndvkkssdreeiteiekmhalikehkldgqfrwvsaqtnrarngelyryiadqrgifvqpafyeafgltvveamtcglptfatchggpneiiepgvsgfhidpyhpdkaaelmseffqrckqdpthwekisasglrrilerytwkiyserlmtlsgvygfwklvsklerretrrylemfyilkfrelaksvplaiddk

seqidno:11:ntsus3-t的多核苷酸序列

atgtttacatggctgaaactcaatataaaaaacaagggtaggtgatcaaaaatcgttggatgcttaaaatcagtagacgttttgctaaatgagcgaccaatgttattgaaaacgttcatgttttcaacccttttggcatacatttgagcattgcccaagattttggataagtagatgcagtgcttataattttaaagcattgtatcctgccttgtttttcattgtcaaaattaattaacttacaagtatttctataagttgcttcataaattagaagtaaatctggattgtgtaatgttattcgcctcgtaaatactgaaagctgcttgaacaagtgaaaaaacacagacaaacgtaacattctccatggattgatgagacttgtaaaatacatatatagaaatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttccatgtccactggagttttacgtatagttaagaggagaaaagactgaggaatactaatgtatgatggtacccctttgcttcttgacctggatacccagtgttcctattcatgcctatactttggtccttgatttcactctcccttttctaacttgagctgcatcaaagaaatttccactgtaaaaaaataaataatgctcaccatatctctgcaacattgcaaacatgtatcccatatgattgatattggtgcgacatggcaaacatgtatcctatttgatgatcaatcaaatttatttttcccctgtcaaaatgacctcagtgtgtaattccctatgtatttgatagcattgtaactcgtgtcatgattcatgaatagggtactagaattgcatggttgacaaatattaactggtcgattgatgatccacaaaacatgcacttactgactaaaatgtgatgggacagatttatttttgtttgtgattaacacagtacttaaccctatacttaatacaatttggcctagctacaatcttttcttcagtgcaaattccttgttacacgaccaatattgtctttctgagttctattctgttgttacttacacttttattattcgaataagacattagattgcttgcatgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacgagagccatactgcattcaccctcccaggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgacatgacaatttacttcccatattctgacaaggaaaaaagactaacgtctttgcatggctcgattgagaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtgacatccatttgtacttattttaatttggaatagatgacatacttatttgcatgaatataaactgacaacccagagatttcctacattagaaaaggagggtctgatatgattttctacaaataaattcccagtgatattgttcaaaaagtcctggatactttattatgagagaaccagggatagatggcactagaatcccttaatcttgagaagtcgccacttatcgctcccaacactttctgagaccctcaagtaactactattattgtttgatatcttggagaagctataagaatctttttctccttattgtaattttttttacgtgactttaaacttaacttccaagctccttctgataaaatgcaaaaactgtctgtattcactgtcttggtttattaacaattgatccaatcaaatgcatatggaacatctttctttttgtttcttcaaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttaggggcggatgtagaaatcaacgtatgggttcagctttgttgcagaccctgtatatgcattaaaaaaatcactaaataagtaaataattgattttgaacccagtaaatcaaaatgagttgtagtagaatcctgaactcgaaccgataaagttggatccactaccgggtaaactctaccttgagaagtgtttatatatgtccctaattatttcttttctgtttcctttctattttaattttttaagttcctttttagatggttttattttttgacaagtggtaagttgttagtattccaaattaaatgccattgccataactatatacatttataaagattgattgaccctagtttctcattcctaagatccaaataaggcaataaacaatatgtcttagtacttgaacctgcttctggtggtcaacacttgatcgcgtagttagttatagatgactgtaaaaaccttaatcattttaatggttttgtcaaagaacaaatatcggacatattatagcgaatggactattgtacttttcttctgattggtcattttattgtgatccgtaagttggctgagactgatgtcatatctttgcttacagaggtaatctgaatgataaatcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgctatgctaaaaatgccacattgagggaattggctaaccttgttgttgtagctggatacaacgatgtaaagaaatccagtgatagagaagaaatagcagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattcagatggatagcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgacaagagaggtatatttgttcaggtacgctgtttgtattgtatttgtccacattcctttttttgcaccgaaagaaaggttgttattgtgacaaatatgtttgttttagcctgcattttatgaagcatttggactcacggtggttgaagctatgacttgtggtcttccaacatttgcaacttgccatggtggtccgaacgagatcattgaacacggtgtatctgggttccatattgatccttatcatcccgataaagctgctgaactcatggcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatctggtctccgaaggattcttgagaggtttgtagttgtgtacatatatagaagattaaagattgttcccttgatattatttgaatgaaaaataacagtaacatctctttttgaacatcgctcaagttcttgtgttaaataattgttaggtatacgtggaaaatttactccgagaggctgatgactttgtctggtgtatatggtttctggaagcttgtttcaaaacttgagaggcgcgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgcctttttgctcattttcagttacaatcaactatatatgtggtttaaatacgtattaagcataaacatgtccgtgattgcggctgtcgaaaatgctatggacatatcctgagctaaggagttttcaagagaattgatttggcttactctgtttacaggcaaaatctgttcctctggcaattgatgacaagtga

seqidno:12:ntsus3-t的多肽序列

mftwlklniknkgrkntvgqyeshtaftlpglyrvvhgidvfdpkfnivspgadmtiyfpysdkekrltslhgsiekllfdpaqneehignlndkskpiifsmarldhvknitglvecyaknatlrelanlvvvagyndvkkssdreeiaeiekmhalikehkldgqfrwiaaqtnrarngelyryiadkrgifvqpafyeafgltvveamtcglptfatchggpneiiehgvsgfhidpyhpdkaaelmaeffqrckqdpthwekisasglrrilerytwkiyserlmtlsgvygfwklvsklerretrrylemfyilkfrelaksvplaiddk

seqidno:13:ntsus4-s的多核苷酸序列

atggcggaacgtgtgctgactcgtgttcatagccttcgtgaacgtcttgatgctactttggctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttgttattgccagttctaatgtatgggcttatatataaacaaagtgttgaagtatgcaaccatataaactgacagcttaaaatgcttgagagaacacacttttatttatttaattatgccttcagcacaagaagtggaacttgacgcaatggaaccataggtcacgggttcaagtcttggaacagcctgcaatctaaggctgcgtgtagtagaccctagtggtccggcccttccacatatctcgcttagtgtaccgggcccattgagtacgggttcggccgaacccagtcgctttggtccaatccatatatttgtcttaaaaatatattgaatatatacaaattgttaatttagtttaaatatgtgtatcatgggttattcatgctggttttggctgttgcaggattgaaagccatggaaaagggatactgaaacctcaccagttgctggctgaatttgattcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaagaagtcctgaaatccactcaggtatttgtggttttagtgttaggtgatggatagcatttattgttttactaagatcacatatgtgtcagtttgtggctagtatttaaaatctggtgtattttgtcatactaggaagcaattgttttgtccccttgggttgcgcttgccattcgtctgaggcctggtgtgtgggaatacgttcgtgtgaatgtcaacgctcttgttgttgaggagcttaccgtgcctgagtatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaatttgttgatttgttagataacatgttctgaactttttgattaaagttgtgtttttgactgatgcagctcgcacgataactttgttcttgagttggattttgagcccttcactgcatcatttccaaaaccaaccctcaccaaatcaattggaaatggagttgaattccttaaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagttcaccactacaagggcaaggtaaacttgtttttcctgtttgtctatgaatttagtttagttgttttgctccgcgaaaatttcagtggaaactgatttatgcaaccactgagtgattaatatgttcaaacttaccgacttctggttttctgtgtagacaatgatgctgaatgacagaattcaggacttaaatactctccaaaatgtcctaaggaaagctgaggaatacctcactaccctttcccctgaaacttcatactcggcatttgagcacaagttccaagaaattggcttggagaggggttggggtgacactgcggagcgtgttctagagatgatctgcatgctcctggatctcctcgaggctcctgactcgtgcacgcttgagaagttccttggtagaattccaatggtttttaatgtggtcatactttcaccccatggttatttcgcccaggaaaatgtcttgggttaccccgacactggtggccaggtgcactgcttatctgtgttcggtcttattatctctttaaaccctactgccacaagtgctgagatgaacctcctttaatttgcaggttgtctatattttggatcaagttcctgctttggagcgtgagatgctcaagcgcataaaggagcaaggacttgacatcaaaccgcgtattcttattgttcgtattcccagtaattgtgtttaaacttatgattatgcaggattttatctgttctaatacagcactcttgcttaaattctcaggttactcggctgctgcctgatgcggttggtaccacttgtggtcagaggcttgagaaagtgtttggaacagagcactcacacattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatctctcgctttgaagtctggccatacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaattggttttggcagcaattttctgcttgctttgacttccgctaaaacttcggattttattgcattaggatgtggcgaaagaaattgctgcagaattgcaggctaagccagatcttatcattggcaattatagtgagggcaaccttgctgcctccttgttggctcacaaattaggtgtaacacaggtcggcaatgtttgtgacatgtaatttcatctttgcatttcctttcgtttgcaactaaaagatttaagagttctctctctcttttttttttccgtctactttgccttatgcagtgcacgatagctcatgctttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttcatcatcaccagcactttccaggagatagcgggaaggtatttttacatcagtttcccactctgattaaattacaatgtatttccctatatgattaaatactgtgtttgatcctaaatcatttctaaattttccagcaaggacactgttggacagtacgagagccacatggcgttcacaatgcctggactgtatagagttgttcacggcattgatgtgtttgaccccaaatttaacattgtgtcaccaggagctgatatgaatctctatttcccatactacgagaaggaaaagagattgacagcatatcaccctgaaattgaggagctgctgtttagtgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattatggctaattatgtaaacaagtttgtactgaatagatttgttattcgatcaggtgtgtgctgaagaacaggaataagcctatcatattcactatggctagattggatcgagtgaagaacttaactggacttgtcgagctgtacgccaagaacccacggctaagggagttggttaaccttgtcgtggttggaggagaccgaaggaaagaatccaaagacttggaagaacaggcagagatgaagaagatgtacgaacttataaagactcacaatttgaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagctttcgtgcagcctgcattttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcacggtggtccagctgagatcatcgttcacgggaaatctggtttccacattgatccataccacggggatcaggcagctgaacttctcgctgatttctttgagaaatgtaagaaagaaccttcgcactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaaactgctactcttttcatttttgcaaaacctactatgatcattattaagctcatttttgcaaaacctacttgctgttgttattgtttgttgcttccttttcactgttctttgagctgaaggtctatcagaaacagtctctctaccttcacaaggtaggggtaagatctgcgtgcacgttaccctcctcaaactctacttaattgtgagattacactaggtttgttgttgttgattctttgctaattaattaaaaggtacacatggcaaatatactcggatcggttgttgacactggctgctgtatatggattctggaagcatgtttccaagcttgatcgtcttgaaattcgccgttatcttgaaatgttctatgctctcaaattccgcaagctggtgagtttcattgctttctgcactcctgcaattgtatag

seqidno:14:ntsus4-s的多肽序列

maervltrvhslrerldatlaahrneillflsrieshgkgilkphqllaefdsihkedknklndhafeevlkstqeaivlspwvalairlrpgvweyvrvnvnalvveeltvpeylqfkeelvngtshdnfvleldfepftasfpkptltksigngveflnrhlsakmfhdkesmtplleflrvhhykgktmmlndriqdlntlqnvlrkaeeylttlspetsysafehkfqeiglergwgdtaervlemicmlldlleapdsctlekflgripmvfnvvilsphgyfaqenvlgypdtggqvvyildqvpaleremlkrikeqgldikprilivtrllpdavgttcgqrlekvfgtehshilrvpfrtekgivrkwisrfevwpymetftedvakeiaaelqakpdliignysegnlaasllahklgvtqctiahalektkypdsdiylkkfdekyhfsaqftadliamnhtdfiitstfqeiagskdtvgqyeshmaftmpglyrvvhgidvfdpkfnivspgadmnlyfpyyekekrltayhpeieellfsdvendehmcvlknrnkpiiftmarldrvknltglvelyaknprlrelvnlvvvggdrrkeskdleeqaemkkmyelikthnlngqfrwissqmnrvrngelyryiadtrgafvqpafyeafgltvveamtcglptfatnhggpaeiivhgksgfhidpyhgdqaaelladffekckkepshweaisegglkriqekytwqiysdrlltlaavygfwkhvskldrleirrylemfyalkfrklvsfiafctpaiv

seqidno:15:ntsus4-t的多核苷酸序列

atggccgaacgtgtgctaactcgtgttcacagccttcgcgaacgtcttgatgctactttggctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttggtgttatttgccagttctaatgtatggactaatatatgaacaaagtgcgaccatttcaactgacaacttaaaatgtttgagagaatacacgtttatttacttaattatggcttgagcataggaagtgtatcttggcgtaactcgtaaagttgacctcatgtgacaaggaggtcacggtttcgagccgtggaaacagcctcttgcagaaatgcaggtaaggctgcgtgcaatagatcgcccttccacggacccgcgcatagcgggaacttagtgcaccggttgggctgtccttttttatgtcttcagcacaaaaatttagtttaaacatgtgtatcatggattattcatgctggttttgccggttgcaggattgaaagccacggaaaagggatattgaaacctcaccagttgctggctgagtttgaatcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaagaagtcctgaaatctactcaggtaatttgtggttttagtgttaggtgatggatagcatttattgtcttactaagatcatatatgtgtcagtttgtggctagtatttgaaaagtctggtgtggtttgtcatactaggaagcaattgtcttgtccccttgggttgcgcttgccattcgtctgcggcctggtgtgtgggaatatgttcgtgtgaatgtcaatgcacttattgtcgaggagctgactgtgcctgaatatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaaatgatgatttgttaaataatatgttctgaactttttgattaatgttgtgttttcccctgatgcagctcgaacgataactttgttcttgagctggattttgagcccttcactgcatcatttcccaaaccaaccctcaccaaatcaattggaaatggagttgaattcctcaaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagttcatcactacaagggcaaggtaaacttgtttttcctgtttgtctatgaatttagtttctgaaagttgctttgcttcgtgaattttttagtggcaactgatttatgattttctgtgcagacaatgatgctgaatgacagagttcaggacttaaacactctccaaaatgtcctaaggaaggctgaggaatatctcactaccctttcccctgaaacttcatactcggtatttgagcacaagttccaagaaattggcctagagaggggctggggtgacaatgctgagcgtgttctagagatgatctgcatgctcctggatctcctcgaggctccagactcatgcactcttgagaagttccttggtagaattcctatggtttttaatgtggtcattctttcacctcacggatatttcgcccaggaaaatgtcttgggttaccccgatactggtggccaggtgcactgcttatttgtaacaccttacgcttttccctctgaaacttatttgcggcaagttctaaggtcctccttccttaatttgcaggttgtctatattttggatcaagttccggccttggagcgtgagatgctcaagcgcataaaggagcaaggacttgatatcaaaccgcgtattcttattgttcgtatctccaataattgcgtttaaacttatgattgtgcaggatttgatctgttcaaatctaatgactgattttcttttttttttttttttccctcaggttactcggctgctgcctgatgcggttggtaccacttgtggtcagcggcttgagaaagtgtttggaacagagcattcacatattcttagggtcccctttaggaccgagaagggcatcgttcgcaaatggatctctcgctttgaagtctggccttacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaatctgttttggcagcaatttttcacttactaacactttggctttcgctaaaacttcggattttattacattaggatgtggcaaaagaaattgctgcagaactgcaggcaaagccagatcttataatcggcaactacagcgagggcaaccttgctgcctccttgttggctcacaagttaggtgtaactcaggtctgtaatgtttgtcacctgttatttcaactttgcatttcctttcatttgcaactagaagttaagagttctctctcttttatcttttccgtctattttgccttctgcagtgcaccatagctcatgcgttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttcataatcaccagcactttccaggagatagcgggaaggtattacatcacaatggatttccgatatgattaaattagttaatttaatcctacttcattgtgtttgatcctaaaacttttctaaatttcccagcaaggacactgttggacagtacgagagccacatggctttcacgatgcctggattgtatagagttgttcacggcattgatgtgttcgatcccaaattcaacattgtgtcaccaggagctgatatgaatctctatttcccctacttcgagaaggaaaagcgattgacagcatatcaccctgaaattgaggagctgctgtttagcgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattgtggctaattatgtaaaaaagtttttactgaatagatttgtgcttctatcaggtgtgtgctgaaggacaggaataagccaattatattcaccatggctagattggatcgagtgaagaacttaactggacttgtggagttgtacgccaagaacccacggctaagggagttggttaaccttgtcgtggttggtggagaccgaaggaaggaatccaaagatttggaagaacaggcagagatgaagaagatgtatgaacttataaagacgcacaatttaaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagcttttgtgcagcctgcattttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacgtttgcaactaatcacggtggtccagctgagatcatcgttcacgggaagtctggttttcacattgatccataccacggcgagcaggcagctgaacttctagctgatttctttgagagatgtaagaaagaaccttcacactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaagctgctactcttttcatttttgcaaaacctaccatgatcattattaagctcatttttgcaaaacctacttgttattctttgttgcttccttttccctgttttttgagccgaggttttatcgaaaacatgctttctaccttcacaaggtaggggtaaggtctgcgtttgttattattgttgttgttgattctctgcgaattaattaaaaggtacacatggcaaatctactcggatcggttgttgacactggctgctgtttatggattctggaagcatgtttccaaacttgatcgtcttgaaattcgtcgttatcttgaaatgttctatgctctaaaattccgcaaactggtgagtttcactgctttctgcactcttccaattgttagttgagtgcactcatttaaactgtagctaaagctgttgtaaatcttcagttaagcagctgctaatgaagtttttatcttttgtttttggttcaggctgaagctgtcccgttggctgttgagtaa

seqidno:16:ntsus4-t的多肽序列

maervltrvhslrerldatlaahrneillflsrieshgkgilkphqllaefesihkedknklndhafeevlkstqeaivlspwvalairlrpgvweyvrvnvnaliveeltvpeylqfkeelvngtsndnfvleldfepftasfpkptltksigngveflnrhlsakmfhdkesmtplleflrvhhykgktmmlndrvqdlntlqnvlrkaeeylttlspetsysvfehkfqeiglergwgdnaervlemicmlldlleapdsctlekflgripmvfnvvilsphgyfaqenvlgypdtggqvvyildqvpaleremlkrikeqgldikprilivtrllpdavgttcgqrlekvfgtehshilrvpfrtekgivrkwisrfevwpymetftedvakeiaaelqakpdliignysegnlaasllahklgvtqctiahalektkypdsdiylkkfdekyhfsaqftadliamnhtdfiitstfqeiagskdtvgqyeshmaftmpglyrvvhgidvfdpkfnivspgadmnlyfpyfekekrltayhpeieellfsdvendehmcvlkdrnkpiiftmarldrvknltglvelyaknprlrelvnlvvvggdrrkeskdleeqaemkkmyelikthnlngqfrwissqmnrvrngelyryiadtrgafvqpafyeafgltvveamtcglptfatnhggpaeiivhgksgfhidpyhgeqaaelladfferckkepshweaisegglkriqekytwqiysdrlltlaavygfwkhvskldrleirrylemfyalkfrklaeavplave

seqidno:17:ntsus5-s的多核苷酸序列

atggcctcaacagttgctgatagcatgcctgatgctttgaaacaaagccggtatcatatgaagagatgcttcgctaggtgaacacccttcttttatgttttttcccctctacgtgtttatgtcaaatttccatgcataatgctaactacttttcttctttttgacttcaaaattggatgtgaaaggttcattgcaatgggaaggaggctaatgaagttgaaacatttaacagaagaaatagaagaaactattgaagacaaggcagaaagaaccaggattttggagggttcacttggaaaaattatgagttccacacaggtcagcaccatttaaccaacttagttgaacaggaaaaaaagaaaaagcaaaagagttattgcaaggcgtaacgattttctttgaaattttcaggaggcagctgttgttccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtcaaagttaacgctgaaactctctctgtggaagctatttcagccagggaatatctcaaattcaaagagatgatctttgacgaagactggtaagtggaaaattgtatcattttaaagagaaacaattttgtaacatacaagaatagttttgatggttgaatgtgcaagcagggcaaaggatgataatgcactggaagtagattttggtgcttttgactactctaatcctcggttagccctttcctcttctgtcggaaatgggctcaactttatctcaaaagttctgtcttcaaagtttggtggaaagccagaggacgcccagcctttgcttgattacttactagctcttaatcatcaaggagaggtatgaaaatggactacctttgtttcttaaaggtattatataatgatgcgcgttataaagttcctttttaaattgaaactttgcagaatctaatgatcaatgagaatctgaatggtgttgctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttctcatatgcttccattgtcatatgcagtataccaatgacatgctaccgaaaagttgtttatgtttgtgacttgattatgaaaactctaggctcaaagaatggggctttgataaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccgagataatccaagcaccagatcccataaatatggagtcctttttcagcaagcttcctactacattcaacattgttatcttctccattcatggttactttggccaagcagatgtccttggtctgcccgatactggaggccaggtctacatatacagcaatttatctccttttgcctcatattgcttattagcgacacttgcatcattgaaatcagacttttacttcacaggttgtttatattctggatcaagtaagggctttagaggaggaaatgttacaaagaatcaagcagcaagggctaaacgtgaagcccaagattcttgtggtgagttttgcaaaaatatgcttagacaggttttgagattgatcggagaagggattaagatgatcaagatctttgtttcctgctttcatgatgtaaacaggtatctcgtctcataccagatgctcgagggacaacatgcaatcaggagatggaacctattcttaactcatcccattctcacatcctgagaattccattcaggactgagaaaggagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtcttctaacaaaattaccacctattcatacactttatttactttcttgaactaatcgtttggtttgtgacgtatatcattaggatgcttctgctaagatacttgagctcatggaaggtaaaccagacctcataattgggaactacactgatggaaatttagtggcatctctattggccaacaaacttggagttactcaggttccgtagctgatcatatgatcatattttctacattgtttcttgataattaaatggaaatcttattggatgataacattttagggaaccattgctcatgcattagagaaaactaagtatgaagattctgatgtgaagtggaagcagtttgatcccaagtaccacttttcttgccaatttactgccgatttattggcaatgaatgctgctgattttatcattaccagcacatatcaagaaatcgctggaaggttagcactgactctctcagtatatttggcaacttaatgaatttactgcagtggccaacactaaaagctatcattcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgatccaaagttcaacattgctgctcctggggctgaacagtctacctatttccctttcactgagaaacagaaacgattcagcacatttcgtcctgctattaacgaattactttacagtaatgaggaaaacaatgagcacatgtaagtctaattgcccattttcctaatctaaccattgcttaaatcgttctgtttttaccggatgtgtggtacttatcagtaacatttttttttggatcagtggatttcttgcagaccggaaaaaaccaattatattttcaatggcgagatttgatacagtgaagaacctgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggtaaaccttgttattgttgggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaataccagctcaagggacaaatgagatggatagcagctcaaactgataaatatcgaaatagtgagctataccgaactattgctgacactaagggagcttttgtccaaccggctttatatgaagcttttggactaaccgttattgaagcaatggattgtggattgcctacgtttgcaactaatcaaggtggacctgcagaaatcattgttgatggggtttcaggtttccatattgatccttacaatggggacgaatcaagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacaggatatctgagggaggtctcaagcgcattgaagaatggtaacaaactagttccaagtttaaaaaatggaaaaaatgcttatcatgttatattttcgtggttttaagttctgcttcgatgcagttatacgtggaagatttatgcaaacaaagtgttgaatatgggatcaatctatggattttggagacaattcaatgtggggcaaaagcaggctaagcaaagatactttgagatgttttacaatcctctcttcaggaaattggtaggttgtatatgttgaatacaatttactaagatcctcaaaatgaccaagaaatatacattgactatgctacttttgtaatttcacaggccaaaagcgtgccgatcccacatgaagagccattgccacttgcaacatcagactctactcaatcccaagaattaaaactaccactaccagttccagcagcagtagctaaagttctgccattaacaaggcatgcttttaacttaattacttctctacctagagtaactggtaaagtggatgtcaagtga

seqidno:18:ntsus5-s的多肽序列

mastvadsmpdalkqsryhmkrcfarfiamgrrlmklkhlteeieetiedkaertrilegslgkimsstqeaavvppyvafavrhnpgfwdyvkvnaetlsveaisareylkfkemifdedwakddnalevdfgafdysnprlalsssvgnglnfiskvlsskfggkpedaqplldyllalnhqgenlminenlngvaklqaalivaevfvssfpkdtpykdfehklkewgfdkgwghnagrvretmrllseiiqapdpinmesffsklpttfnivifsihgyfgqadvlglpdtggqvvyildqvraleeemlqrikqqglnvkpkilvvsrlipdargttcnqemepilnsshshilripfrtekgvlrqwdasakilelmegkpdliignytdgnlvasllanklgvtqgtiahalektkyedsdvkwkqfdpkyhfscqftadllamnaadfiitstyqeiagsetrpgqyeshtaftmpglyravsginvfdpkfniaapgaeqstyfpftekqkrfstfrpainellysneennehigfladrkkpiifsmarfdtvknlsgltewygknkklrnlvnlvivggffdpskskdreeaaeikkmheliekyqlkgqmrwiaaqtdkyrnselyrtiadtkgafvqpalyeafgltvieamdcglptfatnqggpaeiivdgvsgfhidpyngdesskkiadffekckvdskywnrisegglkrieecytwkiyankvlnmgsiygfwrqfnvgqkqakqryfemfynplfrklaksvpipheeplplatsdstqsqelklplpvpaavakvlpltrhafnlitslprvtgkvdvk

seqidno:19:ntsus5-t的多核苷酸序列

atggcctcaactgttgctggtagcatgcctgatgctttgaaacaaagccgatatcatatgaagagatgcttcgctaggtgaacacccttcttgttctttttgttttttccctctaccatttatgtcaaatttcaatgcataatgctaactactttttttctttttgacttcaaaattggacgtgaaaggttcattgcaatgggaaggaggttgatgaagctgaaacatttaacagaagaaatagaaaaaactattgaagacaaggcagaaagaaccaagattttggagggttcacttggaaaaattatgagttccacacaggtcagcaccatttaaccaacttaattgaataggaagaaaaaaaaaagcaaaagagttattgcaaggcgtaacgatttcctttgaaattttcaggaggcagctgttgtcccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtcaaagttgacgctgaaactctctctgtggaagctatttcagccagggactatctcaaattcaaagagatgatctttgatgaagattggtaactggaagattgtatcattttaaagaaacaattttttaatattcaagattagttttgatggttgaatgtgcaagcagggcaaaggatgaaaatgcactcgaagtagattttggtgcttttgactactctaatcatcggttagccctttcctcttctgtcggaaatgggctaaacttcatctcgaaagttttgtcttcaaagtttggtggaaaggcagaagatgcccagcctttgcttgattacttactagctcttaatcatcaaggagaggtatggaaatggactaccttcctttcttaaggaattatataatgatgtatgttataaagatcctttttaaacattgacactttgcagaatctaatgatcaatgagaatctgaatggcgtctctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttttcaaacgcttctgttatcatatgcaatataccaagaatatgttgccttttgaaaagttgtttatgtttatgacttgataatgaaaatactaggctcaaagaatggggctttgagaaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccgagataatccaagcgccagatcccataaatatggagtcctttttcagcaggcttcctactacattcaacattgttatcttctccattcatggttactttggccaagcagatgtccttggtttgcccgatactggaggccaggtttacatacacagcaatttatctccttttgcctcatatttacttattagcgacacttgcattattgaaatcacatttgtatttaacaggttgtttatattctggatcaagtaagagccttagaggaggaaatgttacaaagaatcaagcagcaagggttaaatgtgaagcccaagattcttgtggtgagttatgcaaaaatatgcgtagccaaggttttgaaattgttcagaggggattaagatgatcgagatatttgtttccttcttccattgatgtgtacaggtcactcgtctcattccagatgctcgagggactacatgcaatcaggagatggaacctatacttaactcgtcccattctcacatcctgagaattccattcaggacagagaaaggagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtctcctaccaaaattaccacctattcatacactttattcagttttttgagctaatcattctcatttgtcacgtatgtgattaggatgcttctgctaagatacttgagctcatggaaggtaaaccagacctcattattgggaactacactgatggaaatttagtggcatctctattggccaacaaacttggagttactcaggttctacagctgatcatttatctgatcagattttctacattgttttcttgataattaaacggaaatcttatgagattgtaacattttagggaaccattgctcatgcattagagaaaaccaagtatgaagattctgatgtcaagtggaagcagtttgattccaagtaccacttttcttgccaattcactgccgatttattggcaatgaatgctgctgattttatcattaccagcacatatcaagaaatcgcaggaaggttagcactgactctctcagtatatttggcaacttaatgaatgtactgcttgtggccaacactaaaagctattactcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgatccaaagttcaacattgctgctcctggggctgaacagtctgcctatttccccttcactgagaaacagaaacgattcagcgcgtttcgtcctgctattgaggaactactttacagtaatgagcaaaacaacgagcacatgtaagtctaattgccccattttcctaatctaaccattgcttaaatgttctgtttttacttgatatgtggtacttatcagtgatattttttattggaacagtggatttcttgcagaccgtaaaaaaccaattatattttcaatggcaagatttgatacggtgaagaacttgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggttaacctcgttatcgttgggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaatacaagctcaagggacaaatgagatggatagcagctcaaactgataaatatcaaaacagtgagctatatcgaactattgctgacactaaaggagctttcgtccaaccggctttatatgaagcttttggactaactgttattgaagcaatgaattgtggactgcctacatttgctactaatcaaggcggacctgcagaaatcattgttgatggggtttcaggcttccatattgatccttacaatggggatgaatcgagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacaagatatgtggaggaggtctcaagcgcattgaagaatggtaa

seqidno:20:ntsus5-t的多肽序列

mastvagsmpdalkqsryhmkrcfarfiamgrrlmklkhlteeiektiedkaertkilegslgkimsstqeaavvppyvafavrhnpgfwdyvkvdaetlsveaisardylkfkemifdedwakdenalevdfgafdysnhrlalsssvgnglnfiskvlsskfggkaedaqplldyllalnhqgenlminenlngvsklqaalivaevfvssfpkdtpykdfehklkewgfekgwghnagrvretmrllseiiqapdpinmesffsrlpttfnivifsihgyfgqadvlglpdtggqvvyildqvraleeemlqrikqqglnvkpkilvvtrlipdargttcnqemepilnsshshilripfrtekgvlrqwdasakilelmegkpdliignytdgnlvasllanklgvtqgtiahalektkyedsdvkwkqfdskyhfscqftadllamnaadfiitstyqeiagsetrpgqyeshtaftmpglyravsginvfdpkfniaapgaeqsayfpftekqkrfsafrpaieellysneqnnehigfladrkkpiifsmarfdtvknlsgltewygknkklrnlvnlvivggffdpskskdreeaaeikkmheliekyklkgqmrwiaaqtdkyqnselyrtiadtkgafvqpalyeafgltvieamncglptfatnqggpaeiivdgvsgfhidpyngdesskkiadffekckvdskywnkicggglkrieew

seqidno:21:ntsus6-s的多核苷酸序列

atggctactgcaccagccctaaatagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggaaagaggatgatgaaacttcataacttgatggatgagttggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctacatattatgcactacaatggtatagctagattcatatgtacttatgatgcccttatattgtttcctgatgtattactcttaaaaccttctttgatcaaatttacaggaggctgcagttgttcctccctacattgcctttgccacgagacagaatcctggattctgggaatatgtgaaagtgaatgctaatgatctttctgttgagggtattacagctacagaatacttgaaattcaaggaaatgatagttgatgaatgctggtatagtatacgttgcagcttatcataccttttgtggttttataacttcaatcagaaaactcatcagagttacctttgtgtgaacatgaaatgcagggcaaaagatgaatatgcactggaaattgattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggcaatggtctcagttatgtttccaagtttctaacttcaaagctaaatgctacctccgcgagtgcacagtgtctggttgactacttgctcactttgaatcatcaaggagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagaaaaaataggaaaagaagattcacgtaacaaattttctttatgttcaactgcagaaactgatgatcaatgagacactcagcactgtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctctttaccaacagatacaccatatgagagctttgagctaaggtgatttgttttttcctctacttccctccacttgtgccatgctacgtagtactaagtaacttcaattcttgtaaagattcaaacagtggggttttgagaaaggatggggtgatacagctgaaagggtcagcgacaccatgagaacactgtctgaggtgcttcaggcaccagatccattgaacattcagaagttctttggaagggttccaactgttttcaatattgtattgttctctgtccatggatactttggccaagcagatgttcttggcttgccagacactggtggtcaggtaagcatttaatagcttttacatttaacttctatgcattgacaataaaataatttttaacagtttgaccacttctgctcttgttcaacaggtagtttatgttttggatcaagttgtagcttttgaagaagaaatgctacaaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagttcctagacaatcgacgtgactatgcaattatgtagaggctgtttagaaaagttaatatcatatgttgattgcacagttaacccgactgattccggatgcaaaaggaacaaagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtatgtatttttatatcaaccttgctcatcaaagatgtgttgtttcctcaattccatttttccccttggcaaaaggatgctgctgacaaaatcgtcgagctaatggaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttcactaatggctagaaaacttgggataactctggtaacttttcttaatcatatttgatgttgcttcttctccaagttagttcttaatctccactgacctagaccatctttgcaacagggaactattgctcatgctttggagaagacaaaatatgaagactctgacataaaattgaaggaactcgatccgaagtaccacttctcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcactagcacataccaagaaatagctggaaggtaagaattagagctaataagtaatgcattcatatgtatttcagcatcgctctttcaccatcatcgaatacacaccactactcagtaaatgtatttgctcaaaagtttgcaacttaatggatctcattcttgaatgcttcaacatatgcagcaaagataaaccaggacagtatgagagccatagtgcatttacccttccagggctttacagagttgcttcaggtatcaatgtctttgatccaaaatttaatattgctgcacctggggcagaccagtcggtgtatttcccttacacagaaaagcagaagcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacgtgtaagtctaagtgttaaacttcagcttagtgcctagaacatcccactgctctatgtattgatgtttcacttgtttcaaacagtggatatttagaagacagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaaaatccaaggatagggaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagggtcagattagatggatagcagctcagactgacagatacagaaatagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattgtatgaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaaataatggggatgaatcaagcaacaaaattgccaactttttccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttgcagaaaatttcttaatccttaaatcctaattttttgcagttacacatggaagatctatgcaaacaaggtattgaatatggggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctttgcttccttaatggcacttattgcaggtaaaaaatgtgcctatcagaaaggacgaaacaccacaaggaccaaaggagagggagaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctacagtttttcaagagaccctagtatattctagtactaaattagaattatacagcatgcagcttttgctgttcacctttctaaatcaccagttgtgtcaatcaagttgacaaaatcaataaattgggattttccctttcctatgcttgattgttattactcctactttgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactgacatactaattatttctgtgtaccaggcgctcacaatcaaggttgcagaagtaagattagataaaattgctactgcatga

seqidno:22:ntsus6-s的多肽序列

matapalnrsesiadsmpealrqsryhmkkcfakyieqgkrmmklhnlmdelekviddpaernhvlegllgyilcttmeaavvppyiafatrqnpgfweyvkvnandlsvegitateylkfkemivdecwakdeyaleidfgavdfstprltlsssignglsyvskfltsklnatsasaqclvdylltlnhqgdklminetlstvsklqaalvvaeasisslptdtpyesfelrfkqwgfekgwgdtaervsdtmrtlsevlqapdplniqkffgrvptvfnivlfsvhgyfgqadvlglpdtggqvvyvldqvvafeeemlqrikqqglnikpqilvltrlipdakgtkcnqelepikntkhshilrvpfrtekgvlnqwvsrfdiypylerytqdaadkivelmegkpdliignytdgnlvaslmarklgitlgtiahalektkyedsdiklkeldpkyhfscqftadliamnsadfiitstyqeiagskdkpgqyeshsaftlpglyrvasginvfdpkfniaapgadqsvyfpytekqkrltafrpaieellfskvdndehvgyledrkkpilftmarldtvkntsgltewygknkrlrslvnlvvvggsfdptkskdreeaaeikkmhmliekyqlkgqirwiaaqtdryrnselyrtiadskgafvqpalyeafgltvieamncglptfatnqggpaeiivdgvsgfhidpnngdessnkianffqkcredpeywnrisvqglnriyecytwkiyankvlnmgsiytfwrtlyrdqkqakqryietfynlefrnlvknvpirkdetpqgpkerekvkpqisqrhalkllptvfqetlaltikvaevrldkiata

seqidno:23:ntsus6-t的多核苷酸序列

atggctactgcaccagccctgaaaagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggcaagaggatgatgaaacttcataacttgatggatgaattggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctacatattatgtactacaatggtatagctagattcatatgtacttatgatgtccttatattgtttccggaggcattattcttaaatccttctttgatcaaatttgtaggaggctgcagttgttcctccctatattgccttcgccacgagacagaatcctggattctgggaatatgtgaaagtcaatgctaatgatctttctgttgagggtattacagctacagattacttgaaattcaaggaaatgatagttgatgaaagctggtatagaatactttgcagcttatcataccttttgtggttttataatttcaatcagaaaactcatcagagttacctttgtgtgaacatgacatgcagggcaaaagatgaatatgcactggaaattgattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggaaatggtctcagttatgtttccaagtttctaacttcaaagctaaatgctacctcagcgagtgcacagtgtctggttgactacttgctcactttgaatcaccaaggagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagtaaaaataggaaaagaagattcatgtaacaaattttctttatgttcaactgtagaaactgatgatcaatgagacactcggcactgtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctccttaccaacagatacaccataccagagctttgagctaaggtgatttgttttttcctctacttccttccacttttggtgtgctacatagtactaagtaacttcaattcttgtaaagattcaaacagtggggttttgagaaaggatggggtgatacagctgaaagggtccgcgacaccatgagaacactttctgaggtacttcaggcgccagatccattgaacattgagaagttctttgggagggttccaactgttttcaatattgtattgttctctgttcatggatactttggccaagcaaatgttcttggcttgccagacacaggtggtcaggtaagcatctaatagcttttacatttaacttctatgcattgacaataaaataacttctacactaccaaataatttttgaaagtttgaccacttcggctcttgttcaacaggtggtttatgttttggatcaagttgtagcttttgaagaagaaatgctccaaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagctcctagacaatgacgtgactatgcaattaagtagaggctgtttagaaaagttaatatcatatgttgattgcacagttaacccgactgattccggacgccaaaggaacaaagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtgtgtatttttatatcaaccctgctcatcaaagatgtgttgtttcctcaattccatttttcgccttgacaaaaggacgctgctgacaaaatcatcgagctaatggaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttctctaatggctagaaagcttgggataactctggtaacttttcttatcatatttgatgttgtttcttctccaagttggttcttaatgtcaactaacccagaccatctttgtaacagggaactattgctcatgctctggagaagacaaaatatgaagactctgacatcaaattgaaggaactcgatccgaagtaccacttttcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcacaagcacatatcaagaaatagccggaaggtaagaattggaactacggaagcagagagctaataagtagtgcactcatatatttcagcatcgctctttcgcataatcgaatacacaccactactcagtaaatgtacttgctcaaaagtttacaagtttatggatcttattcttgaatgcttcaacatatgcagcaaagataggccaggacagtatgagagccatagtgcatttacccttccagggctttacagagttgcttcaggcatcaatgtctttgatcctaaatttaatattgctgcacctggggcagaccaatcggtgtatttcccttacacagaaaagcagacgcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacatgtaagtcttagtgttaaacttcagctttcagcttagtgcctagaacattccactggctctatgtattaatgtttcacttgtttcaaacacagtggatatttagaagacagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaaaatccaaggatagagaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagggtcagatcagatggatagcagctcagactgacagatatagaaacagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattatatgaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaaataatggggatgaatcaagcaacaaagttgccaactttttccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttgctgaaaatttcttaatcctttaatcctaaaattttgcagttacacatggaagatctatgcaaacaaggtattgaatatggggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctttgcctccttaatgacacttattgcaggtaaaaaatgtgcctatcagacaggacgaaacaccacaaggaccaaaggagaggagggagaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctatagtttttcaggagaccctagtatattctagtactaaattagaattatacagcatgcagcttgcttctgctgttcacctttctaaatcaccagttatgtcaatcaagttgacaaaatcaataaattcggcttttccctttcctatgcttgattgttattactcctacttcgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactga

seqidno:24:ntsus6-t的多肽序列

matapalkrsesiadsmpealrqsryhmkkcfakyieqgkrmmklhnlmdelekviddpaernhvlegllgyilcttmeaavvppyiafatrqnpgfweyvkvnandlsvegitatdylkfkemivdeswakdeyaleidfgavdfstprltlsssignglsyvskfltsklnatsasaqclvdylltlnhqgdklminetlgtvsklqaalvvaeasisslptdtpyqsfelrfkqwgfekgwgdtaervrdtmrtlsevlqapdplniekffgrvptvfnivlfsvhgyfgqanvlglpdtggqvvyvldqvvafeeemlqrikqqglnikpqilvltrlipdakgtkcnqelepikntkhshilrvpfrtekgvlnqwvsrfdiypylerytqdaadkiielmegkpdliignytdgnlvaslmarklgitlgtiahalektkyedsdiklkeldpkyhfscqftadliamnsadfiitstyqeiagskdrpgqyeshsaftlpglyrvasginvfdpkfniaapgadqsvyfpytekqtrltafrpaieellfskvdndehigyledrkkpilftmarldtvkntsgltewygknkrlrslvnlvvvggsfdptkskdreeaaeikkmhmliekyqlkgqirwiaaqtdryrnselyrtiadskgafvqpalyeafgltvieamncglptfatnqggpaeiivdgvsgfhidpnngdessnkvanffqkcredpeywnrisvqglnriyecytwkiyankvlnmgsiytfwrtlyrdqkqakqryietfynlefrnlvknvpirqdetpqgpkerrekvkpqisqrhalkllpivfqetlvysstklelysmqlasavhlskspvmsikltksinsafpfpmldcyysyfvygslpslfspvllllqly

序列表

<110>philipmorrisproductss.a.

<120>调节植物中的还原糖含量

<130>p10505ep

<140>ep18164769.4

<141>2018-03-28

<160>24

<170>patentin3.5版

<210>1

<211>4384

<212>dna

<213>烟草

<220>

<221>misc_feature

<222>(1520)..(1520)

<223>n为a、c、g或t

<400>1

atggcagctagtggtcttagcattaagaaaagtttggaggaatccattttggctcatcca60

gatgaaattttggctctcaagtcaaggtacattactacatataatgatattaagaactag120

aggcttatccaaggttttgttacatttttgaaattataagtttagaacctaatagtactt180

ggtagcacttgtttccttattatctagctgttgttactgcttgttgctactgctttctgt240

tcatctttccttgagcccggtctatcggaaacaacctctctattctcaaagtataaggtt300

tgcgtacatactacctccccagactctacttgtggaatttactgtttttgttgtgttgtt360

gtaatctaatatttattagaattttactgatttttcacatatatatatctatgtcccctg420

tcgaaaattctatagctcatgttagctaaatacattagtaccattgtttttaattgtttt480

ggttttggcacaggattgaaactgaagggaaaggggtaatgaaaccacttgatctcttga540

accatttggtttctgttactagtaagacaaatggagtaaatattgtacctagtgcacttg600

tggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactagctg660

tacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtgg720

ctgaattaagcattcctgaataccttcaattgaaagagaacactgttgatgaaaggtaaa780

gtattagtctgcgatttcgctttgtgaaattgaagtttttgttttgattcataatgtttt840

gtgtatcaattatgttaccagtggaaacatattggagttggattttgagccatttacaac900

agttacaccaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcg960

ccacattgcttcgaaaatgtttcatgataaggagatttccagatgcctccttgacttcct1020

cagaaaccataactacaaaggaaaggtaataaaaaaaagtgtttctttaaacaagttgta1080

tgattatgtgtatatttctaagtatgttaacttgaaaacagtcattgatggtgaaagaaa1140

gcattcaaagcctagagagtttccaacttgttctgaaaaaagcagaggaacatttgtgca1200

cattgaatccagaaactccatactccaattttgaatcaaagtttgaagagattggcttgg1260

aaagagggtggggaaacaccgctgaacgcgtgcaagacactatcagtcatcttttgcatc1320

tccttgaggctcctaacgcgtcttctttggaaaatttccttggtagaatcccattggttt1380

tcaatgttgtgattctaactccacatggttattttgctcaagataatgtcttgggctatc1440

ctgacactggtggccaggtttgtgtccaatattttgcattcttgatcaagttctttatac1500

catttgaaccaacaatcttnaacattctttttttggttgtgaaatgttgaataggttgtt1560

tacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaa1620

ggactcgatgatatcatccctcgcatccttgttgtaagtggccttaattttcctagtttc1680

atttacacctctaaatgaaattgatcttttttgttgttttatatcaggtaacaaggctgc1740

tgcctgatgcagtaggaaccacctgtggcgagcggatggagaaagtatatggggcagaac1800

attctcatataattcgtgttccatttagaactgagaagggaatgttgcgcaaatggatct1860

cacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaa1920

taaaatccattggaatgttccttctgcaattgaaaatgtcttgctaactgaagacccatt1980

tttaaattgatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccag2040

acttgatcattggaaactacagtgagggaaatcttgctgcctctttgcttgcgaagaaat2100

ttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctg2160

accttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatc2220

tctttgccatgaatcacactgatttcatcatcaccagcactttccaagaaattgctggaa2280

ggtaaaagcaaatgcacaccatcatagtatttcatatttttacccttgtttatactattt2340

ccattcaccgaccccgacttgtttaggattgagccatagttgttgttgttgtttgtttat2400

actatttccatttgccgaccacaacttgtttaggactgaggtatagttgttgttgttggt2460

ttgttcatattattttcattcgctaaccctaacttgtttgggactgaggcatagtagtag2520

tagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtac2580

tgagacatagttgttgttgttgttgtttgtttatactatttccatttgccgaccccaact2640

tgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaa2700

ccccaacttgtttgggactgaggcatagtagtagtagtagtagttgttgctattagttta2760

tactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgt2820

ttgtttatactatttcaatttgtcgaccccaatttgtttgggaccaaggcatggttgttg2880

ttgttgtttgtttgtttttactgtttccattgatattggaacatttgttatttgcagcaa2940

aaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtaccgagt3000

agtccatggaatcgattcgtttgatccaaagttcaacattgtctcccctggggctgatat3060

gtcaatctacttcccttacactgagaaggagaaaaggctaaccaacttccacccggaaat3120

tgaagaactcctctacagtcctgttgagaataaggaccacttgttagtctccttaatttg3180

cttttatttcatcccatttatgatcgcttttatcccaacagatcgattaatcatttgtta3240

tcaacataaacagatgtgtgttgaaggaccggaacaagccaattctctttaccatggcaa3300

ggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgctaagaatgcaaggc3360

tgagggagcttgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatt3420

tagaagagcaagcagagatgaagaagatgtatgatcttatcgaaacctataacctgaacg3480

gccaattcaggtggatttcttcccaaatgaatcgtgtgaggaacggagaactctatcgtt3540

acattgcagacacgaggggtgctttcgttcaaccagcattctacgaggcttttggtttga3600

cagttgtagagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccat3660

ttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaagg3720

ctgctgatatgttggtaaatttctttgaaaaatctaaagaagatccaagttattgggatg3780

ctatttccaagggaggtctgcaacgtattcttgaaaagtaagcttttgcatttgattagc3840

acaagtgcacaaccaagatttaacttttgaacaaactaaaactaacccttttttgtattt3900

tcttttgctaggtatacatggcaaatttattcacagaaagtgatcacactatctgggatt3960

tatggattctggaagtatgcaaccaagaatgataaagttgctagtgcaaagaagcgctat4020

cttgagatgttttatgaacttggatttaagaaatcagtaagtgtcaattttaaaggggaa4080

ccttggatcaacggttaagttgtctttgtgcaacctataggtcaggggtttgagccgtag4140

aagtagccactaatatttacattagggtagactgtgtacatatcacaccccttggggtac4200

ggccctttcctggatcctgtatgaacgcgggatgccttgtgcaccgggctgtattttttt4260

ttttagtgtcacttctgtattttgtttgagcttgtttataaagtttggaaatctgctgct4320

aatttgtatatttgttggttgtgtatttcaggctgagaaagttccattggctattgatga4380

atag4384

<210>2

<211>803

<212>prt

<213>烟草

<400>2

metalaalaserglyleuserilelyslysserleuglugluserile

151015

leualahisproaspgluileleualaleulysserargilegluthr

202530

gluglylysglyvalmetlysproleuaspleuleuasnhisleuval

354045

servalthrserlysthrasnglyvalasnilevalproseralaleu

505560

valgluvalleusercysserglnglualavalilevalproprolys

65707580

leualaleualavalargproargproglyvaltrpglutyrleuser

859095

leuasnleulysthrlyslysvalalagluleuserileproglutyr

100105110

leuglnleulysgluasnthrvalaspgluserglyasnileleuglu

115120125

leuaspphegluprophethrthrvalthrproprolysthrleuser

130135140

aspserileglyasnglyleuglupheleuasnarghisilealaser

145150155160

lysmetphehisasplysgluileserargcysleuleuasppheleu

165170175

argasnhisasntyrlysglylysserleumetvallysgluserile

180185190

glnserleugluserpheglnleuvalleulyslysalaglugluhis

195200205

leucysthrleuasnprogluthrprotyrserasnphegluserlys

210215220

pheglugluileglyleugluargglytrpglyasnthralagluarg

225230235240

valglnaspthrileserhisleuleuhisleuleuglualaproasn

245250255

alaserserleugluasnpheleuglyargileproleuvalpheasn

260265270

valvalileleuthrprohisglytyrphealaglnaspasnvalleu

275280285

glytyrproaspthrglyglyglnvalvaltyrileleuaspglnval

290295300

proalametgluargglumetleuhisargmetlysleuglnglyleu

305310315320

aspaspileileproargileleuvalvalthrargleuleuproasp

325330335

alavalglythrthrcysglygluargmetglulysvaltyrglyala

340345350

gluhisserhisileileargvalpropheargthrglulysglymet

355360365

leuarglystrpileserargphegluvaltrpprotyrmetgluthr

370375380

phethrgluaspvalalaglugluleuvallysgluleuglnalalys

385390395400

proaspleuileileglyasntyrsergluglyasnleualaalaser

405410415

leuleualalyslyspheglyalathrglncysthrilealahisala

420425430

leuglulysthrlystyrproasnseraspleuasntrplyslysphe

435440445

aspasplystyrhispheserserglnphethralaaspleupheala

450455460

metasnhisthrasppheileilethrserthrpheglngluileala

465470475480

glyserlysasnthrvalglyglntyrgluserhisthralaphethr

485490495

metproglyleutyrargvalvalhisglyileaspserpheasppro

500505510

lyspheasnilevalserproglyalaaspmetseriletyrphepro

515520525

tyrthrglulysglulysargleuthrasnphehisprogluileglu

530535540

gluleuleutyrserprovalgluasnlysasphisleucysvalleu

545550555560

lysaspargasnlysproileleuphethrmetalaargleuasparg

565570575

vallysasnleuthrglyleuvalglutrptyralalysasnalaarg

580585590

leuarggluleuvalasnleuvalvalvalglyglyaspargarglys

595600605

gluserlysaspleuglugluglnalaglumetlyslysmettyrasp

610615620

leuilegluthrtyrasnleuasnglyglnpheargtrpileserser

625630635640

glnmetasnargvalargasnglygluleutyrargtyrilealaasp

645650655

thrargglyalaphevalglnproalaphetyrglualapheglyleu

660665670

thrvalvalglusermetthrcysglyleuprothrphealathrcys

675680685

asnglyglyprophegluileilevalasnglylysserglyphehis

690695700

ileaspproasnglnglyasplysalaalaaspmetleuvalasnphe

705710715720

pheglulysserlysgluaspprosertyrtrpaspalaileserlys

725730735

glyglyleuglnargileleuglulystyrthrtrpglniletyrser

740745750

glnlysvalilethrleuserglyiletyrglyphetrplystyrala

755760765

thrlysasnasplysvalalaseralalyslysargtyrleuglumet

770775780

phetyrgluleuglyphelyslysseralaglulysvalproleuala

785790795800

ileaspglu

<210>3

<211>3926

<212>dna

<213>烟草

<400>3

atggcaggcagtggtcttagcattaaggaaagtttggaggaatccattttggctcatcca60

gatgaaattttggctctcaagtcaaggtacattactgcataatgatattaagacctagaa120

gcggatccaagattttgttacatttttgaaattataagtttagaatctaatatttgttat180

cgcttgtttccttattatcttgctgttgttactgcctgttgctactagtttctgttcatc240

cttccttgagctgagtttctatcggaaacaacctctctactctcaaagtaggaataagtt300

atgcgtacacactaccctccccagactccacttgtgtaatttactgagtttgttgttgtt360

gttgttgtaatctaatacttgttagaattttactgatttttcacatatatatctatgacc420

catgtcgaaaatactatagctcatgtgctaaatacattagtaccattgttttgtaattgt480

tttggttttggaacaggattgaaactgaagggaaaggggtaatgaaaccagttgatctct540

tgaaccatttggtttctgttactagtaaaacaaatggagtaaatgttgtacctagtgcac600

ttgtggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactag660

ctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaag720

tggctgaattgagcattcctgagtaccttcaattgaaagagaatactgttgatgaaaggt780

aaagtaatagtctgcgatttcgctttgtgaaattgaagttttttgtttgattcttaatgt840

tttgtgtatcaattatgttaccagtggaaacatcttggagttggattttgagccatttac900

aactgttacaacaccaaaaacactttctgactctattggcaatggtttggagtttcttaa960

tcgccacattgcttcgaaaatgtttcttgataaggagattgccaagtgcctccttgactt1020

tctcagaaaccataactacaaaggaaaggtagtaaaaaaagtgtttctttaaacaagttg1080

tatgattatgtgtgtatttctaaatatgtcaatttgaaaacagtcattgatggtgaaaga1140

aagcattcaaagcctggagagtttccaacttgttctgaaaaaagcagaggaatatttgca1200

cacactgaatccagaaactccatactccaaatttgaatccaagtttgaagagattggctt1260

ggaaagagggtggggaaacaccgctgaacgcgtgcaagacaccattagtcatcttttgca1320

tctccttgaggctcctaacgcgtcttccttggaaaatttccttggtagaatcccattggt1380

tttcaatgttgtgattctcaccccacatggttattttgctcaagataatgtcttgggcta1440

tcctgacactggtggccaggtttgtgtccgatataacatatcaagaaattttgcattctt1500

gatcatgttctttataccatttgaaccaacattctttttttggttgtgaaatgttgaata1560

ggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaa1620

gcttcaaggactcgacgatatcatccctcgcatccttgttgtaagtgcccttaattttcc1680

tggtttggtttacctctaaatgaaattgattttctggctttctaacttttttggattgat1740

ctttttgttgttttatatcaggtaactaggctgctgcctgatgctgtaggaaccacttgt1800

ggcgagtggatggagaaagtatatggggcagaacattctcatataattcgtgttccattt1860

agaactgagaaaggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatg1920

gaaactttcactgaggttggaacataaaaacaaataaaaatcattggaatgttcttctgc1980

atttgaaaatgtcttgctaactaaagactcatttttaaattaatcatcaggatgttgcag2040

aagaacttgtcaaagaattgcaagctaaaccagacttgataattggaaactacagtgagg2100

gaaatcttgctgcctcattgcttgctaagaaatttggggctactcagtgtactattgctc2160

atgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgaca2220

agtatcatttctcaagtcagttcactgctgatctttttgccatgaatcacactgatttca2280

ttatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatag2340

tatttcatatttttaccctagtttatactatttccatttgtcaactccaacttgtttggg2400

attgaaccatagttgttgtttgtttatactatttccattcgccgaccccaacttatttgg2460

gactgagacataattgttgttattattgtttgtttgtttatactatttccattctcagac2520

cccaacttctttgggactgagccgtagattgttgttgttgttgttgttgttgtttgttta2580

tgctatttccgttcaccgaccccaacttatttgggactgaggtgtagaagtagtcgttgt2640

tgtttgtttatacgacttccaattgatattcgaatgtttttatttttgcagcaagaacac2700

tgtaggacagtatgagagtcatactgcttttaccatgcctggattgtatcgagtagtcca2760

tggaatcaattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaat2820

ctacttcccttacactgagaaggagaaaagactaaccaacttccacccggaaattgaaga2880

actcctctacagtcctgttgagaataaggaccacttgttagtcttctttatttcattcat2940

ttttctacaccttttttttcaacagattgattgattggttcttatcaacgtaaacagatg3000

tgtgttgaaggaccagaacaagccaattctctttaccatggcaaggctagatcgcgtgaa3060

gaatctaacagggctcgtggaatggtatgcaaagaatgcaaggctaagggagctcgttaa3120

ccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcaga3180

gatgaagaagatgtatgatcttatcgaaacatacaacctgaatggccaattcaggtggat3240

ttcttcccaaatgaatcgtgtgaggaacggagaactttatcgatacattgcagacacgag3300

gggtgctttcgttcaaccagcattttatgaggcatttggtttgacagttgttgagtctat3360

gacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaa3420

tggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggt3480

taatttcttcgaaaaatctaaagaagatccaagttattgggatactatttccaagggtgg3540

tctgcagcgtattcttgaaaagtaagcttttgcatttgattagcacaagtgtacaaccaa3600

gatttaacttatgaacaaactaaaactaaccctttttttattttcttttgctaggtatac3660

atggcaaatttattcacagaaagtgatcacattatctgggatttatggattctggaaata3720

tgcaaccaagaatgacaaagttgctagtgcgaagaagcgctatcttgaaatgttttatga3780

atttgggtttaagaaatcagtaagtgtcacttctgtattttgtttgagcttgtttgtaaa3840

gtttggcaatcttctgctaatttgtactatatttgttgacttgtgcatttcaggctgaga3900

aagttccattggctattgatgaatag3926

<210>4

<211>803

<212>prt

<213>烟草

<400>4

metalaglyserglyleuserilelysgluserleuglugluserile

151015

leualahisproaspgluileleualaleulysserargilegluthr

202530

gluglylysglyvalmetlysprovalaspleuleuasnhisleuval

354045

servalthrserlysthrasnglyvalasnvalvalproseralaleu

505560

valgluvalleusercysserglnglualavalilevalproprolys

65707580

leualaleualavalargproargproglyvaltrpglutyrleuser

859095

leuasnleulysthrlyslysvalalagluleuserileproglutyr

100105110

leuglnleulysgluasnthrvalaspgluserglyasnileleuglu

115120125

leuaspphegluprophethrthrvalthrthrprolysthrleuser

130135140

aspserileglyasnglyleuglupheleuasnarghisilealaser

145150155160

lysmetpheleuasplysgluilealalyscysleuleuasppheleu

165170175

argasnhisasntyrlysglylysserleumetvallysgluserile

180185190

glnserleugluserpheglnleuvalleulyslysalagluglutyr

195200205

leuhisthrleuasnprogluthrprotyrserlysphegluserlys

210215220

pheglugluileglyleugluargglytrpglyasnthralagluarg

225230235240

valglnaspthrileserhisleuleuhisleuleuglualaproasn

245250255

alaserserleugluasnpheleuglyargileproleuvalpheasn

260265270

valvalileleuthrprohisglytyrphealaglnaspasnvalleu

275280285

glytyrproaspthrglyglyglnvalvaltyrileleuaspglnval

290295300

proalametgluargglumetleuhisargmetlysleuglnglyleu

305310315320

aspaspileileproargileleuvalvalthrargleuleuproasp

325330335

alavalglythrthrcysglyglutrpmetglulysvaltyrglyala

340345350

gluhisserhisileileargvalpropheargthrglulysglymet

355360365

leuarglystrpileserargphegluvaltrpprotyrmetgluthr

370375380

phethrgluaspvalalaglugluleuvallysgluleuglnalalys

385390395400

proaspleuileileglyasntyrsergluglyasnleualaalaser

405410415

leuleualalyslyspheglyalathrglncysthrilealahisala

420425430

leuglulysthrlystyrproasnseraspleuasntrplyslysphe

435440445

aspasplystyrhispheserserglnphethralaaspleupheala

450455460

metasnhisthrasppheileilethrserthrpheglngluileala

465470475480

glyserlysasnthrvalglyglntyrgluserhisthralaphethr

485490495

metproglyleutyrargvalvalhisglyileasnserpheasppro

500505510

lyspheasnilevalserproglyalaaspmetseriletyrphepro

515520525

tyrthrglulysglulysargleuthrasnphehisprogluileglu

530535540

gluleuleutyrserprovalgluasnlysasphisleucysvalleu

545550555560

lysaspglnasnlysproileleuphethrmetalaargleuasparg

565570575

vallysasnleuthrglyleuvalglutrptyralalysasnalaarg

580585590

leuarggluleuvalasnleuvalvalvalglyglyaspargarglys

595600605

gluserlysaspleuglugluglnalaglumetlyslysmettyrasp

610615620

leuilegluthrtyrasnleuasnglyglnpheargtrpileserser

625630635640

glnmetasnargvalargasnglygluleutyrargtyrilealaasp

645650655

thrargglyalaphevalglnproalaphetyrglualapheglyleu

660665670

thrvalvalglusermetthrcysglyleuprothrphealathrcys

675680685

asnglyglyprophegluileilevalasnglylysserglyphehis

690695700

ileaspproasnglnglyasplysalaalaaspmetleuvalasnphe

705710715720

pheglulysserlysgluaspprosertyrtrpaspthrileserlys

725730735

glyglyleuglnargileleuglulystyrthrtrpglniletyrser

740745750

glnlysvalilethrleuserglyiletyrglyphetrplystyrala

755760765

thrlysasnasplysvalalaseralalyslysargtyrleuglumet

770775780

phetyrglupheglyphelyslysseralaglulysvalproleuala

785790795800

ileaspglu

<210>5

<211>4532

<212>dna

<213>烟草

<400>5

atggctgaacgtgctctgactcgtgttcacagccttcgtgaacgtcttgatgccactttg60

gctgcacatcgcaatgagatattgctgtttctttcaaggtattgcctaagtagtgttctt120

gtttcctacaaaagattcagttggtgttcaaaaaacgatatgtgatttgatttatctgcc180

taagtcttggtagtcataattatccggtacctgtgctggtgcgagttagctggttcggaa240

actactcttatgaaaacgagagatttagttggtgttgtctgcaattctgtagtatggact300

attaagcagatagatcatgtttgatatcgaaaaggaatgtatatgtgatgttacttgaac360

tggttttggttattacaggattgaaagccatggaaaagggatcttgaaacctcaccagct420

attggctgagttcgatgcaattcgccaagatgacaaaaagaagctgaatgatcatgcatt480

tgaagaactcctgaaatctactcaggtaattttgattttggctaaatgtgttaccaagct540

gaatgatcatgcatttgagtttgtgtccgactactacaatgatatgttataccaggaagc600

gattgttctgccaccttgggttgcacttgccattcgtttgaggcctggtgtgtgggaata660

tgtccgtgtgaatgttaatgctctagtcgttgaggagctgaccgtccctgagtatttgca720

ttttaaggaagaacttgttgatggaacgtaagttttagtctcttatttgatactatgtta780

gagaataggcagtggattcaatttatcagtgttgttttttacctaatgcagctccaatgg840

aaatttcgttctcgagttggattttgagcccttcactgcatcctttcctaaaccgaccct900

caccaaatctattgggaatggagttgaattcctcaataggcacctttctgcgaaaatgtt960

ccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataaggg1020

caaggtaactttgttattcccattcatatatatgttcagtttgtgcttatcatgcgccca1080

atgatgtatgaatatgtactaaaggatagatgtacgatttcgtttgcagacaatgatgct1140

gaatgacagaatacagaatttaaccactctgcaaaatgtcctaaggaaggcagaggaata1200

ccttattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaat1260

tggattggagaagggatggggcgacactgcggagcgcgtgctagagatgatatgcatgct1320

tcttgatctacttgaggctcccgactcctgtactcttgagaagttcctagggagaattcc1380

tatggtgttcaacgtggttatcctttccccccatggatatttcgcccaggaaaatgtctt1440

gggttatcccgacactggtggccaggtgcattactttagtctttgtccgtgagtctatgt1500

tgctcagatcctctacaatgccactgtacccgtgtaggatactccaaatataatgcattt1560

ttggaggatctgtcaccggtgcaatggcattttggaggtcggagcaacaaacaactgcta1620

gtatgcttctaaagcttgcttccataaatgctaaggtccttcacccgtaatgtgcaggtt1680

gtctacatattagatcaagttccagccttggagcgtgaaatgcttaaacgcctaaaggag1740

caaggacttgatataacaccgcgtattcttattgttagtatttcttgtacttgtaattgc1800

tgcggattacacaaaattttctctttattggcaacttatcttgatattattcccaggtta1860

ctcgtctgctgcctgatgcagttggaacaacttgtggtcagcggcttgagaaggtgtatg1920

gagccgagcactcacatattcttagggtcccctttaggaccgagaagggcattgttcgca1980

aatggatatctcgctttgaagtgtggccatacatggagactttcactgaggtgacactaa2040

gcttccttgtatttgtctatcttctaattggtattaggaacaatttgctaattattaacg2100

ctttggcttttcgtacatcaggatgttgcaaaagaacttgctgcagaactgcaggccaag2160

ccagatttgataattggcaactatagcgagggaaatcttgtggcttcattgctggctcac2220

aagttaggcgtaacgcaggtctgtgttatttttcacctcttataaatctgattgtatttc2280

cattagtctggaactaaaagtactaaaattttcttttcttcgctgtgttatttgccttct2340

gcagtgcaccattgcccatgcattggagaaaacaaagtatcctgattctgacatctactg2400

gaaaaaatttgacgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaat2460

gaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacat2520

caattgctaattcggttgcagtaacattttgttcgatttcttccccttatgcttaaccta2580

ataccctaatgaattttccagcaaggacactgtcggacagtacgagagtcaccaggcatt2640

cacaatgcctggattgtacagagtcgttcacggcattgatgtgttcgatcccaaattcaa2700

cattgtctcacctggagctgatataaacctgtatttcccatattccgagaaggaaaagag2760

attgacagcacttcacccagaaattgaggagcttctgtacagtgatgttgagaacgagga2820

acatctgtaagtttctaacttactcgtaccgtcagtggcagagccagaattttcattaaa2880

atggggtcaaaatataaagacataaattcacaaagaagccaaggggtgtcaatatgtagt2940

ataaatatattaaaaaaattacctagctacacaatgtaattttccgacaaaggggtatcg3000

gttgcacttcttgaatacatgtggctctgccactgggtacagttacaaagtcctgttacc3060

tatgtagatgagcttgtgctgaacatgttgtgattttggtaggtgtgtgctaaaggacag3120

gaataagccaatcttattcacaatggcgagattggatcgtgtgaagaacttaaccggact3180

tgttgagtggtacgccaagaacgcacggctaagggagttggttaaccttgttgtcgttgg3240

tggagaccgaaggaaggaatccaaagatttggaagagcaagcagagatgaagaagatgta3300

tgagctaataaagactcacaacttaaatggccaattcagatggatttcttcacagatgaa3360

ccgagtaaggaacggcgaactctaccgatacattgccgacactaggggagctttcgtgca3420

gcctgcattctatgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcc3480

tacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatccggctt3540

ccatatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaa3600

atgtaagacggaaccttctcattgggaaactatttcaaccggtggcctgaagcgcatcca3660

agagaagtaagcaactctttcttgactctagtcattcaaattaacttgggatttgaggca3720

tagttgattgataatttatcgcgtctctactactatatacaggtacacgtggcaaatcta3780

ctcggagagattattgacgttggctgctgtttacggtttctggaaacatgtttctaagct3840

tgatcgtctagaaatccgtcgatatctagaaatgttttatgctctcaaataccggaagat3900

ggtgagttcttctgcttcctgctcttctcatagtgtttaatatacacttgattgattgca3960

ttcacttagactaagttgctcggacacgggtgtggatgtccgacacgagtgcggatctag4020

agttcagatccttcaagatgtaaattataagattcggggatatggatcctagtacggata4080

cgggtgcgagaatccggctaaaaataattttaaaaaaaattatctctaaattatgagata4140

ttatgtggaatacttacgtataacttgtaaagtgtagattttttttaattctcaagttgt4200

agattagtaaatgattgatttcctagataagtatgctattttcttcaaatttactcttct4260

gatttcgaaaatcaaattgtatctcgtctcgaatttttccgtccgttatggtcaaagtac4320

ccaaaatcgtttgaccaaatcggtacggatcccatacccacacccacactagtgtcgtat4380

tgacacgggtgccgcacctaaactgctatgtcggagcaacttagcacttagagaatcatt4440

gatgttaaattttcttaattcttgaatctgctaatgaagattttatcttggtttttgttt4500

aggctgaagctgttccattggctgctgaatga4532

<210>6

<211>805

<212>prt

<213>烟草

<400>6

metalagluargalaleuthrargvalhisserleuarggluargleu

151015

aspalathrleualaalahisargasngluileleuleupheleuser

202530

argilegluserhisglylysglyileleulysprohisglnleuleu

354045

alaglupheaspalaileargglnaspasplyslyslysleuasnasp

505560

hisalapheglugluleuleulysserthrglnglualailevalleu

65707580

proprotrpvalalaleualaileargleuargproglyvaltrpglu

859095

tyrvalargvalasnvalasnalaleuvalvalglugluleuthrval

100105110

proglutyrleuhisphelysglugluleuvalaspglythrserasn

115120125

glyasnphevalleugluleuaspphegluprophethralaserphe

130135140

prolysprothrleuthrlysserileglyasnglyvalglupheleu

145150155160

asnarghisleuseralalysmetphehisasplysglusermetthr

165170175

proleuleuglupheleuargvalhisasntyrlysglylysthrmet

180185190

metleuasnaspargileglnasnleuthrthrleuglnasnvalleu

195200205

arglysalagluglutyrleuilemetleuproprogluthrprophe

210215220

sergluphegluhislyspheglngluileglyleuglulysglytrp

225230235240

glyaspthralagluargvalleuglumetilecysmetleuleuasp

245250255

leuleuglualaproaspsercysthrleuglulyspheleuglyarg

260265270

ileprometvalpheasnvalvalileleuserprohisglytyrphe

275280285

alaglngluasnvalleuglytyrproaspthrglyglyglnvalval

290295300

tyrileleuaspglnvalproalaleugluargglumetleulysarg

305310315320

leulysgluglnglyleuaspilethrproargileleuilevalthr

325330335

argleuleuproaspalavalglythrthrcysglyglnargleuglu

340345350

lysvaltyrglyalagluhisserhisileleuargvalprophearg

355360365

thrglulysglyilevalarglystrpileserargphegluvaltrp

370375380

protyrmetgluthrphethrgluaspvalalalysgluleualaala

385390395400

gluleuglnalalysproaspleuileileglyasntyrserglugly

405410415

asnleuvalalaserleuleualahislysleuglyvalthrglncys

420425430

thrilealahisalaleuglulysthrlystyrproaspseraspile

435440445

tyrtrplyslyspheaspglulystyrhispheserserglnphethr

450455460

alaaspleuilealametasnhisthrasppheileilethrserthr

465470475480

pheglngluilealaglyserlysaspthrvalglyglntyrgluser

485490495

hisglnalaphethrmetproglyleutyrargvalvalhisglyile

500505510

aspvalpheaspprolyspheasnilevalserproglyalaaspile

515520525

asnleutyrpheprotyrserglulysglulysargleuthralaleu

530535540

hisprogluileglugluleuleutyrseraspvalgluasngluglu

545550555560

hisleucysvalleulysaspargasnlysproileleuphethrmet

565570575

alaargleuaspargvallysasnleuthrglyleuvalglutrptyr

580585590

alalysasnalaargleuarggluleuvalasnleuvalvalvalgly

595600605

glyaspargarglysgluserlysaspleuglugluglnalaglumet

610615620

lyslysmettyrgluleuilelysthrhisasnleuasnglyglnphe

625630635640

argtrpileserserglnmetasnargvalargasnglygluleutyr

645650655

argtyrilealaaspthrargglyalaphevalglnproalaphetyr

660665670

glualapheglyleuthrvalvalglualametthrcysglyleupro

675680685

thrphealathrasnhisglyglyproalagluileilevalasngly

690695700

lysserglyphehisileaspprotyrhisglygluglnalaalaasp

705710715720

leuleualaaspphepheglulyscyslysthrgluproserhistrp

725730735

gluthrileserthrglyglyleulysargileglnglulystyrthr

740745750

trpglniletyrsergluargleuleuthrleualaalavaltyrgly

755760765

phetrplyshisvalserlysleuaspargleugluileargargtyr

770775780

leuglumetphetyralaleulystyrarglysmetalaglualaval

785790795800

proleualaalaglu

805

<210>7

<211>5901

<212>dna

<213>烟草

<400>7

atgctttttatgggagtaaattttatggccggtcattcaactttgtgttcattacgcaaa60

agtcatttttcttggtgtttattacgcaagtcatttttcttttttttttgttacgtaaaa120

atcattcaactatgtgtttattatctaaaattcaattttttttttccttttgttacacaa180

aaatcattttactttactctatttatcacaaaagtcaccttggccagattttataatagg240

cttttatcttttgttacacaaaaattattttactttactctatttatcacaaaagtcacc300

ttggccagattttataataggcttttatcttttgttacacaaaaattattttactttact360

ctatttatcacaaaagtcaccttggccagattttacaatacttttaccttaaaagactat420

tatgcccttgacattataaatcctctcatttatataataccttctatatgatacactata480

taatatatttttacctaggtattttacttataattaaaataatattaaattattttattt540

atctattttataatatattcatacatttaattttttcatggcaaatcactttgtttaatc600

atatttaaacatgaacaaattttaaatatcaaaaaaataaaaaaataaaaaaaatattta660

tttgaaataataacaaacagatttgtttaacaaatgatagtttttttttatagtcaataa720

aatttttaaaaaaattcaaagatatttgtttttaatattaatatttttaaagctttatct780

gttaatattatttatttgaaagtattaatctgatgtgtcattgtgttaaatgtgagtatt840

ttatttattggattaatgagtatggcttggctgataaaaagctttgattttataattttc900

attaaaaatattttattaagctagtacctgacaaatttaatatcttgaaaattaacgtta960

agaaaaaattaaatataaaaatatattataaaaataataaataaataatatcaagttatt1020

ttaattataaataaaatacatggttaaaaatatattatatagcatataatatagaaggta1080

ttacataaatgagatgatttaaagggcataatagacttttcaggtgaatgatttgtaaaa1140

tatggttaaagtgattattgtgataattagagcatagtaaaataatttttatgtaacaaa1200

agaaaaaaaaaatgacttttgggtaatgaacataaatttgaataacttttacgtaacaaa1260

agaataaaataaattttggataataaacataaaattgaatgaccacctataaaatttatt1320

atttttttgggctcttcttgatttgattttttagtttagcctttgcagtaatcttggttg1380

tcacgcgtagcgttgtgctttcgccacataagtatttagtagacttaattaatgtcatta1440

tatcggttggtgtggttttaattacttaactgtactattatattaggtggaaggtttgaa1500

aatttatagtagtaacattctagatcattgaaaatattggtgtttcagtgactttttagt1560

atgtcattttcattttctaagtggttgtactaatatagtatattaaaattttgattggtt1620

gagaaacaatctctctcacctacacggtacgggtaaggtatgcgtatacgcttatcctcc1680

ctacactccatttgtgggactattgttgttattttggataagctgaggtatccatcttct1740

actaactgcactagtttattttttttgctgtttacagttgaaacaattgtctgaggattt1800

ctcacctgctgaatcaactgcaatggctgaacgtgtgctgactcgtgttcacagccttcg1860

tgaacgtcttgatgctactttggctgctcatcgcaatgagatattactgtttctttcaag1920

gtatagccaaagatagtattcttgttaactaaaaaagattcagttggtgttcaaaaaacg1980

atacgtttatctgcctaagtcttggtagtcagaattatccggtacctatgctggtgtgag2040

ttagctggctaggaaaccactcttatgaaaacaagagatttagttagagttgtctgtaat2100

tctgtagtatggactatgtatgtgatgctatttgaactggttttggttattataggattg2160

aaagccatggaaaagggatcttgaaaccgcatcagctattggctgagtttgatgcaattc2220

gccaagatgacaaaaagaaactgaatgatcatgcatttgaagaactcctgaagtccactc2280

aggtaatatggttttggctatatttgtcgccaacgccaagctcatatttttatattattt2340

tgagcttgtgtctgaatacgacgatgatatgttatactaggaagcaattgttctgccacc2400

ttgggttgcacttgcgattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgt2460

caatgcgctagtcgttgaggagctgactgtccctgagtatttgcatttcaaggaagaact2520

tgtcgatggaacgtaagtgttagtcttcaatttgatgctatgttagagaataggctgtgg2580

aatttattgatcaatgctgtgctttgtcctgatacagctccaatggaaatttcgttctcg2640

agttggattttgagcccttcaccgcatcctttcctaaaccaaccctcaccaaatctatcg2700

gaaatggagttgaattcctcaataggcacctctctgcgaaaatgttccatgacaaggaaa2760

gcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtgacttgct2820

atttccatttatctataggttcggtttgtgcttatcatgcgcccaatgacatatgaatat2880

gcgctaaaggatagatatatgatttcctttgcagacaatgatgctgaacgacagaataca2940

gaatttaaccacactgcaaaatgtcctaaggaaggcagaggaatacctcattatgcttcc3000

ccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaaggg3060

atggggcgacactgcagagcgcgtgctggagatgatatgcatgcttcttgatctcctcga3120

ggctcccgattcctgtactcttgagaagttcttggggagaattcctatggtgttcaatgt3180

ggttatcctttccccccacggatatttcgcccaggaaaatgtcttgggttatcccgacac3240

tggtggccaggtgcattactttaatctttatccgtgagtctatgtttgttcgaatcctct3300

agaaatgtcactgtacctatgtaggatactccaaatataatgcattttggggggatctgt3360

tatgggtgcgatggcatttttggaggtcggagcaacaaacaattgctatgtattcttcta3420

aagcttgctttcataaatgctaaggtccttcacccttaatgtgcaggttgtctatatatt3480

agatcaagttccagccttggagcgtgaaatgcttaagcgcctaaaggagcaaggacttga3540

tatcacaccgcgtattcttattgttagtatttcctgtacttgtaattactgcggattaca3600

caaaatttcctttttatcttcttaacaacttatcttgatggtattcccaggttactcgtc3660

tgctacctgatgcagttggaacgacttgtggtcagcggcttgagaaggtgtatggagccg3720

agcactcacatattctgagggtcccctttaggactgagaagggcattgttcgtaaatgga3780

tctctcgctttgaagtgtggccatatatggagactttcactgaggtgacactaaaacttc3840

cttatatttgtctatcttctaattggtattaggaataatttgttaattgttaactctttg3900

tcttttcgtacatcaggatgtcgcaaaagaacttgctgcagaattgcaggccaagccaga3960

tttgataataggcaactatagcgagggaaatcttgtggcttcattgctcgctcataagtt4020

aggcgtaacacaggtctgtgttgtttttcactctcttaaagatctgattgcatttccatt4080

agtctggaactagaagtactaaaaagttcttttcttcactgtgttatttgccgtcggcag4140

tgcaccatagctcatgcattggagaaaacaaagtatcctgattctgacatctactggaaa4200

aaattcgatgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaat4260

cacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaat4320

ttgctacttcgactgcaacagcattgtgttcccatttctttcccttatgcttaacctaat4380

accgtcatgaattttccagcaaggacactgtcggacagtacgagagtcatcaggcattca4440

caatgcccggattgtacagagttgttcacggcattgatgtgttcgaccccaaattcaaca4500

ttgtctcacctggagctgacataaacctctatttcccatattccgagaaggaaaagagac4560

tgacagcacttcaccctgaaatcgaggagctgctgtacagtgacattgagaacgaggaac4620

atctgtaagtttctaccttactcgtacagtcagtggcggagccagaattttcactaaaat4680

aaggtcaaaatataaagacataaatccacaaagaagccaagggtgtcaatatatagtata4740

aatacattaaaaaaattacctatctacacagtgtaattttccgacaaaggggtgtcggtt4800

gacactccttgaatacatgtggctctgccactgggtacagttacaaagttctgttaccta4860

tgtagatgagcttgtgctgaacatgttgtgattttggcaggtgtgtgctaaaggacagga4920

ataagccaatcttattcacaatggcgagattggatcgtgtgaagaatttaaccggacttg4980

ttgagtggtatgccaagaacgcacggctaagggagttggttaaccttgttgtggttggtg5040

gagatcgaaggaaagaatccaaagatttggaagagcaaacagaaatgaaaaagatgtatg5100

agctaataaagactcacaatttaaatggccaattcagatggatttcttcacagatgaacc5160

gagtgaggaacggtgaactctaccgatacattgctgacactagaggagctttcgtgcagc5220

ctgcattctacgaggctttcggtttgactgttgttgaggccatgacctgtggtttgccta5280

catttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatctggcttcc5340

acatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaat5400

gtaagacagaaccttctcattgggaaaccatttcaacgggtggcctgaagcgcatccaag5460

agaagtaagcaactctttcttgactctagtcattgaaattaactttcttgactctagtca5520

ttgaaattaactcgggatttgaggcgtagttgattgatattttatcgcgtctctactact5580

gatatatacaggtacacgtggcaaatctactcggagaggctattgacattggctgctgtt5640

tacgggttctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatcttgaa5700

atgttttatgctctcaaataccgcaagatggtgagttcctcttcttccttgcccttctcc5760

tagtgtttaagatacaatataattgattgcattatcttagagaatcattaatgttaaatt5820

ttcttaattcttgaatctgttaatgaagtttttctcttggtttttgtttaggctgaagct5880

gttccattggctgctgagtga5901

<210>8

<211>825

<212>prt

<213>烟草

<400>8

metleuphemetglyleulysglnleusergluasppheserproala

151015

gluserthralametalagluargvalleuthrargvalhisserleu

202530

arggluargleuaspalathrleualaalahisargasngluileleu

354045

leupheleuserargilegluserhisglylysglyileleulyspro

505560

hisglnleuleualaglupheaspalaileargglnaspasplyslys

65707580

lysleuasnasphisalapheglugluleuleulysserthrglnglu

859095

alailevalleuproprotrpvalalaleualaileargleuargpro

100105110

glyvaltrpglutyrvalargvalasnvalasnalaleuvalvalglu

115120125

gluleuthrvalproglutyrleuhisphelysglugluleuvalasp

130135140

glythrserasnglyasnphevalleugluleuaspphegluprophe

145150155160

thralaserpheprolysprothrleuthrlysserileglyasngly

165170175

valglupheleuasnarghisleuseralalysmetphehisasplys

180185190

glusermetthrproleuleuglupheleuargvalhisasntyrlys

195200205

glylysthrmetmetleuasnaspargileglnasnleuthrthrleu

210215220

glnasnvalleuarglysalagluglutyrleuilemetleupropro

225230235240

gluthrprophesergluphegluhislyspheglngluileglyleu

245250255

glulysglytrpglyaspthralagluargvalleuglumetilecys

260265270

metleuleuaspleuleuglualaproaspsercysthrleuglulys

275280285

pheleuglyargileprometvalpheasnvalvalileleuserpro

290295300

hisglytyrphealaglngluasnvalleuglytyrproaspthrgly

305310315320

glyglnvalvaltyrileleuaspglnvalproalaleugluargglu

325330335

metleulysargleulysgluglnglyleuaspilethrproargile

340345350

leuilevalthrargleuleuproaspalavalglythrthrcysgly

355360365

glnargleuglulysvaltyrglyalagluhisserhisileleuarg

370375380

valpropheargthrglulysglyilevalarglystrpileserarg

385390395400

phegluvaltrpprotyrmetgluthrphethrgluaspvalalalys

405410415

gluleualaalagluleuglnalalysproaspleuileileglyasn

420425430

tyrsergluglyasnleuvalalaserleuleualahislysleugly

435440445

valthrglncysthrilealahisalaleuglulysthrlystyrpro

450455460

aspseraspiletyrtrplyslyspheaspglulystyrhispheser

465470475480

serglnphethralaaspleuilealametasnhisthrasppheile

485490495

ilethrserthrpheglngluilealaglyserlysaspthrvalgly

500505510

glntyrgluserhisglnalaphethrmetproglyleutyrargval

515520525

valhisglyileaspvalpheaspprolyspheasnilevalserpro

530535540

glyalaaspileasnleutyrpheprotyrserglulysglulysarg

545550555560

leuthralaleuhisprogluileglugluleuleutyrseraspile

565570575

gluasnglugluhisleucysvalleulysaspargasnlysproile

580585590

leuphethrmetalaargleuaspargvallysasnleuthrglyleu

595600605

valglutrptyralalysasnalaargleuarggluleuvalasnleu

610615620

valvalvalglyglyaspargarglysgluserlysaspleugluglu

625630635640

glnthrglumetlyslysmettyrgluleuilelysthrhisasnleu

645650655

asnglyglnpheargtrpileserserglnmetasnargvalargasn

660665670

glygluleutyrargtyrilealaaspthrargglyalaphevalgln

675680685

proalaphetyrglualapheglyleuthrvalvalglualametthr

690695700

cysglyleuprothrphealathrasnhisglyglyproalagluile

705710715720

ilevalasnglylysserglyphehisileaspprotyrhisglyglu

725730735

glnalaalaaspleuleualaaspphepheglulyscyslysthrglu

740745750

proserhistrpgluthrileserthrglyglyleulysargilegln

755760765

glulystyrthrtrpglniletyrsergluargleuleuthrleuala

770775780

alavaltyrglyphetrplyshisvalserlysleuaspargleuglu

785790795800

ileargargtyrleuglumetphetyralaleulystyrarglysmet

805810815

alaglualavalproleualaalaglu

820825

<210>9

<211>8323

<212>dna

<213>烟草

<400>9

atggcgaatccaaagttcacaagagtacctagcatgagggagagagttgaggatactctc60

tctgctcaccgtaaccagcttgttgctctcctctccaggtatattaataaactctatata120

cttgttattttctttatttttttgtctttactgataaatttaactgttttcttctttaaa180

tcttgctttcgatgcatgatttctgttgtgttaaattgcgtaaccattttatctaaaagt240

ttatgctgataaacacttttaaattttaatatgtaaattatattatgtctcaacatcaac300

atgtggatggccaaaaatataaagcttaattttcgttattttgaatgatttttctctgcg360

agtgttacggtttgcgtacacattacctaaacctcctccctagtccccacttgtgggaat420

ttaattttttttttctttgtttttttttgttgttgttgttgtctgagttcaattcctacc480

atgttagcttggcaaaaataagttggtaaagcttgaccccaactagttttagttgatcga540

tttatttggtgatttatagttcaataataataattactattagagaaagttccagcagct600

tttctgtttgtttttccagttttagtgattgatatatgtgtatatatattctttgtttct660

tttaagatacgtggcgcaggggaaggggatattgcaacctcaccacttgatcgatgagtt720

caacaacgctgtatgtgatgacactgcttgtgagaagctcaaagatggtccctttagtga780

agtcttgaaagctactcaggtatattcactaatccatgggaatcaagatgatactgtata840

tctttattatggtgtctttcagaaatttgacgatgatgaaatgcaacttttctctgtttg900

tcaccttatccagactgtttttttattttttatttttcattttttaacttgaaatgctct960

taatttcctttgtttatcgataagaccggatttacaatgtatgaacggagcatcttaaga1020

accttctggaatgaagatataagatataaaacatggtgtccgttttctcctttgtggaat1080

cagtgtacatatagactgttattttggtcccactttctggatcttctgatcacaccttct1140

catgcagaggcgagcttgatggtttcaacctttaaattcttactattgaatccatttcac1200

tttcgaaattatgagttcgaaatctaatatttgttgaaatttttgcaaatgttcacatat1260

aagtttaagctttgtgtcaagaatactgggctcaatggattccaatagaccaggctgtat1320

ccgcctctgtctccactctccctgcatccacttctttcgtgtgactaataatgcttaatg1380

agctagaactcgttttaatgtttgaataagttgcttatatcagagcagcttttgatgttt1440

caatctttaacgggttatgcagtaccagcattctgcggctgaaaaacaggaatctgagat1500

ttacttgtctctggctgaatttcttgttcattttgctaacaagtactttggagttaatgc1560

ttgctctctgttgtcaaaataggaagccattgtgctgccaccatttgttgccatagcagt1620

tcgtccaaggccaggtgtttgggagtatgttcgtgttaatgtatatgatttgagcgttga1680

acaattgactgttcctgaatatcttcatttcaaggaagaacttgtggatggagagtaagc1740

tctttcttatttcaatacgaaacataaaaatttacagaagttgaataattaacaaatttg1800

ttgatttttaatgtatgccaggggtaataatcactttgtgcttgagctggattttgagcc1860

atttaatgcatcagttcctcgtccatctcgatcgtcatccattggcaatggagtccaatt1920

cctcaatcgtcatctttcctcaattatgtttcgcagcaaagactctctggaccccttact1980

tgatttccttagaggacactgtcataaagggaatgtaagtaccaaaagcagttttccctt2040

tgtaaatgtctgcttgtccctgattatctactaaatctttcaacacgcgcaaccattata2100

agaaatgtacaatacttctagttagaatttcatcatcgacaaactatctgctttactttt2160

tatttttcccatttgatggatgatagtttagtttatataacagatgatattttggttgaa2220

gggtaccatgaactttttcacaaccacttaatggatacatagttgtaatagttgacattt2280

tggaataatattgtctcacttggaaatgtttaagaagtattactacttctatttgtaaga2340

tggattgtttatctatgcaggtcttgatgttgaatgatcgtatacagcgaatctccaggc2400

tggagtctgctctttctaaagcagaggattatctctccaagctatcaccagatacatcct2460

ataatgagttcgaatacgcgtgagcttgtacacatttgttttgttttctttcaagcatat2520

gtaatttctcaagaaaagggaaatctataggagttgaaacattctttatggaaccatgtg2580

catgcagattgcaagaaatgggctttgagagaggttggggtgatactgccagacgtgttt2640

tggagacgatgcatcttctttctgacattcttcaggctccggatccatcaaccttggaga2700

catttcttggtagactacctatggtgttcaatgtcgtcatattatcccctcatggatatt2760

ttggccaagcaaatgtcttgggtttgcccgacactggtggccaggtaataacaaggagaa2820

tgaggtcttgtattatgtactccctccgttccaatctatatgaacctatttgactgggta2880

tggaaagaaatgaagacttgtaaaacttgtggttctttagaaattccaaacattacattt2940

ggttttttccctcttcctggaaattatactactgaatcatctctagatgttccagtttaa3000

cttgagacgtaagggtaaataacggaccattactctgtcctttcttgcagtaggcttggt3060

acaatgaatatagttcgcatagttgccggaagctagagctgtgttagaaaactcaggaac3120

attaatttggcgatgctaatcactgctaatgttactgaagcatccatggttttccttgat3180

gttattctccttttggttgcttcacaggttgtctatatactggatcaagtgcgtgccttg3240

gaggccgaaatgcttcttagaataaagcaacaaggacttaacttcaagcctagaatcctt3300

gtcgtgagtacatatatattatgcaagctcttatttggtttgtgggattgcagttgacat3360

caatttgcttactctgattactaaaggtcacacggctgatacctgatgctaaaggaacca3420

tgtgcaaccagaggttggagaggattagtggaactgaatactcgcatattttacgtgtcc3480

cttttaggacagagaagggaatccttcataaatggatatctaggtttgatgtatggcctt3540

acctggagaagttcactgaggtaacctctttgtcccttggaaattgccttttgttgctga3600

tgtttctgctagtgtgcttaaatgacggatgttaactagtcacttgctagcgtttgcaat3660

agcaacgggaaaagaaaggatttttgctagtttgaagtctgcctccaagaaaaattatat3720

taaaagtttatggctagtggaaacatcagtcattcatgtaccttatttctatgcccaagt3780

tgtttaagttgaaagtaatttggccaactatgcaaattgggagaacgtgtagccaactat3840

tgtgtttgccgacatgttgatatactttttggtcctgatttatatttgttggtttgtcat3900

actggatgaagcaattctcatgtttttctgcttatatatattggaagaagagatacttgt3960

cgtttcatcatttttctcgacctctctattaccaacactttgccaatttaatgtttggaa4020

atgtcttcttgaccaggatgtggcaagtgaaatgaccgctgagctccagggaaagccaga4080

tctgattattggcaactacagtgatggaaatttagttgcctcccttttggcatataaaat4140

gggtgtcacacaggtaggaaatacatgattctttatcttgctagcactaagtcttgaggt4200

tatgtatctgcaatagaaattttacgctttgccttcatttctttttaattatttttccag4260

tgtaccattgctcatgccttggaaaaaacaaagtatcctgattctgacatctactggaaa4320

aagtttgaggagaaatatcatttttcatgtcagtttactgctgatctactggcaatgaat4380

aattcagatttcattatcaccagtacttatcaagagattgcaggaacgtaagtcatttta4440

atctggtcgtttaaatctgatatttcttccctagtagtctattcaatccgaatttcagtt4500

cagtatatgatgtcatcggttgaggaactgtgattggtaaccttatcaaatccgtagctg4560

ctctataattttatttcgtaattggagaaacaattttttattattgagcttgtagtctga4620

gctagaatttggttctttatctatcaagtagcataatactacaactattttttatgtgtg4680

gcaatttgcaatttcaattttctatttctataagttgcagcttttcttcctgttctgatc4740

atatttacatggctgaaactcaatagaaaactaggctagttgatcaaaagtagttggatg4800

ctttaaaattagtagacgttttgctaaatgagtgaccaatgttattaaaaaaacgttcat4860

gttttcaacccttttggcatacatttgaccactgcccaagattttggataagtacatgca4920

gtgcttataattataaagcattttatcccaccttgtttttcattatgaaaattaagtaat4980

ttacgagtatttgtataagttacttcataaattagaagtaaatctggattgtgtaaagtt5040

attcgccccgtatatactgaaagctacttgaacaagcaaaaaaacagacaaacgtaacat5100

tctccatggattaatgagacttgtatatatatatatatatatatgtaaagagagagagag5160

agagatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgact5220

agacctaaatgttttgtttcaatgtccacgggagttttacgtagagttaagaggagaaga5280

gagtgaggaatactaatgtttgatggtaccccttggcttcttgacctggatactcagtgt5340

tcttattcatgcctatactttggtccttgatttcattctcccttttctagcttgagctgc5400

atcaaagaaattccactgtaaaaaaaataatgctcaccatattggtgcaacatggcaaac5460

atgtatcctatttgatgatcaatcaactttatttttctcctgttaattgacctcagtgtg5520

taactctctatgtatgatagcattgtaacttgtgtcatgattcataaatagggtactaga5580

attggatggttgacatagtaaatggtcaattgatgatccacaaaatatgcacctactgat5640

taaaatgtgatagggcaggtttatttttgtttgtggttaacacagtacttaaccctatat5700

ttaatacaatttggcttatctacaatcttttcttcagtgtttatgcgaattccttattgc5760

acaacaatattgtctttctgagttctattctgttgttgcttacacttttattattccagt5820

aacatagatgtgaagacattagattggttgcttgcaaattgatagccacttgtttcagga5880

agaatactgttggtcagtacgagagccatactgcattcaccctcccgggactatatcgcg5940

tcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgaca6000

tgacaatttatttcccatattctgacaaggaaaaaagactaacgtctttgcatggctcga6060

ttgaaaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtggcatccgttt6120

gtacttaatttttttggaatagatgacatattatttgcatgaatatgaaaaggagggtct6180

gatatgattttctatagataaactaccaatgatattatttaaaaactcctggatactgta6240

ttaggagaagaagagaaccaggggtagatggcattagaatcccttaaatcttgaagagtc6300

gtcactaacgctcccaacacttctgcctcagaccctcaactaaatactattattgttgat6360

ttctttggagaagctataagaatctctctctccttatggtgaaaattttacttggcttta6420

tacttaacttccaaggctccctcttataaaatgcaaaaactgtctgtattcactctcttg6480

gttaacaattgatccaatcaaatgcatatggaacatctttctttacgtttcttctaaagt6540

tcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttagggacgg6600

atgtggaaattaacatatgggctcagcttttctgccgagtgcagaccatgtatatgcgtt6660

aaaaaattcactaaacaagtaaatgtttgattttgaacccagtaaatcaaatgagttgtg6720

gtagaatctcgaactcgaaccgataaagttcaaatccaggatccgcttttaggtaaactc6780

taccttgggaagtgttatatatatgtccctgattatttctttttccgtttcctttctatt6840

ttaatttttaaagttatttttagatggttttattttttgataagtggtaagttgttaata6900

ttccaaattaaatgccattgtcataactatatacatttataaagaatgattgatcctagt6960

ttctcattcctaagatccaaataaggcaataaacaatgtcttagtaattggacctgcttc7020

tggtgatcaacgcttgatcgcgtagttagttatagatgactgtaaaaactttaaccattt7080

taatggttttgtcaaagaacaaatatcggacatattatagagaatggactattgtacttt7140

gcttctgattggtcattttattgtgatccgtaaattggctgtgactgatgtcatatcttt7200

gcttacagaggtaatctgaatgataaatcaaaacccataattttttcaatggcaaggcta7260

gaccatgttaagaacattacgggactagttgagtgctatgctaaaaatgccacattgagg7320

gaattggcgaaccttgttgtagtagctggatacaacgatgtaaagaaatccagtgataga7380

gaagaaataacagaaattgagaagatgcatgctcttattaaggagcataaattggatggg7440

caattcagatgggtatcagcccaaacaaaccgggcacgtaatggtgagctctatcgctat7500

atagctgaccagagaggtatatttgttcaggtatgctatttgtattgtattagtccaatt7560

tcattttttgcaccaaaagaaaggttgttattgtgacgtatatgtttgttttagcctgca7620

ttttatgaagcatttggactaacggtggttgaagctatgacttgtggtcttccaacattt7680

gcaacttgccatggtggtcctaatgagatcattgaacccggtgtatctgggttccatatt7740

gatccttatcatcccgataaagctgctgaactcatgtcagaattctttcaacgctgcaaa7800

caagatcctactcactgggaaaaaatatctgcatctggtctccgaaggattcttgagagg7860

tctgtagttgtgtacatgtatagaagattaaagaatgctaccttgatatttatttgaatc7920

aaaaataacaggaacatctcttttttgaacatcactcaagttcttatattaaataatttt7980

taggtatacgtggaagatttactccgagaggctgatgactttatctggcgtatatggttt8040

ctggaagcttgtttcaaaacttgagaggcgtgaaactagacgataccttgagatgttcta8100

cattctcaaattccgcgagttggtgagtgccttttagctccttttcagttccaataaact8160

atatatgtggtttaagtaagtattaagcataaacatgtccgtgcttggggctgtcgaaaa8220

tgctatggacatatcctgagctaaggatttttcaagaaaattgatgttagctttactcta8280

tttacaggcaaaatctgtacctctagcaattgatgacaagtga8323

<210>10

<211>810

<212>prt

<213>烟草

<400>10

metalaasnprolysphethrargvalprosermetarggluargval

151015

gluaspthrleuseralahisargasnglnleuvalalaleuleuser

202530

argtyrvalalaglnglylysglyileleuglnprohishisleuile

354045

aspglupheasnasnalavalcysaspaspthralacysglulysleu

505560

lysaspglyprophesergluvalleulysalathrglnglualaile

65707580

valleuproprophevalalailealavalargproargproglyval

859095

trpglutyrvalargvalasnvaltyraspleuservalgluglnleu

100105110

thrvalproglutyrleuhisphelysglugluleuvalaspglyglu

115120125

glyasnasnhisphevalleugluleuasppheglupropheasnala

130135140

servalproargproserargserserserileglyasnglyvalgln

145150155160

pheleuasnarghisleuserserilemetpheargserlysaspser

165170175

leuaspproleuleuasppheleuargglyhiscyshislysglyasn

180185190

valleumetleuasnaspargileglnargileserargleugluser

195200205

alaleuserlysalagluasptyrleuserlysleuserproaspthr

210215220

sertyrasnglupheglutyralaleuglnglumetglyphegluarg

225230235240

glytrpglyaspthralaargargvalleugluthrmethisleuleu

245250255

seraspileleuglnalaproaspproserthrleugluthrpheleu

260265270

glyargleuprometvalpheasnvalvalileleuserprohisgly

275280285

tyrpheglyglnalaasnvalleuglyleuproaspthrglyglygln

290295300

valvaltyrileleuaspglnvalargalaleuglualaglumetleu

305310315320

leuargilelysglnglnglyleuasnphelysproargileleuval

325330335

valthrargleuileproaspalalysglythrmetcysasnglnarg

340345350

leugluargileserglythrglutyrserhisileleuargvalpro

355360365

pheargthrglulysglyileleuhislystrpileserargpheasp

370375380

valtrpprotyrleuglulysphethrgluaspvalalaserglumet

385390395400

thralagluleuglnglylysproaspleuileileglyasntyrser

405410415

aspglyasnleuvalalaserleuleualatyrlysmetglyvalthr

420425430

glncysthrilealahisalaleuglulysthrlystyrproaspser

435440445

aspiletyrtrplyslysphegluglulystyrhisphesercysgln

450455460

phethralaaspleuleualametasnasnserasppheileilethr

465470475480

serthrtyrglngluilealaglythrlysasnthrvalglyglntyr

485490495

gluserhisthralaphethrleuproglyleutyrargvalvalhis

500505510

glyileaspvalpheaspprolyspheasnilevalserproglyala

515520525

aspmetthriletyrpheprotyrserasplysglulysargleuthr

530535540

serleuhisglyserileglulysleuleupheaspproalaglnasn

545550555560

glugluhisileglyasnleuasnasplysserlysproileilephe

565570575

sermetalaargleuasphisvallysasnilethrglyleuvalglu

580585590

cystyralalysasnalathrleuarggluleualaasnleuvalval

595600605

valalaglytyrasnaspvallyslysserseraspargglugluile

610615620

thrgluileglulysmethisalaleuilelysgluhislysleuasp

625630635640

glyglnpheargtrpvalseralaglnthrasnargalaargasngly

645650655

gluleutyrargtyrilealaaspglnargglyilephevalglnpro

660665670

alaphetyrglualapheglyleuthrvalvalglualametthrcys

675680685

glyleuprothrphealathrcyshisglyglyproasngluileile

690695700

gluproglyvalserglyphehisileaspprotyrhisproasplys

705710715720

alaalagluleumetsergluphepheglnargcyslysglnasppro

725730735

thrhistrpglulysileseralaserglyleuargargileleuglu

740745750

argtyrthrtrplysiletyrsergluargleumetthrleusergly

755760765

valtyrglyphetrplysleuvalserlysleugluargarggluthr

770775780

argargtyrleuglumetphetyrileleulysphearggluleuala

785790795800

lysservalproleualaileaspasplys

805810

<210>11

<211>3604

<212>dna

<213>烟草

<400>11

atgtttacatggctgaaactcaatataaaaaacaagggtaggtgatcaaaaatcgttgga60

tgcttaaaatcagtagacgttttgctaaatgagcgaccaatgttattgaaaacgttcatg120

ttttcaacccttttggcatacatttgagcattgcccaagattttggataagtagatgcag180

tgcttataattttaaagcattgtatcctgccttgtttttcattgtcaaaattaattaact240

tacaagtatttctataagttgcttcataaattagaagtaaatctggattgtgtaatgtta300

ttcgcctcgtaaatactgaaagctgcttgaacaagtgaaaaaacacagacaaacgtaaca360

ttctccatggattgatgagacttgtaaaatacatatatagaaatttggcttgtaaccaca420

tgtatattatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttcca480

tgtccactggagttttacgtatagttaagaggagaaaagactgaggaatactaatgtatg540

atggtacccctttgcttcttgacctggatacccagtgttcctattcatgcctatactttg600

gtccttgatttcactctcccttttctaacttgagctgcatcaaagaaatttccactgtaa660

aaaaataaataatgctcaccatatctctgcaacattgcaaacatgtatcccatatgattg720

atattggtgcgacatggcaaacatgtatcctatttgatgatcaatcaaatttatttttcc780

cctgtcaaaatgacctcagtgtgtaattccctatgtatttgatagcattgtaactcgtgt840

catgattcatgaatagggtactagaattgcatggttgacaaatattaactggtcgattga900

tgatccacaaaacatgcacttactgactaaaatgtgatgggacagatttatttttgtttg960

tgattaacacagtacttaaccctatacttaatacaatttggcctagctacaatcttttct1020

tcagtgcaaattccttgttacacgaccaatattgtctttctgagttctattctgttgtta1080

cttacacttttattattcgaataagacattagattgcttgcatgcaaattgatagccact1140

tgtttcaggaagaatactgttggtcagtacgagagccatactgcattcaccctcccagga1200

ctatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcct1260

ggagctgacatgacaatttacttcccatattctgacaaggaaaaaagactaacgtctttg1320

catggctcgattgagaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtg1380

acatccatttgtacttattttaatttggaatagatgacatacttatttgcatgaatataa1440

actgacaacccagagatttcctacattagaaaaggagggtctgatatgattttctacaaa1500

taaattcccagtgatattgttcaaaaagtcctggatactttattatgagagaaccaggga1560

tagatggcactagaatcccttaatcttgagaagtcgccacttatcgctcccaacactttc1620

tgagaccctcaagtaactactattattgtttgatatcttggagaagctataagaatcttt1680

ttctccttattgtaattttttttacgtgactttaaacttaacttccaagctccttctgat1740

aaaatgcaaaaactgtctgtattcactgtcttggtttattaacaattgatccaatcaaat1800

gcatatggaacatctttctttttgtttcttcaaaagttcgtttgaggataaggagtagaa1860

tctgagaagatagactagtaggtaaccttaggggcggatgtagaaatcaacgtatgggtt1920

cagctttgttgcagaccctgtatatgcattaaaaaaatcactaaataagtaaataattga1980

ttttgaacccagtaaatcaaaatgagttgtagtagaatcctgaactcgaaccgataaagt2040

tggatccactaccgggtaaactctaccttgagaagtgtttatatatgtccctaattattt2100

cttttctgtttcctttctattttaattttttaagttcctttttagatggttttatttttt2160

gacaagtggtaagttgttagtattccaaattaaatgccattgccataactatatacattt2220

ataaagattgattgaccctagtttctcattcctaagatccaaataaggcaataaacaata2280

tgtcttagtacttgaacctgcttctggtggtcaacacttgatcgcgtagttagttataga2340

tgactgtaaaaaccttaatcattttaatggttttgtcaaagaacaaatatcggacatatt2400

atagcgaatggactattgtacttttcttctgattggtcattttattgtgatccgtaagtt2460

ggctgagactgatgtcatatctttgcttacagaggtaatctgaatgataaatcaaaaccc2520

ataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgc2580

tatgctaaaaatgccacattgagggaattggctaaccttgttgttgtagctggatacaac2640

gatgtaaagaaatccagtgatagagaagaaatagcagaaattgagaagatgcatgctctt2700

attaaggagcataaattggatgggcaattcagatggatagcagcccaaacaaaccgggca2760

cgtaatggtgagctctatcgctatatagctgacaagagaggtatatttgttcaggtacgc2820

tgtttgtattgtatttgtccacattcctttttttgcaccgaaagaaaggttgttattgtg2880

acaaatatgtttgttttagcctgcattttatgaagcatttggactcacggtggttgaagc2940

tatgacttgtggtcttccaacatttgcaacttgccatggtggtccgaacgagatcattga3000

acacggtgtatctgggttccatattgatccttatcatcccgataaagctgctgaactcat3060

ggcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatc3120

tggtctccgaaggattcttgagaggtttgtagttgtgtacatatatagaagattaaagat3180

tgttcccttgatattatttgaatgaaaaataacagtaacatctctttttgaacatcgctc3240

aagttcttgtgttaaataattgttaggtatacgtggaaaatttactccgagaggctgatg3300

actttgtctggtgtatatggtttctggaagcttgtttcaaaacttgagaggcgcgaaact3360

agacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgcctttttg3420

ctcattttcagttacaatcaactatatatgtggtttaaatacgtattaagcataaacatg3480

tccgtgattgcggctgtcgaaaatgctatggacatatcctgagctaaggagttttcaaga3540

gaattgatttggcttactctgtttacaggcaaaatctgttcctctggcaattgatgacaa3600

gtga3604

<210>12

<211>335

<212>prt

<213>烟草

<400>12

metphethrtrpleulysleuasnilelysasnlysglyarglysasn

151015

thrvalglyglntyrgluserhisthralaphethrleuproglyleu

202530

tyrargvalvalhisglyileaspvalpheaspprolyspheasnile

354045

valserproglyalaaspmetthriletyrpheprotyrserasplys

505560

glulysargleuthrserleuhisglyserileglulysleuleuphe

65707580

aspproalaglnasnglugluhisileglyasnleuasnasplysser

859095

lysproileilephesermetalaargleuasphisvallysasnile

100105110

thrglyleuvalglucystyralalysasnalathrleuarggluleu

115120125

alaasnleuvalvalvalalaglytyrasnaspvallyslysserser

130135140

aspargglugluilealagluileglulysmethisalaleuilelys

145150155160

gluhislysleuaspglyglnpheargtrpilealaalaglnthrasn

165170175

argalaargasnglygluleutyrargtyrilealaasplysarggly

180185190

ilephevalglnproalaphetyrglualapheglyleuthrvalval

195200205

glualametthrcysglyleuprothrphealathrcyshisglygly

210215220

proasngluileilegluhisglyvalserglyphehisileasppro

225230235240

tyrhisproasplysalaalagluleumetalagluphepheglnarg

245250255

cyslysglnaspprothrhistrpglulysileseralaserglyleu

260265270

argargileleugluargtyrthrtrplysiletyrsergluargleu

275280285

metthrleuserglyvaltyrglyphetrplysleuvalserlysleu

290295300

gluargarggluthrargargtyrleuglumetphetyrileleulys

305310315320

phearggluleualalysservalproleualaileaspasplys

325330335

<210>13

<211>4030

<212>dna

<213>烟草

<400>13

atggcggaacgtgtgctgactcgtgttcatagccttcgtgaacgtcttgatgctactttg60

gctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttc120

tttgatttagttgttattgccagttctaatgtatgggcttatatataaacaaagtgttga180

agtatgcaaccatataaactgacagcttaaaatgcttgagagaacacacttttatttatt240

taattatgccttcagcacaagaagtggaacttgacgcaatggaaccataggtcacgggtt300

caagtcttggaacagcctgcaatctaaggctgcgtgtagtagaccctagtggtccggccc360

ttccacatatctcgcttagtgtaccgggcccattgagtacgggttcggccgaacccagtc420

gctttggtccaatccatatatttgtcttaaaaatatattgaatatatacaaattgttaat480

ttagtttaaatatgtgtatcatgggttattcatgctggttttggctgttgcaggattgaa540

agccatggaaaagggatactgaaacctcaccagttgctggctgaatttgattcaattcac600

aaagaagacaaaaacaaactgaatgatcatgcttttgaagaagtcctgaaatccactcag660

gtatttgtggttttagtgttaggtgatggatagcatttattgttttactaagatcacata720

tgtgtcagtttgtggctagtatttaaaatctggtgtattttgtcatactaggaagcaatt780

gttttgtccccttgggttgcgcttgccattcgtctgaggcctggtgtgtgggaatacgtt840

cgtgtgaatgtcaacgctcttgttgttgaggagcttaccgtgcctgagtatttgcaattc900

aaggaagaacttgttaatggaacgtaagttttaggttcgaatttgttgatttgttagata960

acatgttctgaactttttgattaaagttgtgtttttgactgatgcagctcgcacgataac1020

tttgttcttgagttggattttgagcccttcactgcatcatttccaaaaccaaccctcacc1080

aaatcaattggaaatggagttgaattccttaaccgacacctctctgccaaaatgttccat1140

gacaaggaaagcatgacccctcttctcgagtttcttcgagttcaccactacaagggcaag1200

gtaaacttgtttttcctgtttgtctatgaatttagtttagttgttttgctccgcgaaaat1260

ttcagtggaaactgatttatgcaaccactgagtgattaatatgttcaaacttaccgactt1320

ctggttttctgtgtagacaatgatgctgaatgacagaattcaggacttaaatactctcca1380

aaatgtcctaaggaaagctgaggaatacctcactaccctttcccctgaaacttcatactc1440

ggcatttgagcacaagttccaagaaattggcttggagaggggttggggtgacactgcgga1500

gcgtgttctagagatgatctgcatgctcctggatctcctcgaggctcctgactcgtgcac1560

gcttgagaagttccttggtagaattccaatggtttttaatgtggtcatactttcacccca1620

tggttatttcgcccaggaaaatgtcttgggttaccccgacactggtggccaggtgcactg1680

cttatctgtgttcggtcttattatctctttaaaccctactgccacaagtgctgagatgaa1740

cctcctttaatttgcaggttgtctatattttggatcaagttcctgctttggagcgtgaga1800

tgctcaagcgcataaaggagcaaggacttgacatcaaaccgcgtattcttattgttcgta1860

ttcccagtaattgtgtttaaacttatgattatgcaggattttatctgttctaatacagca1920

ctcttgcttaaattctcaggttactcggctgctgcctgatgcggttggtaccacttgtgg1980

tcagaggcttgagaaagtgtttggaacagagcactcacacattcttagggtcccctttag2040

gaccgagaagggcattgttcgcaaatggatctctcgctttgaagtctggccatacatgga2100

gacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaattggtttt2160

ggcagcaattttctgcttgctttgacttccgctaaaacttcggattttattgcattagga2220

tgtggcgaaagaaattgctgcagaattgcaggctaagccagatcttatcattggcaatta2280

tagtgagggcaaccttgctgcctccttgttggctcacaaattaggtgtaacacaggtcgg2340

caatgtttgtgacatgtaatttcatctttgcatttcctttcgtttgcaactaaaagattt2400

aagagttctctctctcttttttttttccgtctactttgccttatgcagtgcacgatagct2460

catgctttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaa2520

aaataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttc2580

atcatcaccagcactttccaggagatagcgggaaggtatttttacatcagtttcccactc2640

tgattaaattacaatgtatttccctatatgattaaatactgtgtttgatcctaaatcatt2700

tctaaattttccagcaaggacactgttggacagtacgagagccacatggcgttcacaatg2760

cctggactgtatagagttgttcacggcattgatgtgtttgaccccaaatttaacattgtg2820

tcaccaggagctgatatgaatctctatttcccatactacgagaaggaaaagagattgaca2880

gcatatcaccctgaaattgaggagctgctgtttagtgatgttgagaatgacgaacacatg2940

tatgttactaaactagcaatcctgctgcaaaattatggctaattatgtaaacaagtttgt3000

actgaatagatttgttattcgatcaggtgtgtgctgaagaacaggaataagcctatcata3060

ttcactatggctagattggatcgagtgaagaacttaactggacttgtcgagctgtacgcc3120

aagaacccacggctaagggagttggttaaccttgtcgtggttggaggagaccgaaggaaa3180

gaatccaaagacttggaagaacaggcagagatgaagaagatgtacgaacttataaagact3240

cacaatttgaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggc3300

gaactctacaggtacattgccgatactaggggagctttcgtgcagcctgcattttacgag3360

gcttttggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaat3420

cacggtggtccagctgagatcatcgttcacgggaaatctggtttccacattgatccatac3480

cacggggatcaggcagctgaacttctcgctgatttctttgagaaatgtaagaaagaacct3540

tcgcactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaaac3600

tgctactcttttcatttttgcaaaacctactatgatcattattaagctcatttttgcaaa3660

acctacttgctgttgttattgtttgttgcttccttttcactgttctttgagctgaaggtc3720

tatcagaaacagtctctctaccttcacaaggtaggggtaagatctgcgtgcacgttaccc3780

tcctcaaactctacttaattgtgagattacactaggtttgttgttgttgattctttgcta3840

attaattaaaaggtacacatggcaaatatactcggatcggttgttgacactggctgctgt3900

atatggattctggaagcatgtttccaagcttgatcgtcttgaaattcgccgttatcttga3960

aatgttctatgctctcaaattccgcaagctggtgagtttcattgctttctgcactcctgc4020

aattgtatag4030

<210>14

<211>808

<212>prt

<213>烟草

<400>14

metalagluargvalleuthrargvalhisserleuarggluargleu

151015

aspalathrleualaalahisargasngluileleuleupheleuser

202530

argilegluserhisglylysglyileleulysprohisglnleuleu

354045

alaglupheaspserilehislysgluasplysasnlysleuasnasp

505560

hisalapheglugluvalleulysserthrglnglualailevalleu

65707580

serprotrpvalalaleualaileargleuargproglyvaltrpglu

859095

tyrvalargvalasnvalasnalaleuvalvalglugluleuthrval

100105110

proglutyrleuglnphelysglugluleuvalasnglythrserhis

115120125

aspasnphevalleugluleuaspphegluprophethralaserphe

130135140

prolysprothrleuthrlysserileglyasnglyvalglupheleu

145150155160

asnarghisleuseralalysmetphehisasplysglusermetthr

165170175

proleuleuglupheleuargvalhishistyrlysglylysthrmet

180185190

metleuasnaspargileglnaspleuasnthrleuglnasnvalleu

195200205

arglysalagluglutyrleuthrthrleuserprogluthrsertyr

210215220

seralaphegluhislyspheglngluileglyleugluargglytrp

225230235240

glyaspthralagluargvalleuglumetilecysmetleuleuasp

245250255

leuleuglualaproaspsercysthrleuglulyspheleuglyarg

260265270

ileprometvalpheasnvalvalileleuserprohisglytyrphe

275280285

alaglngluasnvalleuglytyrproaspthrglyglyglnvalval

290295300

tyrileleuaspglnvalproalaleugluargglumetleulysarg

305310315320

ilelysgluglnglyleuaspilelysproargileleuilevalthr

325330335

argleuleuproaspalavalglythrthrcysglyglnargleuglu

340345350

lysvalpheglythrgluhisserhisileleuargvalprophearg

355360365

thrglulysglyilevalarglystrpileserargphegluvaltrp

370375380

protyrmetgluthrphethrgluaspvalalalysgluilealaala

385390395400

gluleuglnalalysproaspleuileileglyasntyrserglugly

405410415

asnleualaalaserleuleualahislysleuglyvalthrglncys

420425430

thrilealahisalaleuglulysthrlystyrproaspseraspile

435440445

tyrleulyslyspheaspglulystyrhispheseralaglnphethr

450455460

alaaspleuilealametasnhisthrasppheileilethrserthr

465470475480

pheglngluilealaglyserlysaspthrvalglyglntyrgluser

485490495

hismetalaphethrmetproglyleutyrargvalvalhisglyile

500505510

aspvalpheaspprolyspheasnilevalserproglyalaaspmet

515520525

asnleutyrpheprotyrtyrglulysglulysargleuthralatyr

530535540

hisprogluileglugluleuleupheseraspvalgluasnaspglu

545550555560

hismetcysvalleulysasnargasnlysproileilephethrmet

565570575

alaargleuaspargvallysasnleuthrglyleuvalgluleutyr

580585590

alalysasnproargleuarggluleuvalasnleuvalvalvalgly

595600605

glyaspargarglysgluserlysaspleuglugluglnalaglumet

610615620

lyslysmettyrgluleuilelysthrhisasnleuasnglyglnphe

625630635640

argtrpileserserglnmetasnargvalargasnglygluleutyr

645650655

argtyrilealaaspthrargglyalaphevalglnproalaphetyr

660665670

glualapheglyleuthrvalvalglualametthrcysglyleupro

675680685

thrphealathrasnhisglyglyproalagluileilevalhisgly

690695700

lysserglyphehisileaspprotyrhisglyaspglnalaalaglu

705710715720

leuleualaaspphepheglulyscyslyslysgluproserhistrp

725730735

glualailesergluglyglyleulysargileglnglulystyrthr

740745750

trpglniletyrseraspargleuleuthrleualaalavaltyrgly

755760765

phetrplyshisvalserlysleuaspargleugluileargargtyr

770775780

leuglumetphetyralaleulysphearglysleuvalserpheile

785790795800

alaphecysthrproalaileval

805

<210>15

<211>4054

<212>dna

<213>烟草

<400>15

atggccgaacgtgtgctaactcgtgttcacagccttcgcgaacgtcttgatgctactttg60

gctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttc120

tttgatttagttggtgttatttgccagttctaatgtatggactaatatatgaacaaagtg180

cgaccatttcaactgacaacttaaaatgtttgagagaatacacgtttatttacttaatta240

tggcttgagcataggaagtgtatcttggcgtaactcgtaaagttgacctcatgtgacaag300

gaggtcacggtttcgagccgtggaaacagcctcttgcagaaatgcaggtaaggctgcgtg360

caatagatcgcccttccacggacccgcgcatagcgggaacttagtgcaccggttgggctg420

tccttttttatgtcttcagcacaaaaatttagtttaaacatgtgtatcatggattattca480

tgctggttttgccggttgcaggattgaaagccacggaaaagggatattgaaacctcacca540

gttgctggctgagtttgaatcaattcacaaagaagacaaaaacaaactgaatgatcatgc600

ttttgaagaagtcctgaaatctactcaggtaatttgtggttttagtgttaggtgatggat660

agcatttattgtcttactaagatcatatatgtgtcagtttgtggctagtatttgaaaagt720

ctggtgtggtttgtcatactaggaagcaattgtcttgtccccttgggttgcgcttgccat780

tcgtctgcggcctggtgtgtgggaatatgttcgtgtgaatgtcaatgcacttattgtcga840

ggagctgactgtgcctgaatatttgcaattcaaggaagaacttgttaatggaacgtaagt900

tttaggttcgaaatgatgatttgttaaataatatgttctgaactttttgattaatgttgt960

gttttcccctgatgcagctcgaacgataactttgttcttgagctggattttgagcccttc1020

actgcatcatttcccaaaccaaccctcaccaaatcaattggaaatggagttgaattcctc1080

aaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgag1140

tttcttcgagttcatcactacaagggcaaggtaaacttgtttttcctgtttgtctatgaa1200

tttagtttctgaaagttgctttgcttcgtgaattttttagtggcaactgatttatgattt1260

tctgtgcagacaatgatgctgaatgacagagttcaggacttaaacactctccaaaatgtc1320

ctaaggaaggctgaggaatatctcactaccctttcccctgaaacttcatactcggtattt1380

gagcacaagttccaagaaattggcctagagaggggctggggtgacaatgctgagcgtgtt1440

ctagagatgatctgcatgctcctggatctcctcgaggctccagactcatgcactcttgag1500

aagttccttggtagaattcctatggtttttaatgtggtcattctttcacctcacggatat1560

ttcgcccaggaaaatgtcttgggttaccccgatactggtggccaggtgcactgcttattt1620

gtaacaccttacgcttttccctctgaaacttatttgcggcaagttctaaggtcctccttc1680

cttaatttgcaggttgtctatattttggatcaagttccggccttggagcgtgagatgctc1740

aagcgcataaaggagcaaggacttgatatcaaaccgcgtattcttattgttcgtatctcc1800

aataattgcgtttaaacttatgattgtgcaggatttgatctgttcaaatctaatgactga1860

ttttcttttttttttttttttccctcaggttactcggctgctgcctgatgcggttggtac1920

cacttgtggtcagcggcttgagaaagtgtttggaacagagcattcacatattcttagggt1980

cccctttaggaccgagaagggcatcgttcgcaaatggatctctcgctttgaagtctggcc2040

ttacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttcca2100

atctgttttggcagcaatttttcacttactaacactttggctttcgctaaaacttcggat2160

tttattacattaggatgtggcaaaagaaattgctgcagaactgcaggcaaagccagatct2220

tataatcggcaactacagcgagggcaaccttgctgcctccttgttggctcacaagttagg2280

tgtaactcaggtctgtaatgtttgtcacctgttatttcaactttgcatttcctttcattt2340

gcaactagaagttaagagttctctctcttttatcttttccgtctattttgccttctgcag2400

tgcaccatagctcatgcgttggagaaaacaaaatatcctgattctgatatctacttgaag2460

aaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgcaatgaat2520

cacaccgatttcataatcaccagcactttccaggagatagcgggaaggtattacatcaca2580

atggatttccgatatgattaaattagttaatttaatcctacttcattgtgtttgatccta2640

aaacttttctaaatttcccagcaaggacactgttggacagtacgagagccacatggcttt2700

cacgatgcctggattgtatagagttgttcacggcattgatgtgttcgatcccaaattcaa2760

cattgtgtcaccaggagctgatatgaatctctatttcccctacttcgagaaggaaaagcg2820

attgacagcatatcaccctgaaattgaggagctgctgtttagcgatgttgagaatgacga2880

acacatgtatgttactaaactagcaatcctgctgcaaaattgtggctaattatgtaaaaa2940

agtttttactgaatagatttgtgcttctatcaggtgtgtgctgaaggacaggaataagcc3000

aattatattcaccatggctagattggatcgagtgaagaacttaactggacttgtggagtt3060

gtacgccaagaacccacggctaagggagttggttaaccttgtcgtggttggtggagaccg3120

aaggaaggaatccaaagatttggaagaacaggcagagatgaagaagatgtatgaacttat3180

aaagacgcacaatttaaacggccaattccgatggatttcttcccagatgaaccgcgtgag3240

gaatggcgaactctacaggtacattgccgatactaggggagcttttgtgcagcctgcatt3300

ttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacgtttgc3360

aactaatcacggtggtccagctgagatcatcgttcacgggaagtctggttttcacattga3420

tccataccacggcgagcaggcagctgaacttctagctgatttctttgagagatgtaagaa3480

agaaccttcacactgggaagccatttccgagggcggccttaagcgtatacaggagaagta3540

agcaagctgctactcttttcatttttgcaaaacctaccatgatcattattaagctcattt3600

ttgcaaaacctacttgttattctttgttgcttccttttccctgttttttgagccgaggtt3660

ttatcgaaaacatgctttctaccttcacaaggtaggggtaaggtctgcgtttgttattat3720

tgttgttgttgattctctgcgaattaattaaaaggtacacatggcaaatctactcggatc3780

ggttgttgacactggctgctgtttatggattctggaagcatgtttccaaacttgatcgtc3840

ttgaaattcgtcgttatcttgaaatgttctatgctctaaaattccgcaaactggtgagtt3900

tcactgctttctgcactcttccaattgttagttgagtgcactcatttaaactgtagctaa3960

agctgttgtaaatcttcagttaagcagctgctaatgaagtttttatcttttgtttttggt4020

tcaggctgaagctgtcccgttggctgttgagtaa4054

<210>16

<211>805

<212>prt

<213>烟草

<400>16

metalagluargvalleuthrargvalhisserleuarggluargleu

151015

aspalathrleualaalahisargasngluileleuleupheleuser

202530

argilegluserhisglylysglyileleulysprohisglnleuleu

354045

alagluphegluserilehislysgluasplysasnlysleuasnasp

505560

hisalapheglugluvalleulysserthrglnglualailevalleu

65707580

serprotrpvalalaleualaileargleuargproglyvaltrpglu

859095

tyrvalargvalasnvalasnalaleuilevalglugluleuthrval

100105110

proglutyrleuglnphelysglugluleuvalasnglythrserasn

115120125

aspasnphevalleugluleuaspphegluprophethralaserphe

130135140

prolysprothrleuthrlysserileglyasnglyvalglupheleu

145150155160

asnarghisleuseralalysmetphehisasplysglusermetthr

165170175

proleuleuglupheleuargvalhishistyrlysglylysthrmet

180185190

metleuasnaspargvalglnaspleuasnthrleuglnasnvalleu

195200205

arglysalagluglutyrleuthrthrleuserprogluthrsertyr

210215220

servalphegluhislyspheglngluileglyleugluargglytrp

225230235240

glyaspasnalagluargvalleuglumetilecysmetleuleuasp

245250255

leuleuglualaproaspsercysthrleuglulyspheleuglyarg

260265270

ileprometvalpheasnvalvalileleuserprohisglytyrphe

275280285

alaglngluasnvalleuglytyrproaspthrglyglyglnvalval

290295300

tyrileleuaspglnvalproalaleugluargglumetleulysarg

305310315320

ilelysgluglnglyleuaspilelysproargileleuilevalthr

325330335

argleuleuproaspalavalglythrthrcysglyglnargleuglu

340345350

lysvalpheglythrgluhisserhisileleuargvalprophearg

355360365

thrglulysglyilevalarglystrpileserargphegluvaltrp

370375380

protyrmetgluthrphethrgluaspvalalalysgluilealaala

385390395400

gluleuglnalalysproaspleuileileglyasntyrserglugly

405410415

asnleualaalaserleuleualahislysleuglyvalthrglncys

420425430

thrilealahisalaleuglulysthrlystyrproaspseraspile

435440445

tyrleulyslyspheaspglulystyrhispheseralaglnphethr

450455460

alaaspleuilealametasnhisthrasppheileilethrserthr

465470475480

pheglngluilealaglyserlysaspthrvalglyglntyrgluser

485490495

hismetalaphethrmetproglyleutyrargvalvalhisglyile

500505510

aspvalpheaspprolyspheasnilevalserproglyalaaspmet

515520525

asnleutyrpheprotyrpheglulysglulysargleuthralatyr

530535540

hisprogluileglugluleuleupheseraspvalgluasnaspglu

545550555560

hismetcysvalleulysaspargasnlysproileilephethrmet

565570575

alaargleuaspargvallysasnleuthrglyleuvalgluleutyr

580585590

alalysasnproargleuarggluleuvalasnleuvalvalvalgly

595600605

glyaspargarglysgluserlysaspleuglugluglnalaglumet

610615620

lyslysmettyrgluleuilelysthrhisasnleuasnglyglnphe

625630635640

argtrpileserserglnmetasnargvalargasnglygluleutyr

645650655

argtyrilealaaspthrargglyalaphevalglnproalaphetyr

660665670

glualapheglyleuthrvalvalglualametthrcysglyleupro

675680685

thrphealathrasnhisglyglyproalagluileilevalhisgly

690695700

lysserglyphehisileaspprotyrhisglygluglnalaalaglu

705710715720

leuleualaaspphephegluargcyslyslysgluproserhistrp

725730735

glualailesergluglyglyleulysargileglnglulystyrthr

740745750

trpglniletyrseraspargleuleuthrleualaalavaltyrgly

755760765

phetrplyshisvalserlysleuaspargleugluileargargtyr

770775780

leuglumetphetyralaleulysphearglysleualaglualaval

785790795800

proleualavalglu

805

<210>17

<211>3752

<212>dna

<213>烟草

<400>17

atggcctcaacagttgctgatagcatgcctgatgctttgaaacaaagccggtatcatatg60

aagagatgcttcgctaggtgaacacccttcttttatgttttttcccctctacgtgtttat120

gtcaaatttccatgcataatgctaactacttttcttctttttgacttcaaaattggatgt180

gaaaggttcattgcaatgggaaggaggctaatgaagttgaaacatttaacagaagaaata240

gaagaaactattgaagacaaggcagaaagaaccaggattttggagggttcacttggaaaa300

attatgagttccacacaggtcagcaccatttaaccaacttagttgaacaggaaaaaaaga360

aaaagcaaaagagttattgcaaggcgtaacgattttctttgaaattttcaggaggcagct420

gttgttccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtc480

aaagttaacgctgaaactctctctgtggaagctatttcagccagggaatatctcaaattc540

aaagagatgatctttgacgaagactggtaagtggaaaattgtatcattttaaagagaaac600

aattttgtaacatacaagaatagttttgatggttgaatgtgcaagcagggcaaaggatga660

taatgcactggaagtagattttggtgcttttgactactctaatcctcggttagccctttc720

ctcttctgtcggaaatgggctcaactttatctcaaaagttctgtcttcaaagtttggtgg780

aaagccagaggacgcccagcctttgcttgattacttactagctcttaatcatcaaggaga840

ggtatgaaaatggactacctttgtttcttaaaggtattatataatgatgcgcgttataaa900

gttcctttttaaattgaaactttgcagaatctaatgatcaatgagaatctgaatggtgtt960

gctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaagac1020

acaccttataaagactttgagcataagtaagcttctcatatgcttccattgtcatatgca1080

gtataccaatgacatgctaccgaaaagttgtttatgtttgtgacttgattatgaaaactc1140

taggctcaaagaatggggctttgataaagggtggggtcacaatgcaggaagagtaagaga1200

gacaatgagactgctttccgagataatccaagcaccagatcccataaatatggagtcctt1260

tttcagcaagcttcctactacattcaacattgttatcttctccattcatggttactttgg1320

ccaagcagatgtccttggtctgcccgatactggaggccaggtctacatatacagcaattt1380

atctccttttgcctcatattgcttattagcgacacttgcatcattgaaatcagactttta1440

cttcacaggttgtttatattctggatcaagtaagggctttagaggaggaaatgttacaaa1500

gaatcaagcagcaagggctaaacgtgaagcccaagattcttgtggtgagttttgcaaaaa1560

tatgcttagacaggttttgagattgatcggagaagggattaagatgatcaagatctttgt1620

ttcctgctttcatgatgtaaacaggtatctcgtctcataccagatgctcgagggacaaca1680

tgcaatcaggagatggaacctattcttaactcatcccattctcacatcctgagaattcca1740

ttcaggactgagaaaggagttcttcgccaatgggtttctcggtttgatatctatccttac1800

ttggagaactatgccaaggcaagtcttctaacaaaattaccacctattcatacactttat1860

ttactttcttgaactaatcgtttggtttgtgacgtatatcattaggatgcttctgctaag1920

atacttgagctcatggaaggtaaaccagacctcataattgggaactacactgatggaaat1980

ttagtggcatctctattggccaacaaacttggagttactcaggttccgtagctgatcata2040

tgatcatattttctacattgtttcttgataattaaatggaaatcttattggatgataaca2100

ttttagggaaccattgctcatgcattagagaaaactaagtatgaagattctgatgtgaag2160

tggaagcagtttgatcccaagtaccacttttcttgccaatttactgccgatttattggca2220

atgaatgctgctgattttatcattaccagcacatatcaagaaatcgctggaaggttagca2280

ctgactctctcagtatatttggcaacttaatgaatttactgcagtggccaacactaaaag2340

ctatcattcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttac2400

catgccggggctttatagagctgtttcaggcatcaatgtatttgatccaaagttcaacat2460

tgctgctcctggggctgaacagtctacctatttccctttcactgagaaacagaaacgatt2520

cagcacatttcgtcctgctattaacgaattactttacagtaatgaggaaaacaatgagca2580

catgtaagtctaattgcccattttcctaatctaaccattgcttaaatcgttctgttttta2640

ccggatgtgtggtacttatcagtaacatttttttttggatcagtggatttcttgcagacc2700

ggaaaaaaccaattatattttcaatggcgagatttgatacagtgaagaacctgtcaggct2760

tgactgagtggtatgggaagaataagaagttgcggaacttggtaaaccttgttattgttg2820

ggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagctgaaatcaagaaga2880

tgcatgaattgattgagaaataccagctcaagggacaaatgagatggatagcagctcaaa2940

ctgataaatatcgaaatagtgagctataccgaactattgctgacactaagggagcttttg3000

tccaaccggctttatatgaagcttttggactaaccgttattgaagcaatggattgtggat3060

tgcctacgtttgcaactaatcaaggtggacctgcagaaatcattgttgatggggtttcag3120

gtttccatattgatccttacaatggggacgaatcaagcaagaaaatagctgatttctttg3180

agaagtgtaaggttgattctaaatattggaacaggatatctgagggaggtctcaagcgca3240

ttgaagaatggtaacaaactagttccaagtttaaaaaatggaaaaaatgcttatcatgtt3300

atattttcgtggttttaagttctgcttcgatgcagttatacgtggaagatttatgcaaac3360

aaagtgttgaatatgggatcaatctatggattttggagacaattcaatgtggggcaaaag3420

caggctaagcaaagatactttgagatgttttacaatcctctcttcaggaaattggtaggt3480

tgtatatgttgaatacaatttactaagatcctcaaaatgaccaagaaatatacattgact3540

atgctacttttgtaatttcacaggccaaaagcgtgccgatcccacatgaagagccattgc3600

cacttgcaacatcagactctactcaatcccaagaattaaaactaccactaccagttccag3660

cagcagtagctaaagttctgccattaacaaggcatgcttttaacttaattacttctctac3720

ctagagtaactggtaaagtggatgtcaagtga3752

<210>18

<211>840

<212>prt

<213>烟草

<400>18

metalaserthrvalalaaspsermetproaspalaleulysglnser

151015

argtyrhismetlysargcysphealaargpheilealametglyarg

202530

argleumetlysleulyshisleuthrglugluileglugluthrile

354045

gluasplysalagluargthrargileleugluglyserleuglylys

505560

ilemetserserthrglnglualaalavalvalproprotyrvalala

65707580

phealavalarghisasnproglyphetrpasptyrvallysvalasn

859095

alagluthrleuservalglualaileseralaargglutyrleulys

100105110

phelysglumetilepheaspgluasptrpalalysaspaspasnala

115120125

leugluvalasppheglyalapheasptyrserasnproargleuala

130135140

leuserserservalglyasnglyleuasnpheileserlysvalleu

145150155160

serserlyspheglyglylysprogluaspalaglnproleuleuasp

165170175

tyrleuleualaleuasnhisglnglygluasnleumetileasnglu

180185190

asnleuasnglyvalalalysleuglnalaalaleuilevalalaglu

195200205

valphevalserserpheprolysaspthrprotyrlysasppheglu

210215220

hislysleulysglutrpglypheasplysglytrpglyhisasnala

225230235240

glyargvalarggluthrmetargleuleusergluileileglnala

245250255

proaspproileasnmetgluserphepheserlysleuprothrthr

260265270

pheasnilevalilepheserilehisglytyrpheglyglnalaasp

275280285

valleuglyleuproaspthrglyglyglnvalvaltyrileleuasp

290295300

glnvalargalaleuglugluglumetleuglnargilelysglngln

305310315320

glyleuasnvallysprolysileleuvalvalserargleuilepro

325330335

aspalaargglythrthrcysasnglnglumetgluproileleuasn

340345350

serserhisserhisileleuargilepropheargthrglulysgly

355360365

valleuargglntrpaspalaseralalysileleugluleumetglu

370375380

glylysproaspleuileileglyasntyrthraspglyasnleuval

385390395400

alaserleuleualaasnlysleuglyvalthrglnglythrileala

405410415

hisalaleuglulysthrlystyrgluaspseraspvallystrplys

420425430

glnpheaspprolystyrhisphesercysglnphethralaaspleu

435440445

leualametasnalaalaasppheileilethrserthrtyrglnglu

450455460

ilealaglysergluthrargproglyglntyrgluserhisthrala

465470475480

phethrmetproglyleutyrargalavalserglyileasnvalphe

485490495

aspprolyspheasnilealaalaproglyalagluglnserthrtyr

500505510

pheprophethrglulysglnlysargpheserthrpheargproala

515520525

ileasngluleuleutyrserasnglugluasnasngluhisilegly

530535540

pheleualaasparglyslysproileilephesermetalaargphe

545550555560

aspthrvallysasnleuserglyleuthrglutrptyrglylysasn

565570575

lyslysleuargasnleuvalasnleuvalilevalglyglyphephe

580585590

aspproserlysserlysasparggluglualaalagluilelyslys

595600605

methisgluleuileglulystyrglnleulysglyglnmetargtrp

610615620

ilealaalaglnthrasplystyrargasnsergluleutyrargthr

625630635640

ilealaaspthrlysglyalaphevalglnproalaleutyrgluala

645650655

pheglyleuthrvalileglualametaspcysglyleuprothrphe

660665670

alathrasnglnglyglyproalagluileilevalaspglyvalser

675680685

glyphehisileaspprotyrasnglyaspgluserserlyslysile

690695700

alaaspphepheglulyscyslysvalaspserlystyrtrpasnarg

705710715720

ilesergluglyglyleulysargilegluglucystyrthrtrplys

725730735

iletyralaasnlysvalleuasnmetglyseriletyrglyphetrp

740745750

argglnpheasnvalglyglnlysglnalalysglnargtyrpheglu

755760765

metphetyrasnproleuphearglysleualalysservalproile

770775780

prohisglugluproleuproleualathrseraspserthrglnser

785790795800

glngluleulysleuproleuprovalproalaalavalalalysval

805810815

leuproleuthrarghisalapheasnleuilethrserleuproarg

820825830

valthrglylysvalaspvallys

835840

<210>19

<211>3268

<212>dna

<213>烟草

<400>19

atggcctcaactgttgctggtagcatgcctgatgctttgaaacaaagccgatatcatatg60

aagagatgcttcgctaggtgaacacccttcttgttctttttgttttttccctctaccatt120

tatgtcaaatttcaatgcataatgctaactactttttttctttttgacttcaaaattgga180

cgtgaaaggttcattgcaatgggaaggaggttgatgaagctgaaacatttaacagaagaa240

atagaaaaaactattgaagacaaggcagaaagaaccaagattttggagggttcacttgga300

aaaattatgagttccacacaggtcagcaccatttaaccaacttaattgaataggaagaaa360

aaaaaaagcaaaagagttattgcaaggcgtaacgatttcctttgaaattttcaggaggca420

gctgttgtcccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattat480

gtcaaagttgacgctgaaactctctctgtggaagctatttcagccagggactatctcaaa540

ttcaaagagatgatctttgatgaagattggtaactggaagattgtatcattttaaagaaa600

caattttttaatattcaagattagttttgatggttgaatgtgcaagcagggcaaaggatg660

aaaatgcactcgaagtagattttggtgcttttgactactctaatcatcggttagcccttt720

cctcttctgtcggaaatgggctaaacttcatctcgaaagttttgtcttcaaagtttggtg780

gaaaggcagaagatgcccagcctttgcttgattacttactagctcttaatcatcaaggag840

aggtatggaaatggactaccttcctttcttaaggaattatataatgatgtatgttataaa900

gatcctttttaaacattgacactttgcagaatctaatgatcaatgagaatctgaatggcg960

tctctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaag1020

acacaccttataaagactttgagcataagtaagcttttcaaacgcttctgttatcatatg1080

caatataccaagaatatgttgccttttgaaaagttgtttatgtttatgacttgataatga1140

aaatactaggctcaaagaatggggctttgagaaagggtggggtcacaatgcaggaagagt1200

aagagagacaatgagactgctttccgagataatccaagcgccagatcccataaatatgga1260

gtcctttttcagcaggcttcctactacattcaacattgttatcttctccattcatggtta1320

ctttggccaagcagatgtccttggtttgcccgatactggaggccaggtttacatacacag1380

caatttatctccttttgcctcatatttacttattagcgacacttgcattattgaaatcac1440

atttgtatttaacaggttgtttatattctggatcaagtaagagccttagaggaggaaatg1500

ttacaaagaatcaagcagcaagggttaaatgtgaagcccaagattcttgtggtgagttat1560

gcaaaaatatgcgtagccaaggttttgaaattgttcagaggggattaagatgatcgagat1620

atttgtttccttcttccattgatgtgtacaggtcactcgtctcattccagatgctcgagg1680

gactacatgcaatcaggagatggaacctatacttaactcgtcccattctcacatcctgag1740

aattccattcaggacagagaaaggagttcttcgccaatgggtttctcggtttgatatcta1800

tccttacttggagaactatgccaaggcaagtctcctaccaaaattaccacctattcatac1860

actttattcagttttttgagctaatcattctcatttgtcacgtatgtgattaggatgctt1920

ctgctaagatacttgagctcatggaaggtaaaccagacctcattattgggaactacactg1980

atggaaatttagtggcatctctattggccaacaaacttggagttactcaggttctacagc2040

tgatcatttatctgatcagattttctacattgttttcttgataattaaacggaaatctta2100

tgagattgtaacattttagggaaccattgctcatgcattagagaaaaccaagtatgaaga2160

ttctgatgtcaagtggaagcagtttgattccaagtaccacttttcttgccaattcactgc2220

cgatttattggcaatgaatgctgctgattttatcattaccagcacatatcaagaaatcgc2280

aggaaggttagcactgactctctcagtatatttggcaacttaatgaatgtactgcttgtg2340

gccaacactaaaagctattactcgtccttcagcgaaactaggcctggacaatatgaaagt2400

cacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgat2460

ccaaagttcaacattgctgctcctggggctgaacagtctgcctatttccccttcactgag2520

aaacagaaacgattcagcgcgtttcgtcctgctattgaggaactactttacagtaatgag2580

caaaacaacgagcacatgtaagtctaattgccccattttcctaatctaaccattgcttaa2640

atgttctgtttttacttgatatgtggtacttatcagtgatattttttattggaacagtgg2700

atttcttgcagaccgtaaaaaaccaattatattttcaatggcaagatttgatacggtgaa2760

gaacttgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggttaa2820

cctcgttatcgttgggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagc2880

tgaaatcaagaagatgcatgaattgattgagaaatacaagctcaagggacaaatgagatg2940

gatagcagctcaaactgataaatatcaaaacagtgagctatatcgaactattgctgacac3000

taaaggagctttcgtccaaccggctttatatgaagcttttggactaactgttattgaagc3060

aatgaattgtggactgcctacatttgctactaatcaaggcggacctgcagaaatcattgt3120

tgatggggtttcaggcttccatattgatccttacaatggggatgaatcgagcaagaaaat3180

agctgatttctttgagaagtgtaaggttgattctaaatattggaacaagatatgtggagg3240

aggtctcaagcgcattgaagaatggtaa3268

<210>20

<211>732

<212>prt

<213>烟草

<400>20

metalaserthrvalalaglysermetproaspalaleulysglnser

151015

argtyrhismetlysargcysphealaargpheilealametglyarg

202530

argleumetlysleulyshisleuthrglugluileglulysthrile

354045

gluasplysalagluargthrlysileleugluglyserleuglylys

505560

ilemetserserthrglnglualaalavalvalproprotyrvalala

65707580

phealavalarghisasnproglyphetrpasptyrvallysvalasp

859095

alagluthrleuservalglualaileseralaargasptyrleulys

100105110

phelysglumetilepheaspgluasptrpalalysaspgluasnala

115120125

leugluvalasppheglyalapheasptyrserasnhisargleuala

130135140

leuserserservalglyasnglyleuasnpheileserlysvalleu

145150155160

serserlyspheglyglylysalagluaspalaglnproleuleuasp

165170175

tyrleuleualaleuasnhisglnglygluasnleumetileasnglu

180185190

asnleuasnglyvalserlysleuglnalaalaleuilevalalaglu

195200205

valphevalserserpheprolysaspthrprotyrlysasppheglu

210215220

hislysleulysglutrpglypheglulysglytrpglyhisasnala

225230235240

glyargvalarggluthrmetargleuleusergluileileglnala

245250255

proaspproileasnmetgluserphepheserargleuprothrthr

260265270

pheasnilevalilepheserilehisglytyrpheglyglnalaasp

275280285

valleuglyleuproaspthrglyglyglnvalvaltyrileleuasp

290295300

glnvalargalaleuglugluglumetleuglnargilelysglngln

305310315320

glyleuasnvallysprolysileleuvalvalthrargleuilepro

325330335

aspalaargglythrthrcysasnglnglumetgluproileleuasn

340345350

serserhisserhisileleuargilepropheargthrglulysgly

355360365

valleuargglntrpaspalaseralalysileleugluleumetglu

370375380

glylysproaspleuileileglyasntyrthraspglyasnleuval

385390395400

alaserleuleualaasnlysleuglyvalthrglnglythrileala

405410415

hisalaleuglulysthrlystyrgluaspseraspvallystrplys

420425430

glnpheaspserlystyrhisphesercysglnphethralaaspleu

435440445

leualametasnalaalaasppheileilethrserthrtyrglnglu

450455460

ilealaglysergluthrargproglyglntyrgluserhisthrala

465470475480

phethrmetproglyleutyrargalavalserglyileasnvalphe

485490495

aspprolyspheasnilealaalaproglyalagluglnseralatyr

500505510

pheprophethrglulysglnlysargpheseralapheargproala

515520525

ileglugluleuleutyrserasngluglnasnasngluhisilegly

530535540

pheleualaasparglyslysproileilephesermetalaargphe

545550555560

aspthrvallysasnleuserglyleuthrglutrptyrglylysasn

565570575

lyslysleuargasnleuvalasnleuvalilevalglyglyphephe

580585590

aspproserlysserlysasparggluglualaalagluilelyslys

595600605

methisgluleuileglulystyrlysleulysglyglnmetargtrp

610615620

ilealaalaglnthrasplystyrglnasnsergluleutyrargthr

625630635640

ilealaaspthrlysglyalaphevalglnproalaleutyrgluala

645650655

pheglyleuthrvalileglualametasncysglyleuprothrphe

660665670

alathrasnglnglyglyproalagluileilevalaspglyvalser

675680685

glyphehisileaspprotyrasnglyaspgluserserlyslysile

690695700

alaaspphepheglulyscyslysvalaspserlystyrtrpasnlys

705710715720

ilecysglyglyglyleulysargilegluglutrp

725730

<210>21

<211>3937

<212>dna

<213>烟草

<400>21

atggctactgcaccagccctaaatagatcagagtccatagctgatagcatgccagaggcc60

ttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggaaag120

aggatgatgaaacttcataacttgatggatgagttggagaaagtaattgatgatcctgct180

gaaaggaaccatgttttggaaggcttacttggctacatattatgcactacaatggtatag240

ctagattcatatgtacttatgatgcccttatattgtttcctgatgtattactcttaaaac300

cttctttgatcaaatttacaggaggctgcagttgttcctccctacattgcctttgccacg360

agacagaatcctggattctgggaatatgtgaaagtgaatgctaatgatctttctgttgag420

ggtattacagctacagaatacttgaaattcaaggaaatgatagttgatgaatgctggtat480

agtatacgttgcagcttatcataccttttgtggttttataacttcaatcagaaaactcat540

cagagttacctttgtgtgaacatgaaatgcagggcaaaagatgaatatgcactggaaatt600

gattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggcaat660

ggtctcagttatgtttccaagtttctaacttcaaagctaaatgctacctccgcgagtgca720

cagtgtctggttgactacttgctcactttgaatcatcaaggagatgtacgtcaacaaaaa780

tcaaactccataagtaaacttgtcaactctaagaagaaaaaataggaaaagaagattcac840

gtaacaaattttctttatgttcaactgcagaaactgatgatcaatgagacactcagcact900

gtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctctttaccaaca960

gatacaccatatgagagctttgagctaaggtgatttgttttttcctctacttccctccac1020

ttgtgccatgctacgtagtactaagtaacttcaattcttgtaaagattcaaacagtgggg1080

ttttgagaaaggatggggtgatacagctgaaagggtcagcgacaccatgagaacactgtc1140

tgaggtgcttcaggcaccagatccattgaacattcagaagttctttggaagggttccaac1200

tgttttcaatattgtattgttctctgtccatggatactttggccaagcagatgttcttgg1260

cttgccagacactggtggtcaggtaagcatttaatagcttttacatttaacttctatgca1320

ttgacaataaaataatttttaacagtttgaccacttctgctcttgttcaacaggtagttt1380

atgttttggatcaagttgtagcttttgaagaagaaatgctacaaagaattaaacagcagg1440

ggctcaatattaagcctcaaattcttgtggtgagttcctagacaatcgacgtgactatgc1500

aattatgtagaggctgtttagaaaagttaatatcatatgttgattgcacagttaacccga1560

ctgattccggatgcaaaaggaacaaagtgcaaccaggaactagaaccaatcaagaataca1620

aaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgg1680

gtttcacgatttgatatctatccatatctggagagatatactcaggtatgtatttttata1740

tcaaccttgctcatcaaagatgtgttgtttcctcaattccatttttccccttggcaaaag1800

gatgctgctgacaaaatcgtcgagctaatggaaggcaaacctgatctaatcattggtaac1860

tacactgatgggaatctagtggcttcactaatggctagaaaacttgggataactctggta1920

acttttcttaatcatatttgatgttgcttcttctccaagttagttcttaatctccactga1980

cctagaccatctttgcaacagggaactattgctcatgctttggagaagacaaaatatgaa2040

gactctgacataaaattgaaggaactcgatccgaagtaccacttctcttgccaattcaca2100

gctgatttgattgcaatgaattcagcagatttcattatcactagcacataccaagaaata2160

gctggaaggtaagaattagagctaataagtaatgcattcatatgtatttcagcatcgctc2220

tttcaccatcatcgaatacacaccactactcagtaaatgtatttgctcaaaagtttgcaa2280

cttaatggatctcattcttgaatgcttcaacatatgcagcaaagataaaccaggacagta2340

tgagagccatagtgcatttacccttccagggctttacagagttgcttcaggtatcaatgt2400

ctttgatccaaaatttaatattgctgcacctggggcagaccagtcggtgtatttccctta2460

cacagaaaagcagaagcgtttgactgctttccgccctgccattgaggaactgctttttag2520

taaagtggacaatgacgagcacgtgtaagtctaagtgttaaacttcagcttagtgcctag2580

aacatcccactgctctatgtattgatgtttcacttgtttcaaacagtggatatttagaag2640

acagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctg2700

gactaacagaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtgg2760

ttggtggttcctttgatcctacaaaatccaaggatagggaagaagcagctgaaataaaaa2820

agatgcacatgctgatagagaaataccagcttaagggtcagattagatggatagcagctc2880

agactgacagatacagaaatagtgaactctaccgcacaatagcagattccaaaggagctt2940

ttgtgcagcctgcattgtatgaagcatttggtctaacagtcattgaggcaatgaactgtg3000

gattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtct3060

caggctttcatattgatccaaataatggggatgaatcaagcaacaaaattgccaactttt3120

tccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaacc3180

gtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttg3240

cagaaaatttcttaatccttaaatcctaattttttgcagttacacatggaagatctatgc3300

aaacaaggtattgaatatggggtccatctatactttttggaggacattgtacagagatca3360

gaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggt3420

atagtgctgcatgacattgacagtataccacaaacatctttatgagatgaattactttta3480

ataaaattgtttttaacctttgcttccttaatggcacttattgcaggtaaaaaatgtgcc3540

tatcagaaaggacgaaacaccacaaggaccaaaggagagggagaaagttaagccacagat3600

atcacaaaggcatgctctaaagcttttgcctacagtttttcaagagaccctagtatattc3660

tagtactaaattagaattatacagcatgcagcttttgctgttcacctttctaaatcacca3720

gttgtgtcaatcaagttgacaaaatcaataaattgggattttccctttcctatgcttgat3780

tgttattactcctactttgtttatggtagtcttccttcattgttttctcctgtacttctt3840

ttactacaactgtactgacatactaattatttctgtgtaccaggcgctcacaatcaaggt3900

tgcagaagtaagattagataaaattgctactgcatga3937

<210>22

<211>860

<212>prt

<213>烟草

<400>22

metalathralaproalaleuasnargsergluserilealaaspser

151015

metproglualaleuargglnserargtyrhismetlyslyscysphe

202530

alalystyrilegluglnglylysargmetmetlysleuhisasnleu

354045

metaspgluleuglulysvalileaspaspproalagluargasnhis

505560

valleugluglyleuleuglytyrileleucysthrthrmetgluala

65707580

alavalvalproprotyrilealaphealathrargglnasnprogly

859095

phetrpglutyrvallysvalasnalaasnaspleuservalglugly

100105110

ilethralathrglutyrleulysphelysglumetilevalaspglu

115120125

cystrpalalysaspglutyralaleugluileasppheglyalaval

130135140

asppheserthrproargleuthrleuserserserileglyasngly

145150155160

leusertyrvalserlyspheleuthrserlysleuasnalathrser

165170175

alaseralaglncysleuvalasptyrleuleuthrleuasnhisgln

180185190

glyasplysleumetileasngluthrleuserthrvalserlysleu

195200205

glnalaalaleuvalvalalaglualaserileserserleuprothr

210215220

aspthrprotyrgluserphegluleuargphelysglntrpglyphe

225230235240

glulysglytrpglyaspthralagluargvalseraspthrmetarg

245250255

thrleusergluvalleuglnalaproaspproleuasnileglnlys

260265270

phepheglyargvalprothrvalpheasnilevalleupheserval

275280285

hisglytyrpheglyglnalaaspvalleuglyleuproaspthrgly

290295300

glyglnvalvaltyrvalleuaspglnvalvalalapheglugluglu

305310315320

metleuglnargilelysglnglnglyleuasnilelysproglnile

325330335

leuvalleuthrargleuileproaspalalysglythrlyscysasn

340345350

glngluleugluproilelysasnthrlyshisserhisileleuarg

355360365

valpropheargthrglulysglyvalleuasnglntrpvalserarg

370375380

pheaspiletyrprotyrleugluargtyrthrglnaspalaalaasp

385390395400

lysilevalgluleumetgluglylysproaspleuileileglyasn

405410415

tyrthraspglyasnleuvalalaserleumetalaarglysleugly

420425430

ilethrleuglythrilealahisalaleuglulysthrlystyrglu

435440445

aspseraspilelysleulysgluleuaspprolystyrhispheser

450455460

cysglnphethralaaspleuilealametasnseralaasppheile

465470475480

ilethrserthrtyrglngluilealaglyserlysasplysprogly

485490495

glntyrgluserhisseralaphethrleuproglyleutyrargval

500505510

alaserglyileasnvalpheaspprolyspheasnilealaalapro

515520525

glyalaaspglnservaltyrpheprotyrthrglulysglnlysarg

530535540

leuthralapheargproalaileglugluleuleupheserlysval

545550555560

aspasnaspgluhisvalglytyrleugluasparglyslysproile

565570575

leuphethrmetalaargleuaspthrvallysasnthrserglyleu

580585590

thrglutrptyrglylysasnlysargleuargserleuvalasnleu

595600605

valvalvalglyglyserpheaspprothrlysserlysaspargglu

610615620

glualaalagluilelyslysmethismetleuileglulystyrgln

625630635640

leulysglyglnileargtrpilealaalaglnthraspargtyrarg

645650655

asnsergluleutyrargthrilealaaspserlysglyalapheval

660665670

glnproalaleutyrglualapheglyleuthrvalileglualamet

675680685

asncysglyleuprothrphealathrasnglnglyglyproalaglu

690695700

ileilevalaspglyvalserglyphehisileaspproasnasngly

705710715720

aspgluserserasnlysilealaasnphepheglnlyscysargglu

725730735

aspproglutyrtrpasnargileservalglnglyleuasnargile

740745750

tyrglucystyrthrtrplysiletyralaasnlysvalleuasnmet

755760765

glyseriletyrthrphetrpargthrleutyrargaspglnlysgln

770775780

alalysglnargtyrilegluthrphetyrasnleuglupheargasn

785790795800

leuvallysasnvalproilearglysaspgluthrproglnglypro

805810815

lysgluargglulysvallysproglnileserglnarghisalaleu

820825830

lysleuleuprothrvalpheglngluthrleualaleuthrilelys

835840845

valalagluvalargleuasplysilealathrala

850855860

<210>23

<211>3905

<212>dna

<213>烟草

<400>23

atggctactgcaccagccctgaaaagatcagagtccatagctgatagcatgccagaggcc60

ttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggcaag120

aggatgatgaaacttcataacttgatggatgaattggagaaagtaattgatgatcctgct180

gaaaggaaccatgttttggaaggcttacttggctacatattatgtactacaatggtatag240

ctagattcatatgtacttatgatgtccttatattgtttccggaggcattattcttaaatc300

cttctttgatcaaatttgtaggaggctgcagttgttcctccctatattgccttcgccacg360

agacagaatcctggattctgggaatatgtgaaagtcaatgctaatgatctttctgttgag420

ggtattacagctacagattacttgaaattcaaggaaatgatagttgatgaaagctggtat480

agaatactttgcagcttatcataccttttgtggttttataatttcaatcagaaaactcat540

cagagttacctttgtgtgaacatgacatgcagggcaaaagatgaatatgcactggaaatt600

gattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggaaat660

ggtctcagttatgtttccaagtttctaacttcaaagctaaatgctacctcagcgagtgca720

cagtgtctggttgactacttgctcactttgaatcaccaaggagatgtacgtcaacaaaaa780

tcaaactccataagtaaacttgtcaactctaagaagtaaaaataggaaaagaagattcat840

gtaacaaattttctttatgttcaactgtagaaactgatgatcaatgagacactcggcact900

gtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctccttaccaaca960

gatacaccataccagagctttgagctaaggtgatttgttttttcctctacttccttccac1020

ttttggtgtgctacatagtactaagtaacttcaattcttgtaaagattcaaacagtgggg1080

ttttgagaaaggatggggtgatacagctgaaagggtccgcgacaccatgagaacactttc1140

tgaggtacttcaggcgccagatccattgaacattgagaagttctttgggagggttccaac1200

tgttttcaatattgtattgttctctgttcatggatactttggccaagcaaatgttcttgg1260

cttgccagacacaggtggtcaggtaagcatctaatagcttttacatttaacttctatgca1320

ttgacaataaaataacttctacactaccaaataatttttgaaagtttgaccacttcggct1380

cttgttcaacaggtggtttatgttttggatcaagttgtagcttttgaagaagaaatgctc1440

caaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagctcctag1500

acaatgacgtgactatgcaattaagtagaggctgtttagaaaagttaatatcatatgttg1560

attgcacagttaacccgactgattccggacgccaaaggaacaaagtgcaaccaggaacta1620

gaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaa1680

ggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatact1740

caggtgtgtatttttatatcaaccctgctcatcaaagatgtgttgtttcctcaattccat1800

ttttcgccttgacaaaaggacgctgctgacaaaatcatcgagctaatggaaggcaaacct1860

gatctaatcattggtaactacactgatgggaatctagtggcttctctaatggctagaaag1920

cttgggataactctggtaacttttcttatcatatttgatgttgtttcttctccaagttgg1980

ttcttaatgtcaactaacccagaccatctttgtaacagggaactattgctcatgctctgg2040

agaagacaaaatatgaagactctgacatcaaattgaaggaactcgatccgaagtaccact2100

tttcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcacaa2160

gcacatatcaagaaatagccggaaggtaagaattggaactacggaagcagagagctaata2220

agtagtgcactcatatatttcagcatcgctctttcgcataatcgaatacacaccactact2280

cagtaaatgtacttgctcaaaagtttacaagtttatggatcttattcttgaatgcttcaa2340

catatgcagcaaagataggccaggacagtatgagagccatagtgcatttacccttccagg2400

gctttacagagttgcttcaggcatcaatgtctttgatcctaaatttaatattgctgcacc2460

tggggcagaccaatcggtgtatttcccttacacagaaaagcagacgcgtttgactgcttt2520

ccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacatgtaagt2580

cttagtgttaaacttcagctttcagcttagtgcctagaacattccactggctctatgtat2640

taatgtttcacttgtttcaaacacagtggatatttagaagacagaaagaaacctatcctg2700

tttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggc2760

aagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcct2820

acaaaatccaaggatagagaagaagcagctgaaataaaaaagatgcacatgctgatagag2880

aaataccagcttaagggtcagatcagatggatagcagctcagactgacagatatagaaac2940

agtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattatat3000

gaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctacc3060

aaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatcca3120

aataatggggatgaatcaagcaacaaagttgccaactttttccaaaaatgcagggaggat3180

cctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactc3240

acagataagccattcaaattgcaaagaggcacatatcttgctgaaaatttcttaatcctt3300

taatcctaaaattttgcagttacacatggaagatctatgcaaacaaggtattgaatatgg3360

ggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagat3420

acatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattga3480

cagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctt3540

tgcctccttaatgacacttattgcaggtaaaaaatgtgcctatcagacaggacgaaacac3600

cacaaggaccaaaggagaggagggagaaagttaagccacagatatcacaaaggcatgctc3660

taaagcttttgcctatagtttttcaggagaccctagtatattctagtactaaattagaat3720

tatacagcatgcagcttgcttctgctgttcacctttctaaatcaccagttatgtcaatca3780

agttgacaaaatcaataaattcggcttttccctttcctatgcttgattgttattactcct3840

acttcgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgt3900

actga3905

<210>24

<211>913

<212>prt

<213>烟草

<400>24

metalathralaproalaleulysargsergluserilealaaspser

151015

metproglualaleuargglnserargtyrhismetlyslyscysphe

202530

alalystyrilegluglnglylysargmetmetlysleuhisasnleu

354045

metaspgluleuglulysvalileaspaspproalagluargasnhis

505560

valleugluglyleuleuglytyrileleucysthrthrmetgluala

65707580

alavalvalproprotyrilealaphealathrargglnasnprogly

859095

phetrpglutyrvallysvalasnalaasnaspleuservalglugly

100105110

ilethralathrasptyrleulysphelysglumetilevalaspglu

115120125

sertrpalalysaspglutyralaleugluileasppheglyalaval

130135140

asppheserthrproargleuthrleuserserserileglyasngly

145150155160

leusertyrvalserlyspheleuthrserlysleuasnalathrser

165170175

alaseralaglncysleuvalasptyrleuleuthrleuasnhisgln

180185190

glyasplysleumetileasngluthrleuglythrvalserlysleu

195200205

glnalaalaleuvalvalalaglualaserileserserleuprothr

210215220

aspthrprotyrglnserphegluleuargphelysglntrpglyphe

225230235240

glulysglytrpglyaspthralagluargvalargaspthrmetarg

245250255

thrleusergluvalleuglnalaproaspproleuasnileglulys

260265270

phepheglyargvalprothrvalpheasnilevalleupheserval

275280285

hisglytyrpheglyglnalaasnvalleuglyleuproaspthrgly

290295300

glyglnvalvaltyrvalleuaspglnvalvalalapheglugluglu

305310315320

metleuglnargilelysglnglnglyleuasnilelysproglnile

325330335

leuvalleuthrargleuileproaspalalysglythrlyscysasn

340345350

glngluleugluproilelysasnthrlyshisserhisileleuarg

355360365

valpropheargthrglulysglyvalleuasnglntrpvalserarg

370375380

pheaspiletyrprotyrleugluargtyrthrglnaspalaalaasp

385390395400

lysileilegluleumetgluglylysproaspleuileileglyasn

405410415

tyrthraspglyasnleuvalalaserleumetalaarglysleugly

420425430

ilethrleuglythrilealahisalaleuglulysthrlystyrglu

435440445

aspseraspilelysleulysgluleuaspprolystyrhispheser

450455460

cysglnphethralaaspleuilealametasnseralaasppheile

465470475480

ilethrserthrtyrglngluilealaglyserlysaspargprogly

485490495

glntyrgluserhisseralaphethrleuproglyleutyrargval

500505510

alaserglyileasnvalpheaspprolyspheasnilealaalapro

515520525

glyalaaspglnservaltyrpheprotyrthrglulysglnthrarg

530535540

leuthralapheargproalaileglugluleuleupheserlysval

545550555560

aspasnaspgluhisileglytyrleugluasparglyslysproile

565570575

leuphethrmetalaargleuaspthrvallysasnthrserglyleu

580585590

thrglutrptyrglylysasnlysargleuargserleuvalasnleu

595600605

valvalvalglyglyserpheaspprothrlysserlysaspargglu

610615620

glualaalagluilelyslysmethismetleuileglulystyrgln

625630635640

leulysglyglnileargtrpilealaalaglnthraspargtyrarg

645650655

asnsergluleutyrargthrilealaaspserlysglyalapheval

660665670

glnproalaleutyrglualapheglyleuthrvalileglualamet

675680685

asncysglyleuprothrphealathrasnglnglyglyproalaglu

690695700

ileilevalaspglyvalserglyphehisileaspproasnasngly

705710715720

aspgluserserasnlysvalalaasnphepheglnlyscysargglu

725730735

aspproglutyrtrpasnargileservalglnglyleuasnargile

740745750

tyrglucystyrthrtrplysiletyralaasnlysvalleuasnmet

755760765

glyseriletyrthrphetrpargthrleutyrargaspglnlysgln

770775780

alalysglnargtyrilegluthrphetyrasnleuglupheargasn

785790795800

leuvallysasnvalproileargglnaspgluthrproglnglypro

805810815

lysgluargargglulysvallysproglnileserglnarghisala

820825830

leulysleuleuproilevalpheglngluthrleuvaltyrserser

835840845

thrlysleugluleutyrsermetglnleualaseralavalhisleu

850855860

serlysserprovalmetserilelysleuthrlysserileasnser

865870875880

alaphepropheprometleuaspcystyrtyrsertyrphevaltyr

885890895

glyserleuproserleupheserprovalleuleuleuleuglnleu

900905910

tyr

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1