修饰的CPMV增强子元件的制作方法

文档序号:12285352阅读:412来源:国知局
修饰的CPMV增强子元件的制作方法与工艺
本发明涉及目的蛋白在植物中的表达。本发明还提供用于在植物中产生目的蛋白的方法和组合物。发明背景植物作为重组蛋白的产生系统具有巨大的潜力。在植物中产生外源蛋白的一种方法是产生稳定的转基因植物系。然而,该方法耗时且劳动密集。转基因植物的替代方案是使用基于植物病毒的表达载体。基于植物病毒的载体允许在植物中快速、高水平、瞬时表达蛋白。在植物中实现外源蛋白的高水平瞬时表达的一种方法涉及使用基于RNA植物病毒的载体,包括豇豆花叶病毒组,如豇豆花叶病毒(Cowpeamosaicvirus)(CPMV;参见,例如WO2007/135480;WO2009/087391;US2010/0287670,SainsburyF.等,2008,PlantPhysiology;148:121-1218;SainsburyF.等,2008,PlantBiotechnologyJournal;6:82-92;SainsburyF.等,2009,PlantBiotechnologyJournal;7:682-693;SainsburyF.等,2009,MethodsinMolecularBiology,RecombinantProteinsFromPlants,vol.483:25-39)。豇豆花叶病毒组是具有二重基因组的RNA病毒。豇豆花叶病毒组RNA基因组的片段被称为RNA-1和RNA-2。RNA-1编码VPg、复制酶和蛋白酶蛋白。复制酶是病毒所需的,用于病毒基因组的复制。豇豆花叶病毒组豇豆花叶病毒(CPMV)的RNA-2产生105kDa或95kDa的多肽,其被加工为4个功能肽。CPMVRNA-2的5’区包含位于115位、161位、512位和524位的起始密码子(AUG)。位于161位和512位的起始密码子处于同一三联体阅读框内。在位于161位起始密码子处的起始导致105K多蛋白的合成,而在位于512位起始密码子处的起始指导95K多蛋白的合成。在CPMV的512位起始密码子处的翻译起始比在161位处的起始更高效,导致产生比105K多蛋白更多的95K多蛋白。位于115位的起始密码子对于病毒复制不是必要的(Wellink等,1993Biochimie.75(8):741-7)。RNA-2通过RNA-1编码的复制酶的高效复制需要维持CPMVRNA-2中161位和512位的起始位点之间的框架(Holness等,1989;Virology172,311-320;vanBokhoven等,1993,Virology195,377-386;Rohll等,1993Virology193,672-679;Wellink等,1993,Biochimie.75(8):741-7)。该需求影响可被插入复制形式的CPMVRNA-2表达载体中512位处起始密码子上游的序列的长度。此外,多接头的使用应当谨慎,因为它们可使开放阅读框(ORF)在这些起始位点之间移动。CPMV被用作发展适于在植物中产生异源多肽的载体系统的基础(Liu等,2005Vaccine23,1788-1792;Sainsbury等,2007VirusExpressionVectors(Hefferon,K.ed),pp.339-555)。这些系统基于RNA-2的修饰,但是不同之处在于使用全长形式还是或者缺失形式。通过与RNA-1共接种(co-inoculation)实现修饰的RNA-2的复制。外源蛋白与RNA-2来源的多蛋白的C端融合。N端多肽的释放由来自口蹄疫病毒的2A催化肽序列的作用介导(Gopinath等,2000,Virology267:159-173)。得到的RNA-2分子既能在植物内传播,又能在植物间传播。该策略已被用于在豇豆植物中表达多种重组蛋白,如乙型肝炎核心抗原(HBcAg)和小免疫蛋白(SIP)(Mechtcheriakova等,J.Virol.Methods131,10-15;2006;Monger等,2006,植物Biotechnol.J.4,623-631;Alamillo等,2006,Biotechnol.J.1,1103-1111)。尽管成功,但是全长病毒载体的使用限制了插入序列的大小,并且在植物之间的移动引发了关于病毒的生物防护的担忧。为了解决生物防护和插入大小的问题,Canizares等人(2006PlantBiotechnol,J4:183-193)用目的序列替代了RNA-2的大部分编码区,以产生无能形式的CPMVRNA-2(deIRNA-2)。将待表达的序列与RNA-2位于512位的AUG融合,紧接3'非翻译区(UTR)的上游,以产生模拟RNA-2的分子。在RNA-1和沉默抑制基因的存在下,当被引入植物时,此类构建体能够复制,并指导高水平的异源蛋白的合成(Sainsbury等,2008PlantBiotechnolJ6:82-92)。CPMVRNA-2载体中位于161位的起始密码子的突变(U162C;HT)增加了由位于512位的起始密码子之后插入的序列所编码的蛋白的表达水平。这允许高水平的外源蛋白的产生,而无需病毒复制,并将其称为CPMV-HT系统(WO2009/087391;Sainsbury和Lomonossoff,2008,PlantPhysiol.148,1212-1218)。在pEAQ表达质粒(Sainsbury等,2009,PlantBiotechnologyJournal,7,pp682-693;US2010/0287670)中,待表达的序列位于5’UTR和3’UTR之间。pEAQ系列中的5’UTR携带U162C(HT)突变。发明概述本发明涉及目的蛋白在植物中的表达。本发明还提供用于在植物中产生目的蛋白的方法和组合物。如本文所述,提供表达增强子,其依次包含CPMV5’UTR核苷酸序列和填充序列,所述CPMV5’UTR核苷酸序列包含SEQIDNO:1的核苷酸1-160或者包含与SEQIDNO:1具有约80%至100%序列相似性的核苷酸序列,所述填充片段包含编码不完全M蛋白的核苷酸序列、在植物中有活性的一种或多种kozak序列,或者这两种均包含。填充片段可以包含10至约500个核苷酸的长度,或者其间的任意长度。填充片段的不完全的M蛋白可以包含约10至约351个核苷酸的长度,或者其间的任意长度。填充片段还可以包含多克隆位点。多克隆位点包含约0至约100个核苷酸的长度,或者其间的任意长度。还提供如上文所述的表达增强子,其中kozak序列选自如SEQIDNO:5-17中所示的序列。还提供包含含有调控区的核酸序列的植物表达系统,所述核酸序列与表达增强子可操作地连接,所述表达增强子依次包含CPMV5’UTR核苷酸序列和填充片段,所述CPMV5’UTR核苷酸序列包含SEQIDNO:1的核苷酸1-160或者包含与SEQIDNO:1具有约80%至100%的序列相似性的核苷酸序列,所述填充片段包含编码不完全的M蛋白的核苷酸序列和一种或多种kozak序列,表达增强子与目的核苷酸序列可操作地连接。植物表达系统还可以包含豇豆花叶病毒组3’UTR。植物表达系统还可以包含编码沉默抑制因子的第二核酸序列,例如HcPro或p19。如上文所限定的植物表达系统的目的核苷酸序列可以编码病毒蛋白或抗体。例如,病毒蛋白可以选自:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16、B型流感病毒血凝素。编码病毒蛋白或抗体的核苷酸序列可以包含天然的信号肽序列或者非天然的信号肽,例如所述非天然的信号肽可以获自蛋白质二硫键异构酶(PDI)。如本文所述,提供在植物中或者在植物的一部分中产生目的蛋白的方法,其包括向植物或植物的一部分引入上文所限定的植物表达系统,以及在允许编码目的蛋白的核苷酸序列表达的条件下培养所述植物或植物部分。本发明还提供瞬时转染或者稳定转化有如上文所述的植物表达系统的植物或植物部分。优选地,基于植物的表达系统具有许多特性,如例如含有目的基因的便利克隆位点,可以以成本有效的方式容易地感染植物,可以引起接种植物的高效局部感染或整体感染。此外,感染应当提供有用蛋白材料的良好收率。该发明概述不一定描述本发明的全部特征。附图简述根据以下描述,参考附图,本发明的这些以及其它特征将变得更加显而易见,其中:图1A显示了与目的核苷酸序列融合的现有技术的增强子序列实例(CPMVHT)和如本文所述的增强子序列实例(CPMVHT+)的一般示意图。显示于该图中的元件并非都是增强子序列中所需的。在目的核苷酸序列的3’末端可以包含其它元件(未显示),所述元件包括编码豇豆花叶病毒组3’非翻译区(UTR)的序列、质体蓝素3’UTR的序列或者豇豆花叶病毒组3’UTR与质体蓝素3’UTR的组合的序列。图1B显示了包含如现有技术所述的增强子序列(CPMVHT)以及如本发明所述的增强子序列的构建体,所述增强子序列在其5’末端与植物调控区(在这些非限制性实例中为2X35S)可操作地连接,以及在其3’末端与填充片段、目的核苷酸序列、含有ATG起始位点的“GOI”可操作地连接。在这些实例中,CPMVHT的填充片段包含不完全的M蛋白和多克隆位点,以及在CPMVHT+的实例中,填充片段包含不完全的M蛋白、多克隆位点和植物kozak序列。图2显示了包含与目的核苷酸序列可操作地连接的CPMV-HT(现有技术)表达构建体,和基于CPMVHT+的表达构建体的植物中产生的蛋白的粗蛋白提取物中的相对血凝滴度(HMG)。显示了来自下述的HA的表达数据:具有PDI信号肽的H1A/California/07/2009(构建体编号484:CPMVHT;和构建体编号1805:CPMVHT+;参见实施例4);具有PDI信号肽的H3A/Victoria/361/2011(构建体编号1391:CPMVHT;和构建体编号1819:CPMVHT+;分别参见实施例1和2);具有缺失的蛋白水解环并具有PDI信号肽的BBrisbane/60/08(构建体编号1039:CPMVHT;和构建体编号1829:CPMVHT+;参见实施例8);具有缺失的蛋白水解环,跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代,并具有PDI信号肽的BBrisbane/60/08+H1TM(构建体编号1067:CPMVHT;和构建体编号1875:CPMVHT+;参见实施例9);具有缺失的蛋白水解环并具有PDI信号肽的BMassachusetts/2/2012(构建体编号2072:CPMVHT;和构建体编号2052:CPMVHT+;参见实施例10);具有缺失的蛋白水解环,跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代,并具有PDI信号肽的BMassachusetts/2/2012+H1Tm(构建体编号2074:CPMVHT;和构建体编号2062:CPMVHT+;参见实施例11);具有缺失的蛋白水解环并具有天然信号肽的BWisconsin/1/2010(构建体编号1445:CPMVHT;和构建体编号1839:CPMVHT+;参见实施例12);以及具有缺失的蛋白水解环,跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代,并具有天然的信号肽的BWisconsin/1/2010+H1Tm(构建体编号1454:CPMVHT;和构建体编号1860:CPMVHT+;参见实施例13)。图3显示了在包含CPMV-HT(现有技术)表达构建体和基于CPMVHT+的表达构建体的植物中产生的蛋白的粗蛋白提取物中的相对血凝滴度(HMG)。显示了下述的表达数据:具有PDI信号肽的来自流感病毒A/Indonesia/5/2005的H5(H5Indo;构建体编号409:CPMVHT;和构建体编号2319:CPMVHT+;参见实施例5);具有苜蓿蛋白质二硫键异构酶的来自流感病毒A/Hangzhou/1/2013的H7(H7Han;构建体编号2140:CPMVHT;和构建体编号2142:CPMVHT+;参见实施例6);与来自流感病毒A/Indonesia/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合,并具有苜蓿蛋白质二硫键异构酶的信号肽的来自流感病毒A/Hangzhou/1/2013的H7(H7Han+H5Tm;构建体编号2130:CPMVHT;构建体编号2146:CPMVHT+;参见实施例7)。图4A显示了测试的植物Kozak序列的变体的实例。显示了CPMVHT+、植物调控区、5’UTR、填充片段以及目的核苷酸序列(GOI)的部分序列的构建体。在该非限制性实例中,该构建体包含2X35S调控区、含有填充片段的CPMVHT+,所述填充片段包含不完全的M蛋白和多克隆位点(限制性位点)、植物kozak序列(也显示了目的核苷酸序列的5’末端:“ATG…GOI”;其中GOI为H3A/Victoria/361)。在所述序列下面也显示了植物kozak序列的变体(也参见图7)。各变体植物Kozak序列位于填充片段的3’末端与目的核苷酸序列(在这些非限制性实例中为H3A/Victoria/361)的5’-ATG位点之间。构建体的其它元件保持相同。图4B显示了含有CPMVHT+表达构建体和所显示的变体植物Kozak序列的植物中产生的目的核苷酸序列的HA滴度。图5显示了用于制备构建体编号1391的序列组件(A‐2X35SCPMV‐HTPDISPH3VictoriaNOS;参见实施例1)。构建体编号1391掺入了现有技术CPMV-HT序列(在161位具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR,并且其在5’UTR与目的核苷酸序列之间不包含异源kozak序列(PDISP/H3Victoria))。PDISP:蛋白质二硫键异构酶信号肽。NOS:胭脂碱合成酶终止子。图5A显示了引物序列IF-PDI.S1=3c(SEQIDNO:18)。图5B显示了引物序列IF‐H3V36111.s1‐4r(SEQIDNO:19)。图5C显示了PDISP/H3Victoria的序列(SEQIDNO:20)。图5D显示了构建体1191的示意图。图5E显示了构建体1191;从左至右t‐DNA边界(加下划线),具有质体蓝素-P19-质体蓝素沉默抑制子表达盒的2X35SCPMV‐HTNOS(SEQIDNO:21)。图5F显示了从2X35S启动子至NOS终止子的表达盒编号1391。PDISP/H3Victoria核苷酸序列加下划线;CPMV5’UTR加粗;不完全的M蛋白为斜体(SEQIDNO:22)。图5G显示了PDISP/H3Victoria的氨基酸序列(SEQIDNO:23)。图5H显示了构建体编号1391(参照构建体)的示意图。图6显示了用于制备构建体编号1819的序列组件(2X35SCPMV‐HT+PDISPH3VictoriaNOS;参见实施例1)。构建体编号1819掺入了CPMV-HT+序列(在161位具有突变的起始密码子,与编码不完全的M蛋白、多克隆位点的填充片段融合的CPMV5’UTR,并且在所述多克隆位点与目的核苷酸序列之间包含植物kozak序列(PDISP/H3Victoria))。PDISP:蛋白质二硫键异构酶信号肽。NOS:胭脂碱合成酶终止子。图6A显示了引物序列IF(SacII)‐Kozac_PDI.c(SEQIDNO:24)。图6B显示了构建体2181的示意图。图6C显示了构建体2181的序列(从左至右t‐DNA边界,加下划线;具有质体蓝素‐P19‐质体蓝素沉默抑制子表达盒的2X35S/CPMV‐HT+/NOS;SEQIDNO:25)。图6D显示了从2X35S启动子至NOS终止子的表达盒编号1819。PDISP/H3Victoria核苷酸序列加下划线(SEQIDNO:26)。图6E显示了构建体1819的示意图。图7显示了包含用于制备选择的基于“CPMVHT+”的构建体的植物kozak序列变型的序列(构建体编号1952至1959)。显示了2X35S/CPMVHT+/NOS表达系统中的SacII限制性位点与PDISP/H3Victoria的ATG之间的序列变型,其包含植物kozak序列的变型(序列显示为来自构建体1819的对应序列的变型;参见实施例2)。变体植物kozak序列加下划线。PDISP:蛋白质二硫键异构酶信号肽。图7A显示了IF-HT1*-PDI.c的核苷酸序列(SEQIDNO:27;用于制备构建体编号1952)。图7B显示了IF-HT2*-PDI.c的核苷酸序列(SEQIDNO:28;用于制备构建体编号1953)。图7C显示了IF-HT3*-PDI.c的核苷酸序列(SEQIDNO:29;用于制备构建体编号1954)。图7D显示了IF-HT4*-PDI.c的核苷酸序列(SEQIDNO:30;用于制备构建体编号1955)。图7E显示了IF-HT5*-PDI.c的核苷酸序列(SEQIDNO:31;用于制备构建体编号1956)。图7F显示了IF-HT6*-PDI.c的核苷酸序列(SEQIDNO:32,用于制备构建体编号1957)。图7G显示了IF-HT7*-PDI.c的核苷酸序列(SEQIDNO:33;用于制备构建体编号1958)。图7H显示了IF-HT8*-PDI.c的核苷酸序列(SEQIDNO:34;用于制备构建体编号1959)。图7I显示了利用SEQIDNO:27(图7A)的包含植物kozak序列(Kozak1)的构建体编号1952的示意图。除了各构建体(1953-1959)分别包含如图7B至7H(SEQIDNO:28至34)中所示的修饰的植物Kozak序列(Kozak1)之外,构建体1953-1959包含与构建体1952相同的特征。图8显示了用于制备构建体编号484和1805的序列组件(分别为2X35S/CPMVHTPDISP/H1CaliforniaNOS和2X35S/CPMVHT+PDISP/H1CaliforniaNOS;参见实施例4)。构建体编号484掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H1California)之间不包含异源kozak序列。构建体编号1805包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽。NOS:胭脂碱合成酶终止子。图8A显示了PDISP/H1California的核苷酸序列(SEQIDNO:35)。图8B显示了PDISP/H1California的氨基酸序列(SEQIDNO:36)。图8C显示了构建体编号484(2X35S/CPMVHT;参照构建体)的示意图。图8D显示了构建体编号1805(2X35S/CPMVHT+)的示意图。图9显示了用于制备构建体编号409和2319的序列组件(分别为2X35S/CPMVHTPDISP/H5IndonesiaNOS;CPMVHT+PDISP/H5IndonesiaNOS;参见实施例5)。构建体编号409掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码的不完全的M蛋白序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H5Indonesia)之间不包含异源kozak序列。构建体编号2319包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。NOS:胭脂碱合成酶终止子。图9A显示了PDISP/H5Indonesia的核苷酸序列(SEQIDNO:37)。图9B显示了PDISP/H5Indonesia的氨基酸序列(SEQIDNO:38)。图9C显示了构建体编号409(2X35S/CPMVHT,参照构建体)的示意图。图9D显示了构建体编号2319(2X35S/CPMVHT+)的示意图。图10显示了用于制备构建体编号2140和2142的序列组件(分别为2X35S/CPMVHTH7HangzhouNOS;CPMVHT+H7HangzhouNOS;参见实施例6)。构建体编号2140掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H7Hangzhou)之间不包含异源kozak序列。构建体编号2142包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。NOS:胭脂碱合成酶终止子。图10A显示了天然的H7Hangzhou的核苷酸序列(SEQIDNO:39)。图10B显示了天然的H7Hangzhou的氨基酸序列(SEQIDNO:40)。图10C显示了构建体编号2140(2X35S/CPMVHT;参照构建体)的示意图。图10D显示了构建体编号2142(2X35S/CPMVHT+)的示意图。图11显示了用于制备构建体编号2130和2146的序列组件(分别为2X35S/CPMVHTH7Hangzhou+H5IndonesiaTMCTNOS;CPMVHT+H7Hangzhou+H5IndonesiaTMCTNOS;参见实施例7)。构建体编号2130掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/H7Hangzhou+H5IndonesiaTMCT)之间不包含异源kozak序列。构建体编号2146包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。NOS:胭脂碱合成酶终止子。图11A显示了H7Hangzhou+H5IndonesiaTMCT的核苷酸序列(SEQIDNO:41)。图11B显示了H7Hangzhou+H5IndonesiaTMCT的氨基酸序列(SEQIDNO:42)。图11C显示了构建体编号2130(2X35S/CPMVHT;参照构建体)的示意图。图11D显示了构建体编号2146(2X35S/CPMVHT+)的示意图。图12显示了用于制备构建体编号1039和1829的序列组件(分别为2X35S/CPMVHTPDISP/HABBrisbane(PrL-)NOS和2X35S/CPMVHT+PDISP/HABBrisbane(PrL-)NOS;参见实施例8)。构建体编号1039掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HABBrisbane(PrL-))之间不包含异源kozak序列。构建体编号1829包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽;NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环。图12A显示了PDISP/HABBrisbane(PrL-)的核苷酸序列(SEQIDNO:43)。图12B显示了PDISP/HABBrisbane(PrL-)的氨基酸序列(SEQIDNO:44)。图12C显示了构建体编号1039(2X35S/CPMVHT;参照构建体)的示意图。图12D显示了构建体编号1829(2X35S/CPMVHT+)示意图。图13显示了用于制备构建体编号1067和1875的序列组件(分别为2X35S/CPMVHTPDISP/HABBrisbane(Prl-)+H1CaliforniaTMCTNOS和2X35S/CPMVHT+PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCTNOS;参见实施例9)。构建体编号1067掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT)之间不包含异源kozak序列。构建体编号1875包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽;NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图13A显示了PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT的核苷酸序列(SEQIDNO:45)。图13B显示了PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT的氨基酸序列(SEQIDNO:46)。图13C显示了构建体编号1067(2X35S/CPMVHT;参照构建体)的示意图。图13D显示了构建体编号1875(2X35S/CPMV160+)的示意图。图14显示了用于制备构建体编号2072和2052的序列组件(分别为2X35S/CPMVHTPDISP/HABMassachusetts(PrL-)NOS和2X35S/CPMVHT+PDISP/HABMassachusetts(PrL-)NOS;参见实施例10)。构建体编号2072掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HABMassachusetts(PrL-))之间不包含异源kozak序列。构建体编号2052包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。PDISP:蛋白质二硫键异构酶信号肽;NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环。图14A显示了PDISP/HABMassachusetts(PrL-)的核苷酸序列(SEQIDNO:47)。图14B显示了PDISP/HABMassachusetts(PrL-)的氨基酸序列(SEQIDNO:48)。图14C显示了构建体编号2072(2X35S/CPMVHT;参照构建体)的示意图。图14D显示了构建体编号2052(2X35S/CPMVHT+)的示意图。图15显示了用于制备构建体编号2074和2062的序列组件(分别为2X35S/CPMVHTPDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCTNOS和2X35S/CPMVHT+PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCTNOS;参见实施例11)。构建体编号2074掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCT)之间不包含异源kozak序列。构建体编号2062包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。PDISP;蛋白质二硫键异构酶信号肽;NOS;胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图15A显示了PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCT的核苷酸序列(SEQIDNO:49)。图15B显示了PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCT的氨基酸序列(SEQIDNO:50)。图15C显示了构建体编号2074(2X35S/CPMVHT;参照构建体)的示意图。图15D显示了构建体编号2062(2X35S/CPMVHT+)的示意图。图16显示了用于制备构建体编号1445和1839的序列组件(分别为2X35S/CPMVHTHABWisconsin(PrL-)NOS和2X35S/CPMVHT+HABWisconsin(PrL-)NOS;参见实施例12)。构建体编号1445掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(HABWisconsin(PrL-))之间不包含异源kozak序列。构建体编号1839包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。PrL-:缺失的蛋白水解环;NOS:胭脂碱合成酶终止子。图16A显示了HABWisconsin(PrL-)的核苷酸序列(SEQIDNO:51)。图16B显示了HABWisconsin(PrL-)的氨基酸序列(SEQIDNO:52)。图16C显示了构建体编号1445(2X35S/CPMVHT;参照构建体)的示意图。图16D显示了构建体编号1839(2X35S/CPMVHT+)的示意图。图17显示了用于制备构建体编号1454和1860的序列组件(分别为2X35S/CPMVHTHABWisconsin(PrL-)+H1CaliforniaTMCTNOS和2X35S/CPMVHT+HABWisconsin(PrL-)+H1CaliforniaTMCTNOS;参见实施例13)。构建体编号1454掺入了现有技术的CPMV-HT序列(在161位处具有突变的起始密码子,与编码不完全的M蛋白的序列融合的CPMV5’UTR),并且在5’UTR与目的核苷酸序列(HABWisconsin(PrL-)+H1CaliforniaTMCT)之间不包含异源kozak序列。构建体编号1860包含含有160个核苷酸的CPMV5’UTR,含有不完全的M蛋白、多克隆位点和植物kozak序列的填充片段,并且是基于CPMVHT+的构建体的实例。NOS:胭脂碱合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图17A显示了HABWisconsin(PrL-)+H1CaliforniaTMCT的核苷酸序列(SEQIDNO:53)。图17B显示了PDISP/HABWisconsin(PrL-)+H1CaliforniaTMCT的氨基酸序列(SEQIDNO:54)。图17C显示了构建体编号1454(2X35S/CPMVHT;参照构建体)的示意图。图17D显示了构建体编号1893(2X35S/CPMVHT+)的示意图。详细描述本方面涉及目的蛋白在植物中的表达。本发明还提供用于在植物中产生目的蛋白的方法和组合物。在下述描述中,广泛使用了许多术语,提供以下定义以便于理解本发明的各个方面。在说明书中使用实例,包括术语的实例仅出于示例性目的,并且不意图限制本发明的实施方案的范围和意义。如本文所使用的,当与术语“包含”连同使用时,单词“一个/一种(a)”或“一个/一种(an)”的使用可以意为“一个/一种(one)”,但是其也符合“一个/一种或多个/多种(oneormore)”、“至少一个/一种(atleastone)”和“一个/一种或多于一个/一种(oneormorethanone)”的意思。术语“约”指给定值的大约+/-10%的偏差。术语“多个/多种(plurality)”意为多于一个/一种,例如两个/两种或者更多个/更多种、三个/三种或者更多个/更多种、四个/四种或者更多个/更多种等。本发明提供核酸、表达增强子和表达系统,以在植物中产生目的蛋白,包括豇豆花叶病毒组5’非翻译区(UTR)以及修饰的、延长的或截短的填充序列。还提供包含目的序列的植物细胞、植物组织、全植株、接种物、核酸、构建体,以及在植物中表达目的蛋白的方法。本发明的表达增强子的实例包括但不限于如图1A中所示的CPMVHT+。提供了CPMVHT+的核苷酸序列的非限制性实例,参考SEQIDNO:1、3和4。表达增强子CPMVHT+可以在增强子序列的5’末端与在植物中有活性的调控区可操作地连接,以及在表达增强子的3’末端与目的核苷酸序列可操作地连接(图1A),以驱使目的核苷酸序列在植物宿主内的表达。还提供使用CPMVHT+,在植物中产生一种或多种目的蛋白的表达系统。本文所述的表达系统包含含有CPMVHT+或者与CPMVHT+具有80%至100%或者其间任意量的序列相似性的序列的表达盒。包含CPMVHT+的表达盒还可以包含与表达增强子的5’末端可操作地连接并在植物中有活性的调控区。目的核苷酸序列可以与表达盒的3’末端可操作地连接,以当被引入植物中时实现目的核苷酸序列在植物宿主中的表达。参考图1A和1B,显示了包含来自豇豆花叶病毒组基因组(豇豆花叶病毒组5’UTR)的5’UTR序列以及修饰的M蛋白的表达增强子。在图1A和1B中,显示了包含不完全的M蛋白的现有技术的CPMVHT增强子(Sainsbury和Lomonossoff,2008,PlantPhysiology;148:1212-1218;WO2009/087391;将它们通过引用并入本文),以及本发明的CPMVHT+。现有技术的CPMVHT表达增强子(Sainsbury和Lomonossoff,2008,PlantPhysiology;148:1212-1218;WO2009/087391;将它们通过引用并入本文)包含115位处具有修饰的ATG(ATG修饰为CGT)的CPMV5’UTR的核苷酸1-160,其与包含SEQIDNO:2的核苷酸161-509的不完全的M蛋白融合,所述不完全的M蛋白由位于162位的修饰的ATG(ATG修饰为ACG)和接头序列组成(参见SEQIDNO:2)。目的核苷酸与接头序列的3’末端融合(参见图1A和1B)。现有技术的CPMVHT缺乏紧接目的核苷酸与表达增强子融合位置上游的植物Kozak序列。本发明的CPMVHT+可以包含115-117位处具有修饰的ATG的CPMV5’UTR的核苷酸1-160(其中ATG修饰为GTG;位于115位的A修饰为G),其与修饰的填充序列融合,所述填充序列包含:修饰的ATG(位于161-163位的ATG修饰为ACG;其中位于162位的“T”修饰为“C”)、不完全的M蛋白、接头序列和植物kozak序列。CPMVHT+核苷酸序列的非限制性实例显示于SEQIDNO:1和4中。目的核苷酸可以与kozak序列的3’末端融合,例如CPMVHT+的植物kozak序列(参见图1A和1B)。如SEQIDNO:4所示,本发明的表达增强子的5’UTR也可以包含位于115位的“A”,并包含核苷酸115-117处的天然ATG序列,其与修饰的填充序列融合,所述填充序列包含:位于核苷酸161-163处修饰为ACG(其中位于162位的“T”修饰为“C”)、不完全的M蛋白、接头序列和植物kozak序列。包含位于115位天然的或野生型“A”的表达增强子可被称作CPMVHT+[WT115]。CPMVHT+[WT115]核苷酸序列的非限制性实例显示于SEQIDNO:3中。目的核苷酸可以与CPMVHT+[WT115]的植物kozak序列的3’末端融合(参见图1A和1B)。CPMVHT+[WT115]可被认为是CPMVHT+的变体,因为CPMVHT+在115位包含核苷酸“G”(SEQIDNO:1)。而且,CPMVHT+[511]也可被认为是CPMVHT+的变体,因为CPMVHT+[511]包含不完全M蛋白的核苷酸161-511(参见SEQIDNO:56)。如此,术语“CPMVHT+”是包括诸如CPMVHT+[WT115]和CPMVHT+[511]的变体的通用术语。CPMVHT+表达增强子的非限制性实例呈现于SEQIDNO:1、3和4中,然而,应当理解,可以在不脱离本发明的情况下对CPMVHT+和CPMVHT+[WT115]的填充序列进行变型或修饰,条件是填充片段包含不完全的M蛋白,并且当与目的核苷酸序列融合时,在植物中有活性的kozak序列(例如植物kozak序列)位于目的核苷酸序列的5’末端。SEQIDNO:56中提供了CPMVHT+表达增强子的另一实例(包含M蛋白-天然kozak序列)(CPMVHT+[511])。可以通过插入、截短或缺失来修饰填充序列,以使当与现有技术的增强子CPMVHT(Sainsbury和Lomonossoff,2008,PlantPhysiology;148:1212-1218;WO2009/087391;将它们通过引用并入本文)的最初的(未改变的)不完全的M蛋白序列相比,不完全的M蛋白序列更长、截短或变短。除了不完全的M蛋白之外,本发明的CPMVHT+表达增强子的填充序列还可以包含一个或多个限制性位点(多接头、多克隆位点、一个或多个克隆位点)、一种或多种kozak序列或M蛋白-天然kozak序列、一种或多种接头序列、一个或多个重组位点或者它们的组合。例如(不应被认为是限制性的),填充序列可以依次包含不完全的M蛋白(SEQIDNO:1或2的核苷酸161-509,或者SEQIDNO:56的核苷酸161-511)、与在植物中有活性的kozak序列(例如植物kozak序列)融合的期望长度的多克隆位点。可以利用多种方法将目的核苷酸序列与本发明的CPMVHT+(或者CPMVHT+[WT115]或CPMVHT+[511])增强子序列融合(可操作地连接)。例如(不应被认为是限制性的):1)目的核苷酸序列(例如编码目的蛋白的核酸)可以紧接在由不完全的M蛋白序列组成的填充片段(含有或不含多克隆位点)之后与CPMVHT+表达增强子融合。在此种情况下,目的核苷酸序列与不完全M蛋白序列(或多克隆位点(如果存在的话))的3’末端融合,并且所述目的核苷酸序列在其5’末端包含紧接目的核苷酸序列的ATG起始位点上游的植物kozak序列。2)目的核苷酸序列可以紧接位于填充片段(包含不完全的M蛋白、任选的多克隆位点和植物kozak序列)的3’末端的植物kozak序列之后,与包含填充片段的表达增强子融合。在此种情况下,目的核苷酸序列将不包含相应的多克隆位点或植物kozak序列。3)目的核苷酸序列可以利用多克隆位点与CPMVHT+表达增强子融合。在此种情况下,目的核苷酸序列可以在其5’末端包含相应的克隆位点,以允许紧接目的核苷酸序列的ATG起始位点上游与表达增强子和植物kozak序列融合。利用任何以上方法得到的整体结果是构建体或表达盒,其包含与5’UTR序列可操作地结合(可操作地连接)的植物调控区,所述5’UTR序列与包含同植物kozak序列融合的不完全M蛋白的填充片段的5’末端融合,所述植物kozak序列的3’末端与目的核苷酸序列的5’末端融合。构建体还可以包含含有豇豆花叶病毒组3’非翻译区(UTR),例如质体蓝素3’UTR或在植物中有活性的其它3’UTR的序列,以及终止子序列(例如NOS终止子)的序列,所述终止子序列与目的核苷酸序列的3’末端可操作地连接(参见图1A)。还提供植物表达系统,其包含含有调控区的第一核酸序列,所述第一核酸序列与本文所述的一种或多于一种表达增强子(例如CPMVHT+、CPMVHT+[WT115]、CPMVHT+[511])以及目的核苷酸序列可操作地连接。此外,描述了包含启动子(调控区)序列、含有豇豆花叶病毒组5’UTR和填充序列的表达增强子(例如CPMVHT+、CPMVHT+[WT115]或CPMVHT+[511])的核酸,所述填充序列具有与编码一种或多种目的蛋白的核酸序列融合的植物kozak序列。所述核酸还可以包含含有豇豆花叶病毒组3’非翻译区(UTR),例如质体蓝素3’UTR或在植物中有活性的其它3’UTR的序列以及终止子序列(例如NOS终止子),所述终止子序列与目的核苷酸序列的3’末端可操作地连接(参见图1A),以使目的核苷酸序列插入豇豆花叶病毒组3’非翻译区(UTR)、质体蓝素3’UTR或其它3’UTR序列的上游。“可操作地连接”意为,具体序列直接或者间接相互作用,以实现预期功能,如介导或调控核酸序列的表达。可操作地连接的序列的相互作用可以,例如被与可操作地连接的序列相互作用的蛋白介导。本文所称的“表达增强子”、“增强子序列”或“增强子元件”包括源自SEQIDNO:1的核苷酸1-160的序列,或者与SEQIDNO:1的核苷酸1-160的序列共有约80%至100%或者其间任意量的序列相似性的序列。增强子序列能够增强与之连接的下游异源开放阅读框(ORF)的表达。术语“5’UTR”或“5’非翻译区”或“5’前导序列”指不翻译的mRNA区。5’UTR通常开始于转录开始位点,并结束于紧接编码区的翻译起始位点或起始密码子(在mRNA中通常为AUG,在DNA序列中为ATG)之前。可以通过下述修饰5’UTR:5’UTR的长度,或者使天然存在的起始密码子或翻译起始位点突变,以使所述密码子不再作为起始密码子发挥作用,并且翻译可以在替代的起始位点处起始。例如可以修饰天然CPMV5’UTR的115位、161位、512位、524位或其组合处起始的ATG,以移除ATG序列,例如修饰为ACG、GTG或者CGT或者其它非ATG序列。“不完全的M蛋白”意为包含SEQIDNO:1的核苷酸161-509或者SEQIDNO:56的核苷酸161-511的约10个至约351个核苷酸或者其间任意量的M蛋白编码序列。SEQIDNO:1的核苷酸161-509或者SEQIDNO:56的核苷酸161-511对应于存在于天然CPMVRNA2基因组序列中的M蛋白的序列(参见本文的SEQIDNO:55;也参见WO2009/087391的表1;将它们通过引用并入本文),其中修饰(置换)位于161-163位的一个或多个核苷酸以移除“atg”开始位点。不完全的M蛋白序列的非限制性实例包括这样的核苷酸序列:其与SEQIDNO:1-4的核苷酸161至509、SEQIDNO:55的核苷酸161-511或者SEQIDNO:56的核苷酸161-511所限定的序列具有约80%至100%的序列相似性或者其间任意量的序列相似性。可以修饰序列以移除起始密码子或起始位点,以使所述序列不包含“atg”密码子。此外,不完全的M蛋白的非限制性实例包括SEQIDNO:1-4的核苷酸161至509、SEQIDNO:55的核苷酸161-511或者SEQIDNO:56的核苷酸161-511。如本文所述使用的包含对天然CPMVRNA2序列(SEQIDNO:55)改变的序列的非限制性实例包括CPMVHT+(SEQIDNO:1)和CPMVHT+[511](SEQIDNO:56)。SEQIDNO:55包含核苷酸1-514(天然CMPVRNA-2基因组片段的全长序列存在于WO2009/087391的表1中;将其通过引用并入本文)的CPMVRNA2基因组的天然(野生型)序列的片段。来自SEQIDNO:55的核苷酸1-511的5’UTR序列包含在115位和161位起始的(斜体加粗)野生型“atg”序列以及核苷酸161-511的加下划线的不完全的M蛋白(为了上下文也显示了位于512位的“atg”;在CPMVRNA-2的天然5’区的512位“atg”处的起始导致95K多蛋白的合成):1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcagc121gatcttcaacgttgtcagatcgtgcttcggcaccagtacattttctttcactgaagc181gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc241ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc301atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt361gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa421atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt481taagcttctgtatattctgcccaaatttgaaatg…SEQIDNO:55CPMVRNA-2序列的核苷酸1-160的5’UTR(参见SEQIDNO:1),起始于转录开始位点,止于框内第一起始密码子(位于161位),其作为用于产生由野生型豇豆花叶病毒组基因组片段编码的两种共羧基端蛋白中较长的蛋白的起始位点(两种编码蛋白中较短的蛋白起始于155位)。此外,也可以突变、缺失或者以其它方式修饰位于(或者对应于)CPMVRNA-2基因组序列115位处的‘第三’起始位点。已经显示,当与不完全的M蛋白组合时,除了移除位于161位的AUG之外,移除AUG115增强了目的核苷酸序列的表达(Sainsbury和Lomonossoff,2008,PlantPhysiology;148:1212-1218;WO2009/087391;将它们通过引用并入本文)。表达增强子可以包含SEQIDNO:1、3或4的核苷酸1-509或者SEQIDNO:55的核苷酸1-511或者SEQIDNO:56的核苷酸1-511,并包含与填充片段融合的CPMV5’非翻译区(UTR),所述填充片段包含不完全的M蛋白和位于填充片段3’末端的植物kozak序列以及任选地多克隆位点;或者表达增强子可以包含与SEQIDNO:1的核苷酸1-160、SEQIDNO:1的核苷酸161-509、SEQIDNO:1的核苷酸1-509、SEQIDNO:55的核苷酸1-511或SEQIDNO:56的核苷酸1-511有80%至100%序列相似性或者其间任意量的序列相似性的序列,并包含含有不完全M蛋白的填充片段,并且在填充片段的3’末端还包含在植物中有活性的kozak序列(植物kozak序列或M蛋白-天然kozak序列)以及任选地多克隆位点,并且当与同现有技术的“CPMVHT”增强子序列(SEQIDNO:2;SainsburyF.,和LomonossoffG.P.,2008,PlantPhysiol.148:pp.1212-1218;将其通过引用并入本文)可操作地连接的编码异源开放阅读框的核苷酸序列的表达相比时,显示出增强与所述表达增强子可操作地连接的编码异源开放阅读框的同样的核苷酸序列表达的特性。填充序列可以包含不完全M蛋白的约50个至351个核苷酸,或者其间任何量的核苷酸,例如但不限于SEQIDNO:1的核苷酸161-509或SEQIDNO:55或56的核苷酸161-511、位于填充片段的3’末端的植物kozak序列或者M蛋白-天然kozak序列,以及位于编码不完全的M蛋白的序列与kozak序列(例如植物kozak序列)之间的长度为约0至100个核苷酸或者其间任意量的核苷酸的多克隆位点(MCS)。因此,填充序列的长度可以为与CPMV5’UTR序列的3’末端融合的约50个至约500个核苷酸或者其间任何量,例如填充序列的长度可以为与CPMV5’UTR序列的3’末端融合的50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、420、440、460、480、500个核苷酸,或者其间任何量。表达增强子还可以包含一个或多个“限制性位点”或“限制性识别位点”、“多克隆位点”、“MCS”、“克隆位点”、“多接头序列”或“多接头”,以便于目的核苷酸插入植物表达系统。本领域众所周知,限制性位点是被限制酶识别的特异性序列基序。表达增强子可以包含位于不完全的M蛋白的下游(3’)的一个或多个限制性位点或克隆位点。所述一个或多个限制性位点或克隆位点可以位于的上游一种或多种kozak序列的上游(5’),并位于不完全的M蛋白和kozak序列之间。多接头序列(多克隆位点)可以包含可用于向5’UTR的3’末端添加和移除核酸序列(包括编码目的蛋白的核苷酸序列)的任何核酸序列。多接头序列可以包含4至约100个核酸或者其间任何量的核酸。由SEQIDNO:1、3、4或者56的序列所限定的CPMVHT+表达增强子(包括CPMVHT+[WT115];CPMVHT+[511])是本发明的表达增强子的实例,其不应被认为是限制性的。本发明还包括这样的表达盒或载体,其包含如SEQIDNO:1、3、4或56所限定的CPMVHT+、CPMVHT+[WT115]或CPMVHT+[511],并且还包含与表达增强子序列可操作地结合的植物调控区以及与表达增强子的3’末端融合的目的核苷酸序列(GOI;具有3’UTR和终止子序列)。本发明还包括如SEQDINO:1、3、4或56所限定的CPMVHT+表达增强子的变体。如果增强子序列包含CPMV5’UTR序列、不完全的M蛋白以及位于所述增强子3’末端的在植物中有活性的kozak序列(例如植物kozak序列),则所述增强子序列可被称为“CPMVHT+增强子序列”,条件是当与同现有技术的“CPMVHT”增强子序列(SEQIDNO:2;SainsburyF.和LomonossoffG.P.,2008,PlantPhysiol.148:pp.1212-1218;将其通过引用并入本文)可操作地连接的编码异源开放阅读框的核苷酸序列的表达相比时,所述CPMVHT+增强子序列显示出增强同所述表达增强子可操作地连接的编码异源开放阅读框的同样的核苷酸序列的表达的特性。可以存在于CPMVHT+中的变化可以包括:1)不完全的M蛋白的长度从约50至约351个核苷酸或者其间任何量的改变;2)多克隆位点(MCS)的修饰,既包括包含的序列的修饰,又包括MCS的长度从约0至约100个核苷酸或者其间任何长度的改变;以及3)kozak序列可以是在植物中有活性的任何kozak序列,并且包括植物kozak序列或M蛋白-天然kozak序列。例如,CPMV5’UTR包含SEQIDNO:1或3的核苷酸1至160或者与SEQIDNO:1或3的核苷酸1-160具有约80%至约100%或者其间任何量的序列相似性的序列。SEQIDNO:1是包含CPMVHT+的表达增强子的实例(核苷酸1-160,5’UTR,包含位于115位的修饰的ATG(GTG)(小写粗体且斜体);包含以下的填充片段:不完全的M蛋白(加下划线),核苷酸161-509,162位处具有修饰的核苷酸(ACG);多克隆位点(斜体),核苷酸510-528;以及植物kozak序列(大写并加粗),核苷酸529-534):1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcagc121gatcttcaacgttgtcagatcgtgcttcggcaccagtacattttctttcactgaagc181gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc241ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc301atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt361gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa421atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt481taagcttctgtatattctgcccaaatttgttcgggcccaataccgcgg(SEQIDNO:1)构建体1819、1805、2319、2142、2146、1829、1875、2052、2062、1839和1860(分别参见实施例1和4-13)是包含含有SEQIDNO:1的CPMVHT+表达增强子的代表性构建体。使用这些构建体的结果可见于图2和3。SEQIDNO:2包含如现有技术中已知的“CPMVHT”表达增强子(例如Sainsbury和Lomonossoff2008,PlantPhysiol.148:pp.1212-1218的图1;将其通过引用并入本文)。CPMVHT包含115位处具有修饰的核苷酸(cgt)的来自SEQIDNO:2的核苷酸1-160的5’UTR序列以及含有162位处具有修饰的核苷酸(acg)的不完全的M蛋白,并且缺乏植物kozak序列(5’UTR:核苷酸1-160;不完全的M蛋白(加下划线),核苷酸161-509)。SEQIDNO:2还包含Sainsbury和Lomonossoff2008中所述的现有技术的CPMVHT序列中不存在的多克隆位点(斜体,核苷酸510-517):1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc121gatcttcaacgttgtcagatcgtgcttcggcaccagtacattttctttcactgaagc181gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc241ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc301atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt361gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa421atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt481taagcttctgtatattctgcccaaatttgtcgggcccSEQIDNO:2包含CPMVHT的构建体在本文被用作参照构建体,以便可以将目的核苷酸序列的表达水平或者利用CPMVHT+、CPMVHT+[WT115]或CPMVHT+[511]的构建体产生的由所述目的核苷酸序列编码的产物进行比较。构建体1391、484、409、2140、2130、1039、1067、2072、2074、1445和1454(分别参见实施例1和4-13)是参照构建体CPMVHT的代表,并且包含SEQIDNO:2。利用这些构建体的结果可见图2和3。如本文所述的CPMVHT+的植物kozak序列可以是任何植物kozak序列,包括但不限于SEQIDNO:5-17的序列之一(也参见图4,具有植物kozak的CPMVHT+;图4的构建体包含SEQIDNO:1的核苷酸1-528、植物kozak序列的几种实例之一,并包含植物调控区和目的核苷酸序列:GOI的转录起始位点ATG)。表达增强子还可以包含一种或多种“kozak共有序列”或“kozak序列”。kozak序列可以包括在植物中有活性的任何kozak序列,例如,植物kozak序列(例如CPMVHT+;CPMVHTWT115)或存在于天然M蛋白中的kozak序列(例如CPMVHT+511)。Kozak序列在翻译起始中发挥主要作用。可以通过确保以下来优化翻译速率:从转基因构建体除去任何mRNA不稳定的序列,以及根据需要使翻译开始位点或起始位点匹配植物的kozak共有序列(Gutierrrez,R.A.等,1999,TrendsPlantSci.4,429–438;Kawaguchi,R.和Bailey-Serres,J.,2002,Curr.Opin.PlantBiol.5,460–465)。该基序中最高度保守的位点是ATG密码子上游的嘌呤(其最通常为A)三核苷酸,其指示翻译的起始(Kozak,M.,1987,J.Mol.Biol.20:947-950,通过引用并入本文)。kozak序列可以包含存在于不完全的M蛋白中的天然序列。例如,如SEQIDNO:55或56所示的紧接不完全的M蛋白的核苷酸512上游的序列,例如SEQIDNO:55的核苷酸508-511。植物kozak共有序列在本领域是已知的(参见例如Rangan等,Mol.Biotechnol.,2008,July39(3),pp.207-213)。天然存在的和合成的Kozak序列均可用于表达增强子或者均可与如本文所述的目的核苷酸序列融合。植物kozak序列可以是任何已知的植物kozak序列(参见例如L.Rangan等,Mol.Biotechnol.2008),包括但不限于下述植物共有序列:caA(A/C)a(SEQIDNO:5;植物界)aaA(A/C)a(SEQIDNO:6;双子叶植物)aa(A/G)(A/C)a(SEQIDNO:7;拟南芥)植物kozak序列还可以选自(参见图4):(A/-)A(A/G)(A/G)(A/C)A.(SEQIDNO:17;共有序列)SEQIDNO:4中提供了具有植物kozak共有序列的CPMVHT+(核苷酸1-160,5’UTR,包含115位修饰的ATG(GTG)(小写加粗并斜体);包含以下的填充片段:不完全的M蛋白(加下划线)、162位处具有修饰的核苷酸(ACG)的核苷酸161-509;多克隆位点(斜体),核苷酸510-528;以及共有植物kozak序列(大写并加粗),核苷酸529-534)。1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcagc121gatcttcaacgttgtcagatcgtgcttcggcaccagtacattttctttcactgaagc181gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc241ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc301atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt361gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa421atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt481taagcttctgtatattctgcccaaatttgttcgggcccaataccgcgg(SEQIDNO:4)SEQIDNO:56(“CPMVHT+[511]”)包含核苷酸1-154的CPMVRNA2基因组的天然序列的一段。来自SEQIDNO:56的核苷酸1-511的5’UTR序列包含115位修饰的“atg”序列(“g”代替“a”;斜体加粗)和162位修饰的“atg”序列(“c”代替“t”;斜体加粗)以及核苷酸161-511的不完全的M蛋白(加下划线)。CPMVHT+[511]包含天然的M蛋白kozak共有序列(核苷酸508-511;加粗):1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcagc121gatcttcaacgttgtcagatcgtgcttcggcaccagtacattttctttcactgaagc181gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc241ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc301atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt361gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa421atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt481taagcttctgtatattctgcccaaattSEQIDNO:56构建体1952-1959是包含具有不同的植物kozak序列的SEQIDNO:1的CPMVHT+表达增强子的实例(参见实施例3,以及图4和7)。通过SEQIDNO:3的序列(CPMVHT+[WT115])提供CPMVHT+增强子序列的另一非限制性实例。包含CPMVHT+和与SEQIDNO:3的表达增强子序列可操作结合的植物调控区以及在3’末端与目的核苷酸序列(GOI)融合的转录开始位点(ATG)的表达盒或载体也是本发明的一部分。SEQIDNO:3(CPMVHT+[WT115])包含:核苷酸1-160,5’UTR,115-117位处具有ATG(小写加粗);包含以下的填充片段:不完全的M蛋白(加下划线)、161-163位具有修饰的ATG(acg)(小写加粗并加下划线)的核苷酸161-509的填充片段;多克隆位点(斜体),核苷酸510-528;以及植物kozak序列(大写并加粗),核苷酸529-534。1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcagc121gatcttcaacgttgtcagatcgtgcttcggcaccagtacattttctttcactgaagc181gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc241ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc301atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt361gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa421atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt481taagcttctgtatattctgcccaaatttgttcgggcccaataccgcgg(SEQIDNO:3)SEQIDNO:3的植物kozak序列可以是任何植物kozak序列,包括但不限于SEQIDNO:5-17的序列之一(也参见图4,具有植物kozak的CPMVHT+;图4的构建体包含SEQIDNO:1的核苷酸1-528、植物kozak序列的几种实例之一,并包含植物调控区和目的核苷酸序列:GOI的转录起始位点ATG)。CPMVHT+表达增强子可以与SEQIDNO:1、3或4的核苷酸1-160、SEQIDNO:1、3或4的核苷酸161-509或者SEQIDNO:1、3或4的核苷酸1-509所限定的序列具有至少100%、99%、98%、97%、96%、95%、90%、85%和80%的同一性。例如增强子序列可以与SEQIDNO:1、3或4的核苷酸1-160、SEQIDNO:1、3或4的核苷酸161-509或者SEQIDNO:1、3或4的核苷酸1-509所限定的序列具有约80%至约100%或者其间任何量的同一性,或者与SEQIDNO:1、3或4的核苷酸1-160、SEQIDNO:1、3或4的核苷酸161-509或者SEQIDNO:1、3或4的核苷酸1-509所限定的序列具有约90%至约100%或者其间任何量的同一性,或者与SEQIDNO:1、3或4的核苷酸1-160、SEQIDNO:1、3或4的核苷酸161-509或者SEQIDNO:1、3或4的核苷酸1-509所限定的序列具有约95%至约100%或者其间任何量的同一性,其中当与如本文所述的植物调控区和植物kozak序列可操作地连接时,与利用同样的植物调控区与CPMVHT(SEQIDNO:2)融合的目的核苷酸序列的表达水平相比,所述表达增强子增加了与表达增强子可操作地连接的目的核苷酸序列的表达水平。当提及具体序列时,例如如威斯康星大学GCG软件程序所述的或者通过人工比对和目测,使用术语“相似性百分比”或“同一性百分比”(参见,例如CurrentProtocolsinMolecularBiology,Ausubel等,eds.1995supplement)。用于将序列对齐进行比较的方法在本领域众所周知。可以如下所述进行比较序列的最佳对齐:利用例如Smith&Waterman的算法(1981,Adv.Appl.Math.2:482),通过Needleman&Wunsch的比对算法(1970,J.Mol.Biol.48:443),通过Pearson&Lipman的搜索相似性的方法(1988,Proc.Nat'l.Acad.Sci.USA85:2444),通过这些算法的计算机化实施(例如:维斯康星遗传学软件包GeneticsComputerGroup(GCG)中的GAP、BESTFIT、FASTA和TFASTA,575ScienceDr.,Madison,Wis.)。适合于确定序列序列同一性和序列相似性百分比的算法的实例为BLAST和BLAST2.0算法,其分别描述于Altschul等人(1977,Nuc.AcidsRes.25:3389-3402)和Altschul等人(1990,J.Mol.Biol.215:403-410)中。使用BLAST和BLAST2.0,用本文所述的参数,确定本发明的核酸和蛋白的序列同一性百分比。例如BLASTN程序(对于核苷酸序列)可以使用字长(W)11、期望值(E)10、M=5、N=-4以及双链比对作为缺省值。对于氨基酸序列,BLASTP程序可以将下述用作缺省值:字长3和期望值(E)10,以及BLOSUM62得分矩阵(参见Henikoff&Henikoff,1989,Proc.Natl.Acad.Sci.USA89:10915)对齐(B)50、期望值(E)10、M=5、N=-4以及双链比对。实施BLAST分析的软件可以通过美国国家生物技术信息中心(参见URL:ncbi.nlm.nih.gov/)公开获得。如图2-4所示,与使用同样的启动子、3’UTR和终止子序列且与现有技术表达增强子可操作地连接的目的核苷酸序列的表达相比,使用如本文所述的表达增强子通常导致同样的目的核苷酸序列的表达增加。例如,参考图2和图3,显示了在植物中产生的蛋白的表达的比较,所述植物包含可操作地连接下述的CPMV-HT(现有技术)表达构建体和基于CPMVHT+的表达构建体:H1A/California/07/2009(“PDI-H1Cal”或“H1A/California/07/2009”):基于CPMVHT+的构建体编号1805,基于CPMVHT的构建体编号484(参见实施例4);H3A/Victoria/361/2011(“PDI-H3Vic”或“H3A/Victoria/361/2011”):基于CPMVHT+的构建体编号1819;基于CPMVHT的构建体编号1391(分别参见实施例1和2);具有缺失的蛋白水解环且具有天然信号肽的B/Wisconsin/1/2010(“WtSp-BWis-PrL”或“B/Wisconsin/1/2010”):基于CPMVHT+的构建体编号1839;基于CPMVHT的构建体编号1445(参见实施例12);具有缺失的蛋白水解环且具有PDI信号肽的BBrisbane/60/08(“BBrisbane/60/08”):基于CPMVHT+的构建体编号1829;基于CPMVHT的构建体编号1039(参见实施例8);具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有PDI信号肽的BBrisbane/60/08+H1Tm(“BBrisbane/60/08+H1Tm”):基于CPMVHT+的构建体编号1875;基于CPMVHT的构建体1067(参见实施例9),具有缺失的蛋白水解环且具有PDI信号肽的BMassachusetts/2/20122012(“BMassachusetts/2/20122012”):基于CPMVHT+的构建体编号2052;基于CPMVHT的构建体编号2072(参见实施例10),具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有PDI信号肽的BMassachusetts/2/2012+H1Tm(“BMassachusetts/2/2012+H1Tm”):基于CPMVHT+的构建体编号2062;基于CPMVHT的构建体2074(参见实施例11),具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有天然信号肽的BWisconsin/1/2010+H1Tm(“BWisconsin/1/2010+H1Tm”):基于CPMVHT+的构建体编号1860;基于CPMVHT的构建体1454(参见实施例13);具有PDI信号肽的来自流感病毒A/Indonesia/5/2005的H5(PDIH5Indo):基于CPMVHT+的构建体编号2319;基于CPMVHT的构建体编号409(参见实施例5);来自流感病毒A/Hangzhou/1/2013的H7,其中天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代(H7Han):基于CPMVHT+的构建体编号2142;基于CPMVHT的构建体编号2140(参见实施例6);来自流感病毒A/Hangzhou/1/2013的H7,其与来自流感病毒A/Indonesia/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合,并具有苜蓿蛋白质二硫键异构酶的信号肽(H7Han+H5Tm):基于CPMVHT+的构建体编号2146;基于CPMVHT的构建体编号2130(参见实施例7)。大体上,当与基于现有技术CPMVHT的构建体中的表达相比时,在基于CPMVHT+的构建体中表达增加(测定为血凝活性)。此外,一些目的核苷酸序列编码嵌合的或修饰的蛋白,例如其包含异源信号肽(例如PDI)、异源跨膜结构域胞质尾区序列(TDCT)和/或含有缺失的蛋白水解环(PrL-)的修饰序列,并且仍观察到活性的增加。如果用于以上基于CPMVHT+的构建体的植物kozak序列被其它植物kozak序列(例如SEQIDNO:8-16中所限定的那些植物kozak序列之一)替代,仍可观察到使用基于CPMVHT+的构建体所观察到的表达的增加。例如,参考图4,显示了在植物中产生的蛋白的表达的比较,所述植物包含基于CPMVHT+的表达构建体,所述构建体可操作地连接各自与不同的植物kozak序列融合的目的核苷酸序列(H3A/Victoria/361)。在不同的情况下,基于CPMVHT+的构建体的表达(测定为血凝滴度)表明显著的表达水平,并且高于基于现有技术的CPMVHT的构建体。编码蛋白的目的核苷酸序列需要位于待表达的基因上游的“翻译起始位点”或“起始位点”或者“翻译开始位点”或“开始位点”或者“起始密码子”的存在。可以将此类起始位点提供为增强子序列的一部分或者作为编码目的蛋白的核苷酸序列的一部分。“表达盒”指包含目的核酸的核苷酸序列,所述目的核酸在合适的启动子或用于在宿主细胞中转录目的核酸的其它调控元件的控制下,或者与合适的启动子或用于在宿主细胞中转录目的核酸的其它调控元件可操作地(或者有效地)连接。“蛋白水解环”或“切割位点”意为参与前体HA0切割的蛋白水解位点的共有序列。本文使用的“共有的”或“共有序列(consensussequence)”意为基于多序列(例如特定流感病毒HA0序列的亚型)比对的分析,包含相关序列的序列变异性的序列(氨基酸序列或者核苷酸序列)。流感病毒HA0切割位点的共有序列可以包含流感病毒A共有的血凝素氨基酸序列,包括例如共有的H1、共有的H3、共有的H5,或者流感病毒B共有的血凝素氨基酸序列,例如但不限于BFlorida、BMalaysia、BWisconsin以及BMassachusetts。蛋白水解环区的序列的非限制性实例显示于美国临时申请第61/806,227号的图15和18B中(提交于2013年3月28日,将其通过引用并入本文;也参见Bianchi等,2005,JournalofVirology,79:7380-7388;通过引用并入本文)。蛋白水解环或切割位点中的残基可以是突变的,例如但不限于点突变、置换、插入或缺失。本文使用的术语“氨基酸突变”或“氨基酸修饰”意图涵盖氨基酸置换、缺失、插入和修饰。可以如美国临时申请第61/806,227号(提交于2013年3月28日,将其通过引用并入本文)所述对置换、缺失、插入和修饰进行任何组合,以得到最终的构建体,条件是最终的构建体具有期望的特征,例如蛋白水解环或切割位点减少或消除的蛋白酶切割。如本文所述,提供核酸构建体(表达系统),其包含与编码目的蛋白的目的核苷酸序列可操作地连接的表达增强子序列。还提供包含如本文所述的增强子序列的植物表达系统。还提供包含植物调控区的植物表达系统,所述调控区与增强子序列可操作结合,所述增强子序列与目的核苷酸序列可操作地连接,所述目的核苷酸序列编码目的蛋白。所述增强子序列可以选自SEQIDNO:1或3,或者与SEQIDNO:1、3或4的核苷酸1-160、SEQIDNO:1、3或4的核苷酸161-509、或者SEQIDNO:1、3或4的核苷酸1-509呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列,其中当如本文所述与植物调控区和植物kozak序列可操作地连接时,与利用相同植物调控区的与CPMVHT(SEQIDNO:2;如SainsburyF.和LomonossoffG.P.,2008,PlantPhysiol.148:pp.1212-1218中所述包含不完全的M蛋白的现有技术的增强子序列;将其通过引用并入本文)融合的目的核苷酸序列的表达水平相比,所述表达增强子增加了与所述表达增强子可操作地连接的目的核苷酸序列的表达水平。可将本发明的增强子序列用于在宿主有机体(例如植物)中表达目的蛋白。在此种情况下,目的蛋白也可以与所讨论的宿主有机体异源,并且利用本领域已知的转化技术将其引入植物细胞。有机体中的异源基因可以替代内源的等同基因,即通常发挥相同或相似功能的基因,或者插入序列可以是所述内源基因或其它序列的外加序列。本发明还提供表达盒,其依次包含与如本文所述的表达增强子序列可操作地连接的启动子或植物调控区,所述表达增强子序列与目的核苷酸序列和3’UTR序列以及终止子序列融合。可将增强子序列限定为例如但不限于下述的任何一项:SEQIDNO:1、3和4,或者与SEQIDNO:1、3或4的核苷酸1-160、SEQIDNO:1、3或4的核苷酸161-509或者SEQIDNO:1、3或4的核苷酸1-509呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列。表达增强子或目的核苷酸序列可以包含植物kozak序列。本领域技术人员将会理解,终止(终止子)序列可以是在植物宿主中有活性的任何序列,例如终止序列可以来源于二重RNA病毒(例如豇豆花叶病毒组)的RNA-2基因组片段,或者终止序列可以是NOS终止子。本发明的构建体还可以包含3’非翻译区(UTR)。3’非翻译区含有多腺苷酸化信号和能够影响mRNA加工或基因表达的任何其它调控信号。多腺苷酸化信号通常以实现向mRNA前体的3’末端添加多聚腺苷酸轨迹为特征。多腺苷酸化信号通常由经典形式的5’AATAAA-3’同源物的存在所识别,尽管变化并不罕见。合适的3’区的非限制性实例是包含下述基因的多腺苷酸化信号的3’转录的非翻译区:农杆菌(Agrobacterium)肿瘤诱导(Ti)质粒基因如胭脂碱合成酶(Nos基因),以及植物基因如大豆储藏蛋白基因、核酮酶-1,5-二磷酸羧化酶基因的小亚基(ssRUBISCO;US4,962,028;将其通过引用并入本文)、用于调节质体蓝素的表达的启动子(Pwee和Gray1993;将其通过引用并入本文)。终止(终止子)序列可由苜蓿质体蓝素基因的3’UTR获得。“目的核苷酸(或核酸)序列”或者“目的编码区”意为待在宿主有机体(例如植物)内表达以产生目的蛋白的任何核苷酸序列或编码区(这些术语可互换使用)。此类目的核苷酸序列可以编码但不限于天然的或修饰的蛋白、工业酶或修饰的工业酶、农业蛋白(agriculturalprotein)或修饰的农业蛋白、辅助蛋白、蛋白补充物、药学活性蛋白、营养物、附加值产品或者用于饲料、食物或者饲料和食物用途的它们的片段。目的蛋白可以包含天然的或非天然的信号肽;所述非天然的信号肽可以是植物源的或者可从动物或细菌多肽获得。天然的信号肽可能对应于待表达的目的蛋白的信号肽,此外,所述信号肽可以来源于除流感病毒之外的病毒的结构蛋白或血凝素。可以使用的信号肽的非限制性实例为苜蓿蛋白质二硫键异构酶的信号肽(PDISP;登录号Z11499的核苷酸32-103)或者马铃薯贮藏蛋白信号肽(PatASP;位于GenBank登录号A08215的核苷酸1738-1806)。该登录号的PatASP的核苷酸序列为:ATGGCAACTACTAAAACTTTTTTAATTTTATTTTTTATGATATTAGCAACTACTAGTTCAACATGTGCT(SEQIDNO:57);马铃薯贮藏蛋白A信号肽的氨基酸序列为:MATTKTFLILFFMILATTSSTCA(SEQIDNO:58)目的核苷酸序列或目的编码区还可以包含编码药学活性蛋白的核苷酸序列,例如生长因子、生长调节素、抗体、抗原以及可用于免疫或疫苗接种等的它们的片段或它们的衍生物。此类蛋白包括但不限于:是人类病原体、病毒蛋白的蛋白,例如但不限于来自呼吸道合胞体病毒(RSV)、轮状病毒、流感病毒、人类免疫缺陷病毒(HIV)、狂犬病毒、人乳头瘤病毒(HPV)、肠病毒71(EV71)中的一种或多种蛋白;或者白介素,例如IL-1至IL-24、IL-26和IL-27中的一种或多种;细胞因子,红细胞生成素(EPO)、胰岛素、G-CSF、GM-CSF、hPG-CSF、M-CSF或其组合;干扰素,例如干扰素-α、干扰素-β、干扰素-γ;凝血因子,例如因子VIII、因子IX;或者tPAhGH;受体;受体激动剂;抗体例如但不限于利妥昔单抗;神经多肽;胰岛素;疫苗;生长因子例如但不限于表皮生长因子、角质细胞生长因子、转化生长因子;生长调节素;抗原;自身抗原;或者它们的片段或者它们的组合。目的蛋白还可以包含流感病毒血凝素(HA;参见WO2009/009876,将其通过引用并入本文)。HA是同源三聚体膜I型糖蛋白,通常包含信号肽、HA1结构域和在C端含有跨膜锚定位点的HA2结构域以及小胞质尾区。编码HA的核苷酸序列众所周知并且是可获得的(参见,例如URL:biohealthbase.org/GSearch/home.do?decorator=Influenza的BioDefenseandPublicHealthDatabase(InfluenzaResearchDatabase;Squires等,2008NucleicAcidsResearch36:D497-D503);或者由美国国家生物技术信息中心维护的数据库(参见URL:ncbi.nlm.nih.gov),将它们通过引用并入本文)。HA蛋白可以是A型流感病毒、B型流感病毒的HA蛋白,或者是选自以下的的A型流感病毒HA的亚型:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15和H16。在本发明的一些方面,HA可以来自A型流感病毒,其选自H1、H2、H3、H5、H6、H7和H9。以上列出的HA的片段也可被认为是目的蛋白。此外,可以将来自以上列出的HA类型或亚型的结构域组合以产生嵌合的HA(参见例如WO2009/076778,将其通过引用并入本文)。包含HA蛋白的亚型的实例包括:A/NewCaledonia/20/99(H1N1)、A/Indonesia/5/2006(H5N1)、A/chicken/NewYork/1995、A/herringgull/DE/677/88(H2N8)、A/Texas/32/2003、A/mallard/MN/33/00、A/duck/Shanghai/1/2000、A/northernpintail/TX/828189/02、A/Turkey/Ontario/6118/68(H8N4)、A/shoveler/Iran/G54/03、A/chicken/Germany/N/1949(H10N7)、A/duck/England/56(H11N6)、A/duck/Alberta/60/76(H12N5)、A/Gull/Maryland/704/77(H13N6)、A/Mallard/Gurjev/263/82、A/duck/Australia/341/83(H15N8)、A/black-headedgull/Sweden/5/99(H16N3)、B/Lee/40、C/Johannesburg/66、A/PuertoRico/8/34(H1N1)、A/Brisbane/59/2007(H1N1)、A/SolomonIslands3/2006(H1N1)、A/Brisbane10/2007(H3N2)、A/Wisconsin/67/2005(H3N2)、B/Malaysia/2506/2004、B/Florida/4/2006、A/Singapore/1/57(H2N2)、A/Anhui/1/2005(H5N1)、A/Vietnam/1194/2004(H5N1)、A/Teal/HongKong/W312/97(H6N1)、A/Equine/Prague/56(H7N7)、A/HongKong/1073/99(H9N2))。HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。例如,H1蛋白可以来自A/NewCaledonia/20/99(H1N1)、A/PuertoRico/8/34(H1N1)、A/Brisbane/59/2007(H1N1)、A/SolomonIslands3/2006(H1N1)、A/California/04/2009(H1N1)或A/California/07/2009(H1N1)株。H3蛋白也可以来自A/Brisbane10/2007(H3N2)、A/Wisconsin/67/2005(H3N2)、A/Victoria/361/2011(H3N2)、A/Texas/50/2012(H3N2)、A/Hawaii/22/2012(H3N2)、A/NewYork/39/2012(H3N2)或A/Perth/16/2009(H3N2)株。在本发明的另一方面,H2蛋白可以来自A/Singapore/1/57(H2N2)株。H5蛋白可以来自A/Anhui/1/2005(H5N1)、A/Vietnam/1194/2004(H5N1)或者A/Indonesia/5/2005株。在本发明的一个方面,H6蛋白可以来自A/Teal/HongKong/W312/97(H6N1)株。H7蛋白可以来自A/Equine/Prague/56(H7N7)株,或者H7A/Hangzhou/1/2013、A/Anhui/1/2013(H7N9)或者A/Shanghai/2/2013(H7N9)株。在本发明的一个方面,H9蛋白来自A/HongKong/1073/99(H9N2)株。在本发明的另一方面,HA蛋白可以来自可能是B型病毒的流感病毒,包括B/Malaysia/2506/2004、B/Florida/4/2006、B/Brisbane/60/08、B/Massachusetts/2/2012样病毒(Yamagata谱系)或者B/Wisconsin/1/2010(Yamagata谱系)。来自H1、H2、H3、H5、H6、H7、H9或者B亚型的HA蛋白的氨基酸序列的非限制性实例包括如WO2009/009876、WO2009/076778、WO2010/003225(将它们通过引用并入本文)中所述的序列。流感病毒HA蛋白可以是H5Indonesia。HA也可以是嵌合HA,其中HA的天然跨膜结构域被异源跨膜结构域替代。HA蛋白的跨膜结构域高度保守(参见,例如WO2010/148511的图1C;将其通过引用并入本文)。异源跨膜结构域可以获自任何HA跨膜结构域,例如但不限于来自下述的跨膜结构域:H1California、B/Florida/4/2006(GenBank登录号ACA33493.1)、B/Malaysia/2506/2004(GenBank登录号ABU99194.1)、H1/Bri(GenBank登录号ADE28750.1)、H1A/SolomonIslands/3/2006(GenBank登录号ABU99109.1)、H1/NC(GenBank登录号AAP34324.1)、H2A/Singapore/1/1957(GenBank登录号AAA64366.1)、H3A/Brisbane/10/2007(GenBank登录号ACI26318.1)、H3A/Wisconsin/67/2005(GenBank登录号ABO37599.1)、H5A/Anhui/1/2005(GenBank登录号ABD28180.1)、H5A/Vietnam/1194/2004(GenBank登录号ACR48874.1)、H5-Indo(GenBank登录号ABW06108.1)。也可以通过以下共有氨基酸序列来限定跨膜结构域:iLXiYystvAiSslXlXXmlagXsXwmcs(SEQIDNO:59)包含具有异源跨膜结构域的嵌合HA的构建体的实例包括:构建体编号1875(BBrisbane/60/08+H1TM,其中跨膜结构域和胞质尾区被H1A/California/07/2009替代;参见实施例9)、构建体编号2074(BMassachusetts/2/2012+H1Tm,其中跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代;参见实施例11)和构建体编号1860(BWisconsin/1/2010+H1Tm,其中跨膜结构域和胞质尾区被H1A/California/07/2009的跨膜结构域和胞质尾区替代;参见实施例13)。这些嵌合HA的活性显示于图2中。本文限定的表达增强子也可用于驱使编码一种或多种目的蛋白的任何目的核苷酸序列的表达。蛋白的实例包括,例如但不限于工业酶,例如,纤维素酶、木聚糖酶、蛋白酶、过氧化物酶、枯草杆菌蛋白酶;蛋白补充物,营养物,附加值产品或者用于饲料、食物或者饲料和食物用途的它们的片段;药学活性蛋白,例如但不限于生长因子,生长调节素,抗体,抗原以及用于免疫或疫苗接种等的它们的片段或它们的衍生物。其它目的蛋白可以包括但不限于:白介素,例如IL-1至IL-24、IL-26和IL-27中的一种或多种;细胞因子,红细胞生成素(EPO)、胰岛素、G-CSF、GM-CSF、hPG-CSF、M-CSF或其组合;干扰素,例如干扰素-α、干扰素-β、干扰素-γ;凝血因子,例如因子VIII、因子IX;或者tPAhGH;受体;受体激动剂;抗体;神经多肽;胰岛素;疫苗;生长因子,例如但不限于表皮生长因子、角质细胞生长因子、转化生长因子;生长调节素;抗原;自身抗原或其片段;抗体,单克隆抗体、嵌合单克隆抗体、单链单克隆抗体、病毒样颗粒(VLP);或者它们的组合。如果目的蛋白是VLP,则VLP可以包含HA0前体形式,或者通过二硫桥保持在一起的HA1或HA2结构域形式。VLP可以具有约20nm至1μm或者其间任何量的平均大小,例如60、65、70、75、80、85、90、95、100、105、110、120、130、140、150160、170、180、190或200nm,或者其间任何量,例如100nm,并且其可以包含脂膜。VLP可以是有包膜的或者无包膜的,例如病毒包膜蛋白、病毒结构蛋白、病毒衣壳蛋白或者病毒外壳蛋白。VLP还可以包含一种或多种脂质、磷脂、核酸、膜等。HA可以包含天然的或非天然的信号肽;所述非天然的信号肽可以是植物源的。例如,信号肽可以是蛋白质二硫键异构酶信号肽(PDI)。天然的信号肽可以对应于表达的血凝素的信号肽,或者可以对应于第二血凝素。本发明还提供包含编码HA蛋白的序列的核酸分子。核酸分子还可以包含与编码HA蛋白的序列可操作地连接的一个或多个调控区。核酸分子可以包含编码H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16或者来自B型流感病毒的HA的序列。例如,由所述核酸分子编码的HA蛋白可以是H1、H2、H3、H5、H6、H7、H9亚型、来自B型的HA。由所述核酸编码的H1蛋白可以来自A/NewCaledonia/20/99(H1N1)、A/PuertoRico/8/34(H1N1)、A/Brisbane/59/2007(H1N1)、A/SolomonIslands3/2006(H1N1)、A/California/04/2009(H1N1)或者A/California/07/2009(H1N1)株。由所述核酸分子编码的H3蛋白可以来自A/Brisbane10/2007(H3N2)、A/Wisconsin/67/2005(H3N2)、A/Victoria/361/2011(H3N2)、A/Texas/50/2012(H3N2)、A/Hawaii/22/2012(H3N2)、A/NewYork/39/2012(H3N2)或者A/Perth/16/2009(H3N2)株。由所述核酸分子编码的H2蛋白可以来自A/Singapore/1/57(H2N2)株。由所述核酸分子编码的H5蛋白来自A/Anhui/1/2005(H5N1)、A/Vietnam/1194/2004(H5N1)或者A/Indonesia/5/2005株。由所述核酸分子编码的的H6蛋白可以来自A/Teal/HongKong/W312/97(H6N1)株。由所述核酸分子编码的H7蛋白可以来自A/Equine/Prague/56(H7N7)株或者H7A/Hangzhou/1/2013、A/Anhui/1/2013(H7N9)或者A/Shanghai/2/2013(H7N9)株。此外,由所述核酸分子编码的H9蛋白可以来自A/HongKong/1073/99(H9N2)株。由所述核酸分子编码的HA蛋白可以来自B型流感病毒,包括B/Malaysia/2506/2004、B/Florida/4/2006、B/Brisbane/60/08、B/Massachusetts/2/2012样病毒(Yamagata谱系)或者B/Wisconsin/1/2010(Yamagata谱系)。来自H1、H2、H3、H5、H6、H7、H9或者B亚型的HA蛋白的氨基酸序列的非限制性实例包括如WO2009/009876、WO2009/076778、WO2010/003225(将它们通过引用并入本文)中所述的序列。流感病毒HA蛋白可以是H5Indonesia。表1:如本文所述制备的构建体的实例:基于CPMV-HT的构建体(包含SEQIDNO:2的构建体;现有技术)构建体#SP1目的序列实施例1391PDI2H3Victoria1484PDIH1California4409PDIH5Indonesia52140PDIH7Hangzhou62130PDIH7Hangzhou+H5IndonesiaTMCT471039PDIBBrisbane(Prl-)81067PDIBBrisbane(PrL-)+HiCaliforniaTMCT92072PDIBMassachusetts(PrL-)102074PDIBMassachusetts(PrL-)+H1CaliforniaTMCT111445WT3BWisconsin(PrL-)121454WTBWisconsin(PrL-)+H1CaliforniaTMCT13基于CPMVHT+的构建体(包含SEQIDNO:1的构建体)1:SP-信号肽2:PDI-苜蓿蛋白质二硫键异构酶3:WT-野生型或者天然的4:TMCT-跨膜结构域和胞质尾区如果目的核酸序列编码对植物直接或者间接有毒的产物,则可以通过在期望的组织内或者在植物发育的期望阶段选择性表达目的核苷酸序列来降低此类毒性。可以在任何合适的植物宿主中表达目的编码区或者目的核苷酸序列,所述植物宿主转化有或者包含本发明的核苷酸序列或核酸分子或遗传构建体或者载体。合适的宿主的实例包括但不限于,拟南芥,农作物包括例如:双低油菜(canola)、芸薹属、玉米(maize)、烟草属(烟草)例如本氏烟草(Nicotianabenthamiana)、苜蓿、马铃薯、甘薯(Ipomoeabatatus)、人参、豌豆、燕麦、大米、大豆、小麦、大麦、向日葵、棉花、玉米(corn)、黑麦(Secalecereale)、高粱(Sorghumbicolor、Sorghumvulgare)、红花(Carthamustinctorius)。本文使用的术语“生物质”和“植物物质”指来源于植物的任何材料。生物质或植物物质可以包括整株植物或者植物部分,所述植物部分包括叶、根、茎、花、种子,所述生物质或植物物质还可以包括植物的任何组织、植物的任何细胞或者植物、植物部分、组织或细胞的任何部分。此外,生物质或植物物质可以包括细胞内植物组分、细胞外植物组分、植物的液体或固体提取物或者它们的组合。此外,生物质或植物物质可以包括植物,来自植物叶、茎、果实、根或其组合的植物细胞、组织、液体提取物或其组合。植物部分可以包含植物物质或生物质。“调控区”、“调控元件”或“启动子”意为通常但不总是位于基因的蛋白编码区的上游的核酸的一部分,其由DNA或RNA或者DNA和RNA二者组成。当调控区具有活性并与目的基因可操作结合或者可操作地连接时,这可以导致目的基因的表达。调控元件可能能够介导器官特异性或者控制发育基因或时序基因的激活。“调控区”包括启动子元件、显示出基础启动子活性的核心启动子元件、可以响应外部刺激而被诱导的元件、介导启动子活性的元件如负调控元件或转录增强子。本文使用的“调控区”还包括转录之后有活性的元件,例如调节基因表达的调控元件,如翻译和转录增强子、翻译和转录抑制子、上游激活序列以及mRNA不稳定决定子。这些后面的元件中的一些可以位于近编码区。在本公开的背景下,术语“调控元件”或“调控区”通常指通常但不总是位于结构基因的编码序列上游(5’)的DNA序列,其通过提供RNA聚合酶和/或在特定位点开始转录所需的其它因子的识别来控制编码区的表达。然而,应当理解,位于内含子内的其它核苷酸序列或者所述序列的3’也可能有助于目的编码区的表达调控。提供RNA聚合酶或者其它转录因子的识别以确保在特定位点处起始的调控元件的实例是启动子元件。大部分但非全部的真核生物启动子元件含有TATA盒,所述TATA盒为由通常位于转录开始位点上游大约25个碱基对的腺苷和胸苷核苷酸碱基对组成的保守核酸序列。启动子元件可以包括负责转录起始的基础启动子元件以及修饰基因表达的其它调控元件(如以上所列出的)。存在数种类型的调控区,包括发育性调控的调控区、诱导型的调控区或组成型的调控区。在某些器官或器官的组织发育期间,在特定时间,发育性调控的调控区或者控制受其控制的基因的差异表达的调控区在所述器官或器官的组织内被激活。然而,一些发育性调控的调控区可能在特定发育阶段的某些器官或者组织中优先被激活,它们还可能以发育性调控的方式被激活或者也处于在植物内的其它器官或组织中的基础水平。组织特异性调控区例如种子特异性调控区的实例包括napin启动子和cruciferin启动子(Rask等,1998,J.PlantPhysiol.152:595-599;Bilodeauetal.,1994,PlantCell14:125-130)。叶特异性启动子的实例包括质体蓝素启动子(参见US7,125,978,将其通过引用并入本文)。诱导型调控区是能够响应诱导物,直接或者间接激活一个或多个DNA序列或基因的转录的调控区。在诱导物不存在的情况下,所述DNA序列或基因将不转录。通常,与诱导型调控区特异性结合以激活转录的蛋白因子可以以无活性的形式存在,然后通过诱导物将其直接或者间接转化为活性形式。然而,蛋白因子也可以不存在。诱导物可以是诸如蛋白、代谢物、生长调节剂、除草剂或酚类化合物的化学物质,或者由热、冷或毒性元素直接施加的生理应激,或者通过病原体或疾病原如病毒的作用间接施加的生理应激。通过将诱导物外部应用于细胞或植物如通过喷射、浇水、加热或类似的方法,可以将含有诱导型调控区的植物细胞暴露于所述诱导物。诱导型调控元件可以来源于植物基因或非植物基因(例如Gatz,C和Lenk,I.R.P.,1998,TrendsPlantSci.3,352-358;将其通过引用并入)。潜在的诱导型启动子的实例包括但不限于四环素可诱导的启动子(Gatz,C.,1997,Ann.Rev.PlantPhysiol.PlantMol.Biol.48,89-108;将其通过引用并入),类固醇可诱导的启动子(Aoyama,T.andChua,N.H.,1997,PlantJ.2,397-404;将其通过引用并入)和乙醇可诱导的启动子(Salter,M.G.等,1998,PlantJournal16,127-132;Caddick,M.X.deng,1998,NatureBiotech.16,177-180;将其通过引用并入)、细胞分裂素可诱导的IB6和CKI1基因(Brandstatter,I.和Kieber,J.J.,1998,PlantCell10,1009-1019;Kakimoto,T.,1996,Science274,982-985;将其通过引用并入)以及植物生长素可诱导的元件DR5(Ulmasov,T.等,1997,PlantCell9,1963-1971;将其通过引用并入)。组成型调控区引导遍及植物不同部分的基因的表达,以及连续贯穿植物发育的基因的表达。已知的组成型调控元件的实例包括与CaMV35S转录本相关的启动子(p35S;Odelletal.,1985,Nature,313:810-812),稻肌动蛋白1(Zhang等,1991,PlantCell,3:1155-1165)、肌动蛋白2(An等,1996,PlantJ.,10:107-121)或者tms2(U.S.5,428,147,将它们通过引用并入本文),以及磷酸丙糖异构酶1(Xu等,1994,PlantPhysiol.106:459-467)基因,玉米泛素1基因(Cornejo等,1993,PlantMol.Biol.29:637-646),拟南芥泛素1和6基因(Holtorf等,1995,PlantMol.Biol.29:637-646),烟草翻译起始因子4A基因(Mandel等,1995PlantMol.Biol.29:995-1004),木薯脉花叶病毒(CassavaVeinMosaicVirus)启动子pCAS(Verdaguer等,1996),核酮酶二磷酸羧化酶的小亚基的启动子pRbcS:(Outchkourov等,2003),pUbi(对于单子叶植物和双子叶植物)。如本文所述,已经发现包含在叶的表达中具有证实效力的增强子序列的调控区在瞬时表达中有效。在不希望受理论的束缚的情况下,通过与核基质连接而与光合基因的上游调控元件的连接可以介导强的表达。例如从豌豆质体蓝素的翻译开始位点至-784(US7,125,978,将其通过引用并入本文)用于介导强报告基因的表达。本文使用的术语“组成型的”不一定指示,受组成型调控区控制的核苷酸序列在所有细胞类型中的表达均处于同一水平,而是所述序列在广泛的细胞类型中表达,尽管经常观察到丰度的变化。以上所述的表达构建体可以存在于载体中。载体可以包含允许表达盒转移并整合进有机体或宿主的基因组的边界序列。构建体可以是植物双元载体,例如基于pPZP的双元转化载体(Hajdukiewicz等1994)。其它示例构建体包括pBin19(参见Frisch,D.A.,L.W.Harris-Haller等,1995,PlantMolecularBiology27:405-409)。如果需要,本发明的构建体可进一步操作为包含选择性标志物。然而,这可能不需要。可用的选择性标志物包括提供针对化学物质的抗性的酶,所述化学物质如抗生素,例如庆大霉素、潮霉素、卡那霉素;除草剂,如草铵膦(phosphinothrycin)、草甘膦、氯磺隆等。类似地,可以使用提供可通过颜色变化鉴定化合物的产生的酶,如GUS(β-葡萄糖醛酸苷酶),或者通过发冷光鉴定的酶,如荧光素酶或GFP。载体还可以包含本文所述的表达增强子。表达增强子可以位于T-DNA上,所述T-DNA还包含基因沉默抑制子和NPTII。多接头也可以编码一组或两组6×组氨酸残基,以允许目的蛋白包含N-端或C-端His标签,从而有助于蛋白纯化。转录后基因沉默(PTGS)可能涉及限制植物中转基因的表达,并且来自马铃薯病毒Y(HcPro)的沉默抑制子的共表达可用于消解转基因mRNA的特异性降解(Brigneti等,1998,EMBOJ.17,6739-6746,将其通过引用并入本文)。可选的沉默抑制子在本领域众所周知,并且可如本文所述使用(Chiba等,2006,Virology346:7-14;将其通过引用并入本文),例如但不限于:TEV-p1/HC-Pro(烟草蚀刻病毒-p1/HC-Pro)、BYV-p21、番茄丛矮病毒的p19(TBSVp19;p19的结构描述于WO2010/0003225中,将其通过引用并入本文)、番茄皱缩病毒的衣壳蛋白(TCV-CP)、黄瓜花叶病毒的2b(CMV-2b)、马铃薯病毒X的p25(PVX-p25)、马铃薯病毒M的p11(PVM-p11)、马铃薯病毒S的p11(PVS-p11)、蓝莓枯黄病毒的p16(BScV-p16)、柑橘衰退病毒的p23(CTV-p23)、葡萄卷叶伴随病毒2号的p24(GLRaV-2p24)、葡萄病毒A的p10(GVA-p10)、葡萄病毒B的p14(GVB-p14)、独活潜隐病毒的p10(HLV-p10)或者大蒜普通潜隐病毒的p16(GCLV-p16)。因此,可将一种或多种沉默抑制子与基于豇豆花叶病毒组的表达盒、来源于双生病毒的扩增元件以及编码目的蛋白的核酸序列共表达,以进一步确保植物内高水平的蛋白产生,所述沉默抑制子例如但不限于:HcPro、TEV-p1/HC-Pro、BYV-p21、TBSVp19、TCV-CP、CMV-2b、PVX-p25、rgscam、来自FHV的B2蛋白、CPMV的小外壳蛋白和来自TCV的外壳蛋白、PVM-p11、PVS-p11、BScV-p16、CTV-p23、GLRaV-2p24、GBV-p14、HLV-p10、GCLV-p16或者GVA-p10。可以利用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、微注射、电穿孔等将本发明的构建体引入植入细胞。关于此类技术的综述,参见例如Weissbach和Weissbach,MethodsforPlantMolecularBiology,AcademyPress,NewYorkVIII,pp.421-463(1988);Geierson和Corey,PlantMolecularBiology,2dEd.(1988);以及Miki和Iyer,FundamentalsofGeneTransferinPlants.InPlantMetabolism,2dEd.DT.Dennis,DHTurpin,DDLefebrve,DBLayzell(eds),AddisonWesly,LangmansLtd.London,pp.561-579(1997)。其它方法包括直接DNA摄取、使用脂质体、电穿孔(例如使用原生质体)、微注射、微弹轰击法(microprojectile)或晶须(whisker)以及真空渗入。参见,例如,Bilang等(1991,Gene100:247-250),Scheid等(1991,Mol.Gen.Genet.228:104-112),Guerche等(1987,PlantScience52:111-116),Neuhause等(1987,Theor.ApplGenet.75:30-36),Klein等(2987,Nature327:70-73);Freeman等(1984,PlantCellPhysiol.29:1353),Howell等(1980,Science208:1265),Horsch等(1985,Science227:1229-1231),DeBlock等(1989,PlantPhysiology91:694-701),MethodsforPlantMolecularBiology(Weissbach和Weissbach,eds.,AcademicPressInc.,1988),MethodsinPlantMolecularBiology(Schuler和Zielinski,eds.,AcademicPressInc.,1989),WO92/09696,WO94/00583,EP331083,EP175966,Liu和Lomonossoff(2002,JVirolMeth,105:343-348),EP290395;WO8706614;美国专利号4,945,050、5,036,006和5,100,792;提交于1995年5月10的美国专利申请连续号08/438,666和提交于1992年9月25日的美国专利申请连续号07/951,715(在此将它们通过引用全部并入)。可将瞬时表达方法用于表达本发明的构建体(参见D’Aoust等,2009,Methodsinmolecularbiology,Vol483,41-50页;Liu和Lomonossoff,2002,JournalofVirologicalMethods,105:343-348;将其通过引用并入本文)。可选地,可以使用如Kapila等人(1997,PlantSci.122,101-108;将其通过引用并入本文)或者WO00/063400、WO00/037663(将它们通过引用并入本文)所述的基于真空的瞬时表达方法。这些方法可以包括,例如但不限于农杆菌接种(Agro-inoculation)或农杆菌渗入(Agro-infiltration)、注射渗入的方法,但是如以上所示,也可以使用其它瞬时方法。随着农杆菌接种、农杆菌渗入或者注射渗入,包含期望核酸的农杆菌(Agrobacteria)的混合物进入组织的细胞间隙,例如叶、植物的地上部分(包括茎、叶和花)、植物的其它部分(茎、根、花)或者全植株。穿过表皮之后,农杆菌感染细胞,并将t-DNA拷贝转移至所述细胞内。t-DNA以附加体的形式转录,进行mRNA翻译,导致感染的细胞中目的蛋白的产生,然而t-DNA在细胞核内的传代是短暂的。本发明的另外考虑部分是的含有本发明的基因构建体的转基因植物、植物细胞或种子,它们可用作适于本文所述的瞬时蛋白表达的平台植物。由植物细胞再生为全植株的方法也是本领域已知的(例如参见Guerineau和Mullineaux(1993,Planttransformationandexpressionvectors.In:PlantMolecularBiologyLabfax(CroyRRDed)Oxford,BIOSScientificPublishers,pp121-148)。通常,在合适的培养基中培养转化的植物细胞,如果选择性标志物被用于帮助鉴定转化的植物细胞,所述培养基可以含有诸如抗生素的选择剂。一旦愈伤组织形成,可以通过根据已知的方法使用合适的植物激素促进芽的形成,并且将所述芽转移至生根培养基以用于植物再生。然后可以由种子或者利用无性繁殖技术将所述植物用于建立重复子代。也可以不利用组织培养而产生转基因植物。本领域已经建立用于稳定转化以及这些有机体再生的方法,并且其是本领域技术人员已知的。在Vasil等人(CellCultureandSomaticCellGeneticsofPlants,VoII,IlandIII,LaboratoryProceduresandTheirApplications,AcademicPress,1984)以及Weissbach和Weissbach(MethodsforPlantMolecularBiology,AcademicPress,1989)中评述了可用的技术。获得转化的和再生的植物的方法不是本发明的关键。如果将用两种或更多种核酸构建体转化或者共转化植物、植物部分或者植物细胞,,则在单次转染事件中将所述核酸构建体引入农杆菌,将核酸合并,并且如所述转染所述细菌细胞。可选地,可以连续引入所述构建体。在这种情况下,如所述将第一构建体引入农杆菌,使细胞在选择性条件下生长(例如在抗生素存在的情况下),其中只有单转化的细菌可以生长。在该第一选择步骤之后,如所述将第二核酸构建体引入农杆菌,并且使细胞在双选择性条件下生长,其中只有双重转化的细菌可以生长。然后如本文所述可将双重转化的细菌用于转化植物、植物部分或者植物细胞,或者可使其进行再次转化步骤,以容纳第三核酸构建体。可选地,如果将用两种或更多种核酸构建体转化或者共转化植物、植物部分或植物细胞,可通过用植物、植物部分或植物细胞共渗入农杆菌细胞的混合物而将核酸构建体引入植物,各农杆菌细胞可以包含一种或多种待引入所述植物的构建体。为了改变在构建体内的目的核苷酸序列在植物、植物部分或植物细胞内的相对表达水平,在渗入步骤期间,包含期望构建体的各农杆菌群的浓度可以不同。本公开还提供包含如本文所限定的表达系统的转基因植物,其中当与缺乏如本文所述的表达系统中的一种或多种组件的其它相似的表达系统(例如CPMVHT(SEQIDNO:2))相比时,盒中的异源目的核酸的表达水平升高。本公开还包括产生目的蛋白的方法,其包括下述步骤:提供表达如本文所述的表达系统的植物、植物部分,至少收获已表达目的蛋白的组织,以及任选地,从所述组织中分离目的蛋白。因此在各方面,并且不受限制,本发明提供:-表达增强子,其包含选自SEQIDNO:1或3的豇豆花叶病毒组5’UTR或者与SEQIDNO:1或3中任一项所示的序列显示出100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列,其中当如本文所述与植物调控区和在植物中有活性的kozak序列(例如植物kozak序列)可操作地连接时,与利用同样的植物调控区的与CPMVHT(SEQIDNO:2;如SainsburyF.和LomonossoffG.P.,2008,PlantPhysiol.148:pp.1212-1218中所述包含不完全的M蛋白的现有技术的增强子序列;将其通过引用并入本文)融合的目的核苷酸序列的表达水平相比,所述表达增强子增加了与所述表达增强子可操作地连接的所述目的核苷酸序列的表达水平。-一种或多种表达系统,其包含如以上所限定的基于豇豆花叶病毒组的表达增强子或表达盒、启动子(调控区),任选地多接头、kozak序列、编码目的蛋白的核酸以及终止子。-利用如本文所述的一种或多种表达系统或载体,在宿主有机体(如植物)中表达目的蛋白的方法。-由本发明的一种或多种表达系统或载体表达目的蛋白的宿主细胞和有机体,以及产生所述宿主和有机体的方法。表2:序列列表实施例1:2X35S/CPMV-HT/PDISP/H3Victoria/NOS(构建体编号1391)利用以下基于PCR的方法,将编码天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Victoria/361/2011的H3的序列(PDISP/H3Victoria)克隆进2X35S-CPMV-HT-NOS表达体。使用引物IF-PDI.S1+3c(图5A,SEQIDNO:18)和IF-H3V36111.s1-4r(图5B,SEQIDNO:19),使用PDISP/H3Victoria序列(图5C,SEQIDNO:20)作为模板扩增含有PDISP/H3Victoria编码序列的片段。使用In-Fusion克隆系统(Clontech,MountainView,CA)将PCR产物克隆进2X35S/CPMV-HT/NOS表达系统。用SacII和StuI限制酶消化构建体编号1191(图5D和5E,SEQIDNO:21),并将线性化的质粒用于In-Fusion装配反应。构建体编号1191是旨在将目的基因“InFusion”克隆进基于CPMV-HT的表达盒的受体质粒。并入基因构建体以在苜蓿质体蓝素基因启动子和终止子下共表达TBSVP19沉默抑制子。骨架为pCAMBIA双元质粒,并且由左至右的t-DNA边界序列显示于图5E(SEQIDNO:21)中。得到的构建体给予编号1391(图5F,SEQIDNO:22)。与PDISP融合的来自流感病毒A/Victoria/361/2011的成熟H3的氨基酸序列显示于图5G(SEQIDNO:23)中。质粒1391的示意图显示于图5H中。实施例2:2X35S/CPMV-HT+/PDISP/H3Victoria/NOS(构建体编号1819)利用以下基于PCR的方法,将编码天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Victoria/361/2011的H3的序列(PDISP/H3Victoria)克隆进2X35S-CPMV-HT+/NOS表达体。使用引物IF(SacII)-Kozac_PDI.c(图6A,SEQIDNO:24)和IF-H3V36111.s1-4r(图5B,SEQIDNO:19),使用PDISP/H3Victoria序列(图8C,SEQIDNO:20)作为模板,扩增PDISP/H3Victoria编码序列的片段。使用In-Fusion克隆系统(Clontech,MountainView,CA),将PCR产物克隆进2X35S/CPMV-HT+/NOS表达系统。用SacII和StuI限制酶消化构建体编号2181(图6B),并将线性化的质粒用于In-Fusion装配反应。构建体编号2181是旨在将目的基因“InFusion”克隆进基于CPMV-HT+的表达盒的受体质粒。同时并入基因构建体,以在苜蓿质体蓝素基因启动子和终止子下共表达TBSVP19沉默抑制子。骨架为pCAMBIA双元质粒,并且由左至右的t-DNA边界显示于图6C(SEQIDNO:25)中。得到的构建体给予编号1819(图6D,SEQIDNO:26)。与PDISP融合的来自流感病毒的成熟H3的氨基酸序列显示于图5G(SEQIDNO:23)中。质粒1819的示意图显示于图6E中。实施例32X35S/CPMVHT+/NOS表达系统中的SacII限制性位点与PDISP/H3Victoria的ATG之间的序列变化(构建体编号1952至1959)利用与构建体编号1819(参见实施例2)相同的基于PCR的方法,用修饰的正向引物并保持所有的其它步骤相同,创建八个包含2X35S/CPMVHT+/NOS表达系统中的SacII限制性位点与PDISP/H3Victoria的ATG之间序列变化的构建体。使用图7A-7H中列出的引物扩增变体HT1*至HT8*,以分别创建构建体编号1952至1959:IF-HT1*(-Mprot)-PDI.c(图7A,SEQIDNO:27),IF-HT2*(-Mprot)-PDI.c(图7B,SEQIDNO:28),IF-HT3*(-Mprot)-PDI.c(图7C,SEQIDNO:29)IF-HT4*(-Mprot)-PDI.c(图7D,SEQIDNO:30)IF-HT5*(-Mprot)-PDI.c(图7E,SEQIDNO:31)IF-HT6*(-Mprot)-PDI.c(图7F,SEQIDNO:32)IF-HT7*(-Mprot)-PDI.c(图7G,SEQIDNO:33)以及IF-HT8*(-Mprot)-PDI.c(图7H,SEQIDNO:34)。质粒1952的示意图显示于图7I中。使用类似的特性来制备构建体1953-1959。实施例4:PDISP/H1California的2X35S/CPMVHT(构建体编号484)和HT+(构建体编号1805)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/H1California特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/California/7/2009(PDISP/H1California)的H1(图8A,SEQIDNO:35)。与PDISP融合的来自流感病毒A/California/7/2009的成熟H1的氨基酸序列显示于图8B(SEQIDNO:36)中。质粒484和1805的示意图显示于图8C和图8D中。实施例5:H5Indonesia的2X35S/CPMVHT(构建体编号409)和HT+(构建体编号2319)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDI/H5Indonesia特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Indonesia/5/2005的H5(图9A,SEQIDNO:37)。与PDISP融合的来自流感病毒A/Indonesia/5/2005的成熟H5的氨基酸序列显示于图9B(SEQIDNO:38)中。质粒409和2319的示意图显示于图9C和图9D中。实施例6:PDISP-H7Hangzhou的2X35S/CPMVHT(构建体编号2140)和HT+(构建体编号2142)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/H7Hangzhou特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的来自流感病毒A/Hangzhou/1/2013的H7(PDISP/H7Hangzhou)(图10A,SEQIDNO:39)。与PDISP融合的来自流感病毒A/Hangzhou/1/2013的成熟H7的氨基酸序列显示于图10B(SEQIDNO:40)中。质粒2140、2142和2168的示意图显示于图10C和图10D中。实施例7:PDISP/H7Hangzhou+H5IndonesiaTMCT的2X35S/CPMVHT(构建体编号2130)和HT+(构建体编号2146)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/H7Hangzhou+H5IndonesiaTMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于与来自流感病毒A/Indonesia/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合并具有苜蓿蛋白质二硫键异构酶的信号肽的来自流感病毒A/Hangzhou/1/2013的H7的胞外域(PDISP/H7Hangzhou+H5IndonesiaTMCT)(图11A,SEQIDNO:41)。与PDISP融合的H7Hangzhou+H5IndonesiaTMCT的氨基酸序列显示于图11B(SEQIDNO:42)中。质粒2130和2146的示意图显示于图11C和11D中。实施例8:PDISP/HABBrisbane(PrL-)的2X35S/CPMVHT(构建体编号1039)和HT+(构建体编号1829)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HABBrisbane(PrL-)特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Brisbane/60/2008的HA(PDISP/HABBrisbane(PrL-;图12A,SEQIDNO:43)。与PDISP融合的成熟HABBrisbane(PrL-)的氨基酸序列显示于图12B(SEQIDNO:44)中。质粒1039和1829的示意图显示于图12C和12D中。实施例9:PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT的2X35S/CPMVHT(构建体编号1067)和HT+(构建体编号1875)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Brisbane/60/08的HA的胞外域,其与来自流感病毒A/California/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合,并且具有苜蓿蛋白质二硫键异构酶的信号肽(PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT)(图13A,SEQIDNO:45)。与PDISP融合的成熟HABBrisbane(PrL-)+H1CaliforniaTMCT的氨基酸序列显示于图13B(SEQIDNO:46)中。质粒1067和1875的示意图显示于图13C和13D中。实施例10:PDISP/HABMassachusetts(PrL-)的2X35S/CPMVHT(构建体编号2072)和HT+(构建体编号2052)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HABMassachusetts(PrL-)特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于天然信号肽已被苜蓿蛋白质二硫键异构酶的信号肽替代的具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Massachusetts/2/2012的HA(PDISP/HABMassachusetts(PrL-))(图14A,SEQIDNO:47)。与PDISP融合的成熟HABMassachusetts(PrL-)的氨基酸序列显示于图14B(SEQIDNO:48)中。质粒2072和2052的示意图显示于图14C和14D中。实施例11:PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCT的2X35S/CPMVHT(构建体编号2074)和HT+(构建体编号2062)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Massachusetts/2/2012的HA的胞外域,其与来自流感病毒A/California/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合,并且具有苜蓿蛋白质二硫键异构酶的信号肽(PDISP/HABMassachusetts(PrL-)+H1CaliforniaTMCT)(图15A,SEQIDNO:49)。与PDISP融合的成熟HABMassachusetts(PrL-)+H1CaliforniaTMCT的氨基酸序列显示于图15B(SEQIDNO:50)中。质粒2074和2062的示意图显示于图15C和15D中。实施例12:HABWisconsin(PrL-)的2X35S/CPMVHT(构建体编号1445)和HT+(构建体编号1839)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为HABWisconsin(PrL-)特别设计的修饰的PCR引物,将编码序列分别克隆进原始的HT和修饰的HT+中,所述编码序列对应于具有自身的天然信号肽并具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Wisconsin/1/2010的HA(HABWisconsin(PrL-))(图16A,SEQIDNO:51)。具有自身的天然信号肽的HABWisconsin(PrL-)的氨基酸序列显示于图16B(SEQIDNO:52)中。质粒1445和1839的示意图显示于图16C和16D中。实施例13:HABWisconsin(PrL-)+H1CaliforniaTMCT的2X35S/CPMVHT(构建体编号1454)和HT+(构建体编号1860)利用与构建体1391和1819相同的基于PCR的方法(参见实施例1和2),但是使用为HABWisconsin(PrL-)+H1CaliforniaTMCT特别设计的修饰的PCR引物,将嵌合体血凝素编码序列分别克隆进原始的HT和修饰的HT+中,所述嵌合体血凝素编码序列对应于具有缺失的蛋白水解环(PrL-)的来自流感病毒B/Wisconsin/2/2012的HA的胞外域,其与来自流感病毒A/California/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合,并且具有HABWisconsin的天然信号肽(HABWisconsin(PrL-)+H1CaliforniaTMCT)(图17A,SEQIDNO:53)。HABWisconsin(PrL-)+H1CaliforniaTMCT的氨基酸序列显示于图17B(SEQIDNO:54)中。质粒1454和1860的示意图显示于图17C和17D中。实施例14:农杆菌转染利用D’Aoust等2008(PlantBiotechnologyJournal6:930-940)所述的方法,通过电穿孔,使农杆菌菌株AGL1转染有DNA构建体。使转染的农杆菌在pH5.6的补充有10mM2-(N-吗啉)乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素以及25μg/ml的羧苄青霉素的YEB培养基中生长至0.6至1.6的OD600。在使用之前将农杆菌悬液离心,并在渗入介质中重悬(10mMMgCl2和10mMMES,pH5.6)。制备植物生物质、接种物和农杆菌渗入物本文使用的术语“生物质”和“植物物质”意为反映来源于植物的任何物质。生物质或植物物质可以包含整个植株、组织、细胞或其任何部分。此外,生物质或植物物质可以包含细胞内植物组分、细胞外植物组分、植物的液体或固体提取物或者它们的组合。此外,生物质或植物物质可以包含植物,植物细胞,组织,来自植物叶、茎、果实、根或其组合的液体提取物或者它们的组合。植物部分可以包含植物物质或生物质。在铺满市售的泥炭苔底层的平地上由种子长出本氏烟草植株。允许植物在16/8光周期和25℃白天/20℃夜晚的温度方案下的温室中生长。播种后三周,挑选单个小植株,移植进盆中,并留在温室中在同样的环境条件下生长另外三周。使转染有各构建体的农杆菌在pH5.6的补充有10mM2-(N-吗啉)乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羟苄青霉素的YEB培养基中生长,直至它们达到0.6至1.6的OD600。使用之前将农杆菌悬液离心,并在渗入介质(10mMMgCl2和10mMMES,pH5.6)中重悬,以及在4℃保存过夜。在渗入当天,以2.5倍培养体积稀释培养物批次,并且允许在使用前升温。将本氏烟草的全植株倒置在密封的不锈钢槽中的细菌悬液中,在20-40托的真空下持续2-min。将植物放回温室中,持续2-6天培育期,直至收获。叶收获和全蛋白提取培育之后,收获植物的地上部分,在-80℃冷冻并破碎成片。通过在3体积冷的50mMTrispH8.0、0.15MNaCl、0.1%TritonX-100和1mM苯甲基磺酰氟中均化(Polytron)各冷冻-破碎的植物材料样本,提取总的可溶蛋白。均化之后,将浆料在10,000g,4℃下离心10min,并保留这些澄清的粗提物(上清液)用于分析。实施例15:血凝分析通过Bradford分析(Bio-Rad,Hercules,CA),使用牛血清白蛋白作为参考标准,测定澄清的粗提取物中的总蛋白含量。血凝分析基于Nayak和Reichl(2004)所述的方法。简言之,在含有100μLPBS的V形底96孔微量滴定板中对测试样本(100μL)进行连续二倍稀释,每孔剩余100μL稀释样本。向各孔添加一百微升0.25%火鸡红细胞悬液(BioLinkInc.,Syracuse,NY;对于所有B株、H1、H5和H7)或者0.5%的豚鼠红细胞悬液(对于H3),并将板在室温孵育2h。将显示完全血凝的最高稀释度的倒数记作HA活性。在此将所有引用通过引用并入。针对一个或多个实施方案,描述了本发明。然而,对本领域技术人员而言显而易见的是,在不脱离权利要求所限定的本发明的范围的情况下,可以进行多种改变和修改。序列表<110>莫迪卡戈公司<120>修饰的CPMV增强子元件<130>V86817WO<150>US61/971,274<151>2014-03-27<150>PCT/CA04/050326<151>2014-03-28<160>59<170>PatentInversion3.5<210>1<211>534<212>DNA<213>人工序列<220><223>包含CPMVHT+的表达增强子<400>1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480taagcttctgtatattctgcccaaatttgttcgggcccaataccgcggagaaaa534<210>2<211>517<212>DNA<213>人工序列<220><223>表达增强子CPMVHT<400>2tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480taagcttctgtatattctgcccaaatttgtcgggccc517<210>3<211>534<212>DNA<213>人工序列<220><223>CPMVHT+[WT115]<400>3tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcatgagc120gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480taagcttctgtatattctgcccaaatttgttcgggcccaataccgcggagaaaa534<210>4<211>534<212>DNA<213>人工序列<220><223>CPMVHT+(植物kozak共有序列)<220><221>misc_feature<222>(529)..(529)<220><221>misc_feature<222>(529)..(529)<223>a可能存在或者不存在<400>4tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480taagcttctgtatattctgcccaaatttgttcgggcccaataccgcggnarrma534<210>5<400>5000<210>6<400>6000<210>7<400>7000<210>8<400>8000<210>9<400>9000<210>10<400>10000<210>11<400>11000<210>12<400>12000<210>13<400>13000<210>14<400>14000<210>15<400>15000<210>16<400>16000<210>17<400>17000<210>18<211>48<212>DNA<213>人工序列<220><223>IF-PDI.S1+3c<400>18aaatttgtcgggcccatggcgaaaaacgttgcgattttcggcttattg48<210>19<211>51<212>DNA<213>人工序列<220><223>IF-H3V36111.s1-4r<400>19actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgccctt51<210>20<211>1725<212>DNA<213>人工序列<220><223>PDISP/H3Victoria的核苷酸序列<400>20atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgcccaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180actaatgctactgagctggttcagaattcctcaataggtgaaatatgcgacagtcctcat240cagatccttgatggagaaaactgcacactaatagatgctctattgggagaccctcagtgt300gatggcttccaaaataagaaatgggacctttttgttgaacgaagcaaagcctacagcaac360tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagt480tctgcttgcataaggagatctaataatagtttctttagtagattaaattggttgacccac540ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600ttgtacatttggggggttcaccacccgggtacggacaaggaccaaatcttcctgtatgct660caatcatcaggaagaatcacagtatctaccaaaagaagccaacaagctgtaatcccgaat720atcggatctagacccagaataaggaatatccctagcagaataagcatctattggacaata780gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaagcactctgaaattg1020gcaacaggaatgcgaaatgtaccagagaaacaaactagaggcatatttggcgcaatagcg1080ggtttcatagaaaatggttgggagggaatggtggatggttggtacggtttcaggcatcaa1140aattctgagggaagaggacaagcagcagatctcaaaagcactcaagcagcaatcgatcaa1200atcaatgggaagctgaatcgattgatcgggaaaaccaacgagaaattccatcagattgaa1260aaagaattctcagaagtcgaagggagaattcaggaccttgagaaatatgttgaggacact1320aaaatagatctctggtcatacaacgcggagcttcttgttgccctggagaaccaacataca1380attgatctaactgactcagaaatgaacaaactgtttgaaaaaacaaagaagcaactaagg1440gaaaatgctgaggatatgggcaatggttgtttcaaaatataccacaaatgtgacaatgcc1500tgcataggatcaatcagaaatggaacttatgaccacgatgtatacagagatgaagcatta1560aacaaccggttccagatcaagggagttgagctgaagtcagggtacaaagattggatccta1620tggatttcctttgccatatcatgttttttgctttgtgttgctttgttggggttcatcatg1680tgggcctgccaaaagggcaacattaggtgcaacatttgcatttga1725<210>21<211>4903<212>DNA<213>人工序列<220><223>构建体1191的核苷酸序列<400>21tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctt3060tcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacg3120tgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgct3180gttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaatatctct3240acttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggt3300tctataagaaatctagtattttctttgaaacagagttttcccgtggttttcgaacttgga3360gaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccgcggatggcgaaa3420aacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctcagatcttc3480gcctgcaggctcctcagccaaaacgacacccccatctgtctatccactggcccctggatc3540tgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatttccctga3600gccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacaccttcccagc3660tgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctccagcacctg3720gcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaaggtggacaa3780gaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccagaagtatc3840atctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctgactcctaa3900ggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttcagctggtt3960tgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagttcaacag4020cactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatggcaagga4080gcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggcctattttctttagt4140ttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcag4200agtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtccct4260tcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaa4320ttcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaa4380gattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgtta4440agcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatgatta4500gagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactagg4560ataaattatcgcgcgcggtgtcatctatgttactagatctctagagtctcaagcttggcg4620cgcccacgtgactagtggcactggccgtcgttttacaacgtcgtgactgggaaaaccctg4680gcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcg4740aagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctaga4800gcagcttgagcttggatcagattgtcgtttcccgccttcagtttaaactatcagtgtttg4860acaggatatattggcgggtaaacctaagagaaaagagcgttta4903<210>22<211>3465<212>DNA<213>人工序列<220><223>表达盒1391的核苷酸序列<400>22gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260gcccatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcc1320ttctcagatcttcgcccaaaaacttcctggaaatgacaacagcacggcaacgctgtgcct1380tgggcaccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattga1440agttactaatgctactgagctggttcagaattcctcaataggtgaaatatgcgacagtcc1500tcatcagatccttgatggagaaaactgcacactaatagatgctctattgggagaccctca1560gtgtgatggcttccaaaataagaaatgggacctttttgttgaacgaagcaaagcctacag1620caactgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatc1680cggcacactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaac1740aagttctgcttgcataaggagatctaataatagtttctttagtagattaaattggttgac1800ccacttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttga1860caaattgtacatttggggggttcaccacccgggtacggacaaggaccaaatcttcctgta1920tgctcaatcatcaggaagaatcacagtatctaccaaaagaagccaacaagctgtaatccc1980gaatatcggatctagacccagaataaggaatatccctagcagaataagcatctattggac2040aatagtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctag2100gggttacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattgg2160caaatgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattcca2220aaatgtaaacaggatcacatacggggcctgtcccagatatgttaagcaaagcactctgaa2280attggcaacaggaatgcgaaatgtaccagagaaacaaactagaggcatatttggcgcaat2340agcgggtttcatagaaaatggttgggagggaatggtggatggttggtacggtttcaggca2400tcaaaattctgagggaagaggacaagcagcagatctcaaaagcactcaagcagcaatcga2460tcaaatcaatgggaagctgaatcgattgatcgggaaaaccaacgagaaattccatcagat2520tgaaaaagaattctcagaagtcgaagggagaattcaggaccttgagaaatatgttgagga2580cactaaaatagatctctggtcatacaacgcggagcttcttgttgccctggagaaccaaca2640tacaattgatctaactgactcagaaatgaacaaactgtttgaaaaaacaaagaagcaact2700aagggaaaatgctgaggatatgggcaatggttgtttcaaaatataccacaaatgtgacaa2760tgcctgcataggatcaatcagaaatggaacttatgaccacgatgtatacagagatgaagc2820attaaacaaccggttccagatcaagggagttgagctgaagtcagggtacaaagattggat2880cctatggatttcctttgccatatcatgttttttgctttgtgttgctttgttggggttcat2940catgtgggcctgccaaaagggcaacattaggtgcaacatttgcatttgaaggcctatttt3000ctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctg3060tgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggt3120cgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaaga3180ccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagt3240ttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaat3300tacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggttttt3360atgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgca3420aactaggataaattatcgcgcgcggtgtcatctatgttactagat3465<210>23<211>574<212>PRT<213>人工序列<220><223>PDISP/H3Victoria的氨基酸序列<400>23MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaGlnLysLeuProGlyAsnAspAsn202530SerThrAlaThrLeuCysLeuGlyHisHisAlaValProAsnGlyThr354045IleValLysThrIleThrAsnAspGlnIleGluValThrAsnAlaThr505560GluLeuValGlnAsnSerSerIleGlyGluIleCysAspSerProHis65707580GlnIleLeuAspGlyGluAsnCysThrLeuIleAspAlaLeuLeuGly859095AspProGlnCysAspGlyPheGlnAsnLysLysTrpAspLeuPheVal100105110GluArgSerLysAlaTyrSerAsnCysTyrProTyrAspValProAsp115120125TyrAlaSerLeuArgSerLeuValAlaSerSerGlyThrLeuGluPhe130135140AsnAsnGluSerPheAsnTrpThrGlyValThrGlnAsnGlyThrSer145150155160SerAlaCysIleArgArgSerAsnAsnSerPhePheSerArgLeuAsn165170175TrpLeuThrHisLeuAsnPheLysTyrProAlaLeuAsnValThrMet180185190ProAsnAsnGluGlnPheAspLysLeuTyrIleTrpGlyValHisHis195200205ProGlyThrAspLysAspGlnIlePheLeuTyrAlaGlnSerSerGly210215220ArgIleThrValSerThrLysArgSerGlnGlnAlaValIleProAsn225230235240IleGlySerArgProArgIleArgAsnIleProSerArgIleSerIle245250255TyrTrpThrIleValLysProGlyAspIleLeuLeuIleAsnSerThr260265270GlyAsnLeuIleAlaProArgGlyTyrPheLysIleArgSerGlyLys275280285SerSerIleMetArgSerAspAlaProIleGlyLysCysAsnSerGlu290295300CysIleThrProAsnGlySerIleProAsnAspLysProPheGlnAsn305310315320ValAsnArgIleThrTyrGlyAlaCysProArgTyrValLysGlnSer325330335ThrLeuLysLeuAlaThrGlyMetArgAsnValProGluLysGlnThr340345350ArgGlyIlePheGlyAlaIleAlaGlyPheIleGluAsnGlyTrpGlu355360365GlyMetValAspGlyTrpTyrGlyPheArgHisGlnAsnSerGluGly370375380ArgGlyGlnAlaAlaAspLeuLysSerThrGlnAlaAlaIleAspGln385390395400IleAsnGlyLysLeuAsnArgLeuIleGlyLysThrAsnGluLysPhe405410415HisGlnIleGluLysGluPheSerGluValGluGlyArgIleGlnAsp420425430LeuGluLysTyrValGluAspThrLysIleAspLeuTrpSerTyrAsn435440445AlaGluLeuLeuValAlaLeuGluAsnGlnHisThrIleAspLeuThr450455460AspSerGluMetAsnLysLeuPheGluLysThrLysLysGlnLeuArg465470475480GluAsnAlaGluAspMetGlyAsnGlyCysPheLysIleTyrHisLys485490495CysAspAsnAlaCysIleGlySerIleArgAsnGlyThrTyrAspHis500505510AspValTyrArgAspGluAlaLeuAsnAsnArgPheGlnIleLysGly515520525ValGluLeuLysSerGlyTyrLysAspTrpIleLeuTrpIleSerPhe530535540AlaIleSerCysPheLeuLeuCysValAlaLeuLeuGlyPheIleMet545550555560TrpAlaCysGlnLysGlyAsnIleArgCysAsnIleCysIle565570<210>24<211>48<212>DNA<213>人工序列<220><223>IF(SacII)-Kozac_PDI.c<400>24gtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttc48<210>25<211>4914<212>DNA<213>人工序列<220><223>构建体2181的核苷酸序列<400>25tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctt3060tcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacg3120tgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgct3180gttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaatatctct3240acttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggt3300tctataagaaatctagtattttctttgaaacagagttttcccgtggttttcgaacttgga3360gaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccaataccgcggaga3420aaatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcctt3480ctcagatcttcgcgacgtcactcctcagccaaaacgacacccccatctgtctatccactg3540gcccctggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggc3600tatttccctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcac3660accttcccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccc3720tccagcacctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcacc3780aaggtggacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtc3840ccagaagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattact3900ctgactcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccag3960ttcagctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggag4020cagttcaacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctc4080aatggcaaggagcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggccta4140ttttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttt4200tctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagc4260aggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaa4320aagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaata4380aagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgtt4440gaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggt4500ttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcg4560cgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatctctagagtct4620caagcttggcgcgcccacgtgactagtggcactggccgtcgttttacaacgtcgtgactg4680ggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctg4740gcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatgg4800cgaatgctagagcagcttgagcttggatcagattgtcgtttcccgccttcagtttaaact4860atcagtgtttgacaggatatattggcgggtaaacctaagagaaaagagcgttta4914<210>26<211>3480<212>DNA<213>人工序列<220><223>表达盒1819的核苷酸序列<400>26gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320tcttgtgttggttccttctcagatcttcgcccaaaaacttcctggaaatgacaacagcac1380ggcaacgctgtgccttgggcaccatgcagtaccaaacggaacgatagtgaaaacaatcac1440gaatgaccaaattgaagttactaatgctactgagctggttcagaattcctcaataggtga1500aatatgcgacagtcctcatcagatccttgatggagaaaactgcacactaatagatgctct1560attgggagaccctcagtgtgatggcttccaaaataagaaatgggacctttttgttgaacg1620aagcaaagcctacagcaactgttacccttatgatgtgccggattatgcctcccttaggtc1680actagttgcctcatccggcacactggagtttaacaatgaaagcttcaattggactggagt1740cactcaaaacggaacaagttctgcttgcataaggagatctaataatagtttctttagtag1800attaaattggttgacccacttaaacttcaaatacccagcattgaacgtgactatgccaaa1860caatgaacaatttgacaaattgtacatttggggggttcaccacccgggtacggacaagga1920ccaaatcttcctgtatgctcaatcatcaggaagaatcacagtatctaccaaaagaagcca1980acaagctgtaatcccgaatatcggatctagacccagaataaggaatatccctagcagaat2040aagcatctattggacaatagtaaaaccgggagacatacttttgattaacagcacagggaa2100tctaattgctcctaggggttacttcaaaatacgaagtgggaaaagctcaataatgagatc2160agatgcacccattggcaaatgcaattctgaatgcatcactccaaatggaagcattcccaa2220tgacaaaccattccaaaatgtaaacaggatcacatacggggcctgtcccagatatgttaa2280gcaaagcactctgaaattggcaacaggaatgcgaaatgtaccagagaaacaaactagagg2340catatttggcgcaatagcgggtttcatagaaaatggttgggagggaatggtggatggttg2400gtacggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcac2460tcaagcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaaaaccaacga2520gaaattccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttga2580gaaatatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgc2640cctggagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaa2700aacaaagaagcaactaagggaaaatgctgaggatatgggcaatggttgtttcaaaatata2760ccacaaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgt2820atacagagatgaagcattaaacaaccggttccagatcaagggagttgagctgaagtcagg2880gtacaaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgc2940tttgttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaacatttgcat3000ttgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttg3060gtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagc3120tcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaa3180aaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaac3240atttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcata3300taatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttattt3360atgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaac3420aaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3480<210>27<211>52<212>DNA<213>人工序列<220><223>引物IF-HT1*-PDI.c<400>27gtcgggcccaataccgcggagacaatggcgaaaaacgttgcgattttcggct52<210>28<211>52<212>DNA<213>人工序列<220><223>引物IF-HT2*-PDI.c<400>28gtcgggcccaataccgcggaggaaatggcgaaaaacgttgcgattttcggct52<210>29<211>52<212>DNA<213>人工序列<220><223>引物IF-HT3*-PDI.c<400>29gtcgggcccaataccgcggaaaaaatggcgaaaaacgttgcgattttcggct52<210>30<211>52<212>DNA<213>人工序列<220><223>引物IF-HT4*-PDI.c<400>30gtcgggcccaataccgcggaaacaatggcgaaaaacgttgcgattttcggct52<210>31<211>52<212>DNA<213>人工序列<220><223>引物IF-HT5*-PDI.c<400>31gtcgggcccaataccgcggaagcaatggcgaaaaacgttgcgattttcggct52<210>32<211>52<212>DNA<213>人工序列<220><223>引物IF-HT6*-PDI.c<400>32gtcgggcccaataccgcggaagaaatggcgaaaaacgttgcgattttcggct52<210>33<211>53<212>DNA<213>人工序列<220><223>IF-HT7*-PDI.c<400>33gtcgggcccaataccgcggaaagaaatggcgaaaaacgttgcgattttcggct53<210>34<211>54<212>DNA<213>人工序列<220><223>IF-HT8*-PDI.c<400>34gtcgggcccaataccgcggaaaagaaatggcgaaaaacgttgcgattttcggct54<210>35<211>1722<212>DNA<213>人工序列<220><223>PDISP/H1California的核苷酸序列<400>35atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgctgacacattatgtataggttatcatgcgaacaattcaacagacactgta120gacacagtactagaaaagaatgtaacagtaacacactctgttaaccttctagaagacaag180cataacgggaaactatgcaaactaagaggggtagccccattgcatttgggtaaatgtaac240attgctggctggatcctgggaaatccagagtgtgaatcactctccacagcaagctcatgg300tcctacattgtggaaacacctagttcagacaatggaacgtgttacccaggagatttcatc360gattatgaggagctaagagagcaattgagctcagtgtcatcatttgaaaggtttgagata420ttccccaagacaagttcatggcccaatcatgactcgaacaaaggtgtaacggcagcatgt480cctcatgctggagcaaaaagcttctacaaaaatttaatatggctagttaaaaaaggaaat540tcatacccaaagctcagcaaatcctacattaatgataaagggaaagaagtcctcgtgcta600tggggcattcaccatccatctactagtgctgaccaacaaagtctctatcagaatgcagat660gcatatgtttttgtggggtcatcaagatacagcaagaagttcaagccggaaatagcaata720agacccaaagtgagggatcaagaagggagaatgaactattactggacactagtagagccg780ggagacaaaataacattcgaagcaactggaaatctagtggtaccgagatatgcattcgca840atggaaagaaatgctggatctggtattatcatttcagatacaccagtccacgattgcaat900acaacttgtcaaacacccaagggtgctataaacaccagcctcccatttcagaatatacat960ccgatcacaattggaaaatgtccaaaatatgtaaaaagcacaaaattgagactggccaca1020ggattgaggaatatcccgtctattcaatctagaggactatttggggccattgccggtttc1080attgaaggggggtggacagggatggtagatggatggtacggttatcaccatcaaaatgag1140caggggtcaggatatgcagccgacctgaagagcacacagaatgccattgacgagattact1200aacaaagtaaattctgttattgaaaagatgaatacacagttcacagcagtaggtaaagag1260ttcaaccacctggaaaaaagaatagagaatttaaataaaaaagttgatgatggtttcctg1320gacatttggacttacaatgccgaactgttggttctattggaaaatgaaagaactttggac1380taccacgattcaaatgtgaagaacttatatgaaaaggtaagaagccagctaaaaaacaat1440gccaaggaaattggaaacggctgctttgaattttaccacaaatgcgataacacgtgcatg1500gaaagtgtcaaaaatgggacttatgactacccaaaatactcagaggaagcaaaattaaac1560agagaagaaatagatggggtaaagctggaatcaacaaggatttaccagattttggcgatc1620tattcaactgtcgccagttcattggtactggtagtctccctgggggcaatcagtttctgg1680atgtgctctaatgggtctctacagtgtagaatatgtatttaa1722<210>36<211>573<212>PRT<213>人工序列<220><223>PDISP/H1California的氨基酸序列<400>36MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspThrLeuCysIleGlyTyrHis202530AlaAsnAsnSerThrAspThrValAspThrValLeuGluLysAsnVal354045ThrValThrHisSerValAsnLeuLeuGluAspLysHisAsnGlyLys505560LeuCysLysLeuArgGlyValAlaProLeuHisLeuGlyLysCysAsn65707580IleAlaGlyTrpIleLeuGlyAsnProGluCysGluSerLeuSerThr859095AlaSerSerTrpSerTyrIleValGluThrProSerSerAspAsnGly100105110ThrCysTyrProGlyAspPheIleAspTyrGluGluLeuArgGluGln115120125LeuSerSerValSerSerPheGluArgPheGluIlePheProLysThr130135140SerSerTrpProAsnHisAspSerAsnLysGlyValThrAlaAlaCys145150155160ProHisAlaGlyAlaLysSerPheTyrLysAsnLeuIleTrpLeuVal165170175LysLysGlyAsnSerTyrProLysLeuSerLysSerTyrIleAsnAsp180185190LysGlyLysGluValLeuValLeuTrpGlyIleHisHisProSerThr195200205SerAlaAspGlnGlnSerLeuTyrGlnAsnAlaAspAlaTyrValPhe210215220ValGlySerSerArgTyrSerLysLysPheLysProGluIleAlaIle225230235240ArgProLysValArgAspGlnGluGlyArgMetAsnTyrTyrTrpThr245250255LeuValGluProGlyAspLysIleThrPheGluAlaThrGlyAsnLeu260265270ValValProArgTyrAlaPheAlaMetGluArgAsnAlaGlySerGly275280285IleIleIleSerAspThrProValHisAspCysAsnThrThrCysGln290295300ThrProLysGlyAlaIleAsnThrSerLeuProPheGlnAsnIleHis305310315320ProIleThrIleGlyLysCysProLysTyrValLysSerThrLysLeu325330335ArgLeuAlaThrGlyLeuArgAsnIleProSerIleGlnSerArgGly340345350LeuPheGlyAlaIleAlaGlyPheIleGluGlyGlyTrpThrGlyMet355360365ValAspGlyTrpTyrGlyTyrHisHisGlnAsnGluGlnGlySerGly370375380TyrAlaAlaAspLeuLysSerThrGlnAsnAlaIleAspGluIleThr385390395400AsnLysValAsnSerValIleGluLysMetAsnThrGlnPheThrAla405410415ValGlyLysGluPheAsnHisLeuGluLysArgIleGluAsnLeuAsn420425430LysLysValAspAspGlyPheLeuAspIleTrpThrTyrAsnAlaGlu435440445LeuLeuValLeuLeuGluAsnGluArgThrLeuAspTyrHisAspSer450455460AsnValLysAsnLeuTyrGluLysValArgSerGlnLeuLysAsnAsn465470475480AlaLysGluIleGlyAsnGlyCysPheGluPheTyrHisLysCysAsp485490495AsnThrCysMetGluSerValLysAsnGlyThrTyrAspTyrProLys500505510TyrSerGluGluAlaLysLeuAsnArgGluGluIleAspGlyValLys515520525LeuGluSerThrArgIleTyrGlnIleLeuAlaIleTyrSerThrVal530535540AlaSerSerLeuValLeuValValSerLeuGlyAlaIleSerPheTrp545550555560MetCysSerAsnGlySerLeuGlnCysArgIleCysIle565570<210>37<211>1728<212>DNA<213>人工序列<220><223>PDISP/H5Indonesia的核苷酸序列<400>37atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgccgatcagatttgcattggttaccatgcaaacaattcaacagagcaggtt120gacacaatcatggaaaagaacgttactgttacacatgcccaagacatactggaaaagaca180cacaacgggaagctctgcgatctagatggagtgaagcctctaattttaagagattgtagt240gtagctggatggctcctcgggaacccaatgtgtgacgaattcatcaatgtaccggaatgg300tcttacatagtggagaaggccaatccaaccaatgacctctgttacccagggagtttcaac360gactatgaagaactgaaacacctattgagcagaataaaccattttgagaaaattcaaatc420atccccaaaagttcttggtccgatcatgaagcctcatcaggagttagctcagcatgtcca480tacctgggaagtccctccttttttagaaatgtggtatggcttatcaaaaagaacagtaca540tacccaacaataaagaaaagctacaataataccaaccaagaggatcttttggtactgtgg600ggaattcaccatcctaatgatgcggcagagcagacaaggctatatcaaaacccaaccacc660tatatttccattgggacatcaacactaaaccagagattggtaccaaaaatagctactaga720tccaaagtaaacgggcaaagtggaaggatggagttcttctggacaattttaaaacctaat780gatgcaatcaacttcgagagtaatggaaatttcattgctccagaatatgcatacaaaatt840gtcaagaaaggggactcagcaattatgaaaagtgaattggaatatggtaactgcaacacc900aagtgtcaaactccaatgggggcgataaactctagtatgccattccacaacatacaccct960ctcaccatcggggaatgccccaaatatgtgaaatcaaacagattagtccttgcaacaggg1020ctcagaaatagccctcaaagagagagcagaagaaaaaagagaggactatttggagctata1080gcaggttttatagagggaggatggcagggaatggtagatggttggtatgggtaccaccat1140agcaatgagcaggggagtgggtacgctgcagacaaagaatccactcaaaaggcaatagat1200ggagtcaccaataaggtcaactcaatcattgacaaaatgaacactcagtttgaggccgtt1260ggaagggaatttaataacttagaaaggagaatagagaatttaaacaagaagatggaagac1320gggtttctagatgtctggacttataatgccgaacttctggttctcatggaaaatgagaga1380actctagactttcatgactcaaatgttaagaacctctacgacaaggtccgactacagctt1440agggataatgcaaaggagctgggtaacggttgtttcgagttctatcacaaatgtgataat1500gaatgtatggaaagtataagaaacggaacgtacaactatccgcagtattcagaagaagca1560agattaaaaagagaggaaataagtggggtaaaattggaatcaataggaacttaccaaata1620ctgtcaatttattcaacagtggcgagttccctagcactggcaatcatgatggctggtcta1680tctttatggatgtgctccaatggatcgttacaatgcagaatttgcatt1728<210>38<211>576<212>PRT<213>人工序列<220><223>PDISP/H5Indonesia的氨基酸序列<400>38MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspGlnIleCysIleGlyTyrHis202530AlaAsnAsnSerThrGluGlnValAspThrIleMetGluLysAsnVal354045ThrValThrHisAlaGlnAspIleLeuGluLysThrHisAsnGlyLys505560LeuCysAspLeuAspGlyValLysProLeuIleLeuArgAspCysSer65707580ValAlaGlyTrpLeuLeuGlyAsnProMetCysAspGluPheIleAsn859095ValProGluTrpSerTyrIleValGluLysAlaAsnProThrAsnAsp100105110LeuCysTyrProGlySerPheAsnAspTyrGluGluLeuLysHisLeu115120125LeuSerArgIleAsnHisPheGluLysIleGlnIleIleProLysSer130135140SerTrpSerAspHisGluAlaSerSerGlyValSerSerAlaCysPro145150155160TyrLeuGlySerProSerPhePheArgAsnValValTrpLeuIleLys165170175LysAsnSerThrTyrProThrIleLysLysSerTyrAsnAsnThrAsn180185190GlnGluAspLeuLeuValLeuTrpGlyIleHisHisProAsnAspAla195200205AlaGluGlnThrArgLeuTyrGlnAsnProThrThrTyrIleSerIle210215220GlyThrSerThrLeuAsnGlnArgLeuValProLysIleAlaThrArg225230235240SerLysValAsnGlyGlnSerGlyArgMetGluPhePheTrpThrIle245250255LeuLysProAsnAspAlaIleAsnPheGluSerAsnGlyAsnPheIle260265270AlaProGluTyrAlaTyrLysIleValLysLysGlyAspSerAlaIle275280285MetLysSerGluLeuGluTyrGlyAsnCysAsnThrLysCysGlnThr290295300ProMetGlyAlaIleAsnSerSerMetProPheHisAsnIleHisPro305310315320LeuThrIleGlyGluCysProLysTyrValLysSerAsnArgLeuVal325330335LeuAlaThrGlyLeuArgAsnSerProGlnArgGluSerArgArgLys340345350LysArgGlyLeuPheGlyAlaIleAlaGlyPheIleGluGlyGlyTrp355360365GlnGlyMetValAspGlyTrpTyrGlyTyrHisHisSerAsnGluGln370375380GlySerGlyTyrAlaAlaAspLysGluSerThrGlnLysAlaIleAsp385390395400GlyValThrAsnLysValAsnSerIleIleAspLysMetAsnThrGln405410415PheGluAlaValGlyArgGluPheAsnAsnLeuGluArgArgIleGlu420425430AsnLeuAsnLysLysMetGluAspGlyPheLeuAspValTrpThrTyr435440445AsnAlaGluLeuLeuValLeuMetGluAsnGluArgThrLeuAspPhe450455460HisAspSerAsnValLysAsnLeuTyrAspLysValArgLeuGlnLeu465470475480ArgAspAsnAlaLysGluLeuGlyAsnGlyCysPheGluPheTyrHis485490495LysCysAspAsnGluCysMetGluSerIleArgAsnGlyThrTyrAsn500505510TyrProGlnTyrSerGluGluAlaArgLeuLysArgGluGluIleSer515520525GlyValLysLeuGluSerIleGlyThrTyrGlnIleLeuSerIleTyr530535540SerThrValAlaSerSerLeuAlaLeuAlaIleMetMetAlaGlyLeu545550555560SerLeuTrpMetCysSerAsnGlySerLeuGlnCysArgIleCysIle565570575<210>39<211>1701<212>DNA<213>人工序列<220><223>PDISP/H7Hangzhou的核苷酸序列<400>39atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgcggacaaaatctgcctcggacatcatgccgtgtcaaacggaaccaaagta120aacacattaactgaaagaggagtggaagtcgtcaatgcaactgaaacagtggaacgaaca180aacatccccaggatctgctcaaaagggaaaaggacagttgacctcggtcaatgtggactc240ctggggacaatcactggaccacctcaatgtgaccaattcctagaattttcagccgattta300attattgagaggcgagaaggaagtgatgtctgttatcctgggaaattcgtgaatgaagaa360gctctgaggcaaattctcagagaatcaggcggaattgacaaggaagcaatgggattcaca420tacagtggaataagaactaatggagcaaccagtgcatgtaggagatcaggatcttcattc480tatgcagaaatgaaatggctcctgtcaaacacagataatgctgcattcccgcagatgact540aagtcatataaaaatacaagaaaaagcccagctctaatagtatgggggatccatcattcc600gtatcaactgcagagcaaaccaagctatatgggagtggaaacaaactggtgacagttggg660agttctaattatcaacaatcttttgtaccgagtccaggagcgagaccacaagttaatggt720atatctggaagaattgactttcattggctaatgctaaatcccaatgatacagtcactttc780agtttcaatggggctttcatagctccagaccgtgcaagcttcctgagaggaaaatctatg840ggaatccagagtggagtacaggttgatgccaattgtgaaggggactgctatcatagtgga900gggacaataataagtaacttgccatttcagaacatagatagcagggcagttggaaaatgt960ccgagatatgttaagcaaaggagtctgctgctagcaacagggatgaagaatgttcctgag1020attccaaagggaagaggcctatttggtgctatagcgggtttcattgaaaatggatgggaa1080ggcctaattgatggttggtatggtttcagacaccagaatgcacagggagagggaactgct1140gcagattacaaaagcactcaatcggcaattgatcaaataacaggaaaattaaaccggctt1200atagaaaaaaccaaccaacaatttgagttgatcgacaatgaattcaatgaggtagagaag1260caaatcggtaatgtgataaattggaccagagattctataacagaagtgtggtcatacaat1320gctgaactcttggtagcaatggagaaccagcatacaattgatctggctgattcagaaatg1380gacaaactgtacgaacgagtgaaaagacagctgagagagaatgctgaagaagatggcact1440ggttgctttgaaatatttcacaagtgtgatgatgactgtatggccagtattagaaataac1500acctatgatcacagcaaatacagggaagaggcaatgcaaaatagaatacagattgaccca1560gtcaaactaagcagcggctacaaagatgtgatactttggtttagcttcggggcatcatgt1620ttcatacttctagccattgtaatgggccttgtcttcatatgtgtaaagaatggaaacatg1680cggtgcactatttgtatataa1701<210>40<211>566<212>PRT<213>人工序列<220><223>PDISP/H7Hangzhou的氨基酸序列<400>40MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspLysIleCysLeuGlyHisHis202530AlaValSerAsnGlyThrLysValAsnThrLeuThrGluArgGlyVal354045GluValValAsnAlaThrGluThrValGluArgThrAsnIleProArg505560IleCysSerLysGlyLysArgThrValAspLeuGlyGlnCysGlyLeu65707580LeuGlyThrIleThrGlyProProGlnCysAspGlnPheLeuGluPhe859095SerAlaAspLeuIleIleGluArgArgGluGlySerAspValCysTyr100105110ProGlyLysPheValAsnGluGluAlaLeuArgGlnIleLeuArgGlu115120125SerGlyGlyIleAspLysGluAlaMetGlyPheThrTyrSerGlyIle130135140ArgThrAsnGlyAlaThrSerAlaCysArgArgSerGlySerSerPhe145150155160TyrAlaGluMetLysTrpLeuLeuSerAsnThrAspAsnAlaAlaPhe165170175ProGlnMetThrLysSerTyrLysAsnThrArgLysSerProAlaLeu180185190IleValTrpGlyIleHisHisSerValSerThrAlaGluGlnThrLys195200205LeuTyrGlySerGlyAsnLysLeuValThrValGlySerSerAsnTyr210215220GlnGlnSerPheValProSerProGlyAlaArgProGlnValAsnGly225230235240IleSerGlyArgIleAspPheHisTrpLeuMetLeuAsnProAsnAsp245250255ThrValThrPheSerPheAsnGlyAlaPheIleAlaProAspArgAla260265270SerPheLeuArgGlyLysSerMetGlyIleGlnSerGlyValGlnVal275280285AspAlaAsnCysGluGlyAspCysTyrHisSerGlyGlyThrIleIle290295300SerAsnLeuProPheGlnAsnIleAspSerArgAlaValGlyLysCys305310315320ProArgTyrValLysGlnArgSerLeuLeuLeuAlaThrGlyMetLys325330335AsnValProGluIleProLysGlyArgGlyLeuPheGlyAlaIleAla340345350GlyPheIleGluAsnGlyTrpGluGlyLeuIleAspGlyTrpTyrGly355360365PheArgHisGlnAsnAlaGlnGlyGluGlyThrAlaAlaAspTyrLys370375380SerThrGlnSerAlaIleAspGlnIleThrGlyLysLeuAsnArgLeu385390395400IleGluLysThrAsnGlnGlnPheGluLeuIleAspAsnGluPheAsn405410415GluValGluLysGlnIleGlyAsnValIleAsnTrpThrArgAspSer420425430IleThrGluValTrpSerTyrAsnAlaGluLeuLeuValAlaMetGlu435440445AsnGlnHisThrIleAspLeuAlaAspSerGluMetAspLysLeuTyr450455460GluArgValLysArgGlnLeuArgGluAsnAlaGluGluAspGlyThr465470475480GlyCysPheGluIlePheHisLysCysAspAspAspCysMetAlaSer485490495IleArgAsnAsnThrTyrAspHisSerLysTyrArgGluGluAlaMet500505510GlnAsnArgIleGlnIleAspProValLysLeuSerSerGlyTyrLys515520525AspValIleLeuTrpPheSerPheGlyAlaSerCysPheIleLeuLeu530535540AlaIleValMetGlyLeuValPheIleCysValLysAsnGlyAsnMet545550555560ArgCysThrIleCysIle565<210>41<211>1698<212>DNA<213>人工序列<220><223>PDISP/H7Hangzhou+H5IndonesiaTMCT的核苷酸序列<400>41atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgcggacaaaatctgcctcggacatcatgccgtgtcaaacggaaccaaagta120aacacattaactgaaagaggagtggaagtcgtcaatgcaactgaaacagtggaacgaaca180aacatccccaggatctgctcaaaagggaaaaggacagttgacctcggtcaatgtggactc240ctggggacaatcactggaccacctcaatgtgaccaattcctagaattttcagccgattta300attattgagaggcgagaaggaagtgatgtctgttatcctgggaaattcgtgaatgaagaa360gctctgaggcaaattctcagagaatcaggcggaattgacaaggaagcaatgggattcaca420tacagtggaataagaactaatggagcaaccagtgcatgtaggagatcaggatcttcattc480tatgcagaaatgaaatggctcctgtcaaacacagataatgctgcattcccgcagatgact540aagtcatataaaaatacaagaaaaagcccagctctaatagtatgggggatccatcattcc600gtatcaactgcagagcaaaccaagctatatgggagtggaaacaaactggtgacagttggg660agttctaattatcaacaatcttttgtaccgagtccaggagcgagaccacaagttaatggt720atatctggaagaattgactttcattggctaatgctaaatcccaatgatacagtcactttc780agtttcaatggggctttcatagctccagaccgtgcaagcttcctgagaggaaaatctatg840ggaatccagagtggagtacaggttgatgccaattgtgaaggggactgctatcatagtgga900gggacaataataagtaacttgccatttcagaacatagatagcagggcagttggaaaatgt960ccgagatatgttaagcaaaggagtctgctgctagcaacagggatgaagaatgttcctgag1020attccaaagggaagaggcctatttggtgctatagcgggtttcattgaaaatggatgggaa1080ggcctaattgatggttggtatggtttcagacaccagaatgcacagggagagggaactgct1140gcagattacaaaagcactcaatcggcaattgatcaaataacaggaaaattaaaccggctt1200atagaaaaaaccaaccaacaatttgagttgatcgacaatgaattcaatgaggtagagaag1260caaatcggtaatgtgataaattggaccagagattctataacagaagtgtggtcatacaat1320gctgaactcttggtagcaatggagaaccagcatacaattgatctggctgattcagaaatg1380gacaaactgtacgaacgagtgaaaagacagctgagagagaatgctgaagaagatggcact1440ggttgctttgaaatatttcacaagtgtgatgatgactgtatggccagtattagaaataac1500acctatgatcacagcaaatacagggaagaggcaatgcaaaatagaatacagattgaccca1560gtcaaactaagcagcggctaccaaatactgtcaatttattcaacagtggcgagttcccta1620gcactggcaatcatgatggctggtctatctttatggatgtgctccaatggatcgttacaa1680tgcagaatttgcatttaa1698<210>42<211>565<212>PRT<213>人工序列<220><223>PDISP/H7Hangzhou+H5IndonesiaTMCT的氨基酸序列<400>42MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspLysIleCysLeuGlyHisHis202530AlaValSerAsnGlyThrLysValAsnThrLeuThrGluArgGlyVal354045GluValValAsnAlaThrGluThrValGluArgThrAsnIleProArg505560IleCysSerLysGlyLysArgThrValAspLeuGlyGlnCysGlyLeu65707580LeuGlyThrIleThrGlyProProGlnCysAspGlnPheLeuGluPhe859095SerAlaAspLeuIleIleGluArgArgGluGlySerAspValCysTyr100105110ProGlyLysPheValAsnGluGluAlaLeuArgGlnIleLeuArgGlu115120125SerGlyGlyIleAspLysGluAlaMetGlyPheThrTyrSerGlyIle130135140ArgThrAsnGlyAlaThrSerAlaCysArgArgSerGlySerSerPhe145150155160TyrAlaGluMetLysTrpLeuLeuSerAsnThrAspAsnAlaAlaPhe165170175ProGlnMetThrLysSerTyrLysAsnThrArgLysSerProAlaLeu180185190IleValTrpGlyIleHisHisSerValSerThrAlaGluGlnThrLys195200205LeuTyrGlySerGlyAsnLysLeuValThrValGlySerSerAsnTyr210215220GlnGlnSerPheValProSerProGlyAlaArgProGlnValAsnGly225230235240IleSerGlyArgIleAspPheHisTrpLeuMetLeuAsnProAsnAsp245250255ThrValThrPheSerPheAsnGlyAlaPheIleAlaProAspArgAla260265270SerPheLeuArgGlyLysSerMetGlyIleGlnSerGlyValGlnVal275280285AspAlaAsnCysGluGlyAspCysTyrHisSerGlyGlyThrIleIle290295300SerAsnLeuProPheGlnAsnIleAspSerArgAlaValGlyLysCys305310315320ProArgTyrValLysGlnArgSerLeuLeuLeuAlaThrGlyMetLys325330335AsnValProGluIleProLysGlyArgGlyLeuPheGlyAlaIleAla340345350GlyPheIleGluAsnGlyTrpGluGlyLeuIleAspGlyTrpTyrGly355360365PheArgHisGlnAsnAlaGlnGlyGluGlyThrAlaAlaAspTyrLys370375380SerThrGlnSerAlaIleAspGlnIleThrGlyLysLeuAsnArgLeu385390395400IleGluLysThrAsnGlnGlnPheGluLeuIleAspAsnGluPheAsn405410415GluValGluLysGlnIleGlyAsnValIleAsnTrpThrArgAspSer420425430IleThrGluValTrpSerTyrAsnAlaGluLeuLeuValAlaMetGlu435440445AsnGlnHisThrIleAspLeuAlaAspSerGluMetAspLysLeuTyr450455460GluArgValLysArgGlnLeuArgGluAsnAlaGluGluAspGlyThr465470475480GlyCysPheGluIlePheHisLysCysAspAspAspCysMetAlaSer485490495IleArgAsnAsnThrTyrAspHisSerLysTyrArgGluGluAlaMet500505510GlnAsnArgIleGlnIleAspProValLysLeuSerSerGlyTyrGln515520525IleLeuSerIleTyrSerThrValAlaSerSerLeuAlaLeuAlaIle530535540MetMetAlaGlyLeuSerLeuTrpMetCysSerAsnGlySerLeuGln545550555560CysArgIleCysIle565<210>43<211>1734<212>DNA<213>人工序列<220><223>PDISP/HABBrisbane(PrL-)的核苷酸序列<400>43atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620atactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatc1680tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734<210>44<211>577<212>PRT<213>人工序列<220><223>PDISP/HABBrisbane(PrL-)的氨基酸序列<400>44MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspArgIleCysThrGlyIleThr202530SerSerAsnSerProHisValValLysThrAlaThrGlnGlyGluVal354045AsnValThrGlyValIleProLeuThrThrThrProThrLysSerHis505560PheAlaAsnLeuLysGlyThrGluThrArgGlyLysLeuCysProLys65707580CysLeuAsnCysThrAspLeuAspValAlaLeuGlyArgProLysCys859095ThrGlyLysIleProSerAlaArgValSerIleLeuHisGluValArg100105110ProValThrSerGlyCysPheProIleMetHisAspArgThrLysIle115120125ArgGlnLeuProAsnLeuLeuArgGlyTyrGluHisIleArgLeuSer130135140ThrHisAsnValIleAsnAlaGluAsnAlaProGlyGlyProTyrLys145150155160IleGlyThrSerGlySerCysProAsnIleThrAsnGlyAsnGlyPhe165170175PheAlaThrMetAlaTrpAlaValProLysAsnAspLysAsnLysThr180185190AlaThrAsnProLeuThrIleGluValProTyrIleCysThrGluGly195200205GluAspGlnIleThrValTrpGlyPheHisSerAspAsnGluThrGln210215220MetAlaLysLeuTyrGlyAspSerLysProGlnLysPheThrSerSer225230235240AlaAsnGlyValThrThrHisTyrValSerGlnIleGlyGlyPhePro245250255AsnGlnThrGluAspGlyGlyLeuProGlnSerGlyArgIleValVal260265270AspTyrMetValGlnLysSerGlyLysThrGlyThrIleThrTyrGln275280285ArgGlyIleLeuLeuProGlnLysValTrpCysAlaSerGlyArgSer290295300LysValIleLysGlySerLeuProLeuIleGlyGluAlaAspCysLeu305310315320HisGluLysTyrGlyGlyLeuAsnLysSerLysProTyrTyrThrGly325330335GluHisAlaLysAlaIleGlyAsnCysProIleTrpValLysThrPro340345350LeuLysLeuAlaAsnGlyThrLysTyrArgProProGlyGlyGlyTrp355360365GluGlyMetIleAlaGlyTrpHisGlyTyrThrSerHisGlyAlaHis370375380GlyValAlaValAlaAlaAspLeuLysSerThrGlnGluAlaIleAsn385390395400LysIleThrLysAsnLeuAsnSerLeuSerGluLeuGluValLysAsn405410415LeuGlnArgLeuSerGlyAlaMetAspGluLeuHisAsnGluIleLeu420425430GluLeuAspGluLysValAspAspLeuArgAlaAspThrIleSerSer435440445GlnIleGluLeuAlaValLeuLeuSerAsnGluGlyIleIleAsnSer450455460GluAspGluHisLeuLeuAlaLeuGluArgLysLeuLysLysMetLeu465470475480GlyProSerAlaValGluIleGlyAsnGlyCysPheGluThrLysHis485490495LysCysAsnGlnThrCysLeuAspArgIleAlaAlaGlyThrPheAsp500505510AlaGlyGluPheSerLeuProThrPheAspSerLeuAsnIleThrAla515520525AlaSerLeuAsnAspAspGlyLeuAspAsnHisThrIleLeuLeuTyr530535540TyrSerThrAlaAlaSerSerLeuAlaValThrLeuMetIleAlaIle545550555560PheValValTyrMetValSerArgAspAsnValSerCysSerIleCys565570575Leu<210>45<211>1734<212>DNA<213>人工序列<220><223>PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT的核苷酸序列<400>45atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560tttgattcactgaatattactgctgcatctttaaatgacgatggattggataattaccag1620attttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggca1680atcagtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1734<210>46<211>577<212>PRT<213>人工序列<220><223>PDISP/HABBrisbane(PrL-)+H1CaliforniaTMCT的氨基酸序列<400>46MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspArgIleCysThrGlyIleThr202530SerSerAsnSerProHisValValLysThrAlaThrGlnGlyGluVal354045AsnValThrGlyValIleProLeuThrThrThrProThrLysSerHis505560PheAlaAsnLeuLysGlyThrGluThrArgGlyLysLeuCysProLys65707580CysLeuAsnCysThrAspLeuAspValAlaLeuGlyArgProLysCys859095ThrGlyLysIleProSerAlaArgValSerIleLeuHisGluValArg100105110ProValThrSerGlyCysPheProIleMetHisAspArgThrLysIle115120125ArgGlnLeuProAsnLeuLeuArgGlyTyrGluHisIleArgLeuSer130135140ThrHisAsnValIleAsnAlaGluAsnAlaProGlyGlyProTyrLys145150155160IleGlyThrSerGlySerCysProAsnIleThrAsnGlyAsnGlyPhe165170175PheAlaThrMetAlaTrpAlaValProLysAsnAspLysAsnLysThr180185190AlaThrAsnProLeuThrIleGluValProTyrIleCysThrGluGly195200205GluAspGlnIleThrValTrpGlyPheHisSerAspAsnGluThrGln210215220MetAlaLysLeuTyrGlyAspSerLysProGlnLysPheThrSerSer225230235240AlaAsnGlyValThrThrHisTyrValSerGlnIleGlyGlyPhePro245250255AsnGlnThrGluAspGlyGlyLeuProGlnSerGlyArgIleValVal260265270AspTyrMetValGlnLysSerGlyLysThrGlyThrIleThrTyrGln275280285ArgGlyIleLeuLeuProGlnLysValTrpCysAlaSerGlyArgSer290295300LysValIleLysGlySerLeuProLeuIleGlyGluAlaAspCysLeu305310315320HisGluLysTyrGlyGlyLeuAsnLysSerLysProTyrTyrThrGly325330335GluHisAlaLysAlaIleGlyAsnCysProIleTrpValLysThrPro340345350LeuLysLeuAlaAsnGlyThrLysTyrArgProProGlyGlyGlyTrp355360365GluGlyMetIleAlaGlyTrpHisGlyTyrThrSerHisGlyAlaHis370375380GlyValAlaValAlaAlaAspLeuLysSerThrGlnGluAlaIleAsn385390395400LysIleThrLysAsnLeuAsnSerLeuSerGluLeuGluValLysAsn405410415LeuGlnArgLeuSerGlyAlaMetAspGluLeuHisAsnGluIleLeu420425430GluLeuAspGluLysValAspAspLeuArgAlaAspThrIleSerSer435440445GlnIleGluLeuAlaValLeuLeuSerAsnGluGlyIleIleAsnSer450455460GluAspGluHisLeuLeuAlaLeuGluArgLysLeuLysLysMetLeu465470475480GlyProSerAlaValGluIleGlyAsnGlyCysPheGluThrLysHis485490495LysCysAsnGlnThrCysLeuAspArgIleAlaAlaGlyThrPheAsp500505510AlaGlyGluPheSerLeuProThrPheAspSerLeuAsnIleThrAla515520525AlaSerLeuAsnAspAspGlyLeuAspAsnTyrGlnIleLeuAlaIle530535540TyrSerThrValAlaSerSerLeuValLeuValValSerLeuGlyAla545550555560IleSerPheTrpMetCysSerAsnGlySerLeuGlnCysArgIleCys565570575Ile<210>47<211>1731<212>DNA<213>人工序列<220><223>PDISP/HABMassachussetts(PrL-)的核苷酸序列<400>47atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560gattcattgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731<210>48<211>576<212>PRT<213>人工序列<220><223>PDISP/HABMassachussetts(PrL-)的氨基酸序列<400>48MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspArgIleCysThrGlyIleThr202530SerSerAsnSerProHisValValLysThrAlaThrGlnGlyGluVal354045AsnValThrGlyValIleProLeuThrThrThrProThrLysSerTyr505560PheAlaAsnLeuLysGlyThrLysThrArgGlyLysLeuCysProAsp65707580CysLeuAsnCysThrAspLeuAspValAlaLeuGlyArgProMetCys859095ValGlyThrThrProSerAlaLysAlaSerIleLeuHisGluValArg100105110ProValThrSerGlyCysPheProIleMetHisAspArgThrLysIle115120125ArgGlnLeuAlaAsnLeuLeuArgGlyTyrGluAsnIleArgLeuSer130135140ThrGlnAsnValIleAspAlaGluLysAlaProGlyGlyProTyrArg145150155160LeuGlyThrSerGlySerCysProAsnAlaThrSerLysSerGlyPhe165170175PheAlaThrMetAlaTrpAlaValProLysAspAsnAsnLysAsnAla180185190ThrAsnProLeuThrValGluValProTyrIleCysAlaGluGlyGlu195200205AspGlnIleThrValTrpGlyPheHisSerAspAsnLysThrGlnMet210215220LysAsnLeuTyrGlyAspSerAsnProGlnLysPheThrSerSerAla225230235240AsnGlyValThrThrHisTyrValSerGlnIleGlyGlyPheProAsp245250255GlnThrGluAspGlyGlyLeuProGlnSerGlyArgIleValValAsp260265270TyrMetMetGlnLysProGlyLysThrGlyThrIleValTyrGlnArg275280285GlyValLeuLeuProGlnLysValTrpCysAlaSerGlyArgSerLys290295300ValIleLysGlySerLeuProLeuIleGlyGluAlaAspCysLeuHis305310315320GluLysTyrGlyGlyLeuAsnLysSerLysProTyrTyrThrGlyGlu325330335HisAlaLysAlaIleGlyAsnCysProIleTrpValLysThrProLeu340345350LysLeuAlaAsnGlyThrLysTyrArgProProGlyGlyGlyTrpGlu355360365GlyMetIleAlaGlyTrpHisGlyTyrThrSerHisGlyAlaHisGly370375380ValAlaValAlaAlaAspLeuLysSerThrGlnGluAlaIleAsnLys385390395400IleThrLysAsnLeuAsnSerLeuSerGluLeuGluValLysAsnLeu405410415GlnArgLeuSerGlyAlaMetAspGluLeuHisAsnGluIleLeuGlu420425430LeuAspGluLysValAspAspLeuArgAlaAspThrIleSerSerGln435440445IleGluLeuAlaValLeuLeuSerAsnGluGlyIleIleAsnSerGlu450455460AspGluHisLeuLeuAlaLeuGluArgLysLeuLysLysMetLeuGly465470475480ProSerAlaValAspIleGlyAsnGlyCysPheGluThrLysHisLys485490495CysAsnGlnThrCysLeuAspArgIleAlaAlaGlyThrPheAsnAla500505510GlyGluPheSerLeuProThrPheAspSerLeuAsnIleThrAlaAla515520525SerLeuAsnAspAspGlyLeuAspAsnHisThrIleLeuLeuTyrTyr530535540SerThrAlaAlaSerSerLeuAlaValThrLeuMetLeuAlaIlePhe545550555560IleValTyrMetValSerArgAspAsnValSerCysSerIleCysLeu565570575<210>49<211>1731<212>DNA<213>人工序列<220><223>PDISP/HABMassachussetts(PrL-)+H1CaliforniaTMCT的核苷酸序列<400>49atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560gattcattgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731<210>50<211>576<212>PRT<213>人工序列<220><223>PDISP/HABMassachussetts(PrL-)+H1CaliforniaTMCT的氨基酸序列<400>50MetAlaLysAsnValAlaIlePheGlyLeuLeuPheSerLeuLeuVal151015LeuValProSerGlnIlePheAlaAspArgIleCysThrGlyIleThr202530SerSerAsnSerProHisValValLysThrAlaThrGlnGlyGluVal354045AsnValThrGlyValIleProLeuThrThrThrProThrLysSerTyr505560PheAlaAsnLeuLysGlyThrLysThrArgGlyLysLeuCysProAsp65707580CysLeuAsnCysThrAspLeuAspValAlaLeuGlyArgProMetCys859095ValGlyThrThrProSerAlaLysAlaSerIleLeuHisGluValArg100105110ProValThrSerGlyCysPheProIleMetHisAspArgThrLysIle115120125ArgGlnLeuAlaAsnLeuLeuArgGlyTyrGluAsnIleArgLeuSer130135140ThrGlnAsnValIleAspAlaGluLysAlaProGlyGlyProTyrArg145150155160LeuGlyThrSerGlySerCysProAsnAlaThrSerLysSerGlyPhe165170175PheAlaThrMetAlaTrpAlaValProLysAspAsnAsnLysAsnAla180185190ThrAsnProLeuThrValGluValProTyrIleCysAlaGluGlyGlu195200205AspGlnIleThrValTrpGlyPheHisSerAspAsnLysThrGlnMet210215220LysAsnLeuTyrGlyAspSerAsnProGlnLysPheThrSerSerAla225230235240AsnGlyValThrThrHisTyrValSerGlnIleGlyGlyPheProAsp245250255GlnThrGluAspGlyGlyLeuProGlnSerGlyArgIleValValAsp260265270TyrMetMetGlnLysProGlyLysThrGlyThrIleValTyrGlnArg275280285GlyValLeuLeuProGlnLysValTrpCysAlaSerGlyArgSerLys290295300ValIleLysGlySerLeuProLeuIleGlyGluAlaAspCysLeuHis305310315320GluLysTyrGlyGlyLeuAsnLysSerLysProTyrTyrThrGlyGlu325330335HisAlaLysAlaIleGlyAsnCysProIleTrpValLysThrProLeu340345350LysLeuAlaAsnGlyThrLysTyrArgProProGlyGlyGlyTrpGlu355360365GlyMetIleAlaGlyTrpHisGlyTyrThrSerHisGlyAlaHisGly370375380ValAlaValAlaAlaAspLeuLysSerThrGlnGluAlaIleAsnLys385390395400IleThrLysAsnLeuAsnSerLeuSerGluLeuGluValLysAsnLeu405410415GlnArgLeuSerGlyAlaMetAspGluLeuHisAsnGluIleLeuGlu420425430LeuAspGluLysValAspAspLeuArgAlaAspThrIleSerSerGln435440445IleGluLeuAlaValLeuLeuSerAsnGluGlyIleIleAsnSerGlu450455460AspGluHisLeuLeuAlaLeuGluArgLysLeuLysLysMetLeuGly465470475480ProSerAlaValAspIleGlyAsnGlyCysPheGluThrLysHisLys485490495CysAsnGlnThrCysLeuAspArgIleAlaAlaGlyThrPheAsnAla500505510GlyGluPheSerLeuProThrPheAspSerLeuAsnIleThrAlaAla515520525SerLeuAsnAspAspGlyLeuAspAsnTyrGlnIleLeuAlaIleTyr530535540SerThrValAlaSerSerLeuValLeuValValSerLeuGlyAlaIle545550555560SerPheTrpMetCysSerAsnGlySerLeuGlnCysArgIleCysIle565570575<210>51<211>1704<212>DNA<213>人工序列<220><223>HABWisconsin(PrL-)的核苷酸序列<400>51atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560ttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttct1620agtttggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaac1680gtttcatgctccatctgtctataa1704<210>52<211>567<212>PRT<213>人工序列<220><223>HABWisconsin(PrL-)的氨基酸序列<400>52MetLysAlaIleIleValLeuLeuMetValValThrSerAsnAlaAsp151015ArgIleCysThrGlyIleThrSerSerAsnSerProHisValValLys202530ThrAlaThrGlnGlyGluValAsnValThrGlyValIleProLeuThr354045ThrThrProThrLysSerTyrPheAlaAsnLeuLysGlyThrArgThr505560ArgGlyLysLeuCysProAspCysLeuAsnCysThrAspLeuAspVal65707580AlaLeuGlyArgProMetCysValGlyThrThrProSerAlaLysAla859095SerIleLeuHisGluValArgProValThrSerGlyCysPheProIle100105110MetHisAspArgThrLysIleArgGlnLeuProAsnLeuLeuArgGly115120125TyrGluAsnIleArgLeuSerThrGlnAsnValIleAspAlaGluLys130135140AlaProGlyGlyProTyrArgLeuGlyThrSerGlySerCysProAsn145150155160AlaThrSerLysIleGlyPhePheAlaThrMetAlaTrpAlaValPro165170175LysAspAsnTyrLysAsnAlaThrAsnProLeuThrValGluValPro180185190TyrIleCysThrGluGlyGluAspGlnIleThrValTrpGlyPheHis195200205SerAspAsnLysThrGlnMetLysSerLeuTyrGlyAspSerAsnPro210215220GlnLysPheThrSerSerAlaAsnGlyValThrThrHisTyrValSer225230235240GlnIleGlyAspPheProAspGlnThrGluAspGlyGlyLeuProGln245250255SerGlyArgIleValValAspTyrMetMetGlnLysProGlyLysThr260265270GlyThrIleValTyrGlnArgGlyValLeuLeuProGlnLysValTrp275280285CysAlaSerGlyArgSerLysValIleLysGlySerLeuProLeuIle290295300GlyGluAlaAspCysLeuHisGluLysTyrGlyGlyLeuAsnLysSer305310315320LysProTyrTyrThrGlyGluHisAlaLysAlaIleGlyAsnCysPro325330335IleTrpValLysThrProLeuLysLeuAlaAsnGlyThrLysTyrArg340345350ProProGlyGlyGlyTrpGluGlyMetIleAlaGlyTrpHisGlyTyr355360365ThrSerHisGlyAlaHisGlyValAlaValAlaAlaAspLeuLysSer370375380ThrGlnGluAlaIleAsnLysIleThrLysAsnLeuAsnSerLeuSer385390395400GluLeuGluValLysAsnLeuGlnArgLeuSerGlyAlaMetAspGlu405410415LeuHisAsnGluIleLeuGluLeuAspGluLysValAspAspLeuArg420425430AlaAspThrIleSerSerGlnIleGluLeuAlaValLeuLeuSerAsn435440445GluGlyIleIleAsnSerGluAspGluHisLeuLeuAlaLeuGluArg450455460LysLeuLysLysMetLeuGlyProSerAlaValAspIleGlyAsnGly465470475480CysPheGluThrLysHisLysCysAsnGlnThrCysLeuAspArgIle485490495AlaAlaGlyThrPheAsnAlaGlyGluPheSerLeuProThrPheAsp500505510SerLeuAsnIleThrAlaAlaSerLeuAsnAspAspGlyLeuAspAsn515520525HisThrIleLeuLeuTyrTyrSerThrAlaAlaSerSerLeuAlaVal530535540ThrLeuMetLeuAlaIlePheIleValTyrMetValSerArgAspAsn545550555560ValSerCysSerIleCysLeu565<210>53<211>1704<212>DNA<213>人工序列<220><223>HABWisconsin(PrL-)+H1CaliforniaTMCT的核苷酸序列<400>53atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560ttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccagt1620tcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtct1680ctacagtgtagaatatgtatttaa1704<210>54<211>567<212>PRT<213>人工序列<220><223>HABWisconsin(PrL-)+H1CaliforniaTMC的氨基酸序列<400>54MetLysAlaIleIleValLeuLeuMetValValThrSerAsnAlaAsp151015ArgIleCysThrGlyIleThrSerSerAsnSerProHisValValLys202530ThrAlaThrGlnGlyGluValAsnValThrGlyValIleProLeuThr354045ThrThrProThrLysSerTyrPheAlaAsnLeuLysGlyThrArgThr505560ArgGlyLysLeuCysProAspCysLeuAsnCysThrAspLeuAspVal65707580AlaLeuGlyArgProMetCysValGlyThrThrProSerAlaLysAla859095SerIleLeuHisGluValArgProValThrSerGlyCysPheProIle100105110MetHisAspArgThrLysIleArgGlnLeuProAsnLeuLeuArgGly115120125TyrGluAsnIleArgLeuSerThrGlnAsnValIleAspAlaGluLys130135140AlaProGlyGlyProTyrArgLeuGlyThrSerGlySerCysProAsn145150155160AlaThrSerLysIleGlyPhePheAlaThrMetAlaTrpAlaValPro165170175LysAspAsnTyrLysAsnAlaThrAsnProLeuThrValGluValPro180185190TyrIleCysThrGluGlyGluAspGlnIleThrValTrpGlyPheHis195200205SerAspAsnLysThrGlnMetLysSerLeuTyrGlyAspSerAsnPro210215220GlnLysPheThrSerSerAlaAsnGlyValThrThrHisTyrValSer225230235240GlnIleGlyAspPheProAspGlnThrGluAspGlyGlyLeuProGln245250255SerGlyArgIleValValAspTyrMetMetGlnLysProGlyLysThr260265270GlyThrIleValTyrGlnArgGlyValLeuLeuProGlnLysValTrp275280285CysAlaSerGlyArgSerLysValIleLysGlySerLeuProLeuIle290295300GlyGluAlaAspCysLeuHisGluLysTyrGlyGlyLeuAsnLysSer305310315320LysProTyrTyrThrGlyGluHisAlaLysAlaIleGlyAsnCysPro325330335IleTrpValLysThrProLeuLysLeuAlaAsnGlyThrLysTyrArg340345350ProProGlyGlyGlyTrpGluGlyMetIleAlaGlyTrpHisGlyTyr355360365ThrSerHisGlyAlaHisGlyValAlaValAlaAlaAspLeuLysSer370375380ThrGlnGluAlaIleAsnLysIleThrLysAsnLeuAsnSerLeuSer385390395400GluLeuGluValLysAsnLeuGlnArgLeuSerGlyAlaMetAspGlu405410415LeuHisAsnGluIleLeuGluLeuAspGluLysValAspAspLeuArg420425430AlaAspThrIleSerSerGlnIleGluLeuAlaValLeuLeuSerAsn435440445GluGlyIleIleAsnSerGluAspGluHisLeuLeuAlaLeuGluArg450455460LysLeuLysLysMetLeuGlyProSerAlaValAspIleGlyAsnGly465470475480CysPheGluThrLysHisLysCysAsnGlnThrCysLeuAspArgIle485490495AlaAlaGlyThrPheAsnAlaGlyGluPheSerLeuProThrPheAsp500505510SerLeuAsnIleThrAlaAlaSerLeuAsnAspAspGlyLeuAspAsn515520525TyrGlnIleLeuAlaIleTyrSerThrValAlaSerSerLeuValLeu530535540ValValSerLeuGlyAlaIleSerPheTrpMetCysSerAsnGlySer545550555560LeuGlnCysArgIleCysIle565<210>55<211>514<212>DNA<213>人工序列<220><223>天然CPMVRNA2基因组的片段,核苷酸1-514<400>55tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcatgagc120gatcttcaacgttgtcagatcgtgcttcggcaccagtacaatgttttctttcactgaagc180gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480taagcttctgtatattctgcccaaatttgaaatg514<210>56<211>511<212>DNA<213>人工序列<220><223>CPMVRNA2基因组,核苷酸1-514,115位和162位处具有修饰<400>56tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480taagcttctgtatattctgcccaaatttgaa511<210>57<211>69<212>DNA<213>人工序列<220><223>马铃薯贮藏蛋白信号肽(核苷酸序列)<400>57atggcaactactaaaacttttttaattttattttttatgatattagcaactactagttca60acatgtgct69<210>58<211>23<212>PRT<213>人工序列<220><223>马铃薯贮藏蛋白信号肽(氨基酸序列)<400>58MetAlaThrThrLysThrPheLeuIleLeuPhePheMetIleLeuAla151015ThrThrSerSerThrCysAla20<210>59<211>29<212>PRT<213>人工序列<220><223>HA跨膜结构域共有氨基酸序列<220><221>misc_feature<222>(3)..(3)<223>Xaa可以是任何天然存在的氨基酸<220><221>misc_feature<222>(15)..(15)<223>Xaa可以是任何天然存在的氨基酸<220><221>misc_feature<222>(17)..(18)<223>Xaa可以是任何天然存在的氨基酸<220><221>misc_feature<222>(23)..(23)<223>Xaa可以是任何天然存在的氨基酸<220><221>misc_feature<222>(25)..(25)<223>Xaa可以是任何天然存在的氨基酸<400>59IleLeuXaaIleTyrTyrSerThrValAlaIleSerSerLeuXaaLeu151015XaaXaaMetLeuAlaGlyXaaSerXaaTrpMetCysSer2025当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1