植物中流感样病毒颗粒的产生的制作方法

文档序号:24530033发布日期:2021-04-02 10:08阅读:704来源:国知局
植物中流感样病毒颗粒的产生的制作方法

发明领域

本发明涉及在植物中产生病毒样颗粒。

发明背景

流感是由正粘液病毒科的rna病毒引起的。存在三种类型的这些病毒,并且它们引起三种不同类型的流感:a型、b型和c型。流感病毒的a型病毒感染哺乳动物(人、猪、雪豹、马)和禽类。该病毒类型对人类来说非常重要,因为这是引起全世界流行病的病毒类型。b型流感病毒(也被简称为流感b)仅感染人类。其偶尔引起流感的局部爆发。c型流感病毒同样仅感染人类。当它们未成熟时它们感染大多数人并且极少引起严重的疾病。

接种疫苗通过诱导对象在感染之前建立防御,提供免受由类似病原体引起的疾病的保护。按照惯例,通过使用减毒活形式或完全灭活形式的感染性病原体作为免疫原实现接种疫苗。为了避免使用完整病毒(如杀死的或减毒的病毒)作为疫苗的危险,重组的病毒蛋白,例如亚基,已被用作疫苗。肽和亚基疫苗均为有许多潜在限制的对象。由于不正确的折叠或弱的抗原递呈,亚基疫苗可能呈现弱的免疫原性。主要的问题是难以确保被改造的蛋白的构象模仿抗原在其自然环境中的构象。合适的佐剂以及在肽的情况下的载体蛋白必须被用来促进免疫应答。此外这些疫苗主要引起体液应答,并且因此可能未能激发有效的免疫力。亚基疫苗通常对疾病是无效的,可证明完整的灭活病毒能提供保护。

病毒样颗粒(vlp)为用于免疫原性组合物中的包含物的潜在候选物。vlp极其类似于成熟病毒粒子,但是它们不含有病毒基因组材料。因此,vlp本质上是非复制性的,这使得它们用于作为疫苗施用是安全的。此外,可改造vlp以在vlp的表面上表达病毒糖蛋白,其为它们最天然的生理性结构。而且,因为vlp类似于完整的病毒粒子并且为多价的微粒结构,所以vlp在诱导针对糖蛋白的中和抗体中,比可溶性包膜蛋白抗原更有效。

vlp已在植物(wo2009/009876;wo2009/076778;wo2010/003225;wo2010/003235;wo2011/03522;wo2010/148511;其通过引用并入本文),以及昆虫和哺乳动物系统中(noad,r.androy,p.,2003,trendsmicrobiol11:438-44;neumann等,2000,j.virol.,74,547-551)产生。latham和galarza(2001,j.virol.,75,6154-6165)报道了,在感染有共表达血凝素(ha)、神经氨酸酶(na)、m1和m2基因的重组杆状病毒的昆虫细胞中,流感vlp的形成。该研究证明,在真核细胞中经共表达的流感病毒粒子蛋白的自我组装,并且m1基质蛋白是用于vlp的产生所必需的。gomez-puertas等(1999,j.gen.virol,80,1635-1645)显示m2的共表达完全地阻碍了catrna传送至mdck培养基中。

流感病毒的刺突糖蛋白血凝素(ha)对病毒颗粒被宿主细胞摄取非常重要。它负责病毒颗粒附着于包括唾液酸的细胞受体上,并且它涉及通过病毒包膜与细胞膜融合的病毒侵入。融合活性以及从而病毒的感染性,取决于将ha前体分子ha0切割为二硫键连接的多肽链ha1和ha2。切割随后ph-依赖的构象变化导致调节膜融合的跨膜多肽ha2在氨基端处的高度保守疏水肽的暴露和再定位。

ha被合成为前体蛋白ha0,其经过蛋白水解作用加工为通过二硫键连在一起的两个亚基(ha1和ha2)。两种结构特征被认为是涉及ha的可切割性:在有限的可切割性的ha中,接头通常由单个精氨酸组成,然而较宽范围的不同细胞种类中可切割的ha在具有主要酶识别基序arg-x-lys/arg-arg(其中x为非碱性氨基酸)的该位置上具有一系列的多个碱性残基插入。具有多个碱性切割位点的ha在其到达细胞膜上的出芽位点前在细胞外转运途径中被切割,相反,具有单碱性接头的ha在细胞外间隙或如针对wsn毒株所示在病毒进入阶段,在病毒颗粒上被激活。ha切割的第二个决定因素似乎为,存在于切割位点附近并且干扰蛋白酶易接近性的碳水化合物侧链。该碳水化合物的损失导致提高ha的可切割性和病毒的致病性。

由于分泌可细胞外切割ha0前体的蛋白酶的细胞范围有限,哺乳类和非致病性禽流感病毒株引起解剖学上的局部感染(chenj等.1998,cell.vol95:409-417)。负责在流感感染的人类中切割ha0的蛋白酶,由呼吸道的细胞或由共感染的细菌或支原体分泌,或者它们可在对感染的炎症应答中产生。主要的蛋白酶候选物为类胰蛋白酶克拉拉(clara),其由支气管上皮的克拉拉细胞产生,并且具有有限的组织分布(上呼吸道)。蛋白酶对h1、h2、h3和h6的切割位点处发现的单碱性序列q/e-x-r具有特异性。来自h9和b毒株的ha显示稍有不同的单碱性切割位点,分别为ssr和ker序列。针对引起水禽中所见的肠道和呼吸道感染的大多数流感病毒,还未鉴定出蛋白酶。大多数细胞系不支持多轮复制,除非加入外源蛋白酶(通常为胰蛋白酶)。

在高致病禽流感毒株中,然而,ha0被更普遍的细胞内蛋白酶家族切割,其导致全身的流感感染。致病性中的这种差异与ha0切割位点处的结构差异相关。致病毒株在单碱性位点内或邻近单碱性位点处具有多碱性氨基酸的插入。在该情况下的切割发生于细胞内,并且所涉及的蛋白酶被鉴定为弗林蛋白酶(furin)和其他类谷草杆菌蛋白酶,其发现于高尔基体中并涉及激素和生长因子前体的翻译后加工。弗林蛋白酶的识别序列r-x-r/k-r为h5h7的ha0切割位点处常见的插入氨基酸。酶的广泛组织分布性以及细胞内切割的效能,有助于由这些病毒引起的广泛传播的和毒力的全身性感染。

ha切割位点是用于病毒减毒的靶标,因为通过宿主蛋白酶将ha0前体激活切割为ha1和ha2片段,是所有流感a和b病毒株的复制循环中的步骤。只有被切割的ha能在受体介导的胞吞作用后的核内体酸性环境中经历构象变化,以暴露用于介导核内膜和病毒粒子膜之间融合的ha2片段的疏水n末端。

horimotot等(2006,vaccine,vol24:3669-3676)描述了h5中h5(rerrrkkr↓g)的多碱性切割位点的废除。所选择的突变体被应用于鼠中免疫原性的研究,其包括具有前面4个带电氨基酸(rerr)的缺失并且使多碱性切割位点失活的修饰(用tetr代替rkkr)的突变体。切割位点的废除不影响突变体h5的免疫原性特性。也已报道,废除多碱性位点(gerrrkkr↓g被retr代替)以产生突变体nibsc05/240nibsc流感参考病毒nibg-23。hoffman等(2002,2002,vaccine,vol20:3165-3170)用h6的单碱性位点代替h5ha的多碱性切割位点,以便促进在卵中的表达。缺失前面4个残基,并且通过ietr代替多碱性位点的后面四个氨基酸(用ietr↓g代替rerrrkkr↓g)。该突变体h5表现出高的表达水平、潜在的蛋白水解作用,以及在宿主细胞中病毒复制和产生所需的低ph下的构象变化,免疫原性数据未被报道。这些研究表明,可利用切割位点的修饰来减少病毒颗粒的毒力(在真实病毒被复制的情况下),其允许病毒在不杀死寄生卵的情况下复制。如果没有这样的突变,病毒在到达高滴度前杀死卵。

sirko等的wo2013043067描述了用于鸡的dna疫苗,其含有编码修饰的h5血凝素(ha)蛋白的cdna,其中ha亚基之间的蛋白水解切割位点被缺失。sirko等陈述了这种缺失提供了更安全的疫苗并以长的、无加工的多肽形式表达“超级抗原”。sirko等进一步陈述了修饰的ha的编码区,在这样的方式下,禽细胞中的蛋白的产生实现最大产量。主要的修饰是鸡的密码子优化和ha的蛋白水解敏感区的缺失。

wo2013/044390描述了在植物中产生具有修饰的血凝素(ha)的病毒样颗粒(vlp)的方法,其中修饰的ha蛋白包含修饰的蛋白水解环。修饰的ha在调控区豇豆花叶病毒(cowpeamosaicvirus)(cpmv)ht和来自菜豆黄矮病毒(beanyellowdwarfvirus)(beydv)的双生病毒(geminivirus)扩增元件的存在下表达。

yang等的us2008/0069821公开了,用于产生作为疫苗的流感病毒的流感ha的多肽和多聚核苷酸变体。通过引入一组载体获得重组流感病毒,所述载体对应于与源自流感ha的变体的互补片段结合的主流感病毒的基因组片段。通常,基于与疫苗施用相关的预期特性选择主毒株。例如,为了疫苗的产生,例如,为了减毒活疫苗的产生,可基于减毒表型、冷适应和/或温度敏感性选择主供体病毒株。

发明概述

本发明涉及在植物中产生病毒样颗粒和修饰的ha蛋白。

本发明的一个目的是提供改善的在植物中产生病毒样颗粒和ha蛋白。

本文所描述的核酸包含表达增强子,所述表达增强子在植物有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环。

此外,本文所描述的是在植物中产生病毒样颗粒(vlp)的方法(a),所述方法包括:

a)将包含表达增强子的核酸引入植物或植物的部分,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环;

b)在允许核酸表达的条件下培养植物或植物的部分,从而产生vlp。

此外,本文所描述的是在植物中产生病毒样颗粒(vlp)的方法(b),所述方法包括:

a)提供包含核酸的植物或植物的部分,所述核酸包含表达增强子,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环,并且

b)在允许核酸表达的条件下培养植物或植物的部分,从而产生vlp。

此外,本文所描述的是在植物中产生包含修饰的蛋白水解环的修饰的ha蛋白的方法(c),所述修饰蛋白水解环包含呈现出减少或废除的切割的一个或多个蛋白酶切割位点,所述方法包括,

a)将包含表达增强子的核酸引入植物或植物的部分,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环;

b)在允许ha蛋白表达的条件下培养植物或植物的部分,从而产生修饰的ha蛋白,

c)收集植物,并且纯化修饰的ha蛋白。

如上所描述的方法(a)、(b)或(c)还可包括以下步骤:

c)收集植物,并且

d)纯化vlp,其中vlp的大小范围为80-300nm。

此外,本文所描述的是增加植物中ha蛋白的产物产量的方法(d),所述方法包括,

a)将包含表达增强子的核酸引入植物或植物的部分,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环;

b)在允许ha蛋白表达的条件下培养植物或植物的部分,从而产生修饰的ha蛋白,

c)收集植物,并且纯化ha蛋白。

表达增强子可为cpmvx、cpmvx+或cpmv-ht+。此外,核苷酸可不包含双生病毒扩增元件。因此核苷酸可不包含菜豆黄矮病毒长基因间隔区(beydvlir)以及beydv短基因间隔区(beydvsir)。修饰的蛋白水解环可包含呈现出减少或废除的蛋白酶切割的一个或多个蛋白酶切割位点。蛋白酶可为克拉拉(clara)-样或弗林蛋白酶(furin)-样。此外修饰的蛋白水解环可包含接头序列,并且接头序列可具有氨基酸序列gg、tetq或tetr。修饰的ha可包含天然或非天然信号肽。此外编码修饰的ha的核苷酸序列可包括嵌合核苷酸序列,所述嵌合核苷酸序列按顺序编码修饰的ha胞外域、流感跨膜结构域和胞质尾区,其中修饰的ha胞外域包含修饰的蛋白水解环且来自第一流感毒株,而跨膜结构域和胞质尾区来自第二流感毒株。

修饰的蛋白水解环可包含呈现出减少或废除的蛋白酶切割的一个或多个蛋白酶切割位点。而且,编码ha的核苷酸序列选自:bha、c、h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15和h16。本文还描述了通过方法(a)所产生的病毒样颗粒(vlp)。所述病毒样颗粒(vlp)可包含植物-特异性n-聚糖或修饰的n-聚糖。

本公开也提供组合物,其包含有效剂量的用于诱导免疫应答的vlp,以及药学上可接受的载体。

本文还描述了包含编码流感血凝素(ha)的核苷酸序列的核酸,所述核苷酸序列与在植物中有活性的调控区可操作地连接,其中ha包含修饰的蛋白水解环序列。所述核酸可编码包含修饰的蛋白水解环的ha,其中所述蛋白具有血凝素(ha)活性。也提供包含所述核酸的植物。也包括的是在植物中所产生的病毒样颗粒(vlp)、包含由所述核酸编码的流感病毒血凝素(ha)的vlp和一种或多种源自植物的脂质。

本发明的概述不必描述本发明的所有特征。

附图简述

本发明的这些和其他特征从参考所附附图的以下描述中更显而易见,其中:

图1显示用来制备a-2x35s/cpmv-ht/h5印度尼西亚(indonesia)/nos(构建体489号)的组件。图1a显示引物if-h5a-i-05.s1+3c(seqidno:2)。图1b显示引物if-h5dtm.r(seqidno:3)。图1c显示构建体1191的示意图。图1d显示构建体1191(seqidno4)。图1e显示表达盒489号(seqidno5)。图1f显示来自流感a/印度尼西亚/5/2005(h5n1)的h5的氨基酸序列(seqidno:6)。图1g显示编码来自流感a/印度尼西亚/5/2005(h5n1)的h5的核苷酸序列(seqidno:42)。

图2显示用来制备b-2x35s/cpmvht/m2新喀里多尼亚(newcaledonia)/nos(构建体1261号)的组件。图2a显示引物if-s1-m1+m2anc.c(seqidno:7)。图2b显示引物if-s1-4-m2anc.r(seqidno:8)。图2c显示用于合成的m2基因的核苷酸序列(对应于连接到来自genbank登录号dq508860的715-982的nt1-26)(seqidno:9)。图2d显示从2x35s启动子至nos终止子的表达盒1261号。来自流感a/新喀里多尼亚/20/1999(h1n1)的m2加下划线(seqidno:10)。图2e显示来自流感a/新喀里多尼亚/20/1999(h1n1)的m2的氨基酸序列(seqidno:11)。

图3显示用来制备c-2x35s/cpmv-ht/m2波多黎各(puertorico)/nos(构建体859号)的组件。图3a显示合成的m2基因的核苷酸序列(对应于连接到来自genebank登录号ef467824的nt740-1007的nt26-51)(seqidno:12)。图3b显示从2x35s启动子至nos终止子的表达盒859号。来自流感a/波多黎各/8/1934(h1n1)的m2加下划线(seqidno:13)。图3c显示来自流感a/波多黎各/8/1934(h1n1)的m2的氨基酸序列(seqidno:14)。

图4显示用来制备引入beydv+复制酶扩增体系中的g-2x35s/cpmv-ht/pdisp/hab布里斯班(brisbane)/nos(构建体1008号)的组件。图4a显示构建体1194的示意图。用于质粒线性化的sacii和stui限制性酶切位点在示意图上注释。图4b显示从左至右的t-dna边界的构建体1194(加下划线)。引入具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的beydv+复制酶扩增体系的2x35s/cpmv-ht/pdisp/nos(seqidno:31)。图4c显示从beydv左lir至beydv右lir的表达盒1008号。来自流感b/布里斯班/60/2008的pdisp/ha加下划线(seqidno:32)。

图5显示用来制备引入beydv+复制酶扩增体系中的i-2x35s/cpmv-ht/具有缺失的蛋白水解环的pdisp/hab布里斯班/nos(构建体1059号)的组件。图5a显示引物1039+1059.r(seqidno:38)。图5b显示引物1039+1059.c(seqidno:39)。图5c显示从beydv左lir至beydv右lir的表达盒1059号。来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的pdisp/ha加下划线(seqidno:40)。图5d显示来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的pdisp/ha的氨基酸序列(seqidno:41)。图5e显示来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的pdisp/ha的核苷酸序列(seqidno:43)。

图6显示用来制备引入beydv(m)+复制酶扩增体系中的b-2x35s/cpmv-ht/hab威斯康星州(wisconsin)/nos(构建体1462号)的组件。图6a显示引物if-hab110.s1+3c(seqidno:49)。图6b显示引物if-hab110.s1-4r(seqidno:50)。图6c显示合成的hab威斯康星州(genbank登录号jn993010)的核苷酸序列(seqidno:51)。图6d显示构建体193的示意图。图6e显示从左至右的t-dna边界的构建体193(加下划线)。引入具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的beydv(m)+复制酶扩增体系的2x35s/cpmv-ht/nos(seqidno:52)。图6f显示从2x35s启动子至nos终止子的表达盒1462号的核苷酸序列。来自流感b/威斯康星州/1/2010的ha加下划线(seqidno:53)。图6g显示来自流感b/威斯康星州/1/2010的ha的氨基酸序列(seqidno:54)。图6h显示构建体1462的示意图。

图7显示用来制备引入beydv(m)+复制酶扩增体系中的c-2x35s/cpmv-ht/具有缺失的蛋白水解环的hab威斯康星州/nos(构建体1467号)的组件。图7a显示引物hab110(prl-).r(seqidno:55)。图7b显示引物hab110(prl-).c(seqidno:56)。图7c显示从2x35s启动子至nos终止子表达盒1467号的核苷酸序列。来自流感b/威斯康星州/1/2010的具有缺失的蛋白水解环的ha加下划线(seqidno:57)。图7d显示具有缺失的蛋白水解环的流感b/威斯康星州/1/2010的氨基酸序列(seqidno:58)。图7e显示构建体1467的示意图。

图8显示用来制备a-2x35s/cpmv-ht/具有缺失的蛋白水解环的pdisp/hab布里斯班/nos(构建体1039号)的组件。图8a显示从2x35s启动子至nos终止子的表达盒1039号的核苷酸序列。来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的ha加下划线(seqidno:15)。图8b显示构建体1039的示意图。

图9显示构建体1008号的质粒图谱。构建体1008号针对来自流感毒株b/布里斯班/60/2008的野生型ha的表达。该构建体包含用于dna扩增的beydv-来源元件。

图10显示构建体1059号的质粒图谱。构建体1059号针对来自流感毒株b/布里斯班/60/2008的具有缺失的蛋白水解环的突变体ha的表达。该构建体包含用于dna扩增的beydv-来源元件。

图11显示构建体1261号的质粒图谱。构建体1261号针对来自流感毒株a/新喀里多尼亚(caledonia)/20/99(h1n1)的野生型m2的表达。

图12显示构建体859号的质粒图谱。构建体859号针对来自流感毒株a/波多黎各/8/34(h1n1)的野生型m2的表达。

图13a显示农杆菌渗入的烟草本塞姆氏(nicotianabenthamiana)叶中ha蛋白表达的western印迹分析。“1008”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下的表达;“1008+1261”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达;“1059”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下的表达;“1059+1261”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。分析来自三种不同渗入的植物(a、b和c)。比值指示共表达实验中所使用的农杆菌培养物的比例。图13b显示来自产生ha的植物的粗蛋白提取物的血凝能力的比较。

图14显示农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。“1059”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下的表达;“1059+1261”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。“1059+859”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/波多黎各/8/34的m2的共表达。分析来自三种不同渗入的植物(a、b和c)。比值指示共表达实验中所使用的农杆菌培养物的比例。

图15显示来自不同流感毒株的ha的接头的周围区域的氨基酸序列比对:h1新喀里多尼亚(newcal)(seqidno:22);h1布里斯班(seqidno:23);h1所罗门群岛(solislands)(seqidno:24);h2a新加坡(singapore)(seqidno:25);h3a布里斯班(seqidno:26);h3awcn(seqidno:27);h5安徽(anhui)(seqidno:28);h5indo(seqidno:29);h5越南(vietnam)(seqidno:30);h6野鸭(teal)hk(seqidno:33);h7eq布拉格(prague)(seqidno:34);h9ahk(seqidno:35);b弗罗里达(florida)(seqidno:36);b马来西亚(malaysia)(seqidno:37)。通过箭头指示前体ha0的切割位点。

图16a显示农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。来自b/威斯康星州/1/2010的ha与来自a/新喀里多尼亚/20/99的m2共表达。每个泳道加载10μg的蛋白。“c+”:阳性对照,来自英国国家生物标准和控制学会(thenationalinstituteforbiologicalstandardsandcontrol,unitedkingdom)的半-纯化的b/威斯康星州/1/2010病毒;“1462”:来自b/威斯康星州/1/2010的野生型ha在存在扩增元件(beydv)下的表达;“1467”:来自b/威斯康星州/1/2010的突变体ha在存在扩增元件(beydv)下的表达;“1462+1261”:来自b/威斯康星州/1/2010的野生型ha在存在扩增元件(beydv)下与m2的共表达;“1467+1261”:来自b/威斯康星州/1/2010的突变体ha在存在扩增元件(beydv)下与m2的共表达。比值指示了表达和共表达实验中所使用的每个农杆菌培养物的光密度。图16b显示来自转化有agl1/1462、agl1/1467、agl1/1462+agl1/1261和agl1/1467+agl1/1261的植物的粗蛋白提取物的血凝能力的比较。

图17a和17b显示农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。“1008”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下的表达;“1008+1261”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达;“1039”:来自b/布里斯班/60/2008的突变体ha在不存在扩增元件(beydv)下的表达。“1039+1261”:来自b/布里斯班/60/2008的突变体ha在不存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。来自a/布里斯班/59/2007(h1n1)的ha。“1059”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下的表达;“1059+1261”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。

图18a显示通过克拉拉-样和/或弗林蛋白酶-样的蛋白酶将ha0切割为ha1和ha2的示意图。图18b显示来自不同流感毒株的ha的序列比对:h1新喀里多尼亚(seqidno:22);h1布里斯班(seqidno:23);h1所罗门群岛(seqidno:24);h2a新加坡(seqidno:25);h3a布里斯班(seqidno:26);h3awcn(seqidno:27);h5安徽(seqidno:28);h5indo(seqidno:29);h5越南(seqidno:30);h6野鸭(teal)hk(seqidno:33);h7eq布拉格(seqidno:34);h9ahk(seqidno:35);b弗罗里达(seqidno:36);b马来西亚(seqidno:37)。图18c显示h5毒株(a/安徽/1/2005(h5n1)seqidno:69、a/印度尼西亚(indonesia)/5/2005(h5n1)seqidno:70、a/越南/1194/2004(h5n1)seqidno:71)和b型毒株(b/弗罗里达/4/2006seqidno:72和b/马来西亚/2506/2004seqidno:73)中的切割位点的部分缺失。

图19显示h5/indo中的切割位点的突变。天然的序列(seqidno:44);包含tetr的h5/indo修饰的切割位点(seqidno:45);包含tetq的h5/indo修饰的切割位点(seqidno:46)。

图20显示包含蛋白水解环内突变的不同的修饰的h5/indoha’s在酶提取后,最初生物质中存在的滴度。h5/indo对照(构建体489);gg接头所代替的h5/indo蛋白水解环(构建体928);tetr接头所代替的h5/indo蛋白水解环(构建体676);tetq接头所代替的h5/indo蛋白水解环(构建体766)。

图21显示修饰b型ha的蛋白水解环的多种方法。图21a显示天然的b/布里斯班/60/2008的氨基酸序列(seqidno:16)。下划线部分是蛋白水解环和ha2结构域。图21b显示具有修饰的蛋白水解环的b/布里斯班/60/2008的氨基酸序列(seqidno:17),其中构成序列akllkergffgaiagfleg的19个氨基酸残基被gg接头(斜体)代替。图21c显示b/布里斯班/60/2008的氨基酸序列(seqidno:18),其中构成序列ppakllker的9个氨基酸被-gsssgsssg-接头(斜体)代替。图21d显示天然的h3a/珀斯/16/2009的氨基酸序列(seqidno:19)。图21e显示具有构成序列rnvpekqtrgif的12个氨基酸残基被gs接头(斜体)代替的h3a/珀斯(perth)/16/2009的氨基酸序列(seqidno:20)。图21f显示具有构成序列rnvpekqtr的9个氨基酸残基被gssgssgss-接头(斜体)代替的h3a/珀斯/16/2009的氨基酸序列(seqidno:21)。

图22显示在农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。来自h5/indo的ha。上图列出了每个泳道中所加载的组分;下图为蛋白质印迹。c:重组的h5印度尼西亚/5/05s-std-0002;一抗:抗-haa/indo/05/2005cber#s-bio-00031/50000;印迹。泳道1和2:h5/indo对照(构建体489);泳道3和4:gg接头所代替的h5/indo的蛋白水解环(构建体928);泳道5和6:tetr接头所代替的h5/indo蛋白水解环(构建体676);泳道7和8:tetq接头所代替的h5/indo蛋白水解环(构建体766);泳道9:mw标记物;泳道10:h5对照。

图23显示用来制备来自a/印度尼西亚/5/2005的具有tetr切割位点突变的b-2x35s/cpmv-ht/h5(构建体676号)的组件。图23a显示引物序列mutcleavage-h5(indo).r(seqidno:74)。图23b显示引物序列mutcleavage-h5(indo).c(seqidno:75)。图23c显示从2x35s启动子至nos终止子的表达盒676的核苷酸序列(seqidno:76)。来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetr切割位点突变加下划线。图23d显示来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetr切割位点突变体的氨基酸序列(seqidno:77)。图23e显示构建体676号的示意图。

图24显示用来制备来自a/印度尼西亚/5/2005的具有tetq切割位点突变的b-2x35s/cpmv-ht/h5(构建体766号)的组件。图24a显示引物序列h5i505_tetq.r(seqidno:78)。图24b显示引物序列h5i505_tetq.c(seqidno:79)。图24c显示从2x35s启动子至nos终止子的表达盒766的核苷酸序列(seqidno:80)。来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetq切割位点突变体加下划线。图24d显示来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetq切割位点突变体的氨基酸序列(seqidno:81)。图24e显示构建体766号的示意图。

图25显示用来制备来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的b-2x35s/cpmv-ht/h5(构建体928号)的组件。图25a显示引物序列h5i505(prl-).r(seqidno:82)。图25b显示引物序列h5i505(prl-).c(seqidno:83)。图25c显示从2x35s启动子至nos终止子的表达盒928的核苷酸序列(seqidno:84)。来自流感a/印度尼西亚/5/2005(h5n1)的具有缺失的蛋白水解环的h5加下划线。图25d显示来自流感a/印度尼西亚/5/2005(h5n1)的具有缺失的蛋白水解环的h5突变体的氨基酸序列(seqidno:85)。图25e显示构建体928号的示意图。

图26a显示数个增强子序列的实例的总示意图,如本文所描述的cpmvx和cpmvx+(包含cpmvx和填充片段,在该非限制性实例中填充片段包含多克隆位点和植物kozak序列)。cpmcx和cpmvx+各自显示为在其5’端与植物调控区可操作地连接,以及在其3’端连续地为目标核苷酸序列(包括atg起始位点和终止位点)、3’utr和终止子序列。本文所描述的构建体cpmvx的实例为cpmv160。本文所描述的构建体cpmvx+的实例为cpmv160+。图26b显示植物中所产生的包含cpmv-ht表达构建体,以及基于cpmv160+的表达构建体的修饰的ha蛋白的粗蛋白提取物中的相对血凝滴度(hmg)。显示了用于以下构建体的表达的数据:具有缺失的蛋白水解环且具有pdi信号肽的hab布里斯班/60/08(构建体1039号,5’utr:cmpvht;和构建体1937号,5’utr:cmpv160+;参见实施例5.7);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被具有缺失的蛋白水解环的h1,b马萨诸塞州(massachusetts)/2/20122012的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b布里斯班/60/08+h1tm(构建体2072号,5’utr:cmpvht;和构建体2050号,5’utr:cmpv160+;参见实施例5.14);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b马萨诸塞州/2/2012+h1tm(构建体2074号,5’utr:cmpvht;和构建体2060号,5’utr:cmpv160+;参见实施例5.15);具有缺失的蛋白水解环且具有天然信号肽的b威斯康星州/1/2010(构建体1445号,5’utr:cmpvht;和构建体1975号,5’utr:cmpv160+;参见实施例5.16);和具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有天然信号肽的b威斯康星州/1/2010+h1tm(构建体1454号,5’utr:cmpvht;和构建体1893号,5’utr:cmpv160+;参见实施例5.18)。

图27a显示与目标核苷酸序列融合的cpmvht和cpmvht+的增强子序列的总示意图。增强子序列内并非需要该图中所示的所有元件。目标核苷酸序列的3’端也可包括另外的元件(未显示),包括编码豇豆花叶病毒3’非翻译区(utr)、质体蓝素3’utr或豇豆花叶病毒3’utr和质体蓝素3’utr的组合的序列。图27b显示植物中所产生的包含与目标核苷酸序列可操作地连接的cpmv-ht表达构建体和基于cpmvht+的表达构建体的蛋白的粗蛋白提取物中的相对血凝滴度(hmg)。显示用于以下构建体的表达的数据:具有缺失的蛋白水解环且具有pdi信号肽的hab布里斯班/60/08(构建体1039号:cpmvht;参见实施例5.7和构建体1829号:cpmvht+;参见实施例5.12);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b布里斯班/60/08+h1tm(构建体1067号:cpmvht;参见实施例5.14和构建体1875号:cpmvht+;参见实施例5.19);具有缺失的蛋白水解环且具有pdi信号肽的b马萨诸塞州/2/2012(构建体2072号:cmpvht;参见实施例5.15和构建体2052号:cmpvht+;参见实施例5.20);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b马萨诸塞州/2/2012+h1tm(构建体2074号:cmpvht;参见实施例5.16和构建体2062号:cmpvht+;参见实施例5.21);具有缺失的蛋白水解环且具有天然信号肽的b威斯康星州/1/2010(构建体1445号:cmpvht;参见实施例5.17和构建体1839号:cmpvht+;参见实施例5.22);和具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有天然信号肽的b威斯康星州/1/2010+h1tm(构建体1454号:cmpvht;参见实施例5.18和构建体1860号:cmpvht+;参见实施例5.23)。

图28a显示在农杆菌渗入的烟草本塞姆氏叶中h3珀斯蛋白表达的western印迹分析。泳道1:(2019+1261)来自h3珀斯-16-09的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2139+1261)来自h3珀斯-16-09的天然(野生型)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道3:(2039+1261)来自h3珀斯-16-09的突变体(修饰的)ha在表达增强子(cpmvht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2159+1261)来自h3珀斯-16-09的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。

图28b显示在农杆菌渗入的烟草本塞姆氏叶中b马来西亚蛋白表达的western印迹分析。泳道2:(2013+1261)来自b马来西亚2506-04的天然(野生型)ha在表达增强子(cpmv-160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2014+1261)来自b马来西亚2506-04的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。

图28c显示在农杆菌渗入的烟草本塞姆氏叶中h9香港蛋白表达的western印迹分析。泳道1:(1610+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-ht)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(1630+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-ht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道3:(2244+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2226+1261):来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道6:(2246+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-160+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道7:(2225+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道8:(2245+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmvht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道9:(2227+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道10:(2247+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmv160+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。

图28d显示在农杆菌渗入的烟草本塞姆氏叶中b马萨诸塞州蛋白表达的western印迹分析。泳道1:(2070+1261)来自b马萨诸塞州-2-12的天然(野生型)ha在表达增强子(cpmv-ht)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2080+1261)来自b马萨诸塞州-2-12的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道3:(2090+1261)来自b马萨诸塞州-2-12的天然(野生型)ha在表达增强子(cpmv-160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2072+1261)来自b马萨诸塞州-2-12的突变体(修饰的)ha在表达增强子(cpmvht)存在下与来自a/新喀里多尼亚/20/99的m2共表达;泳道5:(2052+1261)来自b马萨诸塞州-2-12的突变体(修饰的)ha在表达增强子(cpmvht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道6:(2050+1261)来自b马萨诸塞州-2-12的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。

图28e显示在农杆菌渗入的烟草本塞姆氏叶中的h2新加坡蛋白表达的western印迹分析。泳道1:(2220+1261)来自h2新加坡-1-57的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2222+1261)来自h2新加坡-1-57的天然(野生型)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道3:(2221+1261)来自h2新加坡-1-57的突变体(修饰的)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2223+1261)来自h2新加坡-1-57的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。

图28f显示在农杆菌渗入的烟草本塞姆氏叶中b/弗罗里达蛋白表达的western印迹分析。泳道1:(1004+1261)来自b/弗罗里达的天然(野生型)ha在表达增强子(cpmv-ht)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(1003+1261)来自b/弗罗里达的天然(野生型)ha在表达增强子(cpmvht)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道3:(2102+1261)来自b/弗罗里达的突变体(修饰的)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2104+1261)来自b/弗罗里达的突变体(修饰的)ha在表达增强子(cpmvht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道5:(2106+1261)来自b/弗罗里达+h1加利福尼亚tmct的突变体(修饰的)ha在表达增强子(cpmvht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道6:(2108+1261)来自b/弗罗里达+h1加利福尼亚tmct的突变体(修饰的)ha在表达增强子(cpmvht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。

图29a显示在增强子元件cpmvht、cpmvht+或cpmv160+存在下表达来自不同流感毒株的修饰的ha的相对ha滴度。与用相同的增强子元件所表达的天然ha蛋白比较其活性。h3a珀斯/16/09(h3per1609)、h3维多利亚(victoria)/361/11(h3vic26111)、b布里斯班60/2008(hbbris60008)、b马来西亚2506/04(hbmal250604)和b马萨诸塞州2/12(ma212)与流感m2蛋白共表达。

图30a显示引物if-s2+s4-bbris.c(seqidno:86)。图30b显示引物if-s1a4-bbris.r(seqidno:87)。图30c显示合成的hab布里斯班基因的核苷酸序列(对应于来自genbank登录号fj766840的nt34-1791)(seqidno:88)。图30d显示从2x35s启动子至nos终止子的表达盒1029号的核苷酸序列。来自流感b/布里斯班/60/2008的pdisp/ha加下划线(seqidno:89)。图30e显示来自流感b/布里斯班/60/2008的pdisp/ha的氨基酸序列(seqidno:90)。图30f显示构建体1029的示意图。用于质粒线性化的sacii和stui限制性酶切位点在示意图上注释。

图31显示用来制备构建体1039号和1829号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)nos和2x35s/cpmvht+pdisp/hab布里斯班(prl-)nos;参见实施例5.12)的序列组件。构建体1039号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-)之间不包含异源kozak序列。构建体1829号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图31a显示pdisp/hab布里斯班(prl-)的核苷酸序列(seqidno:91)。图31b显示pdisp/hab布里斯班(prl-)的氨基酸序列(seqidno:92)。图31c显示构建体1829号(2x35s/cpmvht+)的示意图。

图32显示用来制备构建体1039号和1937号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)nos和2x35s/cpmv160+pdisp/hab布里斯班(prl-)nos;参见实施例5.7)的序列组件。构建体1039号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-))之间不包含异源kozak序列。构建体1937号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图32a显示构建体1937号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。

图33显示用来制备构建体1067号和1977号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos和2x35s/cpmv160+pdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos;参见实施例5.14)的序列组件。构建体1067号合并现有技术cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1977号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图33a显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:95)。图33b显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:96)。图33c显示构建体1067号(2x35s/cpmvht;参考构建体)的示意图。图33d显示构建体1977号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。

图34显示用来制备构建体2072号和2050号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)nos和2x35s/cpmv160+pdisp/hab马萨诸塞州(prl-)nos;参见实施例5.15)的序列组件。构建体2072号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-))之间不包含异源kozak序列。构建体2050号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图34a显示pdisp/hab马萨诸塞州(prl-)的核苷酸序列(seqidno:97)。图34b显示pdisp/hab马萨诸塞州(prl-)的氨基酸序列(seqidno:98)。图34c显示构建体2072号(2x35s/cpmvht;参考构建体)的示意图。图34d显示构建体2050号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。

图35显示用来制备构建体2074号和2060号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmv160+pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos;参见实施例5.16)的序列组件。构建体2074号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体2060号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图35a显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:99)。图35b显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:100)。图35c显示构建体2074号(2x35s/cpmvht;参考构建体)的示意图。图35d显示构建体2060号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。

图36显示用来制备构建体1445号、1820号和1975号(分别为2x35s/cpmvhthab威斯康星州(prl-)nos、2x35s/cpmv160+hab威斯康星州(prl-)nos和2x35s/cpmv160hab威斯康星州(prl-)nos;参见实施例15.17)的序列组件。构建体1445号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-))之间不包含异源kozak序列。构建体1820号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。构建体1975号包括包含160个核苷酸的cpmv5’utr,并且其不包括填充片段(多克隆位点)或植物kozak序列(该构建体也不包含编码不完整m蛋白的序列),并且其为基于“cpmv160”(cpmvx)的构建体的实例。prl-:缺失的蛋白水解环;nos:胭脂碱合酶终止子。图36a显示hab威斯康星州(prl-)的核苷酸序列(seqidno:101)。图36b显示hab威斯康星州(prl-)的氨基酸序列(seqidno:102)。图36c显示构建体1445号的示意图(2x35s/cpmvht;参考构建体)。图36d显示构建体1820号(2x35s/cpmv160+;基于cpmvx+的构建体)的示意图。图36e显示构建体1975号(2x35s/cpmv160;基于cpmvx的构建体,其中x=160)的示意图。

图37显示用来制备构建体1454号和1893号(分别为2x35s/cpmvhthab威斯康星州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmv160+hab威斯康星州(prl-)+h1加利福尼亚tmctnos;参见实施例5.18)的序列组件。构建体1454号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1893号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图37a显示hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:103)。图37b显示pdisp/hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:104)。图37c显示构建体1454号(2x35s/cpmvht;参考构建体)的示意图。图37d显示构建体1893号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。

图38显示用来制备构建体1067号和1875号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos和2x35s/cpmvht+pdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos;参见实施例5.19)的序列组件。构建体1067号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1875号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图38a显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:105)。图38b显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:106)。图38c显示构建体1875号(2x35s/cpmv160+)的示意图。

图39显示用来制备构建体2072号和2052号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)nos和2x35s/cpmvht+pdisp/hab马萨诸塞州(prl-)nos;参见实施例5.20)的序列组件。构建体2072号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-))之间不包含异源kozak序列。构建体2052号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图39a显示pdisp/hab马萨诸塞州(prl-)的核苷酸序列(seqidno:107)。图39b显示pdisp/hab马萨诸塞州(prl-)的氨基酸序列(seqidno:108)。图39c显示构建体2052号(2x35s/cpmvht+)的示意图。

图40显示用来制备构建体2074号和2062号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmvht+pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos;参见实施例5.21)的序列组件。构建体2074号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体2062号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图40a显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:109)。图40b显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:110)。图40c显示构建体2062号(2x35s/cpmvht+)的示意图。

图41显示用来制备构建体1445号和1839号(分别为2x35s/cpmvhthab威斯康星州(prl-)nos和2x35s/cpmvht+hab威斯康星州(prl-)nos;参见实施例5.22)的序列组件。构建体1445号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-))之间不包含异源kozak序列。构建体1839号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。prl-:缺失的蛋白水解环;nos:胭脂碱合酶终止子。图41a显示hab威斯康星州(prl-)的核苷酸序列(seqidno:111)。图41b显示hab威斯康星州(prl-)的氨基酸序列(seqidno:112)。图41c显示构建体1839号(2x35s/cpmvht+)的示意图。

图42显示用来制备构建体1454号和1860号(分别为2x35s/cpmvhthab威斯康星州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmvht+hab威斯康星州(prl-)+h1加利福尼亚tmctnos;参见实施例5.23)的序列组件。构建体1454号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1860号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图42a显示hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:113)。图42b显示pdisp/hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:114)。图42c显示构建体1893号(2x35s/cpmvht+)的示意图。

图43显示用来制备构建体489号(2x35s/cpmvhth5印度尼西亚nos,参见实施例5.24)的序列组件。构建体489号包含cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/h1加利福尼亚)之间不包含异源kozak序列。图43a显示天然h5印度尼西亚的核苷酸序列(seqidno:115)。图43b显示天然h5印度尼西亚的氨基酸序列(seqidno:116)。图43c显示构建体489号(2x35s/cpmvht;参考构建体)的示意图。

图44显示用来制备构建体1800号(a-2x35scpmv160+pdisph3维多利亚nos;参见实施例5.25)的序列组件。构建体1800号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。pdisp:蛋白二硫键异构酶信号肽。nos:胭脂碱合酶终止子。图44a显示引物序列if**(sacii)-pdi.s1+4c(seqidno:117)。图44b显示引物序列if-h3v36111.s1-4r(seqidno:118)。图44c显示pdisp/h3维多利亚的序列(seqidno:119)。图44d显示构建体2171(指示了用于质粒线性化的sacii和stui限制性酶切位点)的示意图。图44e显示从左至右t-dna边界的构建体2171(加下划线)、具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的2x35s/cpmv160+/nos、h1加利福尼亚跨膜胞质尾区和cpmv3’utr(seqidno:120)。图44f显示从2x35s启动子至nos终止子的表达盒1800号。pdisp/h3维多利亚核苷酸序列加下划线;5’utr用粗体显示;植物kozak序列双下划线;位于5’utr和植物kozak序列之间的16个碱基对的填充片段(多克隆位点)(seqidno:121)。图44g显示pdisp/h3维多利亚的氨基酸序列(seqidno:122)。图44h显示构建体1800号(基于cpmvx+的构建体,其中x=160)的示意图。

图45显示用来制备构建体1819号(2x35scpmv-ht+pdisph3维多利亚nos)的序列组件。构建体1819号包含cpmv-ht+序列(位置161处具有突变的起始密码子的融合的编码不完整m蛋白的填充片段的cmpv5’utr、多克隆位点,并且多克隆位点和目标核苷酸序列(pdisp/h3维多利亚)之间包含植物kozak序列)。pdisp:蛋白二硫键异构酶信号肽。nos:胭脂碱合酶终止子。图45a显示引物序列if(sacii)-kozac_pdi.c(seqidno:123)。图45b显示引物序列if-h3v36111.s1-4r(seqidno:124)。图45c显示构建体2181的示意图。图45d显示构建体2181(从左至右t-dna边界,加下划线;具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的2x35s/cpmv-ht+/nos;seqidno:126)的序列。图45e显示从2x35s启动子至nos终止子的表达盒1819号。pdisp/h3维多利亚核苷酸序列加下划线(seqidno:127)。图45f显示构建体1819的示意图。

图46a显示天然h7杭州ha和具有缺失的蛋白水解环的修饰h7杭州ha,与m2共表达时的相对血凝活性。在m2(构建体#1261参见实施例5.1)存在下时,表达天然和修饰的h7杭州ha(构建体#2142和2152,参见实施例5.33和5.34)并且从植物中纯化。图46b显示天然h7杭州ha(构建体#2142)和具有缺失的蛋白水解环的修饰h7杭州ha(构建体#2152)的蛋白产量。图46c显示具有泳道2和泳道3的sds-page分析,所述泳道2显示纯化的具有去除的蛋白水解环的修饰h7杭州ha(构建体#2152),所述泳道3显示纯化的天然h7杭州ha(构建体#2142)。对于每个泳道,在凝胶上加2μg总蛋白。对于这两个构建体,蛋白谱的纯度是相似的。

图47a显示天然ha蛋白和蛋白水解环被gg接头(prl-)代替的修饰的ha、蛋白水解环被tetq接头(tetq)代替的修饰的ha,和蛋白水解环被tetr接头(tetr)代替的修饰的ha之间的胰蛋白酶抗性。纯化了天然的(#489)、prl-(#928)、tetq(#766)和tetr(#676)的h5印度尼西亚havlp构建体。对于每种构建体,用ph7.4的缓冲液(100mmna/kpo4,150mmnacl,0.01%吐温80)重悬两份havlp样品,目标浓度为150μg/ml。将胰蛋白酶以1:100蛋白比值加入一个重悬的样品中。样品在室温下孵育30、60和120分钟。sds-page凝胶上加载30μl非消化的提取物(对照)和30μl消化的提取物,其用考马斯亮蓝染色。图47b显示两个剂量后小鼠中的天然h5vlp和其突变体对应物(prl-、tetq和tetr)的免疫原性(hi滴度)。柱状代表每种h5突变体vlp与天然h5vlp相比的相对(%)hi滴度。

图48显示用来制备构建体2220号(2x35s/cpmvht+/pdisp/h2新加坡/nos,参见实施例5.27)的序列组件。图48a显示引物if**-h2s157.s1-6r的核苷酸序列(seqidno:127)。图48b显示pdisp/h2新加坡的核苷酸序列(seqidno:128)。图48c显示从2x35s启动子至nos终止子的表达盒2220号的核苷酸序列。pdisp/h2新加坡核苷酸序列加下划线。图48d显示pdisp/h2新加坡的氨基酸序列。图48e显示构建体2220号的示意图。

图49显示用来制备构建体2221号(2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h2新加坡/nos,参见实施例5.28)的序列组件。图49a显示引物h2s157(prl-).r的核苷酸序列(seqidno:131)。图49b显示引物h2s157(prl-).c的核苷酸序列(seqidno:132)。图49c显示从2x35s启动子至nos终止子的表达盒2221号的核苷酸序列。pdisp/h2新加坡核苷酸序列加下划线(seqidno:133)。图49d显示具有缺失的蛋白水解环的pdisp/h2新加坡的氨基酸序列(seqidno:134)。图49e显示构建体2221号的示意图。

图50显示用来制备构建体2222号(2x35s/cpmv160+/pdisp/h2新加坡)和2223号(2x35s/cpmv160+/具有缺失的蛋白水解环的pdisp/h2新加坡/nos)(参见实施例5.29)的序列组件。图50a显示从2x35s启动子至nos终止子的表达盒2222号的核苷酸序列。pdisp/h2新加坡核苷酸序列加下划线(seqidno:135)。图50b显示从2x35s启动子至nos终止子的表达盒2223号的核苷酸序列。具有缺失的蛋白水解环的pdisp/h2新加坡的核苷酸序列加下划线(seqidno:136)。图50c:构建体2222号的示意图。图50d:构建体2223号的示意图。

图51显示用来制备构建体2219号(2x35s/cpmvht+pdisp/h3珀斯)和2139(2x35s/cpmv160+/pdisp/h3珀斯)(参见实施例5.30)的序列组件。图51a显示pdisp/h3珀斯的核苷酸序列(seqidno:137)。图51b显示引物if**-h3p1609.s1-6r的核苷酸序列(seqidno:138)。图51c显示pdisp/h3珀斯的氨基酸序列(seqidno:139)。图51d显示构建体2219号的示意图。图51e显示构建体2139号的示意图。

图52显示用来制备构建体2039号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/h3珀斯)和2159号(2x35s/cpmv160+具有缺失的蛋白水解环的pdisp/h3珀斯)(参见实施例5.31)的序列组件。图52a显示具有缺失的蛋白水解环的pdisp/h3珀斯的核苷酸序列(seqidno:140)。图52b显示引物h3p1609(prl-)#2.r的核苷酸序列(seqidno:141)。图52c显示引物h3p1609(prl-)#2.c的核苷酸序列(seqidno:142)。图52d显示具有缺失的蛋白水解环的pdisp/h3珀斯的氨基酸序列(seqidno:143)。图52e显示构建体2039号的示意图。图52f显示构建体2159号的示意图。

图53显示用来制备构建体2230号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/h3维多利亚)和2250(2x35s/cpmv160+具有缺失的蛋白水解环的pdisp/h3维多利亚)(参见实施例5.32)的序列组件。图53a显示具有缺失的蛋白水解环的pdisp/h3维多利亚的核苷酸序列(seqidno:144)。图53b显示引物h3v36111(prl-).r的核苷酸序列(seqidno:145)。图53c显示引物h3v36111(prl-).c的核苷酸序列(seqidno:146)。图53d显示具有缺失的蛋白水解环的pdisp/h3维多利亚的氨基酸序列(seqidno:147)。图53e显示构建体2230号的示意图。图53f显示构建体2250号的示意图。

图54显示用来制备构建体2142号(2x35s/cpmvht+/pdisp/h7杭州/nos)(参见实施例5.33)的序列组件。图54a显示pdisp/h7杭州的核苷酸序列(seqidno:148)。图54b显示引物if*-h7h113.s1-6r的核苷酸序列(seqidno:149)。图54c显示pdisp/h7杭州的氨基酸序列(seqidno:150)。图53d显示构建体2142号的示意图。

图55显示用来制备构建体2152号(2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h7杭州/nos)(参见实施例5.34)的序列组件。图55a显示具有缺失的蛋白水解环的pdisp/h7杭州的核苷酸序列(seqidno:151)。图55b显示引物h7h113(prl-).r的核苷酸序列(seqidno:152)。图55c显示引物h7h113(prl-).c的核苷酸序列(seqidno:153)。图55d显示具有缺失的蛋白水解环的pdisp/h7杭州的氨基酸序列(seqidno:154)。图53e显示构建体2152号的示意图。

图56显示用来制备构建体2224号(2x35s/cpmvht+pdisp/h9香港)和2226号(2x35s/cpmv160+pdisp/h9香港)(参见实施例5.35)的序列组件。图56a显示pdisp/h9香港的核苷酸序列(seqidno:155)。图56b显示引物if**-h9hk107399.s1-6r的核苷酸序列(seqidno:156)。图56c显示pdisp/h9香港的氨基酸序列(seqidno:157)。图56d显示构建体2224号的示意图。图56e显示构建体2226号的示意图。

图57显示用来制备构建体2225号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/h9香港)和2227号(2x35s/cpmv160+具有缺失的蛋白水解环的pdisp/h9香港)(参见实施例5.36)的序列组件。图57a显示具有缺失的蛋白水解环的pdisp/h9香港的核苷酸序列(seqidno:158)。图57b显示引物h9hk107399(prl-).r的核苷酸序列(seqidno:159)。图57c显示引物h9hk107399(prl-).c的核苷酸序列(seqidno:160)。图57d显示具有缺失的蛋白水解环的pdisp/h9香港的氨基酸序列(seqidno:161)。图57e显示构建体2225号的示意图。图57f显示构建体2227号的示意图。

图58显示用来制备构建体2013号(2x35s/cpmv160+/pdisp/hab马来西亚/nos)(参见实施例5.37)的序列组件。图58a显示pdisp/hab马来西亚的核苷酸序列(seqidno:162)。图58b显示引物if**-hbm250604.s1-6r的核苷酸序列(seqidno:163)。图58c显示pdisp/hab马来西亚的氨基酸序列(seqidno:164)。图58d显示构建体2013号的示意图。

图59显示用来制备构建体2014号(2x35s/cpmv160+具有缺失的蛋白水解环的/pdisp/hab马来西亚/nos)(参见实施例5.38)序列组件。图59a显示具有缺失的蛋白水解环的pdisp/hab马来西亚的核苷酸序列(seqidno:165)。图59b显示引物hbm250604(prl-).r的核苷酸序列(seqidno:166)。图59c显示引物hbm250604(prl-).c的核苷酸序列(seqidno:167)。图59d显示具有缺失的蛋白水解环的pdisp/hab马来西亚的氨基酸序列(seqidno:168)。图59e显示构建体2014号的示意图。

图60显示用来制备构建体2070号(2x35s/cpmvhtpdisp/hab马萨诸塞州)、2080号(2x35s/cpmvht+pdisp/hab马萨诸塞州)和2090号(2x35s/cpmv160+pdisp/hab马萨诸塞州)(参见实施例5.39)的序列组件。图60a显示pdisp/hab马萨诸塞州的核苷酸序列(seqidno:169)。图60b显示pdisp/hab马萨诸塞州的氨基酸序列(seqidno:170)。图60c显示构建体2070号的示意图。图60d显示构建体2080号的示意图。图60e显示构建体2090号的示意图。

图61显示用来制备构建体2102号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/hab弗罗里达)和2104号(2x35s/cpmvht+具有缺失的蛋白水解环的/beydv/pdisp/hab弗罗里达)(参见实施例5.40)的序列组件。图61a显示引物hbf406(prl-).r的核苷酸序列(seqidno:190)。图61b显示引物hbf406(prl-).c的核苷酸序列(seqidno:191)。图61c显示引物if*-hbf406.s1-6r的核苷酸序列(seqidno:192)。图61d显示具有缺失的蛋白水解环的pdisp/hab弗罗里达的核苷酸序列。图61e显示具有缺失的蛋白水解环的pdisp/hab弗罗里达的氨基酸序列。图61f显示表达盒2102号的核苷酸序列。图61g显示构建体2102号的示意图。图61h显示表达盒2104号的核苷酸序列。图61i显示构建体2104号的示意图。

图62显示用来制备构建体2106号(2x35s/cpmvht+/pdisp/b弗罗里达+具有缺失的蛋白水解环的h1加利福尼亚tmct/nos)和2108号(2x35s/cpmvht+/beydv/pdisp/b弗罗里达+具有缺失的蛋白水解环的h1加利福尼亚tmct/nos)(参见实施例5.41)的序列组件。图62a显示引物if-h1ctmct.s1-4r的核苷酸序列(seqidno:197)。图62b显示pdisp/hab弗罗里达+具有缺失的蛋白水解环的h1caltmct的核苷酸序列(seqidno:198)。图62c显示pdisp/hab弗罗里达+具有缺失的蛋白水解环的h1caltmct氨基酸序列。图62d显示表达盒2106号的核苷酸序列。图62e显示构建体2106号的示意图。图62f显示表达盒2108号的核苷酸序列。图62g显示构建体2108号的示意图。

发明详述

以下的描述是优选实施方案的描述。

本发明涉及病毒样颗粒(vlp)以及在植物中产生和增加vlp产量、累积和生产的方法。

本发明部分地,提供在植物或植物的部分中产生病毒样颗粒(vlp)的方法。所述方法包括将核酸引入植物或植物的部分。所述核酸包含调控区,所述调控区在植物中有活性并与编码流感血凝素(ha)的核苷酸序列操作性地连接到。所述ha包含修饰的蛋白水解环或切割位点。在允许所述核酸表达的条件下培养植物或植物的部分,从而产生vlp。如果需要,可收集植物或植物的部分,并且纯化vlp。

本发明也提供通过该方法所产生的vlp。vlp可包含一种或多种源自植物的脂质。

vlp可被用来制备包含有效剂量的用于诱导免疫应答的vlp以及药学上可接受的载体的组合物。

本文也提供修饰的血凝素,其中蛋白水解环或切割位点被修饰。

本发明也提供包含通过表达如上所述的核酸所产生的vlp的植物物质。所述植物物质可被用于在对象中诱导对流感病毒感染的免疫力。所述植物物质也可作为食品补充剂被掺入。

也可通过如下来产生本发明的vlp:提供包含如上所定义的核酸的植物或植物的部分,并且在允许所述核酸表达的条件下培养植物或植物的部分,从而产生vlp。vlp可包含一种或多种源自植物的脂质。vlp可被用来制备包含有效剂量的用于诱导免疫应答的vlp以及药学上可接受的载体的组合物。本发明也提供包含通过表达第一和第二核酸所产生的vlp的植物物质。所述植物物质可被用于在对象中诱导对流感病毒感染的免疫力。所述植物物质也可作为食品补充剂被掺入。

本发明的vlp包含一个或多个修饰的流感血凝素(ha)。修饰的ha可源自任何ha,例如在wo2009/009876;wo2009/076778;wo2010/003225;wo2010/003235;wo2011/03522中所描述的h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha;其通过引用并入本文。

本发明包括包含流感毒株的ha序列的vlp,其中ha序列包含修饰的多碱性切割位点,其包括例如本文所述的修饰。

ha蛋白

本文所使用的术语“血凝素”或“ha”指存在于流感病毒颗粒的外部的糖蛋白。ha是同源三聚体i型膜糖蛋白,其通常包含信号肽、ha1结构域和ha2结构域以及小胞质尾区,所述ha2结构域包含c-端跨膜锚定位点。编码ha的核苷酸序列是公知的并且是可获得的--参见,例如,生物预防公共健康基础(biodefencepublichealthbase)(流感病毒;参见url:biohealthbase.org)或生物技术信息国家中心(nationalcenterforbiotechnologyinformation)(参见url:ncbi.nlm.nih.gov),二者均通过引用并入本文。ha可包括任何ha,例如wo2009/009876;wo2009/076778;wo2010/003225;wo2010/003235;wo2011/03522中所描述的h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha,其通过引用并入本文)。此外,ha可以分离自一种或多种新兴的或最新鉴定的流感病毒的血凝素的序列为基础。本发明也包括包含获自一种或多种流感亚型的修饰的ha的vlp。

ha单体可被细分为三个功能结构域—茎结构域或茎结构域簇(sdc)、球状头部结构域或头部结构域簇(hdc)以及跨膜结构域簇(tdc)。sdc和hdc可被统称为‘胞外域’。ha等2002的出版物(emboj.21:865-875;其通过引用并入本文)基于x射线晶体结构阐明了一些流感亚型中sdc和hdc的多个亚结构域的相对取向。

ha蛋白被合成为约75kda的前体蛋白(ha0),其在表面组装为延长的三聚体蛋白。前体蛋白在保守的激活切割位点处被切割为通过二硫键连接的2条多肽链,ha1和ha2(其包含跨膜区)。图15提供一些ha的接头区域的氨基酸序列的非限制性实例。

术语“同源三聚体(homotrimer)”或“同源三聚的(homotrimeric)”指通过三个ha蛋白分子形成寡聚物。不希望受理论束缚,ha蛋白被合成为约75kda的单体前体蛋白(ha0),其在表面组装为延长的三聚体蛋白。在三聚作用发生前,前体蛋白在保守的激活切割位点(也被称为融合肽)处被切割为通过二硫键连接的2条多肽链,ha1和ha2(其包含跨膜区)。ha1片段可为328个长度的氨基酸,以及ha2片段可为221个长度的氨基酸。尽管这种切割对病毒的感染性很重要,但是对于蛋白的三聚作用或对于免疫原性它不是必须的。在宿主细胞内质网(er)膜内ha的插入、信号肽的切割以及蛋白的糖基化是共翻译事件。ha的正确再折叠需要蛋白的糖基化和5-6个链内二硫键的形成。ha三聚体在顺式-和反式-高尔基复合体内组装,跨膜结构域在三聚作用过程中发挥作用。菠萝蛋白酶-处理的ha蛋白的晶体结构(其缺乏跨膜结构域)在流感毒株之间表现出高度保守的结构。也已确定,ha在感染过程期间经历主要的构象变化,其需要前体ha0被切割为2条多肽链ha1和ha2。ha蛋白可为加工的(即,包含ha1和ha2结构域),或可为未加工的(即包含ha0结构域)。ha的未加工的前体蛋白被合成为约75kda的前体蛋白(ha0),其在表面组装为延长的三聚体蛋白。在保守的切割位点处(也被称为蛋白水解环)将前体蛋白切割为通过二硫键连接的2条多肽链,ha1和ha2(其包含跨膜区)。

本文所描述的ha蛋白还可为修饰的ha(也被称为“突变体ha”)蛋白,例如修饰的前体蛋白(ha0),其中,蛋白水解环或切割位点被修饰。

修饰的ha/切割位点

ha0的切割后,ha变得对ph敏感,其在核内体的ph(<ph6.0)下经历不可逆的构象变化。前体ha0的构象在低ph下是稳定的,但是切割的ha1-ha2形式是亚稳定的(bulloughpa等,1994,nature.vol371:37-43)。对于b毒株,诱导不同ha的构象变化的ph阈值大约为ph5.8-5.9,然而对于a型ha,ph阈值更酸,其为ph5.1至5.8(beyerwep等,1986,archivesvirol,vol90:173)。切割后,ha2的氨基末端为23个氨基酸的非极性序列,然后其变为扭跨宿主细胞膜的跨膜结构域(被称为融合肽;图15)。ha的切割位点位于ha表面的突出的环上,并且该位点易被蛋白酶接近。

为了优化疫苗在卵中的产生,并且维持有活性但减毒的病毒,研究了h5的多碱性切割位点(rerrrkkr↓g)的修饰(horimotot等,2006,vaccine,vol24:3669-3676)。目标突变体含有前面4个带电氨基酸(rerr)的缺失,并且用tetr代替氨基酸rkkr,其使多碱性切割位点失活,但是通过tetr基序(motif)的精氨酸残基维持了将ha0加工为ha1-ha2的可能性(参见图19)。通过nibsc采用产生减毒病毒的类似策略以废除多碱性位点,其允许在不杀死卵的情况下产生高产量的a/火鸡(turkey)/火鸡/1/2005h5n1毒株。多碱性位点序列(gerrrkkr↓g)在它们的突变体中被retr代替(nibsc05/240nibsc流感参考病毒nibg-23)。h5ha的多碱性切割位点也被h6的单碱性位点代替以用于在卵中表达。在该实例中,多碱性位点的前面4个残基和后面四个氨基酸被ietr代替(用ietr↓g代替rerrrkkr↓g;hoffmane等,2002,vaccine,vol20:3165-3170)。在上文提供各个实例中,进行修饰以使病毒减毒同时维持卵内ha的产生。就是说,ha0前体的切割不完全失活,以便允许ha0被加工为ha1-ha2并且经历ph构象变化,从而允许宿主细胞中的病毒复制。

本文所使用的术语“修饰的血凝素”或“修饰的ha”、“突变的血凝素”或“突变的ha”指ha,其中ha具有修饰或突变,例如取代、插入、缺失或其组合,其导致ha蛋白的蛋白水解环中或切割位点处的氨基酸序列的改变。

已确定来自a/香港/68的ha0的晶体结构(chen,j.,1998.cell95:409-417;其通过引用并入本文)。暴露于溶剂的残基通常被认为是切割位点的部分,其形成延伸的、高度暴露的表面环。在该选定区域确定共有序列,例如,但不限于:

a/h3/ha0共有区:nvpekqtr/gifgaiagfie(seqidno:66)

a/h1/ha0共有区:nipsiqsr/glfgaiagfie(seqidno:67)

禽类h5共有区:qresrrkkr/glfgaiagfieg(seqidno:1)

b/ha0共有区:pakllker/gffgaiagfle(seqidno:68)

其中ha1和ha2之间的切割通过“/”指示(参见bianchi等,2005,journalofvirology,79:7380-7388;其通过引用并入本文),以及也参见图15和18a。

ha蛋白可为b型流感血凝素或a型流感血凝素蛋白,其在蛋白水解环区具有修饰,例如蛋白水解环(切割位点)的缺失、插入、取代或其组合。不希望受理论束缚,蛋白水解环的修饰可确保ha分子被维持为ha0前体。从而产生包含ha0蛋白的更均匀和一致的vlp。

“蛋白水解环”或“切割位点”意指在前体ha0切割中所涉及的蛋白水解位点的共有序列。本文所使用的“共有区”或“共有序列”指包含相关序列的序列变异性的序列(氨基酸或核苷酸序列),其基于多重序列(例如,具体流感亚型的ha0序列)的比对分析。流感ha0切割位点的共有序列可包括流感a共有血凝素氨基酸序列(其包括例如共有h1、共有h3、共有h5),或流感b共有血凝素氨基酸序列,例如但不限于b佛罗里达和b马来西亚。蛋白水解环区域的序列的非限制性实例如图15和18b中所示(并且参见bianchi等,2005,journalofvirology,79:7380-7388;其通过引用并入本文)。

蛋白水解环或切割位点处的残基可被突变,例如但不限于:点突变、取代、插入或缺失。本文所使用的术语“氨基酸突变”或“氨基酸修饰”意指涵盖氨基酸取代、缺失、插入和修饰。可做出取代、缺失、插入和修饰的任意组合以实现最终的构建体,条件是最终的构建体拥有期望的性质,例如,减少或废除的蛋白水解环或切割位点的蛋白酶切割。

“修饰的蛋白水解环”,其意指蛋白水解环可包括一个或多个点突变,被部分地缺失、完全地缺失、用接头序列部分地代替、用接头序列完全地代替、包含用一个或多个非-蛋白氨基酸来部分或完全代替切割位点内的氨基酸,或上述项的组合。类似地,“修饰的切割位点”,其意指蛋白水解环内的切割位点可包括一个或多个点突变,被部分地缺失、完全地缺失、用接头序列部分地代替、用接头序列完全地代替、包含用一个或多个非-蛋白氨基酸来部分或完全代替切割位点内的氨基酸,或上述项的组合。蛋白水解环和/或切割位点的修饰,也可涉及位于蛋白水解环或切割位点序列的外部或与其邻近的一个或多个氨基酸的缺失、代替或取代。“接头”意指包含一个或多个氨基酸的氨基酸序列,其可被引入蛋白水解环或切割位点内,或者其可代替蛋白水解环或切割位点处一些或全部氨基酸。可设计接头以确保蛋白水解环或切割位点内的任意氨基酸的缺失不破坏修饰的ha的表达或随后的活性。

在植物中表达修饰的ha时,与相同条件下植物中所表达的天然ha相比,通过修饰或缺失蛋白水解环使ha蛋白稳定,可实现产物或蛋白产量的增加。此外,与相同条件下植物中所表达的天然ha相比时,通过修饰或缺失蛋白水解环,降低了被表达的修饰ha的表达变异性,以及增加了产生的修饰ha的一致性。

因此,本发明也包括增加植物中ha蛋白的产物产量的方法。不希望受理论束缚,据信通过修饰或缺失ha蛋白中的蛋白水解环,提供了改善的抵抗植物中蛋白水解的稳定性,高尔基体分泌过程中ha传代期间以及纯化过程期间的稳定性。

此外,本发明也包括提高植物中所表达的ha蛋白的产物质量的方法。产物质量意指,例如增加的在植物中所表达的ha的产物产量、产物稳定性(例如增加的植物中所表达的ha的稳定性)、产物的一致性(例如产生同质产物,例如ha0),或上述项的组合。

产物或蛋白产量的增加,其意指与不具有去除的蛋白水解环的相同ha蛋白的产物或蛋白产量相比时,使用本领域标准技术所测定的约20%至约100%或其间的任意量,例如,约40%至约70%或其间的任意值,例如约20%、22%、24%、25%、26%、28%、30%、32%、34%、35%、36%、38%、40%、42%、44%、45%、46%、48%、50%、52%、54%、55%、56%、58%、60%、65%、70%、75%、80%、85%、90%、95%或100%,或其间的任意量的相对蛋白产量的增加。

如图13a和图14中所示,来自b/布里斯班/60/2008的ha在农杆菌渗入的烟草本塞姆氏(nicotianabenthamiana)叶中表达很弱(参见条带1008)。然而,经修饰以缺失蛋白水解环的b型ha的表达(参见条带1059,图13a、图14)导致表达增加。此外,ha-b型与来自a/新喀里多尼亚/20/99的m2的共表达,导致ha表达的增加(参见条带“1008+1261”;和“1059+1261”)。包含蛋白水解环的缺失的b型ha与来自a/波多黎各/8/34的m2的共表达,也导致表达增加(1059+859;图14)。

图46b中进一步显示,经修饰ha以缺失或修饰蛋白水解环时,增加了在农杆菌渗入的烟草本塞姆氏中所表达的来自h7a/杭州/1/13的ha蛋白的蛋白产量。天然(野生型)hah7a/杭州/1/13与来自a/新喀里多尼亚/20/99的m2的共表达,导致100%相对蛋白产量,然而,包含蛋白水解环缺失的hah7a/杭州/1/13与来自a/新喀里多尼亚/20/99的m2的共表达导致182%相对蛋白产量(图46b)。然而,包含蛋白水解环缺失的ha的相对蛋白产量的增加不取决于m2。例如图29a中所示,与天然的h7a/杭州/1/13相比时,包含蛋白水解环缺失的h7a/杭州/1/13表现出表达增加(通过相对ha滴度的测量)。

评估一些策略以便使a毒株和b毒株的ha0的切割失活。被蛋白酶识别的共有序列被附在延伸环上、暴露于溶剂,并且靠近蛋白的膜远侧部分。在b毒株中,该环含有被蛋白酶识别的2个序列基序,以及ha2结构域的前面的n-端氨基酸。使ha0前体的切割失活的点突变方法(例如参见下面的表2),在没有增加b毒株vlp累积的情况下导致ha0产生。包含2个蛋白酶切割基序(7个氨基酸)的序列基序的缺失,废除了bha的累积。去除来自b毒株的ha蛋白的全部18-氨基酸的环,并且插入接头以维持蛋白结构的结构特征(β链)是有效的(参见下面;图13a、14、16a、17b)。a毒株的ha蛋白中蛋白水解环的去除或代替也是有效的(参见图20、22)。

氨基酸序列缺失和插入包括氨基酸的缺失和插入氨基酸。流感b中缺失的非限制性实例为,例如,在图18c所示的流感b弗罗里达和流感b马来西亚所示的,成熟ha蛋白的位置340至357的17个氨基酸(akllkergffgaiagfle)的缺失。该缺失可被适当的接头代替以连接正确表达的多肽链,例如但不限于,使用图21b所示的序列“gg”(seqidno:17;修饰的b/布里斯班/60/2008;用gg代替akllkergffgaiagfleg;例如构建体1059,图5d,10;构建体1039,图8b或构建体1467;图7d、7e)。可选的代替使得包括如图21c所示(seqidno:18)的用“gsssgsssg”代替“ppakllker”。此外,如图19所示,对于流感h5/印度尼西亚,序列“resrrkkr”可被“tetr”或“tetq”代替。

用于来自a毒株的ha的可选的氨基酸突变包括氨基酸取代、插入和缺失,例如但不限于h5安徽的蛋白水解环区域的氨基酸序列“rerrrkrglfgaiagfie”的缺失、包含“resrrkkrglfgaiagfie”的h5indo的蛋白水解环区域的氨基酸序列的缺失,或h5越南的蛋白水解环区域的氨基酸序列“rerrrkkrglfgaiagfie”的缺失。对于h3,序列“rnvpekqtrgif”可被缺失或被适当的接头序列代替,例如但不限于图21e所示的“gs”(seqidno:20)。可选地,h3中的序列“rnvpekqtr”可被图21f所示的“gssgssgss”代替(seqidno:21;修饰的h3a/珀斯/16/2009)。

此外,修饰或改变ha的蛋白水解环或切割位点以减少或废除蛋白水解环或切割位点的蛋白酶切割,也可包含非-保守氨基酸的取代,即用具有不同结构和/或化学特性的另一种氨基酸代替一种氨基酸。非-蛋白氨基酸也可被用来取代。例如,氨基酸的取代可包括通过亲水性氨基酸代替疏水性氨基酸。氨基酸的取代可包括通过蛋白质氨基酸的非自然发生的氨基酸或通过其自然发生的氨基酸的衍生物的代替。

用于来自b毒株和/或a毒株的ha的氨基酸突变可包括氨基酸缺失。例如为了减少或废除蛋白水解环或切割位点的蛋白酶切割,在蛋白水解环或切割位点序列内缺失或去除一个或多个氨基酸。缺失的非限制性实例包括去除天然hah5蛋白的氨基酸323至341,例如图18c所示的h5安徽(rerrrkrglfgaiagfie)、h5indo(resrrkkrglfgaiagfie),或h5越南(rerrrkkrglfgaiagfie)。对于h3,序列“rnvpekqtrgif”可被“gs”代替(图21e;seqidno:20),或h3序列“rnvpekqtr”可被“gssgssgss”代替(图21f;seqidno:21)。对于b毒株,序列“akllkergffgaiagfle”可被缺失和/或被序列“gg”代替,如图21b所示(seqidno:17),序列“akllkergffgaiagfleg”可被“gg”代替,或序列“ppakllker”被“gsssgsssg”代替(图21c;seqidno:18)。

可使用本领域已知的遗传或化学方法生成氨基酸突变。遗传方法可包括定点诱变、pcr、基因合成等等。考虑了通过除遗传改造以外的方法来改变氨基酸侧链基团的方法(如化学修饰),也是有用的。

因此,本发明的血凝素(ha)序列可包含修饰的蛋白水解环序列或切割位点,从而减少或废除蛋白水解环或切割位点的蛋白酶切割。血凝素多肽序列可包含修饰的蛋白水解环或修饰的切割位点序列,例如图5d、7d、8a、18c、19、21b、21c、21e、21f、24d、25d和26d所述的。使用本领域已知的许多方法,包括序列比对(参见例如图15),可确定或预测任何流感毒株的任何血凝素多肽序列的切割位点。

来自h1、h3和bha的序列分析揭示,h1具有直接在融合肽之前的一个单碱性蛋白水解位点(克拉拉(clara)型单碱性:q/exr),然而h3和bha具有2个蛋白水解位点,其中一个位点被克拉拉-样蛋白酶识别(如h1中发现的),以及另一个位点被胰蛋白酶和胰凝乳蛋白酶-样蛋白酶(p-e/a-k)识别。关于这些ha的切割的共有序列如表1中所示。

表1:关于前体ha0切割的蛋白水解位点的共有序列。被克拉拉(clara)类胰蛋白酶或胰蛋白酶/胰凝乳蛋白酶(chimotrypsine)识别的序列分别斜体和黑体显示。一些ha毒株包含多碱性的弗林型切割位点(rkkr;纯文本,加下划线)。

为了避免ha的ha0前体潜在的蛋白水解切割,只有一个蛋白水解位点可能需要从h1的序列中修饰,然而,在h3和b的情况下,两个单碱性位点可能需要被修饰。

例如,通过用ile代替lys341(成熟蛋白编号),可消除b/弗罗里达和b/布里斯班的ha0的第一个切割位点(参见表2)。通过用niq代替融合肽之前的三个氨基酸ker(344-346),可废除第二个单碱性位点。表2中提供了ha的一些修饰的蛋白水解环的序列。

表2:破坏前体ha0的切割的突变的实例描述。单碱性的位点斜体(克拉拉-样蛋白酶识别)且黑体(非下划线;胰蛋白酶/胰凝乳蛋白酶-样)显示。突变被显示为黑体且加下划线。箭头代表用于将ha0转化为ha1-ha2的切割位点。

在又一个实施例中,ha0的包含蛋白水解环的序列可被代替或缺失。例如,图21e中提供h3变体,其含有除了ha2的n-端氨基酸gifgia的缺失之外,ha1的c-端的序列rnvpekqt的缺失。缩短的ha1-ha2可通过gs接头连在一起。

在另一个实施例中,例如在h3中,含有蛋白水解切割位点的环可被柔性接头代替,并且ha2部分可保持完整。可设计(gss)3接头以便适应缩短的ha1与ha2(参见图21f)。

在另一个实施例中,来自流感b的ha可含有除ha2的n-端氨基酸gffgaiagfleg的缺失之外的,ha1的c-端处的序列alkllker的缺失。缩短的ha1-ha2可被gg接头连在一起(参见例如图21b;构建体1008)。图13a和b中显示该构建体的表达。

在另一个实施例中,含有蛋白水解位点的环的来自流感b的ha可被柔性接头代替,并且ha2部分保持完整。可设计较长的gsss接头以便适应缩短的ha1与ha2(参见例如图21c)。

如图13a和14所示,来自b/布里斯班/60/2008的ha在农杆菌渗入的烟草本塞姆氏叶中表达很弱(参见条带1008)。然而,经修饰以缺失蛋白水解环的hab型的表达(参见条带1059,图13a,图14)导致表达增加。此外,ha-b型与来自a/新喀里多尼亚/20/99的m2的共表达,导致ha表达的增加(参见条带“1008+1261”;和“1059+1261”)。包含蛋白水解环缺失的hab型与来自a/波多黎各/8/34的m2的共表达,也导致表达增加(1059+859;图14)。

在类似的方式中,h5/indo的蛋白水解环的缺失,并且用“gg”(构建体928;参见图46d)、“tetr”(构建体676;也参见图19、24d)或“tetq”(构建体766;也参见图19、25d)序列的代替,导致表达水平比得上或增加超过天然h5/indo(构建体489;参见图20和23)所观察到的表达水平。

如图13b所示,与不具有去除的蛋白水解环的ha蛋白相比时,通过缺失ha0的蛋白水解环(如图21b所示的序列),得到的ha0蛋白呈现出以较强的血凝能力所显示的增加的活性。

活性增加,其意指与不具有去除的蛋白水解环的相同ha蛋白的活性相比时,使用本领域的标准技术所测定的约2%至约100%,或其间的任意量,例如,约10%至约50%或其间的任意值,例如约2、5、8、10、12、15、18、20、22、24、25、26、28、30、32、34、35、36、38、40、42、44、45、46、48、50、52、54、55、56、58、60、65、70、75、80、85、90、95或100%,或者其间的任意量的血凝能力的增加。

本发明也包括编码来自例如修饰的h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha的修饰的ha的核苷酸序列,或者在严格的条件下与h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha杂交的任何核苷酸序列,或者在严格的杂交条件下与h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha的互补物杂交的核苷酸序列,其中所述核苷酸序列编码血凝素蛋白,其表达形成vlp,并且vlp诱导抗体的产生。例如,植物细胞内核苷酸序列的表达形成vlp,并且vlp可被用来产生能够结合ha的抗体,所述ha包括来自b或h3的成熟ha。当被施用于对象时,vlp诱导免疫应答。优选地,vlp诱导抗体的产生,并且当被施用于对象时,vlp诱导免疫应答。

例如,植物细胞内核苷酸序列的表达形成vlp,并且vlp可被用来产生能够结合诸如ha的病毒蛋白的抗体,例如,所述ha包括但不限于ha0、具有蛋白水解环缺失的或修饰的ha0蛋白、一种或多种流感型或亚型的ha1或ha2,例如但不限于亚型h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16、b型ha。当被施用于对象时,vlp诱导免疫应答。

严格的杂交条件下的杂交是本领域已知的(参见例如currentprotocolsinmolecularbiology,ausubel等,编著.1995和supplements;maniatis等,inmolecularcloning(alaboratorymanual),coldspringharborlaboratory,1982;sambrook和russell,inmolecularcloning:alaboratorymanual,第三版2001;其各自通过引用并入本文)。该严格杂交条件的一个实例可为:在65℃下于4xssc中约16-20小时的杂交,随后在65℃下用0.1xssc冲洗1小时,或在65℃下用0.1xssc二次冲洗,每次20或30分钟。可选地,示例性严格杂交条件可为:42℃下于50%甲酰胺,4xssc中过夜(16-20小时),随后在65℃下用0.1xssc冲洗1小时,或65℃下用0.1xssc二次冲洗,每次20或30分钟,或过夜(16-20小时),或者在65℃下于church磷酸盐缓冲液(7%sds;0.5mnapo4缓冲液ph7.2;10mmedta)中杂交,50℃下用0.1xssc、0.1%sds二次冲洗,每次20或30分钟,或者在65℃下用2xssc、0.1%sds二次冲洗,每次20或30分钟。

此外,本发明包括这样的核苷酸序列,其特点为与编码h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha的核苷酸序列具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性,其中所述核苷酸序列编码具有修饰的蛋白水解环序列或切割位点的血凝素蛋白(修饰的ha),其减少或废除了蛋白水解环或切割位点的蛋白酶切割。当表达编码修饰的ha的核苷酸序列时,其形成vlp,并且所述vlp诱导抗体的产生。例如,植物细胞内核苷酸序列的表达形成vlp,并且所述vlp可被用来产生能够结合ha的抗体,所述ha包括未加工的ha(ha0)或未被加工,其中蛋白水解环已被缺失。当被施用于对象时,vlp诱导免疫应答。

此外,本发明包括这样的核苷酸序列,其特点为与核苷酸序列seqidno:43、91、95、97、99、101、103、105、107、109、111、113、137、140、144、151、158、165具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性,其中所述核苷酸序列编码修饰的ha蛋白,当其表达时形成vlp,并且所述vlp诱导产生能够结合ha的抗体,所述ha包括未加工的ha(ha0)或未被加工,其中蛋白水解环已被缺失或修饰。当被施用于对象时,vlp诱导免疫应答。

此外,本发明包括这样的氨基酸序列,其特点为与氨基酸序列seqidno:17、18、20、21、41、58、77、81、85、92、96、98、100、102、104、106、108、110、112、114、134、143、147、154、161、168、194和199具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性。其中所述氨基酸序列编码修饰的ha蛋白,当其表达时形成vlp,并且所述vlp诱导产生能够结合ha的抗体,所述ha包括未加工的ha(ha0)或未被加工的,其中蛋白水解环已被缺失或修饰。当被施用于对象时,vlp诱导免疫应答。

可使用如dnasis(例如,使用,但不限于以下的参数:gap罚分5,顶部对角的#5,固定的gap罚分10,k-串2,浮动缺口10,和窗口大小5)内所提供的核苷酸序列比对程序,测定序列同一性或序列相似性。然而,用于比较的序列对比的其他方法是本领域公知的,例如smith&waterman的算法(1981,adv.appl.math.2:482)、needleman&wunsch的算法(j.mol.biol.48:443,1970)、pearson&lipman的算法(1988,proc.nat'l.acad.sci.usa85:2444),并且通过计算机实施这些算法(例如gap、bestfit、fasta和blast),或通过手工比对和目视检查。来自不同流感毒株的ha的序列比对的实例见于图24。

例如,但不限于,编码以下的核苷酸序列:

-具有如seqidno:17、seqidno:18、seqidno:41、seqidno:43、seqidno:58、seqidno:96、seqidno:98、seqidno:100、seqidno:102、seqidno:104、seqidno:106、seqidno:108、seqidno:110、seqidno:112、seqidno:114和seqidno:168所定义的修饰的蛋白水解环的b型ha;或者编码以下的核苷酸序列:具有如seqidno:65、seqidno:72、seqidno:73、seqidno:95、seqidno:97、seqidno:99、seqidno:101、seqidno:103、seqidno:105、seqidno:107、seqidno:109、seqidno:111、seqidno:113和seidno:165所定义的修饰的蛋白水解环区域的b型ha。

-具有修饰的蛋白水解环的h1包括含有如seqidno:63所定义的修饰的切割位点的序列。

-具有修饰的蛋白水解环的h2包括含有如seqidno:134所定义的修饰的切割位点的序列。

-具有修饰的蛋白水解环的h3包括如seqidno:20、seqidno:21、seqidno143、seqidno:147所定义的序列或含有如seqidno:64所定义的修饰的切割位点的序列。

-具有缺失的蛋白水解环的h5包括含有如seqidno:61、seqidno:62、seqidno:69、seqidno:70、seqidno:71所定义的修饰的切割位点的序列。

-具有修饰的蛋白水解环的h7包括含有如seqidno:154所定义的修饰的切割位点的序列,或者编码含有如seqidno:151所定义的修饰的蛋白水解环区域的h7型ha的核苷酸序列。

-具有修饰的蛋白水解环的h9包括含有如seqidno:161所定义的修饰的切割位点的序列,或编码含有如seqidno:158中所定义的修饰的蛋白水解环区域的h9型ha的核苷酸序列。

本发明关于包含跨膜结构域并且包括ha1和ha2结构域的ha蛋白的用途,例如所述ha蛋白可为ha0,或包含ha1和ha2的加工的ha。使用植物或植物细胞表达系统,ha蛋白可被用于产生或形成vlp。

扩增元件和增强子元件/调控元件

在另一个实施例中,修饰ha蛋白可在包含扩增元件和/或调控元件或区域(本文也被称为增强子元件)的表达系统中表达。例如来自双粒病毒组的扩增元件,如例如,来自菜豆黄矮病毒(beydv)的扩增元件可被用来表达修饰的ha。beydv属于适合于双子叶植物的玉米线条虫属(mastreviruses)。beydv是具有单链环状dna基因组的单组分,并且其可通过滚环机制复制至十分高的拷贝数。beydv-来源的dna复制子载体系统,已被用于在植物中快速高产量的蛋白产生。

本文所使用的短语“扩增元件”指包含至少一部分的双粒病毒组基因组的一个或多个长基因间隔区(lir)的核酸节段。本文所使用的“长基因间隔区”指含有能够通过双粒病毒组rep蛋白调节切除和复制的rep结合位点的长基因间隔区的区域。在一些方面中,包含一个或多个lirs的核酸节段,还可包含双粒病毒组基因组的短基因间隔区(sir)。如本文所使用的,“短基因间隔区”指互补链(玉米线条虫属的短ir(sir))。本文可使用任何适合的双粒病毒组-来源的扩增元件。参见,例如,wo2000/20557;wo2010/025285;zhangx等(2005,biotechnologyandbioengineering,vol.93,271-279),huangz等(2009,biotechnologyandbioengineering,vol.103,706-714),huangz等(2009,biotechnologyandbioengineering,vol.106,9-17);其通过引用并入本文)。如果在所述构建体中使用多于一个lir,例如两个lirs,那么对于两个lirs的每一个来说,启动子、cmpv-ht区域和目标核酸序列以及终止子是相等的。

如本文所描述的,通过烟草本塞姆氏叶的农杆菌渗入,菜豆黄矮病毒(beydv)-来源的载体和rep/repa-供应载体的共递呈,导致有效的复制子扩增和大量的蛋白产生。来自转化有驱动具有或没有蛋白水解环去除的修饰的流感bha(来自b/布里斯班/60/2008)(参见图17a的构建体)在存在或不存在扩增元件beydv(构建体1059号和1039号)时的表达的基因构建体的植物的蛋白提取物的western印迹分析表明,当调控元件是cpmv-ht,在不存在beydv时,可检测到流感bha无累积(图17b),。

如图17b所示,通过western印迹分析,来自b/布里斯班/60/2008的具有蛋白水解环去除的ha,在不存在beydv时的表达不会导致可检测的表达(参见图17b中的条带1039)。然而,具有蛋白水解环去除的hab型,在存在扩增元件beydv时的表达,导致增加的表达(参见条带1059)。同样地,在不存在beydv时,包含蛋白水解环缺失的突变体ha-b型与来自a/新喀里多尼亚/20/99的m2的共表达,不会导致可检测的ha表达(参见图17b中的条带“1039+1261”)。另一方面,包含蛋白水解环缺失的突变体ha-b型,在存在beydv时,与来自a/新喀里多尼亚/20/99的m2的共表达导致增加的表达(参见条带“1059+1261”;图17b)。

然而,当增强子元件存在于表达系统中,且当增强元件不是cpmv-ht时,beydv的存在不是必须的。例如,如图29a所示,在不存在beydv时,在诸如cpmv160、cpmv160+或cpmvht+的增强子元件的控制下不同bha毒株的表达导致ha蛋白的产生,其表现出增加的血凝滴度(hmg)。

因此,突变体(修饰的)ha蛋白可在不存在扩增元件,如基于双粒病毒组的扩增元件(例如beydv),但在存在诸如cpmv160、cpmv160+或cpmvht+的增强子元件下表达。

突变体(修饰的)ha可在存在诸如cpmv160、cpmv160+或cpmvht+的增强子元件,但在不存在或存在诸如beydv的扩增元件下表达。如图28b、28c和28f所示,突变体(修饰的)ha可在增强子元件的存在下,有或无扩增元件存在下表达。因此本发明也涉及突变体(修饰的)ha在增强子元件和任选的扩增元件的存在下表达。

当与野生型或包含cpmvht的ha构建体相比时,包含增强子元件(cmpvht+或cmpv160+)和用gg接头代替蛋白水解环(缺失的蛋白水解环)的ha构建体,呈现出增加的表达(图28a,h3珀斯(per);图28b,b马来西亚;图28c,h9hk(香港);图29d,b马萨诸塞州(mass);图28e,h2新加坡(sin))。

图29a呈现在植物中所产生的包含基于cpmvht、cpmvht+、cpmv160或cpmv160+的增强子元件的修饰ha蛋白质或天然ha的血凝滴度的总结数据,所述增强子元件与编码具有缺失的蛋白水解环(gg接头)的修饰ha或天然ha的核苷酸序列可操作地连接。在大多数的情况下,基于cpmvht+、cpmv160或cpmv160+构建体的表达较高(测定为血凝滴度),表明显著的表达水平。

增强子元件可被用来实现具有修饰的蛋白水解环的突变体(修饰的)ha蛋白的高水平的瞬转表达。增强子元件可基于rna植物病毒,包括豇豆花叶病毒组,如豇豆花叶病毒(cpmv;参见,例如,wo2007/135480;wo2009/087391;us2010/0287670,sainsburyf等,2008,plantphysiology;148:121-1218;sainsburyf等,2008,plantbiotechnologyjournal;6:82-92;sainsburyf等,2009,plantbiotechnologyjournal;7:682-693;sainsbury等,2009,methodsinmolecularbiology,recombinantproteinsfromplant,vol.483:25-39)。

cpmv160(cpmvx)和cpmv160+(cpmvx+)

在一个实施方案中,增强子元件为us61/925,852中所描述的“cpmvx”(也被称为“cpmv160”)和/或“cpmvx+”(也被称为“cpmv160+”),其通过引用并入本文。

表达增强子“cpmvx”包含豇豆花叶病毒组的豇豆花叶病毒(cpmv)5’非翻译区(utr)。来自cpmvrna-2序列(seqidno:93)的核苷酸1-160的5’utr,起始于转录起始位点至第一个框内起始密码子(在位置161),其作为用于产生由野生型豇豆花叶病毒基因组片段编码的两个羧基共末端蛋白的较长者的起始位点。此外,cpmvrna-2基因组序列中在(或对应于)位置115处的‘第三个’起始位点也可被突变、缺失或否则改变。已表明,当与不完整m蛋白结合时,除了aug161的去除之外,aug115的去除提高了表达(sainsburyandlomonossoff,2008,plantphysiology;148:1212-1218;wo2009/087391;其通过引用并入本文)。

cpmvx包含seqidno:93的x个核苷酸,其中seqidno:93的x=160、155、150或114,或者包含与cpmvx具有80%至100%序列相似性的序列,其中seqidno:93的x=160、155、150或114。该表达增强子通常被称为cpmvx(参见图26a)。

表达增强子cpmvx,其中x=160,由seqidno:93的核苷酸1-160组成:

1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc

61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc

121gatcttcaacgttgtcagatcgtgcttcggcaccagtaca(seqidno:93)

cpmvx增强子序列还可与填充序列融合,其中cmpvx包含seqidno:1的x个核苷酸,其中seqidno:1的x=160、155、150或114,或者包含与cpmvx具有80至100%序列相似性的序列,其中seqidno:93的x=160、155、150或114,并且填充序列包含与cmpvx序列3’端融合的1-100个核苷酸。例如,填充序列可包含约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸,或其间任意数量的核苷酸。

如果cmpvx序列包含填充片段,那么该表达增强子可被称为cpmvx+(参见图26a),其中seqidno:1的x=160、155、150、114,其也可被称为包含填充序列的cmpvx,或其可被分别地称为cpmv160+;cpmv155+;cpmv150+;cpmv114+,此时x=160、155、50或114。包含cpmvx(其不包含填充序列)的构建体被称为cpmvx+,其中seqidno:93的x=160、155、150、114,并且其中填充序列为0个长度的核苷酸。

可通过位于核苷酸160的3’端的天然cmpv5’utr序列的截短、缺失或代替来修饰填充序列。当与连接有5’utr的原始的或未修饰的(即天然的)填充序列相比时,修饰的填充序列可被去除、代替、截短或缩短(如在sainsburyf.andlomonossoffg.p.,2008,plantphysiol.148:pp.1212-1218所述)。填充序列可包含一个或多个限制性位点(多接头、多克隆位点、一个或多个克隆位点),一个或多个植物kozak序列,一个或多个接头序列,一个或多个重组位点或其组合。例如,其不应被认为是限制,填充序列可连续地包含与植物kozak序列融合的预期长度的多克隆位点。填充序列不包含来自位于天然cpmv5’utr的核苷酸160的3’的天然5’utr序列的核苷酸序列,例如sainsburyf.,andlomonossoffg.p.的图1中所示的核苷酸161至512(2008,plantphysiol.148:pp.1212-1218;其通过引用并入本文),或seqidno:4的核苷酸161-509。就是说,在本发明中,存在于现有技术的cpmvht序列中的不完整m蛋白(sainsburyf.,andlomonossoffg.p.,2008的图1中)从5’utr被去除。

植物kozak共有序列是本领域已知的(参见,例如rangan等.mol.biotechnol.,2008,july39(3),pp.207-213)。自然发生的和合成的kozak序列均可被用于表达增强子中,或可与本文所描述的目标核苷酸序列融合。

植物kozak序列可为任何已知的植物kozak序列(参见,例如l.rangan等.mol.biotechnol.2008),其包括但不限于以下的植物共有序列:

caa(a/c)a(seqidno:174;植物界)

aaa(a/c)a(seqidno:175;双子叶植物)

aa(a/g)(a/c)a(seqidno:176;拟南芥)

植物kozak序列也可选自:

agaaa(seqidno:177)

agaca(seqidno:178)

aggaa(seqidno:179)

aaaaa(seqidno:180)

aaaca(seqidno:181)

aagca(seqidno:182)

aagaa(seqidno:183)

aaagaa(seqidno:184)

aaagaa(seqidno:185)

(a/-)a(a/g)(a/g)(a/c)a.(seqidno:186;共有序列)

表达增强子cpmvx或cpmvx+,在增强子序列的5’端与在植物中有活性的调控区可操作地连接,并且在表达增强子的3’端与目标核苷酸序列可操作地连接(图26a),以便促使目标核苷酸序列在植物宿主内的表达。

cpmvht+、cpmvht+[wt115]、cpmvht+[511]

在另一个实施方案中,增强子元件为us61/971,274中所描述的“cpmvht+”,其通过引用并入本文。表达增强子“cpmvht+”(参见图27a)包含豇豆花叶病毒5’非翻译区(utr)和修饰的、延长的或截短的填充序列。

也提供植物表达系统,其包括包含调控区的第一核苷酸序列和编码修饰的ha的核苷酸序列,所述调控区与本文所描述的一个或多于一个表达增强子(例如cpmvht+、cpmvht+[wt115]、cpmvht+[511])可操作地连接。此外,描述了包含启动子(调控区)序列、表达增强子(例如cpmvht+或cpmvht+[wt115])的核酸,所述表达增强子包含豇豆花叶病毒5’utr和与编码修饰的ha的一个或多个核酸序列融合的具有植物kozak序列的填充序列。核酸还可包含含有豇豆花叶病毒3’非翻译区(utr)(例如,质体蓝素3’utr或在植物中有活性的其他3’utr)和终止子序列(例如nos终止子)的序列,所述序列与编码修饰的ha的核苷酸序列(在图27a中被称为目标核苷酸)的3’端可操作地连接,以便将编码修饰ha的核苷酸序列插入豇豆花叶病毒3’非翻译区(utr)、质体蓝素3’utr或其他3’utr序列上游。

seqidno:173包含现有技术中已知的“cpmvht”表达增强子(例如sainsburyandlomonossoff2008,plantphysiol.148:pp.1212-1218的图1;其通过引用并入本文)。cpmvht包括来自在位置115(cgt)处具有修饰的核苷酸的seqidno:173的核苷酸1-160的5’utr序列以及在位置162(acg)处具有修饰的核苷酸的不完整m蛋白,并且缺少植物kozak序列(5’utr:核苷酸1-160;加下划线的不完整m蛋白,核苷酸161–509)。seqidno:173也包括不存在于现有技术cpmvht序列中的多克隆位点(斜体,核苷酸510-528):

seqidno:187中提供了具有植物kozak共有序列的cpmvht+(核苷酸1-160,5’utr,其包含位置115(gtg)处小写黑体且斜体的修饰的atg;填充片段包含:加下划线的不完整m蛋白,核苷酸161–509,在162(acg)处具有修饰的核苷酸;多克隆位点,斜体,核苷酸510-528;以及共有植物kozak序列,大写且黑体,核苷酸529-534)。

seqidno:188(“cpmvht+511”)包含核苷酸1-154的cpmvrna2基因组的天然序列的节段。来自seqidno:188的核苷酸1-511的5’utr序列包含在位置115(“g”代替“a”;斜体粗体)和162(“c”代替“t”;斜体粗体)处修饰的“atg”序列,和来自核苷酸161-511的不完整m蛋白(加下划线)。cpmvht+511包含天然m蛋白的kozak共有序列(核苷酸508-511;粗体):

通过seqidno:189(cpmvht+[wt115])的序列提供cpmvht+增强子序列的另一个非限制性实例。表达盒或载体也是本发明的部分,所述表达盒或载体包含cpmvht+并且包括与seqidno:189的表达增强子序列可操作地结合的植物调控区以及与编码修饰的ha的核苷酸序列融合的3’端转录起始位点(atg)。

seqidno:189(cpmvht+[wt115])的核苷酸1-160,5’utr,在位置115-117处具有atg,小写粗体;填充片段包含:加下划线的不完整m蛋白,核苷酸161-509,在位置161-163(161-153)处的小写粗体且加下划线的修饰的atg,多克隆位点,斜体,核苷酸510-528;以及植物kozak序列,大写且粗体,核苷酸529-534)。

seqidno:189的植物kozak序列可为任何植物kozak序列,包括但不限于seqidno’s:174-186的序列之一。

“嵌合蛋白”

修饰ha还可为嵌合蛋白。“嵌合病毒蛋白”或“嵌合病毒多肽”,也被称为“嵌合蛋白”或“嵌合多肽”,或者“嵌合ha”,其意指包含来自两种或更多种来源例如但不限于两种或更多种流感型或流感亚型,或者不同起源的流感的氨基酸序列的蛋白或多肽,其被融合为单一多肽。嵌合蛋白或多肽可包括与所述多肽或蛋白的剩余物相同或与其异源的信号肽。嵌合蛋白或嵌合多肽可以作为嵌合核苷酸序列的转录物并且随后合成而产生,并且根据需要可结合形成多亚基蛋白。因此,嵌合蛋白或嵌合多肽也包括包含经二硫键结合的亚基的蛋白或多肽(即多亚基蛋白)。例如,包含来自两种或更多种来源的氨基酸序列的嵌合多肽可被加工成亚基,且亚基经二硫键结合以产生嵌合蛋白或嵌合多肽。嵌合ha蛋白也可包含第一流感病毒的抗原蛋白或其片段,和来自第二病毒流感ha的跨膜结构域复合体(tdc),所述复合体(tdc)包括跨膜结构域和胞浆尾结构域(tm/ct)。多肽可为修饰的ha,并且组成多肽的两种或更多种的氨基酸序列的每一种可获自不同的ha的氨基酸序列,以产生嵌合ha、嵌合流感ha、嵌合修饰的ha或嵌合修饰的流感ha。嵌合ha也可包括包含异源信号肽的氨基酸序列(嵌合ha前蛋白),所述信号肽在蛋白合成之后或期间被切除。优选地,嵌合多肽或嵌合的流感ha不是自然发生的。编码嵌合多肽的核酸可被描述为“嵌合核酸”或“嵌合核苷酸序列”。例如嵌合核酸可为包含编码修饰的ha的核苷酸序列,所述嵌合核酸包含按顺序编码修饰的ha胞外域、流感跨膜结构域和胞质尾区的嵌合核苷酸序列,其中修饰的ha胞外域包含修饰的蛋白水解环且来自第一流感毒株,而跨膜结构域和胞质尾区来自第二流感毒株。实施例5.14、5.16、5.18、5.19、5.21和5.23中给出了嵌合核苷酸的实例,其中修饰的ha胞外域来自第一流感毒株,并且跨膜结构域和胞质尾区来自第二流感毒株。包含嵌合ha的病毒样颗粒可被描述为“嵌合vlp”。

如上所述,嵌合蛋白、嵌合多肽或嵌合ha可包括与所述多肽或蛋白的剩余物相同或与其异源的信号肽。术语“信号肽”是本领域已知的,并且通常指通常存在于多肽的n-端的短(约5-30个氨基酸)序列的氨基酸,其可引导最新翻译的多肽迁移至具体的细胞器,或协助多肽链的具体结构域相对于其它结构域的定位。作为非限制性实例,信号肽可靶向蛋白迁移至内质网,和/或协助n-端近侧结构域相对于新生多肽的膜-锚定结构域的定位,以协助诸如修饰的ha或嵌合修饰的ha的成熟蛋白的切割和折叠。

ha也可为嵌合ha或嵌合修饰的ha,其中ha或修饰的ha的天然跨膜结构域被异源跨膜结构域代替。ha蛋白的跨膜结构域是高度保守的(参见,例如wo2010/148511的图1c;其通过引用并入本文)。异源跨膜结构域可获自任何ha的跨膜结构域,例如但不限于来自以下的跨膜结构域:h1加利福尼亚、b/弗罗里达/4/2006(genbank登录号aca33493.1)、b/马来西亚/2506/2004(genbank登录号abu99194.1)、h1/bri(genbank登录号ade28750.1)、h1a/所罗门群岛/3/2006(genbank登录号abu99109.1)、h1/nc(genbank登录号aap34324.1)、h2a/新加坡/1/1957(genbank登录号aaa64366.1)、h3a/布里斯班/10/2007(genbank登录号aci26318.1)、h3a/威斯康星州/67/2005(genbank登录号abo37599.1)、h5a/安徽/1/2005(genbank登录号abd28180.1)、h5a/越南/1194/2004(genbank登录号acr48874.1)、h5-indo(genbank登录号abw06108.1)。跨膜结构域也可通过以下的共有氨基酸序列定义:

ilxiyystvaisslxlxxmlagxsxwmcs(seqidno:94)

包含具有异源跨膜结构域的嵌合ha的构建体实例包括:构建体1875号(cpmv-ht+具有缺失的蛋白水解环的b布里斯班/60/08+h1tm,具有被h1a/加利福尼亚/07/2009所代替的跨膜结构域和胞质尾区;参见实施例5.19),构建体1977号(cpmv-160+具有缺失的蛋白水解环的b布里斯班/60/08+h1tm,具有被h1a/加利福尼亚/07/2009所代替的跨膜结构域和胞质尾区;参见实施例5.14),构建体1067号(cpmv-ht+具有缺失的蛋白水解环的b布里斯班/60/08+h1tm,具有被h1a/加利福尼亚/07/2009所代替的跨膜结构域和胞质尾区;参见实施例5.14),构建体2074号(cpmvhtb马萨诸塞州/2/2012+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替;参见实施例5.16),构建体2060号(cpmvht160+马萨诸塞州/2/2012+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替;参见实施例5.16),构建体2062号(cpmv160+b马萨诸塞州/2/2012+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区;参见实施例5.21),构建体1860号(cpmvht+b威斯康星州/1/2010+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替;参见实施例5.23),构建体1454号(cpmvhtb威斯康星州/1/2010+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替,参见实施例5.18)和构建体1893号(cpmv160+b威斯康星州/1/2010+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替,参见实施例5.18)。图26b和27b中显示这些嵌合修饰的ha’s的活性。

信号肽

信号肽(sp)可源于修饰的ha或嵌合修饰的ha,或者信号肽可与被表达的修饰ha的初级序列异源。修饰的ha可包含与来自一种或多种不同流感型、流感亚型或流感毒株的ha平衡的来自第一流感型、流感亚型或流感毒株的信号肽。例如ha的h1亚型、h2亚型、h3亚型、h5亚型、h6亚型、h7亚型、h9亚型或b型流感的天然信号肽可被用来在植物体系中表达修饰的ha。在本发明的一些实施方案中,sp可为流感b型、h1型、h3型或h5型;或为h1/bri亚型、h1/nc亚型、h5/indo亚型、h3/bri亚型或b/flo亚型。

此外,修饰的ha或嵌合修饰的ha可包含天然或非-天然信号肽;非-天然信号肽可为植物来源或获自动物或细菌多肽。天然信号肽可对应于被表达的ha或修饰ha的信号肽,此外,信号肽可来自除流感外的病毒的结构蛋白或血凝素。可被使用的信号肽的非限制性实例为紫花苜蓿蛋白二硫键异构酶的信号肽(pdisp;登录号z11499的核苷酸32-103,也参见wo2009/076778;wo2010/148511或wo2010/003235),或马铃薯糖蛋白(patatin)信号肽(patasp;位于genbank登录号a08215的核苷酸1738-1806)。该登录号的patasp的核苷酸序列为:

atggcaactactaaaacttttttaattttattttttatgatattagcaactactagttcaacatgtgct(seqidno:171)

马铃薯糖蛋白a信号肽的氨基酸序列为:

mattktflilffmilattsstca(seqidno:172)

因此本发明提供包含天然或非-天然信号肽的修饰的ha或嵌合修饰的ha,以及编码这样的嵌合修饰的ha蛋白的核酸。

与通道蛋白的共表达

可通过共表达编码修饰的ha的第一核酸与编码通道蛋白例如但不限于质子通道蛋白的第二核酸,在植物中产生突变的(修饰的)ha。第一和第二核酸可在相同的步骤中被引入植物,或它们可被连续地引入植物。可以瞬转的方式或以稳定的方式将第一和第二核酸引入植物。此外,表达编码修饰的ha的第一核酸的植物可转化有通道蛋白,例如但不限于质子通道蛋白(第二核酸),以便第一和第二核酸在植物中共表达。可选地,表达通道蛋白例如但不限于质子通道蛋白(第二核酸)的植物可转化有编码修饰ha的第一核酸,以便第一和第二核酸在植物中共表达。此外,表达编码修饰的ha的第一核酸的第一植物可与表达编码通道蛋白例如但不限于质子通道蛋白的第二核酸的第二植物杂交,以产生共表达各自编码修饰的ha和通道蛋白例如但不限于质子通道蛋白的第一和第二核酸的后代植物。

不希望受理论束缚,包含修饰的ha的细胞区室(包括高尔基体)的ph,可对ha的折叠、稳定性和/或蛋白水解作用是重要的。质子通道蛋白,例如流感m2和bm2蛋白可调节细胞区室中的ph。例如,通过缓冲流感病毒复制后期和早期阶段的细胞内区室,m2可调节膜融合的增强作用。

通过与修饰的ha一起共表达通道蛋白例如但不限于质子通道蛋白,高尔基体内的ph可增加,并且导致稳定性的增加、降解的减少或其组合,并且增加修饰的ha和/或vlp的表达水平和产量。

当与表达修饰的ha但不共表达通道蛋白例如但不限于质子通道蛋白的植物相比,通过在植物中与修饰的ha一起共表达通道蛋白例如但不限于质子通道蛋白,观察到ha和/或vlp的产量增加(参见图13a和14)。例如如图13a所示,m2与修饰的流感bha的共表达增加了ha的累积水平(图13a,1059vs1059+1261)。

此外,将来自流感a/波多黎各/8/1934的m2增加修饰的流感bha和h3的累积的功效,与来自流感a/新喀里多尼亚/20/1999的m2增加修饰的流感bha和h3的累积的功效相比较。对于修饰的流感bha,通过对来自转化有构建体1059、1059+1261和1059+859的植物的蛋白提取物的western印迹分析进行比较。获得的结果表明,来自流感a/波多黎各/8/1934的m2(由构建体859号编码)的共表达与来自流感a/新喀里多尼亚/20/1999的m2(由构建体1261号编码)的共表达,在增加修饰的流感bha的累积方面功效相同(图14)。

本文所使用的术语“m2”、“m2蛋白”、“m2序列”和“m2结构域”指分离自、基于或存在于任何自然发生的或人工产生的流感病毒株或分离物的m2蛋白序列的全部或部分。因此,术语m2等等包括在病毒的生命周期期间通过突变所产生的或在对选择性压力(例如,药物治疗、宿主细胞趋性的扩张或感染性等等)的应答中所产生的自然发生的m2序列变体,以及重组或合成所产生的m2序列。可在本发明使用的序列的非限制性实例包括来自a/波多黎各/8/1934的m2和来自a/新喀里多尼亚/20/1999的m2。

免疫应答

“免疫应答”通常指适应性免疫系统的应答。适应性免疫系统通常包含体液应答,以及细胞介导的应答。体液应答是由在b淋巴细胞谱系(b细胞)的细胞中所产生的分泌抗体所介导的免疫力方面。分泌抗体结合入侵微生物(如病毒或细菌)表面上的抗原,其标记入侵微生物用于消灭。体液免疫通常被用来指抗体的产生和伴随抗体产生的过程,以及抗体的效应子功能,其包括th2细胞激活和细胞因子的产生、记忆细胞增殖、调理素促进吞噬作用、病原体的清除等等。术语“调节”或“调整”等指具体的应答或参数的增加或减少,通过通常已知的或使用的任何一些检测(assay)来测定,本文例示了其中一些检测。

细胞介导的应答为免疫应答,其不涉及抗体但涉及巨噬细胞、自然杀伤细胞(nk)、抗原-特异性细胞毒素t-淋巴细胞的活化,以及在对抗原应答中的多种细胞因子的释放。细胞介导的免疫通常被用来指一些th细胞激活、tc细胞激活和t-细胞介导的应答。细胞介导的免疫在对病毒性感染的应答中尤为重要。

例如,可使用elispot检测来测定抗原特异性cd8阳性t淋巴细胞的诱导;可使用增殖检测来测定cd4阳性t-淋巴细胞的刺激。可使用elisa检测来定量抗-流感的抗体滴度;也可使用抗-同型抗体(例如抗-igg、iga、ige或igm)来测定抗原-特异性或交叉反应抗体的同型。用于进行这样的检测的方法和技术是本领域公知的。

交叉反应性的hai滴度也可被用来证明对与疫苗亚型相关的其他病毒株的免疫应答的功效。例如,来自被第一毒株(例如a/印度尼西亚5/05的vlp)的疫苗组合物免疫的对象的血清,可被用于具有完整的病毒或病毒颗粒的第二种毒株(例如a/越南/1194/2004)的hai检测中,并且测定hai滴度。

也可定量细胞因子的存在或水平。例如通过使用elisa(例如bdbiosciencesopteia试剂盒)来测量分泌ifn-γ和il-4的细胞来表征辅助性t细胞的应答(th1/th2)。可培养获自对象的外周血单核细胞(pbmc)或脾细胞,并且分析上清液。也可通过荧光-激活细胞分选法(facs),使用标记物特异性荧光标签定量t淋巴细胞,并且方法是本领域已知的。

也可进行微量中和检测以表征对象中的免疫应答,参见例如rowe等,1973的方法。可通过几种方式获得病毒的中和滴度,其包括:1)细胞的结晶紫固定/着色后溶菌噬斑(噬斑检测)的计数;2)培养物中细胞溶菌的显微镜观察;3)np病毒蛋白(与宿主细胞的病毒感染性相关)的elisa和分光光度检测。

术语“病毒样颗粒”(vlp)”或“病毒-样颗粒”或“vlp”指自我组装的结构并且包含病毒蛋白,例如流感ha蛋白或修饰的ha蛋白(例如ha0蛋白),其中蛋白水解环已被修饰。vlp通常形态学上和抗原性上类似于感染所产生的病毒粒子,但是缺乏足以复制的遗传信息,并且因此为非-感染性的。在一些实例中,vlp可包含单一的蛋白种类,或多于一种蛋白种类。对于包含多于一种蛋白种类的vlp,蛋白种类可来自相同种类的病毒,或可包含来自不同种、属、亚科或科的病毒(通过ictv命名法命名)的蛋白。在其他实施例中,构成vlp的蛋白种类的一种或多种可来自对自然发生的序列进行修饰,例如本文所描述的修饰的ha。vlp可在适合的宿主细胞中产生,其包括植物和昆虫宿主细胞。来自宿主细胞的取提物并且在适合的条件下经分离和进一步纯化后,vlp可被纯化为完整的结构。

此外,可产生包含ha亚型的组合的vlp。例如,vlp可包含来自下述的一种或多种ha或一种或多种修饰的ha:h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型、h16亚型、b亚型ha或其组合。可通过由vlp所制备的疫苗的预期用途来确定选择ha或修饰的ha的组合。例如,用于在接种禽类中使用的疫苗,可包含ha亚型或修饰ha亚型的任意组合,而用于接种人类的vlp可包含一种或多种h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型、h16亚型、b亚型ha,或包含一种或多种修饰的h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型、h16亚型、b亚型ha。然而,可根据vlp的用途制备其他ha亚型或修饰的ha亚型的组合。为了产生包含ha亚型或修饰的亚型ha的组合的vlp,可在相同的细胞例如植物细胞内共表达期望的ha亚型或修饰的ha亚型。

根据本发明,产生自流感来源的蛋白的vlp不包含m1蛋白。已知m1蛋白结合rna(wakefield和brownlee,1989),rna为vlp制备的污染物。当获得用于vlp产物的监管批准时,rna的存在是不理想的,因此缺乏rna的vlp制剂可为有益的。

如本文所述产生的vlp通常不包含神经氨酸苷酶(na)。然而,如果包含ha和na的vlp是理想的,可将na与ha共表达。

本发明也包括但不限于病毒来源vlp,其从表达vlp蛋白的细胞的质膜获得脂质包膜。例如,如果vlp在基于植物的系统中表达,那么所述vlp可获得来自所述细胞的质膜的脂质包膜。

通常,术语“脂质”指脂溶性(亲脂的)自然发生的分子。该术语也被用来更具体地指脂肪酸和其衍生物(包括甘油三酯、甘油二酯和甘油单酯以及磷脂),以及其他脂溶性含有甾醇的代谢物或甾醇类。磷脂连同糖脂类、甾醇类和蛋白是所有生物膜的主要组分。磷脂的实例包括磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰肌醇、磷脂酰丝氨酸等等。甾醇类的实例包括动物甾醇(例如,胆固醇)和植物甾醇。超过200种植物甾醇已在多种植物种类中鉴定,最常见的为菜油甾醇、豆甾醇、麦角甾醇、菜子甾醇、δ-7-豆甾醇、δ-7-燕麦甾醇、daunosterol、谷甾醇、24-甲基胆甾醇、胆固醇或β-谷甾醇。本领域技术人员理解,细胞质膜的脂质组成可随着细胞或获得细胞的有机体的培养或生长条件而变化。

细胞膜通常包含脂质双层,以及用于多种功能的蛋白。脂质双层中可发现局部浓度的特殊脂质,被称为‘脂质筏’。不希望受理论束缚,脂质筏可在胞吞作用和胞吐作用、病毒或其他感染原的进入或排出、细胞内信号转导、细胞或有机体的其他结构组分如细胞内和细胞外基质的相互作用中发挥重大作用。

在植物中,流感vlp从质膜出芽,因此vlp的脂质组成反映了它们的来源。根据本发明所产生的vlp包含与植物来源的脂质复合的一种或多种流感型或流感亚型的ha。植物脂质能刺激特异性免疫细胞并且提高诱导的免疫应答。植物膜由脂质、磷脂酰胆碱(pc)和磷脂酰乙醇胺(pe)组成,并且也含有鞘糖脂、皂苷和植物甾醇。此外,脂质筏也发现于植物质膜中—这些微区富含鞘脂类和甾醇类。在植物中,已知存在多种植物甾醇,其包括豆甾醇、谷甾醇、24-甲基胆甾醇和胆固醇(mongrand等,2004)。

pc和pe,以及鞘糖脂能结合由哺乳免疫细胞如抗原-递呈细胞(apcs)样树突细胞和巨噬细胞以及其他细胞(包括胸腺和肝脏中的b淋巴细胞和t淋巴细胞)所表达的cd1分子(tsujim,.2006)。cd1分子结构上类似于i型的主要组织相容性复合体(mhc)分子,并且其作用是将糖脂类抗原递呈至nkt细胞(自然杀伤t细胞)。一旦激活,nkt细胞激活天然免疫细胞,如nk细胞和树突状细胞,并且也激活适应性免疫细胞,如产生抗体的b细胞和t-细胞。

质膜中可发现多种植物甾醇—具体的补体可根据种类、生长条件、营养资源或病原体状态(列举几个因素)变化。通常,β-谷甾醇是最丰富的植物甾醇。

存在于复合有脂质双层(如质膜来源的包膜)的流感vlp中的植物甾醇,可提供有益的疫苗组合物。不希望受理论束缚,复合有脂质双层(如质膜来源的包膜)植物-产生的vlp,可诱导比其他表达系统中产生的vlp更强的免疫反应,并且可类似于由活或减毒的完整病毒疫苗所诱导的免疫反应。

本文所描述的vlp可复合有植物-来源的脂质双层。在一些实施方案中,植物-来源的脂质双层可包含vlp的包膜。植物来源的脂质可包含产生vlp的植物的质膜的脂质成分,其包括但不限于:磷脂酰胆碱(pc)、磷脂酰乙醇胺(pe)、鞘糖脂、植物甾醇或其组合。植物-来源的脂质可选择性地被称为‘植物脂质’。植物甾醇的实例是本领域已知的,并且其包括,例如,豆甾醇、谷甾醇、24-甲基胆甾醇和胆固醇-参见,例如,mongrand等,2004。

可通过例如凝集检测、电子显微镜或通过尺寸排阻色谱评估vlp的结构和尺寸。

对于尺寸排阻色谱,可通过在提取缓冲液中匀浆(polytron)冻碎的植物材料样品,从植物组织提取总的可溶性蛋白,并且通过离心去除不可溶材料。可使用peg沉淀。定量可溶性蛋白,并且提取物通过分子排阻基质,例如但不限于sephacryltm。层析后,通过免疫印迹进一步分析级分以确定级分的蛋白补体。

不希望受理论束缚,通过ha对唾液酸α2,3或α2,3以及rbc的表面上存在的这些唾液酸的亲和力,驱动ha结合来自不同动物的rbc的能力。来自流感病毒的马和禽ha使来自所有几个物种的红细胞凝集,所述物种包括火鸡、鸡、鸭、豚鼠、人、羊、马和牛;然而人ha结合火鸡、鸡、鸭、豚鼠、人和羊的红细胞(也参见itot.等,1997,virology,vol227,p493-499;和medeirosr等,2001,virology,vol289,p74-85)。

所表达的病毒蛋白的正确折叠,对蛋白的稳定性、多聚体的形成、vlp的形成、病毒蛋白的功能和通过抗体识别病毒蛋白,及其他特性是重要的。蛋白的折叠和累积可受一个或多个因素影响,所述因素包括但不限于:蛋白的序列、蛋白的相对丰度、细胞内聚集的程度、细胞室中的ph、可结合折叠的、部分折叠的或未折叠的蛋白或瞬间与其联合的辅因子的可利用性、一个或多个伴侣蛋白的存在等。

热激蛋白(hsp)或应激蛋白是伴侣蛋白的实例,其可参与多种细胞过程,包括蛋白合成、细胞内运输、错误折叠的预防、蛋白聚集的预防、蛋白复合体的组装和解装配、蛋白折叠和蛋白解聚。这样的伴侣蛋白的实例包括但不限于:hsp60、hsp65、hsp70、hsp90、hsp100、hsp20-30、hsp10、hsp100-200、hsp100、hsp90、lon、tf55、fkbps、亲环素、clpp、grpe、泛素、钙联结蛋白和蛋白二硫化物异构酶(参见,例如,macario,a.j.l.,coldspringharborlaboratoryres.25:59-70.1995;parsell,d.a.&lindquist,s.ann.rev.genet.27:437-496(1993);美国专利第5,232,833号)。本文所描述的伴侣蛋白,例如但不限于hsp40和hsp70,可被用来确保病毒蛋白的折叠。

hsp70的实例包括来自哺乳动物细胞的hsp72和hsc73、来自细菌,特别是分枝细菌,如麻风分枝杆菌(mycobacteriumleprae)、结核分枝杆菌(mycobacteriumtuberculosis)和牛分枝杆菌(mycobacteriumbovis)的dnak(如杆菌-卡介苗:本文被称为hsp7l)。来自大肠杆菌(escherichiacoli)、酵母和其他原核生物的dnak,以及来自真核生物如拟南芥的bip和grp78(lin等2001(cellstressandchaperones6:201-208))。hsp70的具体实例为拟南芥hsp70(由genbank参考号:ay120747.1编码)。hsp70能够特异性地结合atp以及未折叠的多肽和肽,从而参与蛋白的折叠和去折叠,以及参与蛋白复合体的组装和解装配。

hsp40的实例包括来自原核生物(如大肠杆菌和分枝细菌)的dnaj和来自真核生物(如紫花苜蓿)的hsj1、hdjl和hsp40(frugis等,1999.plantmolecularbiology40:397-408)。hsp40的具体实例为紫花苜蓿的msj1(genbank参考号:aj000995.1)。hsp40作为分子伴侣在蛋白折叠、耐热性和dna复制及其他细胞活性中发挥作用。

在合成完全之前,翻译和新合成的多肽的稳定性涉及hsp中的hsp70和其辅伴侣分子hsp40。不希望受理论束缚,hsp40结合未折叠(初生的或新翻译的)多肽的疏水斑区,因此促进hsp70-atp复合体与所述多肽的相互作用。atp的水解导致多肽、hsp70和adp稳定复合体的形成,以及hsp40的释放。hsp70-adp复合体与所述多肽的疏水斑区的结合防止其与其他疏水斑区的相互作用,而防止不正确折叠和与其他蛋白的聚集物的形成(hartl,fu.1996.nature381:571-579中论述)。

虽然天然的伴侣蛋白能够促进低水平的重组蛋白的正确折叠,但是随着表达水平增加,天然的分子伴侣的丰度可变成限制因素。病毒蛋白在农杆菌渗入的叶中的高水平表达,可导致病毒蛋白在细胞溶胶中的累积,并且一种或多种伴侣蛋白如hsp70、hsp40或hsp70和hsp40的共表达可降低错误折叠的或聚集的蛋白的水平,并且增加显示三级和四级结构特性的蛋白的数量,其允许病毒样颗粒的形成。

因此,本发明也提供在植物中产生病毒蛋白vlp的方法,其中编码病毒蛋白的第一核酸与编码通道蛋白例如但不限于质子通道蛋白的第二核酸,以及编码分子伴侣的第三核酸共表达。可在相同的步骤中将第一、第二和第三核酸引入植物,或可将其连续地引入植物。

植物内所产生的vlp可诱导包含植物-特异性n-聚糖的病毒蛋白。因此,本发明也提供包含具有植物特异性n-聚糖的病毒蛋白的vlp。

此外,植物中n-聚糖的修饰是已知的(参见,例如wo2008/151440;wo2010/006452;或u.s.60/944,344;其通过引用并入本文),并且可产生具有修饰的n-聚糖的病毒蛋白。可获得包含修饰的糖基化形式的病毒蛋白,例如具有降低的盐藻糖基化(fucosylated)和/或木糖基化(xylosylated)、盐藻糖基化(fucosylated)和木糖基化的(xylosylated)的n-聚糖,或可获得具有修饰的糖基化形式的病毒蛋白,其中蛋白缺乏盐藻糖基化和/或木糖基化(xylosylation),并且包含增加的半乳糖基化。此外,当与野生型植物表达的病毒蛋白相比,翻译后修饰的调节,例如末端半乳糖的加入可导致所表达的病毒蛋白的盐藻糖基化和木糖基化(xylosylation)的降低。

例如,其不应理解为限制,可通过与编码β-1.4半乳糖基转移酶(galt)的核苷酸序列一起共表达目标蛋白来实现具有修饰的糖基化形式的病毒蛋白的合成,所述galt例如但不限于哺乳动物galt或人galt,然而也可使用来自另外来源的galt。galt的催化结构域也可与n-乙酰葡糖胺转移酶(gnt1)的cts结构域(即胞质尾区、跨膜结构域、茎区)融合,以产生gnt1-galt杂合酶,并且所述杂合酶可与病毒蛋白共表达。也可与编码n-乙酰葡糖胺转移酶iii(gnt-iii)的核苷酸序列一起共表达病毒蛋白,所述gnt-iii例如但不限于哺乳动物gnt-iii或人gnt-iii,也可使用来自其他来源的gnt-iii。此外,也可使用gnt1-gnt-iii杂合酶,其包含与gnt-iii融合的gnt1的cts。

因此,本发明也包括包含具有修饰的n-聚糖的一种或多种病毒蛋白的vlp’s。

可在本发明使用以产生修饰的ha’s的序列的非限制性实例,也包括wo2009/009876;wo2009/076778;wo2010/003225;wo2010/148511;wo2010/003235;wo2010/006452(其通过引用并入本文)中所描述的序列,例如但不限于:

由例如来自a/布里斯班/59/2007(h1n1)毒株、a/新喀里多尼亚/20/99(h1n1)毒株、a/所罗门群岛3/2006(h1n1)毒株、/波多黎各/8/34(h1n1)毒株、a/布里斯班/59/2007(h1n1)毒株的核酸分子所编码的h1蛋白;

由核酸分子所编码的h2蛋白可来自a/新加坡/1/57(h2n2)毒株;

由核酸分子所编码的h3蛋白可来自a/布里斯班10/2007(h3n2)、a/威斯康星州/67/2005(h3n2)毒株、a/维多利亚/361/2011(h3n2)或a/珀斯/16/2009(h3n2);

由核酸分子所编码的h5蛋白可来自a/安徽/1/2005(h5n1)、a/印度尼西亚/5/2005(h5n1)、a/越南/1194/2004(h5n1);

由核酸分子所编码的h6蛋白可来自a/野鸭/香港/w312/97(h6n1)毒株;

由核酸分子所编码的h7蛋白也可来自a/杭州/1/13(h7n9)、a/马/布拉格/56(h7n7)毒株;

由核酸分子所编码的h9蛋白可来自a/香港/1073/99(h9n2)毒株;

由核酸所编码的来自b亚型的ha蛋白可来自b/弗罗里达/4/2006、b/马萨诸塞州/2/12、b/马来西亚/2506/2004、b/威斯康星州/1/2010或b/布里斯班/60/2008毒株。

表3:本文所描述的已制备的构建体的实例:

表:4:序列描述

本申请还涉及以下技术方案:

1.核酸,其包含在植物中有活性的调控区和在植物中有活性的表达增强子,所述调控区和所述表达增强子与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环。

2.如实施方案1所述的核苷酸,其中所述表达增强子选自:cpmvx、cpmvx+、cpmv-ht+、cpmvht+[wt115]和cpmvht+[511]。

3.如实施方案1所述的核苷酸,其中所述表达增强子不是cpmvht。

4.如实施方案1所述的核苷酸,其中所述核苷酸不包含菜豆黄矮病毒长基因间隔区(beydvlir)和beydv短基因间隔区(beydvsir)。

5.如实施方案1所述的核苷酸,其中所述修饰的蛋白水解环包含一个或多个蛋白酶切割位点,所述蛋白酶切割位点与天然ha的一个或多个切割位点的切割相比,呈现出减少或废除的蛋白酶切割。

6.如实施方案5所述的核苷酸,其中所述蛋白酶为克拉拉-样、弗林蛋白酶-样或胰蛋白酶。

7.如实施方案1所述的核苷酸,其中所述修饰的蛋白水解环包含接头序列。

8.如实施方案7所述的核苷酸,其中所述接头序列具有氨基酸序列gg、tetq或tetr。

9.如实施方案1所述的核苷酸,其中由所述核苷酸序列编码的ha选自来自以下的ha:流感b型、c型、a型以及h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型和h16亚型。

10.如实施方案1所述的核苷酸,其中编码所述流感血凝素(ha)蛋白的核苷酸序列与选自以下的序列具有至少70%的序列同一性:seqidno:17、18、20、21、41、58、77、81、85、92、96、98、100、102、104、106、108、110、112、114、134、143、147、154、161、168、194和199。

11.如实施方案1所述的核苷酸,其中所述ha为ha0。

12.如实施方案1所述的核酸,其中所述修饰的ha包含天然或非天然的信号肽。

13.如实施方案1所述的核酸,其中编码所述修饰的ha的核苷酸序列包含嵌合核苷酸序列,所述嵌合核苷酸序列按顺序编码修饰的ha胞外域、流感跨膜结构域和胞质尾区,其中所述修饰的ha胞外域包含修饰的蛋白水解环且来自第一流感毒株,而所述跨膜结构域和所述胞质尾区来自第二流感毒株。

14.在植物中产生流感病毒样颗粒(vlp)的方法,其包括:

a)将实施方案1所述的核苷酸引入所述植物或所述植物的部分;

b)在允许所述核酸表达的条件下培养所述植物或所述植物的部分,从而产生所述vlp。

15.如实施方案14所述的方法,其中在步骤a)中,将第二核苷酸引入所述植物或所述植物的部分,所述第二核苷酸包含第二调控区,所述第二调控区在所述植物中有活性并且与编码质子通道蛋白的核苷酸序列可操作地连接。

16.如实施方案15所述的方法,其中所述质子通道蛋白选自流感m2或流感bm2。

17.在植物中产生流感病毒样颗粒(vlp)的方法,其包括:

a)提供植物或植物的部分,其包含实施方案1所述的核酸,以及

b)在允许所述核酸表达的条件下培养所述植物或所述植物的部分,从而产生所述vlp。

18.如实施方案14所述的方法,其还包括以下步骤:

c)收集所述植物,以及

d)纯化所述vlp,其中所述vlp的大小范围为80-300nm。

19.通过实施方案14的任一种方法产生的vlp。

20.如实施方案19所述的vlp,其还包含一种或多种源自植物的脂质。

21.如实施方案20所述的vlp,其中所述修饰的ha蛋白包含植物-特异性n-聚糖或修饰的n-聚糖。

22.在植物中产生修饰的ha蛋白的方法,所述修饰的ha蛋白包含修饰的蛋白水解环,所述修饰的蛋白水解环包含呈现出减少或废除的蛋白酶切割的一个或多个蛋白酶切割位点,所述方法包括:

a)将实施方案1所述的核苷酸引入所述植物;

b)在允许所述ha蛋白表达的条件下培养所述植物或所述植物的部分,从而产生所述修饰的ha蛋白,

c)收集所述植物,并且纯化所述修饰的ha蛋白。

23.通过实施方案22所述的方法产生的ha蛋白,其中所述蛋白具有血凝素(ha)活性。

24.由实施方案1所述的核酸编码的ha。

25.如实施方案14所述的方法,其中在所述引入步骤(步骤a)中,以瞬转的方式将所述核酸引入植物中,或者将所述核酸引入所述植物中以使其稳定。

26.包含实施方案1所述的核酸的植物。

28.组合物,其包含用于诱导免疫应答的有效剂量的实施方案19所述的vlp,以及药学上可接受的载体。

29.疫苗,其包含用于诱导免疫应答的有效剂量的实施方案19所述的vlp。

30.在对象中诱导对流感病毒感染的免疫力的方法,其包括施用实施方案19所述的vlp。

31.如实施方案30所述的方法,其中所述vlp经口、皮内、鼻内、肌肉内、腹腔内、静脉内或皮下施用于对象。

32.提高植物中表达的ha蛋白的产物质量的方法,其包括:

a)将实施方案1所述的核苷酸引入所述植物;

b)在允许所述ha蛋白表达的条件下培养所述植物或所述植物的部分,从而产生修饰的ha蛋白,

c)收集所述植物,并且纯化所述修饰的ha蛋白,其中所述修饰的ha蛋白与天然ha相比,具有提高的产物质量。

33.如实施方案32所述的方法,其中所述质量包括提高的产物产量、产物稳定性、产物一致性或其组合。

实施例

实施例1

农杆菌(agrobacterium)转染

使用d’aoust等2008(plantbiotechnologyjournal6:930-940)所描述的方法,通过电穿孔法用dna构建体转染农杆菌菌株agl1。被转染的农杆菌在补充有10mm2-(n-吗啉代)乙磺酸(mes)、20μm乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素的ph5.6的yeb培养基上生长至od600为0.6-1.6。使用前将农杆菌悬浮液离心,然后重悬于渗入培养基(10mmmgcl2和10mmmesph5.6)。

植物生物质、接种量和农杆菌渗入的制备

本文所使用的术语“生物质”和“植物物质”意指源自植物的任何物质。生物质或植物物质可包括完整的植物、组织、细胞或其任何部分(fraction)。进一步地,生物质或植物物质可包括细胞内植物组分,细胞外植物组分,植物的液体或固体提取物或其组合。进一步地,生物质或植物物质可包括来自植物叶、茎、果实、根或其组合的植物、植物细胞、组织、液体提取物或其组合。植物的部分可包括植物物质或生物质。

在铺满商购的泥煤苔培养基的平地上由种子生长烟草本塞姆氏(nicotianabenthamiana)植物。允许植物生长在温室中,16/8光周期和25℃白天/20℃夜晚的温度方案。播种后三周,挑选出个别小植株,移植在盆中,并且在相同环境条件的温室中继续生长另外三周。

转染有各个构建体的农杆菌生长在补充有10mm2-(n-吗啉代)乙磺酸(mes)、20μm乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素的ph5.6的yeb培养基中直到它们达到od600为0.6-1.6。使用前将农杆菌悬浮液离心,然后重悬于渗入培养基(10mmmgcl2和10mmmes,ph5.6),并且在4℃下保存整夜。渗入的当天,将分批培养物稀释成2.5倍的培养物体积,并且在使用前允许加温。真空20-40torr下,将烟草本塞姆氏的完整植物倒置在密封不锈钢罐中的细菌悬浮液中2分钟。将植物返回至温室中经2-6天的培养期直到收集。

叶的收集和总蛋白提取

培养后,收集植物的地上部分,-80℃下冷冻并且碾成碎块。通过用3倍体积的冷50mmtrisph8.0、0.5mnacl、0.1%tritonx-100和1mm苯甲基磺酰氟匀浆(polytron)冻碎的植物物质的各个样品,以提取总的可溶性蛋白。匀浆后,浆液在10,000g,4℃下离心10分钟,并且保留这些澄清的粗提取物(上清液)用于分析。

蛋白分析和免疫印迹

使用牛血清白蛋白作为参考标准,通过bradford检测(bio-rad,hercules,ca)测定澄清的粗提取物的总蛋白含量。通过sds-page分离蛋白,并且将其电转移至聚偏二氟乙烯(pvdf)膜上(rochediagnosticscorporation,indianapolis,in),用于免疫检测。免疫印迹之前,4℃将膜在tris-缓冲盐水溶液中的5%脱脂牛奶和0.1%吐温-20(tbs-t)中封闭16-18小时。

用2μg/ml的一抗(在0.1%的tbs-吐温20中的2%脱脂牛奶中)首先孵育(表4显示用于检测每个ha所使用的抗体和条件),以进行免疫印迹。用于化学发光检测所使用的二抗如表4所示,按所示用0.1%的tbs-吐温20中的2%脱脂牛奶稀释。使用鲁米诺作为底物(rochediagnosticscorporation),通过化学发光来检测免疫反应复合物。通过使用ez-link活化的过氧化物酶结合试剂盒(pierce,rockford,il),实施人igg抗体与辣根过氧化物酶的结合。

表4:用于所表达蛋白的免疫印迹的电泳条件、抗体和稀释。

jir:jacksonimmunoresearch(美国杰克逊免疫研究),westgrove,pa,usa;cber:centerforbiologicsevaluationandresearch(美国生物制品评价和研究中心),rockville,md,usa;

sino:sinobiologicalinc.(北京义翘神州生物技术有限公司),beijing,china;

tga:therapeuticgoodsadministration(澳大利亚治疗产品管理局),australia;

nibsc:nationalinstituteforbiologicalstandardsandcontrol(英国国家生物制品检定所),unitedkingdom.

凝集检测

凝集检测基于nayakandreichl(2004)所描述的方法。简单地说,在含有100μlpbs的v-形底96-孔微量滴定板中进行测试样品(100μl)的连续倍比稀释,每孔留有100μl稀释样品。将100微升0.25%鲜红色血细胞悬浮液(biolinkinc.,syracuse,ny)加入各孔中,并且在室温下孵育板2小时。显示完全血凝的最高稀释倍数的倒数被记录为ha活性。并列地,重组的ha标准(a/越南/1203/2004h5n1)(proteinsciencecorporation,meriden,ct)用pbs稀释,并且将其作为每块板上的对照。

细胞壁消化的vlp提取物

从烟草本塞姆氏植物收集叶片组织,并且切成~1cm2的片状。室温(rt)下,叶片在500mm甘露糖醇中浸泡30分钟。然后去除甘露糖醇溶液,并且更换为原生质体溶液(500mm甘露糖醇、10mmcacl2和5mmmes/koh(ph5.6))中的酶混合物(来自绿色木酶(trichodermaviride)的纤维素酶的混合物(onozukar-10;3%v/v)和来自根霉(rhizopussp.)的果胶酶的混合物(macerozymetm;0.75%v/v;均来自yakultpharmaceuticals)。所用的比值为每100ml溶液20g叶片。将该制备物均匀地分散在浅的器皿(~11x18cm)中,并且在40rpm和26℃的摇床上孵育16小时。

可选地,vlp的提取可按如下进行:植物被agl1/#489、928、676和766农杆菌渗入。渗入后第7天,从烟草本塞姆氏植物中收集叶片组织,并且切成~1cm2的片状。将果胶酶162l(biocatalysts)、multifectcxcg和multifectcxb(genencor)加入至200mm甘露糖醇、75mm柠檬酸盐、0.04%亚硫酸氢钠缓冲液(ph6.0);消化缓冲液。两份生物质在定轨摇床上室温整夜消化。

酶辅助提取后,通过过滤(250或400μm目的尼龙滤器)去除叶的碎片。粗滤提取物在5000xg下离心5分钟。上清液被应用于检测ha表达(血凝活性(参见图20)和蛋白质印迹(参见图22))。

实施例2:

修饰的蛋白水解环对ha的累积的影响

如图13a所示,天然的b/布里斯班(构建体号:1008)的表达低于包含修饰的蛋白水解环的b/布里斯班(构建体号:1059)的表达。当与天然b/布里斯班ha(构建体号:1008;图13b)相比时,包含修饰的蛋白水解环的b/布里斯班(构建体号:1059)中也观察到增加的血凝活性。

在包含修饰的蛋白水解环的b/威斯康星州(构建体号:1467)的累积水平方面观察到类似结果,其大于天然b/威斯康星州ha(构建体号:1462;图16a)所观察到的累积水平。当与天然的b/威斯康星州ha(构建体号:1462;图16b)相比时,包含修饰的蛋白水解环的b/威斯康星州(构建体号:1467)中也观察到增加的血凝活性,其指示了突变蛋白的更多累积。

也观察到包含修饰的蛋白水解环的h5/indo的表达,所述修饰包括包含gg接头(构建体号:928;seqidno:85)、tetr接头(构建体号:676;seqidno:77)或tetq接头(构建体号:766;seqidno:8;图22)的蛋白水解环。

流感m2的共表达对ha的累积水平的影响

评价m2的共表达对修饰的流感bha的累积水平的影响。构建体1059号编码流感bha,其中蛋白水解环被2个氨基酸接头代替(gg代替aa341-359)。来自图13a中呈现的western印迹分析的结果表明,蛋白水解环的去除导致增加的流感bha累积水平(比较1008与1059),并且m2与修饰的流感bha的共表达也增加ha累积水平(图13a,1059vs1059+1261)。来自转化有具有或没有修饰以及与或不与m2共表达的流感bha的植物的粗蛋白提取物的血凝活性分析证实,m2共表达对天然的流感bha(图13b,1008vs1008+1261)和修饰的流感bha(图13b,1059vs1059+1261)的累积水平有积极作用。

m2与包含修饰的蛋白水解环的a型ha的共表达也导致ha表达。例如,具有用gs接头或(gss)3接头所代替的蛋白水解环的修饰的h3(参见图21e,21f)与m2一起的共表达,也可导致植物中ha的累积。

将来自流感a/波多黎各/8/1934的m2增加修饰的流感bha和h3的累积的功效,与来自流感a/新喀里多尼亚/20/1999的m2增加修饰的流感bha和h3的累积的功效相比。对于修饰的流感bha,通过来自转化有构建体1059、1059+1261和1059+859的植物的蛋白提取物的western印迹分析进行所述比较。获得的结果表明,来自流感a/波多黎各/8/1934(由构建体859号编码)的m2的共表达,与来自流感a/新喀里多尼亚/20/1999(由构建体1261号编码)的m2的共表达在增加修饰的流感bha的累积方面功效相同(图14)。

流感m2共表达对不同毒株bha的累积水平的影响

来自转化有基因构建体的植物的蛋白提取物的western印迹分析显示m2共表达导致流感bha累积的增加(图16a),所述基因构建体驱动流感bha(来自b/威斯康星州/1/2010)(构建体1462号)在存在或不存在m2-表达构建体(构建体1261号)时表达。

也评价了m2的共表达对修饰的流感bha的累积水平的影响。构建体1467号编码流感bha,其中蛋白水解环被2个氨基酸接头代替(gg代替aa341-359)。来自图16a中所呈现的western印迹分析的结果显示,蛋白水解环的去除导致流感bha累积水平增加(比较1462与1467),并且m2与修饰的流感bha的共表达也增加了ha累积水平(图16a,1467vs1467+1261)。来自转化有具有或没有修饰并且与或不与m2共表达的流感bha的植物的粗蛋白提取物的血凝活性的分析证实,m2共表达对天然的流感bha(图16b,1462vs1462+1261)和修饰的流感bha(图16b,1467vs1467+1261)的累积水平有积极作用。

扩增元件beydv和修饰的蛋白水解环对ha累积的影响

来自转化有基因构建体的植物的蛋白提取物的western印迹分析显示,当调控元件为cpmv-ht,在不存在beydv时,可检测到流感bha无累积(图17b),所述基因构建体驱动具有或没有蛋白水解环去除的修饰的流感bha(来自b/布里斯班/60/2008)(参见图17a的构建体)在存在或不存在扩增元件beydv(构建体1059号和1039号)时表达。

修饰的蛋白水解环对相对的ha滴度和血凝的影响

根据图29a,显示在植物中所产生的包含基于cpmvht、cpmvht+、cpmv160或cpmv160+的增强子元件的修饰ha蛋白或天然ha的活性比较,所述增强子元件与编码具有蛋白水解环缺失(用gg接头代替)的修饰ha的或天然ha核苷酸序列可操作地连接。在大多数情况下,对于基于cpmvht+、cpmv160或cpmv160+的构建体,表达较高(测定为血凝滴度或活性),表明显著的表达水平。

表5a:相对的ha滴度(wtha=1)(参见图29a)

实施例3

与天然的构建体相比,当去除蛋白水解环(prl-)时增加的h7杭州havlp产量

用agl1/#2142+1261和#2152+1261渗入烟草本塞姆氏植物,并且7天培育期后收集叶。收集叶片组织,并且将其切成~1cm2片状。将果胶酶162l和果胶酶444l(biocatalysts)、multifectcxcg和multifectcxb(genencor)加入到200mm甘露糖醇、125mm柠檬酸盐、0.04%亚硫酸氢钠缓冲液(ph6.0)。生物质在定轨摇床上室温下整夜消化。

消化后,将非原生质体级分(fraction)滤过400μm尼龙滤器以去除粗的未消化的植物组织(<5%原始生物质)。然后将滤过的提取物在室温下5000xg离心15分钟,以去除原生质体和细胞内污染物(蛋白、dna、膜、囊泡、色素,等等)。其次,在被施用于层析前,使用1.2μm玻璃纤维过滤器(sartoporegfplus/sartoriusstedim),以及0.45/0.2μm过滤器(sartopore2/sartoriusstedim)深度过滤(用于澄清)上清液。

将澄清的非原生质体级分加载至用平衡/洗脱缓冲液(50mmnapo4,100mmnacl,0.005%吐温80ph6.0)平衡好的阳离子交换柱上(poroshsappliedbiosystems)。一旦uv归零,用含有渐增浓度的nacl(500mm)的平衡/洗脱缓冲液分步洗脱提取物。纯化的vlp用tff浓缩、配制缓冲液(100mmpo4,150mmnacl,ph7.4的0.01%吐温80)渗滤(diafiltered),并且通过0.22μm的过滤器。

基于nayakandreichl(2004)所描述的方法进行h7的凝集检测。简单地说,在含有100μlpbs的v-形底96-孔微量滴定板中进行测试样品(100μl)的连续倍比稀释,使每孔剩余100μl稀释样品。将100微升0.25%的鲜红色血细胞悬浮液(biolinkinc.,syracuse,ny)加入至各孔,并且在室温下孵育板2小时。显示完全凝集的最高稀释倍数的倒数被记录为血凝活性。

使用牛血清白蛋白作为参考标准,测定澄清的粗提取物的总蛋白含量。通过比较prl-构建体与用作对照的天然构建体获得相对产量。在还原条件下进行具有变性样品上样缓冲液(0.1mtrisph6.8,0.05%溴酚蓝,12.5%甘油,4%sds和5%β-巯基乙醇)的sds-page的分离,并且使用考马斯亮蓝r-250用于蛋白质染色。

图46a显示与天然构建体(#2142+#1261,参见实施例5.33)相比,对于去除蛋白水解环的h7杭州构建体(#2152+#1261,参见实施例5.34),植物提取物中的血凝活性更大。

图46b显示与天然的构建体(#2142+#1261)相比时,对于去除蛋白水解环的h7杭州构建体(#2152+#1261),纯化的vlp中的相对总蛋白产量较高。该实施例表明植物中所累积的vlp的改善与当进行全过程时的最终产量之间的良好相关性。

图46c显示sds-page分析,泳道2显示具有去除的蛋白水解环的纯化的h7杭州构建体,泳道3显示纯化的天然h7杭州构建体。对于每个泳道,在凝胶上加载2μg的总蛋白。对于这两种构建体,蛋白谱的纯度是类似的,并且大于90%。

实施例4.1

突变体h5印度尼西亚vlp(其中蛋白水解环被修饰或去除)的胰蛋白酶抗性大于天然h5印度尼西亚。

烟草本塞姆氏植物用农杆菌渗入实施例1中所描述的agl1/#489、#928、#766和#676(上文)。渗入后7天从植物收集叶,切成~cm2片状。将果胶酶162l(biocatalysts)、multifectcxcg和multifectcxb(genencor)加入至200mm甘露糖醇、75mm柠檬酸盐、0.04%亚硫酸氢钠缓冲液(ph6.0)。生物质在定轨摇床上室温整夜消化。按照实施例3(h7杭州)所述,将消化的提取物进行粗滤、离心、澄清并且纯化。

对于各个天然的(#489)、prl-(#928)、tetq(#766)和tetr(#676),h5印度尼西亚havlp提取物,用ph7.4的缓冲液(100mmna/kpo4,150mmnacl,0.01%吐温80)重悬两份havlp样品。按1:100的蛋白比例加入胰蛋白酶。室温下孵育30、60和120分钟后吸取样品,然后在上样缓冲液中煮沸以中止反应。通过实施例3所描述的sds-page凝胶分析非消化的提取物(对照)和胰蛋白酶-消化的提取物。

图47a显示胰蛋白酶-消化样品的sds-page分析,在消化的不同时间点(0、30、60和120分钟),泳道2至5显示天然h5印度尼西亚vlp(#489)、泳道6至9显示prl-h5印度尼西亚vlp(#928)、泳道10至13显示tetqh5印度尼西亚vlp(#766),泳道14至17显示tetrh5印度尼西亚vlp(#676)。通过胰蛋白酶的加入,在泳道2的非消化提取物中在大约75kda下可检测的具有对应于ha0单体的条带的天然h5印度尼西亚vpl,被快速地加工为ha1和ha2条带,泳道3至5中在胰蛋白酶消化期间分别在大约50和25kda下可检测。通过蛋白水解位点的去除或修饰所稳定的prl-和tetqh5印度尼西亚vlp,表现出胰蛋白酶的抗性,因为ha0条带没有切割为ha1和ha2条带。通过蛋白水解位点的修饰使tetrh5印度尼西亚vlp部分地稳定,并且ha0单体被切割为ha1和ha2慢于天然h5印度尼西亚vlp。

这些数据表明,通过缺失蛋白水解环(prl-)或用接头序列(tetq)方法代替蛋白水解环,在ha1-ha2内的蛋白水解位点处成功地保护了ha0蛋白。

实施例4.2

在小鼠中天然h5印度尼西亚vlp的免疫原性类似于其突变体对应物(prl-、tetq和tetr)

按照实施例4.1所述(上文)纯化天然的、prl-、tetr和tetqh5印度尼西亚vlp提取物。

图47b显示两个剂量后小鼠中的天然h5vlp和其突变体对应物(prl-、tetq和tetr)的免疫原性(hi滴度)。balb/c小鼠(n=8/组)两次肌内注射10μg剂量的基于植物的h5vlp疫苗(天然的、prl-、tetq或tetr)(基于其ha含量),相隔21天。42dpv(第二次剂量后21天),将每只动物的血清进行hi滴度分析,并且h5vlpa/印度尼西亚/5/2005(h5n1)被用作抗原。柱状代表各个h5突变体vlp与天然h5vlp相比的相对(%)hi滴度(用log2hi滴度gmt和95%ci计算)。通过使用单因子方差分析,随后通过对log2-转换数据(假设它们是正态分布的)的图基氏事后分析(tukey’spost-hocanalysis)比较各个剂量组之间的统计学差异。*p<0.05被认为是显著的。观察到各个剂量组之间无差异。

实施例5.1:

b-2x35s/cpmv-ht/m2新喀里多尼亚/nos(构建体1261号)

使用以下基于pcr的方法,将编码来自流感a/新喀里多尼亚/20/1999(h1n1)的m2的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos表达系统中。使用引物if-s1-m1+m2anc.c(图2a,seqidno:7)和if-s1-4-m2anc.r(图2b,seqidno:8),采用合成的m2基因(对应于连接到来自genbank登录号dq508860的nt715-982的nt1-26;图2c,seqidno:9)作为模板,扩增含有完整m2编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht/nos表达系统中。用sacii和stui限制性内切酶消化构建体1191(图1c),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架是pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名1261号(图2d,seqidno:10)。图2e呈现来自流感a/新喀里多尼亚/20/1999(h1n1)的m2的氨基酸序列(seqidno:11)。图11呈现质粒1261的示意图。

实施例5.2:

c-2x35s/cpmv-ht/m2波多黎各/nos(构建体859号)

使用以下基于pcr的方法,将编码来自流感a/波多黎各/8/1934(h1n1)的m2的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos表达系统中。使用引物if-s1-m1+m2anc.c(图2a,seqidno:7)和if-s1-4-m2anc.r(图2b,seqidno:8),采用合成的m2基因(对应于连接到来自genbank登录号ef467824的nt740-1007的nt26-51)(图3a,seqidno:12)作为模板,扩增含有完整的m2编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht/nos表达系统中。用sacii和stui限制性内切酶消化构建体1191(图1c),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。载体为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为859号(图3b,seqidno:13)。图3c呈现来自流感a/波多黎各/8/1934(h1n1)的m2的氨基酸序列(seqidno:14)。图17呈现质粒859的示意图。

实施例5.3:

引入beydv+复制酶扩增体系中的g-2x35s/cpmv-ht/pdisp/hab布里斯班/nos(构建体1008号)

us61/541,780中描述了构建体1008的制备。简单地说,使用基于pcr的方法,采用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791),将编码来自流感b的ha/布里斯班/60/2008的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv+复制酶扩增体系的2x35s/cpmv-ht/pdisp/nos中。将pcr产物克隆进引入beydv扩增体系中的2x35s/cpmv-ht/nos表达盒中具有紫花苜蓿pdi信号肽的框中。用sacii和stui限制性内切酶消化构建体1194(参见图4a,4b),并且线性化质粒被用于组装反应以产生构建体1008号(图4c,图9;seqidno:32)。

构建体1194号(图4a)为意图用于在引入beydv扩增体系中的基于cpmv-ht的表达盒中具有紫花苜蓿pdi信号肽的框中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒。

实施例5.4:

引入beydv+复制酶扩增体系中的具有缺失的蛋白水解环的i-2x35s/cpmv-ht/pdisp-hab布里斯班(构建体1059号)

us61/541.780中描述了构建体1059的制备。简单地说,使用基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的ha的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv+复制酶扩增体系的2x35s/cpmv-ht/pdisp/nos中。在第一轮pcr中,使用合成的hab布里斯班基因(对应于来自genebank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt46至nt1065的片段。使用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt1123至nt1758的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于第二轮的扩增。将得到的片段(编码片段之间具有gg接头的hab/布里斯班/60/2008δa.a.356-374;参见图21b)克隆进包含beydv扩增体系的2x35s/cpmv-ht/nos表达盒中具有紫花苜蓿pdi信号肽的框中,以产生构建体1194(图4a,4b),用sacii和stui限制性内切酶消化构建体1194,并且线性化质粒被用于组装反应。得到的构建体被命名为1059号(图5c;seqidno:40)。

图5d呈现具有缺失的蛋白水解环的pdisp-hab/布里斯班/60/2008的氨基酸序列(seqidno:41)。

实施例5.5:

引入beydv(m)+复制酶扩增体系中的b-2x35s/cpmv-ht/hab威斯康星州/nos(构建体1462号)

us61/541,780中描述构建体1462的制备。简单地说,使用基于pcr的方法,将编码来自流感b/威斯康星州/1/2010的ha的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv(m)+复制酶扩增体系的2x35s/cpmv-ht/nos中。使用合成的hab威斯康星州基因(genbank登录号jn993010)作为模板,扩增含有完整的hab威斯康星州编码序列的片段。将pcr产物克隆进引入beydv(m)扩增体系中的2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体193(图6d),并且线性化质粒被用于组装反应。

构建体193号为意图用于在引入beydv(m)扩增体系中的基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图6e呈现从左至右的t-dna边界的序列(seqidno:52)。得到的构建体被命名为1462号(图6f,seqidno:53)。图6g呈现来自流感b/威斯康星州/1/2010的pdisp/ha的氨基酸序列(seqidno:54)。图6h呈现质粒1462的示意图。

实施例5.6:

引入beydv(m)+复制酶扩增体系中的具有缺失的蛋白水解环的c-2x35s/cpmv-ht/hab威斯康星州(构建体1467号)

us61/541,780中描述了构建体1467的制备。简单地说,使用基于pcr的连接方法(darveau等1995,methodsinneuroscience26:77-85),将编码来自流感b/威斯康星州/1/2010的具有缺失的蛋白水解环的ha的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv(m)+复制酶扩增体系的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-hab110.s1+3c(图6a,seqidno:49)和hab110(prl-).r(图7a,seqidno:55),采用合成的hab威斯康星州基因(genbank登录号jn993010)(图6c,seqidno:51)作为模板,扩增含有hab威斯康星州编码序列的nt1至nt1062的片段。使用引物hab110(prl-).c(图7b,seqidno:56)和if-hab110.s1-4r(图6b,seqidno:50),采用合成的hab威斯康星州基因(genbank登录号jn993010)(图6c,seqidno:51)作为模板,扩增含有hab威斯康星州编码序列的nt1120至nt1755的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if-hab110.s1+3c(图6a,seqidno:49)和if-hab110.s1-4r(图6b,seqidno:50)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码片段之间具有接头的hab/威斯康星州/1/2010δa.a.340-358)克隆进包含beydv(m)扩增体系的2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体193(图6d),并且线性化质粒被用于in-fusion组装反应。

构建体193号为意图用于在引入beydv(m)扩增体系中的基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图6e呈现从左至右的t-dna边界的序列(seqidno:52)。得到的构建体被命名为1467号(图7c,seqidno:57)。图7d呈现来自具有缺失的蛋白水解环的流感b/威斯康星州/1/2010的ha的氨基酸序列(seqidno:58)。图7e呈现质粒1467的示意图。

实施例5.7:

具有缺失的蛋白水解环的a-2x35s/cpmv-ht/pdisp-hab布里斯班(构建体1039号)

us61/541,780中描述了构建体1192的制备。简单地说,使用以下基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自流感b的ha/布里斯班/60/2008的具有缺失的蛋白水解环的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/pdisp/nos中。在第一轮pcr中,使用合成的hab布里斯班基因(对应于来自genebank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt46至nt1065的片段。使用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt1123至nt1758的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于第二轮扩增。将得到的片段(编码片段之间具有gg接头的hab/布里斯班/60/2008δa.a.356-374),克隆进2x35s/cpmv-ht/nos表达盒中具有紫花苜蓿pdi信号肽的框中。用sacii和stui限制性内切酶消化构建体1192,并且线性化质粒被用于in-fusion组装反应。

构建体1192号为意图用于在基于cpmv-ht的表达盒中具有紫花苜蓿pdi信号肽的框中“infusion”克隆目标基因的受体质粒。它也合并了用于紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,得到的构建体被命名为1039号(图8b)。图5d呈现具有缺失的蛋白水解环的pdisp-hab/布里斯班/60/2008的氨基酸序列(seqidno:41)。图8a呈现质粒1039的示意图(seqidno:15)。

实施例5.8:

来自a/印度尼西亚/5/2005的具有tetr切割位点突变的a-2x35s/cpmv-ht/h5(构建体676号)

使用以下基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自a/印度尼西亚/5/2005的具有tetr切割位点突变的h5的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-h5a-i-05.s1+3c(图1a,seqidno:2)和mutcleavage-h5(indo).r(图23a,seqidno:74),采用来自a/印度尼西亚/5/2005的合成h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1至nt1015的片段。使用引物mutcleavage-h5(indo).c(图23b,seqidno:75)和if-h5dtm.r(图1b,seqidno:3),采用来自a/印度尼西亚/5/2005的合成h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1038至nt1707的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if-h5a-i-05.s1+3c(图1a,seqidno:2)和if-h5dtm.r(图1b,seqidno:3)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码片段之间具有tetr接头的来自a/印度尼西亚/5/2005的h5δa.a.339-346)克隆进2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体1191(图1d),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒的框中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为676号(图23c,seqidno:76)。图23d呈现来自a/印度尼西亚/5/2005的具有tetr切割位点突变的h5的氨基酸序列(seqidno:77)。图23e呈现质粒676的示意图。

实施例5.9:

来自a/印度尼西亚/5/2005的具有tetq切割位点突变的b-2x35s/cpmv-ht/h5(构建体766号)

使用以下基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自a/印度尼西亚/5/2005的具有tetq切割位点突变的h5的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-h5a-i-05.s1+3c(图1a,seqidno:2)和h5i505_tetq.r(图24a,seqidno:78),采用来自a/印度尼西亚/5/2005(图1g,seqidno:42)的合成h5作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1至nt1015的片段。使用引物h5i505_tetq.c(图24b,seqidno:79)和if-h5dtm.r(图1b,seqidno:3),采用来自a/印度尼西亚/5/2005的合成h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1038至nt1707的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,使用if-h5a-i-05.s1+3c(图1a,seqidno:2)和if-h5dtm.r(图1b,seqidno:3)作为引物,用于第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码来自片段之间具有tetq接头的h5δa.a.339-346)克隆进2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体1191(图1d),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒的框中“infusion”克隆目标基因的受体质粒。它也合并用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为766号(图24c,seqidno:80)。图24d呈现来自a/印度尼西亚/5/2005的具有tetq切割位点突变的h5的氨基酸序列(seqidno:81)。图24e呈现质粒766的示意图。

实施例5.10:

来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的c-2x35s/cpmv-ht/h5(构建体928号)

使用由darveau等(methodsinneuroscience26:77-85(1995))所呈现的以下基于pcr的连接方法,将编码来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的h5的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-h5a-i-05.s1+3c(图1a,seqidno:2)和h5i505(prl-).r(图25a,seqidno:82),采用来自a/印度尼西亚/5/2005的合成的h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1至nt1011的片段。使用引物h5i505(prl-).c(图25b,seqidno:83)和if-h5dtm.r(图1b,seqidno:3),采用来自a/印度尼西亚/5/2005的合成的h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1075至nt1707的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if-h5a-i-05.s1+3c(图1a,seqidno:2)和if-h5dtm.r(图1b,seqidno:3)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码片段之间具有gg接头的来自a/印度尼西亚/5/2005的h5δa.a.338-358),克隆进2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体1191(图1d),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒的框中“infusion”克隆目标基因的受体质粒。它也合并了在紫花苜蓿质体蓝素基因启动子和终止子下的tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为928号(图25c,seqidno:84)。图25d呈现来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的h5的氨基酸序列(seqidno:85)。图25e呈现质粒928的示意图。

实施例5.11

-f-2x35s/cpmv-ht/pdisp/hab布里斯班/nos(构建体1029号)

使用以下基于pcr的方法,将编码来自流感b的ha/布里斯班/60/2008的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/pdisp/nos表达系统中。使用引物if-s2+s4-bbris.c(图30a,seqidno:86)和if-s1a4-bbris.r(图30b,seqidno:87),采用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791)(图30c,seqidno:88)作为模板,扩增含有hab布里斯班编码序列且无其野生型信号肽的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht/nos表达系统中具有紫花苜蓿pdi信号肽的框中。用sacii和stui限制性内切酶消化构建体1192,并且线性化质粒被用于in-fusion组装反应。构建体1192号意图用于在基于cpmv-ht的表达盒中具有紫花苜蓿pdi信号肽的框中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,和从左至右t-dna边界的序列。得到的构建体被命名为1029号(图30d,seqidno:89)。图30e呈现来自流感b/布里斯班/60/2008的pdisp/ha的氨基酸序列(seqidno:90)。图30f呈现质粒1029的示意图。

实施例5.12

–用于pdisp/hab布里斯班(prl-)的2x35s/cpmvht(构建体1039号)和ht+(构建体1829号)

使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环(prl-)的ha的编码序列(pdisp/hab布里斯班(prl-);图31a,seqidno:91),克隆进原始的ht和修饰的ht+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图31b中呈现与pdisp融合的成熟hab布里斯班(prl-)的氨基酸序列(seqidno:92)。图8b和31d呈现质粒1039和1829的示意图。

实施例5.13

–用于pdisp/hab布里斯班(prl-)的2x35s/cpmvht(构建体1039号)和2x35s/cpmv160+(构建体1937号)

使用实施例5.7和实施例5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环(prl-)的ha(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)的编码序列(pdisp/hab布里斯班(prl-))(图32a,seqidno:93),克隆进原始的cpmv-ht和cpmv160+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图31b中呈现与pdisp融合的成熟hab布里斯班(prl-)的氨基酸序列(seqidno:92)。图8b和图32c呈现质粒1039和1937的示意图。

实施例5.14

-用于pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1067号)和2x35s/cpmv160+(构建体1977号)

使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)(图33a,seqidno:95),克隆进原始的cpmv-ht和cpmv160+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶的信号肽的来自流感b/布里斯班/60/08的具有缺失的蛋白水解环(prl-)的ha的胞外域(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)。图33b中呈现与pdisp融合的成熟hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:96)。图33c和图33d呈现质粒1067和1977的示意图。

实施例5.15

-用于pdisp/hab马萨诸塞(prl-)的2x35s/cpmvht(构建体2072号)和2x35s/cpmv160+(构建体2050号)

使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)的编码序列(pdisp/hab马萨诸塞(prl-))(图34a,seqidno:97),克隆进原始的cpmv-ht和cpmv160+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图34b呈现与pdisp融合的成熟hab马萨诸塞(prl-)的氨基酸序列(seqidno:98)。图34c和图34d中呈现质粒2072和2050的示意图。

实施例5.16

-用于pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体2074号)和2x35s/cpmv160+(构建体2060号)

使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct)(图35a,seqidno:99),克隆进原始的cpmv-ht和cpmv160+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的融合跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶信号肽的来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)。图35b呈现与pdisp融合的成熟hab马萨诸塞(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:100)。图35c和35d中呈现质粒2074和2060的示意图。

实施例5.17

-用于hab威斯康星州(prl-)的2x35s/cpmvht(构建体1445号)、2x35s/cpmvht+(构建体1820号)和cpmv160+(构建体1975号)

使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/威斯康星州/1/2010的具有其天然信号肽的缺失的蛋白水解环(prl-)的ha(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)的编码序列(hab威斯康星州(prl-))(图36aa,seqidno:101),克隆进原始的cpmv-ht、cpmvht+和cpmv160中。图36b中呈现具有其天然信号肽的hab威斯康星州(prl-)的氨基酸序列(seqidno:102)。图36c、36d和36e中分别呈现质粒1445、1820和1975的示意图。

实施例5.18

-用于hab威斯康星州(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1454号)和2x35s/cpmv160+(构建体1893号)

使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)(图37a,seqidno:103),克隆进原始的cpmv-ht和cpmv160+中,所述嵌合血凝素编码序列对应与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有hab威斯康星州天然信号肽的来自流感b/威斯康星州/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)。图37中呈现hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:104)。图37c和37d中呈现质粒1454和1893的示意图。

实施例5.19:

用于pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1067号)和ht+(构建体1875号)

使用实施例5.26中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)(图38a,seqidno:105),克隆进原始的ht和修饰的ht+中,所述嵌合血凝素编码序列对应与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶的信号肽的来自流感b/布里斯班/60/08的具有缺失的蛋白水解环(prl-)的ha的胞外域。图38b中呈现与pdisp融合的成熟hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:106)。图33c和39c中呈现质粒1067和1875的示意图。

实施例5.20:

用于pdisp/hab马萨诸塞(prl-)的2x35s/cpmvht(构建体2072号)和ht+(构建体2052号)

使用如实施例5.26中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha的编码序列(pdisp/hab马萨诸塞(prl-))(图39a,seqidno:107),克隆进原始的ht和修饰的ht+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图39b中呈现与pdisp融合的成熟hab马萨诸塞(prl-)的氨基酸序列(seqidno:108)。图34c和图39c中呈现质粒2072和2052的示意图。

实施例5.21:

用于pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体2074号)和ht+(构建体2062号)

使用如实施例5.26中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct)(图40a,seqidno:109),克隆进原始的ht和修饰的ht+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶的信号肽的来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域。图40b中呈现与pdisp融合的成熟hab马萨诸塞(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:110)。图35c和图40c中呈现质粒2074和2062的示意图。

实施例5.22:

用于hab威斯康星州(prl-)的2x35s/cpmvht(构建体1445号)和ht+(构建体1839号)

使用实施例5.26中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/威斯康星州/1/2010的具有其天然信号肽且具有缺失的蛋白水解环(prl-)的ha的编码序列(hab威斯康星州(prl-))(图41a,seqidno:111),克隆进原始的ht和修饰的ht+中。图41b中呈现具有其天然信号肽的hab威斯康星州(prl-)的氨基酸序列(seqidno:112)。图36c和41c中呈现质粒1445和1839的示意图。

实施例5.23:

用于hab威斯康星州(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1454号)和ht+(构建体1860号)

使用实施例5.26中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)(图42a,seqidno:113),克隆进原始的ht和修饰的ht+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有hab威斯康星州的天然信号肽的来自流感b/威斯康星州/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域。图42b中呈现hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:114)。图37c和42c中呈现质粒1454和1860的示意图。

实施例5.24

-用于h5印度尼西亚的2x35s/cpmvht(构建体489号)、2x35s/cpmv160+(构建体1880号)和2x35s/cpmv160(构建体1885号)

使用如实施例5.25中所描述的相同的基于pcr的方法,但是使用为h5印度尼西亚特别设计的修饰的pcr引物,将对应于来自流感a/印度尼西亚/5/2005的天然h5的编码序列(图43a,seqidno:115),克隆进原始的cpmv-ht、cpmv160+和cpmv160中。图43b中呈现来自流感a/印度尼西亚/5/2005的天然h5的氨基酸序列(seqidno:116)。图43c中呈现质粒489的示意图。

实施例5.25

-2x35s/cpmv160+/pdisp/h3维多利亚/nos(构建体1800号)

使用以下基于pcr的方法,将编码来自流感a/维多利亚/361/2011的h3的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h3维多利亚),克隆进2x35s/cpmv160+/nos表达系统(cpmv160+)中。使用引物if**(sacii)-pdi.s1+4c(图44a,seqidno:117)和if-h3v36111.s1-4r(图44b,seqidno:118),采用pdisp/h3维多利亚序列(图44c,seqidno:119)作为模板,扩增含有pdisp/h3维多利亚编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv160+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2171号(图44d),并且线性化质粒被用于in-fusion组装反应。构建体2171号为意图用于在基于cpmv160+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图44e中呈现从左至右的t-dna边界的序列(seqidno:120)。得到的构建体被命名为1800号(图44f,seqidno:121)。图44g中呈现与pdisp融合的来自流感a/维多利亚/361/2011的成熟h3的氨基酸序列(seqidno:122)。图44h中呈现质粒1800的示意图。

实施例5.26:

2x35s/cpmv-ht+/pdisp/h3维多利亚/nos(构建体1819号)

使用以下基于pcr的方法,将编码来自流感a/维多利亚/361/2011的h3的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h3维多利亚),克隆进2x35s-cpmv-ht+/nos表达系统中。使用引物if(sacii)-kozac_pdi.c(图45a,seqidno:123)和if-h3v36111.s1-4r(图45b,seqidno:124),采用pdisp/h3维多利亚序列(图44c,seqidno:119)作为模板,扩增含有pdisp/h3维多利亚编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2181号(图45d),并且线性化质粒被用于in-fusion组装反应。构建体2181号为意图用于在基于cpmv-ht+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图45e中呈现从左至右的t-dna边界的序列(seqidno:125)。得到的构建体被命名为1819号(图45e,seqidno:126)。图44g中呈现与pdisp融合的来自流感a/维多利亚/361/2011的成熟h3的氨基酸序列(seqidno:122)。图45f中呈现质粒1819的示意图。

实施例5.27

2x35s/cpmvht+/pdisp/h2新加坡/nos(构建体2220号)

使用以下基于pcr的方法,将编码来自流感a/新加坡/1/1957的h2的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h2新加坡),克隆进2x35s/cpmvht+/nos表达系统中。使用引物if(sacii)-kozac_pdi.c(如用于实施例5.26中构建体1819所描述的)和if**-h2s157.s1-6r(图48a,seqidno:127),采用pdisp/h2新加坡序列(图48b,seqidno:128)作为模板,扩增含有pdisp/h2新加坡编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmvht+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2181号(如用于实施例5.26中构建体1819所描述的),并且线性化质粒被用于in-fusion组装反应。构建体2181号为意图用于在基于cpmvht+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图45d中呈现从左至右的t-dna边界的序列。得到的构建体被命名为2220号(图48c,seqidno:129)。图48d中呈现与pdisp融合的来自流感a/新加坡/1/1957的成熟h2的氨基酸序列(seqidno:130)。图48e中呈现质粒2220的示意图。

实施例5.28

2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h2新加坡/nos(构建体2221号)

使用由darveau等(methodsinneuroscience26:77-85(1995))所呈现的以下基于pcr的连接方法,将编码来自流感a/新加坡/1/1957的具有缺失的蛋白水解环的h2的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h2新加坡),克隆进2x35s/cpmvht+/nos表达系统中。在第一轮pcr中,使用引物if(sacii)-kozac_pdi.c(如用于实施例5.26中构建体1819所描述的)和h2s157(prl-).r(图49a,seqidno:131),采用pdisp/h2新加坡序列(图48b,seqidno:128)作为模板,扩增含有来自流感a/新加坡/1/1957的h2编码序列的nt1至nt1032的片段。使用引物h2s157(prl-).c(图49b,seqidno:132)和if**-h2s157.s1-6r(图48a,seqidno:127),采用pdisp/h2新加坡序列(图48b,seqidno:128)作为模板,扩增含有来自流感a/新加坡/1/1957的h2编码序列的nt1084至nt1716的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if(sacii)-kozac_pdi.c(如用于实施例5.26中构建体1819所描述的)和if**-h2s157.s1-6r(图48a,seqidno:127)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物(包含aa321至337被gg接头代替的pdisp/h2新加坡编码序列),克隆进2x35s/cpmvht+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2181号(如用于实施例5.26中构建体1819所描述的),并且线性化质粒被用于in-fusion组装反应。构建体2181号为意图用于在基于cpmvht+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图45d中呈现从左至右的t-dna边界的序列(如用于实施例5.26中的构建体1819所描述的)。得到的构建体被命名为2221号(图49c,seqidno:133)。图49d中呈现与pdisp融合的来自流感a/新加坡/1/1957的具有缺失的蛋白水解环的成熟h2的氨基酸序列(seqidno:134)。图49e中呈现质粒2221的示意图。

实施例5.29

在2x35s/cpmv160+/nos表达系统中pdisp/h2新加坡(构建体2222号)和具有缺失的蛋白水解环的pdisp/h2新加坡(构建体2223号)

分别使用如构建体2220和2221的相同的基于pcr的方法,但使用用于扩增的修饰的正向引物if**(sacii)-pdi.s1+4c(如用于实施例5.25中构建体1800所描述的)和不同的受体质粒,将编码来自流感a/新加坡/1/1957的具有或没有蛋白水解环的h2的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h2新加坡和具有缺失的蛋白水解环的pdisp/h2新加坡),克隆进2x35s/cpmv160+/nos表达系统中。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的pcr产物克隆进2x35s/cpmv160+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2171号(如用于实施例5.25中构建体1800所描述的),并且线性化质粒被用于in-fusion组装反应。构建体2171号为意图用于在基于cpmv160+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图中呈现从左至右的t-dna边界的序列(如用于实施例5.25中构建体1800所描述的)。得到的构建体被命名为2222号用于pdisp/h2新加坡(图50a,seqidno:135),和2223号用于具有缺失的蛋白水解环的pdisp/h2新加坡(图50b,seqidno:136)。图50c和50d中分别呈现质粒2222和2223的示意图。

实施例5.30

用于pdisp/h3珀斯的2x35s/cpmvht+(构建体号2019)和160+(构建体2139号)

分别使用如构建体2220和2222的相同的基于fusion的方法,但是用为pdisp/h3珀斯特别设计的修饰的pcr引物(图51b,seqidno:138),将对应于来自流感a/珀斯/16/2009的h3的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h3珀斯)(图51a,seqidno:137),克隆进修饰的cpmvht+和160+中。图51c中呈现与pdisp融合的来自流感a/珀斯/16/2009的成熟h3的氨基酸序列(seqidno:139)。图51d和图51e中呈现质粒2019和2139的示意图。

实施例5.31

用于具有缺失的蛋白水解环的pdisp/h3珀斯的2x35s/cpmvht+(构建体2039号)和160+(构建体2159号)

分别使用如构建体2221和2223的相同的基于fusion方法,但是使用为具有缺失的蛋白水解环的pdisp/h3珀斯特别设计的修饰的pcr引物(图51b(seqidno:138)、52b(seqidno:141)和53c(seqidno:142)),将对应于来自流感a/珀斯/16/2009的具有缺失的蛋白水解环的h3的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h3珀斯)(图52,seqidno:140),克隆进修饰的cpmvht+和160+中。图52d中呈现与pdisp融合的来自流感a/珀斯/16/2009的具有缺失的蛋白水解环的成熟h3的氨基酸序列(seqidno:143)。图52e和图52f中呈现质粒2039和2159的示意图。

实施例5.32

用于具有缺失的蛋白水解环的pdisp/h3维多利亚的2x35s/cpmvht+(构建体2230号)和160+(构建体2250号)

分别使用如构建体2221和2223的相同的基于fusion方法(参见实施例5.28和5.29),但使用为具有缺失的蛋白水解环的pdisp/h3维多利亚特别设计的修饰的pcr引物(图53b(seqidno:145)和53c(seqidno:146)),将对应于来自流感a/维多利亚/361/2011的具有缺失的蛋白水解环的h3的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h3维多利亚)(图53,seqidno:144),克隆进修饰的cpmvht+和160+中。图53d中呈现与pdisp融合的来自流感a/维多利亚/361/2011的具有缺失的蛋白水解环的成熟h3的氨基酸序列(seqidno:147)。图53e和图53f中呈现质粒2230和2250的示意图。

实施例5.33

2x35s/cpmvht+/pdisp/h7杭州/nos(构建体2142号)

使用如构建体2220的相同的基于fusion的方法,但使用为pdisp/h7杭州特别设计的修饰的pcr引物(图54b,seqidno:149),将对应于来自流感a/杭州/1/2013的h7的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h7杭州)(图54a,seqidno:148),克隆进修饰的cpmvht+中。图54c中呈现与pdisp融合的来自流感a/杭州/1/2013的成熟h7的氨基酸序列(seqidno:150)。图54e中呈现质粒2142的示意图。

实施例5.34

2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h7杭州/nos(构建体2152号)

使用如构建体2221的相同的基于fusion的方法,但是使用为具有缺失的蛋白水解环的pdisp/h7杭州特别设计的修饰的pcr引物(图54b(seqidno:149)、图55b(seqidno:152)和图55c(seqidno:153)),将对应于来自流感a/杭州/1/2013的具有缺失的蛋白水解环的h7的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h7杭州)(图55a,seqidno:151),克隆进修饰的cpmvht+中。图55d中呈现与pdisp融合的来自流感a/杭州/1/2013的具有缺失的蛋白水解环的成熟h7的氨基酸序列(seqidno:154)。图55e中呈现质粒2152的示意图。

实施例5.35

用于pdisp/h9香港的2x35s/cpmvht+(构建体2224号)和160+(构建体2226号)

分别使用如构建体2220和2222的相同的基于fusion的方法,但是使用为pdisp/h9香港特别设计的修饰的pcr引物(图56b,seqidno:156),将对应于来自流感a/香港/1073/1999的h9的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h9香港)(图56a,seqidno:155),克隆进修饰的cpmvht+和160+中。图56c中呈现与pdisp融合的来自流感a/香港/1073/1999的成熟h9的氨基酸序列(seqidno:157)。图56d和图56e中呈现质粒2224和2226的示意图。

实施例5.36

用于具有缺失的蛋白水解环的pdisp/h9香港的2x35s/cpmvht+(构建体2225号)和160+(构建体2227号)

分别使用如构建体2221和2223的相同的基于fusion方法,但是使用为具有缺失的蛋白水解环的pdisp/h9香港特别设计的修饰的pcr引物(图56b(seqidno:156)、图57b(seqidno:159)和图57c(seqidno:160)),将对应于来自流感a/香港/1073/1999的具有缺失的蛋白水解环的h9的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h9香港)(图57a,seqidno:158),克隆进修饰的cpmvht+和160+中。图57d中呈现与pdisp融合的来自流感a/香港/1073/1999的具有缺失的蛋白水解环的成熟h9的氨基酸序列(seqidno:161)。图57e和图57f中呈现质粒2225和2227的示意图。

实施例5.37

2x35s/cpmv160+/pdisp/hab马来西亚/nos(构建体2013号)

使用如构建体2222的相同的基于fusion的方法,但是用为pdisp/hab马来西亚特别设计的修饰的pcr引物(图58b,seqidno:163),将对应于来自流感b/马来西亚/2506/2004的ha的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/hab马来西亚)(图58a,seqidno:162),克隆进修饰的cpmv160+中。图58c中呈现与pdisp融合的来自流感b/马来西亚/2506/2004的成熟ha的氨基酸序列(seqidno:164)。图58d中呈现质粒2013的示意图。

实施例5.38

2x35s/cpmv160+/具有缺失的蛋白水解环的pdisp/hab马来西亚/nos(构建体2014号)

使用如构建体2223的相同的基于fusion的方法,但是使用为具有缺失的蛋白水解环的pdisp/hab马来西亚特别设计的修饰的pcr引物(图58b(seqidno:163)、图59b(seqidno:166)、图59c(seqidno:167),将对应于来自流感b/马来西亚/2506/2004的具有缺失的蛋白水解环的ha的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/hab马来西亚)(图59a,seqidno:165),克隆进修饰的cpmv160+中。图59d中呈现与pdisp融合的来自流感b/马来西亚/2506/2004的具有缺失的蛋白水解环的成熟ha的氨基酸序列(seqidno:168)。图59e中呈现质粒2014的示意图。

实施例5.39

用于pdisp/hab马萨诸塞州的2x35s/cpmvht(构建体2070号)、ht+(构建体2080号)和160+(-mprot)(构建体2090号)

分别使用如构建体2072、2220和2222的相同的基于fusion的方法,但是使用为pdisp/hab马萨诸塞州特别设计的修饰的pcr引物,将对应于来自流感b/马萨诸塞州/2/2012的ha的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/hab马萨诸塞州)(图60a,seqidno:169),克隆进原始的ht、修饰的ht+和160+中。图60b中呈现与pdisp融合的来自流感b/马萨诸塞州/2/2012的成熟ha的氨基酸序列(seqidno:170)。图60c、图60d和图60e中呈现质粒2070、2080和2090的示意图。

实施例5.40

用于具有缺失的蛋白水解环的pdisp/hab弗罗里达的2x35s/cpmvht+(构建体2102号)、具有beydv的ht+(构建体2104号)

如上所述的相同的基于fusion的方法,但是使用为pdisp/hab/弗罗里达特别设计的修饰的pcr引物(参见图61a(seqidno:190)、图61b(seqidno:191)和图61c(seqidno:192),将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列(pdisp/hab弗罗里达)(图61d,seqidno:193),克隆进修饰的ht+中。图61f中给出得到的表达盒2102的核苷酸序列(seqidno:195)。同样地,将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列,克隆进连有扩增元件beydv的修饰的ht+中。图61f中给出得到的表达盒2104的核苷酸序列(seqidno:196)。图61e中呈现与pdisp融合的来自具有缺失的蛋白水解环的流感b/弗罗里达的成熟ha的氨基酸序列(seqidno:194)。图61g和61i中呈现质粒2102和2104的示意图。

实施例5.41

用于具有缺失的蛋白水解环的pdisp/hab弗罗里达+h1加利福尼亚tmct的2x35s/cpmvht+(构建体2106号)、具有beydv的ht+(构建体2108号)

如上所述的相同的基于fusion的方法,但是使用为pdisp/hab/弗罗里达+h1加利福尼亚tmct特别设计的修饰的pcr引物(参见图61a(seqidno:197)),将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达+h1加利福尼亚tmct并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列(pdisp/hab弗罗里达+h1加利福尼亚tmct)(图62b,seqidno:198),克隆进修饰的ht+中。图62d中给出得到的表达盒2106的核苷酸序列(seqidno:200)。同样地,将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达+h1加利福尼亚tmct并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列,克隆进加有扩增元件beydv的修饰的ht+中。图62f中给出得到的表达盒2108的核苷酸序列(seqidno:201)。图62c中呈现与pdisp融合的来自具有缺失的蛋白水解环的流感b/弗罗里达+h1加利福尼亚tmct的成熟ha的氨基酸序列(seqidno:199)。图62e和62g中呈现质粒2106和2108的示意图。

所有引文通过引用据此并入。

已结合一个或多个实施方案描述了本发明。然而,对本领域技术人员显而易见的是,在不脱离权利要求书所定义的本发明的范围下可做出多种改变和修饰。

序列表

<110>莫迪卡戈公司(medicagoinc.)

<120>植物中流感样病毒颗粒的产生

<130>v85680wo

<140>pct/ca2014/050326

<141>2014-03-28

<150>us61/806,227

<151>2013-03-28

<150>us61/971,274

<151>2014-03-27

<150>us61/925,852

<151>2014-01-10

<160>201

<170>patentinversion3.5

<210>1

<211>21

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>禽h5蛋白水解环共有序列

<400>1

glnarggluserargarglyslysargglyleupheglyalaileala

151015

glypheileglugly

20

<210>2

<211>41

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物if-h5a-i-05.s1+3c

<400>2

aaatttgtcgggcccatggagaaaatagtgcttcttcttgc41

<210>3

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物if-h5dtm.r

<400>3

actaaagaaaataggcctttaaatgcaaattctgcattgtaacgatccat50

<210>4

<211>4903

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1191

<400>4

tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60

gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120

aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180

aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240

ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300

gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360

aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420

aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480

taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540

aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600

atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660

taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720

tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780

gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840

acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900

ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960

accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020

gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080

aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140

gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200

actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260

aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320

gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380

tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440

agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500

tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560

tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620

ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680

tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740

ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800

cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860

gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920

tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980

ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040

ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100

cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160

cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220

tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280

ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340

cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400

cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460

ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520

tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580

cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640

aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700

tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760

cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820

tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880

tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940

ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000

ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctt3060

tcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacg3120

tgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgct3180

gttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaatatctct3240

acttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggt3300

tctataagaaatctagtattttctttgaaacagagttttcccgtggttttcgaacttgga3360

gaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccgcggatggcgaaa3420

aacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctcagatcttc3480

gcctgcaggctcctcagccaaaacgacacccccatctgtctatccactggcccctggatc3540

tgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatttccctga3600

gccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacaccttcccagc3660

tgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctccagcacctg3720

gcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaaggtggacaa3780

gaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccagaagtatc3840

atctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctgactcctaa3900

ggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttcagctggtt3960

tgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagttcaacag4020

cactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatggcaagga4080

gcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggcctattttctttagt4140

ttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcag4200

agtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtccct4260

tcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaa4320

ttcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaa4380

gattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgtta4440

agcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatgatta4500

gagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactagg4560

ataaattatcgcgcgcggtgtcatctatgttactagatctctagagtctcaagcttggcg4620

cgcccacgtgactagtggcactggccgtcgttttacaacgtcgtgactgggaaaaccctg4680

gcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcg4740

aagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctaga4800

gcagcttgagcttggatcagattgtcgtttcccgccttcagtttaaactatcagtgtttg4860

acaggatatattggcgggtaaacctaagagaaaagagcgttta4903

<210>5

<211>3447

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒489

<400>5

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320

ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380

cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440

tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500

gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560

caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620

cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680

cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740

ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800

ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860

tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920

aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980

tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040

taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100

aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160

ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220

caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaag2280

agagagcagaagaaaaaagagaggactatttggagctatagcaggttttatagagggagg2340

atggcagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgg2400

gtacgctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaa2460

ctcaatcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataactt2520

agaaaggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctggac2580

ttataatgccgaacttctggttctcatggaaaatgagagaactctagactttcatgactc2640

aaatgttaagaacctctacgacaaggtccgactacagcttagggataatgcaaaggagct2700

gggtaacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtataag2760

aaacggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagaggaaat2820

aagtggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaacagt2880

ggcgagttccctagcactggcaatcatgatggctggtctatctttatggatgtgctccaa2940

tggatcgttacaatgcagaatttgcatttaaaggcctattttctttagtttgaatttact3000

gttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttat3060

tttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggac3120

acaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaa3180

gcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcct3240

gttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaata3300

attaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaa3360

ttatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcg3420

cgcgcggtgtcatctatgttactagat3447

<210>6

<211>568

<212>prt

<213>流感h5a/印度尼西亚/5/2005(h5n1)(influenzah5a/indonesia/5/2005(h5n1))

<400>6

metglulysilevalleuleuleualailevalserleuvallysser

151015

aspglnilecysileglytyrhisalaasnasnserthrgluglnval

202530

aspthrilemetglulysasnvalthrvalthrhisalaglnaspile

354045

leuglulysthrhisasnglylysleucysaspleuaspglyvallys

505560

proleuileleuargaspcysservalalaglytrpleuleuglyasn

65707580

prometcysaspglupheileasnvalproglutrpsertyrileval

859095

glulysalaasnprothrasnaspleucystyrproglyserpheasn

100105110

asptyrglugluleulyshisleuleuserargileasnhispheglu

115120125

lysileglnileileprolyssersertrpserasphisglualaser

130135140

serglyvalserseralacysprotyrleuglyserproserphephe

145150155160

argasnvalvaltrpleuilelyslysasnserthrtyrprothrile

165170175

lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp

180185190

glyilehishisproasnaspalaalagluglnthrargleutyrgln

195200205

asnprothrthrtyrileserileglythrserthrleuasnglnarg

210215220

leuvalprolysilealathrargserlysvalasnglyglnsergly

225230235240

argmetgluphephetrpthrileleulysproasnaspalaileasn

245250255

phegluserasnglyasnpheilealaproglutyralatyrlysile

260265270

vallyslysglyaspseralailemetlyssergluleuglutyrgly

275280285

asncysasnthrlyscysglnthrprometglyalaileasnserser

290295300

metprophehisasnilehisproleuthrileglyglucysprolys

305310315320

tyrvallysserasnargleuvalleualathrglyleuargasnser

325330335

proglnarggluserargarglyslysargglyleupheglyalaile

340345350

alaglypheilegluglyglytrpglnglymetvalaspglytrptyr

355360365

glytyrhishisserasngluglnglyserglytyralaalaasplys

370375380

gluserthrglnlysalaileaspglyvalthrasnlysvalasnser

385390395400

ileileasplysmetasnthrglnpheglualavalglyarggluphe

405410415

asnasnleugluargargilegluasnleuasnlyslysmetgluasp

420425430

glypheleuaspvaltrpthrtyrasnalagluleuleuvalleumet

435440445

gluasngluargthrleuaspphehisaspserasnvallysasnleu

450455460

tyrasplysvalargleuglnleuargaspasnalalysgluleugly

465470475480

asnglycysphegluphetyrhislyscysaspasnglucysmetglu

485490495

serileargasnglythrtyrasntyrproglntyrserglugluala

500505510

argleulysargglugluileserglyvallysleugluserilegly

515520525

thrtyrglnileleuseriletyrserthrvalalaserserleuala

530535540

leualailemetmetalaglyleuserleutrpmetcysserasngly

545550555560

serleuglncysargilecysile

565

<210>7

<211>42

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物if-s1-m1+m2anc.c

<400>7

aaatttgtcgggcccatgagtcttctaaccgaggtcgaaacg42

<210>8

<211>43

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物if-s1-4-m2anc.r

<400>8

actaaagaaaataggcctttactccagctctatgctgacaaaa43

<210>9

<211>294

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>合成的m2基因

<400>9

atgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatgcaac60

gattcaagtgatcctcttgttgttgccgcaagtataattgggattgtgcacctgatattg120

tggattattgatcgccttttttccaaaagcatttatcgtatctttaaacacggtttaaaa180

agagggccttctacggaaggagtaccagagtctatgagggaagaatatcgagaggaacag240

cagaatgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaa294

<210>10

<211>2034

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒1261

<400>10

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatg1320

caacgattcaagtgatcctcttgttgttgccgcaagtataattgggattgtgcacctgat1380

attgtggattattgatcgccttttttccaaaagcatttatcgtatctttaaacacggttt1440

aaaaagagggccttctacggaaggagtaccagagtctatgagggaagaatatcgagagga1500

acagcagaatgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaaag1560

gcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagc1620

ggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgt1680

ttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaa1740

aaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttgg1800

caataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataattt1860

ctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgaga1920

tgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaata1980

tagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat2034

<210>11

<211>97

<212>prt

<213>流感m2新喀里多尼亚/20/1999(h1n1)(influenzam2newcaledonia/20/1999(h1n1))

<400>11

metserleuleuthrgluvalgluthrproileargasnglutrpgly

151015

cysargcysasnaspserseraspproleuvalvalalaalaserile

202530

ileglyilevalhisleuileleutrpileileaspargleupheser

354045

lysseriletyrargilephelyshisglyleulysargglyproser

505560

thrgluglyvalproglusermetarggluglutyrarggluglugln

65707580

glnasnalavalaspalaaspaspglyhisphevalserilegluleu

859095

glu

<210>12

<211>294

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>合成的m2基因

<400>12

atgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatgcaac60

ggttcaagtgatcctctcactattgccgcaaatatcattgggatcttgcacttgacattg120

tggattcttgatcgtctttttttcaaatgcatttaccgtcgctttaaatacggactgaaa180

ggagggccttctacggaaggagtgccaaagtctatgagggaagaatatcgaaaggaacag240

cagagtgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaa294

<210>13

<211>2034

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒859

<400>13

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatg1320

caacggttcaagtgatcctctcactattgccgcaaatatcattgggatcttgcacttgac1380

attgtggattcttgatcgtctttttttcaaatgcatttaccgtcgctttaaatacggact1440

gaaaggagggccttctacggaaggagtgccaaagtctatgagggaagaatatcgaaagga1500

acagcagagtgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaaag1560

gcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagc1620

ggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgt1680

ttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaa1740

aaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttgg1800

caataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataattt1860

ctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgaga1920

tgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaata1980

tagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat2034

<210>14

<211>97

<212>prt

<213>流感m2a/波多黎各/8/1934(h1n1)(influenzam2a/puertorico/8/1934(h1n1))

<400>14

metserleuleuthrgluvalgluthrproileargasnglutrpgly

151015

cysargcysasnglyserseraspproleuthrilealaalaasnile

202530

ileglyileleuhisleuthrleutrpileleuaspargleuphephe

354045

lyscysiletyrargargphelystyrglyleulysglyglyproser

505560

thrgluglyvalprolyssermetarggluglutyrarglysglugln

65707580

glnseralavalaspalaaspaspglyhisphevalserilegluleu

859095

glu

<210>15

<211>3474

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒1039

<400>15

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcc1320

ttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgt1380

cgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaac1440

acccaccaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgccc1500

aaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaa1560

aataccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctt1620

tcctataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacga1680

acatatcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggacccta1740

caaaattggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaac1800

aatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaat1860

agaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactc1920

tgacaacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctc1980

atctgccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaac2040

agaagacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatc2100

tgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtg2160

cgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattg2220

cctccacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgc2280

aaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaac2340

caaatatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacac2400

atcccatggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccat2460

aaacaagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaag2520

actaagcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtgga2580

tgatctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatga2640

aggaataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaat2700

gctgggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaa2760

ccagacctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccc2820

cacctttgattcactgaatattactgctgcatctttaaatgacgatggattggataatca2880

tactatactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagc2940

tatctttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataaag3000

gcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagc3060

ggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgt3120

ttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaa3180

aaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttgg3240

caataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataattt3300

ctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgaga3360

tgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaata3420

tagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3474

<210>16

<211>570

<212>prt

<213>流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)

<400>16

aspargilecysthrglyilethrserserasnserprohisvalval

151015

lysthralathrglnglygluvalasnvalthrglyvalileproleu

202530

thrthrthrprothrlysserhisphealaasnleulysglythrglu

354045

thrargglylysleucysprolyscysleuasncysthraspleuasp

505560

valalaleuglyargprolyscysthrglylysileproseralaarg

65707580

valserileleuhisgluvalargprovalthrserglycysphepro

859095

ilemethisaspargthrlysileargglnleuproasnleuleuarg

100105110

glytyrgluhisileargleuserthrhisasnvalileasnalaglu

115120125

asnalaproglyglyprotyrlysileglythrserglysercyspro

130135140

asnilethrasnglyasnglyphephealathrmetalatrpalaval

145150155160

prolysasnasplysasnlysthralathrasnproleuthrileglu

165170175

valprotyrilecysthrgluglygluaspglnilethrvaltrpgly

180185190

phehisseraspasngluthrglnmetalalysleutyrglyaspser

195200205

lysproglnlysphethrserseralaasnglyvalthrthrhistyr

210215220

valserglnileglyglypheproasnglnthrgluaspglyglyleu

225230235240

proglnserglyargilevalvalasptyrmetvalglnlyssergly

245250255

lysthrglythrilethrtyrglnargglyileleuleuproglnlys

260265270

valtrpcysalaserglyargserlysvalilelysglyserleupro

275280285

leuileglyglualaaspcysleuhisglulystyrglyglyleuasn

290295300

lysserlysprotyrtyrthrglygluhisalalysalaileglyasn

305310315320

cysproiletrpvallysthrproleulysleualaasnglythrlys

325330335

tyrargproproalalysleuleulysgluargglyphepheglyala

340345350

ilealaglypheleugluglyglytrpgluglymetilealaglytrp

355360365

hisglytyrthrserhisglyalahisglyvalalavalalaalaasp

370375380

leulysserthrglnglualaileasnlysilethrlysasnleuasn

385390395400

serleusergluleugluvallysasnleuglnargleuserglyala

405410415

metaspgluleuhisasngluileleugluleuaspglulysvalasp

420425430

aspleuargalaaspthrileserserglnilegluleualavalleu

435440445

leuserasngluglyileileasnsergluaspgluhisleuleuala

450455460

leugluarglysleulyslysmetleuglyproseralavalgluile

465470475480

glyasnglycysphegluthrlyshislyscysasnglnthrcysleu

485490495

aspargilealaalaglythrpheaspalaglyglupheserleupro

500505510

thrpheaspserleuasnilethralaalaserleuasnaspaspgly

515520525

leuaspasnhisthrileleuleutyrtyrserthralaalaserser

530535540

leualavalthrleumetilealailephevalvaltyrmetvalser

545550555560

argaspasnvalsercysserilecysleu

565570

<210>17

<211>554

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>b型ha的δ蛋白水解环(具有接头gg)的氨基酸序列

<400>17

aspargilecysthrglyilethrserserasnserprohisvalval

151015

lysthralathrglnglygluvalasnvalthrglyvalileproleu

202530

thrthrthrprothrlysserhisphealaasnleulysglythrglu

354045

thrargglylysleucysprolyscysleuasncysthraspleuasp

505560

valalaleuglyargprolyscysthrglylysileproseralaarg

65707580

valserileleuhisgluvalargprovalthrserglycysphepro

859095

ilemethisaspargthrlysileargglnleuproasnleuleuarg

100105110

glytyrgluhisileargleuserthrhisasnvalileasnalaglu

115120125

asnalaproglyglyprotyrlysileglythrserglysercyspro

130135140

asnilethrasnglyasnglyphephealathrmetalatrpalaval

145150155160

prolysasnasplysasnlysthralathrasnproleuthrileglu

165170175

valprotyrilecysthrgluglygluaspglnilethrvaltrpgly

180185190

phehisseraspasngluthrglnmetalalysleutyrglyaspser

195200205

lysproglnlysphethrserseralaasnglyvalthrthrhistyr

210215220

valserglnileglyglypheproasnglnthrgluaspglyglyleu

225230235240

proglnserglyargilevalvalasptyrmetvalglnlyssergly

245250255

lysthrglythrilethrtyrglnargglyileleuleuproglnlys

260265270

valtrpcysalaserglyargserlysvalilelysglyserleupro

275280285

leuileglyglualaaspcysleuhisglulystyrglyglyleuasn

290295300

lysserlysprotyrtyrthrglygluhisalalysalaileglyasn

305310315320

cysproiletrpvallysthrproleulysleualaasnglythrlys

325330335

tyrargproproglyglyglytrpgluglymetilealaglytrphis

340345350

glytyrthrserhisglyalahisglyvalalavalalaalaaspleu

355360365

lysserthrglnglualaileasnlysilethrlysasnleuasnser

370375380

leusergluleugluvallysasnleuglnargleuserglyalamet

385390395400

aspgluleuhisasngluileleugluleuaspglulysvalaspasp

405410415

leuargalaaspthrileserserglnilegluleualavalleuleu

420425430

serasngluglyileileasnsergluaspgluhisleuleualaleu

435440445

gluarglysleulyslysmetleuglyproseralavalgluilegly

450455460

asnglycysphegluthrlyshislyscysasnglnthrcysleuasp

465470475480

argilealaalaglythrpheaspalaglyglupheserleuprothr

485490495

pheaspserleuasnilethralaalaserleuasnaspaspglyleu

500505510

aspasnhisthrileleuleutyrtyrserthralaalaserserleu

515520525

alavalthrleumetilealailephevalvaltyrmetvalserarg

530535540

aspasnvalsercysserilecysleupro

545550

<210>18

<211>570

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>用接头代替bha的切割位点的氨基酸序列

<400>18

aspargilecysthrglyilethrserserasnserprohisvalval

151015

lysthralathrglnglygluvalasnvalthrglyvalileproleu

202530

thrthrthrprothrlysserhisphealaasnleulysglythrglu

354045

thrargglylysleucysprolyscysleuasncysthraspleuasp

505560

valalaleuglyargprolyscysthrglylysileproseralaarg

65707580

valserileleuhisgluvalargprovalthrserglycysphepro

859095

ilemethisaspargthrlysileargglnleuproasnleuleuarg

100105110

glytyrgluhisileargleuserthrhisasnvalileasnalaglu

115120125

asnalaproglyglyprotyrlysileglythrserglysercyspro

130135140

asnilethrasnglyasnglyphephealathrmetalatrpalaval

145150155160

prolysasnasplysasnlysthralathrasnproleuthrileglu

165170175

valprotyrilecysthrgluglygluaspglnilethrvaltrpgly

180185190

phehisseraspasngluthrglnmetalalysleutyrglyaspser

195200205

lysproglnlysphethrserseralaasnglyvalthrthrhistyr

210215220

valserglnileglyglypheproasnglnthrgluaspglyglyleu

225230235240

proglnserglyargilevalvalasptyrmetvalglnlyssergly

245250255

lysthrglythrilethrtyrglnargglyileleuleuproglnlys

260265270

valtrpcysalaserglyargserlysvalilelysglyserleupro

275280285

leuileglyglualaaspcysleuhisglulystyrglyglyleuasn

290295300

lysserlysprotyrtyrthrglygluhisalalysalaileglyasn

305310315320

cysproiletrpvallysthrproleulysleualaasnglythrlys

325330335

tyrargglyserserserglyserserserglyglyphepheglyala

340345350

ilealaglypheleugluglyglytrpgluglymetilealaglytrp

355360365

hisglytyrthrserhisglyalahisglyvalalavalalaalaasp

370375380

leulysserthrglnglualaileasnlysilethrlysasnleuasn

385390395400

serleusergluleugluvallysasnleuglnargleuserglyala

405410415

metaspgluleuhisasngluileleugluleuaspglulysvalasp

420425430

aspleuargalaaspthrileserserglnilegluleualavalleu

435440445

leuserasngluglyileileasnsergluaspgluhisleuleuala

450455460

leugluarglysleulyslysmetleuglyproseralavalgluile

465470475480

glyasnglycysphegluthrlyshislyscysasnglnthrcysleu

485490495

aspargilealaalaglythrpheaspalaglyglupheserleupro

500505510

thrpheaspserleuasnilethralaalaserleuasnaspaspgly

515520525

leuaspasnhisthrileleuleutyrtyrserthralaalaserser

530535540

leualavalthrleumetilealailephevalvaltyrmetvalser

545550555560

argaspasnvalsercysserilecysleu

565570

<210>19

<211>550

<212>prt

<213>流感h3a/珀斯/16/2009(influenzah3a/perth/16/2009)

<400>19

glnlysleuproglyasnaspasnserthralathrleucysleugly

151015

hishisalavalproasnglythrilevallysthrilethrasnasp

202530

glnilegluvalthrasnalathrgluleuvalglnserserserthr

354045

glygluilecysaspserprohisglnileleuaspglylysasncys

505560

thrleuileaspalaleuleuglyaspproglncysaspglyphegln

65707580

asnlyslystrpaspleuphevalgluargserlysalatyrserasn

859095

cystyrprotyraspvalproasptyralaserleuargserleuval

100105110

alaserserglythrleuglupheasnasngluserpheasntrpthr

115120125

glyvalthrglnasnglythrserseralacysileargargserlys

130135140

asnserphepheserargleuasntrpleuthrhisleuasnphelys

145150155160

tyrproalaleuasnvalthrmetproasnasngluglnpheasplys

165170175

leutyriletrpglyvalhishisproglythrasplysaspglnile

180185190

pheleutyralaglnalaserglyargilethrvalserthrlysarg

195200205

serglnglnthrvalserproasnileglyserargproargvalarg

210215220

asnileproserargileseriletyrtrpthrilevallysprogly

225230235240

aspileleuleuileasnserthrglyasnleuilealaproarggly

245250255

tyrphelysileargserglylysserserilemetargseraspala

260265270

proileglylyscysasnserglucysilethrproasnglyserile

275280285

proasnasplyspropheglnasnvalasnargilethrtyrglyala

290295300

cysproargtyrvallysglnasnthrleulysleualathrglymet

305310315320

argasnvalproglulysglnthrargglyilepheglyalaileala

325330335

glypheilegluasnglytrpgluglymetvalaspglytrptyrgly

340345350

phearghisglnasnsergluglyargglyglnalaalaaspleulys

355360365

serthrglnalaalaileaspglnileasnglylysleuasnargleu

370375380

ileglylysthrasnglulysphehisglnileglulysglupheser

385390395400

gluvalgluglyargileglnaspleuglulystyrvalgluaspthr

405410415

lysileaspleutrpsertyrasnalagluleuleuvalalaleuglu

420425430

asnglnhisthrileaspleuthraspserglumetasnlysleuphe

435440445

glulysthrlyslysglnleuarggluasnalagluaspmetglyasn

450455460

glycysphelysiletyrhislyscysaspasnalacysileglyser

465470475480

ileargasnglythrtyrasphisaspvaltyrargaspglualaleu

485490495

asnasnargpheglnilelysglyvalgluleulysserglytyrlys

500505510

asptrpileleutrpileserphealailesercyspheleuleucys

515520525

valalaleuleuglypheilemettrpalacysglnlysglyasnile

530535540

argcysasnilecysile

545550

<210>20

<211>540

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>δ-蛋白水解环h3(具有接头gs)的氨基酸序列

<400>20

glnlysleuproglyasnaspasnserthralathrleucysleugly

151015

hishisalavalproasnglythrilevallysthrilethrasnasp

202530

glnilegluvalthrasnalathrgluleuvalglnserserserthr

354045

glygluilecysaspserprohisglnileleuaspglylysasncys

505560

thrleuileaspalaleuleuglyaspproglncysaspglyphegln

65707580

asnlyslystrpaspleuphevalgluargserlysalatyrserasn

859095

cystyrprotyraspvalproasptyralaserleuargserleuval

100105110

alaserserglythrleuglupheasnasngluserpheasntrpthr

115120125

glyvalthrglnasnglythrserseralacysileargargserlys

130135140

asnserphepheserargleuasntrpleuthrhisleuasnphelys

145150155160

tyrproalaleuasnvalthrmetproasnasngluglnpheasplys

165170175

leutyriletrpglyvalhishisproglythrasplysaspglnile

180185190

pheleutyralaglnalaserglyargilethrvalserthrlysarg

195200205

serglnglnthrvalserproasnileglyserargproargvalarg

210215220

asnileproserargileseriletyrtrpthrilevallysprogly

225230235240

aspileleuleuileasnserthrglyasnleuilealaproarggly

245250255

tyrphelysileargserglylysserserilemetargseraspala

260265270

proileglylyscysasnserglucysilethrproasnglyserile

275280285

proasnasplyspropheglnasnvalasnargilethrtyrglyala

290295300

cysproargtyrvallysglnasnthrleulysleualathrglymet

305310315320

glyserglyalailealaglypheilegluasnglytrpgluglymet

325330335

valaspglytrptyrglyphearghisglnasnsergluglyarggly

340345350

glnalaalaaspleulysserthrglnalaalaileaspglnileasn

355360365

glylysleuasnargleuileglylysthrasnglulysphehisgln

370375380

ileglulysgluphesergluvalgluglyargileglnaspleuglu

385390395400

lystyrvalgluaspthrlysileaspleutrpsertyrasnalaglu

405410415

leuleuvalalaleugluasnglnhisthrileaspleuthraspser

420425430

glumetasnlysleupheglulysthrlyslysglnleuarggluasn

435440445

alagluaspmetglyasnglycysphelysiletyrhislyscysasp

450455460

asnalacysileglyserileargasnglythrtyrasphisaspval

465470475480

tyrargaspglualaleuasnasnargpheglnilelysglyvalglu

485490495

leulysserglytyrlysasptrpileleutrpileserphealaile

500505510

sercyspheleuleucysvalalaleuleuglypheilemettrpala

515520525

cysglnlysglyasnileargcysasnilecysile

530535540

<210>21

<211>550

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>用接头代替h3的切割位点的氨基酸序列

<400>21

glnlysleuproglyasnaspasnserthralathrleucysleugly

151015

hishisalavalproasnglythrilevallysthrilethrasnasp

202530

glnilegluvalthrasnalathrgluleuvalglnserserserthr

354045

glygluilecysaspserprohisglnileleuaspglylysasncys

505560

thrleuileaspalaleuleuglyaspproglncysaspglyphegln

65707580

asnlyslystrpaspleuphevalgluargserlysalatyrserasn

859095

cystyrprotyraspvalproasptyralaserleuargserleuval

100105110

alaserserglythrleuglupheasnasngluserpheasntrpthr

115120125

glyvalthrglnasnglythrserseralacysileargargserlys

130135140

asnserphepheserargleuasntrpleuthrhisleuasnphelys

145150155160

tyrproalaleuasnvalthrmetproasnasngluglnpheasplys

165170175

leutyriletrpglyvalhishisproglythrasplysaspglnile

180185190

pheleutyralaglnalaserglyargilethrvalserthrlysarg

195200205

serglnglnthrvalserproasnileglyserargproargvalarg

210215220

asnileproserargileseriletyrtrpthrilevallysprogly

225230235240

aspileleuleuileasnserthrglyasnleuilealaproarggly

245250255

tyrphelysileargserglylysserserilemetargseraspala

260265270

proileglylyscysasnserglucysilethrproasnglyserile

275280285

proasnasplyspropheglnasnvalasnargilethrtyrglyala

290295300

cysproargtyrvallysglnasnthrleulysleualathrglymet

305310315320

glyserserglyserserglyserserglyilepheglyalaileala

325330335

glypheilegluasnglytrpgluglymetvalaspglytrptyrgly

340345350

phearghisglnasnsergluglyargglyglnalaalaaspleulys

355360365

serthrglnalaalaileaspglnileasnglylysleuasnargleu

370375380

ileglylysthrasnglulysphehisglnileglulysglupheser

385390395400

gluvalgluglyargileglnaspleuglulystyrvalgluaspthr

405410415

lysileaspleutrpsertyrasnalagluleuleuvalalaleuglu

420425430

asnglnhisthrileaspleuthraspserglumetasnlysleuphe

435440445

glulysthrlyslysglnleuarggluasnalagluaspmetglyasn

450455460

glycysphelysiletyrhislyscysaspasnalacysileglyser

465470475480

ileargasnglythrtyrasphisaspvaltyrargaspglualaleu

485490495

asnasnargpheglnilelysglyvalgluleulysserglytyrlys

500505510

asptrpileleutrpileserphealailesercyspheleuleucys

515520525

valalaleuleuglypheilemettrpalacysglnlysglyasnile

530535540

argcysasnilecysile

545550

<210>22

<211>31

<212>prt

<213>流感h1新喀里多尼亚(influenzah1newcal)

<400>22

ileproserileglnserargglyleupheglyalailealaglyphe

151015

ilegluglyglytrpthrglymetvalaspglytrptyrglytyr

202530

<210>23

<211>31

<212>prt

<213>流感h1布里斯班(influenzah1brisbane)

<400>23

ileproserileglnserargglyleupheglyalailealaglyphe

151015

ilegluglyglytrpthrglymetvalaspglytrptyrglytyr

202530

<210>24

<211>31

<212>prt

<213>流感h1所罗门群岛(influenzah1solislands)

<400>24

ileproserileglnserargglyleupheglyalailealaglyphe

151015

ilegluglyglytrpthrglymetvalaspglytrptyrglytyr

202530

<210>25

<211>31

<212>prt

<213>流感h2a新加坡(influenzah2asingapore)

<400>25

valproglnilegluserargglyleupheglyalailealaglyphe

151015

ilegluglyglytrpglnglymetvalaspglytrptyrglytyr

202530

<210>26

<211>31

<212>prt

<213>流感h3a布里斯班(influenzah3abrisbane)

<400>26

valproglulysglnthrargglyilepheglyalailealaglyphe

151015

ilegluasnglytrpgluglymetvalaspglytrptyrglyphe

202530

<210>27

<211>31

<212>prt

<213>流感h3awcn(influenzah3awcn)

<400>27

valproglulysglnthrargglyilepheglyalailealaglyphe

151015

ilegluasnglytrpgluglymetvalaspglytrptyrglyphe

202530

<210>28

<211>34

<212>prt

<213>流感h5安徽(influenzah5anhui)

<400>28

serproleuarggluargargarglysargglyleupheglyalaile

151015

alaglypheilegluglyglytrpglnglymetvalaspglytrptyr

202530

glytyr

<210>29

<211>35

<212>prt

<213>流感h5印度尼西亚(influenzah5indo)

<400>29

serproglnarggluserargarglyslysargglyleupheglyala

151015

ilealaglypheilegluglyglytrpglnglymetvalaspglytrp

202530

tyrglytyr

35

<210>30

<211>35

<212>prt

<213>流感h5越南(influenzah5vietnam)

<400>30

serproglnarggluargargarglyslysargglyleupheglyala

151015

ilealaglypheilegluglyglytrpglnglymetvalaspglytrp

202530

tyrglytyr

35

<210>31

<211>6861

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1194

<400>31

tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60

gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120

aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180

aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240

ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300

gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360

aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420

aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480

taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540

aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600

atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660

taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720

tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780

gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840

acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900

ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960

accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020

gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080

aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140

gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200

actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260

aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320

gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380

tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440

agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500

tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560

tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620

ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680

tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740

ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800

cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860

gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920

tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980

ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040

ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100

cgcgttgggaattactagcgcgtgtcgacacgcgtggcgcgccctagcagaaggcatgtt2160

gttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggagg2220

caagggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaagacga2280

agtcttgcgacaaggggggcccacgccgaattttaatattaccggcgtggccccacctta2340

tcgcgagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgcccactagg2400

gttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgataaagcgtata2460

ttgtatcaggtatttccgtcggatacgaattattcgtacaagcttcttaagccggtcaac2520

atggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagac2580

caaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccat2640

tgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaa2700

tgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtccc2760

aaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtct2820

tcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctactccaaa2880

aatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggta2940

atatccggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagata3000

gtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgtt3060

gaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtg3120

gaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccact3180

gacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctatataagga3240

agttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcgaacgtgg3300

ggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctc3360

tcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtac3420

aacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgcc3480

attaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgc3540

tggaggctgctgttcagccccatacattacttgttacgattctgctgactttcggcgggt3600

gcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttcttcttct3660

tgctgattggttctataagaaatctagtattttctttgaaacagagttttcccgtggttt3720

tcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccat3780

ggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctca3840

gatcttcgccgcggctcctcagccaaaacgacacccccatctgtctatccactggcccct3900

ggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatttc3960

cctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacaccttc4020

ccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctccagc4080

acctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaaggtg4140

gacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccagaa4200

gtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctgact4260

cctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttcagc4320

tggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagttc4380

aacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatggc4440

aaggaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgttt4500

ggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgag4560

ctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaa4620

aaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaa4680

catttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcat4740

ataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatt4800

tatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaa4860

caaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactaga4920

tctctagagtctcaagcttggcgcggggtaccgagctcgaattccgagtgtacttcaagt4980

cagttggaaatcaataaaatgattattttatgaatatatttcattgtgcaagtagataga5040

aattacatatgttacataacacacgaaataaacaaaaaaacacaatccaaaacaaacacc5100

ccaaacaaaataacactatatatatcctcgtatgaggagaggcacgttcagtgactcgac5160

gattcccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatcttca5220

aagtaatccttctgttgacttgtcattgataacatccagtcttcgtcaggattgcaaaga5280

attatagaagggatcccaccttttattttcttcttttttccatatttagggttgacagtg5340

aaatcagactggcaacctattaattgcttccacaatgggacgaacttgaaggggatgtcg5400

tcgatgatattataggtggcgtgttcatcgtagttggtgaagtcgatggtcccgttccag5460

tagttgtgtcgcccgagacttctagcccaggtggtctttccggtacgagttggtccgcag5520

atgtagaggctggggtgtctgaccccagtccttccctcatcctggttagatcggccatcc5580

actcaaggtcagattgtgcttgatcgtaggagacaggatgtatgaaagtgtaggcatcga5640

tgcttacatgatataggtgcgtctctctccagttgtgcagatcttcgtggcagcggagat5700

ctgattctgtgaagggcgacacgtactgctcaggttgtggaggaaataatttgttggctg5760

aatattccagccattgaagctttgttgcccattcatgagggaattcttctttgatcatgt5820

caagatactcctccttagacgttgcagtctggataatagttcgccatcgtgcgtcagatt5880

tgcgaggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcctttg5940

atatgtaatcaaggacttgtttagagtttctagctggctggatattagggtgatttcctt6000

caaaatcgaaaaaagaaggatccctaatacaaggttttttatcaagctggataagagcat6060

gatagtgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaataagaa6120

aaggtgtgagtttctcccagagaaactggaataaatcatctctttgagatgagcacttgg6180

ggtaggtaaggaaaacatatttagattggagtctgaagttcttgctagcagaaggcatgt6240

tgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggag6300

gcaagggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaagacg6360

aagtcttgcgacaaggggggcccacgccgaattttaatattaccggcgtggccccacctt6420

atcgcgagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgcccactag6480

ggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgatggagcgtat6540

attgtatcaggtatttccgtcggatacgaattattcgtacggccggccactagtggcact6600

ggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgcct6660

tgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgccc6720

ttcccaacagttgcgcagcctgaatggcgaatgctagagcagcttgagcttggatcagat6780

tgtcgtttcccgccttcagtttaaactatcagtgtttgacaggatatattggcgggtaaa6840

cctaagagaaaagagcgttta6861

<210>32

<211>5555

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒1008

<400>32

ctagcagaaggcatgttgttgtgactccgaggggttgcctcaaactctatcttataaccg60

gcgtggaggcatggaggcaagggcattttggtaatttaagtagttagtggaaaatgacgt120

catttacttaaagacgaagtcttgcgacaaggggggcccacgccgaattttaatattacc180

ggcgtggccccaccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaa240

agttcccgcccactagggttaaaggtgttcacactataaaagcatatacgatgtgatggt300

atttgataaagcgtatattgtatcaggtatttccgtcggatacgaattattcgtacaagc360

ttcttaagccggtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaag420

atacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaa480

acctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagg540

aaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcct600

ctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaag660

acgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcacgaca720

cacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgaga780

cttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatctgtc840

actttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgata900

aaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacccccac960

ccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggatt1020

gatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaagacc1080

cttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaataggtttt1140

gataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcatctct1200

cttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcg1260

tgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtgg1320

acacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtctt1380

gggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacgattct1440

gctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtac1500

ttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttgaaaca1560

gagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattctgccc1620

aaatttgtcgggcccatggcgaaaaacgttgcgattttcggcttattgttttctcttctt1680

gtgttggttccttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaac1740

tcaccacatgtcgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaatacca1800

ctgacaacaacacccaccaaatctcattttgcaaatctcaaaggaacagaaaccaggggg1860

aaactatgcccaaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaa1920

tgcacggggaaaataccctcggcaagagtttcaatactccatgaagtcagacctgttaca1980

tctgggtgctttcctataatgcacgacagaacaaaaattagacagctgcctaaccttctc2040

cgaggatacgaacatatcaggttatcaacccataacgttatcaatgcagaaaatgcacca2100

ggaggaccctacaaaattggaacctcagggtcttgccctaacattaccaatggaaacgga2160

tttttcgcaacaatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaat2220

ccattaacaatagaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgg2280

gggttccactctgacaacgagacccaaatggcaaagctctatggggactcaaagccccag2340

aagttcacctcatctgccaacggagtgaccacacattacgtttcacagattggtggcttc2400

ccaaatcaaacagaagacggaggactaccacaaagtggtagaattgttgttgattacatg2460

gtgcaaaaatctgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaa2520

aaggtgtggtgcgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattgga2580

gaagcagattgcctccacgaaaaatacggtggattaaacaaaagcaagccttactacaca2640

ggggaacatgcaaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctg2700

gccaatggaaccaaatatagacctcctgcaaaactattaaaggaaaggggtttcttcgga2760

gctattgctggtttcttagaaggaggatgggaaggaatgattgcaggttggcacggatac2820

acatcccatggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggcc2880

ataaacaagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaa2940

agactaagcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtg3000

gatgatctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaat3060

gaaggaataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaa3120

atgctgggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgc3180

aaccagacctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctc3240

cccacctttgattcactgaatattactgctgcatctttaaatgacgatggattggataat3300

catactatactgctttactactcaactgctgcctccagtttggctgtaacactgatgata3360

gctatctttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa3420

aggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtga3480

gcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcct3540

gtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaa3600

aaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacattt3660

ggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataat3720

ttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatga3780

gatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaa3840

tatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatctct3900

agagtctcaagcttggcgcggggtaccgagctcgaattccgagtgtacttcaagtcagtt3960

ggaaatcaataaaatgattattttatgaatatatttcattgtgcaagtagatagaaatta4020

catatgttacataacacacgaaataaacaaaaaaacacaatccaaaacaaacaccccaaa4080

caaaataacactatatatatcctcgtatgaggagaggcacgttcagtgactcgacgattc4140

ccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatcttcaaagta4200

atccttctgttgacttgtcattgataacatccagtcttcgtcaggattgcaaagaattat4260

agaagggatcccaccttttattttcttcttttttccatatttagggttgacagtgaaatc4320

agactggcaacctattaattgcttccacaatgggacgaacttgaaggggatgtcgtcgat4380

gatattataggtggcgtgttcatcgtagttggtgaagtcgatggtcccgttccagtagtt4440

gtgtcgcccgagacttctagcccaggtggtctttccggtacgagttggtccgcagatgta4500

gaggctggggtgtctgaccccagtccttccctcatcctggttagatcggccatccactca4560

aggtcagattgtgcttgatcgtaggagacaggatgtatgaaagtgtaggcatcgatgctt4620

acatgatataggtgcgtctctctccagttgtgcagatcttcgtggcagcggagatctgat4680

tctgtgaagggcgacacgtactgctcaggttgtggaggaaataatttgttggctgaatat4740

tccagccattgaagctttgttgcccattcatgagggaattcttctttgatcatgtcaaga4800

tactcctccttagacgttgcagtctggataatagttcgccatcgtgcgtcagatttgcga4860

ggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcctttgatatg4920

taatcaaggacttgtttagagtttctagctggctggatattagggtgatttccttcaaaa4980

tcgaaaaaagaaggatccctaatacaaggttttttatcaagctggataagagcatgatag5040

tgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaataagaaaaggt5100

gtgagtttctcccagagaaactggaataaatcatctctttgagatgagcacttggggtag5160

gtaaggaaaacatatttagattggagtctgaagttcttgctagcagaaggcatgttgttg5220

tgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggaggcaag5280

ggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaagacgaagtc5340

ttgcgacaaggggggcccacgccgaattttaatattaccggcgtggccccaccttatcgc5400

gagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgcccactagggtta5460

aaggtgttcacactataaaagcatatacgatgtgatggtatttgatggagcgtatattgt5520

atcaggtatttccgtcggatacgaattattcgtac5555

<210>33

<211>31

<212>prt

<213>流感h6野鸭hk(influenzah6tealhk)

<400>33

valproglnilegluthrargglyleupheglyalailealaglyphe

151015

ilegluglyglytrpthrglymetileaspglytrptyrglytyr

202530

<210>34

<211>42

<212>prt

<213>流感h7eq布拉格(influenzah7eqprague)

<400>34

valproglualaproalahislysglnleuthrhishismetarglys

151015

lysargglyleupheglyalailealaglypheilegluasnglytrp

202530

gluglyleuileaspglytrptyrglytyr

3540

<210>35

<211>31

<212>prt

<213>流感h9ahk(influenzah9ahk)

<400>35

valproalaargserserargglyleupheglyalailealaglyphe

151015

ilegluglyglytrpproglyleuvalalaglytrptyrglyphe

202530

<210>36

<211>43

<212>prt

<213>流感b佛罗里达(influenzabflorida)

<400>36

leulysleualaasnglythrlystyrargproproalalysleuleu

151015

lysgluargglyphepheglyalailealaglypheleugluglygly

202530

trpgluglymetilealaglytrphisglytyr

3540

<210>37

<211>43

<212>prt

<213>流感b马来西亚(influenzabmalaysia)

<400>37

leulysleualaasnglythrlystyrargproproalalysleuleu

151015

lysgluargglyphepheglyalailealaglypheleugluglygly

202530

trpgluglymetilealaglytrphisglytyr

3540

<210>38

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体10591039加1059.r

<400>38

cttcccatcctccaccaggaggtctatatttggttccattggccagcttcaa52

<210>39

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1039加1059.c

<400>39

caaatatagacctcctggtggaggatgggaaggaatgattgcaggttggcac52

<210>40

<211>5504

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒1059

<400>40

ctagcagaaggcatgttgttgtgactccgaggggttgcctcaaactctatcttataaccg60

gcgtggaggcatggaggcaagggcattttggtaatttaagtagttagtggaaaatgacgt120

catttacttaaagacgaagtcttgcgacaaggggggcccacgccgaattttaatattacc180

ggcgtggccccaccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaa240

agttcccgcccactagggttaaaggtgttcacactataaaagcatatacgatgtgatggt300

atttgataaagcgtatattgtatcaggtatttccgtcggatacgaattattcgtacaagc360

ttcttaagccggtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaag420

atacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaa480

acctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagg540

aaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcct600

ctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaag660

acgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcacgaca720

cacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgaga780

cttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatctgtc840

actttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgata900

aaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacccccac960

ccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggatt1020

gatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaagacc1080

cttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaataggtttt1140

gataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcatctct1200

cttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcg1260

tgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtgg1320

acacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtctt1380

gggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacgattct1440

gctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtac1500

ttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttgaaaca1560

gagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattctgccc1620

aaatttgtcgggcccatggcgaaaaacgttgcgattttcggcttattgttttctcttctt1680

gtgttggttccttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaac1740

tcaccacatgtcgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaatacca1800

ctgacaacaacacccaccaaatctcattttgcaaatctcaaaggaacagaaaccaggggg1860

aaactatgcccaaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaa1920

tgcacggggaaaataccctcggcaagagtttcaatactccatgaagtcagacctgttaca1980

tctgggtgctttcctataatgcacgacagaacaaaaattagacagctgcctaaccttctc2040

cgaggatacgaacatatcaggttatcaacccataacgttatcaatgcagaaaatgcacca2100

ggaggaccctacaaaattggaacctcagggtcttgccctaacattaccaatggaaacgga2160

tttttcgcaacaatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaat2220

ccattaacaatagaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgg2280

gggttccactctgacaacgagacccaaatggcaaagctctatggggactcaaagccccag2340

aagttcacctcatctgccaacggagtgaccacacattacgtttcacagattggtggcttc2400

ccaaatcaaacagaagacggaggactaccacaaagtggtagaattgttgttgattacatg2460

gtgcaaaaatctgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaa2520

aaggtgtggtgcgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattgga2580

gaagcagattgcctccacgaaaaatacggtggattaaacaaaagcaagccttactacaca2640

ggggaacatgcaaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctg2700

gccaatggaaccaaatatagacctcctggtggaggatgggaaggaatgattgcaggttgg2760

cacggatacacatcccatggggcacatggagtagcggtggcagcagaccttaagagcact2820

caagaggccataaacaagataacaaaaaatctcaactctttgagtgagctggaagtaaag2880

aatcttcaaagactaagcggtgccatggatgaactccacaacgaaatactagaactagat2940

gagaaagtggatgatctcagagctgatacaataagctcacaaatagaactcgcagtcctg3000

ctttccaatgaaggaataataaacagtgaagatgaacatctcttggcgcttgaaagaaag3060

ctgaagaaaatgctgggcccctctgctgtagagatagggaatggatgctttgaaaccaaa3120

cacaagtgcaaccagacctgtctcgacagaatagctgctggtacctttgatgcaggagaa3180

ttttctctccccacctttgattcactgaatattactgctgcatctttaaatgacgatgga3240

ttggataatcatactatactgctttactactcaactgctgcctccagtttggctgtaaca3300

ctgatgatagctatctttgttgtttatatggtctccagagacaatgtttcttgctccatc3360

tgtctataaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctat3420

gtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttg3480

tgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttatt3540

aaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgtt3600

caaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatta3660

tcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgt3720

tatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatag3780

aaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttac3840

tagatctctagagtctcaagcttggcgcggggtaccgagctcgaattccgagtgtacttc3900

aagtcagttggaaatcaataaaatgattattttatgaatatatttcattgtgcaagtaga3960

tagaaattacatatgttacataacacacgaaataaacaaaaaaacacaatccaaaacaaa4020

caccccaaacaaaataacactatatatatcctcgtatgaggagaggcacgttcagtgact4080

cgacgattcccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatc4140

ttcaaagtaatccttctgttgacttgtcattgataacatccagtcttcgtcaggattgca4200

aagaattatagaagggatcccaccttttattttcttcttttttccatatttagggttgac4260

agtgaaatcagactggcaacctattaattgcttccacaatgggacgaacttgaaggggat4320

gtcgtcgatgatattataggtggcgtgttcatcgtagttggtgaagtcgatggtcccgtt4380

ccagtagttgtgtcgcccgagacttctagcccaggtggtctttccggtacgagttggtcc4440

gcagatgtagaggctggggtgtctgaccccagtccttccctcatcctggttagatcggcc4500

atccactcaaggtcagattgtgcttgatcgtaggagacaggatgtatgaaagtgtaggca4560

tcgatgcttacatgatataggtgcgtctctctccagttgtgcagatcttcgtggcagcgg4620

agatctgattctgtgaagggcgacacgtactgctcaggttgtggaggaaataatttgttg4680

gctgaatattccagccattgaagctttgttgcccattcatgagggaattcttctttgatc4740

atgtcaagatactcctccttagacgttgcagtctggataatagttcgccatcgtgcgtca4800

gatttgcgaggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcc4860

tttgatatgtaatcaaggacttgtttagagtttctagctggctggatattagggtgattt4920

ccttcaaaatcgaaaaaagaaggatccctaatacaaggttttttatcaagctggataaga4980

gcatgatagtgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaata5040

agaaaaggtgtgagtttctcccagagaaactggaataaatcatctctttgagatgagcac5100

ttggggtaggtaaggaaaacatatttagattggagtctgaagttcttgctagcagaaggc5160

atgttgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcat5220

ggaggcaagggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaa5280

gacgaagtcttgcgacaaggggggcccacgccgaattttaatattaccggcgtggcccca5340

ccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgccca5400

ctagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgatggagc5460

gtatattgtatcaggtatttccgtcggatacgaattattcgtac5504

<210>41

<211>577

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/ha流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)(缺失的蛋白水解环)的氨基酸序列

<400>41

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglylysileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnilethrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnasplysasnlysthr

180185190

alathrasnproleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproglyglyglytrp

355360365

gluglymetilealaglytrphisglytyrthrserhisglyalahis

370375380

glyvalalavalalaalaaspleulysserthrglnglualaileasn

385390395400

lysilethrlysasnleuasnserleusergluleugluvallysasn

405410415

leuglnargleuserglyalametaspgluleuhisasngluileleu

420425430

gluleuaspglulysvalaspaspleuargalaaspthrileserser

435440445

glnilegluleualavalleuleuserasngluglyileileasnser

450455460

gluaspgluhisleuleualaleugluarglysleulyslysmetleu

465470475480

glyproseralavalgluileglyasnglycysphegluthrlyshis

485490495

lyscysasnglnthrcysleuaspargilealaalaglythrpheasp

500505510

alaglyglupheserleuprothrpheaspserleuasnilethrala

515520525

alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr

530535540

tyrserthralaalaserserleualavalthrleumetilealaile

545550555560

phevalvaltyrmetvalserargaspasnvalsercysserilecys

565570575

leu

<210>42

<211>1707

<212>dna

<213>流感h5a/印度尼西亚/5/2005(h5n1)(influenzah5a/indonesia/5/2005(h5n1))

<400>42

atggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagatttgc60

attggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaacgtt120

actgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcgatcta180

gatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgggaac240

ccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggccaat300

ccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaacaccta360

ttgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtccgat420

catgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctttttt480

agaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaagctac540

aataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatgatgcg600

gcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatcaaca660

ctaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaagtgga720

aggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagagtaat780

ggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagcaatt840

atgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatgggggcg900

ataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccccaaa960

tatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaagagag1020

agcagaagaaaaaagagaggactatttggagctatagcaggttttatagagggaggatgg1080

cagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtac1140

gctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactca1200

atcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaa1260

aggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctggacttat1320

aatgccgaacttctggttctcatggaaaatgagagaactctagactttcatgactcaaat1380

gttaagaacctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggt1440

aacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaac1500

ggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagt1560

ggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcg1620

agttccctagcactggcaatcatgatggctggtctatctttatggatgtgctccaatgga1680

tcgttacaatgcagaatttgcatttaa1707

<210>43

<211>1734

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/ha流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)(缺失的蛋白水解环)的核苷酸序列

<400>43

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120

aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180

accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240

tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300

ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360

ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420

atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480

attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540

gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600

gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660

aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720

gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780

gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840

aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900

agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960

cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020

gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080

tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140

catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200

aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260

agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320

ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380

ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440

ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500

acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560

tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620

atactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatc1680

tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734

<210>44

<211>19

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5/indo切割位点的天然序列

<400>44

thrglyleuargasnserproglnarggluserargarglyslysarg

151015

glyleuphe

<210>45

<211>15

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5/印度尼西亚修饰的切割位点(tetr)

<400>45

thrglyleuargasnserproglnthrgluthrargglyleuphe

151015

<210>46

<211>15

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5/印度尼西亚修饰的切割位点(tetq)

<400>46

thrglyleuargasnserproglnthrgluthrglnglyleuphe

151015

<210>47

<211>11

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h1切割位点

<400>47

asnileproserileglnserargglyleuphe

1510

<210>48

<211>11

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h3切割位点

<400>48

asnvalproglulysglnthrargglyilephe

1510

<210>49

<211>46

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1462if-hab110.s1+3c

<400>49

alaalaalathrthrthrglythrcysglyglyglycyscyscysala

151015

thrglyalaalaglyglycysalaalathralaalathrthrglythr

202530

alacysthralacysthrcysalathrglyglythralagly

354045

<210>50

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1462号if-hab110.s1-4r

<400>50

actaaagaaaataggcctttatagacagatggagcatgaaacgttgtctctg52

<210>51

<211>1755

<212>dna

<213>流感hab威斯康星州(influenzahabwisconsin)

<400>51

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120

gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180

ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240

gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300

gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360

caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420

gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480

gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540

aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600

caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660

gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720

cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780

gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840

gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900

ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960

aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020

acacctttgaagcttgccaatggaaccaaatatagacctcctgcaaaactattgaaggaa1080

aggggtttcttcggagctattgctggtttcctagaaggaggatgggaaggaatgattgca1140

ggttggcacggatacacatctcacggagcacatggagtggcagtggcggcagaccttaag1200

agtacacaagaagctataaataagataacaaaaaatctcaattctttgagtgagctagaa1260

gtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgag1320

ctggatgagaaagtggatgatctcagagctgacactataagctcacaaatagaacttgca1380

gtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattggcacttgag1440

agaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacggatgcttcgaa1500

accaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacctttaatgca1560

ggagaattttctctccccacttttgattcattgaacattactgctgcatctttaaatgat1620

gatggattggataaccatactatactgctctattactcaactgctgcttctagtttggct1680

gtaacattaatgctagctatttttattgtttatatggtctccagagacaacgtttcatgc1740

tccatctgtctataa1755

<210>52

<211>6745

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体193

<400>52

tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60

gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120

aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180

aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240

ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300

gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360

aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420

aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480

taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540

aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600

atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660

taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720

tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780

gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840

acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900

ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960

accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020

gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080

aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140

gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200

actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260

aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320

gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380

tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440

agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500

tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560

tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620

ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680

tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740

ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800

cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860

gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920

tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980

ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040

ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100

cgcgttgggaattactagcgcgtgtcgagacgcgttgttgttgtgactccgaggggttgc2160

ctcaaactctatcttataaccggcgtggaggcatggaggcaggggtattttggtcatttt2220

aatagatagtggaaaatgacgtggaatttacttaaagacgaagtctttgcgacaaggggg2280

ggcccacgccgaatttaatattaccggcgtggcccccccttatcgcgagtgctttagcac2340

gagcggtccagatttaaagtagaaaatttcccgcccactagggttaaaggtgttcacact2400

ataaaagcatatacgatgtgatggtatttggtcgacaagcttgcatgccggtcaacatgg2460

tggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaa2520

gggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcc2580

cagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgcc2640

atcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaag2700

atggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaa2760

agcaagtggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaata2820

tcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatat2880

ccggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtgg2940

aaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaag3000

atgcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaa3060

aagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacg3120

taagggatgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagtt3180

catttcatttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaa3240

acccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctctt3300

gtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacg3360

ttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccatta3420

aataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctgga3480

ggctgctgttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaa3540

tatctctacttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgct3600

gattggttctataagaaatctagtattttctttgaaacagagttttcccgtggttttcga3660

acttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccgcggat3720

ggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctca3780

gatcttcgcctgcaggctcctcagccaaaacgacacccccatctgtctatccactggccc3840

ctggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatt3900

tccctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacacct3960

tcccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctcca4020

gcacctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaagg4080

tggacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccag4140

aagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctga4200

ctcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttca4260

gctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagt4320

tcaacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatg4380

gcaaggagcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggcctatttt4440

ctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctg4500

tgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggt4560

cgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaaga4620

ccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagt4680

ttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaat4740

tacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggttttt4800

atgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgca4860

aactaggataaattatcgcgcgcggtgtcatctatgttactagatctctagagtctcaag4920

cttggcgcgccataaaatgattattttatgaatatatttcattgtgcaagtagatagaaa4980

ttacatatgttacataacacacgaaataaacaaaaaaagacaatccaaaaacaaacaccc5040

caaaaaaaataatcactttagataaactcgtatgaggagaggcacgttcagtgactcgac5100

gattcccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatcttta5160

aagtaatccttctgttgacttgtcattgataacatccagtcttcgtcaggattgcaaaga5220

attatagaagggatcccaccttttattttcttcttttttccatatttagggttgacagtg5280

aaatcagactggcaacctattaattgcttccacaatgggacgaacttgaaggggatgtcg5340

tcgatgatattataggtggcgtgttcatcgtagttggtgaaatcgatggtaccgttccaa5400

tagttgtgtcgtccgagacttctagcccaggtggtctttccggtacgagttggtccgcag5460

atgtagaggctggggtgtcggattccattccttccattgtcctggttaaatcggccatcc5520

attcaaggtcagattgagcttgttggtatgagacaggatgtatgtaagtataagcgtcta5580

tgcttacatggtatagatgggtttccctccaggagtgtagatcttcgtggcagcgaagat5640

ctgattctgtgaagggcgacacatacggttcaggttgtggagggaataatttgttggctg5700

aatattccagccattgaagttttgttgcccattcatgagggaattcttccttgatcatgt5760

caagatattcctccttagacgttgcagtctggataatagttctccatcgtgcgtcagatt5820

tgcgaggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcctttg5880

atatgtaatcaaggacttgtttagagtttctagctggctggatattagggtgatttcctt5940

caaaatcgaaaaaagaaggatccctaatacaaggttttttatcaagctggagaagagcat6000

gatagtgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaataagaa6060

aaggtgtgagtttctcccagagaaactggaataaatcatctctttgagatgagcacttgg6120

gataggtaaggaaaacatatttagattggagtctgaagttcttactagcagaaggcatgt6180

tgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggag6240

gcaggggtattttggtcattttaatagatagtggaaaatgacgtggaatttacttaaaga6300

cgaagtctttgcgacaagggggggcccacgccgaatttaatattaccggcgtggcccccc6360

cttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaatttcccgcccac6420

tagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgactagtgg6480

cactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatc6540

gccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatc6600

gcccttcccaacagttgcgcagcctgaatggcgaatgctagagcagcttgagcttggatc6660

agattgtcgtttcccgccttcagtttaaactatcagtgtttgacaggatatattggcggg6720

taaacctaagagaaaagagcgttta6745

<210>53

<211>3495

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒1462

<400>53

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctg1320

cactgggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggt1380

caatgtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatct1440

caaaggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctgga1500

tgtggccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatact1560

ccacgaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaat1620

caggcaactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgt1680

tatcgatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccc1740

taacgctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaa1800

ctacaaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaagggga1860

agaccaaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctcta1920

tggagactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgt1980

ttctcagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcag2040

aattgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaag2100

aggtgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagg2160

gtcattgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaa2220

aagcaagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggt2280

aaaaacacctttgaagcttgccaatggaaccaaatatagacctcctgcaaaactattgaa2340

ggaaaggggtttcttcggagctattgctggtttcctagaaggaggatgggaaggaatgat2400

tgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggcagacct2460

taagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagtgagct2520

agaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaaatact2580

cgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaatagaact2640

tgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattggcact2700

tgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacggatgctt2760

cgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacctttaa2820

tgcaggagaattttctctccccacttttgattcattgaacattactgctgcatctttaaa2880

tgatgatggattggataaccatactatactgctctattactcaactgctgcttctagttt2940

ggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaacgtttc3000

atgctccatctgtctataaaggcctattttctttagtttgaatttactgttattcggtgt3060

gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt3120

aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt3180

taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct3240

gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt3300

gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa3360

tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3420

tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3480

tctatgttactagat3495

<210>54

<211>584

<212>prt

<213>流感b/威斯康星州/1/2010(influenzab/wisconsin/1/2010)

<400>54

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvalargprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysileglyphephealathrmetalatrpalavalpro

165170175

lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasnlysthrglnmetlysserleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyasppheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproalalysleuleulysgluargglyphepheglyalaileala

355360365

glypheleugluglyglytrpgluglymetilealaglytrphisgly

370375380

tyrthrserhisglyalahisglyvalalavalalaalaaspleulys

385390395400

serthrglnglualaileasnlysilethrlysasnleuasnserleu

405410415

sergluleugluvallysasnleuglnargleuserglyalametasp

420425430

gluleuhisasngluileleugluleuaspglulysvalaspaspleu

435440445

argalaaspthrileserserglnilegluleualavalleuleuser

450455460

asngluglyileileasnsergluaspgluhisleuleualaleuglu

465470475480

arglysleulyslysmetleuglyproseralavalaspileglyasn

485490495

glycysphegluthrlyshislyscysasnglnthrcysleuasparg

500505510

ilealaalaglythrpheasnalaglyglupheserleuprothrphe

515520525

aspserleuasnilethralaalaserleuasnaspaspglyleuasp

530535540

asnhisthrileleuleutyrtyrserthralaalaserserleuala

545550555560

valthrleumetleualailepheilevaltyrmetvalserargasp

565570575

asnvalsercysserilecysleu

580

<210>55

<211>56

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1467hab110(prl-).r

<400>55

tccttcccatcctccaccaggaggtctatatttggttccattggcaagcttcaaag56

<210>56

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1467hab110(prl-).c

<400>56

atatagacctcctggtggaggatgggaaggaatgattgcaggttggcacgga52

<210>57

<211>3444

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1467

<400>57

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctg1320

cactgggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggt1380

caatgtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatct1440

caaaggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctgga1500

tgtggccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatact1560

ccacgaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaat1620

caggcaactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgt1680

tatcgatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccc1740

taacgctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaa1800

ctacaaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaagggga1860

agaccaaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctcta1920

tggagactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgt1980

ttctcagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcag2040

aattgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaag2100

aggtgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagg2160

gtcattgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaa2220

aagcaagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggt2280

aaaaacacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatggga2340

aggaatgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggc2400

ggcagaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattcttt2460

gagtgagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaa2520

cgaaatactcgagctggatgagaaagtggatgatctcagagctgacactataagctcaca2580

aatagaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatct2640

attggcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaa2700

cggatgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctgg2760

cacctttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgc2820

atctttaaatgatgatggattggataaccatactatactgctctattactcaactgctgc2880

ttctagtttggctgtaacattaatgctagctatttttattgtttatatggtctccagaga2940

caacgtttcatgctccatctgtctataaaggcctattttctttagtttgaatttactgtt3000

attcggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttatttt3060

atgtaatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacaca3120

aaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagct3180

tatcgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgtt3240

gccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataatt3300

aacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaatta3360

tacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgc3420

gcggtgtcatctatgttactagat3444

<210>58

<211>567

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>ha流感b/威斯康星州/1/2010(缺失的pl)的氨基酸序列

<400>58

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvalargprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysileglyphephealathrmetalatrpalavalpro

165170175

lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasnlysthrglnmetlysserleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyasppheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproglyglyglytrpgluglymetilealaglytrphisglytyr

355360365

thrserhisglyalahisglyvalalavalalaalaaspleulysser

370375380

thrglnglualaileasnlysilethrlysasnleuasnserleuser

385390395400

gluleugluvallysasnleuglnargleuserglyalametaspglu

405410415

leuhisasngluileleugluleuaspglulysvalaspaspleuarg

420425430

alaaspthrileserserglnilegluleualavalleuleuserasn

435440445

gluglyileileasnsergluaspgluhisleuleualaleugluarg

450455460

lysleulyslysmetleuglyproseralavalaspileglyasngly

465470475480

cysphegluthrlyshislyscysasnglnthrcysleuaspargile

485490495

alaalaglythrpheasnalaglyglupheserleuprothrpheasp

500505510

serleuasnilethralaalaserleuasnaspaspglyleuaspasn

515520525

histhrileleuleutyrtyrserthralaalaserserleualaval

530535540

thrleumetleualailepheilevaltyrmetvalserargaspasn

545550555560

valsercysserilecysleu

565

<210>59

<211>11

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>b切割位点

<400>59

proalalysleuleulysgluargglyphephe

1510

<210>60

<211>19

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5/印度尼西亚天然的切割位点

<400>60

thrglyleuargasnserproglnarggluserargarglyslysarg

151015

glyleuphe

<210>61

<211>15

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5/印度尼西亚修饰的切割位点

<400>61

thrglyleuargasnserproglnthrgluthrargglyleuphe

151015

<210>62

<211>15

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5/印度尼西亚修饰的切割位点

<400>62

thrglyleuargasnserproglnthrgluthrglnglyleuphe

151015

<210>63

<211>11

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h1/布里斯班修饰的切割位点

<400>63

asnileproserileglnserglnglyleuphe

1510

<210>64

<211>11

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h3/布里斯班修饰的切割位点

<400>64

asnvalprogluileglnthrglnglyilephe

1510

<210>65

<211>11

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>b/佛罗里达、b/布里斯班修饰的切割位点

<400>65

proalaileleuleuasnileglnglyphephe

1510

<210>66

<211>19

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>a/h3/ha0共有序列

<400>66

asnvalproglulysglnthrargglyilepheglyalailealagly

151015

pheileglu

<210>67

<211>19

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>a/h1/ha0共有序列

<400>67

asnileproserileglnserargglyleupheglyalailealagly

151015

pheileglu

<210>68

<211>19

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>b/ha0共有序列

<400>68

proalalysleuleulysgluargglyphepheglyalailealagly

151015

pheleuglu

<210>69

<211>16

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5安徽蛋白水解环缺失

<400>69

serproleuglyglytrpglnglymetvalaspglytrptyrglytyr

151015

<210>70

<211>16

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5印度尼西亚蛋白水解环缺失

<400>70

serproglnglyglytrpglnglymetvalaspglytrptyrglytyr

151015

<210>71

<211>16

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h5越南蛋白水解环缺失

<400>71

serproglnglyglytrpglnglymetvalaspglytrptyrglytyr

151015

<210>72

<211>25

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>b佛罗里达蛋白水解环缺失

<400>72

leulysleualaasnglythrlystyrargproproglyglytrpglu

151015

glymetilealaglytrphisglytyr

2025

<210>73

<211>25

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>b马来西亚蛋白水解环缺失

<400>73

leulysleualaasnglythrlystyrargproproglyglytrpglu

151015

glymetilealaglytrphisglytyr

2025

<210>74

<211>45

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物mutcleavage-h5(indo).r

<400>74

tagtcctcttgtctctgtttgagggctatttctgagccctgttgc45

<210>75

<211>45

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物mutcleavage-h5(indo).c

<400>75

tagccctcaaacagagacaagaggactatttggagctatagcagg45

<210>76

<211>3435

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒676

<400>76

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320

ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380

cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440

tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500

gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560

caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620

cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680

cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740

ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800

ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860

tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920

aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980

tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040

taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100

aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160

ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220

caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaac2280

agagacaagaggactatttggagctatagcaggttttatagagggaggatggcagggaat2340

ggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtacgctgcaga2400

caaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactcaatcattga2460

caaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaaaggagaat2520

agagaatttaaacaagaagatggaagacgggtttctagatgtctggacttataatgccga2580

acttctggttctcatggaaaatgagagaactctagactttcatgactcaaatgttaagaa2640

cctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggtaacggttg2700

tttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaacggaacgta2760

caactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagtggggtaaa2820

attggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcgagttccct2880

agcactggcaatcatgatggctggtctatctttatggatgtgctccaatggatcgttaca2940

atgcagaatttgcatttaaaggcctattttctttagtttgaatttactgttattcggtgt3000

gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt3060

aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt3120

taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct3180

gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt3240

gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa3300

tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3360

tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3420

tctatgttactagat3435

<210>77

<211>564

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>流感a/印度尼西亚/5/2005(h5n1)tetr切割位点突变的氨基酸序列

<400>77

metglulysilevalleuleuleualailevalserleuvallysser

151015

aspglnilecysileglytyrhisalaasnasnserthrgluglnval

202530

aspthrilemetglulysasnvalthrvalthrhisalaglnaspile

354045

leuglulysthrhisasnglylysleucysaspleuaspglyvallys

505560

proleuileleuargaspcysservalalaglytrpleuleuglyasn

65707580

prometcysaspglupheileasnvalproglutrpsertyrileval

859095

glulysalaasnprothrasnaspleucystyrproglyserpheasn

100105110

asptyrglugluleulyshisleuleuserargileasnhispheglu

115120125

lysileglnileileprolyssersertrpserasphisglualaser

130135140

serglyvalserseralacysprotyrleuglyserproserphephe

145150155160

argasnvalvaltrpleuilelyslysasnserthrtyrprothrile

165170175

lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp

180185190

glyilehishisproasnaspalaalagluglnthrargleutyrgln

195200205

asnprothrthrtyrileserileglythrserthrleuasnglnarg

210215220

leuvalprolysilealathrargserlysvalasnglyglnsergly

225230235240

argmetgluphephetrpthrileleulysproasnaspalaileasn

245250255

phegluserasnglyasnpheilealaproglutyralatyrlysile

260265270

vallyslysglyaspseralailemetlyssergluleuglutyrgly

275280285

asncysasnthrlyscysglnthrprometglyalaileasnserser

290295300

metprophehisasnilehisproleuthrileglyglucysprolys

305310315320

tyrvallysserasnargleuvalleualathrglyleuargasnser

325330335

proglnthrgluthrargglyleupheglyalailealaglypheile

340345350

gluglyglytrpglnglymetvalaspglytrptyrglytyrhishis

355360365

serasngluglnglyserglytyralaalaasplysgluserthrgln

370375380

lysalaileaspglyvalthrasnlysvalasnserileileasplys

385390395400

metasnthrglnpheglualavalglyargglupheasnasnleuglu

405410415

argargilegluasnleuasnlyslysmetgluaspglypheleuasp

420425430

valtrpthrtyrasnalagluleuleuvalleumetgluasngluarg

435440445

thrleuaspphehisaspserasnvallysasnleutyrasplysval

450455460

argleuglnleuargaspasnalalysgluleuglyasnglycysphe

465470475480

gluphetyrhislyscysaspasnglucysmetgluserileargasn

485490495

glythrtyrasntyrproglntyrsergluglualaargleulysarg

500505510

glugluileserglyvallysleugluserileglythrtyrglnile

515520525

leuseriletyrserthrvalalaserserleualaleualailemet

530535540

metalaglyleuserleutrpmetcysserasnglyserleuglncys

545550555560

argilecysile

<210>78

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物h5i505_tetq.r

<400>78

tccaaatagtccttgtgtctctgtttgagggctatttctgagccctgt48

<210>79

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物h5i505_tetq.c

<400>79

aaatagccctcaaacagagacacaaggactatttggagctatagcagg48

<210>80

<211>3435

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒766

<400>80

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320

ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380

cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440

tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500

gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560

caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620

cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680

cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740

ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800

ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860

tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920

aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980

tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040

taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100

aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160

ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220

caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaac2280

agagacacaaggactatttggagctatagcaggttttatagagggaggatggcagggaat2340

ggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtacgctgcaga2400

caaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactcaatcattga2460

caaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaaaggagaat2520

agagaatttaaacaagaagatggaagacgggtttctagatgtctggacttataatgccga2580

acttctggttctcatggaaaatgagagaactctagactttcatgactcaaatgttaagaa2640

cctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggtaacggttg2700

tttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaacggaacgta2760

caactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagtggggtaaa2820

attggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcgagttccct2880

agcactggcaatcatgatggctggtctatctttatggatgtgctccaatggatcgttaca2940

atgcagaatttgcatttaaaggcctattttctttagtttgaatttactgttattcggtgt3000

gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt3060

aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt3120

taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct3180

gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt3240

gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa3300

tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3360

tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3420

tctatgttactagat3435

<210>81

<211>564

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>流感a/印度尼西亚/5/2005(h5n1)tetq切割位点突变的氨基酸序列

<400>81

metglulysilevalleuleuleualailevalserleuvallysser

151015

aspglnilecysileglytyrhisalaasnasnserthrgluglnval

202530

aspthrilemetglulysasnvalthrvalthrhisalaglnaspile

354045

leuglulysthrhisasnglylysleucysaspleuaspglyvallys

505560

proleuileleuargaspcysservalalaglytrpleuleuglyasn

65707580

prometcysaspglupheileasnvalproglutrpsertyrileval

859095

glulysalaasnprothrasnaspleucystyrproglyserpheasn

100105110

asptyrglugluleulyshisleuleuserargileasnhispheglu

115120125

lysileglnileileprolyssersertrpserasphisglualaser

130135140

serglyvalserseralacysprotyrleuglyserproserphephe

145150155160

argasnvalvaltrpleuilelyslysasnserthrtyrprothrile

165170175

lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp

180185190

glyilehishisproasnaspalaalagluglnthrargleutyrgln

195200205

asnprothrthrtyrileserileglythrserthrleuasnglnarg

210215220

leuvalprolysilealathrargserlysvalasnglyglnsergly

225230235240

argmetgluphephetrpthrileleulysproasnaspalaileasn

245250255

phegluserasnglyasnpheilealaproglutyralatyrlysile

260265270

vallyslysglyaspseralailemetlyssergluleuglutyrgly

275280285

asncysasnthrlyscysglnthrprometglyalaileasnserser

290295300

metprophehisasnilehisproleuthrileglyglucysprolys

305310315320

tyrvallysserasnargleuvalleualathrglyleuargasnser

325330335

proglnthrgluthrglnglyleupheglyalailealaglypheile

340345350

gluglyglytrpglnglymetvalaspglytrptyrglytyrhishis

355360365

serasngluglnglyserglytyralaalaasplysgluserthrgln

370375380

lysalaileaspglyvalthrasnlysvalasnserileileasplys

385390395400

metasnthrglnpheglualavalglyargglupheasnasnleuglu

405410415

argargilegluasnleuasnlyslysmetgluaspglypheleuasp

420425430

valtrpthrtyrasnalagluleuleuvalleumetgluasngluarg

435440445

thrleuaspphehisaspserasnvallysasnleutyrasplysval

450455460

argleuglnleuargaspasnalalysgluleuglyasnglycysphe

465470475480

gluphetyrhislyscysaspasnglucysmetgluserileargasn

485490495

glythrtyrasntyrproglntyrsergluglualaargleulysarg

500505510

glugluileserglyvallysleugluserileglythrtyrglnile

515520525

leuseriletyrserthrvalalaserserleualaleualailemet

530535540

metalaglyleuserleutrpmetcysserasnglyserleuglncys

545550555560

argilecysile

<210>82

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物h5i505(prl-).r

<400>82

ctgccatcctccgccagggctatttctgagccctgttgcaaggactaatc50

<210>83

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>引物h5i505(prl-).c

<400>83

gaaatagccctggcggaggatggcagggaatggtagatggttggtatgggta52

<210>84

<211>3390

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒928

<400>84

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320

ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380

cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440

tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500

gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560

caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620

cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680

cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740

ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800

ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860

tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920

aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980

tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040

taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100

aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160

ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220

caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctggcgg2280

aggatggcagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggag2340

tgggtacgctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggt2400

caactcaatcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataa2460

cttagaaaggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctg2520

gacttataatgccgaacttctggttctcatggaaaatgagagaactctagactttcatga2580

ctcaaatgttaagaacctctacgacaaggtccgactacagcttagggataatgcaaagga2640

gctgggtaacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtat2700

aagaaacggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagagga2760

aataagtggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaac2820

agtggcgagttccctagcactggcaatcatgatggctggtctatctttatggatgtgctc2880

caatggatcgttacaatgcagaatttgcatttaaaggcctattttctttagtttgaattt2940

actgttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtt3000

tattttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaag3060

gacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatat3120

caagcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaat3180

cctgttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgta3240

ataattaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccg3300

caattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaatta3360

tcgcgcgcggtgtcatctatgttactagat3390

<210>85

<211>549

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>流感a/印度尼西亚/5/2005(h5n1)的具有缺失的蛋白水解环的氨基酸序列

<400>85

metglulysilevalleuleuleualailevalserleuvallysser

151015

aspglnilecysileglytyrhisalaasnasnserthrgluglnval

202530

aspthrilemetglulysasnvalthrvalthrhisalaglnaspile

354045

leuglulysthrhisasnglylysleucysaspleuaspglyvallys

505560

proleuileleuargaspcysservalalaglytrpleuleuglyasn

65707580

prometcysaspglupheileasnvalproglutrpsertyrileval

859095

glulysalaasnprothrasnaspleucystyrproglyserpheasn

100105110

asptyrglugluleulyshisleuleuserargileasnhispheglu

115120125

lysileglnileileprolyssersertrpserasphisglualaser

130135140

serglyvalserseralacysprotyrleuglyserproserphephe

145150155160

argasnvalvaltrpleuilelyslysasnserthrtyrprothrile

165170175

lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp

180185190

glyilehishisproasnaspalaalagluglnthrargleutyrgln

195200205

asnprothrthrtyrileserileglythrserthrleuasnglnarg

210215220

leuvalprolysilealathrargserlysvalasnglyglnsergly

225230235240

argmetgluphephetrpthrileleulysproasnaspalaileasn

245250255

phegluserasnglyasnpheilealaproglutyralatyrlysile

260265270

vallyslysglyaspseralailemetlyssergluleuglutyrgly

275280285

asncysasnthrlyscysglnthrprometglyalaileasnserser

290295300

metprophehisasnilehisproleuthrileglyglucysprolys

305310315320

tyrvallysserasnargleuvalleualathrglyleuargasnser

325330335

proglyglyglytrpglnglymetvalaspglytrptyrglytyrhis

340345350

hisserasngluglnglyserglytyralaalaasplysgluserthr

355360365

glnlysalaileaspglyvalthrasnlysvalasnserileileasp

370375380

lysmetasnthrglnpheglualavalglyargglupheasnasnleu

385390395400

gluargargilegluasnleuasnlyslysmetgluaspglypheleu

405410415

aspvaltrpthrtyrasnalagluleuleuvalleumetgluasnglu

420425430

argthrleuaspphehisaspserasnvallysasnleutyrasplys

435440445

valargleuglnleuargaspasnalalysgluleuglyasnglycys

450455460

phegluphetyrhislyscysaspasnglucysmetgluserilearg

465470475480

asnglythrtyrasntyrproglntyrsergluglualaargleulys

485490495

argglugluileserglyvallysleugluserileglythrtyrgln

500505510

ileleuseriletyrserthrvalalaserserleualaleualaile

515520525

metmetalaglyleuserleutrpmetcysserasnglyserleugln

530535540

cysargilecysile

545

<210>86

<211>40

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1029if-s2+s4-bbris.c

<400>86

tctcagatcttcgccgatcgaatctgcactggaataacat40

<210>87

<211>43

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1029if-s1a4-bbris.r

<400>87

actaaagaaaataggcctttatagacagatggagcaagaaaca43

<210>88

<211>1758

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>合成的hab布里斯班基因

<400>88

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

ggaataacatcgtcaaactcaccacatgtcgtcaaaactgctactcaaggggaggtcaat120

gtgactggtgtaataccactgacaacaacacccaccaaatctcattttgcaaatctcaaa180

ggaacagaaaccagggggaaactatgcccaaaatgcctcaactgcacagatctggacgta240

gccttgggcagaccaaaatgcacggggaaaataccctcggcaagagtttcaatactccat300

gaagtcagacctgttacatctgggtgctttcctataatgcacgacagaacaaaaattaga360

cagctgcctaaccttctccgaggatacgaacatatcaggttatcaacccataacgttatc420

aatgcagaaaatgcaccaggaggaccctacaaaattggaacctcagggtcttgccctaac480

attaccaatggaaacggatttttcgcaacaatggcttgggccgtcccaaaaaacgacaaa540

aacaaaacagcaacaaatccattaacaatagaagtaccatacatttgtacagaaggagaa600

gaccaaattaccgtttgggggttccactctgacaacgagacccaaatggcaaagctctat660

ggggactcaaagccccagaagttcacctcatctgccaacggagtgaccacacattacgtt720

tcacagattggtggcttcccaaatcaaacagaagacggaggactaccacaaagtggtaga780

attgttgttgattacatggtgcaaaaatctgggaaaacaggaacaattacctatcaaagg840

ggtattttattgcctcaaaaggtgtggtgcgcaagtggcaggagcaaggtaataaaagga900

tccttgcctttaattggagaagcagattgcctccacgaaaaatacggtggattaaacaaa960

agcaagccttactacacaggggaacatgcaaaggccataggaaattgcccaatatgggtg1020

aaaacacccttgaagctggccaatggaaccaaatatagacctcctgcaaaactattaaag1080

gaaaggggtttcttcggagctattgctggtttcttagaaggaggatgggaaggaatgatt1140

gcaggttggcacggatacacatcccatggggcacatggagtagcggtggcagcagacctt1200

aagagcactcaagaggccataaacaagataacaaaaaatctcaactctttgagtgagctg1260

gaagtaaagaatcttcaaagactaagcggtgccatggatgaactccacaacgaaatacta1320

gaactagatgagaaagtggatgatctcagagctgatacaataagctcacaaatagaactc1380

gcagtcctgctttccaatgaaggaataataaacagtgaagatgaacatctcttggcgctt1440

gaaagaaagctgaagaaaatgctgggcccctctgctgtagagatagggaatggatgcttt1500

gaaaccaaacacaagtgcaaccagacctgtctcgacagaatagctgctggtacctttgat1560

gcaggagaattttctctccccacctttgattcactgaatattactgctgcatctttaaat1620

gacgatggattggataatcatactatactgctttactactcaactgctgcctccagtttg1680

gctgtaacactgatgatagctatctttgttgtttatatggtctccagagacaatgtttct1740

tgctccatctgtctataa1758

<210>89

<211>3525

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒1029

<400>89

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcc1320

ttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgt1380

cgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaac1440

acccaccaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgccc1500

aaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaa1560

aataccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctt1620

tcctataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacga1680

acatatcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggacccta1740

caaaattggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaac1800

aatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaat1860

agaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactc1920

tgacaacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctc1980

atctgccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaac2040

agaagacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatc2100

tgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtg2160

cgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattg2220

cctccacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgc2280

aaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaac2340

caaatatagacctcctgcaaaactattaaaggaaaggggtttcttcggagctattgctgg2400

tttcttagaaggaggatgggaaggaatgattgcaggttggcacggatacacatcccatgg2460

ggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaacaagat2520

aacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagactaagcgg2580

tgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgatctcag2640

agctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaaggaataat2700

aaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctgggccc2760

ctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccagacctg2820

tctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacctttga2880

ttcactgaatattactgctgcatctttaaatgacgatggattggataatcatactatact2940

gctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatctttgt3000

tgtttatatggtctccagagacaatgtttcttgctccatctgtctataaaggcctatttt3060

ctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctg3120

tgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggt3180

cgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaaga3240

ccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagt3300

ttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaat3360

tacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggttttt3420

atgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgca3480

aactaggataaattatcgcgcgcggtgtcatctatgttactagat3525

<210>90

<211>594

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>来自流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)的pdisp/ha的氨基酸序列

<400>90

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglylysileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnilethrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnasplysasnlysthr

180185190

alathrasnproleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproalalysleuleu

355360365

lysgluargglyphepheglyalailealaglypheleugluglygly

370375380

trpgluglymetilealaglytrphisglytyrthrserhisglyala

385390395400

hisglyvalalavalalaalaaspleulysserthrglnglualaile

405410415

asnlysilethrlysasnleuasnserleusergluleugluvallys

420425430

asnleuglnargleuserglyalametaspgluleuhisasngluile

435440445

leugluleuaspglulysvalaspaspleuargalaaspthrileser

450455460

serglnilegluleualavalleuleuserasngluglyileileasn

465470475480

sergluaspgluhisleuleualaleugluarglysleulyslysmet

485490495

leuglyproseralavalgluileglyasnglycysphegluthrlys

500505510

hislyscysasnglnthrcysleuaspargilealaalaglythrphe

515520525

aspalaglyglupheserleuprothrpheaspserleuasnilethr

530535540

alaalaserleuasnaspaspglyleuaspasnhisthrileleuleu

545550555560

tyrtyrserthralaalaserserleualavalthrleumetileala

565570575

ilephevalvaltyrmetvalserargaspasnvalsercysserile

580585590

cysleu

<210>91

<211>1734

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab布里斯班(prl-)的核苷酸序列

<400>91

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120

aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180

accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240

tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300

ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360

ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420

atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480

attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540

gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600

gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660

aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720

gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780

gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840

aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900

agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960

cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020

gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080

tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140

catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200

aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260

agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320

ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380

ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440

ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500

acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560

tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620

atactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatc1680

tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734

<210>92

<211>577

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab布里斯班(prl-)的氨基酸序列

<400>92

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglylysileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnilethrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnasplysasnlysthr

180185190

alathrasnproleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproglyglyglytrp

355360365

gluglymetilealaglytrphisglytyrthrserhisglyalahis

370375380

glyvalalavalalaalaaspleulysserthrglnglualaileasn

385390395400

lysilethrlysasnleuasnserleusergluleugluvallysasn

405410415

leuglnargleuserglyalametaspgluleuhisasngluileleu

420425430

gluleuaspglulysvalaspaspleuargalaaspthrileserser

435440445

glnilegluleualavalleuleuserasngluglyileileasnser

450455460

gluaspgluhisleuleualaleugluarglysleulyslysmetleu

465470475480

glyproseralavalgluileglyasnglycysphegluthrlyshis

485490495

lyscysasnglnthrcysleuaspargilealaalaglythrpheasp

500505510

alaglyglupheserleuprothrpheaspserleuasnilethrala

515520525

alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr

530535540

tyrserthralaalaserserleualavalthrleumetilealaile

545550555560

phevalvaltyrmetvalserargaspasnvalsercysserilecys

565570575

leu

<210>93

<211>160

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>表达增强子cpmvx

<400>93

tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60

ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120

gatcttcaacgttgtcagatcgtgcttcggcaccagtaca160

<210>94

<211>29

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>跨结构域膜的共有的氨基酸序列

<220>

<221>

<222>

<221>site

<222>(3)..(3)

<223>xaa可为任何天然存在的氨基酸

<220>

<221>

<222>

<221>site

<222>(15)..(15)

<223>xaa可为任何天然存在的氨基酸

<220>

<221>

<222>

<221>site

<222>(17)..(18)

<223>xaa可为任何天然存在的氨基酸

<220>

<221>

<222>

<221>site

<222>(23)..(23)

<223>xaa可为任何天然存在的氨基酸

<220>

<221>

<222>

<221>site

<222>(25)..(25)

<223>xaa可为任何天然存在的氨基酸

<400>94

ileleuxaailetyrtyrserthrvalalaileserserleuxaaleu

151015

xaaxaametleualaglyxaaserxaatrpmetcysser

2025

<210>95

<211>1734

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列

<400>95

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120

aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180

accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240

tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300

ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360

ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420

atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480

attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540

gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600

gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660

aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720

gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780

gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840

aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900

agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960

cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020

gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080

tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140

catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200

aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260

agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320

ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380

ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440

ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500

acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560

tttgattcactgaatattactgctgcatctttaaatgacgatggattggataattaccag1620

attttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggca1680

atcagtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1734

<210>96

<211>577

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列

<400>96

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglylysileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnilethrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnasplysasnlysthr

180185190

alathrasnproleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproglyglyglytrp

355360365

gluglymetilealaglytrphisglytyrthrserhisglyalahis

370375380

glyvalalavalalaalaaspleulysserthrglnglualaileasn

385390395400

lysilethrlysasnleuasnserleusergluleugluvallysasn

405410415

leuglnargleuserglyalametaspgluleuhisasngluileleu

420425430

gluleuaspglulysvalaspaspleuargalaaspthrileserser

435440445

glnilegluleualavalleuleuserasngluglyileileasnser

450455460

gluaspgluhisleuleualaleugluarglysleulyslysmetleu

465470475480

glyproseralavalgluileglyasnglycysphegluthrlyshis

485490495

lyscysasnglnthrcysleuaspargilealaalaglythrpheasp

500505510

alaglyglupheserleuprothrpheaspserleuasnilethrala

515520525

alaserleuasnaspaspglyleuaspasntyrglnileleualaile

530535540

tyrserthrvalalaserserleuvalleuvalvalserleuglyala

545550555560

ileserphetrpmetcysserasnglyserleuglncysargilecys

565570575

ile

<210>97

<211>1731

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)的核苷酸序列

<400>97

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120

aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240

tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300

ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360

ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420

atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600

ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080

agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140

ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200

ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260

ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320

agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380

ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440

ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500

tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560

gattcattgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620

ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680

attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731

<210>98

<211>576

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)的氨基酸序列

<400>98

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrlysthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleualaasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysalagluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyglypheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproglyglyglytrpglu

355360365

glymetilealaglytrphisglytyrthrserhisglyalahisgly

370375380

valalavalalaalaaspleulysserthrglnglualaileasnlys

385390395400

ilethrlysasnleuasnserleusergluleugluvallysasnleu

405410415

glnargleuserglyalametaspgluleuhisasngluileleuglu

420425430

leuaspglulysvalaspaspleuargalaaspthrilesersergln

435440445

ilegluleualavalleuleuserasngluglyileileasnserglu

450455460

aspgluhisleuleualaleugluarglysleulyslysmetleugly

465470475480

proseralavalaspileglyasnglycysphegluthrlyshislys

485490495

cysasnglnthrcysleuaspargilealaalaglythrpheasnala

500505510

glyglupheserleuprothrpheaspserleuasnilethralaala

515520525

serleuasnaspaspglyleuaspasnhisthrileleuleutyrtyr

530535540

serthralaalaserserleualavalthrleumetleualailephe

545550555560

ilevaltyrmetvalserargaspasnvalsercysserilecysleu

565570575

<210>99

<211>1731

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列

<400>99

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120

aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240

tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300

ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360

ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420

atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600

ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080

agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140

ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200

ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260

ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320

agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380

ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440

ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500

tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560

gattcattgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620

ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680

agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731

<210>100

<211>576

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列

<400>100

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrlysthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleualaasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysalagluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyglypheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproglyglyglytrpglu

355360365

glymetilealaglytrphisglytyrthrserhisglyalahisgly

370375380

valalavalalaalaaspleulysserthrglnglualaileasnlys

385390395400

ilethrlysasnleuasnserleusergluleugluvallysasnleu

405410415

glnargleuserglyalametaspgluleuhisasngluileleuglu

420425430

leuaspglulysvalaspaspleuargalaaspthrilesersergln

435440445

ilegluleualavalleuleuserasngluglyileileasnserglu

450455460

aspgluhisleuleualaleugluarglysleulyslysmetleugly

465470475480

proseralavalaspileglyasnglycysphegluthrlyshislys

485490495

cysasnglnthrcysleuaspargilealaalaglythrpheasnala

500505510

glyglupheserleuprothrpheaspserleuasnilethralaala

515520525

serleuasnaspaspglyleuaspasntyrglnileleualailetyr

530535540

serthrvalalaserserleuvalleuvalvalserleuglyalaile

545550555560

serphetrpmetcysserasnglyserleuglncysargilecysile

565570575

<210>101

<211>1704

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)的核苷酸序列

<400>101

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120

gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180

ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240

gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300

gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360

caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420

gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480

gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540

aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600

caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660

gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720

cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780

gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840

gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900

ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960

aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020

acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080

atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140

gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200

gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260

atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320

gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380

gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440

tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500

tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560

ttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttct1620

agtttggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaac1680

gtttcatgctccatctgtctataa1704

<210>102

<211>567

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)的氨基酸序列

<400>102

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvalargprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysileglyphephealathrmetalatrpalavalpro

165170175

lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasnlysthrglnmetlysserleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyasppheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproglyglyglytrpgluglymetilealaglytrphisglytyr

355360365

thrserhisglyalahisglyvalalavalalaalaaspleulysser

370375380

thrglnglualaileasnlysilethrlysasnleuasnserleuser

385390395400

gluleugluvallysasnleuglnargleuserglyalametaspglu

405410415

leuhisasngluileleugluleuaspglulysvalaspaspleuarg

420425430

alaaspthrileserserglnilegluleualavalleuleuserasn

435440445

gluglyileileasnsergluaspgluhisleuleualaleugluarg

450455460

lysleulyslysmetleuglyproseralavalaspileglyasngly

465470475480

cysphegluthrlyshislyscysasnglnthrcysleuaspargile

485490495

alaalaglythrpheasnalaglyglupheserleuprothrpheasp

500505510

serleuasnilethralaalaserleuasnaspaspglyleuaspasn

515520525

histhrileleuleutyrtyrserthralaalaserserleualaval

530535540

thrleumetleualailepheilevaltyrmetvalserargaspasn

545550555560

valsercysserilecysleu

565

<210>103

<211>1704

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列

<400>103

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120

gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180

ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240

gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300

gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360

caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420

gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480

gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540

aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600

caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660

gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720

cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780

gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840

gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900

ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960

aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020

acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080

atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140

gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200

gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260

atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320

gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380

gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440

tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500

tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560

ttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccagt1620

tcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtct1680

ctacagtgtagaatatgtatttaa1704

<210>104

<211>567

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列

<400>104

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvalargprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysileglyphephealathrmetalatrpalavalpro

165170175

lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasnlysthrglnmetlysserleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyasppheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproglyglyglytrpgluglymetilealaglytrphisglytyr

355360365

thrserhisglyalahisglyvalalavalalaalaaspleulysser

370375380

thrglnglualaileasnlysilethrlysasnleuasnserleuser

385390395400

gluleugluvallysasnleuglnargleuserglyalametaspglu

405410415

leuhisasngluileleugluleuaspglulysvalaspaspleuarg

420425430

alaaspthrileserserglnilegluleualavalleuleuserasn

435440445

gluglyileileasnsergluaspgluhisleuleualaleugluarg

450455460

lysleulyslysmetleuglyproseralavalaspileglyasngly

465470475480

cysphegluthrlyshislyscysasnglnthrcysleuaspargile

485490495

alaalaglythrpheasnalaglyglupheserleuprothrpheasp

500505510

serleuasnilethralaalaserleuasnaspaspglyleuaspasn

515520525

tyrglnileleualailetyrserthrvalalaserserleuvalleu

530535540

valvalserleuglyalaileserphetrpmetcysserasnglyser

545550555560

leuglncysargilecysile

565

<210>105

<211>1734

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列

<400>105

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120

aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180

accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240

tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300

ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360

ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420

atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480

attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540

gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600

gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660

aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720

gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780

gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840

aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900

agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960

cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020

gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080

tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140

catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200

aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260

agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320

ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380

ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440

ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500

acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560

tttgattcactgaatattactgctgcatctttaaatgacgatggattggataattaccag1620

attttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggca1680

atcagtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1734

<210>106

<211>577

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列

<400>106

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglylysileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnilethrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnasplysasnlysthr

180185190

alathrasnproleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproglyglyglytrp

355360365

gluglymetilealaglytrphisglytyrthrserhisglyalahis

370375380

glyvalalavalalaalaaspleulysserthrglnglualaileasn

385390395400

lysilethrlysasnleuasnserleusergluleugluvallysasn

405410415

leuglnargleuserglyalametaspgluleuhisasngluileleu

420425430

gluleuaspglulysvalaspaspleuargalaaspthrileserser

435440445

glnilegluleualavalleuleuserasngluglyileileasnser

450455460

gluaspgluhisleuleualaleugluarglysleulyslysmetleu

465470475480

glyproseralavalgluileglyasnglycysphegluthrlyshis

485490495

lyscysasnglnthrcysleuaspargilealaalaglythrpheasp

500505510

alaglyglupheserleuprothrpheaspserleuasnilethrala

515520525

alaserleuasnaspaspglyleuaspasntyrglnileleualaile

530535540

tyrserthrvalalaserserleuvalleuvalvalserleuglyala

545550555560

ileserphetrpmetcysserasnglyserleuglncysargilecys

565570575

ile

<210>107

<211>1731

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)的核苷酸序列

<400>107

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120

aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240

tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300

ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360

ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420

atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600

ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080

agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140

ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200

ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260

ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320

agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380

ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440

ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500

tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560

gattcattgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620

ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680

attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731

<210>108

<211>576

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)的氨基酸序列

<400>108

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrlysthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleualaasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysalagluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyglypheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproglyglyglytrpglu

355360365

glymetilealaglytrphisglytyrthrserhisglyalahisgly

370375380

valalavalalaalaaspleulysserthrglnglualaileasnlys

385390395400

ilethrlysasnleuasnserleusergluleugluvallysasnleu

405410415

glnargleuserglyalametaspgluleuhisasngluileleuglu

420425430

leuaspglulysvalaspaspleuargalaaspthrilesersergln

435440445

ilegluleualavalleuleuserasngluglyileileasnserglu

450455460

aspgluhisleuleualaleugluarglysleulyslysmetleugly

465470475480

proseralavalaspileglyasnglycysphegluthrlyshislys

485490495

cysasnglnthrcysleuaspargilealaalaglythrpheasnala

500505510

glyglupheserleuprothrpheaspserleuasnilethralaala

515520525

serleuasnaspaspglyleuaspasnhisthrileleuleutyrtyr

530535540

serthralaalaserserleualavalthrleumetleualailephe

545550555560

ilevaltyrmetvalserargaspasnvalsercysserilecysleu

565570575

<210>109

<211>1731

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列

<400>109

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120

aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240

tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300

ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360

ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420

atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600

ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080

agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140

ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200

ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260

ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320

agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380

ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440

ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500

tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560

gattcattgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620

ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680

agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731

<210>110

<211>576

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列

<400>110

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrlysthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleualaasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysalagluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyglypheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproglyglyglytrpglu

355360365

glymetilealaglytrphisglytyrthrserhisglyalahisgly

370375380

valalavalalaalaaspleulysserthrglnglualaileasnlys

385390395400

ilethrlysasnleuasnserleusergluleugluvallysasnleu

405410415

glnargleuserglyalametaspgluleuhisasngluileleuglu

420425430

leuaspglulysvalaspaspleuargalaaspthrilesersergln

435440445

ilegluleualavalleuleuserasngluglyileileasnserglu

450455460

aspgluhisleuleualaleugluarglysleulyslysmetleugly

465470475480

proseralavalaspileglyasnglycysphegluthrlyshislys

485490495

cysasnglnthrcysleuaspargilealaalaglythrpheasnala

500505510

glyglupheserleuprothrpheaspserleuasnilethralaala

515520525

serleuasnaspaspglyleuaspasntyrglnileleualailetyr

530535540

serthrvalalaserserleuvalleuvalvalserleuglyalaile

545550555560

serphetrpmetcysserasnglyserleuglncysargilecysile

565570575

<210>111

<211>1704

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)的核苷酸序列

<400>111

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120

gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180

ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240

gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300

gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360

caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420

gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480

gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540

aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600

caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660

gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720

cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780

gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840

gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900

ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960

aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020

acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080

atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140

gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200

gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260

atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320

gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380

gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440

tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500

tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560

ttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttct1620

agtttggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaac1680

gtttcatgctccatctgtctataa1704

<210>112

<211>567

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)的氨基酸序列

<400>112

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvalargprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysileglyphephealathrmetalatrpalavalpro

165170175

lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasnlysthrglnmetlysserleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyasppheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproglyglyglytrpgluglymetilealaglytrphisglytyr

355360365

thrserhisglyalahisglyvalalavalalaalaaspleulysser

370375380

thrglnglualaileasnlysilethrlysasnleuasnserleuser

385390395400

gluleugluvallysasnleuglnargleuserglyalametaspglu

405410415

leuhisasngluileleugluleuaspglulysvalaspaspleuarg

420425430

alaaspthrileserserglnilegluleualavalleuleuserasn

435440445

gluglyileileasnsergluaspgluhisleuleualaleugluarg

450455460

lysleulyslysmetleuglyproseralavalaspileglyasngly

465470475480

cysphegluthrlyshislyscysasnglnthrcysleuaspargile

485490495

alaalaglythrpheasnalaglyglupheserleuprothrpheasp

500505510

serleuasnilethralaalaserleuasnaspaspglyleuaspasn

515520525

histhrileleuleutyrtyrserthralaalaserserleualaval

530535540

thrleumetleualailepheilevaltyrmetvalserargaspasn

545550555560

valsercysserilecysleu

565

<210>113

<211>1704

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列

<400>113

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120

gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180

ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240

gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300

gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360

caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420

gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480

gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540

aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600

caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660

gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720

cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780

gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840

gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900

ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960

aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020

acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080

atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140

gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200

gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260

atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320

gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380

gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440

tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500

tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560

ttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccagt1620

tcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtct1680

ctacagtgtagaatatgtatttaa1704

<210>114

<211>567

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列

<400>114

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvalargprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysileglyphephealathrmetalatrpalavalpro

165170175

lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasnlysthrglnmetlysserleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyasppheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproglyglyglytrpgluglymetilealaglytrphisglytyr

355360365

thrserhisglyalahisglyvalalavalalaalaaspleulysser

370375380

thrglnglualaileasnlysilethrlysasnleuasnserleuser

385390395400

gluleugluvallysasnleuglnargleuserglyalametaspglu

405410415

leuhisasngluileleugluleuaspglulysvalaspaspleuarg

420425430

alaaspthrileserserglnilegluleualavalleuleuserasn

435440445

gluglyileileasnsergluaspgluhisleuleualaleugluarg

450455460

lysleulyslysmetleuglyproseralavalaspileglyasngly

465470475480

cysphegluthrlyshislyscysasnglnthrcysleuaspargile

485490495

alaalaglythrpheasnalaglyglupheserleuprothrpheasp

500505510

serleuasnilethralaalaserleuasnaspaspglyleuaspasn

515520525

tyrglnileleualailetyrserthrvalalaserserleuvalleu

530535540

valvalserleuglyalaileserphetrpmetcysserasnglyser

545550555560

leuglncysargilecysile

565

<210>115

<211>1707

<212>dna

<213>流感h5印度尼西亚(influenzah5indo)

<400>115

atggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagatttgc60

attggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaacgtt120

actgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcgatcta180

gatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgggaac240

ccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggccaat300

ccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaacaccta360

ttgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtccgat420

catgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctttttt480

agaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaagctac540

aataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatgatgcg600

gcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatcaaca660

ctaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaagtgga720

aggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagagtaat780

ggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagcaatt840

atgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatgggggcg900

ataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccccaaa960

tatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaagagag1020

agcagaagaaaaaagagaggactatttggagctatagcaggttttatagagggaggatgg1080

cagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtac1140

gctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactca1200

atcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaa1260

aggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctggacttat1320

aatgccgaacttctggttctcatggaaaatgagagaactctagactttcatgactcaaat1380

gttaagaacctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggt1440

aacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaac1500

ggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagt1560

ggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcg1620

agttccctagcactggcaatcatgatggctggtctatctttatggatgtgctccaatgga1680

tcgttacaatgcagaatttgcatttaa1707

<210>116

<211>568

<212>prt

<213>流感h5印度尼西亚(influenzah5indo)

<400>116

metglulysilevalleuleuleualailevalserleuvallysser

151015

aspglnilecysileglytyrhisalaasnasnserthrgluglnval

202530

aspthrilemetglulysasnvalthrvalthrhisalaglnaspile

354045

leuglulysthrhisasnglylysleucysaspleuaspglyvallys

505560

proleuileleuargaspcysservalalaglytrpleuleuglyasn

65707580

prometcysaspglupheileasnvalproglutrpsertyrileval

859095

glulysalaasnprothrasnaspleucystyrproglyserpheasn

100105110

asptyrglugluleulyshisleuleuserargileasnhispheglu

115120125

lysileglnileileprolyssersertrpserasphisglualaser

130135140

serglyvalserseralacysprotyrleuglyserproserphephe

145150155160

argasnvalvaltrpleuilelyslysasnserthrtyrprothrile

165170175

lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp

180185190

glyilehishisproasnaspalaalagluglnthrargleutyrgln

195200205

asnprothrthrtyrileserileglythrserthrleuasnglnarg

210215220

leuvalprolysilealathrargserlysvalasnglyglnsergly

225230235240

argmetgluphephetrpthrileleulysproasnaspalaileasn

245250255

phegluserasnglyasnpheilealaproglutyralatyrlysile

260265270

vallyslysglyaspseralailemetlyssergluleuglutyrgly

275280285

asncysasnthrlyscysglnthrprometglyalaileasnserser

290295300

metprophehisasnilehisproleuthrileglyglucysprolys

305310315320

tyrvallysserasnargleuvalleualathrglyleuargasnser

325330335

proglnarggluserargarglyslysargglyleupheglyalaile

340345350

alaglypheilegluglyglytrpglnglymetvalaspglytrptyr

355360365

glytyrhishisserasngluglnglyserglytyralaalaasplys

370375380

gluserthrglnlysalaileaspglyvalthrasnlysvalasnser

385390395400

ileileasplysmetasnthrglnpheglualavalglyarggluphe

405410415

asnasnleugluargargilegluasnleuasnlyslysmetgluasp

420425430

glypheleuaspvaltrpthrtyrasnalagluleuleuvalleumet

435440445

gluasngluargthrleuaspphehisaspserasnvallysasnleu

450455460

tyrasplysvalargleuglnleuargaspasnalalysgluleugly

465470475480

asnglycysphegluphetyrhislyscysaspasnglucysmetglu

485490495

serileargasnglythrtyrasntyrproglntyrserglugluala

500505510

argleulysargglugluileserglyvallysleugluserilegly

515520525

thrtyrglnileleuseriletyrserthrvalalaserserleuala

530535540

leualailemetmetalaglyleuserleutrpmetcysserasngly

545550555560

serleuglncysargilecysile

565

<210>117

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1800if**(sacii)-pdi.s1+4c

<400>117

acagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggct52

<210>118

<211>51

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1800if-h3v36111.s1-4r

<400>118

actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgccctt51

<210>119

<211>1725

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h3维多利亚的核苷酸序列

<400>119

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcccaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120

caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180

actaatgctactgagctggttcagaattcctcaataggtgaaatatgcgacagtcctcat240

cagatccttgatggagaaaactgcacactaatagatgctctattgggagaccctcagtgt300

gatggcttccaaaataagaaatgggacctttttgttgaacgaagcaaagcctacagcaac360

tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420

acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagt480

tctgcttgcataaggagatctaataatagtttctttagtagattaaattggttgacccac540

ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600

ttgtacatttggggggttcaccacccgggtacggacaaggaccaaatcttcctgtatgct660

caatcatcaggaagaatcacagtatctaccaaaagaagccaacaagctgtaatcccgaat720

atcggatctagacccagaataaggaatatccctagcagaataagcatctattggacaata780

gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840

tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900

tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960

gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaagcactctgaaattg1020

gcaacaggaatgcgaaatgtaccagagaaacaaactagaggcatatttggcgcaatagcg1080

ggtttcatagaaaatggttgggagggaatggtggatggttggtacggtttcaggcatcaa1140

aattctgagggaagaggacaagcagcagatctcaaaagcactcaagcagcaatcgatcaa1200

atcaatgggaagctgaatcgattgatcgggaaaaccaacgagaaattccatcagattgaa1260

aaagaattctcagaagtcgaagggagaattcaggaccttgagaaatatgttgaggacact1320

aaaatagatctctggtcatacaacgcggagcttcttgttgccctggagaaccaacataca1380

attgatctaactgactcagaaatgaacaaactgtttgaaaaaacaaagaagcaactaagg1440

gaaaatgctgaggatatgggcaatggttgtttcaaaatataccacaaatgtgacaatgcc1500

tgcataggatcaatcagaaatggaacttatgaccacgatgtatacagagatgaagcatta1560

aacaaccggttccagatcaagggagttgagctgaagtcagggtacaaagattggatccta1620

tggatttcctttgccatatcatgttttttgctttgtgttgctttgttggggttcatcatg1680

tgggcctgccaaaagggcaacattaggtgcaacatttgcatttga1725

<210>120

<211>4644

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体2171

<400>120

tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60

gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120

aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180

aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240

ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300

gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360

aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420

aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480

taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540

aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600

atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660

taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720

tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780

gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840

acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900

ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960

accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020

gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080

aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140

gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200

actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260

aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320

gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380

tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440

agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500

tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560

tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620

ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680

tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740

ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800

cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860

gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920

tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980

ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040

ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100

cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160

cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220

tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280

ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340

cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400

cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460

ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520

tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580

cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640

aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700

tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760

cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820

tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880

tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940

ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000

ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacagggcccaata3060

ccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgt3120

tggttccttctcagatcttcgcgacgtcactcctcagccaaaacgacacccccatctgtc3180

tatccactggcccctggatctgctgcccaaactaactccatggtgaccctgggatgcctg3240

gtcaagggctatttccctgagccagtgacagtgacctggaactctggatccctgtccagc3300

ggtgtgcacaccttcccagctgtcctgcagtctgacctctacactctgagcagctcagtg3360

actgtcccctccagcacctggcccagcgagaccgtcacctgcaacgttgcccacccggcc3420

agcagcaccaaggtggacaagaaaattgtgcccagggattgtggttgtaagccttgcata3480

tgtacagtcccagaagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctc3540

accattactctgactcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatccc3600

gaggtccagttcagctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccc3660

cgggaggagcagttcaacagcactttccgctcagtcagtgaacttcccatcatgcaccag3720

gactggctcaatggcaaggagacgtccagattttggcgatctattcaactgtcgccagtt3780

cattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtctc3840

tacagtgtagaatatgtatttaaaggcctattttctttagtttgaatttactgttattcg3900

gtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgta3960

atttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaag4020

attttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcg4080

acctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccgg4140

tcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacat4200

gtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacat4260

ttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggt4320

gtcatctatgttactagatctctagagtctcaagcttggcgcgcccacgtgactagtggc4380

actggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcg4440

ccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcg4500

cccttcccaacagttgcgcagcctgaatggcgaatgctagagcagcttgagcttggatca4560

gattgtcgtttcccgccttcagtttaaactatcagtgtttgacaggatatattggcgggt4620

aaacctaagagaaaagagcgttta4644

<210>121

<211>3129

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1800

<400>121

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttatt960

gttttctcttcttgtgttggttccttctcagatcttcgcccaaaaacttcctggaaatga1020

caacagcacggcaacgctgtgccttgggcaccatgcagtaccaaacggaacgatagtgaa1080

aacaatcacgaatgaccaaattgaagttactaatgctactgagctggttcagaattcctc1140

aataggtgaaatatgcgacagtcctcatcagatccttgatggagaaaactgcacactaat1200

agatgctctattgggagaccctcagtgtgatggcttccaaaataagaaatgggacctttt1260

tgttgaacgaagcaaagcctacagcaactgttacccttatgatgtgccggattatgcctc1320

ccttaggtcactagttgcctcatccggcacactggagtttaacaatgaaagcttcaattg1380

gactggagtcactcaaaacggaacaagttctgcttgcataaggagatctaataatagttt1440

ctttagtagattaaattggttgacccacttaaacttcaaatacccagcattgaacgtgac1500

tatgccaaacaatgaacaatttgacaaattgtacatttggggggttcaccacccgggtac1560

ggacaaggaccaaatcttcctgtatgctcaatcatcaggaagaatcacagtatctaccaa1620

aagaagccaacaagctgtaatcccgaatatcggatctagacccagaataaggaatatccc1680

tagcagaataagcatctattggacaatagtaaaaccgggagacatacttttgattaacag1740

cacagggaatctaattgctcctaggggttacttcaaaatacgaagtgggaaaagctcaat1800

aatgagatcagatgcacccattggcaaatgcaattctgaatgcatcactccaaatggaag1860

cattcccaatgacaaaccattccaaaatgtaaacaggatcacatacggggcctgtcccag1920

atatgttaagcaaagcactctgaaattggcaacaggaatgcgaaatgtaccagagaaaca1980

aactagaggcatatttggcgcaatagcgggtttcatagaaaatggttgggagggaatggt2040

ggatggttggtacggtttcaggcatcaaaattctgagggaagaggacaagcagcagatct2100

caaaagcactcaagcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaa2160

aaccaacgagaaattccatcagattgaaaaagaattctcagaagtcgaagggagaattca2220

ggaccttgagaaatatgttgaggacactaaaatagatctctggtcatacaacgcggagct2280

tcttgttgccctggagaaccaacatacaattgatctaactgactcagaaatgaacaaact2340

gtttgaaaaaacaaagaagcaactaagggaaaatgctgaggatatgggcaatggttgttt2400

caaaatataccacaaatgtgacaatgcctgcataggatcaatcagaaatggaacttatga2460

ccacgatgtatacagagatgaagcattaaacaaccggttccagatcaagggagttgagct2520

gaagtcagggtacaaagattggatcctatggatttcctttgccatatcatgttttttgct2580

ttgtgttgctttgttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaa2640

catttgcatttgaaggcctattttctttagtttgaatttactgttattcggtgtgcattt2700

ctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttc2760

tttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattt2820

tattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagat2880

cgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatg2940

attatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatg3000

acgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcg3060

atagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatg3120

ttactagat3129

<210>122

<211>574

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h3维多利亚的氨基酸序列

<400>122

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaglnlysleuproglyasnaspasn

202530

serthralathrleucysleuglyhishisalavalproasnglythr

354045

ilevallysthrilethrasnaspglnilegluvalthrasnalathr

505560

gluleuvalglnasnserserileglygluilecysaspserprohis

65707580

glnileleuaspglygluasncysthrleuileaspalaleuleugly

859095

aspproglncysaspglypheglnasnlyslystrpaspleupheval

100105110

gluargserlysalatyrserasncystyrprotyraspvalproasp

115120125

tyralaserleuargserleuvalalaserserglythrleugluphe

130135140

asnasngluserpheasntrpthrglyvalthrglnasnglythrser

145150155160

seralacysileargargserasnasnserphepheserargleuasn

165170175

trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet

180185190

proasnasngluglnpheasplysleutyriletrpglyvalhishis

195200205

proglythrasplysaspglnilepheleutyralaglnsersergly

210215220

argilethrvalserthrlysargserglnglnalavalileproasn

225230235240

ileglyserargproargileargasnileproserargileserile

245250255

tyrtrpthrilevallysproglyaspileleuleuileasnserthr

260265270

glyasnleuilealaproargglytyrphelysileargserglylys

275280285

serserilemetargseraspalaproileglylyscysasnserglu

290295300

cysilethrproasnglyserileproasnasplyspropheglnasn

305310315320

valasnargilethrtyrglyalacysproargtyrvallysglnser

325330335

thrleulysleualathrglymetargasnvalproglulysglnthr

340345350

argglyilepheglyalailealaglypheilegluasnglytrpglu

355360365

glymetvalaspglytrptyrglyphearghisglnasnserglugly

370375380

argglyglnalaalaaspleulysserthrglnalaalaileaspgln

385390395400

ileasnglylysleuasnargleuileglylysthrasnglulysphe

405410415

hisglnileglulysgluphesergluvalgluglyargileglnasp

420425430

leuglulystyrvalgluaspthrlysileaspleutrpsertyrasn

435440445

alagluleuleuvalalaleugluasnglnhisthrileaspleuthr

450455460

aspserglumetasnlysleupheglulysthrlyslysglnleuarg

465470475480

gluasnalagluaspmetglyasnglycysphelysiletyrhislys

485490495

cysaspasnalacysileglyserileargasnglythrtyrasphis

500505510

aspvaltyrargaspglualaleuasnasnargpheglnilelysgly

515520525

valgluleulysserglytyrlysasptrpileleutrpileserphe

530535540

alailesercyspheleuleucysvalalaleuleuglypheilemet

545550555560

trpalacysglnlysglyasnileargcysasnilecysile

565570

<210>123

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1819if(sacii)-kozac_pdi.c

<400>123

gtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttc48

<210>124

<211>51

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1819if-h3v36111.s1-4r

<400>124

actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgccctt51

<210>125

<211>4914

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体2181

<400>125

tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60

gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120

aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180

aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240

ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300

gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360

aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420

aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480

taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540

aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600

atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660

taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720

tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780

gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840

acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900

ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960

accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020

gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080

aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140

gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200

actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260

aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320

gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380

tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440

agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500

tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560

tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620

ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680

tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740

ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800

cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860

gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920

tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980

ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040

ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100

cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160

cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220

tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280

ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340

cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400

cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460

ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520

tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580

cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640

aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700

tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760

cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820

tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880

tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940

ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000

ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctt3060

tcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacg3120

tgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgct3180

gttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaatatctct3240

acttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggt3300

tctataagaaatctagtattttctttgaaacagagttttcccgtggttttcgaacttgga3360

gaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccaataccgcggaga3420

aaatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcctt3480

ctcagatcttcgcgacgtcactcctcagccaaaacgacacccccatctgtctatccactg3540

gcccctggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggc3600

tatttccctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcac3660

accttcccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccc3720

tccagcacctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcacc3780

aaggtggacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtc3840

ccagaagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattact3900

ctgactcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccag3960

ttcagctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggag4020

cagttcaacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctc4080

aatggcaaggagcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggccta4140

ttttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttt4200

tctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagc4260

aggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaa4320

aagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaata4380

aagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgtt4440

gaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggt4500

ttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcg4560

cgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatctctagagtct4620

caagcttggcgcgcccacgtgactagtggcactggccgtcgttttacaacgtcgtgactg4680

ggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctg4740

gcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatgg4800

cgaatgctagagcagcttgagcttggatcagattgtcgtttcccgccttcagtttaaact4860

atcagtgtttgacaggatatattggcgggtaaacctaagagaaaagagcgttta4914

<210>126

<211>3480

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>构建体1819

<400>126

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320

tcttgtgttggttccttctcagatcttcgcccaaaaacttcctggaaatgacaacagcac1380

ggcaacgctgtgccttgggcaccatgcagtaccaaacggaacgatagtgaaaacaatcac1440

gaatgaccaaattgaagttactaatgctactgagctggttcagaattcctcaataggtga1500

aatatgcgacagtcctcatcagatccttgatggagaaaactgcacactaatagatgctct1560

attgggagaccctcagtgtgatggcttccaaaataagaaatgggacctttttgttgaacg1620

aagcaaagcctacagcaactgttacccttatgatgtgccggattatgcctcccttaggtc1680

actagttgcctcatccggcacactggagtttaacaatgaaagcttcaattggactggagt1740

cactcaaaacggaacaagttctgcttgcataaggagatctaataatagtttctttagtag1800

attaaattggttgacccacttaaacttcaaatacccagcattgaacgtgactatgccaaa1860

caatgaacaatttgacaaattgtacatttggggggttcaccacccgggtacggacaagga1920

ccaaatcttcctgtatgctcaatcatcaggaagaatcacagtatctaccaaaagaagcca1980

acaagctgtaatcccgaatatcggatctagacccagaataaggaatatccctagcagaat2040

aagcatctattggacaatagtaaaaccgggagacatacttttgattaacagcacagggaa2100

tctaattgctcctaggggttacttcaaaatacgaagtgggaaaagctcaataatgagatc2160

agatgcacccattggcaaatgcaattctgaatgcatcactccaaatggaagcattcccaa2220

tgacaaaccattccaaaatgtaaacaggatcacatacggggcctgtcccagatatgttaa2280

gcaaagcactctgaaattggcaacaggaatgcgaaatgtaccagagaaacaaactagagg2340

catatttggcgcaatagcgggtttcatagaaaatggttgggagggaatggtggatggttg2400

gtacggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcac2460

tcaagcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaaaaccaacga2520

gaaattccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttga2580

gaaatatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgc2640

cctggagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaa2700

aacaaagaagcaactaagggaaaatgctgaggatatgggcaatggttgtttcaaaatata2760

ccacaaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgt2820

atacagagatgaagcattaaacaaccggttccagatcaagggagttgagctgaagtcagg2880

gtacaaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgc2940

tttgttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaacatttgcat3000

ttgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttg3060

gtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagc3120

tcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaa3180

aaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaac3240

atttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcata3300

taatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttattt3360

atgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaac3420

aaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3480

<210>127

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if**-h2s157.sl-6r

<400>127

actaaagaaaataggccttcatatgcagatcctgcactgcagagacccgt50

<210>128

<211>1716

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h2新加坡的核苷酸序列

<400>128

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggaccaaatatgcattggataccatgccaataattccacagagaaggtc120

gacacaattctagagcggaacgtcactgtgactcatgccaaggacattcttgagaagacc180

cataacggaaagttatgcaaactaaacggaatccctccacttgaactaggggactgtagc240

attgccggatggctccttggaaatccagaatgtgataggcttctaagtgtgccagaatgg300

tcctatataatggagaaagaaaacccgagagacggtttgtgttatccaggcagcttcaat360

gattatgaagaattgaaacatctcctcagcagcgtgaaacatttcgagaaagtaaagatt420

ctgcccaaagatagatggacacagcatacaacaactggaggttcacgggcctgcgcggtg480

tctggtaatccatcattcttcaggaacatggtctggctgacaaagaaagaatcaaattat540

ccggttgccaaaggatcgtacaacaatacaagcggagaacaaatgctaataatttggggg600

gtgcaccatcccaatgatgagacagaacaaagaacattgtaccagaatgtgggaacctat660

gtttccgtaggcacatcaacattgaacaaaaggtcaaccccagacatagcaacaaggcct720

aaagtgaatggactaggaagtagaatggagttctcttggaccctattggatatgtgggac780

accataaattttgagagtactggtaatctaattgcaccagagtatggattcaaaatatcg840

aaaagaggtagttcagggatcatgaaaacagaaggaacacttgagaactgtgagaccaaa900

tgccaaactcctttgggagcaataaatacaacattgccttttcacaatgtccacccactg960

acaataggtgagtgccccaaatatgtaaaatcggagaagttggtcttagcaacaggacta1020

aggaatgttccccagattgaatcaagaggattgtttggggcaatagctggttttatagaa1080

ggaggatggcaaggaatggttgatggttggtatggataccatcacagcaatgaccaggga1140

tcagggtatgcagcagacaaagaatccactcaaaaggcatttgatggaatcaccaacaag1200

gtaaattctgtgattgaaaagatgaacacccaatttgaagctgttgggaaagagttcagt1260

aacttagagagaagactggagaacttgaacaaaaagatggaagacgggtttctagatgtg1320

tggacatacaatgctgagcttctagttctgatggaaaatgagaggacacttgactttcat1380

gattctaatgtcaagaatctgtatgataaagtcagaatgcagctgagagacaacgtcaaa1440

gaactaggaaatggatgttttgaattttatcacaaatgtgatgatgaatgcatgaatagt1500

gtgaaaaacgggacgtatgattatcccaagtatgaagaagagtctaaactaaatagaaat1560

gaaatcaaaggggtaaaattgagcagcatgggggtttatcaaatccttgccatttatgct1620

acagtagcaggttctctgtcactggcaatcatgatggctgggatctctttctggatgtgc1680

tccaacgggtctctgcagtgcaggatctgcatatga1716

<210>129

<211>3471

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>表达盒2220号

<400>129

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320

tcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggataccatgccaa1380

taattccacagagaaggtcgacacaattctagagcggaacgtcactgtgactcatgccaa1440

ggacattcttgagaagacccataacggaaagttatgcaaactaaacggaatccctccact1500

tgaactaggggactgtagcattgccggatggctccttggaaatccagaatgtgataggct1560

tctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagagacggtttgtg1620

ttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcagcgtgaaaca1680

tttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaacaactggagg1740

ttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggtctggctgac1800

aaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaagcggagaaca1860

aatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaagaacattgta1920

ccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaaggtcaacccc1980

agacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagttctcttggac2040

cctattggatatgtgggacaccataaattttgagagtactggtaatctaattgcaccaga2100

gtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacagaaggaacact2160

tgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaacattgccttt2220

tcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatcggagaagtt2280

ggtcttagcaacaggactaaggaatgttccccagattgaatcaagaggattgtttggggc2340

aatagctggttttatagaaggaggatggcaaggaatggttgatggttggtatggatacca2400

tcacagcaatgaccagggatcagggtatgcagcagacaaagaatccactcaaaaggcatt2460

tgatggaatcaccaacaaggtaaattctgtgattgaaaagatgaacacccaatttgaagc2520

tgttgggaaagagttcagtaacttagagagaagactggagaacttgaacaaaaagatgga2580

agacgggtttctagatgtgtggacatacaatgctgagcttctagttctgatggaaaatga2640

gaggacacttgactttcatgattctaatgtcaagaatctgtatgataaagtcagaatgca2700

gctgagagacaacgtcaaagaactaggaaatggatgttttgaattttatcacaaatgtga2760

tgatgaatgcatgaatagtgtgaaaaacgggacgtatgattatcccaagtatgaagaaga2820

gtctaaactaaatagaaatgaaatcaaaggggtaaaattgagcagcatgggggtttatca2880

aatccttgccatttatgctacagtagcaggttctctgtcactggcaatcatgatggctgg2940

gatctctttctggatgtgctccaacgggtctctgcagtgcaggatctgcatatgaaggcc3000

tattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggt3060

tttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgttta3120

gcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaa3180

aaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaa3240

taaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctg3300

ttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgg3360

gtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatag3420

cgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3471

<210>130

<211>571

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h2新加坡的氨基酸序列

<400>130

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspglnilecysileglytyrhis

202530

alaasnasnserthrglulysvalaspthrileleugluargasnval

354045

thrvalthrhisalalysaspileleuglulysthrhisasnglylys

505560

leucyslysleuasnglyileproproleugluleuglyaspcysser

65707580

ilealaglytrpleuleuglyasnproglucysaspargleuleuser

859095

valproglutrpsertyrilemetglulysgluasnproargaspgly

100105110

leucystyrproglyserpheasnasptyrglugluleulyshisleu

115120125

leuserservallyshispheglulysvallysileleuprolysasp

130135140

argtrpthrglnhisthrthrthrglyglyserargalacysalaval

145150155160

serglyasnproserphepheargasnmetvaltrpleuthrlyslys

165170175

gluserasntyrprovalalalysglysertyrasnasnthrsergly

180185190

gluglnmetleuileiletrpglyvalhishisproasnaspgluthr

195200205

gluglnargthrleutyrglnasnvalglythrtyrvalservalgly

210215220

thrserthrleuasnlysargserthrproaspilealathrargpro

225230235240

lysvalasnglyleuglyserargmetgluphesertrpthrleuleu

245250255

aspmettrpaspthrileasnphegluserthrglyasnleuileala

260265270

proglutyrglyphelysileserlysargglyserserglyilemet

275280285

lysthrgluglythrleugluasncysgluthrlyscysglnthrpro

290295300

leuglyalaileasnthrthrleuprophehisasnvalhisproleu

305310315320

thrileglyglucysprolystyrvallysserglulysleuvalleu

325330335

alathrglyleuargasnvalproglnilegluserargglyleuphe

340345350

glyalailealaglypheilegluglyglytrpglnglymetvalasp

355360365

glytrptyrglytyrhishisserasnaspglnglyserglytyrala

370375380

alaasplysgluserthrglnlysalapheaspglyilethrasnlys

385390395400

valasnservalileglulysmetasnthrglnpheglualavalgly

405410415

lysglupheserasnleugluargargleugluasnleuasnlyslys

420425430

metgluaspglypheleuaspvaltrpthrtyrasnalagluleuleu

435440445

valleumetgluasngluargthrleuaspphehisaspserasnval

450455460

lysasnleutyrasplysvalargmetglnleuargaspasnvallys

465470475480

gluleuglyasnglycysphegluphetyrhislyscysaspaspglu

485490495

cysmetasnservallysasnglythrtyrasptyrprolystyrglu

500505510

glugluserlysleuasnargasngluilelysglyvallysleuser

515520525

sermetglyvaltyrglnileleualailetyralathrvalalagly

530535540

serleuserleualailemetmetalaglyileserphetrpmetcys

545550555560

serasnglyserleuglncysargilecysile

565570

<210>131

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h2s157(prl-).r

<400>131

tgccatcctccgccgggaacattccttagtcctgttgctaagaccaac48

<210>132

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h2s157(prl-).c

<400>132

aggaatgttcccggcggaggatggcaaggaatggttgatggttggtatgg50

<210>133

<211>3426

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2221

<400>133

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320

tcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggataccatgccaa1380

taattccacagagaaggtcgacacaattctagagcggaacgtcactgtgactcatgccaa1440

ggacattcttgagaagacccataacggaaagttatgcaaactaaacggaatccctccact1500

tgaactaggggactgtagcattgccggatggctccttggaaatccagaatgtgataggct1560

tctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagagacggtttgtg1620

ttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcagcgtgaaaca1680

tttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaacaactggagg1740

ttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggtctggctgac1800

aaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaagcggagaaca1860

aatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaagaacattgta1920

ccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaaggtcaacccc1980

agacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagttctcttggac2040

cctattggatatgtgggacaccataaattttgagagtactggtaatctaattgcaccaga2100

gtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacagaaggaacact2160

tgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaacattgccttt2220

tcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatcggagaagtt2280

ggtcttagcaacaggactaaggaatgttcccggcggaggatggcaaggaatggttgatgg2340

ttggtatggataccatcacagcaatgaccagggatcagggtatgcagcagacaaagaatc2400

cactcaaaaggcatttgatggaatcaccaacaaggtaaattctgtgattgaaaagatgaa2460

cacccaatttgaagctgttgggaaagagttcagtaacttagagagaagactggagaactt2520

gaacaaaaagatggaagacgggtttctagatgtgtggacatacaatgctgagcttctagt2580

tctgatggaaaatgagaggacacttgactttcatgattctaatgtcaagaatctgtatga2640

taaagtcagaatgcagctgagagacaacgtcaaagaactaggaaatggatgttttgaatt2700

ttatcacaaatgtgatgatgaatgcatgaatagtgtgaaaaacgggacgtatgattatcc2760

caagtatgaagaagagtctaaactaaatagaaatgaaatcaaaggggtaaaattgagcag2820

catgggggtttatcaaatccttgccatttatgctacagtagcaggttctctgtcactggc2880

aatcatgatggctgggatctctttctggatgtgctccaacgggtctctgcagtgcaggat2940

ctgcatatgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttcta3000

tgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttcttt3060

gtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttat3120

taaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgt3180

tcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatt3240

atcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacg3300

ttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgata3360

gaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgtta3420

ctagat3426

<210>134

<211>556

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h2新加坡的氨基酸序列

<400>134

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspglnilecysileglytyrhis

202530

alaasnasnserthrglulysvalaspthrileleugluargasnval

354045

thrvalthrhisalalysaspileleuglulysthrhisasnglylys

505560

leucyslysleuasnglyileproproleugluleuglyaspcysser

65707580

ilealaglytrpleuleuglyasnproglucysaspargleuleuser

859095

valproglutrpsertyrilemetglulysgluasnproargaspgly

100105110

leucystyrproglyserpheasnasptyrglugluleulyshisleu

115120125

leuserservallyshispheglulysvallysileleuprolysasp

130135140

argtrpthrglnhisthrthrthrglyglyserargalacysalaval

145150155160

serglyasnproserphepheargasnmetvaltrpleuthrlyslys

165170175

gluserasntyrprovalalalysglysertyrasnasnthrsergly

180185190

gluglnmetleuileiletrpglyvalhishisproasnaspgluthr

195200205

gluglnargthrleutyrglnasnvalglythrtyrvalservalgly

210215220

thrserthrleuasnlysargserthrproaspilealathrargpro

225230235240

lysvalasnglyleuglyserargmetgluphesertrpthrleuleu

245250255

aspmettrpaspthrileasnphegluserthrglyasnleuileala

260265270

proglutyrglyphelysileserlysargglyserserglyilemet

275280285

lysthrgluglythrleugluasncysgluthrlyscysglnthrpro

290295300

leuglyalaileasnthrthrleuprophehisasnvalhisproleu

305310315320

thrileglyglucysprolystyrvallysserglulysleuvalleu

325330335

alathrglyleuargasnvalproglyglyglytrpglnglymetval

340345350

aspglytrptyrglytyrhishisserasnaspglnglyserglytyr

355360365

alaalaasplysgluserthrglnlysalapheaspglyilethrasn

370375380

lysvalasnservalileglulysmetasnthrglnpheglualaval

385390395400

glylysglupheserasnleugluargargleugluasnleuasnlys

405410415

lysmetgluaspglypheleuaspvaltrpthrtyrasnalagluleu

420425430

leuvalleumetgluasngluargthrleuaspphehisaspserasn

435440445

vallysasnleutyrasplysvalargmetglnleuargaspasnval

450455460

lysgluleuglyasnglycysphegluphetyrhislyscysaspasp

465470475480

glucysmetasnservallysasnglythrtyrasptyrprolystyr

485490495

gluglugluserlysleuasnargasngluilelysglyvallysleu

500505510

sersermetglyvaltyrglnileleualailetyralathrvalala

515520525

glyserleuserleualailemetmetalaglyileserphetrpmet

530535540

cysserasnglyserleuglncysargilecysile

545550555

<210>135

<211>3120

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2222

<400>135

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttatt960

gttttctcttcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggata1020

ccatgccaataattccacagagaaggtcgacacaattctagagcggaacgtcactgtgac1080

tcatgccaaggacattcttgagaagacccataacggaaagttatgcaaactaaacggaat1140

ccctccacttgaactaggggactgtagcattgccggatggctccttggaaatccagaatg1200

tgataggcttctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagaga1260

cggtttgtgttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcag1320

cgtgaaacatttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaac1380

aactggaggttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggt1440

ctggctgacaaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaag1500

cggagaacaaatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaag1560

aacattgtaccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaag1620

gtcaaccccagacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagtt1680

ctcttggaccctattggatatgtgggacaccataaattttgagagtactggtaatctaat1740

tgcaccagagtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacaga1800

aggaacacttgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaac1860

attgccttttcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatc1920

ggagaagttggtcttagcaacaggactaaggaatgttccccagattgaatcaagaggatt1980

gtttggggcaatagctggttttatagaaggaggatggcaaggaatggttgatggttggta2040

tggataccatcacagcaatgaccagggatcagggtatgcagcagacaaagaatccactca2100

aaaggcatttgatggaatcaccaacaaggtaaattctgtgattgaaaagatgaacaccca2160

atttgaagctgttgggaaagagttcagtaacttagagagaagactggagaacttgaacaa2220

aaagatggaagacgggtttctagatgtgtggacatacaatgctgagcttctagttctgat2280

ggaaaatgagaggacacttgactttcatgattctaatgtcaagaatctgtatgataaagt2340

cagaatgcagctgagagacaacgtcaaagaactaggaaatggatgttttgaattttatca2400

caaatgtgatgatgaatgcatgaatagtgtgaaaaacgggacgtatgattatcccaagta2460

tgaagaagagtctaaactaaatagaaatgaaatcaaaggggtaaaattgagcagcatggg2520

ggtttatcaaatccttgccatttatgctacagtagcaggttctctgtcactggcaatcat2580

gatggctgggatctctttctggatgtgctccaacgggtctctgcagtgcaggatctgcat2640

atgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttg2700

gtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagc2760

tcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaa2820

aaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaac2880

atttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcata2940

taatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttattt3000

atgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaac3060

aaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3120

<210>136

<211>3075

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2223

<400>136

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttatt960

gttttctcttcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggata1020

ccatgccaataattccacagagaaggtcgacacaattctagagcggaacgtcactgtgac1080

tcatgccaaggacattcttgagaagacccataacggaaagttatgcaaactaaacggaat1140

ccctccacttgaactaggggactgtagcattgccggatggctccttggaaatccagaatg1200

tgataggcttctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagaga1260

cggtttgtgttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcag1320

cgtgaaacatttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaac1380

aactggaggttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggt1440

ctggctgacaaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaag1500

cggagaacaaatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaag1560

aacattgtaccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaag1620

gtcaaccccagacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagtt1680

ctcttggaccctattggatatgtgggacaccataaattttgagagtactggtaatctaat1740

tgcaccagagtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacaga1800

aggaacacttgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaac1860

attgccttttcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatc1920

ggagaagttggtcttagcaacaggactaaggaatgttcccggcggaggatggcaaggaat1980

ggttgatggttggtatggataccatcacagcaatgaccagggatcagggtatgcagcaga2040

caaagaatccactcaaaaggcatttgatggaatcaccaacaaggtaaattctgtgattga2100

aaagatgaacacccaatttgaagctgttgggaaagagttcagtaacttagagagaagact2160

ggagaacttgaacaaaaagatggaagacgggtttctagatgtgtggacatacaatgctga2220

gcttctagttctgatggaaaatgagaggacacttgactttcatgattctaatgtcaagaa2280

tctgtatgataaagtcagaatgcagctgagagacaacgtcaaagaactaggaaatggatg2340

ttttgaattttatcacaaatgtgatgatgaatgcatgaatagtgtgaaaaacgggacgta2400

tgattatcccaagtatgaagaagagtctaaactaaatagaaatgaaatcaaaggggtaaa2460

attgagcagcatgggggtttatcaaatccttgccatttatgctacagtagcaggttctct2520

gtcactggcaatcatgatggctgggatctctttctggatgtgctccaacgggtctctgca2580

gtgcaggatctgcatatgaaggcctattttctttagtttgaatttactgttattcggtgt2640

gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt2700

aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt2760

taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct2820

gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt2880

gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa2940

tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3000

tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3060

tctatgttactagat3075

<210>137

<211>1725

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h3珀斯的核苷酸序列

<400>137

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcgcaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120

caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180

actaatgctactgagctggttcagagttcctcaacaggtgaaatatgcgacagtcctcat240

cagatccttgatggaaaaaactgcacactaatagatgctctattgggagaccctcagtgt300

gatggcttccaaaataagaaatgggacctttttgttgaacgcagcaaagcctacagcaac360

tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420

acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagc480

tctgcttgcataaggagatctaaaaacagtttctttagtagattgaattggttgacccac540

ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600

ttgtacatttggggggttcaccacccgggtacggacaaagaccaaatcttcctgtatgct660

caagcatcaggaagaatcacagtctctaccaaaagaagccaacaaaccgtaagcccgaat720

atcggatctagacccagagtaaggaatatccctagcagaataagcatctattggacaata780

gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840

tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900

tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960

gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaaacactctgaaattg1020

gcaacagggatgcgaaatgtaccagagaaacaaactagaggcatatttggcgcaatcgcg1080

ggtttcatagaaaatggttgggagggaatggtggatggttggtacggtttcaggcatcaa1140

aattctgagggaagaggacaagcagcagatctcaaaagcactcaagcagcaatcgatcaa1200

atcaatgggaagctgaatagattgatcgggaaaaccaacgagaaattccatcagattgaa1260

aaagaattctcagaagtcgaagggagaattcaggaccttgagaaatatgttgaggacact1320

aaaatagatctctggtcatacaacgcggagcttcttgttgccctggagaaccaacataca1380

attgatctaactgactcagaaatgaacaaactgtttgaaaaaacaaagaagcaactgagg1440

gaaaatgctgaggatatgggcaatggttgtttcaaaatataccacaaatgtgacaatgcc1500

tgcataggatcaatcagaaatggaacttatgaccacgatgtatacagagatgaagcatta1560

aacaaccggtttcagatcaagggagttgagctgaagtcagggtacaaagattggatccta1620

tggatttcctttgccatatcatgttttttgctttgtgttgctttgttggggttcatcatg1680

tgggcctgccaaaaaggcaacattaggtgcaacatttgcatttga1725

<210>138

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if**-h3p1609.s1-6r

<400>138

actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgcctt50

<210>139

<211>574

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h3珀斯的氨基酸序列

<400>139

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaglnlysleuproglyasnaspasn

202530

serthralathrleucysleuglyhishisalavalproasnglythr

354045

ilevallysthrilethrasnaspglnilegluvalthrasnalathr

505560

gluleuvalglnserserserthrglygluilecysaspserprohis

65707580

glnileleuaspglylysasncysthrleuileaspalaleuleugly

859095

aspproglncysaspglypheglnasnlyslystrpaspleupheval

100105110

gluargserlysalatyrserasncystyrprotyraspvalproasp

115120125

tyralaserleuargserleuvalalaserserglythrleugluphe

130135140

asnasngluserpheasntrpthrglyvalthrglnasnglythrser

145150155160

seralacysileargargserlysasnserphepheserargleuasn

165170175

trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet

180185190

proasnasngluglnpheasplysleutyriletrpglyvalhishis

195200205

proglythrasplysaspglnilepheleutyralaglnalasergly

210215220

argilethrvalserthrlysargserglnglnthrvalserproasn

225230235240

ileglyserargproargvalargasnileproserargileserile

245250255

tyrtrpthrilevallysproglyaspileleuleuileasnserthr

260265270

glyasnleuilealaproargglytyrphelysileargserglylys

275280285

serserilemetargseraspalaproileglylyscysasnserglu

290295300

cysilethrproasnglyserileproasnasplyspropheglnasn

305310315320

valasnargilethrtyrglyalacysproargtyrvallysglnasn

325330335

thrleulysleualathrglymetargasnvalproglulysglnthr

340345350

argglyilepheglyalailealaglypheilegluasnglytrpglu

355360365

glymetvalaspglytrptyrglyphearghisglnasnserglugly

370375380

argglyglnalaalaaspleulysserthrglnalaalaileaspgln

385390395400

ileasnglylysleuasnargleuileglylysthrasnglulysphe

405410415

hisglnileglulysgluphesergluvalgluglyargileglnasp

420425430

leuglulystyrvalgluaspthrlysileaspleutrpsertyrasn

435440445

alagluleuleuvalalaleugluasnglnhisthrileaspleuthr

450455460

aspserglumetasnlysleupheglulysthrlyslysglnleuarg

465470475480

gluasnalagluaspmetglyasnglycysphelysiletyrhislys

485490495

cysaspasnalacysileglyserileargasnglythrtyrasphis

500505510

aspvaltyrargaspglualaleuasnasnargpheglnilelysgly

515520525

valgluleulysserglytyrlysasptrpileleutrpileserphe

530535540

alailesercyspheleuleucysvalalaleuleuglypheilemet

545550555560

trpalacysglnlysglyasnileargcysasnilecysile

565570

<210>140

<211>1680

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h3珀斯的核苷酸序列

<400>140

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcgcaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120

caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180

actaatgctactgagctggttcagagttcctcaacaggtgaaatatgcgacagtcctcat240

cagatccttgatggaaaaaactgcacactaatagatgctctattgggagaccctcagtgt300

gatggcttccaaaataagaaatgggacctttttgttgaacgcagcaaagcctacagcaac360

tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420

acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagc480

tctgcttgcataaggagatctaaaaacagtttctttagtagattgaattggttgacccac540

ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600

ttgtacatttggggggttcaccacccgggtacggacaaagaccaaatcttcctgtatgct660

caagcatcaggaagaatcacagtctctaccaaaagaagccaacaaaccgtaagcccgaat720

atcggatctagacccagagtaaggaatatccctagcagaataagcatctattggacaata780

gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840

tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900

tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960

gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaaacactctgaaattg1020

gcaacagggatgcgaaatgtaccaggcggaggttgggagggaatggtggatggttggtac1080

ggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcactcaa1140

gcagcaatcgatcaaatcaatgggaagctgaatagattgatcgggaaaaccaacgagaaa1200

ttccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttgagaaa1260

tatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgccctg1320

gagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaaaaca1380

aagaagcaactgagggaaaatgctgaggatatgggcaatggttgtttcaaaatataccac1440

aaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgtatac1500

agagatgaagcattaaacaaccggtttcagatcaagggagttgagctgaagtcagggtac1560

aaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgctttg1620

ttggggttcatcatgtgggcctgccaaaaaggcaacattaggtgcaacatttgcatttga1680

<210>141

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h3p1609(prl-)#2.r

<400>141

ccctcccaacctccgcctggtacatttcgcatccctgttgccaatttc48

<210>142

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h3p1609(prl-)#2.c

<400>142

aatgtaccaggcggaggttgggagggaatggtggatggttggtacggt48

<210>143

<211>559

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h3珀斯的氨基酸序列

<400>143

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaglnlysleuproglyasnaspasn

202530

serthralathrleucysleuglyhishisalavalproasnglythr

354045

ilevallysthrilethrasnaspglnilegluvalthrasnalathr

505560

gluleuvalglnserserserthrglygluilecysaspserprohis

65707580

glnileleuaspglylysasncysthrleuileaspalaleuleugly

859095

aspproglncysaspglypheglnasnlyslystrpaspleupheval

100105110

gluargserlysalatyrserasncystyrprotyraspvalproasp

115120125

tyralaserleuargserleuvalalaserserglythrleugluphe

130135140

asnasngluserpheasntrpthrglyvalthrglnasnglythrser

145150155160

seralacysileargargserlysasnserphepheserargleuasn

165170175

trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet

180185190

proasnasngluglnpheasplysleutyriletrpglyvalhishis

195200205

proglythrasplysaspglnilepheleutyralaglnalasergly

210215220

argilethrvalserthrlysargserglnglnthrvalserproasn

225230235240

ileglyserargproargvalargasnileproserargileserile

245250255

tyrtrpthrilevallysproglyaspileleuleuileasnserthr

260265270

glyasnleuilealaproargglytyrphelysileargserglylys

275280285

serserilemetargseraspalaproileglylyscysasnserglu

290295300

cysilethrproasnglyserileproasnasplyspropheglnasn

305310315320

valasnargilethrtyrglyalacysproargtyrvallysglnasn

325330335

thrleulysleualathrglymetargasnvalproglyglyglytrp

340345350

gluglymetvalaspglytrptyrglyphearghisglnasnserglu

355360365

glyargglyglnalaalaaspleulysserthrglnalaalaileasp

370375380

glnileasnglylysleuasnargleuileglylysthrasnglulys

385390395400

phehisglnileglulysgluphesergluvalgluglyargilegln

405410415

aspleuglulystyrvalgluaspthrlysileaspleutrpsertyr

420425430

asnalagluleuleuvalalaleugluasnglnhisthrileaspleu

435440445

thraspserglumetasnlysleupheglulysthrlyslysglnleu

450455460

arggluasnalagluaspmetglyasnglycysphelysiletyrhis

465470475480

lyscysaspasnalacysileglyserileargasnglythrtyrasp

485490495

hisaspvaltyrargaspglualaleuasnasnargpheglnilelys

500505510

glyvalgluleulysserglytyrlysasptrpileleutrpileser

515520525

phealailesercyspheleuleucysvalalaleuleuglypheile

530535540

mettrpalacysglnlysglyasnileargcysasnilecysile

545550555

<210>144

<211>1680

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h3维多利亚的核苷酸序列

<400>144

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcgcaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120

caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180

actaatgctactgagctggttcagaattcctcaataggtgaaatatgcgacagtcctcat240

cagatccttgatggagaaaactgcacactaatagatgctctattgggagaccctcagtgt300

gatggcttccaaaataagaaatgggacctttttgttgaacgaagcaaagcctacagcaac360

tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420

acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagt480

tctgcttgcataaggagatctaataatagtttctttagtagattaaattggttgacccac540

ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600

ttgtacatttggggggttcaccacccgggtacggacaaggaccaaatcttcctgtatgct660

caatcatcaggaagaatcacagtatctaccaaaagaagccaacaagctgtaatcccgaat720

atcggatctagacccagaataaggaatatccctagcagaataagcatctattggacaata780

gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840

tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900

tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960

gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaagcactctgaaattg1020

gcaacaggaatgcgaaatgtaccaggcggaggttgggagggaatggtggatggttggtac1080

ggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcactcaa1140

gcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaaaaccaacgagaaa1200

ttccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttgagaaa1260

tatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgccctg1320

gagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaaaaca1380

aagaagcaactaagggaaaatgctgaggatatgggcaatggttgtttcaaaatataccac1440

aaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgtatac1500

agagatgaagcattaaacaaccggttccagatcaagggagttgagctgaagtcagggtac1560

aaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgctttg1620

ttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaacatttgcatttga1680

<210>145

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h3v36111(prl-).r

<400>145

ccctcccaacctccgcctggtacatttcgcattcctgttgccaatttc48

<210>146

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h3v36111(prl-).c

<400>146

aatgtaccaggcggaggttgggagggaatggtggatggttggtacggt48

<210>147

<211>559

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h3维多利亚的氨基酸序列

<400>147

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaglnlysleuproglyasnaspasn

202530

serthralathrleucysleuglyhishisalavalproasnglythr

354045

ilevallysthrilethrasnaspglnilegluvalthrasnalathr

505560

gluleuvalglnasnserserileglygluilecysaspserprohis

65707580

glnileleuaspglygluasncysthrleuileaspalaleuleugly

859095

aspproglncysaspglypheglnasnlyslystrpaspleupheval

100105110

gluargserlysalatyrserasncystyrprotyraspvalproasp

115120125

tyralaserleuargserleuvalalaserserglythrleugluphe

130135140

asnasngluserpheasntrpthrglyvalthrglnasnglythrser

145150155160

seralacysileargargserasnasnserphepheserargleuasn

165170175

trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet

180185190

proasnasngluglnpheasplysleutyriletrpglyvalhishis

195200205

proglythrasplysaspglnilepheleutyralaglnsersergly

210215220

argilethrvalserthrlysargserglnglnalavalileproasn

225230235240

ileglyserargproargileargasnileproserargileserile

245250255

tyrtrpthrilevallysproglyaspileleuleuileasnserthr

260265270

glyasnleuilealaproargglytyrphelysileargserglylys

275280285

serserilemetargseraspalaproileglylyscysasnserglu

290295300

cysilethrproasnglyserileproasnasplyspropheglnasn

305310315320

valasnargilethrtyrglyalacysproargtyrvallysglnser

325330335

thrleulysleualathrglymetargasnvalproglyglyglytrp

340345350

gluglymetvalaspglytrptyrglyphearghisglnasnserglu

355360365

glyargglyglnalaalaaspleulysserthrglnalaalaileasp

370375380

glnileasnglylysleuasnargleuileglylysthrasnglulys

385390395400

phehisglnileglulysgluphesergluvalgluglyargilegln

405410415

aspleuglulystyrvalgluaspthrlysileaspleutrpsertyr

420425430

asnalagluleuleuvalalaleugluasnglnhisthrileaspleu

435440445

thraspserglumetasnlysleupheglulysthrlyslysglnleu

450455460

arggluasnalagluaspmetglyasnglycysphelysiletyrhis

465470475480

lyscysaspasnalacysileglyserileargasnglythrtyrasp

485490495

hisaspvaltyrargaspglualaleuasnasnargpheglnilelys

500505510

glyvalgluleulysserglytyrlysasptrpileleutrpileser

515520525

phealailesercyspheleuleucysvalalaleuleuglypheile

530535540

mettrpalacysglnlysglyasnileargcysasnilecysile

545550555

<210>148

<211>1701

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h7杭州的核苷酸序列

<400>148

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggacaaaatctgcctcggacatcatgccgtgtcaaacggaaccaaagta120

aacacattaactgaaagaggagtggaagtcgtcaatgcaactgaaacagtggaacgaaca180

aacatccccaggatctgctcaaaagggaaaaggacagttgacctcggtcaatgtggactc240

ctggggacaatcactggaccacctcaatgtgaccaattcctagaattttcagccgattta300

attattgagaggcgagaaggaagtgatgtctgttatcctgggaaattcgtgaatgaagaa360

gctctgaggcaaattctcagagaatcaggcggaattgacaaggaagcaatgggattcaca420

tacagtggaataagaactaatggagcaaccagtgcatgtaggagatcaggatcttcattc480

tatgcagaaatgaaatggctcctgtcaaacacagataatgctgcattcccgcagatgact540

aagtcatataaaaatacaagaaaaagcccagctctaatagtatgggggatccatcattcc600

gtatcaactgcagagcaaaccaagctatatgggagtggaaacaaactggtgacagttggg660

agttctaattatcaacaatcttttgtaccgagtccaggagcgagaccacaagttaatggt720

atatctggaagaattgactttcattggctaatgctaaatcccaatgatacagtcactttc780

agtttcaatggggctttcatagctccagaccgtgcaagcttcctgagaggaaaatctatg840

ggaatccagagtggagtacaggttgatgccaattgtgaaggggactgctatcatagtgga900

gggacaataataagtaacttgccatttcagaacatagatagcagggcagttggaaaatgt960

ccgagatatgttaagcaaaggagtctgctgctagcaacagggatgaagaatgttcctgag1020

attccaaagggaagaggcctatttggtgctatagcgggtttcattgaaaatggatgggaa1080

ggcctaattgatggttggtatggtttcagacaccagaatgcacagggagagggaactgct1140

gcagattacaaaagcactcaatcggcaattgatcaaataacaggaaaattaaaccggctt1200

atagaaaaaaccaaccaacaatttgagttgatcgacaatgaattcaatgaggtagagaag1260

caaatcggtaatgtgataaattggaccagagattctataacagaagtgtggtcatacaat1320

gctgaactcttggtagcaatggagaaccagcatacaattgatctggctgattcagaaatg1380

gacaaactgtacgaacgagtgaaaagacagctgagagagaatgctgaagaagatggcact1440

ggttgctttgaaatatttcacaagtgtgatgatgactgtatggccagtattagaaataac1500

acctatgatcacagcaaatacagggaagaggcaatgcaaaatagaatacagattgaccca1560

gtcaaactaagcagcggctacaaagatgtgatactttggtttagcttcggggcatcatgt1620

ttcatacttctagccattgtaatgggccttgtcttcatatgtgtaaagaatggaaacatg1680

cggtgcactatttgtatataa1701

<210>149

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if*-h7h113.s1-6r

<400>149

actaaagaaaataggcctttatatacaaatagtgcaccgcatgtttccat50

<210>150

<211>566

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h7杭州的氨基酸序列

<400>150

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaasplysilecysleuglyhishis

202530

alavalserasnglythrlysvalasnthrleuthrgluargglyval

354045

gluvalvalasnalathrgluthrvalgluargthrasnileproarg

505560

ilecysserlysglylysargthrvalaspleuglyglncysglyleu

65707580

leuglythrilethrglyproproglncysaspglnpheleugluphe

859095

seralaaspleuileilegluargarggluglyseraspvalcystyr

100105110

proglylysphevalasngluglualaleuargglnileleuargglu

115120125

serglyglyileasplysglualametglyphethrtyrserglyile

130135140

argthrasnglyalathrseralacysargargserglyserserphe

145150155160

tyralaglumetlystrpleuleuserasnthraspasnalaalaphe

165170175

proglnmetthrlyssertyrlysasnthrarglysserproalaleu

180185190

ilevaltrpglyilehishisservalserthralagluglnthrlys

195200205

leutyrglyserglyasnlysleuvalthrvalglyserserasntyr

210215220

glnglnserphevalproserproglyalaargproglnvalasngly

225230235240

ileserglyargileaspphehistrpleumetleuasnproasnasp

245250255

thrvalthrpheserpheasnglyalapheilealaproaspargala

260265270

serpheleuargglylyssermetglyileglnserglyvalglnval

275280285

aspalaasncysgluglyaspcystyrhisserglyglythrileile

290295300

serasnleupropheglnasnileaspserargalavalglylyscys

305310315320

proargtyrvallysglnargserleuleuleualathrglymetlys

325330335

asnvalprogluileprolysglyargglyleupheglyalaileala

340345350

glypheilegluasnglytrpgluglyleuileaspglytrptyrgly

355360365

phearghisglnasnalaglnglygluglythralaalaasptyrlys

370375380

serthrglnseralaileaspglnilethrglylysleuasnargleu

385390395400

ileglulysthrasnglnglnphegluleuileaspasnglupheasn

405410415

gluvalglulysglnileglyasnvalileasntrpthrargaspser

420425430

ilethrgluvaltrpsertyrasnalagluleuleuvalalametglu

435440445

asnglnhisthrileaspleualaaspserglumetasplysleutyr

450455460

gluargvallysargglnleuarggluasnalaglugluaspglythr

465470475480

glycysphegluilephehislyscysaspaspaspcysmetalaser

485490495

ileargasnasnthrtyrasphisserlystyrarggluglualamet

500505510

glnasnargileglnileaspprovallysleuserserglytyrlys

515520525

aspvalileleutrppheserpheglyalasercyspheileleuleu

530535540

alailevalmetglyleuvalpheilecysvallysasnglyasnmet

545550555560

argcysthrilecysile

565

<210>151

<211>1650

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h7杭州的核苷酸序列

<400>151

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggacaaaatctgcctcggacatcatgccgtgtcaaacggaaccaaagta120

aacacattaactgaaagaggagtggaagtcgtcaatgcaactgaaacagtggaacgaaca180

aacatccccaggatctgctcaaaagggaaaaggacagttgacctcggtcaatgtggactc240

ctggggacaatcactggaccacctcaatgtgaccaattcctagaattttcagccgattta300

attattgagaggcgagaaggaagtgatgtctgttatcctgggaaattcgtgaatgaagaa360

gctctgaggcaaattctcagagaatcaggcggaattgacaaggaagcaatgggattcaca420

tacagtggaataagaactaatggagcaaccagtgcatgtaggagatcaggatcttcattc480

tatgcagaaatgaaatggctcctgtcaaacacagataatgctgcattcccgcagatgact540

aagtcatataaaaatacaagaaaaagcccagctctaatagtatgggggatccatcattcc600

gtatcaactgcagagcaaaccaagctatatgggagtggaaacaaactggtgacagttggg660

agttctaattatcaacaatcttttgtaccgagtccaggagcgagaccacaagttaatggt720

atatctggaagaattgactttcattggctaatgctaaatcccaatgatacagtcactttc780

agtttcaatggggctttcatagctccagaccgtgcaagcttcctgagaggaaaatctatg840

ggaatccagagtggagtacaggttgatgccaattgtgaaggggactgctatcatagtgga900

gggacaataataagtaacttgccatttcagaacatagatagcagggcagttggaaaatgt960

ccgagatatgttaagcaaaggagtctgctgctagcaacagggatgaagaatgttcctggc1020

ggatgggaaggcctaattgatggttggtatggtttcagacaccagaatgcacagggagag1080

ggaactgctgcagattacaaaagcactcaatcggcaattgatcaaataacaggaaaatta1140

aaccggcttatagaaaaaaccaaccaacaatttgagttgatcgacaatgaattcaatgag1200

gtagagaagcaaatcggtaatgtgataaattggaccagagattctataacagaagtgtgg1260

tcatacaatgctgaactcttggtagcaatggagaaccagcatacaattgatctggctgat1320

tcagaaatggacaaactgtacgaacgagtgaaaagacagctgagagagaatgctgaagaa1380

gatggcactggttgctttgaaatatttcacaagtgtgatgatgactgtatggccagtatt1440

agaaataacacctatgatcacagcaaatacagggaagaggcaatgcaaaatagaatacag1500

attgacccagtcaaactaagcagcggctacaaagatgtgatactttggtttagcttcggg1560

gcatcatgtttcatacttctagccattgtaatgggccttgtcttcatatgtgtaaagaat1620

ggaaacatgcggtgcactatttgtatataa1650

<210>152

<211>49

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h7h113(prl-).r

<400>152

ccttcccatccgccaggaacattcttcatccctgttgctagcagcagac49

<210>153

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h7h113(prl-).c

<400>153

agaatgttcctggcggatgggaaggcctaattgatggttggtatggtt48

<210>154

<211>549

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h7杭州的的氨基酸序列

<400>154

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaasplysilecysleuglyhishis

202530

alavalserasnglythrlysvalasnthrleuthrgluargglyval

354045

gluvalvalasnalathrgluthrvalgluargthrasnileproarg

505560

ilecysserlysglylysargthrvalaspleuglyglncysglyleu

65707580

leuglythrilethrglyproproglncysaspglnpheleugluphe

859095

seralaaspleuileilegluargarggluglyseraspvalcystyr

100105110

proglylysphevalasngluglualaleuargglnileleuargglu

115120125

serglyglyileasplysglualametglyphethrtyrserglyile

130135140

argthrasnglyalathrseralacysargargserglyserserphe

145150155160

tyralaglumetlystrpleuleuserasnthraspasnalaalaphe

165170175

proglnmetthrlyssertyrlysasnthrarglysserproalaleu

180185190

ilevaltrpglyilehishisservalserthralagluglnthrlys

195200205

leutyrglyserglyasnlysleuvalthrvalglyserserasntyr

210215220

glnglnserphevalproserproglyalaargproglnvalasngly

225230235240

ileserglyargileaspphehistrpleumetleuasnproasnasp

245250255

thrvalthrpheserpheasnglyalapheilealaproaspargala

260265270

serpheleuargglylyssermetglyileglnserglyvalglnval

275280285

aspalaasncysgluglyaspcystyrhisserglyglythrileile

290295300

serasnleupropheglnasnileaspserargalavalglylyscys

305310315320

proargtyrvallysglnargserleuleuleualathrglymetlys

325330335

asnvalproglyglytrpgluglyleuileaspglytrptyrglyphe

340345350

arghisglnasnalaglnglygluglythralaalaasptyrlysser

355360365

thrglnseralaileaspglnilethrglylysleuasnargleuile

370375380

glulysthrasnglnglnphegluleuileaspasnglupheasnglu

385390395400

valglulysglnileglyasnvalileasntrpthrargaspserile

405410415

thrgluvaltrpsertyrasnalagluleuleuvalalametgluasn

420425430

glnhisthrileaspleualaaspserglumetasplysleutyrglu

435440445

argvallysargglnleuarggluasnalaglugluaspglythrgly

450455460

cysphegluilephehislyscysaspaspaspcysmetalaserile

465470475480

argasnasnthrtyrasphisserlystyrarggluglualametgln

485490495

asnargileglnileaspprovallysleuserserglytyrlysasp

500505510

valileleutrppheserpheglyalasercyspheileleuleuala

515520525

ilevalmetglyleuvalpheilecysvallysasnglyasnmetarg

530535540

cysthrilecysile

545

<210>155

<211>1701

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h9杭州的核苷酸序列

<400>155

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggataaaatctgcatcggccaccagtcaacaaactccacagaaactgtg120

gacacgctaacagaaaccaatgttcctgtgacacatgccaaagaattgctccacacagag180

cataatggaatgctgtgtgcaacaagcctgggacatcccctcattctagacacatgcact240

attgaaggactagtctatggcaacccttcttgtgacctgctgttgggaggaagagaatgg300

tcctacatcgtcgaaagatcatcagctgtaaatggaacgtgttaccctgggaatgtagaa360

aacctagaggaactcaggacactttttagttccgctagttcctaccaaagaatccaaatc420

ttcccagacacaacctggaatgtgacttacactggaacaagcagagcatgttcaggttca480

ttctacaggagtatgagatggctgactcaaaagagcggtttttaccctgttcaagacgcc540

caatacacaaataacaggggaaagagcattcttttcgtgtggggcatacatcacccaccc600

acctataccgagcaaacaaatttgtacataagaaacgacacaacaacaagcgtgacaaca660

gaagatttgaataggaccttcaaaccagtgatagggccaaggccccttgtcaatggtctg720

cagggaagaattgattattattggtcggtactaaaaccaggccaaacattgcgagtacga780

tccaatgggaatctaattgctccatggtatggacacgttctttcaggagggagccatgga840

agaatcctgaagactgatttaaaaggtggtaattgtgtagtgcaatgtcagactgaaaaa900

ggtggcttaaacagtacattgccattccacaatatcagtaaatatgcatttggaacctgc960

cccaaatatgtaagagttaatagtctcaaactggcagtcggtctgaggaacgtgcctgct1020

agatcaagtagaggactatttggagccatagctggattcatagaaggaggttggccagga1080

ctagtcgctggctggtatggtttccagcattcaaatgatcaaggggttggtatggctgca1140

gatagggattcaactcaaaaggcaattgataaaataacatccaaggtgaataatatagtc1200

gacaagatgaacaagcaatatgaaataattgatcatgaatttagtgaggttgaaactaga1260

ctcaatatgatcaataataagattgatgaccaaatacaagacgtatgggcatataatgca1320

gaattgctagtactacttgaaaatcaaaaaacactcgatgagcatgatgcgaacgtgaac1380

aatctatataacaaggtgaagagggcactgggctccaatgctatggaagatgggaaaggc1440

tgtttcgagctataccataaatgtgatgatcagtgcatggaaacaattcggaacgggacc1500

tataataggagaaagtatagagaggaatcaagactagaaaggcagaaaatagagggggtt1560

aagctggaatctgagggaacttacaaaatcctcaccatttattcgactgtcgcctcatct1620

cttgtgcttgcaatggggtttgctgccttcctgttctgggccatgtccaatggatcttgc1680

agatgcaacatttgtatataa1701

<210>156

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if**-h9hk107399.s1-6r

<400>156

actaaagaaaataggcctttatatacaaatgttgcatctgcaagatccat50

<210>157

<211>566

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/h9杭州的氨基酸序列

<400>157

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaasplysilecysileglyhisgln

202530

serthrasnserthrgluthrvalaspthrleuthrgluthrasnval

354045

provalthrhisalalysgluleuleuhisthrgluhisasnglymet

505560

leucysalathrserleuglyhisproleuileleuaspthrcysthr

65707580

ilegluglyleuvaltyrglyasnprosercysaspleuleuleugly

859095

glyargglutrpsertyrilevalgluargserseralavalasngly

100105110

thrcystyrproglyasnvalgluasnleuglugluleuargthrleu

115120125

pheserseralasersertyrglnargileglnilepheproaspthr

130135140

thrtrpasnvalthrtyrthrglythrserargalacysserglyser

145150155160

phetyrargsermetargtrpleuthrglnlysserglyphetyrpro

165170175

valglnaspalaglntyrthrasnasnargglylysserileleuphe

180185190

valtrpglyilehishisproprothrtyrthrgluglnthrasnleu

195200205

tyrileargasnaspthrthrthrservalthrthrgluaspleuasn

210215220

argthrphelysprovalileglyproargproleuvalasnglyleu

225230235240

glnglyargileasptyrtyrtrpservalleulysproglyglnthr

245250255

leuargvalargserasnglyasnleuilealaprotrptyrglyhis

260265270

valleuserglyglyserhisglyargileleulysthraspleulys

275280285

glyglyasncysvalvalglncysglnthrglulysglyglyleuasn

290295300

serthrleuprophehisasnileserlystyralapheglythrcys

305310315320

prolystyrvalargvalasnserleulysleualavalglyleuarg

325330335

asnvalproalaargserserargglyleupheglyalailealagly

340345350

pheilegluglyglytrpproglyleuvalalaglytrptyrglyphe

355360365

glnhisserasnaspglnglyvalglymetalaalaaspargaspser

370375380

thrglnlysalaileasplysilethrserlysvalasnasnileval

385390395400

asplysmetasnlysglntyrgluileileasphisglupheserglu

405410415

valgluthrargleuasnmetileasnasnlysileaspaspglnile

420425430

glnaspvaltrpalatyrasnalagluleuleuvalleuleugluasn

435440445

glnlysthrleuaspgluhisaspalaasnvalasnasnleutyrasn

450455460

lysvallysargalaleuglyserasnalametgluaspglylysgly

465470475480

cysphegluleutyrhislyscysaspaspglncysmetgluthrile

485490495

argasnglythrtyrasnargarglystyrargglugluserargleu

500505510

gluargglnlysilegluglyvallysleuglusergluglythrtyr

515520525

lysileleuthriletyrserthrvalalaserserleuvalleuala

530535540

metglyphealaalapheleuphetrpalametserasnglysercys

545550555560

argcysasnilecysile

565

<210>158

<211>1656

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h9杭州的核苷酸序列

<400>158

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggataaaatctgcatcggccaccagtcaacaaactccacagaaactgtg120

gacacgctaacagaaaccaatgttcctgtgacacatgccaaagaattgctccacacagag180

cataatggaatgctgtgtgcaacaagcctgggacatcccctcattctagacacatgcact240

attgaaggactagtctatggcaacccttcttgtgacctgctgttgggaggaagagaatgg300

tcctacatcgtcgaaagatcatcagctgtaaatggaacgtgttaccctgggaatgtagaa360

aacctagaggaactcaggacactttttagttccgctagttcctaccaaagaatccaaatc420

ttcccagacacaacctggaatgtgacttacactggaacaagcagagcatgttcaggttca480

ttctacaggagtatgagatggctgactcaaaagagcggtttttaccctgttcaagacgcc540

caatacacaaataacaggggaaagagcattcttttcgtgtggggcatacatcacccaccc600

acctataccgagcaaacaaatttgtacataagaaacgacacaacaacaagcgtgacaaca660

gaagatttgaataggaccttcaaaccagtgatagggccaaggccccttgtcaatggtctg720

cagggaagaattgattattattggtcggtactaaaaccaggccaaacattgcgagtacga780

tccaatgggaatctaattgctccatggtatggacacgttctttcaggagggagccatgga840

agaatcctgaagactgatttaaaaggtggtaattgtgtagtgcaatgtcagactgaaaaa900

ggtggcttaaacagtacattgccattccacaatatcagtaaatatgcatttggaacctgc960

cccaaatatgtaagagttaatagtctcaaactggcagtcggtctgaggaacgtgcctggc1020

ggaggttggccaggactagtcgctggctggtatggtttccagcattcaaatgatcaaggg1080

gttggtatggctgcagatagggattcaactcaaaaggcaattgataaaataacatccaag1140

gtgaataatatagtcgacaagatgaacaagcaatatgaaataattgatcatgaatttagt1200

gaggttgaaactagactcaatatgatcaataataagattgatgaccaaatacaagacgta1260

tgggcatataatgcagaattgctagtactacttgaaaatcaaaaaacactcgatgagcat1320

gatgcgaacgtgaacaatctatataacaaggtgaagagggcactgggctccaatgctatg1380

gaagatgggaaaggctgtttcgagctataccataaatgtgatgatcagtgcatggaaaca1440

attcggaacgggacctataataggagaaagtatagagaggaatcaagactagaaaggcag1500

aaaatagagggggttaagctggaatctgagggaacttacaaaatcctcaccatttattcg1560

actgtcgcctcatctcttgtgcttgcaatggggtttgctgccttcctgttctgggccatg1620

tccaatggatcttgcagatgcaacatttgtatataa1656

<210>159

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h9hk107399(prl-).r

<400>159

gtcctggccaacctccgccaggcacgttcctcagaccgactgccagtt48

<210>160

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>h9hk107399(prl-).c

<400>160

ggaacgtgcctggcggaggttggccaggactagtcgctggctggtatg48

<210>161

<211>551

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/h9杭州的氨基酸序列

<400>161

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaasplysilecysileglyhisgln

202530

serthrasnserthrgluthrvalaspthrleuthrgluthrasnval

354045

provalthrhisalalysgluleuleuhisthrgluhisasnglymet

505560

leucysalathrserleuglyhisproleuileleuaspthrcysthr

65707580

ilegluglyleuvaltyrglyasnprosercysaspleuleuleugly

859095

glyargglutrpsertyrilevalgluargserseralavalasngly

100105110

thrcystyrproglyasnvalgluasnleuglugluleuargthrleu

115120125

pheserseralasersertyrglnargileglnilepheproaspthr

130135140

thrtrpasnvalthrtyrthrglythrserargalacysserglyser

145150155160

phetyrargsermetargtrpleuthrglnlysserglyphetyrpro

165170175

valglnaspalaglntyrthrasnasnargglylysserileleuphe

180185190

valtrpglyilehishisproprothrtyrthrgluglnthrasnleu

195200205

tyrileargasnaspthrthrthrservalthrthrgluaspleuasn

210215220

argthrphelysprovalileglyproargproleuvalasnglyleu

225230235240

glnglyargileasptyrtyrtrpservalleulysproglyglnthr

245250255

leuargvalargserasnglyasnleuilealaprotrptyrglyhis

260265270

valleuserglyglyserhisglyargileleulysthraspleulys

275280285

glyglyasncysvalvalglncysglnthrglulysglyglyleuasn

290295300

serthrleuprophehisasnileserlystyralapheglythrcys

305310315320

prolystyrvalargvalasnserleulysleualavalglyleuarg

325330335

asnvalproglyglyglytrpproglyleuvalalaglytrptyrgly

340345350

pheglnhisserasnaspglnglyvalglymetalaalaaspargasp

355360365

serthrglnlysalaileasplysilethrserlysvalasnasnile

370375380

valasplysmetasnlysglntyrgluileileasphisglupheser

385390395400

gluvalgluthrargleuasnmetileasnasnlysileaspaspgln

405410415

ileglnaspvaltrpalatyrasnalagluleuleuvalleuleuglu

420425430

asnglnlysthrleuaspgluhisaspalaasnvalasnasnleutyr

435440445

asnlysvallysargalaleuglyserasnalametgluaspglylys

450455460

glycysphegluleutyrhislyscysaspaspglncysmetgluthr

465470475480

ileargasnglythrtyrasnargarglystyrargglugluserarg

485490495

leugluargglnlysilegluglyvallysleuglusergluglythr

500505510

tyrlysileleuthriletyrserthrvalalaserserleuvalleu

515520525

alametglyphealaalapheleuphetrpalametserasnglyser

530535540

cysargcysasnilecysile

545550

<210>162

<211>1785

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马来西亚的核苷酸序列

<400>162

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggatcgaatctgcactgggataacatcgtcaaactcaccacatgttgtc120

aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180

accaaatctcattttgcaaatctcaaaggaacagaaaccagagggaaactatgcccaaaa240

tgcctcaactgcacagatctggacgtggccttgggcagaccaaaatgcacggggaacata300

ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360

ataatgcacgacagaacaaaaattagacagctgcctaaacttctcagaggatacgaacat420

atcaggttatcaactcataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480

attggaacctcagggtcttgccctaacgttaccaatggaaacggatttttcgcaacaatg540

gcttgggccgtcccaaaaaacgacaacaacaaaacagcaacaaattcattaacaatagaa600

gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgat660

aacgaaacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720

gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780

gacggaggactaccacaaagcggtagaattgttgttgattacatggtgcaaaaatctggg840

aaaacaggaacaattacctatcaaagaggtattttattgcctcaaaaagtgtggtgcgca900

agtggcaggagcaaggtaataaaaggatcgttgcctttaattggagaagcagattgcctc960

cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020

gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080

tatagacctcctgcaaaactattaaaggaaaggggtttcttcggagctattgctggtttc1140

ttagaaggaggatgggaaggaatgattgcaggttggcacggatacacatcccatggggca1200

catggagtagcggtggcagcagaccttaagagcactcaagaggccataaacaagataaca1260

aaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagactaagcggtgcc1320

atggatgaactccacaacgaaatactagaactagacgagaaagtggatgatctcagagct1380

gatacaataagctcacaaatagaactcgcagtcctgctttccaatgaaggaataataaac1440

agtgaagatgagcatctcttggcgcttgaaagaaagctgaagaaaatgctgggcccctct1500

gctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccagacctgtctc1560

gacagaatagctgctggtacctttgatgcaggagaattttctctccccacttttgattca1620

ctgaatattactgctgcatctttaaatgacgatggattggataatcatactatactgctt1680

tactactcaactgctgcctccagtttggctgtaacattgatgatagctatctttgttgtt1740

tatatggtctccagagacaatgtttcttgctccatctgtctataa1785

<210>163

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if**-hbm250604.s1-6r

<400>163

actaaagaaaataggcctttatagacagatggagcaagaaacattgtctc50

<210>164

<211>594

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马来西亚的氨基酸序列

<400>164

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglyasnileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuprolysleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnvalthrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnaspasnasnlysthr

180185190

alathrasnserleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproalalysleuleu

355360365

lysgluargglyphepheglyalailealaglypheleugluglygly

370375380

trpgluglymetilealaglytrphisglytyrthrserhisglyala

385390395400

hisglyvalalavalalaalaaspleulysserthrglnglualaile

405410415

asnlysilethrlysasnleuasnserleusergluleugluvallys

420425430

asnleuglnargleuserglyalametaspgluleuhisasngluile

435440445

leugluleuaspglulysvalaspaspleuargalaaspthrileser

450455460

serglnilegluleualavalleuleuserasngluglyileileasn

465470475480

sergluaspgluhisleuleualaleugluarglysleulyslysmet

485490495

leuglyproseralavalgluileglyasnglycysphegluthrlys

500505510

hislyscysasnglnthrcysleuaspargilealaalaglythrphe

515520525

aspalaglyglupheserleuprothrpheaspserleuasnilethr

530535540

alaalaserleuasnaspaspglyleuaspasnhisthrileleuleu

545550555560

tyrtyrserthralaalaserserleualavalthrleumetileala

565570575

ilephevalvaltyrmetvalserargaspasnvalsercysserile

580585590

cysleu

<210>165

<211>1734

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/hab马来西亚的核苷酸序列

<400>165

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggatcgaatctgcactgggataacatcgtcaaactcaccacatgttgtc120

aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180

accaaatctcattttgcaaatctcaaaggaacagaaaccagagggaaactatgcccaaaa240

tgcctcaactgcacagatctggacgtggccttgggcagaccaaaatgcacggggaacata300

ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360

ataatgcacgacagaacaaaaattagacagctgcctaaacttctcagaggatacgaacat420

atcaggttatcaactcataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480

attggaacctcagggtcttgccctaacgttaccaatggaaacggatttttcgcaacaatg540

gcttgggccgtcccaaaaaacgacaacaacaaaacagcaacaaattcattaacaatagaa600

gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgat660

aacgaaacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720

gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780

gacggaggactaccacaaagcggtagaattgttgttgattacatggtgcaaaaatctggg840

aaaacaggaacaattacctatcaaagaggtattttattgcctcaaaaagtgtggtgcgca900

agtggcaggagcaaggtaataaaaggatcgttgcctttaattggagaagcagattgcctc960

cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020

gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080

tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140

catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200

aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260

agcggtgccatggatgaactccacaacgaaatactagaactagacgagaaagtggatgat1320

ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380

ataataaacagtgaagatgagcatctcttggcgcttgaaagaaagctgaagaaaatgctg1440

ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500

acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccact1560

tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620

atactgctttactactcaactgctgcctccagtttggctgtaacattgatgatagctatc1680

tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734

<210>166

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hbm250604(prl-).r

<400>166

cattccttcccatcctccaccaggaggtctatatttggttccattggc48

<210>167

<211>48

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hbm250604(prl-).c

<400>167

agacctcctggtggaggatgggaaggaatgattgcaggttggcacgga48

<210>168

<211>577

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/hab马来西亚的氨基酸序列

<400>168

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlysserhis

505560

phealaasnleulysglythrgluthrargglylysleucysprolys

65707580

cysleuasncysthraspleuaspvalalaleuglyargprolyscys

859095

thrglyasnileproseralaargvalserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuprolysleuleuargglytyrgluhisileargleuser

130135140

thrhisasnvalileasnalagluasnalaproglyglyprotyrlys

145150155160

ileglythrserglysercysproasnvalthrasnglyasnglyphe

165170175

phealathrmetalatrpalavalprolysasnaspasnasnlysthr

180185190

alathrasnserleuthrilegluvalprotyrilecysthrglugly

195200205

gluaspglnilethrvaltrpglyphehisseraspasngluthrgln

210215220

metalalysleutyrglyaspserlysproglnlysphethrserser

225230235240

alaasnglyvalthrthrhistyrvalserglnileglyglyphepro

245250255

asnglnthrgluaspglyglyleuproglnserglyargilevalval

260265270

asptyrmetvalglnlysserglylysthrglythrilethrtyrgln

275280285

argglyileleuleuproglnlysvaltrpcysalaserglyargser

290295300

lysvalilelysglyserleuproleuileglyglualaaspcysleu

305310315320

hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly

325330335

gluhisalalysalaileglyasncysproiletrpvallysthrpro

340345350

leulysleualaasnglythrlystyrargproproglyglyglytrp

355360365

gluglymetilealaglytrphisglytyrthrserhisglyalahis

370375380

glyvalalavalalaalaaspleulysserthrglnglualaileasn

385390395400

lysilethrlysasnleuasnserleusergluleugluvallysasn

405410415

leuglnargleuserglyalametaspgluleuhisasngluileleu

420425430

gluleuaspglulysvalaspaspleuargalaaspthrileserser

435440445

glnilegluleualavalleuleuserasngluglyileileasnser

450455460

gluaspgluhisleuleualaleugluarglysleulyslysmetleu

465470475480

glyproseralavalgluileglyasnglycysphegluthrlyshis

485490495

lyscysasnglnthrcysleuaspargilealaalaglythrpheasp

500505510

alaglyglupheserleuprothrpheaspserleuasnilethrala

515520525

alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr

530535540

tyrserthralaalaserserleualavalthrleumetilealaile

545550555560

phevalvaltyrmetvalserargaspasnvalsercysserilecys

565570575

leu

<210>169

<211>1782

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州的核苷酸序列

<400>169

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120

aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240

tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300

ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360

ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420

atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600

ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080

agacctcctgcaaaactattaaaggaaaggggtttcttcggagctattgctggtttccta1140

gaaggaggatgggaaggaatgattgcaggttggcacggatacacatctcacggagcacat1200

ggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaagataacaaaa1260

aatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagtggtgccatg1320

gatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctcagagctgac1380

actataagttcacaaatagaacttgcagtcttgctttccaacgaaggaataataaacagt1440

gaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggtccctctgct1500

gtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacctgcttagac1560

aggatagctgctggcacctttaatgcaggagagttttctctccccacttttgattcattg1620

aacattactgctgcatctttaaatgatgatggattggataaccatactatactgctctat1680

tactcaactgctgcttctagtttggctgtaacattgatgctagctatttttattgtttat1740

atggtctccagagacaacgtttcatgctccatctgtctataa1782

<210>170

<211>593

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>pdisp/hab马萨诸塞州的氨基酸序列

<400>170

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrlysthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvalarg

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleualaasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysalagluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyglypheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproalalysleuleulys

355360365

gluargglyphepheglyalailealaglypheleugluglyglytrp

370375380

gluglymetilealaglytrphisglytyrthrserhisglyalahis

385390395400

glyvalalavalalaalaaspleulysserthrglnglualaileasn

405410415

lysilethrlysasnleuasnserleusergluleugluvallysasn

420425430

leuglnargleuserglyalametaspgluleuhisasngluileleu

435440445

gluleuaspglulysvalaspaspleuargalaaspthrileserser

450455460

glnilegluleualavalleuleuserasngluglyileileasnser

465470475480

gluaspgluhisleuleualaleugluarglysleulyslysmetleu

485490495

glyproseralavalaspileglyasnglycysphegluthrlyshis

500505510

lyscysasnglnthrcysleuaspargilealaalaglythrpheasn

515520525

alaglyglupheserleuprothrpheaspserleuasnilethrala

530535540

alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr

545550555560

tyrserthralaalaserserleualavalthrleumetleualaile

565570575

pheilevaltyrmetvalserargaspasnvalsercysserilecys

580585590

leu

<210>171

<211>63

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>马铃薯糖蛋白a信号肽的核苷酸序列

<400>171

atggcaactactaaaacttttttaattttattttttatgatattagcaactactagttca60

aca63

<210>172

<211>23

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>马铃薯糖蛋白a信号肽的氨基酸序列

<400>172

metalathrthrlysthrpheleuileleuphephemetileleuala

151015

thrthrserserthrcysala

20

<210>173

<211>517

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>cmpvht序列

<400>173

tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60

ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120

gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180

gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240

ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300

atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360

gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420

atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480

taagcttctgtatattctgcccaaatttgtcgggccc517

<210>174

<400>174

000

<210>175

<400>175

000

<210>176

<400>176

000

<210>177

<400>177

000

<210>178

<400>178

000

<210>179

<400>179

000

<210>180

<400>180

000

<210>181

<400>181

000

<210>182

<400>182

000

<210>183

<400>183

000

<210>184

<400>184

000

<210>185

<400>185

000

<210>186

<400>186

000

<210>187

<211>528

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有植物kozak共有序列的cpmvht+

<400>187

tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60

ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120

gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180

gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240

ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300

atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360

gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420

atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480

taagcttctgtatattctgcccaaatttgttcgggcccaataccgcgg528

<210>188

<211>511

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>cpmvht+511的核苷酸序列

<400>188

tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60

ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120

gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180

gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240

ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300

atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360

gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420

atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480

taagcttctgtatattctgcccaaatttgaa511

<210>189

<211>534

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>cpmvht+[wt115]的核苷酸序列

<400>189

tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60

ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcatgagc120

gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180

gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240

ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300

atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360

gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420

atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480

taagcttctgtatattctgcccaaatttgttcgggcccaataccgcggagaaaa534

<210>190

<211>56

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hbf406(prl-).r(构建体2102和2104)

<400>190

tccttcccatcctccaccaggaggtctatatttggttccattggcgagcttcaaag56

<210>191

<211>52

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>hbf406(prl-).c(构建体2102和2104)

<400>191

atatagacctcctggtggaggatgggaaggaatgattgcaggctggcacgga52

<210>192

<211>50

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if*-hbf406.s1-6r(构建体2102和2104)

<400>192

actaaagaaaataggcctttatagacagatggagcatgaaacgttgtctc50

<210>193

<211>1731

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达(构建体2102和2104)

的核苷酸序列

<400>193

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggatcgaatctgcactggaataacatcttcaaactcacctcatgtggtc120

aaaacagccactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaggaccagagggaaactatgcccagac240

tgtctcaactgcacagatctggatgtggctttgggcagaccaatgtgtgtggggaccaca300

ccttcggcgaaggcttcaatactccacgaagtcaaacctgttacatccgggtgctttcct360

ataatgcacgacagaacaaaaatcaggcaactacccaatcttctcagaggatatgaaaat420

atcaggctatcaacccaaaacgtcatcgatgcggaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaagagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccactaacagtagaagta600

ccatacatttgtacagaaggggaagaccaaatcactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacactatgtttctcagattggcagcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcaggattgttgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctaccaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagctcgccaatggaaccaaatat1080

agacctcctggtggaggatgggaaggaatgattgcaggctggcacggatacacatctcac1140

ggagcacatggagtggcagtggcggcggaccttaagagtacgcaagaagctataaacaag1200

ataacaaaaaatctcaattctttgagtgagctagaagtaaagaatcttcaaagactaagt1260

ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgatctc1320

agagctgacactataagctcgcaaatagaacttgcagtcttgctttccaacgaaggaata1380

ataaacagtgaagatgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440

ccctctgctgtagagataggaaatggatgcttcgaaaccaaacacaagtgcaaccagacc1500

tgcttagacaggatagctgctggcacctttaatgcaggagaattttctctccccactttt1560

gattcactgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620

ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680

attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731

<210>194

<211>576

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达(构建体2102和2104)

的氨基酸序列

<400>194

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrargthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvallys

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysthrgluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyserpheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproglyglyglytrpglu

355360365

glymetilealaglytrphisglytyrthrserhisglyalahisgly

370375380

valalavalalaalaaspleulysserthrglnglualaileasnlys

385390395400

ilethrlysasnleuasnserleusergluleugluvallysasnleu

405410415

glnargleuserglyalametaspgluleuhisasngluileleuglu

420425430

leuaspglulysvalaspaspleuargalaaspthrilesersergln

435440445

ilegluleualavalleuleuserasngluglyileileasnserglu

450455460

aspgluhisleuleualaleugluarglysleulyslysmetleugly

465470475480

proseralavalgluileglyasnglycysphegluthrlyshislys

485490495

cysasnglnthrcysleuaspargilealaalaglythrpheasnala

500505510

glyglupheserleuprothrpheaspserleuasnilethralaala

515520525

serleuasnaspaspglyleuaspasnhisthrileleuleutyrtyr

530535540

serthralaalaserserleualavalthrleumetleualailephe

545550555560

ilevaltyrmetvalserargaspasnvalsercysserilecysleu

565570575

<210>195

<211>3486

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2102

<400>195

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320

tcttgtgttggttccttctcagatcttcgcggatcgaatctgcactggaataacatcttc1380

aaactcacctcatgtggtcaaaacagccactcaaggggaggtcaatgtgactggtgtgat1440

accactaacaacaacaccaacaaaatcttattttgcaaatctcaaaggaacaaggaccag1500

agggaaactatgcccagactgtctcaactgcacagatctggatgtggctttgggcagacc1560

aatgtgtgtggggaccacaccttcggcgaaggcttcaatactccacgaagtcaaacctgt1620

tacatccgggtgctttcctataatgcacgacagaacaaaaatcaggcaactacccaatct1680

tctcagaggatatgaaaatatcaggctatcaacccaaaacgtcatcgatgcggaaaaggc1740

accaggaggaccctacagacttggaacctcaggatcttgccctaacgctaccagtaagag1800

cggatttttcgcaacaatggcttgggctgtcccaaaggacaacaacaaaaatgcaacgaa1860

cccactaacagtagaagtaccatacatttgtacagaaggggaagaccaaatcactgtttg1920

ggggttccattcagataacaaaacccaaatgaagaacctctatggagactcaaatcctca1980

aaagttcacctcatctgctaatggagtaaccacacactatgtttctcagattggcagctt2040

cccagatcaaacagaagacggaggactaccacaaagcggcaggattgttgttgattacat2100

gatgcaaaaacctgggaaaacaggaacaattgtctaccaaagaggtgttttgttgcctca2160

aaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtccttgcctttaattgg2220

tgaagcagattgccttcatgaaaaatacggtggattaaacaaaagcaagccttactacac2280

aggagaacatgcaaaagccataggaaattgcccaatatgggtgaaaacacctttgaagct2340

cgccaatggaaccaaatatagacctcctggtggaggatgggaaggaatgattgcaggctg2400

gcacggatacacatctcacggagcacatggagtggcagtggcggcggaccttaagagtac2460

gcaagaagctataaacaagataacaaaaaatctcaattctttgagtgagctagaagtaaa2520

gaatcttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgagctgga2580

tgagaaagtggatgatctcagagctgacactataagctcgcaaatagaacttgcagtctt2640

gctttccaacgaaggaataataaacagtgaagatgagcatctattggcacttgagagaaa2700

actaaagaaaatgctgggtccctctgctgtagagataggaaatggatgcttcgaaaccaa2760

acacaagtgcaaccagacctgcttagacaggatagctgctggcacctttaatgcaggaga2820

attttctctccccacttttgattcactgaacattactgctgcatctttaaatgatgatgg2880

attggataaccatactatactgctctattactcaactgctgcttctagtttggctgtaac2940

attgatgctagctatttttattgtttatatggtctccagagacaacgtttcatgctccat3000

ctgtctataaaggcctattttctttagtttgaatttactgttattcggtgtgcatttcta3060

tgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttcttt3120

gtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttat3180

taaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgt3240

tcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatt3300

atcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacg3360

ttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgata3420

gaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgtta3480

ctagat3486

<210>196

<211>5368

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2104

<400>196

tgttgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatg60

gaggcaggggtattttggtcattttaatagatagtggaaaatgacgtggaatttacttaa120

agacgaagtctttgcgacaagggggggcccacgccgaatttaatattaccggcgtggccc180

ccccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaatttcccgcc240

cactagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttggtcga300

caagcttgcatgccggtcaacatggtggagcacgacacacttgtctactccaaaaatatc360

aaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatcc420

ggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaa480

aaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagat540

gcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaa600

gaagacgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcac660

gacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaatt720

gagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatc780

tgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgc840

gataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggaccc900

ccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtg960

gattgatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaa1020

gacccttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaatagg1080

ttttgataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcat1140

ctctcttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcag1200

atcgtgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctcttt1260

gtggacacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtgg1320

tcttgggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacga1380

ttctgctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcct1440

gtacttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttga1500

aacagagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattct1560

gcccaaatttgtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcgg1620

cttattgttttctcttcttgtgttggttccttctcagatcttcgcggatcgaatctgcac1680

tggaataacatcttcaaactcacctcatgtggtcaaaacagccactcaaggggaggtcaa1740

tgtgactggtgtgataccactaacaacaacaccaacaaaatcttattttgcaaatctcaa1800

aggaacaaggaccagagggaaactatgcccagactgtctcaactgcacagatctggatgt1860

ggctttgggcagaccaatgtgtgtggggaccacaccttcggcgaaggcttcaatactcca1920

cgaagtcaaacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcag1980

gcaactacccaatcttctcagaggatatgaaaatatcaggctatcaacccaaaacgtcat2040

cgatgcggaaaaggcaccaggaggaccctacagacttggaacctcaggatcttgccctaa2100

cgctaccagtaagagcggatttttcgcaacaatggcttgggctgtcccaaaggacaacaa2160

caaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaaga2220

ccaaatcactgtttgggggttccattcagataacaaaacccaaatgaagaacctctatgg2280

agactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacactatgtttc2340

tcagattggcagcttcccagatcaaacagaagacggaggactaccacaaagcggcaggat2400

tgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctaccaaagagg2460

tgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtc2520

cttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaag2580

caagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtgaa2640

aacacctttgaagctcgccaatggaaccaaatatagacctcctggtggaggatgggaagg2700

aatgattgcaggctggcacggatacacatctcacggagcacatggagtggcagtggcggc2760

ggaccttaagagtacgcaagaagctataaacaagataacaaaaaatctcaattctttgag2820

tgagctagaagtaaagaatcttcaaagactaagtggtgccatggatgaactccacaacga2880

aatactcgagctggatgagaaagtggatgatctcagagctgacactataagctcgcaaat2940

agaacttgcagtcttgctttccaacgaaggaataataaacagtgaagatgagcatctatt3000

ggcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagagataggaaatgg3060

atgcttcgaaaccaaacacaagtgcaaccagacctgcttagacaggatagctgctggcac3120

ctttaatgcaggagaattttctctccccacttttgattcactgaacattactgctgcatc3180

tttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttc3240

tagtttggctgtaacattgatgctagctatttttattgtttatatggtctccagagacaa3300

cgtttcatgctccatctgtctataaaggcctattttctttagtttgaatttactgttatt3360

cggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatg3420

taatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaa3480

agattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttat3540

cgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgcc3600

ggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaac3660

atgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatac3720

atttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcg3780

gtgtcatctatgttactagatctctagagtctcaagcttggcgcgccataaaatgattat3840

tttatgaatatatttcattgtgcaagtagatagaaattacatatgttacataacacacga3900

aataaacaaaaaaagacaatccaaaaacaaacaccccaaaaaaaataatcactttagata3960

aactcgtatgaggagaggcacgttcagtgactcgacgattcccgagcaaaaaaagtctcc4020

ccgtcacacatatagtgggtgacgcaattatctttaaagtaatccttctgttgacttgtc4080

attgataacatccagtcttcgtcaggattgcaaagaattatagaagggatcccacctttt4140

attttcttcttttttccatatttagggttgacagtgaaatcagactggcaacctattaat4200

tgcttccacaatgggacgaacttgaaggggatgtcgtcgatgatattataggtggcgtgt4260

tcatcgtagttggtgaaatcgatggtaccgttccaatagttgtgtcgtccgagacttcta4320

gcccaggtggtctttccggtacgagttggtccgcagatgtagaggctggggtgtcggatt4380

ccattccttccattgtcctggttaaatcggccatccattcaaggtcagattgagcttgtt4440

ggtatgagacaggatgtatgtaagtataagcgtctatgcttacatggtatagatgggttt4500

ccctccaggagtgtagatcttcgtggcagcgaagatctgattctgtgaagggcgacacat4560

acggttcaggttgtggagggaataatttgttggctgaatattccagccattgaagttttg4620

ttgcccattcatgagggaattcttccttgatcatgtcaagatattcctccttagacgttg4680

cagtctggataatagttctccatcgtgcgtcagatttgcgaggagagaccttatgatctc4740

ggaaatctcctctggttttaatatctccgtcctttgatatgtaatcaaggacttgtttag4800

agtttctagctggctggatattagggtgatttccttcaaaatcgaaaaaagaaggatccc4860

taatacaaggttttttatcaagctggagaagagcatgatagtgggtagtgccatcttgat4920

gaagctcagaagcaacaccaaggaagaaaataagaaaaggtgtgagtttctcccagagaa4980

actggaataaatcatctctttgagatgagcacttgggataggtaaggaaaacatatttag5040

attggagtctgaagttcttactagcagaaggcatgttgttgtgactccgaggggttgcct5100

caaactctatcttataaccggcgtggaggcatggaggcaggggtattttggtcattttaa5160

tagatagtggaaaatgacgtggaatttacttaaagacgaagtctttgcgacaaggggggg5220

cccacgccgaatttaatattaccggcgtggcccccccttatcgcgagtgctttagcacga5280

gcggtccagatttaaagtagaaaatttcccgcccactagggttaaaggtgttcacactat5340

aaaagcatatacgatgtgatggtatttg5368

<210>197

<211>46

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>if-h1ctmct.s1-4r

<400>197

actaaagaaaataggcctttaaatacatattctacactgtagagac46

<210>198

<211>1731

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达+h1加利福尼亚tmct

(构建体2106和2108)的核苷酸序列

<400>198

atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60

cagatcttcgcggatcgaatctgcactggaataacatcttcaaactcacctcatgtggtc120

aaaacagccactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180

acaaaatcttattttgcaaatctcaaaggaacaaggaccagagggaaactatgcccagac240

tgtctcaactgcacagatctggatgtggctttgggcagaccaatgtgtgtggggaccaca300

ccttcggcgaaggcttcaatactccacgaagtcaaacctgttacatccgggtgctttcct360

ataatgcacgacagaacaaaaatcaggcaactacccaatcttctcagaggatatgaaaat420

atcaggctatcaacccaaaacgtcatcgatgcggaaaaggcaccaggaggaccctacaga480

cttggaacctcaggatcttgccctaacgctaccagtaagagcggatttttcgcaacaatg540

gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccactaacagtagaagta600

ccatacatttgtacagaaggggaagaccaaatcactgtttgggggttccattcagataac660

aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720

aatggagtaaccacacactatgtttctcagattggcagcttcccagatcaaacagaagac780

ggaggactaccacaaagcggcaggattgttgttgattacatgatgcaaaaacctgggaaa840

acaggaacaattgtctaccaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900

ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960

gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020

ataggaaattgcccaatatgggtgaaaacacctttgaagctcgccaatggaaccaaatat1080

agacctcctggtggaggatgggaaggaatgattgcaggctggcacggatacacatctcac1140

ggagcacatggagtggcagtggcggcggaccttaagagtacgcaagaagctataaacaag1200

ataacaaaaaatctcaattctttgagtgagctagaagtaaagaatcttcaaagactaagt1260

ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgatctc1320

agagctgacactataagctcgcaaatagaacttgcagtcttgctttccaacgaaggaata1380

ataaacagtgaagatgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440

ccctctgctgtagagataggaaatggatgcttcgaaaccaaacacaagtgcaaccagacc1500

tgcttagacaggatagctgctggcacctttaatgcaggagaattttctctccccactttt1560

gattcactgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620

ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680

agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731

<210>199

<211>576

<212>prt

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达+h1加利福尼亚tmct

(构建体2106和2108)的氨基酸序列

<400>199

metalalysasnvalalailepheglyleuleupheserleuleuval

151015

leuvalproserglnilephealaaspargilecysthrglyilethr

202530

serserasnserprohisvalvallysthralathrglnglygluval

354045

asnvalthrglyvalileproleuthrthrthrprothrlyssertyr

505560

phealaasnleulysglythrargthrargglylysleucysproasp

65707580

cysleuasncysthraspleuaspvalalaleuglyargprometcys

859095

valglythrthrproseralalysalaserileleuhisgluvallys

100105110

provalthrserglycyspheproilemethisaspargthrlysile

115120125

argglnleuproasnleuleuargglytyrgluasnileargleuser

130135140

thrglnasnvalileaspalaglulysalaproglyglyprotyrarg

145150155160

leuglythrserglysercysproasnalathrserlysserglyphe

165170175

phealathrmetalatrpalavalprolysaspasnasnlysasnala

180185190

thrasnproleuthrvalgluvalprotyrilecysthrgluglyglu

195200205

aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet

210215220

lysasnleutyrglyaspserasnproglnlysphethrserserala

225230235240

asnglyvalthrthrhistyrvalserglnileglyserpheproasp

245250255

glnthrgluaspglyglyleuproglnserglyargilevalvalasp

260265270

tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg

275280285

glyvalleuleuproglnlysvaltrpcysalaserglyargserlys

290295300

valilelysglyserleuproleuileglyglualaaspcysleuhis

305310315320

glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu

325330335

hisalalysalaileglyasncysproiletrpvallysthrproleu

340345350

lysleualaasnglythrlystyrargproproglyglyglytrpglu

355360365

glymetilealaglytrphisglytyrthrserhisglyalahisgly

370375380

valalavalalaalaaspleulysserthrglnglualaileasnlys

385390395400

ilethrlysasnleuasnserleusergluleugluvallysasnleu

405410415

glnargleuserglyalametaspgluleuhisasngluileleuglu

420425430

leuaspglulysvalaspaspleuargalaaspthrilesersergln

435440445

ilegluleualavalleuleuserasngluglyileileasnserglu

450455460

aspgluhisleuleualaleugluarglysleulyslysmetleugly

465470475480

proseralavalgluileglyasnglycysphegluthrlyshislys

485490495

cysasnglnthrcysleuaspargilealaalaglythrpheasnala

500505510

glyglupheserleuprothrpheaspserleuasnilethralaala

515520525

serleuasnaspaspglyleuaspasntyrglnileleualailetyr

530535540

serthrvalalaserserleuvalleuvalvalserleuglyalaile

545550555560

serphetrpmetcysserasnglyserleuglncysargilecysile

565570575

<210>200

<211>3486

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2106

<400>200

gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60

gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120

ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180

tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240

ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300

acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360

tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420

agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480

aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540

atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600

atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660

tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720

taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780

acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840

cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900

cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960

ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020

gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080

gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140

tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200

tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260

gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320

tcttgtgttggttccttctcagatcttcgcggatcgaatctgcactggaataacatcttc1380

aaactcacctcatgtggtcaaaacagccactcaaggggaggtcaatgtgactggtgtgat1440

accactaacaacaacaccaacaaaatcttattttgcaaatctcaaaggaacaaggaccag1500

agggaaactatgcccagactgtctcaactgcacagatctggatgtggctttgggcagacc1560

aatgtgtgtggggaccacaccttcggcgaaggcttcaatactccacgaagtcaaacctgt1620

tacatccgggtgctttcctataatgcacgacagaacaaaaatcaggcaactacccaatct1680

tctcagaggatatgaaaatatcaggctatcaacccaaaacgtcatcgatgcggaaaaggc1740

accaggaggaccctacagacttggaacctcaggatcttgccctaacgctaccagtaagag1800

cggatttttcgcaacaatggcttgggctgtcccaaaggacaacaacaaaaatgcaacgaa1860

cccactaacagtagaagtaccatacatttgtacagaaggggaagaccaaatcactgtttg1920

ggggttccattcagataacaaaacccaaatgaagaacctctatggagactcaaatcctca1980

aaagttcacctcatctgctaatggagtaaccacacactatgtttctcagattggcagctt2040

cccagatcaaacagaagacggaggactaccacaaagcggcaggattgttgttgattacat2100

gatgcaaaaacctgggaaaacaggaacaattgtctaccaaagaggtgttttgttgcctca2160

aaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtccttgcctttaattgg2220

tgaagcagattgccttcatgaaaaatacggtggattaaacaaaagcaagccttactacac2280

aggagaacatgcaaaagccataggaaattgcccaatatgggtgaaaacacctttgaagct2340

cgccaatggaaccaaatatagacctcctggtggaggatgggaaggaatgattgcaggctg2400

gcacggatacacatctcacggagcacatggagtggcagtggcggcggaccttaagagtac2460

gcaagaagctataaacaagataacaaaaaatctcaattctttgagtgagctagaagtaaa2520

gaatcttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgagctgga2580

tgagaaagtggatgatctcagagctgacactataagctcgcaaatagaacttgcagtctt2640

gctttccaacgaaggaataataaacagtgaagatgagcatctattggcacttgagagaaa2700

actaaagaaaatgctgggtccctctgctgtagagataggaaatggatgcttcgaaaccaa2760

acacaagtgcaaccagacctgcttagacaggatagctgctggcacctttaatgcaggaga2820

attttctctccccacttttgattcactgaacattactgctgcatctttaaatgatgatgg2880

attggataactaccagattttggcgatctattcaactgtcgccagttcattggtactggt2940

agtctccctgggggcaatcagtttctggatgtgctctaatgggtctctacagtgtagaat3000

atgtatttaaaggcctattttctttagtttgaatttactgttattcggtgtgcatttcta3060

tgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttcttt3120

gtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttat3180

taaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgt3240

tcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatt3300

atcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacg3360

ttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgata3420

gaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgtta3480

ctagat3486

<210>201

<211>5368

<212>dna

<213>人工序列(artificialsequence)

<220>

<221>

<222>

<223>盒2108

<400>201

tgttgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatg60

gaggcaggggtattttggtcattttaatagatagtggaaaatgacgtggaatttacttaa120

agacgaagtctttgcgacaagggggggcccacgccgaatttaatattaccggcgtggccc180

ccccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaatttcccgcc240

cactagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttggtcga300

caagcttgcatgccggtcaacatggtggagcacgacacacttgtctactccaaaaatatc360

aaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatcc420

ggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaa480

aaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagat540

gcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaa600

gaagacgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcac660

gacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaatt720

gagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatc780

tgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgc840

gataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggaccc900

ccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtg960

gattgatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaa1020

gacccttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaatagg1080

ttttgataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcat1140

ctctcttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcag1200

atcgtgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctcttt1260

gtggacacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtgg1320

tcttgggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacga1380

ttctgctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcct1440

gtacttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttga1500

aacagagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattct1560

gcccaaatttgtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcgg1620

cttattgttttctcttcttgtgttggttccttctcagatcttcgcggatcgaatctgcac1680

tggaataacatcttcaaactcacctcatgtggtcaaaacagccactcaaggggaggtcaa1740

tgtgactggtgtgataccactaacaacaacaccaacaaaatcttattttgcaaatctcaa1800

aggaacaaggaccagagggaaactatgcccagactgtctcaactgcacagatctggatgt1860

ggctttgggcagaccaatgtgtgtggggaccacaccttcggcgaaggcttcaatactcca1920

cgaagtcaaacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcag1980

gcaactacccaatcttctcagaggatatgaaaatatcaggctatcaacccaaaacgtcat2040

cgatgcggaaaaggcaccaggaggaccctacagacttggaacctcaggatcttgccctaa2100

cgctaccagtaagagcggatttttcgcaacaatggcttgggctgtcccaaaggacaacaa2160

caaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaaga2220

ccaaatcactgtttgggggttccattcagataacaaaacccaaatgaagaacctctatgg2280

agactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacactatgtttc2340

tcagattggcagcttcccagatcaaacagaagacggaggactaccacaaagcggcaggat2400

tgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctaccaaagagg2460

tgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtc2520

cttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaag2580

caagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtgaa2640

aacacctttgaagctcgccaatggaaccaaatatagacctcctggtggaggatgggaagg2700

aatgattgcaggctggcacggatacacatctcacggagcacatggagtggcagtggcggc2760

ggaccttaagagtacgcaagaagctataaacaagataacaaaaaatctcaattctttgag2820

tgagctagaagtaaagaatcttcaaagactaagtggtgccatggatgaactccacaacga2880

aatactcgagctggatgagaaagtggatgatctcagagctgacactataagctcgcaaat2940

agaacttgcagtcttgctttccaacgaaggaataataaacagtgaagatgagcatctatt3000

ggcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagagataggaaatgg3060

atgcttcgaaaccaaacacaagtgcaaccagacctgcttagacaggatagctgctggcac3120

ctttaatgcaggagaattttctctccccacttttgattcactgaacattactgctgcatc3180

tttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccag3240

ttcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtc3300

tctacagtgtagaatatgtatttaaaggcctattttctttagtttgaatttactgttatt3360

cggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatg3420

taatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaa3480

agattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttat3540

cgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgcc3600

ggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaac3660

atgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatac3720

atttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcg3780

gtgtcatctatgttactagatctctagagtctcaagcttggcgcgccataaaatgattat3840

tttatgaatatatttcattgtgcaagtagatagaaattacatatgttacataacacacga3900

aataaacaaaaaaagacaatccaaaaacaaacaccccaaaaaaaataatcactttagata3960

aactcgtatgaggagaggcacgttcagtgactcgacgattcccgagcaaaaaaagtctcc4020

ccgtcacacatatagtgggtgacgcaattatctttaaagtaatccttctgttgacttgtc4080

attgataacatccagtcttcgtcaggattgcaaagaattatagaagggatcccacctttt4140

attttcttcttttttccatatttagggttgacagtgaaatcagactggcaacctattaat4200

tgcttccacaatgggacgaacttgaaggggatgtcgtcgatgatattataggtggcgtgt4260

tcatcgtagttggtgaaatcgatggtaccgttccaatagttgtgtcgtccgagacttcta4320

gcccaggtggtctttccggtacgagttggtccgcagatgtagaggctggggtgtcggatt4380

ccattccttccattgtcctggttaaatcggccatccattcaaggtcagattgagcttgtt4440

ggtatgagacaggatgtatgtaagtataagcgtctatgcttacatggtatagatgggttt4500

ccctccaggagtgtagatcttcgtggcagcgaagatctgattctgtgaagggcgacacat4560

acggttcaggttgtggagggaataatttgttggctgaatattccagccattgaagttttg4620

ttgcccattcatgagggaattcttccttgatcatgtcaagatattcctccttagacgttg4680

cagtctggataatagttctccatcgtgcgtcagatttgcgaggagagaccttatgatctc4740

ggaaatctcctctggttttaatatctccgtcctttgatatgtaatcaaggacttgtttag4800

agtttctagctggctggatattagggtgatttccttcaaaatcgaaaaaagaaggatccc4860

taatacaaggttttttatcaagctggagaagagcatgatagtgggtagtgccatcttgat4920

gaagctcagaagcaacaccaaggaagaaaataagaaaaggtgtgagtttctcccagagaa4980

actggaataaatcatctctttgagatgagcacttgggataggtaaggaaaacatatttag5040

attggagtctgaagttcttactagcagaaggcatgttgttgtgactccgaggggttgcct5100

caaactctatcttataaccggcgtggaggcatggaggcaggggtattttggtcattttaa5160

tagatagtggaaaatgacgtggaatttacttaaagacgaagtctttgcgacaaggggggg5220

cccacgccgaatttaatattaccggcgtggcccccccttatcgcgagtgctttagcacga5280

gcggtccagatttaaagtagaaaatttcccgcccactagggttaaaggtgttcacactat5340

aaaagcatatacgatgtgatggtatttg5368

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1