发明领域
本发明涉及在植物中产生病毒样颗粒。
发明背景
流感是由正粘液病毒科的rna病毒引起的。存在三种类型的这些病毒,并且它们引起三种不同类型的流感:a型、b型和c型。流感病毒的a型病毒感染哺乳动物(人、猪、雪豹、马)和禽类。该病毒类型对人类来说非常重要,因为这是引起全世界流行病的病毒类型。b型流感病毒(也被简称为流感b)仅感染人类。其偶尔引起流感的局部爆发。c型流感病毒同样仅感染人类。当它们未成熟时它们感染大多数人并且极少引起严重的疾病。
接种疫苗通过诱导对象在感染之前建立防御,提供免受由类似病原体引起的疾病的保护。按照惯例,通过使用减毒活形式或完全灭活形式的感染性病原体作为免疫原实现接种疫苗。为了避免使用完整病毒(如杀死的或减毒的病毒)作为疫苗的危险,重组的病毒蛋白,例如亚基,已被用作疫苗。肽和亚基疫苗均为有许多潜在限制的对象。由于不正确的折叠或弱的抗原递呈,亚基疫苗可能呈现弱的免疫原性。主要的问题是难以确保被改造的蛋白的构象模仿抗原在其自然环境中的构象。合适的佐剂以及在肽的情况下的载体蛋白必须被用来促进免疫应答。此外这些疫苗主要引起体液应答,并且因此可能未能激发有效的免疫力。亚基疫苗通常对疾病是无效的,可证明完整的灭活病毒能提供保护。
病毒样颗粒(vlp)为用于免疫原性组合物中的包含物的潜在候选物。vlp极其类似于成熟病毒粒子,但是它们不含有病毒基因组材料。因此,vlp本质上是非复制性的,这使得它们用于作为疫苗施用是安全的。此外,可改造vlp以在vlp的表面上表达病毒糖蛋白,其为它们最天然的生理性结构。而且,因为vlp类似于完整的病毒粒子并且为多价的微粒结构,所以vlp在诱导针对糖蛋白的中和抗体中,比可溶性包膜蛋白抗原更有效。
vlp已在植物(wo2009/009876;wo2009/076778;wo2010/003225;wo2010/003235;wo2011/03522;wo2010/148511;其通过引用并入本文),以及昆虫和哺乳动物系统中(noad,r.androy,p.,2003,trendsmicrobiol11:438-44;neumann等,2000,j.virol.,74,547-551)产生。latham和galarza(2001,j.virol.,75,6154-6165)报道了,在感染有共表达血凝素(ha)、神经氨酸酶(na)、m1和m2基因的重组杆状病毒的昆虫细胞中,流感vlp的形成。该研究证明,在真核细胞中经共表达的流感病毒粒子蛋白的自我组装,并且m1基质蛋白是用于vlp的产生所必需的。gomez-puertas等(1999,j.gen.virol,80,1635-1645)显示m2的共表达完全地阻碍了catrna传送至mdck培养基中。
流感病毒的刺突糖蛋白血凝素(ha)对病毒颗粒被宿主细胞摄取非常重要。它负责病毒颗粒附着于包括唾液酸的细胞受体上,并且它涉及通过病毒包膜与细胞膜融合的病毒侵入。融合活性以及从而病毒的感染性,取决于将ha前体分子ha0切割为二硫键连接的多肽链ha1和ha2。切割随后ph-依赖的构象变化导致调节膜融合的跨膜多肽ha2在氨基端处的高度保守疏水肽的暴露和再定位。
ha被合成为前体蛋白ha0,其经过蛋白水解作用加工为通过二硫键连在一起的两个亚基(ha1和ha2)。两种结构特征被认为是涉及ha的可切割性:在有限的可切割性的ha中,接头通常由单个精氨酸组成,然而较宽范围的不同细胞种类中可切割的ha在具有主要酶识别基序arg-x-lys/arg-arg(其中x为非碱性氨基酸)的该位置上具有一系列的多个碱性残基插入。具有多个碱性切割位点的ha在其到达细胞膜上的出芽位点前在细胞外转运途径中被切割,相反,具有单碱性接头的ha在细胞外间隙或如针对wsn毒株所示在病毒进入阶段,在病毒颗粒上被激活。ha切割的第二个决定因素似乎为,存在于切割位点附近并且干扰蛋白酶易接近性的碳水化合物侧链。该碳水化合物的损失导致提高ha的可切割性和病毒的致病性。
由于分泌可细胞外切割ha0前体的蛋白酶的细胞范围有限,哺乳类和非致病性禽流感病毒株引起解剖学上的局部感染(chenj等.1998,cell.vol95:409-417)。负责在流感感染的人类中切割ha0的蛋白酶,由呼吸道的细胞或由共感染的细菌或支原体分泌,或者它们可在对感染的炎症应答中产生。主要的蛋白酶候选物为类胰蛋白酶克拉拉(clara),其由支气管上皮的克拉拉细胞产生,并且具有有限的组织分布(上呼吸道)。蛋白酶对h1、h2、h3和h6的切割位点处发现的单碱性序列q/e-x-r具有特异性。来自h9和b毒株的ha显示稍有不同的单碱性切割位点,分别为ssr和ker序列。针对引起水禽中所见的肠道和呼吸道感染的大多数流感病毒,还未鉴定出蛋白酶。大多数细胞系不支持多轮复制,除非加入外源蛋白酶(通常为胰蛋白酶)。
在高致病禽流感毒株中,然而,ha0被更普遍的细胞内蛋白酶家族切割,其导致全身的流感感染。致病性中的这种差异与ha0切割位点处的结构差异相关。致病毒株在单碱性位点内或邻近单碱性位点处具有多碱性氨基酸的插入。在该情况下的切割发生于细胞内,并且所涉及的蛋白酶被鉴定为弗林蛋白酶(furin)和其他类谷草杆菌蛋白酶,其发现于高尔基体中并涉及激素和生长因子前体的翻译后加工。弗林蛋白酶的识别序列r-x-r/k-r为h5h7的ha0切割位点处常见的插入氨基酸。酶的广泛组织分布性以及细胞内切割的效能,有助于由这些病毒引起的广泛传播的和毒力的全身性感染。
ha切割位点是用于病毒减毒的靶标,因为通过宿主蛋白酶将ha0前体激活切割为ha1和ha2片段,是所有流感a和b病毒株的复制循环中的步骤。只有被切割的ha能在受体介导的胞吞作用后的核内体酸性环境中经历构象变化,以暴露用于介导核内膜和病毒粒子膜之间融合的ha2片段的疏水n末端。
horimotot等(2006,vaccine,vol24:3669-3676)描述了h5中h5(rerrrkkr↓g)的多碱性切割位点的废除。所选择的突变体被应用于鼠中免疫原性的研究,其包括具有前面4个带电氨基酸(rerr)的缺失并且使多碱性切割位点失活的修饰(用tetr代替rkkr)的突变体。切割位点的废除不影响突变体h5的免疫原性特性。也已报道,废除多碱性位点(gerrrkkr↓g被retr代替)以产生突变体nibsc05/240nibsc流感参考病毒nibg-23。hoffman等(2002,2002,vaccine,vol20:3165-3170)用h6的单碱性位点代替h5ha的多碱性切割位点,以便促进在卵中的表达。缺失前面4个残基,并且通过ietr代替多碱性位点的后面四个氨基酸(用ietr↓g代替rerrrkkr↓g)。该突变体h5表现出高的表达水平、潜在的蛋白水解作用,以及在宿主细胞中病毒复制和产生所需的低ph下的构象变化,免疫原性数据未被报道。这些研究表明,可利用切割位点的修饰来减少病毒颗粒的毒力(在真实病毒被复制的情况下),其允许病毒在不杀死寄生卵的情况下复制。如果没有这样的突变,病毒在到达高滴度前杀死卵。
sirko等的wo2013043067描述了用于鸡的dna疫苗,其含有编码修饰的h5血凝素(ha)蛋白的cdna,其中ha亚基之间的蛋白水解切割位点被缺失。sirko等陈述了这种缺失提供了更安全的疫苗并以长的、无加工的多肽形式表达“超级抗原”。sirko等进一步陈述了修饰的ha的编码区,在这样的方式下,禽细胞中的蛋白的产生实现最大产量。主要的修饰是鸡的密码子优化和ha的蛋白水解敏感区的缺失。
wo2013/044390描述了在植物中产生具有修饰的血凝素(ha)的病毒样颗粒(vlp)的方法,其中修饰的ha蛋白包含修饰的蛋白水解环。修饰的ha在调控区豇豆花叶病毒(cowpeamosaicvirus)(cpmv)ht和来自菜豆黄矮病毒(beanyellowdwarfvirus)(beydv)的双生病毒(geminivirus)扩增元件的存在下表达。
yang等的us2008/0069821公开了,用于产生作为疫苗的流感病毒的流感ha的多肽和多聚核苷酸变体。通过引入一组载体获得重组流感病毒,所述载体对应于与源自流感ha的变体的互补片段结合的主流感病毒的基因组片段。通常,基于与疫苗施用相关的预期特性选择主毒株。例如,为了疫苗的产生,例如,为了减毒活疫苗的产生,可基于减毒表型、冷适应和/或温度敏感性选择主供体病毒株。
发明概述
本发明涉及在植物中产生病毒样颗粒和修饰的ha蛋白。
本发明的一个目的是提供改善的在植物中产生病毒样颗粒和ha蛋白。
本文所描述的核酸包含表达增强子,所述表达增强子在植物有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环。
此外,本文所描述的是在植物中产生病毒样颗粒(vlp)的方法(a),所述方法包括:
a)将包含表达增强子的核酸引入植物或植物的部分,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环;
b)在允许核酸表达的条件下培养植物或植物的部分,从而产生vlp。
此外,本文所描述的是在植物中产生病毒样颗粒(vlp)的方法(b),所述方法包括:
a)提供包含核酸的植物或植物的部分,所述核酸包含表达增强子,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环,并且
b)在允许核酸表达的条件下培养植物或植物的部分,从而产生vlp。
此外,本文所描述的是在植物中产生包含修饰的蛋白水解环的修饰的ha蛋白的方法(c),所述修饰蛋白水解环包含呈现出减少或废除的切割的一个或多个蛋白酶切割位点,所述方法包括,
a)将包含表达增强子的核酸引入植物或植物的部分,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环;
b)在允许ha蛋白表达的条件下培养植物或植物的部分,从而产生修饰的ha蛋白,
c)收集植物,并且纯化修饰的ha蛋白。
如上所描述的方法(a)、(b)或(c)还可包括以下步骤:
c)收集植物,并且
d)纯化vlp,其中vlp的大小范围为80-300nm。
此外,本文所描述的是增加植物中ha蛋白的产物产量的方法(d),所述方法包括,
a)将包含表达增强子的核酸引入植物或植物的部分,所述表达增强子在植物中有活性并与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环;
b)在允许ha蛋白表达的条件下培养植物或植物的部分,从而产生修饰的ha蛋白,
c)收集植物,并且纯化ha蛋白。
表达增强子可为cpmvx、cpmvx+或cpmv-ht+。此外,核苷酸可不包含双生病毒扩增元件。因此核苷酸可不包含菜豆黄矮病毒长基因间隔区(beydvlir)以及beydv短基因间隔区(beydvsir)。修饰的蛋白水解环可包含呈现出减少或废除的蛋白酶切割的一个或多个蛋白酶切割位点。蛋白酶可为克拉拉(clara)-样或弗林蛋白酶(furin)-样。此外修饰的蛋白水解环可包含接头序列,并且接头序列可具有氨基酸序列gg、tetq或tetr。修饰的ha可包含天然或非天然信号肽。此外编码修饰的ha的核苷酸序列可包括嵌合核苷酸序列,所述嵌合核苷酸序列按顺序编码修饰的ha胞外域、流感跨膜结构域和胞质尾区,其中修饰的ha胞外域包含修饰的蛋白水解环且来自第一流感毒株,而跨膜结构域和胞质尾区来自第二流感毒株。
修饰的蛋白水解环可包含呈现出减少或废除的蛋白酶切割的一个或多个蛋白酶切割位点。而且,编码ha的核苷酸序列选自:bha、c、h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15和h16。本文还描述了通过方法(a)所产生的病毒样颗粒(vlp)。所述病毒样颗粒(vlp)可包含植物-特异性n-聚糖或修饰的n-聚糖。
本公开也提供组合物,其包含有效剂量的用于诱导免疫应答的vlp,以及药学上可接受的载体。
本文还描述了包含编码流感血凝素(ha)的核苷酸序列的核酸,所述核苷酸序列与在植物中有活性的调控区可操作地连接,其中ha包含修饰的蛋白水解环序列。所述核酸可编码包含修饰的蛋白水解环的ha,其中所述蛋白具有血凝素(ha)活性。也提供包含所述核酸的植物。也包括的是在植物中所产生的病毒样颗粒(vlp)、包含由所述核酸编码的流感病毒血凝素(ha)的vlp和一种或多种源自植物的脂质。
本发明的概述不必描述本发明的所有特征。
附图简述
本发明的这些和其他特征从参考所附附图的以下描述中更显而易见,其中:
图1显示用来制备a-2x35s/cpmv-ht/h5印度尼西亚(indonesia)/nos(构建体489号)的组件。图1a显示引物if-h5a-i-05.s1+3c(seqidno:2)。图1b显示引物if-h5dtm.r(seqidno:3)。图1c显示构建体1191的示意图。图1d显示构建体1191(seqidno4)。图1e显示表达盒489号(seqidno5)。图1f显示来自流感a/印度尼西亚/5/2005(h5n1)的h5的氨基酸序列(seqidno:6)。图1g显示编码来自流感a/印度尼西亚/5/2005(h5n1)的h5的核苷酸序列(seqidno:42)。
图2显示用来制备b-2x35s/cpmvht/m2新喀里多尼亚(newcaledonia)/nos(构建体1261号)的组件。图2a显示引物if-s1-m1+m2anc.c(seqidno:7)。图2b显示引物if-s1-4-m2anc.r(seqidno:8)。图2c显示用于合成的m2基因的核苷酸序列(对应于连接到来自genbank登录号dq508860的715-982的nt1-26)(seqidno:9)。图2d显示从2x35s启动子至nos终止子的表达盒1261号。来自流感a/新喀里多尼亚/20/1999(h1n1)的m2加下划线(seqidno:10)。图2e显示来自流感a/新喀里多尼亚/20/1999(h1n1)的m2的氨基酸序列(seqidno:11)。
图3显示用来制备c-2x35s/cpmv-ht/m2波多黎各(puertorico)/nos(构建体859号)的组件。图3a显示合成的m2基因的核苷酸序列(对应于连接到来自genebank登录号ef467824的nt740-1007的nt26-51)(seqidno:12)。图3b显示从2x35s启动子至nos终止子的表达盒859号。来自流感a/波多黎各/8/1934(h1n1)的m2加下划线(seqidno:13)。图3c显示来自流感a/波多黎各/8/1934(h1n1)的m2的氨基酸序列(seqidno:14)。
图4显示用来制备引入beydv+复制酶扩增体系中的g-2x35s/cpmv-ht/pdisp/hab布里斯班(brisbane)/nos(构建体1008号)的组件。图4a显示构建体1194的示意图。用于质粒线性化的sacii和stui限制性酶切位点在示意图上注释。图4b显示从左至右的t-dna边界的构建体1194(加下划线)。引入具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的beydv+复制酶扩增体系的2x35s/cpmv-ht/pdisp/nos(seqidno:31)。图4c显示从beydv左lir至beydv右lir的表达盒1008号。来自流感b/布里斯班/60/2008的pdisp/ha加下划线(seqidno:32)。
图5显示用来制备引入beydv+复制酶扩增体系中的i-2x35s/cpmv-ht/具有缺失的蛋白水解环的pdisp/hab布里斯班/nos(构建体1059号)的组件。图5a显示引物1039+1059.r(seqidno:38)。图5b显示引物1039+1059.c(seqidno:39)。图5c显示从beydv左lir至beydv右lir的表达盒1059号。来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的pdisp/ha加下划线(seqidno:40)。图5d显示来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的pdisp/ha的氨基酸序列(seqidno:41)。图5e显示来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的pdisp/ha的核苷酸序列(seqidno:43)。
图6显示用来制备引入beydv(m)+复制酶扩增体系中的b-2x35s/cpmv-ht/hab威斯康星州(wisconsin)/nos(构建体1462号)的组件。图6a显示引物if-hab110.s1+3c(seqidno:49)。图6b显示引物if-hab110.s1-4r(seqidno:50)。图6c显示合成的hab威斯康星州(genbank登录号jn993010)的核苷酸序列(seqidno:51)。图6d显示构建体193的示意图。图6e显示从左至右的t-dna边界的构建体193(加下划线)。引入具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的beydv(m)+复制酶扩增体系的2x35s/cpmv-ht/nos(seqidno:52)。图6f显示从2x35s启动子至nos终止子的表达盒1462号的核苷酸序列。来自流感b/威斯康星州/1/2010的ha加下划线(seqidno:53)。图6g显示来自流感b/威斯康星州/1/2010的ha的氨基酸序列(seqidno:54)。图6h显示构建体1462的示意图。
图7显示用来制备引入beydv(m)+复制酶扩增体系中的c-2x35s/cpmv-ht/具有缺失的蛋白水解环的hab威斯康星州/nos(构建体1467号)的组件。图7a显示引物hab110(prl-).r(seqidno:55)。图7b显示引物hab110(prl-).c(seqidno:56)。图7c显示从2x35s启动子至nos终止子表达盒1467号的核苷酸序列。来自流感b/威斯康星州/1/2010的具有缺失的蛋白水解环的ha加下划线(seqidno:57)。图7d显示具有缺失的蛋白水解环的流感b/威斯康星州/1/2010的氨基酸序列(seqidno:58)。图7e显示构建体1467的示意图。
图8显示用来制备a-2x35s/cpmv-ht/具有缺失的蛋白水解环的pdisp/hab布里斯班/nos(构建体1039号)的组件。图8a显示从2x35s启动子至nos终止子的表达盒1039号的核苷酸序列。来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的ha加下划线(seqidno:15)。图8b显示构建体1039的示意图。
图9显示构建体1008号的质粒图谱。构建体1008号针对来自流感毒株b/布里斯班/60/2008的野生型ha的表达。该构建体包含用于dna扩增的beydv-来源元件。
图10显示构建体1059号的质粒图谱。构建体1059号针对来自流感毒株b/布里斯班/60/2008的具有缺失的蛋白水解环的突变体ha的表达。该构建体包含用于dna扩增的beydv-来源元件。
图11显示构建体1261号的质粒图谱。构建体1261号针对来自流感毒株a/新喀里多尼亚(caledonia)/20/99(h1n1)的野生型m2的表达。
图12显示构建体859号的质粒图谱。构建体859号针对来自流感毒株a/波多黎各/8/34(h1n1)的野生型m2的表达。
图13a显示农杆菌渗入的烟草本塞姆氏(nicotianabenthamiana)叶中ha蛋白表达的western印迹分析。“1008”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下的表达;“1008+1261”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达;“1059”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下的表达;“1059+1261”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。分析来自三种不同渗入的植物(a、b和c)。比值指示共表达实验中所使用的农杆菌培养物的比例。图13b显示来自产生ha的植物的粗蛋白提取物的血凝能力的比较。
图14显示农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。“1059”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下的表达;“1059+1261”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。“1059+859”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/波多黎各/8/34的m2的共表达。分析来自三种不同渗入的植物(a、b和c)。比值指示共表达实验中所使用的农杆菌培养物的比例。
图15显示来自不同流感毒株的ha的接头的周围区域的氨基酸序列比对:h1新喀里多尼亚(newcal)(seqidno:22);h1布里斯班(seqidno:23);h1所罗门群岛(solislands)(seqidno:24);h2a新加坡(singapore)(seqidno:25);h3a布里斯班(seqidno:26);h3awcn(seqidno:27);h5安徽(anhui)(seqidno:28);h5indo(seqidno:29);h5越南(vietnam)(seqidno:30);h6野鸭(teal)hk(seqidno:33);h7eq布拉格(prague)(seqidno:34);h9ahk(seqidno:35);b弗罗里达(florida)(seqidno:36);b马来西亚(malaysia)(seqidno:37)。通过箭头指示前体ha0的切割位点。
图16a显示农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。来自b/威斯康星州/1/2010的ha与来自a/新喀里多尼亚/20/99的m2共表达。每个泳道加载10μg的蛋白。“c+”:阳性对照,来自英国国家生物标准和控制学会(thenationalinstituteforbiologicalstandardsandcontrol,unitedkingdom)的半-纯化的b/威斯康星州/1/2010病毒;“1462”:来自b/威斯康星州/1/2010的野生型ha在存在扩增元件(beydv)下的表达;“1467”:来自b/威斯康星州/1/2010的突变体ha在存在扩增元件(beydv)下的表达;“1462+1261”:来自b/威斯康星州/1/2010的野生型ha在存在扩增元件(beydv)下与m2的共表达;“1467+1261”:来自b/威斯康星州/1/2010的突变体ha在存在扩增元件(beydv)下与m2的共表达。比值指示了表达和共表达实验中所使用的每个农杆菌培养物的光密度。图16b显示来自转化有agl1/1462、agl1/1467、agl1/1462+agl1/1261和agl1/1467+agl1/1261的植物的粗蛋白提取物的血凝能力的比较。
图17a和17b显示农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。“1008”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下的表达;“1008+1261”:来自b/布里斯班/60/2008的野生型ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达;“1039”:来自b/布里斯班/60/2008的突变体ha在不存在扩增元件(beydv)下的表达。“1039+1261”:来自b/布里斯班/60/2008的突变体ha在不存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。来自a/布里斯班/59/2007(h1n1)的ha。“1059”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下的表达;“1059+1261”:来自b/布里斯班/60/2008的突变体ha在存在扩增元件(beydv)下与来自a/新喀里多尼亚/20/99的m2的共表达。
图18a显示通过克拉拉-样和/或弗林蛋白酶-样的蛋白酶将ha0切割为ha1和ha2的示意图。图18b显示来自不同流感毒株的ha的序列比对:h1新喀里多尼亚(seqidno:22);h1布里斯班(seqidno:23);h1所罗门群岛(seqidno:24);h2a新加坡(seqidno:25);h3a布里斯班(seqidno:26);h3awcn(seqidno:27);h5安徽(seqidno:28);h5indo(seqidno:29);h5越南(seqidno:30);h6野鸭(teal)hk(seqidno:33);h7eq布拉格(seqidno:34);h9ahk(seqidno:35);b弗罗里达(seqidno:36);b马来西亚(seqidno:37)。图18c显示h5毒株(a/安徽/1/2005(h5n1)seqidno:69、a/印度尼西亚(indonesia)/5/2005(h5n1)seqidno:70、a/越南/1194/2004(h5n1)seqidno:71)和b型毒株(b/弗罗里达/4/2006seqidno:72和b/马来西亚/2506/2004seqidno:73)中的切割位点的部分缺失。
图19显示h5/indo中的切割位点的突变。天然的序列(seqidno:44);包含tetr的h5/indo修饰的切割位点(seqidno:45);包含tetq的h5/indo修饰的切割位点(seqidno:46)。
图20显示包含蛋白水解环内突变的不同的修饰的h5/indoha’s在酶提取后,最初生物质中存在的滴度。h5/indo对照(构建体489);gg接头所代替的h5/indo蛋白水解环(构建体928);tetr接头所代替的h5/indo蛋白水解环(构建体676);tetq接头所代替的h5/indo蛋白水解环(构建体766)。
图21显示修饰b型ha的蛋白水解环的多种方法。图21a显示天然的b/布里斯班/60/2008的氨基酸序列(seqidno:16)。下划线部分是蛋白水解环和ha2结构域。图21b显示具有修饰的蛋白水解环的b/布里斯班/60/2008的氨基酸序列(seqidno:17),其中构成序列akllkergffgaiagfleg的19个氨基酸残基被gg接头(斜体)代替。图21c显示b/布里斯班/60/2008的氨基酸序列(seqidno:18),其中构成序列ppakllker的9个氨基酸被-gsssgsssg-接头(斜体)代替。图21d显示天然的h3a/珀斯/16/2009的氨基酸序列(seqidno:19)。图21e显示具有构成序列rnvpekqtrgif的12个氨基酸残基被gs接头(斜体)代替的h3a/珀斯(perth)/16/2009的氨基酸序列(seqidno:20)。图21f显示具有构成序列rnvpekqtr的9个氨基酸残基被gssgssgss-接头(斜体)代替的h3a/珀斯/16/2009的氨基酸序列(seqidno:21)。
图22显示在农杆菌渗入的烟草本塞姆氏叶中ha蛋白表达的western印迹分析。来自h5/indo的ha。上图列出了每个泳道中所加载的组分;下图为蛋白质印迹。c:重组的h5印度尼西亚/5/05s-std-0002;一抗:抗-haa/indo/05/2005cber#s-bio-00031/50000;印迹。泳道1和2:h5/indo对照(构建体489);泳道3和4:gg接头所代替的h5/indo的蛋白水解环(构建体928);泳道5和6:tetr接头所代替的h5/indo蛋白水解环(构建体676);泳道7和8:tetq接头所代替的h5/indo蛋白水解环(构建体766);泳道9:mw标记物;泳道10:h5对照。
图23显示用来制备来自a/印度尼西亚/5/2005的具有tetr切割位点突变的b-2x35s/cpmv-ht/h5(构建体676号)的组件。图23a显示引物序列mutcleavage-h5(indo).r(seqidno:74)。图23b显示引物序列mutcleavage-h5(indo).c(seqidno:75)。图23c显示从2x35s启动子至nos终止子的表达盒676的核苷酸序列(seqidno:76)。来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetr切割位点突变加下划线。图23d显示来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetr切割位点突变体的氨基酸序列(seqidno:77)。图23e显示构建体676号的示意图。
图24显示用来制备来自a/印度尼西亚/5/2005的具有tetq切割位点突变的b-2x35s/cpmv-ht/h5(构建体766号)的组件。图24a显示引物序列h5i505_tetq.r(seqidno:78)。图24b显示引物序列h5i505_tetq.c(seqidno:79)。图24c显示从2x35s启动子至nos终止子的表达盒766的核苷酸序列(seqidno:80)。来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetq切割位点突变体加下划线。图24d显示来自流感a/印度尼西亚/5/2005(h5n1)的h5的tetq切割位点突变体的氨基酸序列(seqidno:81)。图24e显示构建体766号的示意图。
图25显示用来制备来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的b-2x35s/cpmv-ht/h5(构建体928号)的组件。图25a显示引物序列h5i505(prl-).r(seqidno:82)。图25b显示引物序列h5i505(prl-).c(seqidno:83)。图25c显示从2x35s启动子至nos终止子的表达盒928的核苷酸序列(seqidno:84)。来自流感a/印度尼西亚/5/2005(h5n1)的具有缺失的蛋白水解环的h5加下划线。图25d显示来自流感a/印度尼西亚/5/2005(h5n1)的具有缺失的蛋白水解环的h5突变体的氨基酸序列(seqidno:85)。图25e显示构建体928号的示意图。
图26a显示数个增强子序列的实例的总示意图,如本文所描述的cpmvx和cpmvx+(包含cpmvx和填充片段,在该非限制性实例中填充片段包含多克隆位点和植物kozak序列)。cpmcx和cpmvx+各自显示为在其5’端与植物调控区可操作地连接,以及在其3’端连续地为目标核苷酸序列(包括atg起始位点和终止位点)、3’utr和终止子序列。本文所描述的构建体cpmvx的实例为cpmv160。本文所描述的构建体cpmvx+的实例为cpmv160+。图26b显示植物中所产生的包含cpmv-ht表达构建体,以及基于cpmv160+的表达构建体的修饰的ha蛋白的粗蛋白提取物中的相对血凝滴度(hmg)。显示了用于以下构建体的表达的数据:具有缺失的蛋白水解环且具有pdi信号肽的hab布里斯班/60/08(构建体1039号,5’utr:cmpvht;和构建体1937号,5’utr:cmpv160+;参见实施例5.7);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被具有缺失的蛋白水解环的h1,b马萨诸塞州(massachusetts)/2/20122012的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b布里斯班/60/08+h1tm(构建体2072号,5’utr:cmpvht;和构建体2050号,5’utr:cmpv160+;参见实施例5.14);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b马萨诸塞州/2/2012+h1tm(构建体2074号,5’utr:cmpvht;和构建体2060号,5’utr:cmpv160+;参见实施例5.15);具有缺失的蛋白水解环且具有天然信号肽的b威斯康星州/1/2010(构建体1445号,5’utr:cmpvht;和构建体1975号,5’utr:cmpv160+;参见实施例5.16);和具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有天然信号肽的b威斯康星州/1/2010+h1tm(构建体1454号,5’utr:cmpvht;和构建体1893号,5’utr:cmpv160+;参见实施例5.18)。
图27a显示与目标核苷酸序列融合的cpmvht和cpmvht+的增强子序列的总示意图。增强子序列内并非需要该图中所示的所有元件。目标核苷酸序列的3’端也可包括另外的元件(未显示),包括编码豇豆花叶病毒3’非翻译区(utr)、质体蓝素3’utr或豇豆花叶病毒3’utr和质体蓝素3’utr的组合的序列。图27b显示植物中所产生的包含与目标核苷酸序列可操作地连接的cpmv-ht表达构建体和基于cpmvht+的表达构建体的蛋白的粗蛋白提取物中的相对血凝滴度(hmg)。显示用于以下构建体的表达的数据:具有缺失的蛋白水解环且具有pdi信号肽的hab布里斯班/60/08(构建体1039号:cpmvht;参见实施例5.7和构建体1829号:cpmvht+;参见实施例5.12);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b布里斯班/60/08+h1tm(构建体1067号:cpmvht;参见实施例5.14和构建体1875号:cpmvht+;参见实施例5.19);具有缺失的蛋白水解环且具有pdi信号肽的b马萨诸塞州/2/2012(构建体2072号:cmpvht;参见实施例5.15和构建体2052号:cmpvht+;参见实施例5.20);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有pdi信号肽的b马萨诸塞州/2/2012+h1tm(构建体2074号:cmpvht;参见实施例5.16和构建体2062号:cmpvht+;参见实施例5.21);具有缺失的蛋白水解环且具有天然信号肽的b威斯康星州/1/2010(构建体1445号:cmpvht;参见实施例5.17和构建体1839号:cmpvht+;参见实施例5.22);和具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区(其被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替)且具有天然信号肽的b威斯康星州/1/2010+h1tm(构建体1454号:cmpvht;参见实施例5.18和构建体1860号:cmpvht+;参见实施例5.23)。
图28a显示在农杆菌渗入的烟草本塞姆氏叶中h3珀斯蛋白表达的western印迹分析。泳道1:(2019+1261)来自h3珀斯-16-09的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2139+1261)来自h3珀斯-16-09的天然(野生型)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道3:(2039+1261)来自h3珀斯-16-09的突变体(修饰的)ha在表达增强子(cpmvht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2159+1261)来自h3珀斯-16-09的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。
图28b显示在农杆菌渗入的烟草本塞姆氏叶中b马来西亚蛋白表达的western印迹分析。泳道2:(2013+1261)来自b马来西亚2506-04的天然(野生型)ha在表达增强子(cpmv-160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2014+1261)来自b马来西亚2506-04的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。
图28c显示在农杆菌渗入的烟草本塞姆氏叶中h9香港蛋白表达的western印迹分析。泳道1:(1610+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-ht)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(1630+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-ht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道3:(2244+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2226+1261):来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道6:(2246+1261)来自h9香港-1037-99的天然(野生型)ha在表达增强子(cpmv-160+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道7:(2225+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道8:(2245+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmvht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道9:(2227+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道10:(2247+1261)来自h9香港-1037-99的突变体(修饰的)ha在表达增强子(cpmv160+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。
图28d显示在农杆菌渗入的烟草本塞姆氏叶中b马萨诸塞州蛋白表达的western印迹分析。泳道1:(2070+1261)来自b马萨诸塞州-2-12的天然(野生型)ha在表达增强子(cpmv-ht)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2080+1261)来自b马萨诸塞州-2-12的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道3:(2090+1261)来自b马萨诸塞州-2-12的天然(野生型)ha在表达增强子(cpmv-160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2072+1261)来自b马萨诸塞州-2-12的突变体(修饰的)ha在表达增强子(cpmvht)存在下与来自a/新喀里多尼亚/20/99的m2共表达;泳道5:(2052+1261)来自b马萨诸塞州-2-12的突变体(修饰的)ha在表达增强子(cpmvht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道6:(2050+1261)来自b马萨诸塞州-2-12的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。
图28e显示在农杆菌渗入的烟草本塞姆氏叶中的h2新加坡蛋白表达的western印迹分析。泳道1:(2220+1261)来自h2新加坡-1-57的天然(野生型)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(2222+1261)来自h2新加坡-1-57的天然(野生型)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道3:(2221+1261)来自h2新加坡-1-57的突变体(修饰的)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2223+1261)来自h2新加坡-1-57的突变体(修饰的)ha在表达增强子(cpmv160+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。
图28f显示在农杆菌渗入的烟草本塞姆氏叶中b/弗罗里达蛋白表达的western印迹分析。泳道1:(1004+1261)来自b/弗罗里达的天然(野生型)ha在表达增强子(cpmv-ht)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道2:(1003+1261)来自b/弗罗里达的天然(野生型)ha在表达增强子(cpmvht)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道3:(2102+1261)来自b/弗罗里达的突变体(修饰的)ha在表达增强子(cpmv-ht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达;泳道4:(2104+1261)来自b/弗罗里达的突变体(修饰的)ha在表达增强子(cpmvht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道5:(2106+1261)来自b/弗罗里达+h1加利福尼亚tmct的突变体(修饰的)ha在表达增强子(cpmvht+)存在下与来自a/新喀里多尼亚/20/99的m2的共表达。泳道6:(2108+1261)来自b/弗罗里达+h1加利福尼亚tmct的突变体(修饰的)ha在表达增强子(cpmvht+)和扩增元件beydv存在下与来自a/新喀里多尼亚/20/99的m2的共表达。
图29a显示在增强子元件cpmvht、cpmvht+或cpmv160+存在下表达来自不同流感毒株的修饰的ha的相对ha滴度。与用相同的增强子元件所表达的天然ha蛋白比较其活性。h3a珀斯/16/09(h3per1609)、h3维多利亚(victoria)/361/11(h3vic26111)、b布里斯班60/2008(hbbris60008)、b马来西亚2506/04(hbmal250604)和b马萨诸塞州2/12(ma212)与流感m2蛋白共表达。
图30a显示引物if-s2+s4-bbris.c(seqidno:86)。图30b显示引物if-s1a4-bbris.r(seqidno:87)。图30c显示合成的hab布里斯班基因的核苷酸序列(对应于来自genbank登录号fj766840的nt34-1791)(seqidno:88)。图30d显示从2x35s启动子至nos终止子的表达盒1029号的核苷酸序列。来自流感b/布里斯班/60/2008的pdisp/ha加下划线(seqidno:89)。图30e显示来自流感b/布里斯班/60/2008的pdisp/ha的氨基酸序列(seqidno:90)。图30f显示构建体1029的示意图。用于质粒线性化的sacii和stui限制性酶切位点在示意图上注释。
图31显示用来制备构建体1039号和1829号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)nos和2x35s/cpmvht+pdisp/hab布里斯班(prl-)nos;参见实施例5.12)的序列组件。构建体1039号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-)之间不包含异源kozak序列。构建体1829号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图31a显示pdisp/hab布里斯班(prl-)的核苷酸序列(seqidno:91)。图31b显示pdisp/hab布里斯班(prl-)的氨基酸序列(seqidno:92)。图31c显示构建体1829号(2x35s/cpmvht+)的示意图。
图32显示用来制备构建体1039号和1937号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)nos和2x35s/cpmv160+pdisp/hab布里斯班(prl-)nos;参见实施例5.7)的序列组件。构建体1039号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-))之间不包含异源kozak序列。构建体1937号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图32a显示构建体1937号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。
图33显示用来制备构建体1067号和1977号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos和2x35s/cpmv160+pdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos;参见实施例5.14)的序列组件。构建体1067号合并现有技术cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1977号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图33a显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:95)。图33b显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:96)。图33c显示构建体1067号(2x35s/cpmvht;参考构建体)的示意图。图33d显示构建体1977号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。
图34显示用来制备构建体2072号和2050号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)nos和2x35s/cpmv160+pdisp/hab马萨诸塞州(prl-)nos;参见实施例5.15)的序列组件。构建体2072号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-))之间不包含异源kozak序列。构建体2050号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图34a显示pdisp/hab马萨诸塞州(prl-)的核苷酸序列(seqidno:97)。图34b显示pdisp/hab马萨诸塞州(prl-)的氨基酸序列(seqidno:98)。图34c显示构建体2072号(2x35s/cpmvht;参考构建体)的示意图。图34d显示构建体2050号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。
图35显示用来制备构建体2074号和2060号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmv160+pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos;参见实施例5.16)的序列组件。构建体2074号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体2060号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图35a显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:99)。图35b显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:100)。图35c显示构建体2074号(2x35s/cpmvht;参考构建体)的示意图。图35d显示构建体2060号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。
图36显示用来制备构建体1445号、1820号和1975号(分别为2x35s/cpmvhthab威斯康星州(prl-)nos、2x35s/cpmv160+hab威斯康星州(prl-)nos和2x35s/cpmv160hab威斯康星州(prl-)nos;参见实施例15.17)的序列组件。构建体1445号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-))之间不包含异源kozak序列。构建体1820号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。构建体1975号包括包含160个核苷酸的cpmv5’utr,并且其不包括填充片段(多克隆位点)或植物kozak序列(该构建体也不包含编码不完整m蛋白的序列),并且其为基于“cpmv160”(cpmvx)的构建体的实例。prl-:缺失的蛋白水解环;nos:胭脂碱合酶终止子。图36a显示hab威斯康星州(prl-)的核苷酸序列(seqidno:101)。图36b显示hab威斯康星州(prl-)的氨基酸序列(seqidno:102)。图36c显示构建体1445号的示意图(2x35s/cpmvht;参考构建体)。图36d显示构建体1820号(2x35s/cpmv160+;基于cpmvx+的构建体)的示意图。图36e显示构建体1975号(2x35s/cpmv160;基于cpmvx的构建体,其中x=160)的示意图。
图37显示用来制备构建体1454号和1893号(分别为2x35s/cpmvhthab威斯康星州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmv160+hab威斯康星州(prl-)+h1加利福尼亚tmctnos;参见实施例5.18)的序列组件。构建体1454号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1893号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且其为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图37a显示hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:103)。图37b显示pdisp/hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:104)。图37c显示构建体1454号(2x35s/cpmvht;参考构建体)的示意图。图37d显示构建体1893号(2x35s/cpmv160+;基于cpmvx+的构建体,其中x=160)的示意图。
图38显示用来制备构建体1067号和1875号(分别为2x35s/cpmvhtpdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos和2x35s/cpmvht+pdisp/hab布里斯班(prl-)+h1加利福尼亚tmctnos;参见实施例5.19)的序列组件。构建体1067号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1875号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图38a显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:105)。图38b显示pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:106)。图38c显示构建体1875号(2x35s/cpmv160+)的示意图。
图39显示用来制备构建体2072号和2052号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)nos和2x35s/cpmvht+pdisp/hab马萨诸塞州(prl-)nos;参见实施例5.20)的序列组件。构建体2072号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-))之间不包含异源kozak序列。构建体2052号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环。图39a显示pdisp/hab马萨诸塞州(prl-)的核苷酸序列(seqidno:107)。图39b显示pdisp/hab马萨诸塞州(prl-)的氨基酸序列(seqidno:108)。图39c显示构建体2052号(2x35s/cpmvht+)的示意图。
图40显示用来制备构建体2074号和2062号(分别为2x35s/cpmvhtpdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmvht+pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmctnos;参见实施例5.21)的序列组件。构建体2074号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体2062号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。pdisp:蛋白二硫键异构酶信号肽;nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图40a显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:109)。图40b显示pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:110)。图40c显示构建体2062号(2x35s/cpmvht+)的示意图。
图41显示用来制备构建体1445号和1839号(分别为2x35s/cpmvhthab威斯康星州(prl-)nos和2x35s/cpmvht+hab威斯康星州(prl-)nos;参见实施例5.22)的序列组件。构建体1445号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-))之间不包含异源kozak序列。构建体1839号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。prl-:缺失的蛋白水解环;nos:胭脂碱合酶终止子。图41a显示hab威斯康星州(prl-)的核苷酸序列(seqidno:111)。图41b显示hab威斯康星州(prl-)的氨基酸序列(seqidno:112)。图41c显示构建体1839号(2x35s/cpmvht+)的示意图。
图42显示用来制备构建体1454号和1860号(分别为2x35s/cpmvhthab威斯康星州(prl-)+h1加利福尼亚tmctnos和2x35s/cpmvht+hab威斯康星州(prl-)+h1加利福尼亚tmctnos;参见实施例5.23)的序列组件。构建体1454号合并现有技术的cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)之间不包含异源kozak序列。构建体1860号包括包含160个核苷酸的cpmv5’utr、包含不完整m蛋白的填充片段、多克隆位点和植物kozak序列,并且其为基于cpmvht+的构建体的实例。nos:胭脂碱合酶终止子;prl-:缺失的蛋白水解环;tmct:跨膜结构域胞质尾区。图42a显示hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列(seqidno:113)。图42b显示pdisp/hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:114)。图42c显示构建体1893号(2x35s/cpmvht+)的示意图。
图43显示用来制备构建体489号(2x35s/cpmvhth5印度尼西亚nos,参见实施例5.24)的序列组件。构建体489号包含cpmv-ht序列(与编码不完整m蛋白的序列融合的在位置161处具有突变的起始密码子的cmpv5’utr),并且在5’utr和目标核苷酸序列(pdisp/h1加利福尼亚)之间不包含异源kozak序列。图43a显示天然h5印度尼西亚的核苷酸序列(seqidno:115)。图43b显示天然h5印度尼西亚的氨基酸序列(seqidno:116)。图43c显示构建体489号(2x35s/cpmvht;参考构建体)的示意图。
图44显示用来制备构建体1800号(a-2x35scpmv160+pdisph3维多利亚nos;参见实施例5.25)的序列组件。构建体1800号包括包含160个核苷酸的cpmv5’utr、填充片段(多克隆位点)和植物kozak序列(该构建体不包含编码不完整m蛋白的序列),并且为基于cpmv160+(cpmvx+,其中x=160)的构建体的实例。pdisp:蛋白二硫键异构酶信号肽。nos:胭脂碱合酶终止子。图44a显示引物序列if**(sacii)-pdi.s1+4c(seqidno:117)。图44b显示引物序列if-h3v36111.s1-4r(seqidno:118)。图44c显示pdisp/h3维多利亚的序列(seqidno:119)。图44d显示构建体2171(指示了用于质粒线性化的sacii和stui限制性酶切位点)的示意图。图44e显示从左至右t-dna边界的构建体2171(加下划线)、具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的2x35s/cpmv160+/nos、h1加利福尼亚跨膜胞质尾区和cpmv3’utr(seqidno:120)。图44f显示从2x35s启动子至nos终止子的表达盒1800号。pdisp/h3维多利亚核苷酸序列加下划线;5’utr用粗体显示;植物kozak序列双下划线;位于5’utr和植物kozak序列之间的16个碱基对的填充片段(多克隆位点)(seqidno:121)。图44g显示pdisp/h3维多利亚的氨基酸序列(seqidno:122)。图44h显示构建体1800号(基于cpmvx+的构建体,其中x=160)的示意图。
图45显示用来制备构建体1819号(2x35scpmv-ht+pdisph3维多利亚nos)的序列组件。构建体1819号包含cpmv-ht+序列(位置161处具有突变的起始密码子的融合的编码不完整m蛋白的填充片段的cmpv5’utr、多克隆位点,并且多克隆位点和目标核苷酸序列(pdisp/h3维多利亚)之间包含植物kozak序列)。pdisp:蛋白二硫键异构酶信号肽。nos:胭脂碱合酶终止子。图45a显示引物序列if(sacii)-kozac_pdi.c(seqidno:123)。图45b显示引物序列if-h3v36111.s1-4r(seqidno:124)。图45c显示构建体2181的示意图。图45d显示构建体2181(从左至右t-dna边界,加下划线;具有质体蓝素-p19-质体蓝素沉默抑制子表达盒的2x35s/cpmv-ht+/nos;seqidno:126)的序列。图45e显示从2x35s启动子至nos终止子的表达盒1819号。pdisp/h3维多利亚核苷酸序列加下划线(seqidno:127)。图45f显示构建体1819的示意图。
图46a显示天然h7杭州ha和具有缺失的蛋白水解环的修饰h7杭州ha,与m2共表达时的相对血凝活性。在m2(构建体#1261参见实施例5.1)存在下时,表达天然和修饰的h7杭州ha(构建体#2142和2152,参见实施例5.33和5.34)并且从植物中纯化。图46b显示天然h7杭州ha(构建体#2142)和具有缺失的蛋白水解环的修饰h7杭州ha(构建体#2152)的蛋白产量。图46c显示具有泳道2和泳道3的sds-page分析,所述泳道2显示纯化的具有去除的蛋白水解环的修饰h7杭州ha(构建体#2152),所述泳道3显示纯化的天然h7杭州ha(构建体#2142)。对于每个泳道,在凝胶上加2μg总蛋白。对于这两个构建体,蛋白谱的纯度是相似的。
图47a显示天然ha蛋白和蛋白水解环被gg接头(prl-)代替的修饰的ha、蛋白水解环被tetq接头(tetq)代替的修饰的ha,和蛋白水解环被tetr接头(tetr)代替的修饰的ha之间的胰蛋白酶抗性。纯化了天然的(#489)、prl-(#928)、tetq(#766)和tetr(#676)的h5印度尼西亚havlp构建体。对于每种构建体,用ph7.4的缓冲液(100mmna/kpo4,150mmnacl,0.01%吐温80)重悬两份havlp样品,目标浓度为150μg/ml。将胰蛋白酶以1:100蛋白比值加入一个重悬的样品中。样品在室温下孵育30、60和120分钟。sds-page凝胶上加载30μl非消化的提取物(对照)和30μl消化的提取物,其用考马斯亮蓝染色。图47b显示两个剂量后小鼠中的天然h5vlp和其突变体对应物(prl-、tetq和tetr)的免疫原性(hi滴度)。柱状代表每种h5突变体vlp与天然h5vlp相比的相对(%)hi滴度。
图48显示用来制备构建体2220号(2x35s/cpmvht+/pdisp/h2新加坡/nos,参见实施例5.27)的序列组件。图48a显示引物if**-h2s157.s1-6r的核苷酸序列(seqidno:127)。图48b显示pdisp/h2新加坡的核苷酸序列(seqidno:128)。图48c显示从2x35s启动子至nos终止子的表达盒2220号的核苷酸序列。pdisp/h2新加坡核苷酸序列加下划线。图48d显示pdisp/h2新加坡的氨基酸序列。图48e显示构建体2220号的示意图。
图49显示用来制备构建体2221号(2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h2新加坡/nos,参见实施例5.28)的序列组件。图49a显示引物h2s157(prl-).r的核苷酸序列(seqidno:131)。图49b显示引物h2s157(prl-).c的核苷酸序列(seqidno:132)。图49c显示从2x35s启动子至nos终止子的表达盒2221号的核苷酸序列。pdisp/h2新加坡核苷酸序列加下划线(seqidno:133)。图49d显示具有缺失的蛋白水解环的pdisp/h2新加坡的氨基酸序列(seqidno:134)。图49e显示构建体2221号的示意图。
图50显示用来制备构建体2222号(2x35s/cpmv160+/pdisp/h2新加坡)和2223号(2x35s/cpmv160+/具有缺失的蛋白水解环的pdisp/h2新加坡/nos)(参见实施例5.29)的序列组件。图50a显示从2x35s启动子至nos终止子的表达盒2222号的核苷酸序列。pdisp/h2新加坡核苷酸序列加下划线(seqidno:135)。图50b显示从2x35s启动子至nos终止子的表达盒2223号的核苷酸序列。具有缺失的蛋白水解环的pdisp/h2新加坡的核苷酸序列加下划线(seqidno:136)。图50c:构建体2222号的示意图。图50d:构建体2223号的示意图。
图51显示用来制备构建体2219号(2x35s/cpmvht+pdisp/h3珀斯)和2139(2x35s/cpmv160+/pdisp/h3珀斯)(参见实施例5.30)的序列组件。图51a显示pdisp/h3珀斯的核苷酸序列(seqidno:137)。图51b显示引物if**-h3p1609.s1-6r的核苷酸序列(seqidno:138)。图51c显示pdisp/h3珀斯的氨基酸序列(seqidno:139)。图51d显示构建体2219号的示意图。图51e显示构建体2139号的示意图。
图52显示用来制备构建体2039号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/h3珀斯)和2159号(2x35s/cpmv160+具有缺失的蛋白水解环的pdisp/h3珀斯)(参见实施例5.31)的序列组件。图52a显示具有缺失的蛋白水解环的pdisp/h3珀斯的核苷酸序列(seqidno:140)。图52b显示引物h3p1609(prl-)#2.r的核苷酸序列(seqidno:141)。图52c显示引物h3p1609(prl-)#2.c的核苷酸序列(seqidno:142)。图52d显示具有缺失的蛋白水解环的pdisp/h3珀斯的氨基酸序列(seqidno:143)。图52e显示构建体2039号的示意图。图52f显示构建体2159号的示意图。
图53显示用来制备构建体2230号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/h3维多利亚)和2250(2x35s/cpmv160+具有缺失的蛋白水解环的pdisp/h3维多利亚)(参见实施例5.32)的序列组件。图53a显示具有缺失的蛋白水解环的pdisp/h3维多利亚的核苷酸序列(seqidno:144)。图53b显示引物h3v36111(prl-).r的核苷酸序列(seqidno:145)。图53c显示引物h3v36111(prl-).c的核苷酸序列(seqidno:146)。图53d显示具有缺失的蛋白水解环的pdisp/h3维多利亚的氨基酸序列(seqidno:147)。图53e显示构建体2230号的示意图。图53f显示构建体2250号的示意图。
图54显示用来制备构建体2142号(2x35s/cpmvht+/pdisp/h7杭州/nos)(参见实施例5.33)的序列组件。图54a显示pdisp/h7杭州的核苷酸序列(seqidno:148)。图54b显示引物if*-h7h113.s1-6r的核苷酸序列(seqidno:149)。图54c显示pdisp/h7杭州的氨基酸序列(seqidno:150)。图53d显示构建体2142号的示意图。
图55显示用来制备构建体2152号(2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h7杭州/nos)(参见实施例5.34)的序列组件。图55a显示具有缺失的蛋白水解环的pdisp/h7杭州的核苷酸序列(seqidno:151)。图55b显示引物h7h113(prl-).r的核苷酸序列(seqidno:152)。图55c显示引物h7h113(prl-).c的核苷酸序列(seqidno:153)。图55d显示具有缺失的蛋白水解环的pdisp/h7杭州的氨基酸序列(seqidno:154)。图53e显示构建体2152号的示意图。
图56显示用来制备构建体2224号(2x35s/cpmvht+pdisp/h9香港)和2226号(2x35s/cpmv160+pdisp/h9香港)(参见实施例5.35)的序列组件。图56a显示pdisp/h9香港的核苷酸序列(seqidno:155)。图56b显示引物if**-h9hk107399.s1-6r的核苷酸序列(seqidno:156)。图56c显示pdisp/h9香港的氨基酸序列(seqidno:157)。图56d显示构建体2224号的示意图。图56e显示构建体2226号的示意图。
图57显示用来制备构建体2225号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/h9香港)和2227号(2x35s/cpmv160+具有缺失的蛋白水解环的pdisp/h9香港)(参见实施例5.36)的序列组件。图57a显示具有缺失的蛋白水解环的pdisp/h9香港的核苷酸序列(seqidno:158)。图57b显示引物h9hk107399(prl-).r的核苷酸序列(seqidno:159)。图57c显示引物h9hk107399(prl-).c的核苷酸序列(seqidno:160)。图57d显示具有缺失的蛋白水解环的pdisp/h9香港的氨基酸序列(seqidno:161)。图57e显示构建体2225号的示意图。图57f显示构建体2227号的示意图。
图58显示用来制备构建体2013号(2x35s/cpmv160+/pdisp/hab马来西亚/nos)(参见实施例5.37)的序列组件。图58a显示pdisp/hab马来西亚的核苷酸序列(seqidno:162)。图58b显示引物if**-hbm250604.s1-6r的核苷酸序列(seqidno:163)。图58c显示pdisp/hab马来西亚的氨基酸序列(seqidno:164)。图58d显示构建体2013号的示意图。
图59显示用来制备构建体2014号(2x35s/cpmv160+具有缺失的蛋白水解环的/pdisp/hab马来西亚/nos)(参见实施例5.38)序列组件。图59a显示具有缺失的蛋白水解环的pdisp/hab马来西亚的核苷酸序列(seqidno:165)。图59b显示引物hbm250604(prl-).r的核苷酸序列(seqidno:166)。图59c显示引物hbm250604(prl-).c的核苷酸序列(seqidno:167)。图59d显示具有缺失的蛋白水解环的pdisp/hab马来西亚的氨基酸序列(seqidno:168)。图59e显示构建体2014号的示意图。
图60显示用来制备构建体2070号(2x35s/cpmvhtpdisp/hab马萨诸塞州)、2080号(2x35s/cpmvht+pdisp/hab马萨诸塞州)和2090号(2x35s/cpmv160+pdisp/hab马萨诸塞州)(参见实施例5.39)的序列组件。图60a显示pdisp/hab马萨诸塞州的核苷酸序列(seqidno:169)。图60b显示pdisp/hab马萨诸塞州的氨基酸序列(seqidno:170)。图60c显示构建体2070号的示意图。图60d显示构建体2080号的示意图。图60e显示构建体2090号的示意图。
图61显示用来制备构建体2102号(2x35s/cpmvht+具有缺失的蛋白水解环的pdisp/hab弗罗里达)和2104号(2x35s/cpmvht+具有缺失的蛋白水解环的/beydv/pdisp/hab弗罗里达)(参见实施例5.40)的序列组件。图61a显示引物hbf406(prl-).r的核苷酸序列(seqidno:190)。图61b显示引物hbf406(prl-).c的核苷酸序列(seqidno:191)。图61c显示引物if*-hbf406.s1-6r的核苷酸序列(seqidno:192)。图61d显示具有缺失的蛋白水解环的pdisp/hab弗罗里达的核苷酸序列。图61e显示具有缺失的蛋白水解环的pdisp/hab弗罗里达的氨基酸序列。图61f显示表达盒2102号的核苷酸序列。图61g显示构建体2102号的示意图。图61h显示表达盒2104号的核苷酸序列。图61i显示构建体2104号的示意图。
图62显示用来制备构建体2106号(2x35s/cpmvht+/pdisp/b弗罗里达+具有缺失的蛋白水解环的h1加利福尼亚tmct/nos)和2108号(2x35s/cpmvht+/beydv/pdisp/b弗罗里达+具有缺失的蛋白水解环的h1加利福尼亚tmct/nos)(参见实施例5.41)的序列组件。图62a显示引物if-h1ctmct.s1-4r的核苷酸序列(seqidno:197)。图62b显示pdisp/hab弗罗里达+具有缺失的蛋白水解环的h1caltmct的核苷酸序列(seqidno:198)。图62c显示pdisp/hab弗罗里达+具有缺失的蛋白水解环的h1caltmct氨基酸序列。图62d显示表达盒2106号的核苷酸序列。图62e显示构建体2106号的示意图。图62f显示表达盒2108号的核苷酸序列。图62g显示构建体2108号的示意图。
发明详述
以下的描述是优选实施方案的描述。
本发明涉及病毒样颗粒(vlp)以及在植物中产生和增加vlp产量、累积和生产的方法。
本发明部分地,提供在植物或植物的部分中产生病毒样颗粒(vlp)的方法。所述方法包括将核酸引入植物或植物的部分。所述核酸包含调控区,所述调控区在植物中有活性并与编码流感血凝素(ha)的核苷酸序列操作性地连接到。所述ha包含修饰的蛋白水解环或切割位点。在允许所述核酸表达的条件下培养植物或植物的部分,从而产生vlp。如果需要,可收集植物或植物的部分,并且纯化vlp。
本发明也提供通过该方法所产生的vlp。vlp可包含一种或多种源自植物的脂质。
vlp可被用来制备包含有效剂量的用于诱导免疫应答的vlp以及药学上可接受的载体的组合物。
本文也提供修饰的血凝素,其中蛋白水解环或切割位点被修饰。
本发明也提供包含通过表达如上所述的核酸所产生的vlp的植物物质。所述植物物质可被用于在对象中诱导对流感病毒感染的免疫力。所述植物物质也可作为食品补充剂被掺入。
也可通过如下来产生本发明的vlp:提供包含如上所定义的核酸的植物或植物的部分,并且在允许所述核酸表达的条件下培养植物或植物的部分,从而产生vlp。vlp可包含一种或多种源自植物的脂质。vlp可被用来制备包含有效剂量的用于诱导免疫应答的vlp以及药学上可接受的载体的组合物。本发明也提供包含通过表达第一和第二核酸所产生的vlp的植物物质。所述植物物质可被用于在对象中诱导对流感病毒感染的免疫力。所述植物物质也可作为食品补充剂被掺入。
本发明的vlp包含一个或多个修饰的流感血凝素(ha)。修饰的ha可源自任何ha,例如在wo2009/009876;wo2009/076778;wo2010/003225;wo2010/003235;wo2011/03522中所描述的h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha;其通过引用并入本文。
本发明包括包含流感毒株的ha序列的vlp,其中ha序列包含修饰的多碱性切割位点,其包括例如本文所述的修饰。
ha蛋白
本文所使用的术语“血凝素”或“ha”指存在于流感病毒颗粒的外部的糖蛋白。ha是同源三聚体i型膜糖蛋白,其通常包含信号肽、ha1结构域和ha2结构域以及小胞质尾区,所述ha2结构域包含c-端跨膜锚定位点。编码ha的核苷酸序列是公知的并且是可获得的--参见,例如,生物预防公共健康基础(biodefencepublichealthbase)(流感病毒;参见url:biohealthbase.org)或生物技术信息国家中心(nationalcenterforbiotechnologyinformation)(参见url:ncbi.nlm.nih.gov),二者均通过引用并入本文。ha可包括任何ha,例如wo2009/009876;wo2009/076778;wo2010/003225;wo2010/003235;wo2011/03522中所描述的h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha,其通过引用并入本文)。此外,ha可以分离自一种或多种新兴的或最新鉴定的流感病毒的血凝素的序列为基础。本发明也包括包含获自一种或多种流感亚型的修饰的ha的vlp。
ha单体可被细分为三个功能结构域—茎结构域或茎结构域簇(sdc)、球状头部结构域或头部结构域簇(hdc)以及跨膜结构域簇(tdc)。sdc和hdc可被统称为‘胞外域’。ha等2002的出版物(emboj.21:865-875;其通过引用并入本文)基于x射线晶体结构阐明了一些流感亚型中sdc和hdc的多个亚结构域的相对取向。
ha蛋白被合成为约75kda的前体蛋白(ha0),其在表面组装为延长的三聚体蛋白。前体蛋白在保守的激活切割位点处被切割为通过二硫键连接的2条多肽链,ha1和ha2(其包含跨膜区)。图15提供一些ha的接头区域的氨基酸序列的非限制性实例。
术语“同源三聚体(homotrimer)”或“同源三聚的(homotrimeric)”指通过三个ha蛋白分子形成寡聚物。不希望受理论束缚,ha蛋白被合成为约75kda的单体前体蛋白(ha0),其在表面组装为延长的三聚体蛋白。在三聚作用发生前,前体蛋白在保守的激活切割位点(也被称为融合肽)处被切割为通过二硫键连接的2条多肽链,ha1和ha2(其包含跨膜区)。ha1片段可为328个长度的氨基酸,以及ha2片段可为221个长度的氨基酸。尽管这种切割对病毒的感染性很重要,但是对于蛋白的三聚作用或对于免疫原性它不是必须的。在宿主细胞内质网(er)膜内ha的插入、信号肽的切割以及蛋白的糖基化是共翻译事件。ha的正确再折叠需要蛋白的糖基化和5-6个链内二硫键的形成。ha三聚体在顺式-和反式-高尔基复合体内组装,跨膜结构域在三聚作用过程中发挥作用。菠萝蛋白酶-处理的ha蛋白的晶体结构(其缺乏跨膜结构域)在流感毒株之间表现出高度保守的结构。也已确定,ha在感染过程期间经历主要的构象变化,其需要前体ha0被切割为2条多肽链ha1和ha2。ha蛋白可为加工的(即,包含ha1和ha2结构域),或可为未加工的(即包含ha0结构域)。ha的未加工的前体蛋白被合成为约75kda的前体蛋白(ha0),其在表面组装为延长的三聚体蛋白。在保守的切割位点处(也被称为蛋白水解环)将前体蛋白切割为通过二硫键连接的2条多肽链,ha1和ha2(其包含跨膜区)。
本文所描述的ha蛋白还可为修饰的ha(也被称为“突变体ha”)蛋白,例如修饰的前体蛋白(ha0),其中,蛋白水解环或切割位点被修饰。
修饰的ha/切割位点
ha0的切割后,ha变得对ph敏感,其在核内体的ph(<ph6.0)下经历不可逆的构象变化。前体ha0的构象在低ph下是稳定的,但是切割的ha1-ha2形式是亚稳定的(bulloughpa等,1994,nature.vol371:37-43)。对于b毒株,诱导不同ha的构象变化的ph阈值大约为ph5.8-5.9,然而对于a型ha,ph阈值更酸,其为ph5.1至5.8(beyerwep等,1986,archivesvirol,vol90:173)。切割后,ha2的氨基末端为23个氨基酸的非极性序列,然后其变为扭跨宿主细胞膜的跨膜结构域(被称为融合肽;图15)。ha的切割位点位于ha表面的突出的环上,并且该位点易被蛋白酶接近。
为了优化疫苗在卵中的产生,并且维持有活性但减毒的病毒,研究了h5的多碱性切割位点(rerrrkkr↓g)的修饰(horimotot等,2006,vaccine,vol24:3669-3676)。目标突变体含有前面4个带电氨基酸(rerr)的缺失,并且用tetr代替氨基酸rkkr,其使多碱性切割位点失活,但是通过tetr基序(motif)的精氨酸残基维持了将ha0加工为ha1-ha2的可能性(参见图19)。通过nibsc采用产生减毒病毒的类似策略以废除多碱性位点,其允许在不杀死卵的情况下产生高产量的a/火鸡(turkey)/火鸡/1/2005h5n1毒株。多碱性位点序列(gerrrkkr↓g)在它们的突变体中被retr代替(nibsc05/240nibsc流感参考病毒nibg-23)。h5ha的多碱性切割位点也被h6的单碱性位点代替以用于在卵中表达。在该实例中,多碱性位点的前面4个残基和后面四个氨基酸被ietr代替(用ietr↓g代替rerrrkkr↓g;hoffmane等,2002,vaccine,vol20:3165-3170)。在上文提供各个实例中,进行修饰以使病毒减毒同时维持卵内ha的产生。就是说,ha0前体的切割不完全失活,以便允许ha0被加工为ha1-ha2并且经历ph构象变化,从而允许宿主细胞中的病毒复制。
本文所使用的术语“修饰的血凝素”或“修饰的ha”、“突变的血凝素”或“突变的ha”指ha,其中ha具有修饰或突变,例如取代、插入、缺失或其组合,其导致ha蛋白的蛋白水解环中或切割位点处的氨基酸序列的改变。
已确定来自a/香港/68的ha0的晶体结构(chen,j.,1998.cell95:409-417;其通过引用并入本文)。暴露于溶剂的残基通常被认为是切割位点的部分,其形成延伸的、高度暴露的表面环。在该选定区域确定共有序列,例如,但不限于:
a/h3/ha0共有区:nvpekqtr/gifgaiagfie(seqidno:66)
a/h1/ha0共有区:nipsiqsr/glfgaiagfie(seqidno:67)
禽类h5共有区:qresrrkkr/glfgaiagfieg(seqidno:1)
b/ha0共有区:pakllker/gffgaiagfle(seqidno:68)
其中ha1和ha2之间的切割通过“/”指示(参见bianchi等,2005,journalofvirology,79:7380-7388;其通过引用并入本文),以及也参见图15和18a。
ha蛋白可为b型流感血凝素或a型流感血凝素蛋白,其在蛋白水解环区具有修饰,例如蛋白水解环(切割位点)的缺失、插入、取代或其组合。不希望受理论束缚,蛋白水解环的修饰可确保ha分子被维持为ha0前体。从而产生包含ha0蛋白的更均匀和一致的vlp。
“蛋白水解环”或“切割位点”意指在前体ha0切割中所涉及的蛋白水解位点的共有序列。本文所使用的“共有区”或“共有序列”指包含相关序列的序列变异性的序列(氨基酸或核苷酸序列),其基于多重序列(例如,具体流感亚型的ha0序列)的比对分析。流感ha0切割位点的共有序列可包括流感a共有血凝素氨基酸序列(其包括例如共有h1、共有h3、共有h5),或流感b共有血凝素氨基酸序列,例如但不限于b佛罗里达和b马来西亚。蛋白水解环区域的序列的非限制性实例如图15和18b中所示(并且参见bianchi等,2005,journalofvirology,79:7380-7388;其通过引用并入本文)。
蛋白水解环或切割位点处的残基可被突变,例如但不限于:点突变、取代、插入或缺失。本文所使用的术语“氨基酸突变”或“氨基酸修饰”意指涵盖氨基酸取代、缺失、插入和修饰。可做出取代、缺失、插入和修饰的任意组合以实现最终的构建体,条件是最终的构建体拥有期望的性质,例如,减少或废除的蛋白水解环或切割位点的蛋白酶切割。
“修饰的蛋白水解环”,其意指蛋白水解环可包括一个或多个点突变,被部分地缺失、完全地缺失、用接头序列部分地代替、用接头序列完全地代替、包含用一个或多个非-蛋白氨基酸来部分或完全代替切割位点内的氨基酸,或上述项的组合。类似地,“修饰的切割位点”,其意指蛋白水解环内的切割位点可包括一个或多个点突变,被部分地缺失、完全地缺失、用接头序列部分地代替、用接头序列完全地代替、包含用一个或多个非-蛋白氨基酸来部分或完全代替切割位点内的氨基酸,或上述项的组合。蛋白水解环和/或切割位点的修饰,也可涉及位于蛋白水解环或切割位点序列的外部或与其邻近的一个或多个氨基酸的缺失、代替或取代。“接头”意指包含一个或多个氨基酸的氨基酸序列,其可被引入蛋白水解环或切割位点内,或者其可代替蛋白水解环或切割位点处一些或全部氨基酸。可设计接头以确保蛋白水解环或切割位点内的任意氨基酸的缺失不破坏修饰的ha的表达或随后的活性。
在植物中表达修饰的ha时,与相同条件下植物中所表达的天然ha相比,通过修饰或缺失蛋白水解环使ha蛋白稳定,可实现产物或蛋白产量的增加。此外,与相同条件下植物中所表达的天然ha相比时,通过修饰或缺失蛋白水解环,降低了被表达的修饰ha的表达变异性,以及增加了产生的修饰ha的一致性。
因此,本发明也包括增加植物中ha蛋白的产物产量的方法。不希望受理论束缚,据信通过修饰或缺失ha蛋白中的蛋白水解环,提供了改善的抵抗植物中蛋白水解的稳定性,高尔基体分泌过程中ha传代期间以及纯化过程期间的稳定性。
此外,本发明也包括提高植物中所表达的ha蛋白的产物质量的方法。产物质量意指,例如增加的在植物中所表达的ha的产物产量、产物稳定性(例如增加的植物中所表达的ha的稳定性)、产物的一致性(例如产生同质产物,例如ha0),或上述项的组合。
产物或蛋白产量的增加,其意指与不具有去除的蛋白水解环的相同ha蛋白的产物或蛋白产量相比时,使用本领域标准技术所测定的约20%至约100%或其间的任意量,例如,约40%至约70%或其间的任意值,例如约20%、22%、24%、25%、26%、28%、30%、32%、34%、35%、36%、38%、40%、42%、44%、45%、46%、48%、50%、52%、54%、55%、56%、58%、60%、65%、70%、75%、80%、85%、90%、95%或100%,或其间的任意量的相对蛋白产量的增加。
如图13a和图14中所示,来自b/布里斯班/60/2008的ha在农杆菌渗入的烟草本塞姆氏(nicotianabenthamiana)叶中表达很弱(参见条带1008)。然而,经修饰以缺失蛋白水解环的b型ha的表达(参见条带1059,图13a、图14)导致表达增加。此外,ha-b型与来自a/新喀里多尼亚/20/99的m2的共表达,导致ha表达的增加(参见条带“1008+1261”;和“1059+1261”)。包含蛋白水解环的缺失的b型ha与来自a/波多黎各/8/34的m2的共表达,也导致表达增加(1059+859;图14)。
图46b中进一步显示,经修饰ha以缺失或修饰蛋白水解环时,增加了在农杆菌渗入的烟草本塞姆氏中所表达的来自h7a/杭州/1/13的ha蛋白的蛋白产量。天然(野生型)hah7a/杭州/1/13与来自a/新喀里多尼亚/20/99的m2的共表达,导致100%相对蛋白产量,然而,包含蛋白水解环缺失的hah7a/杭州/1/13与来自a/新喀里多尼亚/20/99的m2的共表达导致182%相对蛋白产量(图46b)。然而,包含蛋白水解环缺失的ha的相对蛋白产量的增加不取决于m2。例如图29a中所示,与天然的h7a/杭州/1/13相比时,包含蛋白水解环缺失的h7a/杭州/1/13表现出表达增加(通过相对ha滴度的测量)。
评估一些策略以便使a毒株和b毒株的ha0的切割失活。被蛋白酶识别的共有序列被附在延伸环上、暴露于溶剂,并且靠近蛋白的膜远侧部分。在b毒株中,该环含有被蛋白酶识别的2个序列基序,以及ha2结构域的前面的n-端氨基酸。使ha0前体的切割失活的点突变方法(例如参见下面的表2),在没有增加b毒株vlp累积的情况下导致ha0产生。包含2个蛋白酶切割基序(7个氨基酸)的序列基序的缺失,废除了bha的累积。去除来自b毒株的ha蛋白的全部18-氨基酸的环,并且插入接头以维持蛋白结构的结构特征(β链)是有效的(参见下面;图13a、14、16a、17b)。a毒株的ha蛋白中蛋白水解环的去除或代替也是有效的(参见图20、22)。
氨基酸序列缺失和插入包括氨基酸的缺失和插入氨基酸。流感b中缺失的非限制性实例为,例如,在图18c所示的流感b弗罗里达和流感b马来西亚所示的,成熟ha蛋白的位置340至357的17个氨基酸(akllkergffgaiagfle)的缺失。该缺失可被适当的接头代替以连接正确表达的多肽链,例如但不限于,使用图21b所示的序列“gg”(seqidno:17;修饰的b/布里斯班/60/2008;用gg代替akllkergffgaiagfleg;例如构建体1059,图5d,10;构建体1039,图8b或构建体1467;图7d、7e)。可选的代替使得包括如图21c所示(seqidno:18)的用“gsssgsssg”代替“ppakllker”。此外,如图19所示,对于流感h5/印度尼西亚,序列“resrrkkr”可被“tetr”或“tetq”代替。
用于来自a毒株的ha的可选的氨基酸突变包括氨基酸取代、插入和缺失,例如但不限于h5安徽的蛋白水解环区域的氨基酸序列“rerrrkrglfgaiagfie”的缺失、包含“resrrkkrglfgaiagfie”的h5indo的蛋白水解环区域的氨基酸序列的缺失,或h5越南的蛋白水解环区域的氨基酸序列“rerrrkkrglfgaiagfie”的缺失。对于h3,序列“rnvpekqtrgif”可被缺失或被适当的接头序列代替,例如但不限于图21e所示的“gs”(seqidno:20)。可选地,h3中的序列“rnvpekqtr”可被图21f所示的“gssgssgss”代替(seqidno:21;修饰的h3a/珀斯/16/2009)。
此外,修饰或改变ha的蛋白水解环或切割位点以减少或废除蛋白水解环或切割位点的蛋白酶切割,也可包含非-保守氨基酸的取代,即用具有不同结构和/或化学特性的另一种氨基酸代替一种氨基酸。非-蛋白氨基酸也可被用来取代。例如,氨基酸的取代可包括通过亲水性氨基酸代替疏水性氨基酸。氨基酸的取代可包括通过蛋白质氨基酸的非自然发生的氨基酸或通过其自然发生的氨基酸的衍生物的代替。
用于来自b毒株和/或a毒株的ha的氨基酸突变可包括氨基酸缺失。例如为了减少或废除蛋白水解环或切割位点的蛋白酶切割,在蛋白水解环或切割位点序列内缺失或去除一个或多个氨基酸。缺失的非限制性实例包括去除天然hah5蛋白的氨基酸323至341,例如图18c所示的h5安徽(rerrrkrglfgaiagfie)、h5indo(resrrkkrglfgaiagfie),或h5越南(rerrrkkrglfgaiagfie)。对于h3,序列“rnvpekqtrgif”可被“gs”代替(图21e;seqidno:20),或h3序列“rnvpekqtr”可被“gssgssgss”代替(图21f;seqidno:21)。对于b毒株,序列“akllkergffgaiagfle”可被缺失和/或被序列“gg”代替,如图21b所示(seqidno:17),序列“akllkergffgaiagfleg”可被“gg”代替,或序列“ppakllker”被“gsssgsssg”代替(图21c;seqidno:18)。
可使用本领域已知的遗传或化学方法生成氨基酸突变。遗传方法可包括定点诱变、pcr、基因合成等等。考虑了通过除遗传改造以外的方法来改变氨基酸侧链基团的方法(如化学修饰),也是有用的。
因此,本发明的血凝素(ha)序列可包含修饰的蛋白水解环序列或切割位点,从而减少或废除蛋白水解环或切割位点的蛋白酶切割。血凝素多肽序列可包含修饰的蛋白水解环或修饰的切割位点序列,例如图5d、7d、8a、18c、19、21b、21c、21e、21f、24d、25d和26d所述的。使用本领域已知的许多方法,包括序列比对(参见例如图15),可确定或预测任何流感毒株的任何血凝素多肽序列的切割位点。
来自h1、h3和bha的序列分析揭示,h1具有直接在融合肽之前的一个单碱性蛋白水解位点(克拉拉(clara)型单碱性:q/exr),然而h3和bha具有2个蛋白水解位点,其中一个位点被克拉拉-样蛋白酶识别(如h1中发现的),以及另一个位点被胰蛋白酶和胰凝乳蛋白酶-样蛋白酶(p-e/a-k)识别。关于这些ha的切割的共有序列如表1中所示。
表1:关于前体ha0切割的蛋白水解位点的共有序列。被克拉拉(clara)类胰蛋白酶或胰蛋白酶/胰凝乳蛋白酶(chimotrypsine)识别的序列分别斜体和黑体显示。一些ha毒株包含多碱性的弗林型切割位点(rkkr;纯文本,加下划线)。
为了避免ha的ha0前体潜在的蛋白水解切割,只有一个蛋白水解位点可能需要从h1的序列中修饰,然而,在h3和b的情况下,两个单碱性位点可能需要被修饰。
例如,通过用ile代替lys341(成熟蛋白编号),可消除b/弗罗里达和b/布里斯班的ha0的第一个切割位点(参见表2)。通过用niq代替融合肽之前的三个氨基酸ker(344-346),可废除第二个单碱性位点。表2中提供了ha的一些修饰的蛋白水解环的序列。
表2:破坏前体ha0的切割的突变的实例描述。单碱性的位点斜体(克拉拉-样蛋白酶识别)且黑体(非下划线;胰蛋白酶/胰凝乳蛋白酶-样)显示。突变被显示为黑体且加下划线。箭头代表用于将ha0转化为ha1-ha2的切割位点。
在又一个实施例中,ha0的包含蛋白水解环的序列可被代替或缺失。例如,图21e中提供h3变体,其含有除了ha2的n-端氨基酸gifgia的缺失之外,ha1的c-端的序列rnvpekqt的缺失。缩短的ha1-ha2可通过gs接头连在一起。
在另一个实施例中,例如在h3中,含有蛋白水解切割位点的环可被柔性接头代替,并且ha2部分可保持完整。可设计(gss)3接头以便适应缩短的ha1与ha2(参见图21f)。
在另一个实施例中,来自流感b的ha可含有除ha2的n-端氨基酸gffgaiagfleg的缺失之外的,ha1的c-端处的序列alkllker的缺失。缩短的ha1-ha2可被gg接头连在一起(参见例如图21b;构建体1008)。图13a和b中显示该构建体的表达。
在另一个实施例中,含有蛋白水解位点的环的来自流感b的ha可被柔性接头代替,并且ha2部分保持完整。可设计较长的gsss接头以便适应缩短的ha1与ha2(参见例如图21c)。
如图13a和14所示,来自b/布里斯班/60/2008的ha在农杆菌渗入的烟草本塞姆氏叶中表达很弱(参见条带1008)。然而,经修饰以缺失蛋白水解环的hab型的表达(参见条带1059,图13a,图14)导致表达增加。此外,ha-b型与来自a/新喀里多尼亚/20/99的m2的共表达,导致ha表达的增加(参见条带“1008+1261”;和“1059+1261”)。包含蛋白水解环缺失的hab型与来自a/波多黎各/8/34的m2的共表达,也导致表达增加(1059+859;图14)。
在类似的方式中,h5/indo的蛋白水解环的缺失,并且用“gg”(构建体928;参见图46d)、“tetr”(构建体676;也参见图19、24d)或“tetq”(构建体766;也参见图19、25d)序列的代替,导致表达水平比得上或增加超过天然h5/indo(构建体489;参见图20和23)所观察到的表达水平。
如图13b所示,与不具有去除的蛋白水解环的ha蛋白相比时,通过缺失ha0的蛋白水解环(如图21b所示的序列),得到的ha0蛋白呈现出以较强的血凝能力所显示的增加的活性。
活性增加,其意指与不具有去除的蛋白水解环的相同ha蛋白的活性相比时,使用本领域的标准技术所测定的约2%至约100%,或其间的任意量,例如,约10%至约50%或其间的任意值,例如约2、5、8、10、12、15、18、20、22、24、25、26、28、30、32、34、35、36、38、40、42、44、45、46、48、50、52、54、55、56、58、60、65、70、75、80、85、90、95或100%,或者其间的任意量的血凝能力的增加。
本发明也包括编码来自例如修饰的h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha的修饰的ha的核苷酸序列,或者在严格的条件下与h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha杂交的任何核苷酸序列,或者在严格的杂交条件下与h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha的互补物杂交的核苷酸序列,其中所述核苷酸序列编码血凝素蛋白,其表达形成vlp,并且vlp诱导抗体的产生。例如,植物细胞内核苷酸序列的表达形成vlp,并且vlp可被用来产生能够结合ha的抗体,所述ha包括来自b或h3的成熟ha。当被施用于对象时,vlp诱导免疫应答。优选地,vlp诱导抗体的产生,并且当被施用于对象时,vlp诱导免疫应答。
例如,植物细胞内核苷酸序列的表达形成vlp,并且vlp可被用来产生能够结合诸如ha的病毒蛋白的抗体,例如,所述ha包括但不限于ha0、具有蛋白水解环缺失的或修饰的ha0蛋白、一种或多种流感型或亚型的ha1或ha2,例如但不限于亚型h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16、b型ha。当被施用于对象时,vlp诱导免疫应答。
严格的杂交条件下的杂交是本领域已知的(参见例如currentprotocolsinmolecularbiology,ausubel等,编著.1995和supplements;maniatis等,inmolecularcloning(alaboratorymanual),coldspringharborlaboratory,1982;sambrook和russell,inmolecularcloning:alaboratorymanual,第三版2001;其各自通过引用并入本文)。该严格杂交条件的一个实例可为:在65℃下于4xssc中约16-20小时的杂交,随后在65℃下用0.1xssc冲洗1小时,或在65℃下用0.1xssc二次冲洗,每次20或30分钟。可选地,示例性严格杂交条件可为:42℃下于50%甲酰胺,4xssc中过夜(16-20小时),随后在65℃下用0.1xssc冲洗1小时,或65℃下用0.1xssc二次冲洗,每次20或30分钟,或过夜(16-20小时),或者在65℃下于church磷酸盐缓冲液(7%sds;0.5mnapo4缓冲液ph7.2;10mmedta)中杂交,50℃下用0.1xssc、0.1%sds二次冲洗,每次20或30分钟,或者在65℃下用2xssc、0.1%sds二次冲洗,每次20或30分钟。
此外,本发明包括这样的核苷酸序列,其特点为与编码h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16或b型ha的核苷酸序列具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性,其中所述核苷酸序列编码具有修饰的蛋白水解环序列或切割位点的血凝素蛋白(修饰的ha),其减少或废除了蛋白水解环或切割位点的蛋白酶切割。当表达编码修饰的ha的核苷酸序列时,其形成vlp,并且所述vlp诱导抗体的产生。例如,植物细胞内核苷酸序列的表达形成vlp,并且所述vlp可被用来产生能够结合ha的抗体,所述ha包括未加工的ha(ha0)或未被加工,其中蛋白水解环已被缺失。当被施用于对象时,vlp诱导免疫应答。
此外,本发明包括这样的核苷酸序列,其特点为与核苷酸序列seqidno:43、91、95、97、99、101、103、105、107、109、111、113、137、140、144、151、158、165具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性,其中所述核苷酸序列编码修饰的ha蛋白,当其表达时形成vlp,并且所述vlp诱导产生能够结合ha的抗体,所述ha包括未加工的ha(ha0)或未被加工,其中蛋白水解环已被缺失或修饰。当被施用于对象时,vlp诱导免疫应答。
此外,本发明包括这样的氨基酸序列,其特点为与氨基酸序列seqidno:17、18、20、21、41、58、77、81、85、92、96、98、100、102、104、106、108、110、112、114、134、143、147、154、161、168、194和199具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性。其中所述氨基酸序列编码修饰的ha蛋白,当其表达时形成vlp,并且所述vlp诱导产生能够结合ha的抗体,所述ha包括未加工的ha(ha0)或未被加工的,其中蛋白水解环已被缺失或修饰。当被施用于对象时,vlp诱导免疫应答。
可使用如dnasis(例如,使用,但不限于以下的参数:gap罚分5,顶部对角的#5,固定的gap罚分10,k-串2,浮动缺口10,和窗口大小5)内所提供的核苷酸序列比对程序,测定序列同一性或序列相似性。然而,用于比较的序列对比的其他方法是本领域公知的,例如smith&waterman的算法(1981,adv.appl.math.2:482)、needleman&wunsch的算法(j.mol.biol.48:443,1970)、pearson&lipman的算法(1988,proc.nat'l.acad.sci.usa85:2444),并且通过计算机实施这些算法(例如gap、bestfit、fasta和blast),或通过手工比对和目视检查。来自不同流感毒株的ha的序列比对的实例见于图24。
例如,但不限于,编码以下的核苷酸序列:
-具有如seqidno:17、seqidno:18、seqidno:41、seqidno:43、seqidno:58、seqidno:96、seqidno:98、seqidno:100、seqidno:102、seqidno:104、seqidno:106、seqidno:108、seqidno:110、seqidno:112、seqidno:114和seqidno:168所定义的修饰的蛋白水解环的b型ha;或者编码以下的核苷酸序列:具有如seqidno:65、seqidno:72、seqidno:73、seqidno:95、seqidno:97、seqidno:99、seqidno:101、seqidno:103、seqidno:105、seqidno:107、seqidno:109、seqidno:111、seqidno:113和seidno:165所定义的修饰的蛋白水解环区域的b型ha。
-具有修饰的蛋白水解环的h1包括含有如seqidno:63所定义的修饰的切割位点的序列。
-具有修饰的蛋白水解环的h2包括含有如seqidno:134所定义的修饰的切割位点的序列。
-具有修饰的蛋白水解环的h3包括如seqidno:20、seqidno:21、seqidno143、seqidno:147所定义的序列或含有如seqidno:64所定义的修饰的切割位点的序列。
-具有缺失的蛋白水解环的h5包括含有如seqidno:61、seqidno:62、seqidno:69、seqidno:70、seqidno:71所定义的修饰的切割位点的序列。
-具有修饰的蛋白水解环的h7包括含有如seqidno:154所定义的修饰的切割位点的序列,或者编码含有如seqidno:151所定义的修饰的蛋白水解环区域的h7型ha的核苷酸序列。
-具有修饰的蛋白水解环的h9包括含有如seqidno:161所定义的修饰的切割位点的序列,或编码含有如seqidno:158中所定义的修饰的蛋白水解环区域的h9型ha的核苷酸序列。
本发明关于包含跨膜结构域并且包括ha1和ha2结构域的ha蛋白的用途,例如所述ha蛋白可为ha0,或包含ha1和ha2的加工的ha。使用植物或植物细胞表达系统,ha蛋白可被用于产生或形成vlp。
扩增元件和增强子元件/调控元件
在另一个实施例中,修饰ha蛋白可在包含扩增元件和/或调控元件或区域(本文也被称为增强子元件)的表达系统中表达。例如来自双粒病毒组的扩增元件,如例如,来自菜豆黄矮病毒(beydv)的扩增元件可被用来表达修饰的ha。beydv属于适合于双子叶植物的玉米线条虫属(mastreviruses)。beydv是具有单链环状dna基因组的单组分,并且其可通过滚环机制复制至十分高的拷贝数。beydv-来源的dna复制子载体系统,已被用于在植物中快速高产量的蛋白产生。
本文所使用的短语“扩增元件”指包含至少一部分的双粒病毒组基因组的一个或多个长基因间隔区(lir)的核酸节段。本文所使用的“长基因间隔区”指含有能够通过双粒病毒组rep蛋白调节切除和复制的rep结合位点的长基因间隔区的区域。在一些方面中,包含一个或多个lirs的核酸节段,还可包含双粒病毒组基因组的短基因间隔区(sir)。如本文所使用的,“短基因间隔区”指互补链(玉米线条虫属的短ir(sir))。本文可使用任何适合的双粒病毒组-来源的扩增元件。参见,例如,wo2000/20557;wo2010/025285;zhangx等(2005,biotechnologyandbioengineering,vol.93,271-279),huangz等(2009,biotechnologyandbioengineering,vol.103,706-714),huangz等(2009,biotechnologyandbioengineering,vol.106,9-17);其通过引用并入本文)。如果在所述构建体中使用多于一个lir,例如两个lirs,那么对于两个lirs的每一个来说,启动子、cmpv-ht区域和目标核酸序列以及终止子是相等的。
如本文所描述的,通过烟草本塞姆氏叶的农杆菌渗入,菜豆黄矮病毒(beydv)-来源的载体和rep/repa-供应载体的共递呈,导致有效的复制子扩增和大量的蛋白产生。来自转化有驱动具有或没有蛋白水解环去除的修饰的流感bha(来自b/布里斯班/60/2008)(参见图17a的构建体)在存在或不存在扩增元件beydv(构建体1059号和1039号)时的表达的基因构建体的植物的蛋白提取物的western印迹分析表明,当调控元件是cpmv-ht,在不存在beydv时,可检测到流感bha无累积(图17b),。
如图17b所示,通过western印迹分析,来自b/布里斯班/60/2008的具有蛋白水解环去除的ha,在不存在beydv时的表达不会导致可检测的表达(参见图17b中的条带1039)。然而,具有蛋白水解环去除的hab型,在存在扩增元件beydv时的表达,导致增加的表达(参见条带1059)。同样地,在不存在beydv时,包含蛋白水解环缺失的突变体ha-b型与来自a/新喀里多尼亚/20/99的m2的共表达,不会导致可检测的ha表达(参见图17b中的条带“1039+1261”)。另一方面,包含蛋白水解环缺失的突变体ha-b型,在存在beydv时,与来自a/新喀里多尼亚/20/99的m2的共表达导致增加的表达(参见条带“1059+1261”;图17b)。
然而,当增强子元件存在于表达系统中,且当增强元件不是cpmv-ht时,beydv的存在不是必须的。例如,如图29a所示,在不存在beydv时,在诸如cpmv160、cpmv160+或cpmvht+的增强子元件的控制下不同bha毒株的表达导致ha蛋白的产生,其表现出增加的血凝滴度(hmg)。
因此,突变体(修饰的)ha蛋白可在不存在扩增元件,如基于双粒病毒组的扩增元件(例如beydv),但在存在诸如cpmv160、cpmv160+或cpmvht+的增强子元件下表达。
突变体(修饰的)ha可在存在诸如cpmv160、cpmv160+或cpmvht+的增强子元件,但在不存在或存在诸如beydv的扩增元件下表达。如图28b、28c和28f所示,突变体(修饰的)ha可在增强子元件的存在下,有或无扩增元件存在下表达。因此本发明也涉及突变体(修饰的)ha在增强子元件和任选的扩增元件的存在下表达。
当与野生型或包含cpmvht的ha构建体相比时,包含增强子元件(cmpvht+或cmpv160+)和用gg接头代替蛋白水解环(缺失的蛋白水解环)的ha构建体,呈现出增加的表达(图28a,h3珀斯(per);图28b,b马来西亚;图28c,h9hk(香港);图29d,b马萨诸塞州(mass);图28e,h2新加坡(sin))。
图29a呈现在植物中所产生的包含基于cpmvht、cpmvht+、cpmv160或cpmv160+的增强子元件的修饰ha蛋白质或天然ha的血凝滴度的总结数据,所述增强子元件与编码具有缺失的蛋白水解环(gg接头)的修饰ha或天然ha的核苷酸序列可操作地连接。在大多数的情况下,基于cpmvht+、cpmv160或cpmv160+构建体的表达较高(测定为血凝滴度),表明显著的表达水平。
增强子元件可被用来实现具有修饰的蛋白水解环的突变体(修饰的)ha蛋白的高水平的瞬转表达。增强子元件可基于rna植物病毒,包括豇豆花叶病毒组,如豇豆花叶病毒(cpmv;参见,例如,wo2007/135480;wo2009/087391;us2010/0287670,sainsburyf等,2008,plantphysiology;148:121-1218;sainsburyf等,2008,plantbiotechnologyjournal;6:82-92;sainsburyf等,2009,plantbiotechnologyjournal;7:682-693;sainsbury等,2009,methodsinmolecularbiology,recombinantproteinsfromplant,vol.483:25-39)。
cpmv160(cpmvx)和cpmv160+(cpmvx+)
在一个实施方案中,增强子元件为us61/925,852中所描述的“cpmvx”(也被称为“cpmv160”)和/或“cpmvx+”(也被称为“cpmv160+”),其通过引用并入本文。
表达增强子“cpmvx”包含豇豆花叶病毒组的豇豆花叶病毒(cpmv)5’非翻译区(utr)。来自cpmvrna-2序列(seqidno:93)的核苷酸1-160的5’utr,起始于转录起始位点至第一个框内起始密码子(在位置161),其作为用于产生由野生型豇豆花叶病毒基因组片段编码的两个羧基共末端蛋白的较长者的起始位点。此外,cpmvrna-2基因组序列中在(或对应于)位置115处的‘第三个’起始位点也可被突变、缺失或否则改变。已表明,当与不完整m蛋白结合时,除了aug161的去除之外,aug115的去除提高了表达(sainsburyandlomonossoff,2008,plantphysiology;148:1212-1218;wo2009/087391;其通过引用并入本文)。
cpmvx包含seqidno:93的x个核苷酸,其中seqidno:93的x=160、155、150或114,或者包含与cpmvx具有80%至100%序列相似性的序列,其中seqidno:93的x=160、155、150或114。该表达增强子通常被称为cpmvx(参见图26a)。
表达增强子cpmvx,其中x=160,由seqidno:93的核苷酸1-160组成:
1tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc
61ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc
121gatcttcaacgttgtcagatcgtgcttcggcaccagtaca(seqidno:93)
cpmvx增强子序列还可与填充序列融合,其中cmpvx包含seqidno:1的x个核苷酸,其中seqidno:1的x=160、155、150或114,或者包含与cpmvx具有80至100%序列相似性的序列,其中seqidno:93的x=160、155、150或114,并且填充序列包含与cmpvx序列3’端融合的1-100个核苷酸。例如,填充序列可包含约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸,或其间任意数量的核苷酸。
如果cmpvx序列包含填充片段,那么该表达增强子可被称为cpmvx+(参见图26a),其中seqidno:1的x=160、155、150、114,其也可被称为包含填充序列的cmpvx,或其可被分别地称为cpmv160+;cpmv155+;cpmv150+;cpmv114+,此时x=160、155、50或114。包含cpmvx(其不包含填充序列)的构建体被称为cpmvx+,其中seqidno:93的x=160、155、150、114,并且其中填充序列为0个长度的核苷酸。
可通过位于核苷酸160的3’端的天然cmpv5’utr序列的截短、缺失或代替来修饰填充序列。当与连接有5’utr的原始的或未修饰的(即天然的)填充序列相比时,修饰的填充序列可被去除、代替、截短或缩短(如在sainsburyf.andlomonossoffg.p.,2008,plantphysiol.148:pp.1212-1218所述)。填充序列可包含一个或多个限制性位点(多接头、多克隆位点、一个或多个克隆位点),一个或多个植物kozak序列,一个或多个接头序列,一个或多个重组位点或其组合。例如,其不应被认为是限制,填充序列可连续地包含与植物kozak序列融合的预期长度的多克隆位点。填充序列不包含来自位于天然cpmv5’utr的核苷酸160的3’的天然5’utr序列的核苷酸序列,例如sainsburyf.,andlomonossoffg.p.的图1中所示的核苷酸161至512(2008,plantphysiol.148:pp.1212-1218;其通过引用并入本文),或seqidno:4的核苷酸161-509。就是说,在本发明中,存在于现有技术的cpmvht序列中的不完整m蛋白(sainsburyf.,andlomonossoffg.p.,2008的图1中)从5’utr被去除。
植物kozak共有序列是本领域已知的(参见,例如rangan等.mol.biotechnol.,2008,july39(3),pp.207-213)。自然发生的和合成的kozak序列均可被用于表达增强子中,或可与本文所描述的目标核苷酸序列融合。
植物kozak序列可为任何已知的植物kozak序列(参见,例如l.rangan等.mol.biotechnol.2008),其包括但不限于以下的植物共有序列:
caa(a/c)a(seqidno:174;植物界)
aaa(a/c)a(seqidno:175;双子叶植物)
aa(a/g)(a/c)a(seqidno:176;拟南芥)
植物kozak序列也可选自:
agaaa(seqidno:177)
agaca(seqidno:178)
aggaa(seqidno:179)
aaaaa(seqidno:180)
aaaca(seqidno:181)
aagca(seqidno:182)
aagaa(seqidno:183)
aaagaa(seqidno:184)
aaagaa(seqidno:185)
(a/-)a(a/g)(a/g)(a/c)a.(seqidno:186;共有序列)
表达增强子cpmvx或cpmvx+,在增强子序列的5’端与在植物中有活性的调控区可操作地连接,并且在表达增强子的3’端与目标核苷酸序列可操作地连接(图26a),以便促使目标核苷酸序列在植物宿主内的表达。
cpmvht+、cpmvht+[wt115]、cpmvht+[511]
在另一个实施方案中,增强子元件为us61/971,274中所描述的“cpmvht+”,其通过引用并入本文。表达增强子“cpmvht+”(参见图27a)包含豇豆花叶病毒5’非翻译区(utr)和修饰的、延长的或截短的填充序列。
也提供植物表达系统,其包括包含调控区的第一核苷酸序列和编码修饰的ha的核苷酸序列,所述调控区与本文所描述的一个或多于一个表达增强子(例如cpmvht+、cpmvht+[wt115]、cpmvht+[511])可操作地连接。此外,描述了包含启动子(调控区)序列、表达增强子(例如cpmvht+或cpmvht+[wt115])的核酸,所述表达增强子包含豇豆花叶病毒5’utr和与编码修饰的ha的一个或多个核酸序列融合的具有植物kozak序列的填充序列。核酸还可包含含有豇豆花叶病毒3’非翻译区(utr)(例如,质体蓝素3’utr或在植物中有活性的其他3’utr)和终止子序列(例如nos终止子)的序列,所述序列与编码修饰的ha的核苷酸序列(在图27a中被称为目标核苷酸)的3’端可操作地连接,以便将编码修饰ha的核苷酸序列插入豇豆花叶病毒3’非翻译区(utr)、质体蓝素3’utr或其他3’utr序列上游。
seqidno:173包含现有技术中已知的“cpmvht”表达增强子(例如sainsburyandlomonossoff2008,plantphysiol.148:pp.1212-1218的图1;其通过引用并入本文)。cpmvht包括来自在位置115(cgt)处具有修饰的核苷酸的seqidno:173的核苷酸1-160的5’utr序列以及在位置162(acg)处具有修饰的核苷酸的不完整m蛋白,并且缺少植物kozak序列(5’utr:核苷酸1-160;加下划线的不完整m蛋白,核苷酸161–509)。seqidno:173也包括不存在于现有技术cpmvht序列中的多克隆位点(斜体,核苷酸510-528):
seqidno:187中提供了具有植物kozak共有序列的cpmvht+(核苷酸1-160,5’utr,其包含位置115(gtg)处小写黑体且斜体的修饰的atg;填充片段包含:加下划线的不完整m蛋白,核苷酸161–509,在162(acg)处具有修饰的核苷酸;多克隆位点,斜体,核苷酸510-528;以及共有植物kozak序列,大写且黑体,核苷酸529-534)。
seqidno:188(“cpmvht+511”)包含核苷酸1-154的cpmvrna2基因组的天然序列的节段。来自seqidno:188的核苷酸1-511的5’utr序列包含在位置115(“g”代替“a”;斜体粗体)和162(“c”代替“t”;斜体粗体)处修饰的“atg”序列,和来自核苷酸161-511的不完整m蛋白(加下划线)。cpmvht+511包含天然m蛋白的kozak共有序列(核苷酸508-511;粗体):
通过seqidno:189(cpmvht+[wt115])的序列提供cpmvht+增强子序列的另一个非限制性实例。表达盒或载体也是本发明的部分,所述表达盒或载体包含cpmvht+并且包括与seqidno:189的表达增强子序列可操作地结合的植物调控区以及与编码修饰的ha的核苷酸序列融合的3’端转录起始位点(atg)。
seqidno:189(cpmvht+[wt115])的核苷酸1-160,5’utr,在位置115-117处具有atg,小写粗体;填充片段包含:加下划线的不完整m蛋白,核苷酸161-509,在位置161-163(161-153)处的小写粗体且加下划线的修饰的atg,多克隆位点,斜体,核苷酸510-528;以及植物kozak序列,大写且粗体,核苷酸529-534)。
seqidno:189的植物kozak序列可为任何植物kozak序列,包括但不限于seqidno’s:174-186的序列之一。
“嵌合蛋白”
修饰ha还可为嵌合蛋白。“嵌合病毒蛋白”或“嵌合病毒多肽”,也被称为“嵌合蛋白”或“嵌合多肽”,或者“嵌合ha”,其意指包含来自两种或更多种来源例如但不限于两种或更多种流感型或流感亚型,或者不同起源的流感的氨基酸序列的蛋白或多肽,其被融合为单一多肽。嵌合蛋白或多肽可包括与所述多肽或蛋白的剩余物相同或与其异源的信号肽。嵌合蛋白或嵌合多肽可以作为嵌合核苷酸序列的转录物并且随后合成而产生,并且根据需要可结合形成多亚基蛋白。因此,嵌合蛋白或嵌合多肽也包括包含经二硫键结合的亚基的蛋白或多肽(即多亚基蛋白)。例如,包含来自两种或更多种来源的氨基酸序列的嵌合多肽可被加工成亚基,且亚基经二硫键结合以产生嵌合蛋白或嵌合多肽。嵌合ha蛋白也可包含第一流感病毒的抗原蛋白或其片段,和来自第二病毒流感ha的跨膜结构域复合体(tdc),所述复合体(tdc)包括跨膜结构域和胞浆尾结构域(tm/ct)。多肽可为修饰的ha,并且组成多肽的两种或更多种的氨基酸序列的每一种可获自不同的ha的氨基酸序列,以产生嵌合ha、嵌合流感ha、嵌合修饰的ha或嵌合修饰的流感ha。嵌合ha也可包括包含异源信号肽的氨基酸序列(嵌合ha前蛋白),所述信号肽在蛋白合成之后或期间被切除。优选地,嵌合多肽或嵌合的流感ha不是自然发生的。编码嵌合多肽的核酸可被描述为“嵌合核酸”或“嵌合核苷酸序列”。例如嵌合核酸可为包含编码修饰的ha的核苷酸序列,所述嵌合核酸包含按顺序编码修饰的ha胞外域、流感跨膜结构域和胞质尾区的嵌合核苷酸序列,其中修饰的ha胞外域包含修饰的蛋白水解环且来自第一流感毒株,而跨膜结构域和胞质尾区来自第二流感毒株。实施例5.14、5.16、5.18、5.19、5.21和5.23中给出了嵌合核苷酸的实例,其中修饰的ha胞外域来自第一流感毒株,并且跨膜结构域和胞质尾区来自第二流感毒株。包含嵌合ha的病毒样颗粒可被描述为“嵌合vlp”。
如上所述,嵌合蛋白、嵌合多肽或嵌合ha可包括与所述多肽或蛋白的剩余物相同或与其异源的信号肽。术语“信号肽”是本领域已知的,并且通常指通常存在于多肽的n-端的短(约5-30个氨基酸)序列的氨基酸,其可引导最新翻译的多肽迁移至具体的细胞器,或协助多肽链的具体结构域相对于其它结构域的定位。作为非限制性实例,信号肽可靶向蛋白迁移至内质网,和/或协助n-端近侧结构域相对于新生多肽的膜-锚定结构域的定位,以协助诸如修饰的ha或嵌合修饰的ha的成熟蛋白的切割和折叠。
ha也可为嵌合ha或嵌合修饰的ha,其中ha或修饰的ha的天然跨膜结构域被异源跨膜结构域代替。ha蛋白的跨膜结构域是高度保守的(参见,例如wo2010/148511的图1c;其通过引用并入本文)。异源跨膜结构域可获自任何ha的跨膜结构域,例如但不限于来自以下的跨膜结构域:h1加利福尼亚、b/弗罗里达/4/2006(genbank登录号aca33493.1)、b/马来西亚/2506/2004(genbank登录号abu99194.1)、h1/bri(genbank登录号ade28750.1)、h1a/所罗门群岛/3/2006(genbank登录号abu99109.1)、h1/nc(genbank登录号aap34324.1)、h2a/新加坡/1/1957(genbank登录号aaa64366.1)、h3a/布里斯班/10/2007(genbank登录号aci26318.1)、h3a/威斯康星州/67/2005(genbank登录号abo37599.1)、h5a/安徽/1/2005(genbank登录号abd28180.1)、h5a/越南/1194/2004(genbank登录号acr48874.1)、h5-indo(genbank登录号abw06108.1)。跨膜结构域也可通过以下的共有氨基酸序列定义:
ilxiyystvaisslxlxxmlagxsxwmcs(seqidno:94)
包含具有异源跨膜结构域的嵌合ha的构建体实例包括:构建体1875号(cpmv-ht+具有缺失的蛋白水解环的b布里斯班/60/08+h1tm,具有被h1a/加利福尼亚/07/2009所代替的跨膜结构域和胞质尾区;参见实施例5.19),构建体1977号(cpmv-160+具有缺失的蛋白水解环的b布里斯班/60/08+h1tm,具有被h1a/加利福尼亚/07/2009所代替的跨膜结构域和胞质尾区;参见实施例5.14),构建体1067号(cpmv-ht+具有缺失的蛋白水解环的b布里斯班/60/08+h1tm,具有被h1a/加利福尼亚/07/2009所代替的跨膜结构域和胞质尾区;参见实施例5.14),构建体2074号(cpmvhtb马萨诸塞州/2/2012+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替;参见实施例5.16),构建体2060号(cpmvht160+马萨诸塞州/2/2012+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替;参见实施例5.16),构建体2062号(cpmv160+b马萨诸塞州/2/2012+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区;参见实施例5.21),构建体1860号(cpmvht+b威斯康星州/1/2010+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替;参见实施例5.23),构建体1454号(cpmvhtb威斯康星州/1/2010+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替,参见实施例5.18)和构建体1893号(cpmv160+b威斯康星州/1/2010+h1tm,跨膜结构域和胞质尾区被h1a/加利福尼亚/07/2009的跨膜结构域和胞质尾区代替,参见实施例5.18)。图26b和27b中显示这些嵌合修饰的ha’s的活性。
信号肽
信号肽(sp)可源于修饰的ha或嵌合修饰的ha,或者信号肽可与被表达的修饰ha的初级序列异源。修饰的ha可包含与来自一种或多种不同流感型、流感亚型或流感毒株的ha平衡的来自第一流感型、流感亚型或流感毒株的信号肽。例如ha的h1亚型、h2亚型、h3亚型、h5亚型、h6亚型、h7亚型、h9亚型或b型流感的天然信号肽可被用来在植物体系中表达修饰的ha。在本发明的一些实施方案中,sp可为流感b型、h1型、h3型或h5型;或为h1/bri亚型、h1/nc亚型、h5/indo亚型、h3/bri亚型或b/flo亚型。
此外,修饰的ha或嵌合修饰的ha可包含天然或非-天然信号肽;非-天然信号肽可为植物来源或获自动物或细菌多肽。天然信号肽可对应于被表达的ha或修饰ha的信号肽,此外,信号肽可来自除流感外的病毒的结构蛋白或血凝素。可被使用的信号肽的非限制性实例为紫花苜蓿蛋白二硫键异构酶的信号肽(pdisp;登录号z11499的核苷酸32-103,也参见wo2009/076778;wo2010/148511或wo2010/003235),或马铃薯糖蛋白(patatin)信号肽(patasp;位于genbank登录号a08215的核苷酸1738-1806)。该登录号的patasp的核苷酸序列为:
atggcaactactaaaacttttttaattttattttttatgatattagcaactactagttcaacatgtgct(seqidno:171)
马铃薯糖蛋白a信号肽的氨基酸序列为:
mattktflilffmilattsstca(seqidno:172)
因此本发明提供包含天然或非-天然信号肽的修饰的ha或嵌合修饰的ha,以及编码这样的嵌合修饰的ha蛋白的核酸。
与通道蛋白的共表达
可通过共表达编码修饰的ha的第一核酸与编码通道蛋白例如但不限于质子通道蛋白的第二核酸,在植物中产生突变的(修饰的)ha。第一和第二核酸可在相同的步骤中被引入植物,或它们可被连续地引入植物。可以瞬转的方式或以稳定的方式将第一和第二核酸引入植物。此外,表达编码修饰的ha的第一核酸的植物可转化有通道蛋白,例如但不限于质子通道蛋白(第二核酸),以便第一和第二核酸在植物中共表达。可选地,表达通道蛋白例如但不限于质子通道蛋白(第二核酸)的植物可转化有编码修饰ha的第一核酸,以便第一和第二核酸在植物中共表达。此外,表达编码修饰的ha的第一核酸的第一植物可与表达编码通道蛋白例如但不限于质子通道蛋白的第二核酸的第二植物杂交,以产生共表达各自编码修饰的ha和通道蛋白例如但不限于质子通道蛋白的第一和第二核酸的后代植物。
不希望受理论束缚,包含修饰的ha的细胞区室(包括高尔基体)的ph,可对ha的折叠、稳定性和/或蛋白水解作用是重要的。质子通道蛋白,例如流感m2和bm2蛋白可调节细胞区室中的ph。例如,通过缓冲流感病毒复制后期和早期阶段的细胞内区室,m2可调节膜融合的增强作用。
通过与修饰的ha一起共表达通道蛋白例如但不限于质子通道蛋白,高尔基体内的ph可增加,并且导致稳定性的增加、降解的减少或其组合,并且增加修饰的ha和/或vlp的表达水平和产量。
当与表达修饰的ha但不共表达通道蛋白例如但不限于质子通道蛋白的植物相比,通过在植物中与修饰的ha一起共表达通道蛋白例如但不限于质子通道蛋白,观察到ha和/或vlp的产量增加(参见图13a和14)。例如如图13a所示,m2与修饰的流感bha的共表达增加了ha的累积水平(图13a,1059vs1059+1261)。
此外,将来自流感a/波多黎各/8/1934的m2增加修饰的流感bha和h3的累积的功效,与来自流感a/新喀里多尼亚/20/1999的m2增加修饰的流感bha和h3的累积的功效相比较。对于修饰的流感bha,通过对来自转化有构建体1059、1059+1261和1059+859的植物的蛋白提取物的western印迹分析进行比较。获得的结果表明,来自流感a/波多黎各/8/1934的m2(由构建体859号编码)的共表达与来自流感a/新喀里多尼亚/20/1999的m2(由构建体1261号编码)的共表达,在增加修饰的流感bha的累积方面功效相同(图14)。
本文所使用的术语“m2”、“m2蛋白”、“m2序列”和“m2结构域”指分离自、基于或存在于任何自然发生的或人工产生的流感病毒株或分离物的m2蛋白序列的全部或部分。因此,术语m2等等包括在病毒的生命周期期间通过突变所产生的或在对选择性压力(例如,药物治疗、宿主细胞趋性的扩张或感染性等等)的应答中所产生的自然发生的m2序列变体,以及重组或合成所产生的m2序列。可在本发明使用的序列的非限制性实例包括来自a/波多黎各/8/1934的m2和来自a/新喀里多尼亚/20/1999的m2。
免疫应答
“免疫应答”通常指适应性免疫系统的应答。适应性免疫系统通常包含体液应答,以及细胞介导的应答。体液应答是由在b淋巴细胞谱系(b细胞)的细胞中所产生的分泌抗体所介导的免疫力方面。分泌抗体结合入侵微生物(如病毒或细菌)表面上的抗原,其标记入侵微生物用于消灭。体液免疫通常被用来指抗体的产生和伴随抗体产生的过程,以及抗体的效应子功能,其包括th2细胞激活和细胞因子的产生、记忆细胞增殖、调理素促进吞噬作用、病原体的清除等等。术语“调节”或“调整”等指具体的应答或参数的增加或减少,通过通常已知的或使用的任何一些检测(assay)来测定,本文例示了其中一些检测。
细胞介导的应答为免疫应答,其不涉及抗体但涉及巨噬细胞、自然杀伤细胞(nk)、抗原-特异性细胞毒素t-淋巴细胞的活化,以及在对抗原应答中的多种细胞因子的释放。细胞介导的免疫通常被用来指一些th细胞激活、tc细胞激活和t-细胞介导的应答。细胞介导的免疫在对病毒性感染的应答中尤为重要。
例如,可使用elispot检测来测定抗原特异性cd8阳性t淋巴细胞的诱导;可使用增殖检测来测定cd4阳性t-淋巴细胞的刺激。可使用elisa检测来定量抗-流感的抗体滴度;也可使用抗-同型抗体(例如抗-igg、iga、ige或igm)来测定抗原-特异性或交叉反应抗体的同型。用于进行这样的检测的方法和技术是本领域公知的。
交叉反应性的hai滴度也可被用来证明对与疫苗亚型相关的其他病毒株的免疫应答的功效。例如,来自被第一毒株(例如a/印度尼西亚5/05的vlp)的疫苗组合物免疫的对象的血清,可被用于具有完整的病毒或病毒颗粒的第二种毒株(例如a/越南/1194/2004)的hai检测中,并且测定hai滴度。
也可定量细胞因子的存在或水平。例如通过使用elisa(例如bdbiosciencesopteia试剂盒)来测量分泌ifn-γ和il-4的细胞来表征辅助性t细胞的应答(th1/th2)。可培养获自对象的外周血单核细胞(pbmc)或脾细胞,并且分析上清液。也可通过荧光-激活细胞分选法(facs),使用标记物特异性荧光标签定量t淋巴细胞,并且方法是本领域已知的。
也可进行微量中和检测以表征对象中的免疫应答,参见例如rowe等,1973的方法。可通过几种方式获得病毒的中和滴度,其包括:1)细胞的结晶紫固定/着色后溶菌噬斑(噬斑检测)的计数;2)培养物中细胞溶菌的显微镜观察;3)np病毒蛋白(与宿主细胞的病毒感染性相关)的elisa和分光光度检测。
术语“病毒样颗粒”(vlp)”或“病毒-样颗粒”或“vlp”指自我组装的结构并且包含病毒蛋白,例如流感ha蛋白或修饰的ha蛋白(例如ha0蛋白),其中蛋白水解环已被修饰。vlp通常形态学上和抗原性上类似于感染所产生的病毒粒子,但是缺乏足以复制的遗传信息,并且因此为非-感染性的。在一些实例中,vlp可包含单一的蛋白种类,或多于一种蛋白种类。对于包含多于一种蛋白种类的vlp,蛋白种类可来自相同种类的病毒,或可包含来自不同种、属、亚科或科的病毒(通过ictv命名法命名)的蛋白。在其他实施例中,构成vlp的蛋白种类的一种或多种可来自对自然发生的序列进行修饰,例如本文所描述的修饰的ha。vlp可在适合的宿主细胞中产生,其包括植物和昆虫宿主细胞。来自宿主细胞的取提物并且在适合的条件下经分离和进一步纯化后,vlp可被纯化为完整的结构。
此外,可产生包含ha亚型的组合的vlp。例如,vlp可包含来自下述的一种或多种ha或一种或多种修饰的ha:h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型、h16亚型、b亚型ha或其组合。可通过由vlp所制备的疫苗的预期用途来确定选择ha或修饰的ha的组合。例如,用于在接种禽类中使用的疫苗,可包含ha亚型或修饰ha亚型的任意组合,而用于接种人类的vlp可包含一种或多种h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型、h16亚型、b亚型ha,或包含一种或多种修饰的h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型、h16亚型、b亚型ha。然而,可根据vlp的用途制备其他ha亚型或修饰的ha亚型的组合。为了产生包含ha亚型或修饰的亚型ha的组合的vlp,可在相同的细胞例如植物细胞内共表达期望的ha亚型或修饰的ha亚型。
根据本发明,产生自流感来源的蛋白的vlp不包含m1蛋白。已知m1蛋白结合rna(wakefield和brownlee,1989),rna为vlp制备的污染物。当获得用于vlp产物的监管批准时,rna的存在是不理想的,因此缺乏rna的vlp制剂可为有益的。
如本文所述产生的vlp通常不包含神经氨酸苷酶(na)。然而,如果包含ha和na的vlp是理想的,可将na与ha共表达。
本发明也包括但不限于病毒来源vlp,其从表达vlp蛋白的细胞的质膜获得脂质包膜。例如,如果vlp在基于植物的系统中表达,那么所述vlp可获得来自所述细胞的质膜的脂质包膜。
通常,术语“脂质”指脂溶性(亲脂的)自然发生的分子。该术语也被用来更具体地指脂肪酸和其衍生物(包括甘油三酯、甘油二酯和甘油单酯以及磷脂),以及其他脂溶性含有甾醇的代谢物或甾醇类。磷脂连同糖脂类、甾醇类和蛋白是所有生物膜的主要组分。磷脂的实例包括磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰肌醇、磷脂酰丝氨酸等等。甾醇类的实例包括动物甾醇(例如,胆固醇)和植物甾醇。超过200种植物甾醇已在多种植物种类中鉴定,最常见的为菜油甾醇、豆甾醇、麦角甾醇、菜子甾醇、δ-7-豆甾醇、δ-7-燕麦甾醇、daunosterol、谷甾醇、24-甲基胆甾醇、胆固醇或β-谷甾醇。本领域技术人员理解,细胞质膜的脂质组成可随着细胞或获得细胞的有机体的培养或生长条件而变化。
细胞膜通常包含脂质双层,以及用于多种功能的蛋白。脂质双层中可发现局部浓度的特殊脂质,被称为‘脂质筏’。不希望受理论束缚,脂质筏可在胞吞作用和胞吐作用、病毒或其他感染原的进入或排出、细胞内信号转导、细胞或有机体的其他结构组分如细胞内和细胞外基质的相互作用中发挥重大作用。
在植物中,流感vlp从质膜出芽,因此vlp的脂质组成反映了它们的来源。根据本发明所产生的vlp包含与植物来源的脂质复合的一种或多种流感型或流感亚型的ha。植物脂质能刺激特异性免疫细胞并且提高诱导的免疫应答。植物膜由脂质、磷脂酰胆碱(pc)和磷脂酰乙醇胺(pe)组成,并且也含有鞘糖脂、皂苷和植物甾醇。此外,脂质筏也发现于植物质膜中—这些微区富含鞘脂类和甾醇类。在植物中,已知存在多种植物甾醇,其包括豆甾醇、谷甾醇、24-甲基胆甾醇和胆固醇(mongrand等,2004)。
pc和pe,以及鞘糖脂能结合由哺乳免疫细胞如抗原-递呈细胞(apcs)样树突细胞和巨噬细胞以及其他细胞(包括胸腺和肝脏中的b淋巴细胞和t淋巴细胞)所表达的cd1分子(tsujim,.2006)。cd1分子结构上类似于i型的主要组织相容性复合体(mhc)分子,并且其作用是将糖脂类抗原递呈至nkt细胞(自然杀伤t细胞)。一旦激活,nkt细胞激活天然免疫细胞,如nk细胞和树突状细胞,并且也激活适应性免疫细胞,如产生抗体的b细胞和t-细胞。
质膜中可发现多种植物甾醇—具体的补体可根据种类、生长条件、营养资源或病原体状态(列举几个因素)变化。通常,β-谷甾醇是最丰富的植物甾醇。
存在于复合有脂质双层(如质膜来源的包膜)的流感vlp中的植物甾醇,可提供有益的疫苗组合物。不希望受理论束缚,复合有脂质双层(如质膜来源的包膜)植物-产生的vlp,可诱导比其他表达系统中产生的vlp更强的免疫反应,并且可类似于由活或减毒的完整病毒疫苗所诱导的免疫反应。
本文所描述的vlp可复合有植物-来源的脂质双层。在一些实施方案中,植物-来源的脂质双层可包含vlp的包膜。植物来源的脂质可包含产生vlp的植物的质膜的脂质成分,其包括但不限于:磷脂酰胆碱(pc)、磷脂酰乙醇胺(pe)、鞘糖脂、植物甾醇或其组合。植物-来源的脂质可选择性地被称为‘植物脂质’。植物甾醇的实例是本领域已知的,并且其包括,例如,豆甾醇、谷甾醇、24-甲基胆甾醇和胆固醇-参见,例如,mongrand等,2004。
可通过例如凝集检测、电子显微镜或通过尺寸排阻色谱评估vlp的结构和尺寸。
对于尺寸排阻色谱,可通过在提取缓冲液中匀浆(polytron)冻碎的植物材料样品,从植物组织提取总的可溶性蛋白,并且通过离心去除不可溶材料。可使用peg沉淀。定量可溶性蛋白,并且提取物通过分子排阻基质,例如但不限于sephacryltm。层析后,通过免疫印迹进一步分析级分以确定级分的蛋白补体。
不希望受理论束缚,通过ha对唾液酸α2,3或α2,3以及rbc的表面上存在的这些唾液酸的亲和力,驱动ha结合来自不同动物的rbc的能力。来自流感病毒的马和禽ha使来自所有几个物种的红细胞凝集,所述物种包括火鸡、鸡、鸭、豚鼠、人、羊、马和牛;然而人ha结合火鸡、鸡、鸭、豚鼠、人和羊的红细胞(也参见itot.等,1997,virology,vol227,p493-499;和medeirosr等,2001,virology,vol289,p74-85)。
所表达的病毒蛋白的正确折叠,对蛋白的稳定性、多聚体的形成、vlp的形成、病毒蛋白的功能和通过抗体识别病毒蛋白,及其他特性是重要的。蛋白的折叠和累积可受一个或多个因素影响,所述因素包括但不限于:蛋白的序列、蛋白的相对丰度、细胞内聚集的程度、细胞室中的ph、可结合折叠的、部分折叠的或未折叠的蛋白或瞬间与其联合的辅因子的可利用性、一个或多个伴侣蛋白的存在等。
热激蛋白(hsp)或应激蛋白是伴侣蛋白的实例,其可参与多种细胞过程,包括蛋白合成、细胞内运输、错误折叠的预防、蛋白聚集的预防、蛋白复合体的组装和解装配、蛋白折叠和蛋白解聚。这样的伴侣蛋白的实例包括但不限于:hsp60、hsp65、hsp70、hsp90、hsp100、hsp20-30、hsp10、hsp100-200、hsp100、hsp90、lon、tf55、fkbps、亲环素、clpp、grpe、泛素、钙联结蛋白和蛋白二硫化物异构酶(参见,例如,macario,a.j.l.,coldspringharborlaboratoryres.25:59-70.1995;parsell,d.a.&lindquist,s.ann.rev.genet.27:437-496(1993);美国专利第5,232,833号)。本文所描述的伴侣蛋白,例如但不限于hsp40和hsp70,可被用来确保病毒蛋白的折叠。
hsp70的实例包括来自哺乳动物细胞的hsp72和hsc73、来自细菌,特别是分枝细菌,如麻风分枝杆菌(mycobacteriumleprae)、结核分枝杆菌(mycobacteriumtuberculosis)和牛分枝杆菌(mycobacteriumbovis)的dnak(如杆菌-卡介苗:本文被称为hsp7l)。来自大肠杆菌(escherichiacoli)、酵母和其他原核生物的dnak,以及来自真核生物如拟南芥的bip和grp78(lin等2001(cellstressandchaperones6:201-208))。hsp70的具体实例为拟南芥hsp70(由genbank参考号:ay120747.1编码)。hsp70能够特异性地结合atp以及未折叠的多肽和肽,从而参与蛋白的折叠和去折叠,以及参与蛋白复合体的组装和解装配。
hsp40的实例包括来自原核生物(如大肠杆菌和分枝细菌)的dnaj和来自真核生物(如紫花苜蓿)的hsj1、hdjl和hsp40(frugis等,1999.plantmolecularbiology40:397-408)。hsp40的具体实例为紫花苜蓿的msj1(genbank参考号:aj000995.1)。hsp40作为分子伴侣在蛋白折叠、耐热性和dna复制及其他细胞活性中发挥作用。
在合成完全之前,翻译和新合成的多肽的稳定性涉及hsp中的hsp70和其辅伴侣分子hsp40。不希望受理论束缚,hsp40结合未折叠(初生的或新翻译的)多肽的疏水斑区,因此促进hsp70-atp复合体与所述多肽的相互作用。atp的水解导致多肽、hsp70和adp稳定复合体的形成,以及hsp40的释放。hsp70-adp复合体与所述多肽的疏水斑区的结合防止其与其他疏水斑区的相互作用,而防止不正确折叠和与其他蛋白的聚集物的形成(hartl,fu.1996.nature381:571-579中论述)。
虽然天然的伴侣蛋白能够促进低水平的重组蛋白的正确折叠,但是随着表达水平增加,天然的分子伴侣的丰度可变成限制因素。病毒蛋白在农杆菌渗入的叶中的高水平表达,可导致病毒蛋白在细胞溶胶中的累积,并且一种或多种伴侣蛋白如hsp70、hsp40或hsp70和hsp40的共表达可降低错误折叠的或聚集的蛋白的水平,并且增加显示三级和四级结构特性的蛋白的数量,其允许病毒样颗粒的形成。
因此,本发明也提供在植物中产生病毒蛋白vlp的方法,其中编码病毒蛋白的第一核酸与编码通道蛋白例如但不限于质子通道蛋白的第二核酸,以及编码分子伴侣的第三核酸共表达。可在相同的步骤中将第一、第二和第三核酸引入植物,或可将其连续地引入植物。
植物内所产生的vlp可诱导包含植物-特异性n-聚糖的病毒蛋白。因此,本发明也提供包含具有植物特异性n-聚糖的病毒蛋白的vlp。
此外,植物中n-聚糖的修饰是已知的(参见,例如wo2008/151440;wo2010/006452;或u.s.60/944,344;其通过引用并入本文),并且可产生具有修饰的n-聚糖的病毒蛋白。可获得包含修饰的糖基化形式的病毒蛋白,例如具有降低的盐藻糖基化(fucosylated)和/或木糖基化(xylosylated)、盐藻糖基化(fucosylated)和木糖基化的(xylosylated)的n-聚糖,或可获得具有修饰的糖基化形式的病毒蛋白,其中蛋白缺乏盐藻糖基化和/或木糖基化(xylosylation),并且包含增加的半乳糖基化。此外,当与野生型植物表达的病毒蛋白相比,翻译后修饰的调节,例如末端半乳糖的加入可导致所表达的病毒蛋白的盐藻糖基化和木糖基化(xylosylation)的降低。
例如,其不应理解为限制,可通过与编码β-1.4半乳糖基转移酶(galt)的核苷酸序列一起共表达目标蛋白来实现具有修饰的糖基化形式的病毒蛋白的合成,所述galt例如但不限于哺乳动物galt或人galt,然而也可使用来自另外来源的galt。galt的催化结构域也可与n-乙酰葡糖胺转移酶(gnt1)的cts结构域(即胞质尾区、跨膜结构域、茎区)融合,以产生gnt1-galt杂合酶,并且所述杂合酶可与病毒蛋白共表达。也可与编码n-乙酰葡糖胺转移酶iii(gnt-iii)的核苷酸序列一起共表达病毒蛋白,所述gnt-iii例如但不限于哺乳动物gnt-iii或人gnt-iii,也可使用来自其他来源的gnt-iii。此外,也可使用gnt1-gnt-iii杂合酶,其包含与gnt-iii融合的gnt1的cts。
因此,本发明也包括包含具有修饰的n-聚糖的一种或多种病毒蛋白的vlp’s。
可在本发明使用以产生修饰的ha’s的序列的非限制性实例,也包括wo2009/009876;wo2009/076778;wo2010/003225;wo2010/148511;wo2010/003235;wo2010/006452(其通过引用并入本文)中所描述的序列,例如但不限于:
由例如来自a/布里斯班/59/2007(h1n1)毒株、a/新喀里多尼亚/20/99(h1n1)毒株、a/所罗门群岛3/2006(h1n1)毒株、/波多黎各/8/34(h1n1)毒株、a/布里斯班/59/2007(h1n1)毒株的核酸分子所编码的h1蛋白;
由核酸分子所编码的h2蛋白可来自a/新加坡/1/57(h2n2)毒株;
由核酸分子所编码的h3蛋白可来自a/布里斯班10/2007(h3n2)、a/威斯康星州/67/2005(h3n2)毒株、a/维多利亚/361/2011(h3n2)或a/珀斯/16/2009(h3n2);
由核酸分子所编码的h5蛋白可来自a/安徽/1/2005(h5n1)、a/印度尼西亚/5/2005(h5n1)、a/越南/1194/2004(h5n1);
由核酸分子所编码的h6蛋白可来自a/野鸭/香港/w312/97(h6n1)毒株;
由核酸分子所编码的h7蛋白也可来自a/杭州/1/13(h7n9)、a/马/布拉格/56(h7n7)毒株;
由核酸分子所编码的h9蛋白可来自a/香港/1073/99(h9n2)毒株;
由核酸所编码的来自b亚型的ha蛋白可来自b/弗罗里达/4/2006、b/马萨诸塞州/2/12、b/马来西亚/2506/2004、b/威斯康星州/1/2010或b/布里斯班/60/2008毒株。
表3:本文所描述的已制备的构建体的实例:
表:4:序列描述
本申请还涉及以下技术方案:
1.核酸,其包含在植物中有活性的调控区和在植物中有活性的表达增强子,所述调控区和所述表达增强子与编码修饰的流感血凝素(ha)的核苷酸序列可操作地连接,所述修饰的流感血凝素(ha)包含修饰的蛋白水解环。
2.如实施方案1所述的核苷酸,其中所述表达增强子选自:cpmvx、cpmvx+、cpmv-ht+、cpmvht+[wt115]和cpmvht+[511]。
3.如实施方案1所述的核苷酸,其中所述表达增强子不是cpmvht。
4.如实施方案1所述的核苷酸,其中所述核苷酸不包含菜豆黄矮病毒长基因间隔区(beydvlir)和beydv短基因间隔区(beydvsir)。
5.如实施方案1所述的核苷酸,其中所述修饰的蛋白水解环包含一个或多个蛋白酶切割位点,所述蛋白酶切割位点与天然ha的一个或多个切割位点的切割相比,呈现出减少或废除的蛋白酶切割。
6.如实施方案5所述的核苷酸,其中所述蛋白酶为克拉拉-样、弗林蛋白酶-样或胰蛋白酶。
7.如实施方案1所述的核苷酸,其中所述修饰的蛋白水解环包含接头序列。
8.如实施方案7所述的核苷酸,其中所述接头序列具有氨基酸序列gg、tetq或tetr。
9.如实施方案1所述的核苷酸,其中由所述核苷酸序列编码的ha选自来自以下的ha:流感b型、c型、a型以及h1亚型、h2亚型、h3亚型、h4亚型、h5亚型、h6亚型、h7亚型、h8亚型、h9亚型、h10亚型、h11亚型、h12亚型、h13亚型、h14亚型、h15亚型和h16亚型。
10.如实施方案1所述的核苷酸,其中编码所述流感血凝素(ha)蛋白的核苷酸序列与选自以下的序列具有至少70%的序列同一性:seqidno:17、18、20、21、41、58、77、81、85、92、96、98、100、102、104、106、108、110、112、114、134、143、147、154、161、168、194和199。
11.如实施方案1所述的核苷酸,其中所述ha为ha0。
12.如实施方案1所述的核酸,其中所述修饰的ha包含天然或非天然的信号肽。
13.如实施方案1所述的核酸,其中编码所述修饰的ha的核苷酸序列包含嵌合核苷酸序列,所述嵌合核苷酸序列按顺序编码修饰的ha胞外域、流感跨膜结构域和胞质尾区,其中所述修饰的ha胞外域包含修饰的蛋白水解环且来自第一流感毒株,而所述跨膜结构域和所述胞质尾区来自第二流感毒株。
14.在植物中产生流感病毒样颗粒(vlp)的方法,其包括:
a)将实施方案1所述的核苷酸引入所述植物或所述植物的部分;
b)在允许所述核酸表达的条件下培养所述植物或所述植物的部分,从而产生所述vlp。
15.如实施方案14所述的方法,其中在步骤a)中,将第二核苷酸引入所述植物或所述植物的部分,所述第二核苷酸包含第二调控区,所述第二调控区在所述植物中有活性并且与编码质子通道蛋白的核苷酸序列可操作地连接。
16.如实施方案15所述的方法,其中所述质子通道蛋白选自流感m2或流感bm2。
17.在植物中产生流感病毒样颗粒(vlp)的方法,其包括:
a)提供植物或植物的部分,其包含实施方案1所述的核酸,以及
b)在允许所述核酸表达的条件下培养所述植物或所述植物的部分,从而产生所述vlp。
18.如实施方案14所述的方法,其还包括以下步骤:
c)收集所述植物,以及
d)纯化所述vlp,其中所述vlp的大小范围为80-300nm。
19.通过实施方案14的任一种方法产生的vlp。
20.如实施方案19所述的vlp,其还包含一种或多种源自植物的脂质。
21.如实施方案20所述的vlp,其中所述修饰的ha蛋白包含植物-特异性n-聚糖或修饰的n-聚糖。
22.在植物中产生修饰的ha蛋白的方法,所述修饰的ha蛋白包含修饰的蛋白水解环,所述修饰的蛋白水解环包含呈现出减少或废除的蛋白酶切割的一个或多个蛋白酶切割位点,所述方法包括:
a)将实施方案1所述的核苷酸引入所述植物;
b)在允许所述ha蛋白表达的条件下培养所述植物或所述植物的部分,从而产生所述修饰的ha蛋白,
c)收集所述植物,并且纯化所述修饰的ha蛋白。
23.通过实施方案22所述的方法产生的ha蛋白,其中所述蛋白具有血凝素(ha)活性。
24.由实施方案1所述的核酸编码的ha。
25.如实施方案14所述的方法,其中在所述引入步骤(步骤a)中,以瞬转的方式将所述核酸引入植物中,或者将所述核酸引入所述植物中以使其稳定。
26.包含实施方案1所述的核酸的植物。
28.组合物,其包含用于诱导免疫应答的有效剂量的实施方案19所述的vlp,以及药学上可接受的载体。
29.疫苗,其包含用于诱导免疫应答的有效剂量的实施方案19所述的vlp。
30.在对象中诱导对流感病毒感染的免疫力的方法,其包括施用实施方案19所述的vlp。
31.如实施方案30所述的方法,其中所述vlp经口、皮内、鼻内、肌肉内、腹腔内、静脉内或皮下施用于对象。
32.提高植物中表达的ha蛋白的产物质量的方法,其包括:
a)将实施方案1所述的核苷酸引入所述植物;
b)在允许所述ha蛋白表达的条件下培养所述植物或所述植物的部分,从而产生修饰的ha蛋白,
c)收集所述植物,并且纯化所述修饰的ha蛋白,其中所述修饰的ha蛋白与天然ha相比,具有提高的产物质量。
33.如实施方案32所述的方法,其中所述质量包括提高的产物产量、产物稳定性、产物一致性或其组合。
实施例
实施例1
农杆菌(agrobacterium)转染
使用d’aoust等2008(plantbiotechnologyjournal6:930-940)所描述的方法,通过电穿孔法用dna构建体转染农杆菌菌株agl1。被转染的农杆菌在补充有10mm2-(n-吗啉代)乙磺酸(mes)、20μm乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素的ph5.6的yeb培养基上生长至od600为0.6-1.6。使用前将农杆菌悬浮液离心,然后重悬于渗入培养基(10mmmgcl2和10mmmesph5.6)。
植物生物质、接种量和农杆菌渗入的制备
本文所使用的术语“生物质”和“植物物质”意指源自植物的任何物质。生物质或植物物质可包括完整的植物、组织、细胞或其任何部分(fraction)。进一步地,生物质或植物物质可包括细胞内植物组分,细胞外植物组分,植物的液体或固体提取物或其组合。进一步地,生物质或植物物质可包括来自植物叶、茎、果实、根或其组合的植物、植物细胞、组织、液体提取物或其组合。植物的部分可包括植物物质或生物质。
在铺满商购的泥煤苔培养基的平地上由种子生长烟草本塞姆氏(nicotianabenthamiana)植物。允许植物生长在温室中,16/8光周期和25℃白天/20℃夜晚的温度方案。播种后三周,挑选出个别小植株,移植在盆中,并且在相同环境条件的温室中继续生长另外三周。
转染有各个构建体的农杆菌生长在补充有10mm2-(n-吗啉代)乙磺酸(mes)、20μm乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素的ph5.6的yeb培养基中直到它们达到od600为0.6-1.6。使用前将农杆菌悬浮液离心,然后重悬于渗入培养基(10mmmgcl2和10mmmes,ph5.6),并且在4℃下保存整夜。渗入的当天,将分批培养物稀释成2.5倍的培养物体积,并且在使用前允许加温。真空20-40torr下,将烟草本塞姆氏的完整植物倒置在密封不锈钢罐中的细菌悬浮液中2分钟。将植物返回至温室中经2-6天的培养期直到收集。
叶的收集和总蛋白提取
培养后,收集植物的地上部分,-80℃下冷冻并且碾成碎块。通过用3倍体积的冷50mmtrisph8.0、0.5mnacl、0.1%tritonx-100和1mm苯甲基磺酰氟匀浆(polytron)冻碎的植物物质的各个样品,以提取总的可溶性蛋白。匀浆后,浆液在10,000g,4℃下离心10分钟,并且保留这些澄清的粗提取物(上清液)用于分析。
蛋白分析和免疫印迹
使用牛血清白蛋白作为参考标准,通过bradford检测(bio-rad,hercules,ca)测定澄清的粗提取物的总蛋白含量。通过sds-page分离蛋白,并且将其电转移至聚偏二氟乙烯(pvdf)膜上(rochediagnosticscorporation,indianapolis,in),用于免疫检测。免疫印迹之前,4℃将膜在tris-缓冲盐水溶液中的5%脱脂牛奶和0.1%吐温-20(tbs-t)中封闭16-18小时。
用2μg/ml的一抗(在0.1%的tbs-吐温20中的2%脱脂牛奶中)首先孵育(表4显示用于检测每个ha所使用的抗体和条件),以进行免疫印迹。用于化学发光检测所使用的二抗如表4所示,按所示用0.1%的tbs-吐温20中的2%脱脂牛奶稀释。使用鲁米诺作为底物(rochediagnosticscorporation),通过化学发光来检测免疫反应复合物。通过使用ez-link
表4:用于所表达蛋白的免疫印迹的电泳条件、抗体和稀释。
jir:jacksonimmunoresearch(美国杰克逊免疫研究),westgrove,pa,usa;cber:centerforbiologicsevaluationandresearch(美国生物制品评价和研究中心),rockville,md,usa;
sino:sinobiologicalinc.(北京义翘神州生物技术有限公司),beijing,china;
tga:therapeuticgoodsadministration(澳大利亚治疗产品管理局),australia;
nibsc:nationalinstituteforbiologicalstandardsandcontrol(英国国家生物制品检定所),unitedkingdom.
凝集检测
凝集检测基于nayakandreichl(2004)所描述的方法。简单地说,在含有100μlpbs的v-形底96-孔微量滴定板中进行测试样品(100μl)的连续倍比稀释,每孔留有100μl稀释样品。将100微升0.25%鲜红色血细胞悬浮液(biolinkinc.,syracuse,ny)加入各孔中,并且在室温下孵育板2小时。显示完全血凝的最高稀释倍数的倒数被记录为ha活性。并列地,重组的ha标准(a/越南/1203/2004h5n1)(proteinsciencecorporation,meriden,ct)用pbs稀释,并且将其作为每块板上的对照。
细胞壁消化的vlp提取物
从烟草本塞姆氏植物收集叶片组织,并且切成~1cm2的片状。室温(rt)下,叶片在500mm甘露糖醇中浸泡30分钟。然后去除甘露糖醇溶液,并且更换为原生质体溶液(500mm甘露糖醇、10mmcacl2和5mmmes/koh(ph5.6))中的酶混合物(来自绿色木酶(trichodermaviride)的纤维素酶的混合物(onozukar-10;3%v/v)和来自根霉(rhizopussp.)的果胶酶的混合物(macerozymetm;0.75%v/v;均来自yakultpharmaceuticals)。所用的比值为每100ml溶液20g叶片。将该制备物均匀地分散在浅的器皿(~11x18cm)中,并且在40rpm和26℃的摇床上孵育16小时。
可选地,vlp的提取可按如下进行:植物被agl1/#489、928、676和766农杆菌渗入。渗入后第7天,从烟草本塞姆氏植物中收集叶片组织,并且切成~1cm2的片状。将果胶酶162l(biocatalysts)、multifectcxcg和multifectcxb(genencor)加入至200mm甘露糖醇、75mm柠檬酸盐、0.04%亚硫酸氢钠缓冲液(ph6.0);消化缓冲液。两份生物质在定轨摇床上室温整夜消化。
酶辅助提取后,通过过滤(250或400μm目的尼龙滤器)去除叶的碎片。粗滤提取物在5000xg下离心5分钟。上清液被应用于检测ha表达(血凝活性(参见图20)和蛋白质印迹(参见图22))。
实施例2:
修饰的蛋白水解环对ha的累积的影响
如图13a所示,天然的b/布里斯班(构建体号:1008)的表达低于包含修饰的蛋白水解环的b/布里斯班(构建体号:1059)的表达。当与天然b/布里斯班ha(构建体号:1008;图13b)相比时,包含修饰的蛋白水解环的b/布里斯班(构建体号:1059)中也观察到增加的血凝活性。
在包含修饰的蛋白水解环的b/威斯康星州(构建体号:1467)的累积水平方面观察到类似结果,其大于天然b/威斯康星州ha(构建体号:1462;图16a)所观察到的累积水平。当与天然的b/威斯康星州ha(构建体号:1462;图16b)相比时,包含修饰的蛋白水解环的b/威斯康星州(构建体号:1467)中也观察到增加的血凝活性,其指示了突变蛋白的更多累积。
也观察到包含修饰的蛋白水解环的h5/indo的表达,所述修饰包括包含gg接头(构建体号:928;seqidno:85)、tetr接头(构建体号:676;seqidno:77)或tetq接头(构建体号:766;seqidno:8;图22)的蛋白水解环。
流感m2的共表达对ha的累积水平的影响
评价m2的共表达对修饰的流感bha的累积水平的影响。构建体1059号编码流感bha,其中蛋白水解环被2个氨基酸接头代替(gg代替aa341-359)。来自图13a中呈现的western印迹分析的结果表明,蛋白水解环的去除导致增加的流感bha累积水平(比较1008与1059),并且m2与修饰的流感bha的共表达也增加ha累积水平(图13a,1059vs1059+1261)。来自转化有具有或没有修饰以及与或不与m2共表达的流感bha的植物的粗蛋白提取物的血凝活性分析证实,m2共表达对天然的流感bha(图13b,1008vs1008+1261)和修饰的流感bha(图13b,1059vs1059+1261)的累积水平有积极作用。
m2与包含修饰的蛋白水解环的a型ha的共表达也导致ha表达。例如,具有用gs接头或(gss)3接头所代替的蛋白水解环的修饰的h3(参见图21e,21f)与m2一起的共表达,也可导致植物中ha的累积。
将来自流感a/波多黎各/8/1934的m2增加修饰的流感bha和h3的累积的功效,与来自流感a/新喀里多尼亚/20/1999的m2增加修饰的流感bha和h3的累积的功效相比。对于修饰的流感bha,通过来自转化有构建体1059、1059+1261和1059+859的植物的蛋白提取物的western印迹分析进行所述比较。获得的结果表明,来自流感a/波多黎各/8/1934(由构建体859号编码)的m2的共表达,与来自流感a/新喀里多尼亚/20/1999(由构建体1261号编码)的m2的共表达在增加修饰的流感bha的累积方面功效相同(图14)。
流感m2共表达对不同毒株bha的累积水平的影响
来自转化有基因构建体的植物的蛋白提取物的western印迹分析显示m2共表达导致流感bha累积的增加(图16a),所述基因构建体驱动流感bha(来自b/威斯康星州/1/2010)(构建体1462号)在存在或不存在m2-表达构建体(构建体1261号)时表达。
也评价了m2的共表达对修饰的流感bha的累积水平的影响。构建体1467号编码流感bha,其中蛋白水解环被2个氨基酸接头代替(gg代替aa341-359)。来自图16a中所呈现的western印迹分析的结果显示,蛋白水解环的去除导致流感bha累积水平增加(比较1462与1467),并且m2与修饰的流感bha的共表达也增加了ha累积水平(图16a,1467vs1467+1261)。来自转化有具有或没有修饰并且与或不与m2共表达的流感bha的植物的粗蛋白提取物的血凝活性的分析证实,m2共表达对天然的流感bha(图16b,1462vs1462+1261)和修饰的流感bha(图16b,1467vs1467+1261)的累积水平有积极作用。
扩增元件beydv和修饰的蛋白水解环对ha累积的影响
来自转化有基因构建体的植物的蛋白提取物的western印迹分析显示,当调控元件为cpmv-ht,在不存在beydv时,可检测到流感bha无累积(图17b),所述基因构建体驱动具有或没有蛋白水解环去除的修饰的流感bha(来自b/布里斯班/60/2008)(参见图17a的构建体)在存在或不存在扩增元件beydv(构建体1059号和1039号)时表达。
修饰的蛋白水解环对相对的ha滴度和血凝的影响
根据图29a,显示在植物中所产生的包含基于cpmvht、cpmvht+、cpmv160或cpmv160+的增强子元件的修饰ha蛋白或天然ha的活性比较,所述增强子元件与编码具有蛋白水解环缺失(用gg接头代替)的修饰ha的或天然ha核苷酸序列可操作地连接。在大多数情况下,对于基于cpmvht+、cpmv160或cpmv160+的构建体,表达较高(测定为血凝滴度或活性),表明显著的表达水平。
表5a:相对的ha滴度(wtha=1)(参见图29a)
实施例3
与天然的构建体相比,当去除蛋白水解环(prl-)时增加的h7杭州havlp产量
用agl1/#2142+1261和#2152+1261渗入烟草本塞姆氏植物,并且7天培育期后收集叶。收集叶片组织,并且将其切成~1cm2片状。将果胶酶162l和果胶酶444l(biocatalysts)、multifectcxcg和multifectcxb(genencor)加入到200mm甘露糖醇、125mm柠檬酸盐、0.04%亚硫酸氢钠缓冲液(ph6.0)。生物质在定轨摇床上室温下整夜消化。
消化后,将非原生质体级分(fraction)滤过400μm尼龙滤器以去除粗的未消化的植物组织(<5%原始生物质)。然后将滤过的提取物在室温下5000xg离心15分钟,以去除原生质体和细胞内污染物(蛋白、dna、膜、囊泡、色素,等等)。其次,在被施用于层析前,使用1.2μm玻璃纤维过滤器(sartoporegfplus/sartoriusstedim),以及0.45/0.2μm过滤器(sartopore2/sartoriusstedim)深度过滤(用于澄清)上清液。
将澄清的非原生质体级分加载至用平衡/洗脱缓冲液(50mmnapo4,100mmnacl,0.005%吐温80ph6.0)平衡好的阳离子交换柱上(poroshsappliedbiosystems)。一旦uv归零,用含有渐增浓度的nacl(500mm)的平衡/洗脱缓冲液分步洗脱提取物。纯化的vlp用tff浓缩、配制缓冲液(100mmpo4,150mmnacl,ph7.4的0.01%吐温80)渗滤(diafiltered),并且通过0.22μm的过滤器。
基于nayakandreichl(2004)所描述的方法进行h7的凝集检测。简单地说,在含有100μlpbs的v-形底96-孔微量滴定板中进行测试样品(100μl)的连续倍比稀释,使每孔剩余100μl稀释样品。将100微升0.25%的鲜红色血细胞悬浮液(biolinkinc.,syracuse,ny)加入至各孔,并且在室温下孵育板2小时。显示完全凝集的最高稀释倍数的倒数被记录为血凝活性。
使用牛血清白蛋白作为参考标准,测定澄清的粗提取物的总蛋白含量。通过比较prl-构建体与用作对照的天然构建体获得相对产量。在还原条件下进行具有变性样品上样缓冲液(0.1mtrisph6.8,0.05%溴酚蓝,12.5%甘油,4%sds和5%β-巯基乙醇)的sds-page的分离,并且使用考马斯亮蓝r-250用于蛋白质染色。
图46a显示与天然构建体(#2142+#1261,参见实施例5.33)相比,对于去除蛋白水解环的h7杭州构建体(#2152+#1261,参见实施例5.34),植物提取物中的血凝活性更大。
图46b显示与天然的构建体(#2142+#1261)相比时,对于去除蛋白水解环的h7杭州构建体(#2152+#1261),纯化的vlp中的相对总蛋白产量较高。该实施例表明植物中所累积的vlp的改善与当进行全过程时的最终产量之间的良好相关性。
图46c显示sds-page分析,泳道2显示具有去除的蛋白水解环的纯化的h7杭州构建体,泳道3显示纯化的天然h7杭州构建体。对于每个泳道,在凝胶上加载2μg的总蛋白。对于这两种构建体,蛋白谱的纯度是类似的,并且大于90%。
实施例4.1
突变体h5印度尼西亚vlp(其中蛋白水解环被修饰或去除)的胰蛋白酶抗性大于天然h5印度尼西亚。
烟草本塞姆氏植物用农杆菌渗入实施例1中所描述的agl1/#489、#928、#766和#676(上文)。渗入后7天从植物收集叶,切成~cm2片状。将果胶酶162l(biocatalysts)、multifectcxcg和multifectcxb(genencor)加入至200mm甘露糖醇、75mm柠檬酸盐、0.04%亚硫酸氢钠缓冲液(ph6.0)。生物质在定轨摇床上室温整夜消化。按照实施例3(h7杭州)所述,将消化的提取物进行粗滤、离心、澄清并且纯化。
对于各个天然的(#489)、prl-(#928)、tetq(#766)和tetr(#676),h5印度尼西亚havlp提取物,用ph7.4的缓冲液(100mmna/kpo4,150mmnacl,0.01%吐温80)重悬两份havlp样品。按1:100的蛋白比例加入胰蛋白酶。室温下孵育30、60和120分钟后吸取样品,然后在上样缓冲液中煮沸以中止反应。通过实施例3所描述的sds-page凝胶分析非消化的提取物(对照)和胰蛋白酶-消化的提取物。
图47a显示胰蛋白酶-消化样品的sds-page分析,在消化的不同时间点(0、30、60和120分钟),泳道2至5显示天然h5印度尼西亚vlp(#489)、泳道6至9显示prl-h5印度尼西亚vlp(#928)、泳道10至13显示tetqh5印度尼西亚vlp(#766),泳道14至17显示tetrh5印度尼西亚vlp(#676)。通过胰蛋白酶的加入,在泳道2的非消化提取物中在大约75kda下可检测的具有对应于ha0单体的条带的天然h5印度尼西亚vpl,被快速地加工为ha1和ha2条带,泳道3至5中在胰蛋白酶消化期间分别在大约50和25kda下可检测。通过蛋白水解位点的去除或修饰所稳定的prl-和tetqh5印度尼西亚vlp,表现出胰蛋白酶的抗性,因为ha0条带没有切割为ha1和ha2条带。通过蛋白水解位点的修饰使tetrh5印度尼西亚vlp部分地稳定,并且ha0单体被切割为ha1和ha2慢于天然h5印度尼西亚vlp。
这些数据表明,通过缺失蛋白水解环(prl-)或用接头序列(tetq)方法代替蛋白水解环,在ha1-ha2内的蛋白水解位点处成功地保护了ha0蛋白。
实施例4.2
在小鼠中天然h5印度尼西亚vlp的免疫原性类似于其突变体对应物(prl-、tetq和tetr)
按照实施例4.1所述(上文)纯化天然的、prl-、tetr和tetqh5印度尼西亚vlp提取物。
图47b显示两个剂量后小鼠中的天然h5vlp和其突变体对应物(prl-、tetq和tetr)的免疫原性(hi滴度)。balb/c小鼠(n=8/组)两次肌内注射10μg剂量的基于植物的h5vlp疫苗(天然的、prl-、tetq或tetr)(基于其ha含量),相隔21天。42dpv(第二次剂量后21天),将每只动物的血清进行hi滴度分析,并且h5vlpa/印度尼西亚/5/2005(h5n1)被用作抗原。柱状代表各个h5突变体vlp与天然h5vlp相比的相对(%)hi滴度(用log2hi滴度gmt和95%ci计算)。通过使用单因子方差分析,随后通过对log2-转换数据(假设它们是正态分布的)的图基氏事后分析(tukey’spost-hocanalysis)比较各个剂量组之间的统计学差异。*p<0.05被认为是显著的。观察到各个剂量组之间无差异。
实施例5.1:
b-2x35s/cpmv-ht/m2新喀里多尼亚/nos(构建体1261号)
使用以下基于pcr的方法,将编码来自流感a/新喀里多尼亚/20/1999(h1n1)的m2的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos表达系统中。使用引物if-s1-m1+m2anc.c(图2a,seqidno:7)和if-s1-4-m2anc.r(图2b,seqidno:8),采用合成的m2基因(对应于连接到来自genbank登录号dq508860的nt715-982的nt1-26;图2c,seqidno:9)作为模板,扩增含有完整m2编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht/nos表达系统中。用sacii和stui限制性内切酶消化构建体1191(图1c),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架是pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名1261号(图2d,seqidno:10)。图2e呈现来自流感a/新喀里多尼亚/20/1999(h1n1)的m2的氨基酸序列(seqidno:11)。图11呈现质粒1261的示意图。
实施例5.2:
c-2x35s/cpmv-ht/m2波多黎各/nos(构建体859号)
使用以下基于pcr的方法,将编码来自流感a/波多黎各/8/1934(h1n1)的m2的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos表达系统中。使用引物if-s1-m1+m2anc.c(图2a,seqidno:7)和if-s1-4-m2anc.r(图2b,seqidno:8),采用合成的m2基因(对应于连接到来自genbank登录号ef467824的nt740-1007的nt26-51)(图3a,seqidno:12)作为模板,扩增含有完整的m2编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht/nos表达系统中。用sacii和stui限制性内切酶消化构建体1191(图1c),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。载体为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为859号(图3b,seqidno:13)。图3c呈现来自流感a/波多黎各/8/1934(h1n1)的m2的氨基酸序列(seqidno:14)。图17呈现质粒859的示意图。
实施例5.3:
引入beydv+复制酶扩增体系中的g-2x35s/cpmv-ht/pdisp/hab布里斯班/nos(构建体1008号)
us61/541,780中描述了构建体1008的制备。简单地说,使用基于pcr的方法,采用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791),将编码来自流感b的ha/布里斯班/60/2008的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv+复制酶扩增体系的2x35s/cpmv-ht/pdisp/nos中。将pcr产物克隆进引入beydv扩增体系中的2x35s/cpmv-ht/nos表达盒中具有紫花苜蓿pdi信号肽的框中。用sacii和stui限制性内切酶消化构建体1194(参见图4a,4b),并且线性化质粒被用于组装反应以产生构建体1008号(图4c,图9;seqidno:32)。
构建体1194号(图4a)为意图用于在引入beydv扩增体系中的基于cpmv-ht的表达盒中具有紫花苜蓿pdi信号肽的框中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒。
实施例5.4:
引入beydv+复制酶扩增体系中的具有缺失的蛋白水解环的i-2x35s/cpmv-ht/pdisp-hab布里斯班(构建体1059号)
us61/541.780中描述了构建体1059的制备。简单地说,使用基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环的ha的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv+复制酶扩增体系的2x35s/cpmv-ht/pdisp/nos中。在第一轮pcr中,使用合成的hab布里斯班基因(对应于来自genebank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt46至nt1065的片段。使用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt1123至nt1758的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于第二轮的扩增。将得到的片段(编码片段之间具有gg接头的hab/布里斯班/60/2008δa.a.356-374;参见图21b)克隆进包含beydv扩增体系的2x35s/cpmv-ht/nos表达盒中具有紫花苜蓿pdi信号肽的框中,以产生构建体1194(图4a,4b),用sacii和stui限制性内切酶消化构建体1194,并且线性化质粒被用于组装反应。得到的构建体被命名为1059号(图5c;seqidno:40)。
图5d呈现具有缺失的蛋白水解环的pdisp-hab/布里斯班/60/2008的氨基酸序列(seqidno:41)。
实施例5.5:
引入beydv(m)+复制酶扩增体系中的b-2x35s/cpmv-ht/hab威斯康星州/nos(构建体1462号)
us61/541,780中描述构建体1462的制备。简单地说,使用基于pcr的方法,将编码来自流感b/威斯康星州/1/2010的ha的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv(m)+复制酶扩增体系的2x35s/cpmv-ht/nos中。使用合成的hab威斯康星州基因(genbank登录号jn993010)作为模板,扩增含有完整的hab威斯康星州编码序列的片段。将pcr产物克隆进引入beydv(m)扩增体系中的2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体193(图6d),并且线性化质粒被用于组装反应。
构建体193号为意图用于在引入beydv(m)扩增体系中的基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图6e呈现从左至右的t-dna边界的序列(seqidno:52)。得到的构建体被命名为1462号(图6f,seqidno:53)。图6g呈现来自流感b/威斯康星州/1/2010的pdisp/ha的氨基酸序列(seqidno:54)。图6h呈现质粒1462的示意图。
实施例5.6:
引入beydv(m)+复制酶扩增体系中的具有缺失的蛋白水解环的c-2x35s/cpmv-ht/hab威斯康星州(构建体1467号)
us61/541,780中描述了构建体1467的制备。简单地说,使用基于pcr的连接方法(darveau等1995,methodsinneuroscience26:77-85),将编码来自流感b/威斯康星州/1/2010的具有缺失的蛋白水解环的ha的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中包含beydv(m)+复制酶扩增体系的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-hab110.s1+3c(图6a,seqidno:49)和hab110(prl-).r(图7a,seqidno:55),采用合成的hab威斯康星州基因(genbank登录号jn993010)(图6c,seqidno:51)作为模板,扩增含有hab威斯康星州编码序列的nt1至nt1062的片段。使用引物hab110(prl-).c(图7b,seqidno:56)和if-hab110.s1-4r(图6b,seqidno:50),采用合成的hab威斯康星州基因(genbank登录号jn993010)(图6c,seqidno:51)作为模板,扩增含有hab威斯康星州编码序列的nt1120至nt1755的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if-hab110.s1+3c(图6a,seqidno:49)和if-hab110.s1-4r(图6b,seqidno:50)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码片段之间具有接头的hab/威斯康星州/1/2010δa.a.340-358)克隆进包含beydv(m)扩增体系的2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体193(图6d),并且线性化质粒被用于in-fusion组装反应。
构建体193号为意图用于在引入beydv(m)扩增体系中的基于cpmv-ht的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图6e呈现从左至右的t-dna边界的序列(seqidno:52)。得到的构建体被命名为1467号(图7c,seqidno:57)。图7d呈现来自具有缺失的蛋白水解环的流感b/威斯康星州/1/2010的ha的氨基酸序列(seqidno:58)。图7e呈现质粒1467的示意图。
实施例5.7:
具有缺失的蛋白水解环的a-2x35s/cpmv-ht/pdisp-hab布里斯班(构建体1039号)
us61/541,780中描述了构建体1192的制备。简单地说,使用以下基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自流感b的ha/布里斯班/60/2008的具有缺失的蛋白水解环的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/pdisp/nos中。在第一轮pcr中,使用合成的hab布里斯班基因(对应于来自genebank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt46至nt1065的片段。使用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791)作为模板,扩增含有hab布里斯班编码序列的nt1123至nt1758的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于第二轮扩增。将得到的片段(编码片段之间具有gg接头的hab/布里斯班/60/2008δa.a.356-374),克隆进2x35s/cpmv-ht/nos表达盒中具有紫花苜蓿pdi信号肽的框中。用sacii和stui限制性内切酶消化构建体1192,并且线性化质粒被用于in-fusion组装反应。
构建体1192号为意图用于在基于cpmv-ht的表达盒中具有紫花苜蓿pdi信号肽的框中“infusion”克隆目标基因的受体质粒。它也合并了用于紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,得到的构建体被命名为1039号(图8b)。图5d呈现具有缺失的蛋白水解环的pdisp-hab/布里斯班/60/2008的氨基酸序列(seqidno:41)。图8a呈现质粒1039的示意图(seqidno:15)。
实施例5.8:
来自a/印度尼西亚/5/2005的具有tetr切割位点突变的a-2x35s/cpmv-ht/h5(构建体676号)
使用以下基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自a/印度尼西亚/5/2005的具有tetr切割位点突变的h5的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-h5a-i-05.s1+3c(图1a,seqidno:2)和mutcleavage-h5(indo).r(图23a,seqidno:74),采用来自a/印度尼西亚/5/2005的合成h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1至nt1015的片段。使用引物mutcleavage-h5(indo).c(图23b,seqidno:75)和if-h5dtm.r(图1b,seqidno:3),采用来自a/印度尼西亚/5/2005的合成h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1038至nt1707的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if-h5a-i-05.s1+3c(图1a,seqidno:2)和if-h5dtm.r(图1b,seqidno:3)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码片段之间具有tetr接头的来自a/印度尼西亚/5/2005的h5δa.a.339-346)克隆进2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体1191(图1d),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒的框中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为676号(图23c,seqidno:76)。图23d呈现来自a/印度尼西亚/5/2005的具有tetr切割位点突变的h5的氨基酸序列(seqidno:77)。图23e呈现质粒676的示意图。
实施例5.9:
来自a/印度尼西亚/5/2005的具有tetq切割位点突变的b-2x35s/cpmv-ht/h5(构建体766号)
使用以下基于pcr的连接方法(darveau等,1995,methodsinneuroscience26:77-85),将编码来自a/印度尼西亚/5/2005的具有tetq切割位点突变的h5的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-h5a-i-05.s1+3c(图1a,seqidno:2)和h5i505_tetq.r(图24a,seqidno:78),采用来自a/印度尼西亚/5/2005(图1g,seqidno:42)的合成h5作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1至nt1015的片段。使用引物h5i505_tetq.c(图24b,seqidno:79)和if-h5dtm.r(图1b,seqidno:3),采用来自a/印度尼西亚/5/2005的合成h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1038至nt1707的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,使用if-h5a-i-05.s1+3c(图1a,seqidno:2)和if-h5dtm.r(图1b,seqidno:3)作为引物,用于第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码来自片段之间具有tetq接头的h5δa.a.339-346)克隆进2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体1191(图1d),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒的框中“infusion”克隆目标基因的受体质粒。它也合并用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为766号(图24c,seqidno:80)。图24d呈现来自a/印度尼西亚/5/2005的具有tetq切割位点突变的h5的氨基酸序列(seqidno:81)。图24e呈现质粒766的示意图。
实施例5.10:
来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的c-2x35s/cpmv-ht/h5(构建体928号)
使用由darveau等(methodsinneuroscience26:77-85(1995))所呈现的以下基于pcr的连接方法,将编码来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的h5的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/nos中。在第一轮pcr中,使用引物if-h5a-i-05.s1+3c(图1a,seqidno:2)和h5i505(prl-).r(图25a,seqidno:82),采用来自a/印度尼西亚/5/2005的合成的h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1至nt1011的片段。使用引物h5i505(prl-).c(图25b,seqidno:83)和if-h5dtm.r(图1b,seqidno:3),采用来自a/印度尼西亚/5/2005的合成的h5(图1g,seqidno:42)作为模板,扩增含有来自a/印度尼西亚/5/2005的h5编码序列的nt1075至nt1707的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if-h5a-i-05.s1+3c(图1a,seqidno:2)和if-h5dtm.r(图1b,seqidno:3)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的片段(编码片段之间具有gg接头的来自a/印度尼西亚/5/2005的h5δa.a.338-358),克隆进2x35s/cpmv-ht/nos表达盒中。用sacii和stui限制性内切酶消化构建体1191(图1d),并且线性化质粒被用于in-fusion组装反应。构建体1191号为意图用于在基于cpmv-ht的表达盒的框中“infusion”克隆目标基因的受体质粒。它也合并了在紫花苜蓿质体蓝素基因启动子和终止子下的tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图1d呈现从左至右的t-dna边界的序列(seqidno:4)。得到的构建体被命名为928号(图25c,seqidno:84)。图25d呈现来自a/印度尼西亚/5/2005的具有缺失的蛋白水解环的h5的氨基酸序列(seqidno:85)。图25e呈现质粒928的示意图。
实施例5.11
-f-2x35s/cpmv-ht/pdisp/hab布里斯班/nos(构建体1029号)
使用以下基于pcr的方法,将编码来自流感b的ha/布里斯班/60/2008的序列,克隆进含有plasto_pro/p19/plasto_ter表达盒的质粒中的2x35s/cpmv-ht/pdisp/nos表达系统中。使用引物if-s2+s4-bbris.c(图30a,seqidno:86)和if-s1a4-bbris.r(图30b,seqidno:87),采用合成的hab布里斯班基因(对应于来自genbank登录号fj766840的nt34-1791)(图30c,seqidno:88)作为模板,扩增含有hab布里斯班编码序列且无其野生型信号肽的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht/nos表达系统中具有紫花苜蓿pdi信号肽的框中。用sacii和stui限制性内切酶消化构建体1192,并且线性化质粒被用于in-fusion组装反应。构建体1192号意图用于在基于cpmv-ht的表达盒中具有紫花苜蓿pdi信号肽的框中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,和从左至右t-dna边界的序列。得到的构建体被命名为1029号(图30d,seqidno:89)。图30e呈现来自流感b/布里斯班/60/2008的pdisp/ha的氨基酸序列(seqidno:90)。图30f呈现质粒1029的示意图。
实施例5.12
–用于pdisp/hab布里斯班(prl-)的2x35s/cpmvht(构建体1039号)和ht+(构建体1829号)
使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环(prl-)的ha的编码序列(pdisp/hab布里斯班(prl-);图31a,seqidno:91),克隆进原始的ht和修饰的ht+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图31b中呈现与pdisp融合的成熟hab布里斯班(prl-)的氨基酸序列(seqidno:92)。图8b和31d呈现质粒1039和1829的示意图。
实施例5.13
–用于pdisp/hab布里斯班(prl-)的2x35s/cpmvht(构建体1039号)和2x35s/cpmv160+(构建体1937号)
使用实施例5.7和实施例5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/布里斯班/60/2008的具有缺失的蛋白水解环(prl-)的ha(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)的编码序列(pdisp/hab布里斯班(prl-))(图32a,seqidno:93),克隆进原始的cpmv-ht和cpmv160+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图31b中呈现与pdisp融合的成熟hab布里斯班(prl-)的氨基酸序列(seqidno:92)。图8b和图32c呈现质粒1039和1937的示意图。
实施例5.14
-用于pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1067号)和2x35s/cpmv160+(构建体1977号)
使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)(图33a,seqidno:95),克隆进原始的cpmv-ht和cpmv160+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶的信号肽的来自流感b/布里斯班/60/08的具有缺失的蛋白水解环(prl-)的ha的胞外域(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)。图33b中呈现与pdisp融合的成熟hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:96)。图33c和图33d呈现质粒1067和1977的示意图。
实施例5.15
-用于pdisp/hab马萨诸塞(prl-)的2x35s/cpmvht(构建体2072号)和2x35s/cpmv160+(构建体2050号)
使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)的编码序列(pdisp/hab马萨诸塞(prl-))(图34a,seqidno:97),克隆进原始的cpmv-ht和cpmv160+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图34b呈现与pdisp融合的成熟hab马萨诸塞(prl-)的氨基酸序列(seqidno:98)。图34c和图34d中呈现质粒2072和2050的示意图。
实施例5.16
-用于pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体2074号)和2x35s/cpmv160+(构建体2060号)
使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct)(图35a,seqidno:99),克隆进原始的cpmv-ht和cpmv160+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的融合跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶信号肽的来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)。图35b呈现与pdisp融合的成熟hab马萨诸塞(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:100)。图35c和35d中呈现质粒2074和2060的示意图。
实施例5.17
-用于hab威斯康星州(prl-)的2x35s/cpmvht(构建体1445号)、2x35s/cpmvht+(构建体1820号)和cpmv160+(构建体1975号)
使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/威斯康星州/1/2010的具有其天然信号肽的缺失的蛋白水解环(prl-)的ha(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)的编码序列(hab威斯康星州(prl-))(图36aa,seqidno:101),克隆进原始的cpmv-ht、cpmvht+和cpmv160中。图36b中呈现具有其天然信号肽的hab威斯康星州(prl-)的氨基酸序列(seqidno:102)。图36c、36d和36e中分别呈现质粒1445、1820和1975的示意图。
实施例5.18
-用于hab威斯康星州(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1454号)和2x35s/cpmv160+(构建体1893号)
使用实施例5.7和5.11中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)(图37a,seqidno:103),克隆进原始的cpmv-ht和cpmv160+中,所述嵌合血凝素编码序列对应与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有hab威斯康星州天然信号肽的来自流感b/威斯康星州/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域(对于另外的信息:ha序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时申请第61/806,227号,其通过引用并入本文)。图37中呈现hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:104)。图37c和37d中呈现质粒1454和1893的示意图。
实施例5.19:
用于pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1067号)和ht+(构建体1875号)
使用实施例5.26中所描述的相同的基于pcr的方法,但是使用为pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct)(图38a,seqidno:105),克隆进原始的ht和修饰的ht+中,所述嵌合血凝素编码序列对应与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶的信号肽的来自流感b/布里斯班/60/08的具有缺失的蛋白水解环(prl-)的ha的胞外域。图38b中呈现与pdisp融合的成熟hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:106)。图33c和39c中呈现质粒1067和1875的示意图。
实施例5.20:
用于pdisp/hab马萨诸塞(prl-)的2x35s/cpmvht(构建体2072号)和ht+(构建体2052号)
使用如实施例5.26中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha的编码序列(pdisp/hab马萨诸塞(prl-))(图39a,seqidno:107),克隆进原始的ht和修饰的ht+中,其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替。图39b中呈现与pdisp融合的成熟hab马萨诸塞(prl-)的氨基酸序列(seqidno:108)。图34c和图39c中呈现质粒2072和2052的示意图。
实施例5.21:
用于pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体2074号)和ht+(构建体2062号)
使用如实施例5.26中所描述的相同的基于pcr的方法,但是使用为pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(pdisp/hab马萨诸塞(prl-)+h1加利福尼亚tmct)(图40a,seqidno:109),克隆进原始的ht和修饰的ht+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有紫花苜蓿蛋白二硫键异构酶的信号肽的来自流感b/马萨诸塞/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域。图40b中呈现与pdisp融合的成熟hab马萨诸塞(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:110)。图35c和图40c中呈现质粒2074和2062的示意图。
实施例5.22:
用于hab威斯康星州(prl-)的2x35s/cpmvht(构建体1445号)和ht+(构建体1839号)
使用实施例5.26中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)特别设计的修饰的pcr引物,将对应于来自流感b/威斯康星州/1/2010的具有其天然信号肽且具有缺失的蛋白水解环(prl-)的ha的编码序列(hab威斯康星州(prl-))(图41a,seqidno:111),克隆进原始的ht和修饰的ht+中。图41b中呈现具有其天然信号肽的hab威斯康星州(prl-)的氨基酸序列(seqidno:112)。图36c和41c中呈现质粒1445和1839的示意图。
实施例5.23:
用于hab威斯康星州(prl-)+h1加利福尼亚tmct的2x35s/cpmvht(构建体1454号)和ht+(构建体1860号)
使用实施例5.26中所描述的相同的基于pcr的方法,但是使用为hab威斯康星州(prl-)+h1加利福尼亚tmct特别设计的修饰的pcr引物,将嵌合血凝素编码序列(hab威斯康星州(prl-)+h1加利福尼亚tmct)(图42a,seqidno:113),克隆进原始的ht和修饰的ht+中,所述嵌合血凝素编码序列对应于与来自流感a/加利福尼亚/7/2009的h1的跨膜结构域和胞质尾区(tmct)融合且具有hab威斯康星州的天然信号肽的来自流感b/威斯康星州/2/2012的具有缺失的蛋白水解环(prl-)的ha的胞外域。图42b中呈现hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列(seqidno:114)。图37c和42c中呈现质粒1454和1860的示意图。
实施例5.24
-用于h5印度尼西亚的2x35s/cpmvht(构建体489号)、2x35s/cpmv160+(构建体1880号)和2x35s/cpmv160(构建体1885号)
使用如实施例5.25中所描述的相同的基于pcr的方法,但是使用为h5印度尼西亚特别设计的修饰的pcr引物,将对应于来自流感a/印度尼西亚/5/2005的天然h5的编码序列(图43a,seqidno:115),克隆进原始的cpmv-ht、cpmv160+和cpmv160中。图43b中呈现来自流感a/印度尼西亚/5/2005的天然h5的氨基酸序列(seqidno:116)。图43c中呈现质粒489的示意图。
实施例5.25
-2x35s/cpmv160+/pdisp/h3维多利亚/nos(构建体1800号)
使用以下基于pcr的方法,将编码来自流感a/维多利亚/361/2011的h3的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h3维多利亚),克隆进2x35s/cpmv160+/nos表达系统(cpmv160+)中。使用引物if**(sacii)-pdi.s1+4c(图44a,seqidno:117)和if-h3v36111.s1-4r(图44b,seqidno:118),采用pdisp/h3维多利亚序列(图44c,seqidno:119)作为模板,扩增含有pdisp/h3维多利亚编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv160+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2171号(图44d),并且线性化质粒被用于in-fusion组装反应。构建体2171号为意图用于在基于cpmv160+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图44e中呈现从左至右的t-dna边界的序列(seqidno:120)。得到的构建体被命名为1800号(图44f,seqidno:121)。图44g中呈现与pdisp融合的来自流感a/维多利亚/361/2011的成熟h3的氨基酸序列(seqidno:122)。图44h中呈现质粒1800的示意图。
实施例5.26:
2x35s/cpmv-ht+/pdisp/h3维多利亚/nos(构建体1819号)
使用以下基于pcr的方法,将编码来自流感a/维多利亚/361/2011的h3的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h3维多利亚),克隆进2x35s-cpmv-ht+/nos表达系统中。使用引物if(sacii)-kozac_pdi.c(图45a,seqidno:123)和if-h3v36111.s1-4r(图45b,seqidno:124),采用pdisp/h3维多利亚序列(图44c,seqidno:119)作为模板,扩增含有pdisp/h3维多利亚编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmv-ht+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2181号(图45d),并且线性化质粒被用于in-fusion组装反应。构建体2181号为意图用于在基于cpmv-ht+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图45e中呈现从左至右的t-dna边界的序列(seqidno:125)。得到的构建体被命名为1819号(图45e,seqidno:126)。图44g中呈现与pdisp融合的来自流感a/维多利亚/361/2011的成熟h3的氨基酸序列(seqidno:122)。图45f中呈现质粒1819的示意图。
实施例5.27
2x35s/cpmvht+/pdisp/h2新加坡/nos(构建体2220号)
使用以下基于pcr的方法,将编码来自流感a/新加坡/1/1957的h2的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h2新加坡),克隆进2x35s/cpmvht+/nos表达系统中。使用引物if(sacii)-kozac_pdi.c(如用于实施例5.26中构建体1819所描述的)和if**-h2s157.s1-6r(图48a,seqidno:127),采用pdisp/h2新加坡序列(图48b,seqidno:128)作为模板,扩增含有pdisp/h2新加坡编码序列的片段。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物克隆进2x35s/cpmvht+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2181号(如用于实施例5.26中构建体1819所描述的),并且线性化质粒被用于in-fusion组装反应。构建体2181号为意图用于在基于cpmvht+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图45d中呈现从左至右的t-dna边界的序列。得到的构建体被命名为2220号(图48c,seqidno:129)。图48d中呈现与pdisp融合的来自流感a/新加坡/1/1957的成熟h2的氨基酸序列(seqidno:130)。图48e中呈现质粒2220的示意图。
实施例5.28
2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h2新加坡/nos(构建体2221号)
使用由darveau等(methodsinneuroscience26:77-85(1995))所呈现的以下基于pcr的连接方法,将编码来自流感a/新加坡/1/1957的具有缺失的蛋白水解环的h2的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h2新加坡),克隆进2x35s/cpmvht+/nos表达系统中。在第一轮pcr中,使用引物if(sacii)-kozac_pdi.c(如用于实施例5.26中构建体1819所描述的)和h2s157(prl-).r(图49a,seqidno:131),采用pdisp/h2新加坡序列(图48b,seqidno:128)作为模板,扩增含有来自流感a/新加坡/1/1957的h2编码序列的nt1至nt1032的片段。使用引物h2s157(prl-).c(图49b,seqidno:132)和if**-h2s157.s1-6r(图48a,seqidno:127),采用pdisp/h2新加坡序列(图48b,seqidno:128)作为模板,扩增含有来自流感a/新加坡/1/1957的h2编码序列的nt1084至nt1716的第二片段。然后将来自两次扩增的pcr产物混合并且用作模板,用于使用if(sacii)-kozac_pdi.c(如用于实施例5.26中构建体1819所描述的)和if**-h2s157.s1-6r(图48a,seqidno:127)作为引物的第二轮扩增。使用in-fusion克隆体系(clontech,mountainview,ca),将pcr产物(包含aa321至337被gg接头代替的pdisp/h2新加坡编码序列),克隆进2x35s/cpmvht+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2181号(如用于实施例5.26中构建体1819所描述的),并且线性化质粒被用于in-fusion组装反应。构建体2181号为意图用于在基于cpmvht+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图45d中呈现从左至右的t-dna边界的序列(如用于实施例5.26中的构建体1819所描述的)。得到的构建体被命名为2221号(图49c,seqidno:133)。图49d中呈现与pdisp融合的来自流感a/新加坡/1/1957的具有缺失的蛋白水解环的成熟h2的氨基酸序列(seqidno:134)。图49e中呈现质粒2221的示意图。
实施例5.29
在2x35s/cpmv160+/nos表达系统中pdisp/h2新加坡(构建体2222号)和具有缺失的蛋白水解环的pdisp/h2新加坡(构建体2223号)
分别使用如构建体2220和2221的相同的基于pcr的方法,但使用用于扩增的修饰的正向引物if**(sacii)-pdi.s1+4c(如用于实施例5.25中构建体1800所描述的)和不同的受体质粒,将编码来自流感a/新加坡/1/1957的具有或没有蛋白水解环的h2的序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h2新加坡和具有缺失的蛋白水解环的pdisp/h2新加坡),克隆进2x35s/cpmv160+/nos表达系统中。使用in-fusion克隆体系(clontech,mountainview,ca),将得到的pcr产物克隆进2x35s/cpmv160+/nos表达系统中。用sacii和stui限制性内切酶消化构建体2171号(如用于实施例5.25中构建体1800所描述的),并且线性化质粒被用于in-fusion组装反应。构建体2171号为意图用于在基于cpmv160+的表达盒中“infusion”克隆目标基因的受体质粒。它也合并了用于在紫花苜蓿质体蓝素基因启动子和终止子下tbsvp19沉默抑制子的共表达的基因构建体。骨架为pcambia双元质粒,并且图中呈现从左至右的t-dna边界的序列(如用于实施例5.25中构建体1800所描述的)。得到的构建体被命名为2222号用于pdisp/h2新加坡(图50a,seqidno:135),和2223号用于具有缺失的蛋白水解环的pdisp/h2新加坡(图50b,seqidno:136)。图50c和50d中分别呈现质粒2222和2223的示意图。
实施例5.30
用于pdisp/h3珀斯的2x35s/cpmvht+(构建体号2019)和160+(构建体2139号)
分别使用如构建体2220和2222的相同的基于fusion的方法,但是用为pdisp/h3珀斯特别设计的修饰的pcr引物(图51b,seqidno:138),将对应于来自流感a/珀斯/16/2009的h3的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h3珀斯)(图51a,seqidno:137),克隆进修饰的cpmvht+和160+中。图51c中呈现与pdisp融合的来自流感a/珀斯/16/2009的成熟h3的氨基酸序列(seqidno:139)。图51d和图51e中呈现质粒2019和2139的示意图。
实施例5.31
用于具有缺失的蛋白水解环的pdisp/h3珀斯的2x35s/cpmvht+(构建体2039号)和160+(构建体2159号)
分别使用如构建体2221和2223的相同的基于fusion方法,但是使用为具有缺失的蛋白水解环的pdisp/h3珀斯特别设计的修饰的pcr引物(图51b(seqidno:138)、52b(seqidno:141)和53c(seqidno:142)),将对应于来自流感a/珀斯/16/2009的具有缺失的蛋白水解环的h3的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h3珀斯)(图52,seqidno:140),克隆进修饰的cpmvht+和160+中。图52d中呈现与pdisp融合的来自流感a/珀斯/16/2009的具有缺失的蛋白水解环的成熟h3的氨基酸序列(seqidno:143)。图52e和图52f中呈现质粒2039和2159的示意图。
实施例5.32
用于具有缺失的蛋白水解环的pdisp/h3维多利亚的2x35s/cpmvht+(构建体2230号)和160+(构建体2250号)
分别使用如构建体2221和2223的相同的基于fusion方法(参见实施例5.28和5.29),但使用为具有缺失的蛋白水解环的pdisp/h3维多利亚特别设计的修饰的pcr引物(图53b(seqidno:145)和53c(seqidno:146)),将对应于来自流感a/维多利亚/361/2011的具有缺失的蛋白水解环的h3的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h3维多利亚)(图53,seqidno:144),克隆进修饰的cpmvht+和160+中。图53d中呈现与pdisp融合的来自流感a/维多利亚/361/2011的具有缺失的蛋白水解环的成熟h3的氨基酸序列(seqidno:147)。图53e和图53f中呈现质粒2230和2250的示意图。
实施例5.33
2x35s/cpmvht+/pdisp/h7杭州/nos(构建体2142号)
使用如构建体2220的相同的基于fusion的方法,但使用为pdisp/h7杭州特别设计的修饰的pcr引物(图54b,seqidno:149),将对应于来自流感a/杭州/1/2013的h7的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h7杭州)(图54a,seqidno:148),克隆进修饰的cpmvht+中。图54c中呈现与pdisp融合的来自流感a/杭州/1/2013的成熟h7的氨基酸序列(seqidno:150)。图54e中呈现质粒2142的示意图。
实施例5.34
2x35s/cpmvht+/具有缺失的蛋白水解环的pdisp/h7杭州/nos(构建体2152号)
使用如构建体2221的相同的基于fusion的方法,但是使用为具有缺失的蛋白水解环的pdisp/h7杭州特别设计的修饰的pcr引物(图54b(seqidno:149)、图55b(seqidno:152)和图55c(seqidno:153)),将对应于来自流感a/杭州/1/2013的具有缺失的蛋白水解环的h7的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h7杭州)(图55a,seqidno:151),克隆进修饰的cpmvht+中。图55d中呈现与pdisp融合的来自流感a/杭州/1/2013的具有缺失的蛋白水解环的成熟h7的氨基酸序列(seqidno:154)。图55e中呈现质粒2152的示意图。
实施例5.35
用于pdisp/h9香港的2x35s/cpmvht+(构建体2224号)和160+(构建体2226号)
分别使用如构建体2220和2222的相同的基于fusion的方法,但是使用为pdisp/h9香港特别设计的修饰的pcr引物(图56b,seqidno:156),将对应于来自流感a/香港/1073/1999的h9的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/h9香港)(图56a,seqidno:155),克隆进修饰的cpmvht+和160+中。图56c中呈现与pdisp融合的来自流感a/香港/1073/1999的成熟h9的氨基酸序列(seqidno:157)。图56d和图56e中呈现质粒2224和2226的示意图。
实施例5.36
用于具有缺失的蛋白水解环的pdisp/h9香港的2x35s/cpmvht+(构建体2225号)和160+(构建体2227号)
分别使用如构建体2221和2223的相同的基于fusion方法,但是使用为具有缺失的蛋白水解环的pdisp/h9香港特别设计的修饰的pcr引物(图56b(seqidno:156)、图57b(seqidno:159)和图57c(seqidno:160)),将对应于来自流感a/香港/1073/1999的具有缺失的蛋白水解环的h9的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/h9香港)(图57a,seqidno:158),克隆进修饰的cpmvht+和160+中。图57d中呈现与pdisp融合的来自流感a/香港/1073/1999的具有缺失的蛋白水解环的成熟h9的氨基酸序列(seqidno:161)。图57e和图57f中呈现质粒2225和2227的示意图。
实施例5.37
2x35s/cpmv160+/pdisp/hab马来西亚/nos(构建体2013号)
使用如构建体2222的相同的基于fusion的方法,但是用为pdisp/hab马来西亚特别设计的修饰的pcr引物(图58b,seqidno:163),将对应于来自流感b/马来西亚/2506/2004的ha的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/hab马来西亚)(图58a,seqidno:162),克隆进修饰的cpmv160+中。图58c中呈现与pdisp融合的来自流感b/马来西亚/2506/2004的成熟ha的氨基酸序列(seqidno:164)。图58d中呈现质粒2013的示意图。
实施例5.38
2x35s/cpmv160+/具有缺失的蛋白水解环的pdisp/hab马来西亚/nos(构建体2014号)
使用如构建体2223的相同的基于fusion的方法,但是使用为具有缺失的蛋白水解环的pdisp/hab马来西亚特别设计的修饰的pcr引物(图58b(seqidno:163)、图59b(seqidno:166)、图59c(seqidno:167),将对应于来自流感b/马来西亚/2506/2004的具有缺失的蛋白水解环的ha的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(具有缺失的蛋白水解环的pdisp/hab马来西亚)(图59a,seqidno:165),克隆进修饰的cpmv160+中。图59d中呈现与pdisp融合的来自流感b/马来西亚/2506/2004的具有缺失的蛋白水解环的成熟ha的氨基酸序列(seqidno:168)。图59e中呈现质粒2014的示意图。
实施例5.39
用于pdisp/hab马萨诸塞州的2x35s/cpmvht(构建体2070号)、ht+(构建体2080号)和160+(-mprot)(构建体2090号)
分别使用如构建体2072、2220和2222的相同的基于fusion的方法,但是使用为pdisp/hab马萨诸塞州特别设计的修饰的pcr引物,将对应于来自流感b/马萨诸塞州/2/2012的ha的编码序列(其中,天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替)(pdisp/hab马萨诸塞州)(图60a,seqidno:169),克隆进原始的ht、修饰的ht+和160+中。图60b中呈现与pdisp融合的来自流感b/马萨诸塞州/2/2012的成熟ha的氨基酸序列(seqidno:170)。图60c、图60d和图60e中呈现质粒2070、2080和2090的示意图。
实施例5.40
用于具有缺失的蛋白水解环的pdisp/hab弗罗里达的2x35s/cpmvht+(构建体2102号)、具有beydv的ht+(构建体2104号)
如上所述的相同的基于fusion的方法,但是使用为pdisp/hab/弗罗里达特别设计的修饰的pcr引物(参见图61a(seqidno:190)、图61b(seqidno:191)和图61c(seqidno:192),将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列(pdisp/hab弗罗里达)(图61d,seqidno:193),克隆进修饰的ht+中。图61f中给出得到的表达盒2102的核苷酸序列(seqidno:195)。同样地,将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列,克隆进连有扩增元件beydv的修饰的ht+中。图61f中给出得到的表达盒2104的核苷酸序列(seqidno:196)。图61e中呈现与pdisp融合的来自具有缺失的蛋白水解环的流感b/弗罗里达的成熟ha的氨基酸序列(seqidno:194)。图61g和61i中呈现质粒2102和2104的示意图。
实施例5.41
用于具有缺失的蛋白水解环的pdisp/hab弗罗里达+h1加利福尼亚tmct的2x35s/cpmvht+(构建体2106号)、具有beydv的ht+(构建体2108号)
如上所述的相同的基于fusion的方法,但是使用为pdisp/hab/弗罗里达+h1加利福尼亚tmct特别设计的修饰的pcr引物(参见图61a(seqidno:197)),将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达+h1加利福尼亚tmct并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列(pdisp/hab弗罗里达+h1加利福尼亚tmct)(图62b,seqidno:198),克隆进修饰的ht+中。图62d中给出得到的表达盒2106的核苷酸序列(seqidno:200)。同样地,将对应于来自具有缺失的蛋白水解环的流感b/弗罗里达+h1加利福尼亚tmct并且其中天然信号肽被紫花苜蓿蛋白二硫键异构酶的信号肽代替的ha的编码序列,克隆进加有扩增元件beydv的修饰的ht+中。图62f中给出得到的表达盒2108的核苷酸序列(seqidno:201)。图62c中呈现与pdisp融合的来自具有缺失的蛋白水解环的流感b/弗罗里达+h1加利福尼亚tmct的成熟ha的氨基酸序列(seqidno:199)。图62e和62g中呈现质粒2106和2108的示意图。
所有引文通过引用据此并入。
已结合一个或多个实施方案描述了本发明。然而,对本领域技术人员显而易见的是,在不脱离权利要求书所定义的本发明的范围下可做出多种改变和修饰。
序列表
<110>莫迪卡戈公司(medicagoinc.)
<120>植物中流感样病毒颗粒的产生
<130>v85680wo
<140>pct/ca2014/050326
<141>2014-03-28
<150>us61/806,227
<151>2013-03-28
<150>us61/971,274
<151>2014-03-27
<150>us61/925,852
<151>2014-01-10
<160>201
<170>patentinversion3.5
<210>1
<211>21
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>禽h5蛋白水解环共有序列
<400>1
glnarggluserargarglyslysargglyleupheglyalaileala
151015
glypheileglugly
20
<210>2
<211>41
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物if-h5a-i-05.s1+3c
<400>2
aaatttgtcgggcccatggagaaaatagtgcttcttcttgc41
<210>3
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物if-h5dtm.r
<400>3
actaaagaaaataggcctttaaatgcaaattctgcattgtaacgatccat50
<210>4
<211>4903
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1191
<400>4
tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60
gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120
aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180
aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240
ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300
gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360
aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420
aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480
taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540
aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600
atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660
taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720
tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780
gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840
acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900
ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960
accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020
gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080
aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140
gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200
actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260
aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320
gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380
tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440
agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500
tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560
tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620
ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680
tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740
ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800
cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860
gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920
tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980
ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040
ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100
cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160
cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220
tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280
ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340
cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400
cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460
ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520
tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580
cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640
aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700
tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760
cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820
tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880
tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940
ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000
ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctt3060
tcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacg3120
tgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgct3180
gttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaatatctct3240
acttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggt3300
tctataagaaatctagtattttctttgaaacagagttttcccgtggttttcgaacttgga3360
gaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccgcggatggcgaaa3420
aacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctcagatcttc3480
gcctgcaggctcctcagccaaaacgacacccccatctgtctatccactggcccctggatc3540
tgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatttccctga3600
gccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacaccttcccagc3660
tgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctccagcacctg3720
gcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaaggtggacaa3780
gaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccagaagtatc3840
atctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctgactcctaa3900
ggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttcagctggtt3960
tgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagttcaacag4020
cactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatggcaagga4080
gcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggcctattttctttagt4140
ttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcag4200
agtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtccct4260
tcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaa4320
ttcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaa4380
gattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgtta4440
agcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatgatta4500
gagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactagg4560
ataaattatcgcgcgcggtgtcatctatgttactagatctctagagtctcaagcttggcg4620
cgcccacgtgactagtggcactggccgtcgttttacaacgtcgtgactgggaaaaccctg4680
gcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcg4740
aagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctaga4800
gcagcttgagcttggatcagattgtcgtttcccgccttcagtttaaactatcagtgtttg4860
acaggatatattggcgggtaaacctaagagaaaagagcgttta4903
<210>5
<211>3447
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒489
<400>5
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320
ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380
cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440
tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500
gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560
caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620
cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680
cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740
ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800
ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860
tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920
aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980
tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040
taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100
aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160
ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220
caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaag2280
agagagcagaagaaaaaagagaggactatttggagctatagcaggttttatagagggagg2340
atggcagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgg2400
gtacgctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaa2460
ctcaatcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataactt2520
agaaaggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctggac2580
ttataatgccgaacttctggttctcatggaaaatgagagaactctagactttcatgactc2640
aaatgttaagaacctctacgacaaggtccgactacagcttagggataatgcaaaggagct2700
gggtaacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtataag2760
aaacggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagaggaaat2820
aagtggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaacagt2880
ggcgagttccctagcactggcaatcatgatggctggtctatctttatggatgtgctccaa2940
tggatcgttacaatgcagaatttgcatttaaaggcctattttctttagtttgaatttact3000
gttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttat3060
tttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggac3120
acaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaa3180
gcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcct3240
gttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaata3300
attaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaa3360
ttatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcg3420
cgcgcggtgtcatctatgttactagat3447
<210>6
<211>568
<212>prt
<213>流感h5a/印度尼西亚/5/2005(h5n1)(influenzah5a/indonesia/5/2005(h5n1))
<400>6
metglulysilevalleuleuleualailevalserleuvallysser
151015
aspglnilecysileglytyrhisalaasnasnserthrgluglnval
202530
aspthrilemetglulysasnvalthrvalthrhisalaglnaspile
354045
leuglulysthrhisasnglylysleucysaspleuaspglyvallys
505560
proleuileleuargaspcysservalalaglytrpleuleuglyasn
65707580
prometcysaspglupheileasnvalproglutrpsertyrileval
859095
glulysalaasnprothrasnaspleucystyrproglyserpheasn
100105110
asptyrglugluleulyshisleuleuserargileasnhispheglu
115120125
lysileglnileileprolyssersertrpserasphisglualaser
130135140
serglyvalserseralacysprotyrleuglyserproserphephe
145150155160
argasnvalvaltrpleuilelyslysasnserthrtyrprothrile
165170175
lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp
180185190
glyilehishisproasnaspalaalagluglnthrargleutyrgln
195200205
asnprothrthrtyrileserileglythrserthrleuasnglnarg
210215220
leuvalprolysilealathrargserlysvalasnglyglnsergly
225230235240
argmetgluphephetrpthrileleulysproasnaspalaileasn
245250255
phegluserasnglyasnpheilealaproglutyralatyrlysile
260265270
vallyslysglyaspseralailemetlyssergluleuglutyrgly
275280285
asncysasnthrlyscysglnthrprometglyalaileasnserser
290295300
metprophehisasnilehisproleuthrileglyglucysprolys
305310315320
tyrvallysserasnargleuvalleualathrglyleuargasnser
325330335
proglnarggluserargarglyslysargglyleupheglyalaile
340345350
alaglypheilegluglyglytrpglnglymetvalaspglytrptyr
355360365
glytyrhishisserasngluglnglyserglytyralaalaasplys
370375380
gluserthrglnlysalaileaspglyvalthrasnlysvalasnser
385390395400
ileileasplysmetasnthrglnpheglualavalglyarggluphe
405410415
asnasnleugluargargilegluasnleuasnlyslysmetgluasp
420425430
glypheleuaspvaltrpthrtyrasnalagluleuleuvalleumet
435440445
gluasngluargthrleuaspphehisaspserasnvallysasnleu
450455460
tyrasplysvalargleuglnleuargaspasnalalysgluleugly
465470475480
asnglycysphegluphetyrhislyscysaspasnglucysmetglu
485490495
serileargasnglythrtyrasntyrproglntyrserglugluala
500505510
argleulysargglugluileserglyvallysleugluserilegly
515520525
thrtyrglnileleuseriletyrserthrvalalaserserleuala
530535540
leualailemetmetalaglyleuserleutrpmetcysserasngly
545550555560
serleuglncysargilecysile
565
<210>7
<211>42
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物if-s1-m1+m2anc.c
<400>7
aaatttgtcgggcccatgagtcttctaaccgaggtcgaaacg42
<210>8
<211>43
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物if-s1-4-m2anc.r
<400>8
actaaagaaaataggcctttactccagctctatgctgacaaaa43
<210>9
<211>294
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>合成的m2基因
<400>9
atgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatgcaac60
gattcaagtgatcctcttgttgttgccgcaagtataattgggattgtgcacctgatattg120
tggattattgatcgccttttttccaaaagcatttatcgtatctttaaacacggtttaaaa180
agagggccttctacggaaggagtaccagagtctatgagggaagaatatcgagaggaacag240
cagaatgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaa294
<210>10
<211>2034
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒1261
<400>10
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatg1320
caacgattcaagtgatcctcttgttgttgccgcaagtataattgggattgtgcacctgat1380
attgtggattattgatcgccttttttccaaaagcatttatcgtatctttaaacacggttt1440
aaaaagagggccttctacggaaggagtaccagagtctatgagggaagaatatcgagagga1500
acagcagaatgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaaag1560
gcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagc1620
ggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgt1680
ttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaa1740
aaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttgg1800
caataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataattt1860
ctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgaga1920
tgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaata1980
tagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat2034
<210>11
<211>97
<212>prt
<213>流感m2新喀里多尼亚/20/1999(h1n1)(influenzam2newcaledonia/20/1999(h1n1))
<400>11
metserleuleuthrgluvalgluthrproileargasnglutrpgly
151015
cysargcysasnaspserseraspproleuvalvalalaalaserile
202530
ileglyilevalhisleuileleutrpileileaspargleupheser
354045
lysseriletyrargilephelyshisglyleulysargglyproser
505560
thrgluglyvalproglusermetarggluglutyrarggluglugln
65707580
glnasnalavalaspalaaspaspglyhisphevalserilegluleu
859095
glu
<210>12
<211>294
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>合成的m2基因
<400>12
atgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatgcaac60
ggttcaagtgatcctctcactattgccgcaaatatcattgggatcttgcacttgacattg120
tggattcttgatcgtctttttttcaaatgcatttaccgtcgctttaaatacggactgaaa180
ggagggccttctacggaaggagtgccaaagtctatgagggaagaatatcgaaaggaacag240
cagagtgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaa294
<210>13
<211>2034
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒859
<400>13
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatgagtcttctaaccgaggtcgaaacgcctatcagaaacgaatgggggtgcagatg1320
caacggttcaagtgatcctctcactattgccgcaaatatcattgggatcttgcacttgac1380
attgtggattcttgatcgtctttttttcaaatgcatttaccgtcgctttaaatacggact1440
gaaaggagggccttctacggaaggagtgccaaagtctatgagggaagaatatcgaaagga1500
acagcagagtgctgtggatgctgacgatggtcattttgtcagcatagagctggagtaaag1560
gcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagc1620
ggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgt1680
ttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaa1740
aaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttgg1800
caataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataattt1860
ctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgaga1920
tgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaata1980
tagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat2034
<210>14
<211>97
<212>prt
<213>流感m2a/波多黎各/8/1934(h1n1)(influenzam2a/puertorico/8/1934(h1n1))
<400>14
metserleuleuthrgluvalgluthrproileargasnglutrpgly
151015
cysargcysasnglyserseraspproleuthrilealaalaasnile
202530
ileglyileleuhisleuthrleutrpileleuaspargleuphephe
354045
lyscysiletyrargargphelystyrglyleulysglyglyproser
505560
thrgluglyvalprolyssermetarggluglutyrarglysglugln
65707580
glnseralavalaspalaaspaspglyhisphevalserilegluleu
859095
glu
<210>15
<211>3474
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒1039
<400>15
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcc1320
ttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgt1380
cgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaac1440
acccaccaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgccc1500
aaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaa1560
aataccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctt1620
tcctataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacga1680
acatatcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggacccta1740
caaaattggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaac1800
aatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaat1860
agaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactc1920
tgacaacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctc1980
atctgccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaac2040
agaagacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatc2100
tgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtg2160
cgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattg2220
cctccacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgc2280
aaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaac2340
caaatatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacac2400
atcccatggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccat2460
aaacaagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaag2520
actaagcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtgga2580
tgatctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatga2640
aggaataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaat2700
gctgggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaa2760
ccagacctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccc2820
cacctttgattcactgaatattactgctgcatctttaaatgacgatggattggataatca2880
tactatactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagc2940
tatctttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataaag3000
gcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagc3060
ggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgt3120
ttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaa3180
aaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttgg3240
caataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataattt3300
ctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgaga3360
tgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaata3420
tagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3474
<210>16
<211>570
<212>prt
<213>流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)
<400>16
aspargilecysthrglyilethrserserasnserprohisvalval
151015
lysthralathrglnglygluvalasnvalthrglyvalileproleu
202530
thrthrthrprothrlysserhisphealaasnleulysglythrglu
354045
thrargglylysleucysprolyscysleuasncysthraspleuasp
505560
valalaleuglyargprolyscysthrglylysileproseralaarg
65707580
valserileleuhisgluvalargprovalthrserglycysphepro
859095
ilemethisaspargthrlysileargglnleuproasnleuleuarg
100105110
glytyrgluhisileargleuserthrhisasnvalileasnalaglu
115120125
asnalaproglyglyprotyrlysileglythrserglysercyspro
130135140
asnilethrasnglyasnglyphephealathrmetalatrpalaval
145150155160
prolysasnasplysasnlysthralathrasnproleuthrileglu
165170175
valprotyrilecysthrgluglygluaspglnilethrvaltrpgly
180185190
phehisseraspasngluthrglnmetalalysleutyrglyaspser
195200205
lysproglnlysphethrserseralaasnglyvalthrthrhistyr
210215220
valserglnileglyglypheproasnglnthrgluaspglyglyleu
225230235240
proglnserglyargilevalvalasptyrmetvalglnlyssergly
245250255
lysthrglythrilethrtyrglnargglyileleuleuproglnlys
260265270
valtrpcysalaserglyargserlysvalilelysglyserleupro
275280285
leuileglyglualaaspcysleuhisglulystyrglyglyleuasn
290295300
lysserlysprotyrtyrthrglygluhisalalysalaileglyasn
305310315320
cysproiletrpvallysthrproleulysleualaasnglythrlys
325330335
tyrargproproalalysleuleulysgluargglyphepheglyala
340345350
ilealaglypheleugluglyglytrpgluglymetilealaglytrp
355360365
hisglytyrthrserhisglyalahisglyvalalavalalaalaasp
370375380
leulysserthrglnglualaileasnlysilethrlysasnleuasn
385390395400
serleusergluleugluvallysasnleuglnargleuserglyala
405410415
metaspgluleuhisasngluileleugluleuaspglulysvalasp
420425430
aspleuargalaaspthrileserserglnilegluleualavalleu
435440445
leuserasngluglyileileasnsergluaspgluhisleuleuala
450455460
leugluarglysleulyslysmetleuglyproseralavalgluile
465470475480
glyasnglycysphegluthrlyshislyscysasnglnthrcysleu
485490495
aspargilealaalaglythrpheaspalaglyglupheserleupro
500505510
thrpheaspserleuasnilethralaalaserleuasnaspaspgly
515520525
leuaspasnhisthrileleuleutyrtyrserthralaalaserser
530535540
leualavalthrleumetilealailephevalvaltyrmetvalser
545550555560
argaspasnvalsercysserilecysleu
565570
<210>17
<211>554
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>b型ha的δ蛋白水解环(具有接头gg)的氨基酸序列
<400>17
aspargilecysthrglyilethrserserasnserprohisvalval
151015
lysthralathrglnglygluvalasnvalthrglyvalileproleu
202530
thrthrthrprothrlysserhisphealaasnleulysglythrglu
354045
thrargglylysleucysprolyscysleuasncysthraspleuasp
505560
valalaleuglyargprolyscysthrglylysileproseralaarg
65707580
valserileleuhisgluvalargprovalthrserglycysphepro
859095
ilemethisaspargthrlysileargglnleuproasnleuleuarg
100105110
glytyrgluhisileargleuserthrhisasnvalileasnalaglu
115120125
asnalaproglyglyprotyrlysileglythrserglysercyspro
130135140
asnilethrasnglyasnglyphephealathrmetalatrpalaval
145150155160
prolysasnasplysasnlysthralathrasnproleuthrileglu
165170175
valprotyrilecysthrgluglygluaspglnilethrvaltrpgly
180185190
phehisseraspasngluthrglnmetalalysleutyrglyaspser
195200205
lysproglnlysphethrserseralaasnglyvalthrthrhistyr
210215220
valserglnileglyglypheproasnglnthrgluaspglyglyleu
225230235240
proglnserglyargilevalvalasptyrmetvalglnlyssergly
245250255
lysthrglythrilethrtyrglnargglyileleuleuproglnlys
260265270
valtrpcysalaserglyargserlysvalilelysglyserleupro
275280285
leuileglyglualaaspcysleuhisglulystyrglyglyleuasn
290295300
lysserlysprotyrtyrthrglygluhisalalysalaileglyasn
305310315320
cysproiletrpvallysthrproleulysleualaasnglythrlys
325330335
tyrargproproglyglyglytrpgluglymetilealaglytrphis
340345350
glytyrthrserhisglyalahisglyvalalavalalaalaaspleu
355360365
lysserthrglnglualaileasnlysilethrlysasnleuasnser
370375380
leusergluleugluvallysasnleuglnargleuserglyalamet
385390395400
aspgluleuhisasngluileleugluleuaspglulysvalaspasp
405410415
leuargalaaspthrileserserglnilegluleualavalleuleu
420425430
serasngluglyileileasnsergluaspgluhisleuleualaleu
435440445
gluarglysleulyslysmetleuglyproseralavalgluilegly
450455460
asnglycysphegluthrlyshislyscysasnglnthrcysleuasp
465470475480
argilealaalaglythrpheaspalaglyglupheserleuprothr
485490495
pheaspserleuasnilethralaalaserleuasnaspaspglyleu
500505510
aspasnhisthrileleuleutyrtyrserthralaalaserserleu
515520525
alavalthrleumetilealailephevalvaltyrmetvalserarg
530535540
aspasnvalsercysserilecysleupro
545550
<210>18
<211>570
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>用接头代替bha的切割位点的氨基酸序列
<400>18
aspargilecysthrglyilethrserserasnserprohisvalval
151015
lysthralathrglnglygluvalasnvalthrglyvalileproleu
202530
thrthrthrprothrlysserhisphealaasnleulysglythrglu
354045
thrargglylysleucysprolyscysleuasncysthraspleuasp
505560
valalaleuglyargprolyscysthrglylysileproseralaarg
65707580
valserileleuhisgluvalargprovalthrserglycysphepro
859095
ilemethisaspargthrlysileargglnleuproasnleuleuarg
100105110
glytyrgluhisileargleuserthrhisasnvalileasnalaglu
115120125
asnalaproglyglyprotyrlysileglythrserglysercyspro
130135140
asnilethrasnglyasnglyphephealathrmetalatrpalaval
145150155160
prolysasnasplysasnlysthralathrasnproleuthrileglu
165170175
valprotyrilecysthrgluglygluaspglnilethrvaltrpgly
180185190
phehisseraspasngluthrglnmetalalysleutyrglyaspser
195200205
lysproglnlysphethrserseralaasnglyvalthrthrhistyr
210215220
valserglnileglyglypheproasnglnthrgluaspglyglyleu
225230235240
proglnserglyargilevalvalasptyrmetvalglnlyssergly
245250255
lysthrglythrilethrtyrglnargglyileleuleuproglnlys
260265270
valtrpcysalaserglyargserlysvalilelysglyserleupro
275280285
leuileglyglualaaspcysleuhisglulystyrglyglyleuasn
290295300
lysserlysprotyrtyrthrglygluhisalalysalaileglyasn
305310315320
cysproiletrpvallysthrproleulysleualaasnglythrlys
325330335
tyrargglyserserserglyserserserglyglyphepheglyala
340345350
ilealaglypheleugluglyglytrpgluglymetilealaglytrp
355360365
hisglytyrthrserhisglyalahisglyvalalavalalaalaasp
370375380
leulysserthrglnglualaileasnlysilethrlysasnleuasn
385390395400
serleusergluleugluvallysasnleuglnargleuserglyala
405410415
metaspgluleuhisasngluileleugluleuaspglulysvalasp
420425430
aspleuargalaaspthrileserserglnilegluleualavalleu
435440445
leuserasngluglyileileasnsergluaspgluhisleuleuala
450455460
leugluarglysleulyslysmetleuglyproseralavalgluile
465470475480
glyasnglycysphegluthrlyshislyscysasnglnthrcysleu
485490495
aspargilealaalaglythrpheaspalaglyglupheserleupro
500505510
thrpheaspserleuasnilethralaalaserleuasnaspaspgly
515520525
leuaspasnhisthrileleuleutyrtyrserthralaalaserser
530535540
leualavalthrleumetilealailephevalvaltyrmetvalser
545550555560
argaspasnvalsercysserilecysleu
565570
<210>19
<211>550
<212>prt
<213>流感h3a/珀斯/16/2009(influenzah3a/perth/16/2009)
<400>19
glnlysleuproglyasnaspasnserthralathrleucysleugly
151015
hishisalavalproasnglythrilevallysthrilethrasnasp
202530
glnilegluvalthrasnalathrgluleuvalglnserserserthr
354045
glygluilecysaspserprohisglnileleuaspglylysasncys
505560
thrleuileaspalaleuleuglyaspproglncysaspglyphegln
65707580
asnlyslystrpaspleuphevalgluargserlysalatyrserasn
859095
cystyrprotyraspvalproasptyralaserleuargserleuval
100105110
alaserserglythrleuglupheasnasngluserpheasntrpthr
115120125
glyvalthrglnasnglythrserseralacysileargargserlys
130135140
asnserphepheserargleuasntrpleuthrhisleuasnphelys
145150155160
tyrproalaleuasnvalthrmetproasnasngluglnpheasplys
165170175
leutyriletrpglyvalhishisproglythrasplysaspglnile
180185190
pheleutyralaglnalaserglyargilethrvalserthrlysarg
195200205
serglnglnthrvalserproasnileglyserargproargvalarg
210215220
asnileproserargileseriletyrtrpthrilevallysprogly
225230235240
aspileleuleuileasnserthrglyasnleuilealaproarggly
245250255
tyrphelysileargserglylysserserilemetargseraspala
260265270
proileglylyscysasnserglucysilethrproasnglyserile
275280285
proasnasplyspropheglnasnvalasnargilethrtyrglyala
290295300
cysproargtyrvallysglnasnthrleulysleualathrglymet
305310315320
argasnvalproglulysglnthrargglyilepheglyalaileala
325330335
glypheilegluasnglytrpgluglymetvalaspglytrptyrgly
340345350
phearghisglnasnsergluglyargglyglnalaalaaspleulys
355360365
serthrglnalaalaileaspglnileasnglylysleuasnargleu
370375380
ileglylysthrasnglulysphehisglnileglulysglupheser
385390395400
gluvalgluglyargileglnaspleuglulystyrvalgluaspthr
405410415
lysileaspleutrpsertyrasnalagluleuleuvalalaleuglu
420425430
asnglnhisthrileaspleuthraspserglumetasnlysleuphe
435440445
glulysthrlyslysglnleuarggluasnalagluaspmetglyasn
450455460
glycysphelysiletyrhislyscysaspasnalacysileglyser
465470475480
ileargasnglythrtyrasphisaspvaltyrargaspglualaleu
485490495
asnasnargpheglnilelysglyvalgluleulysserglytyrlys
500505510
asptrpileleutrpileserphealailesercyspheleuleucys
515520525
valalaleuleuglypheilemettrpalacysglnlysglyasnile
530535540
argcysasnilecysile
545550
<210>20
<211>540
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>δ-蛋白水解环h3(具有接头gs)的氨基酸序列
<400>20
glnlysleuproglyasnaspasnserthralathrleucysleugly
151015
hishisalavalproasnglythrilevallysthrilethrasnasp
202530
glnilegluvalthrasnalathrgluleuvalglnserserserthr
354045
glygluilecysaspserprohisglnileleuaspglylysasncys
505560
thrleuileaspalaleuleuglyaspproglncysaspglyphegln
65707580
asnlyslystrpaspleuphevalgluargserlysalatyrserasn
859095
cystyrprotyraspvalproasptyralaserleuargserleuval
100105110
alaserserglythrleuglupheasnasngluserpheasntrpthr
115120125
glyvalthrglnasnglythrserseralacysileargargserlys
130135140
asnserphepheserargleuasntrpleuthrhisleuasnphelys
145150155160
tyrproalaleuasnvalthrmetproasnasngluglnpheasplys
165170175
leutyriletrpglyvalhishisproglythrasplysaspglnile
180185190
pheleutyralaglnalaserglyargilethrvalserthrlysarg
195200205
serglnglnthrvalserproasnileglyserargproargvalarg
210215220
asnileproserargileseriletyrtrpthrilevallysprogly
225230235240
aspileleuleuileasnserthrglyasnleuilealaproarggly
245250255
tyrphelysileargserglylysserserilemetargseraspala
260265270
proileglylyscysasnserglucysilethrproasnglyserile
275280285
proasnasplyspropheglnasnvalasnargilethrtyrglyala
290295300
cysproargtyrvallysglnasnthrleulysleualathrglymet
305310315320
glyserglyalailealaglypheilegluasnglytrpgluglymet
325330335
valaspglytrptyrglyphearghisglnasnsergluglyarggly
340345350
glnalaalaaspleulysserthrglnalaalaileaspglnileasn
355360365
glylysleuasnargleuileglylysthrasnglulysphehisgln
370375380
ileglulysgluphesergluvalgluglyargileglnaspleuglu
385390395400
lystyrvalgluaspthrlysileaspleutrpsertyrasnalaglu
405410415
leuleuvalalaleugluasnglnhisthrileaspleuthraspser
420425430
glumetasnlysleupheglulysthrlyslysglnleuarggluasn
435440445
alagluaspmetglyasnglycysphelysiletyrhislyscysasp
450455460
asnalacysileglyserileargasnglythrtyrasphisaspval
465470475480
tyrargaspglualaleuasnasnargpheglnilelysglyvalglu
485490495
leulysserglytyrlysasptrpileleutrpileserphealaile
500505510
sercyspheleuleucysvalalaleuleuglypheilemettrpala
515520525
cysglnlysglyasnileargcysasnilecysile
530535540
<210>21
<211>550
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>用接头代替h3的切割位点的氨基酸序列
<400>21
glnlysleuproglyasnaspasnserthralathrleucysleugly
151015
hishisalavalproasnglythrilevallysthrilethrasnasp
202530
glnilegluvalthrasnalathrgluleuvalglnserserserthr
354045
glygluilecysaspserprohisglnileleuaspglylysasncys
505560
thrleuileaspalaleuleuglyaspproglncysaspglyphegln
65707580
asnlyslystrpaspleuphevalgluargserlysalatyrserasn
859095
cystyrprotyraspvalproasptyralaserleuargserleuval
100105110
alaserserglythrleuglupheasnasngluserpheasntrpthr
115120125
glyvalthrglnasnglythrserseralacysileargargserlys
130135140
asnserphepheserargleuasntrpleuthrhisleuasnphelys
145150155160
tyrproalaleuasnvalthrmetproasnasngluglnpheasplys
165170175
leutyriletrpglyvalhishisproglythrasplysaspglnile
180185190
pheleutyralaglnalaserglyargilethrvalserthrlysarg
195200205
serglnglnthrvalserproasnileglyserargproargvalarg
210215220
asnileproserargileseriletyrtrpthrilevallysprogly
225230235240
aspileleuleuileasnserthrglyasnleuilealaproarggly
245250255
tyrphelysileargserglylysserserilemetargseraspala
260265270
proileglylyscysasnserglucysilethrproasnglyserile
275280285
proasnasplyspropheglnasnvalasnargilethrtyrglyala
290295300
cysproargtyrvallysglnasnthrleulysleualathrglymet
305310315320
glyserserglyserserglyserserglyilepheglyalaileala
325330335
glypheilegluasnglytrpgluglymetvalaspglytrptyrgly
340345350
phearghisglnasnsergluglyargglyglnalaalaaspleulys
355360365
serthrglnalaalaileaspglnileasnglylysleuasnargleu
370375380
ileglylysthrasnglulysphehisglnileglulysglupheser
385390395400
gluvalgluglyargileglnaspleuglulystyrvalgluaspthr
405410415
lysileaspleutrpsertyrasnalagluleuleuvalalaleuglu
420425430
asnglnhisthrileaspleuthraspserglumetasnlysleuphe
435440445
glulysthrlyslysglnleuarggluasnalagluaspmetglyasn
450455460
glycysphelysiletyrhislyscysaspasnalacysileglyser
465470475480
ileargasnglythrtyrasphisaspvaltyrargaspglualaleu
485490495
asnasnargpheglnilelysglyvalgluleulysserglytyrlys
500505510
asptrpileleutrpileserphealailesercyspheleuleucys
515520525
valalaleuleuglypheilemettrpalacysglnlysglyasnile
530535540
argcysasnilecysile
545550
<210>22
<211>31
<212>prt
<213>流感h1新喀里多尼亚(influenzah1newcal)
<400>22
ileproserileglnserargglyleupheglyalailealaglyphe
151015
ilegluglyglytrpthrglymetvalaspglytrptyrglytyr
202530
<210>23
<211>31
<212>prt
<213>流感h1布里斯班(influenzah1brisbane)
<400>23
ileproserileglnserargglyleupheglyalailealaglyphe
151015
ilegluglyglytrpthrglymetvalaspglytrptyrglytyr
202530
<210>24
<211>31
<212>prt
<213>流感h1所罗门群岛(influenzah1solislands)
<400>24
ileproserileglnserargglyleupheglyalailealaglyphe
151015
ilegluglyglytrpthrglymetvalaspglytrptyrglytyr
202530
<210>25
<211>31
<212>prt
<213>流感h2a新加坡(influenzah2asingapore)
<400>25
valproglnilegluserargglyleupheglyalailealaglyphe
151015
ilegluglyglytrpglnglymetvalaspglytrptyrglytyr
202530
<210>26
<211>31
<212>prt
<213>流感h3a布里斯班(influenzah3abrisbane)
<400>26
valproglulysglnthrargglyilepheglyalailealaglyphe
151015
ilegluasnglytrpgluglymetvalaspglytrptyrglyphe
202530
<210>27
<211>31
<212>prt
<213>流感h3awcn(influenzah3awcn)
<400>27
valproglulysglnthrargglyilepheglyalailealaglyphe
151015
ilegluasnglytrpgluglymetvalaspglytrptyrglyphe
202530
<210>28
<211>34
<212>prt
<213>流感h5安徽(influenzah5anhui)
<400>28
serproleuarggluargargarglysargglyleupheglyalaile
151015
alaglypheilegluglyglytrpglnglymetvalaspglytrptyr
202530
glytyr
<210>29
<211>35
<212>prt
<213>流感h5印度尼西亚(influenzah5indo)
<400>29
serproglnarggluserargarglyslysargglyleupheglyala
151015
ilealaglypheilegluglyglytrpglnglymetvalaspglytrp
202530
tyrglytyr
35
<210>30
<211>35
<212>prt
<213>流感h5越南(influenzah5vietnam)
<400>30
serproglnarggluargargarglyslysargglyleupheglyala
151015
ilealaglypheilegluglyglytrpglnglymetvalaspglytrp
202530
tyrglytyr
35
<210>31
<211>6861
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1194
<400>31
tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60
gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120
aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180
aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240
ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300
gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360
aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420
aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480
taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540
aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600
atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660
taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720
tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780
gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840
acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900
ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960
accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020
gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080
aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140
gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200
actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260
aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320
gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380
tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440
agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500
tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560
tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620
ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680
tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740
ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800
cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860
gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920
tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980
ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040
ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100
cgcgttgggaattactagcgcgtgtcgacacgcgtggcgcgccctagcagaaggcatgtt2160
gttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggagg2220
caagggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaagacga2280
agtcttgcgacaaggggggcccacgccgaattttaatattaccggcgtggccccacctta2340
tcgcgagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgcccactagg2400
gttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgataaagcgtata2460
ttgtatcaggtatttccgtcggatacgaattattcgtacaagcttcttaagccggtcaac2520
atggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagac2580
caaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccat2640
tgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaa2700
tgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtccc2760
aaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtct2820
tcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctactccaaa2880
aatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggta2940
atatccggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagata3000
gtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgtt3060
gaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtg3120
gaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccact3180
gacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctatataagga3240
agttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcgaacgtgg3300
ggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctc3360
tcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtac3420
aacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgcc3480
attaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgc3540
tggaggctgctgttcagccccatacattacttgttacgattctgctgactttcggcgggt3600
gcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttcttcttct3660
tgctgattggttctataagaaatctagtattttctttgaaacagagttttcccgtggttt3720
tcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccat3780
ggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctca3840
gatcttcgccgcggctcctcagccaaaacgacacccccatctgtctatccactggcccct3900
ggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatttc3960
cctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacaccttc4020
ccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctccagc4080
acctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaaggtg4140
gacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccagaa4200
gtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctgact4260
cctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttcagc4320
tggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagttc4380
aacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatggc4440
aaggaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgttt4500
ggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgag4560
ctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaa4620
aaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaa4680
catttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcat4740
ataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatt4800
tatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaa4860
caaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactaga4920
tctctagagtctcaagcttggcgcggggtaccgagctcgaattccgagtgtacttcaagt4980
cagttggaaatcaataaaatgattattttatgaatatatttcattgtgcaagtagataga5040
aattacatatgttacataacacacgaaataaacaaaaaaacacaatccaaaacaaacacc5100
ccaaacaaaataacactatatatatcctcgtatgaggagaggcacgttcagtgactcgac5160
gattcccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatcttca5220
aagtaatccttctgttgacttgtcattgataacatccagtcttcgtcaggattgcaaaga5280
attatagaagggatcccaccttttattttcttcttttttccatatttagggttgacagtg5340
aaatcagactggcaacctattaattgcttccacaatgggacgaacttgaaggggatgtcg5400
tcgatgatattataggtggcgtgttcatcgtagttggtgaagtcgatggtcccgttccag5460
tagttgtgtcgcccgagacttctagcccaggtggtctttccggtacgagttggtccgcag5520
atgtagaggctggggtgtctgaccccagtccttccctcatcctggttagatcggccatcc5580
actcaaggtcagattgtgcttgatcgtaggagacaggatgtatgaaagtgtaggcatcga5640
tgcttacatgatataggtgcgtctctctccagttgtgcagatcttcgtggcagcggagat5700
ctgattctgtgaagggcgacacgtactgctcaggttgtggaggaaataatttgttggctg5760
aatattccagccattgaagctttgttgcccattcatgagggaattcttctttgatcatgt5820
caagatactcctccttagacgttgcagtctggataatagttcgccatcgtgcgtcagatt5880
tgcgaggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcctttg5940
atatgtaatcaaggacttgtttagagtttctagctggctggatattagggtgatttcctt6000
caaaatcgaaaaaagaaggatccctaatacaaggttttttatcaagctggataagagcat6060
gatagtgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaataagaa6120
aaggtgtgagtttctcccagagaaactggaataaatcatctctttgagatgagcacttgg6180
ggtaggtaaggaaaacatatttagattggagtctgaagttcttgctagcagaaggcatgt6240
tgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggag6300
gcaagggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaagacg6360
aagtcttgcgacaaggggggcccacgccgaattttaatattaccggcgtggccccacctt6420
atcgcgagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgcccactag6480
ggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgatggagcgtat6540
attgtatcaggtatttccgtcggatacgaattattcgtacggccggccactagtggcact6600
ggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgcct6660
tgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgccc6720
ttcccaacagttgcgcagcctgaatggcgaatgctagagcagcttgagcttggatcagat6780
tgtcgtttcccgccttcagtttaaactatcagtgtttgacaggatatattggcgggtaaa6840
cctaagagaaaagagcgttta6861
<210>32
<211>5555
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒1008
<400>32
ctagcagaaggcatgttgttgtgactccgaggggttgcctcaaactctatcttataaccg60
gcgtggaggcatggaggcaagggcattttggtaatttaagtagttagtggaaaatgacgt120
catttacttaaagacgaagtcttgcgacaaggggggcccacgccgaattttaatattacc180
ggcgtggccccaccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaa240
agttcccgcccactagggttaaaggtgttcacactataaaagcatatacgatgtgatggt300
atttgataaagcgtatattgtatcaggtatttccgtcggatacgaattattcgtacaagc360
ttcttaagccggtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaag420
atacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaa480
acctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagg540
aaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcct600
ctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaag660
acgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcacgaca720
cacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgaga780
cttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatctgtc840
actttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgata900
aaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacccccac960
ccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggatt1020
gatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaagacc1080
cttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaataggtttt1140
gataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcatctct1200
cttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcg1260
tgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtgg1320
acacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtctt1380
gggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacgattct1440
gctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtac1500
ttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttgaaaca1560
gagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattctgccc1620
aaatttgtcgggcccatggcgaaaaacgttgcgattttcggcttattgttttctcttctt1680
gtgttggttccttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaac1740
tcaccacatgtcgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaatacca1800
ctgacaacaacacccaccaaatctcattttgcaaatctcaaaggaacagaaaccaggggg1860
aaactatgcccaaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaa1920
tgcacggggaaaataccctcggcaagagtttcaatactccatgaagtcagacctgttaca1980
tctgggtgctttcctataatgcacgacagaacaaaaattagacagctgcctaaccttctc2040
cgaggatacgaacatatcaggttatcaacccataacgttatcaatgcagaaaatgcacca2100
ggaggaccctacaaaattggaacctcagggtcttgccctaacattaccaatggaaacgga2160
tttttcgcaacaatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaat2220
ccattaacaatagaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgg2280
gggttccactctgacaacgagacccaaatggcaaagctctatggggactcaaagccccag2340
aagttcacctcatctgccaacggagtgaccacacattacgtttcacagattggtggcttc2400
ccaaatcaaacagaagacggaggactaccacaaagtggtagaattgttgttgattacatg2460
gtgcaaaaatctgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaa2520
aaggtgtggtgcgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattgga2580
gaagcagattgcctccacgaaaaatacggtggattaaacaaaagcaagccttactacaca2640
ggggaacatgcaaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctg2700
gccaatggaaccaaatatagacctcctgcaaaactattaaaggaaaggggtttcttcgga2760
gctattgctggtttcttagaaggaggatgggaaggaatgattgcaggttggcacggatac2820
acatcccatggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggcc2880
ataaacaagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaa2940
agactaagcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtg3000
gatgatctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaat3060
gaaggaataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaa3120
atgctgggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgc3180
aaccagacctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctc3240
cccacctttgattcactgaatattactgctgcatctttaaatgacgatggattggataat3300
catactatactgctttactactcaactgctgcctccagtttggctgtaacactgatgata3360
gctatctttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa3420
aggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtga3480
gcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcct3540
gtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaa3600
aaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacattt3660
ggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataat3720
ttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatga3780
gatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaa3840
tatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatctct3900
agagtctcaagcttggcgcggggtaccgagctcgaattccgagtgtacttcaagtcagtt3960
ggaaatcaataaaatgattattttatgaatatatttcattgtgcaagtagatagaaatta4020
catatgttacataacacacgaaataaacaaaaaaacacaatccaaaacaaacaccccaaa4080
caaaataacactatatatatcctcgtatgaggagaggcacgttcagtgactcgacgattc4140
ccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatcttcaaagta4200
atccttctgttgacttgtcattgataacatccagtcttcgtcaggattgcaaagaattat4260
agaagggatcccaccttttattttcttcttttttccatatttagggttgacagtgaaatc4320
agactggcaacctattaattgcttccacaatgggacgaacttgaaggggatgtcgtcgat4380
gatattataggtggcgtgttcatcgtagttggtgaagtcgatggtcccgttccagtagtt4440
gtgtcgcccgagacttctagcccaggtggtctttccggtacgagttggtccgcagatgta4500
gaggctggggtgtctgaccccagtccttccctcatcctggttagatcggccatccactca4560
aggtcagattgtgcttgatcgtaggagacaggatgtatgaaagtgtaggcatcgatgctt4620
acatgatataggtgcgtctctctccagttgtgcagatcttcgtggcagcggagatctgat4680
tctgtgaagggcgacacgtactgctcaggttgtggaggaaataatttgttggctgaatat4740
tccagccattgaagctttgttgcccattcatgagggaattcttctttgatcatgtcaaga4800
tactcctccttagacgttgcagtctggataatagttcgccatcgtgcgtcagatttgcga4860
ggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcctttgatatg4920
taatcaaggacttgtttagagtttctagctggctggatattagggtgatttccttcaaaa4980
tcgaaaaaagaaggatccctaatacaaggttttttatcaagctggataagagcatgatag5040
tgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaataagaaaaggt5100
gtgagtttctcccagagaaactggaataaatcatctctttgagatgagcacttggggtag5160
gtaaggaaaacatatttagattggagtctgaagttcttgctagcagaaggcatgttgttg5220
tgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggaggcaag5280
ggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaagacgaagtc5340
ttgcgacaaggggggcccacgccgaattttaatattaccggcgtggccccaccttatcgc5400
gagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgcccactagggtta5460
aaggtgttcacactataaaagcatatacgatgtgatggtatttgatggagcgtatattgt5520
atcaggtatttccgtcggatacgaattattcgtac5555
<210>33
<211>31
<212>prt
<213>流感h6野鸭hk(influenzah6tealhk)
<400>33
valproglnilegluthrargglyleupheglyalailealaglyphe
151015
ilegluglyglytrpthrglymetileaspglytrptyrglytyr
202530
<210>34
<211>42
<212>prt
<213>流感h7eq布拉格(influenzah7eqprague)
<400>34
valproglualaproalahislysglnleuthrhishismetarglys
151015
lysargglyleupheglyalailealaglypheilegluasnglytrp
202530
gluglyleuileaspglytrptyrglytyr
3540
<210>35
<211>31
<212>prt
<213>流感h9ahk(influenzah9ahk)
<400>35
valproalaargserserargglyleupheglyalailealaglyphe
151015
ilegluglyglytrpproglyleuvalalaglytrptyrglyphe
202530
<210>36
<211>43
<212>prt
<213>流感b佛罗里达(influenzabflorida)
<400>36
leulysleualaasnglythrlystyrargproproalalysleuleu
151015
lysgluargglyphepheglyalailealaglypheleugluglygly
202530
trpgluglymetilealaglytrphisglytyr
3540
<210>37
<211>43
<212>prt
<213>流感b马来西亚(influenzabmalaysia)
<400>37
leulysleualaasnglythrlystyrargproproalalysleuleu
151015
lysgluargglyphepheglyalailealaglypheleugluglygly
202530
trpgluglymetilealaglytrphisglytyr
3540
<210>38
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体10591039加1059.r
<400>38
cttcccatcctccaccaggaggtctatatttggttccattggccagcttcaa52
<210>39
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1039加1059.c
<400>39
caaatatagacctcctggtggaggatgggaaggaatgattgcaggttggcac52
<210>40
<211>5504
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒1059
<400>40
ctagcagaaggcatgttgttgtgactccgaggggttgcctcaaactctatcttataaccg60
gcgtggaggcatggaggcaagggcattttggtaatttaagtagttagtggaaaatgacgt120
catttacttaaagacgaagtcttgcgacaaggggggcccacgccgaattttaatattacc180
ggcgtggccccaccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaa240
agttcccgcccactagggttaaaggtgttcacactataaaagcatatacgatgtgatggt300
atttgataaagcgtatattgtatcaggtatttccgtcggatacgaattattcgtacaagc360
ttcttaagccggtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaag420
atacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaa480
acctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagg540
aaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcct600
ctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaag660
acgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcacgaca720
cacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgaga780
cttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatctgtc840
actttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgata900
aaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacccccac960
ccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggatt1020
gatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaagacc1080
cttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaataggtttt1140
gataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcatctct1200
cttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcg1260
tgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtgg1320
acacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtctt1380
gggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacgattct1440
gctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtac1500
ttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttgaaaca1560
gagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattctgccc1620
aaatttgtcgggcccatggcgaaaaacgttgcgattttcggcttattgttttctcttctt1680
gtgttggttccttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaac1740
tcaccacatgtcgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaatacca1800
ctgacaacaacacccaccaaatctcattttgcaaatctcaaaggaacagaaaccaggggg1860
aaactatgcccaaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaa1920
tgcacggggaaaataccctcggcaagagtttcaatactccatgaagtcagacctgttaca1980
tctgggtgctttcctataatgcacgacagaacaaaaattagacagctgcctaaccttctc2040
cgaggatacgaacatatcaggttatcaacccataacgttatcaatgcagaaaatgcacca2100
ggaggaccctacaaaattggaacctcagggtcttgccctaacattaccaatggaaacgga2160
tttttcgcaacaatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaat2220
ccattaacaatagaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgg2280
gggttccactctgacaacgagacccaaatggcaaagctctatggggactcaaagccccag2340
aagttcacctcatctgccaacggagtgaccacacattacgtttcacagattggtggcttc2400
ccaaatcaaacagaagacggaggactaccacaaagtggtagaattgttgttgattacatg2460
gtgcaaaaatctgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaa2520
aaggtgtggtgcgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattgga2580
gaagcagattgcctccacgaaaaatacggtggattaaacaaaagcaagccttactacaca2640
ggggaacatgcaaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctg2700
gccaatggaaccaaatatagacctcctggtggaggatgggaaggaatgattgcaggttgg2760
cacggatacacatcccatggggcacatggagtagcggtggcagcagaccttaagagcact2820
caagaggccataaacaagataacaaaaaatctcaactctttgagtgagctggaagtaaag2880
aatcttcaaagactaagcggtgccatggatgaactccacaacgaaatactagaactagat2940
gagaaagtggatgatctcagagctgatacaataagctcacaaatagaactcgcagtcctg3000
ctttccaatgaaggaataataaacagtgaagatgaacatctcttggcgcttgaaagaaag3060
ctgaagaaaatgctgggcccctctgctgtagagatagggaatggatgctttgaaaccaaa3120
cacaagtgcaaccagacctgtctcgacagaatagctgctggtacctttgatgcaggagaa3180
ttttctctccccacctttgattcactgaatattactgctgcatctttaaatgacgatgga3240
ttggataatcatactatactgctttactactcaactgctgcctccagtttggctgtaaca3300
ctgatgatagctatctttgttgtttatatggtctccagagacaatgtttcttgctccatc3360
tgtctataaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctat3420
gtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttg3480
tgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttatt3540
aaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgtt3600
caaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatta3660
tcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgt3720
tatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatag3780
aaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttac3840
tagatctctagagtctcaagcttggcgcggggtaccgagctcgaattccgagtgtacttc3900
aagtcagttggaaatcaataaaatgattattttatgaatatatttcattgtgcaagtaga3960
tagaaattacatatgttacataacacacgaaataaacaaaaaaacacaatccaaaacaaa4020
caccccaaacaaaataacactatatatatcctcgtatgaggagaggcacgttcagtgact4080
cgacgattcccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatc4140
ttcaaagtaatccttctgttgacttgtcattgataacatccagtcttcgtcaggattgca4200
aagaattatagaagggatcccaccttttattttcttcttttttccatatttagggttgac4260
agtgaaatcagactggcaacctattaattgcttccacaatgggacgaacttgaaggggat4320
gtcgtcgatgatattataggtggcgtgttcatcgtagttggtgaagtcgatggtcccgtt4380
ccagtagttgtgtcgcccgagacttctagcccaggtggtctttccggtacgagttggtcc4440
gcagatgtagaggctggggtgtctgaccccagtccttccctcatcctggttagatcggcc4500
atccactcaaggtcagattgtgcttgatcgtaggagacaggatgtatgaaagtgtaggca4560
tcgatgcttacatgatataggtgcgtctctctccagttgtgcagatcttcgtggcagcgg4620
agatctgattctgtgaagggcgacacgtactgctcaggttgtggaggaaataatttgttg4680
gctgaatattccagccattgaagctttgttgcccattcatgagggaattcttctttgatc4740
atgtcaagatactcctccttagacgttgcagtctggataatagttcgccatcgtgcgtca4800
gatttgcgaggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcc4860
tttgatatgtaatcaaggacttgtttagagtttctagctggctggatattagggtgattt4920
ccttcaaaatcgaaaaaagaaggatccctaatacaaggttttttatcaagctggataaga4980
gcatgatagtgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaata5040
agaaaaggtgtgagtttctcccagagaaactggaataaatcatctctttgagatgagcac5100
ttggggtaggtaaggaaaacatatttagattggagtctgaagttcttgctagcagaaggc5160
atgttgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcat5220
ggaggcaagggcattttggtaatttaagtagttagtggaaaatgacgtcatttacttaaa5280
gacgaagtcttgcgacaaggggggcccacgccgaattttaatattaccggcgtggcccca5340
ccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaagttcccgccca5400
ctagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgatggagc5460
gtatattgtatcaggtatttccgtcggatacgaattattcgtac5504
<210>41
<211>577
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/ha流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)(缺失的蛋白水解环)的氨基酸序列
<400>41
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglylysileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnilethrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnasplysasnlysthr
180185190
alathrasnproleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproglyglyglytrp
355360365
gluglymetilealaglytrphisglytyrthrserhisglyalahis
370375380
glyvalalavalalaalaaspleulysserthrglnglualaileasn
385390395400
lysilethrlysasnleuasnserleusergluleugluvallysasn
405410415
leuglnargleuserglyalametaspgluleuhisasngluileleu
420425430
gluleuaspglulysvalaspaspleuargalaaspthrileserser
435440445
glnilegluleualavalleuleuserasngluglyileileasnser
450455460
gluaspgluhisleuleualaleugluarglysleulyslysmetleu
465470475480
glyproseralavalgluileglyasnglycysphegluthrlyshis
485490495
lyscysasnglnthrcysleuaspargilealaalaglythrpheasp
500505510
alaglyglupheserleuprothrpheaspserleuasnilethrala
515520525
alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr
530535540
tyrserthralaalaserserleualavalthrleumetilealaile
545550555560
phevalvaltyrmetvalserargaspasnvalsercysserilecys
565570575
leu
<210>42
<211>1707
<212>dna
<213>流感h5a/印度尼西亚/5/2005(h5n1)(influenzah5a/indonesia/5/2005(h5n1))
<400>42
atggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagatttgc60
attggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaacgtt120
actgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcgatcta180
gatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgggaac240
ccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggccaat300
ccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaacaccta360
ttgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtccgat420
catgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctttttt480
agaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaagctac540
aataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatgatgcg600
gcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatcaaca660
ctaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaagtgga720
aggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagagtaat780
ggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagcaatt840
atgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatgggggcg900
ataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccccaaa960
tatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaagagag1020
agcagaagaaaaaagagaggactatttggagctatagcaggttttatagagggaggatgg1080
cagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtac1140
gctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactca1200
atcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaa1260
aggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctggacttat1320
aatgccgaacttctggttctcatggaaaatgagagaactctagactttcatgactcaaat1380
gttaagaacctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggt1440
aacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaac1500
ggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagt1560
ggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcg1620
agttccctagcactggcaatcatgatggctggtctatctttatggatgtgctccaatgga1680
tcgttacaatgcagaatttgcatttaa1707
<210>43
<211>1734
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/ha流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)(缺失的蛋白水解环)的核苷酸序列
<400>43
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120
aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180
accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240
tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300
ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360
ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420
atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480
attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540
gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600
gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660
aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720
gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780
gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840
aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900
agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960
cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020
gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080
tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140
catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200
aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260
agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320
ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380
ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440
ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500
acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560
tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620
atactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatc1680
tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734
<210>44
<211>19
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5/indo切割位点的天然序列
<400>44
thrglyleuargasnserproglnarggluserargarglyslysarg
151015
glyleuphe
<210>45
<211>15
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5/印度尼西亚修饰的切割位点(tetr)
<400>45
thrglyleuargasnserproglnthrgluthrargglyleuphe
151015
<210>46
<211>15
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5/印度尼西亚修饰的切割位点(tetq)
<400>46
thrglyleuargasnserproglnthrgluthrglnglyleuphe
151015
<210>47
<211>11
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h1切割位点
<400>47
asnileproserileglnserargglyleuphe
1510
<210>48
<211>11
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h3切割位点
<400>48
asnvalproglulysglnthrargglyilephe
1510
<210>49
<211>46
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1462if-hab110.s1+3c
<400>49
alaalaalathrthrthrglythrcysglyglyglycyscyscysala
151015
thrglyalaalaglyglycysalaalathralaalathrthrglythr
202530
alacysthralacysthrcysalathrglyglythralagly
354045
<210>50
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1462号if-hab110.s1-4r
<400>50
actaaagaaaataggcctttatagacagatggagcatgaaacgttgtctctg52
<210>51
<211>1755
<212>dna
<213>流感hab威斯康星州(influenzahabwisconsin)
<400>51
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60
gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120
gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180
ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240
gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300
gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360
caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420
gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480
gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540
aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600
caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660
gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720
cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780
gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840
gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900
ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960
aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020
acacctttgaagcttgccaatggaaccaaatatagacctcctgcaaaactattgaaggaa1080
aggggtttcttcggagctattgctggtttcctagaaggaggatgggaaggaatgattgca1140
ggttggcacggatacacatctcacggagcacatggagtggcagtggcggcagaccttaag1200
agtacacaagaagctataaataagataacaaaaaatctcaattctttgagtgagctagaa1260
gtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgag1320
ctggatgagaaagtggatgatctcagagctgacactataagctcacaaatagaacttgca1380
gtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattggcacttgag1440
agaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacggatgcttcgaa1500
accaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacctttaatgca1560
ggagaattttctctccccacttttgattcattgaacattactgctgcatctttaaatgat1620
gatggattggataaccatactatactgctctattactcaactgctgcttctagtttggct1680
gtaacattaatgctagctatttttattgtttatatggtctccagagacaacgtttcatgc1740
tccatctgtctataa1755
<210>52
<211>6745
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体193
<400>52
tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60
gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120
aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180
aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240
ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300
gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360
aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420
aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480
taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540
aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600
atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660
taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720
tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780
gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840
acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900
ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960
accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020
gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080
aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140
gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200
actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260
aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320
gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380
tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440
agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500
tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560
tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620
ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680
tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740
ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800
cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860
gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920
tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980
ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040
ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100
cgcgttgggaattactagcgcgtgtcgagacgcgttgttgttgtgactccgaggggttgc2160
ctcaaactctatcttataaccggcgtggaggcatggaggcaggggtattttggtcatttt2220
aatagatagtggaaaatgacgtggaatttacttaaagacgaagtctttgcgacaaggggg2280
ggcccacgccgaatttaatattaccggcgtggcccccccttatcgcgagtgctttagcac2340
gagcggtccagatttaaagtagaaaatttcccgcccactagggttaaaggtgttcacact2400
ataaaagcatatacgatgtgatggtatttggtcgacaagcttgcatgccggtcaacatgg2460
tggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaa2520
gggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcc2580
cagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgcc2640
atcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaag2700
atggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaa2760
agcaagtggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaata2820
tcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatat2880
ccggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtgg2940
aaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaag3000
atgcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaa3060
aagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacg3120
taagggatgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagtt3180
catttcatttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaa3240
acccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctctt3300
gtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacg3360
ttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccatta3420
aataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctgga3480
ggctgctgttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaa3540
tatctctacttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgct3600
gattggttctataagaaatctagtattttctttgaaacagagttttcccgtggttttcga3660
acttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccgcggat3720
ggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttctca3780
gatcttcgcctgcaggctcctcagccaaaacgacacccccatctgtctatccactggccc3840
ctggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggctatt3900
tccctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcacacct3960
tcccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccctcca4020
gcacctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcaccaagg4080
tggacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtcccag4140
aagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattactctga4200
ctcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccagttca4260
gctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggagcagt4320
tcaacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctcaatg4380
gcaaggagcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggcctatttt4440
ctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctg4500
tgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggt4560
cgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaaga4620
ccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagt4680
ttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaat4740
tacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggttttt4800
atgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgca4860
aactaggataaattatcgcgcgcggtgtcatctatgttactagatctctagagtctcaag4920
cttggcgcgccataaaatgattattttatgaatatatttcattgtgcaagtagatagaaa4980
ttacatatgttacataacacacgaaataaacaaaaaaagacaatccaaaaacaaacaccc5040
caaaaaaaataatcactttagataaactcgtatgaggagaggcacgttcagtgactcgac5100
gattcccgagcaaaaaaagtctccccgtcacacatatagtgggtgacgcaattatcttta5160
aagtaatccttctgttgacttgtcattgataacatccagtcttcgtcaggattgcaaaga5220
attatagaagggatcccaccttttattttcttcttttttccatatttagggttgacagtg5280
aaatcagactggcaacctattaattgcttccacaatgggacgaacttgaaggggatgtcg5340
tcgatgatattataggtggcgtgttcatcgtagttggtgaaatcgatggtaccgttccaa5400
tagttgtgtcgtccgagacttctagcccaggtggtctttccggtacgagttggtccgcag5460
atgtagaggctggggtgtcggattccattccttccattgtcctggttaaatcggccatcc5520
attcaaggtcagattgagcttgttggtatgagacaggatgtatgtaagtataagcgtcta5580
tgcttacatggtatagatgggtttccctccaggagtgtagatcttcgtggcagcgaagat5640
ctgattctgtgaagggcgacacatacggttcaggttgtggagggaataatttgttggctg5700
aatattccagccattgaagttttgttgcccattcatgagggaattcttccttgatcatgt5760
caagatattcctccttagacgttgcagtctggataatagttctccatcgtgcgtcagatt5820
tgcgaggagagaccttatgatctcggaaatctcctctggttttaatatctccgtcctttg5880
atatgtaatcaaggacttgtttagagtttctagctggctggatattagggtgatttcctt5940
caaaatcgaaaaaagaaggatccctaatacaaggttttttatcaagctggagaagagcat6000
gatagtgggtagtgccatcttgatgaagctcagaagcaacaccaaggaagaaaataagaa6060
aaggtgtgagtttctcccagagaaactggaataaatcatctctttgagatgagcacttgg6120
gataggtaaggaaaacatatttagattggagtctgaagttcttactagcagaaggcatgt6180
tgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatggag6240
gcaggggtattttggtcattttaatagatagtggaaaatgacgtggaatttacttaaaga6300
cgaagtctttgcgacaagggggggcccacgccgaatttaatattaccggcgtggcccccc6360
cttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaatttcccgcccac6420
tagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttgactagtgg6480
cactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatc6540
gccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatc6600
gcccttcccaacagttgcgcagcctgaatggcgaatgctagagcagcttgagcttggatc6660
agattgtcgtttcccgccttcagtttaaactatcagtgtttgacaggatatattggcggg6720
taaacctaagagaaaagagcgttta6745
<210>53
<211>3495
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒1462
<400>53
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctg1320
cactgggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggt1380
caatgtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatct1440
caaaggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctgga1500
tgtggccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatact1560
ccacgaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaat1620
caggcaactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgt1680
tatcgatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccc1740
taacgctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaa1800
ctacaaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaagggga1860
agaccaaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctcta1920
tggagactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgt1980
ttctcagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcag2040
aattgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaag2100
aggtgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagg2160
gtcattgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaa2220
aagcaagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggt2280
aaaaacacctttgaagcttgccaatggaaccaaatatagacctcctgcaaaactattgaa2340
ggaaaggggtttcttcggagctattgctggtttcctagaaggaggatgggaaggaatgat2400
tgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggcagacct2460
taagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagtgagct2520
agaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaaatact2580
cgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaatagaact2640
tgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattggcact2700
tgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacggatgctt2760
cgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacctttaa2820
tgcaggagaattttctctccccacttttgattcattgaacattactgctgcatctttaaa2880
tgatgatggattggataaccatactatactgctctattactcaactgctgcttctagttt2940
ggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaacgtttc3000
atgctccatctgtctataaaggcctattttctttagtttgaatttactgttattcggtgt3060
gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt3120
aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt3180
taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct3240
gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt3300
gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa3360
tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3420
tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3480
tctatgttactagat3495
<210>54
<211>584
<212>prt
<213>流感b/威斯康星州/1/2010(influenzab/wisconsin/1/2010)
<400>54
metlysalaileilevalleuleumetvalvalthrserasnalaasp
151015
argilecysthrglyilethrserserasnserprohisvalvallys
202530
thralathrglnglygluvalasnvalthrglyvalileproleuthr
354045
thrthrprothrlyssertyrphealaasnleulysglythrargthr
505560
argglylysleucysproaspcysleuasncysthraspleuaspval
65707580
alaleuglyargprometcysvalglythrthrproseralalysala
859095
serileleuhisgluvalargprovalthrserglycyspheproile
100105110
methisaspargthrlysileargglnleuproasnleuleuarggly
115120125
tyrgluasnileargleuserthrglnasnvalileaspalaglulys
130135140
alaproglyglyprotyrargleuglythrserglysercysproasn
145150155160
alathrserlysileglyphephealathrmetalatrpalavalpro
165170175
lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro
180185190
tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis
195200205
seraspasnlysthrglnmetlysserleutyrglyaspserasnpro
210215220
glnlysphethrserseralaasnglyvalthrthrhistyrvalser
225230235240
glnileglyasppheproaspglnthrgluaspglyglyleuprogln
245250255
serglyargilevalvalasptyrmetmetglnlysproglylysthr
260265270
glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp
275280285
cysalaserglyargserlysvalilelysglyserleuproleuile
290295300
glyglualaaspcysleuhisglulystyrglyglyleuasnlysser
305310315320
lysprotyrtyrthrglygluhisalalysalaileglyasncyspro
325330335
iletrpvallysthrproleulysleualaasnglythrlystyrarg
340345350
proproalalysleuleulysgluargglyphepheglyalaileala
355360365
glypheleugluglyglytrpgluglymetilealaglytrphisgly
370375380
tyrthrserhisglyalahisglyvalalavalalaalaaspleulys
385390395400
serthrglnglualaileasnlysilethrlysasnleuasnserleu
405410415
sergluleugluvallysasnleuglnargleuserglyalametasp
420425430
gluleuhisasngluileleugluleuaspglulysvalaspaspleu
435440445
argalaaspthrileserserglnilegluleualavalleuleuser
450455460
asngluglyileileasnsergluaspgluhisleuleualaleuglu
465470475480
arglysleulyslysmetleuglyproseralavalaspileglyasn
485490495
glycysphegluthrlyshislyscysasnglnthrcysleuasparg
500505510
ilealaalaglythrpheasnalaglyglupheserleuprothrphe
515520525
aspserleuasnilethralaalaserleuasnaspaspglyleuasp
530535540
asnhisthrileleuleutyrtyrserthralaalaserserleuala
545550555560
valthrleumetleualailepheilevaltyrmetvalserargasp
565570575
asnvalsercysserilecysleu
580
<210>55
<211>56
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1467hab110(prl-).r
<400>55
tccttcccatcctccaccaggaggtctatatttggttccattggcaagcttcaaag56
<210>56
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1467hab110(prl-).c
<400>56
atatagacctcctggtggaggatgggaaggaatgattgcaggttggcacgga52
<210>57
<211>3444
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1467
<400>57
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctg1320
cactgggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggt1380
caatgtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatct1440
caaaggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctgga1500
tgtggccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatact1560
ccacgaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaat1620
caggcaactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgt1680
tatcgatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccc1740
taacgctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaa1800
ctacaaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaagggga1860
agaccaaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctcta1920
tggagactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgt1980
ttctcagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcag2040
aattgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaag2100
aggtgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagg2160
gtcattgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaa2220
aagcaagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggt2280
aaaaacacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatggga2340
aggaatgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggc2400
ggcagaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattcttt2460
gagtgagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaa2520
cgaaatactcgagctggatgagaaagtggatgatctcagagctgacactataagctcaca2580
aatagaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatct2640
attggcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaa2700
cggatgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctgg2760
cacctttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgc2820
atctttaaatgatgatggattggataaccatactatactgctctattactcaactgctgc2880
ttctagtttggctgtaacattaatgctagctatttttattgtttatatggtctccagaga2940
caacgtttcatgctccatctgtctataaaggcctattttctttagtttgaatttactgtt3000
attcggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttatttt3060
atgtaatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacaca3120
aaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagct3180
tatcgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgtt3240
gccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataatt3300
aacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaatta3360
tacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgc3420
gcggtgtcatctatgttactagat3444
<210>58
<211>567
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>ha流感b/威斯康星州/1/2010(缺失的pl)的氨基酸序列
<400>58
metlysalaileilevalleuleumetvalvalthrserasnalaasp
151015
argilecysthrglyilethrserserasnserprohisvalvallys
202530
thralathrglnglygluvalasnvalthrglyvalileproleuthr
354045
thrthrprothrlyssertyrphealaasnleulysglythrargthr
505560
argglylysleucysproaspcysleuasncysthraspleuaspval
65707580
alaleuglyargprometcysvalglythrthrproseralalysala
859095
serileleuhisgluvalargprovalthrserglycyspheproile
100105110
methisaspargthrlysileargglnleuproasnleuleuarggly
115120125
tyrgluasnileargleuserthrglnasnvalileaspalaglulys
130135140
alaproglyglyprotyrargleuglythrserglysercysproasn
145150155160
alathrserlysileglyphephealathrmetalatrpalavalpro
165170175
lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro
180185190
tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis
195200205
seraspasnlysthrglnmetlysserleutyrglyaspserasnpro
210215220
glnlysphethrserseralaasnglyvalthrthrhistyrvalser
225230235240
glnileglyasppheproaspglnthrgluaspglyglyleuprogln
245250255
serglyargilevalvalasptyrmetmetglnlysproglylysthr
260265270
glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp
275280285
cysalaserglyargserlysvalilelysglyserleuproleuile
290295300
glyglualaaspcysleuhisglulystyrglyglyleuasnlysser
305310315320
lysprotyrtyrthrglygluhisalalysalaileglyasncyspro
325330335
iletrpvallysthrproleulysleualaasnglythrlystyrarg
340345350
proproglyglyglytrpgluglymetilealaglytrphisglytyr
355360365
thrserhisglyalahisglyvalalavalalaalaaspleulysser
370375380
thrglnglualaileasnlysilethrlysasnleuasnserleuser
385390395400
gluleugluvallysasnleuglnargleuserglyalametaspglu
405410415
leuhisasngluileleugluleuaspglulysvalaspaspleuarg
420425430
alaaspthrileserserglnilegluleualavalleuleuserasn
435440445
gluglyileileasnsergluaspgluhisleuleualaleugluarg
450455460
lysleulyslysmetleuglyproseralavalaspileglyasngly
465470475480
cysphegluthrlyshislyscysasnglnthrcysleuaspargile
485490495
alaalaglythrpheasnalaglyglupheserleuprothrpheasp
500505510
serleuasnilethralaalaserleuasnaspaspglyleuaspasn
515520525
histhrileleuleutyrtyrserthralaalaserserleualaval
530535540
thrleumetleualailepheilevaltyrmetvalserargaspasn
545550555560
valsercysserilecysleu
565
<210>59
<211>11
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>b切割位点
<400>59
proalalysleuleulysgluargglyphephe
1510
<210>60
<211>19
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5/印度尼西亚天然的切割位点
<400>60
thrglyleuargasnserproglnarggluserargarglyslysarg
151015
glyleuphe
<210>61
<211>15
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5/印度尼西亚修饰的切割位点
<400>61
thrglyleuargasnserproglnthrgluthrargglyleuphe
151015
<210>62
<211>15
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5/印度尼西亚修饰的切割位点
<400>62
thrglyleuargasnserproglnthrgluthrglnglyleuphe
151015
<210>63
<211>11
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h1/布里斯班修饰的切割位点
<400>63
asnileproserileglnserglnglyleuphe
1510
<210>64
<211>11
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h3/布里斯班修饰的切割位点
<400>64
asnvalprogluileglnthrglnglyilephe
1510
<210>65
<211>11
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>b/佛罗里达、b/布里斯班修饰的切割位点
<400>65
proalaileleuleuasnileglnglyphephe
1510
<210>66
<211>19
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>a/h3/ha0共有序列
<400>66
asnvalproglulysglnthrargglyilepheglyalailealagly
151015
pheileglu
<210>67
<211>19
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>a/h1/ha0共有序列
<400>67
asnileproserileglnserargglyleupheglyalailealagly
151015
pheileglu
<210>68
<211>19
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>b/ha0共有序列
<400>68
proalalysleuleulysgluargglyphepheglyalailealagly
151015
pheleuglu
<210>69
<211>16
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5安徽蛋白水解环缺失
<400>69
serproleuglyglytrpglnglymetvalaspglytrptyrglytyr
151015
<210>70
<211>16
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5印度尼西亚蛋白水解环缺失
<400>70
serproglnglyglytrpglnglymetvalaspglytrptyrglytyr
151015
<210>71
<211>16
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h5越南蛋白水解环缺失
<400>71
serproglnglyglytrpglnglymetvalaspglytrptyrglytyr
151015
<210>72
<211>25
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>b佛罗里达蛋白水解环缺失
<400>72
leulysleualaasnglythrlystyrargproproglyglytrpglu
151015
glymetilealaglytrphisglytyr
2025
<210>73
<211>25
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>b马来西亚蛋白水解环缺失
<400>73
leulysleualaasnglythrlystyrargproproglyglytrpglu
151015
glymetilealaglytrphisglytyr
2025
<210>74
<211>45
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物mutcleavage-h5(indo).r
<400>74
tagtcctcttgtctctgtttgagggctatttctgagccctgttgc45
<210>75
<211>45
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物mutcleavage-h5(indo).c
<400>75
tagccctcaaacagagacaagaggactatttggagctatagcagg45
<210>76
<211>3435
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒676
<400>76
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320
ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380
cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440
tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500
gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560
caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620
cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680
cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740
ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800
ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860
tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920
aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980
tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040
taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100
aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160
ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220
caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaac2280
agagacaagaggactatttggagctatagcaggttttatagagggaggatggcagggaat2340
ggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtacgctgcaga2400
caaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactcaatcattga2460
caaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaaaggagaat2520
agagaatttaaacaagaagatggaagacgggtttctagatgtctggacttataatgccga2580
acttctggttctcatggaaaatgagagaactctagactttcatgactcaaatgttaagaa2640
cctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggtaacggttg2700
tttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaacggaacgta2760
caactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagtggggtaaa2820
attggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcgagttccct2880
agcactggcaatcatgatggctggtctatctttatggatgtgctccaatggatcgttaca2940
atgcagaatttgcatttaaaggcctattttctttagtttgaatttactgttattcggtgt3000
gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt3060
aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt3120
taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct3180
gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt3240
gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa3300
tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3360
tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3420
tctatgttactagat3435
<210>77
<211>564
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>流感a/印度尼西亚/5/2005(h5n1)tetr切割位点突变的氨基酸序列
<400>77
metglulysilevalleuleuleualailevalserleuvallysser
151015
aspglnilecysileglytyrhisalaasnasnserthrgluglnval
202530
aspthrilemetglulysasnvalthrvalthrhisalaglnaspile
354045
leuglulysthrhisasnglylysleucysaspleuaspglyvallys
505560
proleuileleuargaspcysservalalaglytrpleuleuglyasn
65707580
prometcysaspglupheileasnvalproglutrpsertyrileval
859095
glulysalaasnprothrasnaspleucystyrproglyserpheasn
100105110
asptyrglugluleulyshisleuleuserargileasnhispheglu
115120125
lysileglnileileprolyssersertrpserasphisglualaser
130135140
serglyvalserseralacysprotyrleuglyserproserphephe
145150155160
argasnvalvaltrpleuilelyslysasnserthrtyrprothrile
165170175
lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp
180185190
glyilehishisproasnaspalaalagluglnthrargleutyrgln
195200205
asnprothrthrtyrileserileglythrserthrleuasnglnarg
210215220
leuvalprolysilealathrargserlysvalasnglyglnsergly
225230235240
argmetgluphephetrpthrileleulysproasnaspalaileasn
245250255
phegluserasnglyasnpheilealaproglutyralatyrlysile
260265270
vallyslysglyaspseralailemetlyssergluleuglutyrgly
275280285
asncysasnthrlyscysglnthrprometglyalaileasnserser
290295300
metprophehisasnilehisproleuthrileglyglucysprolys
305310315320
tyrvallysserasnargleuvalleualathrglyleuargasnser
325330335
proglnthrgluthrargglyleupheglyalailealaglypheile
340345350
gluglyglytrpglnglymetvalaspglytrptyrglytyrhishis
355360365
serasngluglnglyserglytyralaalaasplysgluserthrgln
370375380
lysalaileaspglyvalthrasnlysvalasnserileileasplys
385390395400
metasnthrglnpheglualavalglyargglupheasnasnleuglu
405410415
argargilegluasnleuasnlyslysmetgluaspglypheleuasp
420425430
valtrpthrtyrasnalagluleuleuvalleumetgluasngluarg
435440445
thrleuaspphehisaspserasnvallysasnleutyrasplysval
450455460
argleuglnleuargaspasnalalysgluleuglyasnglycysphe
465470475480
gluphetyrhislyscysaspasnglucysmetgluserileargasn
485490495
glythrtyrasntyrproglntyrsergluglualaargleulysarg
500505510
glugluileserglyvallysleugluserileglythrtyrglnile
515520525
leuseriletyrserthrvalalaserserleualaleualailemet
530535540
metalaglyleuserleutrpmetcysserasnglyserleuglncys
545550555560
argilecysile
<210>78
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物h5i505_tetq.r
<400>78
tccaaatagtccttgtgtctctgtttgagggctatttctgagccctgt48
<210>79
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物h5i505_tetq.c
<400>79
aaatagccctcaaacagagacacaaggactatttggagctatagcagg48
<210>80
<211>3435
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒766
<400>80
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320
ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380
cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440
tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500
gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560
caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620
cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680
cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740
ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800
ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860
tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920
aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980
tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040
taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100
aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160
ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220
caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaac2280
agagacacaaggactatttggagctatagcaggttttatagagggaggatggcagggaat2340
ggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtacgctgcaga2400
caaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactcaatcattga2460
caaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaaaggagaat2520
agagaatttaaacaagaagatggaagacgggtttctagatgtctggacttataatgccga2580
acttctggttctcatggaaaatgagagaactctagactttcatgactcaaatgttaagaa2640
cctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggtaacggttg2700
tttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaacggaacgta2760
caactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagtggggtaaa2820
attggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcgagttccct2880
agcactggcaatcatgatggctggtctatctttatggatgtgctccaatggatcgttaca2940
atgcagaatttgcatttaaaggcctattttctttagtttgaatttactgttattcggtgt3000
gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt3060
aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt3120
taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct3180
gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt3240
gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa3300
tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3360
tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3420
tctatgttactagat3435
<210>81
<211>564
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>流感a/印度尼西亚/5/2005(h5n1)tetq切割位点突变的氨基酸序列
<400>81
metglulysilevalleuleuleualailevalserleuvallysser
151015
aspglnilecysileglytyrhisalaasnasnserthrgluglnval
202530
aspthrilemetglulysasnvalthrvalthrhisalaglnaspile
354045
leuglulysthrhisasnglylysleucysaspleuaspglyvallys
505560
proleuileleuargaspcysservalalaglytrpleuleuglyasn
65707580
prometcysaspglupheileasnvalproglutrpsertyrileval
859095
glulysalaasnprothrasnaspleucystyrproglyserpheasn
100105110
asptyrglugluleulyshisleuleuserargileasnhispheglu
115120125
lysileglnileileprolyssersertrpserasphisglualaser
130135140
serglyvalserseralacysprotyrleuglyserproserphephe
145150155160
argasnvalvaltrpleuilelyslysasnserthrtyrprothrile
165170175
lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp
180185190
glyilehishisproasnaspalaalagluglnthrargleutyrgln
195200205
asnprothrthrtyrileserileglythrserthrleuasnglnarg
210215220
leuvalprolysilealathrargserlysvalasnglyglnsergly
225230235240
argmetgluphephetrpthrileleulysproasnaspalaileasn
245250255
phegluserasnglyasnpheilealaproglutyralatyrlysile
260265270
vallyslysglyaspseralailemetlyssergluleuglutyrgly
275280285
asncysasnthrlyscysglnthrprometglyalaileasnserser
290295300
metprophehisasnilehisproleuthrileglyglucysprolys
305310315320
tyrvallysserasnargleuvalleualathrglyleuargasnser
325330335
proglnthrgluthrglnglyleupheglyalailealaglypheile
340345350
gluglyglytrpglnglymetvalaspglytrptyrglytyrhishis
355360365
serasngluglnglyserglytyralaalaasplysgluserthrgln
370375380
lysalaileaspglyvalthrasnlysvalasnserileileasplys
385390395400
metasnthrglnpheglualavalglyargglupheasnasnleuglu
405410415
argargilegluasnleuasnlyslysmetgluaspglypheleuasp
420425430
valtrpthrtyrasnalagluleuleuvalleumetgluasngluarg
435440445
thrleuaspphehisaspserasnvallysasnleutyrasplysval
450455460
argleuglnleuargaspasnalalysgluleuglyasnglycysphe
465470475480
gluphetyrhislyscysaspasnglucysmetgluserileargasn
485490495
glythrtyrasntyrproglntyrsergluglualaargleulysarg
500505510
glugluileserglyvallysleugluserileglythrtyrglnile
515520525
leuseriletyrserthrvalalaserserleualaleualailemet
530535540
metalaglyleuserleutrpmetcysserasnglyserleuglncys
545550555560
argilecysile
<210>82
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物h5i505(prl-).r
<400>82
ctgccatcctccgccagggctatttctgagccctgttgcaaggactaatc50
<210>83
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>引物h5i505(prl-).c
<400>83
gaaatagccctggcggaggatggcagggaatggtagatggttggtatgggta52
<210>84
<211>3390
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒928
<400>84
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagat1320
ttgcattggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaa1380
cgttactgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcga1440
tctagatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgg1500
gaacccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggc1560
caatccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaaca1620
cctattgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtc1680
cgatcatgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctt1740
ttttagaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaag1800
ctacaataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatga1860
tgcggcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatc1920
aacactaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaag1980
tggaaggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagag2040
taatggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagc2100
aattatgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatggg2160
ggcgataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccc2220
caaatatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctggcgg2280
aggatggcagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggag2340
tgggtacgctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggt2400
caactcaatcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataa2460
cttagaaaggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctg2520
gacttataatgccgaacttctggttctcatggaaaatgagagaactctagactttcatga2580
ctcaaatgttaagaacctctacgacaaggtccgactacagcttagggataatgcaaagga2640
gctgggtaacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtat2700
aagaaacggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagagga2760
aataagtggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaac2820
agtggcgagttccctagcactggcaatcatgatggctggtctatctttatggatgtgctc2880
caatggatcgttacaatgcagaatttgcatttaaaggcctattttctttagtttgaattt2940
actgttattcggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtt3000
tattttatgtaatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaag3060
gacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatat3120
caagcttatcgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaat3180
cctgttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgta3240
ataattaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccg3300
caattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaatta3360
tcgcgcgcggtgtcatctatgttactagat3390
<210>85
<211>549
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>流感a/印度尼西亚/5/2005(h5n1)的具有缺失的蛋白水解环的氨基酸序列
<400>85
metglulysilevalleuleuleualailevalserleuvallysser
151015
aspglnilecysileglytyrhisalaasnasnserthrgluglnval
202530
aspthrilemetglulysasnvalthrvalthrhisalaglnaspile
354045
leuglulysthrhisasnglylysleucysaspleuaspglyvallys
505560
proleuileleuargaspcysservalalaglytrpleuleuglyasn
65707580
prometcysaspglupheileasnvalproglutrpsertyrileval
859095
glulysalaasnprothrasnaspleucystyrproglyserpheasn
100105110
asptyrglugluleulyshisleuleuserargileasnhispheglu
115120125
lysileglnileileprolyssersertrpserasphisglualaser
130135140
serglyvalserseralacysprotyrleuglyserproserphephe
145150155160
argasnvalvaltrpleuilelyslysasnserthrtyrprothrile
165170175
lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp
180185190
glyilehishisproasnaspalaalagluglnthrargleutyrgln
195200205
asnprothrthrtyrileserileglythrserthrleuasnglnarg
210215220
leuvalprolysilealathrargserlysvalasnglyglnsergly
225230235240
argmetgluphephetrpthrileleulysproasnaspalaileasn
245250255
phegluserasnglyasnpheilealaproglutyralatyrlysile
260265270
vallyslysglyaspseralailemetlyssergluleuglutyrgly
275280285
asncysasnthrlyscysglnthrprometglyalaileasnserser
290295300
metprophehisasnilehisproleuthrileglyglucysprolys
305310315320
tyrvallysserasnargleuvalleualathrglyleuargasnser
325330335
proglyglyglytrpglnglymetvalaspglytrptyrglytyrhis
340345350
hisserasngluglnglyserglytyralaalaasplysgluserthr
355360365
glnlysalaileaspglyvalthrasnlysvalasnserileileasp
370375380
lysmetasnthrglnpheglualavalglyargglupheasnasnleu
385390395400
gluargargilegluasnleuasnlyslysmetgluaspglypheleu
405410415
aspvaltrpthrtyrasnalagluleuleuvalleumetgluasnglu
420425430
argthrleuaspphehisaspserasnvallysasnleutyrasplys
435440445
valargleuglnleuargaspasnalalysgluleuglyasnglycys
450455460
phegluphetyrhislyscysaspasnglucysmetgluserilearg
465470475480
asnglythrtyrasntyrproglntyrsergluglualaargleulys
485490495
argglugluileserglyvallysleugluserileglythrtyrgln
500505510
ileleuseriletyrserthrvalalaserserleualaleualaile
515520525
metmetalaglyleuserleutrpmetcysserasnglyserleugln
530535540
cysargilecysile
545
<210>86
<211>40
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1029if-s2+s4-bbris.c
<400>86
tctcagatcttcgccgatcgaatctgcactggaataacat40
<210>87
<211>43
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1029if-s1a4-bbris.r
<400>87
actaaagaaaataggcctttatagacagatggagcaagaaaca43
<210>88
<211>1758
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>合成的hab布里斯班基因
<400>88
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60
ggaataacatcgtcaaactcaccacatgtcgtcaaaactgctactcaaggggaggtcaat120
gtgactggtgtaataccactgacaacaacacccaccaaatctcattttgcaaatctcaaa180
ggaacagaaaccagggggaaactatgcccaaaatgcctcaactgcacagatctggacgta240
gccttgggcagaccaaaatgcacggggaaaataccctcggcaagagtttcaatactccat300
gaagtcagacctgttacatctgggtgctttcctataatgcacgacagaacaaaaattaga360
cagctgcctaaccttctccgaggatacgaacatatcaggttatcaacccataacgttatc420
aatgcagaaaatgcaccaggaggaccctacaaaattggaacctcagggtcttgccctaac480
attaccaatggaaacggatttttcgcaacaatggcttgggccgtcccaaaaaacgacaaa540
aacaaaacagcaacaaatccattaacaatagaagtaccatacatttgtacagaaggagaa600
gaccaaattaccgtttgggggttccactctgacaacgagacccaaatggcaaagctctat660
ggggactcaaagccccagaagttcacctcatctgccaacggagtgaccacacattacgtt720
tcacagattggtggcttcccaaatcaaacagaagacggaggactaccacaaagtggtaga780
attgttgttgattacatggtgcaaaaatctgggaaaacaggaacaattacctatcaaagg840
ggtattttattgcctcaaaaggtgtggtgcgcaagtggcaggagcaaggtaataaaagga900
tccttgcctttaattggagaagcagattgcctccacgaaaaatacggtggattaaacaaa960
agcaagccttactacacaggggaacatgcaaaggccataggaaattgcccaatatgggtg1020
aaaacacccttgaagctggccaatggaaccaaatatagacctcctgcaaaactattaaag1080
gaaaggggtttcttcggagctattgctggtttcttagaaggaggatgggaaggaatgatt1140
gcaggttggcacggatacacatcccatggggcacatggagtagcggtggcagcagacctt1200
aagagcactcaagaggccataaacaagataacaaaaaatctcaactctttgagtgagctg1260
gaagtaaagaatcttcaaagactaagcggtgccatggatgaactccacaacgaaatacta1320
gaactagatgagaaagtggatgatctcagagctgatacaataagctcacaaatagaactc1380
gcagtcctgctttccaatgaaggaataataaacagtgaagatgaacatctcttggcgctt1440
gaaagaaagctgaagaaaatgctgggcccctctgctgtagagatagggaatggatgcttt1500
gaaaccaaacacaagtgcaaccagacctgtctcgacagaatagctgctggtacctttgat1560
gcaggagaattttctctccccacctttgattcactgaatattactgctgcatctttaaat1620
gacgatggattggataatcatactatactgctttactactcaactgctgcctccagtttg1680
gctgtaacactgatgatagctatctttgttgtttatatggtctccagagacaatgtttct1740
tgctccatctgtctataa1758
<210>89
<211>3525
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒1029
<400>89
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcc1320
ttctcagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgt1380
cgtcaaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaac1440
acccaccaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgccc1500
aaaatgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaa1560
aataccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctt1620
tcctataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacga1680
acatatcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggacccta1740
caaaattggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaac1800
aatggcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaat1860
agaagtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactc1920
tgacaacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctc1980
atctgccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaac2040
agaagacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatc2100
tgggaaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtg2160
cgcaagtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattg2220
cctccacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgc2280
aaaggccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaac2340
caaatatagacctcctgcaaaactattaaaggaaaggggtttcttcggagctattgctgg2400
tttcttagaaggaggatgggaaggaatgattgcaggttggcacggatacacatcccatgg2460
ggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaacaagat2520
aacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagactaagcgg2580
tgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgatctcag2640
agctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaaggaataat2700
aaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctgggccc2760
ctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccagacctg2820
tctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacctttga2880
ttcactgaatattactgctgcatctttaaatgacgatggattggataatcatactatact2940
gctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatctttgt3000
tgtttatatggtctccagagacaatgtttcttgctccatctgtctataaaggcctatttt3060
ctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttttctg3120
tgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagcaggt3180
cgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaaaaga3240
ccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaataaagt3300
ttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaat3360
tacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggttttt3420
atgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgca3480
aactaggataaattatcgcgcgcggtgtcatctatgttactagat3525
<210>90
<211>594
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>来自流感b/布里斯班/60/2008(influenzab/brisbane/60/2008)的pdisp/ha的氨基酸序列
<400>90
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglylysileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnilethrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnasplysasnlysthr
180185190
alathrasnproleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproalalysleuleu
355360365
lysgluargglyphepheglyalailealaglypheleugluglygly
370375380
trpgluglymetilealaglytrphisglytyrthrserhisglyala
385390395400
hisglyvalalavalalaalaaspleulysserthrglnglualaile
405410415
asnlysilethrlysasnleuasnserleusergluleugluvallys
420425430
asnleuglnargleuserglyalametaspgluleuhisasngluile
435440445
leugluleuaspglulysvalaspaspleuargalaaspthrileser
450455460
serglnilegluleualavalleuleuserasngluglyileileasn
465470475480
sergluaspgluhisleuleualaleugluarglysleulyslysmet
485490495
leuglyproseralavalgluileglyasnglycysphegluthrlys
500505510
hislyscysasnglnthrcysleuaspargilealaalaglythrphe
515520525
aspalaglyglupheserleuprothrpheaspserleuasnilethr
530535540
alaalaserleuasnaspaspglyleuaspasnhisthrileleuleu
545550555560
tyrtyrserthralaalaserserleualavalthrleumetileala
565570575
ilephevalvaltyrmetvalserargaspasnvalsercysserile
580585590
cysleu
<210>91
<211>1734
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab布里斯班(prl-)的核苷酸序列
<400>91
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120
aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180
accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240
tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300
ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360
ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420
atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480
attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540
gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600
gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660
aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720
gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780
gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840
aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900
agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960
cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020
gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080
tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140
catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200
aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260
agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320
ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380
ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440
ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500
acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560
tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620
atactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatc1680
tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734
<210>92
<211>577
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab布里斯班(prl-)的氨基酸序列
<400>92
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglylysileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnilethrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnasplysasnlysthr
180185190
alathrasnproleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproglyglyglytrp
355360365
gluglymetilealaglytrphisglytyrthrserhisglyalahis
370375380
glyvalalavalalaalaaspleulysserthrglnglualaileasn
385390395400
lysilethrlysasnleuasnserleusergluleugluvallysasn
405410415
leuglnargleuserglyalametaspgluleuhisasngluileleu
420425430
gluleuaspglulysvalaspaspleuargalaaspthrileserser
435440445
glnilegluleualavalleuleuserasngluglyileileasnser
450455460
gluaspgluhisleuleualaleugluarglysleulyslysmetleu
465470475480
glyproseralavalgluileglyasnglycysphegluthrlyshis
485490495
lyscysasnglnthrcysleuaspargilealaalaglythrpheasp
500505510
alaglyglupheserleuprothrpheaspserleuasnilethrala
515520525
alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr
530535540
tyrserthralaalaserserleualavalthrleumetilealaile
545550555560
phevalvaltyrmetvalserargaspasnvalsercysserilecys
565570575
leu
<210>93
<211>160
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>表达增强子cpmvx
<400>93
tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60
ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120
gatcttcaacgttgtcagatcgtgcttcggcaccagtaca160
<210>94
<211>29
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>跨结构域膜的共有的氨基酸序列
<220>
<221>
<222>
<221>site
<222>(3)..(3)
<223>xaa可为任何天然存在的氨基酸
<220>
<221>
<222>
<221>site
<222>(15)..(15)
<223>xaa可为任何天然存在的氨基酸
<220>
<221>
<222>
<221>site
<222>(17)..(18)
<223>xaa可为任何天然存在的氨基酸
<220>
<221>
<222>
<221>site
<222>(23)..(23)
<223>xaa可为任何天然存在的氨基酸
<220>
<221>
<222>
<221>site
<222>(25)..(25)
<223>xaa可为任何天然存在的氨基酸
<400>94
ileleuxaailetyrtyrserthrvalalaileserserleuxaaleu
151015
xaaxaametleualaglyxaaserxaatrpmetcysser
2025
<210>95
<211>1734
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列
<400>95
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120
aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180
accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240
tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300
ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360
ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420
atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480
attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540
gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600
gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660
aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720
gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780
gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840
aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900
agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960
cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020
gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080
tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140
catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200
aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260
agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320
ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380
ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440
ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500
acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560
tttgattcactgaatattactgctgcatctttaaatgacgatggattggataattaccag1620
attttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggca1680
atcagtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1734
<210>96
<211>577
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列
<400>96
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglylysileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnilethrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnasplysasnlysthr
180185190
alathrasnproleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproglyglyglytrp
355360365
gluglymetilealaglytrphisglytyrthrserhisglyalahis
370375380
glyvalalavalalaalaaspleulysserthrglnglualaileasn
385390395400
lysilethrlysasnleuasnserleusergluleugluvallysasn
405410415
leuglnargleuserglyalametaspgluleuhisasngluileleu
420425430
gluleuaspglulysvalaspaspleuargalaaspthrileserser
435440445
glnilegluleualavalleuleuserasngluglyileileasnser
450455460
gluaspgluhisleuleualaleugluarglysleulyslysmetleu
465470475480
glyproseralavalgluileglyasnglycysphegluthrlyshis
485490495
lyscysasnglnthrcysleuaspargilealaalaglythrpheasp
500505510
alaglyglupheserleuprothrpheaspserleuasnilethrala
515520525
alaserleuasnaspaspglyleuaspasntyrglnileleualaile
530535540
tyrserthrvalalaserserleuvalleuvalvalserleuglyala
545550555560
ileserphetrpmetcysserasnglyserleuglncysargilecys
565570575
ile
<210>97
<211>1731
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)的核苷酸序列
<400>97
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120
aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240
tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300
ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360
ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420
atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600
ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080
agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140
ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200
ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260
ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320
agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380
ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440
ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500
tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560
gattcattgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620
ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680
attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731
<210>98
<211>576
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)的氨基酸序列
<400>98
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrlysthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleualaasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysalagluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyglypheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproglyglyglytrpglu
355360365
glymetilealaglytrphisglytyrthrserhisglyalahisgly
370375380
valalavalalaalaaspleulysserthrglnglualaileasnlys
385390395400
ilethrlysasnleuasnserleusergluleugluvallysasnleu
405410415
glnargleuserglyalametaspgluleuhisasngluileleuglu
420425430
leuaspglulysvalaspaspleuargalaaspthrilesersergln
435440445
ilegluleualavalleuleuserasngluglyileileasnserglu
450455460
aspgluhisleuleualaleugluarglysleulyslysmetleugly
465470475480
proseralavalaspileglyasnglycysphegluthrlyshislys
485490495
cysasnglnthrcysleuaspargilealaalaglythrpheasnala
500505510
glyglupheserleuprothrpheaspserleuasnilethralaala
515520525
serleuasnaspaspglyleuaspasnhisthrileleuleutyrtyr
530535540
serthralaalaserserleualavalthrleumetleualailephe
545550555560
ilevaltyrmetvalserargaspasnvalsercysserilecysleu
565570575
<210>99
<211>1731
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列
<400>99
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120
aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240
tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300
ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360
ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420
atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600
ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080
agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140
ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200
ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260
ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320
agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380
ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440
ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500
tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560
gattcattgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620
ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680
agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731
<210>100
<211>576
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列
<400>100
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrlysthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleualaasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysalagluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyglypheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproglyglyglytrpglu
355360365
glymetilealaglytrphisglytyrthrserhisglyalahisgly
370375380
valalavalalaalaaspleulysserthrglnglualaileasnlys
385390395400
ilethrlysasnleuasnserleusergluleugluvallysasnleu
405410415
glnargleuserglyalametaspgluleuhisasngluileleuglu
420425430
leuaspglulysvalaspaspleuargalaaspthrilesersergln
435440445
ilegluleualavalleuleuserasngluglyileileasnserglu
450455460
aspgluhisleuleualaleugluarglysleulyslysmetleugly
465470475480
proseralavalaspileglyasnglycysphegluthrlyshislys
485490495
cysasnglnthrcysleuaspargilealaalaglythrpheasnala
500505510
glyglupheserleuprothrpheaspserleuasnilethralaala
515520525
serleuasnaspaspglyleuaspasntyrglnileleualailetyr
530535540
serthrvalalaserserleuvalleuvalvalserleuglyalaile
545550555560
serphetrpmetcysserasnglyserleuglncysargilecysile
565570575
<210>101
<211>1704
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)的核苷酸序列
<400>101
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60
gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120
gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180
ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240
gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300
gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360
caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420
gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480
gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540
aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600
caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660
gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720
cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780
gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840
gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900
ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960
aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020
acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080
atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140
gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200
gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260
atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320
gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380
gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440
tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500
tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560
ttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttct1620
agtttggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaac1680
gtttcatgctccatctgtctataa1704
<210>102
<211>567
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)的氨基酸序列
<400>102
metlysalaileilevalleuleumetvalvalthrserasnalaasp
151015
argilecysthrglyilethrserserasnserprohisvalvallys
202530
thralathrglnglygluvalasnvalthrglyvalileproleuthr
354045
thrthrprothrlyssertyrphealaasnleulysglythrargthr
505560
argglylysleucysproaspcysleuasncysthraspleuaspval
65707580
alaleuglyargprometcysvalglythrthrproseralalysala
859095
serileleuhisgluvalargprovalthrserglycyspheproile
100105110
methisaspargthrlysileargglnleuproasnleuleuarggly
115120125
tyrgluasnileargleuserthrglnasnvalileaspalaglulys
130135140
alaproglyglyprotyrargleuglythrserglysercysproasn
145150155160
alathrserlysileglyphephealathrmetalatrpalavalpro
165170175
lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro
180185190
tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis
195200205
seraspasnlysthrglnmetlysserleutyrglyaspserasnpro
210215220
glnlysphethrserseralaasnglyvalthrthrhistyrvalser
225230235240
glnileglyasppheproaspglnthrgluaspglyglyleuprogln
245250255
serglyargilevalvalasptyrmetmetglnlysproglylysthr
260265270
glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp
275280285
cysalaserglyargserlysvalilelysglyserleuproleuile
290295300
glyglualaaspcysleuhisglulystyrglyglyleuasnlysser
305310315320
lysprotyrtyrthrglygluhisalalysalaileglyasncyspro
325330335
iletrpvallysthrproleulysleualaasnglythrlystyrarg
340345350
proproglyglyglytrpgluglymetilealaglytrphisglytyr
355360365
thrserhisglyalahisglyvalalavalalaalaaspleulysser
370375380
thrglnglualaileasnlysilethrlysasnleuasnserleuser
385390395400
gluleugluvallysasnleuglnargleuserglyalametaspglu
405410415
leuhisasngluileleugluleuaspglulysvalaspaspleuarg
420425430
alaaspthrileserserglnilegluleualavalleuleuserasn
435440445
gluglyileileasnsergluaspgluhisleuleualaleugluarg
450455460
lysleulyslysmetleuglyproseralavalaspileglyasngly
465470475480
cysphegluthrlyshislyscysasnglnthrcysleuaspargile
485490495
alaalaglythrpheasnalaglyglupheserleuprothrpheasp
500505510
serleuasnilethralaalaserleuasnaspaspglyleuaspasn
515520525
histhrileleuleutyrtyrserthralaalaserserleualaval
530535540
thrleumetleualailepheilevaltyrmetvalserargaspasn
545550555560
valsercysserilecysleu
565
<210>103
<211>1704
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列
<400>103
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60
gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120
gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180
ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240
gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300
gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360
caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420
gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480
gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540
aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600
caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660
gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720
cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780
gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840
gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900
ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960
aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020
acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080
atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140
gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200
gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260
atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320
gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380
gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440
tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500
tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560
ttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccagt1620
tcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtct1680
ctacagtgtagaatatgtatttaa1704
<210>104
<211>567
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列
<400>104
metlysalaileilevalleuleumetvalvalthrserasnalaasp
151015
argilecysthrglyilethrserserasnserprohisvalvallys
202530
thralathrglnglygluvalasnvalthrglyvalileproleuthr
354045
thrthrprothrlyssertyrphealaasnleulysglythrargthr
505560
argglylysleucysproaspcysleuasncysthraspleuaspval
65707580
alaleuglyargprometcysvalglythrthrproseralalysala
859095
serileleuhisgluvalargprovalthrserglycyspheproile
100105110
methisaspargthrlysileargglnleuproasnleuleuarggly
115120125
tyrgluasnileargleuserthrglnasnvalileaspalaglulys
130135140
alaproglyglyprotyrargleuglythrserglysercysproasn
145150155160
alathrserlysileglyphephealathrmetalatrpalavalpro
165170175
lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro
180185190
tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis
195200205
seraspasnlysthrglnmetlysserleutyrglyaspserasnpro
210215220
glnlysphethrserseralaasnglyvalthrthrhistyrvalser
225230235240
glnileglyasppheproaspglnthrgluaspglyglyleuprogln
245250255
serglyargilevalvalasptyrmetmetglnlysproglylysthr
260265270
glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp
275280285
cysalaserglyargserlysvalilelysglyserleuproleuile
290295300
glyglualaaspcysleuhisglulystyrglyglyleuasnlysser
305310315320
lysprotyrtyrthrglygluhisalalysalaileglyasncyspro
325330335
iletrpvallysthrproleulysleualaasnglythrlystyrarg
340345350
proproglyglyglytrpgluglymetilealaglytrphisglytyr
355360365
thrserhisglyalahisglyvalalavalalaalaaspleulysser
370375380
thrglnglualaileasnlysilethrlysasnleuasnserleuser
385390395400
gluleugluvallysasnleuglnargleuserglyalametaspglu
405410415
leuhisasngluileleugluleuaspglulysvalaspaspleuarg
420425430
alaaspthrileserserglnilegluleualavalleuleuserasn
435440445
gluglyileileasnsergluaspgluhisleuleualaleugluarg
450455460
lysleulyslysmetleuglyproseralavalaspileglyasngly
465470475480
cysphegluthrlyshislyscysasnglnthrcysleuaspargile
485490495
alaalaglythrpheasnalaglyglupheserleuprothrpheasp
500505510
serleuasnilethralaalaserleuasnaspaspglyleuaspasn
515520525
tyrglnileleualailetyrserthrvalalaserserleuvalleu
530535540
valvalserleuglyalaileserphetrpmetcysserasnglyser
545550555560
leuglncysargilecysile
565
<210>105
<211>1734
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的核苷酸序列
<400>105
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactggaataacatcgtcaaactcaccacatgtcgtc120
aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180
accaaatctcattttgcaaatctcaaaggaacagaaaccagggggaaactatgcccaaaa240
tgcctcaactgcacagatctggacgtagccttgggcagaccaaaatgcacggggaaaata300
ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360
ataatgcacgacagaacaaaaattagacagctgcctaaccttctccgaggatacgaacat420
atcaggttatcaacccataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480
attggaacctcagggtcttgccctaacattaccaatggaaacggatttttcgcaacaatg540
gcttgggccgtcccaaaaaacgacaaaaacaaaacagcaacaaatccattaacaatagaa600
gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgac660
aacgagacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720
gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780
gacggaggactaccacaaagtggtagaattgttgttgattacatggtgcaaaaatctggg840
aaaacaggaacaattacctatcaaaggggtattttattgcctcaaaaggtgtggtgcgca900
agtggcaggagcaaggtaataaaaggatccttgcctttaattggagaagcagattgcctc960
cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020
gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080
tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140
catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200
aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260
agcggtgccatggatgaactccacaacgaaatactagaactagatgagaaagtggatgat1320
ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380
ataataaacagtgaagatgaacatctcttggcgcttgaaagaaagctgaagaaaatgctg1440
ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500
acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccacc1560
tttgattcactgaatattactgctgcatctttaaatgacgatggattggataattaccag1620
attttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggca1680
atcagtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1734
<210>106
<211>577
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab布里斯班(prl-)+h1加利福尼亚tmct的氨基酸序列
<400>106
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglylysileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnilethrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnasplysasnlysthr
180185190
alathrasnproleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproglyglyglytrp
355360365
gluglymetilealaglytrphisglytyrthrserhisglyalahis
370375380
glyvalalavalalaalaaspleulysserthrglnglualaileasn
385390395400
lysilethrlysasnleuasnserleusergluleugluvallysasn
405410415
leuglnargleuserglyalametaspgluleuhisasngluileleu
420425430
gluleuaspglulysvalaspaspleuargalaaspthrileserser
435440445
glnilegluleualavalleuleuserasngluglyileileasnser
450455460
gluaspgluhisleuleualaleugluarglysleulyslysmetleu
465470475480
glyproseralavalgluileglyasnglycysphegluthrlyshis
485490495
lyscysasnglnthrcysleuaspargilealaalaglythrpheasp
500505510
alaglyglupheserleuprothrpheaspserleuasnilethrala
515520525
alaserleuasnaspaspglyleuaspasntyrglnileleualaile
530535540
tyrserthrvalalaserserleuvalleuvalvalserleuglyala
545550555560
ileserphetrpmetcysserasnglyserleuglncysargilecys
565570575
ile
<210>107
<211>1731
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)的核苷酸序列
<400>107
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120
aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240
tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300
ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360
ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420
atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600
ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080
agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140
ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200
ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260
ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320
agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380
ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440
ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500
tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560
gattcattgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620
ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680
attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731
<210>108
<211>576
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)的氨基酸序列
<400>108
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrlysthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleualaasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysalagluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyglypheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproglyglyglytrpglu
355360365
glymetilealaglytrphisglytyrthrserhisglyalahisgly
370375380
valalavalalaalaaspleulysserthrglnglualaileasnlys
385390395400
ilethrlysasnleuasnserleusergluleugluvallysasnleu
405410415
glnargleuserglyalametaspgluleuhisasngluileleuglu
420425430
leuaspglulysvalaspaspleuargalaaspthrilesersergln
435440445
ilegluleualavalleuleuserasngluglyileileasnserglu
450455460
aspgluhisleuleualaleugluarglysleulyslysmetleugly
465470475480
proseralavalaspileglyasnglycysphegluthrlyshislys
485490495
cysasnglnthrcysleuaspargilealaalaglythrpheasnala
500505510
glyglupheserleuprothrpheaspserleuasnilethralaala
515520525
serleuasnaspaspglyleuaspasnhisthrileleuleutyrtyr
530535540
serthralaalaserserleualavalthrleumetleualailephe
545550555560
ilevaltyrmetvalserargaspasnvalsercysserilecysleu
565570575
<210>109
<211>1731
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的核苷酸序列
<400>109
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120
aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240
tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300
ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360
ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420
atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600
ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080
agacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatctcac1140
ggagcacatggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaag1200
ataacaaaaaatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagt1260
ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctc1320
agagctgacactataagttcacaaatagaacttgcagtcttgctttccaacgaaggaata1380
ataaacagtgaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440
ccctctgctgtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacc1500
tgcttagacaggatagctgctggcacctttaatgcaggagagttttctctccccactttt1560
gattcattgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620
ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680
agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731
<210>110
<211>576
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州(prl-)+h1加利福尼亚tmct的氨基酸序列
<400>110
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrlysthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleualaasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysalagluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyglypheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproglyglyglytrpglu
355360365
glymetilealaglytrphisglytyrthrserhisglyalahisgly
370375380
valalavalalaalaaspleulysserthrglnglualaileasnlys
385390395400
ilethrlysasnleuasnserleusergluleugluvallysasnleu
405410415
glnargleuserglyalametaspgluleuhisasngluileleuglu
420425430
leuaspglulysvalaspaspleuargalaaspthrilesersergln
435440445
ilegluleualavalleuleuserasngluglyileileasnserglu
450455460
aspgluhisleuleualaleugluarglysleulyslysmetleugly
465470475480
proseralavalaspileglyasnglycysphegluthrlyshislys
485490495
cysasnglnthrcysleuaspargilealaalaglythrpheasnala
500505510
glyglupheserleuprothrpheaspserleuasnilethralaala
515520525
serleuasnaspaspglyleuaspasntyrglnileleualailetyr
530535540
serthrvalalaserserleuvalleuvalvalserleuglyalaile
545550555560
serphetrpmetcysserasnglyserleuglncysargilecysile
565570575
<210>111
<211>1704
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)的核苷酸序列
<400>111
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60
gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120
gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180
ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240
gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300
gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360
caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420
gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480
gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540
aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600
caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660
gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720
cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780
gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840
gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900
ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960
aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020
acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080
atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140
gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200
gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260
atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320
gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380
gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440
tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500
tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560
ttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttct1620
agtttggctgtaacattaatgctagctatttttattgtttatatggtctccagagacaac1680
gtttcatgctccatctgtctataa1704
<210>112
<211>567
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)的氨基酸序列
<400>112
metlysalaileilevalleuleumetvalvalthrserasnalaasp
151015
argilecysthrglyilethrserserasnserprohisvalvallys
202530
thralathrglnglygluvalasnvalthrglyvalileproleuthr
354045
thrthrprothrlyssertyrphealaasnleulysglythrargthr
505560
argglylysleucysproaspcysleuasncysthraspleuaspval
65707580
alaleuglyargprometcysvalglythrthrproseralalysala
859095
serileleuhisgluvalargprovalthrserglycyspheproile
100105110
methisaspargthrlysileargglnleuproasnleuleuarggly
115120125
tyrgluasnileargleuserthrglnasnvalileaspalaglulys
130135140
alaproglyglyprotyrargleuglythrserglysercysproasn
145150155160
alathrserlysileglyphephealathrmetalatrpalavalpro
165170175
lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro
180185190
tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis
195200205
seraspasnlysthrglnmetlysserleutyrglyaspserasnpro
210215220
glnlysphethrserseralaasnglyvalthrthrhistyrvalser
225230235240
glnileglyasppheproaspglnthrgluaspglyglyleuprogln
245250255
serglyargilevalvalasptyrmetmetglnlysproglylysthr
260265270
glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp
275280285
cysalaserglyargserlysvalilelysglyserleuproleuile
290295300
glyglualaaspcysleuhisglulystyrglyglyleuasnlysser
305310315320
lysprotyrtyrthrglygluhisalalysalaileglyasncyspro
325330335
iletrpvallysthrproleulysleualaasnglythrlystyrarg
340345350
proproglyglyglytrpgluglymetilealaglytrphisglytyr
355360365
thrserhisglyalahisglyvalalavalalaalaaspleulysser
370375380
thrglnglualaileasnlysilethrlysasnleuasnserleuser
385390395400
gluleugluvallysasnleuglnargleuserglyalametaspglu
405410415
leuhisasngluileleugluleuaspglulysvalaspaspleuarg
420425430
alaaspthrileserserglnilegluleualavalleuleuserasn
435440445
gluglyileileasnsergluaspgluhisleuleualaleugluarg
450455460
lysleulyslysmetleuglyproseralavalaspileglyasngly
465470475480
cysphegluthrlyshislyscysasnglnthrcysleuaspargile
485490495
alaalaglythrpheasnalaglyglupheserleuprothrpheasp
500505510
serleuasnilethralaalaserleuasnaspaspglyleuaspasn
515520525
histhrileleuleutyrtyrserthralaalaserserleualaval
530535540
thrleumetleualailepheilevaltyrmetvalserargaspasn
545550555560
valsercysserilecysleu
565
<210>113
<211>1704
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的核苷酸序列
<400>113
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60
gggataacatcttcaaactcacctcatgtggtcaaaacagctactcaaggggaggtcaat120
gtgactggcgtgataccactgacaacaacaccaacaaaatcttattttgcaaatctcaaa180
ggaacaaggaccagagggaaactatgcccggactgtctcaactgtacagatctggatgtg240
gccttgggcaggccaatgtgtgtggggaccacaccttctgctaaagcttcaatactccac300
gaggtcagacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360
caactacccaatcttctcagaggatatgaaaatatcaggttatcaacccaaaacgttatc420
gatgcagaaaaagcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480
gctaccagtaaaatcggattttttgcaacaatggcttgggctgtcccaaaggacaactac540
aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600
caaattactgtttgggggttccattcagataacaaaacccaaatgaagagcctctatgga660
gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacattatgtttct720
cagattggcgacttcccagatcaaacagaagacggaggactaccacaaagcggcagaatt780
gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctatcaaagaggt840
gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtca900
ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960
aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtaaaa1020
acacctttgaagcttgccaatggaaccaaatatagacctcctggtggaggatgggaagga1080
atgattgcaggttggcacggatacacatctcacggagcacatggagtggcagtggcggca1140
gaccttaagagtacacaagaagctataaataagataacaaaaaatctcaattctttgagt1200
gagctagaagtaaagaaccttcaaagactaagtggtgccatggatgaactccacaacgaa1260
atactcgagctggatgagaaagtggatgatctcagagctgacactataagctcacaaata1320
gaacttgcagtcttgctttccaacgaaggaataataaacagtgaagacgagcatctattg1380
gcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagacataggaaacgga1440
tgcttcgaaaccaaacacaaatgcaaccagacctgcttagacaggatagctgctggcacc1500
tttaatgcaggagaattttctctccccacttttgattcattgaacattactgctgcatct1560
ttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccagt1620
tcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtct1680
ctacagtgtagaatatgtatttaa1704
<210>114
<211>567
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hab威斯康星州(prl-)+h1加利福尼亚tmct的氨基酸序列
<400>114
metlysalaileilevalleuleumetvalvalthrserasnalaasp
151015
argilecysthrglyilethrserserasnserprohisvalvallys
202530
thralathrglnglygluvalasnvalthrglyvalileproleuthr
354045
thrthrprothrlyssertyrphealaasnleulysglythrargthr
505560
argglylysleucysproaspcysleuasncysthraspleuaspval
65707580
alaleuglyargprometcysvalglythrthrproseralalysala
859095
serileleuhisgluvalargprovalthrserglycyspheproile
100105110
methisaspargthrlysileargglnleuproasnleuleuarggly
115120125
tyrgluasnileargleuserthrglnasnvalileaspalaglulys
130135140
alaproglyglyprotyrargleuglythrserglysercysproasn
145150155160
alathrserlysileglyphephealathrmetalatrpalavalpro
165170175
lysaspasntyrlysasnalathrasnproleuthrvalgluvalpro
180185190
tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis
195200205
seraspasnlysthrglnmetlysserleutyrglyaspserasnpro
210215220
glnlysphethrserseralaasnglyvalthrthrhistyrvalser
225230235240
glnileglyasppheproaspglnthrgluaspglyglyleuprogln
245250255
serglyargilevalvalasptyrmetmetglnlysproglylysthr
260265270
glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp
275280285
cysalaserglyargserlysvalilelysglyserleuproleuile
290295300
glyglualaaspcysleuhisglulystyrglyglyleuasnlysser
305310315320
lysprotyrtyrthrglygluhisalalysalaileglyasncyspro
325330335
iletrpvallysthrproleulysleualaasnglythrlystyrarg
340345350
proproglyglyglytrpgluglymetilealaglytrphisglytyr
355360365
thrserhisglyalahisglyvalalavalalaalaaspleulysser
370375380
thrglnglualaileasnlysilethrlysasnleuasnserleuser
385390395400
gluleugluvallysasnleuglnargleuserglyalametaspglu
405410415
leuhisasngluileleugluleuaspglulysvalaspaspleuarg
420425430
alaaspthrileserserglnilegluleualavalleuleuserasn
435440445
gluglyileileasnsergluaspgluhisleuleualaleugluarg
450455460
lysleulyslysmetleuglyproseralavalaspileglyasngly
465470475480
cysphegluthrlyshislyscysasnglnthrcysleuaspargile
485490495
alaalaglythrpheasnalaglyglupheserleuprothrpheasp
500505510
serleuasnilethralaalaserleuasnaspaspglyleuaspasn
515520525
tyrglnileleualailetyrserthrvalalaserserleuvalleu
530535540
valvalserleuglyalaileserphetrpmetcysserasnglyser
545550555560
leuglncysargilecysile
565
<210>115
<211>1707
<212>dna
<213>流感h5印度尼西亚(influenzah5indo)
<400>115
atggagaaaatagtgcttcttcttgcaatagtcagtcttgttaaaagtgatcagatttgc60
attggttaccatgcaaacaattcaacagagcaggttgacacaatcatggaaaagaacgtt120
actgttacacatgcccaagacatactggaaaagacacacaacgggaagctctgcgatcta180
gatggagtgaagcctctaattttaagagattgtagtgtagctggatggctcctcgggaac240
ccaatgtgtgacgaattcatcaatgtaccggaatggtcttacatagtggagaaggccaat300
ccaaccaatgacctctgttacccagggagtttcaacgactatgaagaactgaaacaccta360
ttgagcagaataaaccattttgagaaaattcaaatcatccccaaaagttcttggtccgat420
catgaagcctcatcaggagttagctcagcatgtccatacctgggaagtccctcctttttt480
agaaatgtggtatggcttatcaaaaagaacagtacatacccaacaataaagaaaagctac540
aataataccaaccaagaggatcttttggtactgtggggaattcaccatcctaatgatgcg600
gcagagcagacaaggctatatcaaaacccaaccacctatatttccattgggacatcaaca660
ctaaaccagagattggtaccaaaaatagctactagatccaaagtaaacgggcaaagtgga720
aggatggagttcttctggacaattttaaaacctaatgatgcaatcaacttcgagagtaat780
ggaaatttcattgctccagaatatgcatacaaaattgtcaagaaaggggactcagcaatt840
atgaaaagtgaattggaatatggtaactgcaacaccaagtgtcaaactccaatgggggcg900
ataaactctagtatgccattccacaacatacaccctctcaccatcggggaatgccccaaa960
tatgtgaaatcaaacagattagtccttgcaacagggctcagaaatagccctcaaagagag1020
agcagaagaaaaaagagaggactatttggagctatagcaggttttatagagggaggatgg1080
cagggaatggtagatggttggtatgggtaccaccatagcaatgagcaggggagtgggtac1140
gctgcagacaaagaatccactcaaaaggcaatagatggagtcaccaataaggtcaactca1200
atcattgacaaaatgaacactcagtttgaggccgttggaagggaatttaataacttagaa1260
aggagaatagagaatttaaacaagaagatggaagacgggtttctagatgtctggacttat1320
aatgccgaacttctggttctcatggaaaatgagagaactctagactttcatgactcaaat1380
gttaagaacctctacgacaaggtccgactacagcttagggataatgcaaaggagctgggt1440
aacggttgtttcgagttctatcacaaatgtgataatgaatgtatggaaagtataagaaac1500
ggaacgtacaactatccgcagtattcagaagaagcaagattaaaaagagaggaaataagt1560
ggggtaaaattggaatcaataggaacttaccaaatactgtcaatttattcaacagtggcg1620
agttccctagcactggcaatcatgatggctggtctatctttatggatgtgctccaatgga1680
tcgttacaatgcagaatttgcatttaa1707
<210>116
<211>568
<212>prt
<213>流感h5印度尼西亚(influenzah5indo)
<400>116
metglulysilevalleuleuleualailevalserleuvallysser
151015
aspglnilecysileglytyrhisalaasnasnserthrgluglnval
202530
aspthrilemetglulysasnvalthrvalthrhisalaglnaspile
354045
leuglulysthrhisasnglylysleucysaspleuaspglyvallys
505560
proleuileleuargaspcysservalalaglytrpleuleuglyasn
65707580
prometcysaspglupheileasnvalproglutrpsertyrileval
859095
glulysalaasnprothrasnaspleucystyrproglyserpheasn
100105110
asptyrglugluleulyshisleuleuserargileasnhispheglu
115120125
lysileglnileileprolyssersertrpserasphisglualaser
130135140
serglyvalserseralacysprotyrleuglyserproserphephe
145150155160
argasnvalvaltrpleuilelyslysasnserthrtyrprothrile
165170175
lyslyssertyrasnasnthrasnglngluaspleuleuvalleutrp
180185190
glyilehishisproasnaspalaalagluglnthrargleutyrgln
195200205
asnprothrthrtyrileserileglythrserthrleuasnglnarg
210215220
leuvalprolysilealathrargserlysvalasnglyglnsergly
225230235240
argmetgluphephetrpthrileleulysproasnaspalaileasn
245250255
phegluserasnglyasnpheilealaproglutyralatyrlysile
260265270
vallyslysglyaspseralailemetlyssergluleuglutyrgly
275280285
asncysasnthrlyscysglnthrprometglyalaileasnserser
290295300
metprophehisasnilehisproleuthrileglyglucysprolys
305310315320
tyrvallysserasnargleuvalleualathrglyleuargasnser
325330335
proglnarggluserargarglyslysargglyleupheglyalaile
340345350
alaglypheilegluglyglytrpglnglymetvalaspglytrptyr
355360365
glytyrhishisserasngluglnglyserglytyralaalaasplys
370375380
gluserthrglnlysalaileaspglyvalthrasnlysvalasnser
385390395400
ileileasplysmetasnthrglnpheglualavalglyarggluphe
405410415
asnasnleugluargargilegluasnleuasnlyslysmetgluasp
420425430
glypheleuaspvaltrpthrtyrasnalagluleuleuvalleumet
435440445
gluasngluargthrleuaspphehisaspserasnvallysasnleu
450455460
tyrasplysvalargleuglnleuargaspasnalalysgluleugly
465470475480
asnglycysphegluphetyrhislyscysaspasnglucysmetglu
485490495
serileargasnglythrtyrasntyrproglntyrserglugluala
500505510
argleulysargglugluileserglyvallysleugluserilegly
515520525
thrtyrglnileleuseriletyrserthrvalalaserserleuala
530535540
leualailemetmetalaglyleuserleutrpmetcysserasngly
545550555560
serleuglncysargilecysile
565
<210>117
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1800if**(sacii)-pdi.s1+4c
<400>117
acagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggct52
<210>118
<211>51
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1800if-h3v36111.s1-4r
<400>118
actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgccctt51
<210>119
<211>1725
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h3维多利亚的核苷酸序列
<400>119
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcccaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120
caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180
actaatgctactgagctggttcagaattcctcaataggtgaaatatgcgacagtcctcat240
cagatccttgatggagaaaactgcacactaatagatgctctattgggagaccctcagtgt300
gatggcttccaaaataagaaatgggacctttttgttgaacgaagcaaagcctacagcaac360
tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420
acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagt480
tctgcttgcataaggagatctaataatagtttctttagtagattaaattggttgacccac540
ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600
ttgtacatttggggggttcaccacccgggtacggacaaggaccaaatcttcctgtatgct660
caatcatcaggaagaatcacagtatctaccaaaagaagccaacaagctgtaatcccgaat720
atcggatctagacccagaataaggaatatccctagcagaataagcatctattggacaata780
gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840
tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900
tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960
gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaagcactctgaaattg1020
gcaacaggaatgcgaaatgtaccagagaaacaaactagaggcatatttggcgcaatagcg1080
ggtttcatagaaaatggttgggagggaatggtggatggttggtacggtttcaggcatcaa1140
aattctgagggaagaggacaagcagcagatctcaaaagcactcaagcagcaatcgatcaa1200
atcaatgggaagctgaatcgattgatcgggaaaaccaacgagaaattccatcagattgaa1260
aaagaattctcagaagtcgaagggagaattcaggaccttgagaaatatgttgaggacact1320
aaaatagatctctggtcatacaacgcggagcttcttgttgccctggagaaccaacataca1380
attgatctaactgactcagaaatgaacaaactgtttgaaaaaacaaagaagcaactaagg1440
gaaaatgctgaggatatgggcaatggttgtttcaaaatataccacaaatgtgacaatgcc1500
tgcataggatcaatcagaaatggaacttatgaccacgatgtatacagagatgaagcatta1560
aacaaccggttccagatcaagggagttgagctgaagtcagggtacaaagattggatccta1620
tggatttcctttgccatatcatgttttttgctttgtgttgctttgttggggttcatcatg1680
tgggcctgccaaaagggcaacattaggtgcaacatttgcatttga1725
<210>120
<211>4644
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体2171
<400>120
tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60
gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120
aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180
aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240
ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300
gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360
aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420
aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480
taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540
aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600
atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660
taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720
tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780
gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840
acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900
ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960
accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020
gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080
aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140
gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200
actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260
aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320
gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380
tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440
agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500
tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560
tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620
ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680
tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740
ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800
cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860
gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920
tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980
ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040
ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100
cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160
cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220
tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280
ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340
cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400
cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460
ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520
tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580
cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640
aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700
tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760
cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820
tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880
tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940
ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000
ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacagggcccaata3060
ccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgt3120
tggttccttctcagatcttcgcgacgtcactcctcagccaaaacgacacccccatctgtc3180
tatccactggcccctggatctgctgcccaaactaactccatggtgaccctgggatgcctg3240
gtcaagggctatttccctgagccagtgacagtgacctggaactctggatccctgtccagc3300
ggtgtgcacaccttcccagctgtcctgcagtctgacctctacactctgagcagctcagtg3360
actgtcccctccagcacctggcccagcgagaccgtcacctgcaacgttgcccacccggcc3420
agcagcaccaaggtggacaagaaaattgtgcccagggattgtggttgtaagccttgcata3480
tgtacagtcccagaagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctc3540
accattactctgactcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatccc3600
gaggtccagttcagctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccc3660
cgggaggagcagttcaacagcactttccgctcagtcagtgaacttcccatcatgcaccag3720
gactggctcaatggcaaggagacgtccagattttggcgatctattcaactgtcgccagtt3780
cattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtctc3840
tacagtgtagaatatgtatttaaaggcctattttctttagtttgaatttactgttattcg3900
gtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgta3960
atttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaag4020
attttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcg4080
acctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccgg4140
tcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacat4200
gtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacat4260
ttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggt4320
gtcatctatgttactagatctctagagtctcaagcttggcgcgcccacgtgactagtggc4380
actggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcg4440
ccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcg4500
cccttcccaacagttgcgcagcctgaatggcgaatgctagagcagcttgagcttggatca4560
gattgtcgtttcccgccttcagtttaaactatcagtgtttgacaggatatattggcgggt4620
aaacctaagagaaaagagcgttta4644
<210>121
<211>3129
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1800
<400>121
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttatt960
gttttctcttcttgtgttggttccttctcagatcttcgcccaaaaacttcctggaaatga1020
caacagcacggcaacgctgtgccttgggcaccatgcagtaccaaacggaacgatagtgaa1080
aacaatcacgaatgaccaaattgaagttactaatgctactgagctggttcagaattcctc1140
aataggtgaaatatgcgacagtcctcatcagatccttgatggagaaaactgcacactaat1200
agatgctctattgggagaccctcagtgtgatggcttccaaaataagaaatgggacctttt1260
tgttgaacgaagcaaagcctacagcaactgttacccttatgatgtgccggattatgcctc1320
ccttaggtcactagttgcctcatccggcacactggagtttaacaatgaaagcttcaattg1380
gactggagtcactcaaaacggaacaagttctgcttgcataaggagatctaataatagttt1440
ctttagtagattaaattggttgacccacttaaacttcaaatacccagcattgaacgtgac1500
tatgccaaacaatgaacaatttgacaaattgtacatttggggggttcaccacccgggtac1560
ggacaaggaccaaatcttcctgtatgctcaatcatcaggaagaatcacagtatctaccaa1620
aagaagccaacaagctgtaatcccgaatatcggatctagacccagaataaggaatatccc1680
tagcagaataagcatctattggacaatagtaaaaccgggagacatacttttgattaacag1740
cacagggaatctaattgctcctaggggttacttcaaaatacgaagtgggaaaagctcaat1800
aatgagatcagatgcacccattggcaaatgcaattctgaatgcatcactccaaatggaag1860
cattcccaatgacaaaccattccaaaatgtaaacaggatcacatacggggcctgtcccag1920
atatgttaagcaaagcactctgaaattggcaacaggaatgcgaaatgtaccagagaaaca1980
aactagaggcatatttggcgcaatagcgggtttcatagaaaatggttgggagggaatggt2040
ggatggttggtacggtttcaggcatcaaaattctgagggaagaggacaagcagcagatct2100
caaaagcactcaagcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaa2160
aaccaacgagaaattccatcagattgaaaaagaattctcagaagtcgaagggagaattca2220
ggaccttgagaaatatgttgaggacactaaaatagatctctggtcatacaacgcggagct2280
tcttgttgccctggagaaccaacatacaattgatctaactgactcagaaatgaacaaact2340
gtttgaaaaaacaaagaagcaactaagggaaaatgctgaggatatgggcaatggttgttt2400
caaaatataccacaaatgtgacaatgcctgcataggatcaatcagaaatggaacttatga2460
ccacgatgtatacagagatgaagcattaaacaaccggttccagatcaagggagttgagct2520
gaagtcagggtacaaagattggatcctatggatttcctttgccatatcatgttttttgct2580
ttgtgttgctttgttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaa2640
catttgcatttgaaggcctattttctttagtttgaatttactgttattcggtgtgcattt2700
ctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttc2760
tttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattt2820
tattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagat2880
cgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatg2940
attatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatg3000
acgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcg3060
atagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatg3120
ttactagat3129
<210>122
<211>574
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h3维多利亚的氨基酸序列
<400>122
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaglnlysleuproglyasnaspasn
202530
serthralathrleucysleuglyhishisalavalproasnglythr
354045
ilevallysthrilethrasnaspglnilegluvalthrasnalathr
505560
gluleuvalglnasnserserileglygluilecysaspserprohis
65707580
glnileleuaspglygluasncysthrleuileaspalaleuleugly
859095
aspproglncysaspglypheglnasnlyslystrpaspleupheval
100105110
gluargserlysalatyrserasncystyrprotyraspvalproasp
115120125
tyralaserleuargserleuvalalaserserglythrleugluphe
130135140
asnasngluserpheasntrpthrglyvalthrglnasnglythrser
145150155160
seralacysileargargserasnasnserphepheserargleuasn
165170175
trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet
180185190
proasnasngluglnpheasplysleutyriletrpglyvalhishis
195200205
proglythrasplysaspglnilepheleutyralaglnsersergly
210215220
argilethrvalserthrlysargserglnglnalavalileproasn
225230235240
ileglyserargproargileargasnileproserargileserile
245250255
tyrtrpthrilevallysproglyaspileleuleuileasnserthr
260265270
glyasnleuilealaproargglytyrphelysileargserglylys
275280285
serserilemetargseraspalaproileglylyscysasnserglu
290295300
cysilethrproasnglyserileproasnasplyspropheglnasn
305310315320
valasnargilethrtyrglyalacysproargtyrvallysglnser
325330335
thrleulysleualathrglymetargasnvalproglulysglnthr
340345350
argglyilepheglyalailealaglypheilegluasnglytrpglu
355360365
glymetvalaspglytrptyrglyphearghisglnasnserglugly
370375380
argglyglnalaalaaspleulysserthrglnalaalaileaspgln
385390395400
ileasnglylysleuasnargleuileglylysthrasnglulysphe
405410415
hisglnileglulysgluphesergluvalgluglyargileglnasp
420425430
leuglulystyrvalgluaspthrlysileaspleutrpsertyrasn
435440445
alagluleuleuvalalaleugluasnglnhisthrileaspleuthr
450455460
aspserglumetasnlysleupheglulysthrlyslysglnleuarg
465470475480
gluasnalagluaspmetglyasnglycysphelysiletyrhislys
485490495
cysaspasnalacysileglyserileargasnglythrtyrasphis
500505510
aspvaltyrargaspglualaleuasnasnargpheglnilelysgly
515520525
valgluleulysserglytyrlysasptrpileleutrpileserphe
530535540
alailesercyspheleuleucysvalalaleuleuglypheilemet
545550555560
trpalacysglnlysglyasnileargcysasnilecysile
565570
<210>123
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1819if(sacii)-kozac_pdi.c
<400>123
gtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttc48
<210>124
<211>51
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1819if-h3v36111.s1-4r
<400>124
actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgccctt51
<210>125
<211>4914
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体2181
<400>125
tggcaggatatattgtggtgtaaacaaattgacgcttagacaacttaataacacattgcg60
gacgtttttaatgtactgaattaacgccgaatcccgggctggtatatttatatgttgtca120
aataactcaaaaaccataaaagtttaagttagcaagtgtgtacatttttacttgaacaaa180
aatattcacctactactgttataaatcattattaaacattagagtaaagaaatatggatg240
ataagaacaagagtagtgatattttgacaacaattttgttgcaacatttgagaaaatttt300
gttgttctctcttttcattggtcaaaaacaatagagagagaaaaaggaagagggagaata360
aaaacataatgtgagtatgagagagaaagttgtacaaaagttgtaccaaaatagttgtac420
aaatatcattgaggaatttgacaaaagctacacaaataagggttaattgctgtaaataaa480
taaggatgacgcattagagagatgtaccattagagaatttttggcaagtcattaaaaaga540
aagaataaattatttttaaaattaaaagttgagtcatttgattaaacatgtgattattta600
atgaattgatgaaagagttggattaaagttgtattagtaattagaatttggtgtcaaatt660
taatttgacatttgatcttttcctatatattgccccatagagtcagttaactcattttta720
tatttcatagatcaaataagagaaataacggtatattaatccctccaaaaaaaaaaaacg780
gtatatttactaaaaaatctaagccacgtaggaggataacaggatccccgtaggaggata840
acatccaatccaaccaatcacaacaatcctgatgagataacccactttaagcccacgcat900
ctgtggcacatctacattatctaaatcacacattcttccacacatctgagccacacaaaa960
accaatccacatctttatcacccattctataaaaaatcacactttgtgagtctacacttt1020
gattcccttcaaacacatacaaagagaagagactaattaattaattaatcatcttgagag1080
aaaatggaacgagctatacaaggaaacgacgctagggaacaagctaacagtgaacgttgg1140
gatggaggatcaggaggtaccacttctcccttcaaacttcctgacgaaagtccgagttgg1200
actgagtggcggctacataacgatgagacgaattcgaatcaagataatccccttggtttc1260
aaggaaagctggggtttcgggaaagttgtatttaagagatatctcagatacgacaggacg1320
gaagcttcactgcacagagtccttggatcttggacgggagattcggttaactatgcagca1380
tctcgatttttcggtttcgaccagatcggatgtacctatagtattcggtttcgaggagtt1440
agtatcaccgtttctggagggtcgcgaactcttcagcatctctgtgagatggcaattcgg1500
tctaagcaagaactgctacagcttgccccaatcgaagtggaaagtaatgtatcaagagga1560
tgccctgaaggtactcaaaccttcgaaaaagaaagcgagtaagttaaaatgcttcttcgt1620
ctcctatttataatatggtttgttattgttaattttgttcttgtagaagagcttaattaa1680
tcgttgttgttatgaaatactatttgtatgagatgaactggtgtaatgtaattcatttac1740
ataagtggagtcagaatcagaatgtttcctccataactaactagacatgaagacctgccg1800
cgtacaattgtcttatatttgaacaactaaaattgaacatcttttgccacaactttataa1860
gtggttaatatagctcaaatatatggtcaagttcaatagattaataatggaaatatcagt1920
tatcgaaattcattaacaatcaacttaacgttattaactactaattttatatcatcccct1980
ttgataaatgatagtacaccaattaggaaggagcatgctcgcctaggagattgtcgtttc2040
ccgccttcagtttgcaagctgctctagccgtgtagccaatacgcaaaccgcctctccccg2100
cgcgttgggaattactagcgcgtgtcgacaagcttgcatgccggtcaacatggtggagca2160
cgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaat2220
tgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctat2280
ctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattg2340
cgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacc2400
cccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagt2460
ggattgatgtgataacatggtggagcacgacacacttgtctactccaaaaatatcaaaga2520
tacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaa2580
cctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaagga2640
aggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctc2700
tgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaaga2760
cgttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaaggga2820
tgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttca2880
tttggagaggtattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaa2940
ccaaaccttcttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttc3000
ttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctt3060
tcactgaagcgaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacg3120
tgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgct3180
gttcagccccatacattacttgttacgattctgctgactttcggcgggtgcaatatctct3240
acttctgcttgacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggt3300
tctataagaaatctagtattttctttgaaacagagttttcccgtggttttcgaacttgga3360
gaaagattgttaagcttctgtatattctgcccaaatttgtcgggcccaataccgcggaga3420
aaatggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttcctt3480
ctcagatcttcgcgacgtcactcctcagccaaaacgacacccccatctgtctatccactg3540
gcccctggatctgctgcccaaactaactccatggtgaccctgggatgcctggtcaagggc3600
tatttccctgagccagtgacagtgacctggaactctggatccctgtccagcggtgtgcac3660
accttcccagctgtcctgcagtctgacctctacactctgagcagctcagtgactgtcccc3720
tccagcacctggcccagcgagaccgtcacctgcaacgttgcccacccggccagcagcacc3780
aaggtggacaagaaaattgtgcccagggattgtggttgtaagccttgcatatgtacagtc3840
ccagaagtatcatctgtcttcatcttccccccaaagcccaaggatgtgctcaccattact3900
ctgactcctaaggtcacgtgtgttgtggtagacatcagcaaggatgatcccgaggtccag3960
ttcagctggtttgtagatgatgtggaggtgcacacagctcagacgcaaccccgggaggag4020
cagttcaacagcactttccgctcagtcagtgaacttcccatcatgcaccaggactggctc4080
aatggcaaggagcgatcgctcaccatcaccatcaccatcaccatcaccattaaaggccta4140
ttttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggttt4200
tctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgtttagc4260
aggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaaaa4320
aagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaata4380
aagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgtt4440
gaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggt4500
ttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcg4560
cgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatctctagagtct4620
caagcttggcgcgcccacgtgactagtggcactggccgtcgttttacaacgtcgtgactg4680
ggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctg4740
gcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatgg4800
cgaatgctagagcagcttgagcttggatcagattgtcgtttcccgccttcagtttaaact4860
atcagtgtttgacaggatatattggcgggtaaacctaagagaaaagagcgttta4914
<210>126
<211>3480
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>构建体1819
<400>126
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320
tcttgtgttggttccttctcagatcttcgcccaaaaacttcctggaaatgacaacagcac1380
ggcaacgctgtgccttgggcaccatgcagtaccaaacggaacgatagtgaaaacaatcac1440
gaatgaccaaattgaagttactaatgctactgagctggttcagaattcctcaataggtga1500
aatatgcgacagtcctcatcagatccttgatggagaaaactgcacactaatagatgctct1560
attgggagaccctcagtgtgatggcttccaaaataagaaatgggacctttttgttgaacg1620
aagcaaagcctacagcaactgttacccttatgatgtgccggattatgcctcccttaggtc1680
actagttgcctcatccggcacactggagtttaacaatgaaagcttcaattggactggagt1740
cactcaaaacggaacaagttctgcttgcataaggagatctaataatagtttctttagtag1800
attaaattggttgacccacttaaacttcaaatacccagcattgaacgtgactatgccaaa1860
caatgaacaatttgacaaattgtacatttggggggttcaccacccgggtacggacaagga1920
ccaaatcttcctgtatgctcaatcatcaggaagaatcacagtatctaccaaaagaagcca1980
acaagctgtaatcccgaatatcggatctagacccagaataaggaatatccctagcagaat2040
aagcatctattggacaatagtaaaaccgggagacatacttttgattaacagcacagggaa2100
tctaattgctcctaggggttacttcaaaatacgaagtgggaaaagctcaataatgagatc2160
agatgcacccattggcaaatgcaattctgaatgcatcactccaaatggaagcattcccaa2220
tgacaaaccattccaaaatgtaaacaggatcacatacggggcctgtcccagatatgttaa2280
gcaaagcactctgaaattggcaacaggaatgcgaaatgtaccagagaaacaaactagagg2340
catatttggcgcaatagcgggtttcatagaaaatggttgggagggaatggtggatggttg2400
gtacggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcac2460
tcaagcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaaaaccaacga2520
gaaattccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttga2580
gaaatatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgc2640
cctggagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaa2700
aacaaagaagcaactaagggaaaatgctgaggatatgggcaatggttgtttcaaaatata2760
ccacaaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgt2820
atacagagatgaagcattaaacaaccggttccagatcaagggagttgagctgaagtcagg2880
gtacaaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgc2940
tttgttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaacatttgcat3000
ttgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttg3060
gtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagc3120
tcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaa3180
aaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaac3240
atttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcata3300
taatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttattt3360
atgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaac3420
aaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3480
<210>127
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if**-h2s157.sl-6r
<400>127
actaaagaaaataggccttcatatgcagatcctgcactgcagagacccgt50
<210>128
<211>1716
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h2新加坡的核苷酸序列
<400>128
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggaccaaatatgcattggataccatgccaataattccacagagaaggtc120
gacacaattctagagcggaacgtcactgtgactcatgccaaggacattcttgagaagacc180
cataacggaaagttatgcaaactaaacggaatccctccacttgaactaggggactgtagc240
attgccggatggctccttggaaatccagaatgtgataggcttctaagtgtgccagaatgg300
tcctatataatggagaaagaaaacccgagagacggtttgtgttatccaggcagcttcaat360
gattatgaagaattgaaacatctcctcagcagcgtgaaacatttcgagaaagtaaagatt420
ctgcccaaagatagatggacacagcatacaacaactggaggttcacgggcctgcgcggtg480
tctggtaatccatcattcttcaggaacatggtctggctgacaaagaaagaatcaaattat540
ccggttgccaaaggatcgtacaacaatacaagcggagaacaaatgctaataatttggggg600
gtgcaccatcccaatgatgagacagaacaaagaacattgtaccagaatgtgggaacctat660
gtttccgtaggcacatcaacattgaacaaaaggtcaaccccagacatagcaacaaggcct720
aaagtgaatggactaggaagtagaatggagttctcttggaccctattggatatgtgggac780
accataaattttgagagtactggtaatctaattgcaccagagtatggattcaaaatatcg840
aaaagaggtagttcagggatcatgaaaacagaaggaacacttgagaactgtgagaccaaa900
tgccaaactcctttgggagcaataaatacaacattgccttttcacaatgtccacccactg960
acaataggtgagtgccccaaatatgtaaaatcggagaagttggtcttagcaacaggacta1020
aggaatgttccccagattgaatcaagaggattgtttggggcaatagctggttttatagaa1080
ggaggatggcaaggaatggttgatggttggtatggataccatcacagcaatgaccaggga1140
tcagggtatgcagcagacaaagaatccactcaaaaggcatttgatggaatcaccaacaag1200
gtaaattctgtgattgaaaagatgaacacccaatttgaagctgttgggaaagagttcagt1260
aacttagagagaagactggagaacttgaacaaaaagatggaagacgggtttctagatgtg1320
tggacatacaatgctgagcttctagttctgatggaaaatgagaggacacttgactttcat1380
gattctaatgtcaagaatctgtatgataaagtcagaatgcagctgagagacaacgtcaaa1440
gaactaggaaatggatgttttgaattttatcacaaatgtgatgatgaatgcatgaatagt1500
gtgaaaaacgggacgtatgattatcccaagtatgaagaagagtctaaactaaatagaaat1560
gaaatcaaaggggtaaaattgagcagcatgggggtttatcaaatccttgccatttatgct1620
acagtagcaggttctctgtcactggcaatcatgatggctgggatctctttctggatgtgc1680
tccaacgggtctctgcagtgcaggatctgcatatga1716
<210>129
<211>3471
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>表达盒2220号
<400>129
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320
tcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggataccatgccaa1380
taattccacagagaaggtcgacacaattctagagcggaacgtcactgtgactcatgccaa1440
ggacattcttgagaagacccataacggaaagttatgcaaactaaacggaatccctccact1500
tgaactaggggactgtagcattgccggatggctccttggaaatccagaatgtgataggct1560
tctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagagacggtttgtg1620
ttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcagcgtgaaaca1680
tttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaacaactggagg1740
ttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggtctggctgac1800
aaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaagcggagaaca1860
aatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaagaacattgta1920
ccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaaggtcaacccc1980
agacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagttctcttggac2040
cctattggatatgtgggacaccataaattttgagagtactggtaatctaattgcaccaga2100
gtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacagaaggaacact2160
tgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaacattgccttt2220
tcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatcggagaagtt2280
ggtcttagcaacaggactaaggaatgttccccagattgaatcaagaggattgtttggggc2340
aatagctggttttatagaaggaggatggcaaggaatggttgatggttggtatggatacca2400
tcacagcaatgaccagggatcagggtatgcagcagacaaagaatccactcaaaaggcatt2460
tgatggaatcaccaacaaggtaaattctgtgattgaaaagatgaacacccaatttgaagc2520
tgttgggaaagagttcagtaacttagagagaagactggagaacttgaacaaaaagatgga2580
agacgggtttctagatgtgtggacatacaatgctgagcttctagttctgatggaaaatga2640
gaggacacttgactttcatgattctaatgtcaagaatctgtatgataaagtcagaatgca2700
gctgagagacaacgtcaaagaactaggaaatggatgttttgaattttatcacaaatgtga2760
tgatgaatgcatgaatagtgtgaaaaacgggacgtatgattatcccaagtatgaagaaga2820
gtctaaactaaatagaaatgaaatcaaaggggtaaaattgagcagcatgggggtttatca2880
aatccttgccatttatgctacagtagcaggttctctgtcactggcaatcatgatggctgg2940
gatctctttctggatgtgctccaacgggtctctgcagtgcaggatctgcatatgaaggcc3000
tattttctttagtttgaatttactgttattcggtgtgcatttctatgtttggtgagcggt3060
tttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagctcctgttta3120
gcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaaaaaaaaaaa3180
aaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaacatttggcaa3240
taaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctg3300
ttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgg3360
gtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatag3420
cgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3471
<210>130
<211>571
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h2新加坡的氨基酸序列
<400>130
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspglnilecysileglytyrhis
202530
alaasnasnserthrglulysvalaspthrileleugluargasnval
354045
thrvalthrhisalalysaspileleuglulysthrhisasnglylys
505560
leucyslysleuasnglyileproproleugluleuglyaspcysser
65707580
ilealaglytrpleuleuglyasnproglucysaspargleuleuser
859095
valproglutrpsertyrilemetglulysgluasnproargaspgly
100105110
leucystyrproglyserpheasnasptyrglugluleulyshisleu
115120125
leuserservallyshispheglulysvallysileleuprolysasp
130135140
argtrpthrglnhisthrthrthrglyglyserargalacysalaval
145150155160
serglyasnproserphepheargasnmetvaltrpleuthrlyslys
165170175
gluserasntyrprovalalalysglysertyrasnasnthrsergly
180185190
gluglnmetleuileiletrpglyvalhishisproasnaspgluthr
195200205
gluglnargthrleutyrglnasnvalglythrtyrvalservalgly
210215220
thrserthrleuasnlysargserthrproaspilealathrargpro
225230235240
lysvalasnglyleuglyserargmetgluphesertrpthrleuleu
245250255
aspmettrpaspthrileasnphegluserthrglyasnleuileala
260265270
proglutyrglyphelysileserlysargglyserserglyilemet
275280285
lysthrgluglythrleugluasncysgluthrlyscysglnthrpro
290295300
leuglyalaileasnthrthrleuprophehisasnvalhisproleu
305310315320
thrileglyglucysprolystyrvallysserglulysleuvalleu
325330335
alathrglyleuargasnvalproglnilegluserargglyleuphe
340345350
glyalailealaglypheilegluglyglytrpglnglymetvalasp
355360365
glytrptyrglytyrhishisserasnaspglnglyserglytyrala
370375380
alaasplysgluserthrglnlysalapheaspglyilethrasnlys
385390395400
valasnservalileglulysmetasnthrglnpheglualavalgly
405410415
lysglupheserasnleugluargargleugluasnleuasnlyslys
420425430
metgluaspglypheleuaspvaltrpthrtyrasnalagluleuleu
435440445
valleumetgluasngluargthrleuaspphehisaspserasnval
450455460
lysasnleutyrasplysvalargmetglnleuargaspasnvallys
465470475480
gluleuglyasnglycysphegluphetyrhislyscysaspaspglu
485490495
cysmetasnservallysasnglythrtyrasptyrprolystyrglu
500505510
glugluserlysleuasnargasngluilelysglyvallysleuser
515520525
sermetglyvaltyrglnileleualailetyralathrvalalagly
530535540
serleuserleualailemetmetalaglyileserphetrpmetcys
545550555560
serasnglyserleuglncysargilecysile
565570
<210>131
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h2s157(prl-).r
<400>131
tgccatcctccgccgggaacattccttagtcctgttgctaagaccaac48
<210>132
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h2s157(prl-).c
<400>132
aggaatgttcccggcggaggatggcaaggaatggttgatggttggtatgg50
<210>133
<211>3426
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2221
<400>133
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320
tcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggataccatgccaa1380
taattccacagagaaggtcgacacaattctagagcggaacgtcactgtgactcatgccaa1440
ggacattcttgagaagacccataacggaaagttatgcaaactaaacggaatccctccact1500
tgaactaggggactgtagcattgccggatggctccttggaaatccagaatgtgataggct1560
tctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagagacggtttgtg1620
ttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcagcgtgaaaca1680
tttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaacaactggagg1740
ttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggtctggctgac1800
aaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaagcggagaaca1860
aatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaagaacattgta1920
ccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaaggtcaacccc1980
agacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagttctcttggac2040
cctattggatatgtgggacaccataaattttgagagtactggtaatctaattgcaccaga2100
gtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacagaaggaacact2160
tgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaacattgccttt2220
tcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatcggagaagtt2280
ggtcttagcaacaggactaaggaatgttcccggcggaggatggcaaggaatggttgatgg2340
ttggtatggataccatcacagcaatgaccagggatcagggtatgcagcagacaaagaatc2400
cactcaaaaggcatttgatggaatcaccaacaaggtaaattctgtgattgaaaagatgaa2460
cacccaatttgaagctgttgggaaagagttcagtaacttagagagaagactggagaactt2520
gaacaaaaagatggaagacgggtttctagatgtgtggacatacaatgctgagcttctagt2580
tctgatggaaaatgagaggacacttgactttcatgattctaatgtcaagaatctgtatga2640
taaagtcagaatgcagctgagagacaacgtcaaagaactaggaaatggatgttttgaatt2700
ttatcacaaatgtgatgatgaatgcatgaatagtgtgaaaaacgggacgtatgattatcc2760
caagtatgaagaagagtctaaactaaatagaaatgaaatcaaaggggtaaaattgagcag2820
catgggggtttatcaaatccttgccatttatgctacagtagcaggttctctgtcactggc2880
aatcatgatggctgggatctctttctggatgtgctccaacgggtctctgcagtgcaggat2940
ctgcatatgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttcta3000
tgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttcttt3060
gtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttat3120
taaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgt3180
tcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatt3240
atcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacg3300
ttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgata3360
gaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgtta3420
ctagat3426
<210>134
<211>556
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h2新加坡的氨基酸序列
<400>134
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspglnilecysileglytyrhis
202530
alaasnasnserthrglulysvalaspthrileleugluargasnval
354045
thrvalthrhisalalysaspileleuglulysthrhisasnglylys
505560
leucyslysleuasnglyileproproleugluleuglyaspcysser
65707580
ilealaglytrpleuleuglyasnproglucysaspargleuleuser
859095
valproglutrpsertyrilemetglulysgluasnproargaspgly
100105110
leucystyrproglyserpheasnasptyrglugluleulyshisleu
115120125
leuserservallyshispheglulysvallysileleuprolysasp
130135140
argtrpthrglnhisthrthrthrglyglyserargalacysalaval
145150155160
serglyasnproserphepheargasnmetvaltrpleuthrlyslys
165170175
gluserasntyrprovalalalysglysertyrasnasnthrsergly
180185190
gluglnmetleuileiletrpglyvalhishisproasnaspgluthr
195200205
gluglnargthrleutyrglnasnvalglythrtyrvalservalgly
210215220
thrserthrleuasnlysargserthrproaspilealathrargpro
225230235240
lysvalasnglyleuglyserargmetgluphesertrpthrleuleu
245250255
aspmettrpaspthrileasnphegluserthrglyasnleuileala
260265270
proglutyrglyphelysileserlysargglyserserglyilemet
275280285
lysthrgluglythrleugluasncysgluthrlyscysglnthrpro
290295300
leuglyalaileasnthrthrleuprophehisasnvalhisproleu
305310315320
thrileglyglucysprolystyrvallysserglulysleuvalleu
325330335
alathrglyleuargasnvalproglyglyglytrpglnglymetval
340345350
aspglytrptyrglytyrhishisserasnaspglnglyserglytyr
355360365
alaalaasplysgluserthrglnlysalapheaspglyilethrasn
370375380
lysvalasnservalileglulysmetasnthrglnpheglualaval
385390395400
glylysglupheserasnleugluargargleugluasnleuasnlys
405410415
lysmetgluaspglypheleuaspvaltrpthrtyrasnalagluleu
420425430
leuvalleumetgluasngluargthrleuaspphehisaspserasn
435440445
vallysasnleutyrasplysvalargmetglnleuargaspasnval
450455460
lysgluleuglyasnglycysphegluphetyrhislyscysaspasp
465470475480
glucysmetasnservallysasnglythrtyrasptyrprolystyr
485490495
gluglugluserlysleuasnargasngluilelysglyvallysleu
500505510
sersermetglyvaltyrglnileleualailetyralathrvalala
515520525
glyserleuserleualailemetmetalaglyileserphetrpmet
530535540
cysserasnglyserleuglncysargilecysile
545550555
<210>135
<211>3120
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2222
<400>135
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttatt960
gttttctcttcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggata1020
ccatgccaataattccacagagaaggtcgacacaattctagagcggaacgtcactgtgac1080
tcatgccaaggacattcttgagaagacccataacggaaagttatgcaaactaaacggaat1140
ccctccacttgaactaggggactgtagcattgccggatggctccttggaaatccagaatg1200
tgataggcttctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagaga1260
cggtttgtgttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcag1320
cgtgaaacatttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaac1380
aactggaggttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggt1440
ctggctgacaaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaag1500
cggagaacaaatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaag1560
aacattgtaccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaag1620
gtcaaccccagacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagtt1680
ctcttggaccctattggatatgtgggacaccataaattttgagagtactggtaatctaat1740
tgcaccagagtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacaga1800
aggaacacttgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaac1860
attgccttttcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatc1920
ggagaagttggtcttagcaacaggactaaggaatgttccccagattgaatcaagaggatt1980
gtttggggcaatagctggttttatagaaggaggatggcaaggaatggttgatggttggta2040
tggataccatcacagcaatgaccagggatcagggtatgcagcagacaaagaatccactca2100
aaaggcatttgatggaatcaccaacaaggtaaattctgtgattgaaaagatgaacaccca2160
atttgaagctgttgggaaagagttcagtaacttagagagaagactggagaacttgaacaa2220
aaagatggaagacgggtttctagatgtgtggacatacaatgctgagcttctagttctgat2280
ggaaaatgagaggacacttgactttcatgattctaatgtcaagaatctgtatgataaagt2340
cagaatgcagctgagagacaacgtcaaagaactaggaaatggatgttttgaattttatca2400
caaatgtgatgatgaatgcatgaatagtgtgaaaaacgggacgtatgattatcccaagta2460
tgaagaagagtctaaactaaatagaaatgaaatcaaaggggtaaaattgagcagcatggg2520
ggtttatcaaatccttgccatttatgctacagtagcaggttctctgtcactggcaatcat2580
gatggctgggatctctttctggatgtgctccaacgggtctctgcagtgcaggatctgcat2640
atgaaggcctattttctttagtttgaatttactgttattcggtgtgcatttctatgtttg2700
gtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttctttgtgagc2760
tcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttattaaaaa2820
aaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgttcaaac2880
atttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcata2940
taatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttattt3000
atgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaac3060
aaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagat3120
<210>136
<211>3075
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2223
<400>136
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacagggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttatt960
gttttctcttcttgtgttggttccttctcagatcttcgcggaccaaatatgcattggata1020
ccatgccaataattccacagagaaggtcgacacaattctagagcggaacgtcactgtgac1080
tcatgccaaggacattcttgagaagacccataacggaaagttatgcaaactaaacggaat1140
ccctccacttgaactaggggactgtagcattgccggatggctccttggaaatccagaatg1200
tgataggcttctaagtgtgccagaatggtcctatataatggagaaagaaaacccgagaga1260
cggtttgtgttatccaggcagcttcaatgattatgaagaattgaaacatctcctcagcag1320
cgtgaaacatttcgagaaagtaaagattctgcccaaagatagatggacacagcatacaac1380
aactggaggttcacgggcctgcgcggtgtctggtaatccatcattcttcaggaacatggt1440
ctggctgacaaagaaagaatcaaattatccggttgccaaaggatcgtacaacaatacaag1500
cggagaacaaatgctaataatttggggggtgcaccatcccaatgatgagacagaacaaag1560
aacattgtaccagaatgtgggaacctatgtttccgtaggcacatcaacattgaacaaaag1620
gtcaaccccagacatagcaacaaggcctaaagtgaatggactaggaagtagaatggagtt1680
ctcttggaccctattggatatgtgggacaccataaattttgagagtactggtaatctaat1740
tgcaccagagtatggattcaaaatatcgaaaagaggtagttcagggatcatgaaaacaga1800
aggaacacttgagaactgtgagaccaaatgccaaactcctttgggagcaataaatacaac1860
attgccttttcacaatgtccacccactgacaataggtgagtgccccaaatatgtaaaatc1920
ggagaagttggtcttagcaacaggactaaggaatgttcccggcggaggatggcaaggaat1980
ggttgatggttggtatggataccatcacagcaatgaccagggatcagggtatgcagcaga2040
caaagaatccactcaaaaggcatttgatggaatcaccaacaaggtaaattctgtgattga2100
aaagatgaacacccaatttgaagctgttgggaaagagttcagtaacttagagagaagact2160
ggagaacttgaacaaaaagatggaagacgggtttctagatgtgtggacatacaatgctga2220
gcttctagttctgatggaaaatgagaggacacttgactttcatgattctaatgtcaagaa2280
tctgtatgataaagtcagaatgcagctgagagacaacgtcaaagaactaggaaatggatg2340
ttttgaattttatcacaaatgtgatgatgaatgcatgaatagtgtgaaaaacgggacgta2400
tgattatcccaagtatgaagaagagtctaaactaaatagaaatgaaatcaaaggggtaaa2460
attgagcagcatgggggtttatcaaatccttgccatttatgctacagtagcaggttctct2520
gtcactggcaatcatgatggctgggatctctttctggatgtgctccaacgggtctctgca2580
gtgcaggatctgcatatgaaggcctattttctttagtttgaatttactgttattcggtgt2640
gcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaattt2700
aatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattt2760
taattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacct2820
gcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtctt2880
gcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaa2940
tgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaa3000
tacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtca3060
tctatgttactagat3075
<210>137
<211>1725
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h3珀斯的核苷酸序列
<400>137
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcgcaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120
caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180
actaatgctactgagctggttcagagttcctcaacaggtgaaatatgcgacagtcctcat240
cagatccttgatggaaaaaactgcacactaatagatgctctattgggagaccctcagtgt300
gatggcttccaaaataagaaatgggacctttttgttgaacgcagcaaagcctacagcaac360
tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420
acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagc480
tctgcttgcataaggagatctaaaaacagtttctttagtagattgaattggttgacccac540
ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600
ttgtacatttggggggttcaccacccgggtacggacaaagaccaaatcttcctgtatgct660
caagcatcaggaagaatcacagtctctaccaaaagaagccaacaaaccgtaagcccgaat720
atcggatctagacccagagtaaggaatatccctagcagaataagcatctattggacaata780
gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840
tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900
tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960
gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaaacactctgaaattg1020
gcaacagggatgcgaaatgtaccagagaaacaaactagaggcatatttggcgcaatcgcg1080
ggtttcatagaaaatggttgggagggaatggtggatggttggtacggtttcaggcatcaa1140
aattctgagggaagaggacaagcagcagatctcaaaagcactcaagcagcaatcgatcaa1200
atcaatgggaagctgaatagattgatcgggaaaaccaacgagaaattccatcagattgaa1260
aaagaattctcagaagtcgaagggagaattcaggaccttgagaaatatgttgaggacact1320
aaaatagatctctggtcatacaacgcggagcttcttgttgccctggagaaccaacataca1380
attgatctaactgactcagaaatgaacaaactgtttgaaaaaacaaagaagcaactgagg1440
gaaaatgctgaggatatgggcaatggttgtttcaaaatataccacaaatgtgacaatgcc1500
tgcataggatcaatcagaaatggaacttatgaccacgatgtatacagagatgaagcatta1560
aacaaccggtttcagatcaagggagttgagctgaagtcagggtacaaagattggatccta1620
tggatttcctttgccatatcatgttttttgctttgtgttgctttgttggggttcatcatg1680
tgggcctgccaaaaaggcaacattaggtgcaacatttgcatttga1725
<210>138
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if**-h3p1609.s1-6r
<400>138
actaaagaaaataggccttcaaatgcaaatgttgcacctaatgttgcctt50
<210>139
<211>574
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h3珀斯的氨基酸序列
<400>139
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaglnlysleuproglyasnaspasn
202530
serthralathrleucysleuglyhishisalavalproasnglythr
354045
ilevallysthrilethrasnaspglnilegluvalthrasnalathr
505560
gluleuvalglnserserserthrglygluilecysaspserprohis
65707580
glnileleuaspglylysasncysthrleuileaspalaleuleugly
859095
aspproglncysaspglypheglnasnlyslystrpaspleupheval
100105110
gluargserlysalatyrserasncystyrprotyraspvalproasp
115120125
tyralaserleuargserleuvalalaserserglythrleugluphe
130135140
asnasngluserpheasntrpthrglyvalthrglnasnglythrser
145150155160
seralacysileargargserlysasnserphepheserargleuasn
165170175
trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet
180185190
proasnasngluglnpheasplysleutyriletrpglyvalhishis
195200205
proglythrasplysaspglnilepheleutyralaglnalasergly
210215220
argilethrvalserthrlysargserglnglnthrvalserproasn
225230235240
ileglyserargproargvalargasnileproserargileserile
245250255
tyrtrpthrilevallysproglyaspileleuleuileasnserthr
260265270
glyasnleuilealaproargglytyrphelysileargserglylys
275280285
serserilemetargseraspalaproileglylyscysasnserglu
290295300
cysilethrproasnglyserileproasnasplyspropheglnasn
305310315320
valasnargilethrtyrglyalacysproargtyrvallysglnasn
325330335
thrleulysleualathrglymetargasnvalproglulysglnthr
340345350
argglyilepheglyalailealaglypheilegluasnglytrpglu
355360365
glymetvalaspglytrptyrglyphearghisglnasnserglugly
370375380
argglyglnalaalaaspleulysserthrglnalaalaileaspgln
385390395400
ileasnglylysleuasnargleuileglylysthrasnglulysphe
405410415
hisglnileglulysgluphesergluvalgluglyargileglnasp
420425430
leuglulystyrvalgluaspthrlysileaspleutrpsertyrasn
435440445
alagluleuleuvalalaleugluasnglnhisthrileaspleuthr
450455460
aspserglumetasnlysleupheglulysthrlyslysglnleuarg
465470475480
gluasnalagluaspmetglyasnglycysphelysiletyrhislys
485490495
cysaspasnalacysileglyserileargasnglythrtyrasphis
500505510
aspvaltyrargaspglualaleuasnasnargpheglnilelysgly
515520525
valgluleulysserglytyrlysasptrpileleutrpileserphe
530535540
alailesercyspheleuleucysvalalaleuleuglypheilemet
545550555560
trpalacysglnlysglyasnileargcysasnilecysile
565570
<210>140
<211>1680
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h3珀斯的核苷酸序列
<400>140
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcgcaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120
caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180
actaatgctactgagctggttcagagttcctcaacaggtgaaatatgcgacagtcctcat240
cagatccttgatggaaaaaactgcacactaatagatgctctattgggagaccctcagtgt300
gatggcttccaaaataagaaatgggacctttttgttgaacgcagcaaagcctacagcaac360
tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420
acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagc480
tctgcttgcataaggagatctaaaaacagtttctttagtagattgaattggttgacccac540
ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600
ttgtacatttggggggttcaccacccgggtacggacaaagaccaaatcttcctgtatgct660
caagcatcaggaagaatcacagtctctaccaaaagaagccaacaaaccgtaagcccgaat720
atcggatctagacccagagtaaggaatatccctagcagaataagcatctattggacaata780
gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840
tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900
tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960
gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaaacactctgaaattg1020
gcaacagggatgcgaaatgtaccaggcggaggttgggagggaatggtggatggttggtac1080
ggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcactcaa1140
gcagcaatcgatcaaatcaatgggaagctgaatagattgatcgggaaaaccaacgagaaa1200
ttccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttgagaaa1260
tatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgccctg1320
gagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaaaaca1380
aagaagcaactgagggaaaatgctgaggatatgggcaatggttgtttcaaaatataccac1440
aaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgtatac1500
agagatgaagcattaaacaaccggtttcagatcaagggagttgagctgaagtcagggtac1560
aaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgctttg1620
ttggggttcatcatgtgggcctgccaaaaaggcaacattaggtgcaacatttgcatttga1680
<210>141
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h3p1609(prl-)#2.r
<400>141
ccctcccaacctccgcctggtacatttcgcatccctgttgccaatttc48
<210>142
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h3p1609(prl-)#2.c
<400>142
aatgtaccaggcggaggttgggagggaatggtggatggttggtacggt48
<210>143
<211>559
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h3珀斯的氨基酸序列
<400>143
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaglnlysleuproglyasnaspasn
202530
serthralathrleucysleuglyhishisalavalproasnglythr
354045
ilevallysthrilethrasnaspglnilegluvalthrasnalathr
505560
gluleuvalglnserserserthrglygluilecysaspserprohis
65707580
glnileleuaspglylysasncysthrleuileaspalaleuleugly
859095
aspproglncysaspglypheglnasnlyslystrpaspleupheval
100105110
gluargserlysalatyrserasncystyrprotyraspvalproasp
115120125
tyralaserleuargserleuvalalaserserglythrleugluphe
130135140
asnasngluserpheasntrpthrglyvalthrglnasnglythrser
145150155160
seralacysileargargserlysasnserphepheserargleuasn
165170175
trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet
180185190
proasnasngluglnpheasplysleutyriletrpglyvalhishis
195200205
proglythrasplysaspglnilepheleutyralaglnalasergly
210215220
argilethrvalserthrlysargserglnglnthrvalserproasn
225230235240
ileglyserargproargvalargasnileproserargileserile
245250255
tyrtrpthrilevallysproglyaspileleuleuileasnserthr
260265270
glyasnleuilealaproargglytyrphelysileargserglylys
275280285
serserilemetargseraspalaproileglylyscysasnserglu
290295300
cysilethrproasnglyserileproasnasplyspropheglnasn
305310315320
valasnargilethrtyrglyalacysproargtyrvallysglnasn
325330335
thrleulysleualathrglymetargasnvalproglyglyglytrp
340345350
gluglymetvalaspglytrptyrglyphearghisglnasnserglu
355360365
glyargglyglnalaalaaspleulysserthrglnalaalaileasp
370375380
glnileasnglylysleuasnargleuileglylysthrasnglulys
385390395400
phehisglnileglulysgluphesergluvalgluglyargilegln
405410415
aspleuglulystyrvalgluaspthrlysileaspleutrpsertyr
420425430
asnalagluleuleuvalalaleugluasnglnhisthrileaspleu
435440445
thraspserglumetasnlysleupheglulysthrlyslysglnleu
450455460
arggluasnalagluaspmetglyasnglycysphelysiletyrhis
465470475480
lyscysaspasnalacysileglyserileargasnglythrtyrasp
485490495
hisaspvaltyrargaspglualaleuasnasnargpheglnilelys
500505510
glyvalgluleulysserglytyrlysasptrpileleutrpileser
515520525
phealailesercyspheleuleucysvalalaleuleuglypheile
530535540
mettrpalacysglnlysglyasnileargcysasnilecysile
545550555
<210>144
<211>1680
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h3维多利亚的核苷酸序列
<400>144
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcgcaaaaacttcctggaaatgacaacagcacggcaacgctgtgccttggg120
caccatgcagtaccaaacggaacgatagtgaaaacaatcacgaatgaccaaattgaagtt180
actaatgctactgagctggttcagaattcctcaataggtgaaatatgcgacagtcctcat240
cagatccttgatggagaaaactgcacactaatagatgctctattgggagaccctcagtgt300
gatggcttccaaaataagaaatgggacctttttgttgaacgaagcaaagcctacagcaac360
tgttacccttatgatgtgccggattatgcctcccttaggtcactagttgcctcatccggc420
acactggagtttaacaatgaaagcttcaattggactggagtcactcaaaacggaacaagt480
tctgcttgcataaggagatctaataatagtttctttagtagattaaattggttgacccac540
ttaaacttcaaatacccagcattgaacgtgactatgccaaacaatgaacaatttgacaaa600
ttgtacatttggggggttcaccacccgggtacggacaaggaccaaatcttcctgtatgct660
caatcatcaggaagaatcacagtatctaccaaaagaagccaacaagctgtaatcccgaat720
atcggatctagacccagaataaggaatatccctagcagaataagcatctattggacaata780
gtaaaaccgggagacatacttttgattaacagcacagggaatctaattgctcctaggggt840
tacttcaaaatacgaagtgggaaaagctcaataatgagatcagatgcacccattggcaaa900
tgcaattctgaatgcatcactccaaatggaagcattcccaatgacaaaccattccaaaat960
gtaaacaggatcacatacggggcctgtcccagatatgttaagcaaagcactctgaaattg1020
gcaacaggaatgcgaaatgtaccaggcggaggttgggagggaatggtggatggttggtac1080
ggtttcaggcatcaaaattctgagggaagaggacaagcagcagatctcaaaagcactcaa1140
gcagcaatcgatcaaatcaatgggaagctgaatcgattgatcgggaaaaccaacgagaaa1200
ttccatcagattgaaaaagaattctcagaagtcgaagggagaattcaggaccttgagaaa1260
tatgttgaggacactaaaatagatctctggtcatacaacgcggagcttcttgttgccctg1320
gagaaccaacatacaattgatctaactgactcagaaatgaacaaactgtttgaaaaaaca1380
aagaagcaactaagggaaaatgctgaggatatgggcaatggttgtttcaaaatataccac1440
aaatgtgacaatgcctgcataggatcaatcagaaatggaacttatgaccacgatgtatac1500
agagatgaagcattaaacaaccggttccagatcaagggagttgagctgaagtcagggtac1560
aaagattggatcctatggatttcctttgccatatcatgttttttgctttgtgttgctttg1620
ttggggttcatcatgtgggcctgccaaaagggcaacattaggtgcaacatttgcatttga1680
<210>145
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h3v36111(prl-).r
<400>145
ccctcccaacctccgcctggtacatttcgcattcctgttgccaatttc48
<210>146
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h3v36111(prl-).c
<400>146
aatgtaccaggcggaggttgggagggaatggtggatggttggtacggt48
<210>147
<211>559
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h3维多利亚的氨基酸序列
<400>147
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaglnlysleuproglyasnaspasn
202530
serthralathrleucysleuglyhishisalavalproasnglythr
354045
ilevallysthrilethrasnaspglnilegluvalthrasnalathr
505560
gluleuvalglnasnserserileglygluilecysaspserprohis
65707580
glnileleuaspglygluasncysthrleuileaspalaleuleugly
859095
aspproglncysaspglypheglnasnlyslystrpaspleupheval
100105110
gluargserlysalatyrserasncystyrprotyraspvalproasp
115120125
tyralaserleuargserleuvalalaserserglythrleugluphe
130135140
asnasngluserpheasntrpthrglyvalthrglnasnglythrser
145150155160
seralacysileargargserasnasnserphepheserargleuasn
165170175
trpleuthrhisleuasnphelystyrproalaleuasnvalthrmet
180185190
proasnasngluglnpheasplysleutyriletrpglyvalhishis
195200205
proglythrasplysaspglnilepheleutyralaglnsersergly
210215220
argilethrvalserthrlysargserglnglnalavalileproasn
225230235240
ileglyserargproargileargasnileproserargileserile
245250255
tyrtrpthrilevallysproglyaspileleuleuileasnserthr
260265270
glyasnleuilealaproargglytyrphelysileargserglylys
275280285
serserilemetargseraspalaproileglylyscysasnserglu
290295300
cysilethrproasnglyserileproasnasplyspropheglnasn
305310315320
valasnargilethrtyrglyalacysproargtyrvallysglnser
325330335
thrleulysleualathrglymetargasnvalproglyglyglytrp
340345350
gluglymetvalaspglytrptyrglyphearghisglnasnserglu
355360365
glyargglyglnalaalaaspleulysserthrglnalaalaileasp
370375380
glnileasnglylysleuasnargleuileglylysthrasnglulys
385390395400
phehisglnileglulysgluphesergluvalgluglyargilegln
405410415
aspleuglulystyrvalgluaspthrlysileaspleutrpsertyr
420425430
asnalagluleuleuvalalaleugluasnglnhisthrileaspleu
435440445
thraspserglumetasnlysleupheglulysthrlyslysglnleu
450455460
arggluasnalagluaspmetglyasnglycysphelysiletyrhis
465470475480
lyscysaspasnalacysileglyserileargasnglythrtyrasp
485490495
hisaspvaltyrargaspglualaleuasnasnargpheglnilelys
500505510
glyvalgluleulysserglytyrlysasptrpileleutrpileser
515520525
phealailesercyspheleuleucysvalalaleuleuglypheile
530535540
mettrpalacysglnlysglyasnileargcysasnilecysile
545550555
<210>148
<211>1701
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h7杭州的核苷酸序列
<400>148
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggacaaaatctgcctcggacatcatgccgtgtcaaacggaaccaaagta120
aacacattaactgaaagaggagtggaagtcgtcaatgcaactgaaacagtggaacgaaca180
aacatccccaggatctgctcaaaagggaaaaggacagttgacctcggtcaatgtggactc240
ctggggacaatcactggaccacctcaatgtgaccaattcctagaattttcagccgattta300
attattgagaggcgagaaggaagtgatgtctgttatcctgggaaattcgtgaatgaagaa360
gctctgaggcaaattctcagagaatcaggcggaattgacaaggaagcaatgggattcaca420
tacagtggaataagaactaatggagcaaccagtgcatgtaggagatcaggatcttcattc480
tatgcagaaatgaaatggctcctgtcaaacacagataatgctgcattcccgcagatgact540
aagtcatataaaaatacaagaaaaagcccagctctaatagtatgggggatccatcattcc600
gtatcaactgcagagcaaaccaagctatatgggagtggaaacaaactggtgacagttggg660
agttctaattatcaacaatcttttgtaccgagtccaggagcgagaccacaagttaatggt720
atatctggaagaattgactttcattggctaatgctaaatcccaatgatacagtcactttc780
agtttcaatggggctttcatagctccagaccgtgcaagcttcctgagaggaaaatctatg840
ggaatccagagtggagtacaggttgatgccaattgtgaaggggactgctatcatagtgga900
gggacaataataagtaacttgccatttcagaacatagatagcagggcagttggaaaatgt960
ccgagatatgttaagcaaaggagtctgctgctagcaacagggatgaagaatgttcctgag1020
attccaaagggaagaggcctatttggtgctatagcgggtttcattgaaaatggatgggaa1080
ggcctaattgatggttggtatggtttcagacaccagaatgcacagggagagggaactgct1140
gcagattacaaaagcactcaatcggcaattgatcaaataacaggaaaattaaaccggctt1200
atagaaaaaaccaaccaacaatttgagttgatcgacaatgaattcaatgaggtagagaag1260
caaatcggtaatgtgataaattggaccagagattctataacagaagtgtggtcatacaat1320
gctgaactcttggtagcaatggagaaccagcatacaattgatctggctgattcagaaatg1380
gacaaactgtacgaacgagtgaaaagacagctgagagagaatgctgaagaagatggcact1440
ggttgctttgaaatatttcacaagtgtgatgatgactgtatggccagtattagaaataac1500
acctatgatcacagcaaatacagggaagaggcaatgcaaaatagaatacagattgaccca1560
gtcaaactaagcagcggctacaaagatgtgatactttggtttagcttcggggcatcatgt1620
ttcatacttctagccattgtaatgggccttgtcttcatatgtgtaaagaatggaaacatg1680
cggtgcactatttgtatataa1701
<210>149
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if*-h7h113.s1-6r
<400>149
actaaagaaaataggcctttatatacaaatagtgcaccgcatgtttccat50
<210>150
<211>566
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h7杭州的氨基酸序列
<400>150
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaasplysilecysleuglyhishis
202530
alavalserasnglythrlysvalasnthrleuthrgluargglyval
354045
gluvalvalasnalathrgluthrvalgluargthrasnileproarg
505560
ilecysserlysglylysargthrvalaspleuglyglncysglyleu
65707580
leuglythrilethrglyproproglncysaspglnpheleugluphe
859095
seralaaspleuileilegluargarggluglyseraspvalcystyr
100105110
proglylysphevalasngluglualaleuargglnileleuargglu
115120125
serglyglyileasplysglualametglyphethrtyrserglyile
130135140
argthrasnglyalathrseralacysargargserglyserserphe
145150155160
tyralaglumetlystrpleuleuserasnthraspasnalaalaphe
165170175
proglnmetthrlyssertyrlysasnthrarglysserproalaleu
180185190
ilevaltrpglyilehishisservalserthralagluglnthrlys
195200205
leutyrglyserglyasnlysleuvalthrvalglyserserasntyr
210215220
glnglnserphevalproserproglyalaargproglnvalasngly
225230235240
ileserglyargileaspphehistrpleumetleuasnproasnasp
245250255
thrvalthrpheserpheasnglyalapheilealaproaspargala
260265270
serpheleuargglylyssermetglyileglnserglyvalglnval
275280285
aspalaasncysgluglyaspcystyrhisserglyglythrileile
290295300
serasnleupropheglnasnileaspserargalavalglylyscys
305310315320
proargtyrvallysglnargserleuleuleualathrglymetlys
325330335
asnvalprogluileprolysglyargglyleupheglyalaileala
340345350
glypheilegluasnglytrpgluglyleuileaspglytrptyrgly
355360365
phearghisglnasnalaglnglygluglythralaalaasptyrlys
370375380
serthrglnseralaileaspglnilethrglylysleuasnargleu
385390395400
ileglulysthrasnglnglnphegluleuileaspasnglupheasn
405410415
gluvalglulysglnileglyasnvalileasntrpthrargaspser
420425430
ilethrgluvaltrpsertyrasnalagluleuleuvalalametglu
435440445
asnglnhisthrileaspleualaaspserglumetasplysleutyr
450455460
gluargvallysargglnleuarggluasnalaglugluaspglythr
465470475480
glycysphegluilephehislyscysaspaspaspcysmetalaser
485490495
ileargasnasnthrtyrasphisserlystyrarggluglualamet
500505510
glnasnargileglnileaspprovallysleuserserglytyrlys
515520525
aspvalileleutrppheserpheglyalasercyspheileleuleu
530535540
alailevalmetglyleuvalpheilecysvallysasnglyasnmet
545550555560
argcysthrilecysile
565
<210>151
<211>1650
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h7杭州的核苷酸序列
<400>151
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggacaaaatctgcctcggacatcatgccgtgtcaaacggaaccaaagta120
aacacattaactgaaagaggagtggaagtcgtcaatgcaactgaaacagtggaacgaaca180
aacatccccaggatctgctcaaaagggaaaaggacagttgacctcggtcaatgtggactc240
ctggggacaatcactggaccacctcaatgtgaccaattcctagaattttcagccgattta300
attattgagaggcgagaaggaagtgatgtctgttatcctgggaaattcgtgaatgaagaa360
gctctgaggcaaattctcagagaatcaggcggaattgacaaggaagcaatgggattcaca420
tacagtggaataagaactaatggagcaaccagtgcatgtaggagatcaggatcttcattc480
tatgcagaaatgaaatggctcctgtcaaacacagataatgctgcattcccgcagatgact540
aagtcatataaaaatacaagaaaaagcccagctctaatagtatgggggatccatcattcc600
gtatcaactgcagagcaaaccaagctatatgggagtggaaacaaactggtgacagttggg660
agttctaattatcaacaatcttttgtaccgagtccaggagcgagaccacaagttaatggt720
atatctggaagaattgactttcattggctaatgctaaatcccaatgatacagtcactttc780
agtttcaatggggctttcatagctccagaccgtgcaagcttcctgagaggaaaatctatg840
ggaatccagagtggagtacaggttgatgccaattgtgaaggggactgctatcatagtgga900
gggacaataataagtaacttgccatttcagaacatagatagcagggcagttggaaaatgt960
ccgagatatgttaagcaaaggagtctgctgctagcaacagggatgaagaatgttcctggc1020
ggatgggaaggcctaattgatggttggtatggtttcagacaccagaatgcacagggagag1080
ggaactgctgcagattacaaaagcactcaatcggcaattgatcaaataacaggaaaatta1140
aaccggcttatagaaaaaaccaaccaacaatttgagttgatcgacaatgaattcaatgag1200
gtagagaagcaaatcggtaatgtgataaattggaccagagattctataacagaagtgtgg1260
tcatacaatgctgaactcttggtagcaatggagaaccagcatacaattgatctggctgat1320
tcagaaatggacaaactgtacgaacgagtgaaaagacagctgagagagaatgctgaagaa1380
gatggcactggttgctttgaaatatttcacaagtgtgatgatgactgtatggccagtatt1440
agaaataacacctatgatcacagcaaatacagggaagaggcaatgcaaaatagaatacag1500
attgacccagtcaaactaagcagcggctacaaagatgtgatactttggtttagcttcggg1560
gcatcatgtttcatacttctagccattgtaatgggccttgtcttcatatgtgtaaagaat1620
ggaaacatgcggtgcactatttgtatataa1650
<210>152
<211>49
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h7h113(prl-).r
<400>152
ccttcccatccgccaggaacattcttcatccctgttgctagcagcagac49
<210>153
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h7h113(prl-).c
<400>153
agaatgttcctggcggatgggaaggcctaattgatggttggtatggtt48
<210>154
<211>549
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h7杭州的的氨基酸序列
<400>154
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaasplysilecysleuglyhishis
202530
alavalserasnglythrlysvalasnthrleuthrgluargglyval
354045
gluvalvalasnalathrgluthrvalgluargthrasnileproarg
505560
ilecysserlysglylysargthrvalaspleuglyglncysglyleu
65707580
leuglythrilethrglyproproglncysaspglnpheleugluphe
859095
seralaaspleuileilegluargarggluglyseraspvalcystyr
100105110
proglylysphevalasngluglualaleuargglnileleuargglu
115120125
serglyglyileasplysglualametglyphethrtyrserglyile
130135140
argthrasnglyalathrseralacysargargserglyserserphe
145150155160
tyralaglumetlystrpleuleuserasnthraspasnalaalaphe
165170175
proglnmetthrlyssertyrlysasnthrarglysserproalaleu
180185190
ilevaltrpglyilehishisservalserthralagluglnthrlys
195200205
leutyrglyserglyasnlysleuvalthrvalglyserserasntyr
210215220
glnglnserphevalproserproglyalaargproglnvalasngly
225230235240
ileserglyargileaspphehistrpleumetleuasnproasnasp
245250255
thrvalthrpheserpheasnglyalapheilealaproaspargala
260265270
serpheleuargglylyssermetglyileglnserglyvalglnval
275280285
aspalaasncysgluglyaspcystyrhisserglyglythrileile
290295300
serasnleupropheglnasnileaspserargalavalglylyscys
305310315320
proargtyrvallysglnargserleuleuleualathrglymetlys
325330335
asnvalproglyglytrpgluglyleuileaspglytrptyrglyphe
340345350
arghisglnasnalaglnglygluglythralaalaasptyrlysser
355360365
thrglnseralaileaspglnilethrglylysleuasnargleuile
370375380
glulysthrasnglnglnphegluleuileaspasnglupheasnglu
385390395400
valglulysglnileglyasnvalileasntrpthrargaspserile
405410415
thrgluvaltrpsertyrasnalagluleuleuvalalametgluasn
420425430
glnhisthrileaspleualaaspserglumetasplysleutyrglu
435440445
argvallysargglnleuarggluasnalaglugluaspglythrgly
450455460
cysphegluilephehislyscysaspaspaspcysmetalaserile
465470475480
argasnasnthrtyrasphisserlystyrarggluglualametgln
485490495
asnargileglnileaspprovallysleuserserglytyrlysasp
500505510
valileleutrppheserpheglyalasercyspheileleuleuala
515520525
ilevalmetglyleuvalpheilecysvallysasnglyasnmetarg
530535540
cysthrilecysile
545
<210>155
<211>1701
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h9杭州的核苷酸序列
<400>155
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggataaaatctgcatcggccaccagtcaacaaactccacagaaactgtg120
gacacgctaacagaaaccaatgttcctgtgacacatgccaaagaattgctccacacagag180
cataatggaatgctgtgtgcaacaagcctgggacatcccctcattctagacacatgcact240
attgaaggactagtctatggcaacccttcttgtgacctgctgttgggaggaagagaatgg300
tcctacatcgtcgaaagatcatcagctgtaaatggaacgtgttaccctgggaatgtagaa360
aacctagaggaactcaggacactttttagttccgctagttcctaccaaagaatccaaatc420
ttcccagacacaacctggaatgtgacttacactggaacaagcagagcatgttcaggttca480
ttctacaggagtatgagatggctgactcaaaagagcggtttttaccctgttcaagacgcc540
caatacacaaataacaggggaaagagcattcttttcgtgtggggcatacatcacccaccc600
acctataccgagcaaacaaatttgtacataagaaacgacacaacaacaagcgtgacaaca660
gaagatttgaataggaccttcaaaccagtgatagggccaaggccccttgtcaatggtctg720
cagggaagaattgattattattggtcggtactaaaaccaggccaaacattgcgagtacga780
tccaatgggaatctaattgctccatggtatggacacgttctttcaggagggagccatgga840
agaatcctgaagactgatttaaaaggtggtaattgtgtagtgcaatgtcagactgaaaaa900
ggtggcttaaacagtacattgccattccacaatatcagtaaatatgcatttggaacctgc960
cccaaatatgtaagagttaatagtctcaaactggcagtcggtctgaggaacgtgcctgct1020
agatcaagtagaggactatttggagccatagctggattcatagaaggaggttggccagga1080
ctagtcgctggctggtatggtttccagcattcaaatgatcaaggggttggtatggctgca1140
gatagggattcaactcaaaaggcaattgataaaataacatccaaggtgaataatatagtc1200
gacaagatgaacaagcaatatgaaataattgatcatgaatttagtgaggttgaaactaga1260
ctcaatatgatcaataataagattgatgaccaaatacaagacgtatgggcatataatgca1320
gaattgctagtactacttgaaaatcaaaaaacactcgatgagcatgatgcgaacgtgaac1380
aatctatataacaaggtgaagagggcactgggctccaatgctatggaagatgggaaaggc1440
tgtttcgagctataccataaatgtgatgatcagtgcatggaaacaattcggaacgggacc1500
tataataggagaaagtatagagaggaatcaagactagaaaggcagaaaatagagggggtt1560
aagctggaatctgagggaacttacaaaatcctcaccatttattcgactgtcgcctcatct1620
cttgtgcttgcaatggggtttgctgccttcctgttctgggccatgtccaatggatcttgc1680
agatgcaacatttgtatataa1701
<210>156
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if**-h9hk107399.s1-6r
<400>156
actaaagaaaataggcctttatatacaaatgttgcatctgcaagatccat50
<210>157
<211>566
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/h9杭州的氨基酸序列
<400>157
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaasplysilecysileglyhisgln
202530
serthrasnserthrgluthrvalaspthrleuthrgluthrasnval
354045
provalthrhisalalysgluleuleuhisthrgluhisasnglymet
505560
leucysalathrserleuglyhisproleuileleuaspthrcysthr
65707580
ilegluglyleuvaltyrglyasnprosercysaspleuleuleugly
859095
glyargglutrpsertyrilevalgluargserseralavalasngly
100105110
thrcystyrproglyasnvalgluasnleuglugluleuargthrleu
115120125
pheserseralasersertyrglnargileglnilepheproaspthr
130135140
thrtrpasnvalthrtyrthrglythrserargalacysserglyser
145150155160
phetyrargsermetargtrpleuthrglnlysserglyphetyrpro
165170175
valglnaspalaglntyrthrasnasnargglylysserileleuphe
180185190
valtrpglyilehishisproprothrtyrthrgluglnthrasnleu
195200205
tyrileargasnaspthrthrthrservalthrthrgluaspleuasn
210215220
argthrphelysprovalileglyproargproleuvalasnglyleu
225230235240
glnglyargileasptyrtyrtrpservalleulysproglyglnthr
245250255
leuargvalargserasnglyasnleuilealaprotrptyrglyhis
260265270
valleuserglyglyserhisglyargileleulysthraspleulys
275280285
glyglyasncysvalvalglncysglnthrglulysglyglyleuasn
290295300
serthrleuprophehisasnileserlystyralapheglythrcys
305310315320
prolystyrvalargvalasnserleulysleualavalglyleuarg
325330335
asnvalproalaargserserargglyleupheglyalailealagly
340345350
pheilegluglyglytrpproglyleuvalalaglytrptyrglyphe
355360365
glnhisserasnaspglnglyvalglymetalaalaaspargaspser
370375380
thrglnlysalaileasplysilethrserlysvalasnasnileval
385390395400
asplysmetasnlysglntyrgluileileasphisglupheserglu
405410415
valgluthrargleuasnmetileasnasnlysileaspaspglnile
420425430
glnaspvaltrpalatyrasnalagluleuleuvalleuleugluasn
435440445
glnlysthrleuaspgluhisaspalaasnvalasnasnleutyrasn
450455460
lysvallysargalaleuglyserasnalametgluaspglylysgly
465470475480
cysphegluleutyrhislyscysaspaspglncysmetgluthrile
485490495
argasnglythrtyrasnargarglystyrargglugluserargleu
500505510
gluargglnlysilegluglyvallysleuglusergluglythrtyr
515520525
lysileleuthriletyrserthrvalalaserserleuvalleuala
530535540
metglyphealaalapheleuphetrpalametserasnglysercys
545550555560
argcysasnilecysile
565
<210>158
<211>1656
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h9杭州的核苷酸序列
<400>158
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggataaaatctgcatcggccaccagtcaacaaactccacagaaactgtg120
gacacgctaacagaaaccaatgttcctgtgacacatgccaaagaattgctccacacagag180
cataatggaatgctgtgtgcaacaagcctgggacatcccctcattctagacacatgcact240
attgaaggactagtctatggcaacccttcttgtgacctgctgttgggaggaagagaatgg300
tcctacatcgtcgaaagatcatcagctgtaaatggaacgtgttaccctgggaatgtagaa360
aacctagaggaactcaggacactttttagttccgctagttcctaccaaagaatccaaatc420
ttcccagacacaacctggaatgtgacttacactggaacaagcagagcatgttcaggttca480
ttctacaggagtatgagatggctgactcaaaagagcggtttttaccctgttcaagacgcc540
caatacacaaataacaggggaaagagcattcttttcgtgtggggcatacatcacccaccc600
acctataccgagcaaacaaatttgtacataagaaacgacacaacaacaagcgtgacaaca660
gaagatttgaataggaccttcaaaccagtgatagggccaaggccccttgtcaatggtctg720
cagggaagaattgattattattggtcggtactaaaaccaggccaaacattgcgagtacga780
tccaatgggaatctaattgctccatggtatggacacgttctttcaggagggagccatgga840
agaatcctgaagactgatttaaaaggtggtaattgtgtagtgcaatgtcagactgaaaaa900
ggtggcttaaacagtacattgccattccacaatatcagtaaatatgcatttggaacctgc960
cccaaatatgtaagagttaatagtctcaaactggcagtcggtctgaggaacgtgcctggc1020
ggaggttggccaggactagtcgctggctggtatggtttccagcattcaaatgatcaaggg1080
gttggtatggctgcagatagggattcaactcaaaaggcaattgataaaataacatccaag1140
gtgaataatatagtcgacaagatgaacaagcaatatgaaataattgatcatgaatttagt1200
gaggttgaaactagactcaatatgatcaataataagattgatgaccaaatacaagacgta1260
tgggcatataatgcagaattgctagtactacttgaaaatcaaaaaacactcgatgagcat1320
gatgcgaacgtgaacaatctatataacaaggtgaagagggcactgggctccaatgctatg1380
gaagatgggaaaggctgtttcgagctataccataaatgtgatgatcagtgcatggaaaca1440
attcggaacgggacctataataggagaaagtatagagaggaatcaagactagaaaggcag1500
aaaatagagggggttaagctggaatctgagggaacttacaaaatcctcaccatttattcg1560
actgtcgcctcatctcttgtgcttgcaatggggtttgctgccttcctgttctgggccatg1620
tccaatggatcttgcagatgcaacatttgtatataa1656
<210>159
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h9hk107399(prl-).r
<400>159
gtcctggccaacctccgccaggcacgttcctcagaccgactgccagtt48
<210>160
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>h9hk107399(prl-).c
<400>160
ggaacgtgcctggcggaggttggccaggactagtcgctggctggtatg48
<210>161
<211>551
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/h9杭州的氨基酸序列
<400>161
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaasplysilecysileglyhisgln
202530
serthrasnserthrgluthrvalaspthrleuthrgluthrasnval
354045
provalthrhisalalysgluleuleuhisthrgluhisasnglymet
505560
leucysalathrserleuglyhisproleuileleuaspthrcysthr
65707580
ilegluglyleuvaltyrglyasnprosercysaspleuleuleugly
859095
glyargglutrpsertyrilevalgluargserseralavalasngly
100105110
thrcystyrproglyasnvalgluasnleuglugluleuargthrleu
115120125
pheserseralasersertyrglnargileglnilepheproaspthr
130135140
thrtrpasnvalthrtyrthrglythrserargalacysserglyser
145150155160
phetyrargsermetargtrpleuthrglnlysserglyphetyrpro
165170175
valglnaspalaglntyrthrasnasnargglylysserileleuphe
180185190
valtrpglyilehishisproprothrtyrthrgluglnthrasnleu
195200205
tyrileargasnaspthrthrthrservalthrthrgluaspleuasn
210215220
argthrphelysprovalileglyproargproleuvalasnglyleu
225230235240
glnglyargileasptyrtyrtrpservalleulysproglyglnthr
245250255
leuargvalargserasnglyasnleuilealaprotrptyrglyhis
260265270
valleuserglyglyserhisglyargileleulysthraspleulys
275280285
glyglyasncysvalvalglncysglnthrglulysglyglyleuasn
290295300
serthrleuprophehisasnileserlystyralapheglythrcys
305310315320
prolystyrvalargvalasnserleulysleualavalglyleuarg
325330335
asnvalproglyglyglytrpproglyleuvalalaglytrptyrgly
340345350
pheglnhisserasnaspglnglyvalglymetalaalaaspargasp
355360365
serthrglnlysalaileasplysilethrserlysvalasnasnile
370375380
valasplysmetasnlysglntyrgluileileasphisglupheser
385390395400
gluvalgluthrargleuasnmetileasnasnlysileaspaspgln
405410415
ileglnaspvaltrpalatyrasnalagluleuleuvalleuleuglu
420425430
asnglnlysthrleuaspgluhisaspalaasnvalasnasnleutyr
435440445
asnlysvallysargalaleuglyserasnalametgluaspglylys
450455460
glycysphegluleutyrhislyscysaspaspglncysmetgluthr
465470475480
ileargasnglythrtyrasnargarglystyrargglugluserarg
485490495
leugluargglnlysilegluglyvallysleuglusergluglythr
500505510
tyrlysileleuthriletyrserthrvalalaserserleuvalleu
515520525
alametglyphealaalapheleuphetrpalametserasnglyser
530535540
cysargcysasnilecysile
545550
<210>162
<211>1785
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马来西亚的核苷酸序列
<400>162
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggatcgaatctgcactgggataacatcgtcaaactcaccacatgttgtc120
aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180
accaaatctcattttgcaaatctcaaaggaacagaaaccagagggaaactatgcccaaaa240
tgcctcaactgcacagatctggacgtggccttgggcagaccaaaatgcacggggaacata300
ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360
ataatgcacgacagaacaaaaattagacagctgcctaaacttctcagaggatacgaacat420
atcaggttatcaactcataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480
attggaacctcagggtcttgccctaacgttaccaatggaaacggatttttcgcaacaatg540
gcttgggccgtcccaaaaaacgacaacaacaaaacagcaacaaattcattaacaatagaa600
gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgat660
aacgaaacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720
gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780
gacggaggactaccacaaagcggtagaattgttgttgattacatggtgcaaaaatctggg840
aaaacaggaacaattacctatcaaagaggtattttattgcctcaaaaagtgtggtgcgca900
agtggcaggagcaaggtaataaaaggatcgttgcctttaattggagaagcagattgcctc960
cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020
gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080
tatagacctcctgcaaaactattaaaggaaaggggtttcttcggagctattgctggtttc1140
ttagaaggaggatgggaaggaatgattgcaggttggcacggatacacatcccatggggca1200
catggagtagcggtggcagcagaccttaagagcactcaagaggccataaacaagataaca1260
aaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagactaagcggtgcc1320
atggatgaactccacaacgaaatactagaactagacgagaaagtggatgatctcagagct1380
gatacaataagctcacaaatagaactcgcagtcctgctttccaatgaaggaataataaac1440
agtgaagatgagcatctcttggcgcttgaaagaaagctgaagaaaatgctgggcccctct1500
gctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccagacctgtctc1560
gacagaatagctgctggtacctttgatgcaggagaattttctctccccacttttgattca1620
ctgaatattactgctgcatctttaaatgacgatggattggataatcatactatactgctt1680
tactactcaactgctgcctccagtttggctgtaacattgatgatagctatctttgttgtt1740
tatatggtctccagagacaatgtttcttgctccatctgtctataa1785
<210>163
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if**-hbm250604.s1-6r
<400>163
actaaagaaaataggcctttatagacagatggagcaagaaacattgtctc50
<210>164
<211>594
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马来西亚的氨基酸序列
<400>164
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglyasnileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuprolysleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnvalthrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnaspasnasnlysthr
180185190
alathrasnserleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproalalysleuleu
355360365
lysgluargglyphepheglyalailealaglypheleugluglygly
370375380
trpgluglymetilealaglytrphisglytyrthrserhisglyala
385390395400
hisglyvalalavalalaalaaspleulysserthrglnglualaile
405410415
asnlysilethrlysasnleuasnserleusergluleugluvallys
420425430
asnleuglnargleuserglyalametaspgluleuhisasngluile
435440445
leugluleuaspglulysvalaspaspleuargalaaspthrileser
450455460
serglnilegluleualavalleuleuserasngluglyileileasn
465470475480
sergluaspgluhisleuleualaleugluarglysleulyslysmet
485490495
leuglyproseralavalgluileglyasnglycysphegluthrlys
500505510
hislyscysasnglnthrcysleuaspargilealaalaglythrphe
515520525
aspalaglyglupheserleuprothrpheaspserleuasnilethr
530535540
alaalaserleuasnaspaspglyleuaspasnhisthrileleuleu
545550555560
tyrtyrserthralaalaserserleualavalthrleumetileala
565570575
ilephevalvaltyrmetvalserargaspasnvalsercysserile
580585590
cysleu
<210>165
<211>1734
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/hab马来西亚的核苷酸序列
<400>165
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggatcgaatctgcactgggataacatcgtcaaactcaccacatgttgtc120
aaaactgctactcaaggggaggtcaatgtgactggtgtaataccactgacaacaacaccc180
accaaatctcattttgcaaatctcaaaggaacagaaaccagagggaaactatgcccaaaa240
tgcctcaactgcacagatctggacgtggccttgggcagaccaaaatgcacggggaacata300
ccctcggcaagagtttcaatactccatgaagtcagacctgttacatctgggtgctttcct360
ataatgcacgacagaacaaaaattagacagctgcctaaacttctcagaggatacgaacat420
atcaggttatcaactcataacgttatcaatgcagaaaatgcaccaggaggaccctacaaa480
attggaacctcagggtcttgccctaacgttaccaatggaaacggatttttcgcaacaatg540
gcttgggccgtcccaaaaaacgacaacaacaaaacagcaacaaattcattaacaatagaa600
gtaccatacatttgtacagaaggagaagaccaaattaccgtttgggggttccactctgat660
aacgaaacccaaatggcaaagctctatggggactcaaagccccagaagttcacctcatct720
gccaacggagtgaccacacattacgtttcacagattggtggcttcccaaatcaaacagaa780
gacggaggactaccacaaagcggtagaattgttgttgattacatggtgcaaaaatctggg840
aaaacaggaacaattacctatcaaagaggtattttattgcctcaaaaagtgtggtgcgca900
agtggcaggagcaaggtaataaaaggatcgttgcctttaattggagaagcagattgcctc960
cacgaaaaatacggtggattaaacaaaagcaagccttactacacaggggaacatgcaaag1020
gccataggaaattgcccaatatgggtgaaaacacccttgaagctggccaatggaaccaaa1080
tatagacctcctggtggaggatgggaaggaatgattgcaggttggcacggatacacatcc1140
catggggcacatggagtagcggtggcagcagaccttaagagcactcaagaggccataaac1200
aagataacaaaaaatctcaactctttgagtgagctggaagtaaagaatcttcaaagacta1260
agcggtgccatggatgaactccacaacgaaatactagaactagacgagaaagtggatgat1320
ctcagagctgatacaataagctcacaaatagaactcgcagtcctgctttccaatgaagga1380
ataataaacagtgaagatgagcatctcttggcgcttgaaagaaagctgaagaaaatgctg1440
ggcccctctgctgtagagatagggaatggatgctttgaaaccaaacacaagtgcaaccag1500
acctgtctcgacagaatagctgctggtacctttgatgcaggagaattttctctccccact1560
tttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatact1620
atactgctttactactcaactgctgcctccagtttggctgtaacattgatgatagctatc1680
tttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa1734
<210>166
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hbm250604(prl-).r
<400>166
cattccttcccatcctccaccaggaggtctatatttggttccattggc48
<210>167
<211>48
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hbm250604(prl-).c
<400>167
agacctcctggtggaggatgggaaggaatgattgcaggttggcacgga48
<210>168
<211>577
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/hab马来西亚的氨基酸序列
<400>168
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlysserhis
505560
phealaasnleulysglythrgluthrargglylysleucysprolys
65707580
cysleuasncysthraspleuaspvalalaleuglyargprolyscys
859095
thrglyasnileproseralaargvalserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuprolysleuleuargglytyrgluhisileargleuser
130135140
thrhisasnvalileasnalagluasnalaproglyglyprotyrlys
145150155160
ileglythrserglysercysproasnvalthrasnglyasnglyphe
165170175
phealathrmetalatrpalavalprolysasnaspasnasnlysthr
180185190
alathrasnserleuthrilegluvalprotyrilecysthrglugly
195200205
gluaspglnilethrvaltrpglyphehisseraspasngluthrgln
210215220
metalalysleutyrglyaspserlysproglnlysphethrserser
225230235240
alaasnglyvalthrthrhistyrvalserglnileglyglyphepro
245250255
asnglnthrgluaspglyglyleuproglnserglyargilevalval
260265270
asptyrmetvalglnlysserglylysthrglythrilethrtyrgln
275280285
argglyileleuleuproglnlysvaltrpcysalaserglyargser
290295300
lysvalilelysglyserleuproleuileglyglualaaspcysleu
305310315320
hisglulystyrglyglyleuasnlysserlysprotyrtyrthrgly
325330335
gluhisalalysalaileglyasncysproiletrpvallysthrpro
340345350
leulysleualaasnglythrlystyrargproproglyglyglytrp
355360365
gluglymetilealaglytrphisglytyrthrserhisglyalahis
370375380
glyvalalavalalaalaaspleulysserthrglnglualaileasn
385390395400
lysilethrlysasnleuasnserleusergluleugluvallysasn
405410415
leuglnargleuserglyalametaspgluleuhisasngluileleu
420425430
gluleuaspglulysvalaspaspleuargalaaspthrileserser
435440445
glnilegluleualavalleuleuserasngluglyileileasnser
450455460
gluaspgluhisleuleualaleugluarglysleulyslysmetleu
465470475480
glyproseralavalgluileglyasnglycysphegluthrlyshis
485490495
lyscysasnglnthrcysleuaspargilealaalaglythrpheasp
500505510
alaglyglupheserleuprothrpheaspserleuasnilethrala
515520525
alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr
530535540
tyrserthralaalaserserleualavalthrleumetilealaile
545550555560
phevalvaltyrmetvalserargaspasnvalsercysserilecys
565570575
leu
<210>169
<211>1782
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州的核苷酸序列
<400>169
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgccgatcgaatctgcactgggataacatcttcaaactcacctcatgtggtc120
aaaacagctactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaagaccagagggaaactatgcccagac240
tgtctcaactgtacagatctggatgtggccctgggcaggccaatgtgtgtgggaactaca300
ccttctgcgaaagcttcaatacttcacgaagtcagacctgttacatccgggtgcttccct360
ataatgcacgacagaacaaaaatcaggcaactagccaatcttctcagaggatatgaaaat420
atcaggttatcaacccaaaacgttatcgatgcagaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaaaagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccattaacagtagaagta600
ccatacatttgtgcagaaggggaagaccaaattactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacattatgtttctcagattggcggcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcagaattgtcgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctatcaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagcttgccaatggaaccaaatat1080
agacctcctgcaaaactattaaaggaaaggggtttcttcggagctattgctggtttccta1140
gaaggaggatgggaaggaatgattgcaggttggcacggatacacatctcacggagcacat1200
ggagtggcagttgctgcagaccttaagagcacacaagaagctataaacaagataacaaaa1260
aatctcaactctttgagtgagctagaagtaaagaatcttcaaaggctaagtggtgccatg1320
gatgaactccacaacgaaatactcgagctggatgagaaagtggatgacctcagagctgac1380
actataagttcacaaatagaacttgcagtcttgctttccaacgaaggaataataaacagt1440
gaagacgagcatctattggcacttgagagaaaactaaagaaaatgctgggtccctctgct1500
gtagacataggaaatggatgcttcgaaaccaaacacaaatgcaaccagacctgcttagac1560
aggatagctgctggcacctttaatgcaggagagttttctctccccacttttgattcattg1620
aacattactgctgcatctttaaatgatgatggattggataaccatactatactgctctat1680
tactcaactgctgcttctagtttggctgtaacattgatgctagctatttttattgtttat1740
atggtctccagagacaacgtttcatgctccatctgtctataa1782
<210>170
<211>593
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>pdisp/hab马萨诸塞州的氨基酸序列
<400>170
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrlysthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvalarg
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleualaasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysalagluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyglypheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproalalysleuleulys
355360365
gluargglyphepheglyalailealaglypheleugluglyglytrp
370375380
gluglymetilealaglytrphisglytyrthrserhisglyalahis
385390395400
glyvalalavalalaalaaspleulysserthrglnglualaileasn
405410415
lysilethrlysasnleuasnserleusergluleugluvallysasn
420425430
leuglnargleuserglyalametaspgluleuhisasngluileleu
435440445
gluleuaspglulysvalaspaspleuargalaaspthrileserser
450455460
glnilegluleualavalleuleuserasngluglyileileasnser
465470475480
gluaspgluhisleuleualaleugluarglysleulyslysmetleu
485490495
glyproseralavalaspileglyasnglycysphegluthrlyshis
500505510
lyscysasnglnthrcysleuaspargilealaalaglythrpheasn
515520525
alaglyglupheserleuprothrpheaspserleuasnilethrala
530535540
alaserleuasnaspaspglyleuaspasnhisthrileleuleutyr
545550555560
tyrserthralaalaserserleualavalthrleumetleualaile
565570575
pheilevaltyrmetvalserargaspasnvalsercysserilecys
580585590
leu
<210>171
<211>63
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>马铃薯糖蛋白a信号肽的核苷酸序列
<400>171
atggcaactactaaaacttttttaattttattttttatgatattagcaactactagttca60
aca63
<210>172
<211>23
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>马铃薯糖蛋白a信号肽的氨基酸序列
<400>172
metalathrthrlysthrpheleuileleuphephemetileleuala
151015
thrthrserserthrcysala
20
<210>173
<211>517
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>cmpvht序列
<400>173
tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60
ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120
gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180
gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240
ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300
atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360
gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420
atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480
taagcttctgtatattctgcccaaatttgtcgggccc517
<210>174
<400>174
000
<210>175
<400>175
000
<210>176
<400>176
000
<210>177
<400>177
000
<210>178
<400>178
000
<210>179
<400>179
000
<210>180
<400>180
000
<210>181
<400>181
000
<210>182
<400>182
000
<210>183
<400>183
000
<210>184
<400>184
000
<210>185
<400>185
000
<210>186
<400>186
000
<210>187
<211>528
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有植物kozak共有序列的cpmvht+
<400>187
tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60
ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120
gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180
gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240
ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300
atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360
gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420
atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480
taagcttctgtatattctgcccaaatttgttcgggcccaataccgcgg528
<210>188
<211>511
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>cpmvht+511的核苷酸序列
<400>188
tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60
ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcgtgagc120
gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180
gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240
ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300
atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360
gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420
atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480
taagcttctgtatattctgcccaaatttgaa511
<210>189
<211>534
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>cpmvht+[wt115]的核苷酸序列
<400>189
tattaaaatcttaataggttttgataaaagcgaacgtggggaaacccgaaccaaaccttc60
ttctaaactctctctcatctctcttaaagcaaacttctctcttgtctttcttgcatgagc120
gatcttcaacgttgtcagatcgtgcttcggcaccagtacaacgttttctttcactgaagc180
gaaatcaaagatctctttgtggacacgtagtgcggcgccattaaataacgtgtacttgtc240
ctattcttgtcggtgtggtcttgggaaaagaaagcttgctggaggctgctgttcagcccc300
atacattacttgttacgattctgctgactttcggcgggtgcaatatctctacttctgctt360
gacgaggtattgttgcctgtacttctttcttcttcttcttgctgattggttctataagaa420
atctagtattttctttgaaacagagttttcccgtggttttcgaacttggagaaagattgt480
taagcttctgtatattctgcccaaatttgttcgggcccaataccgcggagaaaa534
<210>190
<211>56
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hbf406(prl-).r(构建体2102和2104)
<400>190
tccttcccatcctccaccaggaggtctatatttggttccattggcgagcttcaaag56
<210>191
<211>52
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>hbf406(prl-).c(构建体2102和2104)
<400>191
atatagacctcctggtggaggatgggaaggaatgattgcaggctggcacgga52
<210>192
<211>50
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if*-hbf406.s1-6r(构建体2102和2104)
<400>192
actaaagaaaataggcctttatagacagatggagcatgaaacgttgtctc50
<210>193
<211>1731
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达(构建体2102和2104)
的核苷酸序列
<400>193
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggatcgaatctgcactggaataacatcttcaaactcacctcatgtggtc120
aaaacagccactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaggaccagagggaaactatgcccagac240
tgtctcaactgcacagatctggatgtggctttgggcagaccaatgtgtgtggggaccaca300
ccttcggcgaaggcttcaatactccacgaagtcaaacctgttacatccgggtgctttcct360
ataatgcacgacagaacaaaaatcaggcaactacccaatcttctcagaggatatgaaaat420
atcaggctatcaacccaaaacgtcatcgatgcggaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaagagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccactaacagtagaagta600
ccatacatttgtacagaaggggaagaccaaatcactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacactatgtttctcagattggcagcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcaggattgttgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctaccaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagctcgccaatggaaccaaatat1080
agacctcctggtggaggatgggaaggaatgattgcaggctggcacggatacacatctcac1140
ggagcacatggagtggcagtggcggcggaccttaagagtacgcaagaagctataaacaag1200
ataacaaaaaatctcaattctttgagtgagctagaagtaaagaatcttcaaagactaagt1260
ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgatctc1320
agagctgacactataagctcgcaaatagaacttgcagtcttgctttccaacgaaggaata1380
ataaacagtgaagatgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440
ccctctgctgtagagataggaaatggatgcttcgaaaccaaacacaagtgcaaccagacc1500
tgcttagacaggatagctgctggcacctttaatgcaggagaattttctctccccactttt1560
gattcactgaacattactgctgcatctttaaatgatgatggattggataaccatactata1620
ctgctctattactcaactgctgcttctagtttggctgtaacattgatgctagctattttt1680
attgtttatatggtctccagagacaacgtttcatgctccatctgtctataa1731
<210>194
<211>576
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达(构建体2102和2104)
的氨基酸序列
<400>194
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrargthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvallys
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysthrgluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyserpheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproglyglyglytrpglu
355360365
glymetilealaglytrphisglytyrthrserhisglyalahisgly
370375380
valalavalalaalaaspleulysserthrglnglualaileasnlys
385390395400
ilethrlysasnleuasnserleusergluleugluvallysasnleu
405410415
glnargleuserglyalametaspgluleuhisasngluileleuglu
420425430
leuaspglulysvalaspaspleuargalaaspthrilesersergln
435440445
ilegluleualavalleuleuserasngluglyileileasnserglu
450455460
aspgluhisleuleualaleugluarglysleulyslysmetleugly
465470475480
proseralavalgluileglyasnglycysphegluthrlyshislys
485490495
cysasnglnthrcysleuaspargilealaalaglythrpheasnala
500505510
glyglupheserleuprothrpheaspserleuasnilethralaala
515520525
serleuasnaspaspglyleuaspasnhisthrileleuleutyrtyr
530535540
serthralaalaserserleualavalthrleumetleualailephe
545550555560
ilevaltyrmetvalserargaspasnvalsercysserilecysleu
565570575
<210>195
<211>3486
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2102
<400>195
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320
tcttgtgttggttccttctcagatcttcgcggatcgaatctgcactggaataacatcttc1380
aaactcacctcatgtggtcaaaacagccactcaaggggaggtcaatgtgactggtgtgat1440
accactaacaacaacaccaacaaaatcttattttgcaaatctcaaaggaacaaggaccag1500
agggaaactatgcccagactgtctcaactgcacagatctggatgtggctttgggcagacc1560
aatgtgtgtggggaccacaccttcggcgaaggcttcaatactccacgaagtcaaacctgt1620
tacatccgggtgctttcctataatgcacgacagaacaaaaatcaggcaactacccaatct1680
tctcagaggatatgaaaatatcaggctatcaacccaaaacgtcatcgatgcggaaaaggc1740
accaggaggaccctacagacttggaacctcaggatcttgccctaacgctaccagtaagag1800
cggatttttcgcaacaatggcttgggctgtcccaaaggacaacaacaaaaatgcaacgaa1860
cccactaacagtagaagtaccatacatttgtacagaaggggaagaccaaatcactgtttg1920
ggggttccattcagataacaaaacccaaatgaagaacctctatggagactcaaatcctca1980
aaagttcacctcatctgctaatggagtaaccacacactatgtttctcagattggcagctt2040
cccagatcaaacagaagacggaggactaccacaaagcggcaggattgttgttgattacat2100
gatgcaaaaacctgggaaaacaggaacaattgtctaccaaagaggtgttttgttgcctca2160
aaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtccttgcctttaattgg2220
tgaagcagattgccttcatgaaaaatacggtggattaaacaaaagcaagccttactacac2280
aggagaacatgcaaaagccataggaaattgcccaatatgggtgaaaacacctttgaagct2340
cgccaatggaaccaaatatagacctcctggtggaggatgggaaggaatgattgcaggctg2400
gcacggatacacatctcacggagcacatggagtggcagtggcggcggaccttaagagtac2460
gcaagaagctataaacaagataacaaaaaatctcaattctttgagtgagctagaagtaaa2520
gaatcttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgagctgga2580
tgagaaagtggatgatctcagagctgacactataagctcgcaaatagaacttgcagtctt2640
gctttccaacgaaggaataataaacagtgaagatgagcatctattggcacttgagagaaa2700
actaaagaaaatgctgggtccctctgctgtagagataggaaatggatgcttcgaaaccaa2760
acacaagtgcaaccagacctgcttagacaggatagctgctggcacctttaatgcaggaga2820
attttctctccccacttttgattcactgaacattactgctgcatctttaaatgatgatgg2880
attggataaccatactatactgctctattactcaactgctgcttctagtttggctgtaac2940
attgatgctagctatttttattgtttatatggtctccagagacaacgtttcatgctccat3000
ctgtctataaaggcctattttctttagtttgaatttactgttattcggtgtgcatttcta3060
tgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttcttt3120
gtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttat3180
taaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgt3240
tcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatt3300
atcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacg3360
ttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgata3420
gaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgtta3480
ctagat3486
<210>196
<211>5368
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2104
<400>196
tgttgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatg60
gaggcaggggtattttggtcattttaatagatagtggaaaatgacgtggaatttacttaa120
agacgaagtctttgcgacaagggggggcccacgccgaatttaatattaccggcgtggccc180
ccccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaatttcccgcc240
cactagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttggtcga300
caagcttgcatgccggtcaacatggtggagcacgacacacttgtctactccaaaaatatc360
aaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatcc420
ggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaa480
aaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagat540
gcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaa600
gaagacgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcac660
gacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaatt720
gagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatc780
tgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgc840
gataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggaccc900
ccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtg960
gattgatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaa1020
gacccttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaatagg1080
ttttgataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcat1140
ctctcttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcag1200
atcgtgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctcttt1260
gtggacacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtgg1320
tcttgggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacga1380
ttctgctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcct1440
gtacttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttga1500
aacagagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattct1560
gcccaaatttgtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcgg1620
cttattgttttctcttcttgtgttggttccttctcagatcttcgcggatcgaatctgcac1680
tggaataacatcttcaaactcacctcatgtggtcaaaacagccactcaaggggaggtcaa1740
tgtgactggtgtgataccactaacaacaacaccaacaaaatcttattttgcaaatctcaa1800
aggaacaaggaccagagggaaactatgcccagactgtctcaactgcacagatctggatgt1860
ggctttgggcagaccaatgtgtgtggggaccacaccttcggcgaaggcttcaatactcca1920
cgaagtcaaacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcag1980
gcaactacccaatcttctcagaggatatgaaaatatcaggctatcaacccaaaacgtcat2040
cgatgcggaaaaggcaccaggaggaccctacagacttggaacctcaggatcttgccctaa2100
cgctaccagtaagagcggatttttcgcaacaatggcttgggctgtcccaaaggacaacaa2160
caaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaaga2220
ccaaatcactgtttgggggttccattcagataacaaaacccaaatgaagaacctctatgg2280
agactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacactatgtttc2340
tcagattggcagcttcccagatcaaacagaagacggaggactaccacaaagcggcaggat2400
tgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctaccaaagagg2460
tgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtc2520
cttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaag2580
caagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtgaa2640
aacacctttgaagctcgccaatggaaccaaatatagacctcctggtggaggatgggaagg2700
aatgattgcaggctggcacggatacacatctcacggagcacatggagtggcagtggcggc2760
ggaccttaagagtacgcaagaagctataaacaagataacaaaaaatctcaattctttgag2820
tgagctagaagtaaagaatcttcaaagactaagtggtgccatggatgaactccacaacga2880
aatactcgagctggatgagaaagtggatgatctcagagctgacactataagctcgcaaat2940
agaacttgcagtcttgctttccaacgaaggaataataaacagtgaagatgagcatctatt3000
ggcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagagataggaaatgg3060
atgcttcgaaaccaaacacaagtgcaaccagacctgcttagacaggatagctgctggcac3120
ctttaatgcaggagaattttctctccccacttttgattcactgaacattactgctgcatc3180
tttaaatgatgatggattggataaccatactatactgctctattactcaactgctgcttc3240
tagtttggctgtaacattgatgctagctatttttattgtttatatggtctccagagacaa3300
cgtttcatgctccatctgtctataaaggcctattttctttagtttgaatttactgttatt3360
cggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatg3420
taatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaa3480
agattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttat3540
cgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgcc3600
ggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaac3660
atgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatac3720
atttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcg3780
gtgtcatctatgttactagatctctagagtctcaagcttggcgcgccataaaatgattat3840
tttatgaatatatttcattgtgcaagtagatagaaattacatatgttacataacacacga3900
aataaacaaaaaaagacaatccaaaaacaaacaccccaaaaaaaataatcactttagata3960
aactcgtatgaggagaggcacgttcagtgactcgacgattcccgagcaaaaaaagtctcc4020
ccgtcacacatatagtgggtgacgcaattatctttaaagtaatccttctgttgacttgtc4080
attgataacatccagtcttcgtcaggattgcaaagaattatagaagggatcccacctttt4140
attttcttcttttttccatatttagggttgacagtgaaatcagactggcaacctattaat4200
tgcttccacaatgggacgaacttgaaggggatgtcgtcgatgatattataggtggcgtgt4260
tcatcgtagttggtgaaatcgatggtaccgttccaatagttgtgtcgtccgagacttcta4320
gcccaggtggtctttccggtacgagttggtccgcagatgtagaggctggggtgtcggatt4380
ccattccttccattgtcctggttaaatcggccatccattcaaggtcagattgagcttgtt4440
ggtatgagacaggatgtatgtaagtataagcgtctatgcttacatggtatagatgggttt4500
ccctccaggagtgtagatcttcgtggcagcgaagatctgattctgtgaagggcgacacat4560
acggttcaggttgtggagggaataatttgttggctgaatattccagccattgaagttttg4620
ttgcccattcatgagggaattcttccttgatcatgtcaagatattcctccttagacgttg4680
cagtctggataatagttctccatcgtgcgtcagatttgcgaggagagaccttatgatctc4740
ggaaatctcctctggttttaatatctccgtcctttgatatgtaatcaaggacttgtttag4800
agtttctagctggctggatattagggtgatttccttcaaaatcgaaaaaagaaggatccc4860
taatacaaggttttttatcaagctggagaagagcatgatagtgggtagtgccatcttgat4920
gaagctcagaagcaacaccaaggaagaaaataagaaaaggtgtgagtttctcccagagaa4980
actggaataaatcatctctttgagatgagcacttgggataggtaaggaaaacatatttag5040
attggagtctgaagttcttactagcagaaggcatgttgttgtgactccgaggggttgcct5100
caaactctatcttataaccggcgtggaggcatggaggcaggggtattttggtcattttaa5160
tagatagtggaaaatgacgtggaatttacttaaagacgaagtctttgcgacaaggggggg5220
cccacgccgaatttaatattaccggcgtggcccccccttatcgcgagtgctttagcacga5280
gcggtccagatttaaagtagaaaatttcccgcccactagggttaaaggtgttcacactat5340
aaaagcatatacgatgtgatggtatttg5368
<210>197
<211>46
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>if-h1ctmct.s1-4r
<400>197
actaaagaaaataggcctttaaatacatattctacactgtagagac46
<210>198
<211>1731
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达+h1加利福尼亚tmct
(构建体2106和2108)的核苷酸序列
<400>198
atggcgaaaaacgttgcgattttcggcttattgttttctcttcttgtgttggttccttct60
cagatcttcgcggatcgaatctgcactggaataacatcttcaaactcacctcatgtggtc120
aaaacagccactcaaggggaggtcaatgtgactggtgtgataccactaacaacaacacca180
acaaaatcttattttgcaaatctcaaaggaacaaggaccagagggaaactatgcccagac240
tgtctcaactgcacagatctggatgtggctttgggcagaccaatgtgtgtggggaccaca300
ccttcggcgaaggcttcaatactccacgaagtcaaacctgttacatccgggtgctttcct360
ataatgcacgacagaacaaaaatcaggcaactacccaatcttctcagaggatatgaaaat420
atcaggctatcaacccaaaacgtcatcgatgcggaaaaggcaccaggaggaccctacaga480
cttggaacctcaggatcttgccctaacgctaccagtaagagcggatttttcgcaacaatg540
gcttgggctgtcccaaaggacaacaacaaaaatgcaacgaacccactaacagtagaagta600
ccatacatttgtacagaaggggaagaccaaatcactgtttgggggttccattcagataac660
aaaacccaaatgaagaacctctatggagactcaaatcctcaaaagttcacctcatctgct720
aatggagtaaccacacactatgtttctcagattggcagcttcccagatcaaacagaagac780
ggaggactaccacaaagcggcaggattgttgttgattacatgatgcaaaaacctgggaaa840
acaggaacaattgtctaccaaagaggtgttttgttgcctcaaaaggtgtggtgcgcgagt900
ggcaggagcaaagtaataaaagggtccttgcctttaattggtgaagcagattgccttcat960
gaaaaatacggtggattaaacaaaagcaagccttactacacaggagaacatgcaaaagcc1020
ataggaaattgcccaatatgggtgaaaacacctttgaagctcgccaatggaaccaaatat1080
agacctcctggtggaggatgggaaggaatgattgcaggctggcacggatacacatctcac1140
ggagcacatggagtggcagtggcggcggaccttaagagtacgcaagaagctataaacaag1200
ataacaaaaaatctcaattctttgagtgagctagaagtaaagaatcttcaaagactaagt1260
ggtgccatggatgaactccacaacgaaatactcgagctggatgagaaagtggatgatctc1320
agagctgacactataagctcgcaaatagaacttgcagtcttgctttccaacgaaggaata1380
ataaacagtgaagatgagcatctattggcacttgagagaaaactaaagaaaatgctgggt1440
ccctctgctgtagagataggaaatggatgcttcgaaaccaaacacaagtgcaaccagacc1500
tgcttagacaggatagctgctggcacctttaatgcaggagaattttctctccccactttt1560
gattcactgaacattactgctgcatctttaaatgatgatggattggataactaccagatt1620
ttggcgatctattcaactgtcgccagttcattggtactggtagtctccctgggggcaatc1680
agtttctggatgtgctctaatgggtctctacagtgtagaatatgtatttaa1731
<210>199
<211>576
<212>prt
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>具有缺失的蛋白水解环的pdisp/hab佛罗里达+h1加利福尼亚tmct
(构建体2106和2108)的氨基酸序列
<400>199
metalalysasnvalalailepheglyleuleupheserleuleuval
151015
leuvalproserglnilephealaaspargilecysthrglyilethr
202530
serserasnserprohisvalvallysthralathrglnglygluval
354045
asnvalthrglyvalileproleuthrthrthrprothrlyssertyr
505560
phealaasnleulysglythrargthrargglylysleucysproasp
65707580
cysleuasncysthraspleuaspvalalaleuglyargprometcys
859095
valglythrthrproseralalysalaserileleuhisgluvallys
100105110
provalthrserglycyspheproilemethisaspargthrlysile
115120125
argglnleuproasnleuleuargglytyrgluasnileargleuser
130135140
thrglnasnvalileaspalaglulysalaproglyglyprotyrarg
145150155160
leuglythrserglysercysproasnalathrserlysserglyphe
165170175
phealathrmetalatrpalavalprolysaspasnasnlysasnala
180185190
thrasnproleuthrvalgluvalprotyrilecysthrgluglyglu
195200205
aspglnilethrvaltrpglyphehisseraspasnlysthrglnmet
210215220
lysasnleutyrglyaspserasnproglnlysphethrserserala
225230235240
asnglyvalthrthrhistyrvalserglnileglyserpheproasp
245250255
glnthrgluaspglyglyleuproglnserglyargilevalvalasp
260265270
tyrmetmetglnlysproglylysthrglythrilevaltyrglnarg
275280285
glyvalleuleuproglnlysvaltrpcysalaserglyargserlys
290295300
valilelysglyserleuproleuileglyglualaaspcysleuhis
305310315320
glulystyrglyglyleuasnlysserlysprotyrtyrthrglyglu
325330335
hisalalysalaileglyasncysproiletrpvallysthrproleu
340345350
lysleualaasnglythrlystyrargproproglyglyglytrpglu
355360365
glymetilealaglytrphisglytyrthrserhisglyalahisgly
370375380
valalavalalaalaaspleulysserthrglnglualaileasnlys
385390395400
ilethrlysasnleuasnserleusergluleugluvallysasnleu
405410415
glnargleuserglyalametaspgluleuhisasngluileleuglu
420425430
leuaspglulysvalaspaspleuargalaaspthrilesersergln
435440445
ilegluleualavalleuleuserasngluglyileileasnserglu
450455460
aspgluhisleuleualaleugluarglysleulyslysmetleugly
465470475480
proseralavalgluileglyasnglycysphegluthrlyshislys
485490495
cysasnglnthrcysleuaspargilealaalaglythrpheasnala
500505510
glyglupheserleuprothrpheaspserleuasnilethralaala
515520525
serleuasnaspaspglyleuaspasntyrglnileleualailetyr
530535540
serthrvalalaserserleuvalleuvalvalserleuglyalaile
545550555560
serphetrpmetcysserasnglyserleuglncysargilecysile
565570575
<210>200
<211>3486
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2106
<400>200
gtcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctca60
gaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcgga120
ttccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcc180
tacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagt240
ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacc300
acgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctac360
tccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaa420
agggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtg480
aagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcc540
atcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagc600
atcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatc660
tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720
taaggaagttcatttcatttggagaggtattaaaatcttaataggttttgataaaagcga780
acgtggggaaacccgaaccaaaccttcttctaaactctctctcatctctcttaaagcaaa840
cttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcagatcgtgcttcggcac900
cagtacaacgttttctttcactgaagcgaaatcaaagatctctttgtggacacgtagtgc960
ggcgccattaaataacgtgtacttgtcctattcttgtcggtgtggtcttgggaaaagaaa1020
gcttgctggaggctgctgttcagccccatacattacttgttacgattctgctgactttcg1080
gcgggtgcaatatctctacttctgcttgacgaggtattgttgcctgtacttctttcttct1140
tcttcttgctgattggttctataagaaatctagtattttctttgaaacagagttttcccg1200
tggttttcgaacttggagaaagattgttaagcttctgtatattctgcccaaatttgtcgg1260
gcccaataccgcggagaaaatggcgaaaaacgttgcgattttcggcttattgttttctct1320
tcttgtgttggttccttctcagatcttcgcggatcgaatctgcactggaataacatcttc1380
aaactcacctcatgtggtcaaaacagccactcaaggggaggtcaatgtgactggtgtgat1440
accactaacaacaacaccaacaaaatcttattttgcaaatctcaaaggaacaaggaccag1500
agggaaactatgcccagactgtctcaactgcacagatctggatgtggctttgggcagacc1560
aatgtgtgtggggaccacaccttcggcgaaggcttcaatactccacgaagtcaaacctgt1620
tacatccgggtgctttcctataatgcacgacagaacaaaaatcaggcaactacccaatct1680
tctcagaggatatgaaaatatcaggctatcaacccaaaacgtcatcgatgcggaaaaggc1740
accaggaggaccctacagacttggaacctcaggatcttgccctaacgctaccagtaagag1800
cggatttttcgcaacaatggcttgggctgtcccaaaggacaacaacaaaaatgcaacgaa1860
cccactaacagtagaagtaccatacatttgtacagaaggggaagaccaaatcactgtttg1920
ggggttccattcagataacaaaacccaaatgaagaacctctatggagactcaaatcctca1980
aaagttcacctcatctgctaatggagtaaccacacactatgtttctcagattggcagctt2040
cccagatcaaacagaagacggaggactaccacaaagcggcaggattgttgttgattacat2100
gatgcaaaaacctgggaaaacaggaacaattgtctaccaaagaggtgttttgttgcctca2160
aaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtccttgcctttaattgg2220
tgaagcagattgccttcatgaaaaatacggtggattaaacaaaagcaagccttactacac2280
aggagaacatgcaaaagccataggaaattgcccaatatgggtgaaaacacctttgaagct2340
cgccaatggaaccaaatatagacctcctggtggaggatgggaaggaatgattgcaggctg2400
gcacggatacacatctcacggagcacatggagtggcagtggcggcggaccttaagagtac2460
gcaagaagctataaacaagataacaaaaaatctcaattctttgagtgagctagaagtaaa2520
gaatcttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgagctgga2580
tgagaaagtggatgatctcagagctgacactataagctcgcaaatagaacttgcagtctt2640
gctttccaacgaaggaataataaacagtgaagatgagcatctattggcacttgagagaaa2700
actaaagaaaatgctgggtccctctgctgtagagataggaaatggatgcttcgaaaccaa2760
acacaagtgcaaccagacctgcttagacaggatagctgctggcacctttaatgcaggaga2820
attttctctccccacttttgattcactgaacattactgctgcatctttaaatgatgatgg2880
attggataactaccagattttggcgatctattcaactgtcgccagttcattggtactggt2940
agtctccctgggggcaatcagtttctggatgtgctctaatgggtctctacagtgtagaat3000
atgtatttaaaggcctattttctttagtttgaatttactgttattcggtgtgcatttcta3060
tgtttggtgagcggttttctgtgctcagagtgtgtttattttatgtaatttaatttcttt3120
gtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaaagattttaattttat3180
taaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttatcgacctgcagatcgt3240
tcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgatt3300
atcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacg3360
ttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgata3420
gaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgtta3480
ctagat3486
<210>201
<211>5368
<212>dna
<213>人工序列(artificialsequence)
<220>
<221>
<222>
<223>盒2108
<400>201
tgttgttgtgactccgaggggttgcctcaaactctatcttataaccggcgtggaggcatg60
gaggcaggggtattttggtcattttaatagatagtggaaaatgacgtggaatttacttaa120
agacgaagtctttgcgacaagggggggcccacgccgaatttaatattaccggcgtggccc180
ccccttatcgcgagtgctttagcacgagcggtccagatttaaagtagaaaatttcccgcc240
cactagggttaaaggtgttcacactataaaagcatatacgatgtgatggtatttggtcga300
caagcttgcatgccggtcaacatggtggagcacgacacacttgtctactccaaaaatatc360
aaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatcc420
ggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaa480
aaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagat540
gcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaa600
gaagacgttccaaccacgtcttcaaagcaagtggattgatgtgataacatggtggagcac660
gacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaatt720
gagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatc780
tgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgc840
gataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggaccc900
ccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtg960
gattgatgtgatatctccactgacgtaagggatgacgcacaatcccactatccttcgcaa1020
gacccttcctctatataaggaagttcatttcatttggagaggtattaaaatcttaatagg1080
ttttgataaaagcgaacgtggggaaacccgaaccaaaccttcttctaaactctctctcat1140
ctctcttaaagcaaacttctctcttgtctttcttgcgtgagcgatcttcaacgttgtcag1200
atcgtgcttcggcaccagtacaacgttttctttcactgaagcgaaatcaaagatctcttt1260
gtggacacgtagtgcggcgccattaaataacgtgtacttgtcctattcttgtcggtgtgg1320
tcttgggaaaagaaagcttgctggaggctgctgttcagccccatacattacttgttacga1380
ttctgctgactttcggcgggtgcaatatctctacttctgcttgacgaggtattgttgcct1440
gtacttctttcttcttcttcttgctgattggttctataagaaatctagtattttctttga1500
aacagagttttcccgtggttttcgaacttggagaaagattgttaagcttctgtatattct1560
gcccaaatttgtcgggcccaataccgcggagaaaatggcgaaaaacgttgcgattttcgg1620
cttattgttttctcttcttgtgttggttccttctcagatcttcgcggatcgaatctgcac1680
tggaataacatcttcaaactcacctcatgtggtcaaaacagccactcaaggggaggtcaa1740
tgtgactggtgtgataccactaacaacaacaccaacaaaatcttattttgcaaatctcaa1800
aggaacaaggaccagagggaaactatgcccagactgtctcaactgcacagatctggatgt1860
ggctttgggcagaccaatgtgtgtggggaccacaccttcggcgaaggcttcaatactcca1920
cgaagtcaaacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcag1980
gcaactacccaatcttctcagaggatatgaaaatatcaggctatcaacccaaaacgtcat2040
cgatgcggaaaaggcaccaggaggaccctacagacttggaacctcaggatcttgccctaa2100
cgctaccagtaagagcggatttttcgcaacaatggcttgggctgtcccaaaggacaacaa2160
caaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaaga2220
ccaaatcactgtttgggggttccattcagataacaaaacccaaatgaagaacctctatgg2280
agactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacactatgtttc2340
tcagattggcagcttcccagatcaaacagaagacggaggactaccacaaagcggcaggat2400
tgttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctaccaaagagg2460
tgttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtc2520
cttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaag2580
caagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtgaa2640
aacacctttgaagctcgccaatggaaccaaatatagacctcctggtggaggatgggaagg2700
aatgattgcaggctggcacggatacacatctcacggagcacatggagtggcagtggcggc2760
ggaccttaagagtacgcaagaagctataaacaagataacaaaaaatctcaattctttgag2820
tgagctagaagtaaagaatcttcaaagactaagtggtgccatggatgaactccacaacga2880
aatactcgagctggatgagaaagtggatgatctcagagctgacactataagctcgcaaat2940
agaacttgcagtcttgctttccaacgaaggaataataaacagtgaagatgagcatctatt3000
ggcacttgagagaaaactaaagaaaatgctgggtccctctgctgtagagataggaaatgg3060
atgcttcgaaaccaaacacaagtgcaaccagacctgcttagacaggatagctgctggcac3120
ctttaatgcaggagaattttctctccccacttttgattcactgaacattactgctgcatc3180
tttaaatgatgatggattggataactaccagattttggcgatctattcaactgtcgccag3240
ttcattggtactggtagtctccctgggggcaatcagtttctggatgtgctctaatgggtc3300
tctacagtgtagaatatgtatttaaaggcctattttctttagtttgaatttactgttatt3360
cggtgtgcatttctatgtttggtgagcggttttctgtgctcagagtgtgtttattttatg3420
taatttaatttctttgtgagctcctgtttagcaggtcgtcccttcagcaaggacacaaaa3480
agattttaattttattaaaaaaaaaaaaaaaaaagaccgggaattcgatatcaagcttat3540
cgacctgcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgcc3600
ggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaac3660
atgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatac3720
atttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcg3780
gtgtcatctatgttactagatctctagagtctcaagcttggcgcgccataaaatgattat3840
tttatgaatatatttcattgtgcaagtagatagaaattacatatgttacataacacacga3900
aataaacaaaaaaagacaatccaaaaacaaacaccccaaaaaaaataatcactttagata3960
aactcgtatgaggagaggcacgttcagtgactcgacgattcccgagcaaaaaaagtctcc4020
ccgtcacacatatagtgggtgacgcaattatctttaaagtaatccttctgttgacttgtc4080
attgataacatccagtcttcgtcaggattgcaaagaattatagaagggatcccacctttt4140
attttcttcttttttccatatttagggttgacagtgaaatcagactggcaacctattaat4200
tgcttccacaatgggacgaacttgaaggggatgtcgtcgatgatattataggtggcgtgt4260
tcatcgtagttggtgaaatcgatggtaccgttccaatagttgtgtcgtccgagacttcta4320
gcccaggtggtctttccggtacgagttggtccgcagatgtagaggctggggtgtcggatt4380
ccattccttccattgtcctggttaaatcggccatccattcaaggtcagattgagcttgtt4440
ggtatgagacaggatgtatgtaagtataagcgtctatgcttacatggtatagatgggttt4500
ccctccaggagtgtagatcttcgtggcagcgaagatctgattctgtgaagggcgacacat4560
acggttcaggttgtggagggaataatttgttggctgaatattccagccattgaagttttg4620
ttgcccattcatgagggaattcttccttgatcatgtcaagatattcctccttagacgttg4680
cagtctggataatagttctccatcgtgcgtcagatttgcgaggagagaccttatgatctc4740
ggaaatctcctctggttttaatatctccgtcctttgatatgtaatcaaggacttgtttag4800
agtttctagctggctggatattagggtgatttccttcaaaatcgaaaaaagaaggatccc4860
taatacaaggttttttatcaagctggagaagagcatgatagtgggtagtgccatcttgat4920
gaagctcagaagcaacaccaaggaagaaaataagaaaaggtgtgagtttctcccagagaa4980
actggaataaatcatctctttgagatgagcacttgggataggtaaggaaaacatatttag5040
attggagtctgaagttcttactagcagaaggcatgttgttgtgactccgaggggttgcct5100
caaactctatcttataaccggcgtggaggcatggaggcaggggtattttggtcattttaa5160
tagatagtggaaaatgacgtggaatttacttaaagacgaagtctttgcgacaaggggggg5220
cccacgccgaatttaatattaccggcgtggcccccccttatcgcgagtgctttagcacga5280
gcggtccagatttaaagtagaaaatttcccgcccactagggttaaaggtgttcacactat5340
aaaagcatatacgatgtgatggtatttg5368