新型冠状病毒S蛋白及其亚单位疫苗

文档序号:26087784发布日期:2021-07-30 17:55阅读:5546来源:国知局
新型冠状病毒S蛋白及其亚单位疫苗

本发明属于生物技术领域,涉及一种新型冠状病毒s蛋白及其亚单位疫苗。



背景技术:

2020年1月30日,世卫组织宣布新型冠状病毒(sars-cov-2)引发的全球疫情为国际关注的突发公共卫生事件。由于病毒极高的传播潜力,截至2021年3月20日,全球已累计报告超过1.23亿例sars-cov-2感染病例,导致2718896例患者死亡。为了应对全球大流行的新型冠状病毒肺炎疫情,各国政府、企业和学术界正在制定各种治疗和预防对策,重中之重是疫苗和抗病毒药物的研发与应用。疫苗是抵抗所有病毒性疾病感染最有效的手段,也是保护未感染人群最有效的措施。

目前在研或已获批上市的sars-cov-2疫苗类型有:灭活疫苗、腺病毒载体疫苗、核酸疫苗(包括mrna疫苗和dna疫苗)以及亚单位疫苗。虽然已有部分针对sars-cov-2的疫苗紧急上市,用于应急使用,但目前的疫苗品种仍有很多问题:1、我国主要使用的灭活疫苗相比于核酸疫苗和亚单位疫苗的免疫原性不够强,灭活试剂会对抗原天然表位产生破环,而病毒颗粒中的其他但蛋白也会干扰s蛋白的免疫原性。2、核酸类疫苗产品是在新冠病毒中首次应用,以前还没有成功上市的核酸类疫苗,其长期的安全性,整合风险都未知。3、腺病毒疫苗的腺病毒载体会受到预存免疫的干扰。4、现有各种疫苗搜身针对早期流行毒株设计的,无法有效应对已经产生的突变株,不具有保守的保护效果。由于亚单位疫苗是采用sars-cov-2s蛋白全长或部分氨基酸序列作为抗原,具有强免疫原性,可以诱导高滴度的中和抗体产生,基因重组技术也便于对抗原进行突变株更新和广谱性设计,因此亚单位疫苗在应对sars-cov-2突变株具有更大的优势。

sars-cov-2是一种基因组约30kb,是有包膜的单股正链rna病毒,属于冠状病毒家族β属。病毒基因组编码多种蛋白,包括刺突蛋白(s),膜糖蛋白(m)、核衣壳蛋白(n),膜蛋白(e)以及多种非结构蛋白。其中s蛋白是i型病毒融合蛋白,介导病毒附着在细胞表面受体血管紧张素转化酶2(ace2)上,然后释放基因组进入细胞,因此s蛋白是中和性抗体的靶点,也是疫苗制备的主要有效成分。新型冠状病毒s蛋白由1273个氨基酸组成,包含21-35个n-糖基化位点。s蛋白以三聚体的形式在病毒表面形成特殊的花冠结构,冠状病毒因此而得名。s蛋白在宿主细胞蛋白酶的作用下,通过蛋白中部的rrar剪切序列被裂解为s1和s2两个亚基,s1主要功能是与宿主细胞表面受体结合,s2亚基介导病毒-细胞以及细胞-细胞膜融合。s蛋白完整的三聚体结构是病毒被宿主细胞核中和性抗体识别的首要结构。

因此,亟需开发一种新的有效的针对新型冠状病毒的疫苗。



技术实现要素:

为了解决所述技术问题,本发明提供了一种新型冠状病毒s蛋白及其亚单位疫苗,s1/s2切割位点rrar经突变以失去被弗林样蛋白酶切割的能力,以保留完整的s蛋白抗原性。

在本发明的第一方面,提供了一种新型冠状病毒s蛋白,所述新型冠状病毒s蛋白的s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,所述linker为以甘氨酸g和丝氨酸s构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,其中,n为≥1的整数。

进一步地,所述新型冠状病毒s蛋白具有如下修饰1-修饰4中的至少一种:

修饰1、所述新型冠状病毒s蛋白的原始信号肽替换为tpa信号肽、cd5信号肽和igg信号肽中的一种;

修饰2、所述新型冠状病毒s蛋白的seqidno:24所示跨膜区替换为t4噬菌体fibritin三聚体基序或seqidno:25gcn4多聚体形成基序;

修饰3、所述新型冠状病毒s蛋白的c端结构域删除seqidno:7所示跨膜结构域;

修饰4、所述新型冠状病毒s蛋白在氨基酸位置817-987处具有一个或多个氨基酸残基突变为脯氨酸的突变,所述突变包括k986p和/或v987p取代。

进一步地,所述新型冠状病毒s蛋白的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。

进一步地,所述新型冠状病毒s蛋白的氨基酸序列如seqidno:9所示或者seqidno:11所示或者seqidno:13所示。

在本发明的第二方面,提供了一种核酸分子,所述核酸分子的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。

在本发明的第三方面,提供了一种重组表达载体,所述重组表达载体能够表达所述的新型冠状病毒s蛋白。

进一步地,所述重组表达载体的表达区的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。

在本发明的第四方面,提供了一种工程化细胞,所述工程化细胞包含所述的重组表达载体。

在本发明的第五方面,提供了一种新型冠状病毒s蛋白的制备方法,所述方法包括:

获得所述的重组表达载体;

将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组s蛋白的细胞株;

将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒s蛋白。

在本发明的第六方面,提供了一种新型冠状病毒亚单位疫苗,所述新型冠状病毒亚单位疫苗包含所述的重组s蛋白以及药学上接受的佐剂。

进一步,所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、mpltm、il-12、氢氧化铝联合cpgodn复合佐剂、isa51vg、isa720vg、mf59、qs21、as03佐剂中的至少一种。

本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:

本发明提供的新型冠状病毒s蛋白及其亚单位疫苗,本发明的免疫原s蛋白多肽具有稳定的融合前构象,将s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,如以g(gly)甘氨酸和s(ser)丝氨酸构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,通过n来调整linker的长度和效果。在本发明中,我们比较了多种柔性linker,图2b的结果表明,与已经报道的682-qqaq-685突变相比,gs柔性linker,包括682-gsas-685,682-gg-685都具有更好的保护剪切的效果,gs突变中s2的剪切更少,能更好地保持不被剪切的s蛋白形式。本发明应用获取的具有生物活性的三聚体构象的s蛋白,制备成三聚体亚单位疫苗,免疫小鼠后能够诱导小鼠产生针对sars-cov-2原始株以及目前流行的突变株都具有免疫保护作用的中和抗体,对免疫小鼠进行新型冠状病毒的致死性攻毒感染后,可以提供100%的保护效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为哺乳动物细胞分泌型s蛋白序列设计图;

图2为s蛋白在cho-k1细胞中的优化表达效果;图2a:对比s蛋白原始序列与优化密码子序列蛋白表达水平;图2b:对比s蛋白furin剪切位点原始序列以及两种不同突变策略的剪切情况;图2c:对比具有原始信号肽与替换为tpa或者igg信号肽的s蛋白在细胞培养上清中的表达情况;

图3为稳定表达s蛋白的cho-k1细胞生长曲线;

图4为分泌表达重组s蛋白的表达量分析;

图5为分泌表达重组s蛋白的三聚体分析;

图6为s蛋白三聚体抗原激发特异性抗体水平检测;

图7为s蛋白三聚体抗原免疫小鼠后产生的抗体中和活性检测;图7a和7b分别为采集二次接种疫苗或者pbs的小鼠血清以及收集sars-cov-2康复患者血清,稀释不同的梯度,分别与新冠假病毒孵育1h,感染bhk-21ace2细胞,24h后收样检测萤火虫荧光素酶活性;

图8为重组s蛋白三聚体亚单位疫苗的保护性研究;图8a和图8b分别为二次接种疫苗或者pbs的小鼠通过滴鼻的方式感染sars-cov-2,分别记录疫苗组和对照组小鼠的体重变化以及生存的情况;

图9为本发明疫苗对新冠不同突变株假病毒具有极高中和活性的结果;图9a为疫苗二次免疫组小鼠血清针对原始株以及部分目前流行的突变株假病毒具有较高的中和活性结果;图9b为灭活疫苗志愿者血清针对原始株假病毒仅有较低的中和活性,并且对于南非株假病毒完全没有中和活性的结果;

图10为重组s蛋白三聚体亚单位疫苗的攻毒验证;图10a为疫苗组小鼠在感染sars-cov-2后体重变化不大的结果;图10b为重组s蛋白三聚体亚单位疫苗可完全抵抗致死剂量的sars-cov-2感染结果。

具体实施方式

下文将结合具体实施方式和实施例,具体阐述本发明,本发明的优点和各种效果将由此更加清楚地呈现。本领域技术人员应理解,这些具体实施方式和实施例是用于说明本发明,而非限制本发明。

在整个说明书中,除非另有特别说明,本文使用的术语应理解为如本领域中通常所使用的含义。因此,除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域技术人员的一般理解相同的含义。若存在矛盾,本说明书优先。

除非另有特别说明,本发明中用到的各种原材料、试剂、仪器和设备等,均可通过市场购买得到或者可通过现有方法制备得到。

本发明实施例提供的技术方案为解决上述技术问题,总体思路如下:

本申请人经过分析和实验验证发现:覆盖s1和s2的全部序列是最佳的疫苗抗原选择,比单独的s1(或rbd区域)或者单独的s2能诱导更多的抗体种类,更具有广谱性。同时,s蛋白完整的三聚体结构是病毒被宿主细胞核中和性抗体识别的首要结构,因此,如能在体外还原s蛋白三聚体结构,通过体外重组表达核纯化获得三聚体s蛋白,则能够模拟病毒天然构象,激活机体产生最接近天然病毒的识别抗体,也是亚单位重组疫苗的最佳选择。

因此,本发明的目的在于提供一种同时包括s1和s2两个亚基,又能在哺乳动物细胞上清中分泌表达的新型冠状病毒三聚体s蛋白及其基因序列,以及以cho细胞上清表达的此蛋白做成新型冠状病毒亚单位疫苗所提供的高效保护作用。

根据本发明实施例一种典型的实施方式,提供一种新型冠状病毒s蛋白,所述新型冠状病毒s蛋白的s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,所述linker为以甘氨酸g和丝氨酸s构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,其中,n为≥1的整数。

n为≥1的整数均在本发明的保护范围之内;作为优选的方案,本申请实施例中n优选取1-3;所述linker为(g)n,时,n优选值可长些,此时n优选取1-10;

本申请的核心在于将s1/s2切割位点rrar经突变以失去被弗林样蛋白酶切割的能力,以保留完整的s蛋白抗原性,本发明的免疫原s蛋白多肽具有稳定的融合前构象,将s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,如以g(gly)甘氨酸和s(ser)丝氨酸构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,通过n来调整linker的长度和效果。在本发明实施例中,我们比较了多种柔性linker,图2b的结果表明,与已经报道的682-qqaq-685突变相比,gs柔性linker,包括682-gsas-685,682-gg-685都具有更好的保护剪切的效果,gs突变中s2的剪切更少,能更好地保持不被剪切的s蛋白形式。

野生的新型冠状病毒s蛋白的核苷酸序列如seqidno:1所示,野生的新型冠状病毒s蛋白的氨基酸序列如seqidno:2所示;其中野生的新型冠状病毒s蛋白的原始信号肽的氨基酸序列为mfvflvllplvss,如seqidno:15所示;原始信号肽的核苷酸序列如seqidno:14所示;

为了在真核细胞中高效表达,我们使用了javacodonadapation软件对s表达基因的密码子进行了哺乳动物偏好的密码子优化,在一些实施方案中,本申请选用了javacodonadapation软件对s表达基因的密码子进行了优化,获得了在哺乳动物细胞中表达效率比天然s基因更高的表达效率。原始信号肽的核苷酸序列优化为如seqidno:16所示;原始信号肽的氨基酸序列如seqidno:17所示(氨基酸序列同seqidno:15);也可采用其他的密码子优化方式,具体可采用如下一种密码子优化方案:

密码子优化方案1:核苷酸序列如seqidno:3所示;

密码子优化方案2:核苷酸序列如seqidno:4所示;

密码子优化方案3:核苷酸序列如seqidno:5所示;

密码子优化方案4:核苷酸序列如seqidno:6所示;

密码子优化方案5:核苷酸序列如seqidno:7所示;

并将所述密码子优化方案1-5中s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为本申请的柔性的蛋白linker的密码子序列即可,所述linker为以甘氨酸g和丝氨酸s构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,其中,n为≥1的整数。

作为一种可选的实施方式,所述新型冠状病毒s蛋白具有如下修饰1-修饰4中的至少一种:

修饰1、所述新型冠状病毒s蛋白的原始信号肽可替换为seqidno:18所示以及seqidno:19所示tpa信号肽、seqidno:20所示以及seqidno:21所示igg信号肽、seqidno:22所示以及seqidno:23所示cd5信号肽中的一种;该序列采用分泌性信号肽以保证s蛋白可以在哺乳动物细胞的培养上清中分泌表达,选用tpa信号肽以及s蛋白天然信号肽以及igg信号肽以及cd5信号肽,最优的选择tpa信号肽。

修饰2、所述新型冠状病毒s蛋白的seqidno:24所示跨膜区替换为t4噬菌体fibritin三聚体基序或seqidno:25gcn4多聚体形成基序。为更优的形成三聚体结构,将s蛋白与t4噬菌体的次要纤维蛋白(fibritin)的三聚体折叠结构域在c末端进行融合。

修饰3、所述新型冠状病毒s蛋白的c端结构域删除seqidno:26所示跨膜结构域。目的在于促进所述重组s蛋白的分泌表达。

修饰4、所述新型冠状病毒s蛋白在氨基酸位置817-987处具有一个或多个氨基酸残基突变为脯氨酸的突变,所述突变可包括k986p和/或v987p取代。两个脯氨酸残基的取代提高了预融合构象的稳定性。

以上修饰1-修饰4中的一种或多种,其中任何一种排列组合的方案,均在本发明的保护范围之内。

作为优选地,新型冠状病毒s蛋白的核苷酸序列可采用seqidno:8、seqidno:10和seqidno:12任一所示,其中:

新型冠状病毒s蛋白的核苷酸序列seqidno:8所示方案中,采用所述密码子优化方案3骨架+原始信号肽+682gsas685+t4噬菌体fibritin三聚体基序;氨基酸序列seqidno:9所示;

新型冠状病毒s蛋白的核苷酸序列seqidno:10所示方案中,采用所述密码子优化方案3骨架+tpa信号肽+691gsas694+t4噬菌体fibritin三聚体基序;氨基酸序列seqidno:11所示;

新型冠状病毒s蛋白的核苷酸序列seqidno:12所示方案中,采用所述密码子优化方案3骨架+tpa信号肽+691gg692+t4噬菌体fibritin三聚体基序;氨基酸序列seqidno:13所示;

本发明实施例通过多种表达元件的测试和比较,获得了一种可以在哺乳动物细胞中高效分泌表达的s蛋白重组基因序列和蛋白序列。作为一种最优的技术方案,该序列是一种c段截断形式的s蛋白,保留s1和s2两个亚基,除跨膜区外的所有功能区都保留,以最大限度保留s蛋白上的抗体表位。所述最优的技术方案中,所述新型冠状病毒s蛋白的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。所述新型冠状病毒s蛋白的氨基酸序列如seqidno:9所示或者seqidno:11所示或者seqidno:13所示。

根据本发明实施例另一种典型的实施方式,提供一种核酸分子,所述核酸分子的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。含有所述核酸分子的生物材料也在本发明的保护范围之内,所述生物材料包括重组dna、质粒载体、噬菌体载体、病毒载体和工程菌中的一种。

根据本发明实施例另一种典型的实施方式,提供一种重组表达载体,所述重组表达载体能够表达所述的新型冠状病毒s蛋白。

根据本发明实施例另一种典型的实施方式,提供一种工程化细胞,所述工程化细胞包含所述的重组表达载体。所述工程化细胞可选用悬浮细胞,包括cho系列和293、293ft等人用疫苗哺乳动物细胞株都在本发明的保护范围之内,具体地,本发明实施例使用cho-k1细胞,通过将上述s基因转染该细胞并获得稳定表达细胞株,高效表达重组的s蛋白。

根据本发明实施例另一种典型的实施方式,提供一种新型冠状病毒s蛋白的制备方法,所述方法包括:

获得所述的重组表达载体;

将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组s蛋白的细胞株;

将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒s蛋白。

根据本发明实施例另一种典型的实施方式,提供一种新型冠状病毒亚单位疫苗,所述新型冠状病毒亚单位疫苗包含所述的重组s蛋白以及药学上接受的佐剂。

所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、mpltm、il-12、氢氧化铝联合cpgodn复合佐剂、isa51vg、isa720vg、mf59、qs21、as03佐剂中的至少一种。在其他实施方式中,所述佐剂也可选用其他形式的佐剂。

所述新型冠状病毒亚单位疫苗可以制备成滴鼻剂、喷雾剂和肌肉注射剂。

本发明应用获取的具有生物活性的三聚体构象的s蛋白,制备成三聚体亚单位疫苗,免疫小鼠后能够诱导小鼠产生针对sars-cov-2的具有免疫保护作用的中和抗体,对免疫小鼠进行新型冠状病毒的致死性攻毒感染后,可以提供100%的保护效率。

下面将结合实施例及实验数据对本申请的效果进行详细说明。

实施例一重组s蛋白载体构建与表达优化

1、哺乳动物细胞上清表达的s蛋白基因的构建

本发明的s蛋白表达基因的构建示意图见图1。图1中哺乳动物细胞分泌型s蛋白序列设计图:序列保留原始信号肽,或者突变为tpa信号肽/cd5信号肽/igg信号肽;furin剪切位点由rrar突变为gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n;c端跨膜区以及胞内区替换为t4噬菌体次要纤维蛋白序列。

首先,为了在真核细胞中高效表达,我们使用了javacodonadapation软件对s表达基因的密码子进行了哺乳动物偏好的密码子优化,原始信号肽的核苷酸序列优化为如seqidno:16所示;图2a的结果表明,未经优化的s天然基因在cho细胞中表达量极低,几乎检测不到;而经过密码子优化的s基因可以在cho细胞中高效的表达s蛋白。

其次,本发明的免疫原s蛋白多肽具有稳定的融合前构象,将s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,如以g(gly)甘氨酸和s(ser)丝氨酸构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,通过n来调整linker的长度和效果。在本发明中,我们比较了多种柔性linker,图2b的结果表明,与已经报道的682-qqaq-685突变相比,gs柔性linker,包括682-gsas-685,682-gg-685都具有更好的保护剪切的效果,gs突变中s2的剪切更少,能更好地保持不被剪切的s蛋白形式。图7的结果表明,完整的s蛋白可以诱导产生高滴度的特异性中和抗体,而仅靶向s蛋白s2亚基的抗体不具有中和病毒的活性,即无法保护机体抵抗sars-cov-2的感染。

再次,为了无需裂解细胞而在哺乳动物上清中表达s蛋白,我们去掉了天然s蛋白的跨膜区(tm区),将去掉tm区的s蛋白与t4噬菌体的次要纤维蛋白(fibritin)的三聚体折叠结构域在c末端进行融合,增强三聚体的形成。在使用分泌信号肽时,我们比较了tpa信号肽,s蛋白自身信号肽以及人igg信号肽。图2c的结果表明,人组织纤溶酶原激活剂(tpa)信号肽和s蛋白自身信号肽都能在转染的cho上清中检测到s蛋白,因此优选这两种信号肽进行上清表达。

所述s基因的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。

2、分泌表达重组s蛋白的cho-k1细胞株构建

将上述(1)中构建的s基因(所述s基因的核苷酸序列如seqidno:8所示)克隆至表达载体载体(由promega公司的pc-neo载体改造,加入gs表达标签)中,得到带有谷氨酰胺合成酶(gs)筛选标签的表达载体。具体步骤为:pc-gs载体利用限制性内切酶nhei以及smai(thermofisher)酶切,s基因则用nhei以及ecorv(thermofisher)酶切,然后通过琼脂糖凝胶电泳分别回收已经酶切好的载体以及s基因,再利用t4连接酶(newenglandbiolabs)链接,随后转化进感受态dh5,挑单克隆并鉴定正确的pc-gs-s克隆,即得到s基因表达质粒。

将上述s基因表达质粒通过电转仪(biorad公司)电穿孔方式转染至cho-k1细胞(武汉大学中国典型培养物保藏中心)中。电穿孔转染操作方案:取1×107个细胞到800lcho-cd1无血清培养基(上海培源生物科技股份有限公司)中重悬,加入40μg质粒混匀,转移上述培养液至电转杯(biorad公司)中,设置电转程序为电压300v,电容960μf,电阻∞,指数脉冲。电击完毕,取出培养液至cho-cd1培养基,调整细胞浓度为5×105个/ml。电转后每天检测细胞密度以及存活率,当细胞浓度开始稳定增长至1×106个/ml时,证明细胞株完成建系。通过有限稀释法进行筛选,挑选克隆株分别扩大培养,进一步筛选优势细胞株。优势株扩大培养后,接种细胞进行细胞生长周期检测。

3、cho-k1-s细胞生长检测

上述优势株细胞转接到20mlcho-cd1培养基中,细胞终浓度为1×106个/ml,放置到37℃,5%co2,转速为120rpm的摇床培养箱(thermofisher)中。接种当天记第0天,然后每24小时利用血球计数板(biorad)计数,统计细胞生长情况,计数到细胞数目不在增长或下降为止。实验结果表明,在1×106个/ml接种浓度下,优势株细胞在接种第2-3天进入对数生长期,第6-7天到达平台期,第8天开始进入衰亡期(图3)。图3为稳定表达s蛋白的cho-k1-s细胞生长曲线:接种2×107个cho细胞到20ml无血清培养基中,连续培养8天,统计生长情况。

4、分泌表达重组s蛋白的检测

优势株细胞转接到2个含有20mlcho-cd1培养基的细胞培养瓶中,细胞终浓度分别为1×106个/ml记为a瓶;2×106个/ml记为b瓶。放置到37℃5%co2,转速为120rpm的摇床培养箱中。连续培养4天后,然后取a瓶以及b瓶的培养液100μl,800rpm离心5分钟,取出上清,加入对应体积的6×sdsloadingbuffer;离心后的细胞加入40μl1×sdsloadingbuffer,然后放置100℃金属浴(dlab)10分钟,sds-page检测上清中蛋白表达。实验结果表明,优势株细胞上清中可以检测出高表达的s蛋白,并且在接种初始浓度高的样品中,s蛋白表达量更高(图4)。图4为分泌表达重组s蛋白的表达量分析:接种cho细胞到无血清培养基,根据接种细胞数分别记为a瓶和b瓶,培养4天后,检测细胞和培养基上清s蛋白表达。

上述b瓶细胞培养液离心后取得的上清培养基取出10μl、20μl、40μl、60μl到ep管中,第二份对应地加入2μl、4μl、8μl、12μl6×nativeloadingbuffer,然后通过native-page检测上清表达s蛋白的三聚体形式。如图5所示,实验结果表明,优势株细胞上清中可以检测出少量s蛋白单体存在,大部分s蛋白在培养基上清中以二聚体或三聚体形式存在(图5),说明cho-k1-s细胞株可以大量表达天然多聚体构象的s蛋白,并且上述细胞株分泌表达重组s蛋白能够达到3g/l,可以满足亚单位疫苗生产要求。

实施例二、重组s蛋白三聚体疫苗免疫与效果鉴定

1、小鼠的免疫流程

本实验所用小鼠为k18-hace雄鼠,6-8周,19-28g,从江苏集萃药康生物科技有限公司购入,所有动物实验操作在spf实验室进行。实验组接种疫苗+佐剂,共4只小鼠;对照组接种pbs,共4只小鼠。接种第一针疫苗后14天接种第二针,接种第一针后35天(即接种第二针后21天),对所有小鼠进行眼眶取血。取小鼠血清用于检验。

2、elisa检测流程

(1)用0.1m碳酸盐缓冲液(ph=9.6)稀释rbd(义翘神州科技有限公司),使终浓度为1ng/μl,再向96孔酶标板的各孔加入100μl,使每孔最终含有100ngrbd。37℃孵育3小时。

(2)弃包被液,每孔加250μl的0.05%的pbst(莫纳生物科技有限公司)进行洗涤。洗涤3次,每次5分钟。

(3)再向每孔加入200μl的5%脱脂牛奶(用0.05%pbst配制),进行封闭,37℃孵育3小时。

(4)用5%脱脂牛奶对疫苗组和对照组小鼠的血清样品进行1:500稀释。弃封闭液,每孔加入100μl已经稀释的小鼠血清,每份小鼠血清做三次重复,4℃过夜。

(5)弃血清,每孔加200μl的0.05%的pbst进行洗涤。洗涤3次,每次5分钟。

(6)用5%脱脂牛奶以1:5000比例稀释羊抗鼠igg二抗(博尔西科技有限公司)。向每孔加入100μl稀释后的二抗。37℃孵育1h。

(7)弃二抗,每孔加200μl的0.05%的pbst进行洗涤。洗涤3次,每次5分钟。

(8)再向每孔加入100μl的酶作用底物(hcmtmbone),室温避光显色30分钟。每孔加入50μl1mhcl终止反应。放入酶标仪中检测od450的值。

3、vsv骨架新冠假病毒包装流程

新冠病毒spike蛋白表达质粒sdel-18(尾端删除18个氨基酸,质粒来源夏宁邵教授实验室)转染veroe6细胞(15μg/10cmdish),转染后48h,用种子病毒vsv-dg-luc(质粒来源夏宁邵教授实验室)感染细胞(300μl/10cmdish)。感染1h后,吸弃病毒液,换为含有vsv-g抗体(1:1000)的新鲜完全培养基。37℃培养24h,收取细胞上清,分装假病毒,冻存于-80℃备用。

4、新冠假病毒中和实验流程

(1)接种bhk-21ace2细胞(来自武汉大学中国典型培养物保藏中心)于96孔板中,待细胞聚合度达到90%,进行实验。

(2)小鼠血清56℃,30min去除补体。

(3)用感染培养基(dmem+2%fbs+1%ps)梯度稀释小鼠血清。

(4)用感染培养基(dmem+2%fbs+1%ps)稀释假病毒,假病毒(v):总体积(v)=1:10。

(5)血清稀释液与假病毒稀释液等比混合(50l+50l每孔),37℃孵育1h。

(6)用pbs清洗bhk-21ace2细胞两次。

(7)血清与假病毒混合液加入细胞,37℃培养24h,裂解细胞,加入萤火虫荧光素酶底物(promega),用varioskanlux多功能微孔板读数仪(thermofisher)测定萤火虫荧光素酶活性。

5、本发明疫苗免疫的小鼠血清中含有极高的anti-rbdigg

为了验证设计的疫苗能诱导小鼠产生特异性抗体,将制备的重组s蛋白疫苗免疫小鼠,对照组小鼠接种等体积1×pbs。接种第一针后35天(即接种第二针后21天),对所有小鼠进行眼眶取血。随后将制备的4份疫苗组小鼠血清和4份对照组小鼠血清按1:500稀释,用于酶联免疫反应(elisa)检测血清中特异性抗体的含量。

实验结果如图6所示。可以看出,在1:500稀释倍数下,疫苗组小鼠血清与新冠病毒rbd蛋白反应的od450值显著高于对照组小鼠血清与新冠病毒rbd蛋白反应。这说明本发明制备的疫苗能够诱导小鼠产生极高的针对s蛋白rbd区域的特异性抗体。同时,灭活疫苗志愿者血清以1:2000释倍数下,可诱导与本疫苗相似水平的rbd区域抗体反应。

6、本发明疫苗保持s蛋白抗原完整性以及对新冠假病毒具有极高中和活性

为了验证本疫苗产生的抗体对新冠病毒的具有中和能力,将本疫苗二次免疫的小鼠血清和商业化靶向s蛋白的s2亚基抗体(义翘神州科技有限公司)分别进行假病毒中和实验,对比上述两种抗体的中和活性。

取疫苗二次免疫组小鼠(s-55)血清以及对照组(pbs-53)小鼠血清,进行1:100、1:1000、1:10000、1:20000、1:40000和1:80000倍稀释;商业化靶向s蛋白的s2亚基抗体进行1:100、1:500、1:2500、1:5000和1:10000倍稀释。将稀释血清与vsv骨架新冠假病毒进行中和实验,测定小鼠血清和商业化靶向s蛋白的s2亚基特异性抗体的中和活性。

图7a结果显示,疫苗二次免疫小鼠血清在1:100–1:10000稀释度下对新冠假病毒具有中和活性,在稀释度约1:8000时达到50%中和效率。而对照组小鼠血清在所有稀释度下均没有对假病毒中和活性;图7b结果显示,商业化靶向s蛋白的s2亚基特异性抗体仅在低稀释浓度表现出很弱的假病毒中和活性。这表明,本疫苗的重组s蛋白可以保留s蛋白抗原的完整性,并可以诱导产生对新冠病毒中和效果好、高水平的特异性抗体。

7、本发明疫苗对新冠原始株假病毒具有极高中和活性

为了对比本疫苗产生的抗体以及现有新冠灭活疫苗对新冠假病毒的中和活性,将本疫苗二次免疫的小鼠血清以及灭活疫苗志愿者血清进行假病毒中和实验。

取疫苗二次免疫组小鼠血清,进行1:100、1:1000、1:10000、1:20000、1:40000、1:80000、1:160000和1:320000倍稀释;新冠病毒灭活疫苗志愿者血清进行1:102、1:103、1:104、1:105、1:106和1:107倍稀释。对照组小鼠血清作为对照。将稀释血清与vsv骨架新冠假病毒进行中和实验,测定小鼠血清和灭活疫苗志愿者血清中s蛋白特异性抗体的中和活性。

图8a结果显示,疫苗二次免疫小鼠血清在1:100–1:32000稀释度下均对新冠假病毒具有中和活性,在稀释度约为1:6300时达到50%中和效率。而对照组血清在所有稀释度下均没有对假病毒中和活性。图8b结果显示,灭活疫苗志愿者血清1:103–1:105稀释度对新冠假病毒具有低中和活性,且无法达到50%中和效率。这表明,对比现有灭活疫苗,本疫苗可以诱导产生对新冠病毒中和效果更好、高水平的特异性抗体。

8、本发明疫苗对新冠不同突变株假病毒具有极高中和活性

为了对比本疫苗以及现有新冠灭活疫苗产生的抗体对新冠不同突变株假病毒的中和活性,将本疫苗二次免疫的小鼠血清以及灭活疫苗志愿者血清进行突变株假病毒中和实验。

取疫苗二次免疫组小鼠血清以及新冠病毒灭活疫苗志愿者血清,进行1:102、1:103、1:104、1:105、1:106倍稀释。将稀释血清与vsv骨架新冠不同突变株假病毒进行中和实验,测定并统计小鼠血清和灭活疫苗志愿者血清中特异性抗体的50%中和活性或者20%中和活性的稀释度。

图9a结果显示,疫苗二次免疫组小鼠血清针对原始株以及部分目前流行的突变株假病毒具有较高的中和活性,尽管对于南非株假病毒的中和活性有所下降。图9b结果显示,灭活疫苗志愿者血清针对原始株假病毒仅有较低的中和活性,并且对于南非株假病毒完全没有中和活性。这表明本疫苗可以诱导产生对新冠原始株以及目前流行的新冠突变株中和效果更好,且滴度更高的特异性抗体。

实施例三、重组s蛋白三聚体亚单位疫苗的攻毒验证

将上述小鼠适应absl-3环境2-3天后进行实验,小鼠对应分为以下2组:对照组:pbs组;实验组:疫苗组;每组4只。

sars-cov-2攻毒上述两组小鼠,剂量为2.5×102pfu/只(中国科学院武汉病毒研究所分离的临床毒株,武汉大学absl-3实验室扩增)。具体操作流程为:sars-cov-2原液初始滴度为6×106pfu/ml,共200μl。准备1.5ml螺帽管,加入714μl1xpbs以及6μlsars-cov-2原液混匀,此时病毒稀释液体积为720μl,滴度为5×104pfu/ml。然后准备2ml螺帽管,加入1800μl1×pbs以及200μl上述sars-cov-2稀释液混匀,此时病毒稀释液体积为2000μl,滴度为5×103pfu/ml,然后将稀释好的sars-cov-2放置于冰上待用。用镊子夹出小鼠,使用异氟烷进行吸入麻醉,观察小鼠,待小鼠出现站立不稳昏倒等现象时,用移液枪吸取50μl稀释到滴度为5×103pfu/ml病毒液,向小鼠鼻孔缓慢滴入,使病毒液随小鼠的呼吸自然吸入。数秒后将小鼠放回至饲养笼。攻毒后,每天固定时间点称取小鼠体重,一共记录11天。最后使用graphpadprism软件绘制每组小鼠体重与生存曲线。

实验结果表明,通过本发明所应用的实验方案获取到的具有天然三聚体结构的重组s蛋白,制备成的疫苗具有优良的免疫原性,疫苗组小鼠在感染sars-cov-2后体重变化不大(图10a),并可完全抵抗致死剂量的sars-cov-2感染(图10b)。本发明可以作为潜在的sars-cov-2重组s蛋白亚单位疫苗。

最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

序列表

<110>武汉大学

<120>新型冠状病毒s蛋白及其亚单位疫苗

<160>26

<170>siposequencelisting1.0

<210>1

<211>3819

<212>dna

<213>新型冠状病毒(sars-cov-2)

<400>1

atgtttgtgttcctggtgctgctgccactggtgtccagccagtgtgtgaacctgaccacc60

aggacccaacttcctcctgcctacaccaactccttcaccaggggagtctactaccctgac120

aaggtgttcaggtcctctgtgctgcacagcacccaggacctgttcctgccattcttcagc180

aatgtgacctggttccatgccatccatgtgtctggcaccaatggcaccaagaggtttgac240

aaccctgtgctgccattcaatgatggagtctactttgccagcacagagaagagcaacatc300

atcaggggctggatttttggcaccaccctggacagcaagacccagtccctgctgattgtg360

aacaatgccaccaatgtggtgattaaggtgtgtgagttccagttctgtaatgacccattc420

ctgggagtctactaccacaagaacaacaagtcctggatggagtctgagttcagggtctac480

tcctctgccaacaactgtacctttgaatatgtgagccaaccattcctgatggacttggag540

ggcaagcagggcaacttcaagaacctgagggagtttgtgttcaagaacattgatggctac600

ttcaagatttacagcaaacacacaccaatcaacctggtgagggacctgccacagggcttc660

tctgccttggaaccactggtggacctgccaattggcatcaacatcaccaggttccagacc720

ctgctggctctgcacaggtcctacctgacacctggagactcctcctctggctggacagca780

ggagcagcagcctactatgtgggctacctccaaccaaggaccttcctgctgaaatacaat840

gagaatggcaccatcacagatgctgtggactgtgccctggacccactgtctgagaccaag900

tgtaccctgaaatccttcacagtggagaagggcatctaccagaccagcaacttcagggtc960

caaccaacagagagcattgtgaggtttccaaacatcaccaacctgtgtccatttggagag1020

gtgttcaatgccaccaggtttgcctctgtctatgcctggaacaggaagaggattagcaac1080

tgtgtggctgactactctgtgctctacaactctgcctccttcagcaccttcaagtgttat1140

ggagtgagcccaaccaaactgaatgacctgtgtttcaccaatgtctatgctgactccttt1200

gtgattaggggagatgaggtgagacagattgcccctggacaaacaggcaagattgctgac1260

tacaactacaaactgcctgatgacttcacaggctgtgtgattgcctggaacagcaacaac1320

ctggacagcaaggtgggaggcaactacaactacctctacagactgttcaggaagagcaac1380

ctgaaaccatttgagagggacatcagcacagagatttaccaggctggcagcacaccatgt1440

aatggagtggagggcttcaactgttactttccactccaatcctatggcttccaaccaacc1500

aatggagtgggctaccaaccatacagggtggtggtgctgtcctttgaactgctccatgcc1560

cctgccacagtgtgtggaccaaagaagagcaccaacctggtgaagaacaagtgtgtgaac1620

ttcaacttcaatggactgacaggcacaggagtgctgacagagagcaacaagaagttcctg1680

ccattccaacagtttggcagggacattgctgacaccacagatgctgtgagggacccacag1740

accttggagattctggacatcacaccatgttcctttggaggagtgtctgtgattacacct1800

ggcaccaacaccagcaaccaggtggctgtgctctaccaggatgtgaactgtactgaggtg1860

cctgtggctatccatgctgaccaacttacaccaacctggagggtctacagcacaggcagc1920

aatgtgttccagaccagggctggctgtctgattggagcagagcatgtgaacaactcctat1980

gagtgtgacatcccaattggagcaggcatctgtgcctcctaccagacccagaccaacagc2040

ccaaggagggcaaggtctgtggcaagccagagcatcattgcctacacaatgagtctggga2100

gcagagaactctgtggcttacagcaacaacagcattgccatcccaaccaacttcaccatc2160

tctgtgaccacagagattctgcctgtgagtatgaccaagacctctgtggactgtacaatg2220

tatatctgtggagacagcacagagtgtagcaacctgctgctccaatatggctccttctgt2280

acccaacttaacagggctctgacaggcattgctgtggaacaggacaagaacacccaggag2340

gtgtttgcccaggtgaagcagatttacaagacacctccaatcaaggactttggaggcttc2400

aacttcagccagattctgcctgacccaagcaagccaagcaagaggtccttcattgaggac2460

ctgctgttcaacaaggtgaccctggctgatgctggcttcatcaagcaatatggagactgt2520

ctgggagacattgctgccagggacctgatttgtgcccagaagttcaatggactgacagtg2580

ctgcctccactgctgacagatgagatgattgcccaatacacctctgccctgctggctggc2640

accatcacctctggctggacctttggagcaggagcagccctccaaatcccatttgctatg2700

cagatggcttacaggttcaatggcattggagtgacccagaatgtgctctatgagaaccag2760

aaactgattgccaaccagttcaactctgccattggcaagattcaggactccctgtccagc2820

acagcctctgccctgggcaaactccaagatgtggtgaaccagaatgcccaggctctgaac2880

accctggtgaagcaactttccagcaactttggagccatctcctctgtgctgaatgacatc2940

ctgagcagactggacaaggtggaggctgaggtccagattgacagactgattacaggcaga3000

ctccaatccctccaaacctatgtgacccaacaacttatcagggctgctgagattagggca3060

tctgccaacctggctgccaccaagatgagtgagtgtgtgctgggacaaagcaagagggtg3120

gacttctgtggcaagggctaccacctgatgagttttccacagtctgcccctcatggagtg3180

gtgttcctgcatgtgacctatgtgcctgcccaggagaagaacttcaccacagcccctgcc3240

atctgccatgatggcaaggctcactttccaagggagggagtgtttgtgagcaatggcacc3300

cactggtttgtgacccagaggaacttctatgaaccacagattatcaccacagacaacacc3360

tttgtgtctggcaactgtgatgtggtgattggcattgtgaacaacacagtctatgaccca3420

ctccaacctgaactggactccttcaaggaggaactggacaaatacttcaagaaccacacc3480

agccctgatgtggacctgggagacatctctggcatcaatgcctctgtggtgaacatccag3540

aaggagattgacagactgaatgaggtggctaagaacctgaatgagtccctgattgacctc3600

caagaactgggcaaatatgaacaatacatcaagtggccatggtacatctggctgggcttc3660

attgctggactgattgccattgtgatggtgaccataatgctgtgttgtatgacctcctgt3720

tgttcctgtctgaaaggctgttgttcctgtggctcctgttgtaagtttgatgaggatgac3780

tctgaacctgtgctgaaaggagtgaaactgcactacacc3819

<210>2

<211>1273

<212>prt

<213>新型冠状病毒(sars-cov-2)

<400>2

metphevalpheleuvalleuleuproleuvalserserglncysval

151015

asnleuthrthrargthrglnleuproproalatyrthrasnserphe

202530

thrargglyvaltyrtyrproasplysvalpheargserservalleu

354045

hisserthrglnaspleupheleuprophepheserasnvalthrtrp

505560

phehisalailehisvalserglythrasnglythrlysargpheasp

65707580

asnprovalleupropheasnaspglyvaltyrphealaserthrglu

859095

lysserasnileileargglytrpilepheglythrthrleuaspser

100105110

lysthrglnserleuleuilevalasnasnalathrasnvalvalile

115120125

lysvalcysglupheglnphecysasnasppropheleuglyvaltyr

130135140

tyrhislysasnasnlyssertrpmetgluserglupheargvaltyr

145150155160

serseralaasnasncysthrpheglutyrvalserglnpropheleu

165170175

metaspleugluglylysglnglyasnphelysasnleuarggluphe

180185190

valphelysasnileaspglytyrphelysiletyrserlyshisthr

195200205

proileasnleuvalargaspleuproglnglypheseralaleuglu

210215220

proleuvalaspleuproileglyileasnilethrargpheglnthr

225230235240

leuleualaleuhisargsertyrleuthrproglyaspserserser

245250255

glytrpthralaglyalaalaalatyrtyrvalglytyrleuglnpro

260265270

argthrpheleuleulystyrasngluasnglythrilethraspala

275280285

valaspcysalaleuaspproleusergluthrlyscysthrleulys

290295300

serphethrvalglulysglyiletyrglnthrserasnpheargval

305310315320

glnprothrgluserilevalargpheproasnilethrasnleucys

325330335

propheglygluvalpheasnalathrargphealaservaltyrala

340345350

trpasnarglysargileserasncysvalalaasptyrservalleu

355360365

tyrasnseralaserpheserthrphelyscystyrglyvalserpro

370375380

thrlysleuasnaspleucysphethrasnvaltyralaaspserphe

385390395400

valileargglyaspgluvalargglnilealaproglyglnthrgly

405410415

lysilealaasptyrasntyrlysleuproaspaspphethrglycys

420425430

valilealatrpasnserasnasnleuaspserlysvalglyglyasn

435440445

tyrasntyrleutyrargleuphearglysserasnleulysprophe

450455460

gluargaspileserthrgluiletyrglnalaglyserthrprocys

465470475480

asnglyvalgluglypheasncystyrpheproleuglnsertyrgly

485490495

pheglnprothrasnglyvalglytyrglnprotyrargvalvalval

500505510

leuserphegluleuleuhisalaproalathrvalcysglyprolys

515520525

lysserthrasnleuvallysasnlyscysvalasnpheasnpheasn

530535540

glyleuthrglythrglyvalleuthrgluserasnlyslyspheleu

545550555560

propheglnglnpheglyargaspilealaaspthrthraspalaval

565570575

argaspproglnthrleugluileleuaspilethrprocysserphe

580585590

glyglyvalservalilethrproglythrasnthrserasnglnval

595600605

alavalleutyrglnaspvalasncysthrgluvalprovalalaile

610615620

hisalaaspglnleuthrprothrtrpargvaltyrserthrglyser

625630635640

asnvalpheglnthrargalaglycysleuileglyalagluhisval

645650655

asnasnsertyrglucysaspileproileglyalaglyilecysala

660665670

sertyrglnthrglnthrasnserproargargalaargservalala

675680685

serglnserileilealatyrthrmetserleuglyalagluasnser

690695700

valalatyrserasnasnserilealaileprothrasnphethrile

705710715720

servalthrthrgluileleuprovalsermetthrlysthrserval

725730735

aspcysthrmettyrilecysglyaspserthrglucysserasnleu

740745750

leuleuglntyrglyserphecysthrglnleuasnargalaleuthr

755760765

glyilealavalgluglnasplysasnthrglngluvalphealagln

770775780

vallysglniletyrlysthrproproilelysasppheglyglyphe

785790795800

asnpheserglnileleuproaspproserlysproserlysargser

805810815

pheilegluaspleuleupheasnlysvalthrleualaaspalagly

820825830

pheilelysglntyrglyaspcysleuglyaspilealaalaargasp

835840845

leuilecysalaglnlyspheasnglyleuthrvalleuproproleu

850855860

leuthraspglumetilealaglntyrthrseralaleuleualagly

865870875880

thrilethrserglytrpthrpheglyalaglyalaalaleuglnile

885890895

prophealametglnmetalatyrargpheasnglyileglyvalthr

900905910

glnasnvalleutyrgluasnglnlysleuilealaasnglnpheasn

915920925

seralaileglylysileglnaspserleuserserthralaserala

930935940

leuglylysleuglnaspvalvalasnglnasnalaglnalaleuasn

945950955960

thrleuvallysglnleuserserasnpheglyalaileserserval

965970975

leuasnaspileleuserargleuasplysvalglualagluvalgln

980985990

ileaspargleuilethrglyargleuglnserleuglnthrtyrval

99510001005

thrglnglnleuileargalaalagluileargalaseralaasnleu

101010151020

alaalathrlysmetserglucysvalleuglyglnserlysargval

1025103010351040

aspphecysglylysglytyrhisleumetserpheproglnserala

104510501055

prohisglyvalvalpheleuhisvalthrtyrvalproalaglnglu

106010651070

lysasnphethrthralaproalailecyshisaspglylysalahis

107510801085

pheproarggluglyvalphevalserasnglythrhistrppheval

109010951100

thrglnargasnphetyrgluproglnileilethrthraspasnthr

1105111011151120

phevalserglyasncysaspvalvalileglyilevalasnasnthr

112511301135

valtyraspproleuglnprogluleuaspserphelysglugluleu

114011451150

asplystyrphelysasnhisthrserproaspvalaspleuglyasp

115511601165

ileserglyileasnalaservalvalasnileglnlysgluileasp

117011751180

argleuasngluvalalalysasnleuasngluserleuileaspleu

1185119011951200

glngluleuglylystyrgluglntyrilelystrpprotrptyrile

120512101215

trpleuglypheilealaglyleuilealailevalmetvalthrile

122012251230

metleucyscysmetthrsercyscyssercysleulysglycyscys

123512401245

sercysglysercyscyslyspheaspgluaspaspsergluproval

125012551260

leulysglyvallysleuhistyrthr

12651270

<210>3

<211>3819

<212>dna

<213>人工序列(artificialsequence)

<400>3

atgtttgtgttcctggtcctgctgcctcttgtgagttcacaatgtgttaatctgacaacg60

aggactcagctcccccccgcctatacaaatagttttacccgcggcgtgtattatccggat120

aaagtcttcaggtcttctgtgctccacagcacccaggacctgttcctgccttttttttcc180

aatgtgacctggttccacgccatccacgtgtctggaacaaacggtaccaaaagattcgat240

aaccctgtgctgccctttaacgatggagtctactttgctagcaccgagaaaagcaacatt300

attagggggtggatttttggcactaccctcgacagcaaaacccagtcattgcttatcgtc360

aacaacgctaccaacgtcgtgattaaggtttgcgaatttcagttttgcaatgatcctttc420

ctcggcgtgtattatcataagaacaataaatcttggatggaatccgagttccgagtatat480

tcaagcgccaacaactgtacttttgaatatgtgtcccagccattcctcatggatctggaa540

ggcaagcaggggaactttaaaaatctcagagagttcgtattcaagaacattgacgggtac600

tttaagatctatagtaagcatacccccatcaaccttgtaagagacctgccacaggggttt660

agtgccctggagccactcgtggatctgccaatcggaatcaacatcacacgctttcagact720

ttgcttgcgctgcacagaagctatctgaccccgggtgatagctcatctggatggacagcg780

ggggccgccgcgtactacgtcgggtaccttcagcccaggacgttcctgctgaaatacaac840

gaaaacggcaccattaccgacgcagtagactgcgcactcgaccccctgagtgaaacaaag900

tgtacgttgaaaagttttaccgtagagaaaggcatatatcagactagcaattttagggtt960

cagcccacagagtctattgtgcgctttcctaatatcaccaatttgtgcccttttggagaa1020

gtgtttaatgccacccgatttgcgtctgtgtatgcttggaatcgcaaaaggatctcaaac1080

tgcgtcgccgactattccgtgctgtacaactctgcttcatttagcacattcaagtgttat1140

ggggtgagtccaaccaaattgaacgacctctgctttacaaacgtgtacgctgactcattt1200

gtcattagaggcgacgaagtgaggcagattgcccccgggcagacaggaaaaattgcggac1260

tacaactacaagctccctgatgacttcacgggctgtgtcatcgcatggaacagtaacaat1320

cttgatagcaaggtgggcggcaattacaattacctgtacagactgtttagaaaatctaat1380

ctcaaaccctttgaaagggacatttccactgaaatctatcaggccgggagcactccgtgt1440

aacggcgtagaggggtttaactgctatttcccactgcagtcctatggattccagccaaca1500

aacggggtgggctaccaaccctaccgggtagtggtgctgagctttgaacttctgcatgct1560

ccggctaccgtctgtggcccaaagaagagcacaaacctcgtaaagaacaagtgtgttaac1620

ttcaattttaatggcctcaccggaactggcgtcctcactgagtccaataagaagtttctg1680

ccgtttcaacagttcggccgggacatagctgacacgactgacgccgtgagagaccctcaa1740

accctcgaaatactggacatcactccttgctcattcggcggcgtttctgtgataacacca1800

ggcacgaacacttctaatcaggtggctgtgctttatcaggacgtgaactgcacagaagtg1860

cctgtcgccattcatgccgatcagctcacccctacttggagagtttatagcaccggctca1920

aacgtgttccaaacgagagcaggctgccttatcggggcagagcacgtgaacaatagctat1980

gagtgtgatatcccaattggggctggcatatgcgctagctaccagacccagacaaactca2040

cccaggcgggcccggtcagtggctagccagtctattatcgcctacaccatgtccctgggc2100

gccgagaacagtgtcgcgtacagcaataactccatcgctatccctaccaacttcacgatc2160

tcagtgacgactgagatattgccggtttctatgactaagaccagtgtggattgtacaatg2220

tacatctgtggtgatagcacagagtgctctaatctcctgctccaatatgggagcttttgt2280

acccagctgaacagagcattgaccgggattgccgtcgagcaggataagaacacacaagaa2340

gtatttgcccaggtgaaacagatctacaagactccccctattaaagacttcggcggcttt2400

aacttttctcagatactccccgaccctagcaagcctagcaaacggagcttcattgaagat2460

cttttgtttaataaggtcacattggcggatgccggctttatcaagcagtacggggattgt2520

ttgggtgatattgcggctagggatctgatttgtgcccagaagttcaatggcctgacagtg2580

ctgccccccctgcttacagacgagatgattgcgcagtacaccagcgctctgctggcggga2640

accatcacctccggctggacctttggggccggagccgcactccagatcccttttgccatg2700

cagatggcctatagattcaatggaatcggcgtgacacagaacgtcctgtatgagaaccag2760

aaactcatcgctaatcagtttaacagcgccattggcaaaattcaggattctctgagttca2820

accgcatcagctttgggtaaactgcaggatgtcgtaaatcagaatgctcaggccctgaat2880

actcttgttaagcagctctcctctaacttcggcgccatcagttctgtgctgaacgacatt2940

ctgtctagactggacaaggtggaggcagaggtacaaatcgaccgcctgatcaccggacgg3000

ctgcagtcactccaaacatacgtgacccaacagctcatccgggcagccgaaattagagcc3060

tctgcaaatctggccgccacaaagatgagtgagtgcgttctgggtcagtccaaacgagtg3120

gacttctgcggcaaaggttaccacctgatgagtttcccccagtctgccccgcatggcgtg3180

gtattcctgcacgtgacttatgtcccagcccaggaaaagaacttcaccaccgccccagca3240

atttgtcacgatggtaaggcccacttcccccgggaaggcgtttttgtgtccaatggcact3300

cattggttcgtgacacagagaaacttttacgaaccccaaatcattaccaccgacaacact3360

ttcgtcagcgggaattgtgacgtagtaatcgggattgtgaacaacaccgtctatgacccc3420

ctgcagcccgagcttgactcctttaaagaggaactggataagtatttcaagaatcacaca3480

agccctgatgttgatctgggcgacatctctggcattaacgcttcagtggtcaacatacaa3540

aaagagatcgatcgcctcaatgaagtcgccaagaatctcaatgagtcactcatcgatttg3600

caggaactggggaagtacgagcagtatatcaagtggccctggtacatctggctgggattt3660

attgctgggctcatcgctatcgtaatggtcaccattatgttgtgctgcatgacctcctgt3720

tgttcctgtctgaaaggttgttgtagttgcggcagttgttgtaagttcgatgaagatgac3780

tctgagcctgtgctcaagggcgtcaagctccactacaca3819

<210>4

<211>3819

<212>dna

<213>人工序列(artificialsequence)

<400>4

atgttcgtgttcctggtgctgctgcccctggtgagcagccagtgcgtgaacctgaccacc60

agaacccagctgccccccgcctacaccaacagcttcaccagaggcgtgtactaccccgac120

aaggtgttcagaagcagcgtgctgcacagcacccaggacctgttcctgcccttcttcagc180

aacgtgacctggttccacgccatccacgtgagcggcaccaacggcaccaagagattcgac240

aaccccgtgctgcccttcaacgacggcgtgtacttcgccagcaccgagaagagcaacatc300

atcagaggctggatcttcggcaccaccctggacagcaagacccagagcctgctgatcgtg360

aacaacgccaccaacgtggtgatcaaggtgtgcgagttccagttctgcaacgaccccttc420

ctgggcgtgtactaccacaagaacaacaagagctggatggagagcgagttcagagtgtac480

agcagcgccaacaactgcaccttcgagtacgtgagccagcccttcctgatggacctggag540

ggcaagcagggcaacttcaagaacctgagagagttcgtgttcaagaacatcgacggctac600

ttcaagatctacagcaagcacacccccatcaacctggtgagagacctgccccagggcttc660

agcgccctggagcccctggtggacctgcccatcggcatcaacatcaccagattccagacc720

ctgctggccctgcacagaagctacctgacccccggcgacagcagcagcggctggaccgcc780

ggcgccgccgcctactacgtgggctacctgcagcccagaaccttcctgctgaagtacaac840

gagaacggcaccatcaccgacgccgtggactgcgccctggaccccctgagcgagaccaag900

tgcaccctgaagagcttcaccgtggagaagggcatctaccagaccagcaacttcagagtg960

cagcccaccgagagcatcgtgagattccccaacatcaccaacctgtgccccttcggcgag1020

gtgttcaacgccaccagattcgccagcgtgtacgcctggaacagaaagagaatcagcaac1080

tgcgtggccgactacagcgtgctgtacaacagcgccagcttcagcaccttcaagtgctac1140

ggcgtgagccccaccaagctgaacgacctgtgcttcaccaacgtgtacgccgacagcttc1200

gtgatcagaggcgacgaggtgagacagatcgcccccggccagaccggcaagatcgccgac1260

tacaactacaagctgcccgacgacttcaccggctgcgtgatcgcctggaacagcaacaac1320

ctggacagcaaggtgggcggcaactacaactacctgtacagactgttcagaaagagcaac1380

ctgaagcccttcgagagagacatcagcaccgagatctaccaggccggcagcaccccctgc1440

aacggcgtggagggcttcaactgctacttccccctgcagagctacggcttccagcccacc1500

aacggcgtgggctaccagccctacagagtggtggtgctgagcttcgagctgctgcacgcc1560

cccgccaccgtgtgcggccccaagaagagcaccaacctggtgaagaacaagtgcgtgaac1620

ttcaacttcaacggcctgaccggcaccggcgtgctgaccgagagcaacaagaagttcctg1680

cccttccagcagttcggcagagacatcgccgacaccaccgacgccgtgagagacccccag1740

accctggagatcctggacatcaccccctgcagcttcggcggcgtgagcgtgatcaccccc1800

ggcaccaacaccagcaaccaggtggccgtgctgtaccaggacgtgaactgcaccgaggtg1860

cccgtggccatccacgccgaccagctgacccccacctggagagtgtacagcaccggcagc1920

aacgtgttccagaccagagccggctgcctgatcggcgccgagcacgtgaacaacagctac1980

gagtgcgacatccccatcggcgccggcatctgcgccagctaccagacccagaccaacagc2040

cccagaagagccagaagcgtggccagccagagcatcatcgcctacaccatgagcctgggc2100

gccgagaacagcgtggcctacagcaacaacagcatcgccatccccaccaacttcaccatc2160

agcgtgaccaccgagatcctgcccgtgagcatgaccaagaccagcgtggactgcaccatg2220

tacatctgcggcgacagcaccgagtgcagcaacctgctgctgcagtacggcagcttctgc2280

acccagctgaacagagccctgaccggcatcgccgtggagcaggacaagaacacccaggag2340

gtgttcgcccaggtgaagcagatctacaagaccccccccatcaaggacttcggcggcttc2400

aacttcagccagatcctgcccgaccccagcaagcccagcaagagaagcttcatcgaggac2460

ctgctgttcaacaaggtgaccctggccgacgccggcttcatcaagcagtacggcgactgc2520

ctgggcgacatcgccgccagagacctgatctgcgcccagaagttcaacggcctgaccgtg2580

ctgccccccctgctgaccgacgagatgatcgcccagtacaccagcgccctgctggccggc2640

accatcaccagcggctggaccttcggcgccggcgccgccctgcagatccccttcgccatg2700

cagatggcctacagattcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760

aagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagc2820

accgccagcgccctgggcaagctgcaggacgtggtgaaccagaacgcccaggccctgaac2880

accctggtgaagcagctgagcagcaacttcggcgccatcagcagcgtgctgaacgacatc2940

ctgagcagactggacaaggtggaggccgaggtgcagatcgacagactgatcaccggcaga3000

ctgcagagcctgcagacctacgtgacccagcagctgatcagagccgccgagatcagagcc3060

agcgccaacctggccgccaccaagatgagcgagtgcgtgctgggccagagcaagagagtg3120

gacttctgcggcaagggctaccacctgatgagcttcccccagagcgccccccacggcgtg3180

gtgttcctgcacgtgacctacgtgcccgcccaggagaagaacttcaccaccgcccccgcc3240

atctgccacgacggcaaggcccacttccccagagagggcgtgttcgtgagcaacggcacc3300

cactggttcgtgacccagagaaacttctacgagccccagatcatcaccaccgacaacacc3360

ttcgtgagcggcaactgcgacgtggtgatcggcatcgtgaacaacaccgtgtacgacccc3420

ctgcagcccgagctggacagcttcaaggaggagctggacaagtacttcaagaaccacacc3480

agccccgacgtggacctgggcgacatcagcggcatcaacgccagcgtggtgaacatccag3540

aaggagatcgacagactgaacgaggtggccaagaacctgaacgagagcctgatcgacctg3600

caggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttc3660

atcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgcatgaccagctgc3720

tgcagctgcctgaagggctgctgcagctgcggcagctgctgcaagttcgacgaggacgac3780

agcgagcccgtgctgaagggcgtgaagctgcactacacc3819

<210>5

<211>3819

<212>dna

<213>人工序列(artificialsequence)

<400>5

atgttcgtgttcctggtgctgctgcccctggtgagcagccagtgcgtgaacctgaccacc60

cgcacccagctgccccccgcctacaccaacagcttcacccgcggcgtgtactaccccgac120

aaggtgttccgcagcagcgtgctgcacagcacccaggacctgttcctgcccttcttcagc180

aacgtgacctggttccacgccatccacgtgagcggcaccaacggcaccaagcgcttcgac240

aaccccgtgctgcccttcaacgacggcgtgtacttcgccagcaccgagaagagcaacatc300

atccgcggctggatcttcggcaccaccctggacagcaagacccagagcctgctgatcgtg360

aacaacgccaccaacgtggtgatcaaggtgtgcgagttccagttctgcaacgaccccttc420

ctgggcgtgtactaccacaagaacaacaagagctggatggagagcgagttccgcgtgtac480

agcagcgccaacaactgcaccttcgagtacgtgagccagcccttcctgatggacctggag540

ggcaagcagggcaacttcaagaacctgcgcgagttcgtgttcaagaacatcgacggctac600

ttcaagatctacagcaagcacacccccatcaacctggtgcgcgacctgccccagggcttc660

agcgccctggagcccctggtggacctgcccatcggcatcaacatcacccgcttccagacc720

ctgctggccctgcaccgcagctacctgacccccggcgacagcagcagcggctggaccgcc780

ggcgccgccgcctactacgtgggctacctgcagccccgcaccttcctgctgaagtacaac840

gagaacggcaccatcaccgacgccgtggactgcgccctggaccccctgagcgagaccaag900

tgcaccctgaagagcttcaccgtggagaagggcatctaccagaccagcaacttccgcgtg960

cagcccaccgagagcatcgtgcgcttccccaacatcaccaacctgtgccccttcggcgag1020

gtgttcaacgccacccgcttcgccagcgtgtacgcctggaaccgcaagcgcatcagcaac1080

tgcgtggccgactacagcgtgctgtacaacagcgccagcttcagcaccttcaagtgctac1140

ggcgtgagccccaccaagctgaacgacctgtgcttcaccaacgtgtacgccgacagcttc1200

gtgatccgcggcgacgaggtgcgccagatcgcccccggccagaccggcaagatcgccgac1260

tacaactacaagctgcccgacgacttcaccggctgcgtgatcgcctggaacagcaacaac1320

ctggacagcaaggtgggcggcaactacaactacctgtaccgcctgttccgcaagagcaac1380

ctgaagcccttcgagcgcgacatcagcaccgagatctaccaggccggcagcaccccctgc1440

aacggcgtggagggcttcaactgctacttccccctgcagagctacggcttccagcccacc1500

aacggcgtgggctaccagccctaccgcgtggtggtgctgagcttcgagctgctgcacgcc1560

cccgccaccgtgtgcggccccaagaagagcaccaacctggtgaagaacaagtgcgtgaac1620

ttcaacttcaacggcctgaccggcaccggcgtgctgaccgagagcaacaagaagttcctg1680

cccttccagcagttcggccgcgacatcgccgacaccaccgacgccgtgcgcgacccccag1740

accctggagatcctggacatcaccccctgcagcttcggcggcgtgagcgtgatcaccccc1800

ggcaccaacaccagcaaccaggtggccgtgctgtaccaggacgtgaactgcaccgaggtg1860

cccgtggccatccacgccgaccagctgacccccacctggcgcgtgtacagcaccggcagc1920

aacgtgttccagacccgcgccggctgcctgatcggcgccgagcacgtgaacaacagctac1980

gagtgcgacatccccatcggcgccggcatctgcgccagctaccagacccagaccaacagc2040

ccccgccgcgcccgcagcgtggccagccagagcatcatcgcctacaccatgagcctgggc2100

gccgagaacagcgtggcctacagcaacaacagcatcgccatccccaccaacttcaccatc2160

agcgtgaccaccgagatcctgcccgtgagcatgaccaagaccagcgtggactgcaccatg2220

tacatctgcggcgacagcaccgagtgcagcaacctgctgctgcagtacggcagcttctgc2280

acccagctgaaccgcgccctgaccggcatcgccgtggagcaggacaagaacacccaggag2340

gtgttcgcccaggtgaagcagatctacaagaccccccccatcaaggacttcggcggcttc2400

aacttcagccagatcctgcccgaccccagcaagcccagcaagcgcagcttcatcgaggac2460

ctgctgttcaacaaggtgaccctggccgacgccggcttcatcaagcagtacggcgactgc2520

ctgggcgacatcgccgcccgcgacctgatctgcgcccagaagttcaacggcctgaccgtg2580

ctgccccccctgctgaccgacgagatgatcgcccagtacaccagcgccctgctggccggc2640

accatcaccagcggctggaccttcggcgccggcgccgccctgcagatccccttcgccatg2700

cagatggcctaccgcttcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760

aagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagc2820

accgccagcgccctgggcaagctgcaggacgtggtgaaccagaacgcccaggccctgaac2880

accctggtgaagcagctgagcagcaacttcggcgccatcagcagcgtgctgaacgacatc2940

ctgagccgcctggacaaggtggaggccgaggtgcagatcgaccgcctgatcaccggccgc3000

ctgcagagcctgcagacctacgtgacccagcagctgatccgcgccgccgagatccgcgcc3060

agcgccaacctggccgccaccaagatgagcgagtgcgtgctgggccagagcaagcgcgtg3120

gacttctgcggcaagggctaccacctgatgagcttcccccagagcgccccccacggcgtg3180

gtgttcctgcacgtgacctacgtgcccgcccaggagaagaacttcaccaccgcccccgcc3240

atctgccacgacggcaaggcccacttcccccgcgagggcgtgttcgtgagcaacggcacc3300

cactggttcgtgacccagcgcaacttctacgagccccagatcatcaccaccgacaacacc3360

ttcgtgagcggcaactgcgacgtggtgatcggcatcgtgaacaacaccgtgtacgacccc3420

ctgcagcccgagctggacagcttcaaggaggagctggacaagtacttcaagaaccacacc3480

agccccgacgtggacctgggcgacatcagcggcatcaacgccagcgtggtgaacatccag3540

aaggagatcgaccgcctgaacgaggtggccaagaacctgaacgagagcctgatcgacctg3600

caggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttc3660

atcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgcatgaccagctgc3720

tgcagctgcctgaagggctgctgcagctgcggcagctgctgcaagttcgacgaggacgac3780

agcgagcccgtgctgaagggcgtgaagctgcactacacc3819

<210>6

<211>3819

<212>dna

<213>人工序列(artificialsequence)

<400>6

atgttcgtgttcctggtgctcctgcccctggtgagctctcagtgcgtgaacctgacaacc60

cggacacagctgcctcctgcctacaccaactctttcacaagaggcgtctactatcctgat120

aaggtgttcagaagctctgtgctgcattctacccaagatctgttcctgcctttcttcagc180

aatgtgacatggttccacgccatccacgtctctgggactaacggtacaaagagattcgac240

aaccccgtactgcctttcaacgacggcgtttacttcgccagcaccgaaaaatctaacatc300

atcaggggatggatctttggcacaaccctggacagcaagacccaatctctgctgatcgtg360

aacaacgccaccaacgtggtgataaaggtttgtgaattccagttctgcaacgaccccttc420

ctgggcgtgtactaccataagaacaacaagagctggatggaaagcgagttcagagtgtac480

agctccgccaacaactgcacattcgagtacgtgtcccagccttttctgatggacctggaa540

ggcaaacaaggcaacttcaagaacctgagagagttcgtgtttaagaacatcgacggctac600

ttcaagatctactccaagcacacccctatcaacctggttcgggatctgcctcagggcttt660

tctgctctggaacctctggtggacctgccaatcggcatcaacatcacacgcttccagacc720

ttgctcgccctgcacagatcctacctgacccctggcgactcctctagcggatggaccgcc780

ggcgcggccgcatactacgtgggatatctgcagcctagaaccttcctgctgaaatacaac840

gagaatggcaccatcacagacgccgtcgattgcgccctggaccctctgagcgagacaaaa900

tgtaccctgaaaagttttaccgtggaaaagggcatctaccagaccagcaattttagagtg960

cagcccaccgaaagcatcgtgcggttccccaacatcaccaacctgtgccccttcggcgag1020

gtcttcaacgccaccagattcgcctctgtctacgcctggaacagaaagagaatcagcaat1080

tgcgtggccgactacagcgtgctgtacaacagcgccagcttctctacgttcaagtgctac1140

ggcgtaagccctaccaagctgaacgacctgtgcttcaccaacgtgtacgccgactccttt1200

gtgatccggggagacgaggtgcggcagattgcccctggccagaccggcaagatcgctgac1260

tacaactacaagctgcccgatgatttcaccggctgcgtgatcgcttggaacagcaacaac1320

cttgactcaaaggtaggaggcaattacaactacctgtacagactgtttcggaagagcaac1380

ctgaagcctttcgagagagatatctcgacagagatctatcaggccggatctacgccctgt1440

aatggcgttgaaggctttaactgctactttcccctgcagtcttacggctttcagcctacc1500

aatggagttggttaccagccataccgggtggtggtgctcagcttcgagctgctccacgcc1560

ccagctaccgtgtgcggccctaagaagtctaccaacctcgttaagaacaagtgcgtgaac1620

ttcaatttcaacggcctgaccggaaccggcgtgctgaccgagagcaacaaaaagttcctg1680

ccgttccaacagtttggcagagacatcgccgataccacagatgccgttagagatcctcag1740

acactggaaatcctggatatcacaccttgcagcttcggcggagtgagcgtgatcaccccc1800

ggcaccaacacctctaaccaggtggctgtgctgtaccaggacgtgaactgcaccgaggtc1860

cccgtcgccatccacgccgaccaactgacccccacctggcgggtgtacagcaccggcagc1920

aacgtgttccagaccagagccggctgtctgatcggcgccgagcacgtgaacaatagttat1980

gaatgtgacatccccatcggagctggcatttgcgcttcttaccagactcagaccaattct2040

ccacgcagagctcggagcgtggccagccagtccatcatcgcctatactatgagcctgggc2100

gctgagaacagcgtggcatacagcaacaacagcatcgcaatccccaccaattttacaatc2160

agtgtgaccaccgaaatcctgcctgtgagcatgaccaagaccagcgtggactgcaccatg2220

tacatctgcggcgacagcacagagtgcagcaacctgctgctgcagtacggctccttttgc2280

acccagctgaatagagctctgacaggcatcgctgttgaacaggataagaacacccaagag2340

gtgttcgcccaggtaaagcagatctacaagacccctcctatcaaggacttcggcggcttt2400

aacttcagccagatcctgcctgacccaagcaaaccctccaaacggagctttattgaggat2460

ctgctgttcaacaaggtgaccctggccgacgccggattcatcaagcagtacggcgactgc2520

ctgggcgacatcgccgccagagatctgatctgcgcccagaaattcaacgggctgacagtg2580

ctgcctccactgctgaccgatgagatgatcgcccagtatacaagcgccctgctcgctggc2640

acgatcaccagcggatggacattcggagccggcgccgctctgcaaatccctttcgccatg2700

cagatggcctacagattcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760

aagctgatcgctaaccagttcaatagcgccatcgggaagatccaggacagcctgtcatcc2820

acagccagcgccctgggcaagctgcaggacgtggtgaatcaaaacgctcaggcgctgaac2880

acactggtgaagcaactgagcagcaacttcggcgccatcagctcagtgctgaacgatatt2940

ctgtctagactggacaaagtggaggccgaggtgcagatagatagactgatcaccggcaga3000

ctgcagagcctgcaaacctacgtgacccagcagctgatccgggccgccgaaatccgggcc3060

agcgccaatctggcagccactaagatgtctgagtgcgtgctgggccagagcaagcgggtg3120

gacttctgcggcaagggctaccacctgatgagcttcccacaatctgcccctcacggcgtg3180

gtgttcctacacgtgacatacgtgcctgctcaggagaagaatttcacgaccgcccctgct3240

atctgtcacgacggaaaggcccacttccctagagaaggcgtctttgtgagcaacggaaca3300

cactggttcgtgacacagagaaacttctacgagcctcagatcatcacaactgataacaca3360

ttcgtgagcgggaactgcgacgtcgtgatcggcatcgtgaacaataccgtttacgaccct3420

ctgcagcctgagctggactccttcaaagaggaactggataagtacttcaagaaccacacc3480

agcccagacgtcgacctgggcgacattagcggcatcaacgccagcgtggtcaacatccag3540

aaggaaatcgatagactgaacgaggtcgccaagaacctgaatgaaagtttgatcgacctg3600

caggaactgggcaagtacgagcagtacatcaagtggccttggtacatttggctgggattc3660

atcgccggcctgatcgccatcgtgatggtcaccatcatgctgtgttgcatgacaagctgc3720

tgctcctgcctgaagggctgttgttcttgtggaagctgctgtaaattcgacgaggacgat3780

tccgagcccgtgctgaagggcgtgaagctgcactacacc3819

<210>7

<211>3819

<212>dna

<213>人工序列(artificialsequence)

<400>7

atgttcgtgttcctggtgctgctgcccctggtgtcctctcagtgtgtgaacctgaccacc60

agaacacagctgcctccagcctacaccaacagcttcaccagaggcgtgtactaccccgac120

aaggtgttccggtcctccgtgctgcattctacccaggacctgttcctgcctttcttcagc180

aacgtgacctggttccacgccatccatgtgtctggcaccaacggcaccaagagattcgac240

aaccccgtgctgcctttcaacgacggggtgtactttgcctccaccgagaagtccaacatc300

atcagaggctggatcttcggcaccacactggacagcaagacccagagcctgctgatcgtg360

aacaacgccaccaacgtggtcatcaaagtgtgcgagttccagttctgcaacgaccccttc420

ctgggcgtctactaccacaagaacaacaagtcctggatggaatccgagttccgggtgtac480

tcctccgccaacaactgcaccttcgagtacgtgtcccagcctttcctgatggacctggaa540

ggcaagcagggcaacttcaagaacctgcgcgagttcgtgtttaagaacatcgacggctac600

ttcaagatctactccaagcacacccctatcaacctcgtgcgggatctgcctcagggcttc660

tctgctctggaacccctggtggatctgcccatcggcatcaacatcacccggtttcagacc720

ctgctggccctgcaccggtcttatttgacccctggcgactcctcttctggctggactgct780

ggtgccgctgcttactacgtgggctacctgcagcctagaaccttcctgctgaagtacaac840

gagaatggcaccatcaccgacgccgtggactgtgctctggatcctctgtccgagacaaag900

tgcaccctgaagtccttcaccgtggaaaagggcatctaccagacctccaacttccgggtg960

cagcccaccgagtctatcgtgcggttccctaacatcaccaacctgtgtcctttcggcgag1020

gtgttcaatgccaccagattcgcctctgtgtacgcctggaaccggaagcggatctctaac1080

tgcgtggccgactacagcgtgctgtacaactccgcctccttcagcaccttcaagtgctac1140

ggcgtgtcccctaccaagctgaacgacctgtgcttcacaaacgtgtacgccgactccttc1200

gtgatccggggagatgaagtgcggcagatcgctcctggacagaccggcaagatcgccgat1260

tacaactacaagctgcccgacgacttcaccggctgtgtgatcgcttggaactccaacaac1320

ctggactccaaagtcggcggcaactacaactacctgtaccggctgttccggaagtctaac1380

ctgaagcctttcgagcgggacatcagcaccgagatctaccaggctggcagcaccccttgt1440

aacggcgtggaaggcttcaactgctacttcccactgcagtcctacggctttcagcctacc1500

aatggcgtgggctatcagccctacagagtggtggtgctgtccttcgagctgctgcatgct1560

cctgctaccgtgtgcggccctaagaaatctaccaacctggtcaagaacaaatgcgtgaac1620

ttcaacttcaacggcctgaccggcaccggcgtgctgacagagtccaacaagaagttcctg1680

ccattccagcagttcggccgggatatcgccgataccacagatgccgtcagggaccctcag1740

acactggaaatcctggacatcaccccttgcagcttcggcggagtgtctgtgatcacccca1800

ggcaccaacacctctaaccaggtggccgtgctgtatcaggacgtgaactgtaccgaggtg1860

cccgtggctatccatgccgatcagctgacccctacatggcgcgtgtactccaccggctcc1920

aacgtgttccagacaagagctggctgtctgatcggcgctgagcacgtgaacaattcctac1980

gagtgcgacatccccatcggagccggaatctgcgcctcttatcagacccagaccaactct2040

cccagacgggccagatctgtggccagccagtctatcattgcttacaccatgagcctgggc2100

gccgagaactctgtggcctacagcaacaactctatcgctatccccaccaacttcaccatc2160

tccgtgaccacagagatcctgcctgtgtccatgaccaagaccagcgtggactgcaccatg2220

tacatctgcggcgactctaccgagtgctccaacctgctgctgcagtacggctccttctgc2280

acccagctgaatagagccctgaccggaatcgccgtggaacaggacaagaacacccaagag2340

gtgttcgcccaagtgaagcagatctacaagacccctcctatcaaggacttcggcggcttc2400

aatttctcccagattctgcccgatcctagcaagccctccaagcggtctttcatcgaggac2460

ctgctgttcaacaaagtgacactggccgacgccggcttcatcaagcagtatggcgattgc2520

ctgggcgacattgccgccagggatctgatctgtgcccagaagtttaacggactgacagtg2580

ctgcctcctctgctgaccgatgagatgatcgcccagtacacctccgcactgctggctggc2640

acaatcacctctggatggacatttggcgctggcgccgctctgcagatccctttcgctatg2700

cagatggcctaccggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccag2760

aagctgatcgccaaccagttcaacagcgccatcggaaagatccaggacagcctgtccagc2820

accgcttctgccctgggaaagctgcaggatgtggtcaaccagaacgctcaggccctgaac2880

accctcgtgaagcagctgtcctctaacttcggcgccatctcctctgtgctgaacgatatc2940

ctgagccggctggacaaggtggaagccgaggtgcagatcgacagactgatcaccggacgg3000

ctgcagtccctgcagacctatgttacccagcagctgatcagagccgccgagattagagcc3060

tctgccaatctggccgccaccaagatgtctgagtgtgtgctgggccagtccaagagagtg3120

gacttttgcggcaagggctaccacctgatgagcttccctcagtctgctcctcacggcgtg3180

gtgtttctgcacgtgacctacgtgcccgctcaagagaagaactttaccaccgctcctgcc3240

atctgccacgacggcaaggctcactttcctcgagaaggcgtgttcgtgtctaacggcacc3300

cattggttcgtgacacagcggaacttctacgagccccagatcatcaccaccgacaacacc3360

tttgtgtccggcaactgcgacgtcgtgatcggaattgtgaacaataccgtgtacgaccct3420

ctgcagcccgagctggactccttcaaagaggaactggacaagtactttaagaaccacaca3480

agccccgacgtggacctgggagacatctctggcatcaacgcctccgtggtcaacatccag3540

aaagagatcgaccggctgaacgaggtggccaagaatctgaacgagtccctgatcgacctg3600

caagaactggggaagtacgagcagtacatcaagtggccctggtacatctggctgggcttt3660

atcgctggcctgatcgctatcgtgatggtcacaatcatgctgtgctgtatgacctcctgc3720

tgctcttgcctgaagggctgctgttcttgcggctcttgctgcaagttcgacgaggacgac3780

tctgagcccgtgctgaaaggcgtgaagctgcactacacc3819

<210>8

<211>3708

<212>dna

<213>人工序列(artificialsequence)

<400>8

atgttcgtgttcctggtgctgctgcccctggtgagcagccagtgcgtgaacctgaccacc60

cgcacccagctgccccccgcctacaccaacagcttcacccgcggcgtgtactaccccgac120

aaggtgttccgcagcagcgtgctgcacagcacccaggacctgttcctgcccttcttcagc180

aacgtgacctggttccacgccatccacgtgagcggcaccaacggcaccaagcgcttcgac240

aaccccgtgctgcccttcaacgacggcgtgtacttcgccagcaccgagaagagcaacatc300

atccgcggctggatcttcggcaccaccctggacagcaagacccagagcctgctgatcgtg360

aacaacgccaccaacgtggtgatcaaggtgtgcgagttccagttctgcaacgaccccttc420

ctgggcgtgtactaccacaagaacaacaagagctggatggagagcgagttccgcgtgtac480

agcagcgccaacaactgcaccttcgagtacgtgagccagcccttcctgatggacctggag540

ggcaagcagggcaacttcaagaacctgcgcgagttcgtgttcaagaacatcgacggctac600

ttcaagatctacagcaagcacacccccatcaacctggtgcgcgacctgccccagggcttc660

agcgccctggagcccctggtggacctgcccatcggcatcaacatcacccgcttccagacc720

ctgctggccctgcaccgcagctacctgacccccggcgacagcagcagcggctggaccgcc780

ggcgccgccgcctactacgtgggctacctgcagccccgcaccttcctgctgaagtacaac840

gagaacggcaccatcaccgacgccgtggactgcgccctggaccccctgagcgagaccaag900

tgcaccctgaagagcttcaccgtggagaagggcatctaccagaccagcaacttccgcgtg960

cagcccaccgagagcatcgtgcgcttccccaacatcaccaacctgtgccccttcggcgag1020

gtgttcaacgccacccgcttcgccagcgtgtacgcctggaaccgcaagcgcatcagcaac1080

tgcgtggccgactacagcgtgctgtacaacagcgccagcttcagcaccttcaagtgctac1140

ggcgtgagccccaccaagctgaacgacctgtgcttcaccaacgtgtacgccgacagcttc1200

gtgatccgcggcgacgaggtgcgccagatcgcccccggccagaccggcaagatcgccgac1260

tacaactacaagctgcccgacgacttcaccggctgcgtgatcgcctggaacagcaacaac1320

ctggacagcaaggtgggcggcaactacaactacctgtaccgcctgttccgcaagagcaac1380

ctgaagcccttcgagcgcgacatcagcaccgagatctaccaggccggcagcaccccctgc1440

aacggcgtggagggcttcaactgctacttccccctgcagagctacggcttccagcccacc1500

aacggcgtgggctaccagccctaccgcgtggtggtgctgagcttcgagctgctgcacgcc1560

cccgccaccgtgtgcggccccaagaagagcaccaacctggtgaagaacaagtgcgtgaac1620

ttcaacttcaacggcctgaccggcaccggcgtgctgaccgagagcaacaagaagttcctg1680

cccttccagcagttcggccgcgacatcgccgacaccaccgacgccgtgcgcgacccccag1740

accctggagatcctggacatcaccccctgcagcttcggcggcgtgagcgtgatcaccccc1800

ggcaccaacaccagcaaccaggtggccgtgctgtaccaggacgtgaactgcaccgaggtg1860

cccgtggccatccacgccgaccagctgacccccacctggcgcgtgtacagcaccggcagc1920

aacgtgttccagacccgcgccggctgcctgatcggcgccgagcacgtgaacaacagctac1980

gagtgcgacatccccatcggcgccggcatctgcgccagctaccagacccagaccaacagc2040

cccggcagcgccagcagcgtggccagccagagcatcatcgcctacaccatgagcctgggc2100

gccgagaacagcgtggcctacagcaacaacagcatcgccatccccaccaacttcaccatc2160

agcgtgaccaccgagatcctgcccgtgagcatgaccaagaccagcgtggactgcaccatg2220

tacatctgcggcgacagcaccgagtgcagcaacctgctgctgcagtacggcagcttctgc2280

acccagctgaaccgcgccctgaccggcatcgccgtggagcaggacaagaacacccaggag2340

gtgttcgcccaggtgaagcagatctacaagaccccccccatcaaggacttcggcggcttc2400

aacttcagccagatcctgcccgaccccagcaagcccagcaagcgcagcttcatcgaggac2460

ctgctgttcaacaaggtgaccctggccgacgccggcttcatcaagcagtacggcgactgc2520

ctgggcgacatcgccgcccgcgacctgatctgcgcccagaagttcaacggcctgaccgtg2580

ctgccccccctgctgaccgacgagatgatcgcccagtacaccagcgccctgctggccggc2640

accatcaccagcggctggaccttcggcgccggcgccgccctgcagatccccttcgccatg2700

cagatggcctaccgcttcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760

aagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagc2820

accgccagcgccctgggcaagctgcaggacgtggtgaaccagaacgcccaggccctgaac2880

accctggtgaagcagctgagcagcaacttcggcgccatcagcagcgtgctgaacgacatc2940

ctgagccgcctggacgtgaaggaggccgaggtgcagatcgaccgcctgatcaccggccgc3000

ctgcagagcctgcagacctacgtgacccagcagctgatccgcgccgccgagatccgcgcc3060

agcgccaacctggccgccaccaagatgagcgagtgcgtgctgggccagagcaagcgcgtg3120

gacttctgcggcaagggctaccacctgatgagcttcccccagagcgccccccacggcgtg3180

gtgttcctgcacgtgacctacgtgcccgcccaggagaagaacttcaccaccgcccccgcc3240

atctgccacgacggcaaggcccacttcccccgcgagggcgtgttcgtgagcaacggcacc3300

cactggttcgtgacccagcgcaacttctacgagccccagatcatcaccaccgacaacacc3360

ttcgtgagcggcaactgcgacgtggtgatcggcatcgtgaacaacaccgtgtacgacccc3420

ctgcagcccgagctggacagcttcaaggaggagctggacaagtacttcaagaaccacacc3480

agccccgacgtggacctgggcgacatcagcggcatcaacgccagcgtggtgaacatccag3540

aaggagatcgaccgcctgaacgaggtggccaagaacctgaacgagagcctgatcgacctg3600

caggagctgggcaagtacgagcagggctacatccccgaggccccccgcgacggccaggcc3660

tacgtgcgcaaggacggcgagtgggtgctgctgagcaccttcctgtga3708

<210>9

<211>1235

<212>prt

<213>人工序列(artificialsequence)

<400>9

metphevalpheleuvalleuleuproleuvalserserglncysval

151015

asnleuthrthrargthrglnleuproproalatyrthrasnserphe

202530

thrargglyvaltyrtyrproasplysvalpheargserservalleu

354045

hisserthrglnaspleupheleuprophepheserasnvalthrtrp

505560

phehisalailehisvalserglythrasnglythrlysargpheasp

65707580

asnprovalleupropheasnaspglyvaltyrphealaserthrglu

859095

lysserasnileileargglytrpilepheglythrthrleuaspser

100105110

lysthrglnserleuleuilevalasnasnalathrasnvalvalile

115120125

lysvalcysglupheglnphecysasnasppropheleuglyvaltyr

130135140

tyrhislysasnasnlyssertrpmetgluserglupheargvaltyr

145150155160

serseralaasnasncysthrpheglutyrvalserglnpropheleu

165170175

metaspleugluglylysglnglyasnphelysasnleuarggluphe

180185190

valphelysasnileaspglytyrphelysiletyrserlyshisthr

195200205

proileasnleuvalargaspleuproglnglypheseralaleuglu

210215220

proleuvalaspleuproileglyileasnilethrargpheglnthr

225230235240

leuleualaleuhisargsertyrleuthrproglyaspserserser

245250255

glytrpthralaglyalaalaalatyrtyrvalglytyrleuglnpro

260265270

argthrpheleuleulystyrasngluasnglythrilethraspala

275280285

valaspcysalaleuaspproleusergluthrlyscysthrleulys

290295300

serphethrvalglulysglyiletyrglnthrserasnpheargval

305310315320

glnprothrgluserilevalargpheproasnilethrasnleucys

325330335

propheglygluvalpheasnalathrargphealaservaltyrala

340345350

trpasnarglysargileserasncysvalalaasptyrservalleu

355360365

tyrasnseralaserpheserthrphelyscystyrglyvalserpro

370375380

thrlysleuasnaspleucysphethrasnvaltyralaaspserphe

385390395400

valileargglyaspgluvalargglnilealaproglyglnthrgly

405410415

lysilealaasptyrasntyrlysleuproaspaspphethrglycys

420425430

valilealatrpasnserasnasnleuaspserlysvalglyglyasn

435440445

tyrasntyrleutyrargleuphearglysserasnleulysprophe

450455460

gluargaspileserthrgluiletyrglnalaglyserthrprocys

465470475480

asnglyvalgluglypheasncystyrpheproleuglnsertyrgly

485490495

pheglnprothrasnglyvalglytyrglnprotyrargvalvalval

500505510

leuserphegluleuleuhisalaproalathrvalcysglyprolys

515520525

lysserthrasnleuvallysasnlyscysvalasnpheasnpheasn

530535540

glyleuthrglythrglyvalleuthrgluserasnlyslyspheleu

545550555560

propheglnglnpheglyargaspilealaaspthrthraspalaval

565570575

argaspproglnthrleugluileleuaspilethrprocysserphe

580585590

glyglyvalservalilethrproglythrasnthrserasnglnval

595600605

alavalleutyrglnaspvalasncysthrgluvalprovalalaile

610615620

hisalaaspglnleuthrprothrtrpargvaltyrserthrglyser

625630635640

asnvalpheglnthrargalaglycysleuileglyalagluhisval

645650655

asnasnsertyrglucysaspileproileglyalaglyilecysala

660665670

sertyrglnthrglnthrasnserproglyseralaserservalala

675680685

serglnserileilealatyrthrmetserleuglyalagluasnser

690695700

valalatyrserasnasnserilealaileprothrasnphethrile

705710715720

servalthrthrgluileleuprovalsermetthrlysthrserval

725730735

aspcysthrmettyrilecysglyaspserthrglucysserasnleu

740745750

leuleuglntyrglyserphecysthrglnleuasnargalaleuthr

755760765

glyilealavalgluglnasplysasnthrglngluvalphealagln

770775780

vallysglniletyrlysthrproproilelysasppheglyglyphe

785790795800

asnpheserglnileleuproaspproserlysproserlysargser

805810815

pheilegluaspleuleupheasnlysvalthrleualaaspalagly

820825830

pheilelysglntyrglyaspcysleuglyaspilealaalaargasp

835840845

leuilecysalaglnlyspheasnglyleuthrvalleuproproleu

850855860

leuthraspglumetilealaglntyrthrseralaleuleualagly

865870875880

thrilethrserglytrpthrpheglyalaglyalaalaleuglnile

885890895

prophealametglnmetalatyrargpheasnglyileglyvalthr

900905910

glnasnvalleutyrgluasnglnlysleuilealaasnglnpheasn

915920925

seralaileglylysileglnaspserleuserserthralaserala

930935940

leuglylysleuglnaspvalvalasnglnasnalaglnalaleuasn

945950955960

thrleuvallysglnleuserserasnpheglyalaileserserval

965970975

leuasnaspileleuserargleuaspproproglualagluvalgln

980985990

ileaspargleuilethrglyargleuglnserleuglnthrtyrval

99510001005

thrglnglnleuileargalaalagluileargalaseralaasnleu

101010151020

alaalathrlysmetserglucysvalleuglyglnserlysargval

1025103010351040

aspphecysglylysglytyrhisleumetserpheproglnserala

104510501055

prohisglyvalvalpheleuhisvalthrtyrvalproalaglnglu

106010651070

lysasnphethrthralaproalailecyshisaspglylysalahis

107510801085

pheproarggluglyvalphevalserasnglythrhistrppheval

109010951100

thrglnargasnphetyrgluproglnileilethrthraspasnthr

1105111011151120

phevalserglyasncysaspvalvalileglyilevalasnasnthr

112511301135

valtyraspproleuglnprogluleuaspserphelysglugluleu

114011451150

asplystyrphelysasnhisthrserproaspvalaspleuglyasp

115511601165

ileserglyileasnalaservalvalasnileglnlysgluileasp

117011751180

argleuasngluvalalalysasnleuasngluserleuileaspleu

1185119011951200

glngluleuglylystyrgluglnglytyrileproglualaproarg

120512101215

aspglyglnalatyrvalarglysaspglyglutrpvalleuleuser

122012251230

thrpheleu

1235

<210>10

<211>3735

<212>dna

<213>人工序列(artificialsequence)

<400>10

atggacgccatgaagcgcggcctgtgctgcgtgctgctgctgtgcggcgccgtgttcgtg60

agcgcccagtgcgtgaacctgaccacccgcacccagctgccccccgcctacaccaacagc120

ttcacccgcggcgtgtactaccccgacaaggtgttccgcagcagcgtgctgcacagcacc180

caggacctgttcctgcccttcttcagcaacgtgacctggttccacgccatccacgtgagc240

ggcaccaacggcaccaagcgcttcgacaaccccgtgctgcccttcaacgacggcgtgtac300

ttcgccagcaccgagaagagcaacatcatccgcggctggatcttcggcaccaccctggac360

agcaagacccagagcctgctgatcgtgaacaacgccaccaacgtggtgatcaaggtgtgc420

gagttccagttctgcaacgaccccttcctgggcgtgtactaccacaagaacaacaagagc480

tggatggagagcgagttccgcgtgtacagcagcgccaacaactgcaccttcgagtacgtg540

agccagcccttcctgatggacctggagggcaagcagggcaacttcaagaacctgcgcgag600

ttcgtgttcaagaacatcgacggctacttcaagatctacagcaagcacacccccatcaac660

ctggtgcgcgacctgccccagggcttcagcgccctggagcccctggtggacctgcccatc720

ggcatcaacatcacccgcttccagaccctgctggccctgcaccgcagctacctgaccccc780

ggcgacagcagcagcggctggaccgccggcgccgccgcctactacgtgggctacctgcag840

ccccgcaccttcctgctgaagtacaacgagaacggcaccatcaccgacgccgtggactgc900

gccctggaccccctgagcgagaccaagtgcaccctgaagagcttcaccgtggagaagggc960

atctaccagaccagcaacttccgcgtgcagcccaccgagagcatcgtgcgcttccccaac1020

atcaccaacctgtgccccttcggcgaggtgttcaacgccacccgcttcgccagcgtgtac1080

gcctggaaccgcaagcgcatcagcaactgcgtggccgactacagcgtgctgtacaacagc1140

gccagcttcagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacctgtgc1200

ttcaccaacgtgtacgccgacagcttcgtgatccgcggcgacgaggtgcgccagatcgcc1260

cccggccagaccggcaagatcgccgactacaactacaagctgcccgacgacttcaccggc1320

tgcgtgatcgcctggaacagcaacaacctggacagcaaggtgggcggcaactacaactac1380

ctgtaccgcctgttccgcaagagcaacctgaagcccttcgagcgcgacatcagcaccgag1440

atctaccaggccggcagcaccccctgcaacggcgtggagggcttcaactgctacttcccc1500

ctgcagagctacggcttccagcccaccaacggcgtgggctaccagccctaccgcgtggtg1560

gtgctgagcttcgagctgctgcacgcccccgccaccgtgtgcggccccaagaagagcacc1620

aacctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcaccggcgtg1680

ctgaccgagagcaacaagaagttcctgcccttccagcagttcggccgcgacatcgccgac1740

accaccgacgccgtgcgcgacccccagaccctggagatcctggacatcaccccctgcagc1800

ttcggcggcgtgagcgtgatcacccccggcaccaacaccagcaaccaggtggccgtgctg1860

taccaggacgtgaactgcaccgaggtgcccgtggccatccacgccgaccagctgaccccc1920

acctggcgcgtgtacagcaccggcagcaacgtgttccagacccgcgccggctgcctgatc1980

ggcgccgagcacgtgaacaacagctacgagtgcgacatccccatcggcgccggcatctgc2040

gccagctaccagacccagaccaacagccccggcagcgccagcagcgtggccagccagagc2100

atcatcgcctacaccatgagcctgggcgccgagaacagcgtggcctacagcaacaacagc2160

atcgccatccccaccaacttcaccatcagcgtgaccaccgagatcctgcccgtgagcatg2220

accaagaccagcgtggactgcaccatgtacatctgcggcgacagcaccgagtgcagcaac2280

ctgctgctgcagtacggcagcttctgcacccagctgaaccgcgccctgaccggcatcgcc2340

gtggagcaggacaagaacacccaggaggtgttcgcccaggtgaagcagatctacaagacc2400

ccccccatcaaggacttcggcggcttcaacttcagccagatcctgcccgaccccagcaag2460

cccagcaagcgcagcttcatcgaggacctgctgttcaacaaggtgaccctggccgacgcc2520

ggcttcatcaagcagtacggcgactgcctgggcgacatcgccgcccgcgacctgatctgc2580

gcccagaagttcaacggcctgaccgtgctgccccccctgctgaccgacgagatgatcgcc2640

cagtacaccagcgccctgctggccggcaccatcaccagcggctggaccttcggcgccggc2700

gccgccctgcagatccccttcgccatgcagatggcctaccgcttcaacggcatcggcgtg2760

acccagaacgtgctgtacgagaaccagaagctgatcgccaaccagttcaacagcgccatc2820

ggcaagatccaggacagcctgagcagcaccgccagcgccctgggcaagctgcaggacgtg2880

gtgaaccagaacgcccaggccctgaacaccctggtgaagcagctgagcagcaacttcggc2940

gccatcagcagcgtgctgaacgacatcctgagccgcctggacgtgaaggaggccgaggtg3000

cagatcgaccgcctgatcaccggccgcctgcagagcctgcagacctacgtgacccagcag3060

ctgatccgcgccgccgagatccgcgccagcgccaacctggccgccaccaagatgagcgag3120

tgcgtgctgggccagagcaagcgcgtggacttctgcggcaagggctaccacctgatgagc3180

ttcccccagagcgccccccacggcgtggtgttcctgcacgtgacctacgtgcccgcccag3240

gagaagaacttcaccaccgcccccgccatctgccacgacggcaaggcccacttcccccgc3300

gagggcgtgttcgtgagcaacggcacccactggttcgtgacccagcgcaacttctacgag3360

ccccagatcatcaccaccgacaacaccttcgtgagcggcaactgcgacgtggtgatcggc3420

atcgtgaacaacaccgtgtacgaccccctgcagcccgagctggacagcttcaaggaggag3480

ctggacaagtacttcaagaaccacaccagccccgacgtggacctgggcgacatcagcggc3540

atcaacgccagcgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggccaag3600

aacctgaacgagagcctgatcgacctgcaggagctgggcaagtacgagcagggctacatc3660

cccgaggccccccgcgacggccaggcctacgtgcgcaaggacggcgagtgggtgctgctg3720

agcaccttcctgtga3735

<210>11

<211>1244

<212>prt

<213>人工序列(artificialsequence)

<400>11

metaspalametlysargglyleucyscysvalleuleuleucysgly

151015

alavalphevalseralaglncysvalasnleuthrthrargthrgln

202530

leuproproalatyrthrasnserphethrargglyvaltyrtyrpro

354045

asplysvalpheargserservalleuhisserthrglnaspleuphe

505560

leuprophepheserasnvalthrtrpphehisalailehisvalser

65707580

glythrasnglythrlysargpheaspasnprovalleupropheasn

859095

aspglyvaltyrphealaserthrglulysserasnileilearggly

100105110

trpilepheglythrthrleuaspserlysthrglnserleuleuile

115120125

valasnasnalathrasnvalvalilelysvalcysglupheglnphe

130135140

cysasnasppropheleuglyvaltyrtyrhislysasnasnlysser

145150155160

trpmetgluserglupheargvaltyrserseralaasnasncysthr

165170175

pheglutyrvalserglnpropheleumetaspleugluglylysgln

180185190

glyasnphelysasnleuarggluphevalphelysasnileaspgly

195200205

tyrphelysiletyrserlyshisthrproileasnleuvalargasp

210215220

leuproglnglypheseralaleugluproleuvalaspleuproile

225230235240

glyileasnilethrargpheglnthrleuleualaleuhisargser

245250255

tyrleuthrproglyaspserserserglytrpthralaglyalaala

260265270

alatyrtyrvalglytyrleuglnproargthrpheleuleulystyr

275280285

asngluasnglythrilethraspalavalaspcysalaleuasppro

290295300

leusergluthrlyscysthrleulysserphethrvalglulysgly

305310315320

iletyrglnthrserasnpheargvalglnprothrgluserileval

325330335

argpheproasnilethrasnleucyspropheglygluvalpheasn

340345350

alathrargphealaservaltyralatrpasnarglysargileser

355360365

asncysvalalaasptyrservalleutyrasnseralaserpheser

370375380

thrphelyscystyrglyvalserprothrlysleuasnaspleucys

385390395400

phethrasnvaltyralaaspserphevalileargglyaspgluval

405410415

argglnilealaproglyglnthrglylysilealaasptyrasntyr

420425430

lysleuproaspaspphethrglycysvalilealatrpasnserasn

435440445

asnleuaspserlysvalglyglyasntyrasntyrleutyrargleu

450455460

phearglysserasnleulysprophegluargaspileserthrglu

465470475480

iletyrglnalaglyserthrprocysasnglyvalgluglypheasn

485490495

cystyrpheproleuglnsertyrglypheglnprothrasnglyval

500505510

glytyrglnprotyrargvalvalvalleuserphegluleuleuhis

515520525

alaproalathrvalcysglyprolyslysserthrasnleuvallys

530535540

asnlyscysvalasnpheasnpheasnglyleuthrglythrglyval

545550555560

leuthrgluserasnlyslyspheleupropheglnglnpheglyarg

565570575

aspilealaaspthrthraspalavalargaspproglnthrleuglu

580585590

ileleuaspilethrprocysserpheglyglyvalservalilethr

595600605

proglythrasnthrserasnglnvalalavalleutyrglnaspval

610615620

asncysthrgluvalprovalalailehisalaaspglnleuthrpro

625630635640

thrtrpargvaltyrserthrglyserasnvalpheglnthrargala

645650655

glycysleuileglyalagluhisvalasnasnsertyrglucysasp

660665670

ileproileglyalaglyilecysalasertyrglnthrglnthrasn

675680685

serproglyseralaserservalalaserglnserileilealatyr

690695700

thrmetserleuglyalagluasnservalalatyrserasnasnser

705710715720

ilealaileprothrasnphethrileservalthrthrgluileleu

725730735

provalsermetthrlysthrservalaspcysthrmettyrilecys

740745750

glyaspserthrglucysserasnleuleuleuglntyrglyserphe

755760765

cysthrglnleuasnargalaleuthrglyilealavalgluglnasp

770775780

lysasnthrglngluvalphealaglnvallysglniletyrlysthr

785790795800

proproilelysasppheglyglypheasnpheserglnileleupro

805810815

aspproserlysproserlysargserpheilegluaspleuleuphe

820825830

asnlysvalthrleualaaspalaglypheilelysglntyrglyasp

835840845

cysleuglyaspilealaalaargaspleuilecysalaglnlysphe

850855860

asnglyleuthrvalleuproproleuleuthraspglumetileala

865870875880

glntyrthrseralaleuleualaglythrilethrserglytrpthr

885890895

pheglyalaglyalaalaleuglnileprophealametglnmetala

900905910

tyrargpheasnglyileglyvalthrglnasnvalleutyrgluasn

915920925

glnlysleuilealaasnglnpheasnseralaileglylysilegln

930935940

aspserleuserserthralaseralaleuglylysleuglnaspval

945950955960

valasnglnasnalaglnalaleuasnthrleuvallysglnleuser

965970975

serasnpheglyalaileserservalleuasnaspileleuserarg

980985990

leuaspproproglualagluvalglnileaspargleuilethrgly

99510001005

argleuglnserleuglnthrtyrvalthrglnglnleuileargala

101010151020

alagluileargalaseralaasnleualaalathrlysmetserglu

1025103010351040

cysvalleuglyglnserlysargvalaspphecysglylysglytyr

104510501055

hisleumetserpheproglnseralaprohisglyvalvalpheleu

106010651070

hisvalthrtyrvalproalaglnglulysasnphethrthralapro

107510801085

alailecyshisaspglylysalahispheproarggluglyvalphe

109010951100

valserasnglythrhistrpphevalthrglnargasnphetyrglu

1105111011151120

proglnileilethrthraspasnthrphevalserglyasncysasp

112511301135

valvalileglyilevalasnasnthrvaltyraspproleuglnpro

114011451150

gluleuaspserphelysglugluleuasplystyrphelysasnhis

115511601165

thrserproaspvalaspleuglyaspileserglyileasnalaser

117011751180

valvalasnileglnlysgluileaspargleuasngluvalalalys

1185119011951200

asnleuasngluserleuileaspleuglngluleuglylystyrglu

120512101215

glnglytyrileproglualaproargaspglyglnalatyrvalarg

122012251230

lysaspglyglutrpvalleuleuserthrpheleu

12351240

<210>12

<211>3729

<212>dna

<213>人工序列(artificialsequence)

<400>12

atggacgccatgaagcgcggcctgtgctgcgtgctgctgctgtgcggcgccgtgttcgtg60

agcgcccagtgcgtgaacctgaccacccgcacccagctgccccccgcctacaccaacagc120

ttcacccgcggcgtgtactaccccgacaaggtgttccgcagcagcgtgctgcacagcacc180

caggacctgttcctgcccttcttcagcaacgtgacctggttccacgccatccacgtgagc240

ggcaccaacggcaccaagcgcttcgacaaccccgtgctgcccttcaacgacggcgtgtac300

ttcgccagcaccgagaagagcaacatcatccgcggctggatcttcggcaccaccctggac360

agcaagacccagagcctgctgatcgtgaacaacgccaccaacgtggtgatcaaggtgtgc420

gagttccagttctgcaacgaccccttcctgggcgtgtactaccacaagaacaacaagagc480

tggatggagagcgagttccgcgtgtacagcagcgccaacaactgcaccttcgagtacgtg540

agccagcccttcctgatggacctggagggcaagcagggcaacttcaagaacctgcgcgag600

ttcgtgttcaagaacatcgacggctacttcaagatctacagcaagcacacccccatcaac660

ctggtgcgcgacctgccccagggcttcagcgccctggagcccctggtggacctgcccatc720

ggcatcaacatcacccgcttccagaccctgctggccctgcaccgcagctacctgaccccc780

ggcgacagcagcagcggctggaccgccggcgccgccgcctactacgtgggctacctgcag840

ccccgcaccttcctgctgaagtacaacgagaacggcaccatcaccgacgccgtggactgc900

gccctggaccccctgagcgagaccaagtgcaccctgaagagcttcaccgtggagaagggc960

atctaccagaccagcaacttccgcgtgcagcccaccgagagcatcgtgcgcttccccaac1020

atcaccaacctgtgccccttcggcgaggtgttcaacgccacccgcttcgccagcgtgtac1080

gcctggaaccgcaagcgcatcagcaactgcgtggccgactacagcgtgctgtacaacagc1140

gccagcttcagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacctgtgc1200

ttcaccaacgtgtacgccgacagcttcgtgatccgcggcgacgaggtgcgccagatcgcc1260

cccggccagaccggcaagatcgccgactacaactacaagctgcccgacgacttcaccggc1320

tgcgtgatcgcctggaacagcaacaacctggacagcaaggtgggcggcaactacaactac1380

ctgtaccgcctgttccgcaagagcaacctgaagcccttcgagcgcgacatcagcaccgag1440

atctaccaggccggcagcaccccctgcaacggcgtggagggcttcaactgctacttcccc1500

ctgcagagctacggcttccagcccaccaacggcgtgggctaccagccctaccgcgtggtg1560

gtgctgagcttcgagctgctgcacgcccccgccaccgtgtgcggccccaagaagagcacc1620

aacctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcaccggcgtg1680

ctgaccgagagcaacaagaagttcctgcccttccagcagttcggccgcgacatcgccgac1740

accaccgacgccgtgcgcgacccccagaccctggagatcctggacatcaccccctgcagc1800

ttcggcggcgtgagcgtgatcacccccggcaccaacaccagcaaccaggtggccgtgctg1860

taccaggacgtgaactgcaccgaggtgcccgtggccatccacgccgaccagctgaccccc1920

acctggcgcgtgtacagcaccggcagcaacgtgttccagacccgcgccggctgcctgatc1980

ggcgccgagcacgtgaacaacagctacgagtgcgacatccccatcggcgccggcatctgc2040

gccagctaccagacccagaccaacagccccggcggcagcgtggccagccagagcatcatc2100

gcctacaccatgagcctgggcgccgagaacagcgtggcctacagcaacaacagcatcgcc2160

atccccaccaacttcaccatcagcgtgaccaccgagatcctgcccgtgagcatgaccaag2220

accagcgtggactgcaccatgtacatctgcggcgacagcaccgagtgcagcaacctgctg2280

ctgcagtacggcagcttctgcacccagctgaaccgcgccctgaccggcatcgccgtggag2340

caggacaagaacacccaggaggtgttcgcccaggtgaagcagatctacaagacccccccc2400

atcaaggacttcggcggcttcaacttcagccagatcctgcccgaccccagcaagcccagc2460

aagcgcagcttcatcgaggacctgctgttcaacaaggtgaccctggccgacgccggcttc2520

atcaagcagtacggcgactgcctgggcgacatcgccgcccgcgacctgatctgcgcccag2580

aagttcaacggcctgaccgtgctgccccccctgctgaccgacgagatgatcgcccagtac2640

accagcgccctgctggccggcaccatcaccagcggctggaccttcggcgccggcgccgcc2700

ctgcagatccccttcgccatgcagatggcctaccgcttcaacggcatcggcgtgacccag2760

aacgtgctgtacgagaaccagaagctgatcgccaaccagttcaacagcgccatcggcaag2820

atccaggacagcctgagcagcaccgccagcgccctgggcaagctgcaggacgtggtgaac2880

cagaacgcccaggccctgaacaccctggtgaagcagctgagcagcaacttcggcgccatc2940

agcagcgtgctgaacgacatcctgagccgcctggacgtgaaggaggccgaggtgcagatc3000

gaccgcctgatcaccggccgcctgcagagcctgcagacctacgtgacccagcagctgatc3060

cgcgccgccgagatccgcgccagcgccaacctggccgccaccaagatgagcgagtgcgtg3120

ctgggccagagcaagcgcgtggacttctgcggcaagggctaccacctgatgagcttcccc3180

cagagcgccccccacggcgtggtgttcctgcacgtgacctacgtgcccgcccaggagaag3240

aacttcaccaccgcccccgccatctgccacgacggcaaggcccacttcccccgcgagggc3300

gtgttcgtgagcaacggcacccactggttcgtgacccagcgcaacttctacgagccccag3360

atcatcaccaccgacaacaccttcgtgagcggcaactgcgacgtggtgatcggcatcgtg3420

aacaacaccgtgtacgaccccctgcagcccgagctggacagcttcaaggaggagctggac3480

aagtacttcaagaaccacaccagccccgacgtggacctgggcgacatcagcggcatcaac3540

gccagcgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggccaagaacctg3600

aacgagagcctgatcgacctgcaggagctgggcaagtacgagcagggctacatccccgag3660

gccccccgcgacggccaggcctacgtgcgcaaggacggcgagtgggtgctgctgagcacc3720

ttcctgtga3729

<210>13

<211>1242

<212>prt

<213>人工序列(artificialsequence)

<400>13

metaspalametlysargglyleucyscysvalleuleuleucysgly

151015

alavalphevalseralaglncysvalasnleuthrthrargthrgln

202530

leuproproalatyrthrasnserphethrargglyvaltyrtyrpro

354045

asplysvalpheargserservalleuhisserthrglnaspleuphe

505560

leuprophepheserasnvalthrtrpphehisalailehisvalser

65707580

glythrasnglythrlysargpheaspasnprovalleupropheasn

859095

aspglyvaltyrphealaserthrglulysserasnileilearggly

100105110

trpilepheglythrthrleuaspserlysthrglnserleuleuile

115120125

valasnasnalathrasnvalvalilelysvalcysglupheglnphe

130135140

cysasnasppropheleuglyvaltyrtyrhislysasnasnlysser

145150155160

trpmetgluserglupheargvaltyrserseralaasnasncysthr

165170175

pheglutyrvalserglnpropheleumetaspleugluglylysgln

180185190

glyasnphelysasnleuarggluphevalphelysasnileaspgly

195200205

tyrphelysiletyrserlyshisthrproileasnleuvalargasp

210215220

leuproglnglypheseralaleugluproleuvalaspleuproile

225230235240

glyileasnilethrargpheglnthrleuleualaleuhisargser

245250255

tyrleuthrproglyaspserserserglytrpthralaglyalaala

260265270

alatyrtyrvalglytyrleuglnproargthrpheleuleulystyr

275280285

asngluasnglythrilethraspalavalaspcysalaleuasppro

290295300

leusergluthrlyscysthrleulysserphethrvalglulysgly

305310315320

iletyrglnthrserasnpheargvalglnprothrgluserileval

325330335

argpheproasnilethrasnleucyspropheglygluvalpheasn

340345350

alathrargphealaservaltyralatrpasnarglysargileser

355360365

asncysvalalaasptyrservalleutyrasnseralaserpheser

370375380

thrphelyscystyrglyvalserprothrlysleuasnaspleucys

385390395400

phethrasnvaltyralaaspserphevalileargglyaspgluval

405410415

argglnilealaproglyglnthrglylysilealaasptyrasntyr

420425430

lysleuproaspaspphethrglycysvalilealatrpasnserasn

435440445

asnleuaspserlysvalglyglyasntyrasntyrleutyrargleu

450455460

phearglysserasnleulysprophegluargaspileserthrglu

465470475480

iletyrglnalaglyserthrprocysasnglyvalgluglypheasn

485490495

cystyrpheproleuglnsertyrglypheglnprothrasnglyval

500505510

glytyrglnprotyrargvalvalvalleuserphegluleuleuhis

515520525

alaproalathrvalcysglyprolyslysserthrasnleuvallys

530535540

asnlyscysvalasnpheasnpheasnglyleuthrglythrglyval

545550555560

leuthrgluserasnlyslyspheleupropheglnglnpheglyarg

565570575

aspilealaaspthrthraspalavalargaspproglnthrleuglu

580585590

ileleuaspilethrprocysserpheglyglyvalservalilethr

595600605

proglythrasnthrserasnglnvalalavalleutyrglnaspval

610615620

asncysthrgluvalprovalalailehisalaaspglnleuthrpro

625630635640

thrtrpargvaltyrserthrglyserasnvalpheglnthrargala

645650655

glycysleuileglyalagluhisvalasnasnsertyrglucysasp

660665670

ileproileglyalaglyilecysalasertyrglnthrglnthrasn

675680685

serproglyglyservalalaserglnserileilealatyrthrmet

690695700

serleuglyalagluasnservalalatyrserasnasnserileala

705710715720

ileprothrasnphethrileservalthrthrgluileleuproval

725730735

sermetthrlysthrservalaspcysthrmettyrilecysglyasp

740745750

serthrglucysserasnleuleuleuglntyrglyserphecysthr

755760765

glnleuasnargalaleuthrglyilealavalgluglnasplysasn

770775780

thrglngluvalphealaglnvallysglniletyrlysthrpropro

785790795800

ilelysasppheglyglypheasnpheserglnileleuproasppro

805810815

serlysproserlysargserpheilegluaspleuleupheasnlys

820825830

valthrleualaaspalaglypheilelysglntyrglyaspcysleu

835840845

glyaspilealaalaargaspleuilecysalaglnlyspheasngly

850855860

leuthrvalleuproproleuleuthraspglumetilealaglntyr

865870875880

thrseralaleuleualaglythrilethrserglytrpthrphegly

885890895

alaglyalaalaleuglnileprophealametglnmetalatyrarg

900905910

pheasnglyileglyvalthrglnasnvalleutyrgluasnglnlys

915920925

leuilealaasnglnpheasnseralaileglylysileglnaspser

930935940

leuserserthralaseralaleuglylysleuglnaspvalvalasn

945950955960

glnasnalaglnalaleuasnthrleuvallysglnleuserserasn

965970975

pheglyalaileserservalleuasnaspileleuserargleuasp

980985990

lysvalglualagluvalglnileaspargleuilethrglyargleu

99510001005

glnserleuglnthrtyrvalthrglnglnleuileargalaalaglu

101010151020

ileargalaseralaasnleualaalathrlysmetserglucysval

1025103010351040

leuglyglnserlysargvalaspphecysglylysglytyrhisleu

104510501055

metserpheproglnseralaprohisglyvalvalpheleuhisval

106010651070

thrtyrvalproalaglnglulysasnphethrthralaproalaile

107510801085

cyshisaspglylysalahispheproarggluglyvalphevalser

109010951100

asnglythrhistrpphevalthrglnargasnphetyrgluprogln

1105111011151120

ileilethrthraspasnthrphevalserglyasncysaspvalval

112511301135

ileglyilevalasnasnthrvaltyraspproleuglnprogluleu

114011451150

aspserphelysglugluleuasplystyrphelysasnhisthrser

115511601165

proaspvalaspleuglyaspileserglyileasnalaservalval

117011751180

asnileglnlysgluileaspargleuasngluvalalalysasnleu

1185119011951200

asngluserleuileaspleuglngluleuglylystyrgluglngly

120512101215

tyrileproglualaproargaspglyglnalatyrvalarglysasp

122012251230

glyglutrpvalleuleuserthrpheleu

12351240

<210>14

<211>39

<212>dna

<213>人工序列(artificialsequence)

<400>14

atgtttgtttttcttgttttattgccactagtctctagt39

<210>15

<211>13

<212>prt

<213>人工序列(artificialsequence)

<400>15

metphevalpheleuvalleuleuproleuvalserser

1510

<210>16

<211>39

<212>dna

<213>人工序列(artificialsequence)

<400>16

atgttcgtgttcctggtgctgctgcccctggtgagcagc39

<210>17

<211>13

<212>prt

<213>人工序列(artificialsequence)

<400>17

metphevalpheleuvalleuleuproleuvalserser

1510

<210>18

<211>66

<212>dna

<213>人工序列(artificialsequence)

<400>18

atggacgccatgaagcgcggcctgtgctgcgtgctgctgctgtgcggcgccgtgttcgtg60

agcgcc66

<210>19

<211>22

<212>prt

<213>人工序列(artificialsequence)

<400>19

metaspalametlysargglyleucyscysvalleuleuleucysgly

151015

alavalphevalserala

20

<210>20

<211>57

<212>dna

<213>人工序列(artificialsequence)

<400>20

atgggctggtcctgcatcatcctgttcctggtcgccaccgctaccggcgtgcatagc57

<210>21

<211>19

<212>prt

<213>人工序列(artificialsequence)

<400>21

metglytrpsercysileileleupheleuvalalathralathrgly

151015

valhisser

<210>22

<211>72

<212>dna

<213>人工序列(artificialsequence)

<400>22

atgcccatggggtctctgcaaccgctggccaccttgtacctgctggggatgctggtcgct60

tcctgcctcgga72

<210>23

<211>24

<212>prt

<213>人工序列(artificialsequence)

<400>23

metprometglyserleuglnproleualathrleutyrleuleugly

151015

metleuvalalasercysleugly

20

<210>24

<211>27

<212>prt

<213>人工序列(artificialsequence)

<400>24

glytyrileproglualaproargaspglyglnalatyrvalarglys

151015

aspglyglutrpvalleuleuserthrpheleu

2025

<210>25

<211>31

<212>prt

<213>人工序列(artificialsequence)

<400>25

metlysglnilegluasplysileglugluileleuserlysiletyr

151015

hisilegluasngluilealaargilelyslysleuileglyglu

202530

<210>26

<211>25

<212>prt

<213>人工序列(artificialsequence)

<400>26

protrptyriletrpleuglypheilealaglyleuilealaileval

151015

metvalthrilemetleucyscysmet

2025

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1