本发明属于生物技术领域,涉及一种新型冠状病毒s蛋白及其亚单位疫苗。
背景技术:
2020年1月30日,世卫组织宣布新型冠状病毒(sars-cov-2)引发的全球疫情为国际关注的突发公共卫生事件。由于病毒极高的传播潜力,截至2021年3月20日,全球已累计报告超过1.23亿例sars-cov-2感染病例,导致2718896例患者死亡。为了应对全球大流行的新型冠状病毒肺炎疫情,各国政府、企业和学术界正在制定各种治疗和预防对策,重中之重是疫苗和抗病毒药物的研发与应用。疫苗是抵抗所有病毒性疾病感染最有效的手段,也是保护未感染人群最有效的措施。
目前在研或已获批上市的sars-cov-2疫苗类型有:灭活疫苗、腺病毒载体疫苗、核酸疫苗(包括mrna疫苗和dna疫苗)以及亚单位疫苗。虽然已有部分针对sars-cov-2的疫苗紧急上市,用于应急使用,但目前的疫苗品种仍有很多问题:1、我国主要使用的灭活疫苗相比于核酸疫苗和亚单位疫苗的免疫原性不够强,灭活试剂会对抗原天然表位产生破环,而病毒颗粒中的其他但蛋白也会干扰s蛋白的免疫原性。2、核酸类疫苗产品是在新冠病毒中首次应用,以前还没有成功上市的核酸类疫苗,其长期的安全性,整合风险都未知。3、腺病毒疫苗的腺病毒载体会受到预存免疫的干扰。4、现有各种疫苗搜身针对早期流行毒株设计的,无法有效应对已经产生的突变株,不具有保守的保护效果。由于亚单位疫苗是采用sars-cov-2s蛋白全长或部分氨基酸序列作为抗原,具有强免疫原性,可以诱导高滴度的中和抗体产生,基因重组技术也便于对抗原进行突变株更新和广谱性设计,因此亚单位疫苗在应对sars-cov-2突变株具有更大的优势。
sars-cov-2是一种基因组约30kb,是有包膜的单股正链rna病毒,属于冠状病毒家族β属。病毒基因组编码多种蛋白,包括刺突蛋白(s),膜糖蛋白(m)、核衣壳蛋白(n),膜蛋白(e)以及多种非结构蛋白。其中s蛋白是i型病毒融合蛋白,介导病毒附着在细胞表面受体血管紧张素转化酶2(ace2)上,然后释放基因组进入细胞,因此s蛋白是中和性抗体的靶点,也是疫苗制备的主要有效成分。新型冠状病毒s蛋白由1273个氨基酸组成,包含21-35个n-糖基化位点。s蛋白以三聚体的形式在病毒表面形成特殊的花冠结构,冠状病毒因此而得名。s蛋白在宿主细胞蛋白酶的作用下,通过蛋白中部的rrar剪切序列被裂解为s1和s2两个亚基,s1主要功能是与宿主细胞表面受体结合,s2亚基介导病毒-细胞以及细胞-细胞膜融合。s蛋白完整的三聚体结构是病毒被宿主细胞核中和性抗体识别的首要结构。
因此,亟需开发一种新的有效的针对新型冠状病毒的疫苗。
技术实现要素:
为了解决所述技术问题,本发明提供了一种新型冠状病毒s蛋白及其亚单位疫苗,s1/s2切割位点rrar经突变以失去被弗林样蛋白酶切割的能力,以保留完整的s蛋白抗原性。
在本发明的第一方面,提供了一种新型冠状病毒s蛋白,所述新型冠状病毒s蛋白的s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,所述linker为以甘氨酸g和丝氨酸s构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,其中,n为≥1的整数。
进一步地,所述新型冠状病毒s蛋白具有如下修饰1-修饰4中的至少一种:
修饰1、所述新型冠状病毒s蛋白的原始信号肽替换为tpa信号肽、cd5信号肽和igg信号肽中的一种;
修饰2、所述新型冠状病毒s蛋白的seqidno:24所示跨膜区替换为t4噬菌体fibritin三聚体基序或seqidno:25gcn4多聚体形成基序;
修饰3、所述新型冠状病毒s蛋白的c端结构域删除seqidno:7所示跨膜结构域;
修饰4、所述新型冠状病毒s蛋白在氨基酸位置817-987处具有一个或多个氨基酸残基突变为脯氨酸的突变,所述突变包括k986p和/或v987p取代。
进一步地,所述新型冠状病毒s蛋白的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。
进一步地,所述新型冠状病毒s蛋白的氨基酸序列如seqidno:9所示或者seqidno:11所示或者seqidno:13所示。
在本发明的第二方面,提供了一种核酸分子,所述核酸分子的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。
在本发明的第三方面,提供了一种重组表达载体,所述重组表达载体能够表达所述的新型冠状病毒s蛋白。
进一步地,所述重组表达载体的表达区的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。
在本发明的第四方面,提供了一种工程化细胞,所述工程化细胞包含所述的重组表达载体。
在本发明的第五方面,提供了一种新型冠状病毒s蛋白的制备方法,所述方法包括:
获得所述的重组表达载体;
将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组s蛋白的细胞株;
将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒s蛋白。
在本发明的第六方面,提供了一种新型冠状病毒亚单位疫苗,所述新型冠状病毒亚单位疫苗包含所述的重组s蛋白以及药学上接受的佐剂。
进一步,所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、mpltm、il-12、氢氧化铝联合cpgodn复合佐剂、isa51vg、isa720vg、mf59、qs21、as03佐剂中的至少一种。
本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提供的新型冠状病毒s蛋白及其亚单位疫苗,本发明的免疫原s蛋白多肽具有稳定的融合前构象,将s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,如以g(gly)甘氨酸和s(ser)丝氨酸构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,通过n来调整linker的长度和效果。在本发明中,我们比较了多种柔性linker,图2b的结果表明,与已经报道的682-qqaq-685突变相比,gs柔性linker,包括682-gsas-685,682-gg-685都具有更好的保护剪切的效果,gs突变中s2的剪切更少,能更好地保持不被剪切的s蛋白形式。本发明应用获取的具有生物活性的三聚体构象的s蛋白,制备成三聚体亚单位疫苗,免疫小鼠后能够诱导小鼠产生针对sars-cov-2原始株以及目前流行的突变株都具有免疫保护作用的中和抗体,对免疫小鼠进行新型冠状病毒的致死性攻毒感染后,可以提供100%的保护效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为哺乳动物细胞分泌型s蛋白序列设计图;
图2为s蛋白在cho-k1细胞中的优化表达效果;图2a:对比s蛋白原始序列与优化密码子序列蛋白表达水平;图2b:对比s蛋白furin剪切位点原始序列以及两种不同突变策略的剪切情况;图2c:对比具有原始信号肽与替换为tpa或者igg信号肽的s蛋白在细胞培养上清中的表达情况;
图3为稳定表达s蛋白的cho-k1细胞生长曲线;
图4为分泌表达重组s蛋白的表达量分析;
图5为分泌表达重组s蛋白的三聚体分析;
图6为s蛋白三聚体抗原激发特异性抗体水平检测;
图7为s蛋白三聚体抗原免疫小鼠后产生的抗体中和活性检测;图7a和7b分别为采集二次接种疫苗或者pbs的小鼠血清以及收集sars-cov-2康复患者血清,稀释不同的梯度,分别与新冠假病毒孵育1h,感染bhk-21ace2细胞,24h后收样检测萤火虫荧光素酶活性;
图8为重组s蛋白三聚体亚单位疫苗的保护性研究;图8a和图8b分别为二次接种疫苗或者pbs的小鼠通过滴鼻的方式感染sars-cov-2,分别记录疫苗组和对照组小鼠的体重变化以及生存的情况;
图9为本发明疫苗对新冠不同突变株假病毒具有极高中和活性的结果;图9a为疫苗二次免疫组小鼠血清针对原始株以及部分目前流行的突变株假病毒具有较高的中和活性结果;图9b为灭活疫苗志愿者血清针对原始株假病毒仅有较低的中和活性,并且对于南非株假病毒完全没有中和活性的结果;
图10为重组s蛋白三聚体亚单位疫苗的攻毒验证;图10a为疫苗组小鼠在感染sars-cov-2后体重变化不大的结果;图10b为重组s蛋白三聚体亚单位疫苗可完全抵抗致死剂量的sars-cov-2感染结果。
具体实施方式
下文将结合具体实施方式和实施例,具体阐述本发明,本发明的优点和各种效果将由此更加清楚地呈现。本领域技术人员应理解,这些具体实施方式和实施例是用于说明本发明,而非限制本发明。
在整个说明书中,除非另有特别说明,本文使用的术语应理解为如本领域中通常所使用的含义。因此,除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域技术人员的一般理解相同的含义。若存在矛盾,本说明书优先。
除非另有特别说明,本发明中用到的各种原材料、试剂、仪器和设备等,均可通过市场购买得到或者可通过现有方法制备得到。
本发明实施例提供的技术方案为解决上述技术问题,总体思路如下:
本申请人经过分析和实验验证发现:覆盖s1和s2的全部序列是最佳的疫苗抗原选择,比单独的s1(或rbd区域)或者单独的s2能诱导更多的抗体种类,更具有广谱性。同时,s蛋白完整的三聚体结构是病毒被宿主细胞核中和性抗体识别的首要结构,因此,如能在体外还原s蛋白三聚体结构,通过体外重组表达核纯化获得三聚体s蛋白,则能够模拟病毒天然构象,激活机体产生最接近天然病毒的识别抗体,也是亚单位重组疫苗的最佳选择。
因此,本发明的目的在于提供一种同时包括s1和s2两个亚基,又能在哺乳动物细胞上清中分泌表达的新型冠状病毒三聚体s蛋白及其基因序列,以及以cho细胞上清表达的此蛋白做成新型冠状病毒亚单位疫苗所提供的高效保护作用。
根据本发明实施例一种典型的实施方式,提供一种新型冠状病毒s蛋白,所述新型冠状病毒s蛋白的s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,所述linker为以甘氨酸g和丝氨酸s构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,其中,n为≥1的整数。
n为≥1的整数均在本发明的保护范围之内;作为优选的方案,本申请实施例中n优选取1-3;所述linker为(g)n,时,n优选值可长些,此时n优选取1-10;
本申请的核心在于将s1/s2切割位点rrar经突变以失去被弗林样蛋白酶切割的能力,以保留完整的s蛋白抗原性,本发明的免疫原s蛋白多肽具有稳定的融合前构象,将s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,如以g(gly)甘氨酸和s(ser)丝氨酸构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,通过n来调整linker的长度和效果。在本发明实施例中,我们比较了多种柔性linker,图2b的结果表明,与已经报道的682-qqaq-685突变相比,gs柔性linker,包括682-gsas-685,682-gg-685都具有更好的保护剪切的效果,gs突变中s2的剪切更少,能更好地保持不被剪切的s蛋白形式。
野生的新型冠状病毒s蛋白的核苷酸序列如seqidno:1所示,野生的新型冠状病毒s蛋白的氨基酸序列如seqidno:2所示;其中野生的新型冠状病毒s蛋白的原始信号肽的氨基酸序列为mfvflvllplvss,如seqidno:15所示;原始信号肽的核苷酸序列如seqidno:14所示;
为了在真核细胞中高效表达,我们使用了javacodonadapation软件对s表达基因的密码子进行了哺乳动物偏好的密码子优化,在一些实施方案中,本申请选用了javacodonadapation软件对s表达基因的密码子进行了优化,获得了在哺乳动物细胞中表达效率比天然s基因更高的表达效率。原始信号肽的核苷酸序列优化为如seqidno:16所示;原始信号肽的氨基酸序列如seqidno:17所示(氨基酸序列同seqidno:15);也可采用其他的密码子优化方式,具体可采用如下一种密码子优化方案:
密码子优化方案1:核苷酸序列如seqidno:3所示;
密码子优化方案2:核苷酸序列如seqidno:4所示;
密码子优化方案3:核苷酸序列如seqidno:5所示;
密码子优化方案4:核苷酸序列如seqidno:6所示;
密码子优化方案5:核苷酸序列如seqidno:7所示;
并将所述密码子优化方案1-5中s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为本申请的柔性的蛋白linker的密码子序列即可,所述linker为以甘氨酸g和丝氨酸s构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,其中,n为≥1的整数。
作为一种可选的实施方式,所述新型冠状病毒s蛋白具有如下修饰1-修饰4中的至少一种:
修饰1、所述新型冠状病毒s蛋白的原始信号肽可替换为seqidno:18所示以及seqidno:19所示tpa信号肽、seqidno:20所示以及seqidno:21所示igg信号肽、seqidno:22所示以及seqidno:23所示cd5信号肽中的一种;该序列采用分泌性信号肽以保证s蛋白可以在哺乳动物细胞的培养上清中分泌表达,选用tpa信号肽以及s蛋白天然信号肽以及igg信号肽以及cd5信号肽,最优的选择tpa信号肽。
修饰2、所述新型冠状病毒s蛋白的seqidno:24所示跨膜区替换为t4噬菌体fibritin三聚体基序或seqidno:25gcn4多聚体形成基序。为更优的形成三聚体结构,将s蛋白与t4噬菌体的次要纤维蛋白(fibritin)的三聚体折叠结构域在c末端进行融合。
修饰3、所述新型冠状病毒s蛋白的c端结构域删除seqidno:26所示跨膜结构域。目的在于促进所述重组s蛋白的分泌表达。
修饰4、所述新型冠状病毒s蛋白在氨基酸位置817-987处具有一个或多个氨基酸残基突变为脯氨酸的突变,所述突变可包括k986p和/或v987p取代。两个脯氨酸残基的取代提高了预融合构象的稳定性。
以上修饰1-修饰4中的一种或多种,其中任何一种排列组合的方案,均在本发明的保护范围之内。
作为优选地,新型冠状病毒s蛋白的核苷酸序列可采用seqidno:8、seqidno:10和seqidno:12任一所示,其中:
新型冠状病毒s蛋白的核苷酸序列seqidno:8所示方案中,采用所述密码子优化方案3骨架+原始信号肽+682gsas685+t4噬菌体fibritin三聚体基序;氨基酸序列seqidno:9所示;
新型冠状病毒s蛋白的核苷酸序列seqidno:10所示方案中,采用所述密码子优化方案3骨架+tpa信号肽+691gsas694+t4噬菌体fibritin三聚体基序;氨基酸序列seqidno:11所示;
新型冠状病毒s蛋白的核苷酸序列seqidno:12所示方案中,采用所述密码子优化方案3骨架+tpa信号肽+691gg692+t4噬菌体fibritin三聚体基序;氨基酸序列seqidno:13所示;
本发明实施例通过多种表达元件的测试和比较,获得了一种可以在哺乳动物细胞中高效分泌表达的s蛋白重组基因序列和蛋白序列。作为一种最优的技术方案,该序列是一种c段截断形式的s蛋白,保留s1和s2两个亚基,除跨膜区外的所有功能区都保留,以最大限度保留s蛋白上的抗体表位。所述最优的技术方案中,所述新型冠状病毒s蛋白的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。所述新型冠状病毒s蛋白的氨基酸序列如seqidno:9所示或者seqidno:11所示或者seqidno:13所示。
根据本发明实施例另一种典型的实施方式,提供一种核酸分子,所述核酸分子的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。含有所述核酸分子的生物材料也在本发明的保护范围之内,所述生物材料包括重组dna、质粒载体、噬菌体载体、病毒载体和工程菌中的一种。
根据本发明实施例另一种典型的实施方式,提供一种重组表达载体,所述重组表达载体能够表达所述的新型冠状病毒s蛋白。
根据本发明实施例另一种典型的实施方式,提供一种工程化细胞,所述工程化细胞包含所述的重组表达载体。所述工程化细胞可选用悬浮细胞,包括cho系列和293、293ft等人用疫苗哺乳动物细胞株都在本发明的保护范围之内,具体地,本发明实施例使用cho-k1细胞,通过将上述s基因转染该细胞并获得稳定表达细胞株,高效表达重组的s蛋白。
根据本发明实施例另一种典型的实施方式,提供一种新型冠状病毒s蛋白的制备方法,所述方法包括:
获得所述的重组表达载体;
将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组s蛋白的细胞株;
将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒s蛋白。
根据本发明实施例另一种典型的实施方式,提供一种新型冠状病毒亚单位疫苗,所述新型冠状病毒亚单位疫苗包含所述的重组s蛋白以及药学上接受的佐剂。
所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、mpltm、il-12、氢氧化铝联合cpgodn复合佐剂、isa51vg、isa720vg、mf59、qs21、as03佐剂中的至少一种。在其他实施方式中,所述佐剂也可选用其他形式的佐剂。
所述新型冠状病毒亚单位疫苗可以制备成滴鼻剂、喷雾剂和肌肉注射剂。
本发明应用获取的具有生物活性的三聚体构象的s蛋白,制备成三聚体亚单位疫苗,免疫小鼠后能够诱导小鼠产生针对sars-cov-2的具有免疫保护作用的中和抗体,对免疫小鼠进行新型冠状病毒的致死性攻毒感染后,可以提供100%的保护效率。
下面将结合实施例及实验数据对本申请的效果进行详细说明。
实施例一重组s蛋白载体构建与表达优化
1、哺乳动物细胞上清表达的s蛋白基因的构建
本发明的s蛋白表达基因的构建示意图见图1。图1中哺乳动物细胞分泌型s蛋白序列设计图:序列保留原始信号肽,或者突变为tpa信号肽/cd5信号肽/igg信号肽;furin剪切位点由rrar突变为gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n;c端跨膜区以及胞内区替换为t4噬菌体次要纤维蛋白序列。
首先,为了在真核细胞中高效表达,我们使用了javacodonadapation软件对s表达基因的密码子进行了哺乳动物偏好的密码子优化,原始信号肽的核苷酸序列优化为如seqidno:16所示;图2a的结果表明,未经优化的s天然基因在cho细胞中表达量极低,几乎检测不到;而经过密码子优化的s基因可以在cho细胞中高效的表达s蛋白。
其次,本发明的免疫原s蛋白多肽具有稳定的融合前构象,将s1/s2两个亚基之间的furin裂解位点682-rrar-685替换为柔性的蛋白linker,如以g(gly)甘氨酸和s(ser)丝氨酸构成的gsas、gs组合、(gggs)n或者(ggggs)n或者(g)n,通过n来调整linker的长度和效果。在本发明中,我们比较了多种柔性linker,图2b的结果表明,与已经报道的682-qqaq-685突变相比,gs柔性linker,包括682-gsas-685,682-gg-685都具有更好的保护剪切的效果,gs突变中s2的剪切更少,能更好地保持不被剪切的s蛋白形式。图7的结果表明,完整的s蛋白可以诱导产生高滴度的特异性中和抗体,而仅靶向s蛋白s2亚基的抗体不具有中和病毒的活性,即无法保护机体抵抗sars-cov-2的感染。
再次,为了无需裂解细胞而在哺乳动物上清中表达s蛋白,我们去掉了天然s蛋白的跨膜区(tm区),将去掉tm区的s蛋白与t4噬菌体的次要纤维蛋白(fibritin)的三聚体折叠结构域在c末端进行融合,增强三聚体的形成。在使用分泌信号肽时,我们比较了tpa信号肽,s蛋白自身信号肽以及人igg信号肽。图2c的结果表明,人组织纤溶酶原激活剂(tpa)信号肽和s蛋白自身信号肽都能在转染的cho上清中检测到s蛋白,因此优选这两种信号肽进行上清表达。
所述s基因的核苷酸序列如seqidno:8所示或者seqidno:10所示或者seqidno:12所示。
2、分泌表达重组s蛋白的cho-k1细胞株构建
将上述(1)中构建的s基因(所述s基因的核苷酸序列如seqidno:8所示)克隆至表达载体载体(由promega公司的pc-neo载体改造,加入gs表达标签)中,得到带有谷氨酰胺合成酶(gs)筛选标签的表达载体。具体步骤为:pc-gs载体利用限制性内切酶nhei以及smai(thermofisher)酶切,s基因则用nhei以及ecorv(thermofisher)酶切,然后通过琼脂糖凝胶电泳分别回收已经酶切好的载体以及s基因,再利用t4连接酶(newenglandbiolabs)链接,随后转化进感受态dh5,挑单克隆并鉴定正确的pc-gs-s克隆,即得到s基因表达质粒。
将上述s基因表达质粒通过电转仪(biorad公司)电穿孔方式转染至cho-k1细胞(武汉大学中国典型培养物保藏中心)中。电穿孔转染操作方案:取1×107个细胞到800lcho-cd1无血清培养基(上海培源生物科技股份有限公司)中重悬,加入40μg质粒混匀,转移上述培养液至电转杯(biorad公司)中,设置电转程序为电压300v,电容960μf,电阻∞,指数脉冲。电击完毕,取出培养液至cho-cd1培养基,调整细胞浓度为5×105个/ml。电转后每天检测细胞密度以及存活率,当细胞浓度开始稳定增长至1×106个/ml时,证明细胞株完成建系。通过有限稀释法进行筛选,挑选克隆株分别扩大培养,进一步筛选优势细胞株。优势株扩大培养后,接种细胞进行细胞生长周期检测。
3、cho-k1-s细胞生长检测
上述优势株细胞转接到20mlcho-cd1培养基中,细胞终浓度为1×106个/ml,放置到37℃,5%co2,转速为120rpm的摇床培养箱(thermofisher)中。接种当天记第0天,然后每24小时利用血球计数板(biorad)计数,统计细胞生长情况,计数到细胞数目不在增长或下降为止。实验结果表明,在1×106个/ml接种浓度下,优势株细胞在接种第2-3天进入对数生长期,第6-7天到达平台期,第8天开始进入衰亡期(图3)。图3为稳定表达s蛋白的cho-k1-s细胞生长曲线:接种2×107个cho细胞到20ml无血清培养基中,连续培养8天,统计生长情况。
4、分泌表达重组s蛋白的检测
优势株细胞转接到2个含有20mlcho-cd1培养基的细胞培养瓶中,细胞终浓度分别为1×106个/ml记为a瓶;2×106个/ml记为b瓶。放置到37℃5%co2,转速为120rpm的摇床培养箱中。连续培养4天后,然后取a瓶以及b瓶的培养液100μl,800rpm离心5分钟,取出上清,加入对应体积的6×sdsloadingbuffer;离心后的细胞加入40μl1×sdsloadingbuffer,然后放置100℃金属浴(dlab)10分钟,sds-page检测上清中蛋白表达。实验结果表明,优势株细胞上清中可以检测出高表达的s蛋白,并且在接种初始浓度高的样品中,s蛋白表达量更高(图4)。图4为分泌表达重组s蛋白的表达量分析:接种cho细胞到无血清培养基,根据接种细胞数分别记为a瓶和b瓶,培养4天后,检测细胞和培养基上清s蛋白表达。
上述b瓶细胞培养液离心后取得的上清培养基取出10μl、20μl、40μl、60μl到ep管中,第二份对应地加入2μl、4μl、8μl、12μl6×nativeloadingbuffer,然后通过native-page检测上清表达s蛋白的三聚体形式。如图5所示,实验结果表明,优势株细胞上清中可以检测出少量s蛋白单体存在,大部分s蛋白在培养基上清中以二聚体或三聚体形式存在(图5),说明cho-k1-s细胞株可以大量表达天然多聚体构象的s蛋白,并且上述细胞株分泌表达重组s蛋白能够达到3g/l,可以满足亚单位疫苗生产要求。
实施例二、重组s蛋白三聚体疫苗免疫与效果鉴定
1、小鼠的免疫流程
本实验所用小鼠为k18-hace雄鼠,6-8周,19-28g,从江苏集萃药康生物科技有限公司购入,所有动物实验操作在spf实验室进行。实验组接种疫苗+佐剂,共4只小鼠;对照组接种pbs,共4只小鼠。接种第一针疫苗后14天接种第二针,接种第一针后35天(即接种第二针后21天),对所有小鼠进行眼眶取血。取小鼠血清用于检验。
2、elisa检测流程
(1)用0.1m碳酸盐缓冲液(ph=9.6)稀释rbd(义翘神州科技有限公司),使终浓度为1ng/μl,再向96孔酶标板的各孔加入100μl,使每孔最终含有100ngrbd。37℃孵育3小时。
(2)弃包被液,每孔加250μl的0.05%的pbst(莫纳生物科技有限公司)进行洗涤。洗涤3次,每次5分钟。
(3)再向每孔加入200μl的5%脱脂牛奶(用0.05%pbst配制),进行封闭,37℃孵育3小时。
(4)用5%脱脂牛奶对疫苗组和对照组小鼠的血清样品进行1:500稀释。弃封闭液,每孔加入100μl已经稀释的小鼠血清,每份小鼠血清做三次重复,4℃过夜。
(5)弃血清,每孔加200μl的0.05%的pbst进行洗涤。洗涤3次,每次5分钟。
(6)用5%脱脂牛奶以1:5000比例稀释羊抗鼠igg二抗(博尔西科技有限公司)。向每孔加入100μl稀释后的二抗。37℃孵育1h。
(7)弃二抗,每孔加200μl的0.05%的pbst进行洗涤。洗涤3次,每次5分钟。
(8)再向每孔加入100μl的酶作用底物(hcmtmbone),室温避光显色30分钟。每孔加入50μl1mhcl终止反应。放入酶标仪中检测od450的值。
3、vsv骨架新冠假病毒包装流程
新冠病毒spike蛋白表达质粒sdel-18(尾端删除18个氨基酸,质粒来源夏宁邵教授实验室)转染veroe6细胞(15μg/10cmdish),转染后48h,用种子病毒vsv-dg-luc(质粒来源夏宁邵教授实验室)感染细胞(300μl/10cmdish)。感染1h后,吸弃病毒液,换为含有vsv-g抗体(1:1000)的新鲜完全培养基。37℃培养24h,收取细胞上清,分装假病毒,冻存于-80℃备用。
4、新冠假病毒中和实验流程
(1)接种bhk-21ace2细胞(来自武汉大学中国典型培养物保藏中心)于96孔板中,待细胞聚合度达到90%,进行实验。
(2)小鼠血清56℃,30min去除补体。
(3)用感染培养基(dmem+2%fbs+1%ps)梯度稀释小鼠血清。
(4)用感染培养基(dmem+2%fbs+1%ps)稀释假病毒,假病毒(v):总体积(v)=1:10。
(5)血清稀释液与假病毒稀释液等比混合(50l+50l每孔),37℃孵育1h。
(6)用pbs清洗bhk-21ace2细胞两次。
(7)血清与假病毒混合液加入细胞,37℃培养24h,裂解细胞,加入萤火虫荧光素酶底物(promega),用varioskanlux多功能微孔板读数仪(thermofisher)测定萤火虫荧光素酶活性。
5、本发明疫苗免疫的小鼠血清中含有极高的anti-rbdigg
为了验证设计的疫苗能诱导小鼠产生特异性抗体,将制备的重组s蛋白疫苗免疫小鼠,对照组小鼠接种等体积1×pbs。接种第一针后35天(即接种第二针后21天),对所有小鼠进行眼眶取血。随后将制备的4份疫苗组小鼠血清和4份对照组小鼠血清按1:500稀释,用于酶联免疫反应(elisa)检测血清中特异性抗体的含量。
实验结果如图6所示。可以看出,在1:500稀释倍数下,疫苗组小鼠血清与新冠病毒rbd蛋白反应的od450值显著高于对照组小鼠血清与新冠病毒rbd蛋白反应。这说明本发明制备的疫苗能够诱导小鼠产生极高的针对s蛋白rbd区域的特异性抗体。同时,灭活疫苗志愿者血清以1:2000释倍数下,可诱导与本疫苗相似水平的rbd区域抗体反应。
6、本发明疫苗保持s蛋白抗原完整性以及对新冠假病毒具有极高中和活性
为了验证本疫苗产生的抗体对新冠病毒的具有中和能力,将本疫苗二次免疫的小鼠血清和商业化靶向s蛋白的s2亚基抗体(义翘神州科技有限公司)分别进行假病毒中和实验,对比上述两种抗体的中和活性。
取疫苗二次免疫组小鼠(s-55)血清以及对照组(pbs-53)小鼠血清,进行1:100、1:1000、1:10000、1:20000、1:40000和1:80000倍稀释;商业化靶向s蛋白的s2亚基抗体进行1:100、1:500、1:2500、1:5000和1:10000倍稀释。将稀释血清与vsv骨架新冠假病毒进行中和实验,测定小鼠血清和商业化靶向s蛋白的s2亚基特异性抗体的中和活性。
图7a结果显示,疫苗二次免疫小鼠血清在1:100–1:10000稀释度下对新冠假病毒具有中和活性,在稀释度约1:8000时达到50%中和效率。而对照组小鼠血清在所有稀释度下均没有对假病毒中和活性;图7b结果显示,商业化靶向s蛋白的s2亚基特异性抗体仅在低稀释浓度表现出很弱的假病毒中和活性。这表明,本疫苗的重组s蛋白可以保留s蛋白抗原的完整性,并可以诱导产生对新冠病毒中和效果好、高水平的特异性抗体。
7、本发明疫苗对新冠原始株假病毒具有极高中和活性
为了对比本疫苗产生的抗体以及现有新冠灭活疫苗对新冠假病毒的中和活性,将本疫苗二次免疫的小鼠血清以及灭活疫苗志愿者血清进行假病毒中和实验。
取疫苗二次免疫组小鼠血清,进行1:100、1:1000、1:10000、1:20000、1:40000、1:80000、1:160000和1:320000倍稀释;新冠病毒灭活疫苗志愿者血清进行1:102、1:103、1:104、1:105、1:106和1:107倍稀释。对照组小鼠血清作为对照。将稀释血清与vsv骨架新冠假病毒进行中和实验,测定小鼠血清和灭活疫苗志愿者血清中s蛋白特异性抗体的中和活性。
图8a结果显示,疫苗二次免疫小鼠血清在1:100–1:32000稀释度下均对新冠假病毒具有中和活性,在稀释度约为1:6300时达到50%中和效率。而对照组血清在所有稀释度下均没有对假病毒中和活性。图8b结果显示,灭活疫苗志愿者血清1:103–1:105稀释度对新冠假病毒具有低中和活性,且无法达到50%中和效率。这表明,对比现有灭活疫苗,本疫苗可以诱导产生对新冠病毒中和效果更好、高水平的特异性抗体。
8、本发明疫苗对新冠不同突变株假病毒具有极高中和活性
为了对比本疫苗以及现有新冠灭活疫苗产生的抗体对新冠不同突变株假病毒的中和活性,将本疫苗二次免疫的小鼠血清以及灭活疫苗志愿者血清进行突变株假病毒中和实验。
取疫苗二次免疫组小鼠血清以及新冠病毒灭活疫苗志愿者血清,进行1:102、1:103、1:104、1:105、1:106倍稀释。将稀释血清与vsv骨架新冠不同突变株假病毒进行中和实验,测定并统计小鼠血清和灭活疫苗志愿者血清中特异性抗体的50%中和活性或者20%中和活性的稀释度。
图9a结果显示,疫苗二次免疫组小鼠血清针对原始株以及部分目前流行的突变株假病毒具有较高的中和活性,尽管对于南非株假病毒的中和活性有所下降。图9b结果显示,灭活疫苗志愿者血清针对原始株假病毒仅有较低的中和活性,并且对于南非株假病毒完全没有中和活性。这表明本疫苗可以诱导产生对新冠原始株以及目前流行的新冠突变株中和效果更好,且滴度更高的特异性抗体。
实施例三、重组s蛋白三聚体亚单位疫苗的攻毒验证
将上述小鼠适应absl-3环境2-3天后进行实验,小鼠对应分为以下2组:对照组:pbs组;实验组:疫苗组;每组4只。
sars-cov-2攻毒上述两组小鼠,剂量为2.5×102pfu/只(中国科学院武汉病毒研究所分离的临床毒株,武汉大学absl-3实验室扩增)。具体操作流程为:sars-cov-2原液初始滴度为6×106pfu/ml,共200μl。准备1.5ml螺帽管,加入714μl1xpbs以及6μlsars-cov-2原液混匀,此时病毒稀释液体积为720μl,滴度为5×104pfu/ml。然后准备2ml螺帽管,加入1800μl1×pbs以及200μl上述sars-cov-2稀释液混匀,此时病毒稀释液体积为2000μl,滴度为5×103pfu/ml,然后将稀释好的sars-cov-2放置于冰上待用。用镊子夹出小鼠,使用异氟烷进行吸入麻醉,观察小鼠,待小鼠出现站立不稳昏倒等现象时,用移液枪吸取50μl稀释到滴度为5×103pfu/ml病毒液,向小鼠鼻孔缓慢滴入,使病毒液随小鼠的呼吸自然吸入。数秒后将小鼠放回至饲养笼。攻毒后,每天固定时间点称取小鼠体重,一共记录11天。最后使用graphpadprism软件绘制每组小鼠体重与生存曲线。
实验结果表明,通过本发明所应用的实验方案获取到的具有天然三聚体结构的重组s蛋白,制备成的疫苗具有优良的免疫原性,疫苗组小鼠在感染sars-cov-2后体重变化不大(图10a),并可完全抵抗致死剂量的sars-cov-2感染(图10b)。本发明可以作为潜在的sars-cov-2重组s蛋白亚单位疫苗。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
序列表
<110>武汉大学
<120>新型冠状病毒s蛋白及其亚单位疫苗
<160>26
<170>siposequencelisting1.0
<210>1
<211>3819
<212>dna
<213>新型冠状病毒(sars-cov-2)
<400>1
atgtttgtgttcctggtgctgctgccactggtgtccagccagtgtgtgaacctgaccacc60
aggacccaacttcctcctgcctacaccaactccttcaccaggggagtctactaccctgac120
aaggtgttcaggtcctctgtgctgcacagcacccaggacctgttcctgccattcttcagc180
aatgtgacctggttccatgccatccatgtgtctggcaccaatggcaccaagaggtttgac240
aaccctgtgctgccattcaatgatggagtctactttgccagcacagagaagagcaacatc300
atcaggggctggatttttggcaccaccctggacagcaagacccagtccctgctgattgtg360
aacaatgccaccaatgtggtgattaaggtgtgtgagttccagttctgtaatgacccattc420
ctgggagtctactaccacaagaacaacaagtcctggatggagtctgagttcagggtctac480
tcctctgccaacaactgtacctttgaatatgtgagccaaccattcctgatggacttggag540
ggcaagcagggcaacttcaagaacctgagggagtttgtgttcaagaacattgatggctac600
ttcaagatttacagcaaacacacaccaatcaacctggtgagggacctgccacagggcttc660
tctgccttggaaccactggtggacctgccaattggcatcaacatcaccaggttccagacc720
ctgctggctctgcacaggtcctacctgacacctggagactcctcctctggctggacagca780
ggagcagcagcctactatgtgggctacctccaaccaaggaccttcctgctgaaatacaat840
gagaatggcaccatcacagatgctgtggactgtgccctggacccactgtctgagaccaag900
tgtaccctgaaatccttcacagtggagaagggcatctaccagaccagcaacttcagggtc960
caaccaacagagagcattgtgaggtttccaaacatcaccaacctgtgtccatttggagag1020
gtgttcaatgccaccaggtttgcctctgtctatgcctggaacaggaagaggattagcaac1080
tgtgtggctgactactctgtgctctacaactctgcctccttcagcaccttcaagtgttat1140
ggagtgagcccaaccaaactgaatgacctgtgtttcaccaatgtctatgctgactccttt1200
gtgattaggggagatgaggtgagacagattgcccctggacaaacaggcaagattgctgac1260
tacaactacaaactgcctgatgacttcacaggctgtgtgattgcctggaacagcaacaac1320
ctggacagcaaggtgggaggcaactacaactacctctacagactgttcaggaagagcaac1380
ctgaaaccatttgagagggacatcagcacagagatttaccaggctggcagcacaccatgt1440
aatggagtggagggcttcaactgttactttccactccaatcctatggcttccaaccaacc1500
aatggagtgggctaccaaccatacagggtggtggtgctgtcctttgaactgctccatgcc1560
cctgccacagtgtgtggaccaaagaagagcaccaacctggtgaagaacaagtgtgtgaac1620
ttcaacttcaatggactgacaggcacaggagtgctgacagagagcaacaagaagttcctg1680
ccattccaacagtttggcagggacattgctgacaccacagatgctgtgagggacccacag1740
accttggagattctggacatcacaccatgttcctttggaggagtgtctgtgattacacct1800
ggcaccaacaccagcaaccaggtggctgtgctctaccaggatgtgaactgtactgaggtg1860
cctgtggctatccatgctgaccaacttacaccaacctggagggtctacagcacaggcagc1920
aatgtgttccagaccagggctggctgtctgattggagcagagcatgtgaacaactcctat1980
gagtgtgacatcccaattggagcaggcatctgtgcctcctaccagacccagaccaacagc2040
ccaaggagggcaaggtctgtggcaagccagagcatcattgcctacacaatgagtctggga2100
gcagagaactctgtggcttacagcaacaacagcattgccatcccaaccaacttcaccatc2160
tctgtgaccacagagattctgcctgtgagtatgaccaagacctctgtggactgtacaatg2220
tatatctgtggagacagcacagagtgtagcaacctgctgctccaatatggctccttctgt2280
acccaacttaacagggctctgacaggcattgctgtggaacaggacaagaacacccaggag2340
gtgtttgcccaggtgaagcagatttacaagacacctccaatcaaggactttggaggcttc2400
aacttcagccagattctgcctgacccaagcaagccaagcaagaggtccttcattgaggac2460
ctgctgttcaacaaggtgaccctggctgatgctggcttcatcaagcaatatggagactgt2520
ctgggagacattgctgccagggacctgatttgtgcccagaagttcaatggactgacagtg2580
ctgcctccactgctgacagatgagatgattgcccaatacacctctgccctgctggctggc2640
accatcacctctggctggacctttggagcaggagcagccctccaaatcccatttgctatg2700
cagatggcttacaggttcaatggcattggagtgacccagaatgtgctctatgagaaccag2760
aaactgattgccaaccagttcaactctgccattggcaagattcaggactccctgtccagc2820
acagcctctgccctgggcaaactccaagatgtggtgaaccagaatgcccaggctctgaac2880
accctggtgaagcaactttccagcaactttggagccatctcctctgtgctgaatgacatc2940
ctgagcagactggacaaggtggaggctgaggtccagattgacagactgattacaggcaga3000
ctccaatccctccaaacctatgtgacccaacaacttatcagggctgctgagattagggca3060
tctgccaacctggctgccaccaagatgagtgagtgtgtgctgggacaaagcaagagggtg3120
gacttctgtggcaagggctaccacctgatgagttttccacagtctgcccctcatggagtg3180
gtgttcctgcatgtgacctatgtgcctgcccaggagaagaacttcaccacagcccctgcc3240
atctgccatgatggcaaggctcactttccaagggagggagtgtttgtgagcaatggcacc3300
cactggtttgtgacccagaggaacttctatgaaccacagattatcaccacagacaacacc3360
tttgtgtctggcaactgtgatgtggtgattggcattgtgaacaacacagtctatgaccca3420
ctccaacctgaactggactccttcaaggaggaactggacaaatacttcaagaaccacacc3480
agccctgatgtggacctgggagacatctctggcatcaatgcctctgtggtgaacatccag3540
aaggagattgacagactgaatgaggtggctaagaacctgaatgagtccctgattgacctc3600
caagaactgggcaaatatgaacaatacatcaagtggccatggtacatctggctgggcttc3660
attgctggactgattgccattgtgatggtgaccataatgctgtgttgtatgacctcctgt3720
tgttcctgtctgaaaggctgttgttcctgtggctcctgttgtaagtttgatgaggatgac3780
tctgaacctgtgctgaaaggagtgaaactgcactacacc3819
<210>2
<211>1273
<212>prt
<213>新型冠状病毒(sars-cov-2)
<400>2
metphevalpheleuvalleuleuproleuvalserserglncysval
151015
asnleuthrthrargthrglnleuproproalatyrthrasnserphe
202530
thrargglyvaltyrtyrproasplysvalpheargserservalleu
354045
hisserthrglnaspleupheleuprophepheserasnvalthrtrp
505560
phehisalailehisvalserglythrasnglythrlysargpheasp
65707580
asnprovalleupropheasnaspglyvaltyrphealaserthrglu
859095
lysserasnileileargglytrpilepheglythrthrleuaspser
100105110
lysthrglnserleuleuilevalasnasnalathrasnvalvalile
115120125
lysvalcysglupheglnphecysasnasppropheleuglyvaltyr
130135140
tyrhislysasnasnlyssertrpmetgluserglupheargvaltyr
145150155160
serseralaasnasncysthrpheglutyrvalserglnpropheleu
165170175
metaspleugluglylysglnglyasnphelysasnleuarggluphe
180185190
valphelysasnileaspglytyrphelysiletyrserlyshisthr
195200205
proileasnleuvalargaspleuproglnglypheseralaleuglu
210215220
proleuvalaspleuproileglyileasnilethrargpheglnthr
225230235240
leuleualaleuhisargsertyrleuthrproglyaspserserser
245250255
glytrpthralaglyalaalaalatyrtyrvalglytyrleuglnpro
260265270
argthrpheleuleulystyrasngluasnglythrilethraspala
275280285
valaspcysalaleuaspproleusergluthrlyscysthrleulys
290295300
serphethrvalglulysglyiletyrglnthrserasnpheargval
305310315320
glnprothrgluserilevalargpheproasnilethrasnleucys
325330335
propheglygluvalpheasnalathrargphealaservaltyrala
340345350
trpasnarglysargileserasncysvalalaasptyrservalleu
355360365
tyrasnseralaserpheserthrphelyscystyrglyvalserpro
370375380
thrlysleuasnaspleucysphethrasnvaltyralaaspserphe
385390395400
valileargglyaspgluvalargglnilealaproglyglnthrgly
405410415
lysilealaasptyrasntyrlysleuproaspaspphethrglycys
420425430
valilealatrpasnserasnasnleuaspserlysvalglyglyasn
435440445
tyrasntyrleutyrargleuphearglysserasnleulysprophe
450455460
gluargaspileserthrgluiletyrglnalaglyserthrprocys
465470475480
asnglyvalgluglypheasncystyrpheproleuglnsertyrgly
485490495
pheglnprothrasnglyvalglytyrglnprotyrargvalvalval
500505510
leuserphegluleuleuhisalaproalathrvalcysglyprolys
515520525
lysserthrasnleuvallysasnlyscysvalasnpheasnpheasn
530535540
glyleuthrglythrglyvalleuthrgluserasnlyslyspheleu
545550555560
propheglnglnpheglyargaspilealaaspthrthraspalaval
565570575
argaspproglnthrleugluileleuaspilethrprocysserphe
580585590
glyglyvalservalilethrproglythrasnthrserasnglnval
595600605
alavalleutyrglnaspvalasncysthrgluvalprovalalaile
610615620
hisalaaspglnleuthrprothrtrpargvaltyrserthrglyser
625630635640
asnvalpheglnthrargalaglycysleuileglyalagluhisval
645650655
asnasnsertyrglucysaspileproileglyalaglyilecysala
660665670
sertyrglnthrglnthrasnserproargargalaargservalala
675680685
serglnserileilealatyrthrmetserleuglyalagluasnser
690695700
valalatyrserasnasnserilealaileprothrasnphethrile
705710715720
servalthrthrgluileleuprovalsermetthrlysthrserval
725730735
aspcysthrmettyrilecysglyaspserthrglucysserasnleu
740745750
leuleuglntyrglyserphecysthrglnleuasnargalaleuthr
755760765
glyilealavalgluglnasplysasnthrglngluvalphealagln
770775780
vallysglniletyrlysthrproproilelysasppheglyglyphe
785790795800
asnpheserglnileleuproaspproserlysproserlysargser
805810815
pheilegluaspleuleupheasnlysvalthrleualaaspalagly
820825830
pheilelysglntyrglyaspcysleuglyaspilealaalaargasp
835840845
leuilecysalaglnlyspheasnglyleuthrvalleuproproleu
850855860
leuthraspglumetilealaglntyrthrseralaleuleualagly
865870875880
thrilethrserglytrpthrpheglyalaglyalaalaleuglnile
885890895
prophealametglnmetalatyrargpheasnglyileglyvalthr
900905910
glnasnvalleutyrgluasnglnlysleuilealaasnglnpheasn
915920925
seralaileglylysileglnaspserleuserserthralaserala
930935940
leuglylysleuglnaspvalvalasnglnasnalaglnalaleuasn
945950955960
thrleuvallysglnleuserserasnpheglyalaileserserval
965970975
leuasnaspileleuserargleuasplysvalglualagluvalgln
980985990
ileaspargleuilethrglyargleuglnserleuglnthrtyrval
99510001005
thrglnglnleuileargalaalagluileargalaseralaasnleu
101010151020
alaalathrlysmetserglucysvalleuglyglnserlysargval
1025103010351040
aspphecysglylysglytyrhisleumetserpheproglnserala
104510501055
prohisglyvalvalpheleuhisvalthrtyrvalproalaglnglu
106010651070
lysasnphethrthralaproalailecyshisaspglylysalahis
107510801085
pheproarggluglyvalphevalserasnglythrhistrppheval
109010951100
thrglnargasnphetyrgluproglnileilethrthraspasnthr
1105111011151120
phevalserglyasncysaspvalvalileglyilevalasnasnthr
112511301135
valtyraspproleuglnprogluleuaspserphelysglugluleu
114011451150
asplystyrphelysasnhisthrserproaspvalaspleuglyasp
115511601165
ileserglyileasnalaservalvalasnileglnlysgluileasp
117011751180
argleuasngluvalalalysasnleuasngluserleuileaspleu
1185119011951200
glngluleuglylystyrgluglntyrilelystrpprotrptyrile
120512101215
trpleuglypheilealaglyleuilealailevalmetvalthrile
122012251230
metleucyscysmetthrsercyscyssercysleulysglycyscys
123512401245
sercysglysercyscyslyspheaspgluaspaspsergluproval
125012551260
leulysglyvallysleuhistyrthr
12651270
<210>3
<211>3819
<212>dna
<213>人工序列(artificialsequence)
<400>3
atgtttgtgttcctggtcctgctgcctcttgtgagttcacaatgtgttaatctgacaacg60
aggactcagctcccccccgcctatacaaatagttttacccgcggcgtgtattatccggat120
aaagtcttcaggtcttctgtgctccacagcacccaggacctgttcctgccttttttttcc180
aatgtgacctggttccacgccatccacgtgtctggaacaaacggtaccaaaagattcgat240
aaccctgtgctgccctttaacgatggagtctactttgctagcaccgagaaaagcaacatt300
attagggggtggatttttggcactaccctcgacagcaaaacccagtcattgcttatcgtc360
aacaacgctaccaacgtcgtgattaaggtttgcgaatttcagttttgcaatgatcctttc420
ctcggcgtgtattatcataagaacaataaatcttggatggaatccgagttccgagtatat480
tcaagcgccaacaactgtacttttgaatatgtgtcccagccattcctcatggatctggaa540
ggcaagcaggggaactttaaaaatctcagagagttcgtattcaagaacattgacgggtac600
tttaagatctatagtaagcatacccccatcaaccttgtaagagacctgccacaggggttt660
agtgccctggagccactcgtggatctgccaatcggaatcaacatcacacgctttcagact720
ttgcttgcgctgcacagaagctatctgaccccgggtgatagctcatctggatggacagcg780
ggggccgccgcgtactacgtcgggtaccttcagcccaggacgttcctgctgaaatacaac840
gaaaacggcaccattaccgacgcagtagactgcgcactcgaccccctgagtgaaacaaag900
tgtacgttgaaaagttttaccgtagagaaaggcatatatcagactagcaattttagggtt960
cagcccacagagtctattgtgcgctttcctaatatcaccaatttgtgcccttttggagaa1020
gtgtttaatgccacccgatttgcgtctgtgtatgcttggaatcgcaaaaggatctcaaac1080
tgcgtcgccgactattccgtgctgtacaactctgcttcatttagcacattcaagtgttat1140
ggggtgagtccaaccaaattgaacgacctctgctttacaaacgtgtacgctgactcattt1200
gtcattagaggcgacgaagtgaggcagattgcccccgggcagacaggaaaaattgcggac1260
tacaactacaagctccctgatgacttcacgggctgtgtcatcgcatggaacagtaacaat1320
cttgatagcaaggtgggcggcaattacaattacctgtacagactgtttagaaaatctaat1380
ctcaaaccctttgaaagggacatttccactgaaatctatcaggccgggagcactccgtgt1440
aacggcgtagaggggtttaactgctatttcccactgcagtcctatggattccagccaaca1500
aacggggtgggctaccaaccctaccgggtagtggtgctgagctttgaacttctgcatgct1560
ccggctaccgtctgtggcccaaagaagagcacaaacctcgtaaagaacaagtgtgttaac1620
ttcaattttaatggcctcaccggaactggcgtcctcactgagtccaataagaagtttctg1680
ccgtttcaacagttcggccgggacatagctgacacgactgacgccgtgagagaccctcaa1740
accctcgaaatactggacatcactccttgctcattcggcggcgtttctgtgataacacca1800
ggcacgaacacttctaatcaggtggctgtgctttatcaggacgtgaactgcacagaagtg1860
cctgtcgccattcatgccgatcagctcacccctacttggagagtttatagcaccggctca1920
aacgtgttccaaacgagagcaggctgccttatcggggcagagcacgtgaacaatagctat1980
gagtgtgatatcccaattggggctggcatatgcgctagctaccagacccagacaaactca2040
cccaggcgggcccggtcagtggctagccagtctattatcgcctacaccatgtccctgggc2100
gccgagaacagtgtcgcgtacagcaataactccatcgctatccctaccaacttcacgatc2160
tcagtgacgactgagatattgccggtttctatgactaagaccagtgtggattgtacaatg2220
tacatctgtggtgatagcacagagtgctctaatctcctgctccaatatgggagcttttgt2280
acccagctgaacagagcattgaccgggattgccgtcgagcaggataagaacacacaagaa2340
gtatttgcccaggtgaaacagatctacaagactccccctattaaagacttcggcggcttt2400
aacttttctcagatactccccgaccctagcaagcctagcaaacggagcttcattgaagat2460
cttttgtttaataaggtcacattggcggatgccggctttatcaagcagtacggggattgt2520
ttgggtgatattgcggctagggatctgatttgtgcccagaagttcaatggcctgacagtg2580
ctgccccccctgcttacagacgagatgattgcgcagtacaccagcgctctgctggcggga2640
accatcacctccggctggacctttggggccggagccgcactccagatcccttttgccatg2700
cagatggcctatagattcaatggaatcggcgtgacacagaacgtcctgtatgagaaccag2760
aaactcatcgctaatcagtttaacagcgccattggcaaaattcaggattctctgagttca2820
accgcatcagctttgggtaaactgcaggatgtcgtaaatcagaatgctcaggccctgaat2880
actcttgttaagcagctctcctctaacttcggcgccatcagttctgtgctgaacgacatt2940
ctgtctagactggacaaggtggaggcagaggtacaaatcgaccgcctgatcaccggacgg3000
ctgcagtcactccaaacatacgtgacccaacagctcatccgggcagccgaaattagagcc3060
tctgcaaatctggccgccacaaagatgagtgagtgcgttctgggtcagtccaaacgagtg3120
gacttctgcggcaaaggttaccacctgatgagtttcccccagtctgccccgcatggcgtg3180
gtattcctgcacgtgacttatgtcccagcccaggaaaagaacttcaccaccgccccagca3240
atttgtcacgatggtaaggcccacttcccccgggaaggcgtttttgtgtccaatggcact3300
cattggttcgtgacacagagaaacttttacgaaccccaaatcattaccaccgacaacact3360
ttcgtcagcgggaattgtgacgtagtaatcgggattgtgaacaacaccgtctatgacccc3420
ctgcagcccgagcttgactcctttaaagaggaactggataagtatttcaagaatcacaca3480
agccctgatgttgatctgggcgacatctctggcattaacgcttcagtggtcaacatacaa3540
aaagagatcgatcgcctcaatgaagtcgccaagaatctcaatgagtcactcatcgatttg3600
caggaactggggaagtacgagcagtatatcaagtggccctggtacatctggctgggattt3660
attgctgggctcatcgctatcgtaatggtcaccattatgttgtgctgcatgacctcctgt3720
tgttcctgtctgaaaggttgttgtagttgcggcagttgttgtaagttcgatgaagatgac3780
tctgagcctgtgctcaagggcgtcaagctccactacaca3819
<210>4
<211>3819
<212>dna
<213>人工序列(artificialsequence)
<400>4
atgttcgtgttcctggtgctgctgcccctggtgagcagccagtgcgtgaacctgaccacc60
agaacccagctgccccccgcctacaccaacagcttcaccagaggcgtgtactaccccgac120
aaggtgttcagaagcagcgtgctgcacagcacccaggacctgttcctgcccttcttcagc180
aacgtgacctggttccacgccatccacgtgagcggcaccaacggcaccaagagattcgac240
aaccccgtgctgcccttcaacgacggcgtgtacttcgccagcaccgagaagagcaacatc300
atcagaggctggatcttcggcaccaccctggacagcaagacccagagcctgctgatcgtg360
aacaacgccaccaacgtggtgatcaaggtgtgcgagttccagttctgcaacgaccccttc420
ctgggcgtgtactaccacaagaacaacaagagctggatggagagcgagttcagagtgtac480
agcagcgccaacaactgcaccttcgagtacgtgagccagcccttcctgatggacctggag540
ggcaagcagggcaacttcaagaacctgagagagttcgtgttcaagaacatcgacggctac600
ttcaagatctacagcaagcacacccccatcaacctggtgagagacctgccccagggcttc660
agcgccctggagcccctggtggacctgcccatcggcatcaacatcaccagattccagacc720
ctgctggccctgcacagaagctacctgacccccggcgacagcagcagcggctggaccgcc780
ggcgccgccgcctactacgtgggctacctgcagcccagaaccttcctgctgaagtacaac840
gagaacggcaccatcaccgacgccgtggactgcgccctggaccccctgagcgagaccaag900
tgcaccctgaagagcttcaccgtggagaagggcatctaccagaccagcaacttcagagtg960
cagcccaccgagagcatcgtgagattccccaacatcaccaacctgtgccccttcggcgag1020
gtgttcaacgccaccagattcgccagcgtgtacgcctggaacagaaagagaatcagcaac1080
tgcgtggccgactacagcgtgctgtacaacagcgccagcttcagcaccttcaagtgctac1140
ggcgtgagccccaccaagctgaacgacctgtgcttcaccaacgtgtacgccgacagcttc1200
gtgatcagaggcgacgaggtgagacagatcgcccccggccagaccggcaagatcgccgac1260
tacaactacaagctgcccgacgacttcaccggctgcgtgatcgcctggaacagcaacaac1320
ctggacagcaaggtgggcggcaactacaactacctgtacagactgttcagaaagagcaac1380
ctgaagcccttcgagagagacatcagcaccgagatctaccaggccggcagcaccccctgc1440
aacggcgtggagggcttcaactgctacttccccctgcagagctacggcttccagcccacc1500
aacggcgtgggctaccagccctacagagtggtggtgctgagcttcgagctgctgcacgcc1560
cccgccaccgtgtgcggccccaagaagagcaccaacctggtgaagaacaagtgcgtgaac1620
ttcaacttcaacggcctgaccggcaccggcgtgctgaccgagagcaacaagaagttcctg1680
cccttccagcagttcggcagagacatcgccgacaccaccgacgccgtgagagacccccag1740
accctggagatcctggacatcaccccctgcagcttcggcggcgtgagcgtgatcaccccc1800
ggcaccaacaccagcaaccaggtggccgtgctgtaccaggacgtgaactgcaccgaggtg1860
cccgtggccatccacgccgaccagctgacccccacctggagagtgtacagcaccggcagc1920
aacgtgttccagaccagagccggctgcctgatcggcgccgagcacgtgaacaacagctac1980
gagtgcgacatccccatcggcgccggcatctgcgccagctaccagacccagaccaacagc2040
cccagaagagccagaagcgtggccagccagagcatcatcgcctacaccatgagcctgggc2100
gccgagaacagcgtggcctacagcaacaacagcatcgccatccccaccaacttcaccatc2160
agcgtgaccaccgagatcctgcccgtgagcatgaccaagaccagcgtggactgcaccatg2220
tacatctgcggcgacagcaccgagtgcagcaacctgctgctgcagtacggcagcttctgc2280
acccagctgaacagagccctgaccggcatcgccgtggagcaggacaagaacacccaggag2340
gtgttcgcccaggtgaagcagatctacaagaccccccccatcaaggacttcggcggcttc2400
aacttcagccagatcctgcccgaccccagcaagcccagcaagagaagcttcatcgaggac2460
ctgctgttcaacaaggtgaccctggccgacgccggcttcatcaagcagtacggcgactgc2520
ctgggcgacatcgccgccagagacctgatctgcgcccagaagttcaacggcctgaccgtg2580
ctgccccccctgctgaccgacgagatgatcgcccagtacaccagcgccctgctggccggc2640
accatcaccagcggctggaccttcggcgccggcgccgccctgcagatccccttcgccatg2700
cagatggcctacagattcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760
aagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagc2820
accgccagcgccctgggcaagctgcaggacgtggtgaaccagaacgcccaggccctgaac2880
accctggtgaagcagctgagcagcaacttcggcgccatcagcagcgtgctgaacgacatc2940
ctgagcagactggacaaggtggaggccgaggtgcagatcgacagactgatcaccggcaga3000
ctgcagagcctgcagacctacgtgacccagcagctgatcagagccgccgagatcagagcc3060
agcgccaacctggccgccaccaagatgagcgagtgcgtgctgggccagagcaagagagtg3120
gacttctgcggcaagggctaccacctgatgagcttcccccagagcgccccccacggcgtg3180
gtgttcctgcacgtgacctacgtgcccgcccaggagaagaacttcaccaccgcccccgcc3240
atctgccacgacggcaaggcccacttccccagagagggcgtgttcgtgagcaacggcacc3300
cactggttcgtgacccagagaaacttctacgagccccagatcatcaccaccgacaacacc3360
ttcgtgagcggcaactgcgacgtggtgatcggcatcgtgaacaacaccgtgtacgacccc3420
ctgcagcccgagctggacagcttcaaggaggagctggacaagtacttcaagaaccacacc3480
agccccgacgtggacctgggcgacatcagcggcatcaacgccagcgtggtgaacatccag3540
aaggagatcgacagactgaacgaggtggccaagaacctgaacgagagcctgatcgacctg3600
caggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttc3660
atcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgcatgaccagctgc3720
tgcagctgcctgaagggctgctgcagctgcggcagctgctgcaagttcgacgaggacgac3780
agcgagcccgtgctgaagggcgtgaagctgcactacacc3819
<210>5
<211>3819
<212>dna
<213>人工序列(artificialsequence)
<400>5
atgttcgtgttcctggtgctgctgcccctggtgagcagccagtgcgtgaacctgaccacc60
cgcacccagctgccccccgcctacaccaacagcttcacccgcggcgtgtactaccccgac120
aaggtgttccgcagcagcgtgctgcacagcacccaggacctgttcctgcccttcttcagc180
aacgtgacctggttccacgccatccacgtgagcggcaccaacggcaccaagcgcttcgac240
aaccccgtgctgcccttcaacgacggcgtgtacttcgccagcaccgagaagagcaacatc300
atccgcggctggatcttcggcaccaccctggacagcaagacccagagcctgctgatcgtg360
aacaacgccaccaacgtggtgatcaaggtgtgcgagttccagttctgcaacgaccccttc420
ctgggcgtgtactaccacaagaacaacaagagctggatggagagcgagttccgcgtgtac480
agcagcgccaacaactgcaccttcgagtacgtgagccagcccttcctgatggacctggag540
ggcaagcagggcaacttcaagaacctgcgcgagttcgtgttcaagaacatcgacggctac600
ttcaagatctacagcaagcacacccccatcaacctggtgcgcgacctgccccagggcttc660
agcgccctggagcccctggtggacctgcccatcggcatcaacatcacccgcttccagacc720
ctgctggccctgcaccgcagctacctgacccccggcgacagcagcagcggctggaccgcc780
ggcgccgccgcctactacgtgggctacctgcagccccgcaccttcctgctgaagtacaac840
gagaacggcaccatcaccgacgccgtggactgcgccctggaccccctgagcgagaccaag900
tgcaccctgaagagcttcaccgtggagaagggcatctaccagaccagcaacttccgcgtg960
cagcccaccgagagcatcgtgcgcttccccaacatcaccaacctgtgccccttcggcgag1020
gtgttcaacgccacccgcttcgccagcgtgtacgcctggaaccgcaagcgcatcagcaac1080
tgcgtggccgactacagcgtgctgtacaacagcgccagcttcagcaccttcaagtgctac1140
ggcgtgagccccaccaagctgaacgacctgtgcttcaccaacgtgtacgccgacagcttc1200
gtgatccgcggcgacgaggtgcgccagatcgcccccggccagaccggcaagatcgccgac1260
tacaactacaagctgcccgacgacttcaccggctgcgtgatcgcctggaacagcaacaac1320
ctggacagcaaggtgggcggcaactacaactacctgtaccgcctgttccgcaagagcaac1380
ctgaagcccttcgagcgcgacatcagcaccgagatctaccaggccggcagcaccccctgc1440
aacggcgtggagggcttcaactgctacttccccctgcagagctacggcttccagcccacc1500
aacggcgtgggctaccagccctaccgcgtggtggtgctgagcttcgagctgctgcacgcc1560
cccgccaccgtgtgcggccccaagaagagcaccaacctggtgaagaacaagtgcgtgaac1620
ttcaacttcaacggcctgaccggcaccggcgtgctgaccgagagcaacaagaagttcctg1680
cccttccagcagttcggccgcgacatcgccgacaccaccgacgccgtgcgcgacccccag1740
accctggagatcctggacatcaccccctgcagcttcggcggcgtgagcgtgatcaccccc1800
ggcaccaacaccagcaaccaggtggccgtgctgtaccaggacgtgaactgcaccgaggtg1860
cccgtggccatccacgccgaccagctgacccccacctggcgcgtgtacagcaccggcagc1920
aacgtgttccagacccgcgccggctgcctgatcggcgccgagcacgtgaacaacagctac1980
gagtgcgacatccccatcggcgccggcatctgcgccagctaccagacccagaccaacagc2040
ccccgccgcgcccgcagcgtggccagccagagcatcatcgcctacaccatgagcctgggc2100
gccgagaacagcgtggcctacagcaacaacagcatcgccatccccaccaacttcaccatc2160
agcgtgaccaccgagatcctgcccgtgagcatgaccaagaccagcgtggactgcaccatg2220
tacatctgcggcgacagcaccgagtgcagcaacctgctgctgcagtacggcagcttctgc2280
acccagctgaaccgcgccctgaccggcatcgccgtggagcaggacaagaacacccaggag2340
gtgttcgcccaggtgaagcagatctacaagaccccccccatcaaggacttcggcggcttc2400
aacttcagccagatcctgcccgaccccagcaagcccagcaagcgcagcttcatcgaggac2460
ctgctgttcaacaaggtgaccctggccgacgccggcttcatcaagcagtacggcgactgc2520
ctgggcgacatcgccgcccgcgacctgatctgcgcccagaagttcaacggcctgaccgtg2580
ctgccccccctgctgaccgacgagatgatcgcccagtacaccagcgccctgctggccggc2640
accatcaccagcggctggaccttcggcgccggcgccgccctgcagatccccttcgccatg2700
cagatggcctaccgcttcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760
aagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagc2820
accgccagcgccctgggcaagctgcaggacgtggtgaaccagaacgcccaggccctgaac2880
accctggtgaagcagctgagcagcaacttcggcgccatcagcagcgtgctgaacgacatc2940
ctgagccgcctggacaaggtggaggccgaggtgcagatcgaccgcctgatcaccggccgc3000
ctgcagagcctgcagacctacgtgacccagcagctgatccgcgccgccgagatccgcgcc3060
agcgccaacctggccgccaccaagatgagcgagtgcgtgctgggccagagcaagcgcgtg3120
gacttctgcggcaagggctaccacctgatgagcttcccccagagcgccccccacggcgtg3180
gtgttcctgcacgtgacctacgtgcccgcccaggagaagaacttcaccaccgcccccgcc3240
atctgccacgacggcaaggcccacttcccccgcgagggcgtgttcgtgagcaacggcacc3300
cactggttcgtgacccagcgcaacttctacgagccccagatcatcaccaccgacaacacc3360
ttcgtgagcggcaactgcgacgtggtgatcggcatcgtgaacaacaccgtgtacgacccc3420
ctgcagcccgagctggacagcttcaaggaggagctggacaagtacttcaagaaccacacc3480
agccccgacgtggacctgggcgacatcagcggcatcaacgccagcgtggtgaacatccag3540
aaggagatcgaccgcctgaacgaggtggccaagaacctgaacgagagcctgatcgacctg3600
caggagctgggcaagtacgagcagtacatcaagtggccctggtacatctggctgggcttc3660
atcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgcatgaccagctgc3720
tgcagctgcctgaagggctgctgcagctgcggcagctgctgcaagttcgacgaggacgac3780
agcgagcccgtgctgaagggcgtgaagctgcactacacc3819
<210>6
<211>3819
<212>dna
<213>人工序列(artificialsequence)
<400>6
atgttcgtgttcctggtgctcctgcccctggtgagctctcagtgcgtgaacctgacaacc60
cggacacagctgcctcctgcctacaccaactctttcacaagaggcgtctactatcctgat120
aaggtgttcagaagctctgtgctgcattctacccaagatctgttcctgcctttcttcagc180
aatgtgacatggttccacgccatccacgtctctgggactaacggtacaaagagattcgac240
aaccccgtactgcctttcaacgacggcgtttacttcgccagcaccgaaaaatctaacatc300
atcaggggatggatctttggcacaaccctggacagcaagacccaatctctgctgatcgtg360
aacaacgccaccaacgtggtgataaaggtttgtgaattccagttctgcaacgaccccttc420
ctgggcgtgtactaccataagaacaacaagagctggatggaaagcgagttcagagtgtac480
agctccgccaacaactgcacattcgagtacgtgtcccagccttttctgatggacctggaa540
ggcaaacaaggcaacttcaagaacctgagagagttcgtgtttaagaacatcgacggctac600
ttcaagatctactccaagcacacccctatcaacctggttcgggatctgcctcagggcttt660
tctgctctggaacctctggtggacctgccaatcggcatcaacatcacacgcttccagacc720
ttgctcgccctgcacagatcctacctgacccctggcgactcctctagcggatggaccgcc780
ggcgcggccgcatactacgtgggatatctgcagcctagaaccttcctgctgaaatacaac840
gagaatggcaccatcacagacgccgtcgattgcgccctggaccctctgagcgagacaaaa900
tgtaccctgaaaagttttaccgtggaaaagggcatctaccagaccagcaattttagagtg960
cagcccaccgaaagcatcgtgcggttccccaacatcaccaacctgtgccccttcggcgag1020
gtcttcaacgccaccagattcgcctctgtctacgcctggaacagaaagagaatcagcaat1080
tgcgtggccgactacagcgtgctgtacaacagcgccagcttctctacgttcaagtgctac1140
ggcgtaagccctaccaagctgaacgacctgtgcttcaccaacgtgtacgccgactccttt1200
gtgatccggggagacgaggtgcggcagattgcccctggccagaccggcaagatcgctgac1260
tacaactacaagctgcccgatgatttcaccggctgcgtgatcgcttggaacagcaacaac1320
cttgactcaaaggtaggaggcaattacaactacctgtacagactgtttcggaagagcaac1380
ctgaagcctttcgagagagatatctcgacagagatctatcaggccggatctacgccctgt1440
aatggcgttgaaggctttaactgctactttcccctgcagtcttacggctttcagcctacc1500
aatggagttggttaccagccataccgggtggtggtgctcagcttcgagctgctccacgcc1560
ccagctaccgtgtgcggccctaagaagtctaccaacctcgttaagaacaagtgcgtgaac1620
ttcaatttcaacggcctgaccggaaccggcgtgctgaccgagagcaacaaaaagttcctg1680
ccgttccaacagtttggcagagacatcgccgataccacagatgccgttagagatcctcag1740
acactggaaatcctggatatcacaccttgcagcttcggcggagtgagcgtgatcaccccc1800
ggcaccaacacctctaaccaggtggctgtgctgtaccaggacgtgaactgcaccgaggtc1860
cccgtcgccatccacgccgaccaactgacccccacctggcgggtgtacagcaccggcagc1920
aacgtgttccagaccagagccggctgtctgatcggcgccgagcacgtgaacaatagttat1980
gaatgtgacatccccatcggagctggcatttgcgcttcttaccagactcagaccaattct2040
ccacgcagagctcggagcgtggccagccagtccatcatcgcctatactatgagcctgggc2100
gctgagaacagcgtggcatacagcaacaacagcatcgcaatccccaccaattttacaatc2160
agtgtgaccaccgaaatcctgcctgtgagcatgaccaagaccagcgtggactgcaccatg2220
tacatctgcggcgacagcacagagtgcagcaacctgctgctgcagtacggctccttttgc2280
acccagctgaatagagctctgacaggcatcgctgttgaacaggataagaacacccaagag2340
gtgttcgcccaggtaaagcagatctacaagacccctcctatcaaggacttcggcggcttt2400
aacttcagccagatcctgcctgacccaagcaaaccctccaaacggagctttattgaggat2460
ctgctgttcaacaaggtgaccctggccgacgccggattcatcaagcagtacggcgactgc2520
ctgggcgacatcgccgccagagatctgatctgcgcccagaaattcaacgggctgacagtg2580
ctgcctccactgctgaccgatgagatgatcgcccagtatacaagcgccctgctcgctggc2640
acgatcaccagcggatggacattcggagccggcgccgctctgcaaatccctttcgccatg2700
cagatggcctacagattcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760
aagctgatcgctaaccagttcaatagcgccatcgggaagatccaggacagcctgtcatcc2820
acagccagcgccctgggcaagctgcaggacgtggtgaatcaaaacgctcaggcgctgaac2880
acactggtgaagcaactgagcagcaacttcggcgccatcagctcagtgctgaacgatatt2940
ctgtctagactggacaaagtggaggccgaggtgcagatagatagactgatcaccggcaga3000
ctgcagagcctgcaaacctacgtgacccagcagctgatccgggccgccgaaatccgggcc3060
agcgccaatctggcagccactaagatgtctgagtgcgtgctgggccagagcaagcgggtg3120
gacttctgcggcaagggctaccacctgatgagcttcccacaatctgcccctcacggcgtg3180
gtgttcctacacgtgacatacgtgcctgctcaggagaagaatttcacgaccgcccctgct3240
atctgtcacgacggaaaggcccacttccctagagaaggcgtctttgtgagcaacggaaca3300
cactggttcgtgacacagagaaacttctacgagcctcagatcatcacaactgataacaca3360
ttcgtgagcgggaactgcgacgtcgtgatcggcatcgtgaacaataccgtttacgaccct3420
ctgcagcctgagctggactccttcaaagaggaactggataagtacttcaagaaccacacc3480
agcccagacgtcgacctgggcgacattagcggcatcaacgccagcgtggtcaacatccag3540
aaggaaatcgatagactgaacgaggtcgccaagaacctgaatgaaagtttgatcgacctg3600
caggaactgggcaagtacgagcagtacatcaagtggccttggtacatttggctgggattc3660
atcgccggcctgatcgccatcgtgatggtcaccatcatgctgtgttgcatgacaagctgc3720
tgctcctgcctgaagggctgttgttcttgtggaagctgctgtaaattcgacgaggacgat3780
tccgagcccgtgctgaagggcgtgaagctgcactacacc3819
<210>7
<211>3819
<212>dna
<213>人工序列(artificialsequence)
<400>7
atgttcgtgttcctggtgctgctgcccctggtgtcctctcagtgtgtgaacctgaccacc60
agaacacagctgcctccagcctacaccaacagcttcaccagaggcgtgtactaccccgac120
aaggtgttccggtcctccgtgctgcattctacccaggacctgttcctgcctttcttcagc180
aacgtgacctggttccacgccatccatgtgtctggcaccaacggcaccaagagattcgac240
aaccccgtgctgcctttcaacgacggggtgtactttgcctccaccgagaagtccaacatc300
atcagaggctggatcttcggcaccacactggacagcaagacccagagcctgctgatcgtg360
aacaacgccaccaacgtggtcatcaaagtgtgcgagttccagttctgcaacgaccccttc420
ctgggcgtctactaccacaagaacaacaagtcctggatggaatccgagttccgggtgtac480
tcctccgccaacaactgcaccttcgagtacgtgtcccagcctttcctgatggacctggaa540
ggcaagcagggcaacttcaagaacctgcgcgagttcgtgtttaagaacatcgacggctac600
ttcaagatctactccaagcacacccctatcaacctcgtgcgggatctgcctcagggcttc660
tctgctctggaacccctggtggatctgcccatcggcatcaacatcacccggtttcagacc720
ctgctggccctgcaccggtcttatttgacccctggcgactcctcttctggctggactgct780
ggtgccgctgcttactacgtgggctacctgcagcctagaaccttcctgctgaagtacaac840
gagaatggcaccatcaccgacgccgtggactgtgctctggatcctctgtccgagacaaag900
tgcaccctgaagtccttcaccgtggaaaagggcatctaccagacctccaacttccgggtg960
cagcccaccgagtctatcgtgcggttccctaacatcaccaacctgtgtcctttcggcgag1020
gtgttcaatgccaccagattcgcctctgtgtacgcctggaaccggaagcggatctctaac1080
tgcgtggccgactacagcgtgctgtacaactccgcctccttcagcaccttcaagtgctac1140
ggcgtgtcccctaccaagctgaacgacctgtgcttcacaaacgtgtacgccgactccttc1200
gtgatccggggagatgaagtgcggcagatcgctcctggacagaccggcaagatcgccgat1260
tacaactacaagctgcccgacgacttcaccggctgtgtgatcgcttggaactccaacaac1320
ctggactccaaagtcggcggcaactacaactacctgtaccggctgttccggaagtctaac1380
ctgaagcctttcgagcgggacatcagcaccgagatctaccaggctggcagcaccccttgt1440
aacggcgtggaaggcttcaactgctacttcccactgcagtcctacggctttcagcctacc1500
aatggcgtgggctatcagccctacagagtggtggtgctgtccttcgagctgctgcatgct1560
cctgctaccgtgtgcggccctaagaaatctaccaacctggtcaagaacaaatgcgtgaac1620
ttcaacttcaacggcctgaccggcaccggcgtgctgacagagtccaacaagaagttcctg1680
ccattccagcagttcggccgggatatcgccgataccacagatgccgtcagggaccctcag1740
acactggaaatcctggacatcaccccttgcagcttcggcggagtgtctgtgatcacccca1800
ggcaccaacacctctaaccaggtggccgtgctgtatcaggacgtgaactgtaccgaggtg1860
cccgtggctatccatgccgatcagctgacccctacatggcgcgtgtactccaccggctcc1920
aacgtgttccagacaagagctggctgtctgatcggcgctgagcacgtgaacaattcctac1980
gagtgcgacatccccatcggagccggaatctgcgcctcttatcagacccagaccaactct2040
cccagacgggccagatctgtggccagccagtctatcattgcttacaccatgagcctgggc2100
gccgagaactctgtggcctacagcaacaactctatcgctatccccaccaacttcaccatc2160
tccgtgaccacagagatcctgcctgtgtccatgaccaagaccagcgtggactgcaccatg2220
tacatctgcggcgactctaccgagtgctccaacctgctgctgcagtacggctccttctgc2280
acccagctgaatagagccctgaccggaatcgccgtggaacaggacaagaacacccaagag2340
gtgttcgcccaagtgaagcagatctacaagacccctcctatcaaggacttcggcggcttc2400
aatttctcccagattctgcccgatcctagcaagccctccaagcggtctttcatcgaggac2460
ctgctgttcaacaaagtgacactggccgacgccggcttcatcaagcagtatggcgattgc2520
ctgggcgacattgccgccagggatctgatctgtgcccagaagtttaacggactgacagtg2580
ctgcctcctctgctgaccgatgagatgatcgcccagtacacctccgcactgctggctggc2640
acaatcacctctggatggacatttggcgctggcgccgctctgcagatccctttcgctatg2700
cagatggcctaccggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccag2760
aagctgatcgccaaccagttcaacagcgccatcggaaagatccaggacagcctgtccagc2820
accgcttctgccctgggaaagctgcaggatgtggtcaaccagaacgctcaggccctgaac2880
accctcgtgaagcagctgtcctctaacttcggcgccatctcctctgtgctgaacgatatc2940
ctgagccggctggacaaggtggaagccgaggtgcagatcgacagactgatcaccggacgg3000
ctgcagtccctgcagacctatgttacccagcagctgatcagagccgccgagattagagcc3060
tctgccaatctggccgccaccaagatgtctgagtgtgtgctgggccagtccaagagagtg3120
gacttttgcggcaagggctaccacctgatgagcttccctcagtctgctcctcacggcgtg3180
gtgtttctgcacgtgacctacgtgcccgctcaagagaagaactttaccaccgctcctgcc3240
atctgccacgacggcaaggctcactttcctcgagaaggcgtgttcgtgtctaacggcacc3300
cattggttcgtgacacagcggaacttctacgagccccagatcatcaccaccgacaacacc3360
tttgtgtccggcaactgcgacgtcgtgatcggaattgtgaacaataccgtgtacgaccct3420
ctgcagcccgagctggactccttcaaagaggaactggacaagtactttaagaaccacaca3480
agccccgacgtggacctgggagacatctctggcatcaacgcctccgtggtcaacatccag3540
aaagagatcgaccggctgaacgaggtggccaagaatctgaacgagtccctgatcgacctg3600
caagaactggggaagtacgagcagtacatcaagtggccctggtacatctggctgggcttt3660
atcgctggcctgatcgctatcgtgatggtcacaatcatgctgtgctgtatgacctcctgc3720
tgctcttgcctgaagggctgctgttcttgcggctcttgctgcaagttcgacgaggacgac3780
tctgagcccgtgctgaaaggcgtgaagctgcactacacc3819
<210>8
<211>3708
<212>dna
<213>人工序列(artificialsequence)
<400>8
atgttcgtgttcctggtgctgctgcccctggtgagcagccagtgcgtgaacctgaccacc60
cgcacccagctgccccccgcctacaccaacagcttcacccgcggcgtgtactaccccgac120
aaggtgttccgcagcagcgtgctgcacagcacccaggacctgttcctgcccttcttcagc180
aacgtgacctggttccacgccatccacgtgagcggcaccaacggcaccaagcgcttcgac240
aaccccgtgctgcccttcaacgacggcgtgtacttcgccagcaccgagaagagcaacatc300
atccgcggctggatcttcggcaccaccctggacagcaagacccagagcctgctgatcgtg360
aacaacgccaccaacgtggtgatcaaggtgtgcgagttccagttctgcaacgaccccttc420
ctgggcgtgtactaccacaagaacaacaagagctggatggagagcgagttccgcgtgtac480
agcagcgccaacaactgcaccttcgagtacgtgagccagcccttcctgatggacctggag540
ggcaagcagggcaacttcaagaacctgcgcgagttcgtgttcaagaacatcgacggctac600
ttcaagatctacagcaagcacacccccatcaacctggtgcgcgacctgccccagggcttc660
agcgccctggagcccctggtggacctgcccatcggcatcaacatcacccgcttccagacc720
ctgctggccctgcaccgcagctacctgacccccggcgacagcagcagcggctggaccgcc780
ggcgccgccgcctactacgtgggctacctgcagccccgcaccttcctgctgaagtacaac840
gagaacggcaccatcaccgacgccgtggactgcgccctggaccccctgagcgagaccaag900
tgcaccctgaagagcttcaccgtggagaagggcatctaccagaccagcaacttccgcgtg960
cagcccaccgagagcatcgtgcgcttccccaacatcaccaacctgtgccccttcggcgag1020
gtgttcaacgccacccgcttcgccagcgtgtacgcctggaaccgcaagcgcatcagcaac1080
tgcgtggccgactacagcgtgctgtacaacagcgccagcttcagcaccttcaagtgctac1140
ggcgtgagccccaccaagctgaacgacctgtgcttcaccaacgtgtacgccgacagcttc1200
gtgatccgcggcgacgaggtgcgccagatcgcccccggccagaccggcaagatcgccgac1260
tacaactacaagctgcccgacgacttcaccggctgcgtgatcgcctggaacagcaacaac1320
ctggacagcaaggtgggcggcaactacaactacctgtaccgcctgttccgcaagagcaac1380
ctgaagcccttcgagcgcgacatcagcaccgagatctaccaggccggcagcaccccctgc1440
aacggcgtggagggcttcaactgctacttccccctgcagagctacggcttccagcccacc1500
aacggcgtgggctaccagccctaccgcgtggtggtgctgagcttcgagctgctgcacgcc1560
cccgccaccgtgtgcggccccaagaagagcaccaacctggtgaagaacaagtgcgtgaac1620
ttcaacttcaacggcctgaccggcaccggcgtgctgaccgagagcaacaagaagttcctg1680
cccttccagcagttcggccgcgacatcgccgacaccaccgacgccgtgcgcgacccccag1740
accctggagatcctggacatcaccccctgcagcttcggcggcgtgagcgtgatcaccccc1800
ggcaccaacaccagcaaccaggtggccgtgctgtaccaggacgtgaactgcaccgaggtg1860
cccgtggccatccacgccgaccagctgacccccacctggcgcgtgtacagcaccggcagc1920
aacgtgttccagacccgcgccggctgcctgatcggcgccgagcacgtgaacaacagctac1980
gagtgcgacatccccatcggcgccggcatctgcgccagctaccagacccagaccaacagc2040
cccggcagcgccagcagcgtggccagccagagcatcatcgcctacaccatgagcctgggc2100
gccgagaacagcgtggcctacagcaacaacagcatcgccatccccaccaacttcaccatc2160
agcgtgaccaccgagatcctgcccgtgagcatgaccaagaccagcgtggactgcaccatg2220
tacatctgcggcgacagcaccgagtgcagcaacctgctgctgcagtacggcagcttctgc2280
acccagctgaaccgcgccctgaccggcatcgccgtggagcaggacaagaacacccaggag2340
gtgttcgcccaggtgaagcagatctacaagaccccccccatcaaggacttcggcggcttc2400
aacttcagccagatcctgcccgaccccagcaagcccagcaagcgcagcttcatcgaggac2460
ctgctgttcaacaaggtgaccctggccgacgccggcttcatcaagcagtacggcgactgc2520
ctgggcgacatcgccgcccgcgacctgatctgcgcccagaagttcaacggcctgaccgtg2580
ctgccccccctgctgaccgacgagatgatcgcccagtacaccagcgccctgctggccggc2640
accatcaccagcggctggaccttcggcgccggcgccgccctgcagatccccttcgccatg2700
cagatggcctaccgcttcaacggcatcggcgtgacccagaacgtgctgtacgagaaccag2760
aagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagc2820
accgccagcgccctgggcaagctgcaggacgtggtgaaccagaacgcccaggccctgaac2880
accctggtgaagcagctgagcagcaacttcggcgccatcagcagcgtgctgaacgacatc2940
ctgagccgcctggacgtgaaggaggccgaggtgcagatcgaccgcctgatcaccggccgc3000
ctgcagagcctgcagacctacgtgacccagcagctgatccgcgccgccgagatccgcgcc3060
agcgccaacctggccgccaccaagatgagcgagtgcgtgctgggccagagcaagcgcgtg3120
gacttctgcggcaagggctaccacctgatgagcttcccccagagcgccccccacggcgtg3180
gtgttcctgcacgtgacctacgtgcccgcccaggagaagaacttcaccaccgcccccgcc3240
atctgccacgacggcaaggcccacttcccccgcgagggcgtgttcgtgagcaacggcacc3300
cactggttcgtgacccagcgcaacttctacgagccccagatcatcaccaccgacaacacc3360
ttcgtgagcggcaactgcgacgtggtgatcggcatcgtgaacaacaccgtgtacgacccc3420
ctgcagcccgagctggacagcttcaaggaggagctggacaagtacttcaagaaccacacc3480
agccccgacgtggacctgggcgacatcagcggcatcaacgccagcgtggtgaacatccag3540
aaggagatcgaccgcctgaacgaggtggccaagaacctgaacgagagcctgatcgacctg3600
caggagctgggcaagtacgagcagggctacatccccgaggccccccgcgacggccaggcc3660
tacgtgcgcaaggacggcgagtgggtgctgctgagcaccttcctgtga3708
<210>9
<211>1235
<212>prt
<213>人工序列(artificialsequence)
<400>9
metphevalpheleuvalleuleuproleuvalserserglncysval
151015
asnleuthrthrargthrglnleuproproalatyrthrasnserphe
202530
thrargglyvaltyrtyrproasplysvalpheargserservalleu
354045
hisserthrglnaspleupheleuprophepheserasnvalthrtrp
505560
phehisalailehisvalserglythrasnglythrlysargpheasp
65707580
asnprovalleupropheasnaspglyvaltyrphealaserthrglu
859095
lysserasnileileargglytrpilepheglythrthrleuaspser
100105110
lysthrglnserleuleuilevalasnasnalathrasnvalvalile
115120125
lysvalcysglupheglnphecysasnasppropheleuglyvaltyr
130135140
tyrhislysasnasnlyssertrpmetgluserglupheargvaltyr
145150155160
serseralaasnasncysthrpheglutyrvalserglnpropheleu
165170175
metaspleugluglylysglnglyasnphelysasnleuarggluphe
180185190
valphelysasnileaspglytyrphelysiletyrserlyshisthr
195200205
proileasnleuvalargaspleuproglnglypheseralaleuglu
210215220
proleuvalaspleuproileglyileasnilethrargpheglnthr
225230235240
leuleualaleuhisargsertyrleuthrproglyaspserserser
245250255
glytrpthralaglyalaalaalatyrtyrvalglytyrleuglnpro
260265270
argthrpheleuleulystyrasngluasnglythrilethraspala
275280285
valaspcysalaleuaspproleusergluthrlyscysthrleulys
290295300
serphethrvalglulysglyiletyrglnthrserasnpheargval
305310315320
glnprothrgluserilevalargpheproasnilethrasnleucys
325330335
propheglygluvalpheasnalathrargphealaservaltyrala
340345350
trpasnarglysargileserasncysvalalaasptyrservalleu
355360365
tyrasnseralaserpheserthrphelyscystyrglyvalserpro
370375380
thrlysleuasnaspleucysphethrasnvaltyralaaspserphe
385390395400
valileargglyaspgluvalargglnilealaproglyglnthrgly
405410415
lysilealaasptyrasntyrlysleuproaspaspphethrglycys
420425430
valilealatrpasnserasnasnleuaspserlysvalglyglyasn
435440445
tyrasntyrleutyrargleuphearglysserasnleulysprophe
450455460
gluargaspileserthrgluiletyrglnalaglyserthrprocys
465470475480
asnglyvalgluglypheasncystyrpheproleuglnsertyrgly
485490495
pheglnprothrasnglyvalglytyrglnprotyrargvalvalval
500505510
leuserphegluleuleuhisalaproalathrvalcysglyprolys
515520525
lysserthrasnleuvallysasnlyscysvalasnpheasnpheasn
530535540
glyleuthrglythrglyvalleuthrgluserasnlyslyspheleu
545550555560
propheglnglnpheglyargaspilealaaspthrthraspalaval
565570575
argaspproglnthrleugluileleuaspilethrprocysserphe
580585590
glyglyvalservalilethrproglythrasnthrserasnglnval
595600605
alavalleutyrglnaspvalasncysthrgluvalprovalalaile
610615620
hisalaaspglnleuthrprothrtrpargvaltyrserthrglyser
625630635640
asnvalpheglnthrargalaglycysleuileglyalagluhisval
645650655
asnasnsertyrglucysaspileproileglyalaglyilecysala
660665670
sertyrglnthrglnthrasnserproglyseralaserservalala
675680685
serglnserileilealatyrthrmetserleuglyalagluasnser
690695700
valalatyrserasnasnserilealaileprothrasnphethrile
705710715720
servalthrthrgluileleuprovalsermetthrlysthrserval
725730735
aspcysthrmettyrilecysglyaspserthrglucysserasnleu
740745750
leuleuglntyrglyserphecysthrglnleuasnargalaleuthr
755760765
glyilealavalgluglnasplysasnthrglngluvalphealagln
770775780
vallysglniletyrlysthrproproilelysasppheglyglyphe
785790795800
asnpheserglnileleuproaspproserlysproserlysargser
805810815
pheilegluaspleuleupheasnlysvalthrleualaaspalagly
820825830
pheilelysglntyrglyaspcysleuglyaspilealaalaargasp
835840845
leuilecysalaglnlyspheasnglyleuthrvalleuproproleu
850855860
leuthraspglumetilealaglntyrthrseralaleuleualagly
865870875880
thrilethrserglytrpthrpheglyalaglyalaalaleuglnile
885890895
prophealametglnmetalatyrargpheasnglyileglyvalthr
900905910
glnasnvalleutyrgluasnglnlysleuilealaasnglnpheasn
915920925
seralaileglylysileglnaspserleuserserthralaserala
930935940
leuglylysleuglnaspvalvalasnglnasnalaglnalaleuasn
945950955960
thrleuvallysglnleuserserasnpheglyalaileserserval
965970975
leuasnaspileleuserargleuaspproproglualagluvalgln
980985990
ileaspargleuilethrglyargleuglnserleuglnthrtyrval
99510001005
thrglnglnleuileargalaalagluileargalaseralaasnleu
101010151020
alaalathrlysmetserglucysvalleuglyglnserlysargval
1025103010351040
aspphecysglylysglytyrhisleumetserpheproglnserala
104510501055
prohisglyvalvalpheleuhisvalthrtyrvalproalaglnglu
106010651070
lysasnphethrthralaproalailecyshisaspglylysalahis
107510801085
pheproarggluglyvalphevalserasnglythrhistrppheval
109010951100
thrglnargasnphetyrgluproglnileilethrthraspasnthr
1105111011151120
phevalserglyasncysaspvalvalileglyilevalasnasnthr
112511301135
valtyraspproleuglnprogluleuaspserphelysglugluleu
114011451150
asplystyrphelysasnhisthrserproaspvalaspleuglyasp
115511601165
ileserglyileasnalaservalvalasnileglnlysgluileasp
117011751180
argleuasngluvalalalysasnleuasngluserleuileaspleu
1185119011951200
glngluleuglylystyrgluglnglytyrileproglualaproarg
120512101215
aspglyglnalatyrvalarglysaspglyglutrpvalleuleuser
122012251230
thrpheleu
1235
<210>10
<211>3735
<212>dna
<213>人工序列(artificialsequence)
<400>10
atggacgccatgaagcgcggcctgtgctgcgtgctgctgctgtgcggcgccgtgttcgtg60
agcgcccagtgcgtgaacctgaccacccgcacccagctgccccccgcctacaccaacagc120
ttcacccgcggcgtgtactaccccgacaaggtgttccgcagcagcgtgctgcacagcacc180
caggacctgttcctgcccttcttcagcaacgtgacctggttccacgccatccacgtgagc240
ggcaccaacggcaccaagcgcttcgacaaccccgtgctgcccttcaacgacggcgtgtac300
ttcgccagcaccgagaagagcaacatcatccgcggctggatcttcggcaccaccctggac360
agcaagacccagagcctgctgatcgtgaacaacgccaccaacgtggtgatcaaggtgtgc420
gagttccagttctgcaacgaccccttcctgggcgtgtactaccacaagaacaacaagagc480
tggatggagagcgagttccgcgtgtacagcagcgccaacaactgcaccttcgagtacgtg540
agccagcccttcctgatggacctggagggcaagcagggcaacttcaagaacctgcgcgag600
ttcgtgttcaagaacatcgacggctacttcaagatctacagcaagcacacccccatcaac660
ctggtgcgcgacctgccccagggcttcagcgccctggagcccctggtggacctgcccatc720
ggcatcaacatcacccgcttccagaccctgctggccctgcaccgcagctacctgaccccc780
ggcgacagcagcagcggctggaccgccggcgccgccgcctactacgtgggctacctgcag840
ccccgcaccttcctgctgaagtacaacgagaacggcaccatcaccgacgccgtggactgc900
gccctggaccccctgagcgagaccaagtgcaccctgaagagcttcaccgtggagaagggc960
atctaccagaccagcaacttccgcgtgcagcccaccgagagcatcgtgcgcttccccaac1020
atcaccaacctgtgccccttcggcgaggtgttcaacgccacccgcttcgccagcgtgtac1080
gcctggaaccgcaagcgcatcagcaactgcgtggccgactacagcgtgctgtacaacagc1140
gccagcttcagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacctgtgc1200
ttcaccaacgtgtacgccgacagcttcgtgatccgcggcgacgaggtgcgccagatcgcc1260
cccggccagaccggcaagatcgccgactacaactacaagctgcccgacgacttcaccggc1320
tgcgtgatcgcctggaacagcaacaacctggacagcaaggtgggcggcaactacaactac1380
ctgtaccgcctgttccgcaagagcaacctgaagcccttcgagcgcgacatcagcaccgag1440
atctaccaggccggcagcaccccctgcaacggcgtggagggcttcaactgctacttcccc1500
ctgcagagctacggcttccagcccaccaacggcgtgggctaccagccctaccgcgtggtg1560
gtgctgagcttcgagctgctgcacgcccccgccaccgtgtgcggccccaagaagagcacc1620
aacctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcaccggcgtg1680
ctgaccgagagcaacaagaagttcctgcccttccagcagttcggccgcgacatcgccgac1740
accaccgacgccgtgcgcgacccccagaccctggagatcctggacatcaccccctgcagc1800
ttcggcggcgtgagcgtgatcacccccggcaccaacaccagcaaccaggtggccgtgctg1860
taccaggacgtgaactgcaccgaggtgcccgtggccatccacgccgaccagctgaccccc1920
acctggcgcgtgtacagcaccggcagcaacgtgttccagacccgcgccggctgcctgatc1980
ggcgccgagcacgtgaacaacagctacgagtgcgacatccccatcggcgccggcatctgc2040
gccagctaccagacccagaccaacagccccggcagcgccagcagcgtggccagccagagc2100
atcatcgcctacaccatgagcctgggcgccgagaacagcgtggcctacagcaacaacagc2160
atcgccatccccaccaacttcaccatcagcgtgaccaccgagatcctgcccgtgagcatg2220
accaagaccagcgtggactgcaccatgtacatctgcggcgacagcaccgagtgcagcaac2280
ctgctgctgcagtacggcagcttctgcacccagctgaaccgcgccctgaccggcatcgcc2340
gtggagcaggacaagaacacccaggaggtgttcgcccaggtgaagcagatctacaagacc2400
ccccccatcaaggacttcggcggcttcaacttcagccagatcctgcccgaccccagcaag2460
cccagcaagcgcagcttcatcgaggacctgctgttcaacaaggtgaccctggccgacgcc2520
ggcttcatcaagcagtacggcgactgcctgggcgacatcgccgcccgcgacctgatctgc2580
gcccagaagttcaacggcctgaccgtgctgccccccctgctgaccgacgagatgatcgcc2640
cagtacaccagcgccctgctggccggcaccatcaccagcggctggaccttcggcgccggc2700
gccgccctgcagatccccttcgccatgcagatggcctaccgcttcaacggcatcggcgtg2760
acccagaacgtgctgtacgagaaccagaagctgatcgccaaccagttcaacagcgccatc2820
ggcaagatccaggacagcctgagcagcaccgccagcgccctgggcaagctgcaggacgtg2880
gtgaaccagaacgcccaggccctgaacaccctggtgaagcagctgagcagcaacttcggc2940
gccatcagcagcgtgctgaacgacatcctgagccgcctggacgtgaaggaggccgaggtg3000
cagatcgaccgcctgatcaccggccgcctgcagagcctgcagacctacgtgacccagcag3060
ctgatccgcgccgccgagatccgcgccagcgccaacctggccgccaccaagatgagcgag3120
tgcgtgctgggccagagcaagcgcgtggacttctgcggcaagggctaccacctgatgagc3180
ttcccccagagcgccccccacggcgtggtgttcctgcacgtgacctacgtgcccgcccag3240
gagaagaacttcaccaccgcccccgccatctgccacgacggcaaggcccacttcccccgc3300
gagggcgtgttcgtgagcaacggcacccactggttcgtgacccagcgcaacttctacgag3360
ccccagatcatcaccaccgacaacaccttcgtgagcggcaactgcgacgtggtgatcggc3420
atcgtgaacaacaccgtgtacgaccccctgcagcccgagctggacagcttcaaggaggag3480
ctggacaagtacttcaagaaccacaccagccccgacgtggacctgggcgacatcagcggc3540
atcaacgccagcgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggccaag3600
aacctgaacgagagcctgatcgacctgcaggagctgggcaagtacgagcagggctacatc3660
cccgaggccccccgcgacggccaggcctacgtgcgcaaggacggcgagtgggtgctgctg3720
agcaccttcctgtga3735
<210>11
<211>1244
<212>prt
<213>人工序列(artificialsequence)
<400>11
metaspalametlysargglyleucyscysvalleuleuleucysgly
151015
alavalphevalseralaglncysvalasnleuthrthrargthrgln
202530
leuproproalatyrthrasnserphethrargglyvaltyrtyrpro
354045
asplysvalpheargserservalleuhisserthrglnaspleuphe
505560
leuprophepheserasnvalthrtrpphehisalailehisvalser
65707580
glythrasnglythrlysargpheaspasnprovalleupropheasn
859095
aspglyvaltyrphealaserthrglulysserasnileilearggly
100105110
trpilepheglythrthrleuaspserlysthrglnserleuleuile
115120125
valasnasnalathrasnvalvalilelysvalcysglupheglnphe
130135140
cysasnasppropheleuglyvaltyrtyrhislysasnasnlysser
145150155160
trpmetgluserglupheargvaltyrserseralaasnasncysthr
165170175
pheglutyrvalserglnpropheleumetaspleugluglylysgln
180185190
glyasnphelysasnleuarggluphevalphelysasnileaspgly
195200205
tyrphelysiletyrserlyshisthrproileasnleuvalargasp
210215220
leuproglnglypheseralaleugluproleuvalaspleuproile
225230235240
glyileasnilethrargpheglnthrleuleualaleuhisargser
245250255
tyrleuthrproglyaspserserserglytrpthralaglyalaala
260265270
alatyrtyrvalglytyrleuglnproargthrpheleuleulystyr
275280285
asngluasnglythrilethraspalavalaspcysalaleuasppro
290295300
leusergluthrlyscysthrleulysserphethrvalglulysgly
305310315320
iletyrglnthrserasnpheargvalglnprothrgluserileval
325330335
argpheproasnilethrasnleucyspropheglygluvalpheasn
340345350
alathrargphealaservaltyralatrpasnarglysargileser
355360365
asncysvalalaasptyrservalleutyrasnseralaserpheser
370375380
thrphelyscystyrglyvalserprothrlysleuasnaspleucys
385390395400
phethrasnvaltyralaaspserphevalileargglyaspgluval
405410415
argglnilealaproglyglnthrglylysilealaasptyrasntyr
420425430
lysleuproaspaspphethrglycysvalilealatrpasnserasn
435440445
asnleuaspserlysvalglyglyasntyrasntyrleutyrargleu
450455460
phearglysserasnleulysprophegluargaspileserthrglu
465470475480
iletyrglnalaglyserthrprocysasnglyvalgluglypheasn
485490495
cystyrpheproleuglnsertyrglypheglnprothrasnglyval
500505510
glytyrglnprotyrargvalvalvalleuserphegluleuleuhis
515520525
alaproalathrvalcysglyprolyslysserthrasnleuvallys
530535540
asnlyscysvalasnpheasnpheasnglyleuthrglythrglyval
545550555560
leuthrgluserasnlyslyspheleupropheglnglnpheglyarg
565570575
aspilealaaspthrthraspalavalargaspproglnthrleuglu
580585590
ileleuaspilethrprocysserpheglyglyvalservalilethr
595600605
proglythrasnthrserasnglnvalalavalleutyrglnaspval
610615620
asncysthrgluvalprovalalailehisalaaspglnleuthrpro
625630635640
thrtrpargvaltyrserthrglyserasnvalpheglnthrargala
645650655
glycysleuileglyalagluhisvalasnasnsertyrglucysasp
660665670
ileproileglyalaglyilecysalasertyrglnthrglnthrasn
675680685
serproglyseralaserservalalaserglnserileilealatyr
690695700
thrmetserleuglyalagluasnservalalatyrserasnasnser
705710715720
ilealaileprothrasnphethrileservalthrthrgluileleu
725730735
provalsermetthrlysthrservalaspcysthrmettyrilecys
740745750
glyaspserthrglucysserasnleuleuleuglntyrglyserphe
755760765
cysthrglnleuasnargalaleuthrglyilealavalgluglnasp
770775780
lysasnthrglngluvalphealaglnvallysglniletyrlysthr
785790795800
proproilelysasppheglyglypheasnpheserglnileleupro
805810815
aspproserlysproserlysargserpheilegluaspleuleuphe
820825830
asnlysvalthrleualaaspalaglypheilelysglntyrglyasp
835840845
cysleuglyaspilealaalaargaspleuilecysalaglnlysphe
850855860
asnglyleuthrvalleuproproleuleuthraspglumetileala
865870875880
glntyrthrseralaleuleualaglythrilethrserglytrpthr
885890895
pheglyalaglyalaalaleuglnileprophealametglnmetala
900905910
tyrargpheasnglyileglyvalthrglnasnvalleutyrgluasn
915920925
glnlysleuilealaasnglnpheasnseralaileglylysilegln
930935940
aspserleuserserthralaseralaleuglylysleuglnaspval
945950955960
valasnglnasnalaglnalaleuasnthrleuvallysglnleuser
965970975
serasnpheglyalaileserservalleuasnaspileleuserarg
980985990
leuaspproproglualagluvalglnileaspargleuilethrgly
99510001005
argleuglnserleuglnthrtyrvalthrglnglnleuileargala
101010151020
alagluileargalaseralaasnleualaalathrlysmetserglu
1025103010351040
cysvalleuglyglnserlysargvalaspphecysglylysglytyr
104510501055
hisleumetserpheproglnseralaprohisglyvalvalpheleu
106010651070
hisvalthrtyrvalproalaglnglulysasnphethrthralapro
107510801085
alailecyshisaspglylysalahispheproarggluglyvalphe
109010951100
valserasnglythrhistrpphevalthrglnargasnphetyrglu
1105111011151120
proglnileilethrthraspasnthrphevalserglyasncysasp
112511301135
valvalileglyilevalasnasnthrvaltyraspproleuglnpro
114011451150
gluleuaspserphelysglugluleuasplystyrphelysasnhis
115511601165
thrserproaspvalaspleuglyaspileserglyileasnalaser
117011751180
valvalasnileglnlysgluileaspargleuasngluvalalalys
1185119011951200
asnleuasngluserleuileaspleuglngluleuglylystyrglu
120512101215
glnglytyrileproglualaproargaspglyglnalatyrvalarg
122012251230
lysaspglyglutrpvalleuleuserthrpheleu
12351240
<210>12
<211>3729
<212>dna
<213>人工序列(artificialsequence)
<400>12
atggacgccatgaagcgcggcctgtgctgcgtgctgctgctgtgcggcgccgtgttcgtg60
agcgcccagtgcgtgaacctgaccacccgcacccagctgccccccgcctacaccaacagc120
ttcacccgcggcgtgtactaccccgacaaggtgttccgcagcagcgtgctgcacagcacc180
caggacctgttcctgcccttcttcagcaacgtgacctggttccacgccatccacgtgagc240
ggcaccaacggcaccaagcgcttcgacaaccccgtgctgcccttcaacgacggcgtgtac300
ttcgccagcaccgagaagagcaacatcatccgcggctggatcttcggcaccaccctggac360
agcaagacccagagcctgctgatcgtgaacaacgccaccaacgtggtgatcaaggtgtgc420
gagttccagttctgcaacgaccccttcctgggcgtgtactaccacaagaacaacaagagc480
tggatggagagcgagttccgcgtgtacagcagcgccaacaactgcaccttcgagtacgtg540
agccagcccttcctgatggacctggagggcaagcagggcaacttcaagaacctgcgcgag600
ttcgtgttcaagaacatcgacggctacttcaagatctacagcaagcacacccccatcaac660
ctggtgcgcgacctgccccagggcttcagcgccctggagcccctggtggacctgcccatc720
ggcatcaacatcacccgcttccagaccctgctggccctgcaccgcagctacctgaccccc780
ggcgacagcagcagcggctggaccgccggcgccgccgcctactacgtgggctacctgcag840
ccccgcaccttcctgctgaagtacaacgagaacggcaccatcaccgacgccgtggactgc900
gccctggaccccctgagcgagaccaagtgcaccctgaagagcttcaccgtggagaagggc960
atctaccagaccagcaacttccgcgtgcagcccaccgagagcatcgtgcgcttccccaac1020
atcaccaacctgtgccccttcggcgaggtgttcaacgccacccgcttcgccagcgtgtac1080
gcctggaaccgcaagcgcatcagcaactgcgtggccgactacagcgtgctgtacaacagc1140
gccagcttcagcaccttcaagtgctacggcgtgagccccaccaagctgaacgacctgtgc1200
ttcaccaacgtgtacgccgacagcttcgtgatccgcggcgacgaggtgcgccagatcgcc1260
cccggccagaccggcaagatcgccgactacaactacaagctgcccgacgacttcaccggc1320
tgcgtgatcgcctggaacagcaacaacctggacagcaaggtgggcggcaactacaactac1380
ctgtaccgcctgttccgcaagagcaacctgaagcccttcgagcgcgacatcagcaccgag1440
atctaccaggccggcagcaccccctgcaacggcgtggagggcttcaactgctacttcccc1500
ctgcagagctacggcttccagcccaccaacggcgtgggctaccagccctaccgcgtggtg1560
gtgctgagcttcgagctgctgcacgcccccgccaccgtgtgcggccccaagaagagcacc1620
aacctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcaccggcgtg1680
ctgaccgagagcaacaagaagttcctgcccttccagcagttcggccgcgacatcgccgac1740
accaccgacgccgtgcgcgacccccagaccctggagatcctggacatcaccccctgcagc1800
ttcggcggcgtgagcgtgatcacccccggcaccaacaccagcaaccaggtggccgtgctg1860
taccaggacgtgaactgcaccgaggtgcccgtggccatccacgccgaccagctgaccccc1920
acctggcgcgtgtacagcaccggcagcaacgtgttccagacccgcgccggctgcctgatc1980
ggcgccgagcacgtgaacaacagctacgagtgcgacatccccatcggcgccggcatctgc2040
gccagctaccagacccagaccaacagccccggcggcagcgtggccagccagagcatcatc2100
gcctacaccatgagcctgggcgccgagaacagcgtggcctacagcaacaacagcatcgcc2160
atccccaccaacttcaccatcagcgtgaccaccgagatcctgcccgtgagcatgaccaag2220
accagcgtggactgcaccatgtacatctgcggcgacagcaccgagtgcagcaacctgctg2280
ctgcagtacggcagcttctgcacccagctgaaccgcgccctgaccggcatcgccgtggag2340
caggacaagaacacccaggaggtgttcgcccaggtgaagcagatctacaagacccccccc2400
atcaaggacttcggcggcttcaacttcagccagatcctgcccgaccccagcaagcccagc2460
aagcgcagcttcatcgaggacctgctgttcaacaaggtgaccctggccgacgccggcttc2520
atcaagcagtacggcgactgcctgggcgacatcgccgcccgcgacctgatctgcgcccag2580
aagttcaacggcctgaccgtgctgccccccctgctgaccgacgagatgatcgcccagtac2640
accagcgccctgctggccggcaccatcaccagcggctggaccttcggcgccggcgccgcc2700
ctgcagatccccttcgccatgcagatggcctaccgcttcaacggcatcggcgtgacccag2760
aacgtgctgtacgagaaccagaagctgatcgccaaccagttcaacagcgccatcggcaag2820
atccaggacagcctgagcagcaccgccagcgccctgggcaagctgcaggacgtggtgaac2880
cagaacgcccaggccctgaacaccctggtgaagcagctgagcagcaacttcggcgccatc2940
agcagcgtgctgaacgacatcctgagccgcctggacgtgaaggaggccgaggtgcagatc3000
gaccgcctgatcaccggccgcctgcagagcctgcagacctacgtgacccagcagctgatc3060
cgcgccgccgagatccgcgccagcgccaacctggccgccaccaagatgagcgagtgcgtg3120
ctgggccagagcaagcgcgtggacttctgcggcaagggctaccacctgatgagcttcccc3180
cagagcgccccccacggcgtggtgttcctgcacgtgacctacgtgcccgcccaggagaag3240
aacttcaccaccgcccccgccatctgccacgacggcaaggcccacttcccccgcgagggc3300
gtgttcgtgagcaacggcacccactggttcgtgacccagcgcaacttctacgagccccag3360
atcatcaccaccgacaacaccttcgtgagcggcaactgcgacgtggtgatcggcatcgtg3420
aacaacaccgtgtacgaccccctgcagcccgagctggacagcttcaaggaggagctggac3480
aagtacttcaagaaccacaccagccccgacgtggacctgggcgacatcagcggcatcaac3540
gccagcgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggccaagaacctg3600
aacgagagcctgatcgacctgcaggagctgggcaagtacgagcagggctacatccccgag3660
gccccccgcgacggccaggcctacgtgcgcaaggacggcgagtgggtgctgctgagcacc3720
ttcctgtga3729
<210>13
<211>1242
<212>prt
<213>人工序列(artificialsequence)
<400>13
metaspalametlysargglyleucyscysvalleuleuleucysgly
151015
alavalphevalseralaglncysvalasnleuthrthrargthrgln
202530
leuproproalatyrthrasnserphethrargglyvaltyrtyrpro
354045
asplysvalpheargserservalleuhisserthrglnaspleuphe
505560
leuprophepheserasnvalthrtrpphehisalailehisvalser
65707580
glythrasnglythrlysargpheaspasnprovalleupropheasn
859095
aspglyvaltyrphealaserthrglulysserasnileilearggly
100105110
trpilepheglythrthrleuaspserlysthrglnserleuleuile
115120125
valasnasnalathrasnvalvalilelysvalcysglupheglnphe
130135140
cysasnasppropheleuglyvaltyrtyrhislysasnasnlysser
145150155160
trpmetgluserglupheargvaltyrserseralaasnasncysthr
165170175
pheglutyrvalserglnpropheleumetaspleugluglylysgln
180185190
glyasnphelysasnleuarggluphevalphelysasnileaspgly
195200205
tyrphelysiletyrserlyshisthrproileasnleuvalargasp
210215220
leuproglnglypheseralaleugluproleuvalaspleuproile
225230235240
glyileasnilethrargpheglnthrleuleualaleuhisargser
245250255
tyrleuthrproglyaspserserserglytrpthralaglyalaala
260265270
alatyrtyrvalglytyrleuglnproargthrpheleuleulystyr
275280285
asngluasnglythrilethraspalavalaspcysalaleuasppro
290295300
leusergluthrlyscysthrleulysserphethrvalglulysgly
305310315320
iletyrglnthrserasnpheargvalglnprothrgluserileval
325330335
argpheproasnilethrasnleucyspropheglygluvalpheasn
340345350
alathrargphealaservaltyralatrpasnarglysargileser
355360365
asncysvalalaasptyrservalleutyrasnseralaserpheser
370375380
thrphelyscystyrglyvalserprothrlysleuasnaspleucys
385390395400
phethrasnvaltyralaaspserphevalileargglyaspgluval
405410415
argglnilealaproglyglnthrglylysilealaasptyrasntyr
420425430
lysleuproaspaspphethrglycysvalilealatrpasnserasn
435440445
asnleuaspserlysvalglyglyasntyrasntyrleutyrargleu
450455460
phearglysserasnleulysprophegluargaspileserthrglu
465470475480
iletyrglnalaglyserthrprocysasnglyvalgluglypheasn
485490495
cystyrpheproleuglnsertyrglypheglnprothrasnglyval
500505510
glytyrglnprotyrargvalvalvalleuserphegluleuleuhis
515520525
alaproalathrvalcysglyprolyslysserthrasnleuvallys
530535540
asnlyscysvalasnpheasnpheasnglyleuthrglythrglyval
545550555560
leuthrgluserasnlyslyspheleupropheglnglnpheglyarg
565570575
aspilealaaspthrthraspalavalargaspproglnthrleuglu
580585590
ileleuaspilethrprocysserpheglyglyvalservalilethr
595600605
proglythrasnthrserasnglnvalalavalleutyrglnaspval
610615620
asncysthrgluvalprovalalailehisalaaspglnleuthrpro
625630635640
thrtrpargvaltyrserthrglyserasnvalpheglnthrargala
645650655
glycysleuileglyalagluhisvalasnasnsertyrglucysasp
660665670
ileproileglyalaglyilecysalasertyrglnthrglnthrasn
675680685
serproglyglyservalalaserglnserileilealatyrthrmet
690695700
serleuglyalagluasnservalalatyrserasnasnserileala
705710715720
ileprothrasnphethrileservalthrthrgluileleuproval
725730735
sermetthrlysthrservalaspcysthrmettyrilecysglyasp
740745750
serthrglucysserasnleuleuleuglntyrglyserphecysthr
755760765
glnleuasnargalaleuthrglyilealavalgluglnasplysasn
770775780
thrglngluvalphealaglnvallysglniletyrlysthrpropro
785790795800
ilelysasppheglyglypheasnpheserglnileleuproasppro
805810815
serlysproserlysargserpheilegluaspleuleupheasnlys
820825830
valthrleualaaspalaglypheilelysglntyrglyaspcysleu
835840845
glyaspilealaalaargaspleuilecysalaglnlyspheasngly
850855860
leuthrvalleuproproleuleuthraspglumetilealaglntyr
865870875880
thrseralaleuleualaglythrilethrserglytrpthrphegly
885890895
alaglyalaalaleuglnileprophealametglnmetalatyrarg
900905910
pheasnglyileglyvalthrglnasnvalleutyrgluasnglnlys
915920925
leuilealaasnglnpheasnseralaileglylysileglnaspser
930935940
leuserserthralaseralaleuglylysleuglnaspvalvalasn
945950955960
glnasnalaglnalaleuasnthrleuvallysglnleuserserasn
965970975
pheglyalaileserservalleuasnaspileleuserargleuasp
980985990
lysvalglualagluvalglnileaspargleuilethrglyargleu
99510001005
glnserleuglnthrtyrvalthrglnglnleuileargalaalaglu
101010151020
ileargalaseralaasnleualaalathrlysmetserglucysval
1025103010351040
leuglyglnserlysargvalaspphecysglylysglytyrhisleu
104510501055
metserpheproglnseralaprohisglyvalvalpheleuhisval
106010651070
thrtyrvalproalaglnglulysasnphethrthralaproalaile
107510801085
cyshisaspglylysalahispheproarggluglyvalphevalser
109010951100
asnglythrhistrpphevalthrglnargasnphetyrgluprogln
1105111011151120
ileilethrthraspasnthrphevalserglyasncysaspvalval
112511301135
ileglyilevalasnasnthrvaltyraspproleuglnprogluleu
114011451150
aspserphelysglugluleuasplystyrphelysasnhisthrser
115511601165
proaspvalaspleuglyaspileserglyileasnalaservalval
117011751180
asnileglnlysgluileaspargleuasngluvalalalysasnleu
1185119011951200
asngluserleuileaspleuglngluleuglylystyrgluglngly
120512101215
tyrileproglualaproargaspglyglnalatyrvalarglysasp
122012251230
glyglutrpvalleuleuserthrpheleu
12351240
<210>14
<211>39
<212>dna
<213>人工序列(artificialsequence)
<400>14
atgtttgtttttcttgttttattgccactagtctctagt39
<210>15
<211>13
<212>prt
<213>人工序列(artificialsequence)
<400>15
metphevalpheleuvalleuleuproleuvalserser
1510
<210>16
<211>39
<212>dna
<213>人工序列(artificialsequence)
<400>16
atgttcgtgttcctggtgctgctgcccctggtgagcagc39
<210>17
<211>13
<212>prt
<213>人工序列(artificialsequence)
<400>17
metphevalpheleuvalleuleuproleuvalserser
1510
<210>18
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>18
atggacgccatgaagcgcggcctgtgctgcgtgctgctgctgtgcggcgccgtgttcgtg60
agcgcc66
<210>19
<211>22
<212>prt
<213>人工序列(artificialsequence)
<400>19
metaspalametlysargglyleucyscysvalleuleuleucysgly
151015
alavalphevalserala
20
<210>20
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>20
atgggctggtcctgcatcatcctgttcctggtcgccaccgctaccggcgtgcatagc57
<210>21
<211>19
<212>prt
<213>人工序列(artificialsequence)
<400>21
metglytrpsercysileileleupheleuvalalathralathrgly
151015
valhisser
<210>22
<211>72
<212>dna
<213>人工序列(artificialsequence)
<400>22
atgcccatggggtctctgcaaccgctggccaccttgtacctgctggggatgctggtcgct60
tcctgcctcgga72
<210>23
<211>24
<212>prt
<213>人工序列(artificialsequence)
<400>23
metprometglyserleuglnproleualathrleutyrleuleugly
151015
metleuvalalasercysleugly
20
<210>24
<211>27
<212>prt
<213>人工序列(artificialsequence)
<400>24
glytyrileproglualaproargaspglyglnalatyrvalarglys
151015
aspglyglutrpvalleuleuserthrpheleu
2025
<210>25
<211>31
<212>prt
<213>人工序列(artificialsequence)
<400>25
metlysglnilegluasplysileglugluileleuserlysiletyr
151015
hisilegluasngluilealaargilelyslysleuileglyglu
202530
<210>26
<211>25
<212>prt
<213>人工序列(artificialsequence)
<400>26
protrptyriletrpleuglypheilealaglyleuilealaileval
151015
metvalthrilemetleucyscysmet
2025