Sars病毒s蛋白及其疫苗和用其筛选药物的方法

文档序号:977239阅读:316来源:国知局
专利名称:Sars病毒s蛋白及其疫苗和用其筛选药物的方法
技术领域
本发明涉及病毒学、流行病和分子遗传学领域,更具体地涉及SARS病毒的特征性位点及其用途。
背景技术
2003年我国和世界上许多国家遭到了一次大规模的非典型肺炎(Atypical pneumonias)的侵袭,由非典型肺炎引起的严重急性呼吸综合征(Severe Acute Respiratory Sydrome,SARS)已经在22个国家和地区发生。世界卫生组织(World Health Organization,WHO)在疫情发生后迅速建立起由全球10个国家的13个实验室组成的协作研究和监测网络。4月16日,WHO正式确认SARS的病原体是一种新型冠状病毒,这是一种单链RNA病毒。
全球已有8000多例非典型肺炎患者,在某些发病区其死亡率达到15%,给人民群众带来了极大的恐慌。及时开展SARS冠状病毒的病原学以及预防、诊断和治疗的研究,加强控制和治疗措施、对患者和疑似病例做到早发现、早隔离和早治疗,是控制疫情继续发生和传播的关键。
然而,迄今为止对于SARS病毒的毒性和传播能力的决定性位点并没有报道。
因此,本领域迫切需要开发用于筛选药物和生产疫苗的SARS蛋白,尤其是来自传染力强和/或毒性高的SARS病毒株的免疫学性蛋白。

发明内容
因此,本发明的目的是提供一种SARS病毒的特征性蛋白,尤其是来自传染力强和/或毒性高的SARS病毒株的免疫学性蛋白。
本发明的还有一个目的是提供所述蛋白在筛选药物和生产疫苗的用途。
在本发明的一个方面,提供了一种SARS病毒的S蛋白,该蛋白具有SEQID NO2所述的氨基酸序列,并含有选自下列的突变
a)778D→Y;b)77D→Gc)244T→I;d)1182K→Q;e)360F→S;f)479N→R或K;g)480D→G;h)609A→L。
在一个实施例中,该蛋白同时含有b)77D→G和c)244T→I的突变。
本发明的第二个方面提供了一种分离的核酸,它编码上述SARS病毒的S蛋白。
本发明的第三个方面提供了一种SARS病毒,其S蛋白具有SEQ ID NO2的氨基酸序列,并含有选自下列的突变a)778D→Y;b)77D→G;c)244T→I;d)1182K→Q;e)360F→S;f)479N→R或K;g)480D→G;h)609A→L。
在一个优选例中,所述的S蛋白含有a)778D→Y的突变。
在另一个优选例中,所述的S蛋白同时含有b)77D→G和c)244T→I的突变。
在本发明的另一个方面,提供了所述的SARS病毒的用途,该病毒用于筛选治疗SARS的药物。
在本发明的另一个方面,提供了上述SARS病毒S蛋白的用途,该蛋白用于产生针对SARS病毒的疫苗。
在本发明的另一方面,提供了一种特异性检测SARS病毒S蛋白的试剂盒,它含有容器和装在容器内的引物对,所述的引物对扩增出的扩增产物含有对应于S蛋白以下位点的核苷酸序列
a)778D→Y;b)77D→G;c)244T→I;d)1182K→Q;e)360F→S;f)479N→R或K;g)480D→G;h)609A→L。
具体实施例方式
在本发明中,核苷酸的编号基于加拿大分离到的SARS病毒株的基因序列(SEQ ID NO1),其在Genbank的登录号为NC004718(>gi|30248028|gb|AY274119.3|SARS冠状病毒TOR2,完全基因组)。
S蛋白的编号以AAP41037.1氨基酸序列为基准序列,见序列表SEQ IDNO2。
S蛋白(Spike蛋白)是膜蛋白,其构成病毒的包膜子粒,是病毒感染宿主细胞的主要成分。冠状病毒要感染细胞,首先要将其遗传物质RNA导入到宿主细胞中,这一过程主要是通过S蛋白来完成的。一个冠状病毒颗粒在膜上一般包括200左右S蛋白,这些S蛋白的突起是其与受体相互作用和膜融合的关键部位。在多数冠状病毒中,S蛋白存在两种形式,一种为独立的单链蛋白,另一种为两个大小相似的蛋白剪切产物,称为S1和S2.S1位于N端,为外周部分,构成S蛋白的球状头,其通过非共价键与跨膜的杆状S2片段相连。在病毒感染细胞的初期,外周部分的S1负责与宿主细胞上的受体作用。最初的膜融合反应发生在细胞膜表面,而在随后的感染过程中,S蛋白将聚集的在感染细胞的表面,并最终形成能够被观察到的合胞体。由此可见,S蛋白对于SARS病毒的感染和毒性非常重要。
本发明人在对于不同时期和不同地点获得的众多病人分离得到的SARS病毒进行全序列测定和分析后,不仅发现了S病毒的变异情况,而且发现在S蛋白上的几个重要氨基酸位点是SARS病毒的毒性和传播能力的决定性位点
第一类是病毒早期变化过程中逐渐发生的氨基酸变化,包括九个氨基酸位点,其中位点778D→Y是早期最关键的变化,它的变化与病情加重和传播能力加强相关。而位点77D→G,244T→I相对较晚,基因型相对稳定,病情也较严重,两个位点变异只出现一个的病毒株也有发现,但是在群体中发生比例较低,发病程度较轻。而两个同时变异产生的病毒株有非常强的感染力和毒性。
第二类是晚期的1182K→Q变化。
利用S蛋白上第77,778和1182位上的突变,可用常规的DNA重组技术获得含有上述突变的S蛋白,然后将其用于药物筛选和制备抗体。
一种药物筛选方法是,将候选药物与含有这些突变的S蛋白的SARS病毒一起培养,可筛选获得能够治疗sars的多种可能药物。此外,也可进行计算机虚拟筛选进行初筛,然后再进行生物实验筛选。
本发明的突变的S蛋白可用于免疫兔、鼠等动物,从而获得抗本发明多肽的抗体(“本发明抗体”)。本发明抗体包括特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段(如Fab′或(Fab)2片段)、抗体重链、抗体轻链、嵌合抗体、人源化抗体等。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的含上述突变位点S蛋白或其片段,可被施用于动物以诱导多克隆抗体的产生。对于单克隆抗体,可利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and TCell Hybridomas,Elsevier,N.Y.,1981)。
用上述方法制得的本发明抗体可用检测样品中是否存在SARS病毒,从而作为检测SARS的有效指标之一。
基于本发明公开内容,本领域技术人员可以方便地设计出可特异性扩增出含S蛋白特定位点的扩增产物,然后通过测序等方法确定是否存在所述突变(见表1和表2)。通常,引物的长度为15-50bp,较佳地为20-30bp。虽然引物与模板序列完全互补是优选的,但是本领域技术人员知道,在引物与模板存在一定的不互补(尤其是引物的5′端)的情况下,也能够特异性地扩增(即仅扩增出所需的片段)。含有这些引物的试剂盒和使用这些引物的方法都在本发明范围之内,只要该引物扩增出的扩增产物含有本发明SNP的对应位置。
虽然扩增产物的长度没有特别限制,但是通常扩增产物的长度为100-3000bp,较佳地为150-2000bp,更佳地为200-1000bp。这些扩增产物都应含有本发明至少一个所述位点(见表1和表2)。
此外,用上述方法制得的本发明抗体,还可以用于治疗SARS。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1SARS突变S蛋白的检测采集从流行早期到晚期(2003年1月5日至2003年4月7日)的不同地区的多个SARS患者的病毒分离培养样本,分离病毒核酸,然后通过反转录反应获得互补DNA(cDNA),或直接通过反转录反应从生物学样本,如,痰液,粪便和组织器官获得cDNA,进行全序列测定,从中获得S蛋白序列。
结果如表1。
表1列出了SARS病毒S蛋白突变的位点和核苷酸改变。

*注“S30,S08”等为病例编号,其中黑体字标出的本申请主要关注的几个位点在许多病人当中发现,无法一一列出。
发现当778位的氨基酸从Asp变成Tyr,和77位的Asp变成Gly同时244位的Thr变为Ile时,包含有突变S蛋白的SARS病毒株毒性特别强烈,而且传染力增加了许多倍。而当77位和244位不一起发生突变的时候,传染力和发病的程度都较轻。
还在1182位发现了Lys到Gln的突变。这种突变仅在SARS流行晚期的病人体内分离的病毒株中见到。该突变可用来确定SARS病毒的流行病学时间。
实施例2SARS突变S蛋白的检测II采集从流行早早期(2004年1-2月)广州的三个SARS患者的病毒分离培养样本以及来自果子狸的SARS病毒样本。按实施例1相同方法,对分离的SARS病毒全序列测定,从中获得S蛋白序列。结果如表2所示。
表2列出了早早期SARS病毒S蛋白突变的位点和核苷酸改变。

2004年初广东新诊断出的SARS病例(即GZ03-01,GZ03-02,GZ03-03病例)虽然出现时间晚于2002-2003年的病例,但是基于临床诊断和序列分析,认为属于早早期的SARS病例,因为这些早早期SARS的全序列一方面与果子狸的SARS病毒全序列更为接近,而且其感染力也很弱,没有发生人与人之间传播情况,这提示这些早早期SARS病毒在人与人之间传播力非常弱,甚至可能不能在人与人之间传播。此外,早早期SARS感染病例出现抗SARS抗体的时间明显早已其他SARS病毒(例如早、中、晚期SARS,如S30,S08,C52,C53,GZ01等)的感染病例,这提示这些早早期SARS更容易被人体的免疫系统所识别。
S蛋白是SARS病毒与宿主细胞表面上的受体发生结合的主要蛋白,因此S蛋白的变异情况与SARS病毒的感染力强弱密切相关。根据对90例SARS病毒的全序列测定结果以及对多例果子狸SARS病毒的全序列测定结果,表明表2所示的S蛋白位点22570、22927-22928、22930、23316-23317位不仅可以作为早早期SARS病毒的特异性标志,而且这些位点的突变所导致的氨基酸突变(即360 F→S;479 N→R或K;480 D→G;609 A→L)会导致SARS病毒的感染力减弱,然而却不影响其免疫原性,因此在制备抗SARS疫苗方面有巨大的应用前景。
此外,22927-22928位和23316-23317位是两个很特别的双突变位点。其中22927-22928位在所有感染人的SARS中都是AT型(对应氨基酸为Asn),而在果子狸中存在GA型和AA型(对应氨基酸为带正电荷的氨基酸Arg或Lys),这提示只有果子狸SARS病毒发生突变所产生AT型,才可有效地感染人。而非AT型(如GA型和AA型)SARS病毒并不感染人。因此,这一位点可以作为区分SARS病毒来源和判断其感染力强弱的重要标识之一。
23316-23317位在所有测定的SARS病例中只有GC和TT两种,在所有2003年的SARS感染病例中都是GC型(对应氨基酸为Ala),而在果子狸和早早期的SARS病例中为TT型或GC型(对应氨基酸为Leu),这提示这位点非常重要,而且GC型SARS对人的感染力强。而TT型SARS病毒感染力弱。因此,这一位点可以作为判断SARS感染力强弱的重要标识之一。
此外,根据对S蛋白结构的分析,表明S蛋白第311-487位氨基酸构成的区段(对应于第22422-22951位核苷酸),参与S蛋白和ACE2受体结合,而第577-613位氨基酸构成的区段(对应于第23220-23330位核苷酸)与三聚体的形成的有关。而22927-22928位和23316-23317位分别位于上述两个区段,因此在SARS检测上具有重要意义。
实施例3SARS检测试剂盒如实施例1和2所述,SEQ ID NO1中22222、22570、22927-22928、22930、23316-23317、23823等位点与SARS的感染力强弱密切相关。因此,基于这些突变设计特异性引物,用盲法取不同SARS病毒DNA为模板进行扩增进行检测。
制备一试剂盒(100人次),它含有

将检测试剂盒中的PCR引物稀释到1umol/μl,以所提取的SARS DNA为模板与所提供的引物进行PCR反应。PCR产物(对应于SEQ ID NO1中第22890-23910位)纯化后,用ABI-PRISMTM377 DNA测序仪进行荧光标记末端终止法双向测序,用Polyphred软件进行序列的判读和SNP确认。然后根据SNP来判断待检测SARS的感染力强弱。
检测结果如表3所示,与临床结果和样本来源完全相符。
表3检测结果

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表<110>国家人类基因组南方研究中心广东省疾病预防控制中心广州市疾病预防控制中心中国人民解放军军需大学<120>SARS病毒S蛋白及其疫苗和用其筛选药物的方法<130>043094<150>CN03141518.0<151>2003-07-10<160>4<170>PatentIn version 3.1<210>1<211>29751<212>DNA<213>SARS病毒(SARS virus)<400>1atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt60ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac120gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct180tctgcagact gcttacggtt tcgtccgtgt tgcagtcgat catcagcata cctaggtttc240gtccgggtgt gaccgaaagg taagatggag agccttgttc ttggtgtcaa cgagaaaaca300cacgtccaac tcagtttgcc tgtccttcag gttagagacg tgctagtgcg tggcttcggg360gactctgtgg aagaggccct atcggaggca cgtgaacacc tcaaaaatgg cacttgtggt420ctagtagagc tggaaaaagg cgtactgccc cagcttgaac agccctatgt gttcattaaa480cgttctgatg ccttaagcac caatcacggc cacaaggtcg ttgagctggt tgcagaaatg540gacggcattc agtacggtcg tagcggtata acactgggag tactcgtgcc acatgtgggc600gaaaccccaa ttgcataccg caatgttctt cttcgtaaga acggtaataa gggagccggt660ggtcatagct atggcatcga tctaaagtct tatgacttag gtgacgagct tggcactgat720cccattgaag attatgaaca aaactggaac actaagcatg gcagtggtgc actccgtgaa780ctcactcgtg agctcaatgg aggtgcagtc actcgctatg tcgacaacaa tttctgtggc840ccagatgggt accctcttga ttgcatcaaa gattttctcg cacgcgcggg caagtcaatg900tgcactcttt ccgaacaact tgattacatc gagtcgaaga gaggtgtcta ctgctgccgt960gaccatgagc atgaaattgc ctggttcact gagcgctctg ataagagcta cgagcaccag1020acacccttcg aaattaagag tgccaagaaa tttgacactt tcaaagggga atgcccaaag1080tttgtgtttc ctcttaactc aaaagtcaaa gtcattcaac cacgtgttga aaagaaaaag1140actgagggtt tcatggggcg tatacgctct gtgtaccctg ttgcatctcc acaggagtgt1200aacaatatgc acttgtctac cttgatgaaa tgtaatcatt gcgatgaagt ttcatggcag1260acgtgcgact ttctgaaagc cacttgtgaa cattgtggca ctgaaaattt agttattgaa1320ggacctacta catgtgggta cctacctact aatgctgtag tgaaaatgcc atgtcctgcc1380tgtcaagacc cagagattgg acctgagcat agtgttgcag attatcacaa ccactcaaac1440attgaaactc gactccgcaa gggaggtagg actagatgtt ttggaggctg tgtgtttgcc1500tatgttggct gctataataa gcgtgcctac tgggttcctc gtgctagtgc tgatattggc1560tcaggccata ctggcattac tggtgacaat gtggagacct tgaatgagga tctccttgag1620atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag1680gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag1740agtcttgatt acaagtcttt caaaaccatt gttgagtcct gcggtaacta taaagttacc1800aagggaaagc ccgtaaaagg tgcttggaac attggacaac agagatcagt tttaacacca1860ctgtgtggtt ttccctcaca ggctgctggt gttatcagat caatttttgc gcgcacactt1920gatgcagcaa accactcaat tcctgatttg caaagagcag ctgtcaccat acttgatggt1980atttctgaac agtcattacg tcttgtcgac gccatggttt atacttcaga cctgctcacc2040aacagtgtca ttattatggc atatgtaact ggtggtcttg tacaacagac ttctcagtgg2100ttgtctaatc ttttgggcac tactgttgaa aaactcaggc ctatctttga atggattgag2160gcgaaactta gtgcaggagt tgaatttctc aaggatgctt gggagattct caaatttctc2220
attacaggtg tttttgacat cgtcaagggt caaatacagg ttgcttcaga taacatcaag 2280gattgtgtaa aatgcttcat tgatgttgtt aacaaggcac tcgaaatgtg cattgatcaa 2340gtcactatcg ctggcgcaaa gttgcgatca ctcaacttag gtgaagtctt catcgctcaa 2400agcaagggac tttaccgtca gtgtatacgt ggcaaggagc agctgcaact actcatgcct 2460cttaaggcac caaaagaagt aacctttctt gaaggtgatt cacatgacac agtacttacc 2520tctgaggagg ttgttctcaa gaacggtgaa ctcgaagcac tcgagacgcc cgttgatagc 2580ttcacaaatg gagctatcgt tggcacacca gtctgtgtaa atggcctcat gctcttagag 2640attaaggaca aagaacaata ctgcgcattg tctcctggtt tactggctac aaacaatgtc 2700tttcgcttaa aagggggtgc accaattaaa ggtgtaacct ttggagaaga tactgtttgg 2760gaagttcaag gttacaagaa tgtgagaatc acatttgagc ttgatgaacg tgttgacaaa 2820gtgcttaatg aaaagtgctc tgtctacact gttgaatccg gtaccgaagt tactgagttt 2880gcatgtgttg tagcagaggc tgttgtgaag actttacaac cagtttctga tctccttacc 2940aacatgggta ttgatcttga tgagtggagt gtagctacat tctacttatt tgatgatgct 3000ggtgaagaaa acttttcatc acgtatgtat tgttcctttt accctccaga tgaggaagaa 3060gaggacgatg cagagtgtga ggaagaagaa attgatgaaa cctgtgaaca tgagtacggt 3120acagaggatg attatcaagg tctccctctg gaatttggtg cctcagctga aacagttcga 3180gttgaggaag aagaagagga agactggctg gatgatacta ctgagcaatc agagattgag 3240ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta tttaaaactt 3300actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 3360atggtgattg taaatgctgc taacatacac ctgaaacatg gtggtggtgt agcaggtgca 3420ctcaacaagg caaccaatgg tgccatgcaa aaggagagtg atgattacat taagctaaat 3480ggccctctta cagtaggagg gtcttgtttg ctttctggac ataatcttgc taagaagtgt 3540ctgcatgttg ttggacctaa cctaaatgca ggtgaggaca tccagcttct taaggcagca 3600tatgaaaatt tcaattcaca ggacatctta cttgcaccat tgttgtcagc aggcatattt 3660ggtgctaaac cacttcagtc tttacaagtg tgcgtgcaga cggttcgtac acaggtttat 3720attgcagtca atgacaaagc tctttatgag caggttgtca tggattatct tgataacctg 3780aagcctagag tggaagcacc taaacaagag gagccaccaa acacagaaga ttccaaaact 3840gaggagaaat ctgtcgtaca gaagcctgtc gatgtgaagc caaaaattaa ggcctgcatt 3900gatgaggtta ccacaacact ggaagaaact aagtttctta ccaataagtt actcttgttt 3960gctgatatca atggtaagct ttaccatgat tctcagaaca tgcttagagg tgaagatatg 4020tctttccttg agaaggatgc accttacatg gtaggtgatg ttatcactag tggtgatatc 4080acttgtgttg taataccctc caaaaaggct ggtggcacta ctgagatgct ctcaagagct 4140ttgaagaaag tgccagttga tgagtatata accacgtacc ctggacaagg atgtgctggt 4200tatacacttg aggaagctaa gactgctctt aagaaatgca aatctgcatt ttatgtacta 4260ccttcagaag cacctaatgc taaggaagag attctaggaa ctgtatcctg gaatttgaga 4320gaaatgcttg ctcatgctga agagacaaga aaattaatgc ctatatgcat ggatgttaga 4380gccataatgg caaccatcca acgtaagtat aaaggaatta aaattcaaga gggcatcgtt 4440gactatggtg tccgattctt cttttatact agtaaagagc ctgtagcttc tattattacg 4500aagctgaact ctctaaatga gccgcttgtc acaatgccaa ttggttatgt gacacatggt 4560tttaatcttg aagaggctgc gcgctgtatg cgttctctta aagctcctgc cgtagtgtca 4620gtatcatcac cagatgctgt tactacatat aatggatacc tcacttcgtc atcaaagaca 4680tctgaggagc actttgtaga aacagtttct ttggctggct cttacagaga ttggtcctat 4740tcaggacagc gtacagagtt aggtgttgaa tttcttaagc gtggtgacaa aattgtgtac 4800cacactctgg agagccccgt cgagtttcat cttgacggtg aggttctttc acttgacaaa 4860ctaaagagtc tcttatccct gcgggaggtt aagactataa aagtgttcac aactgtggac 4920aacactaatc tccacacaca gcttgtggat atgtctatga catatggaca gcagtttggt 4980ccaacatact tggatggtgc tgatgttaca aaaattaaac ctcatgtaaa tcatgagggt 5040aagactttct ttgtactacc tagtgatgac acactacgta gtgaagcttt cgagtactac 5100catactcttg atgagagttt tcttggtagg tacatgtctg ctttaaacca cacaaagaaa 5160tggaaatttc ctcaagttgg tggtttaact tcaattaaat gggctgataa caattgttat 5220ttgtctagtg ttttattagc acttcaacag cttgaagtca aattcaatgc accagcactt 5280caagaggctt attatagagc ccgtgctggt gatgctgcta acttttgtgc actcatactc 5340gcttacagta ataaaactgt tggcgagctt ggtgatgtca gagaaactat gacccatctt 5400ctacagcatg ctaatttgga atctgcaaag cgagttctta atgtggtgtg taaacattgt 5460ggtcagaaaa ctactacctt aacgggtgta gaagctgtga tgtatatggg tactctatct 5520tatgataatc ttaagacagg tgtttccatt ccatgtgtgt gtggtcgtga tgctacacaa 5580tatctagtac aacaagagtc ttcttttgtt atgatgtctg caccacctgc tgagtataaa 5640ttacagcaag gtacattctt atgtgcgaat gagtacactg gtaactatca gtgtggtcat 5700
tacactcata taactgctaa ggagaccctc tatcgtattg acggagctca ccttacaaag 5760atgtcagagt acaaaggacc agtgactgat gttttctaca aggaaacatc ttacactaca 5820accatcaagc ctgtgtcgta taaactcgat ggagttactt acacagagat tgaaccaaaa 5880ttggatgggt attataaaaa ggataatgct tactatacag agcagcctat agaccttgta 5940ccaactcaac cattaccaaa tgcgagtttt gataatttca aactcacatg ttctaacaca 6000aaatttgctg atgatttaaa tcaaatgaca ggcttcacaa agccagcttc acgagagcta 6060tctgtcacat tcttcccaga cttgaatggc gatgtagtgg ctattgacta tagacactat 6120tcagcgagtt tcaagaaagg tgctaaatta ctgcataagc caattgtttg gcacattaac 6180caggctacaa ccaagacaac gttcaaacca aacacttggt gtttacgttg tctttggagt 6240acaaagccag tagatacttc aaattcattt gaagttctgg cagtagaaga cacacaagga 6300atggacaatc ttgcttgtga aagtcaacaa cccacctctg aagaagtagt ggaaaatcct 6360accatacaga aggaagtcat agagtgtgac gtgaaaacta ccgaagttgt aggcaatgtc 6420atacttaaac catcagatga aggtgttaaa gtaacacaag agttaggtca tgaggatctt 6480atggctgctt atgtggaaaa cacaagcatt accattaaga aacctaatga gctttcacta 6540gccttaggtt taaaaacaat tgccactcat ggtattgctg caattaatag tgttccttgg 6600agtaaaattt tggcttatgt caaaccattc ttaggacaag cagcaattac aacatcaaat 6660tgcgctaaga gattagcaca acgtgtgttt aacaattata tgccttatgt gtttacatta 6720ttgttccaat tgtgtacttt tactaaaagt accaattcta gaattagagc ttcactacct 6780acaactattg ctaaaaatag tgttaagagt gttgctaaat tatgtttgga tgccggcatt 6840aattatgtga agtcacccaa attttctaaa ttgttcacaa tcgctatgtg gctattgttg 6900ttaagtattt gcttaggttc tctaatctgt gtaactgctg cttttggtgt actcttatct 6960aattttggtg ctccttctta ttgtaatggc gttagagaat tgtatcttaa ttcgtctaac 7020gttactacta tggatttctg tgaaggttct tttccttgca gcatttgttt aagtggatta 7080gactcccttg attcttatcc agctcttgaa accattcagg tgacgatttc atcgtacaag 7140ctagacttga caattttagg tctggccgct gagtgggttt tggcatatat gttgttcaca 7200aaattctttt atttattagg tctttcagct ataatgcagg tgttctttgg ctattttgct 7260agtcatttca tcagcaattc ttggctcatg tggtttatca ttagtattgt acaaatggca 7320cccgtttctg caatggttag gatgtacatc ttctttgctt ctttctacta catatggaag 7380agctatgttc atatcatgga tggttgcacc tcttcgactt gcatgatgtg ctataagcgc 7440aatcgtgcca cacgcgttga gtgtacaact attgttaatg gcatgaagag atctttctat 7500gtctatgcaa atggaggccg tggcttctgc aagactcaca attggaattg tctcaattgt 7560gacacatttt gcactggtag tacattcatt agtgatgaag ttgctcgtga tttgtcactc 7620cagtttaaaa gaccaatcaa ccctactgac cagtcatcgt atattgttga tagtgttgct 7680gtgaaaaatg gcgcgcttca cctctacttt gacaaggctg gtcaaaagac ctatgagaga 7740catccgctct cccattttgt caatttagac aatttgagag ctaacaacac taaaggttca 7800ctgcctatta atgtcatagt ttttgatggc aagtccaaat gcgacgagtc tgcttctaag 7860tctgcttctg tgtactacag tcagctgatg tgccaaccta ttctgttgct tgaccaagct 7920cttgtatcag acgttggaga tagtactgaa gtttccgtta agatgtttga tgcttatgtc 7980gacacctttt cagcaacttt tagtgttcct atggaaaaac ttaaggcact tgttgctaca 8040gctcacagcg agttagcaaa gggtgtagct ttagatggtg tcctttctac attcgtgtca 8100gctgcccgac aaggtgttgt tgataccgat gttgacacaa aggatgttat tgaatgtctc 8160aaactttcac atcactctga cttagaagtg acaggtgaca gttgtaacaa tttcatgctc 8220acctataata aggttgaaaa catgacgccc agagatcttg gcgcatgtat tgactgtaat 8280gcaaggcata tcaatgccca agtagcaaaa agtcacaatg tttcactcat ctggaatgta 8340aaagactaca tgtctttatc tgaacagctg cgtaaacaaa ttcgtagtgc tgccaagaag 8400aacaacatac cttttagact aacttgtgct acaactagac aggttgtcaa tgtcataact 8460actaaaatct cactcaaggg tggtaagatt gttagtactt gttttaaact tatgcttaag 8520gccacattat tgtgcgttct tgctgcattg gtttgttata tcgttatgcc agtacataca 8580ttgtcaatcc atgatggtta cacaaatgaa atcattggtt acaaagccat tcaggatggt 8640gtcactcgtg acatcatttc tactgatgat tgttttgcaa ataaacatgc tggttttgac 8700gcatggttta gccagcgtgg tggttcatac aaaaatgaca aaagctgccc tgtagtagct 8760gctatcatta caagagagat tggtttcata gtgcctggct taccgggtac tgtgctgaga 8820gcaatcaatg gtgacttctt gcattttcta cctcgtgttt ttagtgctgt tggcaacatt 8880tgctacacac cttccaaact cattgagtat agtgattttg ctacctctgc ttgcgttctt 8940gctgctgagt gtacaatttt taaggatgct atgggcaaac ctgtgccata ttgttatgac 9000actaatttgc tagagggttc tatttcttat agtgagcttc gtccagacac tcgttatgtg 9060cttatggatg gttccatcat acagtttcct aacacttacc tggagggttc tgttagagta 9120gtaacaactt ttgatgctga gtactgtaga catggtacat gcgaaaggtc agaagtaggt 9180
atttgcctat ctaccagtgg tagatgggtt cttaataatg agcattacag agctctatca 9240ggagttttct gtggtgttga tgcgatgaat ctcatagcta acatctttac tcctcttgtg 9300caacctgtgg gtgctttaga tgtgtctgct tcagtagtgg ctggtggtat tattgccata 9360ttggtgactt gtgctgccta ctactttatg aaattcagac gtgtttttgg tgagtacaac 9420catgttgttg ctgctaatgc acttttgttt ttgatgtctt tcactatact ctgtctggta 9480ccagcttaca gctttctgcc gggagtctac tcagtctttt acttgtactt gacattctat 9540ttcaccaatg atgtttcatt cttggctcac cttcaatggt ttgccatgtt ttctcctatt 9600gtgccttttt ggataacagc aatctatgta ttctgtattt ctctgaagca ctgccattgg 9660ttctttaaca actatcttag gaaaagagtc atgtttaatg gagttacatt tagtaccttc 9720gaggaggctg ctttgtgtac ctttttgctc aacaaggaaa tgtacctaaa attgcgtagc 9780gagacactgt tgccacttac acagtataac aggtatcttg ctctatataa caagtacaag 9840tatttcagtg gagccttaga tactaccagc tatcgtgaag cagcttgctg ccacttagca 9900aaggctctaa atgactttag caactcaggt gctgatgttc tctaccaacc accacagaca 9960tcaatcactt ctgctgttct gcagagtggt tttaggaaaa tggcattccc gtcaggcaaa 10020gttgaagggt gcatggtaca agtaacctgt ggaactacaa ctcttaatgg attgtggttg 10080gatgacacag tatactgtcc aagacatgtc atttgcacag cagaagacat gcttaatcct 10140aactatgaag atctgctcat tcgcaaatcc aaccatagct ttcttgttca ggctggcaat 10200gttcaacttc gtgttattgg ccattctatg caaaattgtc tgcttaggct taaagttgat 10260acttctaacc ctaagacacc caagtataaa tttgtccgta tccaacctgg tcaaacattt 10320tcagttctag catgctacaa tggttcacca tctggtgttt atcagtgtgc catgagacct 10380aatcatacca ttaaaggttc tttccttaat ggatcatgtg gtagtgttgg ttttaacatt 10440gattatgatt gcgtgtcttt ctgctatatg catcatatgg agcttccaac aggagtacac 10500gctggtactg acttagaagg taaattctat ggtccatttg ttgacagaca aactgcacag 10560gctgcaggta cagacacaac cataacatta aatgttttgg catggctgta tgctgctgtt 10620atcaatggtg ataggtggtt tcttaataga ttcaccacta ctttgaatga ctttaacctt 10680gtggcaatga agtacaacta tgaacctttg acacaagatc atgttgacat attgggacct 10740ctttctgctc aaacaggaat tgccgtctta gatatgtgtg ctgctttgaa agagctgctg 10800cagaatggta tgaatggtcg tactatcctt ggtagcacta ttttagaaga tgagtttaca 10860ccatttgatg ttgttagaca atgctctggt gttaccttcc aaggtaagtt caagaaaatt 10920gttaagggca ctcatcattg gatgctttta actttcttga catcactatt gattcttgtt 10980caaagtacac agtggtcact gtttttcttt gtttacgaga atgctttctt gccatttact 11040cttggtatta tggcaattgc tgcatgtgct atgctgcttg ttaagcataa gcacgcattc 11100ttgtgcttgt ttctgttacc ttctcttgca acagttgctt actttaatat ggtctacatg 11160cctgctagct gggtgatgcg tatcatgaca tggcttgaat tggctgacac tagcttgtct 11220ggttataggc ttaaggattg tgttatgtat gcttcagctt tagttttgct tattctcatg 11280acagctcgca ctgtttatga tgatgctgct agacgtgttt ggacactgat gaatgtcatt 11340acacttgttt acaaagtcta ctatggtaat gctttagatc aagctatttc catgtgggcc 11400ttagttattt ctgtaacctc taactattct ggtgtcgtta cgactatcat gtttttagct 11460agagctatag tgtttgtgtg tgttgagtat tacccattgt tatttattac tggcaacacc 11520ttacagtgta tcatgcttgt ttattgtttc ttaggctatt gttgctgctg ctactttggc 11580cttttctgtt tactcaaccg ttacttcagg cttactcttg gtgtttatga ctacttggtc 11640tctacacaag aatttaggta tatgaactcc caggggcttt tgcctcctaa gagtagtatt 11700gatgctttca agcttaacat taagttgttg ggtattggag gtaaaccatg tatcaaggtt 11760gctactgtac agtctaaaat gtctgacgta aagtgcacat ctgtggtact gctctcggtt 11820cttcaacaac ttagagtaga gtcatcttct aaattgtggg cacaatgtgt acaactccac 11880aatgatattc ttcttgcaaa agacacaact gaagctttcg agaagatggt ttctcttttg 11940tctgttttgc tatccatgca gggtgctgta gacattaata ggttgtgcga ggaaatgctc 12000gataaccgtg ctactcttca ggctattgct tcagaattta gttctttacc atcatatgcc 12060gcttatgcca ctgcccagga ggcctatgag caggctgtag ctaatggtga ttctgaagtc 12120gttctcaaaa agttaaagaa atctttgaat gtggctaaat ctgagtttga ccgtgatgct 12180gccatgcaac gcaagttgga aaagatggca gatcaggcta tgacccaaat gtacaaacag 12240gcaagatctg aggacaagag ggcaaaagta actagtgcta tgcaaacaat gctcttcact 12300atgcttagga agcttgataa tgatgcactt aacaacatta tcaacaatgc gcgtgatggt 12360tgtgttccac tcaacatcat accattgact acagcagcca aactcatggt tgttgtccct 12420gattatggta cctacaagaa cacttgtgat ggtaacacct ttacatatgc atctgcactc 12480tgggaaatcc agcaagttgt tgatgcggat agcaagattg ttcaacttag tgaaattaac 12540atggacaatt caccaaattt ggcttggcct cttattgtta cagctctaag agccaactca 12600gctgttaaac tacagaataa tgaactgagt ccagtagcac tacgacagat gtcctgtgcg 12660
gctggtacca cacaaacagc ttgtactgat gacaatgcac ttgcctacta taacaattcg 12720aagggaggta ggtttgtgct ggcattacta tcagaccacc aagatctcaa atgggctaga 12780ttccctaaga gtgatggtac aggtacaatt tacacagaac tggaaccacc ttgtaggttt 12840gttacagaca caccaaaagg gcctaaagtg aaatacttgt acttcatcaa aggcttaaac 12900aacctaaata gaggtatggt gctgggcagt ttagctgcta cagtacgtct tcaggctgga 12960aatgctacag aagtacctgc caattcaact gtgctttcct tctgtgcttt tgcagtagac 13020cctgctaaag catataagga ttacctagca agtggaggac aaccaatcac caactgtgtg 13080aagatgttgt gtacacacac tggtacagga caggcaatta ctgtaacacc agaagctaac 13140atggaccaag agtcctttgg tggtgcttca tgttgtctgt attgtagatg ccacattgac 13200catccaaatc ctaaaggatt ctgtgacttg aaaggtaagt acgtccaaat acctaccact 13260tgtgctaatg acccagtggg ttttacactt agaaacacag tctgtaccgt ctgcggaatg 13320tggaaaggtt atggctgtag ttgtgaccaa ctccgcgaac ccttgatgca gtctgcggat 13380gcatcaacgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca ccgtgcggca 13440caggcactag tactgatgtc gtctacaggg cttttgatat ttacaacgaa aaagttgctg 13500gttttgcaaa gttcctaaaa actaattgct gtcgcttcca ggagaaggat gaggaaggca 13560atttattaga ctcttacttt gtagttaaga ggcatactat gtctaactac caacatgaag 13620agactattta taacttggtt aaagattgtc cagcggttgc tgtccatgac tttttcaagt 13680ttagagtaga tggtgacatg gtaccacata tatcacgtca gcgtctaact aaatacacaa 13740tggctgattt agtctatgct ctacgtcatt ttgatgaggg taattgtgat acattaaaag 13800aaatactcgt cacatacaat tgctgtgatg atgattattt caataagaag gattggtatg 13860acttcgtaga gaatcctgac atcttacgcg tatatgctaa cttaggtgag cgtgtacgcc 13920aatcattatt aaagactgta caattctgcg atgctatgcg tgatgcaggc attgtaggcg 13980tactgacatt agataatcag gatcttaatg ggaactggta cgatttcggt gatttcgtac 14040aagtagcacc aggctgcgga gttcctattg tggattcata ttactcattg ctgatgccca 14100tcctcacttt gactagggca ttggctgctg agtcccatat ggatgctgat ctcgcaaaac 14160cacttattaa gtgggatttg ctgaaatatg attttacgga agagagactt tgtctcttcg 14220accgttattt taaatattgg gaccagacat accatcccaa ttgtattaac tgtttggatg 14280ataggtgtat ccttcattgt gcaaacttta atgtgttatt ttctactgtg tttccaccta 14340caagttttgg accactagta agaaaaatat ttgtagatgg tgttcctttt gttgtttcaa 14400ctggatacca ttttcgtgag ttaggagtcg tacataatca ggatgtaaac ttacatagct 14460cgcgtctcag tttcaaggaa cttttagtgt atgctgctga tccagctatg catgcagctt 14520ctggcaattt attgctagat aaacgcacta catgcttttc agtagctgca ctaacaaaca 14580atgttgcttt tcaaactgtc aaacccggta attttaataa agacttttat gactttgctg 14640tgtctaaagg tttctttaag gaaggaagtt ctgttgaact aaaacacttc ttctttgctc 14700aggatggcaa cgctgctatc agtgattatg actattatcg ttataatctg ccaacaatgt 14760gtgatatcag acaactccta ttcgtagttg aagttgttga taaatacttt gattgttacg 14820atggtggctg tattaatgcc aaccaagtaa tcgttaacaa tctggataaa tcagctggtt 14880tcccatttaa taaatggggt aaggctagac tttattatga ctcaatgagt tatgaggatc 14940aagatgcact tttcgcgtat actaagcgta atgtcatccc tactataact caaatgaatc 15000ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc tctatctgta 15060gtactatgac aaatagacag tttcatcaga aattattgaa gtcaatagcc gccactagag 15120gagctactgt ggtaattgga acaagcaagt tttacggtgg ctggcataat atgttaaaaa 15180ctgtttacag tgatgtagaa actccacacc ttatgggttg ggattatcca aaatgtgaca 15240gagccatgcc taacatgctt aggataatgg cctctcttgt tcttgctcgc aaacataaca 15300cttgctgtaa cttatcacac cgtttctaca ggttagctaa cgagtgtgcg caagtattaa 15360gtgagatggt catgtgtggc ggctcactat atgttaaacc aggtggaaca tcatccggtg 15420atgctacaac tgcttatgct aatagtgtct ttaacatttg tcaagctgtt acagccaatg 15480taaatgcact tctttcaact gatggtaata agatagctga caagtatgtc cgcaatctac 15540aacacaggct ctatgagtgt ctctatagaa atagggatgt tgatcatgaa ttcgtggatg 15600agttttacgc ttacctgcgt aaacatttct ccatgatgat tctttctgat gatgccgttg 15660tgtgctataa cagtaactat gcggctcaag gtttagtagc tagcattaag aactttaagg 15720cagttcttta ttatcaaaat aatgtgttca tgtctgaggc aaaatgttgg actgagactg 15780accttactaa aggacctcac gaattttgct cacagcatac aatgctagtt aaacaaggag 15840atgattacgt gtacctgcct tacccagatc catcaagaat attaggcgca ggctgttttg 15900tcgatgatat tgtcaaaaca gatggtacac ttatgattga aaggttcgtg tcactggcta 15960ttgatgctta cccacttaca aaacatccta atcaggagta tgctgatgtc tttcacttgt 16020atttacaata cattagaaag ttacatgatg agcttactgg ccacatgttg gacatgtatt 16080ccgtaatgct aactaatgat aacacctcac ggtactggga acctgagttt tatgaggcta 16140
tgtacacacc acatacagtc ttgcaggctg taggtgcttg tgtattgtgc aattcacaga 16200cttcacttcg ttgcggtgcc tgtattagga gaccattcct atgttgcaag tgctgctatg 16260accatgtcat ttcaacatca cacaaattag tgttgtctgt taatccctat gtttgcaatg 16320ccccaggttg tgatgtcact gatgtgacac aactgtatct aggaggtatg agctattatt 16380gcaagtcaca taagcctccc attagttttc cattatgtgc taatggtcag gtttttggtt 16440tatacaaaaa cacatgtgta ggcagtgaca atgtcactga cttcaatgcg atagcaacat 16500gtgattggac taatgctggc gattacatac ttgccaacac ttgtactgag agactcaagc 16560ttttcgcagc agaaacgctc aaagccactg aggaaacatt taagctgtca tatggtattg 16620ccactgtacg cgaagtactc tctgacagag aattgcatct ttcatgggag gttggaaaac 16680ctagaccacc attgaacaga aactatgtct ttactggtta ccgtgtaact aaaaatagta 16740aagtacagat tggagagtac acctttgaaa aaggtgacta tggtgatgct gttgtgtaca 16800gaggtactac gacatacaag ttgaatgttg gtgattactt tgtgttgaca tctcacactg 16860taatgccact tagtgcacct actctagtgc cacaagagca ctatgtgaga attactggct 16920tgtacccaac actcaacatc tcagatgagt tttctagcaa tgttgcaaat tatcaaaagg 16980tcggcatgca aaagtactct acactccaag gaccacctgg tactggtaag agtcattttg 17040ccatcggact tgctctctat tacccatctg ctcgcatagt gtatacggca tgctctcatg 17100cagctgttga tgccctatgt gaaaaggcat taaaatattt gcccatagat aaatgtagta 17160gaatcatacc tgcgcgtgcg cgcgtagagt gttttgataa attcaaagtg aattcaacac 17220tagaacagta tgttttctgc actgtaaatg cattgccaga aacaactgct gacattgtag 17280tctttgatga aatctctatg gctactaatt atgacttgag tgttgtcaat gctagacttc 17340gtgcaaaaca ctacgtctat attggcgatc ctgctcaatt accagccccc cgcacattgc 17400tgactaaagg cacactagaa ccagaatatt ttaattcagt gtgcagactt atgaaaacaa 17460taggtccaga catgttcctt ggaacttgtc gccgttgtcc tgctgaaatt gttgacactg 17520tgagtgcttt agtttatgac aataagctaa aagcacacaa ggataagtca gctcaatgct 17580tcaaaatgtt ctacaaaggt gttattacac atgatgtttc atctgcaatc aacagacctc 17640aaataggcgt tgtaagagaa tttcttacac gcaatcctgc ttggagaaaa gctgttttta 17700tctcacctta taattcacag aacgctgtag cttcaaaaat cttaggattg cctacgcaga 17760ctgttgattc atcacagggt tctgaatatg actatgtcat attcacacaa actactgaaa 17820cagcacactc ttgtaatgtc aaccgcttca atgtggctat cacaagggca aaaattggca 17880ttttgtgcat aatgtctgat agagatcttt atgacaaact gcaatttaca agtctagaaa 17940taccacgtcg caatgtggct acattacaag cagaaaatgt aactggactt tttaaggact 18000gtagtaagat cattactggt cttcatccta cacaggcacc tacacacctc agcgttgata 18060taaagttcaa gactgaagga ttatgtgttg acataccagg cataccaaag gacatgacct 18120accgtagact catctctatg atgggtttca aaatgaatta ccaagtcaat ggttacccta 18180atatgtttat cacccgcgaa gaagctattc gtcacgttcg tgcgtggatt ggctttgatg 18240tagagggctg tcatgcaact agagatgctg tgggtactaa cctacctctc cagctaggat 18300tttctacagg tgttaactta gtagctgtac cgactggtta tgttgacact gaaaataaca 18360cagaattcac cagagttaat gcaaaacctc caccaggtga ccagtttaaa catcttatac 18420cactcatgta taaaggcttg ccctggaatg tagtgcgtat taagatagta caaatgctca 18480gtgatacact gaaaggattg tcagacagag tcgtgttcgt cctttgggcg catggctttg 18540agcttacatc aatgaagtac tttgtcaaga ttggacctga aagaacgtgt tgtctgtgtg 18600acaaacgtgc aacttgcttt tctacttcat cagatactta tgcctgctgg aatcattctg 18660tgggttttga ctatgtctat aacccattta tgattgatgt tcagcagtgg ggctttacgg 18720gtaaccttca gagtaaccat gaccaacatt gccaggtaca tggaaatgca catgtggcta 18780gttgtgatgc tatcatgact agatgtttag cagtccatga gtgctttgtt aagcgcgttg 18840attggtctgt tgaataccct attataggag atgaactgag ggttaattct gcttgcagaa 18900aagtacaaca catggttgtg aagtctgcat tgcttgctga taagtttcca gttcttcatg 18960acattggaaa tccaaaggct atcaagtgtg tgcctcaggc tgaagtagaa tggaagttct 19020acgatgctca gccatgtagt gacaaagctt acaaaataga ggaactcttc tattcttatg 19080ctacacatca cgataaattc actgatggtg tttgtttgtt ttggaattgt aacgttgatc 19140gttacccagc caatgcaatt gtgtgtaggt ttgacacaag agtcttgtca aacttgaact 19200taccaggctg tgatggtggt agtttgtatg tgaataagca tgcattccac actccagctt 19260tcgataaaag tgcatttact aatttaaagc aattgccttt cttttactat tctgatagtc 19320cttgtgagtc tcatggcaaa caagtagtgt cggatattga ttatgttcca ctcaaatctg 19380ctacgtgtat tacacgatgc aatttaggtg gtgctgtttg cagacaccat gcaaatgagt 19440accgacagta cttggatgca tataatatga tgatttctgc tggatttagc ctatggattt 19500acaaacaatt tgatacttat aacctgtgga atacatttac caggttacag agtttagaaa 19560atgtggctta taatgttgtt aataaaggac actttgatgg acacgccggc gaagcacctg 19620
tttccatcat taataatgct gtttacacaa aggtagatgg tattgatgtg gagatctttg 19680aaaataagac aacacttcct gttaatgttg catttgagct ttgggctaag cgtaacatta 19740aaccagtgcc agagattaag atactcaata atttgggtgt tgatatcgct gctaatactg 19800taatctggga ctacaaaaga gaagccccag cacatgtatc tacaataggt gtctgcacaa 19860tgactgacat tgccaagaaa cctactgaga gtgcttgttc ttcacttact gtcttgtttg 19920atggtagagt ggaaggacag gtagaccttt ttagaaacgc ccgtaatggt gttttaataa 19980cagaaggttc agtcaaaggt ctaacacctt caaagggacc agcacaagct agcgtcaatg 20040gagtcacatt aattggagaa tcagtaaaaa cacagtttaa ctactttaag aaagtagacg 20100gcattattca acagttgcct gaaacctact ttactcagag cagagactta gaggatttta 20160agcccagatc acaaatggaa actgactttc tcgagctcgc tatggatgaa ttcatacagc 20220gatataagct cgagggctat gccttcgaac acatcgttta tggagatttc agtcatggac 20280aacttggcgg tcttcattta atgataggct tagccaagcg ctcacaagat tcaccactta 20340aattagagga ttttatccct atggacagca cagtgaaaaa ttacttcata acagatgcgc 20400aaacaggttc atcaaaatgt gtgtgttctg tgattgatct tttacttgat gactttgtcg 20460agataataaa gtcacaagat ttgtcagtga tttcaaaagt ggtcaaggtt acaattgact 20520atgctgaaat ttcattcatg ctttggtgta aggatggaca tgttgaaacc ttctacccaa 20580aactacaagc aagtcaagcg tggcaaccag gtgttgcgat gcctaacttg tacaagatgc 20640aaagaatgct tcttgaaaag tgtgaccttc agaattatgg tgaaaatgct gttataccaa 20700aaggaataat gatgaatgtc gcaaagtata ctcaactgtg tcaatactta aatacactta 20760ctttagctgt accctacaac atgagagtta ttcactttgg tgctggctct gataaaggag 20820ttgcaccagg tacagctgtg ctcagacaat ggttgccaac tggcacacta cttgtcgatt 20880cagatcttaa tgacttcgtc tccgacgcag attctacttt aattggagac tgtgcaacag 20940tacatacggc taataaatgg gaccttatta ttagcgatat gtatgaccct aggaccaaac 21000atgtgacaaa agagaatgac tctaaagaag ggtttttcac ttatctgtgt ggatttataa 21060agcaaaaact agccctgggt ggttctatag ctgtaaagat aacagagcat tcttggaatg 21120ctgaccttta caagcttatg ggccatttct catggtggac agcttttgtt acaaatgtaa 21180atgcatcatc atcggaagca tttttaattg gggctaacta tcttggcaag ccgaaggaac 21240aaattgatgg ctataccatg catgctaact acattttctg gaggaacaca aatcctatcc 21300agttgtcttc ctattcactc tttgacatga gcaaatttcc tcttaaatta agaggaactg 21360ctgtaatgtc tcttaaggag aatcaaatca atgatatgat ttattctctt ctggaaaaag 21420gtaggcttat cattagagaa aacaacagag ttgtggtttc aagtgatatt cttgttaaca 21480actaaacgaa catgtttatt ttcttattat ttcttactct cactagtggt agtgaccttg 21540accggtgcac cacttttgat gatgttcaag ctcctaatta cactcaacat acttcatcta 21600tgaggggggt ttactatcct gatgaaattt ttagatcaga cactctttat ttaactcagg 21660atttatttct tccattttat tctaatgtta cagggtttca tactattaat catacgtttg 21720gcaaccctgt catacctttt aaggatggta tttattttgc tgccacagag aaatcaaatg 21780ttgtccgtgg ttgggttttt ggttctacca tgaacaacaa gtcacagtcg gtgattatta 21840ttaacaattc tactaatgtt gttatacgag catgtaactt tgaattgtgt gacaaccctt 21900tctttgctgt ttctaaaccc atgggtacac agacacatac tatgatattc gataatgcat 21960ttaattgcac tttcgagtac atatctgatg ccttttcgct tgatgtttca gaaaagtcag 22020gtaattttaa acacttacga gagtttgtgt ttaaaaataa agatgggttt ctctatgttt 22080ataagggcta tcaacctata gatgtagttc gtgatctacc ttctggtttt aacactttga 22140aacctatttt taagttgcct cttggtatta acattacaaa ttttagagcc attcttacag 22200ccttttcacc tgctcaagac atttggggca cgtcagctgc agcctatttt gttggctatt 22260taaagccaac tacatttatg ctcaagtatg atgaaaatgg tacaatcaca gatgctgttg 22320attgttctca aaatccactt gctgaactca aatgctctgt taagagcttt gagattgaca 22380aaggaattta ccagacctct aatttcaggg ttgttccctc aggagatgtt gtgagattcc 22440ctaatattac aaacttgtgt ccttttggag aggtttttaa tgctactaaa ttcccttctg 22500tctatgcatg ggagagaaaa aaaatttcta attgtgttgc tgattactct gtgctctaca 22560actcaacatt tttttcaacc tttaagtgct atggcgtttc tgccactaag ttgaatgatc 22620tttgcttctc caatgtctat gcagattctt ttgtagtcaa gggagatgat gtaagacaaa 22680tagcgccagg acaaactggt gttattgctg attataatta taaattgcca gatgatttca 22740tgggttgtgt ccttgcttgg aatactagga acattgatgc tacttcaact ggtaattata 22800attataaata taggtatctt agacatggca agcttaggcc ctttgagaga gacatatcta 22860atgtgccttt ctcccctgat ggcaaacctt gcaccccacc tgctcttaat tgttattggc 22920cattaaatga ttatggtttt tacaccacta ctggcattgg ctaccaacct tacagagttg 22980tagtactttc ttttgaactt ttaaatgcac cggccacggt ttgtggacca aaattatcca 23040ctgaccttat taagaaccag tgtgtcaatt ttaattttaa tggactcact ggtactggtg 23100
tgttaactcc ttcttcaaag agatttcaac catttcaaca atttggccgt gatgtttctg 23160atttcactga ttccgttcga gatcctaaaa catctgaaat attagacatt tcaccttgcg 23220cttttggggg tgtaagtgta attacacctg gaacaaatgc ttcatctgaa gttgctgttc 23280tatatcaaga tgttaactgc actgatgttt ctacagcaat tcatgcagat caactcacac 23340cagcttggcg catatattct actggaaaca atgtattcca gactcaagca ggctgtctta 23400taggagctga gcatgtcgac acttcttatg agtgcgacat tcctattgga gctggcattt 23460gtgctagtta ccatacagtt tctttattac gtagtactag ccaaaaatct attgtggctt 23520atactatgtc tttaggtgct gatagttcaa ttgcttactc taataacacc attgctatac 23580ctactaactt ttcaattagc attactacag aagtaatgcc tgtttctatg gctaaaacct 23640ccgtagattg taatatgtac atctgcggag attctactga atgtgctaat ttgcttctcc 23700aatatggtag cttttgcaca caactaaatc gtgcactctc aggtattgct gctgaacagg 23760atcgcaacac acgtgaagtg ttcgctcaag tcaaacaaat gtacaaaacc ccaactttga 23820aatattttgg tggttttaat ttttcacaaa tattacctga ccctctaaag ccaactaaga 23880ggtcttttat tgaggacttg ctctttaata aggtgacact cgctgatgct ggcttcatga 23940agcaatatgg cgaatgccta ggtgatatta atgctagaga tctcatttgt gcgcagaagt 24000tcaatggact tacagtgttg ccacctctgc tcactgatga tatgattgct gcctacactg 24060ctgctctagt tagtggtact gccactgctg gatggacatt tggtgctggc gctgctcttc 24120aaataccttt tgctatgcaa atggcatata ggttcaatgg cattggagtt acccaaaatg 24180ttctctatga gaaccaaaaa caaatcgcca accaatttaa caaggcgatt agtcaaattc 24240aagaatcact tacaacaaca tcaactgcat tgggcaagct gcaagacgtt gttaaccaga 24300atgctcaagc attaaacaca cttgttaaac aacttagctc taattttggt gcaatttcaa 24360gtgtgctaaa tgatatcctt tcgcgacttg ataaagtcga ggcggaggta caaattgaca 24420ggttaattac aggcagactt caaagccttc aaacctatgt aacacaacaa ctaatcaggg 24480ctgctgaaat cagggcttct gctaatcttg ctgctactaa aatgtctgag tgtgttcttg 24540gacaatcaaa aagagttgac ttttgtggaa agggctacca ccttatgtcc ttcccacaag 24600cagccccgca tggtgttgtc ttcctacatg tcacgtatgt gccatcccag gagaggaact 24660tcaccacagc gccagcaatt tgtcatgaag gcaaagcata cttccctcgt gaaggtgttt 24720ttgtgtttaa tggcacttct tggtttatta cacagaggaa cttcttttct ccacaaataa 24780ttactacaga caatacattt gtctcaggaa attgtgatgt cgttattggc atcattaaca 24840acacagttta tgatcctctg caacctgagc ttgactcatt caaagaagag ctggacaagt 24900acttcaaaaa tcatacatca ccagatgttg atcttggcga catttcaggc attaacgctt 24960ctgtcgtcaa cattcaaaaa gaaattgacc gcctcaatga ggtcgctaaa aatttaaatg 25020aatcactcat tgaccttcaa gaattgggaa aatatgagca atatattaaa tggccttggt 25080atgtttggct cggcttcatt gctggactaa ttgccatcgt catggttaca atcttgcttt 25140gttgcatgac tagttgttgc agttgcctca agggtgcatg ctcttgtggt tcttgctgca 25200agtttgatga ggatgactct gagccagttc tcaagggtgt caaattacat tacacataaa 25260cgaacttatg gatttgttta tgagattttt tactcttaga tcaattactg cacagccagt 25320aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400gcagacaacg gtactattac cgttgaggag cttaaacaac tcctggaaca atggaaccta 26460gtaataggtt tcctattcct agcctggatt atgttactac aatttgccta ttctaatcgg 26520aacaggtttt tgtacataat aaagcttgtt ttcctctggc tcttgtggcc agtaacactt 26580
gcttgttttg tgcttgctgc tgtctacaga attaattggg tgactggcgg gattgcgatt 26640gcaatggctt gtattgtagg cttgatgtgg cttagctact tcgttgcttc cttcaggctg 26700tttgctcgta cccgctcaat gtggtcattc aacccagaaa caaacattct tctcaatgtg 26760cctctccggg ggacaattgt gaccagaccg ctcatggaaa gtgaacttgt cattggtgct 26820gtgatcattc gtggtcactt gcgaatggcc ggacactccc tagggcgctg tgacattaag 26880gacctgccaa aagagatcac tgtggctaca tcacgaacgc tttcttatta caaattagga 26940gcgtcgcagc gtgtaggcac tgattcaggt tttgctgcat acaaccgcta ccgtattgga 27000aactataaat taaatacaga ccacgccggt agcaacgaca atattgcttt gctagtacag 27060taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat 28200aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc 28260aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc 28320cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac 28380taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc 28440agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac 28500aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt 28560ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca 28620ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc 28680tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct 28740cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga 28800ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc 28860actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa 28920cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc 28980ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa 29040tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct 29100tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc 29160aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca 29220gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa 29280aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa 29340cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg 29400accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc 29460tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaacttta 29520atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca 29580cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag 29640ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg 29700attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaaaaaa a 29751<210>2<211>1255<212>PRT
<213>SARS病毒(SARS virus)<400>2Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu1 5 10 15Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln20 25 30His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg35 40 45Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser50 55 60Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val65 70 75 80Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn85 90 95Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln100 105 110Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys115 120 125Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met130 135 140Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr145 150 155 160Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser165 170 175Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly180 185 190Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp195 200 205Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu210 215 220Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro225 230 235 240Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr245 250 255Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile260 265 270Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys275 280 285Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn290 295 300Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr305 310 315 320Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser325 330 335Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr340 345 350Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly355 360 365Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala370 375 380Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly385 390 395 400Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe405 410 415Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser420 425 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu435 440 445Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly450 455 460Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp465 470 475 480Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val485 490 495Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly500 505 510Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn515 520 525Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg530 535 540Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp545 550 555 560Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys565 570 575Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser580 585 590Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr595 600 605Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr610 615 620Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu625 630 635 640His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile645 650 655Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys660 665 670Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala675 680 685Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile690 695 700Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys705 710 715 720Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu725 730 735Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile740 745 750Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys755 760 765Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe770 775 780Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile785 790 795 800Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met805 810 815Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile820 825 830Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr835 840 845Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala850 855 860Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe865 870 875 880Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn885 890 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala900 905 910Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly915 920 925Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu930935 940Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn945 950 955 960Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp965 970 975Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln980985990Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala995 1000 1005Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp101010151020Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala102510301035Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln104010451050Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys105510601065Ala Tyr Phe Pro Arg Glu GIy Val Phe Val Phe Asn Gly Thr Ser107010751080Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr108510901095Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly110011051110Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp111511201125Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser113011351140Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val114511501155Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys116011651170Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr117511801185Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile119011951200Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys120512101215Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly122012251230Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys123512401245Gly Val Lys Leu His Tyr Thr12501255<210>3<211>30<212>DNA<213>SARS病毒(SARS virus)<400>3gcaccccacc tgctcttaat tgttattggc 30
<210>4<211>30<212>DNA<213>SARS病毒(SARS virus)<400>4tattaaagag caagtcctca ataaaagacc 30
权利要求
1.一种SARS病毒的S蛋白,其特征在于,该蛋白具有SEQ ID NO2的氨基酸序列,并含有选自下列的突变a)778D→Y;b)77D→G;c)244T→I;d)1182K→Q;e)360F→S;f)479N→R或K;g)480D→G;h)609A→L。
2.如权利要求1所述的蛋白,其特征在于,该蛋白同时含有b)77D→G和c)244T→I的突变。
3.一种分离的核酸,其特征在于,它编码权利要求1所述的SARS病毒的S蛋白。
4.一种SARS病毒,其特征在于,其S蛋白具有SEQ ID NO2的氨基酸序列,并含有选自下列的突变a)778D→Y;b)77D→G;c)244T→I;d)1182K→Q;e)360F→S;f)479N→R或K;g)480D→G;h)609A→L。
5.如权利要求4所述的SARS病毒,其特征在于,所述的S蛋白含有a)778D→Y的突变。
6.如权利要求4所述的SARS病毒,其特征在于,所述的S蛋白同时含有b)77D→G和c)244T→I的突变。
7.权利要求4所述的SARS病毒的用途,其特征在于,该病毒用于筛选治疗SARS的药物。
8.权利要求1所述的SARS病毒S蛋白的用途,其特征在于,该蛋白用于产生针对SARS病毒的疫苗。
9.一种特异性检测SARS病毒S蛋白的试剂盒,其特征在于,它含有容器和装在容器内的引物对,所述的引物对扩增出的扩增产物含有对应于S蛋白以下位点的核苷酸序列a)778D→Y;b)77D→G;c)244T→I;d)1182K→Q;e)360F→S;f)479N→R或K;g)480D→G;h)609A→L。
全文摘要
公开了一种SARS病毒的S蛋白,该蛋白具有SEQ ID NO2的氨基酸序列,并含有选自下列的突变a)778D→Y;b)77D→G;c)244T→I;d)1182K→Q;e)360 F→S;f)479 N→R或K;g)480 D→G;h)609 A→L。还公开了编码该S蛋白的核酸和含有这些突变的SARS病毒。还公开了该病毒用于筛选治疗SARS的药物和该S蛋白用于产生针对SARS病毒的疫苗的用途。
文档编号A61P31/14GK1607207SQ20041004359
公开日2005年4月20日 申请日期2004年5月8日 优先权日2003年7月10日
发明者赵国屏, 林锦炎, 宋怀东, 郑焕英, 王升跃, 何剑峰, 任双喜, 鄢心革, 李亦学, 万卓越, 孔祥银, 许锐恒, 郝沛, 吴新伟, 顾伯伟, 侯金林, 陈竺, 闵军, 缪有刚, 徐军, 傅刚, 陆家海, 张树义, 王小宁, 涂长春, 王鸣 申请人:国家人类基因组南方研究中心, 广东省疾病预防控制中心, 广州市疾病预防控制中心, 中国人民解放军军需大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1