密码子优化的杯状病毒衣壳蛋白的编码核苷酸序列及其应用的制作方法

文档序号:429028阅读:679来源:国知局
专利名称:密码子优化的杯状病毒衣壳蛋白的编码核苷酸序列及其应用的制作方法
技术领域
本发明属于基因工程领域。具体而言,本发明涉及密码子优化的杯状病毒衣壳蛋白的编码核苷酸序列、含有该序列的重组载体及宿主细胞。本发明还涉及通过杯状病毒衣壳蛋白基因密码子的优化,提高杯状病毒衣壳蛋白表达量的方法。
背景技术
人类杯状病毒是引起急性非细菌性胃肠炎的重要病原,主要在家庭或社区范围内引起学龄儿童、成人及其密切接触者的感染(参见Fields BN,et al.Fields Virology,2nd ed,pp671-693.)。1972年,Kapikian等人应用免疫电镜在美国Norwalk地区的腹泻患者粪便标本中发现了直径为27nm的病毒颗粒,并命名为Norwalk病毒(参见Kapikian AZ,et al.Visualization by immune electron microscopy of a 27-nm particleassociated with acute infectious nonbacterial gastroenteritis.J Virol,1972,101075-1081)。随后,一些形态上与之相似的病毒被陆续发现并用腹泻爆发的地方来进行命名,如夏威夷病毒(Hawaii),雪山病毒(SnowMountain),札幌病毒(Sapporo)等。现在这些病毒均被归于杯状病毒科。
目前已知杯状病毒科主要分为4个属Lagovirus,Vesivirus,Norovirus(Noro病毒)和Sapovirus(Sapo病毒),后两种属于人类杯状病毒[参见Green KY,et al.The role of human caliciViruses in epidemicgastroenteritis.Arch.Virol.Suppl.1997,13153-165;Green KY,et al.Taxonomy of the caliciviruses.J.Infect.Dis.2000,181(Suppl.2)S322-S330.],其中,Noro病毒有3个遗传组(GG)GGI,GGII和GGIII,Sapo病毒有4个遗传组SGI,SGII,SGIII和SGIV,但只有GGI、GGII型Noro病毒和SGI、SGII、SGIV型Sapo病毒感染人类(参见Katayama K,et al.Phylogenetic analysis of the complete genome of 18Norwalk-like viruses.Virology.2002,299225-239;Okada M,et al.Molecular epidemiology and phylogenetic analysis of Sapporo-like viruses.2002,Arch.Virol.147l445-1451.)。近来的研究表明,GGI、GGII型Noro病毒分别有14和17个遗传型(参见Kageyama T,et al.Coexistenceof multiple genotypes,including newly identified genotypes,in outbreak ofgastroenteritis due to norovirus in Japan.J.Clin.Microbiol.2004,422988-2995.)。
大量的分子流行病学研究表明,杯状病毒感染呈全球分布,在世界各地都有流行,具有较强的传染性,主要通过污染的食物、水源或人-人接触引起人的感染。在美国,大约90%的急性非细菌性胃肠炎是由杯状病毒引起,每年约有23,000,000的感染病例[参见FankhauserRL,et al.Molecular epidemiology of“Norwalk-like virus”in outbreaks ofgastroenteritis in the Unite States.J.Infect.Dis.1998,1781571-1578;Glass RI,et al.The epidemiology of enteric caliciviruses from humansareassessment using new diagnostics.J.Infect.Dis.2000,l8l(Suppl.2)S254-S261.]。虽然严重、复杂的病例并不多见,但是杯状病毒的感染导致住院和死亡人数的增加(参见Lopman BA,et al.Twoepidemiologic patterns of norovirus outbreakssurveillance in England andWales,1992-2000.Emerg.Infect.Dis.2003,971-77;Mead PS,et al.Food-related illness and death in the United States.Emerg.Infect.Dis.1999,5607-625.)。此外,Noro病毒所致的腹泻也常在军队中发生,例如,海湾战争时,美国军队中的腹泻约有70%是由Noro病毒引起的[参见Mccarthy M,et al.Norwalk-like virus infection in military forceEpdemic potential,sporadic disease,and the future direction of preventionand control efforts.J.Infect.Dis.2000,181(Suppl.2)S387-S389.]。
除日本外,亚洲国家对杯状病毒的分子流行病学的研究较少,(参见Hansman GS,et al.Genetic Diversity of Norovirus and Sapovirus inHospitalized Infants with Sporadic Cases of Acute Gastroenteritis inChiang Mai,Thailand.J.Clin.Microbiol.2004,42,1305-1307.)。1995年,方肇寅等首次在我国河南省腹泻患儿粪便标本中检测到Noro病毒(参见方肇寅等,在我国腹泻患儿中发现诺瓦克样病毒感染,病毒学报,1995,11215-219),随后,方肇寅和钱渊等用RT-PCR和序列分析证明不同基因型杯状病毒感染在我国婴幼儿中普遍存在,目前我国流行的人类杯状病毒主要以Noro病毒为主,Sapo病毒罕见。Noro病毒中又主要以GGII4、GGII3、GGII1和GGII7为主,可占95.8%以上。[参见钱渊等,我国婴幼儿中存在不同基因型杯状病毒的感染,病毒学报,2001,17265-269;方肇寅等,长春市儿童医院1998-2001年婴幼儿杯状病毒腹泻流行病学研究,病毒学报,18(4)332-336;吕红霞,我国婴幼儿杯状病毒腹泻分子流行病学研究,中国疾病预防控制中心病毒病预防控制所,硕士论文,北京2003]。
杯状病毒为单股正链RNA病毒,无包膜,直径约27~40nm,基因组约为7.4~8.3kb,由3个开放读码框架(ORF)组成。ORF1编码非结构蛋白,包括螺旋酶、3CL蛋白酶和RNA多聚酶蛋白,ORF2和ORF3编码结构蛋白,其中ORF2编码一个主要结构蛋白——衣壳蛋白,ORF3编码与衣壳蛋白相关的一个小蛋白,可能与起始基因组的壳体化有关。
衣壳蛋白基因产物编码病毒的主要结构蛋白,其中GGII1型Noro病毒衣壳蛋白基因全长1608个核苷酸,编码535个氨基酸,GGII3型Noro病毒衣壳蛋白基因全长1647个核苷酸,编码548个氨基酸,GGII4型Noro病毒衣壳蛋白基因全长1620个核苷酸,编码539个氨基酸,GGII7型Noro病毒衣壳蛋白基因全长1623个核苷酸,编码540个氨基酸。在缺乏其它病毒基因产物的情况下,杯状病毒衣壳蛋白即可以装配成病毒样颗粒,与病毒衣壳大小相似。
由于目前缺乏有效的细胞培养系统和动物模型,使得对杯状病毒的分类以及分子生物学、生物化学、遗传学以及诊断等方面的研究工作受到了一定的限制。目前对于杯状病毒的研究主要通过基因工程方法表达其ORF基因,该基因产物可自动装配成空心的病毒样颗粒(VLP)。杯状病毒样颗粒具有如下的优点(参见Jamot BN,Ogier A,Piroth L,et al.Recombinant virus-like particles of a norovirus(genogroupII strain)administered intranasally and orally with mucosal adjuvants LTand LT(R192G)in BALB/c mice induce specific humoral and cellularTh1/Th2-like immune responses.Vaccine,2004,221079-1086.),使得其可以替代野生型病毒进行相关的研究电镜下可以观察到,杯状病毒样颗粒与天然的病毒体具有相似的大小和形态;杯状病毒样颗粒与野生型病毒的抗原性相似,可用于制备抗体建立诊断技术;可以激发特异性体液免疫和细胞免疫反应,用于疫苗研究。但是杯状病毒VLP的生产受到蛋白表达量的限制,产量不够理想,限制了其应用[参见JiangX,et al.Diagnosis of Human Caliciviruses by Use of EnzymeImmunoassays.J.Infect.Dis.2000;181(Suppl 2)S349-59;VenkataramPrasad BV,et al.Structural Studies of Recombinant Norwalk Capsids.J.Infect.Dis.2000;181(Suppl 2)S317-21;Kitamoto N,et al.Cross-Reactivity among Several Recombinant Calicivirus Virus-LikeParticles(VLPs)with Monoclonal Antibodies Obtained from MiceImmunized Orally with One Type of VLP.J.Clin.Microbiol.2002,40,2459-2465;Bertolotti-Ciarlet A,et al.The 3End of Norwalk VirusmRNA Contains Determinants That Regulate the Expression and Stabilityof the Viral Capsid Protein VP1a Novel Function for the VP2 Protein.J.Viroi.2003,77,11603-11615.]。

发明内容
本发明一方面提供了一种DNA分子,其中含有密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列。在优选的实施方案中,所述密码子优化的核苷酸序列为SEQ ID NO1、2、3或4。
本发明另一方面提供了一种重组载体,其中含有密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列。所述载体可以是病毒、细菌或质粒载体,优选为病毒载体。所述病毒载体可以选自杆状病毒、腺病毒、疱疹病毒、EB病毒、腺病毒伴随病毒、痘苗病毒、甲病毒、慢病毒、逆转录病毒、流感病毒、副流感病毒、水泡性口炎病毒、冠状病毒、麻疹病毒、乙脑病毒、登革病毒等任何病毒载体,优选为杆状病毒或腺病毒载体。所述核苷酸序列优选为SEQ ID NO1、2、3或4。
本发明再一方面提供了一种宿主细胞,其中含有本发明的重组载体。优选所述宿主细胞为真核细胞,更优选为sf9细胞或者293细胞。
本发明还提供了一种提高杯状病毒衣壳蛋白表达量的方法,该方法包括将密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列导入目标细胞中,使得目标细胞表达杯状病毒衣壳蛋白。优选,所述目标细胞为真核细胞,更优选为昆虫细胞或哺乳动物细胞,最优选为sf9细胞或者293细胞。优选,所述密码子优化的核苷酸序列为SEQ ID NO1、2、3或4。优选密码子优化的核苷酸序列通过病毒载体导入到目标细胞中。
在优选的实施方案中,将经过密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列,利用杆状病毒载体在sf9昆虫细胞中进行表达。在另一优选的实施方案中,将经过密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列,利用腺病毒载体在293细胞中进行表达。


图1杯状病毒的RT-PCR扩增(1.DNA分子量标志;2.阴性对照;3~6.杯状病毒多聚酶基因)。
图2野生型Noro病毒衣壳蛋白基因的克隆(1.pFB1/90C;2.pCDNAII/90C;3.DNA分子量标志)。
图3Bacmid DNA的PCR鉴定(1.pFB1/90C;5.pFB1/GGII1C;6.pFB1/GGII3C;10.pFB1/GGII4C;11.pFB1/GGII7C;2,7,12.DNA分子量标志;4,9.pFastBac1)。
图4Noro病毒衣壳蛋白基因在昆虫细胞里的表达及表达量差异的Western blot分析(1.rvBacGGII7C;2.rvBacGGII4C;3.rvBacGGII1C;4.空白Sf9细胞;5.rvBacGGII3C;6.rvBac 90C;1,2,3,5为密码子优化的基因,6为野生型基因)。
图5在昆虫细胞中表达的Noro病毒衣壳蛋白形成病毒样颗粒的电子显微镜观察(A野生型GGII3Noro病毒衣壳蛋白;B密码子优化的GGII3Noro病毒衣壳蛋白)。
图6重组腺病毒质粒的酶切鉴定。
A1.pAdeasy-1/GGII3C(BamH I);2.pAdeasy-1/GGII1C(BamH I);3.pAdeasy-1/GGII4C(BamH I);4.pAdeasy-1/GGII7C(BamH I);5.DNA分子量标志;6.pAdeasy-1/GGII3C(Pac I);7.pAdeasy-1/GGII1C(Pac 1);8.pAdeasy-1/GGII4C(Pac I);9.pAdeasy-1/GGII7C(Pac I);B1.DNA分子量标志;2,3.pAdeasy-1/90C(Pac I)图7重组腺病毒的电子显微镜观察。
图8Noro病毒衣壳蛋白基因在293细胞里的表达及表达量差异的Western blot检测。
A1.rvAdGGII1C;2.rvAdGGII4C;3.rvAdGGII7C;4.阴性对照;5.rvAdGGII3C;1,2,3,5为密码优化基因;B1.阴性对照;2.rvAd90C;3.rvAdGGII3;2为野生型基因;3为密码子优化基因。
具体实施例方式
在生物界,不同种类生物对同义密码子的使用频率是不同的,优势密码子与基因表达水平呈正相关[参见Ikemura T and Ozeki H.Codon usage and transfer RNA contentsorganism-specific codon-choicepatterns in reference to the isoaccepor contents.Cold Spring Harb SympQuant Biol.1983,47Pt2p1087-97;Bernardi G,et al.Codon usage andgenome composition.J Mol Evol.1985,22(4)363-365.]。分析表明,野生型杯状病毒衣壳蛋白基因密码子与真核细胞密码子使用频率存在差异,某些氨基酸的同义密码子在真核细胞中使用频率最低,而在杯状病毒中使用频率是最高的,如天冬酰氨、苯丙氨酸等,所以,用昆虫细胞或哺乳动物细胞表达未经密码子优化的衣壳蛋白时,势必会影响蛋白的表达量。
在基因表达研究中,欲使目的基因高效表达,其影响因素众多,如载体的选择、宿主系统、目的基因本身的因素等等。研究者一般比较注重选择合适的表达载体和宿主系统,而往往忽视基因本身是否与载体和宿主系统为最佳匹配这样一个实质性问题。基因的最佳化表达可以通过对基因的重新设计和合成来实现,(1)消除稀有密码子而利用最佳化密码子遗传密码有64种,但是绝大多数生物倾向于利用这些密码子中的一部分。那些被最频繁利用的称为最佳密码子,那些不被经常利用的称为稀有或利用率低的密码子。实际上用做蛋白表达或生产的每种生物(包括大肠杆菌,酵母,哺乳动物细胞,Pichia,植物细胞和昆虫细胞)都表现出某种程度的密码子利用的差异或偏爱。密码子利用或偏爱对延伸有深刻的影响,例如,如果mRNA有很多成簇的稀有密码子,这可能对核糖体的运动速度造成负面影响,大大减低了蛋白表达水平。(2)二级结构最小化有些基因mRNA中存在某些不稳定的序列,重新设计合成基因可以去除或改变这些序列,导致高水平表达。(3)翻译起始和终止效率蛋白表达水平受许多不同因素和过程影响。翻译效率是蛋白生产和积累中的主要因素之一,翻译过程分为起始、延伸和终止三个期。对于翻译的起始,原核mRNA需要5’端非翻译前导序列中有一段叫Shine-Dalgarno序列的特异核糖体结合序列。在真核细胞,有效的起始依赖于围绕在起始密码子ATG上下游的一段叫Kozak序列的序列。绝大多数生物都有偏爱的围绕终止密码子的序列框架。酵母和哺乳动物偏爱的终止密码子分别是UAA和UGA。单子叶植物最常利用UGA,而昆虫和大肠杆菌倾向于用UAA。(4)调整GC含量。总的来说,翻译起始框架、翻译终止序列框架和密码子利用应该仔细选择,以利于蛋白的最高水平表达。某些病毒基因密码子按宿主细胞喜爱的密码子改造后,能明显提高表达水平。但是,由于其众多的影响因素,不是每个病毒基因经过密码子优化后表达量都会得到提高,[参见Graf M,et al.Concerted action of multiplecis-acting sequences is required for Rev dependence of late humanimmunodeficiency virus type 1 gene expression.J.Virol.2000,74(22)10822-10826.]。
我们在对杯状病毒衣壳蛋白基因优化的过程中,首先考虑基因本身的因素。野生型杯状病毒衣壳蛋白基因密码子与真核细胞密码子使用频率存在一定的差异,某些氨基酸的同义密码子在真核细胞中使用频率较低或最低,而在杯状病毒中使用频率是较高或最高。我们在进行基因优化时,在不改变氨基酸序列的前提下,利用真核细胞偏爱密码子取代野生型序列中真核细胞使用频率低的或稀有的密码子来进行人工设计合成。同时,在起始密码子ATG上游人工加一段Kozak序列,终止密码子使用昆虫细胞喜爱的UAA,并调整GC含量为50~55%。
为提高衣壳蛋白基因表达,还可以考虑使用合适的表达系统。蛋白表达系统主要有原核细胞表达系统和真核细胞表达系统。重组杆状病毒、重组腺病毒、重组痘苗病毒等病毒表达系统属于真核表达系统。采用重组杆状病毒和重组腺病毒系统表达衣壳蛋白基因,较采用原核细胞表达系统具有明显的优势。
用原核细胞表达某一蛋白基因,这些重组肽或蛋白经常需要进一步的修饰。它们常常会失去进行折叠的能力,不能形成二硫键;在细菌内源性蛋白酶的作用下表现出不稳定性,并且容易聚集成无活性的复合体;与天然的蛋白相比,重组肽或蛋白常常产量较低,抗原性或免疫原性也降低。而用杆状病毒和腺病毒表达系统可以克服上述缺点。
现有技术已经证实,昆虫细胞和杆状病毒可以以高水平表达全长蛋白。在昆虫细胞中很多翻译后修饰类似于哺乳动物细胞,而那些在大肠杆菌中不能成功表达的蛋白也可以在昆虫细胞利用杆状病毒系统进行表达。并且源于杆状病毒的杯状病毒样颗粒的纯化方法已有文献报道(参见Nagesha HS,Wang LF and Hyatt AD.Virus-like particles ofcalicivirus as epitope carriers.Arch Virol,1999,1442429-2439.WHITE LJ,HARDY ME and ESTES MK.Biochemical Characterization ofa Smaller Form of Recombinant Norwalk Virus Capsids Assembled inInsect Cells.J Virol,1997,71(10)8066-8072.)。
腺病毒(Ad)载体是目前被广泛应用的一种载体,腺病毒具有众多优点(1)作为真核基因调控研究的模式系统之一,人类对腺病毒在分子水平已有相当的认识;(2)腺病毒有中等大小的基因组,适合于用最少的病毒序列构建高容量的载体,同时也易于进行重组基因技术操作;(3)腺病毒可感染的宿主细胞范围广泛,包括成纤维、上皮、内皮、基质细胞等;(4)外源基因表达量高;(5)安全、可靠;(6)病毒滴度高,容易培养纯化,生产成本较低;(7)病毒基因组存在于细胞染色体外,避免了因整合引起的基因突变。由于腺病毒载体具有上述特点,使其在基因疫苗、基因治疗及蛋白功能等的研究中受到人们的青睐,成为当今使用最多的病毒载体之一。
本发明分别利用重组杆状病毒系统和重组腺病毒系统在昆虫细胞和293细胞中表达密码子优化的Noro病毒GGII1、GGII3、GGII4和GGII7型和野生型GGII3型衣壳蛋白基因,与野生型基因相比,优化基因的蛋白表达量显著提高,并且可以在昆虫细胞中装配成病毒样颗粒。
下面结合实施例进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体的实验方法,通常按照常规条件和方法,如分子克隆实验室手册(Sambrook,et al.New YorkCold Spring Harbor Laboratory Press,1989)中所述方法或试剂制造商提供的方法。
实施例一Noro病毒衣壳蛋白编码基因密码子的优化及其在昆虫细胞中表达量的提高本实施例的内容是将Noro病毒衣壳蛋白编码基因进行密码子优化设计,人工合成优化后的基因并以杆状病毒为载体,在昆虫细胞中表达密码子优化后的Noro病毒GGII1、GGII3、GGII4和GGII7型衣壳蛋白基因,并将其表达量与野生型Noro病毒衣壳蛋白基因相比较,对密码子优化的效果进行评价。具体步骤如下1.杯状病毒阳性腹泻粪便标本的筛选(1)标本处理将腹泻粪便标本用生理盐水制成20%悬液,反复冻融2次后,8000rpm离心10min,取上清,立即用于病毒RNA提取或置-80℃保存备用。
(2)病毒RNA的提取取300μl上述粪便悬液于1.5ml eppendorf管中;加入1ml TRIZOL(美国Invitrogen公司),混匀后,置4℃作用10~20min。加入200μl氯仿,充分混匀,室温作用2~3min。4℃,12,000rpm离心10min。取上层水相于另一离心管中,加入等体积异丙醇,混匀,室温作用5~8min。于4℃,12,000rpm离心10min。弃上清,加75%乙醇(DEPC H2O配制),混匀后,4℃,12,000rpm离心5min。弃上清,室温干燥5~10min。将沉淀溶于20μl DEPC H2O中,立即用于RT-PCR或置-80℃保存备用。
(3)逆转录(RT)反应在不含核酸酶的微离心管中加入下列成分随机引物(美国Promga公司)1μl,RNA 3μl,2.5mmol/L dNTP(Takara公司)4μl,H2O 5μl,置65℃,5min,立即置冰浴至少1min。瞬时离心后,加入下列成分5×第一链缓冲液4μl,0.1mmol/L DTT 1μl,RNase抑制剂(美国Invitrogen公司,40unit/μl)1μl,逆转录酶Superscript III RT(美国Invitrogen公司,200unit/μl)1μl,混匀后于25℃孵育5min,50℃孵育30~60min,最后70℃加热15min以终止反应。
(4)PCR扩增根据文献(参见Jiang X,et al.Design and evaluation of a primer pairthat detects both Norwalk-and Sapporo-like caliciviruses by RT-PCR.Journal of Virological Methods,1999,83145-154)设计出扩增杯状病毒RNA聚合酶区的引物p289和p290,引物由上海生工生物工程公司合成,序列如下p290HGATTACTCCAGGTGGGACTCCAC;(SEQ ID NO10)p290IGATTACTCCAGGTGGGACTCAAC;(SEQ ID NO11)p290JGATTACTCCAGGTGGGATTCAAC;(SEQ ID NO12)p290KGATTACTCCAGGTGGGATTCCAC;(SEQ ID NO13)p289HTGACGATTTCATCATCACCATC;(SEQ ID NO14)p289ITGACGATTTCATCATCCCCGTC。(SEQ ID NO15)取3μl逆转录产物作为模板,以p289和p290为特异性引物,反应体系为PCR Master Mix(2×)(北京天为时代公司产品)12.5μl,289引物混合液1μl,290引物混合液2μl,RT产物3μl,H2O 6.5μl。循环条件94℃预变性3min,进入PCR循环94℃,1min;49℃,1min 20sec,72℃,1min,共40个循环,最后72℃延伸10min。取PCR产物行1.0%琼脂糖凝胶电泳,PCR产物大小为319bp(Noro病毒)或331bp(Sapo病毒),与预期一致,说明基因扩增正确。图1显示为Noro病毒的扩增结果。将PCR产物克隆到pMD18-T载体(TAKARA公司产品)中,送大连宝生物公司进行DNA测序,将测序结果与GeneBank已发表的序列进行比对。结果表明,我国目前主要的流行型为Noro病毒,Sapo病毒罕见。在412份标本中,Sapo病毒只有1例,其余均为Noro病毒。在Noro病毒中主要以GGII4、GGII1、GGII2、GGII3和GGII7型为主,分别占9.7%、4.85%、2.67%、0.73%和0.38%。
2.野生型衣壳蛋白基因的克隆鉴于GGII3型为目前我国主要流行的Noro病毒之一,我们克隆了其野生型基因作为对照。
(1)PCR扩增根据已发表序列,设计GGII3型衣壳蛋白基因引物。PCR引物由上海生工生物工程公司合成,序列如下FGGCGAATTCATGAAGATGGCGTCGAAT(SEQ ID NO16);RACTCTCGAGTTATAGTGCACGTCTACG(SEQ ID NO17)。分别引入EcoRI和XhoI酶切位点。取GGII3型病毒的RT产物(见1)进行PCR扩增,反应体系为RT产物3μl,引物F和R各1μl,2.5mmol/LdNTP4μl,10×PCR缓冲液5μl,pyrobest DNA多聚酶(TAKARA公司)0.3μl,补水至总体积50μl,反应条件为94℃预变性3min,开始PCR循环,条件为94℃1min,55℃1min,72℃2min,共35个循环,最后72℃延伸10min。琼脂糖凝胶电泳显示,扩增片段长度为1647bp(图2)。按产品说明书,用TAKARA公司的琼脂糖凝胶回收试剂盒回收PCR产物。
(2)目的基因的克隆用内切酶EcoR V(TAKARA公司)单酶切pCDNA II载体(美国Invitrogen公司),体系pCDNA II 10μl,EcoRV 1μl,10×Buffer H 2μl,H2O7μl。37℃消化2h后,回收载体片段。用已经EcoR V酶切的pCDNA II与PCR产物建立连接体系载体片段pCDNA II 0.5ul;PCR产物3ul;连接缓冲液2ul;连接酶1ul;补H2O至20μl。12℃连接16h。取10μl连接产物转化E.coli DH10B(美国Invitrogen公司)感受态细胞。挑取氨苄青霉素(Amp)抗性克隆,用含Amp的LB培养液培养12~16h后,以碱裂解法小量制备质粒,用EcoR I和XhoI双酶切鉴定,得到中间克隆pCDNA II/90C,阳性质粒经大连宝生物公司测序,将测序结果与GeneBank已发表的序列进行比对,确证其基因型为GGII3型。具体序列见SEQ ID NO9。
3.Noro病毒衣壳蛋白基因密码子的优化按真核细胞喜用密码子(参见http//www.kazusa.or.jp/codon/),在不改变氨基酸序列的前提下,利用真核细胞偏爱密码子取代野生型序列中真核细胞使用频率低的或稀有的密码子进行人工设计,同时,在起始密码子ATG上游人工加一段Kozak序列,终止密码子使用昆虫细胞喜爱的UAA,并调整GC含量为50~55%,委托上海生工生物工程公司合成了我国当前流行的Noro病毒GGII1、GGII3、GGII4和GGII7型的衣壳蛋白基因,其序列分别见SEQ ID NO1-SEQ ID NO4。相应的野生型序列见SEQ ID NO5-SEQ ID NO8。优化后的序列G+C含量50~55%,被克隆于pUC57(上海生工公司)载体上,分别命名为pUC57/GGII1C、pUC57/GGII3C、pUC57/GGII4C、pUC57/GGII7C,所有合成基因经大连宝生物公司和上海博亚生物技术公司测序确证正确后,用于衣壳蛋白的表达。
4.杆状病毒表达载体的构建用EcoR I和Xho I(TAKARA公司)双酶切杆状病毒表达载体pFastBac 1(美国Invitrogen公司,以下简称pFB 1),体系为pFB1 10μl,EcoR I和XhoI各1μl,10×缓冲液2μl,H2O 6μl。37℃2h,用TAKARA公司的琼脂糖凝胶回收试剂盒回收回收载体片段。
同时用EcoR I和Xho I双酶切含有优化基因的质粒pUC57/GGII1C、pUC57/GGII3C、pUC57/GGII4C、pUC57/GGII7C及含有野生型GGII3C的质粒pCDNAII/90C。反应体系为质粒20μl,EcoRI和Xho I各1.5μl,10×缓冲液5μl,H2O 22μl。37℃2h,用TAKARA公司的琼脂糖凝胶回收试剂盒分别回收目的片段。
将上述线性化的载体pFB1分别与目的基因GGII1C、GGII3C、GGII4C、GGII7C及90C进行连接反应,反应体系为载体pFB1 0.5μl;目的片段3μl,连接缓冲液2μl;T4DNA连接酶(TAKARA公司)1μl;补H2O至20μl,12℃连接16h。取10μl连接产物分别转化E.coli DH10B感受态细胞。挑取Amp抗性克隆,用含Amp的LB培养液培养12~16h后,以碱裂解法小量制备质粒,用EcoR I和XhoI分别进行双酶切鉴定,得到重组杆状病毒表达载体pFB1/GGII1C、pFB1/GGII3C、pFB1/GGII4C、pFB1/GGII7C、和pFB1/90C。
5.重组杆状病毒表达载体的转座反应(1)Luria Agar选择性培养基的制备称取40g Luria Agar(美国Invitrogen公司)固体培养基溶于1L超纯水,分装至三角瓶中,10磅高压20min,待冷却至50℃左右,迅速加入下列物质的贮存液至终浓度分别为卡那霉素(美国Sigma公司)50μg/ml,庆大霉素(美国Sigma公司)7μg/ml,四环素(美国Sigma公司)10μg/ml,Bluo-gal(美国Invitrogen公司)100μg/ml,iTPG(美国Invitrogen公司)40μg/ml。
(2)转座反应从-80℃冰箱取出DH10Bac感受态细胞(美国Invitrogen公司)置于冰上溶化,分别加入2μl重组表达载体质粒pFB1/GGII1C、pFB1I/GGII3C、pFB1/GGII4C、pFB1I/GGII7C和pFB1/90C,轻弹eppendorf管,混匀,置冰浴30min。42℃热休克90sec,置于冰浴稳定5min。加入900ul SOC培养液(美国Invitrogen公司),置37℃缓慢振摇4-6h。分别取200ul菌液涂布Luria Agar选择性培养平板,37℃避光培养至少48h,观察蓝白斑生长情况。
6.重组Bacmid DNA的分离挑取上述平板上的白色菌落各3~4个,分别再在Luria agar平板上划线培养过夜,挑取仍为白斑的菌落,加至3ml的LB(卡那霉素50μg/ml,庆大霉素7μg/ml,四环素10μg/ml)中,37℃振摇培养24小时。取1.0ml的培养物,离心收集菌体,加入0.3ml溶液I[15mmol/LTris-HCl(pH 8.0),10mmol/LEDTA,100μg/ml RNase A(美国Sigma公司产品)]重悬菌体,加入0.3ml溶液II(0.2N NaOH,1%SDS)混匀,室温放置5min,加入0.3ml 3mol/L的乙酸钾(pH5.5),混匀,冰浴5~10min。13,000rpm离心10min,取上清,加入0.8ml的异丙醇,混匀,冰浴5~10min,13,000rpm离心15min,沉淀用70%的乙醇洗涤,置室温干燥,溶于50μl的TE缓冲液(10mmol/L Tris-HCl,1mmol/L EDTA,pH8.0)中。
7.重组杆状病毒的获得昆虫细胞Sf9的培养采用含10%胎牛血清(杭州四季青公司)和P.S.(青霉素100U/ml,链霉素100μg/ml,华北制药厂)的Grace培养基(美国Invitrogen公司)。转染前24h将细胞传至6孔细胞培养板(美国Costar公司)中,待细胞长至约50~70%丰度时进行转染。转染时准备下列溶液溶液A1-2μg重组Bacmid DNA与100μl无血清无抗生素的Grace培养基混合,溶液B6μl Cellfectin转染试剂(美国Invitrogen公司)与94μl无血清、无抗生素的Grace培养基(美国Invitrogen公司)混合;将上述溶液A与溶液B混合,轻弹管壁混匀,室温孵育30min。在等待的时间内,用2ml无血清无抗生素的Grace培养基洗细胞2次,每孔加入0.8ml无血清、无抗生素的Grace培养基,在转染混合物孵育结束后,逐滴加入转染复合物。27℃孵育5h后,去除转染液,换为含10%胎牛血清的细胞培养液继续27℃培养。次日换为含2%胎牛血清的维持液,27℃培养72h。转染72h后,收获转染上清,分装至无菌冻存管中,此即为含重组病毒的原代毒种。获得的病毒原种分别为rvBacGGII1C、rvBacGGII3C、rvBacGGII4C、rvBacGGII7C和rvBac90C。将病毒原种置4℃或-80℃保存。将此病毒感染Sf9细胞进行扩增传代。
8.目的蛋白的表达鉴定及表达量的比较(1)鼠抗杯状病毒衣壳蛋白多克隆抗体的制备应用AdEasyTMAdenovira1 Vector System将4种优化的Noro病毒衣壳蛋白基因包装重组腺病毒,rAdvGGII1+rAdvGGII3+rAdvGGII4+rAdvGGII7联合免疫6~8周龄Balb/c小鼠,免疫途径为经鼻免疫,免疫剂量为150μl,免疫前及第二、第三次加强免疫后尾静脉取血,室温静置,4000rpm离心10min收集血清,加等量甘油后-20℃保存备用。
(2)目的蛋白的表达鉴定及表达量的比较待Sf9细胞生长至80%~90%丰度时,分别接种等量(MOI=5)重组杆状病毒rvBacGGII1C、rvBacGGII3C、rvBacGGII4C、rvBacGGII7C和rvBac90C,感染后48h细胞刮子刮下病变的细胞,PBS洗涤后,细胞沉淀用200μl含蛋白酶抑制剂(美国Roche公司)的RIPA裂解液(50mmol/L Tris-HCl,150mmol/L NaCl,0.1%SDS,1%NP40,0.5%脱氧胆酸钠)冰上裂解1h,于4℃12,000rpm离心10min,将上清转移至另一新的eppendorf管中,用Pierce公司的BCATMProtein Assay Kit对提取的胞浆蛋白按说明书方法进行定量后,调整蛋白浓度至终浓度至5000μg/ml,加入5×SDS-PAGE电泳缓冲液,100℃加热变性后,取10μl总蛋白行12%SDS-PAGE电泳。电泳结束后,转印硝酸纤维素膜,用5%脱脂奶室温封闭2h后,用小鼠抗杯状病毒衣壳蛋白抗体室温孵育2h,用含0.05%Tween-20的TBS缓冲液(TBST)洗涤3次后,用辣根过氧化物酶标记的羊抗鼠IgG(美国Sigma公司)室温孵育1h。TBST充分洗涤后,用SuperSignalWest Pico化学发光底物(Pierce公司)进行显色。结果显示,在60kD附近有浓集的特异性条带出现(图4),说明杆状病毒携带的杯状病毒衣壳蛋白基因在昆虫细胞中得到高效表达。重复3次实验,分别用TotalLab软件进行半定量扫描,结果显示密码子优化基因的表达量均明显高于野生型GGII3基因(90C),是后者表达量的5~10倍。这说明密码子经过优化的基因序列在昆虫细胞中可以显著提高表达量。
9.Noro病毒样颗粒的形成已有研究表明,在正常情况下单独表达杯状病毒的衣壳蛋白可以形成病毒样颗粒[参见Venkataram Prasad BV,et al.Structural Studies ofRecombinant Norwalk Capsids.J.Infect.Dis.2000;181(Suppl 2)S317-21;Jamot BN,Ogier A,Piroth L,et al.Recombinant virus-likeparticles of a norovirus(genogroup II strain)administered intranasally andorally with mucosal adjuvants LT and LT(R192G)in BALB/c mice inducespecific humoral and cellular Th 1/Th2-like immune responses.Vaccine,2004,221079-1086.]。为了证明表达量提高的蛋白其功能是正常的,我们进行了Noro病毒样颗粒装配的观察。分别将Sf9细胞接种重组杆状病毒rvBacGGII1C、rvBacGGII3C、rvBacGGII4C、rvBacGGII7C和rvBac90C,待细胞病变完全后,刮下病变的细胞,4℃,5000rpm离心10min,收集细胞沉淀。用PBS缓冲液洗涤细胞3次,每次4℃,5000rpm离心10min,将细胞沉淀用200μl含蛋白酶抑制剂(美国Roche公司)的RIPA裂解液冰上裂解1h,12,000rpm离心10min,取上清,磷钨酸负染后在Tecnail2透射电子显微镜(美国Tecnai公司)下观察,可见典型的空心杯状病毒颗粒出现,与野生型基因一致,这说明表达量提高的基因表达产物具有正常的功能(图5)。
实施例二 密码优化Noro病毒衣壳蛋白编码基因在哺乳动物细胞中表达量的提高为了验证按昆虫细胞喜用密码子优化的Noro病毒衣壳蛋白基因是否在哺乳动物细胞中也可以提高其表达量,在本实施例中我们以腺病毒为载体,分别表达了密码子优化的Noro病毒GGII1、GGII3、GGII4和GGII7型和野生型GGII3型衣壳蛋白基因,在人胚肾上皮细胞293中检测基因的表达及其表达量的差异。具体步骤如下1.重组腺病毒载体的构建(1)将密码子优化的衣壳蛋白基因克隆入穿梭载体pShuttle-CMV用限制性内切酶Bgl II和XhoI双酶切穿梭质粒pshuttle-CMV(美国Stratagen公司)pShuttle-CMV 10μl,BamH I和XhoI各1μl,10×缓冲液2μl,H2O 6μl。37℃孵育2h,用TAKARA公司的琼脂糖凝胶回收试剂盒回收载体片段。
用BamHI和XhoI分别双酶切含有密码子优化基因的质粒pUC57/GGII1C、pUC57/GGII3C、pUC57/GGII4C、pUC57/GGII7C,反应体系为质粒20μl,BamHI和XhoI各1.5μl,10×缓冲液5μl,H2O22μl。37℃孵育2h,用TAKARA公司的琼脂糖凝胶回收试剂盒回收目的片段。
Bgl II和BamH I为同尾酶,可以直接建立连接体系,酶切产物pShuttle-CMV分别与GGII1C、GGII3C、GGII4C、GGII7C进行连接反应载体片段pShuttle-CMV 0.5μl,目的片段GGII1C、GGII3C、GGII4C、GGII7C各3μl,连接缓冲液2ul;T4DNA连接酶(TAKARA公司产品)1μl;H2O 13.5μl,12℃连接16h。取10μl连接产物转化E.coli DH10B感受态细胞。挑取卡那霉素(K+)抗性克隆,用含K+的LB培养液培养12~16h后,以碱裂解法小量制备质粒,用EcoR I和Xho I双酶切鉴定,得到重组腺病毒穿梭质粒pShuttle-CMV/GGII1C、pShuttle-CMV/GGII3C、pShuttle-CMV/GGII4C和pShuttle-CMV/GGII7C。
(2)将野生型衣壳蛋白基因克隆入穿梭载体pShuttle-CMV用限制性内切酶Bgl II和XhoI双酶切穿梭质粒pShuttle-CMV,体系pShuttle-CMV 10μl,BglII和XhoI各1μl,10×缓冲液2μl,H2O 6μl。37℃2h,用TAKARA公司的琼脂糖凝胶回收试剂盒回收载体片段。
用BamH I和Xho I双酶切杆状病毒表达载体pFB1/90C,体系pFB1/90C 20μl,BamH I和XhoI各1.5μl,10×缓冲液5μl,H2O 22μl。37℃2h,用TAKARA公司的琼脂糖凝胶回收试剂盒回收目的片段。
将上述线性化的载体pShuttle-CMV与目的基因90C进行连接反应,体系载体片段pShuttle-CMV 0.5μl;90C 3ul;连接缓冲液2ul;T4DNA连接酶(TAKARA公司产品)1μl;;H2O 13.5μl。12℃连接16h。取10μl连接产物转化E.coli DH10B感受态细胞。挑取卡那霉素(K+)抗性克隆,用含K+的LB培养液培养12~16h后,以碱裂解法小量制备质粒,用EcoR I和Xho I双酶切鉴定,得到重组腺病毒穿梭质粒pShuttle-CMV/90C。
2.重组腺病毒的获得对于上述克隆有外源基因的重组腺病毒穿梭质粒pShuttle-CMV/GGII1C、pShuttle-CMV/GGII3C、pShuttle-CMV/GGII4C、pShuttle-CMV/GGII7C和pShuttle-CMV/90C,分别取约500ng重组穿梭质粒,分别用Pme I(美国New England Biolabs公司)单酶切以线性化,无水乙醇沉淀,溶于6μl ddH2O中备用。
用线性化的重组穿梭质粒与约100ng pAdEasy-1腺病毒骨架质粒(美国Stratagen公司)共同电转化E.coli BJ5183(美国Stratagen公司)感受态细胞(参见He TC,Zhou S,da Costa L,Yu J,Kinzler KW,Vogelstein B.A simplified system for generating recombinant adenoviruses.Proc.Natl.Acad.Sci.USA 1998,952509-14),取细菌悬液涂于含50μg/ml卡那霉素的LB培养板中,于37℃培养16~20h,挑选10~20个较小的菌落,接种于3ml含有卡那霉素(25μg/ml)的SOC培养液内,置37℃摇床,培养12~16h,碱裂解法小量提取质粒DNA,获得了重组腺病毒质粒pAdEasyGGII1C、pAdEasyGGII3C、pAdEasyGGII4C、pAdEasyGGII7C和pAdEasy90C,用0.7%琼脂糖凝胶进行电泳迁移率分析后,用Pac I(美国New England Biolabs公司)酶切进一步鉴定,可产生4.5Kb左右的片段。将所得的重组腺病毒质粒转化以氯化钙法制备的宿主菌DH10B(rec A1,end A1)(美国Invitrogen公司)感受态细胞,在此宿主菌中可产生高拷贝数的质粒,挑取目的克隆,经BamH I和Pac I酶切鉴定后,-70℃保存备用(图6)。
用QIAGEN Plasmid Midi Kit(德国Qiagen公司)提取重组腺病毒质粒,用Pac I酶切后,无水乙醇沉淀回收目的DNA片段,溶于无菌去离子水中。在转染前24h将293细胞(美国Invitrogen公司)接种于T-12.5细胞培养瓶(美国BD公司)中,转染时细胞的丰度为50%~70%。将Pac I酶切线性化后的20μl重组腺病毒DNA及3μl的Lipofectamine2000(美国Invitrogen公司)分别与100μl M液[无抗生素、无血清的含有谷氨酰胺及NaHCO3的DMEM培养液(美国Invitrogen公司)]充分混匀,室温孵育15min,混合两种悬液室温继续作用30min。在上述等待的时间里,移去293细胞的原培养液,用2ml M液洗细胞2次。补加800μl M液至Lipofectamine2000-DNA的复合物中,轻轻混匀后加至洗涤过的293细胞上,37℃,5%CO2孵育5h,移去含DNA/脂质体复合物的培养液,补加含10%新生牛血清(美国Hyclone公司)的DMEM完全培养液,继续培养,第二天换为含2%新生牛血清的维持液,继续培养。在转染后6~7d,细胞出现肿胀、变圆等细胞病变(CPE)。收集细胞与上清液一起-70℃、37℃反复冻融3次,取适量的冻融液接种293细胞,用含2%新生牛血清的DMEM培养液于37℃、5%CO2培养箱中培养,观察细胞病变,按上述方法收病毒传代一次。获得的重组腺病毒命名为rvAdGGII1C、rvAdGGII3C、rvAdGGII4C、rvAdGGII7C和rvAd90C。分别将rvAdGGII1C、rvAdGGII3C、rvAdGGII4C、rvAdGGII7C和rvAd90C感293细胞,待细胞病变完全后,反复冻融3次,13,000rpm,离心10min,取上清,磷钨酸负染后在透射电子显微镜下观察,可见呈二十面体结构,直径约为70nm,具有典型的腺病毒形态(图7)。
3.目的蛋白的表达鉴定及表达量的比较(1)鸡抗杯状病毒衣壳蛋白多肽多克隆抗体的制备根据杯状病毒GGII1、GGII3、GGII4和GGII7型衣壳蛋白氨基酸序列,选择保守性多肽序列进行人工合成,序列如下GEFTVSPRNSPGE,对鸡进行肌肉注射制备多克隆抗体,初次免疫用100μg抗原,并加等量弗氏完全佐剂,第1、2和3次加强免疫用100μg抗原,并加等量弗氏不完全佐剂,免疫前及免疫后翅静脉取血,室温静置,4000rpm离心10min收集血清,加等量甘油后-20℃保存备用。
(2)目的蛋白的表达鉴定及表达量的比较待293细胞生长至80%~90%丰度时,分别接种重组腺病毒rvAdGGII1C、rvAdGGII3C、rvAdGGII4C、rvAdGGII7C和rvAd90C,感染后48h刮下病变的细胞,于4℃,5000rpm离心10min,收集细胞沉淀,用PBS洗涤细胞3次,每次4℃,5000rpm离心10min,将细胞沉淀用200μl含蛋白酶抑制剂(美国Roche公司)的RIPA裂解液(50mmol/L Tris-HCl,150mmol/L NaCl,0.1%SDS,1%NP40,0.5%脱氧胆酸钠)冰上裂解1h,于4℃12,000rpm离心10min,将上清转移至另一新的eppendorf管中,用Pierce公司的BCATMProtein Assay Kit对提取的胞浆蛋白按说明书方法进行定量后,调整蛋白浓度至终浓度至5000μg/ml,加入5×SDS-PAGE电泳缓冲液,100℃加热变性后,取10μl总蛋白行12%SDS-PAGE电泳。电泳结束后,转印硝酸纤维素膜,用5%脱脂奶室温封闭2h后,用鸡抗杯状病毒衣壳蛋白多肽抗体室温孵育2h,用TBST洗涤3次后,用辣根过氧化物酶标记的羊抗鸡IgY(美国SIGMA公司)室温孵育1h。TBST充分洗涤后,用SuperSignalWestPico化学发光底物进行显色。结果显示,在60kD附近有特异性的条带出现(图8A),说明腺病毒携带的杯状病毒衣壳蛋白基因在293细胞中得到有效表达。重复3次实验,分别用TotalLab软件对Western blot条带进行半定量扫描,结果显示优化基因的表达量为野生型GGII3基因(90C)表达量的5倍以上(图8B)。这说明按昆虫细胞密码子优化的基因,与其野生型基因相比,在哺乳动物细胞中也可以显著提高其表达量。
序列表<110>王健伟<120>密码子优化的杯状病毒衣壳蛋白的编码核苷酸序列及其应用<130>CP1050231<160>22<170>PatentIn version 3.3<210>1<211>1608<212>DNA<213>人工的<220>
<223>密码子优化的GGII1型Noro病毒衣壳蛋白基因<400>1atgaagatgg cttctaacga cgctgcccct tccaacgatg gtgctgctgg tctggtgcct 60gaggtgaaca atgagaccat ggctctggaa cctgtggctg gtgcttccat tgctgcccct 120ctgactggtc agaacaatgt gattgaccct tggatccgta tgaacttcgt gcaggctcct 180aatggtgagt tcaccgtgtc tcctcgtaac tcccctggtg agatcctgtt gaacctggag 240ttgggtcctg aactgaaccc tttcctggct cacctgtccc gtatgtacaa cggttacgct 300ggaggtgtgg aggtgcaggt gctgttggct ggtaacgctt tcactgctgg taaactggtg 360ttcgctgcca tccctcccca cttccctctg gagaacctgt ctcctggtca gatcaccatg 420ttccctcacg tgatcattga tgtgcgtacc ctggaacctg tgctgttgcc tctgcctgac 480gtgcgtaaca atttcttcca ctacaaccag caacctgagc ctcgtatgcg tctggtggct 540atgttgtaca ctcctctgcg ttctaacggt tctggtgacg atgtgttcac tgtgtcctgc 600cgtgtgttga cccgtccttc tcctgacttc gacttcaact acctggtgcc tcccactgtg 660gagtccaaga ctaagccttt caccctgcct atcctgacca ttggtgagct gtccaactcc 720
cgtttccctg tgcctatcga tgaactgtac acctccccta acgagggtgt gatcgtgcag 780cctcagaacg gtcgttccac cctggatggt gagctgttgg gtaccactca actggtgcct 840tctaacatct gcgctctgcg tggtcgtatc aacgctcagg tgcctgacga tcaccaccag 900tggaacctgc aggtgaccaa caccaacggt actcctttcg accctaccga ggacgtgcct 960gctcctctgg gtacccctga cttcctggct aacatctacg gtgtgacctc ccaacgtaac 1020cctaacaata cttgccgtgc tcacgatggt gtgctggcta cctggtctcc taagttcact 1080cctaagttgg gttctgtgat cctgggtact tgggaggaat ccgacctgga cctgaaccaa 1140cctacccgtt tcactcctgt gggtctgttc aacactgacc acttcgacca gtgggctctg 1200ccttcctact ctggtcgtct gaccctgaac atgaacctgg ctccttctgt gtcccctctg 1260ttccctggtg aacagctgtt gttcttccgt tcccacatcc ctctgaaggg tggaacctct 1320gacggtgcta ttgactgcct gttgcctcaa gagtggatcc aacacttcta ccaggagtct 1380gctccttccc ctactgacgt ggctctgatc cgttacacca accctgacac tggtcgtgtg 1440ctgttcgagg ctaaactgca ccgtcagggt ttcatcactg tggctaactc tggttcccgt 1500cctattgtgg tccctcccaa cggttacttc cgtttcgact cctgggtgaa ccagttctac 1560tctctggctc ctatgggtac tggtaacggt cgtcgccgtg tgcagtaa 1608<210>2<211>1647<212>DNA<213>人工的<220>
<223>密码子优化的GGII3型Noro病毒衣壳蛋白基因<400>2atgaagatgg cttctaaccg tgctgcccct tccaacgatg gtgctgcttg cctggtgcct 60gagatcaaca atgaggctat ggctctggag cctgtggctg gtgctgccat tgctgcccct120
ctgactggtc agcaaaacat cattgatcct tggatcatga acaatttcgt gcaggctcct180ggtggtgagt tcactgtgtc tcctcgtaat tcccctggtg aggtgctgct gaacctggaa240ctgggtcctg aaatcaaccc ttacctggct cacctggctc gtatgtacaa tggttacgct300ggtggcttcg aggtgcaggt ggtcctggct ggtaatgctt tcaccgctgc caaaatcatt360ttcgctgcca tccctcccaa cttccctatc gacaacctgt ctgctgctca gatcaccatg420tgccctcacg tgattgtgga tgtgcgtcag ctggagccta tcaacctgcc tatgcctgac480gtgcgtaaca atttcttcca ctacaaccag ggttctgatt ctcgtctgcg tctgattgct540atgctgtaca ctcctctgcg tgctaacaat tccggtgacg atgtgttcac cgtgtcctgc600cgtgtgctga ctcgtccttc ccctgatttc ctgttcaact tcctggtgcc tcccactgtg660gaatccaaga ccaagccttt caccctgcct attctgacca tctctgagat gtccaactcc720cgtttccctg tgcctatcga ctctctgcac acctccccta ctgagaacat cgtggtccag780tgccaaaacg gtcgtgtgac tctggatggt gagctgatgg gtaccactca actgctccct840tcccagattt gcgctttccg tggtaccctg actggttcca cctctcgtgc ttctgatcag900gctgacaccc ctactcctcg tctgttcaac caccattggc acatccagct ggataacctg960aatggtaccc cttacgaccc tgctgaggac atccctgctc ctctgggtac tcctgacttc 1020cgtggtaagg tgttcggtgt ggctggtcag cgtaaccctg attccaccac tcgtgctcac 1080gaggctaagg tggacaccac ttctggtcgt ttcaccccta agctgggttc cctggaaatc 1140accactgagt ctgacgatct ggacctgtcc cagcctacca aattcacccc tgtgggtatc 1200ggtgtggaca accgtgctga gttccagcaa tggtccctgc ctgactactc tggtcagttc 1260acccacaaca tgaacctggc tcctgctgtg gctcctaact tccctggtga gcagctgctc 1320ttcttccgtt ctcagctgcc ttcctctggt ggtcgttcca atggtgtgct ggattgcctg 1380gtgcctcagg agtgggtgca acacttctac caggagtctg ctcctgctca gacccaggtg 1440
gctctggtgc gttacgtgaa ccctgacact ggtcgtgtgc tgttcgaggc taagctgcac 1500aagctgggtt tcatgaccgt ggctaagaac ggtgactccc ctatcactgt gcctcccaac 1560ggttacttcc gtttcgagtc ttgggtgaac cctttctaca ccctggctcc tatgggtact 1620ggtaacggtc gtcgccgtat ccaataa 1647<210>3<211>1620<212>DNA<213>人工的<220>
<223>密码子优化的GGII3型Noro病毒衣壳蛋白基因<400>3atgaagatgg cttccaatga cgctaaccct tctgatggtt ccgctgctaa cctggtgcct 60gaggtgaaca atgaggtgat ggctctggaa cctgtggtcg gtgctgccat tgctgcccct 120gtggctggtc agcaaaacgt gattgaccct tggatccgta acaatttcgt gcaggctcct 180ggtggcgagt tcactgtgtc ccctcgtaac gctcctggtg agatcctgtg gtctgctcct 240ctgggtcctg acctgaaccc ttacttgtct cacttgtccc gtatgtacaa cggttacgct 300ggtggcttcg aggtgcaggt gatcctggct ggtaatgctt tcactgctgg taaagtgatc 360ttcgctgccg tgcctcccaa cttccctact gagggtttgt ccccttccca ggtgactatg 420ttccctcaca tcattgtgga tgtgcgtcag ttggaacctg tgctgatccc tctgcctgat 480gtgcgtaaca atttctacca ctacaaccaa gctaacgact ctaccctgaa gttgattgct 540atgctgtaca cccctctgcg tgctaacaat gctggtgacg atgtgttcac tgtgtcttgc 600cgtgtgctga cccgtccttc ccctgacttc gacttcatct tcctggtgcc tcccactgtg 660gagtcccgta ccaaaccttt cactgtgcct gtgctgactg tggaggaaat gtccaactcc 720cgtttcccta ttcctctgga gaagctgtac actggtcctt cctctgcttt cgtggtccag 780
cctcaaaacg gtcgttgcac cactgatggt gtgctcctgg gtaccactca actgtctgct 840gtgaacatct gcaacttccg tggtgatgtg acccacattg ctggttctca cgactacacc 900atgaacctgg cttcccaaaa ctggtccaac tacgacccta ccgaagagat ccctgctcct 960ctgggtactc ctgacttcgt gggtaagatc cagggtctgc tcacccagac cactcgtgct 1020gacggttcca cccgtgctca caaagctact gtgtccaccg gttccgtgca cttcacccct 1080aagctgggtt ctgtgcagtt caccactgac accaacaatg acttccaggc tggtcagaac 1140actaagttca cccctgtggg tgtgatccag gacggtgacc accaccagaa cgaacctcag 1200caatggtccc tgcctaacta ctctggtcgt accggtcaca acgtgcacct ggctcctgct 1260gtggctccta ccttccctgg tgagcaactg ctattcttcc gttccaccat gcctggttgc 1320tctggttacc ctaacatgaa cctggactgc ctgctccctc aggaatgggt gctgcacttc 1380taccaggagg ctgcccctgc tcagtctgac gtggctctgc tccgtttcgt gaaccctgac 1440accggtcgtg tgctgttcga gtgcaagctg cacaagtctg gttacatcac cgtggctcac 1500accggtcctt acgacctggt gctgcctccc aacggttact tccgtttcga ctcttgggtg 1560aaccagttct acactctggc tcctatgggt aacggtactg gtcgtcgccg tgctctgtaa 1620<210>4<211>1623<212>DNA<213>人工的<220>
<223>密码子优化的GGII7型Noro病毒衣壳蛋白基因<400>4atgaagatgg cttccaacga cgctgctcct tccaacgacg gtgctgctgg tctggtgcct 60gagatcaaca acgaggtgat gcctctggag cctgtggctg gtgcttccct ggctacccct 120gtggtgggtc agcagaacat catcgaccct tggatccgta acaacttcgt gcaggctcct 180
gctggtgagt tcaccgtgtc ccctcgtaac tcccctggtg agatcctgct ggacctggag 240ctgggtcctg agctgaaccc ttacctggct cacctggctc gtatgtacaa cggtcacgct 300ggtggtatgg aggtgcagat cgtgctggct ggtaacgctt tcaccgctgg taagatcgtg 360ttcgctgcta tccctcctgg tttcccttac gagaacctgt ccccttccca gatcaccatg 420tgccctcacg tgatcatcga cgtgcgtcag ctggagcctg tgctgctgct gatgcctgac 480atcaagaaca acttcttcca ctacaaccag ggtaacgacc ctaagctgcg tctggtggct 540atgctgtaca cccctctgcg tgctaacaac tccggtgacg acgtgttcac cgtgtcctgc 600cgtgtgctga ccaagccttc ccctgacttc gagttcacct tcctggtgcc tcctaccgtg 660gagtccaaga ccaagcagtt caccctgcct atcctgaaga tctccgagat gaccaactcc 720cgtttccctg tgcctgtgga gatgatgtac accgctcgta acgagaacca ggtggtgcag 780cctcagaacg gtcgtgtgac cctggacggt gagctgctgg gtaccacccc tctgctggct 840gtgaacatct gcaagttcaa gggtgaggtg atcgctaaga acggtgacgt gcgttcctac 900cgtatggaca tggagatcac caacaccgac ggtaccccta tcgaccctac cgaggacacc 960cctggtccta tcggttcccc tgacttccag ggtatcctgt tcggtgtggc ttcccagcgt1020aacaagaacg agcagaaccc tgctacccgt gctcaggagg tgaacatcaa caccggtggt1080gaccagtacg ctcctaagct ggctcaggtg aagttcttct ccgagtccca ggacttcgag1140gtgcaccagc ctaccgtgtt cacccctgtg ggtgtggctg gtgacccttc ccaccctttc1200cgtcagtgga ccctgcctcg ttacggtggt cacctgacca acaacatcca cctggctcct1260gccgtcgccc ccctgtttcc cggtgagcag atcctgttct ttcgctccca gatcccttcc1320tccggtggtc acgagctggg ttacatggac tgcctggtgc ctcaggagtg ggtgcagcac1380ttctaccagg aggctgctac cgctcagtcc gaggtggctc tgatccgttt catcaaccct1440gacaccggtc gtgtgctgtt cgaggctaag ctgcacaagc agggtttcat caccgtggct1500
cacaccggtg acaaccctat cgtgatgcct cctaacggtt acttccgttt cgaggcttgg 1560gtgaaccagt tctactccct ggctcctgtg ggtaccggta acggtcgtcg tcgtgtgcag 1620taa1623<210>5<211>1608<212>DNA<213>GGII1型Noro病毒<220>
<221>CDS<222>(1)..(1608)<400>5atg aag atg gcg tcg aat gac gcc gcc cca tct aat gat ggt gca gcc48Met Lys Met Ala Ser Asn Asp Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15ggt ctc gta cca gag gtc aac aac gag acg atg gcc ctc gaa ccg gtg96Gly Leu Val Pro Glu Val Asn Asn Glu Thr Met Ala Leu Glu Pro Val20 25 30gct ggg gct tct ata gcc gcc cct cta acc ggt caa aat aat gtg ata144Ala Gly Ala Ser Ile Ala Ala Pro Leu Thr Gly Gln Asn Asn Val Ile35 40 45gac ccc tgg att aga atg aac ttt gtc caa gcc cca aat gga gaa ttc192Asp Pro Trp Ile Arg Met Asn Phe Val Gln Ala Pro Asn Gly Glu Phe50 55 60aca gtg tct ccc cgc aat tct cct ggt gaa atc ttg cta aat ttg gaa240Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Ile Leu Leu Asn Leu Glu65 70 75 80tta ggc cct gaa tta aat cca ttc tta gca cac ctt tca aga atg tat288Leu Gly Pro Glu Leu Asn Pro Phe Leu Ala His Leu Ser Arg Met Tyr85 90 95aat ggt tat gcc ggc ggg gtt gaa gtg cag gta cta ctc gct ggg aac336
Asn Gly Tyr Ala Gly Gly Val Glu Val Gln Val Leu Leu Ala Gly Asn100 105 110gcg ttc aca gcg gga aaa ctg gtg ttt gca gca atc ccc ccg cac ttc384Ala Phe Thr Ala Gly Lys Leu Val Phe Ala Ala Ile Pro Pro His Phe115 120 125cct ctt gag aat ctg agt cct gga caa att aca atg ttc cct cat gtg432Pro Leu Glu Asn Leu Ser Pro Gly Gln Ile Thr Met Phe Pro His Val130 135 140att att gat gtt aga aca tta gaa cct gtg ctt ttg ccc ctt cca gat480Ile Ile Asp Val Arg Thr Leu Glu Pro Val Leu Leu Pro Leu Pro Asp145 150 155 160gtt aga aat aat ttc ttt cat tac aat cag cag ccc gag ccc cgt atg528Val Arg Asn Asn Phe Phe His Tyr Asn Gln Gln Pro Glu Pro Arg Met165 170 175aga ctt gta gct atg ttg tat act cct ctt aga tct aat ggt tct ggt576Arg Leu Val Ala Met Leu Tyr Thr Pro Leu Arg Ser Asn Gly Ser Gly180 185 190gat gat gtg ttc aca gtt tct tgc agg gtt ctc acc cgc cct tct cca624Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205gat ttt gat ttt aat tat ttg gtt ccc cca act gtg gag tct aaa act672Asp Phe Asp Phe Asn Tyr Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220aaa cca ttc acc ctg cca atc cta act att gga gaa ttg tca aat tct720Lys Pro Phe Thr Leu Pro Ile Leu Thr Ile Gly Glu Leu Ser Asn Ser225 230 235 240aga ttc cca gtt cca ata gat gaa ttg tac acc agc ccc aat gaa gga768Arg Phe Pro Val Pro Ile Asp Glu Leu Tyr Thr Ser Pro Asn Glu Gly245 250 255gtg atc gtg cag ccc caa aat ggc aga tca aca ctt gat ggt gaa ttg816Val Ile Val Gln Pro Gln Asn Gly Arg Ser Thr Leu Asp Gly Glu Leu260 265 270ttg ggc acc acg caa ctc gtg ccc tca aac atc tgt gcg cta cga ggg864
Leu Gly Thr Thr Gln Leu Val Pro Ser Asn Ile Cys Ala Leu Arg Gly275 280 285cgc att aac gcc cag gtg cca gat gat cac cat caa tgg aac cta cag912Arg Ile Asn Ala Gln Val Pro Asp Asp His His Gln Trp Asn Leu Gln290 295 300gta aca aac aca aat ggg act cct ttc gac ccc acc gaa gac gtc cct960Val Thr Asn Thr Asn Gly Thr Pro Phe Asp Pro Thr Glu Asp Val Pro305 310 315 320gca cca ctg ggc aca ccg gat ttc ctg gcg aat atc tat gga gtc acc1008Ala Pro Leu Gly Thr Pro Asp Phe Leu Ala Asn Ile Tyr Gly Val Thr325 330 335agc cag aga aac ccc aac aac act tgc cgt gcc cat gat ggg gtt ttg1056Ser Gln Arg Asn Pro Asn Asn Thr Cys Arg Ala His Asp Gly Val Leu340 345 350gca act tgg agc ccc aaa ttt aca ccc aag tta gga tct gtg att ttg1104Ala Thr Trp Ser Pro Lys Phe Thr Pro Lys Leu Gly Ser Val Ile Leu355 360 365ggc act tgg gaa gaa agt gat ctt gat ctc aat cag ccc aca agg ttc1152Gly Thr Trp Glu Glu Ser Asp Leu Asp Leu Asn Gln Pro Thr Arg Phe370 375 380aca cct gtt ggt ctg ttt aac act gac cac ttt gat cag tgg gcc ttg1200Thr Pro Val Gly Leu Phe Asn Thr Asp His Phe Asp Gln Trp Ala Leu385 390 395 400cct agt tat tct gga aga tta acc cta aac atg aat ttg gca ccc tct1248Pro Ser Tyr Ser Gly Arg Leu Thr Leu Asn Met Asn Leu Ala Pro Ser405 410 415gtt tcc ccc ctc ttt cca ggt gaa cag cta ctt ttc ttc agg tcc cat1296Val Ser Pro Leu Phe Pro Gly Glu Gln Leu Leu Phe Phe Arg Ser His420 425 430ata cca ctc aaa gga ggt acc tct gat ggt gcc att gat tgt cta ctc1344Ile Pro Leu Lys Gly Gly Thr Ser Asp Gly Ala Ile Asp Cys Leu Leu435 440 445ccc cag gaa tgg att cag cat ttt tat cag gag tca gcc cca tcg ccc1392
Pro Gln Glu Trp Ile Gln His Phe Tyr Gln Glu Ser Ala Pro Ser Pro450 455 460acg gac gtg gct cta att aga tac acc aat cct gac aca ggc cgc gtt1440Thr Asp Val Ala Leu Ile Arg Tyr Thr Asn Pro Asp Thr Gly Arg Val465 470 475 480ttg ttt gaa gct aaa ctg cac agg caa gga ttc atc aca gtg gca 8ac1488Leu Phe Glu Ala Lys Leu His Arg Gln Gly Phe Ile Thr Val Ala Asn485 490 495tct ggt tct agg cct att gtt gtc cct ecg aat ggc tat ttt agg ttt1536Ser Gly Ser Arg Pro Ile Val Val Pro Pro Asn Gly Tyr Phe Arg Phe500 505 510gat tct tgg gtt aat caa ttc tat tct ctc gcc ccc atg gga act ggg1584Asp Ser Trp Val Asn Gln Phe Tyr Ser Leu Ala Pro Met Gly Thr Gly515 520 525aac ggg cgc aga aga gtg cag taa1608Asn Gly Arg Arg Arg Val Gln530 535<210>6<211>535<212>PRT<213>GGII1型Noro病毒<400>6Met Lys Met Ala Ser Asn Asp Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15Gly Leu Val Pro Glu Val Asn Asn Glu Thr Met Ala Leu Glu Pro Val20 25 30Ala Gly Ala Ser Ile Ala Ala Pro Leu Thr Gly Gln Asn Asn Val Ile35 40 45Asp Pro Trp Ile Arg Met Asn Phe Val Gln Ala Pro Asn Gly Glu Phe
50 55 60Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Ile Leu Leu Asn Leu Glu65 70 75 80Leu Gly Pro Glu Leu Asn Pro Phe Leu Ala His Leu Ser Arg Met Tyr85 90 95Asn Gly Tyr Ala Gly Gly Val Glu Val Gln Val Leu Leu Ala Gly Asn100 105 110Ala Phe Thr Ala Gly Lys Leu Val Phe Ala Ala Ile Pro Pro His Phe115 120 125Pro Leu Glu Asn Leu Ser Pro Gly Gln Ile Thr Met Phe Pro His Val130 135 140Ile Ile Asp Val Arg Thr Leu Glu Pro Val Leu Leu Pro Leu Pro Asp145 150 155 160Val Arg Asn Asn Phe Phe His Tyr Asn Gln Gln Pro Glu Pro Arg Met165 170 175Arg Leu Val Ala Met Leu Tyr Thr Pro Leu Arg Ser Asn Gly Ser Gly180 185 190Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205Asp Phe Asp Phe Asn Tyr Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220Lys Pro Phe Thr Leu Pro Ile Leu Thr Ile Gly Glu Leu Ser Asn Ser
225 230 235 240Arg Phe Pro Val Pro Ile Asp Glu Leu Tyr Thr Ser Pro Asn Glu Gly245 250 255Val Ile Val Gln Pro Gln Asn Gly Arg Ser Thr Leu Asp Gly Glu Leu260 265 270Leu Gly Thr Thr Gln Leu Val Pro Ser Asn Ile Cys Ala Leu Arg Gly275 280 285Arg Ile Asn Ala Gln Val Pro Asp Asp His His Gln Trp Asn Leu Gln290 295 300Val Thr Asn Thr Asn Gly Thr Pro Phe Asp Pro Thr Glu Asp Val Pro305 310 315 320Ala Pro Leu Gly Thr Pro Asp Phe Leu Ala Asn Ile Tyr Gly Val Thr325 330 335Ser Gln Arg Asn Pro Asn Asn Thr Cys Arg Ala His Asp Gly Val Leu340 345 350Ala Thr Trp Ser Pro Lys Phe Thr Pro Lys Leu Gly Ser Val Ile Leu355 360 365Gly Thr Trp Glu Glu Ser Asp Leu Asp Leu Asn Gln Pro Thr Arg Phe370 375 380Thr Pro Val Gly Leu Phe Asn Thr Asp His Phe Asp Gln Trp Ala Leu385 390 395 400Pro Ser Tyr Ser Gly Arg Leu Thr Leu Asn Met Asn Leu Ala Pro Ser
405 410 415Val Ser Pro Leu Phe Pro Gly Glu Gln Leu Leu Phe Phe Arg Ser His420 425 430Ile Pro Leu Lys Gly Gly Thr Ser Asp Gly Ala Ile Asp Cys Leu Leu435 440 445Pro Gln Glu Trp Ile Gln His Phe Tyr Gln Glu Ser Ala Pro Ser Pro450 455 460Thr Asp Val Ala Leu Ile Arg Tyr Thr Asn Pro Asp Thr Gly Arg Val465 470 475 480Leu Phe Glu Ala Lys Leu His Arg Gln Gly Phe Ile Thr Val Ala Asn485 490 495Ser Gly Ser Arg Pro Ile Val Val Pro Pro Asn Gly Tyr Phe Arg Phe500 505 510Asp Ser Trp Val Asn Gln Phe Tyr Ser Leu Ala Pro Met Gly Thr Gly515 520 525Asn Gly Arg Arg Arg Val Gln530 535<210>7<211>1647<212>DNA<213>GGII3型Noro病毒<220>
<221>CDS<222>(1)..(1647)
<400>7atg aag atg gcg tcg aat cgc gct gct cca tct aat gat ggt gcc gcc48Met Lys Met Ala Ser Asn Arg Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15tgc ctc gtc cca gag atc aac aat gag gca atg gcg cta gag cca gtg96Cys Leu Val Pro Glu Ile Asn Asn Glu Ala Met Ala Leu Glu Pro Val20 25 30gcg ggt gca gcg ata gca gcg ccc ctc act ggc cag caa aat ata att144Ala Gly Ala Ala Ile Ala Ala Pro Leu Thr Gly Gln Gln Asn Ile Ile35 40 45gat ccc tgg att atg aat aat ttt gtg caa gca cct ggt ggt gag ttt192Asp Pro Trp Ile Met Asn Asn Phe Val Gln Ala Pro Gly Gly Glu Phe50 55 60aca gtg tca ccc agg aat tcc cct ggt gaa gtg ctt ctt aat ttg gaa240Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Val Leu Leu Asn Leu Glu65 70 75 80tta ggt cca gaa ata aat cct tat ttg gct cat ctt gct aga atg tac288Leu Gly Pro Glu Ile Asn Pro Tyr Leu Ala His Leu Ala Arg Met Tyr85 90 95aat ggt tat gca ggt gga ttt gaa gtg caa gtg gtc ctg gct gga aat336Asn Gly Tyr Ala Gly Gly Phe Glu Val Gln Val Val Leu Ala Gly Asn100 105 110gcg ttt aca gca gca aaa att atc ttt gca gct ata ccc cct aac ttc384Ala Phe Thr Ala Ala Lys Ile Ile Phe Ala Ala Ile Pro Pro Asn Phe115 120 125cct att gac aat ctg agc gcg gca cag atc aca atg tgc ccg cat gtg432Pro Ile Asp Asn Leu Ser Ala Ala Gln Ile Thr Met Cys Pro His Val130 135 140att gtg gat gtc agg cag ttg gaa cca atc aat ctt ccg atg cct gat480Ile Val Asp Val Arg Gln Leu Glu Pro Ile Asn Leu Pro Met Pro Asp145 150 155 160gtc cgc aac aat ttc ttt cat tat aat caa ggt tct gat tca aga tta528Val Arg Asn Asn Phe Phe His Tyr Asn Gln Gly Ser Asp Ser Arg Leu
165 170 175cgc tta att gca atg ctg tat aca cct ctt agg gca aat aat tct gga576Arg Leu Ile Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ser Gly180 185 190gat gat gtt ttc act gtg tct tgt agg gtg tta act agg cct agc cct624Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205gat ttc tta ttc aat ttt ctt gtc cca ccc act gtg gaa tca aag aca672Asp Phe Leu Phe Asn Phe Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220aaa cct ttt acc ctc ccc att tta acc atc tct gaa atg tct aat tcc720Lys Pro Phe Thr Leu Pro Ile Leu Thr Ile Ser Glu Met Ser Asn Ser225 230 235 240agg ttt ccg gtg cca att gac tct ctg cac acc agc cca act gag aat768Arg Phe Pro Val Pro Ile Asp Ser Leu His Thr Ser Pro Thr Glu Asn245 250 255ata gtt gtc cag tgc caa aat ggg cgc gtc act ctt gac ggt gag ttg816Ile Val Val Gln Cys Gln Asn Gly Arg Val Thr Leu Asp Gly Glu Leu260 265 270atg ggc acc acc caa ctc tta ccg agc caa ata tgt gct ttc agg ggc864Met Gly Thr Thr Gln Leu Leu Pro Ser Gln Ile Cys Ala Phe Arg Gly275 280 285aca ctc act gga tca aca agc agg gcc agt gac caa gcc gac aca cca912Thr Leu Thr Gly Ser Thr Ser Arg Ala Ser Asp Gln Ala Asp Thr Pro290 295 300acc cct agg cta ttc aac cat cat tgg cac ata caa ttg gat aat cta960Thr Pro Arg Leu Phe Asn His His Trp His Ile Gln Leu Asp Asn Leu305 310 315 320aat gga act ccc tac gac cct gca gag gac ata cca gct cct ttg ggc1008Asn Gly Thr Pro Tyr Asp Pro Ala Glu Asp Ile Pro Ala Pro Leu Gly325 330 335aca cca gac ttc cgg ggc aag gtc ttt ggc gta gcc ggc cag aga aac1056Thr Pro Asp Phe Arg Gly Lys Val Phe Gly Val Ala Gly Gln Arg Asn
340 345 350ccc gac agc aca aca agg gca cat gaa gca aaa gtg gac aca aca tct1104Pro Asp Ser Thr Thr Arg Ala His Glu Ala Lys Val Asp Thr Thr Ser355 360 365ggc cgc ttc acc cca aaa ttg ggc tcc tta gaa ata acc act gaa tct1152Gly Arg Phe Thr Pro Lys Leu Gly Ser Leu Glu Ile Thr Thr Glu Ser370 375 380gat gac ctt gac cta agc cag cca aca aaa ttc acc cca gtt ggc att1200Asp Asp Leu Asp Leu Ser Gln Pro Thr Lys Phe Thr Pro Val Gly Ile385 390 395 400gga gtt gac aat agg gca gaa ttt cag caa tgg tcc tta cct gac tat1248Gly Val Asp Asn Arg Ala Glu Phe Gln Gln Trp Ser Leu Pro Asp Tyr405 410 415tcc ggt cag ttt act cac aac atg aac ttg gcc cca gct gtc gcc ccc1296Ser Gly Gln Phe Thr His Asn Met Asn Leu Ala Pro Ala Val Ala Pro420 425 430aat ttt cct ggt gaa cag cta ctt ttc ttc cga tca cag ctg cca tcc1344Asn Phe Pro Gly Glu Gln Leu Leu Phe Phe Arg Ser Gln Leu Pro Ser435 440 445tct ggt ggg cgg tct aac ggg gtt cta gac tgc ctg gtc ccc cag gaa1392Ser Gly Gly Arg Ser Asn Gly Val Leu Asp Cys Leu Val Pro Gln Glu450 455 460tgg gtt caa cac ttt tac caa gaa tca gcc ccc gcc caa aca cag gtg1440Trp Val Gln His Phe Tyr Gln Glu Ser Ala Pro Ala Gln Thr Gln Val465 470 475 480gcc ctg gtt agg tat gtc aac cct gac act ggt aga gtg cta ttt gag1488Ala Leu Val Arg Tyr Val Asn Pro Asp Thr Gly Arg Val Leu Phe Glu485 490 495gcc aag cta cac aaa ttg ggt ttt atg act gta gca aag aat ggt gac1536Ala Lys Leu His Lys Leu Gly Phe Met Thr Val Ala Lys Asn Gly Asp500 505 510tcc cca ata act gtc cct cca aat ggt tat ttt aga ttt gaa tct tgg1584Ser Pro Ile Thr Val Pro Pro Asn Gly Tyr Phe Arg Phe Glu Ser Trp
515 520 525gtt aac ccc ttt tac aca ctt gcc ccc atg gga act gga aac ggg cgt1632Val Asn Pro Phe Tyr Thr Leu Ala Pro Met Gly Thr Gly Asn Gly Arg530 535 540aga agg att caa taa1647Arg Arg Ile Gln545<210>8<211>548<212>PRT<213>GGII3型Noro病毒<400>8Met Lys Met Ala Ser Asn Arg Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15Cys Leu Val Pro Glu Ile Asn Asn Glu Ala Met Ala Leu Glu Pro Val20 25 30Ala Gly Ala Ala Ile Ala Ala Pro Leu Thr Gly Gln Gln Asn Ile Ile35 40 45Asp Pro Trp Ile Met Asn Asn Phe Val Gln Ala Pro Gly Gly Glu Phe50 55 60Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Val Leu Leu Asn Leu Glu65 70 75 80Leu Gly Pro Glu Ile Asn Pro Tyr Leu Ala His Leu Ala Arg Met Tyr85 90 95Asn Gly Tyr Ala Gly Gly Phe Glu Val Gln Val Val Leu Ala Gly Asn100 105 110
Ala Phe Thr Ala Ala Lys Ile Ile Phe Ala Ala Ile Pro Pro Asn Phe115 120 125Pro Ile Asp Asn Leu Ser Ala Ala Gln Ile Thr Met Cys Pro His Val130 135 140Ile Val Asp Val Arg Gln Leu Glu Pro Ile Asn Leu Pro Met Pro Asp145 150 155 160Val Arg Asn Asn Phe Phe His Tyr Asn Gln Gly Ser Asp Ser Arg Leu165 170 175Arg Leu Ile Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ser Gly180 185 190Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205Asp Phe Leu Phe Asn Phe Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220Lys Pro Phe Thr Leu Pro Ile Leu Thr Ile Ser Glu Met Ser Asn Ser225 230 235 240Arg Phe Pro Val Pro Ile Asp Ser Leu His Thr Ser Pro Thr Glu Asn245 250 255Ile Val Val Gln Cys Gln Asn Gly Arg Val Thr Leu Asp Gly Glu Leu260 265 270Met Gly Thr Thr Gln Leu Leu Pro Ser Gln Ile Cys Ala Phe Arg Gly275 280 285
Thr Leu Thr Gly Ser Thr Ser Arg Ala Ser Asp Gln Ala Asp Thr Pro290 295 300Thr Pro Arg Leu Phe Asn His His Trp His Ile Gln Leu Asp Asn Leu305 310 315 320Asn Gly Thr Pro Tyr Asp Pro Ala Glu Asp Ile Pro Ala Pro Leu Gly325 330 335Thr Pro Asp Phe Arg Gly Lys Val Phe Gly Val Ala Gly Gln Arg Asn340 345 350Pro Asp Ser Thr Thr Arg Ala His Glu Ala Lys Val Asp Thr Thr Ser355 360 365Gly Arg Phe Thr Pro Lys Leu Gly Ser Leu Glu Ile Thr Thr Glu Ser370 375 380Asp Asp Leu Asp Leu Ser Gln Pro Thr Lys Phe Thr Pro Val Gly Ile385 390 395 400Gly Val Asp Asn Arg Ala Glu Phe Gln Gln Trp Ser Leu Pro Asp Tyr405 410 415Ser Gly Gln Phe Thr His Asn Met Asn Leu Ala Pro Ala Val Ala Pro420 425 430Asn Phe Pro Gly Glu Gln Leu Leu Phe Phe Arg Ser Gln Leu Pro Ser435 440 445Ser Gly Gly Arg Ser Asn Gly Val Leu Asp Cys Leu Val Pro Gln Glu450 455 460
Trp Val Gln His Phe Tyr Gln Glu Ser Ala Pro Ala Gln Thr Gln Val465 470 475 480Ala Leu Val Arg Tyr Val Asn Pro Asp Thr Gly Arg Val Leu Phe Glu485 490 495Ala Lys Leu His Lys Leu Gly Phe Met Thr Val Ala Lys Asn Gly Asp500 505 510Ser Pro Ile Thr Val Pro Pro Asn Gly Tyr Phe Arg Phe Glu Ser Trp515 520 525Val Asn Pro Phe Tyr Thr Leu Ala Pro Met Gly Thr Gly Asn Gly Arg530 535 540Arg Arg Ile Gln545<210>9<211>1620<212>DNA<213>GGII4型Noro病毒<220>
<221>CDS<222>(1)..(1620)<400>9atg aag atg gcg tcg aat gac gcc agc cca tct gat ggg tcc gca ccc48Met Lys Met Ala Ser Ash Asp Ala Asn Pro Ser Asp Gly Ser Ala Pro1 5 10 15aac ctc gtc cca gag gtc aat aat gag gtt atg gct ctg gag ccc gtt96Asn Leu Val Pro Glu Val Asn Asn Glu Val Met Ala Leu Glu Pro Val20 25 30
gtt ggt gcc gct att gcg gca cct gtg gcg ggc caa caa aac gta att144Val Gly Ala Ala Ile Ala Ala Pro Val Ala Gly Gln Gln Asn Val Ile35 40 45gac ccc tgg att aga aac aat ttt gta caa gcc cct ggt gga gag ttc192Asp Pro Trp Ile Arg Asn Asn Phe Val Gln Ala Pro Gly Gly Glu Phe50 55 60aca gtg tcc cct aga aac gct cca ggt gag ata ctg tgg agc gcg ccc240Thr Val Ser Pro Arg Asn Ala Pro Gly Glu Ile Leu Trp Ser Ala Pro65 70 75 80ttg ggc cct gat ctg aac ccc tat ctt tct cat ttg tcc aga atg tac288Leu Gly Pro Asp Leu Asn Pro Tyr Leu Ser His Leu Ser Arg Met Tyr85 90 95aat ggt tat gca ggt ggt ttt gaa gtg caa gta atc ctc gcg ggg aat336Asn Gly Tyr Ala Gly Gly Phe Glu Val Gln Val Ile Leu Ala Gly Asn100 105 110gcg ttc acc gcc ggg aaa gtc ata ttt gca gca gtc cca cca aac ttt384Ala Phe Thr Ala Gly Lys Val Ile Phe Ala Ala Val Pro Pro Asn Phe115 120 125cct act gaa ggc tta agc ccc agc cag gtt act atg ttc ccc cat ata432Pro Thr Glu Gly Leu Ser Pro Ser Gln Val Thr Met Phe Pro His Ile130 135 140att gta gat gtt aga caa ttg gaa cct gtg ttg atc ccc cta cct gat480Ile Val Asp Val Arg Gln Leu Glu Pro Val Leu Ile Pro Leu Pro Asp145 150 155 160gtt agg aat aat ttc tat cat tac aat caa gca aat gat tct acc ctc528Val Arg Asn Asn Phe Tyr His Tyr Asn Gln Ala Asn Asp Ser Thr Leu165 170 175aag ttg ata gca atg ttg tac aca cca ctc aga gct aat aat gcc ggg576Lys Leu Ile Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ala Gly180 185 190gat gat gtc ttc aca gtc tct tgt cga gtc ctc acg agg cca tcc ccc624Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pr0195 200 205
gat ttt gat ttt ata ttt ctg gtg cca ccc aca gtt gaa tca aga act672Asp Phe Asp Phe Ile Phe Leu Val Pro Pro Thr Val Glu Ser Arg Thr210 215 220aaa cca ttc act gtc cca gtc ttg act gtt gag gaa atg tct aat tca720Lys Pro Phe Thr Val Pro Val Leu Thr Val Glu Glu Met Ser Asn Ser225 230 235 240aga ttc ccc att cct ttg gaa aag ctt tac acg ggc cct agt agt gct768Arg Phe Pro Ile Pro Leu Glu Lys Leu Tyr Thr Gly Pro Ser Ser Ala245 250 255ttt gtt gtc caa cca caa aat ggc aga tgt acg act gat ggc gta ctt816Phe Val Val Gln Pro Gln Asn Gly Arg Cys Thr Thr Asp Gly Val Leu260 265 270cta ggc act acc cag ctg tca gct gtt aat atc tgt aac ttt agg ggg864Leu Gly Thr Thr Gln Leu Ser Ala Val Asn Ile Cys Asn Phe Arg Gly275 280 285gat gtt acc cat att gcg ggt agc cat gat tac aca atg aat ttg gca912Asp Val Thr His Ile Ala Gly Ser His Asp Tyr Thr Met Asn Leu Ala290 295 300tcc caa aat tgg agc aat tat gac cca aca gaa gag atc cca gcc ccc960Ser Gln Asn Trp Ser Asn Tyr Asp Pro Thr Glu Glu Ile Pro Ala Pro305 310 315 320cta gga acg cca gac ttt gtg gga aag atc caa ggc ttg ctc acc cag1008Leu Gly Thr Pro Asp Phe Val Gly Lys Ile Gln Gly Leu Leu Thr Gln325 330 335acc aca aga gcg gac ggc tcg acc cgt gcc cac aaa gct aca gtg agc1056Thr Thr Arg Ala Asp Gly Ser Thr Arg Ala His Lys Ala Thr Val Ser340 345 350act ggg agt gtc cac ttc act cca aag ctg ggt agt gtt caa ttc acc1104Thr Gly Ser Val His Phe Thr Pro Lys Leu Gly Ser Val Gln Phe Thr355 360 365act gac acg aac aat gat ttc caa gct ggc caa aac aca aaa ttc acc1152Thr Asp Thr Asn Asn Asp Phe Gln Ala Gly Gln Asn Thr Lys Phe Thr370 375 380
cca gtt ggc gtc atc caa gac ggt gat cac cac cag aat gaa ccc caa1200Pro Val Gly Val Ile Gln Asp Gly Asp His His Gln Asn Glu Pro Gln385 390 395 400caa tgg tca ctc cca aat tac tca ggt aga act ggt cac aat gtg cac1248Gln Trp Ser Leu Pro Asn Tyr Ser Gly Arg Thr Gly His Asn Val His405 410 415ctg gcc cct gct gtc gcc ccc act ttc ccc ggt gag cag ctt ctt ttc1296Leu Ala Pro Ala Val Ala Pro Thr Phe Pro Gly Glu Gln Leu Leu Phe420 425 430ttt aga tcc acc atg cca ggg tgt agc ggg tac ccc aac atg aat ttg1344Phe Arg Ser Thr Met Pro Gly Cys Ser Gly Tyr Pro Asn Met Asn Leu435 440 445gat tgc tta ctc ccc cag gaa tgg gtg ttg cac ttt tac cag gaa gca1392Asp Cys Leu Leu Pro Gln Glu Trp Val Leu His Phe Tyr Gln Glu Ala450 455 460gcc cca gca caa tcc gat gtg gca ctg ctg aga ttt gtg aat cca gat1440Ala Pro Ala Gln Ser Asp Val Ala Leu Leu Arg Phe Val Asn Pro Asp465 470 475 480aca ggt agg gtt ctg ttt gag tgc aag ctt cat aaa tca ggc tat atc1488Thr Gly Arg Val Leu Phe Glu Cys Lys Leu His Lys Ser Gly Tyr Ile485 490 495aca gtg gcc cac acc ggc ccg tat gat ttg gtt ctc ccc cct aat ggt1536Thr Val Ala His Thr Gly Pro Tyr Asp Leu Val Leu Pro Pro Asn Gly500 505 510tat ttc aga ttt gat tct tgg gtc aac cag ttc tac aca ctc gcc ccc1584Tyr Phe Arg Phe Asp Ser Trp Val Asn Gln Phe Tyr Thr Leu Ala Pro515 520 525atg gga aat gga acg ggg cgc agg cgt gca tta taa1620Met Gly Asn Gly Thr Gly Arg Arg Arg Ala Leu530 535<210>10<211>539
<212>PRT<213>GGII4型Noro病毒<400>10Met Lys Met Ala Ser Asn Asp Ala Asn Pro Ser Asp Gly Ser Ala Pro1 5 10 15Asn Leu Val Pro Glu Val Asn Asn Glu Val Met Ala Leu Glu Pro Val20 25 30Val Gly Ala Ala Ile Ala Ala Pro Val Ala Gly Gln Gln Asn Val Ile35 40 45Asp Pro Trp Ile Arg Asn Asn Phe Val Gln Ala Pro Gly Gly Glu Phe50 55 60Thr Val Ser Pro Arg Asn Ala Pro Gly Glu Ile Leu Trp Ser Ala Pro65 70 75 80Leu Gly Pro Asp Leu Asn Pro Tyr Leu Ser His Leu Ser Arg Met Tyr85 90 95Asn Gly Tyr Ala Gly Gly Phe Glu Val Gln Val Ile Leu Ala Gly Asn100 105 110Ala Phe Thr Ala Gly Lys Val Ile Phe Ala Ala Val Pro Pro Asn Phe115 120 125Pro Thr Glu Gly Leu Ser Pro Ser Gln Val Thr Met Phe Pro His Ile130 135 140Ile Val Asp Val Arg Gln Leu Glu Pro Val Leu Ile Pro Leu Pro Asp145 150 155 160
Val Arg Asn Asn Phe Tyr His Tyr Asn Gln Ala Asn Asp Ser Thr Leu165 170 175Lys Leu Ile Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ala Gly180 185 190Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205Asp Phe Asp Phe Ile Phe Leu Val Pro Pro Thr Val Glu Ser Arg Thr210 215 220Lys Pro Phe Thr Val Pro Val Leu Thr Val Glu Glu Met Ser Asn Ser225 230 235 240Arg Phe Pro Ile Pro Leu Glu Lys Leu Tyr Thr Gly Pro Ser Ser Ala245 250 255Phe Val Val Gln Pro Gln Asn Gly Arg Cys Thr Thr Asp Gly Val Leu260 265 270Leu Gly Thr Thr Gln Leu Ser Ala Val Asn Ile Cys Asn Phe Arg Gly275 280 285Asp Val Thr His Ile Ala Gly Ser His Asp Tyr Thr Met Asn Leu Ala290 295 300Ser Gln Asn Trp Ser Asn Tyr Asp Pro Thr Glu Glu Ile Pro Ala Pro305 310 315 320Leu Gly Thr Pro Asp Phe Val Gly Lys Ile Gln Gly Leu Leu Thr Gln325 330 335
Thr Thr Arg Ala Asp Gly Ser Thr Arg Ala His Lys Ala Thr Val Ser340 345 350Thr Gly Ser Val His Phe Thr Pro Lys Leu Gly Ser Val Gln Phe Thr355 360 365Thr Asp Thr Asn Asn Asp Phe Gln Ala Gly Gln Asn Thr Lys Phe Thr370 375 380Pro Val Gly Val Ile Gln Asp Gly Asp His His Gln Asn Glu Pro Gln385 390 395 400Gln Trp Ser Leu Pro Asn Tyr Ser Gly Arg Thr Gly His Asn Val His405 410 415Leu Ala Pro Ala Val Ala Pro Thr Phe Pro Gly Glu Gln Leu Leu Phe420 425 430Phe Arg Ser Thr Met Pro Gly Cys Ser Gly Tyr Pro Asn Met Asn Leu435 440 445Asp Cys Leu Leu Pro Gln Glu Trp Val Leu His Phe Tyr Gln Glu Ala450 455 460Ala Pro Ala Gln Ser Asp Val Ala Leu Leu Arg Phe Val Asn Pro Asp465 470 475 480Thr Gly Arg Val Leu Phe Glu Cys Lys Leu His Lys Ser Gly Tyr Ile485 490 495Thr Val Ala His Thr Gly Pro Tyr Asp Leu Val Leu Pro Pro Asn Gly500 505 510
Tyr Phe Arg Phe Asp Ser Trp Val Asn Gin Phe Tyr Thr Leu Ala Pro515 520 525Met Gly Asn Gly Thr Gly Arg Arg Arg Ala Leu530 535<210>11<211>1623<212>DNA<213>GGII7型Noro病毒<220>
<221>CDS<222>(1)..(1623)<400>11atg aag atg gcg tcg aat gac gca gct cca tct aat gat ggt gca gca48Met Lys Met Ala Ser Asn Asp Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15ggc ctc gta cca gar atc aac aat gag gtc atg ccc ctt gag ccc gtg96Gly Leu Val Pro Glu Ile Asn Asn Glu Val Met Pro Leu Glu Pro Val20 25 30gct ggt gca tcg ctg gcg aca cca gtt gtt ggg caa caa aac ata att144Ala Gly Ala Ser Leu Ala Thr Pro Val Val Gly Gln Gln Asn Ile Ile35 40 45gat ccc tgg ata aga aat aat ttt gtg caa gcc cct gca ggt gag ttt192Asp Pro Trp Ile Arg Asn Asn Phe Val Gln Ala Pro Ala Gly Glu Phe50 55 60aca gtc tcc cct agg aat tcc ccc ggt gaa atc ctg ctt gat tta gag240Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Ile Leu Leu Asp Leu Glu65 70 75 80ttg gga cca gaa ttg aac ccc tac ctt gct cat ttg gct cgt atg tat288Leu Gly Pro Glu Leu Asn Pro Tyr Leu Ala His Leu Ala Arg Met Tyr85 90 95
aat gga cac gct ggt ggc atg gaa gtg caa att gtg ttg gct ggg aat336Asn Gly His Ala Gly Gly Met Glu Val Gln Ile Val Leu Ala Gly Asn100 105 110gcg ttc aca gct ggc aag atc gta ttt gct gcc atc cct cca ggg ttc384Ala Phe Thr Ala Gly Lys Ile Val Phe Ala Ala Ile Pro Pro Gly Phe115 120 125cca tat gaa aac ttg tca cct tca cag att aca atg tgc cca cat gtt432Pro Tyr Glu Asn Leu Ser Pro Ser Gln Ile Thr Met Cys Pro His Val130 135 140ata att gat gtw aga caa tta gaa cca gtc cta ttg ctt atg cca gac480Ile Ile Asp Xaa Arg Gln Leu Glu Pro Val Leu Leu Leu Met Pro Asp145 150 155 160att aaa aac aac ttc ttc cat tat aat cag ggc aat gac cca aaa ttg528Ile Lys Asn Asn Phe Phe His Tyr Asn Gln Gly Asn Asp Pro Lys Leu165 170 175aga ttg gta gct atg ctc tac act cct tta agg gct aac aat tct ggt576Arg Leu Val Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ser Gly180 185 190gat gac gtg ttc aca gtc tct tgt agg gtc ctt act aaa cca tca cct624Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Lys Pro Ser Pro195 200 205gat ttt gaa ttc aca ttc cta gtt ccc ccc aca gtt gaa tcc aaa acc672Asp Phe Glu Phe Thr Phe Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220aaa caa ttt aca ttg ccc att ctc aaa ata tca gag atg acc aat tca720Lys Gln Phe Thr Leu Pro Ile Leu Lys Ile Ser Glu Met Thr Asn Ser225 230 235 240aga ttc cca gtg cca gtg gaa atg atg tat aca gcc agg aat gag aat768Arg Phe Pro Val Pro Val Glu Met Met Tyr Thr Ala Arg Asn Glu Asn245 250 255caa gtt gtc caa cca cag aat ggt agg gtc acg ctt gat ggt gag cta816Gln Val Val Gln Pro Gln Asn Gly Arg Val Thr Leu Asp Gly Glu Leu260 265 270
ttg ggc acc aca ccc ttg ttg gct gtc aac ata tgc aaa ttc aag gga864Leu Gly Thr Thr Pro Leu Leu Ala Val Asn Ile Cys Lys Phe Lys Gly275 280 285gag gtt ata gcc aag aat gga gat gtg agg tcc tac aga atg gac atg912Glu Val Ile Ala Lys Asn Gly Asp Val Arg Ser Tyr Arg Met Asp Met290 295 300gaa atc acc aac act gat ggc acc cca att gac ccc aca gaa gac aca960Glu Ile Thr Asn Thr Asp Gly Thr Pro Ile Asp Pro Thr Glu Asp Thr305 310 315 320cct ggt ccc att ggt tca cca gat ttc caa ggc ata ctc ttt ggc gtt1008Pro Gly Pro Ile Gly Ser Pro Asp Phe Gln Gly Ile Leu Phe Gly Val325 330 335gcc agc caa cgc aat aag aat gag cag aac ccc gcc aca aga gcc cag1056Ala Ser Gln Arg Asn Lys Asn Glu Gln Asn Pro Ala Thr Arg Ala Gln340 345 350gaa gtt aat att aac act ggt ggg gat caa tat gcc cct aaa ttg gcc1104Glu Val Asn Ile Asn Thr Gly Gly Asp Gln Tyr Ala Pro Lys Leu Ala355 360 365caa gtg aaa ttc ttc tca gag tcc cag gat ttt gag gtg cac cag ccc1152Gln Val Lys Phe Phe Ser Glu Ser Gln Asp Phe Glu Val His Gln Pro370 375 380aca gtt ttc acc cca gtt ggt gtg gca ggc gac cct tcc cac cct ttc1200Thr Val Phe Thr Pro Val Gly Val Ala Gly Asp Pro Ser His Pro Phe385 390 395 400aga cag tgg acc ctg cct cga tac ggt gga cat ctc acc aat aat atc1248Arg Gln Trp Thr Leu Pro Arg Tyr Gly Gly His Leu Thr Asn Asn Ile405 410 415cat ttg gct cca gca gtg gcc cct cta ttc cca ggt gag cag atc cta1296His Leu Ala Pro Ala Val Ala Pro Leu Phe Pro Gly Glu Gln Ile Leu420 425 430ttc ttt aga tca caa ata cct agc tca ggc ggc cat gaa ttg ggc tat1344Phe Phe Arg Ser Gln Ile Pro Ser Ser Gly Gly His Glu Leu Gly Tyr435 440 445
atg gac tgt ctt gtc cca caa gag tgg gtc caa cac ttc tat cag gaa1392Met Asp Cys Leu Val Pro Gln Glu Trp Val Gln His Phe Tyr Gln Glu450 455 460gct gcc aca gct cag tct gag gtg gca ctc ata agg ttc atc aac cca1440Ala Ala Thr Ala Gln Ser Glu Val Ala Leu Ile Arg Phe Ile Asn Pro465 470 475 480gac act ggt aga gtc ctc ttt gag gct aag ctt cac aag caa ggc ttt1488Asp Thr Gly Arg Val Leu Phe Glu Ala Lys Leu His Lys Gln Gly Phe485 490 495ata act gtg gct cac acc ggt gac aac cca att gtc atg cca cca aac1536Ile Thr Val Ala His Thr Gly Asp Asn Pro Ile Val Met Pro Pro Asn500 505 510ggg tac ttt aga ttt gaa gcc tgg gtt aat cag ttt tac tca ctc gcc1584Gly Tyr Phe Arg Phe Glu Ala Trp Val Asn Gln Phe Tyr Ser Leu Ala515 520 525cct gtg gga act ggg aat ggg cgc agg agg gtc caa taa1623Pro Val Gly Thr Gly Asn Gly Arg Arg Arg Val Gln530 535 540<210>12<211>540<212>PRT<213>GGII7型Noro病毒<220>
<221>misc_feature<222>(148)..(148)<223>The’Xaa’at locat ion 148 stands for Val.
<400>12Met Lys Met Ala Ser Asn Asp Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15Gly Leu Val Pro Glu Ile Asn Asn Glu Val Met Pro Leu Glu Pro Val20 25 30
Ala Gly Ala Ser Leu Ala Thr Pro Val Val Gly Gln Gln Asn Ile Ile35 40 45Asp Pro Trp Ile Arg Asn Asn Phe Val Gln Ala Pro Ala Gly Glu Phe50 55 60Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Ile Leu Leu Asp Leu Glu65 70 75 80Leu Gly Pro Glu Leu Asn Pro Tyr Leu Ala His Leu Ala Arg Met Tyr85 90 95Asn Gly His Ala Gly Gly Met Glu Val Gln Ile Val Leu Ala Gly Asn100 105 110Ala Phe Thr Ala Gly Lys Ile Val Phe Ala Ala Ile Pro Pro Gly Phe115 120 125Pro Tyr Glu Asn Leu Ser Pro Ser Gln Ile Thr Met Cys Pro His Val130 135 140Ile Ile Asp Xaa Arg Gln Leu Glu Pro Val Leu Leu Leu Met Pro Asp145 150 155 160Ile Lys Asn Asn Phe Phe His Tyr Asn Gln Gly Asn Asp Pro Lys Leu165 170 175Arg Leu Val Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ser Gly180 185 190Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Lys Pro Ser Pro195 200 205
Asp Phe Glu Phe Thr Phe Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220Lys Gln Phe Thr Leu Pro Ile Leu Lys Ile Ser Glu Met Thr Asn Ser225 230 235 240Arg Phe Pro Val Pro Val Glu Met Met Tyr Thr Ala Arg Asn Glu Asn245 250 255Gln Val Val Gln Pro Gln Asn Gly Arg Val Thr Leu Asp Gly Glu Leu260 265 270Leu Gly Thr Thr Pro Leu Leu Ala Val Asn Ile Cys Lys Phe Lys Gly275 280 285Glu Val Ile Ala Lys Asn Gly Asp Val Arg Ser Tyr Arg Met Asp Met290 295 300Glu Ile Thr Asn Thr Asp Gly Thr Pro Ile Asp Pro Thr Glu Asp Thr305 310 315 320Pro Gly Pro Ile Gly Ser Pro Asp Phe Gln Gly Ile Leu Phe Gly Val325 330 335Ala Ser Gln Arg Asn Lys Asn Glu Gln Asn Pro Ala Thr Arg Ala Gln340 345 350Glu Val Asn Ile Asn Thr Gly Gly Asp Gln Tyr Ala Pro Lys Leu Ala355 360 365Gln Val Lys Phe Phe Ser Glu Ser Gln Asp Phe Glu Val His Gln Pro370 375 380
Thr Val Phe Thr Pro Val Gly Val Ala Gly Asp Pro Ser His Pro Phe385 390 395 400Arg Gln Trp Thr Leu Pro Arg Tyr Gly Gly His Leu Thr Asn Asn Ile405 410 415His Leu Ala Pro Ala Val Ala Pro Leu Phe Pro Gly Glu Gln Ile Leu420 425 430Phe Phe Arg Ser Gln Ile Pro Ser Ser Gly Gly His Glu Leu Gly Tyr435 440 445Met Asp Cys Leu Val Pro Gln Glu Trp Val Gln His Phe Tyr Gln Glu450 455 460Ala Ala Thr Ala Gln Ser Glu Val Ala Leu Ile Arg Phe Ile Asn Pro465 470 475 480Asp Thr Gly Arg Val Leu Phe Glu Ala Lys Leu His Lys Gln Gly Phe485 490 495Ile Thr Val Ala His Thr Gly Asp Asn Pro Ile Val Met Pro Pro Asn500 505 510Gly Tyr Phe Arg Phe Glu Ala Trp Val Asn Gln Phe Tyr Ser Leu Ala515 520 525Pro Val Gly Thr Gly Asn Gly Arg Arg Arg Val Gln530 535 540<210>13<211>1647<212>DNA
<213>GGII3型Noro病毒90C<220>
<221>CDS<222>(1)..(1647)<400>13atg aag atg gcg tct aat gac gct gct cca tct aat gat ggt gcc gcc48Met Lys Met Ala Ser Asn Asp Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15ggc ctc gtc cca gag atc aac aat gag gca atg gcg cta gac cca gtg96Gly Leu Val Pro Glu Ile Asn Asn Glu Ala Met Ala Leu Asp Pro Val20 25 30gcg ggt gca gcg ata gca gca ccc ctc act ggt cag caa aat ata att144Ala Gly Ala Ala Ile Ala Ala Pro Leu Thr Gly Gln Gln Asn Ile Ile35 40 45gat ccc tgg att atg aat aat ttt gta caa gca cct ggt ggt gag ttt192Asp Pro Trp Ile Met Asn Asn Phe Val Gln Ala Pro Gly Gly Glu Phe50 55 60aca gtg tcc cct agg aat tcc cct ggt gaa gtg ctc ctt aat ttg gaa240Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Val Leu Leu Asn Leu Glu65 70 75 80ttg ggc cca gaa ata aac ccc tat ttg gcc cat ctt gct aga atg tat288Leu Gly Pro Glu Ile Asn Pro Tyr Leu Ala His Leu Ala Arg Met Tyr85 90 95aat ggt tat gca ggt gga ttt gaa gtg caa gta gtc ctg gct gga aat336Asn Gly Tyr Ala Gly Gly Phe Glu Val Gln Val Val Leu Ala Gly Asn100 105 110gcg ttt aca gca gga aag ata atc ttt gca gct ata ccc cct aat ttt384Ala Phe Thr Ala Gly Lys Ile Ile Phe Ala Ala Ile Pro Pro Asn Phe115 120 125cca att gat aat ctg agc gca gca cag atc aca atg tgc ccg cat gtg432Pro Ile Asp Asn Leu Ser Ala Ala Gln Ile Thr Met Cys Pro His Val130 135 140
att gtg gat gtc aga cag ttg gaa ccg gtc aac ctt ccg atg cct gac480Ile Val Asp Val Arg Gln Leu Glu Pro Val Asn Leu Pro Met Pro Asp145 150 155 160gtt cgc aac aat ttc ttc cat tat aac caa ggg tct gat tcg aga ttg528Val Arg Asn Asn Phe Phe His Tyr Asn Gln Gly Ser Asp Ser Arg Leu165 170 175cgc tta att gca atg ctg tat aca cct ctt agg gca aat aat tct ggg576Arg Leu Ile Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ser Gly180 185 190gat gat gtt ttt act gtg tca tgc aga gtg ctg act agg cct agc cct624Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205gac ttt tca ttt aat ttc ctt gtg cca cct act gtg gag tca aag aca672Asp Phe Ser Phe Asn Phe Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220aag ccc ttc acc ctt cct att ctg act atc tct gaa atg tcc aat tct720Lys Pro Phe Thr Leu Pro Ile Leu Thr Ile Ser Glu Met Ser Asn Ser225 230 235 240agg ttt cca gtg ccg att gat tct ttg cac acc agc cca act gag aat768Arg Phe Pro Val Pro Ile Asp Ser Leu His Thr Ser Pro Thr Glu Asn245 250 255att gtt gtc cag tgc caa aac ggg cgc gtc act ctt gac ggt gag tta816Ile Val Val Gln Cys Gln Asn Gly Arg Val Thr Leu Asp Gly Glu Leu260 265 270atg gga acc acc caa ctc tta ccg agt cag atc tgt gct ttc agg ggc864Met Gly Thr Thr Gln Leu Leu Pro Ser Gln Ile Cys Ala Phe Arg Gly275 280 285gtg ctc acc cga tca aca agc agg gcc agt gat cag gcc gac aca gca912Val Leu Thr Arg Ser Thr Ser Arg Ala Ser Asp Gln Ala Asp Thr Ala290 295 300acc cct agg ttg ttt aat tat tat tgg cac ata caa ttg gat aat cta960Thr Pro Arg Leu Phe Asn Tyr Tyr Trp His Ile Gln Leu Asp Asn Leu305 310 315 320
aat gga aca cct tac gat cct gca gaa gac ata cca ggc ccc cta ggg1008Asn Gly Thr Pro Tyr Asp Pro Ala Glu Asp Ile Pro Gly Pro Leu Gly325 330 335aca cca gat ttt cgg ggc aaa gtc ttt ggc gtg gcc agc caa aga aac1056Thr Pro Asp Phe Arg Gly Lys Val Phe Gly Val Ala Ser Gln Arg Asn340 345 350ccc gac agc aca act agg gca cac gaa gca aag gtg gat aca aca tct1104Pro Asp Ser Thr Thr Arg Ala His Glu Ala Lys Val Asp Thr Thr Ser355 360 365ggc cgt ttc acc cca aaa tta ggc tca tta gaa ata tcc act gaa tct1152Gly Arg Phe Thr Pro Lys Leu Gly Ser Leu Glu Ile Ser Thr Glu Ser370 375 380ggt gac ttt gac caa aac caa cca aca aga ttc acc cca gtt ggc att1200Gly Asp Phe Asp Gln Asn Gln Pro Thr Arg Phe Thr Pro Val Gly Ile385 390 395 400ggg gtt gac aat gag gca gac ttt caa caa tgg tct cta ccc gac tat1248Gly Val Asp Asn Glu Ala Asp Phe Gln Gln Trp Ser Leu Pro Asp Tyr405 410 415tct ggt cag ttc acc cac aac atg aac ttg gcc cca gct gtt gct ccc1296Ser Gly Gln Phe Thr His Asn Met Asn Leu Ala Pro Ala Val Ala Pro420 425 430aac ttc cct ggt gag cag ctc ctc ttc ttc cgc tca cag tta cca tct1344Asn Phe Pro Gly Glu Gln Leu Leu Phe Phe Arg Ser Gln Leu Pro Ser435 440 445tct ggt gga cgg tcc aac ggg gtt cta gac tgc ctg gtt ccc caa gaa1392Ser Gly Gly Arg Ser Asn Gly Val Leu Asp Cys Leu Val Pro Gln Glu450 455 460tgg gtt cag cac ttc tac caa gaa tcg gcc ccc gcc caa aca cag gtg1440Trp Val Gln His Phe Tyr Gln Glu Ser Ala Pro Ala Gln Thr Gln Val465 470 475 480gcc ttg gtt agg tat gtc aac cct gac act ggt aga gtg tta ttt gag1488Ala Leu Val Arg Tyr Val Asn Pro Asp Thr Gly Arg Val Leu Phe Glu485 490 495
gct aag ctg cac aaa tta ggt ttc atg act ara gct aag agt ggt gat1536Ala Lys Leu His Lys Leu Gly Phe Met Thr Ile Ala Lys Ser Gly Asp500 505 510tcc cca ata act gtc cct cca aat gga tat ttt aga ttt gaa tct tgg1584Ser Pro Ile Thr Val Pro Pro Asn Gly Tyr Phe Arg Phe Glu Ser Trp515 520 525gtg aac ccc ttt tat aca ctt gcc ccc atg gga act ggg aat ggg cgt1632Val Asn Pro Phe Tyr Thr Leu Ala Pro Met Gly Thr Gly Asn Gly Arg530 535 540aga agg att caa taa1647Arg Arg Ile Gln545<210>14<211>548<212>PRT<213>GGII3型Noro病毒90C<400>14Met Lys Met Ala Ser Asn Asp Ala Ala Pro Ser Asn Asp Gly Ala Ala1 5 10 15Gly Leu Val Pro Glu Ile Asn Asn Glu Ala Met Ala Leu Asp Pro Val20 25 30Ala Gly Ala Ala Ile Ala Ala Pro Leu Thr Gly Gln Gln Asn Ile Ile35 40 45Asp Pro Trp Ile Met Asn Asn Phe Val Gln Ala Pro Gly Gly Glu Phe50 55 60Thr Val Ser Pro Arg Asn Ser Pro Gly Glu Val Leu Leu Asn Leu Glu65 70 75 80
Leu Gly Pro Glu Ile Asn Pro Tyr Leu Ala His Leu Ala Arg Met Tyr85 90 95Asn Gly Tyr Ala Gly Gly Phe Glu Val Gln Val Val Leu Ala Gly Asn100 105 110Ala Phe Thr Ala Gly Lys Ile Ile Phe Ala Ala Ile Pro Pro Asn Phe115 120 125Pro Ile Asp Asn Leu Ser Ala Ala Gln Ile Thr Met Cys Pro His Val130 135 140Ile Val Asp Val Arg Gln Leu Glu Pro Val Asn Leu Pro Met Pro Asp145 150 155 160Val Arg Asn Asn Phe Phe His Tyr Asn Gln Gly Ser Asp Ser Arg Leu165 170 175Arg Leu Ile Ala Met Leu Tyr Thr Pro Leu Arg Ala Asn Asn Ser Gly180 185 190Asp Asp Val Phe Thr Val Ser Cys Arg Val Leu Thr Arg Pro Ser Pro195 200 205Asp Phe Ser Phe Asn Phe Leu Val Pro Pro Thr Val Glu Ser Lys Thr210 215 220Lys Pro Phe Thr Leu Pro Ile Leu Thr Ile Ser Glu Met Ser Asn Ser225 230 235 240Arg Phe Pro Val Pro Ile Asp Ser Leu His Thr Ser Pro Thr Glu Asn245 250 255
Ile Val Val Gln Cys Gln Asn Gly Arg Val Thr Leu Asp Gly Glu Leu260 265 270Met Gly Thr Thr Gln Leu Leu Pro Ser Gln Ile Cys Ala Phe Arg Gly275 280 285Val Leu Thr Arg Ser Thr Ser Arg Ala Ser Asp Gln Ala Asp Thr Ala290 295 300Thr Pro Arg Leu Phe Asn Tyr Tyr Trp His Ile Gln Leu Asp Asn Leu305 310 315 320Asn Gly Thr Pro Tyr Asp Pro Ala Glu Asp Ile Pro Gly Pro Leu Gly325 330 335Thr Pro Asp Phe Arg Gly Lys Val Phe Gly Val Ala Ser Gln Arg Asn340 345 350Pro Asp Ser Thr Thr Arg Ala His Glu Ala Lys Val Asp Thr Thr Ser355 360 365Gly Arg Phe Thr Pro Lys Leu Gly Ser Leu Glu Ile Ser Thr Glu Ser370 375 380Gly Asp Phe Asp Gln Asn Gln Pro Thr Arg Phe Thr Pro Val Gly Ile385 390 395 400Gly Val Asp Asn Glu Ala Asp Phe Gln Gln Trp Ser Leu Pro Asp Tyr405 410 415Ser Gly Gln Phe Thr His Asn Met Asn Leu Ala Pro Ala Val Ala Pro420 425 430
Asn Phe Pro Gly Glu Gln Leu Leu Phe Phe Arg Ser Gln Leu Pro Ser435 440 445Ser Gly Gly Arg Ser Asn Gly Val Leu Asp Cys Leu Val Pro Gln Glu450 455 460Trp Val Gln His Phe Tyr Gln Glu Ser Ala Pro Ala Gln Thr Gln Val465 470 475 480Ala Leu Val Arg Tyr Val Asn Pro Asp Thr Gly Arg Val Leu Phe Glu485 490 495Ala Lys Leu His Lys Leu Gly Phe Met Thr Ile Ala Lys Ser Gly Asp500 505 510Ser Pro Ile Thr Val Pro Pro Asn Gly Tyr Phe Arg Phe Glu Ser Trp515 520 525Val Asn Pro Phe Tyr Thr Leu Ala Pro Met Gly Thr Gly Asn Gly Arg530 535 540Arg Arg Ile Gln545<210>15<211>23<212>DNA<213>人工的<220>
<223>引物<400>15gattactcca ggtgggactc cac23
<210>16<211>23<212>DNA<213>人工的<220>
<223>引物<400>16gattactcca ggtgggactc aac23<210>17<211>23<212>DNA<213>人工的<220>
<223>引物<400>17gattactcca ggtgggattc aac23<210>18<211>23<212>DNA<213>人工的<220>
<223>引物<400>18gattactcca ggtgggattc cac 23<210>19<211>22<212>DNA<213>人工的<400>19tgacgatttc atcatcacca tc22
<210>20<211>22<212>DNA<213>人工的<220>
<223>引物<400>20tgacgatttc atcatccccg tc22<210>21<211>27<212>DNA<213>人工的<220>
<223>引物<400>21ggcgaattca tgaagatggc gtcgaat 27<210>22<211>27<212>DNA<213>人工的<220>
<223>引物<400>22actctcgagt tatagtgcac gtctacg 2权利要求
1.一种DNA分子,其中含有密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列。
2.根据权利要求1的DNA分子,其特征在于,所述核苷酸序列选自SEQ ID NO1、2、3或4。
3.一种重组载体,其中含有权利要求1或2所述的DNA分子。
4.权利要求3所述的重组载体,其为病毒、细菌或质粒载体。
5.权利要求4所述的重组载体,其中,所述病毒载体为杆状病毒或腺病毒载体。
6.权利要求5所述的重组载体,其为rvBacGGII1C、rvBacGGII3C、rvBacGGII4C、rvBacGGII7C、rvAdGGII1C、rvAdGGII3C、rvAdGGII4C或rvAdGGII7C。
7.含有权利要求3-6之一所述的重组载体的宿主细胞。
8.权利要求7的宿主细胞,其为真核细胞。
9.权利要求8的宿主细胞,其为Sf9细胞或者293细胞。
10.一种提高杯状病毒衣壳蛋白表达量的方法,该方法包括将密码子优化的编码杯状病毒衣壳蛋白的核苷酸序列导入目标细胞中,使得目标细胞表达杯状病毒衣壳蛋白。
11.权利要求10的方法,其中,所述目标细胞为真核细胞。
12.权利要求11的方法,其中,所述目标细胞为Sf9细胞或者293细胞。
13.权利要求10-12之一的方法,其中,所述密码子优化的核苷酸序列为SEQ ID NO1、2、3或4。
14.权利要求13的方法,其中,所述密码子优化的核苷酸序列通过病毒载体导入到目标细胞中。
15.权利要求14的方法,其中,所述病毒载体为杆状病毒载体,所述目标细胞为Sf9细胞。
16.权利要求15的方法,其中,所述杆状病毒载体为rvBacGGII1C、rvBacGGII3C、rvBacGGII4C或rvBacGGII7C。
17.权利要求14的方法,其中,所述病毒载体为腺病毒载体,所述目标细胞为293细胞。
18.权利要求17的方法,其中,所述腺病毒载体为rvAdGGII1C、rvAdGGII3C、rvAdGGII4C或rvAdGGII7C。
全文摘要
本发明涉及密码子优化的杯状病毒衣壳蛋白的编码核苷酸序列、含有该序列的重组载体及宿主细胞。本发明还涉及通过杯状病毒衣壳蛋白基因密码子的优化,提高杯状病毒衣壳蛋白表达量的方法。
文档编号C12N15/86GK1778927SQ20051011291
公开日2006年5月31日 申请日期2005年10月14日 优先权日2005年10月14日
发明者王健伟, 郭丽, 周红莉, 洪涛 申请人:王健伟
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1