关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物的制作方法

文档序号:451083阅读:419来源:国知局
专利名称:关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物的制作方法
背景技术
幽门螺杆菌是从人类胃活检样本发现并培养的革兰氏阴性S型微需氧细菌。(Warren,J.R.和B.Marshall,(1983)Lancet11273-1275;以及Marshall等,(1984)Microbios Lett.2583-88)。幽门螺杆菌与慢性胃炎和十二指肠溃疡密切相关。(Rathbone等,(1986)Gut27635-641)。此外,积累的证据表明,幽门螺杆菌在非溃疡型消化不良、胃溃疡和胃腺癌中起病因学作用。(Blaser M.J.,(1993)Trends Microbiol.1255-260)。该细菌经口途径传播,并且随着年龄的增加感染风险增加。(Taylor,D.N.和M.J.Blaser,(1991)Epidemiol.Rev.1342-50)。幽门螺杆菌定居于人胃粘膜,形成的感染持续数十年。幽门螺杆菌的感染在世界范围内流行。发达国家成人人群的感染率超过50%,而发展中国家20岁以上成人的感染率达90%。(Hopkins R.J.和J.G.Morris(1994)Am.J.Med.97265-277)。
人们对在胃环境定居和该病原体毒力所需的细菌因子知之甚少。推定的毒力因子的实例包括以下因子脲酶,一种可能在中和胃酸pH中起作用的酶(Eaton等,(1991)Infect.Immunol.592470-2475;Ferrero,R.L.和A.Lee(1991)Microb.Ecol.Hlth.Dis.4121-134;Labigne等,(1991)J.Bacteriol.1731920-1931);负责跨粘膜层游动性的细菌鞭毛蛋白(Hazell等,(1986)J.Inf.Dis.153658-663;Leying等,(1992)Mol.Microbiol.62863-2874;和Haas等,(1993)Mol.Microbiol.8753-760);Vac A,一种诱导上皮细胞形成细胞内空泡的细菌毒素(Schmitt,W.和R.Haas,(1994)Molecular Microbiol.12(2)307-319);和几种胃组织特异性粘附素(Boren等,(1993)Science2621892-1895;Evans等,(1993)J.Bacteriol.175674-683;和Falk等,(1993)Proc.Natl.Acad.Sci.USA902035-203)。
目前可利用许多体外根除幽门螺杆菌感染的治疗剂。(Huesca等,(1993)Zbl.Bakt.280244-252;Hopkins,R.J.和J.G.Morris,参见上文)。然而,由于细菌抗性、改变的药物分布、病人不依从或药物利用度差,许多这些治疗的体内有效性是次优的。(Hopkins R.J.和J.G.Morris,参见上文)。用抗生素结合铋的治疗是用来治疗幽门螺杆菌感染的标准方法的一部分。(Malfertheiner,P.和J.E.Dominguez-Munoz(1993)Clinical Therapeutics15增刊B37-48)。最近,质子泵抑制剂和单一抗生素的组合已经显示减轻十二指肠溃疡(Malfertheiner,P.和J.E.Doninguez-Munoz参见上文)。然而,使用抗生素药剂的方法可能有出现抗这些药剂的细菌菌株的问题(Hopkins,R.J.和J.G.Morris,参见上文)。这些限制表明,需要新的更有效方法体内对抗幽门螺杆菌感染。特别是,非常需要设计可以预防该细菌感染的新疫苗。发明概述本发明涉及新基因,例如编码诸如来自生物幽门螺杆菌(H.pylori)的细菌表面蛋白的多肽的基因和其它相关基因;其基因产物;以及它们的用途。本发明的核酸和肽具有诊断和治疗幽门螺杆菌和其它螺杆菌属种的用途。它们也可以用来检测样品中幽门螺杆菌和其它根瘤菌属种的存在;以及用来在干扰幽门螺杆菌生活周期或抑制幽门螺杆菌感染的能力方面筛选化合物。更具体地说,本发明描述了对应于幽门螺杆菌蛋白所有编码序列的核酸组合物的特征,所述蛋白包括其表面蛋白或分泌蛋白或其部分;描述了能够结合幽门螺杆菌蛋白的mRNA以阻断蛋白翻译的核酸的特征;描述了用肽合成和重组DNA技术生产幽门螺杆菌蛋白或其部分的方法的特征。本发明也描述了可用作检测幽门螺杆菌感染的探针的抗体和核酸的特征。另外,保护抵抗幽门螺杆菌感染或治疗幽门螺杆菌感染的疫苗组合物和方法也属于本发明范围。附图详述

图1描述了5种幽门螺杆菌蛋白的氨基酸序列对比(以单字母氨基酸密码描述,并以其氨基酸序列识别号标示;从左至右显示N末端至C末端)。
图2描述3种幽门螺杆菌蛋白的N末端部分(以单字母氨基酸密码描述,并以其氨基酸序列识别号标示;从左至右显示N末端至C末端)。发明详述一方面,本发明描述了SEQ IN NO98的幽门螺杆菌多肽的重组或大致纯制剂的特征。本发明也包括编码SEQ ID NO98的幽门螺杆菌多肽的大致纯的核酸,这种核酸包含于SEQ ID NO1中。本文描述的本发明的幽门螺杆菌多肽序列包含于序列表中,编码本发明幽门螺杆菌多肽的核酸包含于序列表中。
另一方面,本发明描述了编码具有SEQ ID NO99氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO2核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO100氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO3核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO101氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO4核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO102氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO5核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO103氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO6核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO104氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO7核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO105氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO8核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO106氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO9核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO107氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO10核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO108氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO11核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO109氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO12核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO110氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO13核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO111氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO14核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO112氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO15核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO113氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO16核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO114氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO17核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO115氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO18核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO116氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO19核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO117氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO20核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO118氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO21核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO119氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO22核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO120氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO23核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO121氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO24核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO122氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO25核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO123氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO26核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO124氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO27核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO125氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO28核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO126氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO29核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO127氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO30核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO128氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO31核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO129氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO32核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO130氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO33核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO131氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO34核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO132氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO35核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO133氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO36核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO134氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO37核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO135氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO38核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO136氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO39核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO137氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO40核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO138氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO41核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO139氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO42核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO140氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO43核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO141氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO44核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO142氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO45核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO143氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO46核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO144氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO47核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO145氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO48核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO146氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO49核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO147氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO50核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO148氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO51核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO149氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO52核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO150氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO53核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO151氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO54核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO152氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO55核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO153氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO56核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO154氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO57核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO155氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO58核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO156氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO59核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO157氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO60核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO158氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO61核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO159氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO62核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO160氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO63核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO161氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO64核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO162氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO65核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO163氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO66核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO164氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO67核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO165氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO68核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO166氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO69核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO167氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO70核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO168氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO71核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO169氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO72核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO170氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO73核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO171氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO74核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO172氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO75核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO173氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO76核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO174氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO77核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO175氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO78核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO176氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO79核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO177氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO80核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO178氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO81核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO179氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO82核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO180氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO83核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO181氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO84核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO182氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO85核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO183氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO86核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO184氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO87核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO185氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO88核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO186氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO89核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO187氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO90核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO188氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO91核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO189氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO92核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO190氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO93核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO191氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO94核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO192氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO95核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO193氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO96核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO194氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO97核苷酸序列的核酸。
另一方面,本发明描述了其核苷酸序列编码的幽门螺杆菌多肽至少大约60%同源于选自SEQ ID NO98-SEQ ID NO194的氨基酸序列的分离的核酸的特征。在一个最佳实施方案中,所述分离的核酸包括选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列。
另一方面,本发明描述了其核苷酸序列编码选自SEQ ID NO98-SEQ ID NO194的幽门螺杆菌多肽的分离核酸的特征。
另一方面,本发明描述了编码幽门螺杆菌多肽的分离核酸的特征,所述分离核酸的核苷酸序列至少大约60%同源于选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列。
另一方面,本发明描述了编码幽门螺杆菌多肽、其核苷酸序列在严格杂交条件下与具有选自SEQ ID NO1-SEQ ID NO97的核苷酸序列的核酸分子或其互补序列杂交的分离的核酸分子的特征。
另一方面,本发明描述了其核苷酸序列至少长8个核苷酸的分离的核酸的特征,其中该序列在严格杂交条件下与具有选自SEQ ID NO1-SEQ ID NO97的核苷酸序列的核酸或其互补序列杂交。
特别优选的是其核苷酸序列编码幽门螺杆菌胞外被膜多肽或其片段的分离核酸,所述核酸选自SEQ ID NO63、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO27、SEQ ID NO28、SEQ ID NO50、SEQ ID NO51、SEQ ID NO61、SEQ IDNO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQID NO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ ID NO52、SEQ ID NO22、SEQ ID NO29、SEQ ID NO30、SEQ IDNO65、SEQ ID NO66、SEQ ID NO48、SEQ ID NO49、SEQID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO43、SEQ ID NO44、SEQ ID NO38、SEQ ID NO39、SEQ ID NO1、SEQ ID NO2、SEQ ID NO6、SEQ ID NO34、SEQ ID NO35、SEQ ID NO60、SEQ ID NO69和SEQ ID NO83或其互补序列。
在一个实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由具有SEQ ID NO63的核苷酸序列的核酸或其互补序列编码幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补序列编码的幽门螺杆菌内膜多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO43、SEQ ID NO44、SEQID NO38和SEQ ID NO39。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸或其互补序列编码的参与转运的幽门螺杆菌多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO43和SEQ ID NO44。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补序列编码的幽门螺杆菌外膜多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ IDNO27、SEQ ID NO28、SEQ ID NO50、SEQ ID NO51、SEQID NO61、SEQ ID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ ID NO52、SEQ ID NO22、SEQ ID NO29、SEQ IDNO30、SEQ ID NO65和SEQ ID NO66。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补序列编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO26、SEQ ID NO27、SEQ IDNO28、SEQ ID NO36、SEQ ID NO42、SEQ ID NO50、SEQID NO51、SEQ ID NO52、SEQ ID NO61、SEQ ID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91和SEQ ID NO94。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补序列编码的具有一个末端苯丙氨酸残基和C末端酷氨酸簇的幽门螺杆菌多肽或其片段SEQ ID NO11、SEQ IDNO26、SEQ ID NO36、SEQ ID NO42和SEQ ID NO52。
特别优选的是其核苷酸序列编码选自以下的一种幽门螺杆菌胞外被膜多肽或其片段的分离的核酸SEQ ID NO160、SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQID NO111、SEQ ID NO120、SEQ ID NO121、SEQ ID NO124、SEQ ID NO125、SEQ ID NO147、SEQ ID NO148、SEQID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQ ID NO182、SEQ ID NO188、SEQ ID NO191、SEQID NO102、SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139、SEQ ID NO149、SEQ ID NO119、SEQID NO126、SEQ ID NO127、SEQ ID NO162、SEQ ID NO163、SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQ ID NO135、SEQ ID NO136、SEQ ID NO98、SEQID NO99、SEQ ID NO103、SEQ ID NO131、SEQ ID NO132、SEQ ID NO157、SEQ ID NO166和SEQ ID NO180。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为具有SEQ ID NO160的氨基酸序列的幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌内膜多肽或其片段SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQ ID NO135和SEQID NO136。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为选自以下的参与转运的一种幽门螺杆菌多肽或其片段SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140和SEQ ID NO141。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQ ID NO121、SEQ ID NO124、SEQID NO125、SEQ ID NO147、SEQ ID NO148、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQID NO182、SEQ ID NO188、SEQ ID NO191、SEQ ID NO102、SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQID NO139、SEQ ID NO149、SEQ ID NO119、SEQ ID NO126、SEQ ID NO127、SEQ ID NO162和SEQ ID NO163。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO108、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQID NO121、SEQ ID NO123、SEQ ID NO124、SEQ ID NO125、SEQ ID NO133、SEQ ID NO139、SEQ ID NO147、SEQID NO148、SEQ ID NO149、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQ ID NO182、SEQID NO188和SEQ ID NO191。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139和SEQ ID NO149。
特别优选的是其核苷酸序列编码幽门螺杆菌胞质多肽或其片段的分离的核酸,其中所述核酸选自SEQ ID NO57、SEQ ID NO58、SEQ ID NO86、SEQ ID NO87、SEQ ID NO88、SEQ IDNO89、SEQ ID NO92和SEQ ID NO93。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,其中所述核酸选自SEQ IDNO57和SEQ ID NO58或其互补序列。
在另一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,其中所述核酸选自SEQ ID NO86、SEQ ID NO87或其互补序列。
特别优选的是其核苷酸序列编码选自以下的幽门螺杆菌胞质多肽或其片段的分离的核酸SEQ ID NO154、SEQ ID NO155、SEQ ID NO183、SEQ ID NO184、SEQ ID NO185、SEQ ID NO186、SEQ ID NO189和SEQ ID NO190。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO154和SEQ ID NO155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
在另一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO183和SEQ ID NO184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
特别优选的是其核苷酸序列编码幽门螺杆菌分泌多肽或其片段的分离的核酸,其中所述核酸选自SEQ ID NO3、SEQ ID NO4、SEQ ID NO10、SEQ ID NO12、SEQ ID NO20、SEQ ID NO25、SEQ ID NO31、SEQ ID NO32、SEQ ID NO45、SEQ IDNO46、SEQ ID NO53、SEQ ID NO64、SEQ ID NO67、SEQID NO70、SEQ ID NO77、SEQ ID NO78、SEQ ID NO81、SEQ ID NO82、SEQ ID NO90、SEQ ID NO95和SEQ ID NO97或其互补序列。
特别优选的是其核苷酸序列编码选自以下的幽门螺杆菌分泌多肽或其片段的分离的核酸SEQ ID NO100、SEQ ID NO101、SEQ ID NO107、SEQ ID NO109、SEQ ID NO117、SEQ ID NO122、SEQ ID NO128、SEQ ID NO129、SEQ ID NO142、SEQID NO143、SEQ ID NO150、SEQ ID NO161、SEQ ID NO164、SEQ ID NO167、SEQ ID NO174、SEQ ID NO175、SEQID NO178、SEQ ID NO179、SEQ ID NO187、SEQ ID NO192和SEQ ID NO194。
特别优选的是其核苷酸序列编码幽门螺杆菌细胞多肽或其片段的分离的核酸,其中所述核酸选自SEQ ID NO15、SEQ ID NO16、SEQ ID NO21、SEQ ID NO33、SEQ ID NO37、SEQ IDNO40、SEQ ID NO41、SEQ ID NO47、SEQ ID NO54、SEQID NO55、SEQ ID NO56、SEQ ID NO59、SEQ ID NO62、SEQ ID NO68、SEQ ID NO71、SEQ ID NO72、SEQ ID NO73、SEQ ID NO74、SEQ ID NO75、SEQ ID NO76和SEQ IDNO96或其互补序列。
特别优选的是其核苷酸序列编码选自以下的幽门螺杆菌细胞多肽或其片段的分离的核酸SEQ ID NO112、SEQ ID NO113、SEQ ID NO118、SEQ ID NO130、SEQ ID NO134、SEQ ID NO137、SEQ ID NO138、SEQ ID NO144、SEQ ID NO151、SEQID NO152、SEQ ID NO153、SEQ ID NO156、SEQ ID NO159、SEQ ID NO165、SEQ ID NO168、SEQ ID NO169、SEQID NO170、SEQ ID NO171、SEQ ID NO172、SEQ ID NO173和SEQ ID NO193。
另一方面,本发明描述了一种探针的特征,该探针的核苷酸序列包含选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列的至少8个核苷酸。
另一方面,本发明描述了其氨基酸序列至少大约60%同源于选自SEQ ID NO98-SEQ ID NO194的一种幽门螺杆菌多肽的分离的幽门蚴杆菌多肽的特征。
另一方面,本发明描述了由下述核酸编码的分离的幽门螺杆菌多肽的特征,所述核酸的核苷酸序列至少约60%同源于选自SEQ ID NO1-SEQ ID NO97的一种核苷酸序列。在一个实施方案中,所述分离的幽门螺杆菌多肽由选自SEQ ID NO1-SEQ ID NO97的一种核苷酸序列编码。
另一方面,本发明描述了由下述核酸编码的分离的幽门螺杆菌多肽的特征,所述核酸在严格杂交条件下与选自SEQ ID NO1-SEQ IDNO97的一种核酸或其互补序列杂交。
另一方面,本发明描述了其氨基酸序列选自SEQ ID NO97-SEQID NO194的分离的幽门螺杆菌多肽的特征。
特别优选的是一种分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽选自SEQ ID NO160、SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQ ID NO111、SEQID NO120、SEQ ID NO121、SEQ ID NO124、SEQ ID NO125、SEQ ID NO147、SEQ ID NO148、SEQ ID NO158、SEQID NO176、SEQ ID NO177、SEQ ID NO181、SEQ ID NO182、SEQ ID NO188、SEQ ID NO191、SEQ ID NO102、SEQID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139、SEQ ID NO149、SEQ ID NO119、SEQ ID NO126、SEQID NO127、SEQ ID NO162、SEQ ID NO163、SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQID NO116、SEQ ID NO140、SEQ ID NO141、SEQ ID NO135、SEQ ID NO136、SEQ ID NO98、SEQ ID NO99、SEQ IDNO103、SEQ ID NO131、SEQ ID NO132、SEQ ID NO157、SEQ ID NO166和SEQ ID NO180。
在一个实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为具有SEQ ID NO160的氨基酸序列的幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的幽门螺杆菌内膜多肽或其片段SEQ ID NO145、SEQ IDNO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQ ID NO135和SEQ ID NO136。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为选自以下的参与转运的幽门螺杆菌多肽或其片段SEQ ID NO145、SEQID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQ ID NO135和SEQID NO136。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQ ID NO121、SEQ ID NO124、SEQID NO125、SEQ ID NO147、SEQ ID NO148、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQID NO182、SEQ ID NO188、SEQ ID NO191、SEQ ID NO102、SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQID NO139、SEQ ID NO149、SEQ ID NO119、SEQ ID NO126、SEQ ID NO127、SEQ ID NO162和SEQ ID NO163。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO108、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQID NO121、SEQ ID NO123、SEQ ID NO124、SEQ ID NO125、SEQ ID NO133、SEQ ID NO139、SEQ ID NO147、SEQID NO148、SEQ ID NO149、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQ ID NO182、SEQID NO188和SEQ ID NO191。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139和SEQ ID NO149。
特别优选的是一种分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽由选自以下的核酸编码SEQ ID NO63、SEQ IDNO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13、SEQ IDNO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO27、SEQID NO28、SEQ ID NO50、SEQ ID NO51、SEQ ID NO61、SEQ ID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ IDNO52、SEQ ID NO22、SEQ ID NO29、SEQ ID NO30、SEQID NO65、SEQ ID NO66、SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO43、SEQ ID NO44、SEQ ID NO38、SEQ ID NO39、SEQ IDNO1、SEQ ID NO2、SEQ ID NO6、SEQ ID NO34、SEQ IDNO35、SEQ ID NO60和SEQ ID NO69、SEQ ID NO83。
在一个实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由具有SEQ ID NO63的核苷酸序列的核酸编码的幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌内膜多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ ID NO18、SEQ IDNO19、SEQ ID NO43、SEQ ID NO44、SEQ ID NO38和SEQID NO39。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸编码的参与转运的幽门螺杆菌多肽或其片段SEQ IDNO48、SEQ ID NO49、SEQ ID NO17、SEQ ID NO18、SEQID NO19、SEQ ID NO43和SEQ ID NO44。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌外膜多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO27、SEQ IDNO28、SEQ ID NO50、SEQ ID NO51、SEQ ID NO61、SEQID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ IDNO52、SEQ ID NO22、SEQ ID NO29、SEQ ID NO30、SEQID NO65和SEQ ID NO66。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQID NO24、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO36、SEQ ID NO42、SEQ ID NO50、SEQ ID NO51、SEQ ID NO52、SEQ ID NO61、SEQ ID NO79、SEQ IDNO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91和SEQID NO94。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基和C末端酪氨酸簇的幽门螺杆菌多肽或其片段SEQ ID NO11、SEQ ID NO26、SEQID NO36、SEQ ID NO42和SEQ ID NO52。
特别优选的是一种分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽选自SEQ ID NO154、SEQ ID NO155、SEQ ID NO183、SEQ ID NO184、SEQ ID NO185、SEQ ID NO186、SEQIDNO189和SEQ ID NO190。
在另一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO154和SEQ ID NO155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO183和SEQ ID NO184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
特别优选的是一种分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽由选自以下的核酸编码SEQ ID NO57、SEQ ID NO58、SEQ ID NO86、SEQ ID NO87、SEQ ID NO88、SEQ ID NO89、SEQ ID NO92和SEQ ID NO93。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,其中所述多肽由选自SEQID NO57和SEQ ID NO58的一种核酸编码。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,其中所述多肽由选自SEQ ID NO86和SEQ ID NO87的一种核酸编码。
特别优选的是一种分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽选自SEQ ID NO112、SEQ ID NO113、SEQ ID NO118、SEQ ID NO130、SEQ ID NO134、SEQ ID NO137、SEQID NO138、SEQ ID NO144、SEQ ID NO151、SEQ ID NO152、SEQ ID NO153、SEQ ID NO156、SEQ ID NO159、SEQID NO165、SEQ ID NO168、SEQ ID NO169、SEQ ID NO170、SEQ ID NO171、SEQ ID NO172、SEQ ID NO173和SEQID NO193。
特别优选的是一种分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽由选自以下的一种核酸编码SEQ ID NO15、SEQ ID NO16、SEQ ID NO21、SEQ ID NO33、SEQ ID NO37、SEQ IDNO40、SEQ ID NO41、SEQ ID NO47、SEQ ID NO54、SEQID NO55、SEQ ID NO56、SEQ ID NO59、SEQ ID NO62、SEQ ID NO68、SEQ ID NO71、SEQ ID NO72、SEQ ID NO73、SEQ ID NO74、SEQ ID NO75、SEQ ID NO76和SEQ IDNO96。
特别优选的是一种分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽选自SEQ ID NO100、SEQ ID NO101、SEQ ID NO107、SEQ ID NO109、SEQ ID NO117、SEQ ID NO122、SEQID NO128、SEQ ID NO129、SEQ ID NO142、SEQ ID NO143、SEQ ID NO150、SEQ ID NO161、SEQ ID NO164、SEQID NO167、SEQ ID NO174、SEQ ID NO175、SEQ ID NO178、SEQ ID NO179、SEQ ID NO187、SEQ ID NO192和SEQID NO194。
特别优选的是一种分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽由选自以下的核酸编码SEQ ID NO3、SEQ ID NO4、SEQ ID NO10、SEQ ID NO12、SEQ ID NO20、SEQ ID NO25、SEQ ID NO31、SEQ ID NO32、SEQ ID NO45、SEQ IDNO46、SEQ ID NO53、SEQ ID NO64、SEQ ID NO67、SEQID NO70、SEQ ID NO77、SEQ ID NO78、SEQ ID NO81、SEQ ID NO82、SEQ ID NO90、SEQ ID NO95和SEQ ID NO97。
另一方面,本发明描述了包含至少两种幽门螺杆菌多肽或其片段的一种嵌合幽门螺杆菌多肽的特征,其中所述多肽由选自SEQ ID NO1-SEQ ID NO97的核酸序列编码。
另一方面,本发明描述了包含至少两种幽门螺杆菌多肽或其片段的一种嵌合幽门螺杆菌多肽的特征,其中所述多肽选自SEQ ID NO98-SEQ ID NO194。
另一方面,本发明描述了包含操作性连接至一种非幽门螺杆菌多肽的一种幽门螺杆菌多肽的融合蛋白的特征,所述幽门螺杆菌多肽包含选自SEQ ID NO98-SEQ ID NO194的一种氨基酸序列。
另一方面,本发明描述了预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂的特征,该制剂包含有效量的至少一种本发明分离的核酸。
另一方面,本发明描述了预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂的特征,该制剂包含有效量的至少一种本发明的幽门螺杆菌多肽。
最好是,本发明的疫苗制剂还包含一种药用可接受的载体。在一种实施方案中,所述药用可接受的载体包括一种佐剂。在另一实施方案中,所述药用可接受的载体包括一个传递系统,例如活载体,例如细菌或病毒。在另一实施方案中,所述药用可接受的载体包括一种佐剂和一个传递系统。
另一方面,本发明描述了治疗或降低受治疗者的幽门螺杆菌感染或感染风险的方法的特征。该方法包括给予受治疗者一种本发明的疫苗制剂,使得治疗幽门螺杆菌感染或降低其风险。
另一方面,本发明描述了生产本发明疫苗制剂的方法的特征。该方法包括将至少一种分离的幽门螺杆菌多肽或其片段与药用可接受的载体混合,由此形成疫苗制剂,其中所述幽门螺杆菌多肽选自SEQID NO98-SEQ ID NO194。
另一方面,本发明描述了生产本发明疫苗制剂的方法的特征。该方法包括在允许幽门螺杆菌或其片段表达的条件下培养细胞,其中所述幽门螺杆菌多肽选自SEQ ID NO98-SEQ ID NO194;从所述细胞分离所述幽门螺杆菌多肽;将至少一种分离的幽门螺杆菌多肽或其片段与药用可接受的载体混合,由此形成疫苗制剂。
另一方面,本发明涉及各个幽门螺杆菌多肽成员或编码这一成员的核酸,所述成员为上述各组的幽门螺杆菌多肽。
另一方面,本发明描述了能够结合幽门螺杆菌mRNA的核酸的特征。这种核酸能够用作反义核酸,以控制幽门螺杆菌mRNA的翻译。再一方面,描述了能够特异性结合于幽门螺杆菌核酸的核酸的特征。这些核酸本文也称为互补序列,具有作为探针或和捕获试剂的用途。
另一方面,本发明描述了一种表达系统的特征,该系统包含对应于幽门螺杆菌核酸的可读框。所述核酸还包含与计划中的宿主相容的控制序列。该表达系统可用来制备对应于幽门螺杆菌核酸的多肽。
另一方面,本发明描述了用该表达系统转化以产生幽门螺杆菌多肽的细胞的特征。
另一方面,本发明描述了产生抗幽门螺杆菌多肽的抗体的特征,所述抗体能够特异性地结合于幽门螺杆菌多肽。这类抗体具有作为免疫测定的试剂的用途,以评价幽门螺杆菌特异性抗原的丰度和分布。
另一方面,本发明描述了产生用于免疫个体以抵抗幽门螺杆菌的疫苗的方法的特征。该疫苗接种的方法包括用至少一种按照本发明的幽门螺杆菌多肽(例如一种表面多肽或分泌多肽或它们的活性部分)和药用可接受载体免疫受治疗者。这类疫苗具有治疗和/或预防的用途。
另一方面,本发明提供产生疫苗的方法,所述疫苗包含一种修饰的免疫原性幽门螺杆菌多肽(例如一种表面多肽或分泌多肽或它们的活性部分)和药理学可接受的载体。
另一方面,本发明描述了评价一种化合物(例如一种多肽,例如宿主细胞多肽的片段)结合幽门螺杆菌多肽的能力的方法的特征。该方法包括使该候选化合物与一种幽门螺杆菌多肽接触,并确定该化合物是否结合幽门螺杆菌多肽或者与其相互作用。结合幽门螺杆菌的化合物为该细菌生活周期的激活剂或抑制剂的候选物。这些测定可以在体外或体内进行。
另一方面,本发明描述了评价一种化合物(例如一种多肽,例如宿主细胞多肽的片段)结合幽门螺杆菌核酸(例如DNA或RNA)的能力的方法的特征。该方法包括使该候选化合物与一种幽门螺杆菌核酸接触,并确定该化合物是否结合幽门螺杆菌多肽或者与其相互作用。结合幽门螺杆菌的化合物为该细菌生活周期的激活剂或抑制剂的候选物。这些测定可以在体外或体内进行。
本发明描述了幽门螺杆菌多肽、最好是大致纯的幽门螺杆菌多肽制剂或重组幽门螺杆菌多肽的特征。在最佳实施方案中,该多肽具有生物学活性;该多肽的氨基酸序列至少60%、70%、80%、90%、95%、98%或99%相同于或同源于序列表中含有的本发明的氨基酸序列,优选的是它与序列表中含有的本发明的氨基酸序列具有大约65%序列同一性;最优选的是,它与序列表中含有的本发明的氨基酸序列具有大约92%至大约99%的序列同一性;该多肽的氨基酸序列与序列表中含有的本发明的氨基酸序列基本上相同;该多肽长度为至少5、10、20、50、100或150个氨基酸残基;该多肽包括至少5个、优选至少10个、更优选至少20个、更优选至少50、100或150个连续的序列表中含有的本发明的氨基酸残基。在再一实施方案中,本发明也包括与序列表中含有的本发明氨基酸序列的序列同一性的差异为约7%至约8%的氨基酸序列。
在最佳实施方案中,所述幽门螺杆菌多肽由序列表中含有的本发明的核酸编码,或由与序列表中含有的本发明的核酸的同源性至少为60%、70%、80%、90%、95%、98%或99%的核酸编码。
在一个最佳实施方案中,主题幽门螺杆菌多肽的氨基酸序列与序列表中含有的本发明序列于1、2、3、5、10或更多个残基不同。然而,所述差异使得该幽门螺杆菌多肽表现出一种幽门螺杆菌的生物学活性,例如该幽门螺杆菌多肽保留天然产生的幽门螺杆菌多肽的一种生物学活性。
在最佳实施方案中,该多肽包括序列表中含有的本发明的所有氨基酸序列或其片段;该序列或片段符合读框地融合于其它氨基酸残基,最好是融合于编码序列表中含有的本发明序列的基因组DNA 5’或3’的基因组DNA编码的残基。
在再一最佳实施方案中,该幽门螺杆菌多肽为重组融合蛋白,该蛋白具有第一种幽门螺杆菌多肽部分和第二种多肽部分(例如其氨基酸序列与幽门螺杆菌无关的第二种多肽部分)。该第二种多肽部分可以例如为谷胱苷肽-S-转移酶、DNA结合域或聚合酶激活域中的任何一种。在最佳实施方案中,该融合蛋白可以用于双杂交测定中。
本发明的多肽包括由于以下事件产生的那些多肽替代的转录事件、替代的RNA剪接事件和替代的翻译和翻译后事件。
本发明也包括免疫原性组分,该组分包括免疫原性制剂中的至少一种幽门螺杆菌多肽;该免疫原性组分能够诱出对该幽门螺杆菌多肽特异性的免疫应答,例如体液应答、抗体应答或细胞应答。在最佳实施方案中,该免疫原性组分包括序列表中含有的本发明多肽的至少一种抗原决定簇。
另一方面,本发明提供大致纯的核酸,其核苷酸序列编码一种幽门螺杆菌多肽。在最佳实施方案中该编码的多肽具有生物学活性;该编码的多肽的氨基酸序列至少60%、70%、80%、90%、95%、98%或99%同源于序列表中含有的本发明的氨基酸序列;该编码的多肽的氨基酸序列与序列表中含有的本发明的氨基酸序列基本相同;该编码的多肽至少为5、10、20、100或150个氨基酸的长度;该编码的多肽包括至少5个、优选至少10个、更优选至少20个、更优选至少50个、100个或150个连续的序列表中含有的本发明的氨基酸。
在最佳实施方案中,本发明的核酸为序列表中含有的核酸;该核酸至少60%、70%、80%、90%、95%、98%或99%同源于序列表中含有的本发明的核酸序列。
在一种最佳实施方案中,该编码的幽门螺杆菌多肽的氨基酸序列至少于1、2、3、5、10和更多个残基不同于(例如由于氨基酸取代、加入或缺失至少一个氨基酸残基)序列表中含有的本发明的序列。然而,所述差异使得该幽门螺杆菌编码的多肽表现出一种幽门螺杆菌的生物学活性,例如该编码的幽门螺杆菌酶保留天然产生的幽门螺杆菌的一种生物学活性。
在最佳实施方案中,该编码的多肽包括序列表中含有的本发明的氨基酸序列的全部或其片段;该序列或其片段符合读框地融合于另外的氨基酸残基,最好是融合于编码序列表中含有的本发明序列的基因组DNA 5’或3’的基因组DNA编码的残基。
在最佳实施方案中,主题幽门螺杆菌核酸将包括转录调节序列(例如至少一种转录启动子或转录增强子序列),该序列操作性地连接于该幽门螺杆菌基因序列,例如以使得该幽门螺杆菌基因序列适于在重组宿主细胞中表达。
在又一最佳实施方案中,编码本发明幽门螺杆菌多肽的核酸在严格条件下与核酸探针杂交,其中所述探针对应于至少8个连续的序列表中含有的本发明的核苷酸;更优选至少对应于至少12个连续的序列表中含有的本发明的核苷酸;更优选对应于至少40个连续的序列表中含有的本发明的核苷酸。
在一个最佳实施方案中,该核酸编码一种多肽,该多肽因至少一个氨基酸残基不同于序列表中含有的本发明的序列。
在一个最佳实施方案中,该核酸至少有一个核苷酸不同于序列表中含有的本发明的核苷酸序列,而所述本发明的核苷酸序列编码序列表中含有的本发明的氨基酸序列。
另一方面,本发明包括包含本文描述的一种幽门螺杆菌多肽或一种幽门螺杆菌多肽变异体的编码核酸的载体;用该载体转化的宿主细胞;生产重组幽门螺杆菌多肽或幽门螺杆菌多肽变异体的方法;包括例如在细胞培养基中培养所述细胞,并例如从所述细胞或所述细胞培养基中分离该幽门螺杆菌多肽或幽门螺杆菌多肽变异体。
另一方面,本发明描述了纯化的重组核酸的特征,所述核酸与序列表中含有的本发明核酸至少有50%、60%、70%、80%、90%、95%、98%或99%的同源性。
本发明也提供包括大致纯的寡核苷酸的探针或引物。所述寡核苷酸包括一个核苷酸序列区,该区在严格条件下与序列表中含有的本发明的有义序列或反义序列或其天然产生的突变体的至少8个连续核苷酸杂交。在最佳实施方案中,所述探针或引物还包括与其连接的标记基团。所述标记基团可以是例如放射性同位素、荧光化合物、酶和/或酶的辅因子。最好是,所述寡核苷酸至少长8个寡核苷酸并少于10、20、30、50、100或150个核苷酸。
本发明也提供一种分离的幽门螺杆菌多肽,所述多肽由在严格条件下与序列表中含有的核酸杂交的核酸编码。
本发明还提供编码本发明多肽的核酸,例如RNA或DNA。这包括双链核酸以及反义单链核酸。
其基因组序列已经测序的幽门螺杆菌菌株已经以菌株HP-J99保藏于美国典型培养物保藏中心(ATCC # 55679;由GenomeTherapeutics Corporation进行了保藏,100 Beaver Street,Walthan,MA02154)。
本发明包括等位基因变异;天然突变体;诱导的突变体;有下述DNA编码的蛋白,所述DNA在高或低的严格条件下与编码序列表中含有的本发明多肽的核酸杂交(关于高严格性和低严格性,参见Current Protocols in Molecular Biology,John Wiley & Sons,New York,1989,6.3.1-6.3.6和6.4.1-6.4.10,在此通过引用结合到本文中);以及抗幽门螺杆菌多肽的抗血清特异性结合的多肽。本发明也包括片段,最好是生物活性片段。这些多肽和其它多肽本文也称为幽门螺杆菌类似物或变异体。
已经确定了几种本发明幽门螺杆菌多肽的推测功能,如表1所示。
因此,基于这些鉴定功能的要求保护的幽门螺杆菌多肽的用途以及本文所述的其它功能也属于本发明范围。
另外,本发明包括特征如以下表1所示的幽门螺杆菌多肽,包括幽门螺杆菌胞外被膜蛋白、幽门螺杆菌分泌蛋白、幽门螺杆菌胞质蛋白和幽门螺杆菌细胞蛋白。这些组的成员通过BLAST同源性检索和检索分泌信号或跨膜蛋白基元而鉴定。与表1多肽具显著同源性的相关多肽也被认为以表1所示的同源性方式分类。
表 1 定义本文所用的术语“纯化的多肽”和“分离的多肽”以及“大致纯的多肽制剂”在本文中可互换使用,是指已经大致、最好是完全同与其天然存在的其它蛋白、脂质和核酸分离的多肽。最好是该多肽也与用来纯化其的例如抗体或凝胶基质(例如聚丙烯酰胺)的物质分离。最好是该多肽构成所述纯化制剂干重的至少10、20、50、70、80或95%。最好是,所述制剂含有足以允许蛋白测序的多肽;至少1、10或100μg该多肽;至少1、10或100mg该多肽。此外,本文所用的术语“纯化的多肽”和“分离的多肽”以及“大致纯的多肽制剂”既是指得自天然的多肽,也是指通过本文所述的重组DNA技术产生的多肽。
例如,一种“分离的”或“纯化的”蛋白或其生物活性部分大致不含衍生该幽门螺杆菌蛋白的细胞或组织来源的细胞物质或其它污染蛋白,或当化学合成时大致不含化学前体或其它化学物质。术语“大致不含细胞物质”包括幽门螺杆菌蛋白的制剂,其中该蛋白与从中分离或重组产生该蛋白的细胞的细胞组分分离。在一个实施方案中,术语“大致不含细胞物质”包括这样的幽门螺杆菌蛋白制剂,所述制剂含有少于大约30%(干重)的非幽门螺杆菌蛋白(本文也称为“污染蛋白”),更优选少于大约20%非幽门螺杆菌蛋白,再更优选少于大约10%的非幽门螺杆菌蛋白,最优选少于5%非幽门螺杆菌蛋白。当重组生产幽门螺杆菌蛋白或其生物活性部分时,它也最好是大致不含培养基,即培养基占该蛋白制剂体积的不到大约20%,更优选少于大约10%,最优选少于大约5%术语“大致不含化学前体或其它化学物质”包括幽门螺杆菌蛋白制剂,其中该蛋白与参与合成该蛋白的化学前体或其它化学药品分离。在一个实施方案中,术语“大致不含化学前体或其它化学物质”包括这样的幽门螺杆菌蛋白制剂,它具有少于大约30%(干重)的化学前体或非幽门螺杆菌化学物质,更优选少于大约20%的化学前体或非幽门螺杆菌化学物质,再更优选少于大约10%的化学前体或非幽门螺杆菌化学物质,最优选少于大约5%的化学前体或非幽门螺杆菌化学物质。
在植物或动物细胞的情况下,纯化的细胞制剂是指一种体外细胞制剂,而不是整个完整的植物或动物。在培养细胞或微生物细胞的情况下,它包括至少10%、更优选50%主题细胞的制剂。
纯化或分离或大致纯的核酸,例如大致纯的DNA(是在本文中可互换的术语),为一种或两种下述的核酸与衍生该核酸的生物体的天然存在的基因组中紧密相邻(即,一个位于5’端及一个位于3’端)的两个编码序列非紧密相邻;或它大致不含在衍生该核酸的生物体中存在的核酸。该术语包括例如加入载体(例如自主复制型质粒或病毒)、或加入原核细胞和真核细胞基因组DNA中、或作为独立于其它DNA序列的分离分子存在(例如通过PCR或限制性内切核酸酶处理产生的cDNA或基因组DNA片段)的重组DNA。大致纯的DNA也包括为编码另一幽门螺杆菌DNA序列的杂种基因部分的重组DNA。
本文所用的“重叠群”是代表一段连续的生物体的基因组序列的核酸。
“可读框”也称为ORF,为编码多肽的核酸区。该区可以代表编码序列或总序列的一部分,可以从终止密码子至终止密码子或从起始密码子至终止密码子确定。
本文所用的“编码序列”为置于合适的调节序列控制之下时,转录为信使RMA和/或翻译为多肽的核酸。由5个引物末端的翻译起始密码子和三个引物末端的翻译终止密码子确定编码序列的边界。编码序列可以包括但不限于信使RNA序列、合成DNA序列和重组核酸序列。
本文所用的核酸的“互补序列”是指参与于原始序列Watson-Crick碱基配对的反向平行或反义序列。
“基因产物”是由基因特异性编码的蛋白和结构RNA。
本文所用的术语“探针”是指特异性结合于目的分子的核酸、肽或其它化学实体。探针常常与标记结合,或能够结合标记。标记为能够检测的化学部分。通常,标记包括染料、放射性同位素、发光部分和化学发光部分、荧光团、酶、沉淀剂、扩增序列等。同样,特异性结合于目的分子并将这种分子固定化的核酸、肽或其它化学实体本文称为“捕获配体”。捕获配体通常与支持物结合或能够结合支持物,所述支持物诸如硝酸纤维素、玻璃、尼龙膜、珠粒、颗粒等。杂交的特异性取决于诸如所述核苷酸的碱基对组成以及反应温度和盐浓度的条件。本领域技术人员采用常规实验,可容易地辨别这些条件。
同源的是指两种多肽之间或两种核酸分子之间的序列相似性或序列同一性。当同一碱基或氨基酸单体亚基占据两个相比序列中的一个位置时,例如如果两个DNA分子中的每一个中的一个位置均被腺苷酸占据,则所述分子在该位置是同源的。两个序列之间的同源性百分比为这两个序列共享的匹配或同源位置数除以所比较位置数×100的函数。例如,如果两个序列中10个位置中的6个匹配或同源,则这两个序列的同源性为60%。例如,DNA序列ATTGCC和TATGGC具有50%的同源性。一般而言,当两个序列序列对齐时进行比较,以得出最大同源性。
当至少核酸的一条链在限定的严格条件下可以退火至另一核酸时,核酸相互之间可杂交。如下确定杂交的严格性(a)进行杂交和/或洗涤的温度;以及(b)杂交溶液和洗涤溶液的离子强度和极性。杂交需要这两种核酸具有互补序列;然而,根据杂交的严格性,可以容忍错配。通常,两种序列在高严格性下(诸如于65℃、在0.5X SSC溶液中)的杂交需要所述序列基本上完全同源。中等严格性(诸如于65℃、2X SSC)和低严格性(诸如于55℃、2X SSC)的条件需要所述杂交序列之间相应较低的整体互补性。(1X SSC为0.15M NaCl、0.015M柠檬酸钠)。严格杂交条件的一个优选的非限制性实例为于大约45℃、在6X氯化钠/柠檬酸钠(SSC)中杂交,然后于50-65℃、0.2XSSC、0.1%SDS中洗涤一次或多次。
术语肽、蛋白和多肽在本文中可互换使用。
本文所用的术语“表面蛋白”是指所有表面可及的蛋白,例如内膜蛋白和外膜蛋白、粘附于细胞壁的蛋白以及分泌蛋白。
如果一个多肽具有以下性质中的一个、两个以及最好是多个,则该多肽具有幽门螺杆菌的生物活性(1)如果在幽门螺杆菌感染过程中表达时,它可以促进或介导幽门螺杆菌粘附于细胞;(2)它具有幽门螺杆菌蛋白特征性酶活性、结构功能或调节功能;(3)其编码基因可以拯救一种幽门螺杆菌基因中的致死突变;(4)或它在受治疗者中具有免疫原性。如果一种多肽是具有上述性质之一的多肽的拮抗剂、激动剂或超级激动剂,则该多肽具有生物活性。
生物活性片段或类似物是这样的片段或类似物,它具有序列表中含有的本发明幽门螺杆菌多肽或天然存在的幽门螺杆菌多肽特征性的一种体内或体外活性,例如本文所述一种或多种生物活性。尤其优选的是体内存在的片段,例如由转录后加工产生的片段或由另一种剪接的RNA的翻译产生的片段。片段包括在天然或内源细胞中表达的片段以及在表达系统(例如在CHO细胞中)产生的片段。因为诸如幽门螺杆菌多肽的肽常常表现出一定范围的生理性质,并且因为这类性质可能由该分子的不同的部分产生,所以有用的幽门螺杆菌片段或幽门螺杆菌类似物为在任何幽门螺杆菌活性的测定中表现出一种生物活性的片段或类似物。最优选的是,该片段或类似物在任何体内或体外测定中具有10%、优选40%、更优选60%、70%、80%或90%或更高的幽门螺杆菌的活性。
类似物可以在氨基酸序列上或在不涉及序列的方式上或在这两个方面不同于天然存在的幽门螺杆菌多肽。非序列修饰包括乙酰化、甲基化、磷酸化、羧化或糖基化的改变。优选的类似物包括其序列因一个或多个保守氨基酸取代或基本上不消除该幽门螺杆菌多肽生物活性的一个或多个非保守的氨基酸取代、缺失或插入而不同于野生型序列的幽门螺杆菌多肽(或其生物活性片段)。保守的取代通常包括一个氨基酸取代另一个具有相似特征的氨基酸,例如以下组内的取代缬氨酸、甘氨酸;甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸;天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;以及苯丙氨酸、酪氨酸。其它保守取代可以根据下表产生。
表 2保守性氨基酸取代
本发明内的其它类似物是具有提高肽稳定性的修饰的类似物;这类类似物可以在该肽序列中含有例如一个或多个非肽键(取代所述肽键)。也包括含有不是天然产生的L-氨基酸(例如D-氨基酸)或非天然产生或合成的氨基酸(例如β或γ氨基酸)的残基的类似物;以及环状类似物。
本文所用的用于幽门螺杆菌类似物的术语“片段”一般为长至少大约20个残基、更常见为至少大约40个残基、最好至少大约60个残基。幽门螺杆菌多肽的片段可以用本领域技术人员已知的方法产生。候选片段表现出幽门螺杆菌多肽生物活性的能力可以用如上所述的本领域技术人员已知的方法评价。也包括含有该肽生物活性不需要的残基的幽门螺杆菌多肽或由另一种mRNA剪接或另一种蛋白加工事件产生的多肽。
本文所用的“免疫原性组分”是诸如幽门螺杆菌多肽、或其类似物或片段的一部分,它能够在宿主动物中单独或结合佐剂诱出体液免疫应答和/或细胞免疫应答。
本文所用的“抗原组分”是诸如幽门螺杆菌多肽、或其类似物或其片段,它能够以足够高的亲和力结合于特异性抗体,以形成可检测的抗原-抗体复合物。
本文所用的术语“转基因”是指部分或完全异源(即外源)于其引入的转基因动物或细胞的核酸、或同源于其引入的转基因动物或细胞的内源基因、但设计插入或插入该细胞基因组中,其插入方式使得改变其插入的细胞基因组(例如,将其于不同于天然基因的位置插入或其插入导致失效)。转基因可以包括一种或多种转录调节序列和所选定核酸最佳表达可能所必需的任何其它核酸,诸如内含子,所有这些序列均操作性地连接至所选定的核酸,转基因也可以包括一个增强子序列。
本文所用的术语“转基因细胞”是指含有转基因的细胞。
本文所用的“转基因动物”是指该动物的一种或多种、最好是基本上所有的细胞含有转基因的任何动物。利用有意的基因操作(诸如通过感受态细胞的转化或通过微注射或用重组病毒感染),可以将该转基因直接引入该细胞,或通过引入该细胞的前体间接地引入该细胞。该分子可以整合入染色体中,或它可以是染色体外复制型DNA。
本文所用的术语“抗体”将包括与幽门螺杆菌多肽特异性反应的抗体的片段。
本文所用的术语“细胞特异性启动子”是指用作启动子(它即调节操作性连接于该启动子的选定DNA序列的表达)并影响该选定的DNA在一种组织的特定细胞中表达的DNA序列。该术语也包括所谓的“渗漏”启动子,它调节选定的DNA主要在一种组织中的表达,但也引起在其它组织中表达。
本文所用的错表达是指非野生型方式的基因表达。它包括非野生型水平的表达,即过量表达或表达不足;该基因表达的时间或阶段不同于野生型的一种表达方式,例如在一个预定的发育时期或阶段表达增加或减少(与野生型相比);在一种预定细胞类型或组织类型中表达减少(与野生型相比)而不同于野生型的一种表达方式;在剪接大小、氨基酸序列、翻译后修饰(post-transitional modification)或所表达多肽的生物活性方面不同于野生型的表达方式;在环境刺激物或胞外刺激物对该基因表达的效应方面不同于野生型的表达方式,例如在增加或降低该刺激强度情况下表达增加或降低(与野生型相比)的方式。
本文所用的指微生物或作为单细胞实体培养的高等真核生物细胞系的“宿主细胞”和其它这类术语,是指可以成为或已经用作重组载体或其它转移DNA的受体的细胞,包括已经转染的原始细胞的子代。本领域技术人员理解,由于偶然或有意的突变,单个亲代细胞的子代的基因组DNA或总DNA compliment可以不必完全与原始亲代相同。
本文所用的术语“控制序列”是指其碱基序列由宿主生物体识别以影响与其连接的所编码序列表达的核酸。根据宿主生物体,这类控制序列的性质是不同的;在原核生物中,这类控制序列一般包括启动子、核糖体结合位点、终止子,在某些情况下包括操纵子;在真核生物中,这类控制序列一般包括启动子、终止子,在某些情况下包括增强子。术语控制序列是指最低限度包括其存在是表达所必需的所有组分,也可以包括其存在是有利的另外的组分,例如前导序列。
本文所用的术语“操作性连接”是指连接序列使其以预定方式发挥作用。例如,将控制序列操作性连接于编码序列,其连接方式使得在与该控制序列和宿主细胞相适应的条件下达到该编码序列表达。
本文所用的物质的新陈代谢是指该物质的表达、功能、作用或调节的任何方面。物质的新陈代谢包括该物质的修饰,例如共价修饰或非共价修饰。物质的新陈代谢包括该物质诱导的其它物质的修饰,例如共价修饰或非共价修饰。物质的新陈代谢也包括该物质分布的变化。物质的新陈代谢包括该物质诱导的其它物质分布的变化。
本文所用的“样品”是指生物样品,诸如从个体分离的组织或流体(包括但不限于血浆、血清、脑脊髓液、淋巴、泪、唾液和组织切片)或来自体外细胞培养物组分的样品以及来自环境的样品。
本发明的实施除非另有说明,将使用化学、分子生物学、微生物学、重组DNA和免疫学的常规技术,这些均在本领域技术范围内。这类技术在文献中进行了全面的解释。参见例如Sambrook,Fritsch和Maniatis,Molecular CloningLaboratory Manual第2版(1989);DNACloning第I和II卷(D.N Glover编辑,1985);Oligonucleotide Synthesis(M.J.Gait编辑,1984);Nucleic acid Hybridization(B.D.Hames和S.J.Higgins编辑,1984);Methods in Enzymology系列(Academic Press,Inc.),特别是第154卷和第155卷(Wu和Grossman编辑)以及PCR-A PracticalApproach(McPherson,Quirke和Taylor编辑,1991)。I.幽门螺杆菌核酸的分离及其用途幽门螺杆菌基因组序列本发明提供幽门螺杆菌基因组的核苷酸序列,由此包括幽门螺杆菌基因组DNA的DNA序列文库。下面的详细描述提供幽门螺杆菌的核苷酸序列,也描述如何获得所述序列以及如何鉴别ORF和蛋白编码序列。也描述了在包括诊断和治疗应用的方法中使用公开的幽门螺杆菌序列的方法。此外,该文库可以用作鉴定和比较该幽门螺杆菌菌株和其它菌株中医学上重要的序列的数据库。
为了测定幽门螺杆菌的基因组序列,从一个幽门螺杆菌菌株(ATCC # 556679;由Genome Therapeutics Coporation保藏,100 BeaverStreet,Waltham,MA 02154)分离DNA,并通过喷雾机械剪切为2kb的中等大小。在通过凝胶电泳进行大小分级分离后,将所述片段平端化,连接于连接寡核苷酸,并克隆入20个不同的pMPX载体(Rice等,基因组作图和测序会议摘要,冷泉港,NY,5/11-5/15,1994,第225页)中的每一个,以构建一系列“鸟枪法”亚克隆文库。
用基本上如Church等,1988,Science240185;美国专利第4,942,124和5,149,624公开的多步测序步骤,完成DNA测序。从合并的培养物中提取DNA,进行化学或酶促测序。测序反应物通过电泳分离,将产物转移并共价连接于尼龙膜。最后,将所述膜与一系列标记的与不同鸟枪法克隆载体中存在的“标记”序列互补的寡核苷酸顺序杂交。以该方式,可以从单组测序反应物获得许多序列。该克隆和测序方法在范例中更详细地描述。
以该方式获得的单个序列的解读采用FLACONTM程序(Church等,1994,Automated DNA Sequencing amd Analysis,J.C.Venter编辑,Academic Press)和PHRAP(P.Green,DOE Human Genome ProgramContractor-Grantee Workshop V摘要,1996年1月,第157页)汇编。平均重叠群的长度大约为3-4kb。
种种方法可以用来确定所述重叠群的顺序,以获得完整幽门螺杆菌基因组的连续序列。设计合成的与每个重叠群末端序列互补的寡核苷酸。这些寡核苷酸可以与例如λ噬菌体载体或质粒载体中的幽门螺杆菌基因组DNA的文库杂交,以鉴定含有对应于各个重叠群之间连接区的序列的克隆。然后用这类克隆分离模板DNA,相同的寡核苷酸在聚合酶链式反应(PCR)中用作引物,以扩增连接片段,然后确定其核苷酸序列。
分析幽门螺杆菌序列包含至少180个核苷酸的可读框(ORF)的存在。作为基于终止密码子-终止密码子阅读的ORF分析的结果,应该理解,这些ORF可能不对应于天然存在的幽门螺杆菌多肽的ORF。这些ORF可能含有指示天然存在的幽门螺杆菌多肽蛋白合成起始的起始密码子。本文提供的ORF中的这类起始密码子可以由相关领域的技术人员进行鉴定,产生的ORF和所编码的幽门螺杆菌多肽属于本发明的范围。例如,在所述ORF中,可以鉴别诸如AUG或GUG(编码甲硫氨酸或缬氨酸)的密码子,它作为蛋白合成的起始信号的部分,将该ORF修饰为对应于天然存在的幽门螺杆菌多肽。通过用程序GENEMARKTM(Borodovsky and McIninch,1993,Comp.Chem.17123)评价这类序列的编码潜力,定义预测的编码区。其它幽门螺杆菌核酸可以通过用聚合酶链式反应(PCR),从上述参考幽门螺杆菌菌株的DNA直接获得本发明的核酸。关于PCR的细节,参见“PCR,APractical Approach”(McPherson,Quirke和Taylor编辑,IRL Press,Oxford,UK,1991)。在表达之前,用高保真PCR确保真实的DNA拷贝。另外,扩增产物的真实性可以通过常规测序方法检查。也可以通过利用PCR筛选所述文库或通过本领域已知的合成寡核苷酸探针与所述文库克隆或噬斑的滤膜影印物(参见例如Sambrook等,MolecularCloning,A Laboratory Manual第2版,1989,Cold Spring Habor Press,NY)杂交,获得携带本发明中所述的所需序列的克隆。
也可能按照本文所述的方案,从cDNA文库获得编码幽门螺杆菌多肽的核酸。可以通过从合适菌株中分离总mRNA,获得编码幽门螺杆菌多肽的cDNA。然后从总mRNA可以制备双链cDNA。随后,可以采用任何一种已知技术,将所述cDNA插入合适的质粒或病毒(例如噬菌体)载体中。也可以采用建立的聚合酶链式反应技术,依据本发明提供的核苷酸序列信息,克隆编码幽门螺杆菌多肽的基因。本发明的核酸可以是DNA或RNA。序列表中含有优选的本发明核酸。
本发明的核酸也可以采用标准技术化学合成。各种化学合成多聚脱氧核苷酸的方法是已知的,包括已经在市售DNA合成仪中自动合成的固相合成(象肽合成一样)(参见例如Itakura等,美国专利第4,598,049号;Caruthers等,美国专利第4,458,066号;和Itakura的美国专利第4,401,796号和第4,373,071号,它们通过引用结合到本文中)。
根据本发明的特征分离或合成的核酸例如但不限于,可用作探针、引物、捕获配体、反义基因和开发合成对应于这类序列的蛋白和肽的表达系统。作为探针、引物、捕获配体和反义基因,该核酸通常包括所有或部分(大约20个或更多的核苷酸,具有形成稳定杂交产物的特异性和能力)的序列表中含有的本发明核酸。以下进一步详细描述这些用途。
探针根据序列表中含有的本发明序列分离或合成的核酸,可以用作探针,以特异性地检测幽门螺杆菌。用本申请中提出的序列信息,鉴定20个或更多的核苷酸的序列,这提供对于幽门螺杆菌和杂交条件下可能遇到的外来核酸所需的包含性(inclusivity)和排他性。更优选的是,该序列将包含至少20-30个核苷酸,以赋予该探针和计划的靶分子之间形成的杂交产物以稳定性。
长度大于1000个核苷酸的序列难以合成,但可以通过重组DNA技术产生。本领域技术人员容易认识到,可以为用作探针的核酸提供标记,以有助于杂交产物的检测。
根据序列表中含有的本发明序列分离和合成的核酸,也可以用作探针,用本文所述的合适的严格杂交条件检测其它螺杆菌菌种的同源区(尤其是同源基因)。
捕获配体对于用作捕获配体,以上述关于探针所述方式选择的核酸可以容易地与支持体结合。核酸与支持体结合的方式是众所周知的。具有序列表中含有的本发明序列中的20个或更多核苷酸的核酸,具有从每种其它和其它生物体的核酸分离幽门螺杆菌核酸的用途。具有序列表中含有的本发明序列中的20个或更多核苷酸的核酸,也可以具有将其它螺杆菌菌种与每种其它或其它生物体分离的用途。最好是,该序列将包含至少20个核苷酸,以赋予该探针和计划的靶分子之间形成的杂交产物以稳定性。长度大于1000个核苷酸的序列难以合成,但可以通过重组DNA技术产生。
引物根据本文所述序列分离或合成的核酸,具有作为引物以扩增幽门螺杆菌核酸的用途。这些核酸也可以具有作为引物以扩增其它螺杆菌菌种的核酸的用途。关于聚合酶链式反应(PCR)技术,具有序列表中含有的本发明的≥10-15个核苷酸的核酸序列,结合合适的酶和试剂,具有产生幽门螺杆菌核酸拷贝的用途。更优选的是,该序列将包含20个或更多的核苷酸,以赋予该探针和计划的靶分子之间形成的杂交产物以稳定性。大于100个核苷酸的引物为获得特异性的结合条件更难以控制。在表达之前,高保真PCR可以用来确保真实的DNA拷贝。另外,可以用常规测序方法检查扩增产物。
所述拷贝可以用于诊断测定,以检测特定的序列,包括来自幽门螺杆菌和/或其它螺杆菌菌种的基因。所述拷贝也可以加入克隆载体和表达载体中,以产生对应于PCR合成的核酸的多肽,如本文更详细的描述。
反义根据本文所述序列分离或合成的核酸或核酸杂交衍生物,具有防止幽门螺杆菌基因表达的反义因子(antisense agent)的用途。这些序列也具有作为防止其它螺杆菌菌种的基因表达的反义因子的用途。
在一个实施方案中,将对应于幽门螺杆菌核酸的核酸或衍生物加载入合适的载体(诸如脂质体或噬菌体)中,以引入细菌细胞。例如具有20个或更多核苷酸的核酸能够结合于细菌核酸或细菌信使RNA。最好是,该反义核酸包含20个或更多的核苷酸,以提供非天然存在核酸和细菌核酸和/或细菌信使RNA的杂交产物必需的稳定性。其序列长度大于1000个核苷酸的核酸难以合成,但可以采用重组DNA技术产生。将反义核酸加载入脂质体的方法是本领域已知的,如1980年12月23日授予Papahadjopoulos等的美国专利4,241,046所例举的。II.幽门螺杆菌核酸的表达根据本文所述序列分离或合成的核酸具有产生多肽的用途。序列表中例举的本发明的核酸或编码幽门螺杆菌多肽活性部分的核酸片段,可以克隆入合适的载体中,或用来分离核酸。该分离的核酸与合适的DNA接头结合,并克隆入合适的载体中。
可以通过在可以特异性地测定所述基因或操纵子特定的基因产物的活性的条件下在细菌菌株中表达,确定特定基因或操纵子的功能。获得,可以在表达菌株中大量产生基因产物,以用作抗原、工业试剂、用于结构研究等。可以在缺失待测试基因活性的突变菌株中、或在不产生相同基因产物的菌株中完成该表达。这包括但不限于其它螺杆菌菌株、或诸如大肠杆菌、诺卡氏菌属(Norcardia)、棒杆菌属(Corynebacterium)、弯曲杆菌属(Campylobacter)和链霉菌属(Streptonmyces)菌种的其它细菌菌株。在某些情况下,表达宿主利用天然的螺杆菌启动子,而其它情况下,它对于用来自表达生物体的启动子序列驱动该基因是必需的(例如大肠杆菌β-半乳糖苷酶启动子对于在大肠杆菌中表达)。
为了用天然幽门螺杆菌启动子表达基因产物,可以使用诸如以下的方法。将含有目的基因的限制性片段与其结合的天然启动子元件和调节序列(用DNA序列数据鉴定),一起克隆入合适的重组质粒,该重组质粒含有在宿主生物体中有功能的复制起点和一个合适的选择标记。这可以通过本领域技术人员已知的多种方法完成。最优选的是,这可以通过以下方法进行,即通过用相同的限制性酶切割该质粒和待克隆的片段,以产生可以将两个片段连接在一起的相匹配的末端。通过例如电穿孔,将该重组质粒引入该宿主生物体,并通过选择该质粒上的标记,鉴别含有该重组质粒的细胞。采用针对该基因产物特异的测定,检测所需基因产物的表达。
在需要不同启动子的基因的情况下,特异性切割该基因体(编码序列),将其克隆入合适的表达质粒中。可以采用几种方法进行该亚克隆,但最容易用以下方法完成,即通过PCR扩增特定片段、并在用限制性酶或外切核酸酶处理以产生合适的用于克隆的末端后连接入表达质粒中。
用于表达基因的合适的宿主细胞可以是原核细胞或真核细胞。例如,可以在诸如大肠杆菌的细菌细胞、昆虫细胞(杆状病毒)、酵母或诸如中国仓鼠卵巢细胞(CHO)的哺乳动物细胞中表达幽门螺杆菌多肽。其它合适的宿主细胞是本领域技术人员已知的。
在诸如哺乳动物、酵母或昆虫细胞的真核细胞中的表达,可能导致重组肽产物的部分或完全糖基化和/或形成相关链间或链内二硫键。在酵母酿酒酵母(S.cerivisae)中表达的载体实例包括pYepSecl(Baldari等,(1987)Embo J.6229-234)、pMFa(Kurjan和Herskowitz,(1982)Cell30933-943)、pJRY88(Schultz等,(1987)Gene54113-123)和pYES2(Unvitrogen Corporation,San Diego,CA)。可用来在培养的昆虫细胞(SF 9细胞)中表达蛋白的杆状病毒载体包括pAc系列(Smith等,(1983)Mol.Cell Biol.32156-2165)和pVL系列(Lucklow,V.A.和Summers,M.D.,(1989)Virology17031-39)。一般而言,COS细胞(Gluzman,Y.,(1981)Cell23175-182)与诸如pCDM 8(Aruffo,A.和Seed,B.,(1987)Proc.Natl.Acad.Sci.USA848573-8577)的载体结合使用,以在哺乳动物细胞中进行瞬时扩增/表达,而CHO(dhfrChineseHamsterOvary)细胞与诸如pMT2PC(Kaufman等(1987),EMBO J.6187-195)一起使用,用于在哺乳动物细胞中进行稳定扩增/表达。可以通过常规技术,诸如磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染或电穿孔,将载体DNA引入哺乳动物细胞中。合适的转化宿主细胞的方法可以参见Sambrook等(Molecular CloningA Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press(1989))和其它实验教科书。
在原核生物中的表达最常在大肠杆菌中用或者融合或者非融合诱导型表达载体进行。融合载体通常将大量NH2末端氨基酸加入表达的靶基因。这些NH2末端氨基酸通常称为报道基团。这类报道基团通常用于两个目的1)为了提高靶重组蛋白的溶解性;和2)有助于通过用作亲和纯化中的配体而纯化靶重组蛋白。通常,在融合表达载体中,在该报道基团和靶重组蛋白的接点引入蛋白水解切割位点,以能够在纯化融合蛋白后从该报道基团分离靶重组蛋白。这类酶及其相关识别序列包括因子Xa、凝血酶和肠激酶。典型的融合表达载体包括pGEX(Amrad Corp.,Melbourne,澳大利亚)、pMAL(New EnglandBiolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ),它们分别将谷胱甘肽S-转移酶、麦芽糖E结合蛋白或蛋白A融合于靶重组蛋白。优选的报道基团是poly(His),它可以融合于该蛋白的氨基末端或羧基末端,并使得重组融合蛋白容易通过金属螯合层析纯化。
诱导型非融合表达载体包括pTrc(Amann等,(1988)Gene69301-315)和pET11d(Studier等,Gene Expression TechnologyMethods inEnzymology185,Academic Press,San Diego,California(1990)60-89)。靶基因表达依赖于宿主RNA聚合酶从pTrc中的杂种trp-lac融合启动子转录,而插入pET11d中的靶基因的表达依赖于共表达的病毒RNA聚合酶(T7 gn1)介导的从T7 gn 10-lac 0融合启动子的转录。该病毒聚合酶由宿主菌株BL21(DE3)或HMS174(DE3),从带有在lacUV 5启动子转录控制下的T7 gn1的停留(resident)λ前噬菌体供应。
例如,用指导编码幽门螺杆菌多肽的核苷酸序列表达的核酸载体转染的宿主细胞,可以在合适的条件下培养,以使得发生该多肽的表达。可以分泌该多肽,并从细胞和含该肽的培养基的混合物中分离该多肽。或者,该多肽可以保留在胞质中,收获细胞、将其裂解并分离蛋白。细胞培养物包括宿主细胞、培养基和其它副产物。适用于细胞培养的培养基是本领域熟知的。可以用纯化蛋白领域已知的技术,包括离子交换层析、凝胶过滤层析、超滤、电泳和用这类多肽特异性抗体的免疫亲和纯化,从细胞培养基、宿主细胞或在这两者中分离本发明的多肽。另外,在许多情况下,可以通过化学切割天然蛋白(例如胰蛋白酶消化)产生多肽,然后可以通过标准技术纯化切割产物。
在膜结合蛋白的情况下,这些蛋白可以如下从宿主细胞分离,即通过使膜结合蛋白部分与形成溶解的复合物的去垢剂接触,这时所述膜结合蛋白不再完全包埋在膜部分中,至少在某些程度上溶解,这使得它可以从该膜部分中进行层析分离。用几种不同的标准选择适于溶解这些复合物的去垢剂。例如,一个考虑的性质是在该膜结合蛋白最少变性、使得该膜结合蛋白在该蛋白重建时恢复活性或功能性的情况下,该去垢剂溶解该幽门螺杆菌蛋白的能力。选择去垢剂时考虑的另一性质是该去垢剂的关键的微团浓度,因为选择的去垢剂最好具有高CMC值,以使得在重建后易于除去。选择去垢剂时考虑的第三个性质是该去垢剂的疏水性。通常,膜结合蛋白的疏水性非常强,因此也是疏水性的去垢剂(例如triton系列)对于溶解疏水性蛋白是有用的。对于去垢剂重要的另一性质可能是该去垢剂以最小蛋白-蛋白相互作用除去该幽门螺杆菌蛋白的能力,以便于进一步纯化。应该考虑的该去垢剂的第五个性质是该去垢剂的电荷。例如,如果在纯化过程中需要使用离子交换树脂,则去垢剂最好为不带电荷的去垢剂。可以用于最后纯化步骤的层析技术是本领域已知的,包括疏水性相互作用层析、凝集素亲和层析、离子交换层析、染料亲和层析和免疫亲和层析。
使重组幽门螺杆菌肽在大肠杆菌中的表达最大化的一个策略,是在蛋白水解切割该重组蛋白的能力受损的宿主细菌中表达该蛋白(Gottesman,S.,Gene Expression TechnologyMethods in Enzymeology185,Academic Press,San Diego,California(1990)119-128)。另一策略是改变待插入表达载体、编码幽门螺杆菌多肽的核酸,使得每个氨基酸的各个密码子是在高度表达的大肠杆菌蛋白中优先使用的密码子(Wada等,(1992)Nuc.Acids Res.202111-2118)。本发明核酸的这类改变可以用标准DNA合成技术进行。
本发明核酸也可以采用标准技术化学合成。化学合成多聚脱氧核苷酸的各个方法是已知的,包括固相合成,它同肽合成一样,已经在市售DNA合成仪中完全自动进行(参见例如Itakura等,美国专利第4,598,049号;Caruthers等的美国专利第4,458,066号;和Itakura的美国专利第4,401,796号和第4,373,071号,它们通过引用结合到本文中)。III.幽门螺杆菌多肽本发明包括由公开的幽门螺杆菌基因组序列编码的分离的幽门螺杆菌多肽,包括序列表中含有的本发明多肽。本发明多肽最好长至少5个氨基酸残基。采用本文提供的DNA序列信息,可以采用本领域熟知的方法,推导出本发明包括的多肽的氨基酸序列。应该理解,可以分离编码幽门螺杆菌多肽的完整核酸序列,并根据仅编码相关蛋白编码区的片段的ORF进行鉴定。这可以例如通过采用分离的编码该ORF的核酸或其片段完成,以引发用幽门螺杆菌基因组DNA作为模板的聚合酶链式反应;然后序列分析扩增的产物。
可以从野生型或突变型幽门螺杆菌细胞或从已经引入并表达幽门螺杆菌核酸的异源生物或细胞(包括但不限于细菌、酵母、昆虫、植物和哺乳动物细胞)分离本发明的多肽。此外,该多肽可以是部分重组融合蛋白。
可以采用诸如本文参考的工业自动方法,化学合成本发明的幽门螺杆菌多肽。
本发明的幽门螺杆菌多肽也将包括本文所述的嵌合蛋白和截短的蛋白。嵌合幽门螺杆菌蛋白幽门螺杆菌嵌合多肽包含一种或多种融合在一起的幽门螺杆菌多肽。可以通过将两种或多种基因、或两种或多种多肽编码序列、或至少一种基因和至少一种多肽编码序列串联组合,制备这些组合的序列,随后通过常规分子生物学技术表达这些编码的蛋白。所述组合的核苷酸序列可以包含或者全长幽门螺杆菌核苷酸或这类序列的片段(例如含有所编码的幽门螺杆菌蛋白的免疫学相关部分的片段)的组合。则这些嵌合幽门螺杆菌蛋白具有每个单独的幽门螺杆菌蛋白序列的联合疫苗或协同疫苗的潜力,并且可以用于本发明的疫苗制剂中。截短的基因表达和蛋白产生由给定核苷酸序列编码的幽门螺杆菌蛋白也可以以生物活性截短的形式使用。可以例如通过消除编码核苷酸序列的或者5’和/或3’区,产生这类截短物。这类截短物可能影响所述编码蛋白的重组表达和/或该蛋白随后的纯化。例如,截短编码特定蛋白的预测输出序列的核苷酸序列,可以改变该蛋白的表达。或者,通过消除核酸编码区的3’端截短幽门螺杆菌多肽的C末端,也可以提高蛋白表达和随后的纯化和使用,这些在以下实施例VIII中概述。编码内部幽门螺杆菌蛋白区的核酸区的缺失,也可以导致增加的蛋白表达、纯化和/或作为疫苗候选物的效力。IV.编码疫苗组分的核酸和有效抗幽门螺杆菌的因子的靶的鉴定公开的幽门螺杆菌基因组序列包括指导核糖核酸和多肽合成的区段以及复制起点、启动子、其它类型的调节序列和基因间核酸。本发明包括编码疫苗的免疫原性组分的核酸和有效抗幽门螺杆菌的因子的靶。用种种方法可以完成参与确定公开序列功能的免疫原性组分的鉴定。以下简述这些方法的非限制性实施例。
与已知序列的同源性公开的幽门螺杆菌序列与公众可利用的数据库中存在的先前报道的序列的计算机辅助比较,可用来鉴定功能性幽门螺杆菌核酸序列和多肽序列。应该理解,蛋白编码序列例如可以作为整体进行比较,两种蛋白之间在氨基酸水平的高度同源性(诸如>80-90%),表明这两种蛋白也具有某些程度的功能同源性,诸如在参与新陈代谢、DNA合成或细胞壁合成中的酶和参与转运、细胞分裂等的蛋白中。另外,已经鉴定了特定蛋白类别的许多结构特征,并将其与特定的共有序列相联系,所述共有序列诸如核苷酸、DNA、金属离子和其它小分子的结合域;诸如磷酸化、酰化等的共价修饰位点;蛋白蛋白相互作用位点等。这些共有序列可以相当短,因此可以仅代表完整蛋白编码序列的一部分。因此,在一种幽门螺杆菌多肽中这一特征的鉴定可用来确定所编码蛋白的功能,并鉴定有用的抗菌药的靶。
与本发明特别相关的是分泌蛋白、跨膜蛋白和表面蛋白所共有的结构特征,包括分泌信号肽和疏水性跨膜域。鉴定为含有推定信号序列和/或跨膜域的幽门螺杆菌蛋白可用作疫苗的免疫原性组分。
必需基因的鉴定编码幽门螺杆菌生长和生存所必需的蛋白的核酸是优选的药物靶。可以采用相关领域技术人员已知的技术,通过检查缺失和/或中断基因(即通过所谓的基因“失效(knockout)”)的效应,测试幽门螺杆菌基因与该生物的生物相关性。可以以这种方式鉴定必需基因。
菌株特异性序列由于不同幽门螺杆菌菌株之间的进化关系,相信本文公开的幽门螺杆菌序列可用来鉴定和/或分辨先前已知的和新的幽门螺杆菌菌株。相信其它幽门螺杆菌菌株与本文公开的序列将表现出至少70%的序列同源性。得自含幽门螺杆菌菌株样品的DNA序列的系统分析和常规分析、以及与本发明序列的比较,使得可以鉴定可以用来鉴别菌株的序列以及所有幽门螺杆菌菌株所共有的序列。在一个实施方案中,本发明提供鉴别不同幽门螺杆菌菌株的核酸(包括探针)和肽和多肽序列。菌株特异性组分也可以通过它们诱出或与选择性识别一种或多种幽门螺杆菌菌株的抗体反应的能力而进行功能鉴定。
在另一实施方案中,本发明提供所有幽门螺杆菌菌株所共有、但在其它细菌菌种中未发现的核酸(包括探针)以及肽和多肽序列。具体实施例测定用于抗体和疫苗开发的候选蛋白抗原用于疫苗开发的候选蛋白抗原的选择可以来自编码幽门螺杆菌多肽的核酸。首先,可以分析该ORF与其它已知输出蛋白或跨膜蛋白的同源性,采用Klein等(Klein,P.,Kanehsia,M.和DeLisi,C.(1985)Biochimica et Biophysica Acta 815,468-476)所述的判别分析进行分析,以预测输出蛋白和跨膜蛋白。
可以采用Wisconsin序列分析软件包(Genetics Computer Group,University Research Park,575 Science Drive,Madison,WI 53711)中含有BLAST算法,将每个预测的ORF的氨基酸序列与当前GenBank、SWISS-PROT和PIR数据库中发现的所有序列比较,进行同源性检索。BLAST检索该ORF和数据库序列之间的局部序列对比,并报告一个可能性得分,表明在该数据库中偶然发现该序列的可能性。与膜蛋白或输出蛋白具有显著同源性(例如同源性仅由于随机机遇的可能性低于1×10-6)的ORF代表用于疫苗开发的蛋白抗原。根据与其它生物中克隆的基因的序列同源性,可以将可能的功能提供给幽门螺杆菌基因。
判别分析(Klein等,见上文)可以用来检查所述ORF的氨基酸序列。该算法使用ORF氨基酸序列中含有的特有信息,并将其与得自已知膜蛋白和输出蛋白的性质的信息进行比较。这种比较预测哪些蛋白将为输出蛋白、膜相关蛋白或胞质蛋白。由该算法鉴别为输出的或膜相关的OFR氨基酸序列可能是用于疫苗开发的蛋白抗原。
表面暴露的外膜蛋白可能代表提供对幽门螺杆菌的保护性免疫应答的最佳抗原。在可以用来协助预测这些外膜蛋白的算法中,包括在其C末端存在两亲性β-折叠区。已经在革兰氏阴性菌的大量外膜蛋白中检测的该区,通常特征为大约于C末端的1、3、5、7和9位的疏水性残基(Phe或Tyr)。重要的是,这些序列尚未在周质蛋白的C末端检测到,因此提供基于一级序列数据的这些蛋白类别之间的初步区别。Struyve等(J.Mol.Bio.218141-148,1991)先前已经报道了该现象。
图1也描述了在幽门螺杆菌的许多外膜蛋白中发现的另外的氨基酸序列基元。图1中的氨基酸序列对比描述了有其氨基酸序列识别号标记的5种幽门螺杆菌蛋白序列的部分,从左至右显示N末端至C末端。发现6个区别框(标记A-F)的相似氨基酸残基,包括常常发现于外膜蛋白C末端附近位置的特殊疏水性残基(Phe或Tyr;根据氨基酸残基的单字母密码为F或Y)。几种共享基元的存在清楚地确立了该组蛋白成员之间的相似性。
另外,从幽门螺杆菌分离的外膜蛋白常常共享成熟N末端(即加工除去分泌信号后)附近的一个基元,如在图2的框注氨基酸残基中描述的。图2描述了3种幽门螺杆菌蛋白的N末端部分(由其氨基酸序列识别号标示,并从左至右显示N末端至C末端)。
本领域技术人员已知,这些共享的序列基元是非常重要的,并确立了该组蛋白中的相似性。
很少不可能辨别该核酸序列中给定位置的多个可能的核苷酸。在那些情况下,如下通过扩增的字母表示这些不确定性(ambiguity)这些是法定的IUPAC-IUB单字母碱基密码密码 碱基描述G鸟嘌呤A腺嘌呤T胸腺嘧啶C胞嘧啶R嘌呤 (A或G)Y嘧啶 (C或T或U)M氨基 (A或C)K酮(G或T)S强相互作用(C或G)W弱相互作用(A或T)H非G (A或C或T)B非A (C或G或T)V非T(非U) (A或C或G)D非C (A或G或T)N任一种(A或C或G或T)本发明的氨基酸翻译通过将多义密码子翻译为字母“X”,说明核酸序列中的不确定性。在所有情况下,根据基于标准遗传密码子的核酸序列的检查,在一位置上的允许氨基酸残基是清楚的。V.幽门螺杆菌核酸和多肽的片段和类似物的产生根据序列表中提供的本发明的幽门螺杆菌基因产物的发现,本领域技术人员可以例如通过产生片段或类似物,改变公开的结构(幽门螺杆菌基因的结构),并测试所述新产生的结构的活性。下面讨论相关领域技术人员已知允许产生并测试片段和类似物的技术的实施例。这些方法或类似方法可以用来制备多肽文库,例如随机肽文库或细胞蛋白的片段或类似物文库,并根据其结合幽门螺杆菌多肽的能力进行筛选。这类筛选用来鉴定幽门螺杆菌的抑制剂。片段的产生可以以几种方式,例如重组、蛋白水解消化或化学合成,产生蛋白的片段。可以通过除去编码该多肽的核酸一端(用于末端片段)或两端(用于内部片段),产生多肽的内部片段或末端片段。诱变的DNA的表达产生多肽片段。用“末端一点一点地切下”的内切核酸酶消化由此可以产生编码一系列片段的DNA。编码蛋白片段的DNA也可以通过随机剪切、限制性消化或上述方法的组合而产生。
也可以采用本领域已知的技术,诸如常规Merrifield固相F-Moc或t-Boc化学法,化学合成片段。例如,可以将本发明的肽任意分为没有片段重叠的所需长度的片段,或分为所需长度的重叠片段。核酸和多肽的改变随机方法可以通过随机诱变编码蛋白或蛋白特定域或特定区的DNA,制备蛋白的氨基酸序列变异体。有用的方法包括PCR诱变和饱和诱变(saturation mutagenesis)。也可以通过合成一组简并寡核苷酸序列,产生随机氨基酸序列变异体文库。(筛选变异体文库中的蛋白的方法在本文其它地方)。
(A)PCR诱变在PCR诱变中,可以用减低的Taq聚合酶保真度将随机突变引入DNA的克隆片段中(Leung等,1989,Technique 111-15)。采用聚合酶链式反应(PCR),在降低Taq DNA聚合酶DNA合成的保真度的条件下,例如通过采用dGTP/dATP之比为5并将Mn2+加入PCR反应中,扩增待诱变的DNA区。将扩增的DNA片段库插入合适的克隆载体中,以提供随机突变体文库。
(B)饱和诱变饱和诱变允许将大量的单碱基置换快速引入克隆的DNA片段中(Mayers等,1985,Science 229242)。该技术包括例如通过体外化学处理或辐射单链DNA产生突变,并合成互补DNA链。可以通过调节处理强度调节突变频率,可以获得基本上所有可能的碱基置换。因为该方法不涉及突变体片段的遗传选择,所以获得中性置换以及改变功能的置换。点突变的分布不偏向保守序列基元。
(C)简并寡核苷酸也可以由一组简并寡核苷酸序列产生同源物(homolog)文库。可以在自动DNA合成仪中进行简并序列的化学合成,然后将合成的基因连接入合适的表达载体。简并寡核苷酸的合成是本领域已知的(参见例如Narang,SA(1983)Tetrahedron 393;Itakura等(1981)Recombinant DNA,Proc 3rd Cleveland Sympos.Macromolecules,编辑AG Walton,AmsterdanElsevier第273-289页;Itakura等(1984)Annu.Rev.Biochem.53323;Itakura等(1984)Science 1981056;Ike等(1983)Nucleic acidRes.11477)。这类技术已经用于其它蛋白的定向进化(参见例如Scott等(1990)Science 249386-390;Roberts等(1992)PNAS 892429-2433;Devlin等(1990)Science 249404-406;Cwirla等(1990)PNAS 876378-6382;以及美国专利第5,223,409号、第5,198,346号和第5,096,815号)。核酸和多肽的改变定向诱变的方法非随机诱变或定向诱变的技术可以用来提供特定的序列或特定区中的突变。这些技术可以用来产生变异体,包括例如蛋白的已知氨基酸序列残基的缺失、插入或取代。可以通过以下步骤单独或系列修饰突变位置(1)用保守氨基酸取代第一个氨基酸,然后根据所得到的结果用多种基团选择进行取代,(2)缺失靶残基,或(3)将同一类或不同类的残基插入邻近定位位置,或选择1-3的组合。
(A)丙氨酸扫描诱变丙氨酸扫描诱变是一种有用的方法,用来鉴别所需蛋白诱变的优选位置或域的某些残基或某些区,Cummingham和Wells(Science 2441081-1085,1989)。在丙氨酸扫描中,鉴别一个残基或一组靶残基(例如带电荷残基,诸如Arg、Asp、His、Lys和Glu),并用一种中性或带负电氨基酸(最优选丙氨酸或多丙氨酸)取代。氨基酸的取代可以影响所述氨基酸与细胞内或外的周围水性环境的相互作用。然后,通过将另外的或其它变异体引入取代位点,精制表现出对取代的功能敏感性的那些域。困此,当预定引入氨基酸序列突变的位点时,不必预定突变本身的性质。例如,为了优化给定位点的突变表现,可以于靶密码子或靶区进行丙氨酸扫描或随机诱变,根据所需活性的最佳组合,筛选表达所需蛋白亚基的变异体。
(B)寡核苷酸介导的诱变寡核苷酸介导的诱变是一种有用的方法,用来制备DNA的置换、缺失和插入变异体,参见例如Adelman等,(DNA 2183,1983)。简而言之,通过将编码一种突变的寡核苷酸与DNA模板杂交,从而改变所需DNA,在此模板为单链形式含有所需蛋白的未改变或天然DNA序列的质粒或噬菌体。杂交后,用DNA聚合酶合成完整的模板第二条互补链,这将由此掺入寡核苷酸引物,并将编码所需蛋白的DNA中选定的改变。通常使用至少长25个核苷酸的寡核苷酸。最适寡核苷酸具有12-15个核苷酸,该寡核苷酸与模板编码该突变的任一端完全互补。这确保该寡核苷酸将正确地与单链DNA模板分子杂交。采用本领域已知的技术,诸如Crea等所述技术(Proc.Natl.Acad.Sci.USA,755765),容易合成所述寡核苷酸。
(C)盒式诱变制备变异体的另一方法盒式诱变基于Wells等所述的技术(Gene,34315)。原材料为包括待突变蛋白亚基DNA的质粒(或其它载体)。鉴定待突变的蛋白亚基DNA中的密码子。在鉴定的突变位点的每一端必须有独特的限制性内切核酸酶位点。如果不存在这类限制性位点,则可以采用上述寡核苷酸介导的诱变方法产生这类限制性位点,以将这些限制性位点引入所需蛋白亚基DNA中的合适位置。将限制性位点引入质粒后,在这些位点切割该质粒,以使其线性化。采用标准方法,合成编码限制性位点之间的DNA序列、但不含有所需突变的双链寡核苷酸。独立合成两条链,然后用标准技术将其杂交在一起。该双链寡核苷酸称为盒。设计该盒,使其具有与该线性化质粒末端相匹配的3’和5’末端,使得它可以直接与该质粒连接。该质粒现在含有突变的所需蛋白亚基的DNA序列。
(D)联合诱变(combinatorial mutagenesis)也可以用联合诱变产生突变体(Ladner等,Wo 88/06630)。在该方法中,对比一组同源物或其它相关蛋白的氨基酸序列,最好以有利于可能的最高同源性。可以选择出现在对比序列给定位置的所有氨基酸,以产生一套简并组合序列。通过核酸水平的联合诱变,产生变异体的花斑文库(Variegated library),并由花斑基因文库编码。例如,可以将合成寡核苷酸的混合物酶促连接入基因序列,使得该套简并潜在序列可以作为单个肽表达,或者作为一套更大的含有该套简并序列的融合蛋白表达。幽门螺杆菌核酸和多肽的其它修饰对于诸如提高溶解度、增强稳定性(例如体外储存期限和对体内蛋白水解降解的抗性)的目的,修饰幽门螺杆菌多肽的结构是合理的。可以产生修饰的幽门螺杆菌蛋白或肽,在这些蛋白或肽中,其氨基酸序列已经例如通过上述的氨基酸取代、缺失或插入而改变。
也可以通过用丙氨酸、丝氨酸、苏氨酸、亮氨酸或谷氨酸残基取代半胱氨酸残基,修饰幽门螺杆菌肽,以便通过二硫键的二聚化最小化。另外,可以化学修饰本发明蛋白片段的氨基酸侧链。另一修饰是肽的环化。
为了增强稳定性和/或反应性,可以修饰幽门螺杆菌多肽,以在该蛋白的氨基酸序列中加入导致中性等位基因突变的一种或多种多态性。另外,可以置换或加入D-氨基酸、非天然氨基酸或非氨基酸类似物,以产生本发明范围内的修饰蛋白。此外,可以按照A.Sehon及其同事(Wie等,见上文)的方法,采用聚乙二醇(PEG)修饰幽门螺杆菌多肽,以产生与PEG缀合的蛋白。另外,PEG可以在该蛋白化学合成中加入。幽门螺杆菌蛋白的其它修饰包括还原/烷基化(Tarr,Mehtods ofProtein Microcharacterization,J.E.Silver编辑,Humana Press,Clifton NJ155-194(1986));酰化(Tarr,见上述);与合适载体化学偶联(Mishell和Shiigi编辑,Selected Methods in Cellular Immunology,WH Freeman,SanFrancisco,CA(1980),美国专利4,939,239;或温和福尔马林处理(Marsh,(1971)Int.Arch.of Allergy and Appl.Immunol.,41199-215)。
为了有利于纯化和潜在性地提高幽门螺杆菌蛋白或肽的溶解性,将氨基酸融合部分加入肽骨架是合理的。例如,可以将六组氨酸加入蛋白中,以通过固定化金属离子亲和层析进行纯化(Hochuli,E.等,(1988)Bio/Technology,61321-1325)。另外,为了有利于分离不含非相关序列的肽,可以在融合部分和该肽序列之间引入特定的内切蛋白酶切割位点。
为了潜在性地有助于幽门螺杆菌多肽中正确的表位抗原加工,可以通过重组方法或合成方法,工程改造包含至少一个表位的各区之间规范的蛋白酶敏感位点。例如,在蛋白或片段的重组构建期间,可以将诸如KK或RR的带电荷的氨基酸对引入蛋白或片段内各区之间。可以赋予产生的肽对组织蛋白酶和/或其它胰蛋白酶样酶(这些酶将产生含有一个或多个表位的蛋白部分)切割的敏感性。另外,这类带电荷的氨基酸残基可以导致该肽的溶解性提高。筛选多肽和类似物的基本方法本领域已知筛选产生的突变基因产物的各种技术。筛选大基因文库的技术通常包括将基因文库克隆入复制型表达载体、用产生的载体文库转化合适的细胞和在检测所需活性的条件下(例如,在该情况下,为结合幽门螺杆菌多肽或相互作用蛋白)表达所述基因,促进相对容易的编码检测其产物的基因的载体的分离。下述的每种技术均适于筛选大量例如通过随机诱变技术产生的序列的高通量分析。
(A)双杂交系统诸如上述系统的双杂交测定(正如本文所述的其它筛选方法一样)可以用来鉴定多肽,例如天然产生的幽门螺杆菌多肽(例如细胞蛋白)或随机产生的结合幽门螺杆菌蛋白的多肽的片段或类似物。(幽门螺杆菌域用作饵蛋白,变异体文库作为鱼融合蛋白表达)。在类似的方式中,双杂交测定(整正如本文所述的其它筛选方法一样)可以用来发现结合幽门螺杆菌多肽的多肽。
(B)呈现文库在筛选测定的一种方法中,候选肽呈现于细胞或病毒颗粒表面,在“淘选测定”中,测定特定细胞或病毒颗粒通过呈现的产物结合合适受体蛋白的能力。例如,该基因文库可以克隆入细菌细胞表面膜蛋白的基因中,通过淘选测定产生的融合蛋白(Ladner等,WO 88/06630;Fuchs等(1991)Bio/Technology 91370-1371;和Goward等(1992)TIBS18136-140)。可以以相似的方式使用可检测标记的配体,为潜在功能肽同源物评分。荧光标记的配体(例如受体)可以用来检测配体保留结合活性的同源物。使用荧光标记配体,使得可在荧光显微镜下肉眼检查并分离细胞,或者在细胞形态允许的情况下通过荧光激活细胞分选仪分离细胞。
基因文库可以作为病毒颗粒表面上的融合蛋白表达。例如,在丝状噬菌体系统中,外源肽序列可以在感染性噬菌体表面上表达,由此提供两个显著的益处。第一,由于这些噬菌体可以以大大超过1013噬菌体/ml的浓度用于亲和基质,因此可以一次筛选大量的噬菌体。第二,由于每个感染性噬菌体在其表面呈现一种基因产物,因此如果从亲合基质以低收率回收特定噬菌体,则可以通过另一轮感染扩增该噬菌体。一组几乎相同的大肠杆菌丝状噬菌体M13、fd.和f1最常用于噬菌体呈现文库。噬菌体gIII或gVIII被膜蛋白中的任一个可以用来产生融合蛋白,而不破坏最终的病毒颗粒的包装。外源表位可以在pIII的NH2末端表达,并从大量过量的缺乏该表位的噬菌体中回收带有该种类表位的噬菌体(Ladner等PCT公布WO 90/02909;Garrard等,PCR公布WO 92/09690;Marks等(1992)J.Biol.Chem.26716007-16010;Griffiths等(1993)EMBO J 12725-734;Clackson等(1991)Nature352624-628;和Barbas等(1992)PNAS 894457-4461)。
一种常用方法使用大肠杆菌的麦芽糖受体(外膜蛋白LamB)作为肽融合伴侣(Charbit等(1986)EMBO 5,3029-3037)。已经将寡核苷酸插入编码LamB基因的质粒中,以产生融合入该蛋白一种胞外回环(loop)中的肽。可利用这些肽结合配体,例如结合抗体,并且当将所述给予动物时可以诱出免疫应答。其它细胞表面蛋白,例如OmpA(Schorr等(1991)Vaccines 91,第387-392页)、PhoE(Agterberg等(1990)Gene 88,37-45)和PAL(Fuchs等(1991)Bio/Tech 9,1369-1372),以及大的细菌表面结构已经用作肽呈现的载体。可以将肽融合于菌毛蛋白,这是一种聚合形成细菌间交换遗传信息的管道-菌毛的蛋白(Thiry等(1989)Appl.Environ.Microbiol.55,984-993)。由于菌毛在与其它细胞相互作用中的作用,它为将肽提呈给胞外环境提供有用的支持。用于肽呈现的另一大表面结构是细菌的运动器官鞭毛。肽与亚基蛋白鞭毛的融合,提供在宿主细胞上许多肽拷贝的致密排列(Kuwajima等(1988)Bio/Tech.6,1080-1083)。其它细菌菌种的表面蛋白也已经用作肽融合伴侣。实例包括葡萄球菌属(Staphylococcus)蛋白A和奈瑟氏球菌属(Neisseria)的外膜IgA蛋白酶(Hansson等(1992)J.Bacteriol.174,4239-4245和Klauser等(1990)EMBO J.9,1991-1999)。
在上述丝状噬菌体系统和LamB系统中,由于其表面携带该肽的颗粒(细胞或噬菌体)内含有编码该肽的DNA,使该肽与该DNA之间发生物理上的联系。捕获该肽即捕获所述颗粒和其中的DNA。另一方案使用DNA结合蛋白LacI,以形成肽和DNA之间的连接(Cull等(1992)PNAS USA 891865-1869)。该系统使用一种质粒,该质粒含有其3’端具有一个寡核苷酸克隆位点的LacI基因。在控制的阿拉伯糖诱导下,产生LacI肽融合蛋白。该融合体保留LacI结合短DNA序列(已知为LacO操纵子(LacO))的能力。通过在表达载体上安装两个拷贝的LacO,LacI-肽融合体紧密地结合于其编码质粒。因为每个细胞中的质粒仅含一个单个的寡核苷酸序列,并且每个细胞仅表达一个单个的肽序列,所以,所述肽变为特异性地并且稳定地与指导其合成的DNA序列结合。温和地裂解该文库的细胞,并将肽-DNA复合物暴露于固定化受体基质,以回收含有活性肽的复合物。结合的质粒DNA然后再引入细胞中,以进行扩增并进行DNA测序,以确定所述肽配体的身份。作为该方法实际用途的证明,制备大的十二肽的随机文库,并在产生的抗阿片样肽强啡肽B的单克隆抗体上进行选择。回收一组(cohort)肽,即所有因对应于强啡肽B的六残基部分的共有序列而相关的肽。(Cull等(1992)Proc.Natl.Acad.Sci.U.S.A.89-1869)。
该方案有时称为质粒的肽,在两个重要的方面不同于噬菌体呈现方法。第一,所述肽连接于该融合蛋白的C末端,导致该文库成员作为具有游离羧基末端的肽呈现。两种丝状噬菌体被膜蛋白pIII和pVIII均通过其C末端锚定于该噬菌体,并且所述客肽(guest peptide)置入向外延伸的N末端域中。在某些设计中,噬菌体呈现的肽呈现在融合蛋白氨基末端的右边。(Cwirla等(1990)Proc.Natl.Acad.Sci.U.S.A.87,6378-6382)。第二个差异是影响文库中实际存在的肽群体的一组生物学偏差(biological bias)。LacI融合分子限制在宿主细胞的胞质中。在翻译期间,所述噬菌体被膜融合体短暂地暴露于细胞,但迅速地通过内膜分泌到周质区室内,通过其C末端疏水域保持锚定于质膜内,而含有所述肽的N末端突出到周质中,同时等待装配为噬菌体颗粒。LacI和噬菌体文库中的肽由于它们暴露于不同的蛋白水解活性,因此可能显著不同。噬菌体被膜蛋白需要跨内膜转运和作为加入噬菌体序曲的信号肽酶加工。某些肽对这些加工施加有害的影响,并在文库中代表性不足(Gallop等(1994)J.Med.Chem.37(9)1233-1251)。这些特定的倾向性不是LacI呈现系统中的因子。
重组随机文库中可利用的小肽数目是庞大的。通常制备107-109个独立克隆的文库。已经产生了大至1011个重组体的文库,但这种大小接近克隆文库的实际极限。文库大小的这种限制在含有随机化区段的DNA转化入宿主细菌细胞的步骤时发生。为了避开这种限制,最近已经开发出一种基于多核糖体复合物中新生肽呈现的体外系统。该呈现文库方法具有产生比目前可获得的噬菌体/噬菌粒文库或质粒文库高3-6个数量级的文库。此外,所述文库的构建、肽的表达和筛选以完全无细胞形式进行。
在该方法的一个应用中(Gallop等(1994)J.Med.Chem.37(9)1233-1251),构建了编码1012种十肽的分子DNA文库,该文库在大肠杆菌S30体外偶联转录/翻译系统中表达。选择条件,以将核糖体安装在mRNA上,使得大比例的RNA在多核糖体中积累,并产生含仍连接于其编码RNA的新生肽的复合物。所述多核糖体强壮得足以以同筛选更常规的重组肽呈现文库几乎相同方式,在固定化受体上进行亲和纯化。结合复合物的RNA可以回、转化成cDNA、用PCR扩增产生下一轮合成和筛选的模板。多核糖体呈现方法可以与噬菌体呈现系统偶联。在几轮筛选后,将来自富含多核糖体库的cDNA克隆入噬菌粒载体。该载体既用作肽表达载体呈现融合至被膜蛋白的肽,又用作肽鉴定的DNA测序载体。通过在噬菌体表达多核糖体衍生肽,可以继续该形式的亲和选择步骤,或在各个克隆上分析所述肽在噬菌体ELISA中的结合活性、或分析其在完全噬菌体ELISA(Barret等(1992)Anal.Biochem 204,357-364)中的结合特异性。为了鉴定所述活性肽的序列,人们可以对噬菌粒宿主产生的DNA进行测序。多肽和类似物的第二次筛选在上述高通量测定后,可以进行第二次筛选,以便进一步鉴别生物活性,这使得本领域技术人员能够区别激动剂和拮抗剂。所用的第二次筛选的类型将取决于需要测试的所需活性。例如,可以开发一种测定,其中抑制目的蛋白及其各自配体之间相互作用的能力,可以用来从一组通过上述第一次筛选分离的肽片段鉴别拮抗剂。
因此,产生片段和类似物并测试它们的活性的方法是本领域已知的。一旦鉴别出目的核心序列,则获得类似物和片段对于本领域技术人员而言是常规技术。幽门螺杆菌多肽的肽模拟物本发明也提供主题幽门螺杆菌多肽的蛋白结合域的还原,以产生模拟物,例如肽因子或非肽因子。所述肽模拟物例如在幽门螺杆菌多肽结合天然产生的配体的情况下,能够破坏多肽与其反配体的结合。可以确定主题幽门螺杆菌多肽参与多肽分子识别的关键残基,并将其用来产生幽门螺杆菌衍生的竞争性或非竞争性抑制该幽门螺杆菌多肽与互作多肽结合的肽模拟物(参见例如欧洲专利申请EP-412,762A和EP-B31,080A)。
例如,扫描诱变可以用来将特定幽门螺杆菌多肽参与结合互作多肽的氨基酸残基进行作图,可以产生肽模拟物(例如二氮杂或异喹啉衍生物),它们模拟与互作多肽结合中的那些残基,并且因此它们可以抑制幽门螺杆菌多肽与互作多肽的结合,并因此干扰幽门螺杆菌多肽的功能。例如,可以用苯并二氮杂产生这类残基的非可水解肽类似物(例如参见Freidinger等,PeptidesChemistry and Biology,G.R.Marshall编辑,ESCOM PublisherLeiden,Netherlands,1988)、氮杂(例如参见Huffamn等,Peptideschemistry and Biology,G.R.Marshall编辑,ESCOM PublisherLeiden,Netherlands,1988)、取代的γ内酰胺环(Garvey等,Peptideschemistry and Biology,G.R.Marshall编辑,ESCOMPublisherLeiden,Netherlands,1988)、酮-亚甲基假肽(Ewenson等(1986)J Med Chem 29295;和Ewenson等,PeptidesStructure and Function(Proceedings of the 9th American Peptide Symposium)Pierce Chemical Co.Rockland,IL,1985)、β-转折二肽核心(Nagai等(1985)Tetrahedron Lett26647;和Sato等(1986)J Chem Soc Perkin Trans 11231)、以及β-氨基醇(Gordon等(1985)Biochem Biophys Res Commun 126419;以及Dann等(1986)Biochem Biophys Res Commun 13471)。VI.幽门螺杆菌核酸和多肽的疫苗制剂本发明也描述了针对幽门螺杆菌感染进行保护或治疗幽门螺杆菌感染的疫苗组合物或制剂(本文中可互换使用)的特征。本文所用的术语“治疗幽门螺杆菌感染”是指现有的或确立的幽门螺杆菌感染的治疗性治疗。术语“针对幽门螺杆菌感染的保护”或“预防性治疗”是指使用幽门螺杆菌疫苗制剂降低有幽门螺杆菌感染风险的受治疗者的幽门螺杆菌感染的风险或预防幽门螺杆菌感染。在一个实施方案中,所述疫苗组合物含有一种或多种来自幽门螺杆菌的免疫原性组分(诸如表面蛋白)或其片段以及药学上可接受的载体。例如,在一个实施方案中,本发明的疫苗制剂含有至少一种幽门螺杆菌多肽或其片段的或来自相同或不同幽门螺杆菌抗原的幽门螺杆菌多肽或其片段的组合物。用于本发明疫苗制剂中的核酸和幽门螺杆菌多肽,包括序列表中陈述的核酸和多肽,最好是编码表面蛋白的幽门螺杆菌核酸以及表面蛋白或其片段。例如优选用于本发明疫苗组合物中的核酸和幽门螺杆菌多肽选自表1中提出的编码胞外被膜蛋白的核酸和幽门螺杆菌胞外被膜蛋白。然而,编码免疫原性幽门螺杆菌蛋白的任何核酸以及幽门螺杆菌多肽及其部分,均可以用于本发明中。这些疫苗具有治疗和/或预防用途。
本发明的一个方面提供保护抵抗幽门螺杆菌感染的疫苗组合物,包含至少一种幽门螺杆菌蛋白的免疫原性片段和一种药学上可接受的载体。优选的片段包括至少长大约10个氨基酸残基、优选长大约10-20个氨基酸残基、更优选长大约12-16个氨基酸残基的肽。
例如通过筛选由编码全长幽门螺杆菌蛋白的核酸的相应片段重组产生的多肽,可以获得本发明的免疫原性组分。另外,可以采用本领域已知的技术,诸如常规Merrifield固相f-Moc或t-Boc化学,化学合成片段。
在一个实施方案中,根据该肽刺激T细胞的能力鉴定免疫原性组分。通过例如T细胞增殖或细胞因子分泌测定的刺激T细胞的肽,在本文中定义为包含至少一种T细胞表位。相信T细胞表位参与引起变态反应临床症状的蛋白变应原免疫应答的起始和永续性。认为这些T细胞表位在T辅助细胞水平上通过与抗原提呈细胞表面上的合适HLA分子结合,触发早期事件,由此刺激具有该表位的相关T细胞受体的T细胞亚群。这些事件导致T细胞增殖、淋巴因子分泌、局部炎性反应、将其它免疫细胞募集至抗原/T细胞相互作用位点以及导致抗体产生的B细胞级联的激活。T细胞表位是一种基本元件或T细胞受体识别的最小单位,在此所述表位包含受体识别所必需的氨基酸(例如大约6或7个氨基酸残基)。模拟T细胞表位氨基酸序列的氨基酸序列属于本发明范围。
在另一实施方案中,本发明的免疫原性组分通过基因组疫苗接种鉴定。该基本方案基于下述的想法包含所有或部分病原体基因组(例如幽门螺杆菌基因组)的表达文库当用来遗传免疫宿主时,可以提供保护。该表达文库的免疫(ELI)与表达克隆类似,包括在可以用作基因疫苗的质粒中还原病原体(例如幽门螺杆菌)的基因组表达文库。所述质粒也可以设计为编码可以显著刺激体液应答的遗传佐剂。这些遗传佐剂可以在较远位点引入,并且在胞外以及在胞内起作用。
这是一种疫苗生产的新方法,它有活/减毒病原体的许多优点,但没有感染的风险。可以用病原体DNA的表达文库免疫宿主,由此产生活疫苗抗原提呈的效应,而没有风险。例如在本发明中,幽门螺杆菌基因组或粘粒或质粒克隆的随机片段、以及通过基因组测序鉴定的基因的PCR产物,可以用来免疫宿主。该方法的可行性已经用肺支原体(Mycoplasma pulmonis)证明(Brry等,Nature 377632-536,1995),甚至一种啮齿动物的天然病原体肺支原体的部分表达文库提供针对该病原体攻击的保护作用。
ELI是一种技术,它甚至当几乎不了解病原体的生物学时,也允许生产非感染性多分体疫苗,因为ELI使用免疫系统筛选候选基因。一旦分离出这些基因,则它们可以用作基因疫苗,或用于开发重组蛋白疫苗。因此,ELI允许以系统的、主要为机械化方式生产疫苗。
可以采用几种不同测定中的一种或多种,完成筛选免疫原性组分。例如,在体外,通过将已知或怀疑为免疫原性的肽与T细胞培养物中提呈合适MHC分子的抗原提呈细胞接触,测定肽的T细胞刺激活性。结合必需的共同刺激,将结合合适的MHC分子的免疫原性幽门螺杆菌肽提呈给T细胞,具有将信号传送至T细胞的效应,这诱导产生提高水平的细胞因子,特别是白介素-2和白介素-4。可以获得该培养上清液,并测定白介素-2或其它已知的细胞因子。例如,可以使用几种白介素-2常规测定中的任何一种,诸如Proc.Natl.Acad.Sci.USA,861333(1989)中描述的测定方法,该文献的相关部分通过引用结合到本文中。也可用Genzyme Corporation(Cambrige,MA)的干扰素产生测定的试剂盒。
或者,常用的T细胞增殖测定需要测定氚标记的胸苷掺入。可以通过测定掺入培养细胞的复制DNA中的3H标记胸苷的量,体外测定T细胞的增殖。因此,可以定量测定DNA合成速率,再定量测定细胞分裂速率。
含有一种或多种免疫原性组分(例如幽门螺杆菌多肽或其片段或编码幽门螺杆菌多肽的核酸或其片段)的本发明的疫苗组合物或制剂,最好包括一种药学上可接受的载体。术语“药学上可接受的载体”将包括与药物给予相适应的任何一种和所有的溶剂、分散介质、涂料、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。合适的药学上可接受的载体包括例如水、盐水、磷酸缓冲盐溶液、葡萄糖、甘油、乙醇等的一种或多种以及它们的组合物。药学上可接受的载体还可以包括少量的辅助物质,诸如润湿剂或乳化剂、防腐剂或缓冲剂,它们增加幽门螺杆菌核酸和多肽的储存期或效力。对于含有幽门螺杆菌多肽的本发明的疫苗制剂,所述多肽最好与本文所述的合适佐剂和/或传递系统一起给予。
对于本领域技术人员显而易见的是,本发明DNA或蛋白的治疗有效量将特别取决于给药方案、给予的幽门螺杆菌核酸或多肽的单位剂量、该蛋白或核酸是否结合其它治疗剂给予、患者的免疫状况和健康状况以及特定蛋白或核酸的治疗活性。
疫苗制剂通常胃肠外给予,例如通过皮下或肌内注射给予。Wolff等(1990)Science2471465-1468和Sedegah等(1994)Immunology919866-9870描述了肌内免疫的方法。其它给药模式包括口服制剂和肺制剂、栓剂和经皮给药。相对于胃肠外方法,口服免疫是诱导抵抗幽门螺杆菌感染的保护作用的优选方法。Czinn等(1993)Vaccine11637-642。口服制剂包括这类通常使用的赋形剂,诸如药用级甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素、碳酸镁等等。
在一个实施方案中,该疫苗制剂包括作为药学上可接受载体的佐剂。用于本发明疫苗制剂中的合适佐剂的实例包括但不限于,氢氧化铝;N-乙酰-胞壁酰-L-苏氨酰基-D-异谷氨酰胺(thr-MDP);N-乙酰-nor-胞壁酰-L-丙氨酰基-D-异谷氨酰胺(CGP 11637,称为nor-MDP);N-乙酰胞壁酰-L-丙氨酰基-D-异谷氨酰基-L-丙氨酸-2-(1’-2’-二棕榈酰-sn-甘油基-3-羟基磷酰氧基)-乙胺(CGP 19835A,称为MTP-PE);RIBI,含有三种来自细菌的组分;单磷酰脂质A;海藻糖二霉菌酸酯;细胞壁骨架(MPL+TDM+CWS)的2%角鲨烯/Tween 80乳液;以及霍乱毒素。可以使用的其它佐剂是霍乱毒素的无毒衍生物(包括其B亚基)和/或幽门螺杆菌多肽与霍乱毒素或其B亚基、霍乱类菌素原、真菌多糖(包括裂裥菌素)、胞壁酰二肽、胞壁酰二肽的衍生物、佛波醇酯、大肠杆菌的不稳定毒素、非幽门螺杆菌细菌裂解液、嵌段聚合物或皂苷的缀合物或遗传改造的融合体。
在一个实施方案中,该疫苗制剂包括作为药学上可接受载体的传递系统。用于本发明疫苗制剂的合适传递系统包括可生物降解的微囊或免疫刺激复合物(ISCOM)、蜗形物(cochleate)或脂质体、遗传改造的减毒活载体(诸如病毒或细菌)和重组(嵌合)病毒样颗粒(例如蓝舌病毒)。在本发明的另一实施方案中,该疫苗制剂包括一个传递系统和一种佐剂。
人类中的传递系统可以包括保护该抗原免受胃酸性环境损害的肠溶释放胶囊,包含作为融合蛋白的不溶性形式的幽门螺杆菌多肽。本发明疫苗的合适载体为肠溶包衣胶囊和聚交酯-聚乙交酯微球体。合适稀释剂为0.2N NaHCO3和/或盐水。
本发明的疫苗在成人和儿童中可以作为初次预防剂给予,在成功地根除受感染宿主中的幽门螺杆菌后,作为第二次预防给予,或作为治疗剂给予,目的是诱导易感宿主的免疫应答以预防幽门螺杆菌感染。本发明疫苗给予的量可由本领域技术人员容易地确定。因此,关于成人,合适的剂量范围为10μg-10g,最好为10μg-100mg,例如50μg-50mg。成人合适的剂量范围也为5μg-500mg。相似的剂量范围可以用于儿童。
佐剂的用量将取决于所用的佐剂类型。例如,当粘膜佐剂为霍乱毒素时,其合适的用量为5μg-50μg,例如为10μg-35μg。当以微囊形式使用时,该用量将取决于该微囊基质中达到所需剂量的用量。该量的确定在本领域技术人员的技术范围内。
本领域技术人员会认识到,最适剂量或多或少地取决于该患者的体重、疾病、给药途径和其它因素。本领域技术人员也会认识到,根据已知的口服疫苗(诸如基于大肠杆菌裂解液的疫苗)的结果(日剂量为6mg,直至总剂量为540mg)和产肠毒素大肠杆菌纯化抗原的结果(4个剂量的1mg)(Schulman等,J.Urol.150917-921(1993));Boedecker等,American Gastroenterological Assoc.999A-222(1993)),可以获得合适的剂量水平。给药次数取决于疾病、制剂和来自临床试验的效力数据。对治疗过程不设计任何限制,对于1个月的初次免疫时间表,该治疗可以给予3-8次(Boedeker,American Gastroenterological Assoc.888A-222(1993))。
在一个最佳实施方案中,本发明的疫苗组合物可以基于杀伤的全大肠杆菌制剂(具有大肠杆菌表面上表达本发明的幽门螺杆菌蛋白的免疫原性片段),或它可以基于大肠杆菌裂解液,其中杀伤的大肠杆菌用作载体或佐剂。
对本领域技术人员显而易见的是,某些本发明的疫苗组合物可仅用来预防幽门螺杆菌感染,某些疫苗组合物可以仅用来治疗幽门螺杆菌感染,某些疫苗组合物可用来既预防又治疗幽门螺杆菌感染。在一个最佳实施方案中,本发明的疫苗组合物通过刺激针对幽门螺杆菌的体液和/或细胞介导的免疫,提供抵抗幽门螺杆菌感染的保护作用。应该理解,减轻幽门螺杆菌感染的任何症状是所需的临床目标,包括减少用来治疗幽门螺杆菌引起的疾病的药物剂量,或增加患者血清或粘膜中抗体的产生。VII.与幽门螺杆菌多肽反应的抗体本发明也包括与主题幽门螺杆菌多肽特异性反应的抗体。可以采用标准方案(参见例如Harlow和Lane编辑的AntibodiesA LaboratoryManual(Cold Spring Harbor Press,1988))生产抗蛋白/抗肽抗血清或单克隆抗体。诸如小鼠、仓鼠或兔子的哺乳动物可以用免疫原性形式的该肽免疫。赋予蛋白或肽免疫原性的技术包括与载体缀合或其它本领域已知的技术。主题幽门螺杆菌多肽的免疫原性部分可以在佐剂存在下给予。可以通过检测血浆或血清中的抗体效价,监测免疫进程。可以用标准ELISA或其它免疫测定与作为抗原的免疫原,评价抗体水平。
在一个最佳实施方案中,主题抗体对于本发明的幽门螺杆菌抗原决定簇为免疫特异性的,所述抗原决定簇例如为序列表中含有的本发明多肽的抗原决定簇、或密切相关的人类或非人类哺乳动物同源物(例如90%同源,更优选至少95%)。在再一本发明的最佳实施方案中,抗幽门螺杆菌抗体与例如与序列表中含有的本发明序列的同源性低于80%的蛋白基本上不交叉反应(即,特异性反应)。“基本上不交叉反应”是指该抗体对非同源性蛋白的结合亲和力低于对序列表中含有的本发明蛋白的结合亲和力的10%,更优选低于5%,甚至更优选低于1%。在一个最优选的实施方案中,在细菌和哺乳动物抗原之间没有交叉反应性。
本文所用的术语抗体计划包括也与幽门螺杆菌多肽特异性反应的抗体的片段。可以采用常规技术将抗体片段化,并如用于全抗体所述的相同方式,根据其用途筛选片段。例如,F(ab’)2片段可以用胃蛋白酶处理抗体而产生。可以处理产生的F(ab’)2片段,以还原二硫键,产生Fab’片段。本发明的抗体还计划包括具有抗幽门螺杆菌部分的双特异性嵌合分子。
针对幽门螺杆菌多肽或幽门螺杆菌多肽变异体的单克隆抗体和多克隆抗体(Ab)以及诸如Fab’和F(ab’)2的抗体片段,可以通过微注射本发明的抗幽门螺杆菌多肽抗体,用来阻断幽门螺杆菌多肽的作用,并且使得可以研究特定的本发明幽门螺杆菌多肽在异常或不想要的胞内信号发送、以及幽门螺杆菌正常细胞功能中的作用。
特异性结合幽门螺杆菌表位的抗体也可以用来对组织样品进行免疫组织化学染色,以便评价幽门螺杆菌抗原的丰度和表达型式。抗幽门螺杆菌多肽抗体可以在诊断上用于免疫沉淀和免疫印迹分析,以作为临床测试方法一部分检测和评价组织或体液中的幽门螺杆菌水平。同样,监测个体中幽门螺杆菌多肽水平的能力可以允许检测给定治疗方案对于惠有这种疾病的个体的效力。可以在体液(诸如尿样)中发现的细胞中测定幽门螺杆菌多肽的水平,或可以在诸如胃活检产生的组织中测定。采用抗幽门螺杆菌抗体的诊断测定可以包括例如设计有助于早期诊断幽门螺杆菌感染的免疫测定。本发明也可以用作使用特异性幽门螺杆菌抗原检测样品中含有的抗体的方法,其中所述样品来自该细菌感染的个体。
本发明的抗幽门螺杆菌多肽抗体的另一应用,是免疫筛选在诸如λgt11、λgt18-23、λZAP和λORF8的表达载体中构建的cDNA文库。该类型的信使文库具有插入正确读框和以正确方向插入的编码序列,可以产生融合蛋白。例如λgt11将产生其氨基末端包含β-半乳糖苷酶氨基酸序列、其羧基末端包含外源多肽的融合蛋白。然后,例如当使由受感染平板影印的硝酸纤维素滤膜与抗幽门螺杆菌多肽抗体反应时,可以用抗体检测主题幽门螺杆菌多肽的抗原表位。然后,可以从受感染平板分离用该测定评分的噬菌体。因此,可以检测幽门螺杆菌基因同源物的存在,并将其由其它物种中克隆,可以检测并克隆其它的同种型(包括剪接变异体)。VIII.含有本发明核酸、多肽或抗体的试剂盒本发明的核酸、多肽和抗体可以与其它试剂和物品组合,形成试剂盒。用于诊断目的的试剂盒通常包括小瓶或其它合适容器中的所述核酸、多肽或抗体。试剂盒通常包括其它试剂,以进行杂交反应、聚合酶链式反应(PCR)或用于重建冻干组分,诸如水性介质、盐、缓冲液等。试剂盒也可以包括用于样品加工的试剂,诸如去垢剂、离液盐等。试剂盒也可以包括固定化试剂,诸如颗粒、支持体、孔、浸棒(dipstick)等。试剂盒也可以包括标记工具,诸如染料、显色试剂、放射性同位素、荧光剂、发光或化学发光剂、酶、嵌入剂等。用本文提供的核酸序列和氨基酸序列信息,本领域技术人员可以容易地装配试剂盒,以用于其特定目的。试剂盒还可以包括使用说明。IX.采用幽门螺杆菌多肽的药物筛选测定通过制备可用的纯化和重组的幽门螺杆菌多肽,本发明提供可以用来筛选药物的测定,其中所述药物或者为正常细胞功能(在该情况下,为主题幽门螺杆菌多肽)或其在细胞信号发送中作用的激动剂或拮抗剂。这类抑制剂或增效剂可以用作新的抵抗人类幽门螺杆菌感染的治疗剂。种类繁多的测定形式会满足需要,并且根据本发明,技术人员会充分了解这些测定形式。
在测试化合物和天然提取物文库的许多药物筛选中,需要高通量测定,以便使在给定的时间内研究的化合物数目最大化。在诸如可以得自纯化或半纯化蛋白的无细胞系统中进行的测定,常常优选作为“初次”筛选,因为可以产生它们以使得可以快速开发,并相对容易地检测分子靶中由受试化合物介导的改变。此外,受试化合物的细胞毒性和/或生物利用度在体外系统中一般可以忽略,而该测定主要集中在该药物对分子靶的效应,如可能表现在与其它蛋白的结合亲和力的改变或分子靶酶性质的改变。因此,在一个本发明例举的筛选测定中,使该目的化合物与分离和纯化的幽门螺杆菌多肽接触。
可以用纯化的幽门螺杆菌多肽及其片段,诸如具有酶活性的幽门螺杆菌多肽,在体外构建筛选测定,使得该多肽的活性产生可检测的反应产物。可以通过从采用受试化合物的各种浓度获得的数据产生剂量反应曲线,评价该化合物的效力。此外,可以进行对照测定,以提供比较基线。合适的产物包括例如具有特殊吸收、荧光或化学发光性质的那些产物,因为检测可以容易地自动进行。在该测定中可以测试种种合成或天然存在的化合物,以鉴别那些抑制或增强该幽门螺杆菌多肽的活性。这些活性化合物中的某些可以直接地、或通过化学改变促进膜通透性或溶解性,也在活的全幽门螺杆菌细胞中抑制或增强相同的活性(例如酶活性)。
通过以下实施例进一步说明本发明,这些实施例不应解释为限制性的。该申请中引用的所有参考文献和公开的专利申请内容均通过引用结合到本文中。
范例I.幽门螺杆菌DNA的克隆和测序按照Schleif R.F.和Wensink P.C.,Practical Methods in MolecularBiology,第98页,Springer-Verlag,NY.,1981概述的基本DNA方案,进行一点修改,分离幽门螺杆菌染色体DNA。简而言之,将细胞沉淀,重悬浮于TE(10mM Tris,1mM EDTA,ph 7.6),加入GES裂解缓冲液(5.1M硫氰酸胍,0.1M EDTA,pH 8.0,0.5%N-月桂基肌氨酸)。冷却悬浮液,加入乙酸胺,终浓度为0.2M。DNA首先用氯仿抽提,然后用苯酚-氯仿抽提,再用氯仿抽提。用异丙醇沉淀DNA,用70%EtOH洗涤2次,干燥并重悬浮于TE中。
分离后,将完整的基因组幽门螺杆菌DNA雾化(Bodenteich等,Automated DNA Sequencing and Analysis(J.C.Venter编辑),AcademicPress,1994)为2000bp的平均大小。雾化后,将所述DNA浓缩,并在标准1%琼脂糖凝胶上分离。从凝胶上切下对应于大小大约为900-1300bp、1300-1700bp、1700-2200bp、2200-2700bp的几个部分,通过GeneClean方法(Bio101,Inc.)纯化。
然后用T4 DNA聚合酶将纯化的DNA片段平端化。然后将愈合的DNA与以100-1000倍过量的独特BstXI接头连接物连接。这些接头与BstXI切割的pMPX载体互补,而突出端不是自身互补的。因此,所述接头不会连环化,切割的载体自身也不容易重连接。在1%琼脂糖凝胶上将接头连接的插入片段与未掺入的接头分离,并用GeneClean纯化。然后将接头连接的插入片段连接于20种pMPX载体中的每一种,以构建一系列“鸟枪”亚克隆文库。所述载体在克隆位点含有框架外的LacZ基因,在克隆连接物-二聚体的事件中变为符合读框,使得这些载体避免其蓝色。
所有随后的步骤均基于Church G.M.和Kieffier-Higgins S.,Science240185-188,1988概述的多重DNA测序方案。仅突出了对所述方案的主要修改。简而言之,将20种载体中的每一种转化入DH5α感受态细胞(Gibco/BRL,DH5α转化方案)。通过平板接种于含有氨苄青霉素、二甲氧基苯青霉素和IPTG/Xgal的抗生素平板,评估文库。所述平板于37℃培养过夜。然后使用成功的转化体将克隆铺平板,并合并为多重库。挑出所述克隆,合并于40ml生长培养基中。培养物于37℃生长过夜。采用Qiagen Midi-prep试剂盒和Tip-100柱(Qiagen,Inc.)纯化DNA。以该方式,每个库获得100μg DNA。产生15个96孔板DNA,获得5-10倍的序列丰余,假定平均读码长度(read-lenght)为250-300个碱基。
然后,采用基于化学降解法的多重DNA测序(Church G.M.和Kieffer-Higgins S.,Sicence 240185-188,1988),或用Sequithrem(Epicenter Technologies)的双脱氧测序方案,对这些纯化的DNA样品测序。将测序反应物电泳分离,通过从40cm凝胶上的直接转移电泳(Richterich P.和Church G.M.,Methods in Enzymology 218187-222,1993),或通过电印迹(church,见上述),转移到尼龙膜上。每块凝胶电泳24个样品。通过化学测序,获得45个成功的膜,通过双脱氧测序,产生8个成功的膜。通过暴露于紫外光,将所述DNA共价结合于所述膜上,并与同所述载体上的标记序列互补的标记寡核苷酸杂交(Church,见上述)。洗涤所述膜,以清洗去非特异性结合的探针,对X胶片曝光,以显现各个序列梯。放射自显影后,通过于65℃温育,除去杂交的探针,用另一标记序列重复杂交循环,直至对于化学测序膜,该膜已经用探针探测38次,而对于双脱氧测序膜,该膜已经探测10次。因此,每块凝胶产生大量的膜,每个膜含有新的测序信息。无论何时加工新的印迹,均是对加入每个库种的内标序列进行初次的探测。
用激光扫描光密度计(Molecular Dynamics,Sunnyvale,CA)产生所述薄膜的数字图象。在计算机工作站(VaxStation 4000’s),采用程序REPLICATM(Church等,Automated DNA Sequencing and Analysis(J.C.Venter编辑),Academic Press,1994),加工所述数字化图象。图象加工包括使泳道直化、调整对比度以平滑掉亮度差以及通过叠代高斯去卷积提高分辨率。然后在REPLICATM中自动挑出序列,在储存于项目数据库之前显示用于交互校读。通过快速可见扫描薄膜图象,然后用鼠标在显示的图象条带上单击以修饰碱基调入,完成校读。因为包括基因组DNA同一部分的多重序列读码提供用于编辑的足够的序列丰余性,所以可以检测到并校正许多序列错误。每个序列自动接受一个识别编号(对应于微量滴定板、探针信息和泳道组号)。该编号用作该序列的永久识别号,因此,它通常可以鉴别任何特定序列的来源,而不用求助于特定的数据库。
采用程序FALCON(Church,Church等,Automated DNA Sequencingand Analysis(J.C.Venter编辑),Academic Press,1994)进行幽门螺杆菌序列的常规装配。该程序已证明对于大多数序列是快速而可靠的。用Genetics Computer Group(GCG)开发的、与REPLICATM交互的修改版本的GelAssemble(Deverux等,Nucleic Acid Res.12387-95,1984),显示装配的重叠群。这供给集成编辑器,允许从REPLICATM数据库种瞬时调出多重序列凝胶图像,并显示以允许快速扫描重叠群,并校读在装配中在不同序列读码之间发生偏差的凝胶痕迹。II.重组幽门螺杆菌DNA序列的鉴定、克隆和表达为了便于幽门螺杆菌膜蛋白和分泌蛋白的克隆、表达和纯化,选择一个强有力的基因表达系统pET系统(Novagen),用于在大肠杆菌种克隆和表达重组蛋白。此外,还将编码肽标记His标记的一个DNA序列融合于目的DNA序列的3’端,以便有助于纯化所述重组蛋白产物。选择3’端进行融合,以便避免任何5’末端信号序列的改变。上述的例外是ppiB,这是一个在表达研究中用作对照而克隆的基因。在该项研究中,幽门螺杆菌ppiB的序列含有一个融合于所述全长基因5’端、编码His标记的DNA序列,因为该基因的蛋白产物不含有信号序列,并作为胞质蛋白表达。含有幽门螺杆菌J99菌株膜蛋白和分泌蛋白的ORF的DNA序列的PCR扩增和克隆制备选择用于从幽门螺杆菌J99菌株克隆的序列(来自本发明的DNA序列表),用于通过聚合酶链式反应(PCR)扩增克隆。设计和购买对于可读框(ORF)5’和3’端特异的合成寡核苷酸引物(GibcoBRL LifeTechnologies,Gaithersburg,MD,USA)(表3)。设计所有正向引物(对该序列5’端特异的),以在5’末端尽头包含一个NcoI克隆位点,除了HpSeq.4821082,它使用NdeI。设计这些引物,以允许在后接缬氨酸残基和天然幽门螺杆菌DNA序列其余部分编码序列的甲硫氨酸残基起始蛋白翻译。一个例外是幽门螺杆菌序列4821082,其起始甲硫氨酸后紧接天然幽门螺杆菌DNA序列的其余部分。所有的反向引物(对幽门螺杆菌ORF 3’端特异的)均在5’末端尽头包括一个EcoRI位点,以允许将每个幽门螺杆菌序列克隆入pET-29b的读框中。pET-28b载体提供编码另外20个羧基末端氨基酸(在HpSeq.26380318和HpSeq.14640637中仅有19个氨基酸)的序列(包含6个组氨酸残基(于C末端尽头)),包含His标记。如前所述,上述的一个例外是ppiB基因的载体构建。对ppiB基因的5’端特异的合成寡核苷酸引物于其5’末端尽头编码一个BamHI位点,ppiB基因3’端的引物于其5’末端尽头编码一个XhoI位点。
表3用于PCR扩增幽门螺杆菌DNA序列的寡核苷酸引物
由幽门螺杆菌J99菌株(ATCC #55679,由Genome TherapeuticsCorporation,100 Beaver Street,Walthman,MA 02154保藏)制备的基因组DNA用作PCR扩增反应的模板DNA源(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有幽门螺杆菌ORF的DNA序列,将基因组DNA(60纳克)引入含有终体积为100μl的以下物质的反应小瓶中2mM MgCl2、1μM互补并邻接于限定幽门螺杆菌ORF的合成寡核苷酸引物(正向引物和反向引物)、各种三磷酸脱氧核苷酸各0.2mM;dATP、dGTP、dCTP、dTTP和2.5单位热稳定的DNA聚合酶(Amplitaq,RocheMolecular Systems,Inc.,Branchburg,NJ,USA)。采用Perkin ElmerCetus/GeneAmp PCR系统9600热循环仪,使用以下热循环条件获得每种ORF的扩增DNA产物蛋白26054702、蛋白7116626、蛋白29479681、蛋白30100332和蛋白4821082于94℃变性2分钟,2个循环94℃15秒,30℃15秒和72℃1.5分钟23个循环94℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束。蛋白16225006于94℃变性2分钟,25个循环95℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束。蛋白4721061于94℃变性2分钟,2个循环94℃15秒,36℃15秒和72℃1.5分钟23个循环94℃15秒,60℃15秒和72℃1.5分钟反应于72℃6分钟结束。蛋白26380318于94℃变性2分钟,2个循环94℃15秒,38℃15秒和72℃1.5分钟23个循环94℃15秒,62℃15秒和72℃1.5分钟反应于72℃6分钟结束。蛋白14640637于94℃变性2分钟,2个循环94℃15秒,33℃15秒和72℃1.5分钟30个循环94℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束。扩增幽门螺杆菌ppiB的条件于94℃变性2分钟,2个循环94℃15秒,32℃15秒和72℃1.5分钟25个循环94℃15秒,56℃15秒和72℃1.5分钟反应于72℃6分钟结束。
完成热循环反应时,洗涤每个扩增DNA样品,并采用QiaquickSpin PCR纯化试剂盒(Qiagen,Gaithersburg,MD,USA)纯化。所有扩增的DNA样品经过用限制性内切核酸酶NcoI和EcoRI(New EnglandBioLabs,Beverly,MA,USA)消化,或在HpSeq.48210182(SEQ ID NO1309)的情况下,用NdeI和EcoRI消化(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后,DNA样品在1.0%NuSeive(FMC BioProducts,Rockland,ME USA)琼脂糖凝胶上电泳。通过暴露于溴化乙锭和长波UV辐射,使DNA显现。从琼脂糖凝胶分离的胶片中含有的DNA,用Bio 101 GeneClean试剂盒方案(Bio 101 Vista,CA,USA)纯化。将幽门螺杆菌DNA序列克隆入pET-28b原核表达载体中制备pET-28b载体用于通过用NcoI和EcoRI消化克隆,或在幽门螺杆菌蛋白4821082的情况下,用NdeI和EcoRI消化(CurrentProtocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。在克隆ppiB时,使用pET-28a载体并制备克隆位点,以用于ppiB基因通过用BamHI和XhoI限制性内切核酸酶消化进行克隆,其中pET-28a载体编码一个His标记,该标记融合于插入基因的5’端。
消化后,将DNA插入片段克隆入(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)预先消化的pET-28b表达载体中,除去扩增的ppiB插入片段,将其克隆入pET-28a表达载体中。然后如上所述用连接反应产物转化大肠杆菌BL21菌株(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。用重组质粒转化感受态细菌按照标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),用携带克隆幽门螺杆菌序列的重组pET表达质粒转化大肠杆菌菌株BL21或大肠杆菌菌株BL21(DE3)的感受态菌。简而言之,将1微升连接反应物与50微升电感受态(electrocompetent)细胞混合,经过高压脉冲处理,此后,样品于0.45毫升SOC培养基(0.5%酵母提取物、2.0%胰蛋白胨、10mM NaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖)、37℃振荡培养1小时。然后将样品涂布在含有25微克/ml硫酸卡那霉素的LB琼脂平板上生长过夜。如上所述挑出并分析BL21的转化菌落,以评价克隆插入片段。携带幽门螺杆菌序列的重组pET表达质粒的鉴定采用用于初始PCR扩增克隆反应中对各个幽门螺杆菌序列特异的相同正向和反向引物,通过克隆的插入片段的PCR扩增,分析用重组pET-28b-幽门螺杆菌ORF转化的各个BL21克隆。成功的扩增证实,幽门螺杆菌序列加入该表达载体中(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。由BL21转化体分离和制备质粒DNA挑出携带正确克隆的幽门螺杆菌ORF的重组pET-28b载体的各个克隆,于加有25微克/ml硫酸卡那霉素的5ml LB液体培养基中培养过夜。第二天,分离质粒DNA,并采用Qiagen质粒纯化方法(Qiagen Inc.,Chatsworth,CA,USA)纯化。重组幽门螺杆菌序列在大肠杆菌中的表达可以在任何大肠杆菌K-12菌株(例如HMS174、HB101、JM109、DH5等)中繁殖pET载体,用于克隆或质粒制备。用于表达的宿主包括含有一个T7 RNA聚合酶基因的染色体拷贝的大肠杆菌菌株。这些宿主是携带lacI基因、lacUV5启动子和T7 RNA聚合酶基因的噬菌体DE3、λ衍生物的溶原体。通过加入异丙基-B-D-硫代半乳糖苷(IPTG)诱导T7 RNA聚合酶,T7 RNA聚合酶转录携带一个T7启动子和目的基因的任何靶质粒,诸如pET-28b。所用的菌株包括BL21(DE3)(Studier,F.W.,Rosenberg,A.H.,Dunn,J.J.和Dubendorff,J.W.(1990)Meth.Enzymol.185,60-89)。
为了表达重组幽门螺杆菌序列,用50纳克按上述分离的质粒,如上所述DNA转化感受态BL21(DE3)细菌(由Novagen作为pET表达系统试剂盒的一部分提供)。LacZ基因(β-半乳糖苷酶)在所述幽门螺杆菌重组构建物的pET系统中表达。转化细胞于SOC培养基中培养1小时,然后将培养物在含有25微克/ml硫酸卡那霉素的LB平板上铺平板。第二天,合并细菌菌落,于含有硫酸卡那霉素(25微克/ml)的LB培养基中生长至于600nM的光密度为0.5-1.0 O.D.单位,此时,将1mMIPTG加入培养物中3小时,以诱导幽门螺杆菌重组DNA构建物的基因表达。
用IPTG诱导基因表达后,通过在Sorvall RC-3B离心机中以3500×g于4℃离心15分钟,沉淀细菌。将沉淀重悬浮于50毫升冷10mMTris-HCl pH 8.0、0.1M NaCl和0.1mM EDTA(STE缓冲液)中。然后于2000×g、4℃离心20分钟。将湿沉淀称重,并冷冻于-80℃,直至准备用于蛋白纯化。III.从大肠杆菌纯化重组蛋白分析方法采用由氨基酸含量计算的吸光度系数,通过分光光度计定量测定纯化蛋白制剂的浓度(Perkins,S.J.1986 Eur.J.Biochem.157,169-180)。也通过Bradford,M.M.(1976)Anal.Biochem.72,248-254和Lowry,O.H.,Rosebrough,N.,Farr,A.L.和Randall,R.J.(1951)J.Biol.Chem.193,第265-275页的方法,采用牛血清白蛋白作为标准,测量蛋白浓度。
SDS-聚丙烯酰胺凝胶(12%或4.0-25%丙烯酰胺梯度凝胶)购自BioRad(Hercules,CA,USA),并用考马斯亮蓝染色。分子量标记包括兔骨骼肌肌球蛋白(200kDa)、大肠杆菌β-半乳糖苷酶(116kDa)、兔肌磷酸化酶B(97.4kDa)、牛血清白蛋白(66.2kDa)、卵清蛋白(45kDa)、牛碳酸酐酶(31kDa)、大豆胰蛋白酶抑制剂(21.5kDa)、卵清溶菌酶(14.4kDa)和牛抑酶肽(6.5kDa)。1.可溶性蛋白的纯化所有步骤均在4℃进行。将冷冻细胞解冻,重悬浮于5倍体积裂解缓冲液(20mM Tris pH 7.9、0.5M NaCl、具有10%甘油的5mM咪唑、0.1%2-巯基乙醇、200μg/ml溶菌酶、1mM苯甲基磺酰氟(PMSF)和亮抑酶肽、抑酶肽、胃酶抑制剂、L-1-氯-3-[4-甲苯磺酰氨基]-7-氨基-2-庚酮(TLCK)、L-1-氯-3-[4-甲苯磺酰氨基]-4-苯基-2-丁酮(TPCK)和大豆胰蛋白酶抑制剂各10ug/ml)中,并数次通过小体积微量流化装置(M-110S型,Microfluidics International Corporation,Newton,MA)将细胞破碎。用0.1%Brii 35制备匀浆,于100,000×g离心1小时,以产生清澈的上清液(粗提取物)。
通过0.8μm Supor滤器(Gelman Sciences,FRG)过滤后,将粗提取物直接上样于Ni2+次氮基三乙酸酯-琼脂糖(NTA)(Hochuli,E.,Dbeli,H.和Schacheer,A.(1987)J.Chromatography 411,177-184),该柱床体积为5毫升,已在含有10%甘油、0.1%Brij 35和1mM PMSF的裂解缓冲液中预平衡。该柱用含10%甘油和0.1%Brij 35的250ml(50倍床体积)裂解缓冲液洗涤,连续用含有10%甘油、0.05%Brij 35、1mM PMSF和20、100、200和500mM咪唑的裂解缓冲液的顺序步骤洗脱。通过于OD280nM的吸光度监测流分,通过SDS-PAGE分析峰流分。含有该重组蛋白的流分于100mM咪唑洗脱。重组蛋白14640637和蛋白β-半乳糖苷酶(lacZ)和肽基-脯氨酰顺反异构酶(ppiB)合并来自Ni2+-NTA-琼脂糖柱的含有该重组蛋白的流分,然后通过离心过滤(Centriprep-10,Amicon,MA)浓缩为大约5ml,直接上样于180ml Sephacryl S-100 HR凝胶过滤介质柱(1.6×91cm),该柱已于A缓冲液(10mM Hepes,pH 7.5,100mM NaCl,0.1mM EGTA)中平衡,然后在A缓冲液中以18ml/h展开。通过280nm的吸光度鉴定含有该重组蛋白的流分,并通过SDS-PAGE分析。合并流分,并通过离心过滤浓缩。重组蛋白7116626合并来自Ni2+-NTA-琼脂糖柱的含有该重组蛋白的流分,然后对1升透析缓冲液(10mM MOPS pH 6.5、50mM NaCl、0.1mM EGTA、0.02%Brij 35和1mM PMSF)透析过夜。在早上,通过离心除去细小的白色沉淀,将产生的上清液上样于8ml(8×75mm)MonoS高效液相层析柱(Pharmacia Biotechnology,Inc.,Piscataway,NJ,USA),该柱已于含有50mM NaCl的B缓冲液(10mM MOSF,pH 6.5,0.1mM EGTA)中平衡。该柱用10倍床体积的含50mM NaCl的B缓冲液洗涤,用50mlNaCl增加(50-500mM)的线性梯度展开。重组蛋白7116626作为尖峰于300mM NaCl处洗脱。2.从内含体纯化不溶性蛋白以下步骤于4℃进行。将细胞沉淀重悬浮于裂解缓冲液中,所述裂解缓冲液含有10%甘油、200μg/ml溶菌酶、5mM EDTA、1mMPMSF和0.1%巯基乙醇。通过细胞破碎器后,制备产生的含有0.2%脱氧胆酸盐的匀浆,搅拌10分钟,然后以20,000×g离心30分钟。沉淀用含有10%甘油、10mM EDTA、1%Triton X-100、1mM PMSF和0.1%巯基乙醇的裂解缓冲液洗涤,然后用含有1M尿素、1mMPMSF和0.1%2-巯基乙醇的裂解缓冲液洗涤数次。产生的白色沉淀主要由内含体组成,不含破碎的细胞和膜物质。重组蛋白26054702、16225006、30100332、4721061以下步骤于室温下进行。将纯化的内含体溶于20ml 8.0M尿素的裂解缓冲液中,所述裂解缓冲液具有1mM PMSF和1%2-巯基乙醇,于室温温育1小时。离心除去不溶解的物质。将透明的上清液过滤,上样于在8.0M尿素的裂解缓冲液中预平衡的Ni2+-NTA-琼脂糖柱。该柱用250ml(50倍床体积)的含8M尿素、1mM PMSF、0.1%2-巯基乙醇的裂解缓冲液洗涤,并连续用含8M尿素、1mM PMSF、0.1%2-巯基乙醇和20、100、200及500mM咪唑的裂解缓冲液的随后步骤展开。通过OD280nm的吸光度监测流分,并通过SDS-PAGE分析峰流分。含有该重组蛋白的流分于100mM咪唑洗脱。重组蛋白29479681、26380318将含有内含体的沉淀溶解于含有8.0M尿素、1mM PMSF和0.1%2-巯基乙醇的B缓冲液中,于室温温育1小时。通过以20,000×g离心30分钟除去不溶解的物质,将透明的上清液上样于在6M尿素、1mM PMSF、0.1%2-巯基乙醇的B缓冲液中预平衡的15ml(1.6×7.5cm)SP-Sepharose柱。该柱连续用10倍床体积缓冲液洗涤后,用0-500mM NaCl的线性梯度展开。蛋白样品的透析和浓缩通过对含0.5%脱氧胆酸盐(DOC)的Tris缓冲液盐水(TBS;10mMTris pH 8.0,150mM NaCl)透析,如下连续降低尿素浓度6M、4M、3M、2M、1M、0.5M,最后为没有尿素的TBS,从所述蛋白样品中慢慢除去尿素。每个透析步骤于室温至少进行4小时。
透析后,通过用Amicon搅拌槽,加压过滤浓缩样品。用Perkins(1986 Eur.J.Biochem.157,169-180)、Bradford((1976)Anal.Biochem.72,248-254)和Lowry((1951)J.Biol.Chem. 193,第265-275页)的方法,测定蛋白浓度。
采用上述方法纯化的重组蛋白概述于以下表4。
表4
外膜蛋白
周质/分泌蛋白
其它表面蛋白
内膜蛋白
具有His标记的对照蛋白
IV.幽门螺杆菌蛋白作为疫苗候选物的分析为了分析幽门螺杆菌蛋白以用于本发明的疫苗制剂,将几种幽门螺杆菌蛋白进行表达、免疫学特征鉴定,并在以下概述的动物效力研究中进行测试。具体地说,在模拟人类中人幽门螺杆菌感染的小鼠/幽门螺杆菌模型中研究幽门螺杆菌蛋白免疫调节效应。在这些研究中,测定口服免疫选定幽门螺杆菌多肽在幽门螺杆菌感染小鼠中的效应。重组幽门螺杆菌序列的鉴定、克隆和表达为了便于克隆、表达和纯化幽门螺杆菌的膜蛋白和/或分泌蛋白,选择用于在大肠杆菌中克隆和表达重组蛋白的pET基因表达系统。此外,对于其氨基末端具有信号序列的蛋白,将编码肽标记(His标记)的DNA序列融合于目的幽门螺杆菌DNA序列5’端,以便于纯化所述重组蛋白产物。PCR扩增和克隆含有幽门螺杆菌J99菌株膜蛋白和分泌蛋白ORF的DNA序列制备选定用于从幽门螺杆菌J99菌株克隆的序列,用于通过聚合酶链式反应(PCR)扩增克隆。所有选定的序列编码的幽门螺杆菌外膜蛋白与vac9(SEQ ID NO125)、vac10(SEQ ID NO147)、vac22(SEQID NO121)和vac41(SEQ ID NO176)序列均共享末端苯丙氨酸残基。同样,vac32(SEQ ID NO108)、vac36(SEQ ID NO149)和vac37(SEQ ID NO139)序列均共享一个末端苯丙氨酸残基和C末端的一个酪氨酸簇。设计和购得(BibcoBRL Life Technologies,Gaithersburg,MD,USA)对所述ORF预测成熟5’端和该预测的翻译终止密码子下游(3’)特异的每个目的ORF(表5)的合成寡核苷酸引物。设计所有的正向引物(对目的ORF区5’末端特异的),以包括后接一个NdeI限制性位点的一个BamIII限制性位点。设计这些引物,以允许于该NdeI限制性位点序列内编码的甲硫氨酸残基(在产生非His标记的重组蛋白的情况下)起始蛋白翻译,或允许符合读框地与编码His标记的DNA序列融合(对于产生His标记的重组蛋白),然后接所述天然幽门螺杆菌DNA其余部分的编码序列。设计所有反向寡核苷酸引物(对该ORF的预测翻译终止密码子下游(3’端)特异的),以于5’端包含一个EcoRI限制性位点。这种引物组合使得能够将每个目的ORF克隆入pET28b(以产生His标记的重组蛋白)或pET30a(以产生非His标记的或天然的重组蛋白)中。pET28b载体提供编码另外20个氨基末端氨基酸(加上NdeI限制性位点内的甲硫氨酸)的序列,所述末端氨基酸包括一段构成His标记的6个组氨酸残基。
由幽门螺杆菌菌株J99 (ATCC 55679)制备的基因组DNA用作PCR扩增反应的模板DNA源(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有特定幽门螺杆菌ORF的DNA序列,将基因组DNA(50纳克)加入反应管中,所述反应管含有对目的ORF特异的正向和反向合成寡核苷酸引物各200纳克和45微升购买的PCR SuperMix(GibcoBRL LifeTechnologies,Gaithersburg,MD,USA),总共50微升。PCR SuperMix以1.1X浓度供应,含有22mM Tris-HCl(pH 8.4)、5.5mM KCl、1.65mM MgCl2、dATP、dCTP、dGTP、dTTP各220μM、22单位重组Taq聚合酶/ml以及稳定剂。采用Perkins Elmer Cetus/Gene Amp PCR系统热循环仪,使用以下热循环条件获得每个ORF的扩增DNA产物。
表5寡核苷酸引物
Vac32、Vac9和Vac22的序列于94℃变性30秒35个循环94℃15秒,55℃15秒和72℃1.5分钟反应于72℃8分钟结束Vac10和Vac41的序列于94℃变性30秒35个循环94℃15秒,55℃15秒和72℃2.5分钟反应于72℃8分钟结束Vac36和Vac37的序列变性2个循环94℃15秒,30℃15秒和72℃1.5分钟23个循环94℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束完成热循环反应时,每种扩增DNA样品在1.O%琼脂糖凝胶上电泳。该DNA通过暴露于溴化乙锭和长波UV辐射显现,并在凝胶胶条中切出。用Wizard PCR Preps试剂盒(Promega Corp.,Madison,WI,USA)纯化DNA,然后用BamHI和EcoRI消化(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后,消化的PCR扩增子再如上电泳和纯化。将幽门螺杆菌DNA序列连接入克隆载体在Vac9、10、22、31和32的情况下,制备pOK12载体(J.Vieira和J.Messing,Gene 100189-194,1991),用于用BamHI和EcoRI消化克隆,而在Vac 41的情况下,制备pSU21载体(B.Bartolome等,Gene10275-78,1991),用于用BamHI和EcoRI消化克隆(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。将所述载体在1.0%琼脂糖凝胶上电泳,并采用Wizard PCR Preps试剂盒(Promega Corp.,Madison,WI,USA)纯化。连接纯化、消化的载体和纯化、消化的扩增幽门螺杆菌ORF后,按照标准方法(Current Protocolsin Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)将连接反应的产物转化入大肠杆菌JM109感受态细胞。通过在LB液体培养基(对于基于pOK12的质粒加上25ug/ml硫酸卡那霉素,或对于基于pSU21的质粒加25ug/ml氯霉素)中过夜培养,筛选含有正确重组质粒的各个细菌菌落,然后用Magic Minipreps系统(Promega Corp.,Madison,WI,USA)制备质粒DNA,然后通过限制性消化进行分析(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。将幽门螺杆菌DNA序列克隆入pET28b和pET30a原核表达载体制备pET28b和pET30a表达载体,以通过用NdeI和EcoRI消化克隆(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。通过用NdeI和EcoRI消化,从pOK12(Vac9、10、23、31和32)或pSU21(Vac41)质粒骨架取出幽门螺杆菌DNA序列(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。pET28b、pET30a和幽门螺杆菌DNA序列均在1%琼脂糖凝胶上电泳,并用Wizard PCR Preps试剂盒(Promega Corp.,Madison WI,USA)纯化。连接纯化、消化的表达载体和纯化、消化的幽门螺杆菌DNA序列后,将连接反应的产物转化入大肠杆菌JM109感受态细胞(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。通过如上所述制备质粒DNA,然后通过限制性消化分布型分析和DNA测序,筛选含有正确重组质粒的各个细菌菌落(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后用这些重组质粒转化特定的大肠杆菌菌株。用重组表达质粒转化感受态细菌按照标准方法制备感受态细菌菌株(BL21(DE3)、BL21(DE3)pLysS、HMS174(DE3)和HMS174(DE3)pLysS,并用携带克隆幽门螺杆菌序列的重组pET28b表达质粒转化(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。这些表达宿主菌株含有一个染色体拷贝的T7 RNA聚合酶基因。这些宿主为一种λ衍生物噬菌体DE3的溶原体,该噬菌体携带lacI基因、lacUV5启动子和T7 RNA聚合酶基因。通过加入异丙基-β-D硫代半乳糖苷(IPTG)诱导T7 RNA聚合酶表达,然后T7 RNA聚合酶转录携带T7启动子序列和目的基因的任何靶质粒,诸如pET28b。重组幽门螺杆菌序列在大肠杆菌中的表达从含有25ug/ml硫酸卡那霉素(确保保持基于pET28b的重组质粒)的LB琼脂平板收集转化体,并用来接种含有25ug/ml硫酸卡那霉素的LB液体培养基,并生长至600nm的光密度为0.5-1.0 OD单位,此时,将1mM IPTG加入培养基中1-3小时,以诱导幽门螺杆菌重组DNA构成物的基因表达。用IPTG诱导基因表达后,离心沉淀细菌,将其重悬浮于SDS-PAGE溶解缓冲液后,进行SDS-PAGE(Current Protocolsin Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。采用标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),通过用考马斯亮蓝染色显现蛋白质,或通过用特异性抗His标记的单克隆抗体(Clontech,Palo Alto,CA,USA)进行蛋白质免疫印迹测定蛋白质。然后选择提供最高水平重组蛋白生产的宿主菌株,用于大规模诱导,以便纯化重组蛋白。重组表达所有下列蛋白,以下列出最高水平表达的菌株BL21(DE3)(vac31,vac26,vac37);BL21(DE3)pLysS(vac 9,32);HMS174(DE3)(vac10,11)。重组蛋白的纯化和特异性抗血清的产生如上接种大规模培养物,并使其生长,并用1mM IPTG诱导3小时。诱导后,在Sorvall离心机中以3500×g于4℃离心15分钟,沉淀细菌。所有表达的重组蛋白均存在于不溶性内含体部分中。按照标准方案(Antibodies,Cold Spring Harbor Laboratory Press,E.Harlow和D.Lane编辑,1988)纯化内含体。由vac32产生的重组蛋白溶于8M尿素中,通过镍层析(这里为REF)进行部分纯化。变性的重组蛋白通过在SDS-PAGE凝胶上电泳纯化,在用考马斯亮蓝显现后,从凝胶切下该蛋白,匀浆所述胶条。该材料用来按照标准方案(Antibodies,Cold SpringHarbor Laboratory Press,E.Harlow和D.Lane编辑,1988)在小鼠或兔子产生特异性多克隆抗体。重组蛋白的免疫学特征鉴定在试图产生抗体的所有情况下,产生高效价抗血清,证实重组蛋白的免疫原性。此外,这些特异性抗血清用来分析由该克隆基因编码的蛋白是否在幽门螺杆菌中表达。采用标准方案进行蛋白质免疫印迹分析(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)证实,幽门螺杆菌菌株J99的确表达与vac10、vac32、vac31、vac36抗血清反应的预期分子量的蛋白。该特异性抗血清也用来测定大量幽门螺杆菌分离物之间抗原保守水平,所述幽门螺杆菌分离物得自世界的不同地理位点,并来自所有临床表现类型,包括胃炎、十二指肠溃疡、胃溃疡和胃癌。发现每种菌株产生与每种抗血清特异性反应的蛋白。
此外,将来自菌株J99、17874、AH244和SS1的幽门螺杆菌细胞分级分离为不同的细胞区室(Doig和Trust 1994 Infect.Immun.624526-4533O’Toole等1995 J.Bacteriol.1776049-6057)。用特异性抗血清通过蛋白质免疫印迹探测这些部分,以鉴定该蛋白定位的部分。在所有情况下,通过本文所述的序列特征和基元检索预测,该免疫反应性蛋白存在于外膜中。证明蛋白作为疫苗的效力纯化vac36用于效力研究所有以下步骤均于4℃进行。将细胞沉淀重悬浮于每克细胞5倍体积的裂解缓冲液(50mM磷酸钠pH 8.0,0.5M NaCl,5mM咪唑)中,所述裂解缓冲液含10mM EDTA、1mM苯甲基磺酰氟(PMSF)和0.1%β-巯基乙醇,数次通过小体积的微量流化装置(M-110S型,Microfluidics International Corporation,Newton,MA)破碎细胞。将产生的匀浆制为含0.2%脱氧胆酸钠(DOC)的匀浆,搅拌20分钟,然后离心(10,000g×30min)。沉淀用含有10mM EDTA、1%Triton X-100、1mM PMSF和0.1%β-巯基乙醇的裂解缓冲液洗涤2次,然后用含有1M尿素、1mM PMSF和0.1%β-巯基乙醇的裂解缓冲液洗涤。产生的白色沉淀主要由内含体组成,不含破碎的细胞和膜物质。
将内含体溶于20ml 6M盐酸胍的裂解缓冲液中,所述裂解缓冲液具有1mM PMSF和0.1%β-巯基乙醇,于冰上孵育1小时。离心(100,000g×30min)除去不溶解的物质。将透明的上清液通过0.8μmSupor滤器(Gelman Sciences,FRG)过滤,然后直接上样于在6M盐酸胍的裂解缓冲液(含有1mM PMSF和0.1%β-巯基乙醇)中预平衡的10ml Ni2+-NTA-琼脂糖柱(Hochuli等,1987)。该柱用20ml(2倍床体积)的含6M盐酸胍、1mM PMSF、0.1%β-巯基乙醇的裂解缓冲液洗涤,然后用含有0.5%Brij 35、1mM PMSF、0.1%β-巯基乙醇的100ml线性梯度(6M-0M盐酸胍)的裂解缓冲液,慢慢除去盐酸胍。接着,该柱用25ml咪唑增加的线性梯度(5-500mM)的裂解缓冲液展开,所述裂解缓冲液含有0.5%Brij 35、1mM PMSF、0.1%β-巯基乙醇。重组蛋白作为集中于100mM咪唑的一个峰洗脱出。
合并含有所述重组蛋白的流分,然后通过离心过滤(Centriprep-10,Amicon,MA)浓缩为大约8ml,直接上样于350ml Sephacyl S-100 HR凝胶过滤介质柱(2.2×91cm),该柱已于A缓冲液(50mM磷酸钠,pH8.0,500mM NaCl,0.1mM EGTA,1mM PMSF,0.1%β-巯基乙醇,0.5%Brij 35)中平衡,然后在A缓冲液中以30ml/h展开。通过280nm的吸光度鉴定含有该重组蛋白的流分,并通过SDS-PAGE分析。合并流分,浓缩为1.5-2mg/ml,然后对10 mM磷酸钾pH 7.5、150mM NaCl、0.1mM EGTA和0.5%Brij 35透析过夜。定量测定透析物中蛋白的浓度并分装,然后冷冻于-20℃。幽门螺杆菌感染的小鼠模型通过用幽门螺杆菌Sydey菌株SS1感染C57BL/6小鼠,产生幽门螺杆菌感染小鼠模型,用来评估重组幽门螺杆菌vac36的效力。该适应小鼠(mouse-adapted)幽门螺杆菌菌株为cagA+vacA+,显示在C57BL/6小鼠中的定居水平相当于在人类中观察到的水平,形成附着基架,定居至少8个月,并诱出慢性-活动型胃炎和粘膜萎缩(Lee等,Gastroenterology,1121386-1397,1997)。剂量反应研究已表明,用单次接种106生物体攻击后8周的近交C57BL/6和Balb/C小鼠,其感染率为100%。胃幽门螺杆菌感染的评估通过培养胃组织和定量脲酶测定,检测胃组织中幽门螺杆菌生物体的存在。在后一方法中,将占总窦区大约1/4的纵向窦节段置于1ml尿素液体培养基中。4小时后,通过分光光度测量A550,定量测定因尿素水解和pH升高产生的变色程度(Fox等,Ummunol.88400-406,1996)。测定敏感度为~103幽门螺杆菌生物体。阳性(幽门螺杆菌感染的)胃组织定义为显示高于平均A550值2个标准差的样品,其中平均A550得自一组未受攻击、未感染的、年龄相当的对照小鼠。对胃组织中免疫的局部免疫应答的评估将来自食管至十二指肠接点的胃组织纵向切片包埋于OCT包埋化合物中,于液氮中冷冻,冷冻切片用识别CD4+或CD8+T细胞的单克隆抗体、或抗小鼠IgA的抗血清免疫染色,以鉴定含IgA(IgACC)的血浆细胞(Pappo等,Infect.Immun.631246-1252,1995)。局部胃免疫应答的程度定量表示为CD4+、CD8+或IgACC细胞/mm2所检查的胃区。纯化的重组幽门螺杆菌vac36抗原的保护活性在小鼠中检查得自幽门螺杆菌的纯化重组vac36抗原干扰幽门螺杆菌感染建立的能力。多组(n=10)6-8周龄雌性C57BL/6小鼠以每周次的间隔如下口服免疫4次1)100μg重组vac36抗原和10μg霍乱毒素(CT)佐剂,2)1mg幽门螺杆菌裂解液抗原和10μg CT,以及3)0.2M碳酸氢盐缓冲液和10μg CT佐剂。2周后,通过口服108幽门螺杆菌生物体,连续3天攻击小鼠。该实验在攻击后2周终止,通过细菌菌落计数和定量脲酶测定,评估幽门螺杆菌感染水平。
用活幽门螺杆菌生物体攻击时,用vac36抗原口服免疫干扰幽门螺杆菌感染的确立。通过胃脲酶活性和细菌计数测定进行评价,用纯化重组vac36抗原免疫的小鼠,表现出幽门螺杆菌定居水平显著较低(表6)。口服vac36抗原免疫也导致产生局部保护性胃免疫应答。与未免疫的幽门螺杆菌感染小鼠相比,在vac36免疫小鼠的胃组织中募集较大数目的CD4+T细胞和IgACC(表7)。表6重组vac36抗原保护小鼠免受幽门螺杆菌的攻击
a 脲酶活性表示为来自n=10只小鼠/组双份窦样品的乎均A550±SEM。b 通过Wilcoxon秩和检定与用单独的CT佐剂免疫的小鼠相比c 胃组织中幽门螺杆菌水平通过细菌计数评价,表示为平均菌落形成单位±SEM表7vac36免疫小鼠用幽门螺杆菌攻击时产生局部胃免疫应答
a胃区平均细胞数/mm2±SEM*与未免疫的幽门螺杆菌感染小鼠相比时,Wilcoxon秩和检定的p<0.05V.幽门螺杆菌菌株中基因的序列变异分析从几个幽门螺杆菌菌株克隆并序列分析了4个基因,以比较DNA序列和推定的氨基酸序列。该信息用来确定幽门螺杆菌J99和从人类患者中分离的其它幽门螺杆菌菌株之间的序列变异。染色体DNA的制备幽门螺杆菌菌株的培养物(列于表10)于BLBB(1%胰蛋白胨、1%Peptamin、0.1%葡萄糖、0.2%酵母提取物、0.5%氯化钠、5%胎牛血清)生长至OD600为0.2。细胞在Sorvall RC-3B中以3500×g于4℃离心15分钟,将细胞沉淀重悬浮于0.95ml 10mM Tris-HCl、0.1mMEDTA(TE)中。加入终浓度为1mg/ml的溶菌酶以及SDS(至1%)和RNA酶A+T1(分别至0.5mg/ml和5单位/ml),于37℃温育1小时。然后加入蛋白酶K至终浓度为0.4mg/ml,将样品于55℃温育1小时以上。将NaCl加入样品中,浓度为0.65M,小心混合,加入0.15ml10%CTAB的0.7M NaCl(最终为1%CTAB/70mM NaCl),然后于65℃温育20分钟。此时,用氯仿异戊醇抽提样品,然后用苯酚抽提,再用氯仿∶异戊醇抽提。用EtOH(1.5倍体积)或异丙醇(0.6倍体积)于-70℃沉淀DNA 10分钟,在70%EtOH中洗涤,并重悬浮于TE。PCR扩增和克隆由12个幽门螺杆菌菌株制备的基因组DNA用作PCR扩增反应的DNA模板源(Current Protocols in Molecular Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有幽门螺杆菌ORF的DNA序列,将基因组DNA(10纳克)加入双份反应的反应小瓶中,该反应小瓶含有2mM MgCl2、1μM与限定的幽门螺杆菌ORF互补并邻接的合成寡核苷酸引物(正向和反向引物,参见表8)、每种环磷酸脱氧核苷酸各0.2mM;dATP,dGTP,dCTP,dTTP和0.5单位热稳定DNA聚合酶(Amplitaq,Roche Molecular Systems Inc.,Branchburg,NJ,USA),终体积为20微升。表 8用于PCR扩增幽门螺杆菌DNA序列的寡核苷酸引物
采用Perkin Elmer Cetus/GeneAmp PCR系统9600热循环仪,使用以下热循环条件获得每种ORF的扩增DNA产物蛋白7116626和蛋白346于94℃变性2分钟,2个循环94℃15秒,30℃15秒和72℃1.5分钟23个循环94℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束。菌株AH55、5155、7958、AH24和J99的蛋白于94℃变性2分钟,2个循环94℃15秒,30℃15秒和72℃1.5分钟25个循环95℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束。菌株AH4、AH15、AH61、5294、5640、AH18和Hp244的蛋白26054702和蛋白294796813
于94℃变性2分钟,2个循环94℃15秒、30℃20秒和72℃2分钟23个循环94℃15秒,55℃20秒和72℃2分钟反应于72℃8分钟结束。
热循环反应结束时,混合每对样品,如下所述直接用来克隆入pCR克隆载体。将幽门螺杆菌DNA序列克隆入pCR TA克隆载体采用Original TA克隆试剂盒(Invitrogen,San Diego,CA)中描述的方法,将所有扩增的插入片段克隆入pCR 2.1载体。然后如下所述用连接反应的产物转化大肠杆菌菌株TOP10F’(在幽门螺杆菌序列350的情况下为INVaF’)。用重组质粒转化受态细菌按照标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),用携带克隆的幽门螺杆菌序列的重组pCR表达质粒转化感受态细菌大肠杆菌TOP10F’或大肠杆菌菌株INVaF’。简而言之,将2微升0.5μM BEM加入每个50微升感受态细胞的小瓶中。随后,将2微升连接反应物与感受态细胞混合,于冰上孵育30分钟。然后细胞和连接反应物于42℃进行“热休克”30秒,随后再置于冰上2分钟,此后,样品于0.45毫升SOC培养基(0.5%酵母提取物、2.0%胰蛋白胨、10mM NaCl、2.5mM KCl、10mMMgCl2、10mM MgSO4和20mM葡萄糖)中于37℃振荡培养1小时。然后将样品涂布于含25微克/ml硫酸卡那霉素或100微克/ml氨苄青霉素的LB琼脂平板上生长过夜。然后挑出并分析转化的TOP10F’或INVaF’菌落,以如下评价克隆的插入片段。携带幽门螺杆菌序列的重组PCR质粒的鉴定采用原始PCR扩增克隆反应、对每种幽门螺杆菌序列特异的正向和反向引物,通过PCR扩增克隆的插入片段,分析用重组pCR-幽门螺杆菌ORF转化的各个TOP10F’或INVaF’克隆。成功的扩增证实,所述幽门螺杆菌序列加入该克隆载体(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)中。
挑出携带正确克隆的幽门螺杆菌ORF的重组pCR载体的各个克隆,用于序列分析。采用标准方案(Perkin Elmer),用载体特异性引物(如在PCRII或pCR2.1中发现的,Invitrogen,San Diego,CA)和对以下表9所列ORF特异的测序引物,在ABI测序仪上进行序列分析。表9用于序列分析幽门螺杆菌DNA序列的寡核苷酸引物
结果为了确立这些实验中的PCR错误率,对由幽门螺杆菌菌株J99的5个独立的PCR反应混合物制备的5个独立的蛋白26054702克隆,在该DNA序列累积总共为4485个碱基、总长度为897个核苷酸的长度内测序。将5个克隆的DNA序列与先前通过不同方法(即随机鸟枪法克隆和测序)获得的DNA序列进行比较。本文所述实验的PCR错误率测定为4485个碱基中2个碱基改变,这相当于估计的不高于0.04%的错误率。
在鉴定为基因并通过PCR方法由12个不同的幽门螺杆菌菌株扩增4个不同可读框上,进行DNA测序分析。选择用于该项研究的4个可读框中的3个,其推定的氨基酸序列与其它细菌菌种中存在的特定蛋白显示统计学上显著的BLAST同源性。那些ORF包括蛋白26054702,同源于编码F.nonicida中ABC转运蛋白的val A和B基因;蛋白7116626,同源于流感嗜血杆菌(H.influenzae)外膜中存在的脂蛋白e(P4);蛋白29479681,同源于fecA-一种大肠杆菌二柠檬酸铁(III)转运中的外膜受体。蛋白346鉴定为未知的可读框,因为它与公用数据库中的序列显示低同源性。
为了评价不同幽门螺杆菌菌株的ORF中的保守或变异程度,将DNA序列和推导的蛋白序列中的改变与幽门螺杆菌J99菌株中发现的DNA序列和推导的蛋白序列比较(参见以下表10)。结果以通过随机鸟枪法克隆测序的同幽门螺杆菌J99菌株的同一性百分比表示。为了控制J99序列中的任何变异,再从J99细菌菌株将4个可读框信息中的每个进行克隆并测序,将该序列信息与已经通过对J99菌株随机鸟枪法测序克隆的插入片段收集的序列信息进行比较。该数据证明,该DNA序列中有小至0.12%差异(蛋白346,J99菌株)至大约7%改变(蛋白26054702,菌株AH5)的变异。推导的蛋白序列或者未显示变异(蛋白346,菌株AH18和AH24),或显示最高达7.66%氨基酸改变(蛋白26054702,菌株AH5)。表10幽门螺杆菌疫苗候选者的多菌株DNA序列分析J99蛋白编号26054702 26054702 7116626 7116626 29479681 29477968 346 3461区域长度测序的 248 a.a. 746 nt. 232 a.a. 96nt.182 a.a. 548 nt. 273 a.a. 819 nt.测试的菌株氨基酸 核苷酸 氨基酸 核苷酸 氨基酸 核苷酸 氨基酸核苷酸同一性 同一性 同一性 同一性 同一性 同一性 同一性同一性J99 100.0%100.00% 100.00% 100.00% 100.00% 100.00% 99.63% 99.88%AH244 95.16%95.04% n.d. n.d. 99.09% 96.71% 98.90% 96.45%AH4 95.97%95.98% 97.84% 95.83% n.d. n.d. 97.80% 95.73%AH5 92.34%93.03% 98.28% 96.12% 98.91% 96.90% 98.53% 95.73%AH15 95.16%94.91% 97.41% 95.98% 99.82% 97.99% 99.63% 96.09%AH61 n.d. n.d. 97.84% 95.98% 99.27% 97.44% n.d. n.d.5155 n.d. n.d. n.d n.d. 99.45% 97.08% 98.53% 95.60%5294 94.35%94.37% 98.28% 95.40% 99.64% 97.26% 97.07% 95.48%7958 94.35%94.10% 97.84% 95.40% n.d. n.d. 99.63% 96.46%5640 95.16%94.37% 97.41% 95.69% 99.09% 97.63% 98.53% 95.48%AH18 n.d. n.d. 98.71% 95.69% 99.64% 97.44% 100.00% 95.97%AH24 94.75%95.04% 97.84% 95.40% 99.27% 96.71% 100.00% 96.46%n.d.=未进行VI.测定作为潜在治疗靶的幽门螺杆菌必需基因的实验型失效方案从其蛋白产物似乎在诸如胞外被膜合成、DNA合成、转录、翻译、调节和定居/毒性的必需细胞途径中起关键作用的基因,选择治疗靶。
缺失幽门螺杆菌基因/ORF部分和插入诱变卡那霉素抗性盒,以便鉴定细胞必需基因,其方案由先前发表的方法(Labigne-Roussel等,1988,J.Bacteriology 170,第1704-1708页;Cover等,1994,J.BiologicalChemistry 269,第10566-10573页;Reyrat等,1995,Proc.Natl.Acad.Sci.92,第8768-8772页)进行修改。结果是基因“失效”。幽门螺杆菌基因序列的鉴定和克隆从幽门螺杆菌基因组序列中鉴定选择作为失效靶的基因或ORF(可读框)的序列,并用来设计引物以特异性地扩增所述基因/ORF。在OLIGO程序(National Biosciences,Inc.,Plymouth,MN 55447,USA)的帮助下设计所有合成寡核苷酸引物,也可以购自Gibco/BRL LifeTechnologies(Gaithersburg,MD,USA)。如果该ORF小于800-1000个碱基对,则选择该可读框外的侧翼引物。
由幽门螺杆菌HpJ99菌株(ATCC55679;由Geneome TherapeuticsCorporation,100 Beaver Street,Waltham,MA 02154保藏)制备的基因组DNA,用作通过PCR(聚合酶链式反应)(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)扩增所述ORF的模板DNA源。对于从幽门螺杆菌制备基因组DNA,参见实施例I。通过将10纳克基因组HpJ99 DNA加入反应小瓶中进行PCR扩增,其中所述反应小瓶含有10mM Tris pH 8.3、50mM KCl、2mMMgCl2、2μM合成寡核苷酸引物(正向=F1,而反向=R1)、0.2mM每种三磷酸脱氧核苷酸(dATP,dGTP,dCTP,dTTP)和1.25单位热稳定DNA聚合酶(Amplitaq,Roche Molecular Systems,Inc.,Branchburg,NJ,USA),终体积为40微升。用Perkins Elmer Cetus/GeneAmp PCR系统9600热循环仪进行PCR。
在热循反应结束时,每个扩增DNA的样品在2%TAE琼脂糖凝胶上用溴乙锭染色呈现(Current Protocols in Molecular Biology,JohnWiley和Sons,Inc.,F.Ausubel等编辑,1994),以确定由该反应产生的预期大小的单个产物。然后洗涤扩增的DNA,并用Qiaquick Spin PCR纯化试剂盒(Qiagen,Gaithersburg,MD,USA)纯化。
采用TA克隆策略(Current Protocols in Molecular Biology,JohnWiley and Sons,Inc.,F.Ausubel等编辑,1994),将PCR产物克隆入pT7Blue T载体(分类号为69820-1,Novagen,Inc.,Madison,WI,USA)。通过将过量6倍摩尔浓度的所述PCR产物、10ng pT7Blue-T载体(Novagen)、1微升T4 DNA连接酶缓冲液(New England Biolabs,Beverly,MA,USA)和200单位的T4 DNA连接酶(New England Biolabs)混合为10微升的终反应体积,完成将所述PCR产物连接入该载体中。让连接反应于16℃进行16小时。
将连接产物电穿孔入电穿孔感受态XL-1 Blue或DH5-a大肠杆菌细胞(Clontech Lab.,Inc.Palo Alto,CA,USA)中(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。简而言之,将1微升连接反应物与40微升电感受态细胞混合,经过高压脉冲(25微法拉,2.5kV,200ohms),此后,样品于0.45ml SOC培养基(0.5%酵母提取物、2%胰蛋白胨、10mM NaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖)、37℃振荡培养1小时。然后将样品涂布在含有100微克/ml氨苄青霉素、0.3%X-gal和100微克/ml IPTG的LB(10g/l细菌培养用胰蛋白胨、5g/l细菌培养用酵母提取物、10g/l氯化钠)平板上。这些平板于37℃培养过夜。选择白色的氨苄青霉素抗性菌落,使其生长于含有100微克/ml氨苄青霉素的5ml液体LB中,用Qiagen小量制备方案(Qiagen,Gaithsburg,MD,USA)分离质粒DNA。
为了证实已经克隆了正确的幽门螺杆菌DNA插入片段,使用用于J99幽门螺杆菌序列最初扩增的相同正向和反向引物,将这些pT7Blue质粒DNA用作PCR扩增所述克隆的插入片段的模板。识别2%TAE(溴化乙锭染色的琼脂糖凝胶)上显现的引物和正确大小的PCR产物,证实已经克隆了正确的插入片段。每个失效靶获得2-6个这种证实的克隆,将其于-70℃冷冻贮存。为了最大限度地减小由PCR产生的错误,合并分子这些证实的克隆的质粒DNA,用于随后的克隆步骤。
再用所述基因/ORF序列设计第二对引物,所述引物邻接所述ORF内或者待破坏或者待缺失的幽门螺杆菌DNA区(多至250个碱基对),但方向相反。先前分离克隆的环状质粒DNA库用作该轮PCR的模板。由于该对缺失引物扩增方向相反,因此引物之间ORF部分不包括在产生的PCR产物中。该PCR产物为每端具有幽门螺杆菌DNA的线性DNA片段和它们之间的pT7Blue载体骨架,这本质上导致所述ORF一部分的缺失。在1%TAE(溴化乙锭染色的琼脂糖凝胶)上显现该PCR产物,以证实仅扩增了正确大小的单一产物。
通过先前所用的TA克隆方法(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994),将卡那霉素抗性盒(labigne-Roussel等,1988,J.Bacteriology,170,1704-1708)连接于该PCR产物。通过用EcoRI消化重组质粒pCTB8kan(Cover等,1994,J.Biological Chemistry 269,第10566-10573页),获得含Campylobacter卡那霉素抗性基因的卡那霉素盒。在1%TAE凝胶上分离合适的片段(1.4kb),用QIAquick凝胶提取试剂盒(Qiagen,Gaithersburg,MD,USA)分离。采用Klenow填平方案进行该片段的末端修复,这涉及将4ug该DNA片段、1微升0.5mM dATP、dGTP、dCTP、dTTP、2微升Klenow缓冲液(New England Biolabs)和5单位Klenow DNA聚合酶I大(Klenow)片段(New England Biolabs)混合为20微升反应物,于30℃温育15分钟,通过加热至75℃10分钟失活该酶。然后通过Qiaquick柱(Qiagen,Gaithersburg,MD,USA)纯化该平端化的卡那霉素盒,以去除核苷酸。然后,通过在100微升反应物中混合5微克平端卡那霉素盒、10mM Tris pH 8.3、50mM KCl、2mM MgCl2、5单位DNA聚合酶(Amplitaq,Roche Molecular Systems,Inc.,Branchburg,NJ,USA)、20微升5mM dTTP,于37℃温育反应物2小时。采用QIAquick柱(Qiagen,Gaithersburg,MD,USA)纯化“Kan-T”盒。通过在10微升反应物中混合10-25ng缺失引物PCR产物、50-75ng Kan-T盒DNA、1微升10x T4 DNA连接酶反应混合物、0.5微升T4 DNA连接酶(NewEngland Biolabs,Beverly,MA,USA),将所述缺失引物(F2和R2)的PCR产物连接于Kan-T盒,于16℃温育16小时。
通过如前述的电穿孔,将连接产物转化入XL-1 Blue或DH5-a大肠杆菌。在SOC中回收后,将细胞平板接种于含100微克/ml氨苄青霉素的平板,于37℃生长过夜。然后,将这些平板复制平板接种于含有25微克/ml卡那霉素的平板上,让其生长过夜。产生的菌落具有pT7Blue载体中存在的氨苄青霉素抗性基因,也具有新引入的卡那霉素抗性基因。将菌落挑到含有25微克/ml卡那霉素的LB中,采用Qiagen小量制备方案(Qiagen,Gaithersburg,MD,USA)从培养的细胞分离质粒DNA。
通过PCR扩增的几个实验在这些质粒上进行,以证实卡那霉素插入幽门螺杆菌基因/ORF中,以测定卡那霉素抗性基因相对于幽门螺杆菌基因/ORF插入的方向。为证实将卡那霉素盒插入幽门螺杆菌序列,用所述质粒DNA作为使用原始用来克隆幽门螺杆菌基因/ORF的该组引物的PCR扩增的模板。正确的PCR产物为缺失的基因/ORF的大小,但是通过加入1.4kb卡那霉素盒使其大小增大。为了避免卡那霉素抗性盒对幽门螺杆菌基因表达的潜在极性影响,测定卡那霉素抗性基因相对于失效基因/ORF的方向,两个方向最终均用于幽门螺杆菌转化中(参见下文)。为了确定卡那霉素抗性基因插入的方向,由卡那霉素基因的末端设计引物(“Kan-1”5’-ATCTTACCTATCACCTCAAAT-3’(SEQ ID NO255))和“Kan-2”5’AGACAGCAACATCTTTGTGAA-3’(SEQ ID NO256))。通过使用每种克隆引物结合每种Kan引物(4个引物组合),确定卡那霉素盒相对于幽门螺杆菌序列的方向。将阳性克隆分类为“A”方向(幽门螺杆菌基因和卡那霉素抗性基因存在相同的转录方向)或“B”方向(幽门螺杆菌基因的转录方向与卡那霉素抗性基因的方向相反)。合并相同方向(A或B)的克隆,用于随后的实验并独立转化入幽门螺杆菌。将质粒DNA转化入幽门螺杆菌细胞用2个幽门螺杆菌菌株进行转化ATCC55679,提供获得幽门螺杆菌序列数据库的DNA的临床分离物;和AH244,已经传代并具有定居小鼠胃能力的分离物。用于转化的细胞于37℃、10%CO2、100%湿度生长于或者羊血琼脂平板或生长于Brucella肉汤液体中。细胞生长至对数期,进行显微镜检查,以确定细胞是“健康”(活跃运动的细胞)的,不是污染的。如果生长于乎板上,通过用无菌接种环从该平板上刮下细胞,收获细胞,悬浮于1ml Brucella肉汤中,离心下来(1分钟,在eppendorf微量离心机中的最高速),并重悬浮于200微升Brucella肉汤中。如果生长于Brucella肉汤液体中,离心细胞(在Beckman TJ6离心机中,3000rpm 15分钟),将细胞沉淀重悬浮于200微升Brucella肉汤中。取等份细胞测定600nm的光密度,以便计算细胞浓度。将1等份(1-5 OD600单位/25微升)重悬浮细胞平板接种于预温热的羊血琼脂平板上,将该平板再于37℃、6%CO2、100%湿度温育4小时。该温育后,将10微升质粒DNA(100微克/微升)点到这些细胞上。平行进行阳性对照(具有由卡那霉素抗性基因中断的核糖核酸酶H基因的质粒DNA)和阴性对照(无质粒DNA)。将平板返回37℃、6%CO2再温育4小时。然后,用于Brucella肉汤中湿润的药签将细胞涂布到该平板,于37℃、6%CO2生长20小时。然后,将细胞转移至含25微克/ml卡那霉素的羊血琼脂平板,让其于37℃、6%CO2、100%湿度生长3-5天。如果出现菌落,挑出这些菌落,作为含有25微克/ml卡那霉素的新鲜羊血琼脂平板上的斑片再生长。
进行3组PCR实验,以证实已经由合适的染色体位置上的同源重组产生转化体菌落。如下通过快速煮沸DNA制剂方法,获得PCR模板(来自菌落的DNA)。将1等份菌落(用牙签刺该菌落)引入100微升的1%Triton X-100、20mM Tris,pH 8.5,并煮沸6分钟。加入等体积苯酚∶氯仿(1∶1),并涡旋混合。将该混合物微量离心5分钟,将上清液用作使用以下引物组合的PCR的模板,以证实于合适染色体位置的同源重组。
实验1.用最初用来扩增该基因/ORF的克隆引物的PCR。于正确染色体位置的同源重组的阳性结果应该显示单一的PCR产物,预期该产物大小为该缺失基因/ORF的大小,但加上1.4kb卡那霉素盒使其大小增大。恰好该基因/ORF大小的PCR产物证明该基因尚未失效,并且转化体不是正确染色体位置上的同源重组的结果。
实验2.根据所用的质粒DNA是“A”方向还是“B”方向,用F3(由该基因/ORF上游序列设计的、但不存在于该质粒上的引物)和或者引物Kan-1或者Kan-2(由卡那霉素抗性基因末端设计的引物)进行的PCR。于正确染色体位置上的同源重组将产生预期大小的单一PCR产物(即从F3的位置至卡那霉素抗性基因的插入位点)。没有不正确大小的一种或多种PCR产物将证明,该质粒尚未整合于正确的位点,并且该基因尚未失效。
实验3.根据所用的质粒DNA是“A”方向还是“B”方向,用R3(由该基因/ORF下游序列设计的、但不存在于该质粒上的引物)和或者引物Kan-1或者Kan-2进行的PCR。于正确染色体位置上的同源重组将产生预期大小的单一PCR产物(即从卡那霉素抗性基因的插入位点至R3的下游位置)。此外,没有不正确大小的一种或多种PCR产物会证明,该质粒尚未整合于正确的位点,并且该基因尚未失效。
所有以上三个实验均显示阳性结果的转化体表明,该基因对于体外生存不是必需的。
对于每个转化体,在任何一个上述三个实验中的阴性结果,表明该基因尚未破坏,并且该基因对于体外生存是必需的。
在由两个独立转化未产生菌落的事件中,尽管核糖核酸酶H质粒DNA破坏的阳性对照产生转化体,但在铺平板用于菌落形成之前,对来自转化体群体的DNA通过PCR进一步分析该质粒DNA。这将证实,该质粒可能进入所述细胞,并于正确位点经历同源重组。简而言之,按照上述转化方案温育质粒DNA。在与质粒DNA温育后,立即从幽门螺杆菌细胞提取DNA,将该DNA用作以上实验2和实验3的模板。实验2和实验3中的阳性结果将证明,该质粒DNA可能进入所述细胞,并于正确的染色体位置经历同源重组。如果实验2和实验3为阳性,则不能获得有生命力的转化体表明,该基因是必需的,该基因破坏的细胞不能形成菌落。VII.高通量的药物筛选测定克隆、表达和蛋白纯化待用于高通量药物筛选测定的幽门螺杆菌靶基因及其蛋白产物(例如幽门螺杆菌酶)的克隆、转化、表达和纯化,基本上按照以上实施例II和实施例III中所述进行。以下作为一个具体实施例描述特定幽门螺杆菌基因产物肽基-脯氨酰顺反异构酶的筛选测定的开发和应用。酶测定基本上按Fisher(Fisher,G.等(1984)Biomed.Biochim.Acta431101-1111)所述进行该测定。该测定测量测试肽N-琥珀酰-Ala-Ala-Pro-Phe-对硝基酰基苯胺(nitroailide)(Sigma # S-7388,批号84H5805)中Ala-Pro键的顺反异构。该测定与α-胰凝乳蛋白酶偶联,其中该蛋白酶切割该测试肽的能力仅在所述Ala-Pro键为反式时发生。在BeckmanDU-650型分光光度计上于390nm跟踪该测定中该测试肽向反式异构体的转化。以0.5秒的平均扫描时间,每秒收集数据。在终体积为400ul的35mM Hepes,pH 8.0与10μM α-胰凝乳蛋白酶(来自牛胰的1-5型,Sigma # C-7762,批号23H7020)和10nM PPI酶中进行该测定。为了起始反应,于室温将10μl底物(2 mM N-琥珀酰-Ala-Ala-Pro-Phe-对硝基酰基苯胺的DMSO)加入390μl反应混合物中。粗细菌提取物中的酶测定于对数中期(OD600nm~1)收获Brucella肉汤中的50ml幽门螺杆菌(菌株J99)培养物,将其重悬浮于具有以下蛋白酶抑制剂的裂解缓冲液中1mM PMSF以及抑酶肽、亮抑酶肽、胃酶抑制剂、TLCK、TPCK和大豆胰蛋白酶抑制剂各10μg/ml。将该悬浮液进行3个循环的冻融(于-70℃15分钟,然后于室温30分钟),然后进行超声处理(3个20秒的脉冲串)。将裂解液离心(12,000g×30分钟),如上分析上清液的酶活性。
在大肠杆菌中许多幽门螺杆菌酶可以以高水平的活性形式表达。这种纯化蛋白的高产量供设计各种高通量药物筛选测定之用。VIII.截短的基因表达和蛋白生产重组幽门螺杆菌序列的鉴定、克隆和表达为了便于克隆、表达和纯化幽门螺杆菌的膜蛋白,选择用于在大肠杆菌中克隆和表达重组蛋白的pET基因表达系统(Novagen)。此外,对于其氨基末端具有信号序列的蛋白,将编码肽标记(His标记)的DNA序列融合于目的幽门螺杆菌DNA序列5’端,以便于纯化所述重组蛋白产物。在某些情况下,将该DNA序列符合读框地与谷胱苷肽-S-转移酶蛋白一起克隆,以产生GST融合蛋白。用于这种情况的载体为Pharmacia LKB(Uppsala,瑞典)的pGEX系列。PCR扩增和克隆含有幽门螺杆菌J99菌株膜蛋白和分泌蛋白ORF的DNA序列制备选定(选自本发明的DNA序列表)用于从幽门螺杆菌菌株J99克隆的序列,用于通过聚合酶链式反应(PCR)扩增克隆。设计和购得(GibcoBRL Life Technologies,Gaithersburg,MD,USA)用于目的ORF(表1)、对该ORF预测成熟5’端、以及或者该预测的翻译终止密码子下游(3’)或者该编码区内特定点特异的合成寡核苷酸引物。设计所有的正向引物(对目的ORF区5’末端特异的),以包括或者一个BamHI或者一个NdeI限制性位点。设计NdeI限制性位点序列内的这些引物,以允许于甲硫氨酸残基(在产生非His标记的重组蛋白的情况下,在NdeI限制性位点内编码的)起始蛋白翻译,或以符合读框地与编码His标记的DNA序列融合(对于产生His标记的重组蛋白),然后接所述天然幽门螺杆菌DNA其余部分的编码序列。产生具有该BamHI限制性位点的引物,以符合读框地与pGEX载体(Pharmacia LKB,Uppsala,瑞典)中的谷胱苷肽-S-转移酶基因的C末端融合。设计所有反向引物,以于5’端包含一个EcoRI限制性位点。选择几种能引起该多肽截短的反向寡核苷酸引物,以除去C末端的某些部分,在这些情况下,5’末端的EcoRI限制性位点后接一个翻译终止密码子。这类引物组合使得能够将目的ORF(或目的ORF的部分)克隆入pET28b(以产生His标记的重组蛋白)、pET30a(以产生非His标记的或天然的重组蛋白)或pGEX-4T或pGEX-5X系列(以产生GST融合蛋白)中。pET28b载体提供编码另外20个氨基末端氨基酸(加上NdeI限制性位点内的甲硫氨酸)的序列,所述氨基末端氨基酸包括一段构成His标记的6个组氨酸残基,而pGEX载体将幽门螺杆菌蛋白融合于26,000Da的谷胱苷肽-S-转移酶蛋白。
由幽门螺杆菌菌株J99(ATCC 55679)制备的基因组DNA用作PCR扩增反应的模板DNA源(Current Protocols in Moleculare Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有特定幽门螺杆菌ORF的DNA序列,将基因组DNA(50纳克)加入反应管中,所述反应管含有对目的ORF特异的正向和反向合成寡核苷酸引物各200纳克和45微升购买的PCR SuperMix(GibcoBRL LifeTechnologies,Gaithersburg,MD,USA),总共50微升。PCR SuperMix以1.1X浓度供应,含有22mM Tris-HCl(pH 8.4)、55mM KCl、1.65mM MgCl2、dATP、dCTP、dGTP、dTTP各220μM、22单位重组Taq聚合酶/ml以及稳定剂。采用Perkins Elmer Cetus/GeneAmp PCR系统热循环仪,使用以下热循环条件获得每个ORF的扩增DNA产物。表11寡核苷酸引物
Vac38的序列(全长或截短的)于94℃变性30秒35个循环94℃15秒,55℃15秒和72℃1.5分钟反应于72℃8分钟结束热循环反应结束时,在1.0%琼脂糖凝胶上电泳每种扩增DNA样品。通过暴露于溴化乙锭和长波UV辐射,显现该DNA,并以胶条切出。用Wizard PCR Prep试剂盒(Promega Corp.,Madison WI,USA)纯化DNA,然后经过BamHI和EcoRI消化(Current Protocols in MoleculareBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后重电泳消化的PCR扩增子并如前纯化。将幽门螺杆菌DNA序列连接入克隆载体制备pOK12载体(J.Vieira和J.Messing,Gene 100189-194,1991),用于用BamHI和EcoRI或在Vac41的情况下用NdeI和EcoRI消化的克隆(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。该载体在1.0%琼脂糖凝胶上电泳并采用Wizard PCK Prep试剂盒(Promega Corp.,Madison WI,USA)进行纯化。将纯化的消化载体和纯化、消化的扩增幽门螺杆菌ORF连接后,按照标准方法(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)将连接反应物转化入大肠杆菌JM109感受态细胞。通过在LB肉汤中培养过夜(加上25ug/ml硫酸卡那霉素),然后用Magic小量制备系统(Promega Corp.,Madison WI,USA)制备质粒DNA,筛选含有正确重组质粒的各个细菌菌落,然后通过限制性消化分析(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。将幽门螺杆菌DNA序列克隆入pET28b、pET30a和pGEX4T-3原核表达载体制备pET28b和pET30a表达载体,用于通过以NdeI和EcoRI消化进行克隆,以及制备pGEX4T-3载体,用于以BamHI和EcoRI消化进行克隆(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。通过用NdeI和EcoRI消化或BamHI和EcoRI消化,从pOK12质粒骨架取出幽门螺杆菌DNA序列(CurrentProtocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。在1%琼脂糖凝胶上电泳pET28b、pET30a、pGEX4T-3和幽门螺杆菌DNA序列,并用Wizard PCR Prep试剂盒(PromegaCorp.,Madison WI,USA)纯化。将纯化的消化表达载体和纯化、消化的幽门螺杆菌DNA序列连接后,将连接反应物转化入大肠杆菌JM109感受态细胞(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。通过如上所述制备质粒DNA,随后通过限制性消化分布型分析和DNA测序,筛选含有正确重组质粒的各个细菌菌落(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。然后用这些重组质粒转化特定的大肠杆菌表达菌株。用重组表达质粒转化受态细菌按照标准方法,制备感受态细菌菌株BL21(DE3)、BL21(DE3)pLysS、HMS174(DE3)和HMS173(DE3)pLysS,并用携带克隆的幽门螺杆菌序列的重组pET28b表达质粒转化(Current Protocolsin Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。这些表达宿主菌株含有一个染色体拷贝的T7 RNA聚合酶基因。这些宿主为一种λ衍生物噬菌体DE3的溶原体,该噬菌体携带lacI基因、lacUV5启动子和T7 RNA聚合酶基因。通过加入异丙基-β-D-硫代半乳糖苷(IPTG)诱导T7 RNA聚合酶表达,然后T7 RNA聚合酶转录携带T7启动子序列和目的基因的任何靶质粒,诸如pET28b。
按照标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),制备感受态细菌菌株JM109和DH5α,并用携带克隆的幽门螺杆菌序列的重组pGEX4T-3表达质粒转化。重组幽门螺杆菌序列在大肠杆菌中的表达从含有25ug/ml硫酸卡那霉素(确保保持基于pET28b的重组质粒)或100ug/ml氨苄青霉素(确保保持基于pGEX4T-3的重组质粒)的LB琼脂平板收集转化体,并用来接种含有25ug/ml硫酸卡那霉素或100ug/ml氨苄青霉素的LB液体培养基,并生长至600nm的光密度为0.5-1.0 OD单位,此时,将1mM IPTG加入培养基中1-3小时,以诱导所述幽门螺杆菌重组DNA构成物的基因表达。用IPTG诱导基因表达后,离心沉淀细菌,将其重悬浮于SDS-PAGE溶解缓冲液后,进行SDS-PAGE(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。采用标准方法(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994),通过用考马斯亮蓝染色显现蛋白质,或通过用特异性抗His标记的单克隆抗体(Clontech,Palo Alto,CA,USA或)抗GST标记抗体(PharmaciaLKB)进行蛋白质免疫印迹检测蛋白质。然后选择提供最高水平重组蛋白生产的宿主菌株,用于大规模诱导,以便纯化该重组蛋白。所用的菌株为HMS174(DE3)(基于pET29b的构成物)和DH5α(基于pGEX4T-3的构成物)。
除去C末端区似乎在两个系统中均提高表达水平,尽管这种增加在GST融合系统中显著得多。产生的所有重组蛋白均具有根据DNA序列(如果需要)加上所述融合标记的大小预测的分子量。该幽门螺杆菌蛋白的截短部分含有某些疏水性极强的序列,除去这些序列可能是表达增加的原因。相当的实施方案本领域技术人员会认识到,或能够确定,仅仅使用常规实验,许多实施方案相当于本文所述的具体实施方案和方法。这类相当的实施方案将包括在以下权利要求书的范围内。
序列表1)一般信息(i)申请人(A)姓名Astra Aktiebolag(B)街道S-151 85(C)城市Sodertalje(D)州(E)国家瑞典(F)邮政编码(ii)发明名称关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物(iii)序列数275(iv)计算机可读形式(A)媒体类型CD/ROM ISO9660(B)计算机(C)操作系统(D)软件(v)当前申请数据(A)申请号(B)申请日(vi)在先申请数据(A)申请号US 08/759,625(B)申请日19996年12月5日(vii)在先申请数据(A)申请号US 08/823,745(B)申请日1997年3月25日(viii)在先申请数据(A)申请号US 08/891,928(B)申请日1997年7月14日(ix)通信地址(A)收信人LAHIVE & COCKFIELD(B)街道28 State Street(C)城市波士顿(D)州Massachusetts
(E)国家美国(F)邮政编码02109-1875(x)代理律师/代理人资料(A)姓名Mandragouras,Amy E.
(B)注册号36,207(C)参考/档案号GTN-011CP2PC(xi)电信资料(A)电话(617)227-7400(B)传真(617)227-5941(2)INFORMATION FOR SEQ ID NO1(i)序列特征(A)长度687个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...687(xi)序列描述SEQ ID NO1ATGAGATTTA AGGGTTCAAG AGTGGAAGCG TTTTTAGGAG CGTTAGAATT TCAAGAGAAT 60GAATATGAAG AGTTTAAAGA GCTTTATGAG AGCTTAAAAA CCAAGCAAAA GCCCCACACT 120TTGTTCATTT CTTGCGTGGA TTCACGAGTC GTGCCTAATT TAATCACAGG CACCCAACCG 180GGCGAATTGT ATGTGATCCG CAACATGGGC AATGTGATCC CCCCTAAAAC AAGCTATAAA 240GAATCCCTTT CTACCATTGC GAGCGTTGAA TACGCTATCG CGCATGTGGG CGTTCAAAAC 300TTAATCATTT GCGGGCATAG CGATTGTGGG GCTTGCGGGA GCATTCATTT AATCCATGAT 360GAAACCACCA AAGCTAAAAC CCCTTACATT GCAAACTGGA TACAATTTTT AGAGCCTATT 420AAAGAAGAAT TAAAAAACCA CCCGCAATTC AGCAACCATT TCGCCAAGCG TTCATGGCTT 480ACAGAGCGTT TGAATGCGCG CTTGCAACTC AACAACCTCT TAAGCTATGA TTTCATTCAA 540GAAAGAGTAA TAAATAACGA ATTAAAAATT TTTGGTTGGC ACTATATCAT AGAAACAGGC 600AGGATTTATA ATTATAATTT TGAAAGCCAT TTTTTTGAGC CGATTGAAGA AACCATTAAA 660CAAAGGATAA GTCATGAAAA CTTCTAA 687(2)INFORMATION FOR SEQ ID NO2(i)序列特征(A)长度666个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...666(xi)序列描述SEQ ID NO2GTGGAAGCGT TTTTAGGAGC GTTAGAATTT CAAGAGAATG AATATGAAGA GTTTAAAGAG 60CTTTATGAGA GCTTAAAAAC CAAGCAAAAG CCCCACACTT TGTTCATTTC TTGCGTGGAT 120TCACGAGTCG TGCCTAATTT AATCACAGGC ACCCAACCGG GCGAATTGTA TGTGATCCGC 180AACATGGGCA ATGTGATCCC CCCTAAAACA AGCTATAAAG AATCCCTTTC TACCATTGCG 240AGCGTTGAAT ACGCTATCGC GCATGTGGGC GTTCAAAACT TAATCATTTG CGGGCATAGC 300GATTGTGGGG CTTGCGGGAG CATTCATTTA ATCCATGATG AAACCACCAA AGCTAAAACC 360CCTTACATTG CAAACTGGAT ACAATTTTTA GAGCCTATTA AAGAAGAATT AAAAAACCAC 420CCGCAATTCA GCAACCATTT CGCCAAGCGT TCATGGCTTA CAGAGCGTTT GAATGCGCGC 480TTGCAACTCA ACAACCTCTT AAGCTATGAT TTCATTCAAG AAAGAGTAAT AAATAACGAA 540TTAAAAATTT TTGGTTGGCA CTATATCATA GAAACAGGCA GGATTTATAA TTATAATTTT 600GAAAGCCATT TTTTTGAGCC GATTGAAGAA ACCATTAAAC AAAGGATAAG TCATGAAAAC 660TTCTAA 666(2)INFORMATION FOR SEQ ID NO3
(i)序列特征(A)长度1008个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1008(xi)序列描述SEQ ID NO3ATGTTAGTTA CTCGTTTTAA AAAAGCCTTC ATTTCTTATT CTTTAGGCGT GCTTGTTGTT 60TCATTATTAT TGAATGTGTG CAACGCTTCA GCACAAGAAG TCAAAGTCAA GGATTATTTT 120GGGGAGCAAA CCATAAAGCT TCCTGTTTCC AAAATAGCCT ATATAGGGAG TTATGTAGAA 180GTGCCTGCCA TGCTTAATGT TTGGGATAGG GTTGTAGGCG TTTCTGATTA TGCCTTTAAG 240GATGACATTG TCAAAGCCAC TCTCAAAGGC GAGGATCTTA AACGAGTCAA ACACATGAGC 300ACCGATCATA CAGCCGCGTT GAATGTGGAA TTATTAAAAA AGCTTAGCCC TGATCTTGTG 360GTAACCTTTG TGGGTAACCC TAAAGCGGTA GAGCATGCGA AAAAATTTGG GATTTCATTC 420CTTTCTTTCC AAGAGACAAC GATTGCAGAG GCCATGCAAG CTATGCAAGC TCAAGCCACG 480GTCTTAGAAA TTGACGCTTC CAAAAAATTC GCCAAAATGC AAGAAACTTT GGACTTTATT 540GCTGAGCGTT TGAAGGGCGT TAAAAAGAAA AAGGGGGTGG AGCTTTTCCA TAAAGCCAAT 600AAAATCAGCG GCCATCAAGC CATTAGCTCA GACATTTTAG AAAAAGGGGG TATAGATAAT 660TTTGGCTTGA AATACGTTAA GTTTGGACGC GCTGACATTA GTGTGGAAAA AATCGTTAAA 720GAAAACCCTG AAATCATTTT CATTTGGTGG GTAAGCCCAC TCACTCCTGA AGACGTGTTG 780AACAACCCTA AATTTTCCAC TATCAAAGCC ATTAAAAATA AGCAAGTCTA TAAGCTCCCC 840ACGATGGATA TTGGCGGTCC TAGAGCCCCA CTCATTAGTC TTTTTATCGC TTTAAAAGCC 900CACCCTGAAG CCTTTAAAGG CGTGGATATT AATGCGATAG TCAAAGATTA TTATAAAGTG 960GTCTTTGATT TGAATGATGC GGAAATTGAG CCATTCTTAT GGCACTGA 1008(2)INFORMATION FOR SEQ ID NO4(i)序列特征(A)长度825个碱基对
(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...825(xi)序列描述SEQ ID NO4ATGTTAGTTA CTCGTTTTAA AAAAGCCTTC ATTTCTTATT CTTTAGGCGT GCTTGTTGTT 60TCATTATTAT TGAATGTGTG CAACGCTTCA GCACAAGAAG TCAAAGTCAA GGATTATTTT 120GGGGAGCAAA CCATAAAGCT TCCTGTTTCC AAAATAGCCT ATATAGGGAG TTATGTAGAA 180GTGCCTGCCA TGCTTAATGT TTGGGATAGG GTTGTAGGCG TTTCTGATTA TGCCTTTAAG 240GATGACATTG TCAAAGCCAC TCTCAAAGGC GAGGATCTTA AACGAGTCAA ACACATGAGC 300ACCGATCATA CAGCCGCGTT GAATGTGGAA TTATTAAAAA AGCTTAGCCC TGATCTTGTG 360GTAACCTTTG TGGGTAACCC TAAAGCGGTA GAGCATGCGA AAAAATTTGG GATTTCATTC 420CTTTCTTTCC AAGAGACAAC GATTGCAGAG GCCATGCAAG CTATGCAAGC TCAAGCCACG 480GTCTTAGAAA TTGACGCTTC CAAAAAATTC GCCAAAATGC AAGAAACTTT GGACTTTATT 540GCTGATCGTT TGAAGGGCGT TAAAAAGAAA AAGGGGGTGG AGCTTTTCCA TAAAGCCAAT 600AAAATCAGCG GCCATCAAGC CATTAACTCA GACATTTTAC AACAAGGGGG TATTGATAAT 660TTTGGCTTGA AATACGTCAA GTTTGGACGC GCTGACATTA GTGTGGAAAA AATCGTTAAA 720GAAAACCCTG AAATCATTTT CATTAGGTGG GTAACCCCAC TCACTCCTGA TTACGTGTTG 780AACAACCCAA AATTTTCTAC TATCAATGCC ATTAAAAACA TATAA 825(2)INFORMATION FOR SEQ ID NO5(i)序列特征(A)长度1287个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1287(xi)序列描述SEQ ID NO5ATGAAGAAAA AATTTCTGTC ATTAACCTTA GGTTCGCTTT TAGTTTCCGC TTTAAGCGCT 60GAAGACAACG GCTTTTTTGT GAGCGCCGGC TATCAAATCG GTGAATCCGC TCAAATGGTG 120AAAAACACCA AAGGCATTCA AGATCTTTCA GACAGCTATG AAAGATTGAA CAACCTTTTA 180ACGAATTATA GCGTCCTAAA CGCTCTCATC AGGCAGTCCG CCGACCCCAA CGCCATCAAT 240AACGCAAGGG GCAATTTGAA CGCGAGCGCG AAGAATTTGA TCAATGATAA AAAGAATTCC 300CCGGCGTATC AAGCCGTGCT TTTAGCCTTG AATGCGGCAG CGGGGTTGTG GCAAGTCATG 360AGCTATGCGA TCAGCCCTTG TGGTCCCGGT AAAGACACAA GCAAAAATGG GGGCGTTCAA 420ACTTTCCACA ACACGCCTTC AAATCAATGG GGAGGCACTA CCATTACTTG TGGCACTACT 480GGTTATGAAC CAGGACCATA CAGCATTTTA TCCACTGAAA ATTACGCGAA AATCAATAAA 540GCTTATCAAA TCATCCAAAA GGCTTTTGGG AGCAGCGGAA AAGATATTCC TGCCTTAAGC 600GACACCAACA CAGAACTCAA ATTCACAATC AATAAAAATA ATGGAAACAC GAATACGAAT 660AATAATGGAG AAGAAATTGT TACAAAAAAT AACGCTCAAG TTCTTTTAGA ACAGGCTAGC 720ACCATTATAA CTACCCTTAA TAGCGCATGC CCATGGATCA ACAATGGTGG TGCAGGTGGT 780GCGAGTAGTG GTAGTTTATG GGAAGGAATA TATTTGAAAG GCGATGGGAG CGCTTGCGGG 840ATTTTTAAAA ATGAAATCAG CGCGATTCAA GACATGATCA AAAACGCTGC AATAGCCGTA 900GAGCAATCCA AGATCGTTGC TGCAAACGCG CAAAACCAGC GCAACCTAGA CACCGGGAAG 960ACATTCAACC CCTATAAAGA CGCCAACTTC GCCCAAAGCA TGTTCGCTAA CGCCAAAGCG 1020CAAGCGGAGA TTTTAAACCG CGCCCAAGCA GTGGTGAAAG ACTTTGAAAG AATCCCTGCA 1080GAGTTCGTAA AAGACTCTTT AGGGGTGTGC CATGAAGTGC AAAACGGCCA TCTCCGTGGC 1140ACGCCATCCG GCACGGTAAC TGATAACACT TGGGGAGCCG GTTGCGCGTA TGTGGGAGAG 1200ACCGTAACGA ATCTAAAAGA CAGCATCGCT CATTTTGGCG ACCAAGCCGA GCGAATCCAT 1260AACGCGCGCA ACCTCGCTAC ACTTTAG 1287(2)INFORMATION FOR SEQ ID NO6(i)序列特征(A)长度537个碱基对(B)类型核酸(C)链型双链
(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...537(xi)序列描述SEQ ID NO6ATGAACCCCT TATTGCAAGA TTATGCGCGC ATCCTTTTAG AATGGAATCA AACGCACAAC 60TTGAGCGGCG CGAGAAATTT AAGCGAATTA GAACCCCAGA TCACAGACGC TCTAAAGCCC 120TTAGAATTTG TCAAAGATTT TAAAAGCTGC TTGGATATTG GGAGCGGGGC GGGACTTCCT 180GCTATCCCTT TAGCCCTTGA AAAACCTGAA GCGCAATTCA TTCTTTTAGA GCCAAGGGTA 240AAAAGAGCGG CTTTTTTAAA CTACCTTAAA AGCGTTTTGC CTTTAAACAA CATTGAAATC 300ATTAAAAAGC GTTTAGAAGA TTATCAAAAT CTTTTACAAG TGGATTTAAT CACTTCTAGA 360GCGGTCGCTA GCTCTTCTTT TTTGATAGAA AAAAGCCAAC GCTTCCTAAA AGATAAGGGG 420TATTTTTTAT TCTATAAAGG CGAGCAGTTA AAGAATGAAA TCGCTTATAA AACCACTGAA 480TGCTTTATGC ATCAAAAGCG CGTTTATTTT TACAAATCAA AGGAAAGTTT ATGTTAA 537(2)INFORMATION FOR SEQ ID NO7(i)序列特征(A)长度723个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...723(xi)序列描述SEQ ID NO7TTGGGTCTTA AAAAACGAGC TATTTTATGG TCTTTAATGG GATTTTGTGC AGGATTGAGC 60GCGCTTGATT ATGACACCCT AGACCCAAAA TATTACAAAT ATATCAAGTA TTATAAGGCT 120TATGAAGATA AAGAAGTTGA AGAATTGATC AGAGACTTGA AAAGGGCGAA CGCTAAAAGC 180GGGCTTATTT TAGGGATCAA TACCGGTTTT TTTTATAACC ATGAAATCAT GGTCAAAACC 240AATAGCTCCA GTATCACCGG GAATATTTTA AATTATTTGT TCGCCTATGG CTTGCGTTTT 300GGCTATCAAA CTTTCAGGCC GTCGTTTTTT GCGCGCTTGG TTAAGCCCAA TATCATTGGC 360AGGCGCATCT ATATTCAATA TTATGGAGGA GCTCCTAAGA AAGCGGGCTT TGGGAGCGTG 420GGGTTTCAAT CGGTCATGTT GAATGGGGAT TTTTTATTAG ACTTTCCTTT GCCCTTTGTG 480GGGAAATACC TTTATATGGG GGGGTATATG GGTTTAGGCT TGGGGGTTGT GGCGCATGGG 540GTGAATTATA CGGCGGAATG GGGGATGTCT TTTAACGCAG GATTGGCTCT AACGGTATTA 600GAAAAAAACC GCATTGAATT TGAATTTAAA ATTTTGAATA ATTTCCCTTT TTTGCAATCT 660AATTCTTCAA AAGAGACTTG GTGGGGAGCT ATAGCAAGCA TTGGGTATCA ATATGTGTTC 720TAA723(2)INFORMAION FOR SEQ ID NO8(i)序列特征(A)长度942个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...942(xi)序列描述SEQ ID NO8TTGAAACTCA AATACTGGTT AGTTTATCTG GCGTTCATTA TAGGACTTCA AGCGACAGAT 60TATGACAATT TAGAAGAAGA AAACCAACAA TTAGACGAAA AAATAAACAA TTTAAAGCGA 120CAGCTCACCG AAAAAGGGGT TTCACCCAAA GAGATGGATA AGGATAAGTT TGAAGAAGAA 180TATTTAGAGC GAACTTACCC AAAGATTTCT TCAAAGAAAA GAAAAAAATT GCTCAAATCT 240TTTTCCATAG CCGATGATAA GAGTGGGGTG TTTTTAGGGG GCGGGTATGC TTATGGGGAA 300CTTAACTTGT CTTATCAAGG GGAGATGTTA GACAGGTATG GCGCAAATGC CCCTAGCGCG 360TTTAAAAACA ATATCAATAT TAACGCTCCT GTTTCTATGA TTAGCGTTAA ATTTGGGTAT 420CAAAAATACT TCGTGCCTTA TTTTGGGACA CGATTTTATG GGGATTTGTT GCTTGGGGGA 480GGGGCGTTAA AAGAGAACGC GCTCAAGCAG CCTGTAGGCT CGTTTTTTTA TGTTTTAGGG 540GCTATGAATA CCGATTTATT GTTTGACATG CCTTTAGATT TTAAGACTAA AAAGCATTTT 600TTAGGCGTTT ATGCGGGTTT TGGGATAGGG CTTATGCTTT ATCAAGACAA GCCTAATCAA 660AACGGGAGGA ATTTGATAGT AGGGGGTTAT TCAAGCCCTA ATTTTTTATG GAAATCTTTG 720ATTGAAGTGG ATTACACTTT TAATGTGGGC GTGAGTTTAA CGCTTTATAG GAAACACCGC 780TTAGAGATTG GCACAAAATT ACCGATTAGC TATTTGAGGA TGGGAGTAGA AGAGGGAGCG 840ATTTATCACA ATAAAGAAAA TGATGAACGA TTGTTGATTT CGGCTAACAA CCAGTTCAAA 900CGATCCAGTT TTTTATTAGT GAATTATGCG TTCATTTTTT GA 942(2)INFORMATION FOR SEQ ID NO9(i)序列特征(A)长度1182个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1182(xi)序列描述SEQ ID NO9ATGACTTCAG CTTCAAGCCA TTCTTTTAAA GAACAAGATT TTCATATTCC TATCGCTTTC 60GCTTTTGATA AGAATTATCT CATTCCTGCG GGCGCATGCA TTTATTCCTT GCTAGAAAGC 120ATCGCTAAAG CCAATAAAAA AATCCGTTAC ACCTTACACG CTTTAGTGGT AGGCTTGAAT 180GAAGAAGATA AAACAAAACT TAACCAAATC ACAGAGCCTT TTAAAGAATT TGCTGTTTTA 240GAAGTAAAAG ATATTGAACC TTTTTTAGAC ACTATCCCTA ACCCTTTTGA TGAGGATTTC 300ACCAAGCGTT TTTCTAAAAT GGTGTTAGTG AAGTATTTTC TAGCGGATTT ATTCCCCAAA 360TATTCTAAAA TGGTGTGGAG CGATGTGGAT GTTATCTTTT GTAATGAATT TAGCGCTGAT 420TTCTTAAACA TTAAAGAAGA TGATGAGAAT TATTTTTATG GGGTTTATGA CAAAATATAC 480CCGTATGAAG GCTTTTTTTA TTGCAACTTA ACTTACCAGC GAAAAAATCA ATTTTGTAAA 540AAAATATTAG AAATCATACG CGCACAAAAA ATAGATAAAG AACCGCAATT GACAGAATTT 600TGTCGTTCAA AGATCGCGCC ATTAAAAATA GAGTATTGTA TTTTCCCACA CTATTATAGC 660CTTTCTGAAG AGCATTTAAA GGGCGTGGCC AATGCAATTT ATCATAACAC CATTAAACAA 720GCCCTAAGAG AACCTATCGT TATACAATAT GACTCTCATC CTTATTTTCA AATCAAGCCT 780TGGACATATC CTTTTGGTTT GAAAGCGGAT TTATGGCTGA ACGCTTTGGC TAAAACCCCA 840TTTATGAGCG ATTGGTCTTA TTTGATCACA GGGGGTGGGG GGATAGGTGG AGAAAAATGG 900CATTACTACC ATGGCATTGC CGCTTATCAT TACTACTTTC CTTTATGGAA AGCAGAAGAA 960CAGATTGCCC ATGACGCTCT TAAGACATTT TTAAAACATT ATTTTTTGCA CATTCATGAG 1020ATTCCCCAAA ACGCAAGGCG AAGACTATTC AAATACTGCA TTTCAATACC GCTTAAGAGC 1080TTTATTAGTA AAACCCTTAA ATTTCTAAAA CTCCATGCAT TGGTGAAAAA AATCCTAATC 1140CAACTCAAGC TCTTAAAAAA GAACCAGAGC CAAAACTTTT AA1182(2)INFORMATION FOR SEQ ID NO10(i)序列特征(A)长度1308个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1308(xi)序列描述SEQ ID NO10TTGATTTTCT TAAAAAAATC TCTTTGCGCG TTGTTAATTT CAGGTTTTTT CATACCACCC 60TTAATGAAAG CGGCTAGTTT TGTCTATGAC TTGAAGTTTA TGAGCTTTAA TTTCAATCTG 120GCTTCCCCTC CAAATAACCC CTATTGGAAT AGCCTAACCA AAATGCAAGG TCGTCTCATG 180CCTCAAATTG GCGTCCAATT AGACAAAAGA CAGGCCTTGA TGTTTGGGGC GTGGTTCATT 240CAAAATTTGC ACACGCATTA TAGCTATTTC CCTTATTCGT GGGGGGTTAC CATGTATTAC 300CAATACATAG GGAAAAATTT GAGATTTTTT TTAGGCATTG TGCCACGAAG CTATCAAATA 360GGGCATTACC CTTTAAGCGC TTTTAAAAAA CTTTTCTGGT TTATAGACCC TACTTTTAGG 420GGAGGAGCGT TCCAATTCAA ACCGGCTTAT GATCCCAATC GTTGGTGGAA TGGGTGGTTT 480GAGGGCGTTG TGGATTGGTA TGGGGGGCGT AATTGGAACA ACCAGCCCAA AAAGAAAAAT 540TACGATTTTG ATCAATTCTT GTATTTTGTT TCTTCAGAAT TTCAGTTTCT TAAAGGGTAT 600TTAGGTTTGG GGGGACAGCT TGTCATTTTT CATAACGCCA ACTCTCATAG TATGGGGGAT 660AACTACCCTT ATGGCGGGAA TTCCTACTTA AAACCAGGCG ATGCAACCCC ACAATGGCCT 720AATGGCTACC CTTATTTCAG CCAAAAAGAT AACCCACAAG GCGGAGAAAT AGGGAAATAC 780TCTAACCCTA CCATTTTAGA CAGGGTTTAT TACCATGCTT ATTTAAAAGC AGATTTTAAA 840AATCTCATGC CTTATATGGA CAATATTTTC ATGACCTTTG GCACGCAGTC GTCTCAAACC 900CATTATTGCG TGCGTTATGC TAGCGAGTGT AAAAACGCCC GATTTTATAA CAGCTTTGGG 960GGGGAATTTT ACGCTCAAGC GCAATACAAA GGCTTTGGGA TCTTTAACAG ATACTATTTT 1020TCCAACAAAC CCCAAATGCA TTTTTATGCC ACTTATGGCC AATCCCTTTA TACCGGATTG 1080CCATGGTATA GAGCCCCTAA TTTTGACATG ATAGGGCTTT ATTATCTTTA TAAAAACAAA 1140TGGTTAAGCG TGCGAGCGGA TGCGTTTTTT AGCTTTGTGG GTGGGGGCGA TGGGTACCAT 1200TTGTATGGCA AGGGGGGTAA GTGGTTTGTG ATGTATCAGC AATTTTTAAC CCTAACCATA 1260GACACAAGAG AGTTGATTGA TTTTGTCAAA TCTAAAATCC CTAAATAA 1308(2)INFORMATION FOR SEQ ID NO11(i)序列特征(A)长度663个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...663
(xi)序列描述SEQ ID NO11ATGAATAAAA CAACAATTAA AATATTAATG GGCATGGCGT TATTATCATC GCTTCAAGCC 60GCAGAGGCAG AGCTTGATGA AAAATCAAAA AAACCTAAAT TTGCGGATAG GAATACGTTT 120TATTTAGGGG TTGGGTATCA GCTTAGCGCG ATCAACACGT CTTTTAGCAC CAGTTCTATA 180GATAAATCGT ATTTCATGAC CGGCAATGGT TTTGGCGTGG TGTTGGGGGG GAAATTTGTG 240GCTAAAACGC AAGCTGTAGA GCATGTGGGT TTTCGTTACG GGTTGTTTTA TGATCAGACC 300TTTTCTTCTC ACAAATCCTA TATTTCTACC TATGGTTTAG AATTTAGCGG TTTGTGGGAC 360GCTTTCAATT CGCCAAAGAT GTTTTTGGGG TTGGAGTTTG GCTTAGGCAT CGCTGGGGCG 420ACTTACATGC CAGGAGGGGC CATGCATGGG ATTATCGCTC AATATTTAGG CAAAGAAAAT 480TCGCTTTTCC AATTGCTTGT GAAAGTGGGT TTTCGTTTTG GCTTTTTCCA CAATGAAATC 540ACCTTTGGGT TGAAATTCCC TGTCATTCCT AACAAAAAAA CGGAAATCGT TGATGGCTTG 600AGCGCGACCA CTTTATGGCA ACGCTTGCCG GTAGCCTATT TCAATTATAT CTATAATTTT 660TAG663(2)INFORMATION FOR SEQ ID NO12(i)序列特征(A)长度351个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...351(xi)序列描述SEQ ID NO12TTGAATCTCC ATTTTATGAA AGGATTTGTT ATGAGTGGAT TAAGAACATT TAGTTGTGTA 60GTGGTTTTAT GCGGTGCAAT GGTTAATGTA GCTGTAGCTG GTCCTAAAAT AGAGGCAAGG 120GGTGAATTAG GCAAATTTGT AGGGGGAGCT GTTGGAAATT TTGTTGGTGA TAAAATGGGC 180GGATTTGTTG GTGGTGCAAT AGGAGGATAT ATTGGGTCTG AAGTAGGCGA TAGGGTAGAA 240GATTATATCC GTGGCGTTGA TAGAGAGCCA CAAAACAAAG AACCACAAAC CCCAAGAGAA 300CCTATCCGTG ATTTTTATGA TTACGGCTAT AGTTTTGGGC ATGCTTGGTG A351(2)INFORMATION FOR SEQ ID NO13(i)序列特征(A)长度1311个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1311(xi)序列描述SEQ ID NO13ATGTCAAGGG ATTTTAAATT TGATTCTAAC TATTTAAATG TCAATACCAA TCCTAAATTA 60GGCCCCGTTT ATACCAATCA AAATTATCCA GGATTTTTTA TCTTTGATCA TTTAAGGCGT 120TATGTGATGA ACGCTTTTGA GCCTAATTTG AACTTAGTTG TCAATACCAA TAAAGTTAAG 180CAAACTTTTA ATGTGGGCAT GCGTTTTATG ACAATGGATA TGTTCATTAG ATCCGATCAA 240AGCACATGCG AAAAAACAGA TATTATCAAT GGGGTGTGCC ACATGCCTCC TTATGTCCTT 300TCTAAAACGC CTAACAATAA TCAAGAAATG TTTAATAACT ATACAGCGGT ATGGTTGAGC 360GATAAAATAG AGTTTTTTGA TTCTAAATTG GTGATAACTC CAGGGCTTAG ATACACTTTT 420TTGAACTATA ACAACAAAGA GCCAGAAAAG CATGATTTTT CCGTATGGAC CAGTAAAAAA 480CAGCGTCAAA ACGAATGGAG TCCTGCCCTT AATATTGGCT ATAAACCTAT GGAAAATTGG 540ATATGGTATG CGAACTACCG CCGCAGTTTT ATCCCCCCAC AACACACAAT GGTAGGCATT 600ACTAGGACTA ATTACAACCA AATTTTTAAT GAAATTGAAG TGGGGCAGCG CTATAGTTAT 660AAAAATCTAT TGAGTTTTAA CACCAATTAT TTTGTGATTT TTGCCAAGCG TTACTATGCG 720GGAGGCTATA GCCCACAGCC TGTGGATGCC AGAAGTCAAG GGGTGGAATT GGAATTGTAT 780TACGCGCCGA TTAGGGGTTT GCAATTCCAT GTGGCTTACA CTTATATTGA TGCGCGCATC 840ACTTCTAACG CTGATGATAT TGCTTATTAT TTTACAGGCA TTGTCAATAA ACCCTTTGAC 900ATTAAAGGGA AGCGCTTGCC CTATGTGAGT CCTAACCAAT TCATATTTGA CATGATGTAT 960ACTTACAAGC ACACGACTTT TGGTATCAGC AGCTATTTTT ATAGCCGCGC TTATAGTTCC 1020ATGCTCAATC AAGCCAAAGA TCAAACCGTA TGCCTGCCCT TAAACCCAGA ATACACAGGG 1080GGGTTAAAGT ATGGTTGTAA TTCAGTGGGG TTATTGCCCT TGTATTTTGT GTTGAATGTC 1140CAAGTAAGCT CAATCTTATG GCAAAGCGGT AGGCATAAAA TCACAGGGAG TTTGCAAATC 1200AATAACCTTT TTAACATGAA GTATTATTTT AGGGGGATTG GCACAAGCCC TACAGGGAGA 1260GAACCCGCGC CAGGGAGATC CATTACAGCG TATTTGAATT ATGAGTTTTA A 1311(2)INFORMATION FOR SEQ ID NO14(i)序列特征(A)长度2304个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...2304(xi)序列描述SEQ ID NO14ATGAAAAGAA TTTTAGTTTC TTTGGCTGTT TTGAGTCATA GCGCGCATGC TGTCAAAACT 60CATAATTTGG AAAGGGTGGA AGCTTCAGGG GTGGCTAACG ATAAAGAAGC GCCTTTAAGC 120TGGAGGAGCA AGGAAGTTAG AAATTATATG GGTTCTCGCA CGGTGATTTC TAACAAGCAA 180CTCACTAAAA GCGCCAATCA AAGCATTGAA GAAGCTTTGC AAAATGTGCC AGGCGTGCAT 240ATTAGAAACT CTACCGGTAT TGGAGCTGTG CCTAGCATTT CCATTAGGGG GTTTGGTGCT 300GGAGGCCCAG GGCATTCTAA TACGGGAATG ATTCTAGTCA ATGGGATTCC TATTTATGTC 360GCGCCCTATG TTGAAATTGG CACGGTTATT TTTCCTGTAA CCTTTCAGTC TGTGGATAGA 420ATCAGCGTAA CTAAGGGTGG GGAGAGCGTG CGTTATGGCC CTAACGCTTT TGGCGGTGTG 480ATCAACATCA TCACCAAAGG CATTCCTACC AATTGGGAAA GTCAGGTGAG CGAGAGGACC 540ACTTTTTGGG GCAAGTCTGA AAACGGGGGC TTTTTCAATC AAAATTCTAA AAACATTGAT 600AAAAGCTTAG TTAATAACAT GCTTTTTAAC ACCTATTTAA GAACGGGGGG TATGATGAAT 660AAGCATTTTG GAATCCAAGC TCAAGTCAAT TGGCTCAAAG GGCAAGGGTT TAGATACAAC 720AGCCCTACGG ATATTCAAAA TTACATGTTA GATTCATTGT ATCAAATCAA TGATAGCAAT 780AAAATCACCG CTTTTTTTCA ATATTATAGT TATTTCTTGA CAGACCCTGG ATCTTTAGGC 840ATAGCCGCTT ACAATCAAAA TCGTTTTCAA AACAACCGCC CCAATAACGA TAAAAGCGGG 900AGAGCGAAGC GATGGGGAGC TGTGTATCAA AACTTTTTTG GGGACACGGA TAGGGTAGGG 960GGGGATTTCA CTTTTAGCTA CTATGGGCAT GACATGTCAA GGGATTTTAA ATTTGATTCT 1020AACTATTTAA ATGTCAATAC CAATCCTAAA TTAGGCCCCG TTTATACCAA TCAAAATTAT 1080CCAGGATTTT TTATCTTTGA TCATTTAAGG CGTTATGTGA TGAACGCTTT TGAGCCTAAT 1140TTGAACTTAG TTGTCAATAC CAATAAAGTT AAGCAAACTT TTAATGTGGG CATGCGTTTT 1200ATGACAATGG ATATGTTCAT TAGATCCGAT CAAAGCACAT GCGAAAAAAC AGATATTATC 1260AATGGGGTGT GCCACATGCC TCCTTATGTC CTTTCTAAAA CGCCTAACAA TAATCAAGAA 1320ATGTTTAATA ACTATACAGC GGTATGGTTG AGCGATAAAA TAGAGTTTTT TGATTCTAAA 1380TTGGTGATAA GTCCAGGGCT TAGATACACT TTTTTGAACT ATAACAACAA AGAGCCAGAA 1440AAGCATGATT TTTCCGTATG GACCAGTAAA AAACAGCGTC AAAACGAATG GAGTCCTGCC 1500CTTAATATTG GCTATAAACC TATGGAAAAT TGGATATGGT ATGCGAACTA CCGCCGCAGT 1560TTTATCCCCC CACAACACAC AATGGTAGGC ATTACTAGGA CTAATTACAA CCAAATTTTT 1620AATGAAATTG AAGTGGGGCA GCGCTATAGT TATAAAAATC TATTGAGTTT TAACACCAAT 1680TATTTTGTGA TTTTTGCCAA GCGTTACTAT GCGGGAGGCT ATAGCCCACA GCCTGTGGAT 1740GCCAGAAGTC AAGGGGTGGA ATTGGAATTG TATTACGCGC CGATTAGGGG TTTGCAATTC 1800CATGTGGCTT ACACTTATAT TGATGCGCGC ATCACTTCTA ACGCTGATGA TATTGCTTAT 1860TATTTTACAG GCATTGTCAA TAAACCCTTT GACATTAAAG GGAAGCGCTT GCCCTATGTG 1920AGTCCTAACC AATTCATATT TGACATGATG TATACTTACA AGCACACGAC TTTTGGTATC 1980AGCAGCTATT TTTATAGCCG CGCTTATAGT TCCATGCTCA ATCAAGCCAA AGATCAAACC 2040GTATGCCTGC CCTTAAACCC AGAATACACA GGGGGGTTAA AGTATGGTTG TAATTCAGTG 2100GGGTTATTGC CCTTGTATTT TGTGTTGAAT GTCCAAGTAA GCTCAATCTT ATGGCAAAGC 2160GGTAGGCATA AAATCACAGG GAGTTTGCAA ATCAATAACC TTTTTAACAT GAAGTATTAT 2220TTTAGGGGGA TTGGCACAAG CCCTACAGGG AGAGAACCCG CGCCAGGGAG ATCCATTACA 2280GCGTATTTGA ATTATGAGTT TTAA 2304(2)INFORMATION FOR SEQ ID NO15(i)序列特征(A)长度348个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征
(A)名称/关键词misc_特征(B)位置1...348(xi)序列描述SEQ ID NO15TTGCACCCTC TATGCGCACA CGGCCAATGT GGAAGCGAAG CGATTGCGTG TTTAGAAGCC 60ATTAGCGTGG GGATTGTGCC TGTTATCGCT AATAGCCCTT TAAGCGCGAC CAGGCAATTC 120GCGCTAGATG AACGATCGTT ATTTGAGCCT AATAACGCTA AAGATTTGAG CGCTAAAATA 180GACTGGTGGT TAGAAAACAA ACTTGAAAGA GAAAGAATGC AAAACGAATA CGCTAAAAGC 240GCTTTAAACT ACACTTTAGA AAATTCAGTC ATTCAAATTG AAAAAGTTTA TGAAGAAGCG 300ATCAAAGATT TTAAAAACAA CCCCAACCTC TTTAAAACCT TATCGTAA 348(2)INFORMATION FOR SEQ ID NO16(i)序列特征(A)长度1170个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1170(xi)序列描述SEQ ID NO16ATGGTTATTG TTTTAGTCGT GGATAGCTTT AAAGACACCA GTAATGGCAC TTCTATGACA 60GCGTTTCGTT TTTTTGAAGC GCTGAAAAAA AGAGGGCATG CGATGAGAGT GGTCGCCCCT 120CATGTGGATA ATTTAGGGAG TGAAGAAGAG GGGTATTACA ACCTTAAAGA GCGCTATATC 180CCCCTAGTTA CAGAAATTTC ACACAAGCAA CACATTCTTT TTGCCAAACC GGATGAAAAA 240ATTCTACGAA AGGCTTTTAA GGGAGCGGAT ATGATCCATA CTTACTTGCC TTTTTTGCTA 300GAAAAAACAG CCGTAAAAAT CGCGCGAGAA ATGCGAGTGC CTTATATTGG CTCTTTCCAT 360TTACAGCCAG AGCATATTTC TTATAACATG AAATTGGGGC AATTTTCTTG GCTAAATACC 420ATGCTTTTTT CATGGTTTAA ATCTTCGCAT TACCGCTATA TCCACCATAT CCATTGCCCA 480TCAAAATTCA TTGTAGAAGA ATTGGAAAAA TACAACTATG GAGGAAAAAA ATACGCTATC 540TCTAACGGCT TTGATCCCAT GTTTAAGTTT GAGCACCCGC AAAAAAGCCT TTTTGACACC 600ACGCCCTTTA AAATCGCTAT GGTAGGGCGC TATTCTAATG AAAAAAATCA AAGCGTTCTC 660ATTAAAGCGG TTGCTTTAAG CCGATACAAA CAAGACATTG TATTATTACT CAAAGGCAAG 720GGGCCTGATG AGAAAAAAAT CAAACTTCTA GCCCAAAAAC TAGGCGTAAA AACGGAGTTT 780GGGTTTGTCA ATTCCCATGA ATTGTTAGAG ATTTTAAAAA CTTGCACCCT CTATGCGCAC 840ACGGCCAATG TGGAAAGCGA AGCGATTGCG TGTTTAGAAG CCATTAGCGT GGGGATTGTG 900CCTGTTATCG CTAATAGCCC TTTAAGCGCG ACCAGGCAAT TCGCGCTAGA TGAACGATCG 960TTATTTGAGC CTAATAACGC TAAAGATTTG AGCGCTAAAA TAGACTGGTG GTTAGAAAAC 1020AAACTTGAAA GAGAAAGAAT GCAAAACGAA TACGCTAAAA GCGCTTTAAA CTACACTTTA 1080GAAAATTCAG TCATTCAAAT TGAAAAAGTT TATGAAGAAG CGATCAAAGA TTTTAAAAAC 1140AACCCCAACC TCTTTAAAAC CTTATCGTAA 1170(2)INFORMATION FOR SEQ ID NO17(i)序列特征(A)长度939个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...939(xi)序列描述SEQ ID NO17TTGGCTTCTT ACGGGTTTTT TTTAGGAGCG TTGTTTATTT TAGCGAGCGG GATCGTGTGC 60TTACAGACTG CCGGTAATCC CTTTGTAACC TTGCTTTCTA AAGGTAAAGA AGCCAGAAAC 120TTGGTTTTAG TCCAGGCGTT CAATTCGCTT GGCACGACTT TAGGGCCTAT TTTTGGGAGC 180TTGTTGATTT TTAGCGCGAC CAAAACGAGC GATAATTTAA GCCTGATAGA CAAGTTAGCG 240GACGCTAAAA GCGTTCAAAT GCCTTATTTG GGTTTAGCGG TGTTTTCGCT TCTTTTAGCG 300CTTGTGATGT ATCTTTTAAA ATTGCCTGAT GTGGAAAAAG AAATGCCCAA AGAAACGACG 360CAAAAAAGCC TGTTTTCGCA CAAACACTTT GTTTTTGGGG CTTTAGGGAT CTTTTTCTAT 420GTGGGGGGAG AAGTGGCGAT TGGATCATTC TTGGTGCTAA GCTTTGAAAA GCTTTTGAAT 480TTAGACGCTC AATCAAGCGC GCATTACTTG GTGTATTATT GGGGCGGCGC GATGGTAGGG 540CGTTTCTTAG GCAGCGCTTT GATGAATAAA ATCGCTCCTA ATAAATACCT GGCTTTCAAC 600GCCTTAAGCT CTATCATTCT TATCGCTTTG GCTATTCTTA TTGGAGGCAA GATCGCTTTA 660TTCGCTCTGA CTTTTGTGGG CTTTTTCAAC TCTATCATGT TCCCTACAAT CTTTTCTTTG 720GCTACGCTCA ATTTAGGGCA TCTCACTTCT AAGGCTTCTG GAGTGATTAG CATGGCGATT 780GTGGGAGGGG CGTTAATCCC CCCCATTCAA GGCGTGGTTA CAGACATGCT CACAGCAACC 840GAATCGAATC TGCTCTACGC TTATAGCGTG CCGTTGTTGT GCTATTTTTA TATCCTCTTC 900TTTGCACTTA AGGGGTATAA ACAAGAAGAA AACTCCTAA 939(2)INFORMATION FOR SEQ ID NO18(i)序列特征(A)长度1224个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1224(xi)序列描述SEQ ID NO18ATGCAAAAAA CTTCTAACAC TTTAGCGCTG GGGAGTTTGA CGGCGCTATT CTTTCTAATG 60GGTTTTATCA CGGTTTTAAA CGACATTTTG ATCCCGCATT TAAAGCCCAT TTTTGACTTG 120ACCTATTTTG AAGCTTCGCT CATTCAATTT TGCTTTTTTG GGGCGTATTT CATCATGGGG 180GGAGTCTTTG GGAACGTGAT CAGTAAAATC GGCTACCCTT TTGGCGTGGT GCTTGGTTTT 240GTGATCACAG CGAGCGGGTG CGCGTTGTTT TATCCGGCGG CGCATTTTGG CTCTTACGGG 300TTTTTTTTAG GAGCGTTGTT TATTTTAGCG AGCGGGATCG TGTGCTTACA GACTGCCGGT 360AATCCCTTTG TAACCTTGCT TTCTAAAGGT AAAGAAGCCA GAAACTTGGT TTTAGTCCAG 420GCGTTCAATT CGCTTGGCAC GACTTTAGGG CCTATTTTTG GGAGCTTGTT GATTTTTAGC 480GCGACCAAAA CGAGCGATAA TTTAAGCCTG ATAGACAAGT TAGCGGACGC TAAAAGCGTT 540CAAATGCCTT ATTTGGGTTT AGCGGTGTTT TCGCTTCTTT TAGCGCTTGT GATGTATCTT 600TTAAAATTGC CTGATGTGGA AAAAGAAATG CCCAAAGAAA CGACGCAAAA AAGCCTGTTT 660TCGCACAAAC ACTTTGTTTT TGGGGCTTTA GGGATCTTTT TCTATGTGGG GGGAGAAGTG 720GCGATTGGAT CATTCTTGGT GCTAAGCTTT GAAAAGCTTT TGAATTTAGA CGCTCAATCA 780AGCGCGCATT ACTTGGTGTA TTATTGGGGC GGCGCGATGG TAGGGCGTTT CTTAGGCAGC 840GCTTTGATGA ATAAAATCGC TCCTAATAAA TACCTGGCTT TCAACGCCTT AAGCTCTATC 900ATTCTTATCG CTTTGGCTAT TCTTATTGGA GGCAAGATCG CTTTATTCGC TCTGACTTTT 960GTGGGCTTTT TCAACTCTAT CATGTTCCCT ACAATCTTTT CTTTGGCTAC GCTCAATTTA 1020GGGCATCTCA CTTCTAAGGC TTCTGGAGTG ATTAGCATGG CGATTGTGGG AGGGGCGTTA 1080ATCCCCCCCA TTCAAGGCGT GGTTACAGAC ATGCTCACAG CAACCGAATC GAATCTGCTC 1140TACGCTTATA GCGTGCCGTT GTTGTGCTAT TTTTATATCC TCTTCTTTGC ACTTAAGGGG 1200TATAAACAAG AAGAAAACTC CTAA1224(2)INFORMATION FOR SEQ ID NO19(i)序列特征(A)长度378个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...378(xi)序列描述SEQ ID NO19ATGAATAAAA TCGCTCCTAA TAAATACCTG GCTTTCGGCG CCTTAAGCTC TATCATTCTT 60ATCGCTTTGG CTATTCTTAT TGGAGGCAAG ATCGCTTTAT TCGCTCTGAC TTTTGTGGGC 120TTTTTCAACT CTATCATGTT CCCTACAATC TTTTCTTTGG CTACGCTCAA TTTAGGCATC 180TCACTTCTAA TGGCTTCTGG AGTGATTAGC ATGGCGATTG TGGGAGGGGC GTTAATCCCC 240CCCATTCAAG GCGTGGTTAC AGACATGCTC ACAGCAACCG AATCGAATCT GCTCTACGCT 300TATAGCGTGC CGTTGTTGTG CTATTTTTAT ATCCTCTTCT TTGCACTTAA GGGGTATAAA 360CAAGAAGAAA ACTCCTAA378(2)INFORMATION FOR SEQ ID NO20(i)序列特征(A)长度993个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...993(xi)序列描述SEQ ID NO20TTGAAAAAAA TATTACCGGC TTTGTTAATG GGGTTTGTGG GATTGAATGC TAGTGATCGT 60TTGTTAGAAA TCATGCGCCT TTATCAAAAA CAAGGCTTGG AAGTGGTGGG TCAAAAATTG 120GATTCTTATT TAGCGGATAA GTCTTTTTGG GCAGAAGAGC TTCAAAACAA GGACACGGAT 180TTTGGCTATT ATCAAAACAA GCAGTTTTTA TTTGTGGCGG ATAAATCCAA GCCCAGTTTG 240GAGTTTTATG AAATAGAAAA TAACATGCTT AAAAAAATCA ACAGCTCTAA AGCCCTTGTA 300GGCTCTAAAA AGGGCGATAA AACTTTAGAG GGCGATTTGG CCACGCCTAT TGGAGTGTAT 360CGTATCACGC AGAAATTAGA GCGTTTGGAT CAATATTATG GCGTTTTGGC TTTTGTAACG 420AATTACCCTA ATTTGTATGA CACTTTGAAA AAACGCACCG GGCATGGCAT TTGGGTGCAT 480GGAATGCCTT TAAATGGCGA TAGGAATGAA TTGAACACTA AGGGTTGCAT TGCGATTGAA 540AACCCTATTC TAAGCTCTTA TGACAAAGTG TTAAAAGGCG AAAAAGCGTT CCTTATCACT 600TATGAAGACA AGTTTTCCCC TAGCACTAAA GAAGAATTGA GCATGATTTT AAGCTCCCTT 660TTCCAATGGA AAGAAGCTTG GGCTAGGGGC GATTTTGAAC GCTACATGCG TTTTTATAAC 720CCCAATTTCA CTCGCTATGA CGGCATGAGT TTTAACGCTT TTAAAGAGTA TAAAAAAAGG 780GTGTTTGCAA AAAATGAAAA AAAGAATATC GCTTTTTCCT CTATCAATGT GATCCCTTAC 840CCCAACTCTC AAAACAAACG CTTGTTTTAT GTGGTATTTG ACCAAGATTA CAAAGCCTAC 900CAGCAAAACA AGCTCTCTTA TAGCTCCAAT TCTCAAAAAG AACTCTATGT AGAGATTGAA 960AACAATCAAG CGTCTATTAT AATGGAAAAA TAA 993(2)INFORMATION FOR SEQ ID NO21
(i)序列特征(A)长度510个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...510(xi)序列描述SEQ ID NO21TTGTTTGAGA AATGGATTGG TCTGACCTTA CTCCTTAGTT CCTTAGGCTA TCCATGCCAA 60AAGGTAAGTA TTAGTTTCAA GCAATACGAA AATCTTATCC ATATCCATCA AAAAGGTTGC 120AACAATGAAG TGGTGTGCAG AACGCTCATC TCTATCGCTT TACTAGAAAG CTCTCTAGGG 180TTGAACAACA AGCGAGAAAA ATCCCTTAAA GACACTTCTT ACTCCATGTT CCATATCACC 240TTAAACACCG CTAAAAAGTT CTACCCTACC TATTCTAAAA CGCTCCTCAA AACCAAATTG 300TTAAATGATG TGGGTTTTGC GATCCAATTA GCCAAACAAA TTTTAAAAGA AAATTTTGAT 360TATTACCACC AAAAACACCC CAACAAAAGC GTGTATCAAT TAGTACAAAT GGCCATAGGC 420GCTTACAATG GGGGAATGAA ACACAACCCT AATGGCGCTT ACATGAAGAA GTTTCGTTGC 480ATTTATTCTC AAGTGCGATA CAACGAATAA 510(2)INFORMATION FOR SEQ ID NO22(i)序列特征(A)长度648个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...648(xi)序列描述SEQ ID NO22ATGAAAAAAC CCTACAGAAA GATTTCTGAT TATGCGATCG TGGGTGGTTT GAGCGCGTTA 60GTGATGGTAA GCATTGTGGG GTGTAAGAGC AATGCCGATG ACAAACCAAA AGAGCAAAGC 120TCTTTAAGTC AAAGCGTTCA AAAAGGCGCG TTTGTGATTT TAGAAGAGCA AAAGGATAAA 180TCTTACAAGG TTGTTGAAGA ATACCCCAGC TCAAGAACCC ACATTGTAGT GCGCGATTTG 240CAAGGCAATG AACGCGTGTT GAGCAATGAA GAGATTCAAA AGCTCATCAA AGAAGAAGAA 300GCCAAAATTG ATAACGGCAC GAGCAAGCTT GTCCAGCCTA ATAATGGAGG GAGTAATGAA 360GGATCAGGCT TTGGCTTGGG AAGCGCGATT TTAGGGAGCG CGGCGGGGGC GATTTTAGGG 420AGTTATATTG GCAATAAGCT TTTTAATAAC CCTAATTATC AGCAAAACGC CCAACGGACC 480TACAAATCCC CACAAGCTTA CCAACGCTCT CAAAATTCTT TTTCTAAAAG CGCACCCAGC 540GCTTCAAGCA TGGGCACAGC GAGTAAGGGA CAGAGCGGGT TTTTTGGCTC TAGTAGGCCT 600ACTAGTTCGC CTGCAATAAG CTCTGGGACA AGGGGCTTTA ACGCATAA 648(2)INFORMATION FOR SEQ ID NO23(i)序列特征(A)长度762个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...762
(xi)序列描述SEQ ID NO23TTGAAAACTC TATTTAGTGT TTATCTCTTT TTGTCGTTGA ATCCACTCTT TTTAGAAGCT 60AAAGAAATCA CTTGGTCTCA ATTCTTGGAA AATTTTAAAA ACAAGAATGA AGACGACAAA 120CCTAAACCCC TAACCATTGA CAAAAACAAT GAAAAACAGC AAATCCTAGA CAAAAACCAG 180CAAATCTTAA AAAGGGCTTT AGAAAAAAGC CTTAAATTTT TCTTTATTTT TGGATACAAC 240TATTCGCAAG CCGCTTATTC AACCACTAAT CAAAACTTGA CTCTTACGGC GAATAGCATA 300GGGTTTAACA CCGCTACAGG CTTGGAGCAT TTTTTAAGAA ACCACCCTAA AGTCGGTTTT 360AGAATCTTTA GCGTCTATAA CTATTTCCAT TCCGTTTCGC TCTCCCAGCC TCAAATCCTA 420ATGGTGCAAA ATTACGGAGG CGCGTTAGAT TTTTCTTGGA TTTTTGTGGA TAAAAAAACC 480TATCGCTTTA GGAGTTATTT AGGAATCGCT TTAGAGCAAG GGGTGTTGTT AGTGGATACG 540ATTAAAACCG GCTCTTTCAC AACCATCATC CCAAGAACCA AGAAAACCTT TTTTCAAGCC 600CCTTTGCGTT TTGGTTTTAT CGTGGATTTT ATCGGCTATT TGTCTTTGCA ATTAGGGATT 660GAAATGCCCT TAGTGAGGAA TGTTTTTTAC ACCTACAATA ACCATCAAGA AAGATTCAAA 720CCACGATTTA ACGCTAATCT TTCTTTAATC GTTTCGTTTT AG 762(2)INFORMATION FOR SEQ ID NO24(i)序列特征(A)长度1011个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1011(xi)序列描述SEQ ID NO24TTGTTTTTCA AATTTATTTT ATGTTTATCA TTAGGAATAT TTGCATGGGC AAAAGAGGTC 60ATTCCCACCC CTTCAACCCC ATTAACGCCC TCTAAACGCT ATTCTATCAA TTTGATGACT 120GAAAATGATG GTTATATCAA TCCTTACATT GATGAGTATT ACACGGCAGG CAATCAAATA 180GGCTTTTCTA CTAAAGAGTT TGATTTTTCT AAAAATAAAG CGATGAAATG GTCTTCGTAT 240TTAGGGTTTT TCAATAAAAG CCCTAGGGTT ACTCGTTTTG GCATTTCTCT CGCCCAAGAC 300ATGTATACCC CCTCACTTGC AAACAGAAAA CTGGTGCATT TGCATGACAA CCACCCTTAT 360GGGGGGTATT TGAGGGTGAA TTTGAACGTG TATAACCGCC ATCAAACTTT CATGGAGTTA 420TTCACGATTT CTTTAGGCAC GACAGGCCAA GATTCTTTGG CCGCTCAAAC GCAGCGTCTC 480ATTCATAAAT GGGGTCATGA TCCCCAATTT TATGGCTGGA ACACGCAGCT CAAAAACGAA 540TTTATCTTTG AACTGCACTA CCAATTGCTT AAAAAAGTCC CCCTTTTAAA GACTCGTTTT 600TTTTCTATGG AGTTGATGCC TGGGTTTAAT GTGGAACTGG GTAATGCGAG GGATTATTTC 660CAACTCGGCT CGCTCTTTAG GGCTGGGTAT AACTTGGACG CTGATTATGG GGTCAATAAG 720GTCAATACCG CTTTTGATGG GGGCATGCCT TATAGCGATA AGTTTTCCAT CTATTTTTTT 780GCAGGGGCTT TTGGGCGCTT CCAACCCCTT AACATCTTCA TTCAAGGCAA TAGCCCTGAA 840ACTAGGGGCA TTGCCAATTT GGAATACTTT GTTTATGCCA GTGAAATAGG AGCGGCTATG 900ATGTGGCGTA GCCTCAGGGT GGCTTTTACA ATCACTGATA TTAGTAAAAC CTTTCAGTCC 960CAGCCTAAGC ACCATCAGAT CGGCACCTTA GAATTGAATT TCGCCTTTTG A 1011(2)INFORMATION FOR SEQ ID NO25(i)序列特征(A)长度327个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关链词misc_特征(B)位置1...327(xi)序列描述SEQ ID NO25ATGAAACCAA TCTTTAGCCT CTTTTTCCTC CTTATTGTTT TAAAAGCGCA CCCCATAAAC 60CCCTTATTAG AGCCGTTATA TTTCCCCAGT TACACGCAAT TTTTAGATTT AGAACCTCAT 120TTTGTCATTA AAAAAAAGCG CGCTTACAGG CCTTTTCAAT GGGGGAACAC TATTATTATC 180AAACGCCATG ATTTAGAAGA GCGCCAGAGC AACCAACCAA GCGATATTTT CCGCCAGAAC 240GCTGAAATCA ATGTGTCTTC TCAAACTTTT TTAAGAGGAA TCAGCAGCGC TTCTTCACGC 300ATAGTGATCG ATTCGGTCGC TCAGTAA327(2)INFORMATION FOR SEQ ID NO26(i)序列特征(A)长度588个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...588(xi)序列描述SEQ ID NO26ATGAGCAATA ACCCCTTTAA AAAAGTGGGC ATGATCAGCT CTCAAAACAA TAACGGCGCT 60TTGAACGGGC TTGGCGTGCA AGTGGGTTAT AAACAATTCT TTGGCGAAAG CAAAAGATGG 120GGGTTAAGGT ATTATGGTTT CTTTGATTAC AACCACGGCT ATATCAAATC CAGCTTTTTT 180AATTCTTCTT CTGATATATG GACTTATGGC GGTGGGAGCG ATTTGTTAGT GAATTTTATC 240AACGATAGCA TCACAAGAAA GAACAACAAG CTTTCTGTGG GTCTTTTTGG TGGTATCCAA 300CTAGCAGGGA CTACATGGCT TAATTCTCAA TACATGAATT TAACAGCGTT CAATAACCCT 360TACAGCGCGA AAGTCAATGC TTCCAATTTC CAATTTTTGT TCAATCTCGG CTTGAGGACG 420AATCTCGCTA CAGCTAAGAA AAAAGACAGC GAACGTTCCG CGCAACATGG CGTTGAACTG 480GGCATTAAAA TCCCTACCAT TAACACCAAT TATTATTCTT TTCTAGGCAC TAAGCTAGAA 540TACAGAAGGC TTTATAGCGT GTATCTCAAT TATGTGTTTG CTTATTAA 588(2)INFORMATION FOR SEQ ID NO27(i)序列特征(A)长度684个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状
(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...684(xi)序列描述SEQ ID NO27GTGCGTTTTG GTAAAATTGA TTATTTGAAC ATGCTCCCTT TTGATGTGTT TATCAAATCC 60TACCCCACCC CTTGTTATTT CAAACAATTC TTACGGCTTA AAAAAACCTA CCCCTCCAAA 120CTCAATGAGA GTTTTTTATT CAGGCGCATT GATGCGGGGT TTATTTCTTC TATCGCTGGC 180TATCCATTCG CTCTTTGTTC TTATTCTCTA GGCATTGTCG CTTATAAGGA AGTTTTAAGC 240GTGTTGGTTG TAAATAGAGA AAACGCTTTT GACAAAGAAA GCGCTTCTTC AAACGCCCTC 300TCTAAAGTGT TAGGGTTAAA AGGCGAGGTC TTAATCGGCA ATAAAGCGCT GCAATTTTAT 360TATTCCAACC CTAAAAAAGA TTTTATAGAT TTAGCCGCTC TGTGGTATGA AAAAAAACGC 420TTGCCGTTTG TTTTTGGGCG TCTGTGCTAT TATCAAAACA AGGATTTTTA CAAACGCTTG 480TCTTTAGCCT TCAAACATCA AAAAACAAAA ATCCCTCACT ACATCCTTAA AGAAGCCGCT 540TTGAAAACCA ACTTGAAACG CCAAGATATT CTAAACTACT TGCAAAAAAT TTACTACACT 600TTAGGCAAAA AGGAACAATC AGGCCTTAAA GCGTTCTATC GTGAATTGTT GTTCAAACGC 660ATCCAAAAAC CCAAGCGGTT TTAG 684(2)INFORMATION FOR SEQ ID NO28(i)序列特征(A)长度918个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...918(xi)序列描述SEQ ID NO28ATGGGTAGAA TTGAATCAAA AAAGCGTTTG AAAGCACTCA TTTTTTTAGC GAGTTTGGGG 60GTGTTGTGGG GCAATGCGGC TGAAAAAACG CCTTTTTTTA AAACTAAAAA CCACATTTAT 120TTGGGTTTTA GGCTAGGCAC AGGGGCTACT ACGCGCACAA GCATGTGGCA ACAAGCCTAT 180AAAGACAACC CCACTTGCCC TAGCAGCGTG TGTTATGGCG AGAAATTAGA AGCCCATTAT 240AAGGGGGGTA AAAACTTATC TTATACCGGG CAAATAGGCG ATGAAATAGC TTTTGATAAA 300TACCATATTT TAGGCTTAAG GGTGTGGGGG GATGTAGAAT ACGCTAAGGC TCAATTAGGT 360CAAAAAGTGG GGGGTAACAC CCTTTTATCC CAAGCGAATT ATAACCCAAG CGCGATTAAA 420ACCTACGATC CTACTTCAAA CGCTCAAGGC TCTTTAGTTT TGCAAAAAAC CCCAAGCCCC 480CAAGATTTCC TTTTCAATAA CGGGCATTTC ATGGCGTTTG GTTTGAACGT GAACATGTTT 540GTCAATCTCC CTATAGACAC CCTTTTAAAA CTCGCTTTAA AAACGGAAAA AATGCTGTTT 600TTTAAAATAG GCGTGTTTGG TGGGGGTGGG GTGGAATACG CAATCTTGTG GAGTCCTCAA 660TATAAAAATC AAAATACCCA TCAAGACGAT AAATTTTTTG CCGCAGGTGG GGGGTTTTTT 720GTGAATTTTG GAGGCTCTTT GTATATAGGC AAGCGCAACC GCTTCAATGT GGGGCTAAAA 780ATCCCTTATT ATAGCTTGAG CGCGCAAAGT TGGAAAAATT TTGGCTCTAG CAATGTGTGG 840CAGCAACAAA CGATCCGACA AAACTTCAGC GTTTTTAGGA ATAAUGAAGT TTTTGTCAGC 900TACGCGTTCT TGTTTTAG918(2)INFORMATION FOR SEQ ID NO29(i)序列特征(A)长度777个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...777(xi)序列描述SEQ ID NO29ATGTTTTTAA GATCATACCC AAAGCTTAGA TACGCTTTAT GTTTACCCCT ACTCACTGAG 60ACTTGCTATA GCGAGGAGCG CACTTTAAAT AAGGTTACCA CCCAAGCTAA AAGGATTTTC 120ACTTACAATA ATGAGTTTAA GGTTACTTCT AAAGAATTGG ATCAACGCCA AAGCAATGAA 180GTCAAAGACC TGTTTAGGAC TAACCCTGAT GTGAATGTGG GCGGAGGGAG CGTGATGGGG 240CAGAAAATCT ACGTGAGAGG CATTGAAGAC AGGCTTTTAA GGGTTACGGT GGATGGGGCT 300GCGCAAAATG GCAACATCTA CCACCACCAA GGCAACACCG TGATTGACCC TGGCATGCTC 360AAAAGCGTGG AAGTTACTAA AGGCGCGGCG AATGCGAGCG CGGGGCCAGG AGCGATCGCG 420GGAGTGATTA AAATGGAGAC TAAAGGAGCG GCTGATTTTA TCCCTAGGGG GAAAAATTAT 480GCAGCGAGTG GGGCGGTGAG TTTTTATACC AATTTTGGGG ACAGAGAGAC TTTTAGATCG 540GCCTATCAAA GCGCGCATTT TGATATTATC GCTTACTACA CGCACCAAAA TATTTTCTAT 600TATAGGAGCG GCGCCACAGT GATGAAAAAC CTTTTCAAAC CCACACAAGC CGATAAAGAG 660CCAGGAACTC CCACCGAGCA AAACAACGCT TTGATTAAAA TGAATGGCTA TTTGAGCGAC 720AGAGACACGC TCACTTTCAG CTGGAACATG ACACGAGATA ACGCCACACG CCTTTAA 777(2)INFORMATION FOR SEQ ID NO30(i)序列特征(A)长度579个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...579(xi)序列描述SEQ ID NO30ATGTTTTTAA GATCATACCC AAAGCTTAGA TACGCTTTAT GTTTACCCCT ACTCACTGAG 60ACTTGCTATA GCGAGGAGCG CACTTTAAAT AAGGTTACCA CCCAAGCTAA AAGGATTTTC 120ACTTACAATA ATGAGTTTAA GGTTACTTCT AAAGAATTGG ATCAACGCCA AAGCAATGAA 180GTCAAAGACC TGTTTAGGAC TAACCCTGAT GTGAATGTGG GCGGAGGGAG CGTGATGGGG 240CAGAAAATCT ACGTGAGAGG CATTGAAGAC AGGCTTTTAA GGGTTACGGT GGATGGGGCT 300GCGCAAAATG GCAACATTTA CCACCACCAA GGCAACACCG TGATTGACCC TGGCATGCTC 360AAAAGCGTGG AAGTTACTAA AGGCGCGGCG AATGCGAGCG CGGGGCCAGG AGCGATCGCG 420GGAGTGATTA AAATGGAGAC TAAAGGAGCG GCTGATTTTA TCCCTAGGGG GAAAAATTAT 480GCAGCGAGTG GGGCGGTGAG TTTTTATACC AATTTTGGGG ACAGAGAGAC TTTTAGATCG 540GCCTATCAAA GCGCGCATTT TGATATTATC GCTTACTAG 579(2)INFORMATION FOR SEQ ID NO31(i)序列特征(A)长度381个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...381(xi)序列描述SEQ ID NO31GTGCCCTTGA GTTTGGGAGG CAACCTCTTA AACCCTAACA ACAGTAGCGT GCTGAATTTA 60AAAAACAGCC AGCTTGTTTT TAGCGATCAA GGGAGCTTGA ATATCGCTAA CATTGATTTA 120CTAAGCGATC TGAATGGTAA TAAAAATCGT GTGTATAACA TCATTCAAGC GGACATGAAT 180GGTAATTGGT ATGAGCGTAT CAACTTCTTT GGCATGCGCA TTAATGATGG GATTTATGAC 240GCTAAAAACC AAACTTATAG TTTCACTAAC CCTCTCAATA ACGCCGTAAA ATTCACCGAG 300AGCTTTTTCA TACACCGCCT GTGCGGTTCG CTCTCTCAAA TACAAAAAAA AAAAAACACA 360ATAGTCTCAC CTCGGCTCTG A381(2)INFORMATION FOR SEQ ID NO32
(i)序列特征(A)长度1698个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1698(xi)序列描述SEQ ID NO32GTGTATTCTT ATAGCGATGA CGCACAAGGC GTGTTTTATC TCACGAGCAG CGTGAAAGGC 60TATTACAACC CCAACCAATC CTATCAAGCC AGCGGCAGCA ATAACACCAC GAAAAATAAC 120AATCTAACCT CTGAATCTTC TGTCATTTCG CAAACCTATA ACGCGCAAGG CAACCCTATC 180AGCGCGTTAC ACGTCTATAA CAAGGGCTAT AATTTCAGTA ATATCAAAGC GTTAGGGCAA 240ATGGCGCTCA AACTCTACCC TGAAATCAAA AAGATATTAG GGAATGATTT TTCGCTTTCA 300AGTTTGAGCA ATTTAAAAGG CGATGCGCTA AACCAGCTTA CCAAGCTCAT CACGCCTAGC 360GATTGGAAAA ACATTAACGA GTTGATTGAT AACGCAAACA ATTCGGTCGT GCAAAATTTC 420AATAACGGCA CTTTGATTAT AGGAGCGACT AAAATAGGGC AAACAGACAC CAATAGTGCG 480GTGGTTTTTG GGGGCTTGGG CTATCAAAAG CCTTGCGATT ACACTGATAT TGTGTGCCAA 540AAATTTAGAG GCACTTATTT GGGGCAGCTT TTGGAGTCCA ACTCCGCTGA TTTGGGCTAT 600ATTGACACGA CTTTTAACGC TAAAGAAATT TATCTTACCG GCACTTTAGG GAGCGGGAAC 660GCATGGGGGA CTGGGGGGAG TGCGAGCGTA ACTTTTAACA GCCAAACTTC GCTCATTCTC 720AACCAAGCGA ATATCGTAAG CTCGCAAACC GATGGGATTT TTAGCATGCT GGGTCAAGAG 780GGCATCAATA AGGTTTTCAA TCAAGCCGGG CTCGCTAATA TTTTGGGCGA AGTGGCAATG 840CAATCCATTA ACAAAGCCGG GGGATTAGGG AATTTGATAG TAAATACGCT AGGGAGTGAT 900AGCGTGATTG GGGGGTATTT AACGCCTGAG CAAAAAAATC AAACCCTAAG CCAGCTTTTG 960GGGCAGAATA ATTTTGATAA CCTCATGAAC GATAGCGGTT TGAACACGGC GATTAAGGAT 1020TTGATCAGAC AAAAATTAGG CTTTTGGACC GGGCTAGTGG GGGGATTAGC CGGACTGGGG 1080GGCATTGATT TGCAAAACCC TGAAAAGCTT ATAGGCAGCA TGTCCATCAA TGATTTATTG 1140AGTAAAAAGG GGTTGTTCAA TCAGATCACC GGCTTTATTT CCGCTAACGA TATAGGGCAA 1200GTCATAAGCG TGATGCTGCA AGATATTGTC AAGCCGAGCG ACGCTTTAAA AAACGATGTA 1260GCCGCTTTGG GCAAGCAAAT GATTGGCGAA TTTTTAGGCC AAGACACGCT CAATTCTTTA 1320GAAAGCTTGC TGCAAAACCA GCAGATTAAA AGCGTTTTAG ACAAAGTCTT AGCGGCTAAA 1380GGATTAGGGT CTATTTATGA ACAAGGTTTG GGGGATTTGA TCCCTAATCT TGGTAAAAAG 1440GGGATTTTCG CTCCCTATGG CTTGAGTCAA GTGTGGCAAA AAGGGGATTT TAGTTTCAAC 1500GCGCAAGGCA ATGTTTTTGT GCAAAATTCC ACTTTCTCTA ACGCTAATGG AGGCACGCTC 1560AGTTTTAACG CAGGAAATTC GCTCATTTTT GCCGGAAACA ACCACATCGC TTTCACTAAC 1620CATTCTGGAA CGCTCAATTT GTTGTCTAAT CAAGTTTCTA ACATTAACGT CACCATGCTT 1680AACGCAGCAA CGGCCTAA 1698(2)INFORMATION FOR SEQ ID NO33(i)序列特征(A)长度519个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...519(xi)序列描述SEQ ID NO33GTGTTTGGAT TGAGTTTGGC GGATATGATT TTAGAGCGTT TTAAAGATTT TATGAGAGAA 60TACCCTGAGC CTTACAAGTT TTTACAGGTT TTTTACGCGC AAGAAAAAGA ACGCTTCTTA 120AATCATAAAA TGAACGATTA TATCAAGCAA AATAAGAGCA AGGAAGAGGC TAGTATTTTG 180GCCAGACAAG GCTTTGTCAG CGTAATTGGA AGAGCGTTAG AAAAAATCAT AGAACTTTTA 240TTAAAAGATT TTTGTATTAA AAACAATGTA AAAATGACGA ACGATAAAAC CTTAAGGGCT 300AAGCGCATTA ATGGCGAATT AGATAAGGTC AAACGGGCTT TATTGGTGCA TTTTGGAGGA 360TATAGCGTTT TACCCGATAT TATTCTTTAT CAAACCAACA AAGATAATAT CAAAATCCTA 420GCGATTTTAT CGGTAAAAAA TTCGTTTAGA GAGCGTTTCA CAAAAGACGC CTTATTGGAA 480ATTAAAACTT TTGCAATCGC CTGTAACTTC TCACATTAA 519(2)INFORMATION FOR SEQ ID NO34
(i)序列特征(A)长度996个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...996(xi)序列描述SEQ ID NO34ATGAAAAGAT TTGTTTTATT CTTGTTATTC ATATGTGTTT GCGTTTGCGT TCAAGCTTAC 60GCTGAGCAAG ATTACTTTTT TAGGGATTTT AAATCTATAG ATTTGCCCCA AAAACTCCAC 120CTTGATAAAA AGCTCTCCCA AACAATACAG CCATGCGCGC AACTTAACGC ATCAAAACAC 180TACACTGCTA CTGGGGTTAG AGAGCCTGAT GCCTGCACCA AGAGTTTTAA AAAATCCGCT 240ATGGTTTCCT ATGATTTAGC GCTAGGCTAT TTAGTGAGCC AAAACAAACC ATACGGCTTA 300AAAGCTATAG AGATTTTAAA CGCTTGGGCT AATGAGCTTC AAAGCGTGGA TACTTATCAA 360AGCGAGGACA ATATCAATTT TTACATGCCT TATATGAACA TGGCTTATTG GTTTGTCAAA 420AAAGAATTTC CTAGCCCAGA ATATGAAGAT TTCATTAGGC GGATGCGTCA GTATTCTCAA 480TCAGCTCTTA ACACTAACCA TGGGGCGTGG GGGATTCTCT TTGATGTGAG CTCTGCACTA 540GCGCTAGATG ATCATGCCCT TTTGCAAAGT AGCGCTAATC GGTGGCAGGA GTGGGTGTTT 600AAAGCCATAG ATGAGAACGG GGTTATTGCT AGCGCGATCA CTAGGAGCGA TACGAGCGAT 660TATCATGGCG GCCCTACAAA GGGCATTAAG GGGATAGCTT ATACCAATTT TGCGCTTCTT 720GCGATAACTA TATCAGGCGA ATTGCTTTTT GAGAACGGGT ATGATTTGTG GGGTAGTGGA 780GCCGGGCAAA GGCTCTCTGT GGCGTATAAC AAAGCCGCAA CATGGATTCT AAACCCTGAA 840ACTTTCCCCT ATTTTCAGCC TAACCTCATT GGGGTGCATA ACAACGCCTA TTTCATTATT 900TTAGCCAAAC ATTATTCTAG CCCTAGCGCG GATGAGCTTT TAGAGCAAGG CGATTTGCAT 960GAAGATGGCT TCAGGCTGAA ACTCCGATCG CCATGA996(2)INFORMATION FOR SEQ ID NO35(i)序列特征
(A)长度384个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...384(xi)序列描述SEQ ID NO35ATGCGTCAGT ATTCTCAATC AGCTCTTAAC ACTAACCATG GGGCGTGGGG GATTCTCTTT 60GATGTGAGCT CTGCACTAGC GCTAGATGAT CATGCCCTTT TGCAAAGTAG CGCTAATCGG 120TGGCAGGAGT GGGTGTTTAA AGCCATAGAT GAGAACGGGG TTATTGCTAG CGCGATCACT 180AGGAGCGATA CGAGCGATTA TCATGGCGGC CCTACAAAGG GCATTAAGGG GATAGCTTAT 240ACCAATTTTG CGCTTCTTGC GATAACTATA TCAGGCGAAT TGCTTTTTGA GAACGGGTAT 300GATTTGTGGG GTAGTGGAGC CGGGCAAAGG CTCTCTGTGG CGTATAACAA AGCCGCAACA 360TGGATTCTAA ACCCTGAAAC TTTC 384(2)INFORMATION FOR SEQ ID NO36(i)序列特征(A)长度738个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源
(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...738(xi)序列描述SEQ ID NO36TTGAGAACCT TGTTAAAAAT GTTGGTTGGT GTGAGCTTAC TAACACACGC TTTAATGGCT 60ACAGAAGAAA GCGCTGCCCC TTCTTGGACA AAAAATTTGT ATATGGGATT CAATTACCAA 120ACAGGTTCTA TCAATTTAAT GACTAATATT CATGAAGTTA GAGAAGTTAC TAGCTATCAA 180ACCGGTTACA CCAATGTAAT GACTAGCATT AATAGCGTTA AAAAACTCAC TAACATGGGT 240TCTAATGGGA TTGGCTTAGT CATGGGCTAT AACCACTTTT TCCATCCGGA TAAAGTCTTG 300GGTTTGCGCT ATTTTGCTTT TTTAGATTGG CAAGGCTATG GCATGAGATA CCCTAAAGGC 360TATTATGGGG GCAATAACAT GATCACTTAT GGCGTGGGCG TGGATGCGAT ATGGAATTTC 420TTCCAAGGGA GTTTTTATCA AGATGATATT GGCGTGGATA TTGGCGTTTT TGGGGGGATT 480GCGATTGCTG GGAATAGCTG GTATATTGGC AATAAAGGGC AGGAATTATT AGGCATCACC 540AATAGTAGTG CGGTTGATAA CACCTCTTTT CAATTCCTCT TTAACTTTGG TTTCAAAGCT 600TTATTTGTAG ATGAACATGA ATTTGAAATT GGGTTTAAAT TCCCCACTCT TAACAACAAA 660TACTACACCA CCGACGCGCT CAAGGTTCAA ATGCGTAGGG TCTTTGCCTT TTATGTGGGG 720TATAATTACC ACTTCTAA738(2)INFORMATION FORSEQ ID NO37(i)序列特征(A)长度873个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...873
(xi)序列描述SEQ ID NO37ATGTTTGAAG AAATTACCCT AGCGCATAAG GACTTGTTTT CAAGGTTTTT ACAAACTCAA 60AAAATCGTTT TATCGGATGT GAGTTTTACC AATTGCTTTT TATGGCAGCA CGCAAGGCTC 120ATTCAAGTGG CTGTGATTAG GGATTGTTTG GTGATTCAAA CCACTTATGA AAACCAAAAA 180CCCTTTTATT TCTATCCTAT CGGTAAGAGG CCGCATGAAT GCGTGAAAGA GCTTTTGGAA 240TTAGAAAAAA ATTTAAGATT CCACTCCCTG ACTTTAGAGC AAAAAGACGA TTTGAAAGAC 300AATTTTGTAG GGGTGTTTGA TTTCACTTAC AACCGAGACA GGAGCGATTA TGTTTATTCT 360ATTGAAGAAC TAATCGCGCT CAAAGGGAAA AAATACCATA AGAAAAAAAA CCACTTAAAC 420CAGTTTTTAA CCAATCATGC GAATTTTGTT TATGAAAAAA TTTCTCCTCA AAACAGAAAG 480GAAGTTTTAG AAGCCTCTAA AGCGTGGTTT TTAGAAAGCC AGACCGATGA TATAGGGTTA 540ATCAACGAAA ATAAGGGCAT TCAAAGCGTT TTAGAAAATT ATGAAAGCTT GGATTTAAAG 600GGGGGGCTTA TTAGGGTTAA TGGGGAAATA GTCTCGTTTA GTTTTGGGGA AGTTTTAAAC 660GAAGAGAGCG CGCTCATCCA CATTGAAAAA GCCCGCACAG ATATTGCAGG CGCGTATCAA 720ATCATCAACC AACAATTGCT TTTGAATGAA TTTAGCCATT TAACTTACGC TAACAGAGAA 780GAAGATCTAG GATTAGAGGG CTTAAGAAGG TCTAAAATGA GCTATAACCC GGTGTTTTTG 840ATAGACAAAT ACGAAGCGGT TGCTAGAAAT TAA 873(2)INFORMATION FOR SEQ ID NO38(i)序列特征(A)长度333个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...333(xi)序列描述SEQ ID NO38ATGATGTTCA TTGTAGCGGT TTTGATGCTG GCGTTTTTGA TCTTTGTCCA TGAGTTAGGG 60CATTTCATTA TCGCTAGGAT TTGTGGGGTG AAAGTGGAAG TGTTTAGCAT TGGTTTTGGT 120AAAAAACTCT GGTTTTTCAA GCTTTTTGGC ACGCAATTCG CTCTGTCTTT GATCCCGCTT 180GGGGGCTATG TGAAATTAAA GGGCATGGAT AAAGAAGAAA ATGAAGAAAA TAAAATTAAT 240CAAGCGAATG ATAGCTACGC CAAAAAAGCC CTTTCCAAAA GCTATGGATA TTGTTTGGTG 300GGGCGTTTTT TAATTTTCTT TTTGCGGTTT TAG 333(2)INFORMATION FOR SEQ ID NO39(i)序列特征(A)长度1056个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1056(xi)序列描述SEQ ID NO39ATGATGTTCA TTGTAGCGGT TTTGATGCTG GCGTTTTTGA TCTTTGTCCA TGAGTTAGGG 60CATTTCATTA TCGCTAGGAT TTGTGGGGTG AAAGTGGAAG TGTTTAGCAT TGGTTTTGGT 120AAAAAACTCT GGTTTTTCAA GCTTTTTGGC ACGCAATTCG CTCTGTCTTT GATCCCGCTT 180GGGGGCTATG TGAAATTAAA GGGCATGGAT AAAGAAGAAA ATGAAGAAAA TAAAATTAAT 240CAAGCGAATG ATAGCTACGC GCAAAAAAGC CCTTTCCAAA AGCTATGGAT ATTGTTTGGT 300GGGGCGTTTT TTAATTTTCT TTTTGCGGTT TTAGTGTATT TTTTTCTGGC ATTGAGCGGG 360GAAAAAGTCT TACTGCCCGT CATTGGCGGT TTAGAAAAAA ACGCGCTAGA AGCCGGGCTG 420TTAAAGGGGG ATAGAATCCT TTCTATCAAC CATCAAAAAA TAGCGAGTTT TAGAGAGATT 480AGAGAGATAG TGGCGCGTTC TCAAGGCGAG TTAATTTTAG AAATAGAGCG AAACAATCAG 540ATTTTAGAAA AACGACTGAC CCCCAAAATC GTGGCGGTGA TAAGCGAGTC TAATGATCCT 600AATGAAATCA TCAAGTATAA AATAATAGGC ATTAAACCGG ACATGCAAAA AATGGGCGTT 660GTCTCTTATT CCGTGTTTCA AGCGTTTGAA AAGGCTTTGA GTCGGTTTAA AGAGGGCGTT 720GTTTTGATTG TGGATTCTTT AAGGCGTTTG ATTATGGGGA GCGCTTCAGT TAAAGAATTG 780AGTGGGGTAA TAGGCATTGT GGGGGCGTTA AGCCATGCCA ATAGCGTGAG CATGCTTTTG 840TTGTTTGGGG CGTTTTTATC TATCAATCTA GGGATTTTAA ATTTATTACC CATTCCAGCC 900TTAGATGGGG CGCAAATGCT AGGGGTCGTT TTTAAAAATA TTTTTCATAT CGCTTTGCCA 960ACGCCCATAC AAAATGCGTT GTGGCTAGTG GGGGTGGGGT TTTTGGTTTT TGTCATGTTT 1020TTAGGGCTTT TTAATGACAT TACTCGTTTG CTATAA 1056(2)INFORMATION FOR SEQ ID NO40(i)序列特征(A)长度303个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...303(xi)序列描述SEQ ID NO40ATGCAAAAGA ATTTGGATAG TCTTTTAGAA AATTTAAGGG CTGAAATTGA TGCGTTGGAT 60AATGAATTGA GCGATCTTTT AGACAAACGC TTAGGAATCG CTTTAAAAAT CGCTCTCATC 120AAACAAGAAA GCCCCCAAGA AAACCCCATT TATTGCCCTA AAAGAGAGCA AGAGATTTTA 180AAACGACTCA GCCAAAGGGG TTTCAAGCAT TTGAATGGAG AAATCCTTGC AAGTTTTTAT 240GCAGAGGTTT TTAAGATTTC TAGAAATTTT CAAGAAAACG CCCTAAAAGA GTTAAAAAAA 300TAA303(2)INFORMATION FOR SEQ ID NO41(i)序列特征(A)长度525个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...525(xi)序列描述SEQ ID NO41GTGAAAATGC GTTTTTTTAG TGGTTTTGGG TTTGTTAATG AAAGCGTTTT GTTTGAAGAG 60TGGCTTTTAA AAGGGGCTTA TGATGTGTCA GGCTTTTCTA TGGGGGCGAT TAAGGCGATA 120GAATACGCCT ATAATGAAGT CTTGCAACAA CGGCGCATCC ATTCCTTATT GTTGTTTTCG 180CCTTGCATGC TAGCGCATAA GAGTTTGGCG TTCAAACGCT TGCAACTTTT CTTGTTTCAA 240AAAGATCCGC AAAGCTACAT GGATAACTTT TATAAGGAAG TGGGATTGGA CGCTCAATTG 300GAGCGTTTTA AAAAAGAGGG TTCTTTAGAA GAATTGGAAT TTTTATTGGA TTACAAGTAT 360AGTGATTCTA TAATTAGATT TTTATTGGAA AAGGGCGTGA AGATTGAAGT GTTTATCGGT 420TTAAAAGATA GAATCACTGA CATTCAAGCC CTTTTAGAAT TTTTTATGCC CTTAGTTCAA 480GTGTGGCAGT TTAAGGATTG TAACCATTTG TTGCAAAAAT CTTAA 525(2)INFORMATION FOR SEQ ID NO42(i)序列特征(A)长度1416个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征
(B)位置1...1416(xi)序列描述SEQ ID NO42ATGAAAAATA CCAATACAAA AGAGATAAAG AATACAAGGA TGAAAAAAGG TTATAGTCAA 60TACCACACGC TCAAAAAAGG GCTTTTAAAA ACCGCTCTGC TTTTTAGCCT TCCTTTAAGC 120GTGGCGTTAG CTGAAGACGA TGGCTTTTAT ATGGGAGTGG GCTATCAAAT CGGCGGCGCG 180CAACAAAACA TCAACAACAA AGGCAGCACC CTAAGGAATA ATGTCATTGA TGATTTCCGC 240CAAGTGGGCG TGGGTATGGC AGGGGGTAAT GGGCTTTTAG CTTTAGCGAC AAACACGACC 300ATGGACGGTC TTTTAGGGAT AGGCAACCAA ATTGTCAATA CTAATACAAC TGTTGGCAAC 360AACAACGCAG AGTTAACCCA GTTTAAAAAA ATACTCCCCC AAATTGAACA ACGCTTTGAG 420ACGAATAAAA ACGCTTATAG CGTTCAAGCC TTGCAAGTGT ATTTGAGTAA TGTGCTTTAT 480AACTTGGTTA ATAATAGTAA TAATGGTAGG AATAATGGAG TCGTTCCTGA ATATGTAGGG 540ATTATAAAAG TTCTCTATGG TTCTCAAAAT GAATTCAGTC TCTTAGCCAC GGAGAGTGTG 600GCGCTTTTAA ACGCGGTCAC GAGAGTGAAT CTGGATAGTA ATTCGGTGTT TTTAAAAGGG 660CTATTAGCCC AAATGGAGCT TTTTAATGAC ACTTCTTCAG CAAAGCTAGG TCAGATCGCA 720GAAAACTTGA AGAACGGTGG TGCAGGGGCC ATGCTTCAAA AGGATGTGAA AACCATCTCG 780GATCGAATCG CTACTTACCA AGAGAATCTA AAACAGCTAG GAGGGATGTT AAAGAATTAC 840GATGAGCCAT ACCTACCCCA ATTTGGGCCA GGCACAAGCT CTCAGCATGG GGTTATTAAT 900GGCTTTGGCA TTCAAGTGGG CTATAAGCAA TTTTTTGGGA GCAAGAAGAA TATAGGCTTA 960CGATATTACG CTTTCTTTGA TTATGGCTTT ACGCAATTGG GCAGTCTTAA CAGTGCTGTT 1020AAAGCGAACA TCTTTACTTA TGGTGCTGGC ACGGACTTTT TATGGAATAT CTTTAGAAGG 1080GTTTTTAGCG ATCAGTCCTT GAATGTGGGG GTGTTTGGGG GCATTCAAAT AGCGGGTAAC 1140ACTTGGGATA GCTCTTTAAG AGGTCAAATT GAAAACTCGT TTAAAGAATA CCCCACTCCC 1200ACGAATTTCC AATTTTTGTT TAATTTGGGC TTAAGGGCTC ATTTTGCCAG CACCATGCAC 1260CGCCGGTTTT TGAGCGCGTC TCAAAGCATT CAGCATGGTA TGGAATTTGG CGTGAAAATC 1320CCAGCTATCA ATCAAAGGTA TTTGAAAGCG AATGGGGCTG ATGTGGATTA CAGGCGTTTG 1380TATGCGTTCT ATATCAATTA CACGATAGGT TTTTAA 1416(2)INFORMATION FOR SEQ ID NO43(i)序列特征(A)长度390个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...390(xi)序列描述SEQ ID NO43ATGAAAAGCA TCAGAAGAGG CGATGGGCTG AATGTTGTCC CTTTCATTGA TATTATGCTC 60GTCTTACTAG CGATTGTGTT GAGTATTTCT ACTTTTATCG CGCAAGGTAA GATTAAAGTC 120AGTCTCCCTA ACGCTAAAAA TGCGGAAAAA TCCCAGCCAA ACGATCAAAA AGTGGTGGTC 180ATCTCTGTGG ATGAGCATGA CAATATTTTC GTAGATGACA AACCGACGAA TTTAGAAGCT 240TTGAGCGCTG TAGTCAAGCA AACAGACCCT AAAACCCTTA TAGATTTAAA AAGCGACAAG 300AGCTCTCGTT TTGAAACTTT TATCAGCATT ATGGATATTT TAAAAGAGCA TAATCATGAA 360AATTTCTCCA TCTCCACGCA AGCTCAGTAA 390(2)INFORMATION FOR SEQ ID NO44(i)序列特征(A)长度225个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...225(xi)序列描述SEQ ID NO44ATGCTCGTCT TACTAGCGAT TGTGTTGAGT ATTTCTACTT TTATCGCGCA AGGTAAGATT 60AAAGTCAGTC TCCCTAACGC TAAAAATGCG GAAAAATCCC GACCAAACGA TCAAAAAGTG 120GTGGTCATCT CTGTGGATGA GCATGACAAT ATTTTCGTAG ATGACAAACC GACGAATTTA 180GAAGCTTTGA GCGCTGTAGT CAAGCAAACA GACCCTAAAA CCCTT 225(2)INFORMATION FOR SEQ ID NO45(i)序列特征(A)长度672个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...672(xi)序列描述SEQ ID NO45ATGTTTTCAC TTTCTTATGT TTCCAAGAAA TTTTTAAGCG TGTTGCTATT GATTTCGCTG 60TTTTTAAGCG CTTGCAAATC CAACAATAAA GACAAATTGG ATGAAAATCT TTTAAGCTCC 120GGCACTCAAA GCTCCAAAGA ATTAAACGAC AAGCGAGACA ATATAGACAA AAAGAGCTAC 180GCTGGTTTAG AAGATGTTTT TTTAGACAAC AAGTCCATTA GCCCTAATGA TAAATACATG 240CTTTTAGTTT TTGGCCGTAA TGGTTGCTCC TATTGTGAAA GGCTTAAAAA AGATCTCAAA 300AATGTCAAAG AATTGCGCAA CTATATTAAA GAGCATTTTA GTGCTTACTA TGTCAATATC 360AGCTATTCTA AAGAGCATAA TTTTAAAGTC GGCGATAAGG ATAAAAATGA TGAAAAAGAA 420ATCAAAATGT CCACAGAAGA ATTAGCGCAA ATTTATGCCG TCCAATCCAC CCCTACGATT 480GTTTTATCCG ATAAAACCGG CAAAACCATC TATGAATTGC CGGGCTATAT GCCTTCTGTG 540CAATTTTTAG CCGTGTTAGA ATTTATCGGC GATGGGAAGT ATCAAGACAC GAAAAACGAT 600GAGGATCTCA CTAAAAAATT AAAGGCTTAC ATCAAGTATA AAACCAACCT TTCTAAGAGC 650AAGTCCAGCT AG 672(2)INFORMATION FOR SEQ ID NO46(i)序列特征(A)长度351个碱基对(B)类型核酸
(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...351(xi)序列描述SEQ ID NO46TTGATGAAAT CTAAAATCAC TCATTTTATC GTTATCTCTT TTGTTTTAAG CGTGTTGAGC 60GCCTGCAAAG ATGAGCCTAA AAAATCGTCC CAATCGCACC AAAACAACAC TAAAACCACT 120CAAAACAATC AAATCAATCA ACCTAATAAG GATATAAAAA AGATTGAGCA TGAAGAAGAA 180GATGAAAAAG TCACCAAAGA AGTGAATGAT CTGATCAATA ACGAAAATAA AATTGATGAA 240ATCAATAATG AAGAAAACGC TGATCCTTCG CAAAAAAGAA CGAACAATGT TTTGCAACGA 300GCCACTAACC ACCAAGACAA TCTCAGTTCC CCACTCAACA GGAAGTATTA A 351(2)INFORMATION FOR SEQ ID NO47(i)序列特征(A)长度240个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征
(A)名称/关键词misc_特征(B)位置1...240(xi)序列描述SEQ ID NO47ATGTTTGAAA AAATACGCAA GATTTTAGCG GATATTGAAG ATTCGCAAAA TGAAATTGAA 60ATGCTTTTAA AATTAGCGAA TTTGAGTTTG GGGGATTTTA TTGAGATTAA AAGAGGGAGC 120ATGGACATGC CAAAGGGCGT GAATGAAGCG TTTTTTACGC AATTAAGCGA AGAAGTGGAG 180CGCCTAAAGG AGCTTATCAA CGCTTTGAAT AAAATCAAAA AAGGGTTATT GGTGTTTTAA 240(2)INFORMATION FOR SEQ ID NO48(i)序列特征(A)长度156个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...156(xi)序列描述SEQ ID NO48ATGTCTATGT TCATTTCTAA TCTGGCTTTC ACGAGCGAAC ATAAGGACGC TATGGAAGTG 60GCAAAAATTG CGATTTTACT CGGATCTTTG ATTTCTGGGA TCATAGGGGC TTTATATTTA 120TTCGCACTAG ATAAAAGAGC GGCTTTAAAG AAATAG156(2)INFORMATION FOR SEQ ID NO49(i)序列特征(A)长度1350个碱基对(B)类型核酸(C)链型双链
(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1350(xi)序列描述SEQ ID NO49ATGGGTTTGA AAATAAAAAT TTTAAGGTTG TCTATGAATC TCAAAAAAAC AGAAAACGCG 60CTCAGTTTGA CGCTTAAAAA CTTCATTAAA AGCGAGTCTT TTGGAGGGAT TTTCCTCTTT 120TTGAACGCCG TTTTAGCGAT GGTGGTGGCT AATTCGTTTT TAAAAGAAAG TTATTTTGCG 180CTATGGCACA CCCCTTTTGG GTTTCAAGTA GGGGATTTTT TTATCGGCTT TAGTTTGCAC 240AACTGGATTG ATGATGTCTT AATGGCGTTA TTCTTTTTAA TGATAGGCTT AGAGATCAAG 300CGAGAATTGT TGTTTGGGGA ATTATCCAGT TTTAAAAAAG CTTCTTTCCC TGTGATCGCA 360GCCATAGGGG GCATGATAGC TCCAGGATTG ATTTATTTTT TTCTTAACGC CAACACGCCC 420TCTCAGCATG GTTTTGGGAT CCCTATGGCA ACGGATATTG CGTTCGCTTT AGGCGTGATC 480ATGCTTTTAG GCAAGAGGGT GCCAACCGCC TTAAAGGTTT TTTTAATCAC TCTAGCGGTG 540GCTGATGACT TAGGGGCTAT TGTGGTGATC GCGCTCTTTT ATACCACGAA TTTAAAATTC 600GCATGGCTTT TAGGGGCTTT AGGGGTGGTT CTTGTTTTAG CCATATTGAA CCGCCTGAAT 660ATCCGATCGC TCATCCCTTA CTTGCTTTTA GGGGTGTTGC TTTGGTTTTG CGTGCATCAA 720AGCGGTATCC ATGCGACGAT CGCTGCGGTG GTTCTAGCTT TTATGATACC GGTGAAAATC 780CCTAAAGATT CTAAAAATGT AGAGCTTTTG GAATTAGGCA AACGATACGC AGAGACGAGT 840TCAGGAGTGC TTTTAACCAA AGAGCAGCAA GAAATCTTGC ATTCTATTGA AGAAAAAGCG 900AGTGCTTTAC AAAGCCCCTT AGAAAGATTG GAGCATTTTC TAGCCCCCAT CAGCGGGTAT 960TTCATCATGC CCTTATTCGC GTTTGCAAAC GCTGGGGTGA GCGTTGATTC TAGCATCAAT 1020TTAGAAGTGG ATAAGGTGCT TTTAGGGGTT ATTTTAGGGC TTTGTTTGGG CAAGCCTTTA 1080GGGATTTTCT TAATCACTTT CATAAGCGAA AAGCTTAAAA TCACTGCGCG CCCTAAAGGC 1140ATCGGCTGGT GGCATATTTT AGGGGCTGGG CTTTTAGCAG GGATTGGCTT TACCATGTCT 1200ATGTTCATTT CTAATCTGGC TTTCACGAGC GAACATAAGG ACGCTATGGA AGTGGCAAAA 1260ATTGCGATTT TACTCGGATC TTTGATTTCT GGGATCATAG GGGCTTTATA TTTATTCGCA 1320CTAGATAAAA GAGCGGCTTT AAAGAAATAG 1350(2)INFORMATION FOR SEQ ID NO50
(i)序列特征(A)长度2448个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...2448(xi)序列描述SEQ ID NO50ATGAATGACA AGCGTTTTAG AAAATATTGT AGTTTTTCTA TTTTTTTGTC CTTATTAGGA 60ACGTTTGAAT TAGAGGCTAA AGAAGAAGAA AAAGAAGAAA AAAAGACAGA AAGGAACAAA 120GATAAAGAAA AGAACGCCCA ACACACTTTG GGTAAAGTTA CCACTCAAGC GGCTAAAATC 180TTTAATTACA ACAACCAGAC AACCATTTCA AGTAAAGAAT TAGAAAGAAG GCAAGCCAAC 240CAAATCAGCG ACATGTTTAG AAGAAACCCC AATATCAATG TGGGCGGTGG TGCGGTGATA 300GCGCAAAAAA TTTACGTGCG CGGTATTGAA GACAGATTGG CTAGGGTTAC GGTGGATGGC 360GTGGCGCAAA TGGGCGCAAG CTATGGGCAT CAAGGCAATA CAATCATTGA CCCTGGAATG 420CTCAAAAGCG TGGTGGTTAC CAAGGGGGCG GCTCAAGCGA GCGCGGGGCC TATGGCTTTA 480ATTGGCGCGA TCAAAATGGA GACTAGGAGC GCGAGCGATT TTATCCCTAA AGGCAAAGAC 540TACGCCATAA GTGGGGCTGC CACTTTTTTA ACCAACTTTG GGGATAGGGA AACCATTATG 600GGCGCTTATC GTAACCATCA TTTTGATGCG CTTTTGTATT ACACGCACCA AAATATTTTT 660TATTATCGTG ATGGGGATAA CGCGATGAAA AATCTTTTTG ACCCTAAAGC GGATAATAAA 720GTTACAGCAA GCCCTAGCGA ACAAAACAAT GTGATGGCTA AGATCAATGG TTATTTGAGC 780GAAAGGGATA CCTTAACGCT CAGTTATAAC ATGACTAGAG ATAACGCCAA TCGCCCTTTA 840AGAGCGAATT TTACCGGCAC TTTTTTACCC TATTCTTGTG GTGATTTCAA CGCTTTCCCT 900AACGAGAAAA ACCCTAGCGA TTGTTTGTTT GAAAATGACG CCAGTTTGTT TAAAACTTAT 960AGCGTCAATT TAGTGCATAA CGTGAGCTTG AATTATGAAA GGGAAGGGGG GAGTCGCTTT 1020GGCGATCCTA AATTAAAAAT CAATGGCTAC ACGAGCATTA GGAATGTCCA AATTGATCCG 1080CTTTTCAGAC CTAGCGATAT AGCGACTACC ATTCCTTTCA CCCCAAACCC GCAGCTCTCT 1140CAAGGCGAAG AAAATCAATG CGTGGCGCAA GGGGGCATTT ATGACGCTCT TAAACAAACT 1200TGCTCCATCA CTTTTAAAAG CCTTGGAGGG GGTTCTGTTG TCGCTAATAA AAATTTATTC 1260ATCATCAATT CTGGGTTTAA TGCGAACGTG ATCCACACCA TAGACCACAA GAATGACAAT 1320CTTTTGGAAT ACGGGTTGAA TTACCAGAAT TTAACCACTT TTGATAAAGC GATCCCTGAT 1380AGCGAATTAG TCAAGCCCGG CGATGCCCCT GATGCGTGCT TAAGAGTTAC AGGACCTGAT 1440GATCCTAACA TGAACGGGCG CTGCCAACGG AATGGCGCTA CGGCGAATGT GGTTGGGGTG 1500TATGCGCAAG CGAATTACAC CTTGCACCCT ATGGTAACTT TAGGGGCAGG GACTCGTTAT 1560GACGTTTATA CTTTAGTGGA TAAAGACTGG CAATTGCACG TAACTCAAGG GTTTAGCCCT 1620AGCGCGGCTT TAAACGTCTC GCCTTTAGAA AATTTGAATT TCAGGCTTTC TTACGCGTAT 1680GTAACTAGAG GCCCTATGCC TGGAGGTTTG GTGTGGATGC GTCAAGACAA TTTGCGCTAT 1740AACCGCAATT TAAAGCCAGA AATTGGGCAA AATGCGGAAT TTAACACCGA ATACAGCAGT 1800CAGTATTTTG ATTTCAGAGC CGCCGGTTTT GTCCAATTGA TTTCTAATTA CATCAATCAA 1860TTTTCTTCAA CGCTTTTTGT CACCAACTTG CCCGCACAAG ATATTATTTA TGTGCCTGGC 1920TATGAAGTTT CAGGGACGGC TAAATACAAG GGTTTTTCTT TAGGCTTGAG CGTGGCGCGA 1980TCATGGCCTT CTTTAAAAGG GCGTTTGATC GCTGACGTGT ATGAATTGGC GGCTACGACA 2040GGCAATGTGT TTATTTTAAC GGCAAGCTAT ACAATCCCAC GCACCGGCCT TAGCATCACT 2100TGGCTTTCAC GCTTTGTTAC TAATTTGAGT TATTGCTCTT ATAGCCCTTA TCGTAACGGC 2160CCTACGGATA TTGACAGAAG GCCTAGTAAT TGCCCTAAAA CGCCCGGGAT TTTTCATGTG 2220CATAAACCCG GCTATGGGGT GAGCAGTTTC TTTATCACTT ACAAGCCTAC TTATAAGAAA 2280CTCAAAGGGT TGAGCCTGAA CGCGGTGTTT AATAATGTTT TTAACCAACA ATATATTGAT 2340CAAGCAAGCC CGGTGATGAG CCCTGATGAA CCCAATCAAG ACAAATACGC AAGGGGCATG 2400GCAGAGCCTG GCTTTAACGC TAGGTTTGAA ATTTCTTATA AGTTTTAA 2448(2)INFORMATION FOR SEQ ID NO51(i)序列特征(A)长度2445个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...2445(xi)序列描述SEQ ID NO51ATGACAAGCG TTTTAGAAAA ATATTGTAGT TTTTCTATTT TTTTGTCCTT ATTAGGAACG60TTTGAATTAG AGGCTAAAGA AGAAGAAAAA GAAGAAAAAA AGACAGAAAG GAACAAAGAT 120AAAGAAAAGA ACGCCCAACA CACTTTGGGT AAAGTTACCA CTCAAGCGGC TAAAATCTTT 180AATTACAACA ACCAGACAAC CATTTCAAGT AAAGAATTAG AAAGAAGGCA AGCCAACCAA 240ATCAGCGACA TGTTTAGAAG AAACCCCAAT ATCAATGTGG GCGGTGGTGC GGTGATAGCG 300CAAAAAATTT ACGTGCGCGG TATTGAAGAC AGATTGGCTA GGGTTACGGT GGATGGCGTG 360GCGCAAATGG GCGCAAGCTA TGGGCATCAA GGCAATACAA TCATTGACCC TGGAATGCTC 420AAAAGCGTGG TGGTTACCAA GGGGGCGGCT CAAGCGAGCG CGGGGCCTAT GGCTTTAATT 480GGCGCGATCA AAATGGAGAC TAGGAGCGCG AGCGATTTTA TCCCTAAAGG CAAAGACTAC 540GCCATAAGTG GGGCTGCCAC TTTTTTAACC AACTTTGGGG ATAGGGAAAC CATTATGGGC 600GCTTATCGTA ACCATCATTT TGATGCGCTT TTGTATTACA CGCACCAAAA TATTTTTTAT 660TATCGTGATG GGGATAACGC GATGAAAAAT CTTTTTGACC CTAAAGCGGA TAATAAAGTT 720ACAGCAAGCC CTAGCGAACA AAACAATGTG ATGGCTAAGA TCAATGGTTA TTTGAGCGAA 780AGGGATACCT TAACGCTCAG TTATAACATG ACTAGAGATA ACGCCAATCG CCCTTTAAGA 840GCGAATTTTA CCGGCACTTT TTTACCCTAT TCTTGTGGTG ATTTCAACGC TTTCCCTAAC 900GAGAAAAACC CTAGCGATTG TTTGTTTGAA AATGACGCCA GTTTGTTTAA AACTTATAGC 960GTCAATTTAG TGCATAACGT GAGCTTGAAT TATGAAAGGG AAGGGGGGAG TCGCTTTGGC 1020GATCCTAAAT TAAAAATCAA TGGCTACACG AGCATTAGGA ATGTCCAAAT TGATCCGCTT 1080TTCAGACCTA GCGATATAGC GACTACCATT CCTTTCACCC CAAACCCGCA GCTCTCTCAA 1140GGCGAAGAAA ATCAATGCGT GGCGCAAGGG GGCATTTATG ACGCTCTTAA ACAAACTTGC 1200TCCATCACTT TTAAAAGCCT TGGAGGGGGT TCTGTTGTCG CTAATAAAAA TTTATTCATC 1260ATCAATTCTG GGTTTAATGC GAACGTGATC CACACCATAG ACCACAAGAA TGACAATCTT 1320TTGGAATACG GGTTGAATTA CCAGAATTTA ACCACTTTTG ATAAAGCGAT CCCTGATAGC 1380GAATTAGTCA AGCCCGGCGA TGCCCCTGAT GCGTGCTTAA GAGTTACAGG ACCTGATGAT 1440CCTAACATGA ACGGGCGCTG CCAACGGAAT GGCGCTACGG CGAATGTGGT TGGGGTGTAT 1500GCGCAAGCGA ATTACACCTT GCACCCTATG GTAACTTTAG GGGCAGGGAC TCGTTATGAC 1560GTTTATACTT TAGTGGATAA AGACTGGCAA TTGCACGTAA CTCAAGGGTT TAGCCCTAGC 1620GCGGCTTTAA ACGTCTCGCC TTTAGAAAAT TTGAATTTCA GGCTTTCTTA CGCGTATGTA 1680ACTAGAGGCC CTATGCCTGG AGGTTTGGTG TGGATGCGTC AAGACAATTT GCGCTATAAC 1740CGCAATTTAA AGCCAGAAAT TGGGCAAAAT GCGGAATTTA ACACCGAATA CAGCAGTCAG 1800TATTTTGATT TCAGAGCCGC CGGTTTTGTC CAATTGATTT CTAATTACAT CAATCAATTT 1860TCTTCAACGC TTTTTGTCAC CAACTTGCCC GCACAAGATA TTATTTATGT GCCTGGCTAT 1920GAAGTTTCAG GGACGGCTAA ATACAAGGGT TTTTCTTTAG GCTTGAGCGT GGCGCGATCA 1980TGGCCTTCTT TAAAAGGGCG TTTGATCGCT GACGTGTATG AATTGGCGGC TACGACAGGC 2040AATGTGTTTA TTTTAACGGC AAGCTATACA ATCCCACGCA CCGGCCTTAG CATCACTTGG 2100CTTTCACGCT TTGTTACTAA TTTGAGTTAT TGCTCTTATA GCCCTTATCG TAACGGCCCT 2160ACGGATATTG ACAGAAGGCC TAGTAATTGC CCTAAAACGC CCGGGATTTT TCATGTGCAT 2220AAACCCGGCT ATGGGGTGAG CAGTTTCTTT ATCACTTACA AGCCTACTTA TAAGAAACTC 2280AAAGGGTTGA GCCTGAACGC GGTGTTTAAT AATGTTTTTA ACCAACAATA TATTGATCAA 2340GCAAGCCCGG TGATGAGCCC TGATGAACCC AATCAAGACA AATACGCAAG GGGCATGGCA 2400GAGCCTGGCT TTAACGCTAG GTTTGAAATT TCTTATAAGT TTTAA 2445(2)INFORMATION FOR SEQ ID NO52
(i)序列特征(A)长度1584个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1584(xi)序列描述SEQ ID NO52ATGAAACAAA ATTTAAAGCC ATTCAAAATG ATTAAGGAAA ATTTAATGAC ACAATCTCAA 60AAAGTAAGAT TCTTAGCCCC TTTGAGCCTA GCGTTAAGCT TGAGCTTCAA TCCAGTGGGC 120GCTGAAGAAG ATGGGGGCTT TATGACCTTT GGGTATGAAT TAGGTCAGGT GGTCCAGCAA 180GTGAAAAACC CGGGTAAAAT CAAAGCCGAA GAATTAGCGG GCCTGTTAAA CTCTACCACG 240ACAAACAACA CCAATATCAA TATTGCAGGC ACAGGAGGGA ATGTCGCCGG GACTTTGGGC 300AACCTTTTTA TGAACCAATT GGGCAATTTG ATTGATTTGT ATCCTACTTT GAAAACTAAT 360AATCTTCACC AATGCGGTAG CACTAATAGC GGTAATGGCG CTACTGCTGC CGCTGCTACT 420AACAATAGCC CTTGTTTCCA AGGTAACCTG GCTCTTTATA ACGAAATGGT TGACTCTATC 480AAAACTTTGA GTCAAAACAT CAGCAAGAAC ATCTTTCAAG GCGACAACAA CACCACGAGC 540GCTAATCTCT CCAACCAGCT CAGTGAGTTG AACACCGCTA GCGTTTATTT GACTTACATG 600AACTCGTTCT TAAACGCCAA CAACCAAGCG GGTGGGATTT TTCAAAACAA CACCAATCAA 660GCTTACGAGA ATGGTGTTAC CGCTCAACAA ATCGCTTATG TCCTAAAGCA AGCTTCAATC 720ACTATGGGGC CAAGCGGTGA TAGTGGGGCT GCGGGAGCGT TTTTAGACGC CGCTTTAGCC 780CAACATGTTT TCAACTCGGC TAACGCTGGG AACGATTTGA GCGCTAAGGA ATTCACTAGC 840TTGGTGCAAA ACATCGTCAA TAATTCTCAA AACGCTTTAA CGCTAGCCAA CAACGCTAAC 900ATCAGCAATT CAACAGGCTA TCAAGTGAGC TATGGTGGGA ATATTGATCA AGCGCGCTCT 960ACCCAACTGT TAAACAACAC CACAAACACT TTGGCTAAAG TTACCGCTCT AAACAACGAG 1020CTTAAAGCTA ACCCATGGCT TGGGAATTTC GCTGCTGGTA ACAGCTCTCA AGTGAATGCG 1080TTTAACGGGT TTATCACTAA AATCGGTTAT AAGCAATTCT TCGGGGAAAA CAAGAATGTG 1140GGCTTACGCT ACTACGGGTT CTTCAGCTAT AACGGCGCGG GCGTGGGTAA TGGCCCCACT 1200TACAATCAAG TCAATCTGCT CACTTATGGG GTGGGGACTG ATGTGCTTTA CAATGTGTTT 1260AGCCGCTCTT TTGGCAGTAG GAGTCTTAAT GCGGGCTTCT TTGGGGGGAT CCAACTCGCA 1320GGGGACACTT ACATCAGCAC GCTAAGAAAC AGCCCTCAGC TTGCGAGCAG ACCTACAGCG 1380ACAAAATTCC AATTCTTGTT TGATGTGGGC TTACGCATGA ACTTTGGTAT CTTGAAAAAA 1440GACCTAAAAA GCCATAACCA GCATTCTATA GAAATCGGTG TGCAAATCCC TACGATTTAC 1500AACACTTACT ATAAAGCTGG TGGCGCTGAA GTGAAATACT TCCGCCCTTA TAGCGTGTAT 1560TGGGTCTATG GCTACGCCTT CTAA 1584(2)INFORMATION FOR SEQ ID NO53(i)序列特征(A)长度1380个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1380(xi)序列描述SEQ ID NO53GTGGTGTTAT TAACAATGAC AAAACGACTT TTTAAAGGGT TGTTAGCGAT TTCTCTTGCG 60GTGAGTTTGC ATGGTGGTGA AGTTAAGGAA AAAAAGCCGG TCAAGCCGGT CAAAGAAGAT 120CCGCAAGAAT TAGCGGCTAA AAGGGTGGAA GCGTTCAGTC GTTTCTCTAA TGTGGTTACA 180GAAATTGAAA AAAAGTATGT GGATAAGATC AGTATTTCTG AGATCATGAC TAAAGCGATT 240GAAGGCTTAC TCTCTAATTT GGACGCGCAT TCAGCGTATT TGAATGAAAA GAAGTTTAAG 300GAATTTCAGG CCCAAACCGA GGGCGAATTT GGGGGGCTTG GGATCACGGT GGGCATGCGC 360GATGGCGTTT TGACCGTTAT TGCACCTTTA GAGGGCACTC CAGCTTACAA GGCTGGGGTT 420AAATCAGGCG ATAGCATTTT AAAAATCAAT AACGAAAGCA CGCTGAGCAT GAGCATTGAT 480GATGCGGTTA ATCTCATGCG CGGCAAGCCA AAAACCTCTA TTCAGATCAC TGTTGTTAGG 540AAAAATGAGC CAAAACCCTT GGTATTTAAT ATCGTTAGGG ATATTATCAA GATCCCCTCT 600GTCTATGTGA AAAAGATTAA AGACACACCT TATTTGTACG TGAGAGTCAA TTCTTTTGAT 660AAAAATGTTA CCAAATCGGT TTTAGACGGC TTGAAGGCTA ACCCTAACAT TAAGGGCGTT 720GTGTTGGATT TGAGGGGGAA TCCTGGAGGG CTATTAAACC AGGCGGTAGG CTTGTCTAAC 780CTTTTCATTA AAGAGGGGGT TTTAGTCTCT CAAAGAGGCA AAAATAAGGA GGAAAACTTA 840GAATACAAGG CTAATGGCAG AGCCCCTTAT ACCAATTTAC CTGTTGTGGT GTTAGTCAAT 900GGCGGTTCAG CGAGCGCGAG CGAGATCGTC GCAGGGGCAC TGCAAGATCA CAAGCGAGCC 960ATCATTATCG GTGAAAAAAC CTTTGGTAAG GGAAGCGTGC AAGTGTTGCT CCCTGTCAAT 1020AAAGACGAAG CCATTAAAAT CACGACCGCG CGCTATTATT TGCCGAGCGG GCGCACCATT 1080CAAGCTAAGG GGATCACGCC TGATATTGTG ATTTATCCGG GTAAAGTGCC AGAAAATGAA 1140AATAAATTCA GTTTGAAAGA AGCGGATTTA AAACACCATT TAGAGCAAGA GCTTAAAAAA 1200CTTGATGATA AAACCCCTAT TTCCAAAGAG GCGGATAAAG ACAAGAAAAG CGAAGAGGAA 1260AAAGAGGTTA CTCCTAAAAT GATCAATGAT GATATTCAGC TAAAAACCGC TATTGACAGC 1320TTGAAAACCT GGTCTATCGT AGATGAGAAA ATGGATGAAA AAGTGCCTAA GAAGAAATAA 1380(2)INFORMATION FOR SEQ ID NO54(i)序列特征(A)长度315个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...315(xi)序列描述SEQ ID NO54TTGCTTTTGC ACCCCTTGCA TGCTCATGCA CAAGTGCTTG GCTTCACAAA CCACGATCAC 60GCCCCTTGGC TCTATGATTT CATCAAAAGT TTCTGCAATT TGAGTGGTCA GCCTTTCTTG 120GATTTGCAGG CGTTTGCTAT AAATTTCAAT GAGTTTAGCG ATCGCGCTAA TGCCTACAAT 180CTTTTCCTTA GGGATATATC CCACGCTAAT ATTCCCAAAA AAAGGGAGCA AATGGTGCTC 240GCAAGTGGAG TAAAATTCAA TGTTTTGAGC CACTATCATT TCATCGCAAA CGCCTTGAAA 300ATACGCGCTT TTTAA 315(2)INFORMATION FOR SEQ ID NO55
(i)序列特征(A)长度498个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...498(xi)序列描述SEQ ID NO55ATGATTGAAC TAATCTTACA CAATAAGTCC ATACAAATTG ATGAAACATT GCTGAATGTA 60AAAGAGCATT TAGAAAAGTT TTATTCAAAC AAAGAACAAG AGACAATCGC AAAAACCTTA 120GAGAGCCAAA CAGAGCTTAC TTGCAGTTAT TTATTGGATA AAGATTTTTC ATTGCTAGAA 180AAGCATTTAG AAAATAGCTT AGGGCATTTT ACTTTTGAGA GTGAGTTTGC CCTACTAAAA 240GACAAAGAGC CTTTGAATTT AGCTCAAATC AAACAAATCG GTGTTTTAAA GGTTATTACC 300TATGAAATGA CACAAGCCTT AAAAAATCAA ATCATTCATT TAACGCAAAT TGTCAATGAA 360GAAAATTTAG AGTTTGATGA AGAACTTGTT ATTTATCACT TAAATTTTAA GCTCAATCAA 420AATACTTACA AAGTGTTAGC GAAATTTTGC GTATTAAAAA AGAAAGGAAC ATTGCATGAA 480AAATTTAAGG CATTTTAG498(2)INFORMATION FOR SEQ ID NO56(i)序列特征(A)长度642个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...642(xi)序列描述SEQ ID NO56ATGGATACCG AAACACAAGA AAAGTTTTTA GCGTATTTGT TTGAAAAAGC TTTACAAAAA 60AATCTACAAG CTTATTGGAT AACAACAACT GAAACTAAGA ATGAATTAAC AAGAGAAGAG 120TTTTCAAATT TAATAAGAAA AACAATGATT GAACTAATCT TACACAATAA GTCCATACAA 180ATTGATGAAA CATTGCTGAA TGTAAAAGAG CATTTAGAAA AGTTTTATTC AAACAAAGAA 240CAAGAGACAA TCGCAAAAAC CTTAGAGAGC CAAACAGAGC TTACTTGCAG TTATTTATTG 300GATAAAGATT TTTCATTGCT AGAAAAGCAT TTAGAAAATA GCTTAGGGCA TTTTACTTTT 360GAGAGTGAGT TTGCCCTACT AAAAGACAAA GAGCCTTTGA ATTTAGCTCA AATCAAACAA 420ATCGGTGTTT TAAAGGTTAT TACCTATGAA ATGACACAAG CCTTAAAAAA TCAAATCATT 480CATTTAACGC AAATTGTCAA TGAAGAAAAT TTAGAGTTTG ATGAAGAACT TGTTATTTAT 540CACTTAAATT TTAAGCTCAA TCAAAATACT TACAAAGTGT TAGCGAAATT TTGCGTATTA 600AAAAAGAAAG GAACATTGCA TGAAAAATTT AAGGCATTTT AG 642(2)INFORMATION FOR SEQ ID NO57(i)序列特征(A)长度762个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...762
(xi)序列描述SEQ ID NO57ATGGCGATCT CTATTAAAAG CCCAAAAGAA ATCAAAGCCC TAAGAAAAGC CGGGGAATTA 60ACCGCTCAAG CGTTAGCCCT TTTAGAGCGA GAAGTAAGGC CTGGGGTTTC ACTTTTAGAG 120CTGGATAAAA TGGCTGAAGA TTTTATCAAA TCCTCGCATG CTAGGCCTGC TTTTAAGGGG 180CTCTATGGTT TCCCTAACTC TGTGTGCATG TCCTTAAATG AGGTGGTTAT TCATGGTATT 240CCTACGGATT ATGTTTTACA AGAAGGGGAT ATTATAGGCT TGGATTTGGG GGTGGAGGTG 300GATGGCTATT ATGGCGATTC AGCCCTCACG CTTCCCATAG GCGCGATAAG CCCGCAAGAT 360GAAAAATTGC TCGCTTGCTC TAAAGAGAGC TTGATGCATG CCATTAGCTC AATTAGAGTG 420GGCATGCATT TTAAAGAGTT GAGTCAGATT TTAGAGGGCG CTATTACAGA AAGGGGCTTT 480GTGCCTTTGA AGGGATTTTG CGGGCATGGC ATTGGTAAAA AGCCCCATGA AGAGCCAGAA 540ATCCCCAACT ACCTAGAAAA AGGCGTCAAA GCTAATAGCG GCCCTAAAAT CAAAGAGGGC 600ATGGTGTTTT GTTTAGAGCC TATGGTGTGT CAAAAACAAG GCGAGCCTAA AATACTAGCG 660GATAAGTGGA GCGTGGTTTC AGTGGATGGA CTTAACACAA GCCACCATGA GCATACTATC 720GCCATAGTTG GCAATAAAGC AGTGATTCTT ACGGAGCGTT AA 762(2)INFORMATION FOR SEQ ID NO58(i)序列特征(A)长度744个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...744(xi)序列描述SEQ ID NO58AAGCCCAAAA GAAATCAAAG CCCTAAGAAA AGCCGGGAAT TAACCGCTCA AGCGTTAGCC 60CTTTTAGAGC GAGAAGTAAG GCCTGGGGTT TCACTTTTAG AGCTGGATAA AATGGCTGAA 120GATTTTATCA AATCCTCGCA TGCTAGGCCT GCTTTTAAGG GGCTCTATGG TTTCCCTAAC 180TCTGTGTGCA TGTCCTTAAA TGAGGTGGTT ATTCATGGTA TTCCTACGGA TTATGTTTTA 240CAAGAAGGGG ATATTATAGG CTTGGATTTG GGGGTGGAGG TGGATGGCTA TTATGGCGAT 300TCAGCCCTCA CGCTTCCCAT AGGCGCGATA AGCCCGCAAG ATGAAAAATT GCTCGCTTGC 360TCTAAAGAGA GCTTGATGCA TGCCATTAGC TCAATTAGAG TGGGCATGCA TTTTAAAGAG 420TTGAGTCAGA TTTTAGAGGG CGCTATTACA GAAAGGGGCT TTGTGCCTTT GAAGGGATTT 480TGCGGGCATG GCATTGGTAA AAAGCCCCAT GAAGAGCCAG AAATCCCCAA CTACCTAGAA 540AAAGGCGTCA AAGCTAATAG CGGCCCTAAA ATCAAAGAGG GCATGGTGTT TTGTTTAGAG 600CCTATGGTGT GTCAAAAACA AGGCGAGCCT AAAATACTAG CGGATAAGTG GAGCGTGGTT 660TCAGTGGATG GACTTAACAC AAGCCACCAT GAGCATACTA TCGCCATAGT TGGCAATAAA 720GCAGTGATTC TTACGGAGCG TTAA 744(2)INFORMATION FOR SEQ ID NO59(i)序列特征(A)长度1023个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1023(xi)序列描述SEQ ID NO59ATGTATCGTA AAGATTTGGA TAATTACTTA AAACAGCGCC TCCCTAAAGC GGTGTTTTTG 60TATGGGGAGT TTGATTTTTT CATCCATTAT TATATTCAAA CGATTAGCGC GCTTTTTAAA 120GGCAATAACC CTGACACAGA AACTTCGCTT TTTTATGCGA GCGATTATGA AAAAAGCCAG 180ATTGCGACCC TTTTAGAGCA GGATTCTTTA TTTGGAGGGA GCAGTTTAGT TATTTTAAAA 240CTGGATTTTG CATTGCATAA GAAATTTAAG GAAAATGATA TCAATCCTTT TTTAAAAGCT 300TTAGAGCGGC CTAGCCATAA TAGGCTTATC ATAGGGCTTT ATAATGCTAA AAGCGACACC 360ACAAAATACA AATACACTAG CGAAATTATC GTTAAATTTT TCCAAAAAAG CCCCTTGAAA 420GATGAAGCCA TTTGCGTGCG CTTTTTTACC CCTAAAGCGT GGGAGAGTTT GAAATTCTTG 480CAAGAAAGGG CTAATTTTTT GCATTTAGAC ATCAGCGGCC ATCTTTTAAA CGCTCTTTTT 540GAAATTAATA ACGAAGATTT AAGCGTTTCG TTTAACGATT TAGACAAGCT AGCGGTTTTA 600AACGCGCCCA TCACTTTAGA AGACATTCAA GAATTAAGCT CCAATGCGGG GGATATGGAT 660TTGCAAAAGC TCATTTTAGG GCTTTTTTTG AAAAAAAGCG TCCTTGATAT TTATGATTAT 720TTGTTAAAAG AGGGCAAAAA GGATGCGGAT ATTTTAAGGG GGTTAGAGCG CTATTTTTAC 780CAGCTTTTTT TATTTTTCGC CCACATTAAA ACGACCGGTT TAATGGACGC TAAAGAGGTC 840TTAGGCTACG CTCCTCCTAA AGAGATTGTA GAAAATTACG CTAAAAACGC CCTGCGTTTG 900AAAGAAGCCG GCTATAAGAG GGTTTTTGAA ATTTTTAGGT TATGGCACCT TCAAAGCATG 960CAAGGGCAAA AGGAATTGGG CTTTTTGTAT TTGACCCCCA TTCAAAAAAT CATTAACCCT 1020TGA 1023(2)INFORMATION FOR SEQ ID NO60(i)序列特征(A)长度603个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...603(xi)序列描述SEQ ID NO60GTGTTTATGA CAAGCGCTCT GTTAGGCTTA CAAATTGTTT TAGCGGTATT GATTGTGGTG 60GTGGTTTTGT TGCAAAAAAG TTCTAGCATC GGCTTAGGGG CTTATAGCGG AAGCAACGAT 120TCTTTATTTG GCGCTAAAGG GCCCGCAAGC TTTATGGCGA AATTGACCAT GTTTTTAGGT 180TTATTGTTTG TCATCAACAC CATCGCTTTG GGCTATTTTT ACAACAAAGA ATACGGCAAG 240AGCGTTTTAG ATGAAACTAA AACCAATAAA GAGCTTTCGC CCTTAGTCCC TGCCACCGGC 300ACGCTCAACC CTACGCTTAA TCCCACATTA AACCCAACGC TCAACCCTTT AGAGCAAGCC 360CCCACTAATC CTTTAATGCC TACACAAACG CCTAAAGAGC TTCCTAAAGA GCCAGCCAAA 420ACGCCTTTTG TTGAAAGCCC CAAACAGAAT GAAAAGAATG AAAAGAATGA TGCCAAAGAA 480AATGGTATAA AGGGTGTTGA AAAAAACAAA GAGAACGCCA AAACGCCCCC AACCACCCAC 540CAAAAGCCTA AAACGCATGC GACAACCAAC GCCCATACCA ACCAAAAAAA GGATGAAAAA 600TAA 603(2)INFORMATION FOR SEQ ID NO61(i)序列特征(A)长度480个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...480(xi)序列描述SEQ ID NO61ATGCGTTCTC CAAATTTAGA AAAAGAAGAA ACTGAAATCA TAGAAACGCT TCTTGTGCGT 60GAAAAAATGC GTTTATGCCC CTTGTATTGG CGCATCTTAG CGTTTTTAAT CGATAGTTTA 120TTGGTGGCGT TTTTATTGAG CGATCTTTTA AGGGCATGCG CTTTTTTACA TTCTTTATAT 180TGGCTGACTA ACCCCATTTA TTACAGCGCG TTTGTTGTGA TGGGTTTTAT CATCTTGTAT 240GGCGTTTATG AAATCTTTTT TGTGTGTTTG TGCAAGATGA GTTTGGCTAA ACTGGTTTTT 300AGGATTAAGA TCATTGATAT TTATTTAGCG GATTGCCCCA GTAGGGCTAT TTTATTGAAG 360CGTTTAGGGT TAAAAATCGT GGTTTTTCTA TGCCCCTTTT TATGGTTTGT GGTGTTTAAA 420AACCCCTATC ATAGGGCATG GCATGAAGAA AAAAGCAAAA GTCTTTTGGT GTTGTTTTAA 480(2)INFORMATION FOR SEQ ID NO62(i)序列特征(A)长度705个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...705(xi)序列描述SEQ ID NO62TTGAATACGG ACTTTAGCCA TATCACCGAT ATTGAGGGCA TGCGTTTTGT TAATGAAGAA 60GACGCTTTAA ACAAATTGAT TAATGAAATC CACACGCGCC ACATTGATTT AAAAGATTCC 120ATCATGCTCG CTTTGAGTTT TAACGCCTTG TATTTAGCTA ACGCTTTAGC GCAAAAATTT 180GGGGCGACTT ATGATATACT TTTTTTAGAA CCTATCTTAG CCCCTTTAAA CTCAAAGTGT 240GAAATCGCTT TAGTGAGTGA AAGCATGGAT ATAGTGATGA ATGAAAGTTT AATCAATTCC 300TTTGACATCG CTTTAGACTA TGTTTATGGG GAAGCCAAGC GGGCTTATGA AGAAGACATT 360CTGTCTCACA TCTATCAGTA TCGCAAAGGC AATGCGATCA AAAGCCTAAA AGATAAAAAT 420ATTTTTATCG TAGATAGGGG GATTGAGACC GGGTTTAGAG CAGGGTTAGG CGTGCAAACT 480TGTTTGAAAA AAGAATGCCA AGACATTTAT ATTTTAACCC CCATTCTCGC GCAAAATGTC 540GCTCAAGGCT TAGAAAGCTT GTGCGATGGG GTGATTAGCG TGTATCGCCC TGAATGTTTT 600GTCTCTGTGG AACACCATTA TAAAGAACTC AAGCGATTAA GCAATGAAGA AATTGAAAAA 660TACTTGGGCG CTAACAACGC GCCCAATCTC AAAAAGGAAC ATTAA 705(2)INFORMATION FOR SEQ ID NO63(i)序列特征(A)长度864个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...864(xi)序列描述SEQ ID NO63TTGAAACAAA GCGAAATGGC CATGGAATTT AATGATCCTA GGATGCGTTT TTTTATTGGC 60GATGTCAGGG ATTTAGAACG CTTGAATTAC GCTTTAGAGG GCGTGGATAT TTGTATCCAT 120GCGGCCGCGC TCAAGCATGT GCCTATCGCT GAATACAACC CCCTAGAATG CATTAAAACT 180AACATCATGG GAGCGAGCAA TGTGATTAAC GCATGCTTAA AAAATGAAAT CAGCCAGGTT 240ATTGCCCTAA GCACCGATAA AGCCGCTAAC CCCATTAACC TCTACGGCGC AACCAAATTG 300TGCAGCGACA AGCTCTTTGT GAGCGCGAAC AACTTTAAAG GCCCTTCTCA AACGCAATTT 360GGCGTGGTGC GTTATGGTAA TGTGGTGGGG AGTCGTGGGA GCGTGGTGCC GTTTTTTAAA 420AAATTAGTCC AAAACAAAGC GAGTGAAATC CCCATTACCG ATATTCGCAT GACACGATTT 480TGGATCACCT TAGATGAGGG GGTTTCTTTT GTGCTTAAAA GCTTGAAAAG AATGCATGGG 540GGGGAAATTT TTGTGCCTAA AATCCCCAGC ATGAAAATGA TTGATCTCGC CAAAGCCCTA 600GCCCCCAATA TCCCTACTAA AATCATAGGG ATTCGCCCGG GCGAAAAACT CCATGAAGTG 660ATGATCCCTA AAGATGAAAG CCATTTAGCC CTAGAATTTG AAGACTTTTT TATTATTCAG 720CCCACTATAA GCTTCCAAAC GCCTAAAGAT TACACGCTCA CCAAACTCCA TGAAAAAGGC 780CAAAAAGTCG CCCCTGATTT TGAATACAGC AGCCATACTA ATAACCAATG GCTAGAGCCT 840GATGATTTGT TAAAATTATT ATGA 864(2)INFORMATION FOR SEQ ID NO64(i)序列特征(A)长度606个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...606
(xi)序列描述SEQ ID NO64ATGCGTTTGC ACACTGCCTT TTTTGGTATT AATTCGTTGC TTGTCGCCAC TCTTTTGATA 60AGCGGTTGCA GTCTCTTTAA AAAGCGTAAC ACTAACGCTC AGCTAATCCC CCCTTCAGCT 120AACGGGTTGC AAGCCCCCAT TTATCCCCCA ACCAATTTCA CCCCCAGAAA GAGCATTCAG 180CCTCTCCCAA GCCCTCGCCT TGAGAATAAC GATCAGCCCA TCATTAGCTC TAATCCCACT 240AACGCTATCC CTAACACCCC CATTCTCACG CCCAATAATG TCATTGAGTT GAATGCGGTG 300GGCATGGGTG TGGCTCCAGA ATCCACCATT TCGCCCTCTC AAGCTCTAGC TTTAGCTAAG 360CGAGCGGCTA TTGTTGATGG CTACCGCCAG TTGGGTGAAA AAATGTATGG CATCAGAGTG 420AACGCTCAAG ACACCGTCAA AGACATGGTT TTACAAAATT CCGTGATTAA AACGAGAGTG 480AATGCCCTCA TTCGTAACGC TGAAATCACT GAGACTATCT ATAAAGACGG CTTGTGCCAG 540GTAAGCATGG AGCTTAAATT AGACGGCAGG ATTTGGTATC GTATTTTGAG CGGATCGAGA 600GGATAA 606(2)INFORMATION FOR SEQ ID NO65(i)序列特征(A)长度1068个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1068(xi)序列描述SEQ ID NO65ATGAGTTATA CTATTAATAA ACGCTTTTCT GTGGGTGTGG GTTTAAGGGG GCTTTATGCG 60ACCGGGAGCT TTAATAACAC CGTTTATGTG CCTTTAGAGG GCGCTTCAGT TTTGAGCGCG 120GAGCAAATCT TAAACTTACC CAACAATGTT TTTGCCGATC AAGTGCCAAG TAACATGATG 180ACTTTATTAG GCAATATTGG CTACCAACCA GCGCTTAATT GCCAAAAAGC CGGTGGGGAC 240ATGAGTGATC AGAGCTGTCA AGAGTTTTAC AACGGCTTGA AAAAAATCAT GGGTTATAGC 300GGTTTAATCA AAGCGAGCGC GAATCTTTAT GGCACGACTC AAGTCGTGCA AAAATCTAAC 360GGACAAGGCG TATCGGGGGG GTATAGAGTG GGTTCGAGTT TGCGTGTGTT TGATCATGGC 420ATGTTTTCTG TGGTGTATAA TTCTTCAGTT ACCTTTAACA TGAAAGGCGG TTTGGTGGCT 480ATCACAGAGC TTGGCCCTTC TTTAGGGAGC GTTTTGACTA AAGGCAGCTT GAATATCAAT 540GTTTCACTCC CCCAAACTTT AAGCTTAGCC TACGCCCACC AATTTTTTAA AGATCGCCTA 600AGGGTTGAAG GGGTGTTTGA GCGCACTTTT TGGAGTCAAG GGAATAAATT TTTAGTCACC 660CCTGATTTTG CGAACGCCAC TTACAAGGGC TTGAGCGGGA CGGTGGCTTC CTTGGACTCT 720GAAACGCTTA AAAAAATGGT AGGCCTAGCG AATTTTAAAA GCGTGATGAA CATGGGGGCT 780GGCTGGAGGG ACACCAACAC CTTTAGATTA GGGGTAACTT ACATGGGTAA AAGCTTGCGT 840TTAATGGGCG CTATTGATTA TGATCAAGCC CCAAGCCCCC AAGACGCGAT AGGCATTCCG 900GACTCTAATG GCTATACCGT GGCTTTTGGG ACTAAATACA ATTTTAGGGG CTTTGATTTG 960GGCGTAGCGG GGAGTTTCAC TTTTAAGAGC AACCGCTCCA GTTTGTATCA ATCCCCAACT 1020ATTGGGCAAT TGAGAATCTT TAGCGCCTCT TTAGGCTATC GCTGGTAA 1068(2)INFORMATION FOR SEQ ID NO66(i)序列特征(A)长度1764个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1764(xi)序列描述SEQ ID NO66ATGAAAAACT TTTCCCCACT CTATTGTCTT AAAAAGCTCA AAAAACGCCA TTTAATCGCT 60CTGAGTCTGC CCTTGCTTTC TTATGCGAAT GGCTTTAAAA TCCAAGAGCA AAGCTTGAAT 120GGCACGGCTT TAGGCTCGGC GTATGTCGCT GGGGCTAGGG GTGCTGACGC TTCTTTTTAC 180AACCCGGCTA ACATGGGCTT TACTAACGAT TGGGGCGAAA ACAGAAGCGA ATTTGAAATG 240ACCACCACCG TGATCAATAT CCCGGCCTTT AGCTTTAAAG TCCCTACGAC CAATCAAGGC 300TTATATTCGG TAACAAGTTT AGAAATTGAT AAAAGCCAAC AAAATATTTT AGGCATCATC 360AACACTATAG GGTTAGGCAA TATCCTTAAA GCGCTTGGCA ATACGGCCGC TACCAATGGC 420TTATCACAAG CTATCAATCG TGTTCAAGGG CTTATGAACT TAACCAATCA AAAAGTCGTA 480ACCCTCGCTT CAAAACCTGA CACTCAAATC GTGAATGGCT GGACAGGCAC GACTAATTTT 540GTTTTACCTA AATTCTTTTA TAAAACGCGC ACGCATAACG GCTTCACTTT TGGGGGGAGT 600TTTACCGCTC CTAGTGGGTT GGGTATGAAA TGGAATGGTA AGGGGGGGGA ATTTTTGCAT 660GACGTGTTTA TCATGATGGT AGAGCTTGCC CCTAGCATGA GTTATACTAT TAATAAACGC 720TTTTCTGTGG GTGTGGGTTT AAGGGGGCTT TATGCGACCG GGAGCTTTAA TAACACCGTT 780TATGTGCCTT TAGAGGGCGC TTCAGTTTTG AGCGCGGAGC AAATCTTAAA CTTACCCAAC 840AATGTTTTTG CCGATCAAGT GCCAAGTAAC ATGATGACTT TATTAGGCAA TATTGGCTAC 900CAACCAGCGC TTAATTGCCA AAAAGCCGGT GGGGACATGA GTGATCAGAG CTGTCAAGAG 960TTTTACAACG GCTTGAAAAA AATCATGGGT TATAGCGGTT TAATCAAAGC GAGCGCGAAT 1020CTTTATGGCA CGACTCAAGT CGTGCAAAAA TCTAACGGAC AAGGCGTATC GGGGGGGTAT 1080AGAGTGGGTT CGAGTTTGCG TGTGTTTGAT CATGGCATGT TTTCTGTGGT GTATAATTCT 1140TCAGTTACCT TTAACATGAA AGGCGGTTTG GTGGCTATCA CAGAGCTTGG CCCTTCTTTA 1200GGGAGCGTTT TGACTAAAGG CAGCTTGAAT ATCAATGTTT CACTCCCCCA AACTTTAAGC 1260TTAGCCTACG CCCACCAATT TTTTAAAGAT CGCCTAAGGG TTGAAGGGGT GTTTGAGCGC 1320ACTTTTTGGA GTCAAGGGAA TAAATTTTTA GTCACCCCTG ATTTTGCGAA CGCCACTTAC 1380AAGGGCTTGA GCGGGACGGT GGCTTCCTTG GACTCTGAAA CGCTTAAAAA AATGGTAGGC 1440CTAGCGAATT TTAAAAGCGT GATGAACATG GGGGCTGGCT GGAGGGACAC CAACACCTTT 1500AGATTAGGGG TAACTTACAT GGGTAAAAGC TTGCGTTTAA TGGGCGCTAT TGATTATGAT 1560CAAGCCCCAA GCCCCCAAGA CGCGATAGGC ATTCCGGACT CTAATGGCTA TACCGTGGCT 1620TTTGGGACTA AATACAATTT TAGGGGCTTT GATTTGGGCG TAGCGGGGAG TTTCACTTTT 1680AAGAGCAACC GCTCCAGTTT GTATCAATCC CCAACTATTG GGCAATTGAG AATCTTTAGC 1740GCCTCTTTAG GCTATCGCTG GTAA 1764(2)INFORMATION FOR SEQ ID NO67(i)序列特征(A)长度618个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征
(A)名称/关键词misc_特征(B)位置1...618(xi)序列描述SEQ ID NO67TTGATTTTTA GATTTTTCTT AATCTTAAGC CTTTTAAAAG GGGTTTTACT GGCCAAAAAG 60GATTGGAATT TTTTCAAACC TTTAGAGCCT ACTAAAAAAT ATTTTGGCTC TTTTAAAATC 120GGCTATCTTT ACCAACATGC AGAAACGACT AAAAGATTCC CCATCCGCCC TAAAAACCGC 180CCGCCTATTT TAATGGATAA AATTTACCAT GACGCTTCTT TGGGTTTTGA CGCAGGGTAT 240GTTTTGAAAA AGAAAGCTTT ATTGGGGGGG TATTTGGATG CAGGAATGGG CGATTCGTAT 300TTCATGAGCG CTGGGCTAGT CGCTGGGGTG AGGCTTTTTA AGGGGTGGGT TATCCCTAAA 360ATCGCCTTAG GCTATCAGCT TCAAATTTTA GGGGCTAAGA TTGATAAGTA TCAATTCAAT 420ATCCAATCAG CGGTGGGGAG TGTGGGCTTG TTTTTCAATG CGGCTAAAAA TTTTGGCTTG 480AGTATAGAAG CAAGGGGCGG TATCCCTTTT TATTTCATTC AGAGCAGGTT TTCTAAGGCT 540TTCGGCACGC CACGATTGAA TATCTATTCT GTTGGTATCA CATTCACTTT TTATGACTTT 600ACGAGATTTT TAGGGTAA618(2)INFORMATION FOR SEQ ID NO68(i)序列特征(A)长度762个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...762(xi)序列描述SEQ ID NO68TTGTGGCATG CTGCCTTTAG CGTTGGCGAG TGGGGATGGA ACGGCGATGA AATCCCCTAT 60AGGGATTGCG ATGAGTGGGG GCTTGATGAT TTCTATGGTG TTAAGCCTAC TGATTGTGCC 120GGTGTTTTAT CGTTTGCTCG CTCCCATAGA CGACAAAATC AAGCGGTTTT ATCAAAACCA 180AAAAGCTTTA GAATGAAAAA AATTGCTTTC ATTTTGGCTT TATGGGTGGG CTTGTTAGGG 240GCGTTTGAGC CTAAAAAAAG TCATATTTAT TTTGGGGCTA TGGTGGGTTT AGCCCCTGTT 300AAAATAACCC CAAAACCGGC TAGTGATTCT TCTTATACGG CTTTTTTATG GGGGGCTAAA 360GGGGGGTATC AATTCGCTTT TTTTAAAGCT CTAGCGTTAA GGGGTGAATT TTCCTACCTT 420ATGGCGATCA AACCCACCGC ACTGCACACG ATTAACACTT CTTTATTGAG TTTAAATATG 480GATGTGTTGA GCGATTTTTA CACTTATAAA AAATACAGCT TTGGGGTGTA TGGGGGGCTT 540GGGATAGGGT ATTTTTATCA AAGCAACCAT TTAGGCATGA AAAATAGTTC GTTTATGGGT 600TATAACGGCT TGTTTAATGT GGGGCTTGGC AGCACGATCG ATCGCCACCA CCGCGTAGAG 660CTTGGGGCTA AGATCCCTTT TTCAAAGACT AGAAATTCTT TTAAAAATTC TTATTTTTTA 720GAGAGCGTTT TTATCCATGC GGCTTATAGT TATATGTTTT AA 762(2)INFORMATION FOR SEQ ID NO69(i)序列特征(A)长度1239个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1239(xi)序列描述SEQ ID NO69ATGGAATCAG TAAAAACAGT AAAAACAAAT AAAGTTGGCA AAAACACAGA GACAGCTAAC 60ACAGAGGCAA GTAAAGAGAC TCATTTTAAA CAAGCGAGTG CCATTACAAA TACGCTCCGA 120TCAATTGGTG GGATTTTTAC AAAAATTGCA AAGAAAGTTA GAGAACTTGT GAAAAAACAT 180CCCAAGAAAA GCAGTGTGGC ATTAGTAGTA TTGACCCATA TTGCGTGCAA GAGGGCAAAA 240GAATTGGACG ATAAAGTCCA AGATAAATCC AAACAAGCTG AAAAAGAAAA TCAAATCAAT 300TGGTGGAAAT ATTCAGGATT AACAATAGCG GCAAGTTTAT TATTAGCCGC TTGTAGCACT 360GGTGATATTG ATAAACAAAT AGAACTAGAA CAAGAAAAAA AGGAAGCAAATAAGAGTGGG 420ATAAAGTTAG AACAAGAAAG ACAGAAAACA GAACAAGAAA GACAGAAGAC AAATAAGAGT 480GAGATAGAGT TAGAACAAGA AAGACAAAAA ACAAACAAGA GTGGGATAGA ACTCGCTAAT 540AGTCAAATAA AAGCAGAACA AGAAAGACAA AAGACAGAAC AAGAAAAACA AAAAGCAAAT 600AAGAGTGAGA TAGAGTTAGA ACAGCAAAAA CAAAAGACAA TTAATACACA AAGAGATTTG 660ATTAAAGAAC AGAAAGATTT CATTAAAGAA ACAGAACAAA ATTGCCAAGA AAAACATGGC 720CAATTGTTTA TTAAAAAAGC AAGAATTAAG ACCGGTATTA CTACTGGTAT TGCCATAGAA 780ATAGAAGCTG AATGCAAAAC CCCTAAACCT GCAAAAACCA ATCAAACCCC TATCCAGCCA 840AAACACCTCC CAAACTCTAA ACAACCCCGC TCTCAAAGAG GATCAAAAGC GCAAGAGCTT 900ATCGCTTATT TGCAAAAAGA GCTAGAATCT CTGCCCTATT CGCAAAAAGC TATCGCTAAA 960CAAGTGGATT TTTATAAACC AAGTTCTATC GCTTATTTAG AACTAGACCC TAGAGATTTT 1020AAGGTTACAG AAGAATGGCA AAAAGAAAAT TTAAAAATAC GCTCTAAAGC TCAAGCTAAA 1080ATGCTTGAAA TGAGAAACCC ACAAGCCCAC CTTCCAACCT CTCAAAGCCT TTTGTTCGTT 1140CAAAAAATAT TTGCTGATAT TAATAAAGAA ATAGAAGCAG TTGCTAATAC TGAAAAGAAA 1200ACAGAAAAAG CGGGTTATGG TTATAGTAAA AGGATGTAG 1239(2)INFORMATION FOR SEQ ID NO70(i)序列特征(A)长度450个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...450(xi)序列描述SEQ ID NO70TTGAATTGGG AGCATTTGAT GAAAAAATTA GCGTTTTCTT TATTATTTAC AGGGACTTTT60TTGGGGCTTT TTTTGAATGC GAGTGATTTT AAGAGCATGG ATAACAAGCA ACTATTAGAG 120CAAGCAGGGA AAGTCGCTCC TAGCGAAGTT CCAGAGTTTC GCACAGAAGT CAATAAACGA 180TTAGAAGCGA TGAAAGAAGA AGAGCGTCAA AAATATAAAG CGGATTTTAA GAAAGCGATG 240GATAAGAATT TGGCTTCTTT AAGCCAAGAA GATCGCAACA AGCGTAAAAA AGAAATCCTT 300GAAGTCATTG CTAACAAAAA GAAAACAATG ACCATGAAAG AGTATCGTGA AGAGGGGTTG 360GATTTGCATG ATTGCGCATG CGAAGGCCCT TTTCATGATC ATGAAAAAAA GGGGCAAAAA 420GGGAAAAAAC CAAGCCATCA TAAGCATTAG 450(2)INFORMATION FOR SEQ ID NO71(i)序列特征(A)长度615个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...615(xi)序列描述SEQ ID NO71ATGCAAGCAG TGATTTTAGC GAATGGGGAG TTTCCTAAAT CTAAAAAATG CTTAGACATT60TTACAAAACG CTCCCTTTTT AATCGCATGC GATGGGGCTG TTATATCATT GCATGCGCTT 120CAATTCAAAC CCAGCGTTGT TATAGGCGAT TTGGATAGCA TTGATTCGCA TTTGAAAGCC 180TTGTATAACC CTATACGCGT GAGCGAACAA GACAGCAACG ATTTGTCCAA AGCCTTTTTT 240TATGCTTTGA ATAGGGGTTG TGATGATTTT ATTTTTTTAG GGTTGAATGG CAAGCGAGAA 300GACCACGCTT TAGCGAACAC TTTTTTATTG TTGGAGTATT TTAAATTTTG CAAAAAAATC 360CAATCCGTAA GCGATTATGG CCTTTTTAGG GTGTTAGAAA CCCCTTTTAC TTTGCCCAGT 420TTTAAGGGGG AGCAAATCTC GCTTTTTAGC TTGGATCTTA AAGCCCGATT CACTTCTAAA 480AACCTCAAAT ACCCCTTAAA AGACTTGCGT CTAAAAACGC TCTTTTCCGG CTCGCTCAAT 540GAAGCCACTA ATCATTGTTT TAGCCTTAGC TCTGAACCTA AATCGGTGGT GCTAGTGTAT 600CAAAAATTCT CATGA615(2)INFORMATION FOR SEQ ID NO72(i)序列特征(A)长度843个碱基对(B)类型核酸(C)链型双链
(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...843(xi)序列描述SEQ ID NO72GTGTTTGACT CATTGGGCGG ATTTTTGGGG TATAAAACTT TTAAGCCGAT AGTGGATAAG60GTTAAAAATA TAAACGCTTG GATAAAAAAT TACGATAATA AAAAAGCTCA AGAGATTATG 120GGTTTTATAG AAAATCCTAC GCCTGATTTC CAAAATAATA AGTTTTTGTG TGTTTTAAAC 180CGACAAGGAA CAAGGCACAA CAATTATCTT GGTTTAACCT CTACAAACCT TCTAATCGGC 240GCGATCTATT TCTCCATCCG CCATTGCATC AAAGCCACAT GGCAAAACGA TAGGGATCAA 300TTCTACGCCC CTTATGATGA CGCTTTCCAA GACGACAGCG AGTTTAAAAA CAATTGTTTG 360GCGTTCATGC TTTTTCACAC CCAAAACCGC ATCACTGCCA CTCAAGGGAC TAACCATTTT 420ATCCCCTTTA GCGAAGATGA AGTTGATTCT AAAGAAAGGT ATTTGAGCCA TGCTTTATTA 480GACTTTTTAA AAGGCGAAAT CAAAGAACCT AAAAAGAGCG ATAGCCTCTT TTTAAACGCC 540AAAAAAGAAA ACAAGCCCCT AAAATTCAGC TCGAGCGCTT CAAAGGTGTT TGACGCTGGC 600AGAGAGATTT ATCGCTATTA CCACACACAA GATTTCATCC ACACCCCCTA TAACGCTAAC 660GCAAGCCTTT ATGACATCAA AGAATTTTTT CAAGGCCGTA ACAAGCAAGG CAGATTAAAC 720TCACCCACCA AAGCCAAAGA TGAATATTAC AAACAGCTTT ACGCTAACTT GCAATACGCC 780CTAAAAGATC TCGCCAAAGA AATACAGCCT AAAGTCTATG AATACGGATT TTTAAGGGAG 840TAG 843(2)INFORMATION FOR SEQ ID NO73(i)序列特征(A)长度930个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...930(xi)序列描述SEQ ID NO73TGTGACAGGG CAATTCCCCA TTGGCTTTTT AGTCTGGGAT ACCGCTACCC CCCCCCCTTA60AAACCAACCA ACGCGTTCAA TTTAGAAGTG TTTGACTCAT TGGGCGGATT TTTGGGGTAT 120AAAACTTTTA AGCCGATAGT GGATAAGGTT AAAAATATAA ACGCTTGGAT AAAAAATTAC 180GATAATAAAA AAGCTCAAGA GATTATGGGT TTTATAGAAA ATCCTACGCC TGATTTCCAA 240AATAATAAGT TTTTGTGTGT TTTAAACCGA CAAGGAACAA GGCACAACAA TTATCTTGGT 300TTAACCTCTA CAAACCTTCT AATCGGCGCG ATCTATTTCT CCATCCGCCA TTGCATCAAA 360GCCACATGGC AAAACGATAG GGATCAATTC TACGCCCCTT ATGATGACGC TTTCCAAGAC 420GACAGCGAGT TTAAAAACAA TTGTTTGGCG TTCATGCTTT TTCACACCCA AAACCGCATC 480ACTGCCACTC AAGGGACTAA CCATTTTATC CCCTTTAGCG AAGATGAAGT TGATTCTAAA 540GAAAGGTATT TGAGCCATGC TTTATTAGAC TTTTTAAAAG GCGAAATCAA AGAACCTAAA 600AAGAGCGATA GCCTCTTTTT AAACGCCAAA AAAGAAAACA AGCCCCTAAA ATTCAGCTCG 660AGCGCTTCAA AGGTGTTTGA CGCTGGCAGA GAGATTTATC GCTATTACCA CACACAAGAT 720TTCATCCACA CCCCCTATAA CGCTAACGCA AGCCTTTATG ACATCAAAGA ATTTTTTCAA 780GGCCGTAACA AGCAAGGCAG ATTAAACTCA CCCACCAAAG CCAAAGATGA ATATTACAAA 840CAGCTTTACG CTAACTTGCA ATACGCCCTA AAAGATCTCG CCAAAGAAAT ACAGCCTAAA 900GTCTATGAAT ACGGATTTTT AAGGGAGTAG930(2)INFORMATION FOR SEQ ID NO74(i)序列特征(A)长度564个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...564(xi)序列描述SEQ ID NO74TTGGAAACTT ATATCATTGA TGCAGATAAT ATAGATGGGG ATTTATTTTT CTATAATCTT60ACTAGAAACA GCAATGATTT TTCCATGTTG CCCGTTTTTG AACTCGATCG CATTGCCCAA 120AAAATTAGAA ATATTCTTAA AAAACATGGC AGTAGAAAAG ACATTATTTT AAAACACAAT 180GAAATTAAAG AAGCCTTTTT TAGCCCGTTC AAACCGCAGC TAAAAACCGT TCAAGTGTTC 240CTCTCGCACT CGCATGCGGA TAAAAATAAG GCTTTAGGGG TTAAGGACTA TTTGGAAAGC 300AAAACAAAAC GCAAAGTGTT TATCGATTCG CTTTTTTGGG ATTATAAAGA CGATGTTTTA 360AACAAATTGG CAAAACACGA TGATATAAGC AAGATTGAAG ACGCTTTCAC GCTCATTCTC 420AGAAAATCTT TACAAGATAT GATTGAAAAA TGCCCTTATT TTGTGTTTTT ACAAAGCAAG 480AACAGCGTTT CTAATCAAGG GCTATCACGC ATCACTTATT CCGCATGGAT TTATGAAGAA 540TTAAAAATCG CTTCATTCTA TTAG 564(2)INFORMATION FOR SEQ ID NO75(i)序列特征(A)长度597个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...597(xi)序列描述SEQ ID NO75TTGGAAACTT ATATCATTGA TGCAGATAAT ATAGATGGGG ATTTATTTTT CTATAATCTT 60ACTAGAAACA GCAATGATTT TTCCATGTTG CCCGTTTTTG AACTCGATCG CATTGCCCAA 120AAAATTAGAA ATATTCTTAA AAAACATGGC AGTAGAAAAG ACATTATTTT AAAACACAAT 180GAAATTAAAG AAGCCTTTTT TAGCCCGTTC AAACCGCAGC TAAAAACCGT TCAAGTGTTC 240CTCTCGCACT CGCATGCGGA TAAAAATAAG GCTTTAGGGG TTAAGGACTA TTTGGAAAGC 300AAAACAAAAC GCAAAGTGTT TATCGATTCG CTTTTTTGGG ATTATAAAGA CGATGTTTTA 360AACAAATTGG CAAAACACGA TGATATAAGC AAGATTGAAG ACGCTTTCAC GCTCATTCTC 420AGAAAATCTT TACAAGATAT GATTGAAAAA TGCCCTTATT TTGTGTTTTT ACAAAGCAAG 480AACAGCGTTT CTAATCAAGG GCTATCACGC ATCACTTATT CCGCATGGAT TTATGAAGAA 540TTAAAAATCG CTTCATTTCT ATTAGCGCTA TTAACGAGAG TCGCCCAATT CCAATGA 597(2)INFORMATION FOR SEQ ID NO76(i)序列特征(A)长度570个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...570(xi)序列描述SEQ ID NO76ATGATGACTA AGAACGCTTA TGCGTTTGTC GTGATTGAAA AAAGTATTAT GGTGTTTAAA60TGCGCCAAAG ACAAGGGGCT AATCCCTATC ACTGAAGGCT TTGTGCCGTT AAAAGAGGGC 120TTTTTGAGAA GTTTTAAAGA GCGTTGCAAT CTGGATTTTT TAGAAAATTT AGACCTTTTG 180TTTTTGTATG ACTACCAATT TCCAAGCGAG GTTTTTTCAT TGTGTAAGGA TTTGAAAAAT 240TCCATTTGGG ACAGAAAGCT TGTGGTAGTG CTAGTGGAGG CTTTGGAGGG TTTTAAGGGT 300TTGAATTTGT CTCTTAAGAT AGAAGATAGG CATTCTAATA GCTTGGGTAA TGGCGTTCAA 360AAATTGCTCA CCAACGCTGA TTTGGGGAGC AACCACAAAC CAATCGTAAT AGACAGCATG 420AAAACATACC ACCAAAGCCA GCAAGAAAAA TACAAAAGAG AAAGAGGCGA AACGCTAGAG 480GTTCGCCCCA CAACACCCCC TAGCTATGGG GGTGGGAGCA TTAGAATCAG CGGCGATAAA 540AAGCCTGATT CCAATGAAGA AAATTTTTAA570(2)INFORMATION FOR SEQ ID NO77(i)序列特征(A)长度1773个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1773(xi)序列描述SEQ ID NO77ATGAAAGCGA TAAAAATACT TCTTATAATG ACACTCAGTT TAAACGCTAT CAGCGTGAAT 60AGGGCGTTGT TTGATTTAAA AGATTCGCAA TTAAAAGGGG AATTAACGCC AAAAATAGTG 120GATTTTGGGG GTTATAAAAG CAACACCACA GAGTGGGGAG CTACGGCTTT AAACTATATC 180AATGCGGCTA ATGGCGATGC GAAAAAATTC AGCGCGTTAG TGGAAAAAAT GCGTTTTAAC 240TCTGGTATCT TGGGGAATTT TAGAGCGCAT GCACATTTGA GGCAAGCCCT AAAATTGCAA 300AAGAATTTGA AATATTGCCT TAAAATCATC GCTAGGGATT CTTTTTATAG TTACCGCACC 360GGTATTTATA TCCCCTTAGG CATTTCTTTA AAAGATCAAA AAACGGCTCA AAAAATGCTC 420GCTGATTTGA GCGTGGTAGG GGCGTATCTT AAAAAGCAAC AGGAGAATGA AAAGGCTCAA 480AGCCCTTATT ACAGGAGCAA CAACTATTAC AACTCCTACT ATAGCCCTTA TTATGGCATG 540TATGGCATGT ATGGAATGGG CATGTATGGA ATGTATGGCA TGGGCATGTA TGATTTTTAT 600GACTTTTATG ATGGCATGTA TGGGTTCTAC CCTAACATGT TTTTCATGAT GCAAGTTCAA 660GACTACTTGA TGTTAGAAAA TTACATGTAT GCACTCGATC AAGAAGAGAT TTTAGACCAT 720GACGCTTCCA TCAACCAACT TGATACGCCT ACTGATGATG ACAGAGACGA TAAAGACGAT 780AAATCTTCGC AACCAGCGAA TCTCATGAGC TTTTATCGTG ATCCCAAATT CAGCAAAGAC 840ATTCAAACCA ACCGCTTGAA TAGCGCCTTA GTCAATTTAG ACAACAGCCA CATGCTCAAA 900GACAATTCGC TCTTCCACAC TAAAGCCATG CCCACTAAAA GCGTGGATGC GATCACTTCT 960CAAGCTAAAG AGCTTAACCA TTTGGTGGGG CAAATCAAAG AGATGAAGCA AGACGGGGCG 1020AGTCCTAATA AGATTGATTC AGTGGTCAAT AAAGCTATGG AGGTTAGGGA CAAATTAGAC1080AACAACCTCA ACCAACTAGA CAATGACTTA AAAGATCAAA AAGGGCTTTC AAGCGAGCAG1140CAAGCCCAAG TGGATAAAGC CTTAGACAGC GTGCAACAAT TAAGCCATAG CAGCGATGTG1200GTAGGGAATT ATTTAGACGG GAGTTTGAAA ATTGATGGCG ATGACAGAGA CGATTTGAAT1260GATGCGATCA ATAACCCTAT GCAACAACCT GCGCAACAAA CGCCTATTAA CAACATGGAC1320AACACCCATG CAAATGACAG CAAAGATCAA GGGGGTAACG CGCTCATAAA CCCTAACAAC1380GCCACCAACG ATGATCACAA CGATGATCAC ATGGACACTA ACACCACTGA CACTAGCAAC1440GCAAACGACA CCCCCACTGA TGATAAAGAT GCTAGCGGCA ACAATACCGG CGATATGAAT1500AACACCGACA CCGGCAATAC GGACACTGGC AACACCGACA CCGGTAACAC TGATGATATG1560AGCAACATGA ACAACGGCAA CGATGATACG GGTAACACTA ACGACGACAT GGGTAATAGC1620AACGACATGG GCGATGACAT GAATAACGCG AACGACATGA ACGACGACAT GGGTAACAGC1680AACGATGACA TGGGCGATAT GGGGGACATG AACGATGACA TGGGTGGCGA TATGGGAGAC1740ATGGGGGATA TGGGTGGCGA TATGGGGAAT TGA 1773(2)INFORMATION FOR SEQ ID NO78(i)序列特征(A)长度588个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...588(xi)序列描述SEQ ID NO78TTGAATTTAC GATTGGCTGG AGCAAGCGTT TTAACGGCTT GTGTCTTTTC GGGGTGTTTT60TTTTTAAAAA TGTTTGACAA AAAACTTTCT AGCAACGATT GGCATATCCA AAAAGTAGAA 120ATGAACCATC AAGTGTATGA CATTGAAACC ATGCTCGCTG ATAGCGCTTT TAGAGAGCAT 180GAAGAAGAGC AAGACTCCTC TTTAAATACC GCTTTGCCTG AAGATAAAAC AGCGATTGAA 240GCCAAAGAGC AAGAGCAAAA AGAAAAAAGG AAACACTGGT ATGAGCTTTT TAAAAAGAAG 300CCAAAGCCCA AAAGCTCTAT GGGAGAGTTT GTGTTTGATC AAAAAGAAAA TCGTATTTAT 360GGGAAAGGCT ATTGCAACCG GTATTTTGCT AGCTACACAT GGCAGGGCGA TAGGCACATC 420GCAATTGAAG ATAGCGGGAT TTCAAGAAAA GTGTGTAGAG ATGAGCATTT GATGGCGTTT 480GAATTGGAAT TTATGGAGAA TTTTAAGGGT AATTTTGCGG TAACTAAGGG CAAGGACACG 540CTCATTTTAG ACAACCAAAA AATGAAAATT TATTTGAAAA CGCCATGA588(2)INFORMATION FOR SEQ ID NO79(i)序列特征(A)长度2235个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...2235(xi)序列描述SEQ ID NO79ATGTTAAAAC TCGCCAGTAA AACGATTTGT TTGTCCCTAA TCAGCTCATT CACGGCTGTA 60GAAGCCTTTC AAAAACACCA AAAAGACGGC TTTTTCATAG AAGCCGGCTT TGAAACCGGG 120CTATTACAAG GCACACAAAC CCAAGAACAA ACCATAGCCA CCACTCAAGA AAAACCCAAA 180CCCAAACCCA AACCAAAACC CATTACCCCT CAAAGCACCT ATGGGAAATA CTACATCTCC 240CAAAGCACCA TTTTAAAGAA TGCGACTGAG TTGTTTGCAG AGGATAATAT CACCAACTTA 300ACCTTTTACT CTCAAAACCC TGTGTATGTA ACCGCTTATA ACCAAGAAAG CGCTGAAGAA 360GCTGGCTATG GTAATAACAG CTTGATTATG ATACAAAACT TCTTGCCTTA TAACTTGAAC 420AACATTGAGC TGAGTTACAC GGACGATCAA GGCAATGTGG TCAGTTTGGG CGTGATAGAG 480ACTATCCCTA AACAATCTCA AATCATTCTG CCCGCAAGCT TGTTTAACGA CCCACAGCTT 540AACGCCGATG GCTTCCAACA ACTCCAAACC AACACCACAC GATTTTCTGA TGCCAGCACG 600CAGAATCTGT TTAACAAGCT CAGCAAGGTT ACAACCAATC TTCAAATGAC TTATATCAAT 660TACAACCAAT TTTCTAGCGG TAACGGCAGT GGCTCTAAAC CCCCATGCCC CCCATACGAA 720AACCAAGCAA ATTGTGTGGC TAAAGTGCCG CCTTTCACCT CTCAAGACGC TAAAAATTTG 780ACCAATTTAA TGCTGAACAT GATGGCGGTG TTTGATTCTA AATCTTGGGA AGACGCCGTC 840TTAAACGCTC CTTTCCAATT CAGCGACAAC AACCTGTCAG CGCCATGTTA TTCTGATTAC 900CTTACATGCG TGAATCCTTA CAACGATGGG CTTGTTGATC CTAAATTGAT CGCCAAAAAT 960AAAGGAGATG AATACAATAT AGAAAACGGG CAAACAGGCT CAGTGATATT AACGCCGCAA1020GATGTTATCT ATAGCTATAG AGTCGCTAAT AATATTTATG TGAATCTCTT GCCCACAAGA1080GGAGGGGATT TAGGGTTAGG GTCTCAATAT GGTGGCCCGA ATGGCCCAGG CGATGATGGC1140ACCAATTTTG GCGCTTTAGG GATATTGTCC CCTTTCTTAG ACCCTGAAAT ATTGTTTGGC1200AAAGAATTGA ATAAAGTCGC CATCATGCAA TTAAGAGACA TCATCCATGA ATACGGCCAT1260ACTTTAGGCT ATACGCATAA CGGGAACATG ACTTATCAAA GAGTGCGCAT GTGCGAAGAA1320AACAATGGGC CAGAAGAGCG CTGTCAGGGC GGAAGGATAG AGCAAGTGGA TGGGAAAGAA1380GTGCAAGTGT TTGACAACGG GCATGAAGTG CGAGACACCG ATGGCTCTAC CTATGATGTG1440TGTTCTCGTT TTAAAGATAA GCCCTATACA GCGGGCAGCT ATCCTAATTC CATCTATACC1500GATTGCTCTC AAGTCCCCGC TGGGCTTATA GGCGTTACCA GCGCTGTTTG GCAACAACTC1560ATTGATCAAA ACGCCCTACC GGTGGATTTT ACTAATTTGA GCAGCCAAAC CAACTATTTG1620AACGCCAGCT TGAACACGCA AGACTTTGCG ACCACCATGC TTAGCGCGAT CAGTCAAAGC1680CTTTCATCTT CTAAATCTAG CGCCACTACT TATCGCACTT CAAAAACCTC ACGGCCCTTT1740GGAGCCCCCC TATTAGGCGT TAATCTTAAA ATGGGCTATC AAAAATATTT TAATGATTAT1800CTAGGGTTGT CTTCTTATGG CATTATCAAA TACAACTACG CTCAAGCCAA CAACGAAAAA1860ATCCAGCAAT TAAGCTATGG CGTGGGAATG GATGTGCTGT TTGATTTCAT CACCAATTAC1920ACTAACGAAA AGAACCCCAA AAGCAATCTA ACCAAGAAAG TTTTCACTTC CTCTCTTGGG1980GTGTTTGGGG GGTTAAGGGG CTTATACAAC AGCTATTATT TGTTGAACCA ATACAAAGGG2040AGCGGTAATT TAAATGTGAC CGGTGGGTTG AATTACCGCT ACAAGCATTC CAAATATTCT2100ATAGGCATTA GCGTTCCTTT GGTCCAGTTG AAATCTAGGA TCGTTTCTAG CGATGGTGCT2160TATACCAATT CTATCACCCT CAATGAAGGG GGCAGTCATT TTAAAGTGTT TTTTAATTAC2220GGGTGGATTT TCTAA 2235(2)INFORMATION FOR SEQ ID NO80(i)序列特征(A)长度1590个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征
(B)位置1...1590(xi)序列描述SEQ ID NO80ATGACTTATA TCAATTACAA CCAATTTTCT AGCGGTAACG GCAGTGGCTC TAAACCCCCA 60TGCCCCCCAT ACGAAAACCA AGCAAATTGT GTGGCTAAAG TGCCGCCTTT CACCTCTCAA 120GACGCTAAAA ATTTGACCAA TTTAATGCTG AACATGATGG CGGTGTTTGA TTCTAAATCT 180TGGGAAGACG CCGTCTTAAA CGCTCCTTTC CAATTCAGCG ACAACAACCT GTCAGCGCCA 240TGTTATTCTG ATTACCTTAC ATGCGTGAAT CCTTACAACG ATGGGCTTGT TGATCCTAAA 300TTGATCGCCA AAAATAAAGG AGATGAATAC AATATAGAAA ACGGGCAAAC AGGCTCAGTG 360ATATTAACGC CGCAAGATGT TATCTATAGC TATAGAGTCG CTAATAATAT TTATGTGAAT 420CTCTTGCCCA CAAGAGGAGG GGATTTAGGG TTAGGGTCTC AATATGGTGG CCCGAATGGC 480CCAGGCGATG ATGGCACCAA TTTTGGCGCT TTAGGGATAT TGTCCCCTTT CTTAGACCCT 540GAAATATTGT TTGGCAAAGA ATTGAATAAA GTCGCCATCA TGCAATTAAG AGACATCATC 600CATGAATACG GCCATACTTT AGGCTATACG CATAACGGGA ACATGACTTA TCAAAGAGTG 660CGCATGTGCG AAGAAAACAA TGGGCCAGAA GAGCGCTGTC AGGGCGGAAG GATAGAGCAA 720GTGGATGGGA AAGAAGTGCA AGTGTTTGAC AACGGGCATG AAGTGCGAGA CACCGATGGC 780TCTACCTATG ATGTGTGTTC TCGTTTTAAA GATAAGCCCT ATACAGCGGG CAGCTATCCT 840AATTCCATCT ATACCGATTG CTCTCAAGTC CCCGCTGGGC TTATAGGCGT TACCAGCGCT 900GTTTGGCAAC AACTCATTGA TCAAAACGCC CTACCGGTGG ATTTTACTAA TTTGAGCAGC 960CAAACCAACT ATTTGAACGC CAGCTTGAAC ACGCAAGACT TTGCGACCAC CATGCTTAGC 1020GCGATCAGTC AAAGCCTTTC ATCTTCTAAA TCTAGCGCCA CTACTTATCG CACTTCAAAA 1080ACCTCACGGC CCTTTGGAGC CCCCCTATTA GGCGTTAATC TTAAAATGGG CTATCAAAAA 1140TATTTTAATG ATTATCTAGG GTTGTCTTCT TATGGCATTA TCAAATACAA CTACGCTCAA 1200GCCAACAACG AAAAAATCCA GCAATTAAGC TATGGCGTGG GAATGGATGT GCTGTTTGAT 1260TTCATCACCA ATTACACTAA CGAAAAGAAC CCCAAAAGCA ATCTAACCAA GAAAGTTTTC 1320ACTTCCTCTC TTGGGGTGTT TGGGGGGTTA AGGGGCTTAT ACAACAGCTA TTATTTGTTG 1380AACCAATACA AAGGGAGCGG TAATTTAAAT GTGACCGGTG GGTTGAATTA CCGCTACAAG 1440CATTCCAAAT ATTCTATAGG CATTAGCGTT CCTTTGGTCC AGTTGAAATC TAGGATCGTT 1500TCTAGCGATG GTGCTTATAC CAATTCTATC ACCCTCAATG AAGGGGGCAG TCATTTTAAA 1560GTGTTTTTTA ATTACGGGTG GATTTTCTAA 1590(2)INFORMATION FOR SEQ ID NO81(i)序列特征(A)长度564个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...564(xi)序列描述SEQ ID NO81TTGGGTTGCG TATCAATGAC TCTAGGTATT GATGAAGCGG GGAGGGGGTG TTTGGCCGGT60TCGCTTTTTG TGGCGGGGGT GGTGTGTAAT GAAAAAATAG CCTTAGAATT TCTAAAAATG 120GGTCTTAAGG ATAGCAAGAA GCTCAGCCCC AAAAAGCGCT TTTTCTTAGA AGATAAAATC 180AAAACGCATG GTGAGGTGGG GTTTTTCGTG GTTAAAAAAA GCGCGAATGA AATTGATCAT 240TTGGGCTTAG GGGCGTGTTT GAAACTCGCT ATTGAAGAAA TTGTAGAAAA TGGTTGCTCT 300TTAGCCAATG AAATAAAAAT AGATGGCAAC ACGGCGTTTG GCTTGAACAA ACGCTACCCC 360AACATACAAA CCATCATCAA GGGCGATGAA ACAATCGCTC AAATCGCTAT GGCGTCTGTT 420TTGGCGAAAG CTTCTAAGGA TAGGGAAATG TTAGAACTGC ACGCTTTGTT TAAGGAATAC 480GGCTGGGATA AGAATTGCGG GTATGGGACT AAACAACATA TAGAAGCGAT CAATAAGCTA 540GGGGCTACGC TTTCATCGGC ATAG 564(2)INFORMATION FOR SEQ ID NO82(i)序列特征(A)长度615个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...615
(xi)序列描述SEQ ID NO82ATGACTCTAG GTATTGATGA AGCGGGGAGG GGGTGTTTGG CCGGTTCGCT TTTTGTGGCG 60GGGGTGGTGT GTAATGAAAA AATAGCCTTA GAATTTCTAA AAATGGGTCT TAAGGATAGC 120AAGAAGCTCA GCCCCAAAAA GCGCTTTTTC TTAGAAGATA AAATCAAAAC GCATGGTGAG 180GTGGGGTTTT TCGTGGTTAA AAAAAGCGCG AATGAAATTG ATCATTTGGG CTTAGGGGCG 240TGTTTGAAAC TCGCTATTGA AGAAATTGTA GAAAATGGTT GCTCTTTAGC CAATGAAATA 300AAAATAGATG GCAACACGGC GTTTGGCTTG AACAAACGCT ACCCCAACAT ACAAACCATC 360ATCAAGGGCG ATGAAACAAT CGCTCAAATC GCTATGGCGT CTGTTTTGGC GAAAGCTTCT 420AAGGATAGGG AAATGTTAGA ACTGCACGCT TTGTTTAAGG AATACGGCTG GGATAAGAAT 480TGCGGGTATG GGACTAAACA ACATATAGAA GCGATCAATA AGCTAGGGGC TACGCCTTTT 540CATCGGCATA GCTTCACGCT TAAAAACCGC ATCTTAAATC CCAAACTCTT AGAGGTGGAA 600CAACGCCTTG TTTAA 615(2)INFORMATION FOR SEQ ID NO83(i)序列特征(A)长度579个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...579(xi)序列描述SEQ ID NO83ATGAATGCAT TGAAAAAATT AAGTTTTTGC GCCTTGTTAT CCCTAGGCCT CTTCGCTCAA 60ACAGTGCATG CTCAGCATTT AAAGGACACG ATTAACTATC CTGATTGGCT TAAAATCAAT 120CTTTTTGATA AAAAGAACCC GCCCAATCAA TATGTCGGAT CGGCTTCAAT TTCTGGTAAA 180AGGAACGATT TTTATTCCAA TTACATCCCC TATGATGACA AATTGCCCCC TGAAAAGAAC 240GCTGAAGAAA TCGCTCTTTT AAGGGCCAGA ATGAACGCTT ACAGCACTTT AGAAAGCGCT 300TTACTCACTA AAATGTGCAA TCGCATTGTT AAAGCGCTTC AAGTTAAAAA TAATGTTATC 360AGCCATTTAT TCGGGTTTGT TGATTTTTTA ACGTCTAAAT CCATTTTGGC TAAAAGGTTC 420GTGGATACCA CCAACCATCG TGTGTATGTC ATGGTGCAAT TCCCTTTCAT TCAGCCTGAA 480GACTTAATCG CTTACTTTAA AGCCAAACGC ATCGACCTTT CTTTAGCGAG CGCTACCAAT 540CTCAGCGCCA TTTTAAACAA GGCGTTGTTC CACCTCTAA 579(2)INFORMATION FOR SEQ ID NO84(i)序列特征(A)长度261个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...261(xi)序列描述SEQ ID NO84ATGAATGCAT TGAAAAAATT AAGTTTTTGC GCCTTGTTAT CCCTAGGCCT CTTCGCTCAA60ACAGTGCATG CTCAGCATTT AAAGGACACG ATTAACTATC CTGATTGGCT TAAAATCAAT 120CTTTTTGATA AAAAGAACCC GCCCAATCAA TATGTCGGAT CGGCTTCAAT TTCTGGTAAA 180AGGAACGATT TTTATTCCAA TTACATCCCC TATGATGACA AATTGCCCCC TGAAAGACG240CTGAAGAAAT CGCTCTTTTA A 261(2)INFORMATION FOR SEQ ID NO85(i)序列特征(A)长度228个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状
(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...228(xi)序列描述SEQ ID NO85TTGAAAATTT TAACCCTTTT TTTGATAGGT TTAAACGCAT TGTTCGCCCT AGATTTGAAC 60GCGCTTAAAA CAGAAATCAA AGAAACCTAT CTCAAAGAAT ACAAAGACTT AAAATTGGAA 120ATTGAAACAA TTAATTTAGA AATCCCAGAG CGTTTTTCTC ACGCTTCCAT TTTAAGCTAT 180GAATTGAACG CTTCTAACAA GCTTAAAAAA GATGGGTCGT GTTTTTAA 228(2)INFORMATION FOR SEQ ID NO86(i)序列特征(A)长度636个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...636(xi)序列描述SEQ ID NO86ATGTTTTCAA TAATTCTGGG GGGGGGGGGG GGTAATACCC CATGCGGCTT GACATGGCAA 60CACTTCAAAT TAGGGGATTT GTTTGAAATT GAAAAAACCT TAAGCTTTAA TAAAGACGCT 120TTAACGCAAG GACAAGATTA CGATTATATT ACAAGAACTT CGCAAAATCA AGGCGTTTTG 180CAAACTACAG GATTTGTCAA TGCAGAAAAT TTAAACCCAC CATTTACTTG GAGTTTAGGG 240CTTTTGCAAA TGGATTTTTT CTATCGTAAA AAGTCATGGT ATGCGGGACA ATTCATGCGA 300AAAATCACAC CAAAAACTGA AATTAAAAAT AAAATTAATT CACGCATAGC CCACTATTTC 360ACAACGCTTT TAAACGCCTT AAAACGCCCT TTATTGAGTG TATTAGTTAG GGATATTGAT 420AAAACTTTTA GGGAGCAAAA AATCCAACTA CCCCTAAAAC CCACCGCTAA AACTCAAAGC 480CTTGATGGTA TTGATTTTGA TTTCATGCAC ACCCTAATCA ACGCCCTGAT GAAGCAAACC 540ATTCAAGGCG TGGTTCAATA CTGCGACGCT AAAATACAGG CTACAAAAGA AGTTATCAGC 600CAAGAAACGC CTATTCAAAA AGACTCGTTA TTTTGA636(2)INFORMATION FOR SEQ ID NO87(i)序列特征(A)长度1221个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1221(xi)序列描述SEQ ID NO87GTGATTGGCC CCCTTAGCAG CCAACTCAAC GCTATTAAGT GGGGCGAGTT CAAATTAGGG 60GATTTGTTTG AAGCGAGTAA CGGCGATTTT GACATTCAAA AACGCCACAT CAATCATAAG 120GGCGAATTTG TCATCACCGC AGGGCTTAGC AATAATGGCG TTTTAGGGCA AAGCGATATA 180AAAGCAAAAG TTTTTGAAAG CCATACCATT ACTATTGACA TGTTTGGTTG CGCGTTTTAT 240CGCAGTTTTG CTTATAAAAT GGTAACACAT GCTAGGGTAT TTTCTCTCAA ACCTAAATTT 300GAAATCAACC ATAAAATCGG CTTGTTTTTA TCCACGCTAT TTTTTGGTTA CCATAAAAAA 360TTCGGCTATG AAAACATGTG TTCATGGGCA AAAATTAAAA ACGATAAAGT CATTCTACCC 420CTAAAACCCA CCGCTAACAC TCAAACCCTT GAGGGTATTG ATTTTGATTT CATGGAAAAA 480TTCATAGCCG AACTTGAGCA GTGTCGGCTC GCCGAACTTC AGGCTTATTT AAAAGCTACA 540GGGCTAGAAA ACACCACCCT TTCTAACGAT GAAGAAAATG CCCTTAATGT TTTCAATAAT 600TCTGGGGGGG GGGGGGGTAA TACCCCATGC GGCTTGACAT GGCAACACTT CAAATTAGGG 660GATTTGTTTG AAATTGAAAA AACCTTAAGC TTTAATAAAG ACGCTTTAAC GCAAGGACAA 720GATTACGATT ATATTACAAG AACTTCGCAA AATCAAGGCG TTTTGCAAAC TACAGGATTT 780GTCAATGCAG AAAATTTAAA CCCACCATTT ACTTGGAGTT TAGGGCTTTT GCAAATGGAT 840TTTTTCTATC GTAAAAAGTC ATGGTATGCG GGACAATTCA TGCGAAAAAT CACACCAAAA 900ACTGAAATTA AAAATAAAAT TAATTCACGC ATAGCCCACT ATTTCACAAC GCTTTTAAAC 960GCCTTAAAAC GCCCTTTATT GAGTGTATTA GTTAGGGATA TTGATAAAAC TTTTAGGGAG 1020CAAAAAATCC AACTACCCCT AAAACCCACC GCTAAAACTC AAAGCCTTGA TGGTATTGAT 1080TTTGATTTCA TGCACACCCT AATCAACGCC CTGATGAAGC AAACCATTCA AGGCGTGGTT 1140CAATACTGCG ACGCTAAAAT ACAGGCTACA AAAGAAGTTA TCAGCCAAGA AACGCCTATT 1200CAAAAAGACT CGTTATTTTG A 1221(2)INFORMATION FOR SEQ ID NO88(i)序列特征(A)长度828个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...828(xi)序列描述SEQ ID NO88ATGAGTAAGA GTTTATACCA AACTTTAAAC GTGAGCGAAA ACGCCAGCCA AGATGAAATC 60AAAAAATCCT ACCGCCGTTT AGCCAGGCAA TACCACCCGG ATTTGAATAA AACCAAAGAA 120GCCGAAGAGA AATTCAAAGA AATCAACGCC GCTTATGAAA TTTTGAGCGA TGAAGAAAAA 180CGCCGCCAAT ACGATCAATT TGGCGACAAC ATGTTTGGCG GGCAGAATTT CAGCGATTTT 240GCCAGAAGCC GTGGTCCTAG TGAAGATTTA GATGATATTT TAAGCTCTAT TTTTGGGAAA 300GGAGGCTTTT CGCAAAGATT TTCTCAAAAT TCGCAAGGCT TTTCTGGCTT TAATTTTTCC 360AATTTCGCCC CTGAAAATTT AGATGTAACC GCTATTTTAA ATGTCTCTGT TTTAGACACC 420CTTTTAGGCA ATAAAAAACA AGTGAGCGTC AATAATGAGA CTTTTAGCCT TAAAATCCCT 480ATCGGCGTGG AAGAGGGCGA AAAGATTAGG GTTCGCAACA AAGGGAAAAT GGGGCGAACG 540GGTAGGGGCG ATTTGCTCTT ACAGATCCAT ATTGAAGAAG ATGAAATGTA TAGGCGCGAA 600AAAGACGATA TTATCCAAAT CTTTGATTTA CCCTTAAAAA CGGCTCTTTT TGGAGGGAAA 660ATTGAAATCG CTACTTGGCA TAAAACCTTA ACCCTAACCA TTCCCCCTAA CACCAAAGCC 720ATGCAAAAAT TCCGCATCAA AGACAAAGGG ATCAAAAGCA GAAAAACTTC GCATGTGGGG 780GATTGTATTG CAAGCTCGTT TGATCTGCTA AAATTGAAAC GCTTCTAA 828(2)INFORMATION FOR SEQ ID NO89(i)序列特征(A)长度837个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...837(xi)序列描述SEQ ID NO89ATGAGTAAGA GTTTATACCA AACTTTAAAC GTGAGCGAAA ACGCCAGCCA AGATGAAATC60AAAAAATCCT ACCGCCGTTT AGCCAGGCAA TACCACCCGG ATTTGAATAA AACCAAAGAA 120GCCGAAGAGA AATTCAAAGA AATCAACGCC GCTTATGAAA TTTTGAGCGA TGAAGAAAAA 180CGCCGCCAAT ACGATCAATT TGGCGACAAC ATGTTTGGCG GGCAGAATTT CAGCGATTTT 240GCCAGAAGCC GTGGTCCTAG TGAAGATTTA GATGATATTT TAAGCTCTAT TTTTGGGAAA 300GGAGGCTTTT CGCAAAGATT TTCTCAAAAT TCGCAAGGCT TTTCTGGCTT TAATTTTTCC 360AATTTCGCCC CTGAAAATTT AGATGTAACC GCTATTTTAA ATGTCTCTGT TTTAGACACC 420CTTTTAGGCA ATAAAAAACA AGTGAGCGTC AATAATGAGA CTTTTAGCCT TAAAATCCCT 480ATCGGCGTGG AAGAGGGCGA AAAGATTAGG GTTCGCAACA AAGGGAAAAT GGGGCGAACG 540GGTAGGGGCG ATTTGCTCTT ACAGATCCAT ATTGAAGAAG ATGAAATGTA TAGGCGCGAA 600AAAGACGATA TTATCCAAAT CTTTGATTTA CCCTTAAAAA CGGCTCTTTT TGGAGGGAAA 660ATTGAAATCG CTACTTGGCA TAAAACCTTA ACCCTAACCA TTCCCCCTAA CACCAAAGCC 720ATGCAAAAAT TCCGCATCAA AGACAAAGGG ATCAAAAGCA GAAAAACTTC GCATGTGGGG 780GATTGTATTG CAAGCTCGTT TGATCTGCCT AAAATTGAAA CGCTTCTAAT GAGTTGA 837(2)INFORMATION FOR SEQ ID NO90(i)序列特征(A)长度699个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...699(xi)序列描述SEQ ID NO90GTGGTTCAAA AATTTAATTT TTATAAGACA GGTGGCATGC GTTTAAAACA TTTTAAGACA60TTCCTTTTTA TCACAATGGC GGTGATTGTG ATAGGCACTG GTTGTGCGAA TAAAAAGAAA 120AAAAAAGATG AATACAACAA ACCGGCGATC TTTTGGTATC AAGGGATTTT GAGAGAAATT 180CTTTTTGCTA ATTTAGAAAC AGCGGACAAT TACTATTCTT CCTTACAGAG CGAACACATC 240AATTCCCCCC TTGTCCCAGA AGCTATGCTA GCTTTAGGGC AAGCGCACAT GAAAAAGAAA 300GAGTATGTTT TAGCGTCTTT TTACTTTGAT GAATACATCA AGCGCTTTGG GACGAAGGAC 360AATGTGGATT ATTTGACCTT TTTGAAACTG CAATCGCATT ATTACGCTTT CAAAAACCAT 420TCTAAAGACC AGGAATTTAT CTCTAATTCT ATTGTGAGTT TAGGCGAATT TATAGAAAAA 480TACCCTAACA GCCGTTACCG CCCCTATGTA GAATACATGC AAATCAAATT CATTTTAGGG 540CAAAATGAGC TCAATCGCGC GATCGCGAAT GTCTATAAAA AACGCCACAA GCCCGAGGGC 600GTGAAACGCT ATTTAGAAAG GATAGATGAG ACTTTAGAAA AAGAGACTAA AGCCAAACCA 660TCGCACATGC CTTGGTATGT GTTAATTTTT GATTGGTAG 699(2)INFORMATION FOR SEQ ID NO91(i)序列特征
(A)长度345个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...345(xi)序列描述SEQ ID NO91ATGCGTTTTT TGAATAACAA ACATAGAGAA AAGGGCTTAA AGGCTGAAGA AGAAGCTTGC 60GGGTTTTTAA AAACGCTGGG TTTTGAAATG ATAGAGAGGA ACTTTTTTTC ACAATTTGGT 120GAAATTGATA TTATCGCTTT GAAAAAAGGG GTTTTGCATT TCATTGAAGT CAAAAGCGGG 180GAAAATTTTG ATCCCATTTA TGCGATCACG CCGAGCAAAT TAAAAAAGAT GATTAAAACG 240ATCCGCTGTT ATTTGTCTCA AAAAGATCCC AATAGCGATT TTTGCATTGA CGCTCTTATT 300GTGAAAAATG GTAAATTTGA GCTTTTAGAA AATATCACTT TTTAG 345(2)INFORMATION FOR SEQ ID NO92(i)序列特征(A)长度306个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...306(xi)序列描述SEQ ID NO92ATGGGCAGCA TTGGGGCTAT GACTAAAGGG AGCTCTGATA GGTATTTTCA AGAGGGCGTG 60GCGAGTGAAA AATTAGTCCC AGAAGGCATT GAGGGGCGTG TGCCTTATCG TGGTAAGGTT 120TCGGATATGA TTTTCCAATT AGTAGGGGGC GTGCGTTCTT CTATGGGGTA TCAGGGGGCG 180AAGAATATTT TGGAATTGTA TCAAAACGCT GAATTTGTAG AAATCACTAG CGCGGGGTTA 240AAAAAAAGCC ATGTGCATGG CGTGGATATT ACTAAAGAAG CCCCTAATAT TATGGGTGAA 300TTTTAA 306(2)INFORMATION FOR SEQ ID NO93(i)序列特征(A)长度1446个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...1446(xi)序列描述SEQ ID NO93ATGAGAATTT TACAAAGGGC TTTGACTTTT GAAGACGTGT TGATGGTGCC TAGAAAATCC60AGCGTTTTAC CTAAAGATGT GAGCTTAAAG TCTCGCCTAA CCAAAAACAT TGGTTTGAAT 120ATCCCTTTTA TTAGTGCGGC TATGGATACG GTTACAGAGC ATAAAACCGC TATCGCTATG 180GCGCGCCTTG GGGGTATTGG CATCGTGCAT AAAAACATGG ATATTCAAAC GCAAGTCAAA 240GAAATCACTA AAGTTAAAAA AAGCGAGAGC GGGGTGATTA ATGATCCTAT TTTTATCCAT 300GCGCACAGGA CGCTAGCGGA CGCTAAAGTC ATAACGGATA ATTATAAGAT TTCAGGCGTG 360CCTGTGGTAG ATGATAAGGG GTTGTTGATT GGGATTTTAA CCAACAGAGA CGTGCGTTTT 420GAAACCGATT TGAGTAAAAA AGTGGGCGAT GTGATGACTA AAATGCCTTT AGTTACCGCT 480CATGTGGGCA TTAGCTTAGA TGAAGCGAGC GATTTGATGC ACAAGCATAA GATTGAAAAA 540TTGCCCATTG TGGATAAAGA TAATGTTTTA AAAGGCTTGA TCACGATCAA AGACATTCAA 600AAACGCATTG AATACCCTGA GGCCAATAAA GATGATTTTG GGAGGTTGAG AGTGGGGGCG 660GCTATTGGAG TGGGGCAGTT GGATAGGGCT GAAATGTTAG TTAAAGCGGG GGTGGATGCG 720TTGGTGTTAG ACAGCGCGCA TGGGCATTCA GCCAATATTT TACACACTTT AGAAGAGATT 780AAAAAAAGCT TGGTAGTGGA TGTGATTGTG GGGAATGTGG TTACTAAAGA AGCCACAAGC 840GATTTGATTA GCGCGGGAGC GGACGCTGTT AAAGTGGGTA TTGGGCCAGG AAGCATTTGC 900ACCACTAGGA TTGTGGCCGG GGTGGGAATG CCCCAAGTGA GCGCAATTGA TAATTGCGTG 960GAAGTGGCGT CTAAATTTGA TATTCCTGTG ATTGCCGATG GAGGGATCCG CTATTCAGGC 1020GATGTGGCTA AGGCTCTAGC TTTAGGAGCA TCAAGCGTGA TGATAGGCTC TTTACTCGCT 1080GGCACAGAAG AATCTCCAGG GGATTTTATG ATTTACCAAG GGAGGCAATA TAAAAGCTAT 1140AGGGGCATGG GCAGCATTGG GGCTATGACT AAAGGGAGCT CTGATAGGTA TTTTCAAGAG 1200GGCGTGGCGA GTGAAAAATT AGTCCCAGAA GGCATTGAGG GGCGTGTGCC TTATCGTGGT 1260AAGGTTTCGG ATATGATTTT CCAATTAGTA GGGGGCGTGC GTTCTTCTAT GGGGTATCAG 1320GGGGCGAAGA ATATTTTGGA ATTGTATCAA AACGCTGAAT TTGTAGAAAT CACTAGCGCG 1380GGGTTAAAAG AAAGCCATGT GCATGGCGTG GATATTACTA AAGAAGCCCC TAATTATTAT 1440GGGTGA 1446(2)INFORMATION FOR SEQ ID NO94(i)序列特征(A)长度615个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...615(xi)序列描述SEQ ID NO94ATGCAAGGGT TTCTTTTACA AACACAAAGC ATAAGAGATG AAGATTTGAT CGTGCACGTT 60TTAACCAAAA ACCAGCTCAA AACCCTCTAT CGTTTCTATG GCAAACGCCA CAGCGTGCTG 120AATGTGGGTC GTAAAATTGA TTTTGAAGAA GAAAACGATG ATAAATTTTT ACCCAAGTTA 180AGGAATATTT TGCATTTAGG CTATATTTGG GAAAGAGAAA TGGAGCGCTT GTTTTTTTGG 240CAACGCTTTT GCGCTCTTTT GTTCAAGCAT TTAGAGGGCG TGCATTCTTT AGATAGCATC 300TATTTTGACA CTTTAGATGA TGGGGCTAGC AAACTCTCCA AACAGCACCC CTTAAGAGTG 360ATTTTAGAAA TGTATGCAGT CCTTTTGAAT TTTGAAGGGC GCTTGCAAAG TTACAATTCT 420TGTTTTTTAT GCGATGCAAA ATTAGAGCGT TCTGTCGCTT TAGCGCAAGG GTTTATTTTA 480GCGCACCCCT CTTGCTTGAA AGCTAAAAGC TTGGATTTAG AAAAAATCCA AGCTTTTTTC 540CGCACTCAAA GCACGATTGA TCTAGAAACA GAAGAAGTGG AAGAATTATG GCGCACGCTG 600AATTTAGGGT TTTGA 615(2)INFORMATION FOR SEQ ID NO95(i)序列特征(A)长度249个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...249(xi)序列描述SEQ ID NO95ATGGGCGTCG GACGGGTCGG CAATATGGCA CTGTTGGCGT GTGCAGGTCC GATGGGCATC 60GGCGCTATTG CTATCGCCAT TAACGGCGGC AGACAACGGT CGCGGATGTT GGTGGTCGAT 120ATAGACGACA AACGTCTGGA GCAGGTACAG AAGATGCTGC CGGGGAATTG GCGGCCAGTA 180ACGGCATTGA GCTGGTGTCT GTGCATACCA AAGCGAGGAG CGATCCGTGC CAGATGCTGC 240GAGCGCTGA 249(2)INFORMATION FOR SEQ ID NO96
(i)序列特征(A)长度204个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...204(xi)序列描述SEQ ID NO96TTGTCCGGTA CAGCCGTGAG TTGCCGGTGC ACATGCCGCA TACAGTTGGT ATTGGTGCGC 60ACCAGCATCC CGGTTGTTAT CGGGTGCTCA TGCCCATTCC TTTCCAGTAT TGGGTTCACA 120ACGGGAACCC ACCAATCACC CGTTAAACGC TGCGGGGTTA ACGCCGGAAA AACACCGTCA 180AAAAAACATT TGCATTTAAA CTAA 204(2)INFORMATION FOR SEQ ID NO97(i)序列特征(A)长度345个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...345(xi)序列描述SEQ ID NO97GTGTGGCTGG CGGCGCTGGG CTTCCTGATC ACCGCGGTGG GGCTGCCGGT GATCACCGTG60ATCGCCCTGG CCAAGGTCGG CGGTTCGTCG ACGCCCTCAG CCATCCGATC GGCAGGTATG 120CCGGCGGCCT GCTGGCGGCG GTCTGCTACC TGGCGGTCGG CCCGCTGTTC GCCATTCCGC 180GCACCGCCAC GGTGTCCTTC GAAGGTCAGC GTGGTGCCGC TGCTCGGCGA AGAAGCGGCA 240CGGCGCTGTT CGTCTACAGC CTGGCGTACT TCCTCCTCGC CCTGGCCATC TCCCTCTACC 300CCGGTCGCCT GCTGGACACC GTCGGACGCT TCCTCGCCCC GCTGA 345(2)INFORMATION FOR SEQ ID NO98(i)序列特征(A)长度228个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc特征(B)位置1...228(xi)序列描述SEQ ID NO98Met Arg Phe Lys Gly Ser Arg Val Glu Ala Phe Leu Gly Ala Leu Glu1 5 10 15Phe Gln Glu Asn Glu Tyr Glu Glu Phe Lys Glu Leu Tyr Glu Ser Leu20 25 30Lys Thr Lys Gln Lys Pro His Thr Leu Phe Ile Ser Cys Val Asp Ser35 40 45Arg Val Val Pro Asn Leu Ile Thr Gly Thr Gln Pro Gly Glu Leu Tyr50 55 60Val Ile Arg Asn Met Gly Asn Val Ile Pro Pro Lys Thr Ser Tyr Lys65 70 75 80Glu Ser Leu Ser Thr Ile Ala Ser Val Glu Tyr Ala Ile Ala His Val85 90 95Gly Val Gln Asn Leu Ile Ile Cys Gly His Ser Asp Cys Gly Ala Cys100 105 110Gly Ser Ile His Leu Ile His Asp Glu Thr Thr Lys Ala Lys Thr Pro115 120 125Tyr Ile Ala Asn Trp Ile Gln Phe Leu Glu Pro Ile Lys Glu Glu Leu130 135 140Lys Asn His Pro Gln Phe Ser Asn His Phe Ala Lys Arg Ser Trp Leu145 150 155 160Thr Glu Arg Leu Asn Ala Arg Leu Gln Leu Asn Asn Leu Leu Ser Tyr165 170 175Asp Phe Ile Gln Glu Arg Val Ile Asn Asn Glu Leu Lys Ile Phe Gly180 185 190Trp His Tyr Ile Ile Glu Thr Gly Arg Ile Tyr Asn Tyr Asn Phe Glu195 200 205Ser His Phe Phe Glu Pro Ile Glu Glu Thr Ile Lys Gln Arg Ile Ser210 215 220His Glu Asn Phe225(2)INFORMATION FOR SEQ ID NO99(i)序列特征(A)长度221个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...221(xi)序列描述SEQ ID NO99Val Glu Ala Phe Leu Gly Ala Leu Glu Phe Gln Glu Asn Glu Tyr Glu1 5 10 15Glu Phe Lys Glu Leu Tyr Glu Ser Leu Lys Thr Lys Gln Lys Pro His20 25 30Thr Leu Phe Ile Ser Cys Val Asp Ser Arg Val Val Pro Asn Leu Ile35 40 45Thr Gly Thr Gln Pro Gly Glu Leu Tyr Val Ile Arg Asn Met Gly Asn50 55 60Val Ile Pro Pro Lys Thr Ser Tyr Lys Glu Ser Leu Ser Thr Ile Ala65 70 75 80Ser Val Glu Tyr Ala Ile Ala His Val Gly Val Gln Asn Leu Ile Ile85 90 95Cys Gly His Ser Asp Cys Gly Ala Cys Gly Ser Ile His Leu Ile His100 105 110Asp Glu Thr Thr Lys Ala Lys Thr Pro Tyr Ile Ala Asn Trp Ile Gln115 120 125Phe Leu Glu Pro Ile Lys Glu Glu Leu Lys Asn His Pro Gln Phe Ser130 135 140Asn His Phe Ala Lys Arg Ser Trp Leu Thr Glu Arg Leu Asn Ala Arg145 150 155 160Leu Gln Leu Asn Asn Leu Leu Ser Tyr Asp Phe Ile Gln Glu Arg Val165 170 175Ile Asn Asn Glu Leu Lys Ile Phe Gly Trp His Tyr Ile Ile Glu Thr180 185 190Gly Arg Ile Tyr Asn Tyr Asn Phe Glu Ser His Phe Phe Glu Pro Ile195 200 205Glu Glu Thr Ile Lys Gln Arg Ile Ser His Glu Asn Phe210 215 220(2)INFORMATION FOR SEQ ID NO100(i)序列特征(A)长度335个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征
(B)位置1...335(xi)序列描述SEQ ID NO100Met Leu Val Thr Arg Phe Lys Lys Ala Phe Ile Ser Tyr Ser Leu Gly1 5 10 15Val Leu Val Val Ser Leu Leu Leu Asn Val Cys Asn Ala Ser Ala Gln20 25 30Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gln Thr Ile Lys Leu Pro35 40 45Val Ser Lys Ile Ala Tyr Ile Gly Ser Tyr Val Glu Val Pro Ala Met50 55 60Leu Asn Val Trp Asp Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys65 70 75 80Asp Asp Ile Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val85 90 95Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu100 105 110Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys115 120 125Ala Val
195 200 205Ser Ser Asp Ile Leu Glu Lys Gly Gly Ile Asp Asn Phe Gly Leu Lys210 215 220Tyr Val Lys Phe Gly Arg Ala Asp Ile Ser Val Glu Lys Ile Val Lys225 230 235 240Glu Asn Pro Glu Ile Ile Phe Ile Trp Trp Val Ser Pro Leu Thr Pro245 250 255Glu Asp Val Leu Asn Asn Pro Lys Phe Ser Thr Ile Lys Ala Ile Lys260 265 270Asn Lys Gln Val Tyr Lys Leu Pro Thr Met Asp Ile Gly Gly Pro Arg275 280 285Ala Pro Leu Ile Ser Leu Phe Ile Ala Leu Lys Ala His Pro Glu Ala290 295 300Phe Lys Gly Val Asp Ile Asn Ala Ile Val Lys Asp Tyr Tyr Lys Val305 310 315 320Val Phe Asp Leu Asn Asp Ala Glu Ile Glu Pro Phe Leu Trp His325 330 335(2)INFORMATION FOR SEQ ID NO101(i)序列特征(A)长度274个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...274(xi)序列描述SEQ ID NO101Met Leu Val Thr Arg Phe Lys Lys Ala Phe Ile Ser Tyr Ser Leu Gly1 5 10 15Val Leu Val Val Ser Leu Leu Leu Asn Val Cys Asn Ala Ser Ala Gln20 25 30Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gln Thr Ile Lys Leu Pro35 40 45Val Ser Lys Ile Ala Tyr Ile Gly Ser Tyr Val Glu Val Pro Ala Met50 55 60Leu Asn Val Trp Asp Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys65 70 75 80Asp Asp Ile Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val85 90 95Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu100 105 110Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys115 120 125Ala Val Glu His Ala Lys Lys Phe Gly Ile Ser Phe Leu Ser Phe Gln130 135 140Glu Thr Thr Ile Ala Glu Ala Met Gln Ala Met Gln Ala Gln Ala Thr145 150 155 160Val Leu Glu Ile Asp Ala Ser Lys Lys Phe Ala Lys Met Gln Glu Thr165 170 175Leu Asp Phe Ile Ala Asp Arg Leu Lys Gly Val Lys Lys Lys Lys Gly180 185 190Val Glu Leu Phe His Lys Ala Asn Lys Ile Ser Gly His Gln Ala Ile195 200 205Asn Ser Asp Ile Leu Gln Gln Gly Gly Ile Asp Asn Phe Gly Leu Lys210 215 220Tyr Val Lys Phe Gly Arg Ala Asp Ile Ser Val Glu Lys Ile Val Lys225 230 235 240Glu Asn Pro Glu Ile Ile Phe Ile Arg Trp Val Thr Pro Leu Thr Pro245 250 255Asp Tyr Val Leu Asn Asn Pro Lys Phe Ser Thr Ile Asn Ala Ile Lys260 265 270Asn Ile(2)INFORMATION FOR SEQ ID NO102(i)序列特征(A)长度428个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...428(xi)序列描述SEQ ID NO102Met Lys Lys Lys Phe Leu Ser Leu Thr Leu Gly Ser Leu Leu Val Ser1 5 10 15Ala Leu Ser Ala Glu Asp Asn Gly Phe Phe Val Ser Ala Gly Tyr Gln20 25 30Ile Gly Glu Ser Ala Gln Met Val Lys Asn Thr Lys Gly Ile Gln Asp35 40 45Leu Ser Asp Ser Tyr Glu Arg Leu Asn Asn Leu Leu Thr Asn Tyr Ser50 55 60Val Leu Asn Ala Leu Ile Arg Gln Ser Ala Asp Pro Asn Ala Ile Asn65 70 75 80Asn Ala Arg Gly Asn Leu Asn Ala Ser Ala Lys Asn Leu Ile Asn Asp85 90 95Lys Lys Asn Ser Pro Ala Tyr Gln Ala Val Leu Leu Ala Leu Asn Ala100 105 110Ala Ala Gly Leu Trp Gln Val Met Ser Tyr Ala Ile Ser Pro Cys Gly115 120 125Pro Gly Lys Asp Thr Ser Lys Asn Gly Gly Val Gln Thr Phe His Asn130 135 140Thr Pro Ser Asn Gln Trp Gly Gly Thr Thr Ile Thr Cys Gly Thr Thr145 150 155 160Gly Tyr Glu Pro Gly Pro Tyr Ser Ile Leu Ser Thr Glu Asn Tyr Ala165 170 175Lys Ile Asn Lys Ala Tyr Gln Ile Ile Gln Lys Ala Phe Gly Ser Ser180 185 190Gly Lys Asp Ile Pro Ala Leu Ser Asp Thr Asn Thr Glu Leu Lys Phe195 200 205Thr Ile Asn Lys Asn Asn Gly Asn Thr Asn Thr Asn Asn Asn Gly Glu210 215 220Glu Ile Val Thr Lys Asn Asn Ala Gln Val Leu Leu Glu Gln Ala Ser225 230 235 240Thr Ile Ile Thr Thr Leu Asn Ser Ala Cys Pro Trp Ile Asn Asn Gly245 250 255Gly Ala Gly Gly Ala Ser Ser Gly Ser Leu Trp Glu Gly Ile Tyr Leu260 265 270Lys Gly Asp Gly Ser Ala Cys Gly Ile Phe Lys Asn Glu Ile Ser Ala275 280 285Ile Gln Asp Met Ile Lys Asn Ala Ala Ile Ala Val Glu Gln Ser Lys290 295 300Ile Val Ala Ala Asn Ala Gln Asn Gln Arg Asn Leu Asp Thr Gly Lys305 310 315 320Thr Phe Asn Pro Tyr Lys Asp Ala Asn Phe Ala Gln Ser Met Phe Ala325 330 335Asn Ala Lys Ala Gln Ala Glu Ile Leu Asn Arg Ala Gln Ala Val Val340 345 350Lys Asp Phe Glu Arg Ile Pro Ala Glu Phe Val Lys Asp Ser Leu Gly355 360 365Val Cys His Glu Val Gln Asn Gly His Leu Arg Gly Thr Pro Ser Gly370 375 380Thr Val Thr Asp Asn Thr Trp Gly Ala Gly Cys Ala Tyr Val Gly Glu385 390 395 400Thr Val Thr Asn Leu Lys Asp Ser Ile Ala His Phe Gly Asp Gln Ala405 410 415Glu Arg Ile His Asn Ala Arg Asn Leu Ala Thr Leu420 425(2)INFORMATION FOR SEQ ID NO103(i)序列特征(A)长度178个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...178(xi)序列描述SEQ ID NO103Met Asn Pro Leu Leu Gln Asp Tyr Ala Arg Ile Leu Leu Glu Trp Asn1 5 10 15Gln Thr His Asn Leu Ser Gly Ala Arg Asn Leu Ser Glu Leu Glu Pro20 25 30Gln Ile Thr Asp Ala Leu Lys Pro Leu Glu Phe Val Lys Asp Phe Lys35 40 45Ser Cys Leu Asp Ile Gly Ser Gly Ala Gly Leu Pro Ala Ile Pro Leu50 55 60Ala Leu Glu Lys Pro Glu Ala Gln Phe Ile Leu Leu Glu Pro Arg Val65 70 75 80Lys Arg Ala Ala Phe Leu Asn Tyr Leu Lys Ser Val Leu Pro Leu Asn85 90 95Asn Ile Glu Ile Ile Lys Lys Arg Leu Glu Asp Tyr Gln Asn Leu Leu100 105 110Gln Val Asp Leu Ile Thr Ser Arg Ala Val Ala Ser Ser Ser Phe Leu115 120 125Ile Glu Lys Ser Gln Arg Phe Leu Lys Asp Lys Gly Tyr Phe Leu Phe
130 135 140Tyr Lys Gly Glu Gln Leu Lys Asn Glu Ile Ala Tyr Lys Thr Thr Glu145 150 155 160Cys Phe Met His Gln Lys Arg Val Tyr Phe Tyr Lys Ser Lys Glu Ser165 170 175Leu Cys(2)INFORMATION FOR SEQ ID NO104(i)序列特征(A)长度240个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...240(xi)序列描述SEQ ID NO104Leu Gly Leu Lys Lys Arg Ala Ile Leu Trp Ser Leu Met Gly Phe Cys1 5 10 15Ala Gly Leu Ser Ala Leu Asp Tyr Asp Thr Leu Asp Pro Lys Tyr Tyr20 25 30Lys Tyr Ile Lys Tyr Tyr Lys Ala Tyr Glu Asp Lys Glu Val Glu Glu35 40 45Leu Ile Arg Asp Leu Lys Arg Ala Asn Ala Lys Ser Gly Leu Ile Leu50 55 60Gly Ile Asn Thr Gly Phe Phe Tyr Asn His Glu Ile Met Val Lys Thr65 70 75 80Asn Ser Ser Ser Ile Thr Gly Asn Ile Leu Asn Tyr Leu Phe Ala Tyr85 90 95Gly Leu Arg Phe Gly Tyr Gln Thr Phe Arg Pro Ser Phe Phe Ala Arg100 105 110Leu Val Lys Pro Asn Ile Ile Gly Arg Arg Ile Tyr Ile Gln Tyr Tyr
115 120 125Gly Gly Ala Pro Lys Lys Ala Gly Phe Gly Ser Val Gly Phe Gln Ser130 135 140Val Met Leu Asn Gly Asp Phe Leu Leu Asp Phe Pro Leu Pro Phe Val145 150 155 160Gly Lys Tyr Leu Tyr Met Gly Gly Tyr Met Gly Leu Gly Leu Gly Val165 170 175Val Ala His Gly Val Asn Tyr Thr Ala Glu Trp Gly Met Ser Phe Asn180 185 190Ala Gly Leu Ala Leu Thr Val Leu Glu Lys Asn Arg Ile Glu Phe Glu195 200 205Phe Lys Ile Leu Asn Asn Phe Pro Phe Leu Gln Ser Asn Ser Ser Lys210 215 220Glu Thr Trp Trp Gly Ala Ile Ala Ser Ile Gly Tyr Gln Tyr Val Phe225 230 235 24C(2)INFORMLTION FOR SEQ ID NO105(i)序列特征(A)长度313个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...313(xi)序列描述SEQ ID NO105Leu Lys Leu Lys Tyr Trp Leu Val Tyr Leu Ala Phe Ile Ile Gly Leu1 5 10 15Gln Ala Thr Asp Tyr Asp Asn Leu Glu Glu Glu Asn Gln Gln Leu Asp20 25 30Glu Lys Ile Asn Asn Leu Lys Arg Gln Leu Thr Glu Lys Gly Val Ser35 40 45Pro Lys Glu Met Asp Lys Asp Lys Phe Glu Glu Glu Tyr Leu Glu Arg
50 55 60Thr Tyr Pro Lys Ile Ser Ser Lys Lys Arg Lys Lys Leu Leu Lys Ser65 70 75 80Phe Ser Ile Ala Asp Asp Lys Ser Gly Val Phe Leu Gly Gly Gly Tyr85 90 95Ala Tyr Gly Glu Leu Asn Leu Ser Tyr Gln Gly Glu Met Leu Asp Arg100 105 110Tyr Gly Ala Asn Ala Pro Ser Ala Phe Lys Asn Asn Ile Asn Ile Asn115 120 125Ala Pro Val Ser Met Ile Ser Val Lys Phe Gly Tyr Gln Lys Tyr Phe130 135 140Val Pro Tyr Phe Gly Thr Arg Phe Tyr Gly Asp Leu Leu Leu Gly Gly145 150 155 160Gly Ala Leu Lys Glu Asn Ala Leu Lys Gln Pro Val Gly Ser Phe Phe165 170 175Tyr Val Leu Gly Ala Met Asn Thr Asp Leu Leu Phe Asp Met Pro Leu180 185 190Asp Phe Lys Thr Lys Lys His Phe Leu Gly Val Tyr Ala Gly Phe Gly195 200 205Ile Gly Leu Met Leu Tyr Gln Asp Lys Pro Asn Gln Asn Gly Arg Asn210 215 220Leu Ile Val Gly Gly Tyr Ser Ser Pro Asn Phe Leu Trp Lys Ser Leu225 230 235 240Ile Glu Val Asp Tyr Thr Phe Asn Val Gly Val Ser Leu Thr Leu Tyr245 250 255Arg Lys His Arg Leu Glu Ile Gly Thr Lys Leu Pro Ile Ser Tyr Leu260 265 270Arg Met Gly Val Glu Glu Gly Ala Ile Tyr His Asn Lys Glu Asn Asp275 280 285Glu Arg Leu Leu Ile Ser Ala Asn Asn Gln Phe Lys Arg Ser Ser Phe290 295 300Leu Leu Val Asn Tyr Ala Phe Ile Phe305 310(2)INFORMATION FOR SEQ ID NO106(i)序列特征(A)长度393个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质
(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...393(xi)序列描述SEQ ID NO106Met Thr Ser Ala Ser Ser His Ser Phe Lys Glu Gln Asp Phe His Ile1 5 10 15Pro Ile Ala Phe Ala Phe Asp Lys Asn Tyr Leu Ile Pro Ala Gly Ala20 25 30Cys Ile Tyr Ser Leu Leu Glu Ser Ile Ala Lys Ala Asn Lys Lys Ile35 40 45Arg Tyr Thr Leu His Ala Leu Val Val Gly Leu Asn Glu Glu Asp Lys50 55 60Thr Lys Leu Asn Gln Ile Thr Glu Pro Phe Lys Glu Phe Ala Val Leu65 70 75 80Glu Val Lys Asp Ile Glu Pro Phe Leu Asp Thr Ile Pro Asn Pro Phe85 90 95Asp Glu Asp Phe Thr Lys Arg Phe Ser Lys Met Val Leu Val Lys Tyr100 105 110Phe Leu Ala Asp Leu Phe Pro Lys Tyr Ser Lys Met Val Trp Ser Asp115 120 125Val Asp Val Ile Phe Cys Asn Glu Phe Ser Ala Asp Phe Leu Asn Ile130 135 140Lys Glu Asp Asp Glu Asn Tyr Phe Tyr Gly Val Tyr Asp Lys Ile Tyr145 150 155 160Pro Tyr Glu Gly Phe Phe Tyr Cys Asn Leu Thr Tyr Gln Arg Lys Asn165 170 175Gln Phe Cys Lys Lys Ile Leu Glu Ile Ile Arg Ala Gln Lys Ile Asp180 185 190Lys Glu Pro Gln Leu Thr Glu Phe Cys Arg Ser Lys Ile Ala Pro Leu195 200 205Lys Ile Glu Tyr Cys Ile Phe Pro His Tyr Tyr Ser Leu Ser Glu Glu210 215 220His Leu Lys Gly Val Ala Asn Ala Ile Tyr His Asn Thr Ile Lys Gln225 230 235 240Ala Leu Arg Glu Pro Ile Val Ile Gln Tyr Asp Ser His Pro Tyr Phe245 250 255Gln Ile Lys Pro Trp Thr Tyr Pro Phe Gly Leu Lys Ala Asp Leu Trp260 265 270Leu Asn Ala Leu Ala Lys Thr Pro Phe Met Ser Asp Trp Ser Tyr Leu275 280 285Ile Thr Gly Gly Gly Gly Ile Gly Gly Glu Lys Trp His Tyr Tyr His290 295 300Gly Ile Ala Ala Tyr His Tyr Tyr Phe Pro Leu Trp Lys Ala Glu Glu305 310 315 320Gln Ile Ala His Asp Ala Leu Lys Thr Phe Leu Lys His Tyr Phe Leu325 330 335His Ile His Glu Ile Pro Gln Asn Ala Arg Arg Arg Leu Phe Lys Tyr340 345 350Cys Ile Ser Ile Pro Leu Lys Ser Phe Ile Ser Lys Thr Leu Lys Phe355 360 365Leu Lys Leu His Ala Leu Val Lys Lys Ile Leu Ile Gln Leu Lys Leu370 375 380Leu Lys Lys Asn Gln Ser Gln Asn Phe385 390(2)INFORMATION FOR SEQ ID NO107(i)序列特征(A)长度435个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...435(xi)序列描述SEQ ID NO107Leu Ile Phe Leu Lys Lys Ser Leu Cys Ala Leu Leu Ile Ser Gly Phe1 5 10 15Phe Ile Pro Pro Leu Met Lys Ala Ala Ser Phe Val Tyr Asp Leu Lys20 25 30Phe Met Ser Phe Asn Phe Asn Leu Ala Ser Pro Pro Asn Asn Pro Tyr35 40 45Trp Asn Ser Leu Thr Lys Met Gln Gly Arg Leu Met Pro Gln Ile Gly50 55 60Val Gln Leu Asp Lys Arg Gln Ala Leu Met Phe Gly Ala Trp Phe Ile65 70 75 80Gln Asn Leu His Thr His Tyr Ser Tyr Phe Pro Tyr Ser Trp Gly Val85 90 95Thr Met Tyr Tyr Gln Tyr Ile Gly Lys Asn Leu Arg Phe Phe Leu Gly100 105 110Ile Val Pro Arg Ser Tyr Gln Ile Gly His Tyr Pro Leu Ser Ala Phe115 120 125Lys Lys Leu Phe Trp Phe Ile Asp Pro Thr Phe Arg Gly Gly Ala Phe130 135 140Gln Phe Lys Pro Ala Tyr Asp Pro Asn Arg Trp Trp Asn Gly Trp Phe145 150 155 160Glu Gly Val Val Asp Trp Tyr Gly Gly Arg Asn Trp Asn Asn Gln Pro165 170 175Lys Lys Lys Asn Tyr Asp Phe Asp Gln Phe Leu Tyr Phe Val Ser Ser180 185 190Glu Phe Gln Phe Leu Lys Gly Tyr Leu Gly Leu Gly Gly Gln Leu Val195 200 205Ile Phe His Asn Ala Asn Ser His Ser Met Gly Asp Asn Tyr Pro Tyr210 215 220Gly Gly Asn Ser Tyr Leu Lys Pro Gly Asp Ala Thr Pro Gln Trp Pro225 230 235 240Asn Gly Tyr Pro Tyr Phe Ser Gln Lys Asp Asn Pro Gln Gly Gly Glu245 250 255Ile Gly Lys Tyr Ser Asn Pro Thr Ile Leu Asp Arg Val Tyr Tyr His260 265 270Ala Tyr Leu Lys Ala Asp Phe Lys Asn Leu Met Pro Tyr Met Asp Asn275 280 285Ile Phe Met Thr Phe Gly Thr Gln Ser Ser Gln Thr His Tyr Cys Val290 295 300Arg Tyr Ala Ser Glu Cys Lys Asn Ala Arg Phe Tyr Asn Ser Phe Gly305 310 315 320Gly Glu Phe Tyr Ala Gln Ala Gln Tyr Lys Gly Phe Gly Ile Phe Asn325 330 335Arg Tyr Tyr Phe Ser Asn Lys Pro Gln Met His Phe Tyr Ala Thr Tyr340 345 350Gly Gln Ser Leu Tyr Thr Gly Leu Pro Trp Tyr Arg Ala Pro Asn Phe355 360 365Asp Met Ile Gly Leu Tyr Tyr Leu Tyr Lys Asn Lys Trp Leu Ser Val
370 375 380Arg Ala Asp Ala Phe Phe Ser Phe Val Gly Gly Gly Asp Gly Tyr His385 390 395 400Leu Tyr Gly Lys Gly Gly Lys Trp Phe Val Met Tyr Gln Gln Phe Leu405 410 415Thr Leu Thr Ile Asp Thr Arg Glu Leu Ile Asp Phe Val Lys Ser Lys420 425 430Ile Pro Lys435(2)INFORMATION FOR SEQ ID NO108(i)序列特征(A)长度220个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...220(xi)序列描述SEQ ID NO108Met Asn Lys Thr Thr Ile Lys Ile Leu Met Gly Met Ala Leu Leu Ser1 5 10 15Ser Leu Gln Ala Ala Glu Ala Glu Leu Asp Glu Lys Ser Lys Lys Pro20 25 30Lys Phe Ala Asp Arg Asn Thr Phe Tyr Leu Gly Val Gly Tyr Gln Leu35 40 45Ser Ala Ile Asn Thr Ser Phe Ser Thr Ser Ser Ile Asp Lys Ser Tyr50 55 60Phe Met Thr Gly Asn Gly Phe Gly Val Val Leu Gly Gly Lys Phe Val65 70 75 80Ala Lys Thr Gln Ala Val Glu His Val Gly Phe Arg Tyr Gly Leu Phe85 90 95Tyr Asp Gln Thr Phe Ser Ser His Lys Ser Tyr Ile Ser Thr Tyr Gly
100 105 110Leu Glu Phe Ser Gly Leu Trp Asp Ala Phe Asn Ser Pro Lys Met Phe115 120 125Leu Gly Leu Glu Phe Gly Leu Gly Ile Ala Gly Ala Thr Tyr Met Pro130 135 140Gly Gly Ala Met His Gly Ile Ile Ala Gln Tyr Leu Gly Lys Glu Asn145 150 155 160Ser Leu Phe Gln Leu Leu Val Lys Val Gly Phe Arg Phe Gly Phe Phe165 170 175His Asn Glu Ile Thr Phe Gly Leu Lys Phe Pro Val Ile Pro Asn Lys180 185 190Lys Thr Glu Ile Val Asp Gly Leu Ser Ala Thr Thr Leu Trp Gln Arg195 200 205Leu Pro Val Ala Tyr Phe Asn Tyr Ile Tyr Asn Phe210 215 220(2)INFORMATION FOR SEQ ID NO109(i)序列特征(A)长度116个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...116(xi)序列描述SEQ ID NO109Leu Asn Leu His Phe Met Lys Gly Phe Val Met Ser Gly Leu Arg Thr1 5 10 15Phe Ser Cys Val Val Val Leu Cys Gly Ala Met Val Asn Val Ala Val20 25 30Ala Gly Pro Lys Ile Glu Ala Arg Gly Glu Leu Gly Lys Phe Val Gly35 40 45Gly Ala Val Gly Asn Phe Val Gly Asp Lys Met Gly Gly Phe Val Gly
50 55 60Gly Ala Ile Gly Gly Tyr Ile Gly Ser Glu Val Gly Asp Arg Val Glu65 70 75 80Asp Tyr Ile Arg Gly Val Asp Arg Glu Pro Gln Asn Lys Glu Pro Gln85 90 95Thr Pro Arg Glu Pro Ile Arg Asp Phe Tyr Asp Tyr Gly Tyr Ser Phe100 105 110Gly His Ala Trp115(2)INPORMATION FOR SEQ ID NO110(i)序列特征(A)长度436个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...436(xi)序列描述SEQ ID NO110Met Ser Arg Asp Phe Lys Phe Asp Ser Asn Tyr Leu Asn Val Asn Thr1 5 10 15Asn Pro Lys Leu Gly Pro Val Tyr Thr Asn Gln Asn Tyr Pro Gly Phe20 25 30Phe Ile Phe Asp His Leu Arg Arg Tyr Val Met Asn Ala Phe Glu Pro35 40 45Asn Leu Asn Leu Val Val Asn Thr Asn Lys Val Lys Gln Thr Phe Asn50 55 60Val Gly Met Arg Phe Met Thr Met Asp Met Phe Ile Arg Ser Asp Gln65 70 75 80Ser Thr Cys Glu Lys Thr Asp Ile Ile Asn Gly Val Cys His Met Pro85 90 95Pro Tyr Val Leu Ser Lys Thr Pro Asn Asn Asn Gln Glu Met Phe Asn
100 105 110Asn Tyr Thr Ala Val Trp Leu Ser Asp Lys Ile Glu Phe Phe Asp Ser115 120 125Lys Leu Val Ile Thr Pro Gly Leu Arg Tyr Thr Phe Leu Asn Tyr Asn130 135 140Asn Lys Glu Pro Glu Lys His Asp Phe Ser Val Trp Thr Ser Lys Lys145 150 155 160Gln Arg Gln Asn Glu Trp Ser Pro Ala Leu Asn Ile Gly Tyr Lys Pro165 170 175Met Glu Asn Trp Ile Trp Tyr Ala Asn Tyr Arg Arg Ser Phe Ile Pro180 185 190Pro Gln His Thr Met Val Gly Ile Thr Arg Thr Asn Tyr Asn Gln Ile195 200 205Phe Asn Glu Ile Glu Val Gly Gln Arg Tyr Ser Tyr Lys Asn Leu Leu210 215 220Ser Phe Asn Thr Asn Tyr Phe Val Ile Phe Ala Lys Arg Tyr Tyr Ala225 230 235 240Gly Gly Tyr Ser Pro Gln Pro Val Asp Ala Arg Ser Gln Gly Val Glu245 250 255Leu Glu Leu Tyr Tyr Ala Pro Ile Arg Gly Leu Gln Phe His Val Ala260 265 270Tyr Thr Tyr Ile Asp Ala Arg Ile Thr Ser Asn Ala Asp Asp Ile Ala275 280 285Tyr Tyr Phe Thr Gly Ile Val Asn Lys Pro Phe Asp Ile Lys Gly Lys290 295 300Arg Leu Pro Tyr Val Ser Pro Asn Gln Phe Ile Phe Asp Met Met Tyr305 310 315 320Thr Tyr Lys His Thr Thr Phe Gly Ile Ser Ser Tyr Phe Tyr Ser Arg325 330 335Ala Tyr Ser Ser Met Leu Asn Gln Ala Lys Asp Gln Thr Val Cys Leu340 345 350Pro Leu Asn Pro Glu Tyr Thr Gly Gly Leu Lys Tyr Gly Cys Asn Ser355 360 365Val Gly Leu Leu Pro Leu Tyr Phe Val Leu Asn Val Gln Val Ser Ser370 375 380Ile Leu Trp Gln Ser Gly Arg His Lys Ile Thr Gly Ser Leu Gln Ile385 390 395 400Asn Asn Leu Phe Asn Met Lys Tyr Tyr Phe Arg Gly Ile Gly Thr Ser405 410 415Pro Thr Gly Arg Glu Pro Ala Pro Gly Arg Ser Ile Thr Ala Tyr Leu420 425 430Asn Tyr Glu Phe435(2)INFORMATION FOR SEQ ID NO111(i)序列特征(A)长度767个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...767(xi)序列描述SEQ ID NO111Met Lys Arg Ile Leu Val Ser Leu Ala Val Leu Ser His Ser Ala His1 5 10 15Ala Val Lys Thr His Asn Leu Glu Arg Val Glu Ala Ser Gly Val Ala20 25 30Asn Asp Lys Glu Ala Pro Leu Ser Trp Arg Ser Lys Glu Val Arg Asn35 40 45Tyr Met Gly Ser Arg Thr Val Ile Ser Asn Lys Gln Leu Thr Lys Ser50 55 60Ala Asn Gln Ser Ile Glu Glu Ala Leu Gln Asn Val Pro Gly Val His65 70 75 80Ile Arg Asn Ser Thr Gly Ile Gly Ala Val Pro Ser Ile Ser Ile Arg85 90 95Gly Phe Gly Ala Gly Gly Pro Gly His Ser Asn Thr Gly Met Ile Leu100 105 110Val Asn Gly Ile Pro Ile Tyr Val Ala Pro Tyr Val Glu Ile Gly Thr115 120 125Val Ile Phe Pro Val Thr Phe Gln Ser Val Asp Arg Ile Ser Val Thr130 135 140Lys Gly Gly Glu Ser Val Arg Tyr Gly Pro Asn Ala Phe Gly Gly Val145 150 155 160Ile Asn Ile Ile Thr Lys Gly Ile Pro Thr Asn Trp Glu Ser Gln Val165 170 175Ser Glu Arg Thr Thr Phe Trp Gly Lys Ser Glu Asn Gly Gly Phe Phe180 185 190Asn Gln Asn Ser Lys Asn Ile Asp Lys Ser Leu Val Asn Asn Met Leu195 200 205Phe Asn Thr Tyr Leu Arg Thr Gly Gly Met Met Asn Lys His Phe Gly210 215 220Ile Gln Ala Gln Val Asn Trp Leu Lys Gly Gln Gly Phe Arg Tyr Asn225 230 235 240Ser Pro Thr Asp Ile Gln Asn Tyr Met Leu Asp Ser Leu Tyr Gln Ile245 250 255Asn Asp Ser Asn Lys Ile Thr Ala Phe Phe Gln Tyr Tyr Ser Tyr Phe260 265 270Leu Thr Asp Pro Gly Ser Leu Gly Ile Ala Ala Tyr Asn Gln Asn Arg275 280 285Phe Gln Asn Asn Arg Pro Asn Asn Asp Lys Ser Gly Arg Ala Lys Arg290 295 300Trp Gly Ala Val Tyr Gln Asn Phe Phe Gly Asp Thr Asp Arg Val Gly305 310 315 320Gly Asp Phe Thr Phe Ser Tyr Tyr Gly His Asp Met Ser Arg Asp Phe325 330 335Lys Phe Asp Ser Asn Tyr Leu Asn Val Asn Thr Asn Pro Lys Leu Gly340 345 350Pro Val Tyr Thr Asn Gln Asn Tyr Pro Gly Phe Phe Ile Phe Asp His355 360 365Leu Arg Arg Tyr Val Met Asn Ala Phe Glu Pro Asn Leu Asn Leu Val370 375 380Val Asn Thr Asn Lys Val Lys Gln Thr Phe Asn Val Gly Met Arg Phe385 390 395 400Met Thr Met Asp Met Phe Ile Arg Ser Asp Gln Ser Thr Cys Glu Lys405 410 415Thr Asp Ile Ile Asn Gly Val Cys His Met Pro Pro Tyr Val Leu Ser420 425 430Lys Thr Pro Asn Asn Asn Gln Glu Met Phe Asn Asn Tyr Thr Ala Val435 440 445Trp Leu Ser Asp Lys Ile Glu Phe Phe Asp Ser Lys Leu Val Ile Thr450 455 460Pro Gly Leu Arg Tyr Thr Phe Leu Asn Tyr Asn Asn Lys Glu Pro Glu465 470 475 480Lys His Asp Phe Ser Val Trp Thr Ser Lys Lys Gln Arg Gln Asn Glu485 490 495Trp Ser Pro Ala Leu Asn Ile Gly Tyr Lys Pro Met Glu Asn Trp Ile500 505 510Trp Tyr Ala Asn Tyr Arg Arg Ser Phe Ile Pro Pro Gln His Thr Met
515 520 525Val Gly Ile Thr Arg Thr Asn Tyr Asn Gln Ile Phe Asn Glu Ile Glu530 535 540Val Gly Gln Arg Tyr Ser Tyr Lys Asn Leu Leu Ser Phe Asn Thr Asn545 550 555 560Tyr Phe Val Ile Phe Ala Lys Arg Tyr Tyr Ala Gly Gly Tyr Ser Pro565 570 575Gln Pro Val Asp Ala Arg Ser Gln Gly Val Glu Leu Glu Leu Tyr Tyr580 585 590Ala Pro Ile Arg Gly Leu Gln Phe His Val Ala Tyr Thr Tyr Ile Asp595 600 605Ala Arg Ile Thr Ser Asn Ala Asp Asp Ile Ala Tyr Tyr Phe Thr Gly610 615 620Ile Val Asn Lys Pro Phe Asp Ile Lys Gly Lys Arg Leu Pro Tyr Val625 630 635 640Ser Pro Asn Gln Phe Ile Phe Asp Met Met Tyr Thr Tyr Lys His Thr645 650 655Thr Phe Gly Ile Ser Ser Tyr Phe Tyr Ser Arg Ala Tyr Ser Ser Met660 665 670Leu Asn Gln Ala Lys Asp Gln Thr Val Cys Leu Pro Leu Asn Pro Glu675 680 685Tyr Thr Gly Gly Leu Lys Tyr Gly Cys Asn Ser Val Gly Leu Leu Pro690 695 700Leu Tyr Phe Val Leu Asn Val Gln Val Ser Ser Ile Leu Trp Gln Ser705 710 715 720Gly Arg His Lys Ile Thr Gly Ser Leu Gln Ile Asn Asn Leu Phe Asn725 730 735Met Lys Tyr Tyr Phe Arg Gly Ile Gly Thr Ser Pro Thr Gly Arg Glu740 745 750Pro Ala Pro Gly Arg Ser Ile Thr Ala Tyr Leu Asn Tyr Glu Phe755 760 765(2)INFORMATION FOR SEQ ID NO112(i)序列特征(A)长度115个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...115(xi)序列描述SEQ ID NO112Leu His Pro Leu Cys Ala His Gly Gln Cys Gly Ser Glu Ala Ile Ala1 5 10 15Cys Leu Glu Ala Ile Ser Val Gly Ile Val Pro Val Ile Ala Asn Ser20 25 30Pro Leu Ser Ala Thr Arg Gln Phe Ala Leu Asp Glu Arg Ser Leu Phe35 40 45Glu Pro Asn Asn Ala Lys Asp Leu Ser Ala Lys Ile Asp Trp Trp Leu50 55 60Glu Asn Lys Leu Glu Arg Glu Arg Met Gln Asn Glu Tyr Ala Lys Ser65 70 75 80Ala Leu Asn Tyr Thr Leu Glu Asn Ser Val Ile Gln Ile Glu Lys Val85 90 95Tyr Glu Glu Ala Ile Lys Asp Phe Lys Asn Asn Pro Asn Leu Phe Lys100 105 110Thr Leu Ser115(2)INFORMATION FOR SEQ ID NO113(i)序列特征(A)长度389个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...389
(xi)序列描述SEQ ID NO113Met Val Ile Val Leu Val Val Asp Ser Phe Lys Asp Thr Ser Asn Gly1 5 10 15Thr Ser Met Thr Ala Phe Arg Phe Phe Glu Ala Leu Lys Lys Arg Gly20 25 30His Ala Met Arg Val Val Ala Pro His Val Asp Asn Leu Gly Ser Glu35 40 45Glu Glu Gly Tyr Tyr Asn Leu Lys Glu Arg Tyr Ile Pro Leu Val Thr50 55 60Glu Ile Ser His Lys Gln His Ile Leu Phe Ala Lys Pro Asp Glu Lys65 70 75 80Ile Leu Arg Lys Ala Phe Lys Gly Ala Asp Met Ile His Thr Tyr Leu85 90 95Pro Phe Leu Leu Glu Lys Thr Ala Val Lys Ile Ala Arg Glu Met Arg100 105 110Val Pro Tyr Ile Gly Ser Phe His Leu Gln Pro Glu His Ile Ser Tyr115 120 125Asn Met Lys Leu Gly Gln Phe Ser Trp Leu Asn Thr Met Leu Phe Ser130 135 140Trp Phe Lys Ser Ser His Tyr Arg Tyr Ile His His Ile His Cys Pro145 150 155 160Ser Lys Phe Ile Val Glu Glu Leu Glu Lys Tyr Asn Tyr Gly Gly Lys165 170 175Lys Tyr Ala Ile Ser Asn Gly Phe Asp Pro Met Phe Lys Phe Glu His180 185 190Pro Gln Lys Ser Leu Phe Asp Thr Thr Pro Phe Lys Ile Ala Met Val195 200 205Gly Arg Tyr Ser Asn Glu Lys Asn Gln Ser Val Leu Ile Lys Ala Val210 215 220Ala Leu Ser Arg Tyr Lys Gln Asp Ile Val Leu Leu Leu Lys Gly Lys225 230 235 240Gly Pro Asp Glu Lys Lys Ile Lys Leu Leu Ala Gln Lys Leu Gly Val245 250 255Lys Thr Glu Phe Gly Phe Val Asn Ser His Glu Leu Leu Glu Ile Leu260 265 270Lys Thr Cys Thr Leu Tyr Ala His Thr Ala Asn Val Glu Ser Glu Ala275 280 285Ile Ala Cys Leu Glu Ala Ile Ser Val Gly Ile Val Pro Val Ile Ala290 295 300Asn Ser Pro Leu Ser Ala Thr Arg Gln Phe Ala Leu Asp Glu Arg Ser305 310 315 320Leu Phe Glu Pro Asn Asn Ala Lys Asp Leu Ser Ala Lys Ile Asp Trp325 330 335Trp Leu Glu Asn Lys Leu Glu Arg Glu Arg Met Gln Asn Glu Tyr Ala340 345 350Lys Ser Ala Leu Asn Tyr Thr Leu Glu Asn Ser Val Ile Gln Ile Glu355 360 365Lys Val Tyr Glu Glu Ala Ile Lys Asp Phe Lys Asn Asn Pro Asn Leu370 375 380Phe Lys Thr Leu Ser385(2)INFORMATION FOR SEQ ID NO114(i)序列特征(A)长度312个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...312(xi)序列描述SEQ ID NO114Leu Ala Ser Tyr Gly Phe Phe Leu Gly Ala Leu Phe Ile Leu Ala Ser1 5 10 15Gly Ile Val Cys Leu Gln Thr Ala Gly Asn Pro Phe Val Thr Leu Leu20 25 30Ser Lys Gly Lys Glu Ala Arg Asn Leu Val Leu Val Gln Ala Phe Asn35 40 45Ser Leu Gly Thr Thr Leu Gly Pro Ile Phe Gly Ser Leu Leu Ile Phe50 55 60Ser Ala Thr Lys Thr Ser Asp Asn Leu Ser Leu Ile Asp Lys Leu Ala65 70 75 80Asp Ala Lys Ser Val Gln Met Pro Tyr Leu Gly Leu Ala Val Phe Ser85 90 95Leu Leu Leu Ala Leu Val Met Tyr Leu Leu Lys Leu Pro Asp Val Glu100 105 110Lys Glu Met Pro Lys Glu Thr Thr Gln Lys Ser Leu Phe Ser His Lys115 120 125His Phe Val Phe Gly Ala Leu Gly Ile Phe Phe Tyr Val Gly Gly Glu130 135 140Val Ala Ile Gly Ser Phe Leu Val Leu Ser Phe Glu Lys Leu Leu Asn145 150 155 160Leu Asp Ala Gln Ser Ser Ala His Tyr Leu Val Tyr Tyr Trp Gly Gly165 170 175Ala Met Val Gly Arg Phe Leu Gly Ser Ala Leu Met Asn Lys Ile Ala180 185 190Pro Asn Lys Tyr Leu Ala Phe AsN Ala Leu Ser Ser Ile Ile Leu Ile195 200 205Ala Leu Ala Ile Leu Ile Gly Gly Lys Ile Ala Leu Phe Ala Leu Thr210 215 220Phe Val Gly Phe Phe Asn Ser Ile Met Phe Pro Thr Ile Phe Ser Leu225 230 235 240Ala Thr Leu Asn Leu Gly His Leu Thr Ser Lys Ala Ser Gly Val Ile245 250 255Ser Met Ala Ile Val Gly Gly Ala Leu Ile Pro Pro Ile Gln Gly Val260 265 270Val Thr Asp Met Leu Thr Ala Thr Glu Ser Asn Leu Leu Tyr Ala Tyr275 280 285Ser Val Pro Leu Leu Cys Tyr Phe Tyr Ile Leu Phe Phe Ala Leu Lys290 295 300Gly Tyr Lys Gln Glu Glu Asn Ser305 310(2)INFORMATION FOR SEQ ID NO115(i)序列特征(A)长度407个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...407(xi)序列描述SEQ ID NO115Met Gln Lys Thr Ser Asn Thr Leu Ala Leu Gly Ser Leu Thr Ala Leu1 5 10 15Phe Phe Leu Met Gly Phe Ile Thr Val Leu Asn Asp Ile Leu Ile Pro20 25 30His Leu Lys Pro Ile Phe Asp Leu Thr Tyr Phe Glu Ala Ser Leu Ile35 40 45Gln Phe Cys Phe Phe Gly Ala Tyr Phe Ile Met Gly Gly Val Phe Gly50 55 60Asn Val Ile Ser Lys Ile Gly Tyr Pro Phe Gly Val Val Leu Gly Phe65 70 75 80Val Ile Thr Ala Ser Gly Cys Ala Leu Phe Tyr Pro Ala Ala His Phe85 90 95Gly Ser Tyr Gly Phe Phe Leu Gly Ala Leu Phe Ile Leu Ala Ser Gly100 105 110Ile Val Cys Leu Gln Thr Ala Gly Asn Pro Phe Val Thr Leu Leu Ser115 120 125Lys Gly Lys Glu Ala Arg Asn Leu Val Leu Val Gln Ala Phe Asn Ser130 135 140Leu Gly Thr Thr Leu Gly Pro Ile Phe Gly Ser Leu Leu Ile Phe Ser145 150 155 160Ala Thr Lys Thr Ser Asp Asn Leu Ser Leu Ile Asp Lys Leu Ala Asp165 170 175Ala Lys Ser Val Gln Met Pro Tyr Leu Gly Leu Ala Val Phe Ser Leu180 185 190Leu Leu Ala Leu Val Met Tyr Leu Leu Lys Leu Pro Asp Val Glu Lys195 200 205Glu Met Pro Lys Glu Thr Thr Gln Lys Ser Leu Phe Ser His Lys His210 215 220Phe Val Phe Gly Ala Leu Gly Ile Phe Phe Tyr Val Gly Gly Glu Val225 230 235 240Ala Ile Gly Ser Phe Leu Val Leu Ser Phe Glu Lys Leu Leu Asn Leu245 250 255Asp Ala Gln Ser Ser Ala His Tyr Leu Val Tyr Tyr Trp Gly Gly Ala260 265 270Met Val Gly Arg Phe Leu Gly Ser Ala Leu Met Asn Lys Ile Ala Pro275 280 285Asn Lys Tyr Leu Ala Phe Asn Ala Leu Ser Ser Ile Ile Leu Ile Ala
290 295 300Leu Ala Ile Leu Ile Gly Gly Lys Ile Ala Leu Phe Ala Leu Thr Phe305 310 315 320Val Gly Phe Phe Asn Ser Ile Met Phe Pro Thr Ile Phe Ser Leu Ala325 330 335Thr Leu Asn Leu Gly His Leu Thr Ser Lys Ala Ser Gly Val Ile Ser340 345 350Met Ala Ile Val Gly Gly Ala Leu Ile Pro Pro Ile Gln Gly Val Val355 360 365Thr Asp Met Leu Thr Ala Thr Glu Ser Asn Leu Leu Tyr Ala Tyr Ser370 375 380Val Pro Leu Leu Cys Tyr Phe Tyr Ile Leu Phe Phe Ala Leu Lys Gly385 390 395 400Tyr Lys Gln Glu Glu Asn Ser405(2)INFORMATION FOR SEQ ID NO116(i)序列特征(A)长度125个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...125(xi)序列描述SEQ ID NO116Met Asn Lys Ile Ala Pro Asn Lys Tyr Leu Ala Phe Gly Ala Leu Ser1 5 10 15Ser Ile Ile Leu Ile Ala Leu Ala Ile Leu Ile Gly Gly Lys Ile Ala20 25 30Leu Phe Ala Leu Thr Phe Val Gly Phe Phe Asn Ser Ile Met Phe Pro35 40 45Thr Ile Phe Ser Leu Ala Thr Leu Asn Leu Gly Ile Ser Leu Leu Met
50 55 60Ala Ser Gly Val Ile Ser Met Ala Ile Val Gly Gly Ala Leu Ile Pro65 70 75 80Pro Ile Gln Gly Val Val Thr Asp Met Leu Thr Ala Thr Glu Ser Asn85 90 95Leu Leu Tyr Ala Tyr Ser Val Pro Leu Leu Cys Tyr Phe Tyr Ile Leu100 105 110Phe Phe Ala Leu Lys Gly Tyr Lys Gln Glu Glu Asn Ser115 120 125(2)INFORMATION FOR SEQ ID NO117(i)序列特征(A)长度330个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...330(xi)序列描述SEQ ID NO117Leu Lys Lys Ile Leu Pro Ala Leu Leu Met Gly Phe Val Gly Leu Asn1 5 10 15Ala Ser Asp Arg Leu Leu Glu Ile Met Arg Leu Tyr Gln Lys Gln Gly20 25 30Leu Glu Val Val Gly Gln Lys Leu Asp Ser Tyr Leu Ala Asp Lys Ser35 40 45Phe Trp Ala Glu Glu Leu Gln Asn Lys Asp Thr Asp Phe Gly Tyr Tyr50 55 60Gln Asn Lys Gln Phe Leu Phe Val Ala Asp Lys Ser Lys Pro Ser Leu65 70 75 80Glu Phe Tyr Glu Ile Glu Asn Asn Met Leu Lys Lys Ile Asn Ser Ser85 90 95Lys Ala Leu Val Gly Ser Lys Lys Gly Asp Lys Thr Leu Glu Gly Asp
100 105 110Leu Ala Thr Pro Ile Gly Val Tyr Arg Ile Thr Gln Lys Leu Glu Arg115 120 125Leu Asp Gln Tyr Tyr Gly Val Leu Ala Phe Val Thr Asn Tyr Pro Asn130 135 140Leu Tyr Asp Thr Leu Lys Lys Arg Thr Gly His Gly Ile Trp Val His145 150 155 160Gly Met Pro Leu Asn Gly Asp Arg Asn Glu Leu Asn Thr Lys Gly Cys165 170 175Ile Ala Ile Glu Asn Pro Ile Leu Ser Ser Tyr Asp Lys Val Leu Lys180 185 190Gly Glu Lys Ala Phe Leu Ile Thr Tyr Glu Asp Lys Phe Ser Pro Ser195 200 205Thr Lys Glu Glu Leu Ser Met Ile Leu Ser Ser Leu Phe Gln Trp Lys210 215 220Glu Ala Trp Ala Arg Gly Asp Phe Glu Arg Tyr Met Arg Phe Tyr Asn225 230 235 240Pro Asn Phe Thr Arg Tyr Asp Gly Met Ser Phe Asn Ala Phe Lys Glu245 250 255Tyr Lys Lys Arg Val Phe Ala Lys Asn Glu Lys Lys Asn Ile Ala Phe260 265 270Ser Ser Ile Asn Val Ile Pro Tyr Pro Asn Ser Gln Asn Lys Arg Leu275 280 285Phe Tyr Val Val Phe Asp Gln Asp Tyr Lys Ala Tyr Gln Gln Asn Lys290 295 300Leu Ser Tyr Ser Ser Asn Ser Gln Lys Glu Leu Tyr Val Glu Ile Glu305 310 315 320Asn Asn Gln Ala Ser Ile Ile Met Glu Lys325 330(2)INFORMATION FOR SEQ ID NO118(i)序列特征(A)长度169个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...169(xi)序列描述SEQ ID NO118Leu Phe Glu Lys Trp Ile Gly Leu Thr Leu Leu Leu Ser Ser Leu Gly1 5 10 15Tyr Pro Cys Gln Lys Val Ser Ile Ser Phe Lys Gln Tyr Glu Asn Leu20 25 30Ile His Ile His Gln Lys Gly Cys Asn Asn Glu Val Val Cys Arg Thr35 40 45Leu Ile Ser Ile Ala Leu Leu Glu Ser Ser Leu Gly Leu Asn Asn Lys50 55 60Arg Glu Lys Ser Leu Lys Asp Thr Ser Tyr Ser Met Phe His Ile Thr65 70 75 80Leu Asn Thr Ala Lys Lys Phe Tyr Pro Thr Tyr Ser Lys Thr Leu Leu85 90 95Lys Thr Lys Leu Leu Asn Asp Val Gly Phe Ala Ile Gln Leu Ala Lys100 105 110Gln Ile Leu Lys Glu Asn Phe Asp Tyr Tyr His Gln Lys His Pro Asn115 120 125Lys Ser Val Tyr Gln Leu Val Gln Met Ala Ile Gly Ala Tyr Asn Gly130 135 140Gly Met Lys His Asn Pro Asn Gly Ala Tyr Met Lys Lys Phe Arg Cys145 150 155 160Ile Tyr Ser Gln Val Arg Tyr Asn Glu165(2)INFORMATION FOR SEQ ID NO119(i)序列特征(A)长度215个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...215(xi)序列描述SEQ ID NO119Met Lys Lys Pro Tyr Arg Lys Ile Ser Asp Tyr Ala Ile Val Gly Gly1 5 10 15Leu Ser Ala Leu Val Met Val Ser Ile Val Gly Cys Lys Ser Asn Ala20 25 30Asp Asp Lys Pro Lys Glu Gln Ser Ser Leu Ser Gln Ser Val Gln Lys35 40 45Gly Ala Phe Val Ile Leu Glu Glu Gln Lys Asp Lys Ser Tyr Lys Val50 55 60Val Glu Glu Tyr Pro Ser Ser Arg Thr His Ile Val Val Arg Asp Leu65 70 75 80Gln Gly Asn Glu Arg Val Leu Ser Asn Glu Glu Ile Gln Lys Leu Ile85 90 95Lys Glu Glu Glu Ala Lys Ile Asp Asn Gly Thr Ser Lys Leu Val Gln100 105 110Pro Asn Asn Gly Gly Ser Asn Glu Gly Ser Gly Phe Gly Leu Gly Ser115 120 125Ala Ile Leu Gly Ser Ala Ala Gly Ala Ile Leu Gly Ser Tyr Ile Gly130 135 140Asn Lys Leu Phe Asn Asn Pro Asn Tyr Gln Gln Asn Ala Gln Arg Thr145 150 155 160Tyr Lys Ser Pro Gln Ala Tyr Gln Arg Ser Gln Asn Ser Phe Ser Lys165 170 175Ser Ala Pro Ser Ala Ser Ser Met Gly Thr Ala Ser Lys Gly Gln Ser180 185 190Gly Phe Phe Gly Ser Ser Arg Pro Thr Ser Ser Pro Ala Ile Ser Ser195 200 205Gly Thr Arg Gly Phe Asn Ala210 215(2)INFORMATION FOR SEQ ID NO120(i)序列特征(A)长度253个氨基酸(B)类型氨基酸(D)拓扑结构线性
(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...253(xi)序列描述SEQ ID NO120Leu Lys Thr Leu Phe Ser Val Tyr Leu Phe Leu Ser Leu Asn Pro Leu1 5 10 15Phe Leu Glu Ala Lys Glu Ile Thr Trp Ser Gln Phe Leu Glu Asn Phe20 25 30Lys Asn Lys Asn Glu Asp Asp Lys Pro Lys Pro Leu Thr Ile Asp Lys35 40 45Asn Asn Glu Lys Gln Gln Ile Leu Asp Lys Asn Gln Gln Ile Leu Lys50 55 60Arg Ala Leu Glu Lys Ser Leu Lys Phe Phe Phe Ile Phe Gly Tyr Asn65 70 75 80Tyr Ser Gln Ala Ala Tyr Ser Thr Thr Asn Gln Asn Leu Thr Leu Thr85 90 95Ala Asn Ser Ile Gly Phe Asn Thr Ala Thr Gly Leu Glu His Phe Leu100 105 110Arg Asn His Pro Lys Val Gly Phe Arg Ile Phe Ser Val Tyr Asn Tyr115 120 125Phe His Ser Val Ser Leu Ser Gln Pro Gln Ile Leu Met Val Gln Asn130 135 140Tyr Gly Gly Ala Leu Asp Phe Ser Trp Ile Phe Val Asp Lys Lys Thr145 150 155 160Tyr Arg Phe Arg Ser Tyr Leu Gly Ile Ala Leu Glu Gln Gly Val Leu165 170 175Leu Val Asp Thr Ile Lys Thr Gly Ser Phe Thr Thr Ile Ile Pro Arg180 185 190Thr Lys Lys Thr Phe Phe Gln Ala Pro Leu Arg Phe Gly Phe Ile Val195 200 205Asp Phe Ile Gly Tyr Leu Ser Leu Gln Leu Gly Ile Glu Met Pro Leu210 215 220Val Arg Asn Val Phe Tyr Thr Tyr Asn Asn His Gln Glu Arg Phe Lys225 230 235 240Pro Arg Phe Asn Ala Asn Leu Ser Leu Ile Val Ser Phe245 250(2)INFORMATION FOR SEQ ID NO121(i)序列特征(A)长度336个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...336(xi)序列描述SEQ ID NO121Leu Phe Phe Lys Phe Ile Leu Cys Leu Ser Leu Gly Ile Phe Ala Trp1 5 10 15Ala Lys Glu Val Ile Pro Thr Pro Ser Thr Pro Leu Thr Pro Ser Lys20 25 30Arg Tyr Ser Ile Asn Leu Met Thr Glu Asn Asp Gly Tyr Ile Asn Pro35 40 45Tyr Ile Asp Glu Tyr Tyr Thr Ala Gly Asn Gln Ile Gly Phe Ser Thr50 55 60Lys Glu Phe Asp Phe Ser Lys Asn Lys Ala Met Lys Trp Ser Ser Tyr65 70 75 80Leu Gly Phe Phe Asn Lys Ser Pro Arg Val Thr Arg Phe Gly Ile Ser85 90 95Leu Ala Gln Asp Met Tyr Thr Pro Ser Leu Ala Asn Arg Lys Leu Val100 105 110His Leu His Asp Asn His Pro Tyr Gly Gly Tyr Leu Arg Val Asn Leu115 120 125Asn Val Tyr Asn Arg His Gln Thr Phe Met Glu Leu Phe Thr Ile Ser130 135 140Leu Gly Thr Thr Gly Gln Asp Ser Leu Ala Ala Gln Thr Gln Arg Leu145 150 155 160Ile His Lys Trp Gly His Asp Pro Gln Phe Tyr Gly Trp Asn Thr Gln165 170 175Leu Lys Asn Glu Phe Ile Phe Glu Leu His Tyr Gln Leu Leu Lys Lys180 185 190Val Pro Leu Leu Lys Thr Arg Phe Phe Ser Met Glu Leu Met Pro Gly195 200 205Phe Asn Val Glu Leu Gly Asn Ala Arg Asp Tyr Phe Gln Leu Gly Ser210 215 220Leu Phe Arg Ala Gly Tyr Asn Leu Asp Ala Asp Tyr Gly Val Asn Lys225 230 235 240Val Asn Thr Ala Phe Asp Gly Gly Met Pro Tyr Ser Asp Lys Phe Ser245 250 255Ile Tyr Phe Phe Ala Gly Ala Phe Gly Arg Phe Gln Pro Leu Asn Ile260 265 270Phe Ile Gln Gly Asn Ser Pro Glu Thr Arg Gly Ile Ala Asn Leu Glu275 280 285Tyr Phe Val Tyr Ala Ser Glu Ile Gly Ala Ala Met Met Trp Arg Ser290 295 300Leu Arg Val Ala Phe Thr Ile Thr Asp Ile Ser Lys Thr Phe Gln Ser305 310 315 320Gln Pro Lys His His Gln Ile Gly Thr Leu Glu Leu Asn Phe Ala Phe325 330 335(2)INFORMATION FOR SEQ ID NO122(i)序列特征(A)长度108个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...108(xi)序列描述SEQ ID NO122Met Lys Pro Ile Phe Ser Leu Phe Phe Leu Leu Ile Val Leu Lys Ala1 5 10 15His Pro Ile Asn Pro Leu Leu Glu Pro Leu Tyr Phe Pro Ser Tyr Thr20 25 30Gln Phe Leu Asp Leu Glu Pro His Phe Val Ile Lys Lys Lys Arg Ala35 40 45Tyr Arg Pro Phe Gln Trp Gly Asn Thr Ile Ile Ile Lys Arg His Asp50 55 60Leu Glu Glu Arg Gln Ser Asn Gln Pro Ser Asp Ile Phe Arg Gln Asn65 70 75 80Ala Glu Ile Asn Val Ser Ser Gln Thr Phe Leu Arg Gly Ile Ser Ser85 90 95Ala Ser Ser Arg Ile Val Ile Asp Ser Val Ala Gln100 105(2)INFORMATION FOR SEQ ID NO123(i)序列特征(A)长度195个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...195(xi)序列描述SEQ ID NO123Met Ser Asn Asn Pro Phe Lys Lys Val Gly Met Ile Ser Ser Gln Asn1 5 10 15Asn Asn Gly Ala Leu Asn Gly Leu Gly Val Gln Val Gly Tyr Lys Gln20 25 30Phe Phe Gly Glu Ser Lys Arg Trp Gly Leu Arg Tyr Tyr Gly Phe Phe35 40 45Asp Tyr Asn His Gly Tyr Ile Lys Ser Ser Phe Phe Asn Ser Ser Ser50 55 60Asp Ile Trp Thr Tyr Gly Gly Gly Ser Asp Leu Leu Val Asn Phe Ile65 70 75 80Asn Asp Ser Ile Thr Arg Lys Asn Asn Lys Leu Ser Val Gly Leu Phe85 90 95Gly Gly Ile Gln Leu Ala Gly Thr Thr Trp Leu Asn Ser Gln Tyr Met100 105 110Asn Leu Thr Ala Phe Asn Asn Pro Tyr Ser Ala Lys Val Asn Ala Ser115 120 125Asn Phe Gln Phe Leu Phe Asn Leu Gly Leu Arg Thr Asn Leu Ala Thr130 135 140Ala Lys Lys Lys Asp Ser Glu Arg Ser Ala Gln His Gly Val Glu Leu145 150 155 160Gly Ile Lys Ile Pro Thr Ile Asn Thr Asn Tyr Tyr Ser Phe Leu Gly165 170 175Thr Lys Leu Glu Tyr Arg Arg Leu Tyr Ser Val Tyr Leu Asn Tyr Val180 185 190Phe Ala Tyr195(2)INFORMATION FOR SEQ ID NO124(i)序列特征(A)长度227个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...227(xi)序列描述SEQ ID NO124Val Arg Phe Gly Lys Ile Asp Tyr Leu Asn Met Leu Pro Phe Asp Val1 5 10 15Phe Ile Lys Ser Tyr Pro Thr Pro Cys Tyr Phe Lys Gln Phe Leu Arg20 25 30Leu Lys Lys Thr Tyr Pro Ser Lys Leu Asn Glu Ser Phe Leu Phe Arg35 40 45Arg Ile Asp Ala Gly Phe Ile Ser Ser Ile Ala Gly Tyr Pro Phe Ala50 55 60Leu Cys Ser Tyr Ser Leu Gly Ile Val Ala Tyr Lys Glu Val Leu Ser65 70 75 80Val Leu Val Val Asn Arg Glu Asn Ala Phe Asp Lys Glu Ser Ala Ser85 90 95Ser Asn Ala Leu Ser Lys Val Leu Gly Leu Lys Gly Glu Val Leu Ile100 105 110Gly Asn Lys Ala Leu Gln Phe Tyr Tyr Ser Asn Pro Lys Lys Asp Phe115 120 125Ile Asp Leu Ala Ala Leu Trp Tyr Glu Lys Lys Arg Leu Pro Phe Val130 135 140Phe Gly Arg Leu Cys Tyr Tyr Gln Asn Lys Asp Phe Tyr Lys Arg Leu145 150 155 160Ser Leu Ala Phe Lys His Gln Lys Thr Lys Ile Pro His Tyr Ile Leu165 170 175Lys Glu Ala Ala Leu Lys Thr Asn Leu Lys Arg Gln Asp Ile Leu Asn180 185 190Tyr Leu Gln Lys Ile Tyr Tyr Thr Leu Gly Lys Lys Glu Gln Ser Gly195 200 205Leu Lys Ala Phe Tyr Arg Glu Leu Leu Phe Lys Arg Ile Gln Lys Pro210 215 220Lys Arg Phe225(2)INFORMATION FOR SEQ ID NO125(i)序列特征(A)长度305个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征
(B)位置1...305(xi)序列描述SEQ ID NO125Met Gly Arg Ile Glu Ser Lys Lys Arg Leu Lys Ala Leu Ile Phe Leu1 5 10 15Ala Ser Leu Gly Val Leu Trp Gly Asn Ala Ala Glu Lys Thr Pro Phe20 25 30Phe Lys Thr Lys Asn His Ile Tyr Leu Gly Phe Arg Leu Gly Thr Gly35 40 45Ala Thr Thr Arg Thr Ser Met Trp Gln Gln Ala Tyr Lys Asp Asn Pro50 55 60Thr Cys Pro Ser Ser Val Cys Tyr Gly Glu Lys Leu Glu Ala His Tyr65 70 75 80Lys Gly Gly Lys Asn Leu Ser Tyr Thr Gly Gln Ile Gly Asp Glu Ile85 90 95Ala Phe Asp Lys Tyr His Ile Leu Gly Leu Arg Val Trp Gly Asp Val100 105 110Glu Tyr Ala Lys Ala Gln Leu Gly Gln Lys Val Gly Gly Asn Thr Leu115 120 125Leu Ser Gln Ala Asn Tyr Asn Pro Ser Ala Ile Lys Thr Tyr Asp Pro130 135 140Thr Ser Asn Ala Gln Gly Ser Leu Val Leu Gln Lys Thr Pro Ser Pro145 150 155 160Gln Asp Phe Leu Phe Asn Asn Gly His Phe Met Ala Phe Gly Leu Asn165 170 175Val Asn Met Phe Val Asn Leu Pro Ile Asp Thr Leu Leu Lys Leu Ala180 185 190Leu Lys Thr Glu Lys Met Leu Phe Phe Lys Ile Gly Val Phe Gly Gly195 200 205Gly Gly Val Glu Tyr Ala Ile Leu Trp Ser Pro Gln Tyr Lys Asn Gln210 215 220Asn Thr His Gln Asp Asp Lys Phe Phe Ala Ala Gly Gly Gly Phe Phe225 230 235 240Val Asn Phe Gly Gly Ser Leu Tyr Ile Gly Lys Arg Asn Arg Phe Asn245 250 255Val Gly Leu Lys Ile Pro Tyr Tyr Ser Leu Ser Ala Gln Ser Trp Lys260 265 270Asn Phe Gly Ser Ser Asn Val Trp Gln Gln Gln Thr Ile Arg Gln Asn275 280 285Phe Ser Val Phe Arg Asn Lys Glu Val Phe Val Ser Tyr Ala Phe Leu290 295 300Phe305(2)INFORMATION FOR SEQ ID NO126(i)序列特征(A)长度258个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...258(xi)序列描述SEQ ID NO126Met Phe Leu Arg Ser Tyr Pro Lys Leu Arg Tyr Ala Leu Cys Leu Pro1 5 10 15Leu Leu Thr Glu Thr Cys Tyr Ser Glu Glu Arg Thr Leu Asn Lys Val20 25 30Thr Thr Gln Ala Lys Arg Ile Phe Thr Tyr Asn Asn Glu Phe Lys Val35 40 45Thr Ser Lys Glu Leu Asp Gln Arg Gln Ser Asn Glu Val Lys Asp Leu50 55 60Phe Arg Thr Asn Pro Asp Val Asn Val Gly Gly Gly Ser Val Met Gly65 70 75 80Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg Leu Leu Arg Val Thr85 90 95Val Asp Gly Ala Ala Gln Asn Gly Asn Ile Tyr His His Gln Gly Asn100 105 110Thr Val Ile Asp Pro Gly Met Leu Lys Ser Val Glu Val Thr Lys Gly115 120 125Ala Ala Asn Ala Ser Ala Gly Pro Gly Ala Ile Ala Gly Val Ile Lys130 135 140Met Glu Thr Lys Gly Ala Ala Asp Phe Ile Pro Arg Gly Lys Asn Tyr145 150 155 160Ala Ala Ser Gly Ala Val Ser Phe Tyr Thr Asn Phe Gly Asp Arg Glu
165 170 175Thr Phe Arg Ser Ala Tyr Gln Ser Ala His Phe Asp Ile Ile Ala Tyr180 185 190Tyr Thr His Gln Asn Ile Phe Tyr Tyr Arg Ser Gly Ala Thr Val Met195 200 205Lys Asn Leu Phe Lys Pro Thr Gln Ala Asp Lys Glu Pro Gly Thr Pro210 215 220Ser Glu Gln Asn Asn Ala Leu Ile Lys Met Asn Gly Tyr Leu Ser Asp225 230 235 240Arg Asp Thr Leu Thr Phe Ser Trp Asn Met Thr Arg Asp Asn Ala Thr245 250 255Arg Leu(2)INFORMATION FOR SEQ ID NO127(i)序列特征(A)长度192个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...192(xi)序列描述SEQ ID NO127Met Phe Leu Arg Ser Tyr Pro Lys Leu Arg Tyr Ala Leu Cys Leu Pro1 5 10 15Leu Leu Thr Glu Thr Cys Tyr Ser Glu Glu Arg Thr Leu Asn Lys Val20 25 30Thr Thr Gln Ala Lys Arg Ile Phe Thr Tyr Asn Asn Glu Phe Lys Val35 40 45Thr Ser Lys Glu Leu Asp Gln Arg Gln Ser Asn Glu Val Lys Asp Leu50 55 60Phe Arg Thr Asn Pro Asp Val Asn Val Gly Gly Gly Ser Val Met Gly65 70 75 80Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg Leu Leu Arg Val Thr85 90 95Val Asp Gly Ala Ala Gln Asn Gly Asn Ile Tyr His His Gln Gly Asn100 105 110Thr Val Ile Asp Pro Gly Met Leu Lys Ser Val Glu Val Thr Lys Gly115 120 125Ala Ala Asn Ala Ser Ala Gly Pro Gly Ala Ile Ala Gly Val Ile Lys130 135 140Met Glu Thr Lys Gly Ala Ala Asp Phe Ile Pro Arg Gly Lys Asn Tyr145 150 155 160Ala Ala Ser Gly Ala Val Ser Phe Tyr Thr Asn Phe Gly Asp Arg Glu165 170 175Thr Phe Arg Ser Ala Tyr Gln Ser Ala His Phe Asp Ile Ile Ala Tyr180 185 190(2)INFORMATION FOR SEQ ID NO128(i)序列特征(A)长度126个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...126(xi)序列描述SEQ ID NO128Val Pro Leu Ser Leu Gly Gly Asn Leu Leu Asn Pro Asn Asn Ser Ser1 5 10 15Val Leu Asn Leu Lys Asn Ser Gln Leu Val Phe Ser Asp Gln Gly Ser20 25 30Leu Asn Ile Ala Asn Ile Asp Leu Leu Ser Asp Leu Asn Gly Asn Lys35 40 45Asn Arg Val Tyr Asn Ile Ile Gln Ala Asp Met Asn Gly Asn Trp Tyr
50 55 60Glu Arg Ile Asn Phe Phe Gly Met Arg Ile Asn Asp Gly Ile Tyr Asp65 70 75 80Ala Lys Asn Gln Thr Tyr Ser Phe Thr Asn Pro Leu Asn Asn Ala Val85 90 95Lys Phe Thr Glu Ser Phe Phe Ile His Arg Leu Cys Gly Ser Leu Ser100 105 110Gln Ile Gln Lys Lys Lys Asn Thr Ile Val Ser Pro Arg Leu115 120 125(2)INFORMATION FOR SEQ ID NO129(i)序列特征(A)长度565个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...565(xi)序列描述SEQ ID NO129Val Tyr Ser Tyr Ser Asp Asp Ala Gln Gly Val Phe Tyr Leu Thr Ser1 5 10 15Ser Val Lys Gly Tyr Tyr Asn Pro Asn Gln Ser Tyr Gln Ala Ser Gly20 25 30Ser Asn Asn Thr Thr Lys Asn Asn Asn Leu Thr Ser Glu Ser Ser Val35 40 45Ile Ser Gln Thr Tyr Asn Ala Gln Gly Asn Pro Ile Ser Ala Leu His50 55 60Val Tyr Asn Lys Gly Tyr Asn Phe Ser Asn Ile Lys Ala Leu Gly Gln65 70 75 80Met Ala Leu Lys Leu Tyr Pro Glu Ile Lys Lys Ile Leu Gly Asn Asp85 90 95Phe Ser Leu Ser Ser Leu Ser Asn Leu Lys Gly Asp Ala Leu Asn Gln
100 105 110Leu Thr Lys Leu Ile Thr Pro Ser Asp Trp Lys Asn Ile Asn Glu Leu115 120 125Ile Asp Asn Ala Asn Asn Ser Val Val Gln Asn Phe Asn Asn Gly Thr130 135 140Leu Ile Ile Gly Ala Thr Lys Ile Gly Gln Thr Asp Thr Asn Ser Ala145 150 155 160Val Val Phe Gly Gly Leu Gly Tyr Gln Lys Pro Cys Asp Tyr Thr Asp165 170 175Ile Val Cys Gln Lys Phe Arg Gly Thr Tyr Leu Gly Gln Leu Leu Glu180 185 190Ser Asn Ser Ala Asp Leu Gly Tyr Ile Asp Thr Thr Phe Asn Ala Lys195 200 205Glu Ile Tyr Leu Thr Gly Thr Leu Gly Ser Gly Asn Ala Trp Gly Thr210 215 220Gly Gly Ser Ala Ser Val Thr Phe Asn Ser Gln Thr Ser Leu Ile Leu225 230 235 240Asn Gln Ala Asn Ile Val Ser Ser Gln Thr Asp Gly Ile Phe Ser Met245 250 255Leu Gly Gln Glu Gly Ile Asn Lys Val Phe Asn Gln Ala Gly Leu Ala260 265 270Asn Ile Leu Gly Glu Val Ala Met Gln Ser Ile Asn Lys Ala Gly Gly275 280 285Leu Gly Asn Leu Ile Val Asn Thr Leu Gly Ser Asp Ser Val Ile Gly290 295 300Gly Tyr Leu Thr Pro Glu Gln Lys Asn Gln Thr Leu Ser Gln Leu Leu305 310 315 320Gly Gln Asn Asn Phe Asp Asn Leu Met Asn Asp Ser Gly Leu Asn Thr325 330 335Ala Ile Lys Asp Leu Ile Arg Gln Lys Leu Gly Phe Trp Thr Gly Leu340 345 350Val Gly Gly Leu Ala Gly Leu Gly Gly Ile Asp Leu Gln Asn Pro Glu355 360 365Lys Leu Ile Gly Ser Met Ser Ile Asn Asp Leu Leu Ser Lys Lys Gly370 375 380Leu Phe Asn Gln Ile Thr Gly Phe Ile Ser Ala Asn Asp Ile Gly Gln385 390 395 400Val Ile Ser Val Met Leu Gln Asp Ile Val Lys Pro Ser Asp Ala Leu405 410 415Lys Asn Asp Val Ala Ala Leu Gly Lys Gln Met Ile Gly Glu Phe Leu420 425 430Gly Gln Asp Thr Leu Asn Ser Leu Glu Ser Leu Leu Gln Asn Gln Gln435 440 445Ile Lys Ser Val Leu Asp Lys Val Leu Ala Ala Lys Gly Leu Gly Ser450 455 460Ile Tyr Glu Gln Gly Leu Gly Asp Leu Ile Pro Asn Leu Gly Lys Lys465 470 475 480Gly Ile Phe Ala Pro Tyr Gly Leu Ser Gln Val Trp Gln Lys Gly Asp485 490 495Phe Ser Phe Asn Ala Gln Gly Asn Val Phe Val Gln Asn Ser Thr Phe500 505 510Ser Asn Ala Asn Gly Gly Thr Leu Ser Phe Asn Ala Gly Asn Ser Leu515 520 525Ile Phe Ala Gly Asn Asn His Ile Ala Phe Thr Asn His Ser Gly Thr530 535 540Leu Asn Leu Leu Ser Asn Gln Val Ser Asn Ile Asn Val Thr Met Leu545 550 555 560Asn Ala Ala Thr Ala565(2)INFORMATION FOR SEQ ID NO130(i)序列特征(A)长度172个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...172(xi)序列描述SEQ ID NO130Val Phe Gly Leu Ser Leu Ala Asp Met Ile Leu Glu Arg Phe Lys Asp1 5 10 15Phe Met Arg Glu Tyr Pro Glu Pro Tyr Lys Phe Leu Gln Val Phe Tyr20 25 30Ala Gln Glu Lys Glu Arg Phe Leu Asn His Lys Met Asn Asp Tyr Ile35 40 45Lys Gln Asn Lys Ser Lys Glu Glu Ala Ser Ile Leu Ala Arg Gln Gly50 55 60Phe Val Ser Val Ile Gly Arg Ala Leu Glu Lys Ile Ile Glu Leu Leu65 70 75 80Leu Lys Asp Phe Cys Ile Lys Asn Asn Val Lys Met Thr Asn Asp Lys85 90 95Thr Leu Arg Ala Lys Arg Ile Asn Gly Glu Leu Asp Lys Val Lys Arg100 105 110Ala Leu Leu Val His Phe Gly Gly Tyr Ser Val Leu Pro Asp Ile Ile115 120 125Leu Tyr Gln Thr Asn Lys Asp Asn Ile Lys Ile Leu Ala Ile Leu Ser130 135 140Val Lys Asn Ser Phe Arg Glu Arg Phe Thr Lys Asp Ala Leu Leu Glu145 150 155 160Ile Lys Thr Phe Ala Ile Ala Cys Asn Phe Ser His165 170(2)INFORMATION FOR SEQ ID NO131(i)序列特征(A)长度331个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...331(xi)序列描述SEQ ID NO131Met Lys Arg Phe Val Leu Phe Leu Leu Phe Ile Cys Val Cys Val Cys15 10 15Val Gln Ala Tyr Ala Glu Gln Asp Tyr Phe Phe Arg Asp Phe Lys Ser20 25 30Ile Asp Leu Pro Gln Lys Leu His Leu Asp Lys Lys Leu Ser Gln Thr35 40 45Ile Gln Pro Cys Ala Gln Leu Asn Ala Ser Lys His Tyr Thr Ala Thr50 55 60Gly Val Arg Glu Pro Asp Ala Cys Thr Lys Ser Phe Lys Lys Ser Ala65 70 75 80Met Val Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Gln Asn Lys85 90 95Pro Tyr Gly Leu Lys Ala Ile Glu Ile Leu Asn Ala Trp Ala Asn Glu100 105 110Leu Gln Ser Val Asp Thr Tyr Gln Ser Glu Asp Asn Ile Asn Phe Tyr115 120 125Met Pro Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Glu Phe Pro130 135 140Ser Pro Glu Tyr Glu Asp Phe Ile Arg Arg Met Arg Gln Tyr Ser Gln145 150 155 160Ser Ala Leu Asn Thr Asn His Gly Ala Trp Gly Ile Leu Phe Asp Val165 170 175Ser Ser Ala Leu Ala Leu Asp Asp His Ala Leu Leu Gln Ser Ser Ala180 185 190Asn Arg Trp Gln Glu Trp Val Phe Lys Ala Ile Asp Glu Asn Gly Val195 200 205Ile Ala Ser Ala Ile Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly210 215 220Pro Thr Lys Gly Ile Lys Gly Ile Ala Tyr Thr Asn Phe Ala Leu Leu225 230 235 240Ala Ile Thr Ile Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu245 250 255Trp Gly Ser Gly Ala Gly Gln Arg Leu Ser Val Ala Tyr Asn Lys Ala260 265 270Ala Thr Trp Ile Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gln Pro Asn275 280 285Leu Ile Gly Val His Asn Asn Ala Tyr Phe Ile Ile Leu Ala Lys His290 295 300Tyr Ser Ser Pro Ser Ala Asp Glu Leu Leu Glu Gln Gly Asp Leu His305 310 315 320Glu Asp Gly Phe Arg Leu Lys Leu Arg Ser Pro325 330(2)INFORMATION FOR SEQ ID NO132(i)序列特征(A)长度128个氨基酸(B)类型氨基酸(D)拓扑结构线性
(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...128(xi)序列描述SEQ ID NO132Met Arg Gln Tyr Ser Gln Ser Ala Leu Asn Thr Asn His Gly Ala Trp1 5 10 15Gly Ile Leu Phe Asp Val Ser Ser Ala Leu Ala Leu Asp Asp His Ala20 25 30Leu Leu Gln Ser Ser Ala Asn Arg Trp Gln Glu Trp Val Phe Lys Ala35 40 45Ile Asp Glu Asn Gly Val Ile Ala Ser Ala Ile Thr Arg Ser Asp Thr50 55 60Ser Asp Tyr His Gly Gly Pro Thr Lys Gly Ile Lys Gly Ile Ala Tyr65 70 75 80Thr Asn Phe Ala Leu Leu Ala Ile Thr Ile Ser Gly Glu Leu Leu Phe85 90 95Glu Asn Gly Tyr Asp Leu Trp Gly Ser Gly Ala Gly Gln Arg Leu Ser100 105 110Val Ala Tyr Asn Lys Ala Ala Thr Trp Ile Leu Asn Pro Glu Thr Phe115 120 125(2)INFORMATION FOR SEQ ID NO133(i)序列特征(A)长度245个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源
(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...245(xi)序列描述SEQ ID NO133Leu Arg Thr Leu Leu Lys Met Leu Val Gly Val Ser Leu Leu Thr His1 5 10 15Ala Leu Met Ala Thr Glu Glu Ser Ala Ala Pro Ser Trp Thr Lys Asn20 25 30Leu Tyr Met Gly Phe Asn Tyr Gln Thr Gly Ser Ile Asn Leu Met Thr35 40 45Asn Ile His Glu Val Arg Glu Val Thr Ser Tyr Gln Thr Gly Tyr Thr50 55 60Asn Val Met Thr Ser Ile Asn Ser Val Lys Lys Leu Thr Asn Met Gly65 70 75 80Ser Asn Gly Ile Gly Leu Val Met Gly Tyr Asn His Phe Phe His Pro85 90 95Asp Lys Val Leu Gly Leu Arg Tyr Phe Ala Phe Leu Asp Trp Gln Gly100 105 110Tyr Gly Met Arg Tyr Pro Lys Gly Tyr Tyr Gly Gly Asn Asn Met Ile115 120 125Thr Tyr Gly Val Gly Val Asp Ala Ile Trp Asn Phe Phe Gln Gly Ser130 135 140Phe Tyr Gln Asp Asp Ile Gly Val Asp Ile Gly Val Phe Gly Gly Ile145 150 155 160Ala Ile Ala Gly Asn Ser Trp Tyr Ile Gly Asn Lys Gly Gln Glu Leu165 170 175Leu Gly Ile Thr Asn Ser Ser Ala Val Asp Asn Thr Ser Phe Gln Phe180 185 190Leu Phe Asn Phe Gly Phe Lys Ala Leu Phe Val Asp Glu His Glu Phe195 200 205Glu Ile Gly Phe Lys Phe Pro Thr Leu Asn Asn Lys Tyr Tyr Thr Thr210 215 220Asp Ala Leu Lys Val Gln Met Arg Arg Val Phe Ala Phe Tyr Val Gly225 230 235 240Tyr Asn Tyr His Phe245(2)INFORMATION FOR SEQ ID NO134
(i)序列特征(A)长度290个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...290(xi)序列描述SEQ ID NO134Met Phe Glu Glu Ile Thr Leu Ala His Lys Asp Leu Phe Ser Arg Phe1 5 10 15Leu Gln Thr Gln Lys Ile Val Leu Ser Asp Val Ser Phe Thr Asn Cys20 25 30Phe Leu Trp Gln His Ala Arg Leu Ile Gln Val Ala Val Ile Arg Asp35 40 45Cys Leu Val Ile Gln Thr Thr Tyr Glu Asn Gln Lys Pro Phe Tyr Phe50 55 50Tyr Pro Ile Gly Lys Arg Pro His Glu Cys Val Lys Glu Leu Leu Glu65 70 75 80Leu Glu Lys Asn Leu Arg Phe His Ser Leu Thr Leu Glu Gln Lys Asp85 90 95Asp Leu Lys Asp Asn Phe Val Gly Val Phe Asp Phe Thr Tyr Asn Arg100 105 110Asp Arg Ser Asp Tyr Val Tyr Ser Ile Glu Glu Leu Ile Ala Leu Lys115 120 125Gly Lys Lys Tyr His Lys Lys Lys Asn His Leu Asn Gln Phe Leu Thr130 135 140Asn His Ala Asn Phe Val Tyr Glu Lys Ile Ser Pro Gln Asn Arg Lys145 150 155 160Glu Val Leu Glu Ala Ser Lys Ala Trp Phe Leu Glu Ser Gln Thr Asp165 170 175Asp Ile Gly Leu Ile Asn Glu Asn Lys Gly Ile Gln Ser Val Leu Glu180 185 190Asn Tyr Glu Ser Leu Asp Leu Lys Gly Gly Leu Ile Arg Val Asn Gly
195 200 205Glu Ile Val Ser Phe Ser Phe Gly Glu Val Leu Asn Glu Glu Ser Ala210 215 220Leu Ile His Ile Glu Lys Ala Arg Thr Asp Ile Ala Gly Ala Tyr Gln225 230 235 240Ile Ile Asn Gln Gln Leu Leu Leu Asn Glu Phe Ser His Leu Thr Tyr245 250 255Ala Asn Arg Glu Glu Asp Leu Gly Leu Glu Gly Leu Arg Arg Ser Lys260 265 270Met Ser Tyr Asn Pro Val Phe Leu Ile Asp Lys Tyr Glu Ala Val Ala275 280 285Arg Asn290(2)INFORMATION FOR SEQ ID NO135(i)序列特征(A)长度110个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...110(xi)序列描述SEQ ID NO135Met Met Phe Ile Val Ala Val Leu Met Leu Ala Phe Leu Ile Phe Val1 5 10 15His Glu Leu Gly His Phe Ile Ile Ala Arg Ile Cys Gly Val Lys Val20 25 30Glu Val Phe Ser Ile Gly Phe Gly Lys Lys Leu Trp Phe Phe Lys Leu35 40 45Phe Gly Thr Gln Phe Ala Leu Ser Leu Ile Pro Leu Gly Gly Tyr Val50 55 60Lys Leu Lys Gly Met Asp Lys Glu Glu Asn Glu Glu Asn Lys Ile Asn65 70 75 80Gln Ala Asn Asp Ser Tyr Ala Lys Lys Ala Leu Ser Lys Ser Tyr Gly85 90 95Tyr Cys Leu Val Gly Arg Phe Leu Ile Phe Phe Leu Arg Phe100 105 110(2)INFORMATION FOR SEQ ID NO136(i)序列特征(A)长度351个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...351(xi)序列描述SEQ ID NO136Met Met Phe Ile Val Ala Val Leu Met Leu Ala Phe Leu Ile Phe Val1 5 10 15His Glu Leu Gly His Phe Ile Ile Ala Arg Ile Cys Gly Val Lys Val20 25 30Glu Val Phe Ser Ile Gly Phe Gly Lys Lys Leu Trp Phe Phe Lys Leu35 40 45Phe Gly Thr Gln Phe Ala Leu Ser Leu Ile Pro Leu Gly Gly Tyr Val50 55 60Lys Leu Lys Gly Met Asp Lys Glu Glu Asn Glu Glu Asn Lys Ile Asn65 70 75 80Gln Ala Asn Asp Ser Tyr Ala Gln Lys Ser Pro Phe Gln Lys Leu Trp85 90 95Ile Leu Phe Gly Gly Ala Phe Phe Asn Phe Leu Phe Ala Val Leu Val100 105 110Tyr Phe Phe Leu Ala Leu Ser Gly Glu Lys Val Leu Leu Pro Val Ile115 120 125Gly Gly Leu Glu Lys Asn Ala Leu Glu Ala Gly Leu Leu Lys Gly Asp
130 135 140Arg Ile Leu Ser Ile Asn His Gln Lys Ile Ala Ser Phe Arg Glu Ile145 150 155 160Arg Glu Ile Val Ala Arg Ser Gln Gly Glu Leu Ile Leu Glu Ile Glu165 170 175Arg Asn Asn Gln Ile Leu Glu Lys Arg Leu Thr Pro Lys Ile Val Ala180 185 190Val Ile Ser Glu Ser Asn Asp Pro Asn Glu Ile Ile Lys Tyr Lys Ile195 200 205Ile Gly Ile Lys Pro Asp Met Gln Lys Met Gly Val Val Ser Tyr Ser210 215 220Val Phe Gln Ala Phe Glu Lys Ala Leu Ser Arg Phe Lys Glu Gly Val225 230 235 240Val Leu Ile Val Asp Ser Leu Arg Arg Leu Ile Met Gly Ser Ala Ser245 250 255Val Lys Glu Leu Ser Gly Val Ile Gly Ile Val Gly Ala Leu Ser His260 265 270Ala Asn Ser Val Ser Met Leu Leu Leu Phe Gly Ala Phe Leu Ser Ile275 280 285Asn Leu Gly Ile Leu Asn Leu Leu Pro Ile Pro Ala Leu Asp Gly Ala290 295 300Gln Met Leu Gly Val Val Phe Lys Asn Ile Phe His Ile Ala Leu Pro305 310 315 320Thr Pro Ile Gln Asn Ala Leu Trp Leu Val Gly Val Gly Phe Leu Val325 330 335Phe Val Met Phe Leu Gly Leu Phe Asn Asp Ile Thr Arg Leu Leu340 345 350(2)INFORMATION FOR SEQ ID NO137(i)序列特征(A)长度100个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征
(A)名称/关键词misc_特征(B)位置1...100(xi)序列描述SEQ ID NO137Met Gln Lys Asn Leu Asp Ser Leu Leu Glu Asn Leu Arg Ala Glu Ile1 5 10 15Asp Ala Leu Asp Asn Glu Leu Ser Asp Leu Leu Asp Lys Arg Leu Gly20 25 30Ile Ala Leu Lys Ile Ala Leu Ile Lys Gln Glu Ser Pro Gln Glu Asn35 40 45Pro Ile Tyr Cys Pro Lys Arg Glu Gln Glu Ile Leu Lys Arg Leu Ser50 55 60Gln Arg Gly Phe Lys His Leu Asn Gly Glu Ile Leu Ala Ser Phe Tyr65 70 75 80Ala Glu Val Phe Lys Ile Ser Arg Asn Phe Gln Glu Asn Ala Leu Lys85 90 95Glu Leu Lys Lys100(2)INFORMATION FOR SEQ ID NO138(i)序列特征(A)长度174个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...174(xi)序列描述SEQ ID NO138Val Lys Met Arg Phe Phe Ser Gly Phe Gly Phe Val Asn Glu Ser Val1 5 10 15Leu Phe Glu Glu Trp Leu Leu Lys Gly Ala Tyr Asp Val Ser Gly Phe
20 25 30Ser Met Gly Ala Ile Lys Ala Ile Glu Tyr Ala Tyr Asn Glu Val Leu35 40 45Gln Gln Arg Arg Ile His Ser Leu Leu Leu Phe Ser Pro Cys Met Leu50 55 60Ala His Lys Ser Leu Ala Phe Lys Arg Leu Gln Leu Phe Leu Phe Gln65 70 75 80Lys Asp Pro Gln Ser Tyr Met Asp Asn Phe Tyr Lys Glu Val Gly Leu85 90 95Asp Ala Gln Leu Glu Arg Phe Lys Lys Glu Gly Ser Leu Glu Glu Leu100 105 110Glu Phe Leu Leu Asp Tyr Lys Tyr Ser Asp Ser Ile Ile Arg Phe Leu115 120 125Leu Glu Lys Gly Val Lys Ile Glu Val Phe Ile Gly Leu Lys Asp Arg130 135 140Ile Thr Asp Ile Gln Ala Leu Leu Glu Phe Phe Met Pro Leu Val Gln145 150 155 160Val Trp Gln Phe Lys Asp Cys Asn His Leu Leu Gln Lys Ser165 170(2)INFORMATION FOR SEQ ID NO139(i)序列特征(A)长度471个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...471(xi)序列描述SEQ ID NO139Met Lys Asn Thr Asn Thr Lys Glu Ile Lys Asn Thr Arg Met Lys Lys1 5 10 15Gly Tyr Ser Gln Tyr His Thr Leu Lys Lys Gly Leu Leu Lys Thr Ala
20 25 30Leu Leu Phe Ser Leu Pro Leu Ser Val Ala Leu Ala Glu Asp Asp Gly35 40 45Phe Tyr Met Gly Val Gly Tyr Gln Ile Gly Gly Ala Gln Gln Asn Ile50 55 60Asn Asn Lys Gly Ser Thr Leu Arg Asn Asn Val Ile Asp Asp Phe Arg65 70 75 80Gln Val Gly Val Gly Met Ala Gly Gly Asn Gly Leu Leu Ala Leu Ala85 90 95Thr Asn Thr Thr Met Asp Ala Leu Leu Gly Ile Gly Asn Gln Ile Val100 105 110Asn Thr Asn Thr Thr Val Gly Asn Asn Asn Ala Glu Leu Thr Gln Phe115 120 125Lys Lys Ile Leu Pro Gln Ile Glu Gln Arg Phe Glu Thr Asn Lys Asn130 135 140Ala Tyr Ser Val Gln Ala Leu Gln Val Tyr Leu Ser Asn Val Leu Tyr145 150 155 160Asn Leu Val Asn Asn Ser Asn Asn Gly Ser Asn Asn Gly Val Val Pro165 170 175Glu Tyr Val Gly Ile Ile Lys Val Leu Tyr Gly Ser Gln Asn Glu Phe180 185 190Ser Leu Leu Ala Thr Glu Ser Val Ala Leu Leu Asn Ala Leu Thr Arg195 200 205Val Asn Leu Asp Ser Asn Ser Val Phe Leu Lys Gly Leu Leu Ala Gln210 215 220Met Gln Leu Phe Asn Asp Thr Ser Ser Ala Lys Leu Gly Gln Ile Ala225 230 235 240Glu Asn Leu Lys Asn Gly Gly Ala Gly Ala Met Leu Gln Lys Asp Val245 250 255Lys Thr Ile Ser Asp Arg Ile Ala Thr Tyr Gln Glu Asn Leu Lys Gln260 265 270Leu Gly Gly Met Leu Lys Asn Tyr Asp Glu Pro Tyr Leu Pro Gln Phe275 280 285Gly Pro Gly Thr Ser Ser Gln His Gly Val Ile Asn Gly Phe Gly Ile290 295 300Gln Val Gly Tyr Lys Gln Phe Phe Gly Ser Lys Lys Asn Ile Gly Leu305 310 315 320Arg Tyr Tyr Ala Phe Phe Asp Tyr Gly Phe Thr Gln Leu Gly Ser Leu325 330 335Asn Ser Ala Val Lys Ala Asn Ile Phe Thr Tyr Gly Ala Gly Thr Asp340 345 350Phe Leu Trp Asn Ile Phe Arg Arg Val Phe Ser Asp Gln Ser Leu Asn355 360 365Val Gly Val Phe Gly Gly Ile Gln Ile Ala Gly Asn Thr Trp Asp Ser370 375 380Ser Leu Arg Gly Gln Ile Glu Asn Ser Phe Lys Glu Tyr Pro Thr Pro385 390 395 400Thr Asn Phe Gln Phe Leu Phe Asn Leu Gly Leu Arg Ala His Phe Ala405 410 415Ser Thr Met His Arg Arg Phe Leu Ser Ala Ser Gln Ser Ile Gln His420 425 430Gly Met Glu Phe Gly Val Lys Ile Pro Ala Ile Asn Gln Arg Tyr Leu435 440 445Lys Ala Asn Gly Ala Asp Val Asp Tyr Arg Arg Leu Tyr Ala Phe Tyr450 455 460Ile Asn Tyr Thr Ile Gly Phe465 470(2)INFORMATION FOR SEQ ID NO140(i)序列特征(A)长度129个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...129(xi)序列描述SEQ ID NO140Met Lys Ser Ile Arg Arg Gly Asp Gly Leu Asn Val Val Pro Phe Ile1 5 10 15Asp Ile Met Leu Val Leu Leu Ala Ile Val Leu Ser Ile Ser Thr Phe20 25 30Ile Ala Gln Gly Lys Ile Lys Val Ser Leu Pro Asn Ala Lys Asn Ala35 40 45Glu Lys Ser Gln Pro Asn Asp Gln Lys Val Val Val Ile Ser Val Asp50 55 60Glu His Asp Asn Ile Phe Val Asp Asp Lys Pro Thr Asn Leu Glu Ala65 70 75 80Leu Ser Ala Val Val Lys Gln Thr Asp Pro Lys Thr Leu Ile Asp Leu85 90 95Lys Ser Asp Lys Ser Ser Arg Phe Glu Thr Phe Ile Ser Ile Met Asp100 105 110Ile Leu Lys Glu His Asn His Glu Asn Phe Ser Ile Ser Thr Gln Ala115 120 125Gln(2)INFORMATION FOR SEQ ID NO141(i)序列特征(A)长度75个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...75(xi)序列描述SEQ ID NO141Met Leu Val Leu Leu Ala Ile Val Leu Ser Ile Ser Thr Phe Ile Ala1 5 10 15Gln Gly Lys Ile Lys Val Ser Leu Pro Asn Ala Lys Asn Ala Glu Lys20 25 30Ser Arg Pro Asn Asp Gln Lys Val Val Val Ile Ser Val Asp Glu His35 40 45Asp Asn Ile Phe Val Asp Asp Lys Pro Thr Asn Leu Glu Ala Leu Ser50 55 60Ala Val Val Lys Gln Thr Asp Pro Lys Thr Leu65 70 75(2)INFORMATION FOR SEQ ID NO142
(i)序列特征(A)长度223个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...223(xi)序列描述SEQ ID NO142Met Phe Ser Leu Ser Tyr Val Ser Lys Lys Phe Leu Ser Val Leu Leu1 5 10 15Leu Ile Ser Leu Phe Leu Ser Ala Cys Lys Ser Asn Asn Lys Asp Lys20 25 30Leu Asp Glu Asn Leu Leu Ser Ser Gly Thr Gln Ser Ser Lys Glu Leu35 40 45Asn Asp Lys Arg Asp Asn Ile Asp Lys Lys Ser Tyr Ala Gly Leu Glu50 55 60Asp Val Phe Leu Asp Asn Lys Ser Ile Ser Pro Asn Asp Lys Tyr Met65 70 75 80Leu Leu Val Phe Gly Arg Asn Gly Cys Ser Tyr Cys Glu Arg Leu Lys85 90 95Lys Asp Leu Lys Asn Val Lys Glu Leu Arg Asn Tyr Ile Lys Glu His100 105 110Phe Ser Ala Tyr Tyr Val Asn Ile Ser Tyr Ser Lys Glu His Asn Phe115 120 125Lys Val Gly Asp Lys Asp Lys Asn Asp Glu Lys Glu Ile Lys Met Ser130 135 140Thr Glu Glu Leu Ala Gln Ile Tyr Ala Val Gln Ser Thr Pro Thr Ile145 150 155 160Val Leu Ser Asp Lys Thr Gly Lys Thr Ile Tyr Glu Leu Pro Gly Tyr165 170 175Met Pro Ser Val Gln Phe Leu Ala Val Leu Glu Phe Ile Gly Asp Gly180 185 190Lys Tyr Gln Asp Thr Lys Asn Asp Glu Asp Leu Thr Lys Lys Leu Lys195 200 205Ala Tyr Ile Lys Tyr Lys Thr Asn Leu Ser Lys Ser Lys Ser Ser210 215 220(2)INFORMATION FOR SEQ ID NO143(i)序列特征(A)长度116个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...116(xi)序列描述SEQ ID NO143Leu Met Lys Ser Lys Ile Thr His Phe Ile Val Ile Ser Phe Val Leu1 5 10 15Ser Val Leu Ser Ala Cys Lys Asp Glu Pro Lys Lys Ser Ser Gln Ser20 25 30His Gln Asn Asn Thr Lys Thr Thr Gln Asn Asn Gln Ile Asn Gln Pro35 40 45Asn Lys Asp Ile Lys Lys Ile Glu His Glu Glu Glu Asp Glu Lys Val50 55 60Thr Lys Glu Val Asn Asp Leu Ile Asn Asn Glu Asn Lys Ile Asp Glu65 70 75 80Ile Asn Asn Glu Glu Asn Ala Asp Pro Ser Gln Lys Arg Thr Asn Asn85 90 95Val Leu Gln Arg Ala Thr Asn His Gln Asp AsnLeu Ser Ser Pro Leu100 105110Asn Arg Lys Tyr115(2)INFORMATION FOR SEQ ID NO144
(i)序列特征(A)长度79个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置l...79(xi)序列描述SEQ ID NO144Met Phe Glu Lys Ile Arg Lys Ile Leu Ala Asp Ile Glu Asp Ser Gln1 5 10 15Asn Glu Ile Glu Met Leu Leu Lys Leu Ala Asn Leu Ser Leu Gly Asp20 25 30Phe Ile Glu Ile Lys Arg Gly Ser Met Asp Met Pro Lys Gly Val Asn35 40 45Glu Ala Phe Phe Thr Gln Leu Ser Glu Glu Val Glu Arg Leu Lys Glu50 55 60Leu Ile Asn Ala Leu Asn Lys Ile Lys Lys Gly Leu Leu Val Phe65 70 75(2)INFORMATION FOR SEQ ID NO145(i)序列特征(A)长度51个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...5l(xi)序列描述SEQ ID NO145Met Ser Met Phe Ile Ser Asn Leu Ala Phe Thr Ser Glu His Lys Asp1 5 10 15Ala Met Glu Val Ala Lys Ile Ala Ile Leu Leu Gly Ser Leu Ile Ser20 25 30Gly Ile Ile Gly Ala Leu Tyr Leu Phe Ala Leu Asp Lys Arg Ala Ala35 40 45Leu Lys Lys50(2)INFORMATION FOR SEQ ID NO146(i)序列特征(A)长度449个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...449(xi)序列描述SEQ ID NO146Met Gly Leu Lys Ile Lys Ile Leu Arg Leu Ser Met Asn Leu Lys Lys1 5 10 15Thr Glu Asn Ala Leu Ser Leu Thr Leu Lys Asn Phe Ile Lys Ser Glu20 25 30Ser Phe Gly Gly Ile Phe Leu Phe Leu Asn Ala Val Leu Ala Met Val35 40 45Val Ala Asn Ser Phe Leu Lys Glu Ser Tyr Phe Ala Leu Trp His Thr
50 55 60Pro Phe Gly Phe Gln Val Gly Asp Phe Phe Ile Gly Phe Ser Leu His65 70 75 80Asn Trp Ile Asp Asp Val Leu Met Ala Leu Phe Phe Leu Met Ile Gly85 90 95Leu Glu Ile Lys Arg Glu Leu Leu Phe Gly Glu Leu Ser Ser Phe Lys100 105 110Lys Ala Ser Phe Pro Val Ile Ala Ala Ile Gly Gly Met Ile Ala Pro115 120 125Gly Leu Ile Tyr Phe Phe Leu Asn Ala Asn Thr Pro Ser Gln His Gly130 135 140Phe Gly Ile Pro Met Ala Thr Asp Ile Ala Phe Ala Leu Gly Val Ile145 150 155 160Met Leu Leu Gly Lys Arg Val Pro Thr Ala Leu Lys Val Phe Leu Ile165 170 175Thr Leu Ala Val Ala Asp Asp Leu Gly Ala Ile Val Val Ile Ala Leu180 185 190Phe Tyr Thr Thr Asn Leu Lys Phe Ala Trp Leu Leu Gly Ala Leu Gly195 200 205Val Val Leu Val Leu Ala Ile Leu Asn Arg Leu Asn Ile Arg Ser Leu210 215 220Ile Pro Tyr Leu Leu Leu Gly Val Leu Leu Trp Phe Cys Val His Gln225 230 235 240Ser Gly Ile His Ala Thr Ile Ala Ala Val Val Leu Ala Phe Met Ile245 250 255Pro Val Lys Ile Pro Lys Asp Ser Lys Asn Val Glu Leu Leu Glu Leu260 265 270Gly Lys Arg Tyr Ala Glu Thr Ser Ser Gly Val Leu Leu Thr Lys Glu275 280 285Gln Gln Glu Ile Leu His Ser Ile Glu Glu Lys Ala Ser Ala Leu Gln290 295 300Ser Pro Leu Glu Arg Leu Glu His Phe Leu Ala Pro Ile Ser Gly Tyr305 310 315 320Phe Ile Met Pro Leu Phe Ala Phe Ala Asn Ala Gly Val Ser Val Asp325 330 335Ser Ser Ile Asn Leu Glu Val Asp Lys Val Leu Leu Gly Val Ile Leu340 345 350Gly Leu Cys Leu Gly Lys Pro Leu Gly Ile Phe Leu Ile Thr Phe Ile355 360 365Ser Glu Lys Leu Lys Ile Thr Ala Arg Pro Lys Gly Ile Gly Trp Trp370 375 380His Ile Leu Gly Ala Gly Leu Leu Ala Gly Ile Gly Phe Thr Met Ser385 390 395 400Met Phe Ile Ser Asn Leu Ala Phe Thr Ser Glu His Lys Asp Ala Met405 410 415Glu Val Ala Lys Ile Ala Ile Leu Leu Gly Ser Leu Ile Ser Gly Ile420 425 430Ile Gly Ala Leu Tyr Leu Phe Ala Leu Asp Lys Arg Ala Ala Leu Lys435 440 445Lys(2)INFORMATION FOR SEQ ID NO147(i)序列特征(A)长度815个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...815(xi)序列描述SEQ ID NO147Met Asn Asp Lys Arg Phe Arg Lys Tyr Cys Ser Phe Ser Ile Phe Leu1 5 10 15Ser Leu Leu Gly Thr Phe Glu Leu Glu Ala Lys Glu Glu Glu Lys Glu20 25 30Glu Lys Lys Thr Glu Arg Asn Lys Asp Lys Glu Lys Asn Ala Gln His35 40 45Thr Leu Gly Lys Val Thr Thr Gln Ala Ala Lys Ile Phe Asn Tyr Asn50 55 60Asn Gln Thr Thr Ile Ser Ser Lys Glu Leu Glu Arg Arg Gln Ala Asn65 70 75 80Gln Ile Ser Asp Met Phe Arg Arg Asn Pro Asn Ile Asn Val Gly Gly85 90 95Gly Ala Val Ile Ala Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg100 105 110Leu Ala Arg Val Thr Val Asp Gly Val Ala Gln Met Gly Ala Ser Tyr115 120 125Gly His Gln Gly Asn Thr Ile Ile Asp Pro Gly Met Leu Lys Ser Val130 135 140Val Val Thr Lys Gly Ala Ala Gln Ala Ser Ala Gly Pro Met Ala Leu145 150 155 160Ile Gly Ala Ile Lys Met Glu Thr Arg Ser Ala Ser Asp Phe Ile Pro165 170 175Lys Gly Lys Asp Tyr Ala Ile Ser Gly Ala Ala Thr Phe Leu Thr Asn180 185 190Phe Gly Asp Arg Glu Thr Ile Met Gly Ala Tyr Arg Asn His His Phe195 200 205Asp Ala Leu Leu Tyr Tyr Thr His Gln Asn Ile Phe Tyr Tyr Arg Asp210 215 220Gly Asp Asn Ala Met Lys Asn Leu Phe Asp Pro Lys Ala Asp Asn Lys225 230 235 240Val Thr Ala Ser Pro Ser Glu Gln Asn Asn Val Met Ala Lys Ile Asn245 250 255Gly Tyr Leu Ser Glu Arg Asp Thr Leu Thr Leu Ser Tyr Asn Met Thr260 265 270Arg Asp Asn Ala Asn Arg Pro Leu Arg Ala Asn Phe Thr Gly Thr Phe275 280 285Leu Pro Tyr Ser Cys Gly Asp Phe Asn Ala Phe Pro Asn Glu Lys Asn290 295 300Pro Ser Asp Cys Leu Phe Glu Asn Asp Ala Ser Leu Phe Lys Thr Tyr305 310 315 320Ser Val Asn Leu Val His Asn Val Ser Leu Asn Tyr Glu Arg Glu Gly325 330 335Gly Ser Arg Phe Gly Asp Pro Lys Leu Lys Ile Asn Gly Tyr Thr Ser340 345 350Ile Arg Asn Val Gln Ile Asp Pro Leu Phe Arg Pro Ser Asp Ile Ala355 360 365Thr Thr Ile Pro Phe Thr Pro Asn Pro Gln Leu Ser Gln Gly Glu Glu370 375 380Asn Gln Cys Val Ala Gln Gly Gly Ile Tyr Asp Ala Leu Lys Gln Thr385 390 395 400Cys Ser Ile Thr Phe Lys Ser Leu Gly Gly Gly Ser Val Val Ala Asn405 410 415Lys Asn Leu Phe Ile Ile Asn Ser Gly Phe Asn Ala Asn Val Ile His420 425 430Thr Ile Asp His Lys Asn Asp Asn Leu Leu Glu Tyr Gly Leu Asn Tyr435 440 445Gln Asn Leu Thr Thr Phe Asp Lys Ala Ile Pro Asp Ser Glu Leu Val
450 455 460Lys Pro Gly Asp Ala Pro Asp Ala Cys Leu Arg Val Thr Gly Pro Asp465 470 475 480Asp Pro Asn Met Asn Gly Arg Cys Gln Arg Asn Gly Ala Thr Ala Asn485 490 495Val Val Gly Val Tyr Ala Gln Ala Asn Tyr Thr Leu His Pro Met Val500 505 510Thr Leu Gly Ala Gly Thr Arg Tyr Asp Val Tyr Thr Leu Val Asp Lys515 520 525Asp Trp Gln Leu His Val Thr Gln Gly Phe Ser Pro Ser Ala Ala Leu530 535 540Asn Val Ser Pro Leu Glu Asn Leu Asn Phe Arg Leu Ser Tyr Ala Tyr545 550 555 560Val Thr Arg Gly Pro Met Pro Gly Gly Leu Val Trp Met Arg Gln Asp565 570 575Asn Leu Arg Tyr Asn Arg Asn Leu Lys Pro Glu Ile Gly Gln Asn Ala580 585 590Glu Phe Asn Thr Glu Tyr Ser Ser Gln Tyr Phe Asp Phe Arg Ala Ala595 600 605Gly Phe Val Gln Leu Ile Ser Asn Tyr Ile Asn Gln Phe Ser Ser Thr610 615 620Leu Phe Val Thr Asn Leu Pro Ala Gln Asp Ile Ile Tyr Val Pro Gly625 630 635 640Tyr Glu Val Ser Gly Thr Ala Lys Tyr Lys Gly Phe Ser Leu Gly Leu645 650 655Ser Val Ala Arg Ser Trp Pro Ser Leu Lys Gly Arg Leu Ile Ala Asp660 665 670Val Tyr Glu Leu Ala Ala Thr Thr Gly Asn Val Phe Ile Leu Thr Ala675 680 685Ser Tyr Thr Ile Pro Arg Thr Gly Leu Ser Ile Thr Trp Leu Ser Arg690 695 700Phe Val Thr Asn Leu Ser Tyr Cys Ser Tyr Ser Pro Tyr Arg Asn Gly705 710 715 720Pro Thr Asp Ile Asp Arg Arg Pro Ser Asn Cys Pro Lys Thr Pro Gly725 730 735Ile Phe His Val His Lys Pro Gly Tyr Gly Val Ser Ser Phe Phe Ile740 745 750Thr Tyr Lys Pro Thr Tyr Lys Lys Leu Lys Gly Leu Ser Leu Asn Ala755 760 765Val Phe Asn Asn Val Phe Asn Gln Gln Tyr Ile Asp Gln Ala Ser Pro770 775 780Val Met Ser Pro Asp Glu Pro Asn Gln Asp Lys Tyr Ala Arg Gly Met785 790 795 800Ala Glu Pro Gly Phe Asn Ala Arg Phe Glu Ile Ser Tyr Lys Phe805 810815(2)INFORMATION FOR SEQ ID NO148(i)序列特征(A)长度814个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...814(xi)序列描述SEQ ID NO148Met Thr Ser Val Leu Glu Lys Tyr Cys Ser Phe Ser Ile Phe Leu Ser1 5 10 15Leu Leu Gly Thr Phe Glu Leu Glu Ala Lys Glu Glu Glu Lys Glu Glu20 25 30Lys Lys Thr Glu Arg Asn Lys Asp Lys Glu Lys Asn Ala Gln His Thr35 40 45Leu Gly Lys Val Thr Thr Gln Ala Ala Lys Ile Phe Asn Tyr Asn Asn50 55 60Gln Thr Thr Ile Ser Ser Lys Glu Leu Glu Arg Arg Gln Ala Asn Gln65 70 75 80Ile Ser Asp Met Phe Arg Arg Asn Pro Asn Ile Asn Val Gly Gly Gly85 90 95Ala Val Ile Ala Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg Leu100 105 110Ala Arg Val Thr Val Asp Gly Val Ala Gln Met Gly Ala Ser Tyr Gly115 120 125His Gln Gly Asn Thr Ile Ile Asp Pro Gly Met Leu Lys Ser Val Val130 135 140Val Thr Lys Gly Ala Ala Gln Ala Ser Ala Gly Pro Met Ala Leu Ile145 150 155 160Gly Ala Ile Lys Met Glu Thr Arg Ser Ala Ser Asp Phe Ile Pro Lys165 170 175Gly Lys Asp Tyr Ala Ile Ser Gly Ala Ala Thr Phe Leu Thr Asn Phe180 185 190Gly Asp Arg Glu Thr Ile Met Gly Ala Tyr Arg Asn His His Phe Asp195 200 205Ala Leu Leu Tyr Tyr Thr His Gln Asn Ile Phe Tyr Tyr Arg Asp Gly210 215 220Asp Asn Ala Met Lys Asn Leu Phe Asp Pro Lys Ala Asp Asn Lys Val225 230 235 240Thr Ala Ser Pro Ser Glu Gln Asn Asn Val Met Ala Lys Ile Asn Gly245 250 255Tyr Leu Ser Glu Arg Asp Thr Leu Thr Leu Ser Tyr Asn Met Thr Arg260 265 270Asp Asn Ala Asn Arg Pro Leu Arg Ala Asn Phe Thr Gly Thr Phe Leu275 280 285Pro Tyr Ser Cys Gly Asp Phe Asn Ala Phe Pro Asn Glu Lys Asn Pro290 295 300Ser Asp Cys Leu Phe Glu Asn Asp Ala Ser Leu Phe Lys Thr Tyr Ser305 310 315 320Val Asn Leu Val His Asn Val Ser Leu Asn Tyr Glu Arg Glu Gly Gly325 330 335Ser Arg Phe Gly Asp Pro Lys Leu Lys Ile Asn Gly Tyr Thr Ser Ile340 345 350Arg Asn Val Gln Ile Asp Pro Leu Phe Arg Pro Ser Asp Ile Ala Thr355 360 365Thr Ile Pro Phe Thr Pro Asn Pro Gln Leu Ser Gln Gly Glu Glu Asn370 375 380Gln Cys Val Ala Gln Gly Gly Ile Tyr Asp Ala Leu Lys Gln Thr Cys385 390 395 400Ser Ile Thr Phe Lys Ser Leu Gly Gly Gly Ser Val Val Ala Asn Lys405 410 415Asn Leu Phe Ile Ile Asn Ser Gly Phe Asn Ala Asn Val Ile His Thr420 425 430Ile Asp His Lys Asn Asp Asn Leu Leu Glu Tyr Gly Leu Asn Tyr Gln435 440 445Asn Leu Thr Thr Phe Asp Lys Ala Ile Pro Asp Ser Glu Leu Val Lys450 455 460Pro Gly Asp Ala Pro Asp Ala Cys Leu Arg Val Thr Gly Pro Asp Asp465 470 475 480Pro Asn Met Asn Gly Arg Cys Gln Arg Asn Gly Ala Thr Ala Asn Val485 490 495Val Gly Val Tyr Ala Gln Ala Asn Tyr Thr Leu His Pro Met Val Thr
500 505 510Leu Gly Ala Gly Thr Arg Tyr Asp Val Tyr Thr Leu Val Asp Lys Asp515 520 525Trp Gln Leu His Val Thr Gln Gly Phe Ser Pro Ser Ala Ala Leu Asn530 535 540Val Ser Pro Leu Glu Asn Leu Asn Phe Arg Leu Ser Tyr Ala Tyr Val545 550 555 560Thr Arg Gly Pro Met Pro Gly Gly Leu Val Trp Met Arg Gln Asp Asn565 570 575Leu Arg Tyr Asn Arg Asn Leu Lys Pro Glu Ile Gly Gln Asn Ala Glu580 585 590Phe Asn Thr Glu Tyr Ser Ser Gln Tyr Phe Asp Phe Arg Ala Ala Gly595 600 605Phe Val Gln Leu Ile Ser Asn Tyr Ile Asn Gln Phe Ser Ser Thr Leu610 615 620Phe Val Thr Asn Leu Pro Ala Gln Asp Ile Ile Tyr Val Pro Gly Tyr625 630 635 640Glu Val Ser Gly Thr Ala Lys Tyr Lys Gly Phe Ser Leu Gly Leu Ser645 650 655Val Ala Arg Ser Trp Pro Ser Leu Lys Gly Arg Leu Ile Ala Asp Val660 665 670Tyr Glu Leu Ala Ala Thr Thr Gly Asn Val Phe Ile Leu Thr Ala Ser675 680 685Tyr Thr Ile Pro Arg Thr Gly Leu Ser Ile Thr Trp Leu Ser Arg Phe690 695 700Val Thr Asn Leu Ser Tyr Cys Ser Tyr Ser Pro Tyr Arg Asn Gly Pro705 710 715 720Thr Asp Ile Asp Arg Arg Pro Ser Asn Cys Pro Lys Thr Pro Gly Ile725 730 735Phe His Val His Lys Pro Gly Tyr Gly Val Ser Ser Phe Phe Ile Thr740 745 750Tyr Lys Pro Thr Tyr Lys Lys Leu Lys Gly Leu Ser Leu Asn Ala Val755 760 765Phe Asn Asn Val Phe Asn Gln Gln Tyr Ile Asp Gln Ala Ser Pro Val770 775 780Met Ser Pro Asp Glu Pro Asn Gln Asp Lys Tyr Ala Arg Gly Met Ala785 790 795 800Glu Pro Gly Phe Asn Ala Arg Phe Glu Ile Ser Tyr Lys Phe805 810(2)INFORMATION FOR SEQ ID NO149(i)序列特征
(A)长度527个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...527(xi)序列描述SEQ ID NO149Met Lys Gln Asn Leu Lys Pro Phe Lys Met Ile Lys Glu Asn Leu Met1 5 10 15Thr Gln Ser Gln Lys Val Arg Phe Leu Ala Pro Leu Ser Leu Ala Leu20 25 30Ser Leu Ser Phe Asn Pro Val Gly Ala Glu Glu Asp Gly Gly Phe Met35 40 45Thr Phe Gly Tyr Glu Leu Gly Gln Val Val Gln Gln Val Lys Asn Pro50 55 60Gly Lys Ile Lys Ala Glu Glu Leu Ala Gly Leu Leu Asn Ser Thr Thr65 70 75 80Thr Asn Asn Thr Asn Ile Asn Ile Ala Gly Thr Gly Gly Asn Val Ala85 90 95Gly Thr Leu Gly Asn Leu Phe Met Asn Gln Leu Gly Asn Leu Ile Asp100 105 110Leu Tyr Pro Thr Leu Lys Thr Asn Asn Leu His Gln Cys Gly Ser Thr115 120 125Asn Ser Gly Asn Gly Ala Thr Ala Ala Ala Ala Thr Asn Asn Ser Pro130 135 140Cys Phe Gln Gly Asn Leu Ala Leu Tyr Asn Glu Met Val Asp Ser Ile145 150 155 160Lys Thr Leu Ser Gln Asn Ile Ser Lys Asn Ile Phe Gln Gly Asp Asn165 170 175Asn Thr Thr Ser Ala Asn Leu Ser Asn Gln Leu Ser Glu Leu Asn Thr180 185 190Ala Ser Val Tyr Leu Thr Tyr Met Asn Ser Phe Leu Asn Ala Asn Asn195 200 205Gln Ala Gly Gly Ile Phe Gln Asn Asn Thr Asn Gln Ala Tyr Glu Asn210 215 220Gly Val Thr Ala Gln Gln Ile Ala Tyr Val Leu Lys Gln Ala Ser Ile225 230 235 240Thr Met Gly Pro Ser Gly Asp Ser Gly Ala Ala Gly Ala Phe Leu Asp245 250 255Ala Ala Leu Ala Gln His Val Phe Asn Ser Ala Asn Ala Gly Asn Asp260 265 270Leu Ser Ala Lys Glu Phe Thr Ser Leu Val Gln Asn Ile Val Asn Asn275 280 285Ser Gln Asn Ala Leu Thr Leu Ala Asn Asn Ala Asn Ile Ser Asn Ser290 295 300Thr Gly Tyr Gln Val Ser Tyr Gly Gly Asn Ile Asp Gln Ala Arg Ser305 310 315 320Thr Gln Leu Leu Asn Asn Thr Thr Asn Thr Leu Ala Lys Val Thr Ala325 330 335Leu Asn Asn Glu Leu Lys Ala Asn Pro Trp Leu Gly Asn Phe Ala Ala340 345 350Gly Asn Ser Ser Gln Val Asn Ala Phe Asn Gly Phe Ile Thr Lys Ile355 360 365Gly Tyr Lys Gln Phe Phe Gly Glu Asn Lys Asn Val Gly Leu Arg Tyr370 375 380Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Gly Val Gly Asn Gly Pro Thr385 390 395 400Tyr Asn Gln Val Asn Leu Leu Thr Tyr Gly Val Gly Thr Asp Val Leu405 410 415Tyr Asn Val Phe Ser Arg Ser Phe Gly Ser Arg Ser Leu Asn Ala Gly420 425 430Phe Phe Gly Gly Ile Gln Leu Ala Gly Asp Thr Tyr Ile Ser Thr Leu435 440 445Arg Asn Ser Pro Gln Leu Ala Ser Arg Pro Thr Ala Thr Lys Phe Gln450 455 460Phe Leu Phe Asp Val Gly Leu Arg Met Asn Phe Gly Ile Leu Lys Lys465 470 475 480Asp Leu Lys Ser His Asn Gln His Ser Ile Glu Ile Gly Val Gln Ile485 490 495Pro Thr Ile Tyr Asn Thr Tyr Tyr Lys Ala Gly Gly Ala Glu Val Lys500 505 510Tyr Phe Arg Pro Tyr Ser Val Tyr Trp Val Tyr Gly Tyr Ala Phe515 520 525(2)INFORMATION FOR SEQ ID NO150
(i)序列特征(A)长度459个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...459(xi)序列描述SEQ ID NO150Val Val Leu Leu Thr Met Thr Lys Arg Leu Phe Lys Gly Leu Leu Ala1 5 10 15Ile Ser Leu Ala Val Ser Leu His Gly Gly Glu Val Lys Glu Lys Lys20 25 30Pro Val Lys Pro Val Lys Glu Asp Pro Gln Glu Leu Ala Ala Lys Arg35 40 45Val Glu Ala Phe Ser Arg Phe Ser Asn Val Val Thr Glu Ile Glu Lys50 55 60Lys Tyr Val Asp Lys Ile Ser Ile Ser Glu Ile Met Thr Lys Ala Ile65 70 75 80Glu Gly Leu Leu Ser Asn Leu Asp Ala His Ser Ala Tyr Leu Asn Glu85 90 95Lys Lys Phe Lys Glu Phe Gln Ala Gln Thr Glu Gly Glu Phe Gly Gly100 105 110Leu Gly Ile Thr Val Gly Met Arg Asp Gly Val Leu Thr Val Ile Ala115 120 125Pro Leu Glu Gly Thr Pro Ala Tyr Lys Ala Gly Val Lys Ser Gly Asp130 135 140Ser Ile Leu Lys Ile Asn Asn Glu Ser Thr Leu Ser Met Ser Ile Asp145 150 155 160Asp Ala Val Asn Leu Met Arg Gly Lys Pro Lys Thr Ser Ile Gln Ile165 170 175Thr Val Val Arg Lys Asn Glu Pro Lys Pro Leu Val Phe Asn Ile Val180 185 190Arg Asp Ile Ile Lys Ile Pro Ser Val Tyr Val Lys Lys Ile Lys Asp
195 200 205Thr Pro Tyr Leu Tyr Val Arg Val Asn Ser Phe Asp Lys Asn Val Thr210 215 220Lys Ser Val Leu Asp Gly Leu Lys Ala Asn Pro Asn Ile Lys Gly Val225 230 235 240Val Leu Asp Leu Arg Gly Asn Pro Gly Gly Leu Leu Asn Gln Ala Val245 250 255Gly Leu Ser Asn Leu Phe Ile Lys Glu Gly Val Leu Val Ser Gln Arg260 265 270Gly Lys Asn Lys Glu Glu Asn Leu Glu Tyr Lys Ala Asn Gly Arg Ala275 280 285Pro Tyr Thr Asn Leu Pro Val Val Val Leu Val Asn Gly Gly Ser Ala290 295 300Ser Ala Ser Glu Ile Val Ala Gly Ala Leu Gln Asp His Lys Arg Ala305 310 315 320Ile Ile Ile Gly Glu Lys Thr Phe Gly Lys Gly Ser Val Gln Val Leu325 330 335Leu Pro Val Asn Lys Asp Glu Ala Ile Lys Ile Thr Thr Ala Arg Tyr340 345 350Tyr Leu Pro Ser Gly Arg Thr Ile Gln Ala Lys Gly Ile Thr Pro Asp355 360 365Ile Val Ile Tyr Pro Gly Lys Val Pro Glu Asn Glu Asn Lys Phe Ser370 375 380Leu Lys Glu Ala Asp Leu Lys His His Leu Glu Gln Glu Leu Lys Lys385 390 395 400Leu Asp Asp Lys Thr Pro Ile Ser Lys Glu Ala Asp Lys Asp Lys Lys405 410 415Ser Glu Glu Glu Lys Glu Val Thr Pro Lys Met Ile Asn Asp Asp Ile420 425 430Gln Leu Lys Thr Ala Ile Asp Ser Leu Lys Thr Trp Ser Ile Val Asp435 440 445Glu Lys Met Asp Glu Lys Val Pro Lys Lys Lys450 455(2)INFORMATION FOR SEQ ID NO151(i)序列特征(A)长度104个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质
(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...104(xi)序列描述SEQ ID NO151Leu Leu Leu His Pro Leu His Ala His Ala Gln Val Leu Gly Phe Thr1 5 10 15Asn His Asp His Ala Pro Trp Leu Tyr Asp Phe Ile Lys Ser Phe Cys20 25 30Asn Leu Ser Gly Gln Pro Phe Leu Asp Leu Gln Ala Phe Ala Ile Asn35 40 45Phe Asn Glu Phe Ser Asp Arg Ala Asn Ala Tyr Asn Leu Phe Leu Arg50 55 60Asp Ile Ser His Ala Asn Ile Pro Lys Lys Arg Glu Gln Met Val Leu65 70 75 80Ala Ser Gly Val Lys Phe Asn Val Leu Ser His Tyr His Phe Ile Ala85 90 95Asn Ala Leu Lys Ile Arg Ala Phe100(2)INFORMATION FOR SEQ ID NO152(i)序列特征(A)长度165个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...165
(xi)序列描述SEQ ID NO152Met Ile Glu Leu Ile Leu His Asn Lys Ser Ile Gln Ile Asp Glu Thr1 5 10 15Leu Leu Asn Val Lys Glu His Leu Glu Lys Phe Tyr Ser Asn Lys Glu20 25 30Gln Glu Thr Ile Ala Lys Thr Leu Glu Ser Gln Thr Glu Leu Thr Cys35 40 45Ser Tyr Leu Leu Asp Lys Asp Phe Ser Leu Leu Glu Lys His Leu Glu50 55 60Asn Ser Leu Gly His Phe Thr Phe Glu Ser Glu Phe Ala Leu Leu Lys65 70 75 80Asp Lys Glu Pro Leu Asn Leu Ala Gln Ile Lys Gln Ile Gly Val Leu85 90 95Lys Val Ile Thr Tyr Glu Met Thr Gln Ala Leu Lys Asn Gln Ile Ile100 105 110His Leu Thr Gln Ile Val Asn Glu Glu Asn Leu Glu Phe Asp Glu Glu115 120 125Leu Val Ile Tyr His Leu Asn Phe Lys Leu Asn Gln Asn Thr Tyr Lys130 135 140Val Leu Ala Lys Phe Cys Val Leu Lys Lys Lys Gly Thr Leu His Glu145 150 155 160Lys Phe Lys Ala Phe165(2)INFORMATION FOR SEQ ID NO153(i)序列特征(A)长度213个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...213
(xi)序列描述SEQ ID NO153Met Asp Thr Glu Thr Gln Glu Lys Phe Leu Ala Tyr Leu Phe Glu Lys1 5 10 15Ala Leu Gln Lys Asn Leu Gln Ala Tyr Trp Ile Thr Thr Thr Glu Thr20 25 30Lys Asn Glu Leu Thr Arg Glu Glu Phe Ser Asn Leu Ile Arg Lys Thr35 40 45Met Ile Glu Leu Ile Leu His Asn Lys Ser Ile Gln Ile Asp Glu Thr50 55 60Leu Leu Asn Val Lys Glu His Leu Glu Lys Phe Tyr Ser Asn Lys Glu65 70 75 80Gln Glu Thr Ile Ala Lys Thr Leu Glu Ser Gln Thr Glu Leu Thr Cys85 90 95Ser Tyr Leu Leu Asp Lys Asp Phe Ser Leu Leu Glu Lys His Leu Glu100 105 110Asn Ser Leu Gly His Phe Thr Phe Glu Ser Glu Phe Ala Leu Leu Lys115 120 125Asp Lys Glu Pro Leu Asn Leu Ala Gln Ile Lys Gln Ile Gly Val Leu130 135 140Lys Val Ile Thr Tyr Glu Met Thr Gln Ala Leu Lys Asn Gln Ile Ile145 150 155 160His Leu Thr Gln Ile Val Asn Glu Glu Asn Leu Glu Phe Asp Glu Glu165 170 175Leu Val Ile Tyr His Leu Asn Phe Lys Leu Asn Gln Asn Thr Tyr Lys180 185 190Val Leu Ala Lys Phe Cys Val Leu Lys Lys Lys Gly Thr Leu His Glu195 200 205Lys Phe Lys Ala Phe210(2)INFORMATION FOR SEQ ID NO154(i)序列特征(A)长度253个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...253(xi)序列描述SEQ ID NO154Met Ala Ile Ser Ile Lys Ser Pro Lys Glu Ile Lys Ala Leu Arg Lys1 5 10 15Ala Gly Glu Leu Thr Ala Gln Ala Leu Ala Leu Leu Glu Arg Glu Val20 25 30Arg Pro Gly Val Ser Leu Leu Glu Leu Asp Lys Met Ala Glu Asp Phe35 40 45Ile Lys Ser Ser His Ala Arg Pro Ala Phe Lys Gly Leu Tyr Gly Phe50 55 60Pro Asn Ser Val Cys Met Ser Leu Asn Glu Val Val Ile His Gly Ile65 70 75 80Pro Thr Asp Tyr Val Leu Gln Glu Gly Asp Ile Ile Gly Leu Asp Leu85 90 95Gly Val Glu Val Asp Gly Tyr Tyr Gly Asp Ser Ala Leu Thr Leu Pro100 105 110Ile Gly Ala Ile Ser Pro Gln Asp Glu Lys Leu Leu Ala Cys Ser Lys115 120 125Glu Ser Leu Met His Ala Ile Ser Ser Ile Arg Val Gly Met His Phe130 135 140Lys Glu Leu Ser Gln Ile Leu Glu Gly Ala Ile Thr Glu Arg Gly Phe145 150 155 160Val Pro Leu Lys Gly Phe Cys Gly His Gly Ile Gly Lys Lys Pro His165 170 175Glu Glu Pro Glu Ile Pro Asn Tyr Leu Glu Lys Gly Val Lys Ala Asn180 185 190Ser Gly Pro Lys Ile Lys Glu Gly Met Val Phe Cys Leu Glu Pro Met195 200 205Val Cys Gln Lys Gln Gly Glu Pro Lys Ile Leu Ala Asp Lys Trp Ser210 215 220Val Val Ser Val Asp Gly Leu Asn Thr Ser His His Glu His Thr Ile225 230 235 240Ala Ile Val Gly Asn Lys Ala Val Ile Leu Thr Glu Arg245 250(2)INFORMATION FOR SEQ ID NO155
(i)序列特征(A)长度247个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...247(xi)序列描述SEQ ID NO155Lys Pro Lys Arg Asn Gln Ser Pro Lys Lys Ser Arg Glu Leu Thr Ala1 5 10 15Gln Ala Leu Ala Leu Leu Glu Arg Glu Val Arg Pro Gly Val Ser Leu20 25 30Leu Glu Leu Asp Lys Met Ala Glu Asp Phe Ile Lys Ser Ser His Ala35 40 45Arg Pro Ala Phe Lys Gly Leu Tyr Gly Phe Pro Asn Ser Val Cys Met50 55 60Ser Leu Asn Glu Val Val Ile His Gly Ile Pro Thr Asp Tyr Val Leu65 70 75 80Gln Glu Gly Asp Ile Ile Gly Leu Asp Leu Gly Val Glu Val Asp Gly85 90 95Tyr Tyr Gly Asp Ser Ala Leu Thr Leu Pro Ile Gly Ala Ile Ser Pro100 105 110Gln Asp Glu Lys Leu Leu Ala Cys Ser Lys Glu Ser Leu Met His Ala115 120 125Ile Ser Ser Ile Arg Val Gly Met His Phe Lys Glu Leu Ser Gln Ile130 135 140Leu Glu Gly Ala Ile Thr Glu Arg Gly Phe Val Pro Leu Lys Gly Phe145 150 155 160Cys Gly His Gly Ile Gly Lys Lys Pro His Glu Glu Pro Glu Ile Pro165 170 175Asn Tyr Leu Glu Lys Gly Val Lys Ala Asn Ser Gly Pro Lys Ile Lys180 185 190Glu Gly Met Val Phe Cys Leu Glu Pro Met Val Cys Gln Lys Gln Gly195 200 205Glu Pro Lys Ile Leu Ala Asp Lys Trp Ser Val Val Ser Val Asp Gly210 215 220Leu Asn Thr Ser His His Glu His Thr Ile Ala Ile Val Gly Asn Lys225 230 235 240Ala Val Ile Leu Thr Glu Arg245(2)INFORMATION FOR SEQ ID NO156(i)序列特征(A)长度340个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...340(xi)序列描述SEQ ID NO156Met Tyr Arg Lys Asp Leu Asp Asn Tyr Leu Lys Gln Arg Leu Pro Lys1 5 10 15Ala Val Phe Leu Tyr Gly Glu Phe Asp Phe Phe Ile His Tyr Tyr Ile20 25 30Gln Thr Ile Ser Ala Leu Phe Lys Gly Asn Asn Pro Asp Thr Glu Thr35 40 45Ser Leu Phe Tyr Ala Ser Asp Tyr Glu Lys Ser Gln Ile Ala Thr Leu50 55 60Leu Glu Gln Asp Ser Leu Phe Gly Gly Ser Ser Leu Val Ile Leu Lys65 70 75 80Leu Asp Phe Ala Leu His Lys Lys Phe Lys Glu Asn Asp Ile Asn Pro85 90 95Phe Leu Lys Ala Leu Glu Arg Pro Ser His Asn Arg Leu Ile Ile Gly100 105 110Leu Tyr Asn Ala Lys Ser Asp Thr Thr Lys Tyr Lys Tyr Thr Ser Glu115 120 125Ile Ile Val Lys Phe Phe Gln Lys Ser Pro Leu Lys Asp Glu Ala Ile130 135 140Cys Val Arg Phe Phe Thr Pro Lys Ala Trp Glu Ser Leu Lys Phe Leu145 150 155 160Gln Glu Arg Ala Asn Phe Leu His Leu Asp Ile Ser Gly His Leu Leu165 170 175Asn Ala Leu Phe Glu Ile Asn Asn Glu Asp Leu Ser Val Ser Phe Asn180 185 190Asp Leu Asp Lys Leu Ala Val Leu Asn Ala Pro Ile Thr Leu Glu Asp195 200 205Ile Gln Glu Leu Ser Ser Asn Ala Gly Asp Met Asp Leu Gln Lys Leu210 215 220Ile Leu Gly Leu Phe Leu Lys Lys Ser Val Leu Asp Ile Tyr Asp Tyr225 230 235 240Leu Leu Lys Glu Gly Lys Lys Asp Ala Asp Ile Leu Arg Gly Leu Glu245 250 255Arg Tyr Phe Tyr Gln Leu Phe Leu Phe Phe Ala His Ile Lys Thr Thr260 265 270Gly Leu Met Asp Ala Lys Glu Val Leu Gly Tyr Ala Pro Pro Lys Glu275 280 285Ile Val Glu Asn Tyr Ala Lys Asn Ala Leu Arg Leu Lys Glu Ala Gly290 295 300Tyr Lys Arg Val Phe Glu Ile Phe Arg Leu Trp His Leu Gln Ser Met305 310 315 320Gln Gly Gln Lys Glu Leu Gly Phe Leu Tyr Leu Thr Pro Ile Gln Lys325 330 335Ile Ile Asn Pro340(2)INFORMATION FOR SEQ ID NO157(i)序列特征(A)长度200个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源
(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...200(xi)序列描述SEQ ID NO157Val Phe Met Thr Ser Ala Leu Leu Gly Leu Gln Ile Val Leu Ala Val1 5 10 15Leu Ile Val Val Val Val Leu Leu Gln Lys Ser Ser Ser Ile Gly Leu20 25 30Gly Ala Tyr Ser Gly Ser Asn Asp Ser Leu Phe Gly Ala Lys Gly Pro35 40 45Ala Ser Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val50 55 60Ile Asn Thr Ile Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys65 70 75 80Ser Val Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val85 90 95Pro Ala Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro100 105 110Thr Leu Asn Pro Leu Glu Gln Ala Pro Thr Asn Pro Leu Met Pro Thr115 120 125Gln Thr Pro Lys Glu Leu Pro Lys Glu Pro Ala Lys Thr Pro Phe Val130 135 140Glu Ser Pro Lys Gln Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu145 150 155 160Asn Gly Ile Lys Gly Val Glu Lys Asn Lys Glu Asn Ala Lys Thr Pro165 170 175Pro Thr Thr His Gln Lys Pro Lys Thr His Ala Thr Thr Asn Ala His180 185 190Thr Asn Gln Lys Lys Asp Glu Lys195 200(2)INFORMATION FOR SEQ ID NO158(i)序列特征(A)长度159个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质
(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...159(xi)序列描述SEQ ID NO158Met Arg Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu Ile Ile Glu Thr1 5 10 15Leu Leu Val Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg Ile20 25 30Leu Ala Phe Leu Ile Asp Ser Leu Leu Val Ala Phe Leu Leu Ser Asp35 40 45Leu Leu Arg Ala Cys Ala Phe Leu His Ser Leu Tyr Trp Leu Thr Asn50 55 60Pro Ile Tyr Tyr Ser Ala Phe Val Val Met Gly Phe Ile Ile Leu Tyr65 70 75 80Gly Val Tyr Glu Ile Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala85 90 95Lys Leu Val Phe Arg Ile Lys Ile Ile Asp Ile Tyr Leu Ala Asp Cys100 105 110Pro Ser Arg Ala Ile Leu Leu Lys Arg Leu Gly Leu Lys Ile Val Val115 120 125Phe Leu Cys Pro Phe Leu Trp Phe Val Val Phe Lys Asn Pro Tyr His130 135 140Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe145 150155(2)INFORMATION FOR SEQ ID NO159(i)序列特征(A)长度234个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...234(xi)序列描述SEQ ID NO159Leu Asn Thr Asp Phe Ser His Ile Thr Asp Ile Glu Gly Met Arg Phe1 5 10 15Val Asn Glu Glu Asp Ala Leu Asn Lys Leu Ile Asn Glu Ile His Thr20 25 30Arg His Ile Asp Leu Lys Asp Ser Ile Met Leu Ala Leu Ser Phe Asn35 40 45Ala Leu Tyr Leu Ala Asn Ala Leu Ala Gln Lys Phe Gly Ala Thr Tyr50 55 60Asp Ile Leu Phe Leu Glu Pro Ile Leu Ala Pro Leu Asn Ser Lys Cys65 70 75 80Glu Ile Ala Leu Val Ser Glu Ser Met Asp Ile Val Met Asn Glu Ser85 90 95Leu Ile Asn Ser Phe Asp Ile Ala Leu Asp Tyr Val Tyr Gly Glu Ala100 105 110Lys Arg Ala Tyr Glu Glu Asp Ile Leu Ser His Ile Tyr Gln Tyr Arg115 120 125Lys Gly Asn Ala Ile Lys Ser Leu Lys Asp Lys Asn Ile Phe Ile Val130 135 140Asp Arg Gly Ile Glu Thr Gly Phe Arg Ala Gly Leu Gly Val Gln Thr145 150 155 160Cys Leu Lys Lys Glu Cys Gln Asp Ile Tyr Ile Leu Thr Pro Ile Leu165 170 175Ala Gln Asn Val Ala Gln Gly Leu Glu Ser Leu Cys Asp Gly Val Ile180 185 190Ser Val Tyr Arg Pro Glu Cys Phe Val Ser Val Glu His His Tyr Lys195 200 205Glu Leu Lys Arg Leu Ser Asn Glu Glu Ile Glu Lys Tyr Leu Gly Ala210 215 220Asn Asn Ala Pro Asn Leu Lys Lys Glu His225 230(2)INFORMATION FOR SEQ ID NO160
(i)序列特征(A)长度287个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...287(xi)序列描述SEQ ID NO160Leu Lys Gln Ser Glu Met Ala Met Glu Phe Asn Asp Pro Arg Met Arg1 5 10 15Phe Phe Ile Gly Asp Val Arg Asp Leu Glu Arg Leu Asn Tyr Ala Leu20 25 30Glu Gly Val Asp Ile Cys Ile His Ala Ala Ala Leu Lys His Val Pro35 40 45Ile Ala Glu Tyr Asn Pro Leu Glu Cys Ile Lys Thr Asn Ile Met Gly50 55 60Ala Ser Asn Val Ile Asn Ala Cys Leu Lys Asn Glu Ile Ser Gln Val65 70 75 80Ile Ala Leu Ser Thr Asp Lys Ala Ala Asn Pro Ile Asn Leu Tyr Gly85 90 95Ala Thr Lys Leu Cys Ser Asp Lys Leu Phe Val Ser Ala Asn Asn Phe100 105 110Lys Gly Pro Ser Gln Thr Gln Phe Gly Val Val Arg Tyr Gly Asn Val115 120 125Val Gly Ser Arg Gly Ser Val Val Pro Phe Phe Lys Lys Leu Val Gln130 135 140Asn Lys Ala Ser Glu Ile Pro Ile Thr Asp Ile Arg Met Thr Arg Phe145 150 155 160Trp Ile Thr Leu Asp Glu Gly Val Ser Phe Val Leu Lys Ser Leu Lys165 170 175Arg Met His Gly Gly Glu Ile Phe Val Pro Lys Ile Pro Ser Met Lys180 185 190Met Ile Asp Leu Ala Lys Ala Leu Ala Pro Asn Ile Pro Thr Lys Ile
195 200 205Ile Gly Ile Arg Pro Gly Glu Lys Leu His Glu Val Met Ile Pro Lys210 215 220Asp Glu Ser His Leu Ala Leu Glu Phe Glu Asp Phe Phe Ile Ile Gln225 230 235 240Pro Thr Ile Ser Phe Gln Thr Pro Lys Asp Tyr Thr Leu Thr Lys Leu245 250 255His Glu Lys Gly Gln Lys Val Ala Pro Asp Phe Glu Tyr Ser Ser His260 265 270Thr Asn Asn Gln Trp Leu Glu Pro Asp Asp Leu Leu Lys Leu Leu275 280 285(2)INFORMATION FOR SEQ ID NO161(i)序列特征(A)长度201个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...201(xi)序列描述SEQ ID NO161Met Arg Leu His Thr Ala Phe Phe Gly Ile Asn Ser Leu Leu Val Ala1 5 10 15Thr Leu Leu Ile Ser Gly Cys Ser Leu Phe Lys Lys Arg Asn Thr Asn20 25 30Ala Gln Leu Ile Pro Pro Ser Ala Asn Gly Leu Gln Ala Pro Ile Tyr35 40 45Pro Pro Thr Asn Phe Thr Pro Arg Lys Ser Ile Gln Pro Leu Pro Ser50 55 60Pro Arg Leu Glu Asn Asn Asp Gln Pro Ile Ile Ser Ser Asn Pro Thr65 70 75 80Asn Ala Ile Pro Asn Thr Pro Ile Leu Thr Pro Asn Asn Val Ile Glu
85 90 95Leu Asn Ala Val Gly Met Gly Val Ala Pro Glu Ser Thr Ile Ser Pro100 105 110Ser Gln Ala Leu Ala Leu Ala Lys Arg Ala Ala Ile Val Asp Gly Tyr115 120 125Arg Gln Leu Gly Glu Lys Met Tyr Gly Ile Arg Val Asn Ala Gln Asp130 135 140Thr Val Lys Asp Met Val Leu Gln Asn Ser Val Ile Lys Thr Arg Val145 150 155 160Asn Ala Leu Ile Arg Asn Ala Glu Ile Thr Glu Thr Ile Tyr Lys Asp165 170 175Gly Leu Cys Gln Val Ser Met Glu Leu Lys Leu Asp Gly Arg Ile Trp180 185 190Tyr Arg Ile Leu Ser Gly Ser Arg Gly195 200(2)INFORMATION FOR SEQ ID NO162(i)序列特征(A)长度355个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...355(xi)序列描述SEQ ID NO162Met Ser Tyr Thr Ile Asn Lys Arg Phe Ser Val Gly Val Gly Leu Arg1 5 10 15Gly Leu Tyr Ala Thr Gly Ser Phe Asn Asn Thr Val Tyr Val Pro Leu20 25 30Glu Gly Ala Ser Val Leu Ser Ala Glu Gln Ile Leu Asn Leu Pro Asn35 40 45Asn Val Phe Ala Asp Gln Val Pro Ser Asn Met Met Thr Leu Leu Gly
50 55 60Asn Ile Gly Tyr Gln Pro Ala Leu Asn Cys Gln Lys Ala Gly Gly Asp65 70 75 80Met Ser Asp Gln Ser Cys Gln Glu Phe Tyr Asn Gly Leu Lys Lys Ile85 90 95Met Gly Tyr Ser Gly Leu Ile Lys Ala Ser Ala Asn Leu Tyr Gly Thr100 105 110Thr Gln Val Val Gln Lys Ser Asn Gly Gln Gly Val Ser Gly Gly Tyr115 120 125Arg Val Gly Ser Ser Leu Arg Val Phe Asp His Gly Met Phe Ser Val130 135 140Val Tyr Asn Ser Ser Val Thr Phe Asn Met Lys Gly Gly Leu Val Ala145 150 155 160Ile Thr Glu Leu Gly Pro Ser Leu Gly Ser Val Leu Thr Lys Gly Ser165 170 175Leu Asn Ile Asn Val Ser Leu Pro Gln Thr Leu Ser Leu Ala Tyr Ala180 185 190His Gln Phe Phe Lys Asp Arg Leu Arg Val Glu Gly Val Phe Glu Arg195 200 205Thr Phe Trp Ser Gln Gly Asn Lys Phe Leu Val Thr Pro Asp Phe Ala210 215 220Asn Ala Thr Tyr Lys Gly Leu Ser Gly Thr Val Ala Ser Leu Asp Ser225 230 235 240Glu Thr Leu Lys Lys Met Val Gly Leu Ala Asn Phe Lys Ser Val Met245 250 255Asn Met Gly Ala Gly Trp Arg Asp Thr Asn Thr Phe Arg Leu Gly Val260 265 270Thr Tyr Met Gly Lys Ser Leu Arg Leu Met Gly Ala Ile Asp Tyr Asp275 280 285Gln Ala Pro Ser Pro Gln Asp Ala Ile Gly Ile Pro Asp Ser Asn Gly290 295 300Tyr Thr Val Ala Phe Gly Thr Lys Tyr Asn Phe Arg Gly Phe Asp Leu305 310 315 320Gly Val Ala Gly Ser Phe Thr Phe Lys Ser Asn Arg Ser Ser Leu Tyr325 330 335Gln Ser Pro Thr Ile Gly Gln Leu Arg Ile Phe Ser Ala Ser Leu Gly340 345 350Tyr Arg Trp355(2)INFORMATION FOR SEQ ID NO163(i)序列特征
(A)长度587个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...587(xi)序列描述SEQ ID NO163Met Lys Asn Phe Ser Pro Leu Tyr Cys Leu Lys Lys Leu Lys Lys Arg1 5 10 15His Leu Ile Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe20 25 30Lys Ile Gln Glu Gln Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr35 40 45Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn50 55 60Met Gly Phe Thr Asn Asp Trp Gly Glu Asn Arg Ser Glu Phe Glu Met65 70 75 80Thr Thr Thr Val Ile Asn Ile Pro Ala Phe Ser Phe Lys Val Pro Thr85 90 95Thr Asn Gln Gly Leu Tyr Ser Val Thr Ser Leu Glu Ile Asp Lys Ser100 105 110Gln Gln Asn Ile Leu Gly Ile Ile Asn Thr Ile Gly Leu Gly Asn Ile115 120 125Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gln Ala130 135 140Ile Asn Arg Val Gln Gly Leu Met Asn Leu Thr Asn Gln Lys Val Val145 150 155 160Thr Leu Ala Ser Lys Pro Asp Thr Gln Ile Val Asn Gly Trp Thr Gly165 170 175Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His180 185 190Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly195 200 205Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe Ile210 215 220Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Ile Asn Lys Arg225 230 235 240Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe245 250 255Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala260 265 270Glu Gln Ile Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gln Val Pro275 280 285Ser Asn Met Met Thr Leu Leu Gly Asn Ile Gly Tyr Gln Pro Ala Leu290 295 300Asn Cys Gln Lys Ala Gly Gly Asp Met Ser Asp Gln Ser Cys Gln Glu305 310 315 320Phe Tyr Asn Gly Leu Lys Lys Ile Met Gly Tyr Ser Gly Leu Ile Lys325 330 335Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gln Val Val Gln Lys Ser Asn340 345 350Gly Gln Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val355 360 365Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe370 375 380Asn Met Lys Gly Gly Leu Val Ala Ile Thr Glu Leu Gly Pro Ser Leu385 390 395 400Gly Ser Val Leu Thr Lys Gly Ser Leu Asn Ile Asn Val Ser Leu Pro405 410 415Gln Thr Leu Ser Leu Ala Tyr Ala His Gln Phe Phe Lys Asp Arg Leu420 425 430Arg Val Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gln Gly Asn Lys435 440 445Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser450 455 460Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly465 470 475 480Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp485 490 495Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg500 505 510Leu Met Gly Ala Ile Asp Tyr Asp Gln Ala Pro Ser Pro Gln Asp Ala515 520 525Ile Gly Ile Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys530 535 540Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe545 550 555 560Lys Ser Asn Arg Ser Ser Leu Tyr Gln Ser Pro Thr Ile Gly Gln Leu565 570 575Arg Ile Phe Ser Ala Ser Leu Gly Tyr Arg Trp580 585(2)INFORMATION FOR SEQ ID NO164(i)序列特征(A)长度205个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...205(xi)序列描述SEQ ID NO164Leu Ile Phe Arg Phe Phe Leu Ile Leu Ser Leu Leu Lys Gly Val Leu1 5 10 15Leu Ala Lys Lys Asp Trp Asn Phe Phe Lys Pro Leu Glu Pro Thr Lys20 25 30Lys Tyr Phe Gly Ser Phe Lys Ile Gly Tyr Leu Tyr Gln His Ala Glu35 40 45Thr Thr Lys Arg Phe Pro Ile Arg Pro Lys Asn Arg Pro Pro Ile Leu50 55 60Met Asp Lys Ile Tyr His Asp Ala Ser Leu Gly Phe Asp Ala Gly Tyr65 70 75 80Val Leu Lys Lys Lys Ala Leu Leu Gly Gly Tyr Leu Asp Ala Gly Met85 90 95Gly Asp Ser Tyr Phe Met Ser Ala Gly Leu Val Ala Gly Val Arg Leu100 105 110Phe Lys Gly Trp Val Ile Pro Lys Ile Ala Leu Gly Tyr Gln Leu Gln115 120 125Ile Leu Gly Ala Lys Ile Asp Lys Tyr Gln Phe Asn Ile Gln Ser Ala
130 135 140Val Gly Ser Val Gly Leu Phe Phe Asn Ala Ala Lys Asn Phe Gly Leu145 150 155 160Ser Ile Glu Ala Arg Gly Gly Ile Pro Phe Tyr Phe Ile Gln Ser Arg165 170 175Phe Ser Lys Ala Phe Gly Thr Pro Arg Leu Asn Ile Tyr Ser Val Gly180 185 190Ile Thr Phe Thr Phe Tyr Asp Phe Thr Arg Phe Leu Gly195 200 205(2)INFORMATION FOR SEQ ID NO165(i)序列特征(A)长度253个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...253(xi)序列描述SEQ ID NO165Leu Trp His Ala Ala Phe Ser Val Gly Glu Trp Gly Trp Asn Gly Asp1 5 10 15Glu Ile Pro Tyr Arg Asp Cys Asp Glu Trp Gly Leu Asp Asp Phe Tyr20 25 30Gly Val Lys Pro Thr Asp Cys Ala Gly Val Leu Ser Phe Ala Arg Ser35 40 45His Arg Arg Gln Asn Gln Ala Val Leu Ser Lys Pro Lys Ser Phe Arg50 55 60Met Lys Lys Ile Ala Phe Ile Leu Ala Leu Trp Val Gly Leu Leu Gly65 70 75 80Ala Phe Glu Pro Lys Lys Ser His Ile Tyr Phe Gly Ala Met Val Gly85 90 95Leu Ala Pro Val Lys Ile Thr Pro Lys Pro Ala Ser Asp Ser Ser Tyr
100 105 110Thr Ala Phe Leu Trp Gly Ala Lys Gly Gly Tyr Gln Phe Ala Phe Phe115 120 125Lys Ala Leu Ala Leu Arg Gly Glu Phe Ser Tyr Leu Met Ala Ile Lys130 135 140Pro Thr Ala Leu His Thr Ile Asn Thr Ser Leu Leu Ser Leu Asn Met145 150 155 160Asp Val Leu Ser Asp Phe Tyr Thr Tyr Lys Lys Tyr Ser Phe Gly Val165 170 175Tyr Gly Gly Leu Gly Ile Gly Tyr Phe Tyr Gln Ser Asn His Leu Gly180 185 190Met Lys Asn Ser Ser Phe Met Gly Tyr Asn Gly Leu Phe Asn Val Gly195 200 205Leu Gly Ser Thr Ile Asp Arg His His Arg Val Glu Leu Gly Ala Lys210 215 220Ile Pro Phe Ser Lys Thr Arg Asn Ser Phe Lys Asn Ser Tyr Phe Leu225 230 235 240Glu Ser Val Phe Ile His Ala Ala Tyr Ser Tyr Met Phe245 250(2)INFORMATION FOR SEQ ID NO166(i)序列特征(A)长度412个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...412(xi)序列描述SEQ ID NO166Met Glu Ser Val Lys Thr Val Lys Thr Asn Lys Val Gly Lys Asn Thr1 5 10 15Glu Thr Ala Asn Thr Glu Ala Ser Lys Glu Thr His Phe Lys Gln Ala
20 25 30Ser Ala Ile Thr Asn Thr Leu Arg Ser Ile Gly Gly Ile Phe Thr Lys35 40 45Ile Ala Lys Lys Val Arg Glu Leu Val Lys Lys His Pro Lys Lys Ser50 55 60Ser Val Ala Leu Val Val Leu Thr His Ile Ala Cys Lys Arg Ala Lys65 70 75 80Glu Leu Asp Asp Lys Val Gln Asp Lys Ser Lys Gln Ala Glu Lys Glu85 90 95Asn Gln Ile Asn Trp Trp Lys Tyr Ser Gly Leu Thr Ile Ala Ala Ser100 105 110Leu Leu Leu Ala Ala Cys Ser Thr Gly Asp Ile Asp Lys Gln Ile Glu115 120 125Leu Glu Gln Glu Lys Lys Glu Ala Asn Lys Ser Gly Ile Lys Leu Glu130 135 140Gln Glu Arg Gln Lys Thr Glu Gln Glu Arg Gln Lys Thr Asn Lys Ser145 150 155 160Glu Ile Glu Leu Glu Gln Glu Arg Gln Lys Thr Asn Lys Ser Gly Ile165 170 175Glu Leu Ala Asn Ser Gln Ile Lys Ala Glu Gln Glu Arg Gln Lys Thr180 185 190Glu Gln Glu Lys Gln Lys Ala Asn Lys Ser Glu Ile Glu Leu Glu Gln195 200 205Gln Lys Gln Lys Thr Ile Asn Thr Gln Arg Asp Leu Ile Lys Glu Gln210 215 220Lys Asp Phe Ile Lys Glu Thr Glu Gln Asn Cys Gln Glu Lys His Gly225 230 235 240Gln Leu Phe Ile Lys Lys Ala Arg Ile Lys Thr Gly Ile Thr Thr Gly245 250 255Ile Ala Ile Glu Ile Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys260 265 270Thr Asn Gln Thr Pro Ile Gln Pro Lys His Leu Pro Asn Ser Lys Gln275 280 285Pro Arg Ser Gln Arg Gly Ser Lys Ala Gln Glu Leu Ile Ala Tyr Leu290 295 300Gln Lys Glu Leu Glu Ser Leu Pro Tyr Ser Gln Lys Ala Ile Ala Lys305 310 315 320Gln Val Asp Phe Tyr Lys Pro Ser Ser Ile Ala Tyr Leu Glu Leu Asp325 330 335Pro Arg Asp Phe Lys Val Thr Glu Glu Trp Gln Lys Glu Asn Leu Lys340 345 350Ile Arg Ser Lys Ala Gln Ala Lys Met Leu Glu Met Arg Asn Pro Gln355 360 365Ala His Leu Pro Thr Ser Gln Ser Leu Leu Phe Val Gln Lys Ile Phe370 375 380Ala Asp Ile Asn Lys Glu Ile Glu Ala Val Ala Asn Thr Glu Lys Lys385 390 395 400Thr Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met405 410(2)INFORMATION FOR SEQ ID NO167(i)序列特征(A)长度149个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...149(xi)序列描述SEQ ID NO167Leu Asn Trp Glu His Leu Met Lys Lys Leu Ala Phe Ser Leu Leu Phe1 5 10 15Thr Gly Thr Phe Leu Gly Leu Phe Leu Asn Ala Ser Asp Phe Lys Ser20 25 30Met Asp Asn Lys Gln Leu Leu Glu Gln Ala Gly Lys Val Ala Pro Ser35 40 45Glu Val Pro Glu Phe Arg Thr Glu Val Asn Lys Arg Leu Glu Ala Met50 55 60Lys Glu Glu Glu Arg Gln Lys Tyr Lys Ala Asp Phe Lys Lys Ala Met65 70 75 80Asp Lys Asn Leu Ala Ser Leu Ser Gln Glu Asp Arg Asn Lys Arg Lys85 90 95Lys Glu Ile Leu Glu Val Ile Ala Asn Lys Lys Lys Thr Met Thr Met100 105 110Lys Glu Tyr Arg Glu Glu Gly Leu Asp Leu His Asp Cys Ala Cys Glu115 120 125Gly Pro Phe His Asp His Glu Lys Lys Gly Gln Lys Gly Lys Lys Pro130 135 140Ser His His Lys His145(2)INFORMATION FOR SEQ ID NO168(i)序列特征(A)长度204个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...204(xi)序列描述SEQ ID NO168Met Gln Ala Val Ile Leu Ala Asn Gly Glu Phe Pro Lys Ser Lys Lys1 5 10 15Cys Leu Asp Ile Leu Gln Asn Ala Pro Phe Leu Ile Ala Cys Asp Gly20 25 30Ala Val Ile Ser Leu His Ala Leu Gln Phe Lys Pro Ser Val Val Ile35 40 45Gly Asp Leu Asp Ser Ile Asp Ser His Leu Lys Ala Leu Tyr Asn Pro50 55 60Ile Arg Val Ser Glu Gln Asp Ser Asn Asp Leu Ser Lys Ala Phe Phe65 70 75 80Tyr Ala Leu Asn Arg Gly Cys Asp Asp Phe Ile Phe Leu Gly Leu Asn85 90 95Gly Lys Arg Glu Asp His Ala Leu Ala Asn Thr Phe Leu Leu Leu Glu100 105 110Tyr Phe Lys Phe Cys Lys Lys Ile Gln Ser Val Ser Asp Tyr Gly Leu115 120 125Phe Arg Val Leu Glu Thr Pro Phe Thr Leu Pro Ser Phe Lys Gly Glu130 135 140Gln Ile Ser Leu Phe Ser Leu Asp Leu Lys Ala Arg Phe Thr Ser Lys145 150 155 160Asn Leu Lys Tyr Pro Leu Lys Asp Leu Arg Leu Lys Thr Leu Phe Ser165 170 175Gly Ser Leu Asn Glu Ala Thr Asn His Cys Phe Ser Leu Ser Ser Glu180 185 190Pro Lys Ser Val Val Leu Val Tyr Gln Lys Phe Ser195 200(2)INFORMATION FOR SEQ ID NO169(i)序列特征(A)长度280个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...280(xi)序列描述SEQ ID NO169Val Phe Asp Ser Leu Gly Gly Phe Leu Gly Tyr Lys Thr Phe Lys Pro1 5 10 15Ile Val Asp Lys Val Lys Asn Ile Asn Ala Trp Ile Lys Asn Tyr Asp20 25 30Asn Lys Lys Ala Gln Glu Ile Met Gly Phe Ile Glu Asn Pro Thr Pro35 40 45Asp Phe Gln Asn Asn Lys Phe Leu Cys Val Leu Asn Arg Gln Gly Thr50 55 60Arg His Asn Asn Tyr Leu Gly Leu Thr Ser Thr Asn Leu Leu Ile Gly65 70 75 80Ala Ile Tyr Phe Ser Ile Arg His Cys Ile Lys Ala Thr Trp Gln Asn85 90 95Asp Arg Asp Gln Phe Tyr Ala Pro Tyr Asp Asp Ala Phe Gln Asp Asp100 105 110Ser Glu Phe Lys Asn Asn Cys Leu Ala Phe Met Leu Phe His Thr Gln115 120 125Asn Arg Ile Thr Ala Thr Gln Gly Thr Asn His Phe Ile Pro Phe Ser130 135 140Glu Asp Glu Val Asp Ser Lys Glu Arg Tyr Leu Ser His Ala Leu Leu145 150 155 160Asp Phe Leu Lys Gly Glu Ile Lys Glu Pro Lys Lys Ser Asp Ser Leu165 170 175Phe Leu Asn Ala Lys Lys Glu Asn Lys Pro Leu Lys Phe Ser Ser Ser180 185 190Ala Ser Lys Val Phe Asp Ala Gly Arg Glu Ile Tyr Arg Tyr Tyr His195 200 205Thr Gln Asp Phe Ile His Thr Pro Tyr Asn Ala Asn Ala Ser Leu Tyr210 215 220Asp Ile Lys Glu Phe Phe Gln Gly Arg Asn Lys Gln Gly Arg Leu Asn225 230 235 240Ser Pro Thr Lys Ala Lys Asp Glu Tyr Tyr Lys Gln Leu Tyr Ala Asn245 250 255Leu Gln Tyr Ala Leu Lys Asp Leu Ala Lys Glu Ile Gln Pro Lys Val260 265 270Tyr Glu Tyr Gly Phe Leu Arg Glu275 280(2)INFORMATION FOR SEQ ID NO170(i)序列特征(A)长度309个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...309(xi)序列描述SEQ ID NO170Cys Asp Arg Ala Ile Pro His Trp Leu Phe Ser Leu Gly Tyr Arg Tyr1 5 10 15Pro Pro Pro Leu Lys Pro Thr Asn Ala Phe Asn Leu Glu Val Phe Asp20 25 30Ser Leu Gly Gly Phe Leu Gly Tyr Lys Thr Phe Lys Pro Ile Val Asp35 40 45Lys Val Lys Asn Ile Asn Ala Trp Ile Lys Asn Tyr Asp Asn Lys Lys50 55 60Ala Gln Glu Ile Met Gly Phe Ile Glu Asn Pro Thr Pro Asp Phe Gln65 70 75 80Asn Asn Lys Phe Leu Cys Val Leu Asn Arg Gln Gly Thr Arg His Asn85 90 95Asn Tyr Leu Gly Leu Thr Ser Thr Asn Leu Leu Ile Gly Ala Ile Tyr100 105 110Phe Ser Ile Arg His Cys Ile Lys Ala Thr Trp Gln Asn Asp Arg Asp115 120 125Gln Phe Tyr Ala Pro Tyr Asp Asp Ala Phe Gln Asp Asp Ser Glu Phe130 135 140Lys Asn Asn Cys Leu Ala Phe Met Leu Phe His Thr Gln Asn Arg Ile145 150 155 160Thr Ala Thr Gln Gly Thr Asn His Phe Ile Pro Phe Ser Glu Asp Glu165 170 175Val Asp Ser Lys Glu Arg Tyr Leu Ser His Ala Leu Leu Asp Phe Leu180 185 190Lys Gly Glu Ile Lys Glu Pro Lys Lys Ser Asp Ser Leu Phe Leu Asn195 200 205Ala Lys Lys Glu Asn Lys Pro Leu Lys Phe Ser Ser Ser Ala Ser Lys210 215 220Val Phe Asp Ala Gly Arg Glu Ile Tyr Arg Tyr Tyr His Thr Gln Asp225 230 235 240Phe Ile His Thr Pro Tyr Asn Ala Asn Ala Ser Leu Tyr Asp Ile Lys245 250 255Glu Phe Phe Gln Gly Arg Asn Lys Gln Gly Arg Leu Asn Ser Pro Thr260 265 270Lys Ala Lys Asp Glu Tyr Tyr Lys Gln Leu Tyr Ala Asn Leu Gln Tyr275 280 285Ala Leu Lys Asp Leu Ala Lys Glu Ile Gln Pro Lys Val Tyr Glu Tyr290 295 300Gly Phe Leu Arg Glu305(2)INFORMATION FOR SEQ ID NO171
(i)序列特征(A)长度187个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...187(xi)序列描述SEQ ID NO171Leu Glu Thr Tyr Ile Ile Asp Ala Asp Asn Ile Asp Gly Asp Leu Phe1 5 10 15Phe Tyr Asn Leu Thr Arg Asn Ser Asn Asp Phe Ser Met Leu Pro Val20 25 30Phe Glu Leu Asp Arg Ile Ala Gln Lys Ile Arg Asn Ile Leu Lys Lys35 40 45His Gly Ser Arg Lys Asp Ile Ile Leu Lys His Asn Glu Ile Lys Glu50 55 60Ala Phe Phe Ser Pro Phe Lys Pro Gln Leu Lys Thr Val Gln Val Phe65 70 75 80Leu Ser His Ser His Ala Asp Lys Asn Lys Ala Leu Gly Val Lys Asp85 90 95Tyr Leu Glu Ser Lys Thr Lys Arg Lys Val Phe Ile Asp Ser Leu Phe100 105 110Trp Asp Tyr Lys Asp Asp Val Leu Asn Lys Leu Ala Lys His Asp Asp115 120 125Ile Ser Lys Ile Glu Asp Ala Phe Thr Leu Ile Leu Arg Lys Ser Leu130 135 140Gln Asp Met Ile Glu Lys Cys Pro Tyr Phe Val Phe Leu Gln Ser Lys145 150 155 160Asn Ser Val Ser Asn Gln Gly Leu Ser Arg Ile Thr Tyr Ser Ala Trp165 170 175Ile Tyr Glu Glu Leu Lys Ile Ala Ser Phe Tyr180 185(2)INFORMATION FOR SEQ ID NO172(i)序列特征(A)长度198个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...198(xi)序列描述SEQ ID NO172Leu Glu Thr Tyr Ile Ile Asp Ala Asp Asn Ile Asp Gly Asp Leu Phe1 5 10 15Phe Tyr Asn Leu Thr Arg Asn Ser Asn Asp Phe Ser Met Leu Pro Val20 25 30Phe Glu Leu Asp Arg Ile Ala Gln Lys Ile Arg Asn Ile Leu Lys Lys35 40 45His Gly Ser Arg Lys Asp Ile Ile Leu Lys His Asn Glu Ile Lys Glu50 55 60Ala Phe Phe Ser Pro Phe Lys Pro Gln Leu Lys Thr Val Gln Val Phe65 70 75 80Leu Ser His Ser His Ala Asp Lys Asn Lys Ala Leu Gly Val Lys Asp85 90 95Tyr Leu Glu Ser Lys Thr Lys Arg Lys Val Phe Ile Asp Ser Leu Phe100 105 110Trp Asp Tyr Lys Asp Asp Val Leu Asn Lys Leu Ala Lys His Asp Asp115 120 125Ile Ser Lys Ile Glu Asp Ala Phe Thr Leu Ile Leu Arg Lys Ser Leu130 135 140Gln Asp Met Ile Glu Lys Cys Pro Tyr Phe Val Phe Leu Gln Ser Lys145 150 155 160Asn Ser Val Ser Asn Gln Gly Leu Ser Arg Ile Thr Tyr Ser Ala Trp165 170 175Ile Tyr Glu Glu Leu Lys Ile Ala Ser Phe Leu Leu Ala Leu Leu Thr
180 185 190Arg Val Ala Gln Phe Gln195(2)INFORMATION FOR SEQ ID NO173(i)序列特征(A)长度189个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...189(xi)序列描述SEQ ID NO173Met Met Thr Lys Asn Ala Tyr Ala Phe Val Val Ile Glu Lys Ser Ile1 5 10 15Met Val Phe Lys Cys Ala Lys Asp Lys Gly Leu Ile Pro Ile Thr Glu20 25 30Gly Phe Val Pro Leu Lys Glu Gly Phe Leu Arg Ser Phe Lys Glu Arg35 40 45Cys Asn Leu Asp Phe Leu Glu Asn Leu Asp Leu Leu Phe Leu Tyr Asp50 55 60Tyr Gln Phe Pro Ser Glu Val Phe Ser Leu Cys Lys Asp Leu Lys Asn65 70 75 80Ser Ile Trp Asp Arg Lys Leu Val Val Val Leu Val Glu Ala Leu Glu85 90 95Gly Phe Lys Gly Leu Asn Leu Ser Leu Lys Ile Glu Asp Arg His Ser100 105 110Asn Ser Leu Gly Asn Gly Val Gln Lys Leu Leu Thr Asn Ala Asp Leu115 120 125Gly Ser Asn His Lys Pro Ile Val Ile Asp Ser Met Lys Thr Tyr His130 135 140Gln Ser Gln Gln Glu Lys Tyr Lys Arg Glu Arg Gly Glu Thr Leu Glu145 150 155 160Val Arg Pro Thr Thr Pro Pro Ser Tyr Gly Gly Gly Ser Ile Arg Ile165 170 175Ser Gly Asp Lys Lys Pro Asp Ser Asn Glu Glu Asn Phe180 185(2)INFORMATION FOR SEQ ID NO174(i)序列特征(A)长度590个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...590(xi)序列描述SEQ ID NO174Met Lys Ala Ile Lys Ile Leu Leu Ile Met Thr Leu Ser Leu Asn Ala1 5 10 15Ile Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gln Leu Lys20 25 30Gly Glu Leu Thr Pro Lys Ile Val Asp Phe Gly Gly Tyr Lys Ser Asn35 40 45Thr Thr Glu Trp Gly Ala Thr Ala Leu Asn Tyr Ile Asn Ala Ala Asn50 55 60Gly Asp Ala Lys Lys Phe Ser Ala Leu Val Glu Lys Met Arg Phe Asn65 70 75 80Ser Gly Ile Leu Gly Asn Phe Arg Ala His Ala His Leu Arg Gln Ala85 90 95Leu Lys Leu Gln Lys Asn Leu Lys Tyr Cys Leu Lys Ile Ile Ala Arg100 105 110Asp Ser Phe Tyr Ser Tyr Arg Thr Gly Ile Tyr Ile Pro Leu Gly Ile115 120 125Ser Leu Lys Asp Gln Lys Thr Ala Gln Lys Met Leu Ala Asp Leu Ser
130 135 140Val Val Gly Ala Tyr Leu Lys Lys Gln Gln Glu Asn Glu Lys Ala Gln145 150 155 160Ser Pro Tyr Tyr Arg Ser Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro165 170 175Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr180 185 190Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly195 200 205Phe Tyr Pro Asn Met Phe Phe Met Met Gln Val Gln Asp Tyr Leu Met210 215 220Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gln Glu Glu Ile Leu Asp His225 230 235 240Asp Ala Ser Ile Asn Gln Leu Asp Thr Pro Thr Asp Asp Asp Arg Asp245 250 255Asp Lys Asp Asp Lys Ser Ser Gln Pro Ala Asn Leu Met Ser Phe Tyr260 265 270Arg Asp Pro Lys Phe Ser Lys Asp Ile Gln Thr Asn Arg Leu Asn Ser275 280 285Ala Leu Val Asn Leu Asp Asn Ser His Met Leu Lys Asp Asn Ser Leu290 295 300Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala Ile Thr Ser305 310 315 320Gln Ala Lys Glu Leu Asn His Leu Val Gly Gln Ile Lys Glu Met Lys325 330 335Gln Asp Gly Ala Ser Pro Asn Lys Ile Asp Ser Val Val Asn Lys Ala340 345 350Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gln Leu Asp Asn355 360 365Asp Leu Lys Asp Gln Lys Gly Leu Ser Ser Glu Gln Gln Ala Gln Val370 375 380Asp Lys Ala Leu Asp Ser Val Gln Gln Leu Ser His Ser Ser Asp Val385 390 395 400Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys Ile Asp Gly Asp Asp Arg405 410 415Asp Asp Leu Asn Asp Ala Ile Asn Asn Pro Met Gln Gln Pro Ala Gln420 425 430Gln Thr Pro Ile Asn Asn Met Asp Asn Thr His Ala Asn Asp Ser Lys435 440 445Asp Gln Gly Gly Asn Ala Leu Ile Asn Pro Asn Asn Ala Thr Asn Asp450 455 460Asp His Asn Asp Asp His Met Asp Thr Asn Thr Thr Asp Thr Ser Asn465 470 475 480Ala Asn Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly Asn Asn Thr485 490 495Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp Thr Gly Asn Thr500 505 510Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn Asn Gly Asn Asp515 520 525Asp Thr Gly Asn Thr Asn Asp Asp Met Gly Asn Ser Asn Asp Met Gly530 535 540Asp Asp Met Asn Asn Ala Asn Asp Met Asn Asp Asp Met Gly Asn Ser545 550 555 560Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp Asp Met Gly Gly565 570 575Asp Met Gly Asp Met Gly Asp Met Gly Gly Asp Met Gly Asn580 585 590(2)INFORMATION FOR SEQ ID NO175(i)序列特征(A)长度195个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...195(xi)序列描述SEQ ID NO175Leu Asn Leu Arg Leu Ala Gly Ala Ser Val Leu Thr Ala Cys Val Phe1 5 10 15Ser Gly Cys Phe Phe Leu Lys Met Phe Asp Lys Lys Leu Ser Ser Asn20 25 30Asp Trp His Ile Gln Lys Val Glu Met Asn His Gln Val Tyr Asp Ile35 40 45Glu Thr Met Leu Ala Asp Ser Ala Phe Arg Glu His Glu Glu Glu Gln50 55 60Asp Ser Ser Leu Asn Thr Ala Leu Pro Glu Asp Lys Thr Ala Ile Glu65 70 75 80Ala Lys Glu Gln Glu Gln Lys Glu Lys Arg Lys His Trp Tyr Glu Leu85 90 95Phe Lys Lys Lys Pro Lys Pro Lys Ser Ser Met Gly Glu Phe Val Phe100 105 110Asp Gln Lys Glu Asn Arg Ile Tyr Gly Lys Gly Tyr Cys Asn Arg Tyr115 120 125Phe Ala Ser Tyr Thr Trp Gln Gly Asp Arg His Ile Ala Ile Glu Asp130 135 140Ser Gly Ile Ser Arg Lys Val Cys Arg Asp Glu His Leu Met Ala Phe145 150 155 160Glu Leu Glu Phe Met Glu Asn Phe Lys Gly Asn Phe Ala Val Thr Lys165 170 175Gly Lys Asp Thr Leu Ile Leu Asp Asn Gln Lys Met Lys Ile Tyr Leu180 185 190Lys Thr Pro195(2)INFORMATION FOR SEQ ID NO176(i)序列特征(A)长度744个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...744(xi)序列描述SEQ ID NO176Met Leu Lys Leu Ala Ser Lys Thr Ile Cys Leu Ser Leu Ile Ser Ser1 5 10 15Phe Thr Ala Val Glu Ala Phe Gln Lys His Gln Lys Asp Gly Phe Phe20 25 30Ile Glu Ala Gly Phe Glu Thr Gly Leu Leu Gln Gly Thr Gln Thr Gln35 40 45Glu Gln Thr Ile Ala Thr Thr Gln Glu Lys Pro Lys Pro Lys Pro Lys50 55 60Pro Lys Pro Ile Thr Pro Gln Ser Thr Tyr Gly Lys Tyr Tyr Ile Ser65 70 75 80Gln Ser Thr Ile Leu Lys Asn Ala Thr Glu Leu Phe Ala Glu Asp Asn85 90 95Ile Thr Asn Leu Thr Phe Tyr Ser Gln Asn Pro Val Tyr Val Thr Ala100 105 110Tyr Asn Gln Glu Ser Ala Glu Glu Ala Gly Tyr Gly Asn Asn Ser Leu115 120 125Ile Met Ile Gln Asn Phe Leu Pro Tyr Asn Leu Asn Asn Ile Glu Leu130 135 140Ser Tyr Thr Asp Asp Gln Gly Asn Val Val Ser Leu Gly Val Ile Glu145 150 155 160Thr Ile Pro Lys Gln Ser Gln Ile Ile Leu Pro Ala Ser Leu Phe Asn165 170 175Asp Pro Gln Leu Asn Ala Asp Gly Phe Gln Gln Leu Gln Thr Asn Thr180 185 190Thr Arg Phe Ser Asp Ala Ser Thr Gln Asn Leu Phe Asn Lys Leu Ser195 200 205Lys Val Thr Thr Asn Leu Gln Met Thr Tyr Ile Asn Tyr Asn Gln Phe210 215 220Ser Ser Gly Asn Gly Ser Gly Ser Lys Pro Pro Cys Pro Pro Tyr Glu225 230 235 240Asn Gln Ala Asn Cys Val Ala Lys Val Pro Pro Phe Thr Ser Gln Asp245 250 255Ala Lys Asn Leu Thr Asn Leu Met Leu Asn Met Met Ala Val Phe Asp260 265 270Ser Lys Ser Trp Glu Asp Ala Val Leu Asn Ala Pro Phe Gln Phe Ser275 280 285Asp Asn Asn Leu Ser Ala Pro Cys Tyr Ser Asp Tyr Leu Thr Cys Val290 295 300Asn Pro Tyr Asn Asp Gly Leu Val Asp Pro Lys Leu Ile Ala Lys Asn305 310 315 320Lys Gly Asp Glu Tyr Asn Ile Glu Asn Gly Gln Thr Gly Ser Val Ile325 330 335Leu Thr Pro Gln Asp Val Ile Tyr Ser Tyr Arg Val Ala Asn Asn Ile340 345 350Tyr Val Asn Leu Leu Pro Thr Arg Gly Gly Asp Leu Gly Leu Gly Ser355 360 365Gln Tyr Gly Gly Pro Asn Gly Pro Gly Asp Asp Gly Thr Asn Phe Gly
370 375 380Ala Leu Gly Ile Leu Ser Pro Phe Leu Asp Pro Glu Ile Leu Phe Gly385 390 395 400Lys Glu Leu Asn Lys Val Ala Ile Met Gln Leu Arg Asp Ile Ile His405 410 415Glu Tyr Gly His Thr Leu Gly Tyr Thr His Asn Gly Asn Met Thr Tyr420 425 430Gln Arg Val Arg Met Cys Glu Glu Asn Asn Gly Pro Glu Glu Arg Cys435 440 445Gln Gly Gly Arg Ile Glu Gln Val Asp Gly Lys Glu Val Gln Val Phe450 455 460Asp Asn Gly His Glu Val Arg Asp Thr Asp Gly Ser Thr Tyr Asp Val465 470 475 480Cys Ser Arg Phe Lys Asp Lys Pro Tyr Thr Ala Gly Ser Tyr Pro Asn485 490 495Ser Ile Tyr Thr Asp Cys Ser Gln Val Pro Ala Gly Leu Ile Gly Val500 505 510Thr Ser Ala Val Trp Gln Gln Leu Ile Asp Gln Asn Ala Leu Pro Val515 520 525Asp Phe Thr Asn Leu Ser Ser Gln Thr Asn Tyr Leu Asn Ala Ser Leu530 535 540Asn Thr Gln Asp Phe Ala Thr Thr Met Leu Ser Ala Ile Ser Gln Ser545 550 555 560Leu Ser Ser Ser Lys Ser Ser Ala Thr Thr Tyr Arg Thr Ser Lys Thr565 570 575Ser Arg Pro Phe Gly Ala Pro Leu Leu Gly Val Asn Leu Lys Met Gly580 585 590Tyr Gln Lys Tyr Phe Asn Asp Tyr Leu Gly Leu Ser Ser Tyr Gly Ile595 600 605Ile Lys Tyr Asn Tyr Ala Gln Ala Asn Asn Glu Lys Ile Gln Gln Leu610 615 620Ser Tyr Gly Val Gly Met Asp Val Leu Phe Asp Phe Ile Thr Asn Tyr625 630 635 640Thr Asn Glu Lys Asn Pro Lys Ser Asn Leu Thr Lys Lys Val Phe Thr645 650 655Ser Ser Leu Gly Val Phe Gly Gly Leu Arg Gly Leu Tyr Asn Ser Tyr660 665 670Tyr Leu Leu Asn Gln Tyr Lys Gly Ser Gly Asn Leu Asn Val Thr Gly675 680 685Gly Leu Asn Tyr Arg Tyr Lys His Ser Lys Tyr Ser Ile Gly Ile Ser690 695 700Val Pro Leu Val Gln Leu Lys Ser Arg Ile Val Ser Ser Asp Gly Ala705 710 715 720Tyr Thr Asn Ser Ile Thr Leu Asn Glu Gly Gly Ser His Phe Lys Val725 730 735Phe Phe Asn Tyr Gly Trp Ile Phe740(2)INFORMATION FOR SEQ ID NO177(i)序列特征(A)长度529个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...529(xi)序列描述SEQ ID NO177Met Thr Tyr Ile Asn Tyr Asn Gln Phe Ser Ser Gly Asn Gly Ser Gly1 5 10 15Ser Lys Pro Pro Cys Pro Pro Tyr Glu Asn Gln Ala Asn Cys Val Ala20 25 30Lys Val Pro Pro Phe Thr Ser Gln Asp Ala Lys Asn Leu Thr Asn Leu35 40 45Met Leu Asn Met Met Ala Val Phe Asp Ser Lys Ser Trp Glu Asp Ala50 55 60Val Leu Asn Ala Pro Phe Gln Phe Ser Asp Asn Asn Leu Ser Ala Pro65 70 75 80Cys Tyr Ser Asp Tyr Leu Thr Cys Val Asn Pro Tyr Asn Asp Gly Leu85 90 95Val Asp Pro Lys Leu Ile Ala Lys Asn Lys Gly Asp Glu Tyr Asn Ile100 105 110Glu Asn Gly Gln Thr Gly Ser Val Ile Leu Thr Pro Gln Asp Val Ile115 120 125Tyr Ser Tyr Arg Val Ala Asn Asn Ile Tyr Val Asn Leu Leu Pro Thr130 135 140Arg Gly Gly Asp Leu Gly Leu Gly Ser Gln Tyr Gly Gly Pro Asn Gly145 150 155 160Pro Gly Asp Asp Gly Thr Asn Phe Gly Ala Leu Gly Ile Leu Ser Pro165 170 175Phe Leu Asp Pro Glu Ile Leu Phe Gly Lys Glu Leu Asn Lys Val Ala180 185 190Ile Met Gln Leu Arg Asp Ile Ile His Glu Tyr Gly His Thr Leu Gly195 200 205Tyr Thr His Asn Gly Asn Met Thr Tyr Gln Arg Val Arg Met Cys Glu210 215 220Glu Asn Asn Gly Pro Glu Glu Arg Cys Gln Gly Gly Arg Ile Glu Gln225 230 235 240Val Asp Gly Lys Glu Val Gln Val Phe Asp Asn Gly His Glu Val Arg245 250 255Asp Thr Asp Gly Ser Thr Tyr Asp Val Cys Ser Arg Phe Lys Asp Lys260 265 270Pro Tyr Thr Ala Gly Ser Tyr Pro Asn Ser Ile Tyr Thr Asp Cys Ser275 280 285Gln Val Pro Ala Gly Leu Ile Gly Val Thr Ser Ala Val Trp Gln Gln290 295 300Leu Ile Asp Gln Asn Ala Leu Pro Val Asp Phe Thr Asn Leu Ser Ser305 310 315 320Gln Thr Asn Tyr Leu Asn Ala Ser Leu Asn Thr Gln Asp Phe Ala Thr325 330 335Thr Met Leu Ser Ala Ile Ser Gln Ser Leu Ser Ser Ser Lys Ser Ser340 345 350Ala Thr Thr Tyr Arg Thr Ser Lys Thr Ser Arg Pro Phe Gly Ala Pro355 360 365Leu Leu Gly Val Asn Leu Lys Met Gly Tyr Gln Lys Tyr Phe Asn Asp370 375 380Tyr Leu Gly Leu Ser Ser Tyr Gly Ile Ile Lys Tyr Asn Tyr Ala Gln385 390 395 400Ala Asn Asn Glu Lys Ile Gln Gln Leu Ser Tyr Gly Val Gly Met Asp405 410 415Val Leu Phe Asp Phe Ile Thr Asn Tyr Thr Asn Glu Lys Asn Pro Lys420 425 430Ser Asn Leu Thr Lys Lys Val Phe Thr Ser Ser Leu Gly Val Phe Gly435 440 445Gly Leu Arg Gly Leu Tyr Asn Ser Tyr Tyr Leu Leu Asn Gln Tyr Lys450455 460Gly Ser Gly Asn Leu Asn Val Thr Gly Gly Leu Asn Tyr Arg Tyr Lys465 470 475 480His Ser Lys Tyr Ser Ile Gly Ile Ser Val Pro Leu Val Gln Leu Lys
485 490 495Ser Arg Ile Val Ser Ser Asp Gly Ala Tyr Thr Asn Ser Ile Thr Leu500 505 510Asn Glu Gly Gly Ser His Phe Lys Val Phe Phe Asn Tyr Gly Trp Ile515 520 525Phe(2)INFORMATION FOR SEQ ID NO178(i)序列特征(A)长度187个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...187(xi)序列描述SEQ ID NO178Leu Gly Cys Val Ser Met Thr Leu Gly Ile Asp Glu Ala Gly Arg Gly1 5 10 15Cys Leu Ala Gly Ser Leu Phe Val Ala Gly Val Val Cys Asn Glu Lys20 25 30Ile Ala Leu Glu Phe Leu Lys Met Gly Leu Lys Asp Ser Lys Lys Leu35 40 45Ser Pro Lys Lys Arg Phe Phe Leu Glu Asp Lys Ile Lys Thr His Gly50 55 60Glu Val Gly Phe Phe Val Val Lys Lys Ser Ala Asn Glu Ile Asp His65 70 75 80Leu Gly Leu Gly Ala Cys Leu Lys Leu Ala Ile Glu Glu Ile Val Glu85 90 95Asn Gly Cys Ser Leu Ala Asn Glu Ile Lys Ile Asp Gly Asn Thr Ala100 105 110Phe Gly Leu Asn Lys Arg Tyr Pro Asn Ile Gln Thr Ile Ile Lys Gly
115 120 125Asp Glu Thr Ile Ala Gln Ile Ala Met Ala Ser Val Leu Ala Lys Ala130 135 140Ser Lys Asp Arg Glu Met Leu Glu Leu His Ala Leu Phe Lys Glu Tyr145 150 155 160Gly Trp Asp Lys Asn Cys Gly Tyr Gly Thr Lys Gln His Ile Glu Ala165 170 175Ile Asn Lys Leu Gly Ala Thr Leu Ser Ser Ala180 185(2)INFORMATION FOR SEQ ID NO179(i)序列特征(A)长度204个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...204(xi)序列描述SEQ ID NO179Met Thr Leu Gly Ile Asp Glu Ala Gly Arg Gly Cys Leu Ala Gly Ser1 5 10 15Leu Phe Val Ala Gly Val Val Cys Asn Glu Lys Ile Ala Leu Glu Phe20 25 30Leu Lys Met Gly Leu Lys Asp Ser Lys Lys Leu Ser Pro Lys Lys Arg35 40 45Phe Phe Leu Glu Asp Lys Ile Lys Thr His Gly Glu Val Gly Phe Phe50 55 60Val Val Lys Lys Ser Ala Asn Glu Ile Asp His Leu Gly Leu Gly Ala65 70 75 80Cys Leu Lys Leu Ala Ile Glu Glu Ile Val Glu Asn Gly Cys Ser Leu85 90 95Ala Asn Glu Ile Lys Ile Asp Gly Asn Thr Ala Phe Gly Leu Asn Lys
100 105 110Arg Tyr Pro Asn Ile Gln Thr Ile Ile Lys Gly Asp Glu Thr Ile Ala115 120 125Gln Ile Ala Met Ala Ser Val Leu Ala Lys Ala Ser Lys Asp Arg Glu130 135 140Met Leu Glu Leu His Ala Leu Phe Lys Glu Tyr Gly Trp Asp Lys Asn145 150 155 160Cys Gly Tyr Gly Thr Lys Gln His Ile Glu Ala Ile Asn Lys Leu Gly165 170 175Ala Thr Pro Phe His Arg His Ser Phe Thr Leu Lys Asn Arg Ile Leu180 185 190Asn Pro Lys Leu Leu Glu Val Glu Gln Arg Leu Val195 200(2)INFORMATION FOR SEQ ID NO180(i)序列特征(A)长度192个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...192(xi)序列描述SEQ ID NO180Met Asn Ala Leu Lys Lys Leu Ser Phe Cys Ala Leu Leu Ser Leu Gly1 5 10 15Leu Phe Ala Gln Thr Val His Ala Gln His Leu Lys Asp Thr Ile Asn20 25 30Tyr Pro Asp Trp Leu Lys Ile Asn Leu Phe Asp Lys Lys Asn Pro Pro35 40 45Asn Gln Tyr Val Gly Ser Ala Ser Ile Ser Gly Lys Arg Asn Asp Phe50 55 60Tyr Ser Asn Tyr Ile Pro Tyr Asp Asp Lys Leu Pro Pro Glu Lys Asn65 70 75 80Ala Glu Glu Ile Ala Leu Leu Arg Ala Arg Met Asn Ala Tyr Ser Thr85 90 95Leu Glu Ser Ala Leu Leu Thr Lys Met Cys Asn Arg Ile Val Lys Ala100 105 110Leu Gln Val Lys Asn Asn Val Ile Ser His Leu Phe Gly Phe Val Asp115 120 125Phe Leu Thr Ser Lys Ser Ile Leu Ala Lys Arg Phe Val Asp Thr Thr130 135 140Asn His Arg Val Tyr Val Met Val Gln Phe Pro Phe Ile Gln Pro Glu145 150 155 160Asp Leu Ile Ala Tyr Phe Lys Ala Lys Arg Ile Asp Leu Ser Leu Ala165 170 175Ser Ala Thr Asn Leu Ser Ala Ile Leu Asn Lys Ala Leu Phe His Leu180 185 190(2)INFORMATION FOR SEQ ID NO181(i)序列特征(A)长度86个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...86(xi)序列描述SEQ ID NO181Met Asn Ala Leu Lys Lys Leu Ser Phe Cys Ala Leu Leu Ser Leu Gly1 5 10 15Leu Phe Ala Gln Thr Val His Ala Gln His Leu Lys Asp Thr Ile Asn20 25 30Tyr Pro Asp Trp Leu Lys Ile Asn Leu Phe Asp Lys Lys Asn Pro Pro35 40 45Asn Gln Tyr Val Gly Ser Ala Ser Ile Ser Gly Lys Arg Asn Asp Phe
50 55 60Tyr Ser Asn Tyr Ile Pro Tyr Asp Asp Lys Leu Pro Pro Glu Arg Thr65 70 75 80Leu Lys Lys Ser Leu Phe85(2)INFORMATION FOR SEQ ID NO182(i)序列特征(A)长度75个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...75(xi)序列描述SEQ ID NO182Leu Lys Ile Leu Thr Leu Phe Leu Ile Gly Leu Asn Ala Leu Phe Ala1 5 10 15Leu Asp Leu Asn Ala Leu Lys Thr Glu Ile Lys Glu Thr Tyr Leu Lys20 25 30Glu Tyr Lys Asp Leu Lys Leu Glu Ile Glu Thr Ile Asn Leu Glu Ile35 40 45Pro Glu Arg Phe Ser His Ala Ser Ile Leu Ser Tyr Glu Leu Asn Ala50 55 60Ser Asn Lys Leu Lys Lys Asp Gly Ser Cys Phe65 70 75(2)INFORMATION FOR SEQ ID NO183(i)序列特征(A)长度211个氨基酸(B)类型氨基酸(D)拓扑结构线性
(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...211(xi)序列描述SEQ ID NO183Met Phe Ser Ile Ile Leu Gly Gly Gly Gly Gly Asn Thr Pro Cys Gly1 5 10 15Leu Thr Trp Gln His Phe Lys Leu Gly Asp Leu Phe Glu Ile Glu Lys20 25 30Thr Leu Ser Phe Asn Lys Asp Ala Leu Thr Gln Gly Gln Asp Tyr Asp35 40 45Tyr Ile Thr Arg Thr Ser Gln Asn Gln Gly Val Leu Gln Thr Thr Gly50 55 60Phe Val Asn Ala Glu Asn Leu Asn Pro Pro Phe Thr Trp Ser Leu Gly65 70 75 80Leu Leu Gln Met Asp Phe Phe Tyr Arg Lys Lys Ser Trp Tyr Ala Gly85 90 95Gln Phe Met Arg Lys Ile Thr Pro Lys Thr Glu Ile Lys Asn Lys Ile100 105 110Asn Ser Arg Ile Ala His Tyr Phe Thr Thr Leu Leu Asn Ala Leu Lys115 120 125Arg Pro Leu Leu Ser Val Leu Val Arg Asp Ile Asp Lys Thr Phe Arg130 135 140Glu Gln Lys Ile Gln Leu Pro Leu Lys Pro Thr Ala Lys Thr Gln Ser145 150 155 160Leu Asp Gly Ile Asp Phe Asp Phe Met His Thr Leu Ile Asn Ala Leu165 170 175Met Lys Gln Thr Ile Gln Gly Val Val Gln Tyr Cys Asp Ala Lys Ile180 185 190Gln Ala Thr Lys Glu Val Ile Ser Gln Glu Thr Pro Ile Gln Lys Asp195 200 205Ser Leu Phe210(2)INFORMATION FOR SEQ ID NO184(i)序列特征(A)长度406个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...406(xi)序列描述SEQ ID NO184Val Ile Gly Pro Leu Ser Ser Gln Leu Asn Ala Ile Lys Trp Gly Glu1 5 10 15Phe Lys Leu Gly Asp Leu Phe Glu Ala Ser Asn Gly Asp Phe Asp Ile20 25 30Gln Lys Arg His Ile Asn His Lys Gly Glu Phe Val Ile Thr Ala Gly35 40 45Leu Ser Asn Asn Gly Val Leu Gly Gln Ser Asp Ile Lys Ala Lys Val50 55 60Phe Glu Ser His Thr Ile Thr Ile Asp Met Phe Gly Cys Ala Phe Tyr65 70 75 80Arg Ser Phe Ala Tyr Lys Met Val Thr His Ala Arg Val Phe Ser Leu85 90 95Lys Pro Lys Phe Glu Ile Asn His Lys Ile Gly Leu Phe Leu Ser Thr100 105 110Leu Phe Phe Gly Tyr His Lys Lys Phe Gly Tyr Glu Asn Met Cys Ser115 120 125Trp Ala Lys Ile Lys Asn Asp Lys Val Ile Leu Pro Leu Lys Pro Thr130 135 140Ala Asn Thr Gln Thr Leu Glu Gly Ile Asp Phe Asp Phe Met Glu Lys145 150 155 160Phe Ile Ala Glu Leu Glu Gln Cys Arg Leu Ala Glu Leu Gln Ala Tyr165 170 175Leu Lys Ala Thr Gly Leu Glu Asn Thr Thr Leu Ser Asn Asp Glu Glu
180 185 190Asn Ala Leu Asn Val Phe Asn Asn Ser Gly Gly Gly Gly Gly Asn Thr195 200 205Pro Cys Gly Leu Thr Trp Gln His Phe Lys Leu Gly Asp Leu Phe Glu210 215 220Ile Glu Lys Thr Leu Ser Phe Asn Lys Asp Ala Leu Thr Gln Gly Gln225 230 235 240Asp Tyr Asp Tyr Ile Thr Arg Thr Ser Gln Asn Gln Gly Val Leu Gln245 250 255Thr Thr Gly Phe Val Asn Ala Glu Asn Leu Asn Pro Pro Phe Thr Trp260 265 270Ser Leu Gly Leu Leu Gln Met Asp Phe Phe Tyr Arg Lys Lys Ser Trp275 280 285Tyr Ala Gly Gln Phe Met Arg Lys Ile Thr Pro Lys Thr Glu Ile Lys290 295 300Asn Lys Ile Asn Ser Arg Ile Ala His Tyr Phe Thr Thr Leu Leu Asn305 310 315 320Ala Leu Lys Arg Pro Leu Leu Ser Val Leu Val Arg Asp Ile Asp Lys325 330 335Thr Phe Arg Glu Gln Lys Ile Gln Leu Pro Leu Lys Pro Thr Ala Lys340 345 350Thr Gln Ser Leu Asp Gly Ile Asp Phe Asp Phe Met His Thr Leu Ile355 360 365Asn Ala Leu Met Lys Gln Thr Ile Gln Gly Val Val Gln Tyr Cys Asp370 375 380Ala Lys Ile Gln Ala Thr Lys Glu Val Ile Ser Gln Glu Thr Pro Ile385 390 395 400Gln Lys Asp Ser Leu Phe405(2)INFORMATION FOR SEQ ID NO185(i)序列特征(A)长度275个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...275(xi)序列描述SEQ ID NO185Met Ser Lys Ser Leu Tyr Gln Thr Leu Asn Val Ser Glu Asn Ala Ser1 5 10 15Gln Asp Glu Ile Lys Lys Ser Tyr Arg Arg Leu Ala Arg Gln Tyr His20 25 30Pro Asp Leu Asn Lys Thr Lys Glu Ala Glu Glu Lys Phe Lys Glu Ile35 40 45Asn Ala Ala Tyr Glu Ile Leu Ser Asp Glu Glu Lys Arg Arg Gln Tyr50 55 60Asp Gln Phe Gly Asp Asn Met Phe Gly Gly Gln Asn Phe Ser Asp Phe65 70 75 80Ala Arg Ser Arg Gly Pro Ser Glu Asp Leu Asp Asp Ile Leu Ser Ser85 90 95Ile Phe Gly Lys Gly Gly Phe Ser Gln Arg Phe Ser Gln Asn Ser Gln100 105 110Gly Phe Ser Gly Phe Asn Phe Ser Asn Phe Ala Pro Glu Asn Leu Asp115 120 125Val Thr Ala Ile Leu Asn Val Ser Val Leu Asp Thr Leu Leu Gly Asn130 135 140Lys Lys Gln Val Ser Val Asn Asn Glu Thr Phe Ser Leu Lys Ile Pro145 150 155 160Ile Gly Val Glu Glu Gly Glu Lys Ile Arg Val Arg Asn Lys Gly Lys165 170 175Met Gly Arg Thr Gly Arg Gly Asp Leu Leu Leu Gln Ile His Ile Glu180 185 190Glu Asp Glu Met Tyr Arg Arg Glu Lys Asp Asp Ile Ile Gln Ile Phe195 200 205Asp Leu Pro Leu Lys Thr Ala Leu Phe Gly Gly Lys Ile Glu Ile Ala210 215 220Thr Trp His Lys Thr Leu Thr Leu Thr Ile Pro Pro Asn Thr Lys Ala225 230 235 240Met Gln Lys Phe Arg Ile Lys Asp Lys Gly Ile Lys Ser Arg Lys Thr245 250 255Ser His Val Gly Asp Cys Ile Ala Ser Ser Phe Asp Leu Leu Lys Leu260 265 270Lys Arg Phe275(2)INFORMATION FOR SEQ ID NO186(i)序列特征(A)长度278个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...278(xi)序列描述SEQ ID NO186Met Ser Lys Ser Leu Tyr Gln Thr Leu Asn Val Ser Glu Asn Ala Ser1 5 10 15Gln Asp Glu Ile Lys Lys Ser Tyr Arg Arg Leu Ala Arg Gln Tyr His20 25 30Pro Asp Leu Asn Lys Thr Lys Glu Ala Glu Glu Lys Phe Lys Glu Ile35 40 45Asn Ala Ala Tyr Glu Ile Leu Ser Asp Glu Glu Lys Arg Arg Gln Tyr50 55 60Asp Gln Phe Gly Asp Asn Met Phe Gly Gly Gln Asn Phe Ser Asp Phe65 70 75 80Ala Arg Ser Arg Gly Pro Ser Glu Asp Leu Asp Asp Ile Leu Ser Ser85 90 95Ile Phe Gly Lys Gly Gly Phe Ser Gln Arg Phe Ser Gln Asn Ser Gln100 105 110Gly Phe Ser Gly Phe Asn Phe Ser Asn Phe Ala Pro Glu Asn Leu Asp115 120 125Val Thr Ala Ile Leu Asn Val Ser Val Leu Asp Thr Leu Leu Gly Asn130 135 140Lys Lys Gln Val Ser Val Asn Asn Glu Thr Phe Ser Leu Lys Ile Pro145 150 155 160Ile Gly Val Glu Glu Gly Glu Lys Ile Arg Val Arg Asn Lys Gly Lys165 170 175Met Gly Arg Thr Gly Arg Gly Asp Leu Leu Leu Gln Ile His Ile Glu180 185 190Glu Asp Glu Met Tyr Arg Arg Glu Lys Asp Asp Ile Ile Gln Ile Phe195 200 205Asp Leu Pro Leu Lys Thr Ala Leu Phe Gly Gly Lys Ile Glu Ile Ala210 215 220Thr Trp His Lys Thr Leu Thr Leu Thr Ile Pro Pro Asn Thr Lys Ala225 230 235 240Met Gln Lys Phe Arg Ile Lys Asp Lys Gly Ile Lys Ser Arg Lys Thr245 250 255Ser His Val Gly Asp Cys Ile Ala Ser Ser Phe Asp Leu Pro Lys Ile260 265 270Glu Thr Leu Leu Met Ser275(2)INFORMATION FOR SEQ ID NO187(i)序列特征(A)长度232个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...232(xi)序列描述SEQ ID NO187Val Val Gln Lys Phe Asn Phe Tyr Lys Thr Gly Gly Met Arg Leu Lys1 5 10 15His Phe Lys Thr Phe Leu Phe Ile Thr Met Ala Val Ile Val Ile Gly20 25 30Thr Gly Cys Ala Asn Lys Lys Lys Lys Lys Asp Glu Tyr Asn Lys Pro35 40 45Ala Ile Phe Trp Tyr Gln Gly Ile Leu Arg Glu Ile Leu Phe Ala Asn50 55 60Leu Glu Thr Ala Asp Asn Tyr Tyr Ser Ser Leu Gln Ser Glu His Ile65 70 75 80Asn Ser Pro Leu Val Pro Glu Ala Met Leu Ala Leu Gly Gln Ala His85 90 95Met Lys Lys Lys Glu Tyr Val Leu Ala Ser Phe Tyr Phe Asp Glu Tyr100 105 110Ile Lys Arg Phe Gly Thr Lys Asp Asn Val Asp Tyr Leu Thr Phe Leu115 120 125Lys Leu Gln Ser His Tyr Tyr Ala Phe Lys Asn His Ser Lys Asp Gln130 135 140Glu Phe Ile Ser Asn Ser Ile Val Ser Leu Gly Glu Phe Ile Glu Lys145 150 155 160Tyr Pro Asn Ser Arg Tyr Arg Pro Tyr Val Glu Tyr Met Gln Ile Lys165 170 175Phe Ile Leu Gly Gln Asn Glu Leu Asn Arg Ala Ile Ala Asn Val Tyr180 185 190Lys Lys Arg His Lys Pro Glu Gly Val Lys Arg Tyr Leu Glu Arg Ile195 200 205Asp Glu Thr Leu Glu Lys Glu Thr Lys Pro Lys Pro Ser His Met Pro210 215 220Trp Tyr Val Leu Ile Phe Asp Trp225 230(2)INFORMATION FOR SEQ ID NO188(i)序列特征(A)长度114个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...114(xi)序列描述SEQ ID NO188Met Arg Phe Leu Asn Asn Lys His Arg Glu Lys Gly Leu Lys Ala Glu1 5 10 15Glu Glu Ala Cys Gly Phe Leu Lys Thr Leu Gly Phe Glu Met Ile Glu20 25 30Arg Asn Phe Phe Ser Gln Phe Gly Glu Ile Asp Ile Ile Ala Leu Lys35 40 45Lys Gly Val Leu His Phe Ile Glu Val Lys Ser Gly Glu Asn Phe Asp50 55 60Pro Ile Tyr Ala Ile Thr Pro Ser Lys Leu Lys Lys Met Ile Lys Thr65 70 75 80Ile Arg Cys Tyr Leu Ser Gln Lys Asp Pro Asn Ser Asp Phe Cys Ile85 90 95Asp Ala Leu Ile Val Lys Asn Gly Lys Phe Glu Leu Leu Glu Asn Ile100 105 110Thr Phe(2)INFORMATION FOR SEQ ID NO189(i)序列特征(A)长度101个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...101(xi)序列描述SEQ ID NO189Met Gly Ser Ile Gly Ala Met Thr Lys Gly Ser Ser Asp Arg Tyr Phe1 5 10 15Gln Glu Gly Val Ala Ser Glu Lys Leu Val Pro Glu Gly Ile Glu Gly20 25 30Arg Val Pro Tyr Arg Gly Lys Val Ser Asp Met Ile Phe Gln Leu Val35 40 45Gly Gly Val Arg Ser Ser Met Gly Tyr Gln Gly Ala Lys Asn Ile Leu50 55 60Glu Leu Tyr Gln Asn Ala Glu Phe Val Glu Ile Thr Ser Ala Gly Leu65 70 75 80Lys Lys Ser His Val His Gly Val Asp Ile Thr Lys Glu Ala Pro Asn85 90 95Ile Met Gly Glu Phe100(2)INFORMATION FOR SEQ ID NO190(i)序列特征(A)长度481个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...481(xi)序列描述SEQ ID NO190Met Arg Ile Leu Gln Arg Ala Leu Thr Phe Glu Asp Val Leu Met Val1 5 10 15Pro Arg Lys Ser Ser Val Leu Pro Lys Asp Val Ser Leu Lys Ser Arg20 25 30Leu Thr Lys Asn Ile Gly Leu Asn Ile Pro Phe Ile Ser Ala Ala Met35 40 45Asp Thr Val Thr Glu His Lys Thr Ala Ile Ala Met Ala Arg Leu Gly50 55 60Gly Ile Gly Ile Val His Lys Asn Met Asp Ile Gln Thr Gln Val Lys65 70 75 80Glu Ile Thr Lys Val Lys Lys Ser Glu Ser Gly Val Ile Asn Asp Pro85 90 95Ile Phe Ile His Ala His Arg Thr Leu Ala Asp Ala Lys Val Ile Thr100 105 110Asp Asn Tyr Lys Ile Ser Gly Val Pro Val Val Asp Asp Lys Gly Leu115 120 125Leu Ile Gly Ile Leu Thr Asn Arg Asp Val Arg Phe Glu Thr Asp Leu130 135 140Ser Lys Lys Val Gly Asp Val Met Thr Lys Met Pro Leu Val Thr Ala145 150 155 160His Val Gly Ile Ser Leu Asp Glu Ala Ser Asp Leu Met His Lys His165 170 175Lys Ile Glu Lys Leu Pro Ile Val Asp Lys Asp Asn Val Leu Lys Gly180 185 190Leu Ile Thr Ile Lys Asp Ile Gln Lys Arg Ile Glu Tyr Pro Glu Ala195 200 205Asn Lys Asp Asp Phe Gly Arg Leu Arg Val Gly Ala Ala Ile Gly Val210 215 220Gly Gln Leu Asp Arg Ala Glu Met Leu Val Lys Ala Gly Val Asp Ala225 230 235 240Leu Val Leu Asp Ser Ala His Gly His Ser Ala Asn Ile Leu His Thr245 250 255Leu Glu Glu Ile Lys Lys Ser Leu Val Val Asp Val Ile Val Gly Asn260 265 270Val Val Thr Lys Glu Ala Thr Ser Asp Leu Ile Ser Ala Gly Ala Asp275 280 285Ala Val Lys Val Gly Ile Gly Pro Gly Ser Ile Cys Thr Thr Arg Ile290 295 300Val Ala Gly Val Gly Met Pro Gln Val Ser Ala Ile Asp Asn Cys Val305 310 315 320Glu Val Ala Ser Lys Phe Asp Ile Pro Val Ile Ala Asp Gly Gly Ile325 330 335Arg Tyr Ser Gly Asp Val Ala Lys Ala Leu Ala Leu Gly Ala Ser Ser340 345 350Val Met Ile Gly Ser Leu Leu Ala Gly Thr Glu Glu Ser Pro Gly Asp355 360 365Phe Met Ile Tyr Gln Gly Arg Gln Tyr Lys Ser Tyr Arg Gly Met Gly370 375 380Ser Ile Gly Ala Met Thr Lys Gly Ser Ser Asp Arg Tyr Phe Gln Glu385 390 395 400Gly Val Ala Ser Glu Lys Leu Val Pro Glu Gly Ile Glu Gly Arg Val405 410 415Pro Tyr Arg Gly Lys Val Ser Asp Met Ile Phe Gln Leu Val Gly Gly420 425 430Val Arg Ser Ser Met Gly Tyr Gln Gly Ala Lys Asn Ile Leu Glu Leu435 440 445Tyr Gln Asn Ala Glu Phe Val Glu Ile Thr Ser Ala Gly Leu Lys Glu
450 455 460Ser His Val His Gly Val Asp Ile Thr Lys Glu Ala Pro Asn Tyr Tyr465 470 475 480Gly(2)INFORMATION FOR SEQ ID NO191(i)序列特征(A)长度204个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...204(xi)序列描述SEQ ID NO191Met Gln Gly Phe Leu Leu Gln Thr Gln Ser Ile Arg Asp Glu Asp Leu1 5 10 15Ile Val His Val Leu Thr Lys Asn Gln Leu Lys Thr Leu Tyr Arg Phe20 25 30Tyr Gly Lys Arg His Ser Val Leu Asn Val Gly Arg Lys Ile Asp Phe35 40 45Glu Glu Glu Asn Asp Asp Lys Phe Leu Pro Lys Leu Arg Asn Ile Leu50 55 60His Leu Gly Tyr Ile Trp Glu Arg Glu Met Glu Arg Leu Phe Phe Trp65 70 75 80Gln Arg Phe Cys Ala Leu Leu Phe Lys His Leu Glu Gly Val His Ser85 90 95Leu Asp Ser Ile Tyr Phe Asp Thr Leu Asp Asp Gly Ala Ser Lys Leu100 105 110Ser Lys Gln His Pro Leu Arg Val Ile Leu Glu Met Tyr Ala Val Leu115 120 125Leu Asn Phe Glu Gly Arg Leu Gln Ser Tyr Asn Ser Cys Phe Leu Cys
130 135 140Asp Ala Lys Leu Glu Arg Ser Val Ala Leu Ala Gln Gly Phe Ile Leu145 150 155 160Ala His Pro Ser Cys Leu Lys Ala Lys Ser Leu Asp Leu Glu Lys Ile165 170 175Gln Ala Phe Phe Arg Thr Gln Ser Thr Ile Asp Leu Glu Thr Glu Glu180 185 190Val Glu Glu Leu Trp Arg Thr Leu Asn Leu Gly Phe195 200(2)INFORMATION FOR SEQ ID NO192(i)序列特征(A)长度82个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...82(xi)序列描述SEQ ID NO192Met Gly Val Gly Arg Val Gly Asn Met Ala Leu Leu Ala Cys Ala Gly1 5 10 15Pro Met Gly Ile Gly Ala Ile Ala Ile Ala Ile Asn Gly Gly Arg Gln20 25 30Arg Ser Arg Met Leu Val Val Asp Ile Asp Asp Lys Arg Leu Glu Gln35 40 45Val Gln Lys Met Leu Pro Gly Asn Trp Arg Pro Val Thr Ala Leu Ser50 55 60Trp Cys Leu Cys Ile Pro Lys Arg Gly Ala Ile Arg Ala Arg Cys Cys65 70 75 80Glu Arg(2)INFORMATION FOR SEQ ID NO193(i)序列特征(A)长度67个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...67(xi)序列描述SEQ ID NO193Leu Ser Gly Thr Ala Val Ser Cys Arg Cys Thr Cys Arg Ile Gln Leul 5 10 15Val Leu Val Arg Thr Ser Ile Pro Val Val Ile Gly Cys Ser Cys Pro20 25 30Phe Leu Ser Ser Ile Gly Phe Thr Thr Gly Thr His Gln Ser Pro Val35 40 45Lys Arg Cys Gly Val Asn Ala Gly Lys Thr Pro Ser Lys Lys His Leu50 55 60His Leu Asn65(2)INFORMATION FOR SEQ ID NO194(i)序列特征(A)长度114个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(iii)假说是(vi)原始来源
(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...114(xi)序列描述SEQ ID NO194Val Trp Leu Ala Ala Leu Gly Phe Leu Ile Thr Ala Val Gly Leu Pro1 5 10 15Val Ile Thr Val Ile Ala Leu Ala Lys Val Gly Gly Ser Ser Thr Pro20 25 30Ser Ala Ile Arg Ser Ala Gly Met Pro Ala Ala Cys Trp Arg Arg Ser35 40 45Ala Thr Trp Arg Ser Ala Arg Cys Ser Pro Phe Arg Ala Pro Pro Arg50 55 60Cys Pro Ser Lys Val Ser Val Val Pro Leu Leu Gly Glu Glu Ala Ala65 70 75 80Arg Arg Cys Ser Ser Thr Ala Trp Arg Thr Ser Ser Ser Pro Trp Pro85 90 95Ser Pro Ser Thr Pro Val Ala Cys Trp Thr Pro Ser Asp Ala Ser Ser100 105 110Pro Arg(2)INFORMATION FOR SEQ ID NO195(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征
(A)名称/关键词misc_特征(B)位置1...20(xi)序列描述SEQ ID NO195TATACCATGG TGGGCGCTAA 20(2)INFORMATION FOR SEQ ID NO196(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO196ATGAATTCGA GTAAGGATTT TTG 23(2)INFORMATION FOR SEQ ID NO197(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO197TTAACCATGG TGAAAAGCGA TA 22(2)INFORMATION FOR SEQ ID NO198(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO198TAGAATTCGC ATAACGATCA ATC 23(2)INFORMATION FOR SEQ ID NO199(i)序列特征(A)长度22个碱基对
(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO199ATATCCATGG TGAGTTTGAT GA22(2)INFORMATION FOR SEQ ID NO200(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO200ATGAATTCAA TTTTTTATTT TGCCA 25(2)INFORMATION FOR SEQ ID NO201(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(ii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...21(xi)序列描述SEQ ID NO201AATTCCATGG TGGGGGCTAT G 21(2)INFORMATION FOR SEQ ID NO202(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源
(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO202ATGAATTCTC GATAGCCAAA ATC 23(2)INFORMATION FOR SEQ ID NO203(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO203AATTCCATGG TGCATAACTT CCATT25(2)INFORMATION FOR SEQ ID NO204(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状
(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO204AAGAATTCTC TAGCATCCAA ATGGA 25(2)INFORMATION FOR SEQ ID NO205(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...24(xi)序列描述SEQ ID NO205ATTTCCATGG TCATGTCTCA TATT24(2)INFORMATION FOR SEQ ID NO206
(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO206ATGAATTCCA TCTTTTATTC CAC23(2)INFORMATION FOR SEQ ID NO207(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征
(B)位置1...27(xi)序列描述SEQ ID NO207AACCATGGTG ATTTTAAGCA TTGAAAG 27(2)INFORMATION FOR SEQ ID NO208(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...28(xi)序列描述SEQ ID NO208AAGAATTCCA CTCAAAATTT TTTAACAG 28(2)INFORMATION FOR SEQ ID NO209(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO209GATCATCCAT ATGTTATCTT CTAAT 25(2)INFORMATION FOR SEQ ID NO210(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO210TGAATTCAAC CATTTTAACC CTG 23(2)INFORMATION FOR SEQ ID NO211(i)序列特征(A)长度27个碱基对(B)类型核酸
(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...27(xi)序列描述SEQ ID NO211TATACCATGG TGAAATTTTT TCTTTTA 27(2)INFORMATION FOR SEQ ID NO212(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO212AGAATTCAAT TGCGTCTTGT AAAAG 25(2)INFORMATION FOR SEQ ID NO213(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...24(xi)序列描述SEQ ID NO213TATACCATGG TGATGGACAA ACTC24(2)INFORMATION FOR SEQ ID NO214(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO214ATGAATTCCC ACTTGGGGCG ATA 23(2)INFORMATION FOR SEQ ID NO215(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO215TTATGGATCC AAACCAATTA AAACT25(2)INFORMATION FOR SEQ ID NO216(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO216TATCTCGAGT TATAGAGAAG GGC 23(2)INFORMATION FOR SEQ ID NO217(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO217TTAACCATGG TGAAAAGCGA TA 22(2)INFORMATION FOR SEQ ID NO218
(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...24(xi)序列描述SEQ ID NO218TAGAATTCGC CTCTAAAACT TTAG24(2)INFORMATION FOR SEQ ID NO219(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22
(xi)序列描述SEQ ID NO219TTAACCATGG TGAAAAGCGA TA 22(2)INFORMATION FOR SEQ ID NO220(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO220TAGAATTCGC ATAACGATCA ATC23(2)INFORMATION FOR SEQ ID NO221(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO221ATATCCATGG TGAGTTTGAT GA 22(2)INFORMATION FOR SEQ ID NO222(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO222ATGAATTCAA TTTTTTATTT TGCCA 25(2)INFORMATION FOR SEQ ID NO223(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链
(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO223AATTCCATGG CTATCCAAAT CCG 23(2)INFORMATION FOR SEQ ID NO224(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO224ATGAATTCGC CAAAATCGTA GTATT25(2)INFORMATION FOR SEQ ID NO225(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...24(xi)序列描述SEQ ID NO225GATACCATGG AATTTATGAA AAAG 24(2)INFORMATION FOR SEQ ID NO226(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO226TGAATTCGAA AAAGTGTAGT TATAC25(2)INFORMATION FOR SEQ ID NO227(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...19(xi)序列描述SEQ ID NO227CCCTTCATTT TAGAAATCG 19(2)INFORMATION FOR SEQ ID NO228(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...20(xi)序列描述SEQ ID NO228ATTTCAACCA ATTCAATGCG 20(2)INFORMATION FOR SEQ ID NO229(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...20(xi)序列描述SEQ ID NO229GCCCCTTTTG ATTTGAAGCT 20(2)INFORMATION FOR SEQ ID NO230(i)序列特征
(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO230TCGCTCCAAG ATACCAAGAA GT22(2)INFORMATION FOR SEQ ID NO231(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22
(xi)序列描述SEQ ID NO231CTTGAATTAG GGGCAAAGAT CG 22(2)INFORMATION FOR SEQ ID NO232(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO232ATGCGTTTTT ACCCAAAGAA GT22(2)INFORMATION FOR SEQ ID NO233(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO233ATAACGCCAC TTCCTTATTG GT22(2)INFORMATION FOR SEQ ID NO234(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...19(xi)序列描述SEQ ID NO234CTTTGGGTAA AAACGCATC19(2)INFORMATION FOR SEQ ID NO235(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状
(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...20(xi)序列描述SEQ ID NO235CGATCTTTGA TCCTAATTCA 20(2)INFORMATION FOR SEQ ID NO236(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...19(xi)序列描述SEQ ID NO236ATCAAGTTGC CTATGCTGA19(2)INFORMATION FOR SEQ ID NO237(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO237TTGAACACTT TTGATTATGC GG 22(2)INFORMATION FOR SEQ ID NO238(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征
(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO238GGATTATGCG ATTGTTTTAC AAG 23(2)INFORMATION FOR SEQ ID NO239(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...21(xi)序列描述SEQ ID NO239GTCTTTAGCA AAAATGGCGT C 21(2)INFORMATION FOR SEQ ID NO240(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...21(xi)序列描述SEQ ID NO240AATGAGCGTA AGAGAGCCTT C 21(2)INFORMATION FOR SEQ ID NO241(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...18(xi)序列描述SEQ ID NO241CTTATGGGGG TATTGTCA18(2)INFORMATION FOR SEQ ID NO242(i)序列特征(A)长度18个碱基对
(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...18(xi)序列描述SEQ ID NO242AGCATGTGGG TATCCAGC 18(2)INFORMATION FOR SEQ ID NO243(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...19(xi)序列描述SEQ ID NO243AGGTTGTTGC CTAAAGACT19(2)INFORMATION FOR SEQ ID NO244(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...18(xi)序列描述SEQ ID NO244CTGCCTCCAC CTTTGATC 18(2)INFORMATION FOR SEQ ID NO245(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源
(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...19(xi)序列描述SEQ ID NO245ACCAATATCA ATTGGCACT 19(2)INFORMATION FOR SEQ ID NO246(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...18(xi)序列描述SEQ ID NO246ACTTGGAAAA GCTCTGCA 18(2)INFORMATION FOR SEQ ID NO247(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状
(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...19(xi)序列描述SEQ ID NO247CTTGCTTGTC ATATCTAGC 19(2)INFORMATION FOR SEQ ID NO248(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...18(xi)序列描述SEQ ID NO248GTTGAAGTGT TGGTGCTA 18(2)INFORMATION FOR SEQ ID NO249
(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...22(xi)序列描述SEQ ID NO249CAAGCAAGTG GTTTGGTTTT AG 22(2)INFORMATION FOR SEQ ID NO250(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征
(B)位置1...22(xi)序列描述SEQ ID NO250TGGAAAGAGC AAATCATTGA AG22(2)INFORMATION FOR SEQ ID NO251(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...21(xi)序列描述SEQ ID NO251GCCCATAATC AAAAAGCCCA T 21(2)INFORMATION FOR SEQ ID NO252(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质
(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...24(xi)序列描述SEQ ID NO252CTAAAACCAA ACCACTTGCT TGTC 24(2)INFORMATION FOR SEQ ID NO253(i)序列特征(A)长度16个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...16(xi)序列描述SEQ ID NO253GTAAAACGAC GGCCAG 16(2)INFORMATION FOR SEQ ID NO254(i)序列特征(A)长度17个碱基对(B)类型核酸
(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...17(xi)序列描述SEQ ID NO254CAGGAAACAG CTATGAC 17(2)INFORMATION FOR SEQ ID NO255(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...21(xi)序列描述SEQ ID NO255ATCTTACCTA TCACCTCAAA T21(2)INFORMATION FOR SEQ ID NO256(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...21(xi)序列描述SEQ ID NO256AGACAGCAAC ATCTTTGTGA A21(2)INFORMATION FOR SEQ ID NO257(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...50(xi)序列描述SEQ ID NO257CGCGGATCCA TATGGCTGAA AAAACGCCTT TTTTTAAAAC TAAAAACCAC50(2)INFORMATION FOR SEQ ID NO258(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...34(xi)序列描述SEQ ID NO258CCGGAATTCA TCAGTATTCA ATGGGAATAA AGCC 34(2)INFORMATION FOR SEQ ID NO259(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...50(xi)序列描述SEQ ID NO259CGCGGATCCA TATGAAAGAA GAAGAAAAAG AAGAAAAAAA GACAGAAAGG50(2)INFORMATION FOR SEQ ID NO260(i)序列特征(A)长度37个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...37(xi)序列描述SEQ ID NO260CCGGAATTCG CTTAAAAGAA AATAGTCCCC CAAACGC 37(2)INFORMATION FOR SEQ ID NO261
(i)序列特征(A)长度43个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...43(xi)序列描述SEQ ID NO261CGCGGATCCA TATGAAAGAG GTCATTCCCA CCCCTTCAAC CCC43(2)INFORMATION FOR SEQ ID NO262(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...36
(xi)序列描述SEQ ID NO262CCGGAATTCA TATAAATATC ATATAGGCAG AAAAAC36(2)INFORMATION FOR SEQ ID NO263(i)序列特征(A)长度37个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...37(xi)序列描述SEQ ID NO263CGCGGATCCA TATGGAGGCA GAGCTTGATG AAAAATC37(2)INFORMATION FOR SEQ ID NO264(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质
(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...36(xi)序列描述SEQ ID NO264CCGGAATTCG ATTGATTTTG TCAAATCTAA AATCCC36(2)INFORMATION FOR SEQ ID NO265(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO265TATTATACAT ATGGAAGAAG ATGGG 25(2)INFORMATION FOR SEQ ID NO266(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型双链
(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...23(xi)序列描述SEQ ID NO266TAATCTCGAG TTTAGAAGGC GTA23(2)INFORMATION FOR SEQ ID NO267(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...25(xi)序列描述SEQ ID NO267TTATATTCAT ATGGAAGACG ATGGC 25(2)INFORMATION FOR SEQ ID NO268(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...24(xi)序列描述SEQ ID NO268AATTCTCGAG CCTCTTTATA AGCC 24(2)INFORMATION FOR SEQ ID NO269(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌
(ix)特征(A)名称/关键词misc_特征(B)位置1...46(xi)序列描述SEQ ID NO269CGCGGATCCA TATGGTAGAA GCCTTTCAAA AACACCAAAA AGACGG 46(2)INFORMATION FOR SEQ ID NO270(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...32(xi)序列描述SEQ ID NO270CCGGAATTCG GAGCCAATAG GGAGCTAAAG CC 32(2)INFORMATION FOR SEQ ID NO271(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)
(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...31(xi)序列描述SEQ ID NO271CGGGATCCGA AGGTGATGGT GTTTATATAG G 31(2)INFORMATION FOR SEQ ID NO272(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...32(xi)序列描述SEQ ID NO272CGCATATGGA AGGTGATGGT GTTTATATAG GG32(2)INFORMATION FOR SEQ ID NO273(i)序列特征
(A)长度37个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...37(xi)序列描述SEQ ID NO273GCGAATTCTC ACTCTTTCCA ATAGTTTGCT GCAGAGC37(2)INFORMATION FOR SEQ ID NO274(i)序列特征(A)长度37个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...37
(xi)序列描述SEQ ID NO274CCGGAATTCT TAATCCCGTT TCAAATGGTA ATAAAGG 37(2)INFORMATION FOR SEQ ID NO275(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型双链(D)拓扑结构环状(ii)分子类型DNA(基因组)(iii)假说蛋白质(iv)反义蛋白质(vi)原始来源(A)生物幽门螺杆菌(ix)特征(A)名称/关键词misc_特征(B)位置1...36(xi)序列描述SEQ ID NO275GCGAATTCCC TTTTATTTAA AAAGTGTAGT TATACC 3权利要求
1.其包含的核苷酸序列编码幽门螺杆菌多肽的分离的核酸,其中所述幽门螺杆菌多肽与选自SEQ ID NO98-SEQ ID NO194的氨基酸序列至少约60%同源。
2.分离的核酸,包含编码选自SEQ ID NO98-SEQ ID NO194的幽门螺杆菌多肽的核苷酸序列。
3.编码幽门螺杆菌多肽的分离的核酸,包含与选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列的同源性至少为约60%的核苷酸序列。
4.权利要求1的分离的核酸,包含选自SEQ ID NO1-SEQ IDNO97的核苷酸序列或其互补序列的核苷酸序列。
5.编码幽门螺杆菌多肽的分离核酸分子,包含一种核苷酸序列,该序列在严格杂交条件下与包含选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列的核酸分子杂交。
6.分离的核酸,包含长度至少为8个核苷酸的核苷酸序列,其中所述序列在严格杂交条件下与其核苷酸序列选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列的核酸杂交。
7.其包含的核苷酸序列编码幽门螺杆菌胞外被膜多肽或其片段的分离核酸,所述核酸选自SEQ ID NO63、SEQ ID NO7、SEQID NO8、SEQ ID NO9、SEQ ID NO13、SEQ ID NO14、SEQID NO23、SEQ ID NO24、SEQ ID NO27、SEQ ID NO28、SEQ ID NO50、SEQ ID NO51、SEQ ID NO61、SEQ ID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ IDNO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQID NO26、SEQ ID NO36、SEQ ID NO42、SEQ ID NO52、SEQ ID NO22、SEQ ID NO29、SEQ ID NO30、SEQ ID NO65、SEQ ID NO66、SEQ ID NO48、SEQ ID NO49、SEQ IDNO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO43、SEQID NO44、SEQ ID NO38、SEQ ID NO39、SEQ ID NO1、SEQ ID NO2、SEQ ID NO6、SEQ ID NO34、SEQ ID NO35、SEQ ID NO60、SEQ ID NO69和SEQ ID NO83或其互补物。
8.权利要求7的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为由包含SEQ ID NO63的核苷酸序列或其互补物的幽门螺杆菌鞭毛相关多肽或其片段。
9.权利要求7的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补物编码的幽门螺杆菌内膜多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO43、SEQ ID NO44、SEQ ID NO38和SEQ ID NO39。
10.权利要求9的分离核酸,其中所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸或其互补物编码的参与转运的幽门螺杆菌多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO43和SEQ IDNO44。
11.权利要求7的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补物编码的幽门螺杆菌外膜多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO27、SEQ ID NO28、SEQ ID NO50、SEQ ID NO51、SEQ ID NO61、SEQ ID NO79、SEQ ID NO80、SEQ IDNO84、SEQ ID NO85、SEQ ID NO91、SEQ ID NO94、SEQID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ ID NO52、SEQ ID NO22、SEQ ID NO29、SEQ ID NO30、SEQ ID NO65和SEQ ID NO66。
12.权利要求11的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补物编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO26、SEQ IDNO27、SEQ ID NO28、SEQ ID NO42、SEQ ID NO50、SEQID NO51、SEQ ID NO52、SEQ ID NO61、SEQ ID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91和SEQ ID NO94。
13.权利要求12的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补物编码的具有一个末端苯丙氨酸残基和C末端酪氨酸簇的幽门螺杆菌多肽或其片段SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42和SEQ IDNO52。
14.其包含的核苷酸序列编码幽门螺杆菌胞外被膜多肽或其片段的分离核酸,其中所述多肽选自SEQ ID NO160、SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQID NO111、SEQ ID NO120、SEQ ID NO121、SEQ ID NO124、SEQ ID NO125、SEQ ID NO147、SEQ ID NO148、SEQID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQ ID NO182、SEQ ID NO188、SEQ ID NO191、SEQID NO102、SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139、SEQ ID NO149、SEQ ID NO119、SEQID NO126、SEQ ID NO127、SEQ ID NO162、SEQ ID NO163、SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQ ID NO135、SEQ ID NO136、SEQ ID NO98、SEQID NO99、SEQ ID NO103、SEQ ID NO131、SEQ ID NO132、SEQ ID NO157、SEQ ID NO166和SEQ ID NO180。
15.权利要求14的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为包含SEQ ID NO160氨基酸序列的幽门螺杆菌鞭毛相关多肽或其片段。
16.权利要求14的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌内膜多肽或其片段SEQID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQID NO135和SEQ ID NO136。
17.权利要求16的分离核酸,其中所述幽门螺杆菌内膜多肽或其片段为选自以下的、参与转运的一种幽门螺杆菌多肽或其片段SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140和SEQ ID NO141。
18.权利要求14的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段SEQID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQ ID NO121、SEQID NO124、SEQ ID NO125、SEQ ID NO147、SEQ ID NO148、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQID NO181、SEQ ID NO182、SEQ ID NO188、SEQ ID NO191、SEQ ID NO102、SEQ ID NO108、SEQ ID NO123、SEQID NO133、SEQ ID NO139、SEQ ID NO149、SEQ ID NO119、SEQ ID NO126、SEQ ID NO127、SEQ ID NO162和SEQID NO163。
19.权利要求18的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO108、SEQ ID NO110、SEQ ID NO111、SEQID NO120、SEQ ID NO121、SEQ ID NO123、SEQ ID NO124、SEQ ID NO125、SEQ ID NO133、SEQ ID NO139、SEQID NO147、SEQ ID NO148、SEQ ID NO149、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQID NO182、SEQ ID NO188和SEQ ID NO191。
20.权利要求19的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139和SEQ ID NO149。
21.其包含的核苷酸序列编码幽门螺杆菌胞质多肽或其片段的分离核酸,所述核酸选自SEQ ID NO57、SEQ ID NO58、SEQID NO86、SEQ ID NO87、SEQ ID NO88、SEQ ID NO89、SEQ ID NO92、SEQ IDNO93或其互补序列。
22.权利要求21的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,所述核酸选自SEQ ID NO57和SEQ ID NO58或其互补序列。
23.权利要求21的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,所述核酸选自SEQ ID NO86和SEQ ID NO87或其互补序列。
24.其包含的核苷酸序列编码幽门螺杆菌胞质多肽或其片段的分离核酸,其中所述多肽选自SEQ ID NO154、SEQ ID NO155、SEQ ID NO183、SEQ ID NO184、SEQ ID NO185、SEQID NO186、SEQ ID NO189和SEQ ID NO190。
25.权利要求24的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO154和SEQ ID NO155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
26.权利要求24的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO183和SEQ ID NO184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
27.其包含的核苷酸序列编码幽门螺杆菌分泌多肽或其片段的分离核酸,所述核酸选自SEQ ID NO3、SEQ ID NO4、SEQ IDNO10、SEQ ID NO12、SEQ ID NO20、SEQ ID NO25、SEQID NO31、SEQ ID NO32、SEQ ID NO45、SEQ ID NO46、SEQ ID NO53、SEQ ID NO64、SEQ ID NO67、SEQ ID NO70、SEQ ID NO77、SEQ ID NO78、SEQ ID NO81、SEQ IDNO82、SEQ ID NO90、SEQ ID NO95和SEQ ID NO97或其互补序列。
28.分离的核酸,其包含的核苷酸序列编码选自以下的幽门螺杆菌分泌多肽或其片段SEQ ID NO100、SEQ ID NO101、SEQ IDNO107、SEQ ID NO109、SEQ ID NO117、SEQ ID NO122、SEQ ID NO128、SEQ ID NO129、SEQ ID NO142、SEQ ID NO143、SEQ ID NO150、SEQ ID NO161、SEQ ID NO164、SEQID NO167、SEQ ID NO174、SEQ ID NO175、SEQ ID NO178、SEQ ID NO179、SEQ ID NO187、SEQ ID NO192和SEQID NO194。
29.其包含的核苷酸序列编码幽门螺杆菌细胞多肽或其片段的分离核酸,所述核酸选自SEQ ID NO15、SEQ ID NO16、SEQID NO21、SEQ ID NO33、SEQ ID NO37、SEQ ID NO40、SEQ ID NO41、SEQ ID NO47、SEQ ID NO54、SEQ ID NO55、SEQ ID NO56、SEQ ID NO59、SEQ ID NO62、SEQ IDNO68、SEQ ID NO71、SEQ ID NO72、SEQ ID NO73、SEQID NO74、SEQ ID NO75、SEQ ID NO76和SEQ ID NO96或其互补序列。
30.其包含的核苷酸序列编码幽门螺杆菌细胞多肽或其片段的分离核酸,其中所述多肽选自SEQ ID NO112、SEQ ID NO113、SEQ ID NO118、SEQ ID NO130、SEQ ID NO134、SEQID NO137、SEQ ID NO138、SEQ ID NO144、SEQ ID NO151、SEQ ID NO152、SEQ ID NO153、SEQ ID NO156、SEQID NO159、SEQ ID NO165、SEQ ID NO168、SEQ ID NO169、SEQ ID NO170、SEQ ID NO171、SEQ ID NO172、SEQID NO173和SEQ ID NO193。
31.探针,包含由选自SEQ ID NO1-SEQ ID NO97的核苷酸序列或其互补序列的至少8个核苷酸组成的核苷酸序列。
32.重组表达载体,包含操作性连接于转录调节序列的权利要求1、2、3、4、5、6、7、14、21、24、27、28、29或30中任一项的核酸。
33.包含权利要求32的重组表达载体的细胞。
34.生产幽门螺杆菌多肽的方法,包括在允许表达所述多肽的条件下培养权利要求33的细胞。
35.权利要求34的方法,还包括从所述细胞纯化所述多肽。
36.检测样品中螺杆菌属核酸存在的方法,包括(a)使样品与权利要求6或31中任一项的核酸接触,使得在所述探针和样品中螺杆菌属核酸之间形成杂交物;以及(b)检测步骤(a)中形成的杂交物,其中检测到杂交物表明所述样品中存在螺杆菌属核酸。
37.分离的幽门螺杆菌多肽,其包含的氨基酸序列与选自SEQID NO98-SEQ ID NO194的幽门螺杆菌多肽的同源性至少为60%。
38.分离的幽门螺杆菌多肽,所述多肽由其包含的核苷酸序列与选自SEQ ID NO1-SEQ ID NO97的核苷酸序列至少约60%同源的核酸编码。
39.权利要求28的分离的幽门螺杆菌多肽,其中所述多肽由选自SEQ ID NO1-SEQ ID NO97的核苷酸序列编码。
40.分离的幽门螺杆菌多肽,所述多肽由在严格条件下与选自SEQ ID NO1-SEQ ID NO97的核酸或其互补序列杂交的核酸编码。
41.分离的幽门螺杆菌多肽,包含选自SEQ ID NO97-SEQ IDNO194的氨基酸序列。
42.分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽选自SEQ ID NO160、SEQ ID NO104、SEQ ID NO105、SEQ IDNO106、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQ ID NO121、SEQ ID NO124、SEQ ID NO125、SEQ ID NO147、SEQ ID NO148、SEQ ID NO158、SEQ ID NO176、SEQID NO177、SEQ ID NO181、SEQ ID NO182、SEQ ID NO188、SEQ ID NO191、SEQ ID NO102、SEQ ID NO108、SEQID NO123、SEQ ID NO133、SEQ ID NO139、SEQ ID NO149、SEQ ID NO119、SEQ ID NO126、SEQ ID NO127、SEQID NO162、SEQ ID NO163、SEQ ID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQID NO140、SEQ ID NO141、SEQ ID NO135、SEQ ID NO136、SEQ ID NO98、SEQ ID NO99、SEQ ID NO103、SEQ IDNO131、SEQ ID NO132、SEQ ID NO157、SEQ ID NO166和SEQ ID NO180。
43.权利要求42的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为包含SEQ ID NO160氨基酸序列的一种幽门螺杆菌鞭毛相关多肽或其片段。
44.权利要求43的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌内膜多肽或其片段SEQID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140、SEQ ID NO141、SEQID NO135、SEQ ID NO136。
45.权利要求44的分离多肽,其中所述幽门螺杆菌内膜多肽或其片段为参与转运、选自以下的一种幽门螺杆菌多肽或其片段SEQID NO145、SEQ ID NO146、SEQ ID NO114、SEQ ID NO115、SEQ ID NO116、SEQ ID NO140和SEQ ID NO141。
46.权利要求43的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段SEQID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO110、SEQ ID NO111、SEQ ID NO120、SEQ ID NO121、SEQID NO124、SEQ ID NO125、SEQ ID NO147、SEQ ID NO148、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQID NO181、SEQ ID NO182、SEQ ID NO188、SEQ ID NO191、SEQ ID NO102、SEQ ID NO108、SEQ ID NO123、SEQID NO133、SEQ ID NO139、SEQ ID NO149、SEQ ID NO119、SEQ ID NO126、SEQ ID NO127、SEQ ID NO162和SEQID NO163。
47.权利要求46的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO104、SEQ ID NO105、SEQ ID NO106、SEQ ID NO108、SEQ ID NO110、SEQ ID NO111、SEQID NO120、SEQ ID NO121、SEQ ID NO123、SEQ ID NO124、SEQ ID NO125、SEQ ID NO133、SEQ ID NO139、SEQID NO147、SEQ ID NO148、SEQ ID NO149、SEQ ID NO158、SEQ ID NO176、SEQ ID NO177、SEQ ID NO181、SEQID NO182、SEQ ID NO188和SEQ ID NO191。
48.权利要求47的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段SEQ ID NO108、SEQ ID NO123、SEQ ID NO133、SEQ ID NO139和SEQ ID NO149。
49.分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽由选自以下的核酸编码SEQ ID NO63、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ ID NO27、SEQ ID NO28、SEQ IDNO50、SEQ ID NO51、SEQ ID NO61、SEQ ID NO79、SEQID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ ID NO52、SEQ IDNO22、SEQ ID NO29、SEQ ID NO30、SEQ ID NO65、SEQID NO66、SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO43、SEQ ID NO44、SEQ ID NO38、SEQ ID NO39、SEQ ID NO1、SEQ ID NO2、SEQ ID NO6、SEQ ID NO34、SEQ ID NO35、SEQ ID NO60、SEQ ID NO69和SEQ ID NO83。
50.权利要求49的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为由包含SEQ ID NO63的核苷酸序列的核酸编码的幽门螺杆菌鞭毛相关多肽或其片段。
51.权利要求49的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌内膜多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO43、SEQ ID NO44、SEQID NO38和SEQ ID NO39。
52.权利要求51的分离多肽,其中所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸编码的参与转运的幽门螺杆菌多肽或其片段SEQ ID NO48、SEQ ID NO49、SEQ ID NO17、SEQ IDNO18、SEQ ID NO19、SEQ ID NO43和SEQ ID NO44。
53.权利要求49的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌外膜多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13、SEQ ID NO14、SEQ ID NO23、SEQ ID NO24、SEQ IDNO27、SEQ ID NO28、SEQ ID NO50、SEQ ID NO51、SEQID NO61、SEQ ID NO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQ ID NO91、SEQ ID NO94、SEQ ID NO5、SEQ ID NO11、SEQ ID NO26、SEQ ID NO36、SEQ ID NO42、SEQ ID NO52、SEQ ID NO22、SEQ ID NO29、SEQ IDNO30、SEQ ID NO65和SEQ ID NO66。
54.权利要求53的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段SEQ ID NO7、SEQ ID NO8、SEQ IDNO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO14、SEQID NO23、SEQ ID NO24、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28、SEQ ID NO36、SEQ ID NO42、SEQ ID NO50、SEQ ID NO51、SEQ ID NO52、SEQ ID NO61、SEQ IDNO79、SEQ ID NO80、SEQ ID NO84、SEQ ID NO85、SEQID NO91和SEQ ID NO94。
55.权利要求54的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基和C末端酪氨酸簇的幽门螺杆菌多肽或其片段SEQ ID NO11、SEQID NO26、SEQ ID NO36、SEQ ID NO42和SEQ ID NO52。
56.分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽选自SEQ ID NO154、SEQ ID NO155、SEQ ID NO183、SEQ ID NO184、SEQ ID NO185、SEQ ID NO186、SEQ ID NO189和SEQID NO190。
57.权利要求56的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO154和SEQ ID NO155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
58.权利要求56的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO183和SEQ ID NO184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
59.分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽由选自以下的核酸编码SEQ ID NO57、SEQ ID NO58、SEQ ID NO86、SEQ ID NO87、SEQ ID NO88、SEQ ID NO89、SEQ IDNO92和SEQ ID NO93。
60.权利要求59的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,所述多肽由选自SEQ ID NO57和SEQ ID NO58的一种核酸编码。
61.权利要求59的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,所述多肽由选自SEQ ID NO86和SEQ ID NO87的一种核酸编码。
62.分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽选自SEQ ID NO112、SEQ ID NO113、SEQ ID NO118、SEQ ID NO130、SEQ ID NO134、SEQ ID NO137、SEQ ID NO138、SEQID NO144、SEQ ID NO151、SEQ ID NO152、SEQ ID NO153、SEQ ID NO156、SEQ ID NO159、SEQ ID NO165、SEQID NO168、SEQ ID NO169、SEQ ID NO170、SEQ ID NO171、SEQ ID NO172、SEQ ID NO173和SEQ ID NO193。
63.分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽由选自以下的一种核酸编码SEQ ID NO15、SEQ ID NO16、SEQ IDNO21、SEQ ID NO33、SEQ ID NO37、SEQ ID NO40、SEQID NO41、SEQ ID NO47、SEQ ID NO54、SEQ ID NO55、SEQ ID NO56、SEQ ID NO59、SEQ ID NO62、SEQ ID NO68、SEQ ID NO71、SEQ ID NO72、SEQ ID NO73、SEQ IDNO74、SEQ ID NO75、SEQ ID NO76和SEQ ID NO96。
64.分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽选自SEQ ID NO100、SEQ ID NO101、SEQ ID NO107、SEQ ID NO109、SEQ ID NO117、SEQ ID NO122、SEQ ID NO128、SEQID NO129、SEQ ID NO142、SEQ ID NO143、SEQ ID NO150、SEQ ID NO161、SEQ ID NO164、SEQ ID NO167、SEQID NO174、SEQ ID NO175、SEQ ID NO178、SEQ ID NO179、SEQ ID NO187、SEQ ID NO192和SEQ ID NO194 。
65.分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽由选自以下的核酸编码SEQ ID NO3、SEQ ID NO4、SEQ ID NO10、SEQ ID NO12、SEQ ID NO20、SEQ ID NO25、SEQ IDNO31、SEQ ID NO32、SEQ ID NO45、SEQ ID NO46、SEQID NO53、SEQ ID NO64、SEQ ID NO67、SEQ ID NO70、SEQ ID NO77、SEQ ID NO78、SEQ ID NO81、SEQ ID NO82、SEQ ID NO90、SEQ ID NO95和SEQ ID NO97。
66.包含一种幽门螺杆菌多肽的融合蛋白,所述融合蛋白包含操作性连接至一种非幽门螺杆菌多肽、选自SEQ ID NO98-SEQ ID NO194的一种氨基酸序列。
67.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种权利要求1、2、3、4、5、6、7、14、21、24、27、28、29或30中任何权利要求的分离核酸。
68.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种权利要求37、38、40、41、42、49、56、59、62、63、64或65中任何权利要求的幽门螺杆菌多肽或其片段。
69.权利要求67的疫苗制剂,还包含一种药学上可接受的载体。
70.权利要求68的疫苗制剂,还包含一种药学上可接受的载体。
71.权利要求69的疫苗制剂,其中所述药学上可接受的载体包含一种佐剂。
72.权利要求70的疫苗制剂,其中所述药学上可接受的载体包含一种佐剂。
73.权利要求69的疫苗制剂,其中所述药学上可接受的载体包含一种传递系统。
74.权利要求70的疫苗制剂,其中所述药学上可接受的载体包含一种传递系统。
75.权利要求73的疫苗制剂,其中所述传递系统包含一种活载体。
76.权利要求74的疫苗制剂,其中所述传递系统包含一种活载体。
77.权利要求75的疫苗制剂,其中所述活载体为细菌或病毒。
78.权利要求76的疫苗制剂,其中所述活载体为细菌或病毒。
79.权利要求73的疫苗制剂,其中所述药学上可接受的载体还包含一种佐剂。
80.权利要求74的疫苗制剂,其中所述药学上可接受的载体还包含一种佐剂。
81.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种编码幽门螺杆菌外膜多肽或其片段的分离核酸,所述核酸选自SEQ ID NO28、SEQ ID NO50、SEQ ID NO24、SEQ ID NO11、SEQ ID NO52、SEQ ID NO42和SEQ ID NO79。
82.权利要求81的疫苗制剂,其中所述核酸包含SEQ ID NO52的核苷酸序列。
83.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种幽门螺杆菌外膜多肽或其片段,所述多肽选自SEQ ID NO125、SEQ ID NO147、SEQ ID NO121、SEQ ID NO108、SEQ ID NO149、SEQ ID NO139和SEQ ID NO176。
84.权利要求81的疫苗制剂,其中所述多肽包含SEQ ID NO149的氨基酸序列。
85.权利要求81或83的疫苗制剂,还包含一种药学上可接受的载体。
86.权利要求85的疫苗制剂,其中所述药学上可接受的载体包含一种佐剂。
87.权利要求85的疫苗制剂,其中所述药学上可接受的载体包含一种传递系统。
88.权利要求87的疫苗制剂,其中所述传递系统包含一种活载体。
89.权利要求88的疫苗制剂,其中所述活载体为细菌或病毒。
90.权利要求86的疫苗制剂,其中所述药学上可接受的载体还包含一种佐剂。
91.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求67的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
92.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求68的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
93.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求81的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
94.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求83的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
95.生产疫苗制剂的方法,包括将选自SEQ ID NO98-SEQ IDNO194的至少一种分离的幽门螺杆菌多肽或其片段与药学上可接受的载体混合,以由此形成疫苗制剂。
96.生产疫苗制剂的方法,包括(a)提供选自SEQ ID NO98-SEQ ID NO194的至少一种分离的幽门螺杆菌多肽或其片段;以及(b)将至少一种所述分离的幽门螺杆菌多肽或其片段与药学上可接受的载体混合,以由此形成疫苗制剂。
97.生产疫苗制剂的方法,包括(a)在允许选自SEQ ID NO98-SEQ ID NO194的一种幽门螺杆菌多肽或其片段表达的条件下培养细胞;(b)从所述细胞分离所述幽门螺杆菌多肽或其片段;以及(c)将至少一种所述分离的幽门螺杆菌多肽或其片段与药学上可接受的载体混合,以由此形成疫苗制剂。
98.嵌合幽门螺杆菌多肽,包含至少两种幽门螺杆菌多肽或其片段,其中所述多肽由选自SEQ ID NO1-SEQ ID NO97的核酸序列编码。
99.嵌合幽门螺杆菌多肽,包含至少两种幽门螺杆菌多肽或其片段,其中所述多肽选自SEQ ID NO98-SEQ ID NO194。
全文摘要
描述了重组或大致纯的幽门螺杆菌多肽制剂。也描述了编码所述多肽的核酸。所述幽门螺杆菌多肽可用于诊断和疫苗组合物,其中该图描述了5种幽门螺杆菌蛋白的氨基酸序列对比。
文档编号C12N1/15GK1246799SQ97181630
公开日2000年3月8日 申请日期1997年12月5日 优先权日1996年12月5日
发明者D·史密斯, R·A·阿尔姆, P·C·多伊格, Z·卡波克, L·M·卡斯特里奥塔 申请人:阿斯特拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1