一种鉴定可用作药物靶点的蛋白质编码dna序列的基于计算机的通用方法

文档序号:6131955阅读:406来源:国知局
专利名称:一种鉴定可用作药物靶点的蛋白质编码dna序列的基于计算机的通用方法
技术领域
本发明涉及鉴定可用作药物靶点的蛋白质编码DNA序列的一种通用方法。更具体地说,本发明涉及鉴定各种生物基因组序列中鉴定可用作潜在药物靶点的新基因的方法。本发明还提供通过精确的氨基酸序列相同性标识(identity signature)说明(assignment)功能未知的推测的开放读框(蛋白质)的功能的方法。
已出现的高通量测序技术需要鉴定新测序基因组中新的蛋白质编码DNA序列(基因)。本发明通过利用肽文库提供了将DNA序列转变为字母数字式序列的新方法。本发明也提供采用具有一输入层(input layer)、一含有30个神经元的隐藏层(hidden layer)和一输出层(output layer)的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还提供利用S形(曲线)作为学习函数(learningfunction)来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分(fraction of zeroes)、最大连续性非零延伸段(maximum continuous non-zero stretch)和方差。
本发明背景和现有技术参考鉴定新测序基因组中蛋白质编码DNA序列(基因)的最可靠方法是寻找其它生物中相接近的类似基因(BLAST(Altschul,S.F等,1990)和FASTA(Pearson,W.R.,1995))。DNA序列中的4种核苷酸不是随机分布的。编码区内核苷酸的统计学分布与非编码区明显不同(Bird,A.,1987)。以Hidden Markov模型(HMM)为基础的方法最有效地利用了这些统计学特性(Salzberg,S.L等,1998;Delcher,A.L等,1999;Lukashin,A.V.和Borodovsky,M.,1998),当将这些方法与发表的注释比较时,能预测到基因组中约97-98%的所有基因(Delcher,A.L等,1999)。已开发了利用HMM的各种算法,例如GeneMark、Glimmer等来预测原核生物的基因。所有现有方法中,Glimmer 2.0最为成功(Delcher,A.L等,1999)。然而,Glimmer也只能预测7-20%的额外基因(假阳性)。每种基因预测方法有其自身长处和弱点(Mathe,C.等,2002)。由于预测通常取决于训练组(training set),因各种交叉基因组之间编码区的不同而使这种统计学产生缺点。而且这些方法不能有效地预测长度短的基因(<100氨基酸),这是因为用类似的检索或统计学分析很难检测这些基因。就基因的水平转移而言,该问题愈加严重(Kehoe,M.A等,1996)。在此种情况中,基因组自身内这些基因的核苷酸序列的统计学分布也不同。
本发明所述的方法是基于以下的发现,即某给定长度肽的理论上可能的总数和实际上确实观察到的总数的差异随着该肽长度的增加而急剧上升。例如,在56个完全测序的原核生物基因组库中仅观察到理论上可能的七肽的约2%。在八肽水平上,该数字降低至小于0.1%。此外,有趣地注意到就其性质而言,大多数这些选出的肽仅发现于编码区中,而非常罕见于理论上可被翻译的非编码区中。此发现促使我们研究了蛋白质编码序列中的肽的这种天然选择排他性是否可用来区分编码区和非编码区。
从原理上讲,只有当得到了足够的数据用来估计训练(train)预测算法所需的统计学参数,才能总是优选用较长而非较短的肽给查询ORF评分(Salzberg,S.L.等,1998)。但当我们使用长度为8个或更多个氨基酸的肽时,难于得到足够的数据来估计这些训练参数。这是因为两种多肽之间共有一个八肽的可能性小于共有一个七肽。所以,我们认为7个氨基酸的长度对于ORF评分是最佳的。
本文所述方法的新颖性在于它是根据蛋白质编码序列的氨基酸水平,而非核苷酸水平进行工作。值得注意的是该方法无需生物特异性训练组,这点相对于其它方法具有明显优势。与其它方法不同,GeneDecipher不采用诸如核糖体结合位点、启动子序列、转录起始位点或密码子使用偏爱等任何地标(landmark)来预测编码基因和它们的起始部位。此外,该方法克服了对较小基因组(Chen,L等,2003),如SARS-CoV作基因预测的困难。与基因预测不同,该方法也可用于多肽的相似性检索、蛋白质推测的功能说明(根据该寡肽基序的存在)和种系发生的结构域分析,表明该方法具有广泛应用性和通用性。
现有的计算方法,例如GeneMark.hmm(Lukashin和Borodovsky,1998)、Glimmer(Salzberg等,1998)等在分析小基因组,例如SARS时有困难。基于HiddenMarkov模型(HMM)的方法需要数千个训练参数。这使得这些方法不适于分析较小的基因组。就SARS-CoV基因组而言,所述化合物长度约30kb。迄今为止,即使最适用于预测病毒基因的方法-ZCURVE_CoV(Chen等,2003)也需要33种训练参数。GeneDecipher只需要5种参数即能分析较小的基因组。申请人在大肠杆菌-k12基因组编码和非编码区上训练了人工神经网络(ORF不报道为基因)。使用GeneDecipher预测病毒基因组上蛋白质编码基因无需额外的训练。这是该方法优于其它方法的一个明显优点。
本发明的目的本发明的主要目的是提供基于计算机的方法来预测可用作药物靶点的蛋白质编码DNA序列(基因)。
本发明的另一主要目的是开发一种利用软件GeneDecipher的通用性方法,所述方法采用在其它基因组的ORF中发现的寡肽来鉴定基因。
本发明还有另一目的是开发一种适用于防治病原性生物所致疾病的方法。
本发明还有另一目的是开发一种执行上述方法的基于计算机的系统。
本发明还有另一目的是开发一种用于鉴定可用作潜在药物靶点的新蛋白质编码DNA序列的方法,该方法可用作广谱抗菌药物的药物筛选以及感染的特异性诊断。
本发明还有另一目的是鉴定菌株特异性或生物特异性的蛋白质编码基因。
本发明还有另一目的是鉴定真核生物的蛋白质编码DNA序列(外显子)。
本发明的另一目的是通过精确的氨基酸序列相同性标识说明功能未知的推测的开放读框(蛋白质)的功能。
本发明小结本发明涉及利用软件GeneDecipher,采用在其它基因组的ORF中发现的寡肽来鉴定基因并且也适用于分析小基因组的通用性方法,所述方法包括以下步骤用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得每个读框的多肽;根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练成字母数字式序列;解密该测试基因组中的蛋白质编码区,从而鉴定对大量已知基因作图的肽的较长延伸段和它们所对应的蛋白质;最后本发明涉及防治病原性生物所致疾病的方法,所述方法包括通过抑制本发明上述步骤鉴定到的一种或多种蛋白质的功能来评价所提出的候选药物步骤。
本发明详述因此,本发明涉及利用专门开发的软件GeneDecipher鉴定基因组中可用作药物靶点的蛋白质编码DNA序列(基因)的通用性方法,所述方法包括以下步骤用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得每个读框的多肽;根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练成字母数字式序列;解密该测试基因组中的蛋白质编码区,从而鉴定对大量已知基因作图的肽的较长延伸段和它们所对应的蛋白质;最后本发明涉及防治病原性生物所致疾病的方法,所述方法包括通过抑制本发明上述步骤鉴定到的一种或多种蛋白质的作用来评价所提出的候选药物步骤。
在本发明的一个实施方案中,鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法包括以下步骤·用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;·人工翻译该测试基因组从而获得每个读框的多肽;·根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;·用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;·解密该测试基因组中的蛋白质编码区,和·鉴定用作功能性标识的对大量已知基因作图的肽的较长延伸段。
在本发明的另一实施方案中,所述人工神经网络具有一个或多个输入层、含有数目不同神经元的一个或多个隐藏层和一个或多个输出层。
在本发明还有的另一实施方案中,所述隐藏层中神经元的数量优选30。
在本发明还有的另一实施方案中,所述‘N’的值是4或更大。
在本发明还有的另一实施方案中,所述S形(曲线)学习函数具有5种参数,包括总得分、平均值、零部分、最大连续性非零延伸段和方差。
在本发明还有的另一实施方案中,所述鉴定基因的方法采用发现存在于(但不限于)流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的其它基因组ORF中的寡肽。
在本发明还有的另一实施方案中,权利要求1所述的方法中的所述肽文库数据可取自任何生物,而不特别限于本发明所用的那些。
在本发明还有的另一实施方案中,SEQ ID No 1-44所示流感嗜血菌的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.170-213所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 1-44所示流感嗜血菌基因。
在本发明还有的另一实施方案中,SEQ ID No 45-60所示幽门螺杆菌的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.214-229所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 45-60所示幽门螺杆菌基因。
在本发明还有的另一实施方案中,SEQ ID No 61-165所示结核分枝杆菌的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.230-334所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 61-165所示结核分枝杆菌基因。
在本发明还有的另一实施方案中,SEQ ID No 166-169所示SARS-冠状病毒的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.335-338所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 166-169所示SARS-冠状病毒基因。
在本发明还有的另一实施方案中,对应于SEQ ID No 1-169所示基因的可作为药物靶点的SEQ ID No.170-338所示蛋白质用作防治需要这种防治的对象的病原生物所致疾病。
在本发明还有的另一实施方案中,所述病原性生物选自SARS-冠状病毒、流感嗜血菌、结核分枝杆菌就幽门螺杆菌。
在本发明还有的另一实施方案中,所述对象是动物。
在本发明还有的另一实施方案中,所述对象是人。
在本发明还有的另一实施方案中,所述应用可扩展至真核生物和多细胞生物。
已出现的高通量测序技术需要鉴定新测序基因组中新的蛋白质编码DNA序列(基因)。本发明通过利用肽文库提供了将DNA序列转变为字母数字式序列的新方法。本发明也提供使用具有一输入层、一含有30个神经元的隐藏层和一输出层的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还提供利用S形(曲线)作为学习函数来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分、最大连续性非零延伸段和方差。
本申请人发明了通过与含有数百万个肽的经受了自然选择的肽文库作比较来鉴定蛋白质编码DNA序列的基于计算机的新方法,所述肽得自许多生物的蛋白质序列。该方法描述了一种可用于基因鉴定的可广泛使用的和通用性的新方法。该计算机处理的方法通过利用肽文库和人工神经网络能在某给定的DNA序列的所有可能的开放读框(ORF)中确定候选基因。所述肽文库由得自完全测序的56种或更多种原核生物基因组的蛋白质的所有可能的重叠七肽构成。根据文库七肽(文库中存在的七肽)沿着ORF的丰度和分布模式确定某给定的查询ORF是否为基因。该方法的性能特征在于灵敏度和特异性都很高。分析完全测序的10种原核生物基因组证明了本发明方法的效力。
本发明方法也可预测针对病原生物某特定肽基序的其它(alternate)靶点或负责疾病进程的任何宿主蛋白质靶点。可利用不同长度的肽扩展该方法来获得更大量的蛋白质编码基因以及用于真核生物与多细胞生物。
本发明涉及通过采用肽文库将DNA序列转变为字母数字式序列的新方法,本发明也提供采用具有一输入层、一含有30个神经元的隐藏层和一输出层的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还涉及用S形(曲线)作为学习函数来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分、最大连续性非零延伸段和方差,该方法可用于鉴定新的蛋白质编码区作为广谱抗菌药物的药物筛选以及感染的特异性诊断,此外可用于说明功能尚未知的新鉴定的蛋白质的功能。该方法可鉴定各物种或菌株的特异性蛋白质编码基因。该方法甚至也可扩展至对真核生物基因组中的任何蛋白质编码序列进行鉴定。
因此,本发明公开了鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的一种通用方法,所述方法包括以下步骤
a.用计算机处理以字母顺序排列的长度为‘N’的寡肽从已知基因组产生肽文库;b.人工翻译该测试基因组获得每个读框的多肽;c.根据这些寡肽在该肽文库的存在将每条多肽序列转变为字母数字式序列,其中各条序列对应于各个读框;d.用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;e.解密该测试基因组中的蛋白质编码区,和f.鉴定用作功能性标识的对大量已知基因作图的肽(进化上保守的寡肽)的较长延伸段。
在本发明的另一实施方案中,所述ANN具有一个或多个输入层、含有数量不同神经元的一个或多个隐藏层和一个或多个输出层。在本发明还有的另一实施方案中,所述隐藏层中神经元数目优选30。
在本发明还有的另一实施方案中,所述‘N’的值是4或更大。
在本发明还有的另一实施方案中,所述S形(曲线)学习函数具有5种参数,包括总得分、平均值、零部分、最大连续性非零延伸段和方差。
本发明的再一个实施方案(涉及)鉴定具有进化上保守的肽序列的基因的方法,这些保守的肽序列存在于各种(生物)基因组的ORF中产生,包括,但不限于流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的基因组。
在本发明还有的另一实施方案中,该方法在SARS-冠状病毒和流感嗜血菌、结核分枝杆菌、幽门螺杆菌的基因组中鉴定了169种SEQ ID 1-169所示的新基因。
本发明还有的实施方案(提供)防治病原生物,例如SARS-冠状病毒和流感嗜血菌、结核分枝杆菌、幽门螺杆菌所致疾病的方法,所述方法包括评价所提出的候选药物能否抑制一种或多种进化上保守的肽序列的功能,这些保守的肽序列可用本方法鉴定,选自对应于SEQ ID 1-169所示新基因(编码)的SEQ ID 170-338所示蛋白质。
在本发明还有另一实施方案中,该肽文库数据可取自任何生物而不特别限于本文所用的那些。
方法详述该方法主要有5步(如

图1所示)1.产生肽文库。
2.将某给定的基因组人工翻译成6个读框。
3.将每条翻译的序列转变为字母数字序列。(各条对应于各个读框)。
4.训练人工神经网络(ANN)。
5.使用经训练的ANN解密这些基因。
1.产生肽文库本发明需要一个参比肽文库来预测某给定基因组中的基因。在本发明中,申请人采用了已完全测序的56种原核生物基因组(编码)的蛋白质。我们数据库的蛋白质文件从ftp://ftp.ncbi.nlm.nih.gov/genomes以FASTA格式获得。为制备用于解密某特定基因组中基因的肽文库,申请人排除了属于我们数据库的特定物种的蛋白质文件,目的是避免任何偏向性。例如,当分析大肠杆菌-k12基因组时,将对应于大肠杆菌所有菌株的蛋白质文件排除在用于产生该肽文库的数据库之外。当分析新测序的基因组时,必需这样做以除去得自该生物的肽的信号。这增强了该方法对不能得到其注释的蛋白质文件的新测序基因组的基因预测(能力)。产生肽文库时,通过将读窗移动一个氨基酸来包括所有可能的重叠七肽。从该肽文库中除去冗余肽,根据不同生物存在的肽数目给每个肽一个出现值。
该出现值是对编码区中七肽保守性的一种度量。ORF中存在高出现值的某七肽增加了该ORF是蛋白质编码基因的可能性。依据以下假设,如果某七肽在9种或更多种不同生物的蛋白质文件中存在,可认为它是高度保守的七肽,我们的算法将9或更大的出现值处理为9。用更高的值来进一步区分保守程度(amount)没有意义。
所述七肽文库由两列构成,第一列是七肽序列,第二列是该七肽的评分(出现值)。七肽按字典顺序分类。肽文库数据库也保留有关七肽的其它信息,例如所有包含特定七肽的蛋白质的登录号和NCBI注释。可利用其对某给定的ORF作假定的功能预测。同一方法也可用于种系发生结构域的分析。
2.将某给定基因组人工翻译成6个读框该算法的第二步是用标准密码子表将全部查询基因组人工翻译成所有的6个读框。然而,当需要时可采用用户指定的密码子表。在人工翻译基因组时,申请人使用字母‘z’对应于终止密码子TTA、TAG和TGA,字母‘b’表示含有任何非标准核苷酸(K、N、W、R和S等)的所有三联密码子。
3.将每条翻译的序列转变为字母数字式序列(各条对应于各个读框)我们的算法中下一步是将人工翻译,带有终止密码子(z)中断的氨基酸序列转变为字母数字式序列。申请人在肽文库中检索了每条重叠的七肽,分配了对应的数值(出现值)并将其加在字母数字式序列后。如果某七肽不存在于该文库中,申请人分配数值为0。如果某七肽以对应于起始密码子ATG、GTG和TTG之一的氨基酸开始,申请人在字母数字式序列中加上符号‘s’。这有助于检测可能的起始密码子的位置。当某七肽含有符号‘z’时,申请人加上对应于该七肽的符号‘*’。因此,字母数字式序列中连续7个‘*’(******)是终止密码子的信号。申请人给任何含有符号‘b’的七肽加上符号‘-’。该信号说明存在非标准核苷酸符号并且不传送关于序列是基因还是非基因一部分的信息。因此,如此产生的字母数字式序列含有13个符号,即任何整数(0-9)、‘s’、‘*’和‘-’。申请人以该方式将所有6个翻译蛋白质的文件转变为6个字母数字式序列。
4.训练人工神经网络(ANN)本文所用的神经网络具有多层正反馈拓扑学(结构)。它由一输入层、一隐藏层和一输出层构成。这是‘完全连接’的神经网络,其中每个神经元i与下一层的每个单元j相连(图2)。每个连接的权重以wij表示。输入层中每个神经元的状态Ii直接从输入数据指派,而隐藏层神经元的状态用S形(曲线)函数,hj=1/(1+exp-λ(wj0+∑wijIi))用计算机处理,其中wj0是偏置权重,λ=1。
采用了反向传播(back propagation)算法以尽可能降低计算机输出和所需输出之间的差异。进行了一千次轮(信号出现时间(epoch))迭代。然后鉴定确认组(validation set)中最小误差的信号出现时间,对应的权重(wij)指派为ANN的最终权重。该网络在训练组训练、核对误差并通过反向传播利用确认组优化。
‘训练组’由1610个NCBI列出的大肠杆菌-k12的蛋白质编码基因和还未报道为基因(非基因)的3000个大肠杆菌-k12 ORF(长度超过20个氨基酸并在同一框内含有起始密码子、终止密码子的序列延伸段)构成。‘确认组’具有大肠杆菌-k12的1000个已知基因和1000个非基因而与训练组所用的基因相区别。‘测试组’含有同一生物的另1000个基因和1000个非基因。为训练ANN,分别将基因和非基因的概率值指派为1和0。
为训练神经网络,申请人首先通过上述方法(步骤2和3)将大肠杆菌-k12所有的基因和非基因转变为对应的字母数字串。此时重要的是应注意与对应于非基因的字母数字式序列相比,对应于基因的字母数字式序列富含数字。为定量某字母数字式序列的这种数字丰富程度,从该字母数字式序列选择了5个参数。以下是这5个参数(i).总评分这是某给定的字母数字式序列的所有整数的代数和。经验法则方法是评分越高,成为基因的机会越大。
(ii).零部分零部分等于字母数字式序列中零符号的总数除以该序列中符号的总数。零部分越多,成为基因的机会越低。
(iii).平均值平均值等于总评分除以序列的总长度。平均值越高,成为基因的机会越高。实际上,该参数似乎与总评分相同,但由于该参数也包括了序列的长度(每单位长度的评分),它是重要的。
(iv).方差是关于整个ORF的平均出现值的出现值方差。
(v).最大连续性非零延伸段的长度该参数的值越高,成为基因的机会越高。设想如‘45’的序列区。这里,‘4’表示某七肽在4种生物中保守,其后的‘5’表示某重叠的七肽在5种生物中保守。因此,如果在这两组之间至少一种生物是共同的,申请人最终获得了在该生物和查询ORF之间有共同一个八肽。这提高了我们预测编码区的可信度。例如,当与序列‘s40540607000*******’比较时,序列‘s45467000000********’更可能是一个基因。这是因为在后一序列中更有可能存在较长的保守肽。前一序列的该参数值是2而后一序列的为5。然而,该算法中所用的其它参数不能区分这两条序列。
当计算该字母数字式序列的这些参数时,已排除了例如‘s’、‘*’和‘-’符号。
为找到最佳组合,采用所有的5个参数一起训练神经网络。计算对应于基因和非基因的字母数字式序列的参数。训练组、确认组和测试组包含6列,前5列包含5个参数的值,最后一列包含表示基因的数字‘1’和表示非基因的数字‘0’。
输入层中神经元的数目等于输入数据点的数目。隐藏层中神经元的最佳数目由命中(hit)和试验所确定同时尽可能减少网络最佳信号出现时间的误差。计算所有5个参数的计算机程序和人工神经网络用C(语言)编写,在装有Red Hat Linux 7.3或8.0版的PC上执行。
训练ANN(该算法的步骤4)通常只进行一次,训练过的同一神经网络可用于对任何原核生物基因组执行该方法。虽然如果申请人采用生物特异性训练组,在一些情况中结果可能有所改善,但很勉强。这是因为我们的方法是根据ORF的字母数字式序列的数字分布来预测基因。所以,基因预测更依赖于所用的肽文库而非训练组。
5.使用训练过的ANN解密基因虽然认为产生肽文库(步骤1)和训练ANN(步骤4)是执行本发明方法的预备阶段,但步骤2和步骤3对每个基因组测序而言是强制性的。用计算机处理将基因组翻译成所有的6个读框并将它们转变为6个字母数字式序列后,即可用ANN解密这些基因。该步骤还可分为以下5个小步骤1.将所有6条字母数字式序列截断成可能的ORF。(所有可能的片段始于‘s’,终于‘*’)2.计算所有可能的ORF(所有的字母数字串在‘s’和‘*’之间)的所有5个参数(总评分、零部分、平均值、方差和连续性非零延伸段的长度)。
3.用训练过的ANN计算对应于某给定字母数字串的ORF成为蛋白质编码基因的概率。
4.采用一截断概率值从非编码ORF中滤出蛋白质编码ORF。
5.除去所有重叠(encapsulate)的蛋白质编码区(Shibuya,T.和Rigoutsos,I.,2002)如果在不同的翻译框中预测了两个ORF,以致于一个延伸完全重叠了另一个,通常认为二者中只有一个可能是真正的基因。在这种情况中,申请人报告具有较高概率值的ORF为基因。当概率值相同时,申请人取较长的ORF为基因。
本发明的方法可预测对应于某查询ORF是蛋白质编码区的概率值。利用=1的S形(曲线)学习函数训练ANN(基因的概率为‘1’,非基因的概率为‘0’);因此,大多数时间此概率值低于0.1或高于0.9。由于该原因,0.1-0.9之间的任何截断值可能得到非常相似的结果。在我们的分析中,申请人使用的默认截断值为0.5。重要的是应注意,本发明无需在灵敏度和特异性之间寻求平衡,因为截断概率的选择对结果无重要影响。
本发明的其它方面、特征和优点将通过以下提出的出于公开目的本发明优选实施方案的描述而得以明了。
计算机程序简述1.文件名genedcodchr.cxx应用将核苷酸序列(FASTA文件格式)翻译成6个独立框中的6个假设的多肽。
输入格式<Program_name><Nucleotide_file><Output1><Output2><frame>例如,./genedcodchr ecoli.fna pf1 pr1 0输出格式AGTFYRYmGHVNMKIYTASLPTYRYGYFSHRED.....HGOIEKSDWEzDFGTRE2.文件名searchchr.cxx应用通过七肽文库(给定的输入)检索将多肽文件转变为字母数字式序列。
输入格式<Program_name>7<peptide library file name>out Y<Input1><Input2><Output1><Output2>例如./searchchr 7 ecoli.peplib out Y pf1 pr1 bf1 br1输出格式s1124500001090003000020000023000000000*******0001000..........
3.文件名cutfc应用从正向链的字母数字式序列切除所有可能的ORF(即,所有的‘s’到‘*’区域),产生含有字母数字式序列中所有‘s’的位置的文件。
输入格式<Program_name><Input file name><Output1><Output2>例如../cutf bf1 unknown_bf1 bf1_location输出格式output1-s1111000s00000000563*,output2-某列中‘s’的起始位置。
4.文件名cutr.c应用从反向链的字母数字式序列切除所有可能的ORF(所有的‘s’到‘*’区域),产生含有字母数字式序列文件中对应于所有ORF的所有3个正向框的起始位置的文件。
输入格式<Program_name><Input file name><Output1><Output2>例如../cutr br1 unknown_br1 br1_location输出格式output1-*010340000222200067900000s000001000200s00230000s,output2-‘s’的起始位置5.文件名stat.c应用计算某给定的字母数字式序列的5个参数零部分、平均值、总评分、最大连续性延伸段的长度和方差。
输入格式<Program_name><Input file name><Output>1例如../statunknown_bf1 bf1.data 1输出格式0.334 3.2 48 15 0.452 16.文件名train.c应用利用S形(曲线)(=1)作为学习函数以正反馈传播算法训练人工神经网络(一隐藏层、一输入和一输出层)。
输入格式<Program_name><Input specification file name><Input1><Input2><Input3>>output例如../train train.spec.fast trainset.data validateset.data testset.data>train.Net输出格式输出一单列中所含有的最终神经网络权重7.文件名recognize.c应用根据训练过的权重识别某给定的模式并产生概率值作为输出。
输入格式<Program_name><Input specification file name><Input1><Input2><Output>例如../recognize recognize.spec bf1.data train.net f1.out输出格式pat1 probability<value>
8.文件名Filter_prediction.c应用根据概率和长度参数滤除同一框中完全重叠的ORF。
输入格式<Program_name)<Input1><Input2><Output>例如../Filter_prediction f1.out unknown_bf1 bf1.out.res输出格式pat1 probability<value><integer string>
9.文件名locationf.c应用滤除长度<20个氨基酸的基因,报告含所有3个正向框字母数字式序列的其余基因的起始位置输入格式<Program_name><Input1><Output><Input2>例如../locationfbf1.out.res bf1.out.res bf1_location输出格式<Pattern No><Probability value><integer string><Start><End>
10.文件名locationr.c应用滤除长度<20个氨基酸的基因,报告含与所有3个反向框的字母数字式序列的其余基因的起始位置输入格式<Program_name><Input1><Output><Input2>例如../locationrbr1.out.res br1.out.res1 br1_location输出格式<Pattern No><Probability value><integer string><Start><End>
11.文件名finalf.c应用将字母数字式序列的起始和末端位置转变为3个正向框的相应的基因组位置输入格式<Program_name><Input1><Input2><Input3><Output>例如../finalf bf1.out.res1 bf2.out.res1 bf3.out.res1 Final_outputf输出格式<Start><End><frame><length><Probability value>integerstring>
12.文件名finalr.c应用将字母数字式序列的起始和末端位置转变为3个反向框的相应的基因组位置输入格式<Program_name><Input1><Input2><Input3><Output>例如../finalf br1.out.res1 br2.out.res1 br3.out.res1 Final_outputr输出格式<Start><End><frame><length><Probability value><integerstring>
13.文件名sort.c文件名sort.c应用将最终预测的基因打印为沿该基因组起始位置的递降顺序。
输入格式<Program_name><Input1><Input2><Input3><Output>例如../sort Final_outputfFinal_outputr OUTPUTF_with_encapOUTPUTR_with_encap OUTPUT输出格式<Start><End><Probability value>
14.文件名removeencap.c应用除去在其它5个框中发现的重叠基因输入格式<Program_name><Input1><Input2><Input3><Output>例如../removeencap OUTPUTF_with_encap OUTPUTR_with_encap OUTPUTOUTPUTF OUTPUTR输出格式<Start><End><frame><length><Probability value>integerstring>
本发明涉及基于计算机的预测可用作药物靶点的蛋白质编码DNA序列的新方法。在该方法中,利用出现的寡肽标签(signature)作为探针。该方法是通用性的,不一定需要用于人工神经网络的生物特异性训练组。该方法不仅依赖于统计学分析,而且整合了经受过进化压力的保守肽中所保留的生物信息。可合乎逻辑地扩理地拓展该方法来预测真核生物基因组中的蛋白质编码DNA序列(外显子)。
附图简述图1显示了GeneDecipher的逻辑电路。
图2显示了神经网络的结构。
图3显示了GeneDecipher对10种生物所得结果的分析。
下文给出了本发明所用生物的细节,包括名字、菌株、登录号和其它细节。
给出以下实施例是为了说明本发明而不应理解为限制本发明的范围。
实施例1将DNA序列转变为字母数字式序列该模块在我们软件中的目的是经计算机处理利用特定的密码子表将整个查询基因组(DNA序列)翻译成所有的6个读框。人工翻译基因组时,申请人使用的字母‘z’对应于终止密码子TTA、TAG和TGA,字母‘b’表示含有任何非标准核苷酸(K、N、W、R和S等)的所有三联密码子。然后将翻译的基因组序列经计算机处理转变为字母数字式序列(
、‘s’、‘*’和‘-’)。申请人在该肽文库中检索了每条重叠的七肽,指派了对应的数值(出现值)并将其加在字母数字式序列后。如果某七肽不存在于此文库中,申请人指派数值0。如果某七肽以对应于起始密码子ATG、GTG和TTG之一的氨基酸开始,申请人在该字母数字式序列中加上符号‘s’。这有助于检测可能的起始密码子位置。在某七肽含有符号‘z’的情况中,申请人加上对应于该七肽的符号‘*’。因此,字母数字式序列中连续7个‘*’(*******)是终止密码子的信号。申请人给任何含有符号‘b’的七肽加上符号‘-’。该信号表明存在非标准核苷酸符号。
在下列6条序列的帮助下进一步精制了上述转变。
·SEQ ID No.12
>gi_GDC_HINF_243018GTGATGAGCCGACATCGAGGTGCCAAACACCGCCGTCGATATGAACTCTTGGGCGGTATCAGCCTGTTATCCCCGGAGTACCTTTTATCCGTTGAGCGATGGCCCTTCCATTCAGAACCACCGGATCACTATGACCTACTTTCGTACCTGCTCGACTTGTCTGTCTCGCAGTTAAGCTTGCTTATACCATTGCACTAA计算机翻译的蛋白质序列>gi_GDC_HINF_243018VMSRHRGAKHRRRYELLGGISLLSPEYLLSVERWPFHSEPPDHYDLLSYLLDLSVSQLSLLIPLH计算机产生的字母数字式序列ss10000000000001s03111431000000000000000000110000100s001030*·SEQ ID No.4
>gi_GDC_HINF_170553GTGTTTATGCTTTATTTAGAATTTTTATTTTTACTATTAATGCTCTATATCGGTAGCCGTTACGGCGGTATCGGATTAGGTGTTGTTTCTGGTATCGGTCTTGCTATCGAGGTTTTCGTATTTCGTATGCCAGTGGGGAAGCACCGATTGATGTTATGCTTATCATTCTTGCAGTGGTGA计算机翻译的蛋白质序列>gi_GDC_HINF_170553VFMLYLEFLFLLLMLYIGSRYGGIGLGVVSGIGLAIEVFVFRMPVGKHRLMLCLSFLQW
计算机产生的字母数字式序列s0s1131231142s1111445232254238000000000000s0s0000ss00*·SEQ ID No.73
>gi_GDC_MTUB_688806TTGCTGCACAGCAGCTTCGGGCACCTCGAGGGCATCCAGCAGCCGCTCATAGACGAGCTGGCAGAACTCGACCACGTGTTGGGCAAGCTGCCGGACGCCTACCGGATCATCGGCCGCGCCGGCGGCATATACGGTGACTTCTTCAACTTCTATCTGTGTGACATCTCACTGAAAGTCAACGGATTACAGCCTGGAGGTCCGGTACGCACCGTCAAGTTGTTCGGCCAGCCGACCGGCAGGTGCACACCGCAATGA计算机翻译的蛋白质序列>gi_GDC_MTUB_688806LLHSSFGHLEGIQQPLIDELAELDHVLGKLPDAYRIIGRAGGIYGDFFNFYLCDISLKVNGLQPGGPVRTVKLFGQPTGRCTPQ计算机产生的字母数字式序列s000000000110110530100000ss000000000000100000000000000000001111210000000s00100*·SEQ ID No.92
>gi_GDC_MTUB_1286282GTGACGGTATACCGTCGAGGTATGGCTGTGTTAACGGATGAGCAGGTCGACGCCGCACTGCACGACCTCAACGGCTGGCAGCGCGCCGGTGGTGTCCTGCGTAGGTCAATCAAGTTTCCGACGTTTATGGCCGGTATCGACGCCGTACGCCGGGTGGCCGAGCGAGCCGAGGAGGTAAATCATCATCCGGACATCGATATCCGTTGGCGAACAGTAACTTTCGCGCTGGTTACGCATGCGGTAGGTGGTATCACGGAAAACGACATTGCGATGGCGCACGATATCGACGCAATGTTTGGGGCCTAA计算机翻译的蛋白质序列>gi_GDC_MTUB_1286282VTVYRRGMAVLTDEQVDAALHDLNGWQRAGGVLRRSIKFPTFMAGIDAVRRVAERAEEVNHHPDIDIRWRTVTFALVTHAVGGITENDIAMAHDIDAMFGA
计算机产生的字母数字式序列s000000s0s21110001000000300000000011000000s01031100s00020000110000000030000000013310000000s0001*·SEQ ID No.49
gi_GDC_HPYL_583607TTGATGGAATTTGATGTTACCATCATAGATGAGACAGGCAGGGCCACAGCACCAGAAATCTTGATTCCTGCACTTCGCACTAAAAAACTGATCTTAATAGGCGATCACAACCAGCTCCCACCTAGCATTGATAGGTACCTCCTAGAACAATTAGAGAGCGATGATATTCAAAACTTGGATGCCATTGATCGCCAATTATTGGAAGAGAGTTTTTTTGAAAATCTCTATAAGTATATTCCAGAGAGTAATAAGGCCATGCTTAATGAGTAA计算机翻译的蛋白质序列>gi_GDC_HPYL_583607LMEFDVTIIDETGRATAPEILIPALRTKKLILIGDHNQLPPSIDRYLLEQLESDDIQNL DAIDRQLLEESFFENLYKYIPESNKAMLNE计算机产生的字母数字式序列ss001000000000000000s0000011000020000000000030310000000002s0003020s0000000000000000*·SEQ ID No.54
gi_GDC_HPYL_954846GTGAGCCTGGTTTCAAGCGTGTTTTTAATGTGTTTAGACACTCAAGTGCTAGTCTTTGGGGATTGCGCGATTATCCCTAACCCTAGCCCTAAAGAATTAGCCGAGATCGCTACCACTTCCGCACAAACCGCCAAGCAATTCAATATTGCGCCTAAAGTGGCCTTGCTTTCTTATGCGACAGGCGATTCCGCTCAAGGCGAAATGATAGACAAAATCAACGAAGCTTTAACAATCGCTCAAAAGTTGGATCCCCAATTAGAAATTGATGGCCCCTTACAATTTGACGCTTCCATTGATAAAAGCGTAGCCAAGAAAAAATGCCTAACAGCCAAGTGGCTGGGCAAGCTAGCGTTTTTATTTTCCCGGATTTAA计算机翻译的蛋白质序列
>gi_GDC_HPYL_954846VSLVSSVFLMCLDTQVLVFGDCAIIPNPSPKELAEIATTSAQTAKQFNIAPKVALLSYATGDSAQGEMIDKINEALTIAQKLDPQLEIDGPLQFDASIDKSVAKKKCLTAKWL GKLAFLFSRI计算机产生的字母数字式序列s80000s00s00002s200222000000003100000000000000000010s0s100000000000s0000000100000s00000000000000000000000000030000010*实施例2训练人工神经网络(ANN)该模块在软件中的目的是用特定的基因和非基因编号训练指定的神经网络(图2)。在该实施例中,训练组由1610个NCBI列出的大肠杆菌-k12蛋白质编码基因和还未报道为基因的3000个大肠杆菌-k12 ORF(非基因)构成。确认组具有大肠杆菌-k12的1000个已知基因和1000个非基因而和训练组所用的相区别。测试组含有同一生物的另外1000个基因和1000个非基因。为训练ANN,基因和非基因分别指派的概率值为1和0。为训练神经网络,申请人首先通过上述方法(步骤2和3)将所有大肠杆菌-k12基因和非基因转变为对应的字母数字式链。图3显示了字母数字式序列格式的两个大肠杆菌-k12基因和两个非基因的例子。这里重要的是应注意与对应于非基因的字母数字式序列相比,对应于基因的字母数字式序列富含数字。为定量其字母数字式序列的这种数字丰富程度,从该字母数字式序列选择了5个参数。以下是这5个参数表1(a)和1(b)解释了总评分(某给定的字母数字式序列的所有整数的代数和)、零部分(该字母数字式序列中零符号的总数除以该序列中符号的总数)、平均值(总评分除以序列的总长度)、方差(关于整个ORF的平均出现值的出现值方差)、最大连续性非零延伸段的长度(表示无间断的非零数字在序列中的占位情况)。
表1(a)训练ANN(基因)
表1(b)训练ANN(非基因)
当计算该字母数字式序列的这些参数时,排除符号‘s’、‘*’和‘-’。为确定每个参数对区分基因与非基因的作用,采用所有5个参数一起训练神经网络。计算出对应于基因和非基因的字母数字式序列的参数。训练组、确认组和测试组包含6列,前5列包含5个参数的值,最后一列包含表示基因的数字‘1’和表示非基因的数字‘0’。
实施例3申请人使用本发明的方法分析了10种原核生物基因组。该方法的效率定义为由所述方法预测的NCBI列出的蛋白质编码区的百分比。通过专门开发的程序自动除去所有重叠的蛋白质编码区。该方法能预测平均92.7%的NCBI列出的基因,标准差是2.8%。除结核分枝杆菌H37RV基因组外,该方法的灵敏度和特异性值均高(如图3所示)。
实施例4预测蛋白质编码DNA序列的起始位置本发明方法预测起始位置的正确率从结核分枝杆菌H37Rv的49.5%(特异性也是最低的)到幽门螺杆菌26695的81.1%。申请人的方法根据是否存在起始密码子加周围七肽的保守情况可确定该起始位置。也可利用该方法预测经一些其它方法预测的查询蛋白质编码DNA序列的起始位置。这可通过简单地将蛋白质序列转变为对应的整数序列,然后根据周围七肽确定正确的起始位置来实现。为举例说明起始位置的预测(如下所示),申请人报告了大肠杆菌K-12基因组的3个这样的情况(两个来自正向链,一个来自反向链)。
预测起始位置时,要兼顾数字丰富程度和ORF的长度。在情况1(PID 16132273)中,NCBI将该基因的起始位置从位置85540移至85630。目测对应于该基因的整数序列,可以明显看出较早的在‘s’后有充满0的区域;或者换言之它不是富含数字的区域(下图所示情况1中的黑体区域)。现在移动起始位点使它位于本发明方法预测的数字丰富区之前。情况2是该起始密码子向5’上游移动的一个例子,因为在该起始密码子的上游有数字丰富区(‘2011111’和一个‘3’和一个‘2’)。故该位点从位置4611194移至4611050。情况3是移动反向链中起始位点的另一例子,其中在较早的NCBI起始位置的上游有数字丰富区(该数字串中有‘16531311’和许多其它数字)。
情况1.PID 16132273位置较早的NCBI(85540……87354);新的NCBI(85630……87354) s0s0000000000000s000000000s000s2ss4222s111000000000999922224210000s00s40004466442223s0s0120000000177s9999855553239888440s001111000113002s1116311112ss22222s430100000000100s0100000639977100011100100000001000000000s2000010030000011110111100000161171000000000s201s12s0000002ss10000000001099s76s6211100s0s0000s00014444441111100000000000234331211000s033221s000000014s000s00000002000000000001110000000000000000000s000001s000000s48976531s1111110001223459999999s92554010010s0s0002s2236667778s75221001s000s000ss00000066ss11111s3211100000s000002204332110000000000210010010000s00000s11000000354211s000000s00s22*******情况2.PID 16132266位置较早的NCBI(4611194……4611829);新的NCBI(4611050……4611829)
s00020111110000000000000300000000020000010000030ss000000001110s0s000ss00000s102110000000100ss3s2000000000000000000000100021100011s110000000000s00000000001s10100000010100002222222000000000000000010321002s3321111s11011110010000000s00s000s00101010100s00000*******情况3.PID 16132224位置较早的NCBI(2538824……2539273);新的NCBI(253824……2539699)N*******0000000000000ss000000001s2000104220300000000s00000000000100000s0s98↓889135120sss0001222000022512s0000223s123100000000ss0s000ss0022s30000ss00000s00000000000001000000s0s0000s16531311000000101010000s00200101s1110000230ss0↓100000s0001000000s0000000s0000s0s00001100s0011000000000000000s00000s←———— EENCBI的较早的起始位点→正向读框NNCBI的较新的起始位点→反向读框实施例5预测蛋白质编码DNA序列通过采用以下步骤利用该方法预测发表的可得到的数据库(NCBI)中各种基因组的蛋白质编码DNA序列i)从选择的生物的所有蛋白质序列经计算机处理产生重叠的肽文库,所述蛋白质序列得自http://www.ncbi.nlm.nih.gov;ii)按字母顺序,根据单字母氨基酸密码用计算机拣选以上获得的长度为‘N’的肽;iii)将每个肽和出现它们的不同特异性生物分类;iv)利用步骤1和2获得的肽文库将DNA序列转变为字母数字式序列;v)检索该字母数字式序列检索所有可能的开放读框(ORF);vi)训练改进的神经网络来区分蛋白质编码和非编码DNA序列;vii)利用训练过的神经网络预测该开放读框(步骤4中获得)中的DNA编码序列;viii)除去重叠的蛋白质编码DNA序列(基因内的基因)。
如表2所详述的,本发明人使用本发明的方法从选自以下的生物的基因组中发现了169个新基因SARS-冠状病毒、流感嗜血菌、结核分枝杆菌和幽门螺杆菌。表2显示了SEQ ID No.1-SEQ ID No.169所示序列中的所述新基因。
表2
对10种微生物基因组分析了GeneDecipher的系统灵敏度和特异性(图3)。以下给出了对病毒基因组的GeneDecipher进一步分析。
SAR-CoV基因组序列从GenBank数据库(http://www.ncbi.nlm.nih.gov/Entrez/genomes/viruses)下载可利用的18 SARS-CoV毒株序列并分析。这些序列包括SARS-CoV Refseq(NC_004718.3)、SARS-CoV TWC(AY32118)、SIN2774(AY283798)、SIN2748(AY283797)、SIN267^(AY283796)、SIN2677(AY283794)、SIN25ti6(AY283794)、Frankfurt(A Y291315)、BJ04(AY279354)、BJ03(AY278490)、BJ02(AY278487)、GZ01(AY278848)、CUHKW 1(AY278554)、TOR2(AY274119)、TW1(AY291451)、BJ01(AY278488)、Urban(AY278741)、HKU-39849(AY278491)。其它蛋白质编码基因相关的信息检索得自http://www.nchi.nlm.nih.gov/genomes/SARS/SAks.html。
对病毒基因组测试GeneDecipher为对病毒基因组测试我们的方法,申请人首先用GeneDecipher分析了人呼吸道合胞病毒(HRSV)的完全基因组。将GeneDecipher的结果与现有技术水平的方法ZCURVE_CoV进行了比较(表3)。ZCURVE_CoV能从11个NCBI报道的基因中预测8个注释的蛋白而无假阳性。ZCURVE_CoV不能预测以下3个基因PID 9629200(位置626...1000,非结构蛋白2(NS2));PID 9629205(位置4690...5589,粘附性糖蛋白(G))和PID 9629208(位置8171...8443,基质蛋白2(M2))。GeneDecipher从总共11个注释的HRSV蛋白中预测了10个而无假阳性。注意到GeneDecipher遗漏的基因也是ZCURVE_CoV所遗漏的PID 9629208(位置8171...8443,基质蛋白2)。
成功预测了HRSV基因组中的蛋白质编码区提高了我们对预测新测序的SARS-CoV基因组中蛋白质编码区的信心。
用GeneDecipher分析SARS-CoV申请人用GeneDecipher分析了SARS-CoV的所有18个病毒株。(详细结果见以上给出的网址)。对18个病毒株中的每种而言,GeneDecipher在SARS-CoV基因组中预测了总共15个蛋白质编码区,包括多聚蛋白1a、1ab(多聚蛋白1ab的Sars2628 C末端)和所有4种已知的结构蛋白(M、N、S和E)。取决于所用病毒株的基因组序列,GeneDecipher也预测了6-8个额外的编码区。这些额外编码区的长度范围是61-274个氨基酸。
GeneDecipher预测的12个编码区是所有18个病毒株共有的(表4)和存在于5个病毒株中的一个编码区(NCBI refseq基因组中的Sars63、sars6)。GeneDecipher特别在GZ01病毒株中预测了基因Sars90,在BJ02病毒株中预测了Sars154(NCBIrefseq基因组中的Sars 3b)。
这12个共有蛋白质编码区由SARS-CoV的6个基础蛋白质(2个多聚蛋白和4个结构蛋白)构成Sars274(NCBI refseq数据库中的Sars3a)、Sars 122(NCBI refseq数据库中的Sars7a)、Sars78(已报道TOR2病毒株中起始点转移为ORF14/Sars9c);和3个新预测到的(对NCBI的当前注释而言是假阳性)蛋白质编码区Sars174、Sars68和Sars61。这3个新预测的基因全部位于多聚蛋白1a基因组区域中。虽然在细菌基因组中我们的方法舍弃了这种基因,但不能排除在病毒基因组中发现这种基因的可能性。由于这些基因存在于所有18种病毒株中,它们可能是蛋白质编码区。
除了上述12个编码区以外,申请人还预测了3个编码区,Sars63、Sars154和Sars90。Sars63在5个病毒株中均鉴定到但未在其余13个病毒株中鉴定到。该编码区早已报道在NCBI refseq中(Sars6)。申请人不能在本文中过多评价Sars63(NCBIrefseq中的Sars6)的存在。因为它在5个并毒株中鉴定到而在其余13个病毒株中未鉴定到。这是因为病毒株之间该区域的非同义突变密度高。两个编码区Sars154(NCBI中的sars3b)和Sars90(在GZ01毒株中新预测的)只在一个病毒株中鉴定到。由于这两个编码区只在一个病毒株中鉴定到,它们不大可能是蛋白质编码区,ZCURVE CoV(Chen等,2003)分析也提出同一结论。该3个基因在不同病毒株中的位置见表5。
由于此肽文库从各种生物的基因组序列制备,故可以追踪某给定蛋白的进化起源。如果该蛋白富含发现在病毒基因组中的七肽,则可以认为该蛋白是病毒起源的。申请人发现5个核心蛋白(两个多聚蛋白和3个结构蛋白M、N和S)是病毒起源的。其余的(包括3个新预测的)是原核生物起源的。令人感兴趣的是从同一DNA区域申请人在不同读框中得到含有不同起源的肽的蛋白。同一DNA序列如何编码细菌和病毒起源的(蛋白)令人感兴趣。这或许可解释为何在依据与其它已知病毒基因组序列的同源性作的初步分析中未能检测到这些新的蛋白质编码基因。
与现有系统-ZCURVE_CoV的比较表6a和6b给出了用SARS-CoV的Urbani和TOR2病毒株的已知注释比较GeneDecipher和ZCURVE_CoV的结果。
GeneDecipher的结果与已知的注释相一致。就Urbani并毒株而言,GeneDecipher预测到除Sars84(X5)、Sars63(X3)和Sars154(X2)之外的所有已知基因。ZCURVE_CoV预测到Sars84(X5)和Sars63(X3),而两种方法均遗漏了Sars154(X2)。GeneDecipher在该病毒株中顺便预测了ZCURVE_CoV未预测到的4个新基因。要注意的是在这4个基因中Sars78是病毒株TOR2已知的ORF14/Sars9c。这支持了该基因存在于Urbani病毒株中的可能性。然而,ZCURVE_CoV也预测了GeneDecipher未预测到的两个新基因。
GeneDecipher对TOR2病毒株的预测与对Urbani病毒株的预测相同。在该病毒株中,GeneDecipher预测了9个已知基因,但未预测到6个具有已知注释的基因。这6个基因是Sars154(ORF4)、Sars98(ORF13)、Sars63(ORF7)、Sars44(ORF9)、Sars39(ORF10)和Sars84(ORF11)。在这些基因中,Sars154(ORF4)和Sars98(ORF13)也为ZCURVE_CoV所遗漏。应注意Sars44(ORF9)和Sars39(ORF10)均是长度非常小(分别是44和39个氨基酸)的ORF,它们也不全存在于各种SARS病毒株中。GeneDecipher在其它5个病毒株而非在本文考虑的两个病毒株中预测到了Sars63(ORF7)。
突变分析使用多个序列比对(ClustalW)对所有18个病毒株的3个新预测的蛋白质编码基因Sars174、Sars68和Sars61进行分析显示1.SIN2677病毒株中Sars68在位置80具有一个点突变GAT->GGT(D->G)。
2.GZ01病毒株中Sars174在位置204具有同义点突变CGA->CGC和BJ04病毒株中在位置447具有同义突变CTG->CTT。
3.GZ01毒株中Sars61在位置119具有一个点突变CTG->CAG(L->Q)。
这3个新预测的基因存在于所有18个病菌株中而无明显的突变,并且在非冗余数据库中用BLASTP命中不明显。这表明该3个蛋白对SARS-CoV可能有特别重要的生物学功能。因此,这些编码序列可作为抗SARS的候选药物靶点,功能指定申请人总共预测了SARS-CoV中的15个编码区,其中已指定了4个结构蛋白(M、N、S和E)的功能。虽然已指定了多聚蛋白1ab只有复制酶活性,我们的分析暗示该复制酶活性与Sars2628(ORF 1ab的C末端)片段相关。完整的1ab多聚蛋白含有6个功能标签,其中多聚蛋白1a含有与代谢酶相关的标签(表7a)。根据在至少5种不同生物中具有相似功能的蛋白中存在的肽(长度为7个或更多个氨基酸)给多聚蛋白指定功能。其它预测的基因/蛋白质编码区含有的肽存在于较少基因组中。根据这些肽,申请人提出了它们的功能,虽然不大肯定(表7b)。这些发现的生物相关性有待研究。
表3.就注释的基因而言,对HRSV基因组比较GeneDecipher与ZCURVE_CoV的结果
表4GeneDecipher在所有18个病毒株共有的SARS-CoV Refseq中所预测的蛋白质编码基因
表5GeneDecipher在各种SARS-CoV中鉴定到的视为蛋白质编码基因的Sars90、Sars63和Sars154
表6(a).就注释的基因而言,对SARS-CoVUrbani病毒株基因组比较GeneDecipher与ZCURVE_CoV的结果
表6(b).就注释的基因而言,对SARS-CoVTOR2病毒株基因组比较GeneDecipher与ZCURVE_CoV的结果
表7(a)用PLHOST指定SARS(Urbani)基因组中多聚蛋白的功能
表7(b)用PLHOST提出SARS-CoV中一些非结构基因的功能
*未发现保守的八肽。然而,功能已根据仅有的高保守七肽指定。
如上所述,申请人公开了SARS-CoV中的4个新基因,包括Sars78。该分析进一步确证了ZCURVE_CoV的发现(Chen等,2003),即ORF Sars154(作为Sars3b列于Refseq中)不可能是编码区。申请人也给两个多聚蛋白1ab和1a指定了功能。除了1ab多聚蛋白C末端的复制相关功能外,申请人的分析提示多聚蛋白1a可能与代谢酶样的功能相关。总之,多聚蛋白1ab中存在6个肽标签。申请人给其它9个蛋白,包括通过GeneDecipher新预测到的提出了假定的功能。
优点1.本发明的主要优点是提供一种预测蛋白质编码DNA序列而不使用任何外部证据,例如核糖体结合位点、启动子序列、转录起始位点或密码子使用偏爱的新方法。
2.本发明提供蛋白质编码DNA序列的统计学分析方法,所述方法利用经受了进化压力的保守肽中所留生物学信息。
3.本发明提供一种预测蛋白质编码基因的起始位点的简单方法。
4.本发明提供一种检测生物特异性、毒株特异性蛋白质编码DNA序列的方法。
5.本发明提供可用作潜在药物靶点的新蛋白质编码DNA序列。
参考文献Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.,Lipman,D.J.,(1990)“局部序列比对基本检索工具”(Basic local alignment search tool),J.Mol Biol.,215,403-10Bird,A,(1987),“CpG岛可作为脊椎动物核中的基因标记”(CpG islands asgene markers in the vertebrate nucleus),Trends Genet.,3,342-47Chen,L.,Ou,H.,Zhang,R.和Zhang,C.,(2003),“ZCURVE_CoV一种能识别冠状病毒蛋白质编码基因的新系统,及其在分析SARS-CoV基因组中的应用”(ZCURVE_CoVa new system to recognize protein coding genes in coronavirus,and its applications in analyzing SARSCoV genomes),Biochemical and BiophysicalResearch Communications,307,382-8Delcher,A.L.,Harmon,D.,Kasif,S.,White,O.和Salzberg,S.L.,(1999),“用GLIMMER改进的微生物基因鉴定”(Improved microbial gene identification withGLIMMER),Nucleic Acid Research,27,4636-41Kehoe,M.A.等,(1996),“A族链球菌中的水平性基因转移发病机理和流行病学的关系”(Horizontal gene transfer among group A streptococciimplications forpathogenesis and epidemiology),Trends Microbial.,4,436-43Lukashin,A.V.和Borodovsky,M.,(1998),“GeneMark.hmm寻找基因新方法”(GeneMark.hmmNew solution for gene finding),Nucleic Acid Research,26,1107-15Mathe,C.,Sagot,M.F.,Schiex,T.和Rouze,P.,(2002),“当前基因预测方法的能力和应用”(Current Methods of gene prediction their strength and theapplicantsaknesses),Nucleic Acid Research,30,4103-17Medigue,C.等,(1999),“检测和分析DNA测序的错误为获得更高质量的枯草芽胞杆菌基因组序列”(Detecting and Analyzing DNA Sequencing ErrorsTowarda Higher Quality of the Bacillus subtilis Genome Sequence),Genome Research,9,1116-27Pearson,W.R.,(1995),“检索蛋白质序列数据库方法的比较”(Comparison ofmethods for searching protein sequence databases),Protein Science,4,1145-60Salzberg,S.L.,Delcher,A.L.,Kasif,S.和White,O.,(1998),“使用内插Markov模型鉴定微生物基因”(Microbial gene identification using interpolatedMarkov models),Nucleic Acid Research,26,544-8Shibuya,T.和Rigoutsos,I.,(2002),“词典驱动的寻找原核生物基因”(Dictionary-driven prokaryotic gene finding),Nucleic Acid Research,30,2710-25Brahmachari,S.K.和Dash,D.,(2001),“一种鉴定用作药物靶点的肽的计算机方法”(a computer based method for identifving peptides useful as drug targets),PCT国际专利公布(WO01/74130 A2,2001年10月11日)“所报道的严重急性呼吸道综合征(SARS)病例的累积数字”(Cumulativenumber of reported cases of severe acute respiratory syndrome(SARS)),日内瓦国际卫生组织,2003,(2003年4月9日得自http://www.who.int/csr/sarscountry/20030404/en/)Drosten,C.,Giinther,S.和Preiser,W.,(2003),“在严重急性呼吸道综合征患者中鉴定到新的冠状病毒”(Identification of a Novel Coronavirus in Patients withSevere Acute Respiratory Syndrome),N Engl J Med.,(www.nejm.org,2003年4月10日)Ksiazek,T.G.,Dean Erdman,P.H.和Goldsmith,C.S.,(2003),“一种新的严重急性呼吸道综合征相关的冠状病毒”(A Novel Coronavirus Associated with SevereAcute Respiratory Syndrome),N Engl J Med,348,1947-58Marra,M.A.,Jones,S.J.,Astell,C.R.,Holt,R.A.,Brooks-Wilson,A.,(2003),“SARS相关冠状病毒的基因组序列”(The Genome sequence of theSARS-associated coronavirus),Science,300,1399-404Tsang,K.W.,Ho,P.L.和Ooi,G.C.,(2003),“香港的严重急性呼吸道综合征的一系列病例”(A cluster of cases of severe acute respiratory syndrome in HongKong),N Engl J Med,348,1977-85
申请组织街道Rafi Marg市新得里省得里国印度邮编110001电话号码传真号码电子邮件地址impd@vsnl.net<110>组织名科学工业研究委员会申请项目<120>名称一种鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法<130>申请文件参考US 1729<140>当前申请号<141>当前提交日期--序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链(PreSequenceString)ttgttgttga aaggagtgat tatgcaggtc tcaagaagaa aattcttcaa gatctgtgca60 ggaggtatgg cgggaacgtc agctgcaatg ttgggctttg ctccagcaaa cgtattagct120 gcgccacgcg aatataaatt attacgcgcg tttgaatccc gtaacacctg tacatattgc180 gctgtaagtt gcggtatgtt gttatatagc acaggcaaac cttacaattc attaagcagc240 catactggca caaatactcg ttcaaaactc tttcatattg agggtgatcc agatcatcca300 gtcagtcgtg gtgcgctttg cccgaaaggt gctggctcac tcgattatgt caatagtgaa360 agccgttctt tatatcctca atatcgtgcg ccaggttctg ataaatggga acgaatttct420 tggaaagatg ccattaaacg tattgctcgt ttaatgaaag atgaccgaga tgccaacttt480 gttgaaaaag attcaaatgg aaaaacggtt aatcgttggg caacgacagg aattatgact540 gcatcagcaa tgagcaatga agctgcgtta ttaacacaaa agtggattag aatgctcggt600 atggtgccag tatgtaacca agcgaatact tga633<212>类型DNA<211>长度633序列名SEQ ID 1GDC_HINF_5641序列描述
自定义密码子序列名SEQ ID 1GDC_HINF_5641序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgacaaata actgggttga tattaaaaat gccaacttaa tcatcgttca aggcggtaac60 cctgcagaag cccatcctgt tggcttccgt tgggcaattg aagcgaagaa aaacggtgcg120 aaaatcatcg ttattgatcc gcgttttaac cgtacagcat ccgttgctga tcttcatgcg180 ccaattcgtt ctggttctga tattacgttc ttaatgggcg tgatccgtta cctattggaa240 acaaaccaaa ttcaacacga atatgttaaa cactatacca acgcatcatt cttaattgat300 gaaggtttca aatttgaaga tggtttattt gtagggtata acgaagaaaa acgtaactac360 gataaatcta aatggaacta ccaatttgat gaaaatggtc acgctaaacg tgatatgaca420 ttacaacatc ctcgttgtgt cattaacatc ttaaaagagc acgtttctcg ttatacccca480 gaaatggttg aacgtattac aggcgtaaaa caaaaactct tcttacaaat ctgtgaagaa540 attggtaaaa cctctgtgcc aaataaaacg atgacgcatc tatatgcatt aggttttaca600 gagcattcaa tcggtacaca aaatattcgc tcaatggcga taatccagtt acttttaggt660 aatatgggga tgccaggtgg cggtattaac gcattacgtg gacactccaa tgtgcaaggt720 acgacagata tgggcttatt gccaatgtct ttaccaggtt atatgcgttt gccaaacgat780 aaagatacct cttacgatca atacattaac gcaattacac caaaagatat cgttccaaac840 caagtgaact attatcgtca tacttcaaaa ttctttgtta gcatgatgaa aactttctac900 ggagataatg ccactaagga aaatggctgg ggattcgatt tcttaccaaa agcagatcgc960 ctatatgatc caattactca cgttaaattg atgaatgaag gcaaattaca cggttggatt1020 ttac1024<212>类型DNA<211>长度1024序列名SEQ ID 2GDC_HINF_6322序列描述自定义密码子序列名SEQ ID 2GDC_HINF_6322序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg180 cttataccat tgcactaa198<212>类型DNA<211>长度198序列名SEQ ID 3GDC_HINF_124181序列描述自定义密码子序列名SEQ ID 3GDC_HINF_124181序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgtttatgc tttatttaga atttttattt ttactattaa tgctctatat cggtagccgt60 tacggcggta tcggattagg tgttgtttct ggtatcggtc ttgctatcga ggttttcgta120 tttcgtatgc cagtggggaa gcaccgattg atgttatgct tatcattctt gcagtggtga180<212>类型DNA<211>长度180序列名SEQ ID 4GDC_HINF_170553序列描述自定义密码子序列名SEQ ID 4GDC_HINF_170553序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atggctgctg caattcaaca acgtgccgaa cttcaacgcc gtatttggca aactgctaat60 gatgtgcgag gctcggtcga tggctgggat ttcaaacaat atgtgcttgg cacacttttt120 taccgtttta ttagcgaaaa ttttgccaat tacattgaag cgggcgatga aagcgtaaat180 tatgcccaat tacctgatga aatcattaca cagatgccat taaaacgaaa ggctacttta240 tttacccaag ccaattattt aagaatgttg cggctaatgc tggcagcaat cctaatttga300<212>类型DNA<211>长度300序列名SEQ ID 5GDC_HINF_231874序列描述自定义密码子序列名SEQ ID 5GDC_HINF_231874序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
ttgaatactg atttaaaaca gatttttact gatattgaaa actcagcgac gggctttccg60 tctgaacaag atattaaagg gttatttgcc gattttgata ccaccagcaa tcgcttaggc120 aataccgtaa aagataaaaa cgaccgctta acggctgttt tgaaaggcgt ggctgaactt180 gattttggca aatttgaaga taaccacatt gatttatttg gcgatgcata cgaatatctt240 atttctaact atgccgccaa tgcaggcaaa tctggtggcg aattttttac cccacaaagt300 gtttccaaac tcattgctca aattgcaatg cacgggcaaa cctcggtcaa taaaatttat360 gaccctgcag caggttctgg ctcacttttg cttcaagcca aaaaacaatt tgatgaacat420 attattgaag aaggcttttt cgggcaggaa attaaccata ccacatacaa ccttgcccgt480 atgaatatgt ttttgcataa catcaactac gacaagtttg atattgcttt aggcaacacc540 ttaatggaac cacaatttgg cgataataaa cctttcgatg ccattgtttc gaacccgcct600 tactccgtga aatgggctgg ctccgacgat ccaacattga ttaatgatga acgatttgcc660 ccccgcaggc gtgcttgcac caaaatccaa agcggacttt gcctttattt tacatgcgtt720 aagttatctt tcagcaaaag gccgcgcggc gattgtttcc ttccctggta ttttttatcg780 tggcggtgcc gagcaaaaaa ttcgtcaata tttggtggat aa822<212>类型DNA<211>长度822序列名SEQ ID 6GDC_HINF_232170序列描述自定义密码子序列名SEQ ID 6GDC_HINF_232170序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgatgaacg atttgccccc cgcaggcgtg cttgcaccaa aatccaaagc ggactttgcc60 tttattttac atgcgttaag ttatctttca gcaaaaggcc gcgcggcgat tgtttccttc120 cctggtattt tttatcgtgg cggtgccgag caaaaaattc gtcaatattt ggtggataat180 aactatgtgg acgcggtgat tgcgcttgcg ccaaatctct tttttggcac cagtattgcg240 gtgaatattt tggtgctttc caaacacaaa cccaatttat cgatgccagc ggtttattta300 aatctgccac taataaccac attttag327<212>类型DNA<211>长度327序列名SEQ ID 7GDC_HINF_232813序列描述自定义密码子序列名SEQ ID 7GDC_HINF_232813序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgccgcatt tggcaaaatc catatccttt gaagaaatcg cccaaaatga ctacaacctt60 gcagtaagtt cgtatgtgga acaaaaagac actcgtgaag tgattaatat tgatgaactc120 aatgctcaaa ttcgtgaaac tgttaccaat attgaccact tgcgtgcgga aattgacaag180 attgttgcag aaattgaagg gtaa204
<212>类型DNA<211>长度204序列名SEQ ID 8GDC_HINF_233190序列描述自定义密码子序列名SEQ ID 8GDC_HINF_233190序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgacccaat acaaaactat cgctgaatcc aataatttta tcgttttaga tcaatataat60 aaatttgtgg aagaatctaa tgctggttat caaacggaaa ggagccttga gcgtgagttt120 attcgtgatt tacaggctca aggctatgag tatttacaat ggcttaataa tcacgatgaa180 ctgattaaaa acttacgggc gcaattacaa cgcttaaata acgtggtttt ctccgatgca240 gaatggcaac gttttttaga ggaatatttg gataaaccga gcgataatct gattgagaaa300 acccgcaaaa ttcacgatga ttatatttat gattttgtgt tcgataacgg acgcattcag360 aacatctatt tgcttgataa gaaaaatctt gccaataatt ctctgcaagt catcaatcaa420 tttaagcaaa ctggcagcta tgataatcgt tatgatgtga caattttggt gaatggttta480 cccctttatt ga492<212>类型DNA<211>长度492序列名SEQ ID 9GDC_HINF_235441序列描述自定义密码子序列名SEQ ID 9GDC_HINF_235441序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
atggtttacc cctttattga attaaaaaaa cgcggcgtgg cgattcgtga agcctttaac60 caaattcacc gttacagcaa agaaagtttc aataaagaaa attctctcttt aaatatatt120 cagatttttg tcatttctaa tggcacggat actcgctatt ttgctaatac gactaaacgc180 aataagaata gctacgactt cacaatgaat tgggcaacgg caaaaaatac tctgattaaa240 gatttaaagg attttaccgc gactttcttg caaaagaata ctttgctcaa tgtgttggta300 aattactgcg tgtttgatgt gagtgatacg ttgttaatta tgcgtccgta tcaaattgcc360 gcaacagaac gtattttatg gaaaattcaa atttcttact tagcaaaaaa ttggagtaat420 cgtgaaagtg gtggctatat ttggcatacc acaggttcag gcaaaaccct caccagtttt480 aaagcctctc gccttgcgac tgaacttgat tttattgata aagtcttttt tgtggtcgat540 cgtaaagact tagactacca aacgatgaaa gaatatcagc gtttttcgcc tgatagcgtg600 aatgggtcgg aaagtaccgc tgggcttaaa cgcaatattg aaaaagatga taacaaaatt660 atcgtaacca ccattcaaaa attgaataat ttaatgaaaa gtgaagaaaa cctgtctatt720 tatcaaaaac aggtggtctt tattttcgat gaagcacatc gctctcaatt tggcgaagca780 caaaaaaatc taaaacgtaa attcaaaaaa ttctatcaat ttggttttac tggcacgcct840 attttccctg aaaacgcatt aggtgcggaa acgacagcaa gtgtgttcgg tgcggaattg900 cattcttatg tgattaccga tgctattcgt gatgacaaag tactgaaatt caaagtcgat960 tacaacgatg tccgcccaca atttaaagcc ttagaaacag aaaaagatcc tgaaaaattg1020 accg1024<212>类型DNA<211>长度1024序列名SEQ ID 10GDC_HINF_235913序列描述自定义密码子序列名SEQ ID 10GDC_HINF_235913序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atggatataa taaagcctat atgcacaggt tttttttata acgataataa tgttttagga60 gatttgatga aaaatttcaa atattttgct cagagttatg tggattgggt tattcgtctt120 gggcgtcttc gtttttctct tttaggcgtg atgattctcg cggttttagc tctttgtact180 cagattttat ttagtctatt tattgttcat cagatatctt gggtagatat ttttcgttcg240 gtaacttttg gcttactcac tgcgcctttt gttatttatt ttttcacttt attagtagaa300 aaacttgaac attctcgtct tgatctttct agctcggtta atcgattgga aaatgaggtc360 gccgagcgaa ttgctgctca gaaaaaatta tcccaagcat tggaaaagtt agaaaaaaat420 agccgtgata aaagtacctt acttgccaca ataagccatg aatttcgcac gccattgaat480 gggattgtcg ggcttagcca gattttactt gatgatgaat tggatgatct ccagcgtaat540 tatttaaaaa ctatcaacat aagtgcggtc agtttaggct atatttttag cgatattatt600 gatttggaaa aaattgatgc cagccgaatt gaattaaatc gccagccaac agatttccct660 gccttattaa acgatattta taattttgct agtttcctcg ccaaagaaaa aaatcttatt720 ttttctttag agcttgaacc taatttgcct aattggttga atcttgatcg tgttcgcttg780 agccaaattt tgtggaactt aattagtaat gcggtgaagt ttacggatca gggaaatatt840 attcttaaaa ttatgagaaa tcaggattgt taccatttta ttgtgaaaga tacaggaatg900 gggatttcac ctgaagaaca aaaacatatt tttgaaatgt attatcaagt gaaagaaagc960 cgccagcaaa gtgcgggtag cggtattggg ttggctattt ctaaaaatct tgctcagtta1020 atgg1024<212>类型DNA<211>长度1024序列名SEQ ID 11GDC_HINF_240336序列描述自定义密码子序列名SEQ ID 11GDC_HINF_240336序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg180 cttataccat tgcactaa198<212>类型DNA<211>长度198序列名SEQ ID 12GDC_HINF_243018序列描述自定义密码子序列名SEQ ID 12GDC_HINF_243018序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgaatattc atggtttagc aaaacttaat ggtaatgtca ctttaataga tcacagccaa60 tttacattga gcaacaatgc cacccaaaca ggcaatatca aactttcaaa tcacgcaaat120 gcaacggtaa ataatgccac gttaaacggc aatgtgcatt taacggattc tgctcaattt180 tctttaaaaa acagccattt ttggcaccaa attcagggcg acaaagacac aacagtgacg240 ttggaaaatg cgacttggac aatgcctagc gatactacat tgcagaattt aacgctaaat300 aatagtactg ttacgttaaa ttcagcttat tcagctagct caaataatgc gccacgtcac360 cgccgttcat tagagacgga aacaacgcca acatcggcag aacatcgttt caacacattg420 acagtaaatg gtaaattgag cgggcaaggc acattccaat ttacttcatc tttatttggc480 tataaaagcg ataaattaaa attatccaat gacgctgagg gcgattacac attatctgtt540 cgcaacacag gcaaagaacc tgtgaccctt gagcaattaa ctttgattga aagcttagat600 aataaaccgt tatcagataa gctcaaattt actttagaaa atgaccacgt tgatgcaggt660 gcattacgtt ataaattagt gaagaataag ggcgaattcc gcttgcataa cccaataaaa720 gagcaggaat tgctcaatga tttagtaaga gcagagcaag cagaacaaac attagaagcc780 aaacaagttg aacagactgc tgaaaaacaa aaaagtaagg caaaagcgcg gtcaagaaga840 gcggtgttgt ctgatacccc gtctgctcaa agcctgttaa acgcattaga agccaaacaa900 gttgaacaga ctactgaaac acaaacaagt aagccaaaaa caaaaaaagg gcggtcaaaa960 agagcattga gtgcagcgtt ttctgatacc ccgtttgatc taagccagtt aaaggtattc1020 gaag1024<212>类型DNA<211>长度1024序列名SEQ ID 13GDC_HINF_274892序列描述自定义密码子序列名SEQ ID 13GDC_HINF_274892
序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgaaaaaaa ctgtatttcg tcttaatttt ttaaccgctt gtgtttcatt agggatagca60 tcacaagcct gggcaggtca tacttatttt gggattgact accaatatta tcgtgatttt120 gccgagaata aagggaagtt cacagttggg gctaaaaata ttgaggttta taacaaagaa180 gggcaattag ttggcacatc aatgacaaaa gccccgatga ttgatttttc cgtggtgtcg240 cgtaacggcg tggcggcatt agtaggcgat cagtatattg tgagcgtggc acataacggc300 ggatataacg atgttgattt tggtgcagaa ggacgaaacc ctgatcagca ccgctttact360 tatcaaattg taaaaagaaa taattatcaa gcttgggaga gaaagcatcc ttatgatgga420 gattatcata tgcctcgttt acataaattt gtaactgaag ctgaacctgt gggtatgaca480 acaaatatgg atggaaaagt atatgctgat agagagaact atcctgagcg tgtacgtata540 ggctcaggac gtcagtattg gcgtacagat aaagatgaag aaacgaatgt acatagttca600 tattatgtct caggtgcata tcgttatctt actgcaggaa atacccatac tcagagtgga660 aatggtaatg gtacagtcaa tcttagtggt aatgtagtta gccctaatca ttatggtcca720 ttaccaacgg gtggttctaa aggcgatagc ggttcgccaa tgtttattta tgatgcgaag780 aagaaacaat ggcttataaa tgctgtatta caaactgggc atcctttttt cggaagaggt840 aatgggtttc agttaatacg tgaagaatgg ttttataatg aagttcttgc ggttgatacc900 cctagtgttt ttcaacgcta tattccccca ataaatggac attattcctt tgtatcaaat960 aatgatggta caggtaaatt aactttaact agacctagta aagatggctc taaagcaaaa1020 tcag1024<212>类型DNA<211>长度1024序列名SEQ ID 14GDC_HINF_276992序列描述自定义密码子序列名SEQ ID 14GDC_HINF_276992序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgggggaaa acgcgatgaa tttaagtcgt cgagacttta tgaaagccaa tgcggctatg60 gcagccgcaa cggcagcggg gctaaccatc ccagtcaaaa atgtggttgc ggctgaatcc120 gaaattaaat gggacaaagc agtatgtcgt ttctgtggta ccggttgtgc agtattagtt180 ggtactaaag atggacgtgt tgtggcatct caaggcgatc ctgatgcaga agtaaaccgt240 ggtttaaact gtattaaagg ttatttcttg ccaaaaatta tgtacggtaa agaccgttta300 acgcagccgc ttttacgtat gacaaacgga aaatttgata agaacggcga ttttgcgcca360 gtttcttggg attttgccgt tcaaaacaat ggctga396<212>类型DNA<211>长度1024序列名SEQ ID 15GDC_HINF_370413序列描述自定义密码子序列名SEQ ID 15GDC_HINF_370413
序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgataagaa cggcgatttt gcgccagttt cttgggattt tgccgttcaa aacaatggct60 gaaaaattca aagaagcgtt caaaaagaac ggtcaaaatg cagtaggtat gtttagttct120 ggtcagtcta ccatttggga aggctatgca aagaacaaac tttggaaagc aggttttcgt180 tctaacaacg tagacccgaa tgcgcgtcac tgtatggcat ctgcagcggt tgcgtttatg240 cgcaccttcg gtatggatga acctatgggt tgttataacg acattgaaca ggcagatgct300 tttgttcttt ggggctcaaa tatggcggaa atgcacccaa ttttgtggtc gcgtattact360 gatcgccgta tttctaatcc tgatgttcgt gtcactgtac tttctactta cgaacatcgt420 agttttgaac ttgccgatca cggtttgata tttacaccgc aaactgattt ggcaattatg480 aactacatca tcaattatct tattcaaaat aatgcgatta attgggattt tgttaataaa540 cataccaaat ttaaacgcgg agaaacgaat attggctatg gtttgcgtcc agagcatcca600 ttagaaaaag acacgaatcg taaaacagct gggaaaatgc acgattcttc ttttgaagaa660 ttaaagcaac ttgtatcaga atatacagtg gaaaaagtat cgaaaatgtc tgggttagat720 aaagtccagt tagaaacttt agcgaaactt tatgctgatc caacgaagaa agtggtttcc780 tactggacaa tgggctttaa ccaacataca cgtggtgtgt gggtaaacca attaatctac840 aatattcatt tacttactgg aaaaatttca atcccaggtt gtgggccatt ttcattaact900 ggtcagcctt ctgcttgtgg tacggcgcgt gaagtaggtt cattccctca tcgtttacct960 gccgacttag tggtaactaa tccgaaacac cgtgaaattg ctgaacgtat ttggaaatta1020 ccaa1024<212>类型DNA<211>长度1024序列名SEQ ID 16GDC_HINF_370747序列描述自定义密码子序列名SEQ ID 16GDC_HINF_370747序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg180 cttataccat tgcactaa198<212>类型DNA<211>长度198序列名SEQ ID 17GDC_HINF_628407序列描述自定义密码子序列名SEQ ID 17GDC_HINF_628407序列
<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttggttatgt tcaatgattt tttggcaaca ttcagccagc aattaacacc tcaaatgtgg60 ggcgttgtcg caaccgcaac ttatgaaact gtttatatca gttttgcatc taccctactt120 gctgtactag tcggcgtgcc tgttggcata tggacttttt taactggaaa aaatgagatt180 ttacaaaata accgcactca ttttgtgtta aacacgatta ttaatattgg gcgttccatt240 ccatttatta ttttgctcct aatcttatta cctgtaactc gtttcatcgt gggaactgta300 ttaggtacaa cagcagcaat tattccattg agtatttgtg caatgccatt cgtggctcgc360 ttaactgcta atgcactaat ggaaattcca aatggtttaa ccgaagcagc tcaagcaatg420 ggggctacta aatggcaaat tgttcgtaaa ttctatttgt cagaagctct acctacgcta480 attaatggcg ttactcttac gctagtcact ttagttggtt attctgcaat ggcaggaaca540 caagggggcg gtggtttagg tagcctcgct atcaactacg ggcgtatatc gcaatatgcc600 ttatgtaact tgggtggcaa ccattattat tgtgctattc gttatgatta g651<212>类型DNA<211>长度651序列名SEQ ID 18GDC_HINF_654365序列描述自定义密码子序列名SEQ ID 18GDC_HINF_654365序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg180 cttataccat tgcactaa198<212>类型DNA<211>长度198序列名SEQ ID 19GDC_HINF_661444序列描述自定义密码子序列名SEQ ID 19GDC_HINF_661444序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
ttgcgtaaag atgcactacc cgcatttttc acagacgtaa atcaaatgta tgatgcctta60 ttgaataaat caggggcaac aggtgtattt actgatttcc cagatacttg cgtggaattc120 ttaaaaggaa taaaataa138<212>类型DNA<211>长度138序列名SEQ ID 20GDC_HINF_737160序列描述自定义密码子序列名SEQ ID 20GDC_HINF_737160序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg180 cttataccat tgcactaa198<212>类型DNA<211>长度198序列名SEQ ID 21GDC_HINF_775792序列描述自定义密码子序列名SEQ ID 21GDC_HINF_775792序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgcctaaac ctgaaccaat accacgaccg aggcgtttagcactatgctt tgcaccttca60 gccggagata gagtatttaa acgcatctct tactcctcca ctttaaccat gtatgaaact120 tggttaatca taccacgtac tgcaggcgta tcaattaact caacagtgtg gtgtatatgg180 cgaagaccaa gaccacgcaa ggtagcttta tgcttcggta aacgagcaat tgagctacga240 acttgtgtta ctttaatagt tttagccatt attcattacc ccaagatttc atcaacagtt300 ttaccgcgtt ttgcagcaac catttctggt gatttcatat ttgctaatgc atcaatagtt360 gcacgaacaa cgttaattgg gttggtagaa ccatacgctt tagaaagaac gttacgtaca420 cctgcaactt ccaataccgc acgcattgca ccaccagcga tgatacctgt accttcactt480 gctggctgca taaatacacg tgaaccagta tga513<212>类型DNA<211>长度513
序列名SEQ ID 22GDC_HINF_848166序列描述自定义密码子序列名SEQ ID 22GDC_HINF_848166序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgtttatat atgggggaat aaatatgcaa attacacttt caaatacctt agcgaatgat60 gcttggggaa aaaatgcgat tttgagcttt gactctaata aagctatgat tcatttaaaa120 aataatggaa aaactgaccg cactttagtt caacaagctg ctcgtaaatt gcgtgggcaa180 ggaatcaaag aggtggagtt ggtcggcgag aaatgggatt tggaattttg ctgggcgttt240 tatcaaggtt tttataccgc aaaacaagat tacgcgattg agtttccaca tttagatgat300 gaaccgcaag atgaattgtt agcacgtatt gaatgtggcg attttgtgcg tggaattatt360 aatgaaccag cacaaagttt aacgcctgtg aaattagtag agcgagcggc tgaatttatc420 ttaaaccaag cggacattta taatgaaaaa agtgcggtaa gttttaagat tatttctggc480 gaggaacttg agcaacaagg ttatcacgga atttggactg tgggtaaagg ctctgcgaac540 ttgccagcca tgttgcaact tgatttcaat ccaacacagg attcgaatgc gcccgtgtta600 gcttgtttag ttggtaaggg gattactttt gatagtggcg gctatagtat caaaccaagt660 gatggtatga gtacaatgcg aactgatatg ggcggggctg cattattaac gggggcttta720 ggtttcgcta tcgctcgtgg attaaatcaa cgcgttaagc tgtatttatg ttgcgcagaa780 aatttggtaa gcaataatgc ctttaagcta ggcgatatta ttacttataa aaatggcgtg840 agcgcagaag tactgaatac tgatgcggaa ggtcgtttgg tgttagctga tggattgatt900 gaggctgata accaaaatcc aggttttatt attgattgcg cgactttaac tggcgcagca960 aaaagtggct gtaggaaacg actatcattc tgtattatct atggatga1008<212>类型DNA<211>长度1008序列名SEQ ID 23GDC_HINF_928073序列描述自定义密码子序列名SEQ ID 23GDC_HINF_928073序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtggctgtag gaaacgacta tcattctgta ttatctatgg atgatgaact tgtgaaaaat60 cttttccaat ccgcacaagc agaaaatgaa cctttctggc gtttaccatt tgaagatttt120 catcgttcac aaattaattc atcttttgcc gatattgcta atattggttc ggttccagtt180 ggagctgggg caagcactgc aacggcattt ttatcgtatt ttgtaaaaaa ttataaacaa240 aattggttgc atattgattg ctccgcgact tatcgtaaat ctggtagtga tttatggtct300 gttggggcaa caggaattgg tgtgcaaact ttagctaatt taatgttatc aagatcattg360 aagtaa366<212>类型DNA<211>长度366
序列名SEQ ID 24GDC_HINF_929037序列描述自定义密码子序列名SEQ ID 24GDC_HINF_929037序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgccaattg aattaaaagt agaaggttta gtgggtaaac caaacgagaa aatttctgcg60 gcagaatttc gtcaaaaatg tcgtgaatac gcggcggaac aggtcgaggg tcaaaagaaa120 gactttatcc gtttaggtgt gttgggcgat tgggataatc catatctcac gatgaatttc180 gataccgaag cgaatattat ccgcacttta ggtaaagtga ttgaaaatgg tcatttgtat240 aaaggctcaa aaccagttca ctggtgtttg gattgcggtt cttctttagc agaagcagaa300 gtggaatatg aagacaaagt ttctccgtca atttacgttc gtttccctgc ggaaagtgcg360 gatgaaattg aagctaaatt ttctgcacaa ggtagaggac aaggtaaatt atcagccatc420 atttggacta ccacaccttg gacgatgcca tctaaccgtg cgattgcggt gaatgcagac480 tcagaataca acttagtcca acttggcgat gagcgtgtaa ttttagctgc tgaattagtt540 gagtcagtgg caaaagcggt gggtattgag cacattgaaa ttctgggttc tgtaaaaggt600 gatgatcttg aattaagccg tttccatcat ccgttctatg attttactgt gccagtgatt660 ttaggcgatc acgtaaccac tgatggcggt acaggtttag tacataccgc acctgatcac720 ggtttagacg actttatcgt gggtaaacaa tatgatttac caatggcggg tcttgtatcg780 aatgatggta aatttatttc aacgaccgaa ttctttgcag gcaaaggcgt atttgaagca840 aatccgcttg tgatagaaaa attacaagaa gtaggtaact tattaaaagt tgaaaaaatc900 aaacacagct atccacactg ctggcgtcac aaaacgccaa ttattttccg tgcaacaccg960 caatggttta tcggcatgga aacgcaaggt ttacgccaac aagcattagg cgaaattaaa1020 caag1024<212>类型DNA<211>长度1024序列名SEQ ID 25GDC_HINF_1018846序列描述自定义密码子序列名SEQ ID 25GDC_HINF_1018846序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttggaaaata aaatgacagt cgattacaaa aacactctta acctaccgga aaccagcttt60 ccaatgcgcg gtgatttagc taagcgcgaa cctgataagt ag102<212>类型DNA<211>长度102序列名SEQ ID 26GDC_HINF_1021582
序列描述自定义密码子序列名SEQ ID 26GDC_HINF_1021582序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgaagataa ctcattgtaa attaaagaaa tctatacaaa ataagctact tgaatttttt60 gtattagaag ttacagcccg agcagcggct gatttactcg atatctaa108<212>类型DNA<211>长度108序列名SEQ ID 27GDC_HINF_1082407序列描述自定义密码子序列名SEQ ID 27GDC_HINF_1082407序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgtttctgg ttggaaacct tttgaggtgg gtttggcttg cgctttttat cattgcgcaa60 atttgggctt atgtacaaac acctgattct tggttagcaa tgatttctgg tatttctggt120 attttgtgtg tggtattggt aagtaaaggt aaaattagta attatttctt tggattgatt180 tttgcctata cttattttta tgttgcttgg ggatcgaatt tcttaggcga aatgaacacc240 gtactttacg tatatttgcc ctctcaattt attggttact ttatgtggaa agccaatatg300 caaaatagcg atggtggaga aagcgtgatt gcaaaagcgt taactgttaa aggatggatg360 acattaattg ttgtgactac ggttggtact ttgctttttg ttcaagcatt acaagcggct420 ggtggtagct caacaggttt agatggtcta actacaatta ttacggttgc ggcacagatt480 ttaatgattt tgccgttatc gtga504<212>类型DNA<211>长度504序列名SEQ ID 28GDC_HINF_1144501序列描述自定义密码子序列名SEQ ID 28GDC_HINF_1144501序列
<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgtttagtg gcgaacatga tgcttgcgat tgctatgtgg acctacaagc aggttctggc60 ggcaccgaag ctcaagattg gacagaaatg ttgctccgta tgtatctccg ttgggctgaa120 agcaaaggtt ttaaaacaga actgatggaa gtctctgacg gcgatgtagc tggattgaaa180 tcagcaacca ttaaagtgag cggtgaatat gcttttggtt ggttacgaac agaaacgggg240 attcatcgtt tagtgcgtaa aagtccattt gattccaata accgtcgtca cacatcattc300 agcgcagcat ttgtctaccc tgaaattgat gatgatattg atattgaaat caatcctgct360 gatttacgta ttgatgttta tcgtgcatca ggggcaggtg gtcagcacgt aaacaaaact420 gaaagtgcgg tgcgaattac ccatatgcca agtggcattg tggtgcaatg tcaaaacgac480 cgttcacagc acaagaacaa agatcaagca atgaaacaat taaaagcgaa attgtatgag540 cttgaattac aaaagaaaaa tgcggataaa caagcaatgg aagataataa atctgacatt600 ggttggggaa gccaaattcg ctcttatgta ttagacgatt cacgcattaa agatttacgt660 actggcgtag aaaaccgtaa tacgcaagcc gtattagacg gggatttaga tcgatttatt720 gaagcgagtt taaaagcggg cttgtag747<212>类型DNA<211>长度747序列名SEQ ID 29GDC_HINF_1279189序列描述自定义密码子序列名SEQ ID 29GDC_HINF_1279189序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgcttggta acgaaaaaca agctgaagca caagctaaat atgcggaaga cacgctgaaa60 caagcacgcg attttgctaa acaacatcat aaaacagcct atttagcgcg taatgcggat120 ggcttacaaa ctggtcaaaa aggttcgatt catacggaag caatggaatt ggttggcttg180 gaaaacgtcg cagagggaga acaaaaaggc ttaactcaag tttcaatgga acagctttta240 ttgtga246<212>类型DNA<211>长度246序列名SEQ ID 30GDC_HINF_1347200序列描述自定义密码子序列名SEQ ID 30GDC_HINF_1347200序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
ttgccacgta tttttgccgc ttgttttgtc ggggcggcgc ttgcttgtgg gggcgcaact60 tatcaaggta tgtttaaaaa tccgcttgtt tcgccagata ttttgggtgt ttcagcgggg120 gcaggttttg gggcaagttt ggcaattttt tataatttgc caatgattta tatccaattt180 tttgctttta gcggtggcat tttagctgtg ttatgtgtat cgctcattgc ctcgcgtagt240 cgtacacaag atcctatttt agtgctggtg ctttctggga ttgcaattgg ttctttactt300 ggtgcaggca tttctttgtt aaaaattctt gcggatcctt tcactcaatt accttcaatc360 actttttggc tacttggtag cctgacggct attaatcaac aagatttaat tcaattgatc420 ccgatgttgt tgctagggat tgttcccatt tttttattac ttactgatac gctggctcgc480 acgattgcac cgattgaact gccactcggt attctgactt ctgcttgtgg ttattag537<212>类型DNA<211>长度537序列名SEQ ID 31GDC_HINF_1347942序列描述自定义密码子序列名SEQ ID 31GDC_HINF_1347942序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgaagaact cattacggga gttaaaacnn gattatactg tggttatagt aactcataat60 atgcaacaag ctacacgttg ctccgactat acggcattta tgtatttggg tgaattagtt120 gaatttggtc aaacacaaca aatttttgat agacccaaga tacaacgtac agaagattat180 attcgcggta aaatggggta g201<212>类型DNA<211>长度201序列名SEQ ID 32GDC_HINF_1476415序列描述自定义密码子序列名SEQ ID 32GDC_HINF_1476415序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
atgattagtc tacaagaaac caaaatagct gtgcaaaatc taaatttcta ctatgaggat60 tttcatgcat taaaaaacat taatttacgt atcgctaaga ataaagtgac cgcctttatt120 ggtccttcag gttgcggtaa atctacttta ttgcggagtt ttaatcggat gtttgaacta180 tatccaaatc aaaaagctac tggtgaaatt aatttagacg gtgaaaattt actcacaaca240 aagatggata tttctctgat tcgtgctaag gttggtatgg ttttccaaaa accaacgcca300 tttccaatgt cgatttatga taatattgca ttcggtgttc gtttgtttga aaaattatta360 aaagaaaaga tgaatgaacg agtagaatgg gcattgacta aggccgctct ttggaatgaa420 gtgaaagata aattacataa aagcggagat agtttatctg gcggacaaca gcaacgcttg480 tgcattgctc gagggattgc tattaaacct agtgtgttgt tgttagatga accttgttcg540 gcattagatc ctatttcgac tatgaaaatt gaagaactca ttacgggagt taaaacnnga600 ttatactgtg gttatagtaa ctcataa627<212>类型DNA<211>长度627序列名SEQ ID 33GDC_HINF_1476557序列描述自定义密码子序列名SEQ ID 33GDC_HINF_1476557序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgagccagc ttaatattca atttccgaca aaattcaaac cgctctttga atctatttgg60 cggtttatta ttttctacgg tgggcgaggt tcaggtaaaa gttttagtat cgctagagca120 ttagtattgc gagcctatca atcgcctgtt cgagttttgt gttccgtgaa attcagaaat180 cgatttctga ttctgtga198<212>类型DNA<211>长度198序列名SEQ ID 34GDC_HINF_1505851序列描述自定义密码子序列名SEQ ID 34GDC_HINF_1505851序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
gtggttcccg agttcattat tgtttcttta atcttggtgg cacagtccat gaaattggcg60 ttaaacaaat ggcttatcat atttggcaac gctatagctc ttcacataaa gtacgcttta120 ttgcgattaa actttgaggg agttgttggt gagattttag agaaagtcga taacggccaa180 atgggcgttg tattaaaacg gatgatggtg cgagccgcaa gtaaagtcgc tcaacgtttc240 aatattgaag caattgtgac aggggaggca ttagggcaag tttctagcca aactttaacc300 aatttacgct tgattgatga agccgctgat gccttagtat tgcgtccgtt aattacccat360 gataaagaac aaattatcgc gatggcgaaa gaaattggca ctgatgatat tgcaaaatct420 atgccagaat tttgtggcgt gatttcaaaa aatcctacga ttaaagcggt tcgtgaaaag480 attcttaaag aagaagggca ttttaatttt gagattcttg aaagtgcggt acaaaatgca540 aaatatttag atattcgcca gattgcagaa gaaacagnaa aagcagtcgt ggaagtcgag600 gcaatttctg tgttaggtga aaatgaagtg attttggata ttcgtagccc agaagaaacg660 gatgaaaagc catttgaatc aggtacacat gacgtcattc aaatgccgtt ctacaaactt720 tcttctcaat ttggtagcct tgatcaaagt aaaagttacg tgttgtattg tgaacgtggt780 gtgatgagta aattacaagc cttatatttg aaagaaaatg gtttttcaaa tgtgcgtgta840 tttgcaaaaa acattcatta a861<212>类型DNA<211>长度861序列名SEQ ID 35GDC_HINF_1524561序列描述自定义密码子序列名SEQ ID 35GDC_HINF_1524561序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttggccatcg ctattggtgg aggtaataga ggtaatgcaa gcggagtatt gcgccaaaat60 tttgcagaag ataaagcaaa aaagaccgct tcgaagctcg tgggcgtaat ggctcactat120 tttggcggta agtcgtttta tctgcccgca ggtgataaaa tcaaagaagc cttacgagat180 gcacaaattt atcaagaatt caacggtaag aatgtacctg acctaataaa aaaataccga240 ttgtcagaaa gcacaattta tgcgatctta cgcaatcaac gaacgcttca aagaaagcga300 catcagatgg attttaattt tagttag327<212>类型DNA<211>长度327序列名SEQ ID 36GDC_HINF_1568974序列描述自定义密码子序列名SEQ ID 36GDC_HINF_1568974序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
ttgtttaggt ggcactacct tggaggtttt acagtaatgc cagatacaaa taacacagaa60 accaataata agatcgaact ctatctaaat ggcaaaattt tatccggttg gaaaagcctt120 aacctgcaac gctcgctgga atcaatgagt ggtcgttttg atttaggcat tgctgtgcga180 cctgaagatg atatatcagt gcttgccgca ggttcgccac tggtgctgaa aatgggcggg240 caaaccgtga ttaccggtta cttggatgaa atcaaacaac gcgtaagcgg taacgacaaa300 actatctctg tgagtggacg agataaaact tgcgacttgg tggattgtgc cattatccac360 aacagctacc aattcaaaaa ccaaactgcc aaacaaattg ccgaagccat ctgtaaacct420 tttggcatta gcgtagtatg gcaagtgcaa gcccctgaag ccaatgaacg aatccctgtc480 tggcaagtag aaccaggcga aaccgccttt gataatttaa gcaaaatcgc ccgacacaaa540 ggcgtgttag tcaccagcga cgtggacggc aatttgcttt tcaccgagcc gagcaacaag600 caagtcggta atcttaccct tggcgaaaac ttgctcgaac tggaacaaac cgacagctgg660 ttgcaacgct tttcgctcta tcgcgtgatt ggtgacgcag aacaaggcgg cgccaaaggt720 gataccaaaa ccaaaaacaa agcggcaaaa ggcaaggaaa aagatgatgg cgtggtagaa780 gatcccgata tttacccagg accagcagaa ggaggcaagt aa822<212>类型DNA<211>长度822序列名SEQ ID 37GDC_HINF_1586944序列描述自定义密码子序列名SEQ ID 37GDC_HINF_1586944序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgaaggttt cttaccggct aaataattgt ctaagtttaa agttagcgct gatcccatta60 ttaatactat tatttgttgt tatgggatcg gtgctttctt taatcgcaaa attagatttt120 tatttttttc aacaaatatt atttaattcc gaattgcatt ttgcattgct aatgtcattg180 ggaacgtctc ttttttcttt gatattagca ttatgtattg ctattccatc tgcatggcga240 atgagtcaag tgcggttgcc ttttcaatca ttttttgaca ctttgtttga tttaccaatg300 gttttgccac cattagtcac aggactaagt ttgcttctac tttttagttc acaagggata360 ttggctgaac tacttccttt tataagtaaa tggatttttt cccctgtagg gatcattatt420 gctcagactt atattgcgag ttcgatttta ttgcgttgta gcgagccatt aaaactgcga480 aaaaaaacca ttaaaactac gaaaataaaa ccttga516<212>类型DNA<211>长度516序列名SEQ ID 38GDC_HINF_1594339序列描述自定义密码子序列名SEQ ID 38GDC_HINF_1594339序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
ttgacaaaac gtaaaaatgt ttcctttact tatgaaaatt atactgttac gccattttgg60 gatacgctca agttaagcta ttcacaacaa agaattacaa caagagcaag aacagaagat120 tactgtgatg gtaatgaaaa atgtgactct tataagaatc ctttagggct tcaattaaaa180 gagggaaaag tcgttgatcg gaatggtgat cctgttgagt tgaagcttgt tgaggatgaa240 caaggtcaga aacgacatca agttgttgat aaatataata atccttttag tgtagcctct300 ggaactaata atgatgcttt cgtaggtaaa caattatctc cttctgagtt ttggttagat360 tgctctattt ttaattgtga taagcctgtc agggtttata aatatcagta tagcaaccaa420 gaaccagagt cgaaggaagt tgagttaaat agaaccatgg aaattaatgg aaagaaattt480 gctacttatg agtctaataa ttatagagat agataccata tgattttacc aaattctaaa540 ggttacttgc ctttggatta taaagagcgt gatttaaata caaagacgaa acaaattaat600 ttagatttaa caaaagcctt tactctcttt gagattgaaa atgaactttc ctatggtggt660 gtttacgcga aaacgaccaa ggaaatggtg aataaagcag gatattatgg gcgtaatcct720 acttggtggg cggagagaac gttagggaaa tcattgctta atggattgag aacgtgtaag780 gaagattctt catataatgg gctactatgt cctcgtcatg aacctaaaac gtctttctta840 attcctgtag aaacaacaac taagtcttta tattttgcag acaatatcaa gttgcacaat900 atgttgagcg tagatttagg ttatcgttat gatgatatta aatatcagcc agagtatatt960 cctggtgtaa cacctaagat tgcagatgat atggtcagag aattatttgt tccactccct1020 ccag1024<212>类型DNA<211>长度1024序列名SEQ ID 39GDC_HINF_1634710序列描述自定义密码子序列名SEQ ID 39GDC_HINF_1634710序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链ttgcgtgaac gtagttcgct ttctgctcta atggccaaaa cgattgaatg ggattttata60 acagaaaacc ccctaaaata tcttgagaaa ccaaaagcgc cagcaccaag aactcgtcga120 tataatgaac atgaaattga gcgtctgatt tttgtgtcag gttatgatgt cgaacatatt180 gaaccgccaa aaaccttaca aaattgcacg ggggcggcat ttctttttgc tatagagaca240 gcaatgagag caggggaaat agcaagttta acttggaata atattaattt tgaaaagcgc300 accacctttt tgccaattac taaaaatgga cattcacgca cggtgcctct ttcggtaaaa360 gcaatagaga ttttacaaca tcttacttcg gtaaaaacag aaagtgatcc gcgagtattc420 caaatggaag cacgccaact ggatcacaac ttccgcaagc tcaaaaagat ggaagggctt480 gaaaatgcca atttacattt tcacgacacc cgccgtgaac gattggcaga aaaagtggat540 gtaatggtat tagccaaaat atcgggccat agagatctca gtattctgca aaatacttat600 tacgcacctg atatggcaga aggctataaa acaaaggcgg gttatgatct gaccccaacc660 aaaggcttga gccaacggaa ttttttcttc tttaatgaaa acttcatcgt tttcacaaca720 aatccaccga tagtcattaa gctgtaa747<212>类型DNA<211>长度747序列名SEQ ID 40GDC_HINF_1638626序列描述自定义密码子序列名SEQ ID 40GDC_HINF_1638626
序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atggcgacaa ttatcaagaa tggcaagcgt tggcacgcac aagtgcgcaa gtttggcgtg60 agcaaatcag ccattttttt gactcaagca gacgcaaaaa aatgggcaga aatgctcgaa120 aaacagcttg aatcaggaaa gtataatgaa atccctgata ttacattgga tgaactcatt180 gataagtatc taaaagaagt cactgtaacc aagcgcggga aacgtgaaga gcgcataaga240 ctactgcgtc tttctcgaac tccgcttgcc gcaatatctt tacaagaaat aggaaaagca300 cactttcgtg agtggtaa318<212>类型DNA<211>长度318序列名SEQ ID 41GDC_HINF_1639409序列描述自定义密码子序列名SEQ ID 41GDC_HINF_1639409序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atggaagccg ttcaattaga caaaaatcaa gagcctaatt ataaaggtta tagcggtagc60 ttgattcatc ctgcatttca acagcaaaca acaaaacgtg aaaaaccgag tacaccatta120 cctagtttgg atttgctttt aaaatatccg ccaaatgaac aacgcattac accagatgaa180 ataatggaaa cctcacagcg tattgaacaa caattacgca attttaatgt aaaagccagc240 gtaaaagatg tgcttgttgg ccctgttgtt acgcgttatg aattagaatt acagccgggt300 gtgaaagcat caaaagtcac gagcatcgat accgatttag caagagcatt gatgtttcgt360 tctattcgtg tggcagaggt gattccaggt aaaccttata ttggtattga aaccccaaat420 cttcatcgtc aaatggtgcc attacgtgat gtattagata gcaatgaatt ccgtgatagc480 aaggcaactt tacctattgc tttaggtaaa gatattagtg gcaaaccagt cattgttgat540 ttagcgaaaa tgccacattt attggtagca ggttctacgg gatcaggtaa gtctgttggt600 gtgaatacga tgattctaag tttactttat cgtgttcaac cagaagatgt gaaatttatt660 atgattgatc ctaaagtcgt cgaactttct gtttataatg atattccaca tttactgaca720 ccagttgtaa cggatatgaa aaaagccgct aatgcgttgc gttggtgcgt agatgaaatg780 gaacgtcgtt atcagttgct ttcagcttta cgcgtacgaa acattgaagg ctttaatgaa840 aaaattgatg aatacgaagc aatgggaatg cctgtgccaa atccaatttg gcgactgggc900 gatacgatgg atgcaatgcc accagcgttg aaaaaattga gttatattgt ggttattgtc960 gatgagtttg ctgatttaat gatggtagcg ggtaagcaaa tcgaagaact gattgcacgg1020 ttgg1024<212>类型DNA<211>长度1024序列名SEQ ID 42GDC_HINF_1660491序列描述自定义密码子序列名SEQ ID 42GDC_HINF_1660491
序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链atgaataaaa ttttaaagt tatttggaat gttgtgactc aaacttgggt tgtggtgtct60 gaactcactc gcgcccacac caaacgcacc tccgcaaccg tggcaaccgc cgtattggcg120 accgtattgt ctgcaacggt tcaggcgatt aacgacgcag gaactttcgt gaaagtgcaa180 agtacggaag atgatattga agatagtgct gcaaccaaag atgacaataa aaaccaagct240 ctcaaagcag gcgacacctt aaccttaaaa gcgggtaaaa acttaaaagc taagttagac300 caaggtggta aatcagtaac ctttgcttta gcgaaagacc ttgatgtgaa aaccgcgaaa360 gtgagtgata ctttaacgat cggcgggaat acgcctgctg cgggtggtgc tacgccaaaa420 gtaagtatta ctagcacggc tgatggcttg aagttagcaa aaggcactaa tggagatact480 gcagttcatt tgaatggctt ggcttcaact ttgcctgatg tgactacaaa tacaggtgcc540 tcaacttcag taaccttttc gcctagtgac attgaaaaaa caagagctgc aactattaaa600 gatgttttaa atgcaggttg gaatattaaa ggagctaaag ttgcgggggg taataccgag660 aatgttgatt tagtggcggg ttatgacaat gttgagttta ttacaggaga taaaaacaca720 cttgatgttg tattaacagc taaagaaaac ggtaaaacaa ccgaagtgaa gttcacaccg780 aaaacttctg ttattaaaga taataatggt aagttgctta caggtaagca gttgaaggat840 gcgaatactg gtacagcgac caatgcaact gaagatacag acgaggcaat ggcttag897<212>类型DNA<211>长度897序列名SEQ ID 43GDC_HINF_1807963序列描述自定义密码子序列名SEQ ID 43GDC_HINF_1807963序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg180 cttataccat tgcactaa198<212>类型DNA<211>长度198序列名SEQ ID 44GDC_HINF_1817220序列描述自定义密码子序列名SEQ ID 44GDC_HINF_1817220序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链atgtttgcag tgcatgctgc gatgattacg acattaaaga aagaagtttt ctttctttac60 ctttatatca aatcactcaa aatcccgatt cctactacac tgaaatacat gatttcttta120 ggcaaaatca gagaattaga tgttttagca aatcttgcta aactttgccc tacttgtcat180 agggctttaa aaaaaggatc tagcgaagag gagtttcaaa aacgcttgat tagaaacatt240 ctcaatcgca ataaagacaa tttagagttt gcgcaattgc gttttgaaac cgatgatttt300 tcaacgctta ttgatcgtat ttgtgaaagc ttgaaatga339<212>类型DNA<211>长度339序列名SEQ ID 45GDC_HPYL_51094序列描述自定义密码子序列名SEQ ID 45GDC_HPYL_51094序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链atgattaaac aaaccctcat cattcttgcc ccttttttta tcgcaacgct gttgtatttt60 ttaggcgcac cggatgggtt aagacctaac gcttggcttt atttttgtat tttcatgggc120 atgattatag ggctaatttt agagccggtg ccatcaggtt taatagcgct aagcgcgtta180 gtgctgtgta tagcgttaaa aattggagcg agcgataaag tagcgagcgc taataaggct240 atttcgtggg gtttgagcgg gtatgcgaat aaaacggtgt ggcttgtgtt tgtcgctttc300 attttgggtt tagggtatga aaaaagcttg ttagggaaac ggatcgctct tttactgatt360 aggtttttag ggcaaacccc tttaggttta ggctatgcga ttggtttgag cgaattgtgt420 ctagcccctt ttatccctag caactccgct agaagtggag gcatactcta tcccatcgtt480 tcatctatcc cgcctttaat gggatctact ccaaataata accctgacaa aatcggcgcg540 tatttgatgt gggtcgcttt ggcttcaact tgcatcactt cgtccatgtt tttaaccgcg600 ctcgctccta accccctagc aatggaaatc gctgccaaaa tgggcgtgaa tgaaatctca660 tggttttcgt ggtttttagc gttcttgcct tgtggggtgg ttttgatctt gcttgtgcct720 ttattggcgt ataaaacctg caaacccacc ttaaaaggct caaaagaagt gagtttgtgg780 gccaaaaaaa ggaattag798<212>类型DNA<211>长度798序列名SEQ ID 46GDC_HPYL_155367序列描述自定义密码子序列名SEQ ID 46GDC_HPYL_155367序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链
atgagccgac atcgaggtgc caaacctccc cgtcgatgtg agctcttggg ggagatcagc60 ctgttatccc cggggtacct tttatccttt gagcgatggc ccttccacac agaaccaccg120 gatcactatg accgactttc gtctctgctt gacttgtatg tcttacagtc aggctggctt180 gtgccattac actcaacttg cgatttccaa ccgcaatga219<212>类型DNA<211>长度219序列名SEQ ID 47GDC_HPYL_447632序列描述自定义密码子序列名SEQ ID 47GDC_HPYL_447632序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链gtgcaacttc attgccacaa cttgccatgc gtttcaattg atattctact aggcggacca60 ccatgccaga gctattctac ccttggcaaa agaaaaatgg atgaaaaagc gaatctgttt120 aaagaatatt tgcggctttt agatttagta aaaccaaaaa tatttgtttt tgaaaatgtg180 gtgggtttaa tgtctatgca aaaagggcaa ttattcaaac aaatttgtaa cgcttttaaa240 gagagagatt atattttaga gcatgccatt ttgaacgccc tagattatgg tgtgcctcaa300 atgagagaac gagtgatttt agtgggcgtg cttaaaagct ttaaacaaaa attttacttc360 cctaaaccca taaaaacgca tttttctctg aaagacgctt taggggattt accacccatt420 caaagcggtg aaaatggtga tgctttaggt tatcttaaaa atgcggataa tgtttttttg480 gaatttgtgc gaaattctaa agaattaagc gaacatagca gtcctaaaaa caatgaaaaa540 ctgataaaaa tcatgcaaac gctaaaagac ggacagagta aagatgattt gccagaaagt600 ctgcgtccca aaagtggtta tattaatacc tatgccaaaa tgtggtggga aaaaccagcc660 cccaccatta caagaaattt ttctacccca agcagttcta ggtgtatcca tccaagagac720 tctagagcgt taagcattag agagggggca agattgcaaa gctttcctga taattataaa780 ttctgtggga gtggtagcgc taaaagattg caaattggca atgccgtgcc gcctttattg840 agtgtagcgc tcgcgcaggc ggtctttgac tttttaaagg ggtaa885<212>类型DNA<211>长度885序列名SEQ ID 48GDC_HPYL_506250序列描述自定义密码子序列名SEQ ID 48GDC_HPYL_506250序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链
ttgatggaat ttgatgttac catcatagat gagacaggca gggccacagc accagaaatc60 ttgattcctg cacttcgcac taaaaaactg atcttaatag gcgatcacaa ccagctccca120 cctagcattg ataggtacct cctagaacaa ttagagagcg atgatattca aaacttggat180 gccattgatc gccaattatt ggaagagagt ttttttgaaa atctctataa gtatattcca240 gagagtaata aggccatgct taatgagtaa270<212>类型DNA<211>长度270序列名SEQ ID 49GDC_HPYL_583607序列描述自定义密码子序列名SEQ ID 49GDC_HPYL_583607序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链atgcctgctt ctattggatc gctagttagt cagctttttt ataaagagaa acttaagaat60 ggagtgatca aaaatacctc gcaattttac gatcctaaga atattatccg ttggattaat120 gttgaagggg agcatcaact agaaaaaaca agtagctata acaaaaatca agttcaaaaa180 atcatagagc ttttagagca aatcaatcgc gttcttaatc aaagaaaaat cagaaaaacc240 ataggaatta tcacacctta taatgcccaa aaaagatgct tgcgatcaga agtggaaaaa300 tacggcttca agaattttga tgagctcaaa atagacactg tggatgcctt tcaaggcgag360 aaggcagata ttattattta ttccaccgtg aaaacttatg gtaatctttc tttcttgata420 gattctaaac gcttgaatgt agctatttct agggcaaaag aaaatctcat ttttgtgggc480 aaaaagtctt tctttgagaa tttgcgaagc gatgagaaga atatctttag cgctattttg540 caagtctgta gatag555<212>类型DNA<211>长度555序列名SEQ ID 50GDC_HPYL_583883序列描述自定义密码子序列名SEQ ID 50GDC_HPYL_583883序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链
ttgattattg aaacgcaaca agaccccaaa gaactacctg agtcttgcaa aataacgccc60 caaaaaatct cttttaacca agtggttttt aaaaaaatta aaagaaaact caaccgcttc120 attggaagca ttttagctcg gacagaagtg tataagaatc tcgtggcaaa atacgatgaa180 ctcacaggaa aatacgaatc attattggca aaagaggcaa acatcaaaga gaccttttgg240 gaaaggcgtg ctgatagcga aaaagaagcc ttttttttag agcattttta cctcactagc300 gtgtatgtgg cttctacagc aggatactat atcacgccta agggcgctaa aacctttata360 gaagccacgg agcgttttaa aatcatagag ccggtggata tgttcataaa caaccccact420 taccatgatg tggctaattt tacctatttg ccttgccctg tttctttaaa caagcatgct480 ctcaatagca ccattcaaaa tgcaaaaaag cctgacattt cattaaaacc ccctagaaaa540 tcctattttg ataatctttt ttatgatcaa ttaaacacta gaaagtgctt aaaagccttt600 cacaaataca gcagacgata cgctccttta aaaaccccta aagaggttta a651<212>类型DNA<211>长度651序列名SEQ ID 51GDC_HPYL_665045序列描述自定义密码子序列名SEQ ID 51GDC_HPYL_665045序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链ttgatggaaa ttttagtgtt gaatctgggc agttcgtcta ttaagtttaa gttgtttgac60 atgaaagaaa ataagccctt agcgagcggt ttggctgaaa aaatcggcga agaaataggg120 cagttgaaaa ttaaatcgca tttgcaccat aacgatcaag aattaaaaga aaagtttgtg180 attaaagatc atgcgagcgg acttttaatg attcgtgaga atttaacgaa aatggggatt240 atcaaagatt ttaaccaaat tgacgctata gggcatcgtg tggttcaagg gggggataaa300 ttccatgccc cagttctagt caatgaaaaa gtcatgcaag aaattggcaa tctttctatt360 ttagccccct tacacaaccc ggcgaattta gccggtattg agtttgttca aaaagcgcac420 ccccatatcc ctcaaatcgc tgtttttgac accgcattcc atgccactat gcccagttac480 gcttacatgt atgcgttacc ttatgaattg tatgaaaagt atcaaatccg gcactatggt540 ttccatagga cttcacacca ttatgtggcc aaagaagcgg cgaagttttt gaataccgct600 tatgaggaat ttaacgcgat cagtttgcat ttagggaacg gctcaagtgc agccgccatt660 caaaagggta aaagcgtgga tacttctatg gggctaaccc ctttagaagg cttgattatg720 ggcacaaggt gtggggatat tgaccccact gtggtggaat atactgcgca atgcgcgaac780 aagagcttag aagaagtgat gaaaatgtta aaccatgaaa gcggattgaa aggcatttgt840 ggggataatg agaaacatag aagccagaaa agaaaaaggt ga882<212>类型DNA<211>长度882序列名SEQ ID 52GDC_HPYL_953783序列描述自定义密码子序列名SEQ ID 52GDC_HPYL_953783序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链atgcctaaca gccaagtggc tgggcaagct agcgttttta ttttcccgga tttaaacgct60 gggaacatcg cttataaagc ggtgcaacgg agcgctaaag ccgtggcgat agggcccatt120 ttacaaggtt tgaataagcc cattaacgat ttgagtaggg gcgctttagt ggaagatatt180 attaacaccg ttttgattag cgcccttcaa gcgcaagatt aa222<212>类型DNA<211>长度222序列名SEQ ID 53GDC_HPYL_954679序列描述自定义密码子序列名SEQ ID 53GDC_HPYL_954679序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链gtgagcctgg tttcaagcgt gtttttaatg tgtttagaca ctcaagtgct agtctttggg60 gattgcgcga ttatccctaa ccctagccct aaagaattag ccgagatcgc taccacttcc120 gcacaaaccg ccaagcaatt caatattgcg cctaaagtgg ccttgctttc ttatgcgaca180 ggcgattccg ctcaaggcga aatgatagac aaaatcaacg aagctttaac aatcgctcaa240 aagttggatc cccaattaga aattgatggc cccttacaat ttgacgcttc cattgataaa300 agcgtagcca agaaaaaatg cctaacagcc aagtggctgg gcaagctagc gtttttattt360 tcccggtttt aa372<212>类型DNA<211>长度372序列名SEQ ID 54GDC_HPYL_954846序列描述自定义密码子序列名SEQ ID 54GDC_HPYL_954846序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链ttgaaagctg cacatcgttt gaatttaatg ggcgcggtag gattgatctt atcaggcgat60 aaagaagcca ttaattcgaa aaatttgaac ttgaatttag aaaatgtgga aatcattgat120 cccaacactt ctcattatag agaagaattc gctaaaagct tgtatgaatt acgaaaatca180 aagggcttga gtgagcaaga agctaagcaa ttagtgctgg ataagactta ttttgcgacc240 atgctcgtgc attcaggcta tgtgcatgcg atggtttctg gggtgaatca cagctga297<212>类型DNA<211>长度297
序列名SEQ ID 55GDC_HPYL_955261序列描述自定义密码子序列名SEQ ID 55GDC_HPYL_955261序列<213>生物名幽门螺杆菌(Helicobacterpylori)-26695<400>前序列链gtgaaacaaa ttagtatctc ttgcagccat agaaaatatt ttgttagctt tagcgtggaa60 tacgaacaag acattactcc cataaaaaac actaaaaatg gtgtggggct agatttgaat120 atccttgata tagcttgttc ttgtgagata aacaaccatg acaaactaac ggactttaag180 caataccaaa cagacatgaa agaattacta gggatagaaa tagatgaaga gctggatact240 aaacgactta tccctactta ttccaaattg tattctttaa aaaaatactc taaaaaattt300 aaaagattac aaagaaaaca aagccgtagg gtgttaaagt ctaaacaaaa caaaaccaaa360 ttaggaggta atttttacaa aacccaaaag aaattaaacc aagcctttga caagtctagt420 catcaaaaaa cagacagata ccataaaatc acaagcgaac tttcaaagca atttgaattg480 atagtagttg aagatttgca agtaaaaaac atgactaaaa gagctaaact caaaaatgtt540 aaacaaaaga gtgggcttaa tcaatctatt ttaaacgctt cattctatca aatcatctct600 tttttagact acaaacaaca gcataatggc aaattgttag tgaaagttcc cccacaatat660 acgagtaaaa cttgccattg ttgtgggaat atcaaccaca agcttaaatt aaatcatagg720 caatattggt gtttagaatg cgggtataga gaacacaggg acatcaacgc tgcgaacaac780 attttaagca aagggttaag tctttttggg gtaggaaata tccatgcaga ctttaaagaa840 caaagccttt cgtgttag858<212>类型DNA<211>长度858序列名SEQ ID 56GDC_HPYL_1068602序列描述自定义密码子序列名SEQ ID 56GDC_HPYL_1068602序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链atgaaagtca ataagggttt taaattccgc ttgtatccca ctaaagaaca acaagataag60 ttgcaacact gcttttttgt ctataatcaa gcttataata ttggcttgaa tgaactgcaa120 gagcaatatg aaaccaacaa agattcacca cctaaagaaa gaaaatacaa aaaatcaagc180 gaattagaca atgcgatcaa acaatgcttg agagctaggg acttgccctt tagcgctgtg240 atagcccaac aagcacgcat gaatgttgaa agggctttaa aagatgcttt taaagttaaa300 aacagaggct ttcctaaatt caaaaactct aaatccgcta aacaatcttt ttcgtggaac360 aatcaaggct tctctatcaa agagagcgat gatgagtgct tcaagacatt cactctgatg420 aaaatgcctt tactcatgcg catgcataga gacttccccc taattttaaa gtga474<212>类型DNA<211>长度474
序列名SEQ ID 57GDC_HPYL_1069456序列描述自定义密码子序列名SEQ ID 57GDC_HPYL_1069456序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链ttgatattca tcacccattt ttccacagag cctttacctt tacccatcct ggtttctaag60 ggtttagcgg tcaaaggctt atcagggaat actctaatcc acaccttacc cgctctttta120 atgtgccttg tcatggccac ccttgcggat tcaatttggc gtgaatcaat cctcccatgc180 tctatggctt taatcgcaat atccccaaac gcaatggagt taccccgatg ggctttccca240 cgattgcgcc ctttcatttg ctttctgtat tttgttcttt ttggcattaa catgattatt300 gcctccctct tctgcttctt ctag324<212>类型DNA<211>长度324序列名SEQ ID 58GDC_HPYL_1376803序列描述自定义密码子序列名SEQ ID 58GDC_HPYL_1376803序列<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链atgagccgac atcgaggtgc caaacctccc cgtcgatgtg agctcttggg ggagatcagc60 ctgttatccc cggggtacct tttatccttt gagcgatggc ccttccacac agaaccaccg120 gatcactatg accgactttc gtctctgctt gacttgtatg tcttacagtc aggctggctt180 gtgccattac actcaacttg cgatttccaa ccgcaatga219<212>类型DNA<211>长度219序列名SEQ ID 59GDC_HPYL_1474291序列描述自定义密码子序列名SEQ ID 59GDC_HPYL_1474291序列
<213>生物名幽门螺杆菌(Helicobacter pylori)-26695<400>前序列链ttgaacgccg catttaaaga aaggcgcttc attctcgtcc agttagatga aaaaattgat60 cccaaggaag acaaaagcgc ttatgatttt tgtttgaaca ccttaaaatc accctcccca120 agcatttttg acatcaccga agaaaggatt aaaagagcgg gggctaaaat caaagaagct180 tgcgcgcatt tagatgtggg gtttagagcg tttgaaatca ttgatgatga aacgcatgct240 aatgataaaa atctcagtca agcccatcaa aaggatttgt tcgcttattc taaccttgat300 agaatggaaa cccaaacgat tttaattaag cttttaggct gcgagggttt ggagctcact360 acccctataa cttgcttgat tgaaaacgcc ttgtatctgg ctttaaatac ggctttcatt420 gtgggggata tagaaatgag cgaagtttta gaaaacttga aagataaagg ggtggaaaaa480 atcagcatgt atatgcccgc tatcagtaac gataatttgt gtttggaatt gggcagtaat540 ttgttggatt tgaaattaga gagtggcgat ttaaagatta gggggtag588<212>类型DNA<211>长度588序列名SEQ ID 60GDC_HPYL_1600102序列描述自定义密码子序列名SEQ ID 60GDC_HPYL_1600102序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgtatatac gtttttatcg cgattctctt gcagagcccg ccacagacat atacgctttt60 gcctatgttt cgttcaacaa ggaggccggc acatggcaca cccctgcgca accgacccgg120 aactatggtt cgggtacccc gatgacgacg gcagcgacgg cgccgctaag gcacgcgcct180 atgagcggtc ggccacccaa gcgcggatcc aatgcctgcg ccggtgcccg ctcctacagc240 agcgccggtg tgctcaacac gcggtcgagc atcgggtgga gtacggcgta tgggccggca300 tcaagcttcc cggcggccag taccgaaagc gcgaacagct cgcggcagcc cacgacgtgc360 tgcgtcggat tgccggcggc gagatcaatt ccaggcagct cccggacaat gcggctctgc420 tggcccgcaa cgaaggactc gaggtcaccc cggtgcccgg ggtcgtggtg cacctgccga480 tcgcacaggt tggcccacaa ccggccgctt gatgcccggt cggcaagccc ggcagttgcc540 aaacccagcg tgatcaggct cggctcgcga gttcggcgaa gaagtggctc gcctgatcac600 ctaccatcgg ccaggatctg cgtgtcatca cgacgctcgc caaggaggtt gttgtggtgc660 tatcgacggc ctttagccag atgttcggaa tcgactatcc gatag705<212>类型DNA<211>长度705序列名SEQ ID 61GDC_MTUB_26830序列描述自定义密码子序列名SEQ ID 61GDC_MTUB_26830序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链ttgatgttct gtgcgtcgcg gaaagagatg gcgatgtcga attcgtcttc tagctcggtg60 atcaactgga acagcttgag cgagtcaaaa cccaggtcgt cgacgagtac ctggttcgcg120 gtgatgccgc ggtcggttcg caagatccgt tggatggtgg cgttgatggc ctctttcata180 gcgcggctcc ttgcggggtc aggtcctcgg caaggccggc aaacacgtgc aaggcccggt240 cgaggtcaga ttgtcggtgg tcggctaggt agctggtgcg gaatcccgaa cgctcctccg300 gcacggctgg gggggccacc gggttcacat acaccccgga gcgcatcagc cgcagatagc360 ccgcatgcgc cacggtcggg ttgcccagga tcaccggcac gatcgcggtt ccgtgatact420 cggcctgata gccctgccgt gccaggccgg tggccatgta ctcggccgcg gccagcaccc480 gagcccgccg gtcgggttca cgccgactga510<212>类型DNA<211>长度510序列名SEQ ID 62GDC_MTUB_36276序列描述自定义密码子序列名SEQ ID 62GDC_MTUB_36276序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgccgccac cgatcccgcg gtgcgcggcg gccagtactt cggacccgat ggcttcggtg60 aaatacgggg ctacccgaag gtggtggcct ccagcgccca gtctcacgac gagcagctgc120 agcgccgcct gtgggctgtg tccgaagagc tcaccggggt cgtctatccc gtcggatgag180 ccggactcaa cggcaacggt tggtcaacac tcgacgatgt tgactgcgac gttgatggcg240 agcccgccgg ccgaggtttc cttgtacttg gtgtgcatgt ccgcgccggt ggcgcgcatg300 gtgtcgatga cctggtcgag ggtgacgcga tggatgccgt cgccgcgcaa tgccatccgt360 gcggcgttga tggccttgcc ggcggaaatc gcgttgcgtt cgatgcaggg gatctgcacc420 agcccggcga tggggtcaca ggtcaggccg aggctgtgtt ccatggcgat ctcggcggcg480 ttttccactt gtcgcggtgt gccgccgagg atttcagcca atccggcggc ggccatggcg540 gccgcggagc cgacctcgcc ctga564<212>类型DNA<211>长度564序列名SEQ ID 63GDC_MTUB_76032序列描述自定义密码子序列名SEQ ID 63GDC_MTUB_76032序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
60 gtcgtgagga agacattggg gatcttggcc agcgcggtgg aattcggcac aatgccaacg120 acccgcaatc tgcgcgcgcc gacctcgaca gtgtcaccga ggtgtcggcc catcgtgctc180 gatgccgcga cttcgtccgg tttcgacggt gaccgaccct ctgagacccg tggcatgcca240 ggtccgtgct cgggcgcgcc gaagaccgtg acgtttcgcg tcgacgtgcc ttctttcatg300 atcgtcccca cgctgcccaa cggggccgcg gccatgacac cgggttcagc ggccactcgg360 gccaggtcaa catcgggaaa cggtattgaa cccagaaaag gtccagcagc gccggatctg420 acgacgaata catcgacacc catggaatcg acggtgtgcc gggcctccac ccggaagccg480 ttcgcgagtc cggtcaaaac aagcgtcatc ccgaagatca gcccggtgct gatgatcgtg540 atgaccaggc ggcgctttct ccattgcatg tcacgcaggg ccgcgaagag cattcccaga600 ggctaccaac gtggcgcact tgtggggcct ggtcttgacg ttttgtggtc agggcgcggc660 ccgctagtgg tcgaagaggc gttcggggtg gtggtagtcg ttggtgtggg caccgcggtc720 gaggtggggt ggcgggatcc attccgtttg gccgtcggac cgtttccttg tccgccagcc780 tttcccgact ag792<212>类型DNA<211>长度792序列名SEQ ID 64GDC_MTUB_80423序列描述自定义密码子序列名SEQ ID 64GDC_MTUB_80423序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgtcgcgtg ctatccggac aaagccgaaa tcagcatctt cccggggtag cgcaggctac60 cgggtatacc tcggccaacg actgggtgtc gctgtattcg cgcagcgaga tgatcatccc120 gtcacgggtc tcgaagatgc agacgaacgg gctgtcatat cgggtccggt cggcgctcac180 accgtcgcaa tgcccctcga ccactaccgt ttcaccctcg ttgacgcagc ggatgagttc240 gatgttgacc tcgaagacct gcttgcgccg ctcgactgct cgccgaaacg tcttcttgtc300 caattccgta cgggtgacga tgctccagta ggtgaagtcg ttgctgagca gcgcgaagcc360 ttcgtcgaga tctccgccct cgcagaggct ttgcaggaac atccaggcca gttcggcttg420 cgggtcgtcg aacggcgtca tcacatcgcc atcttgtctc gggagacagc gtgcggtcaa480 ttgacgtggt cgtcgaagcg gtggtcacct tcgcgggggc ggccggcttc gcgcacacct540 tggcgccgtt gcgtcgcggt cagcaggatc catgctttcg ggtccccggt gacggcacta600 tctggcggac cagcttgctg cccaccgggc cggtcaccgc gcggatcagc cgtgctgggc660 gcgacgccgc ccgttgcgtg gcgtggggca gcggtgccga ggagtttgtc gacatggcgc720 ccgccatgct gggcgccgcc gacgacgcca gcgatttcgt gccgctgcat ccggccgtgg780 ccgccgcgca ccgccggctg ccgaacttgc gcctgggccg caccggccag gtgctggaag840 ccttga846<212>类型DNA<211>长度846序列名SEQ ID 65GDC_MTUB_167239序列描述自定义密码子序列名SEQ ID 65GDC_MTUB_167239序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcgaccgg gccaccgcca ggtcgatgga tgccgccgtg gccaaccgtt gtgcggtgct60 catgaacgcg tcggcctcgt gcgggttgtc ggtgccttcg gcctggcgca gcagggctgc120 gatgcgggcc agcatcttgt cgttggtcat ggcgccaaaa ctagtggagg gctgcgacag180 gtcggctcgg cctacaaccg ctcggtgagc caggcgacca catcgtcgag cacctggttg240 cgctccggct cgttgaacac ctcgtggtac agcccgggat actccttcag ctgcacgtcg300 gccgatccca cacattcgac caggcgacgg ctgccctcga tggggatcag ccggtcatcg360 gtgccgtgca gcactagcag cggcgcggtc aatgccggtg ctcgccgcgg catggtctcg420 cccacctgca gcagcgcgcg gccaatcccg gccggaaccc gtccgtggtg cacgagtggg480 tcggtgttgt aa492<212>类型DNA<211>长度492序列名SEQ ID 66GDC_MTUB_214625序列描述自定义密码子序列名SEQ ID 66GDC_MTUB_214625序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgtgtaaag catgtctcgg tcaccatacc catcaccacc gaacatctcg gcccctacga60 aatcgatgcc agcacgatca accccgacca gcccatcgac acggctttca cccaaaccct120 cgatttcgcc ggcagcggca ccgtgggcgc gttccccttc ggcttcggct ggcagcagag180 cccgggattc ttcaactcga ccacaacccc gtcgtcgggc ttcttcaact ccggcgccgg240 tggcgcatcg ggcttcctca acgacgccgc agccgccgtg tcgggcctgg gaaacgtctt300 caccgagact tcgggcttct tcaatgctgg cggcgtagga attcgggctt ccaaaacttc360 ggcaacctgc tgtcgggctg ggcgaaccta ggcaataccg tctccggttt ctacaacacg420 agcatgctgg acctcgcgac ccaagccctt atctccggct tcggcaacca cggagcccga480 ctctccggca tcctcaacaa cggtagcgga ccctaa516<212>类型DNA<211>长度516序列名SEQ ID 67GDC_MTUB_424142序列描述自定义密码子序列名SEQ ID 67GDC_MTUB_424142序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
gtgcttagcc tatccgctgg cggcccggaa ccgagaatgc gaccaggtca caacccagtc60 accttccacg ccgagcagac gaggaatcgc actgcgcgga cctcacgcgt gcgattccgc120 gtctgctcgt cagacaaatc agcccaggat cagcgagtcg gcgtcggggc tgacgttgac180 cggcacggta tcgccgtcgt gcacctggcc ggccaacagc atcttggcca gctggtcacc240 gatggcctgc tgcaccagcc ggcgcaacgg ccgcgccccg tacaccgggt cgaatccgcg300 ctgcgccaac cagcgcttgg ccggcagcga gacctgcagc tgcagccgcc gctgcgccag360 ccgcttgccc agctgcgcca gctggatgtc gacgatgcgc accagctctt cggggttgag420 accctcaaag atgagcacgt cgtcgagccg gttgatgaac tccggcttga acgtagcgcg480 caccgcggcc agcacctgct cggcgctgcc acccgacccc aggttggacg tcaggatcaa540 gatggtgttg cggaagtcga ccgtgcggcc gtgcccgtcg gtgagccggc cctcgtcgag600 gacctgcagc agcacgtcga acacgtccgg gtgcgccttc tcgatctcgt cgaacagcac660 caccgtgtag ggacgccggc gcaccgcctc ggtcagctga ccgcccgcct cgtatcccac720 atagccgggc ggggcgccga tcaaccgagc cacggtgtgc ttctcgccgt actcgctcat780 gtcgatgcgg accatcgccc gctcgtcgtc gaacaggaag tcggccagcg ccttggccag840 ctcggtcttg ccgacaccgg tcgggccgag gaacatgaac gccccggtgg gccggttggg900 gtcggacacc ccggcccggc tgcgccgcac cgcatcagag actgcggtaa ccgcggcctt960 ctgcccgatg acccgcttgc ccagctcgtc ttccatgcgc agcagcttgg cggtctcgcc1020 ttcc1024<212>类型DNA<211>长度1024序列名SEQ ID 68GDC_MTUB_459316序列描述自定义密码子序列名SEQ ID 68GDC_MTUB_459316序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcttgccg atttcgatgt aggacaacac cttttccagc tggtcgttgg aggcctggga60 acccagcatg gtttcggtgt ccagcgggtc gccctgccgg accgccttgg tccggatcgc120 cgccagctcc aggaactcgt cgtagatgtc ggcctggatc agactgcgcg acgggcaggt180 gcacacctcg ccctggttga gggcgaacat ggtgaagcct tccagcgcct tgtcgcagaa240 gtcgtcgtgg gcggccagca cgtcggcgaa gaagatgttg gggctcttgc cgccgagttc300 cagggtgacc gggatcaggt tgtgcgaggc gtattgcatg atcagccgcc ccgtggtggt360 ttccccggtg aacgcgacct tggcgatgcg gtcgctggag gccaacggct tgccggcctc420 ggcgccgaat ccgttgacca cgttgaccac cccgggcggc aacagatcac cgatcagcga480 catcaggtag agcaccgaag cgggtgtctg ctcggcgggt ttgagcaccg ccgtgttgcc540 ggccgccaac gccggcgcca gcttccaggc cgccatcagg atggggaagt tccacggaat600 gatctggccc accacgccga gcggctcgtg gaagtggtag gccacggtgt cctcgtcgat660 ctggctcagc gcgccctcct gggcgcgaat cgccgcggcg aagtaccgga agtgatcgac720 cgccaacggg atatcggcgg ccagcgcttc ccggaccggt ttcccgttgt cccagacctc780 ggccaccgcc agcgcggcgg cgttcttgtc gatgcggtcg gcaatcatgt tgaggatcgc840 cgcccgttcg gccggtgcgg tcttgcccca ccccggcgcc gccgcgtgcg cggcgtcgag900 cgccttgtcg atgtcggccg cgtcggagcg cggcacctcg cagaacggct ggccggtcac960 cggcgtcggg ttctcgaagt agcgcccatg gaccggcgcg acccactggc ccccgatgaa1020 gttt1024<212>类型DNA<211>长度1024序列名SEQ ID 69GDC_MTUB_549643序列描述自定义密码子序列名SEQ ID 69GDC_MTUB_549643序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgtatcttc cgcccaagct gatcccgagg cggatcccgg cgcaggtgag gccaactatg60 gtggcccccc aagttcccca cgtcttgtcg atcacaccga atgggcgcag tggggaagtc120 tgcccagcct ccgggtctac ccgtcccaag ttgggcgtac agcctcccgc cgcctcggga180 tggccgctgc cgacgcggcc tgggccgagg ttctcgcgct gtcaccggag gccgacactg240 ccggcatgcg cgcgcagttc atctgccact ggcagtacgc cgaaatcaga caacccggca300 aacccagctg gaacctcgag ccgtggcggc cggtcgtcga cgactcggag atgttggctt360 ccggctgcaa tccgggcagc cctgaagagt cgttttagtg ctcggccaac cgactcgggc420 gcagttggcc gcgctggtag accacaccct gctcaagcct ga462<212>类型DNA<211>长度462序列名SEQ ID 70GDC_MTUB_566823序列描述自定义密码子序列名SEQ ID 70GDC_MTUB_566823序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgacgtcta cgaacgggcc atcggcgcgg gataccggtt ttgttgaggg ccagcaggcc60 aagacacaac ttctcaccgt ggccgaagtg gcggccctga tgcgggtgtc caagatgacg120 gtgtaccggc tggtgcacaa tggcgaactg cccgcggttc gggtcgggcg gtcattccgg180 gtgcatgcca aggccgtcca cgacatgttg gagacttcgt acttcgacgc gggctag237<212>类型DNA<211>长度237序列名SEQ ID 71GDC_MTUB_591109序列描述自定义密码子序列名SEQ ID 71GDC_MTUB_591109序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
gtggcggagt ccgtggctat ccgcggctgc ctgctgaggt gcgggccgcg ttcccgaccg60 cggcggagat cgcgccgcag tggcatctgc gcatgcaggc cgcggtgcag cgccacgtcg120 aggccgccgt gtccaagacg gtcaacttgc ccgccacggc gacggtcgat gacgtccgcg180 ccatctatgt ggccgcctgg aaggcaaagg tcaagggcat cacggtgtat cgctacggca240 gccgggaagg acaggtactg tcctacgccg cgccgaaacc gctactggcg caggctgaca300 cggagttcag cggcggctgt gcgggccgct cctgcgagtt ctgacggcgg ctcccatggc360 gcgagcagac gcagaatcgc acaaaatcag cgattttga399<212>类型DNA<211>长度399序列名SEQ ID 72GDC_MTUB_663028序列描述自定义密码子序列名SEQ ID 72GDC_MTUB_663028序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgctgcaca gcagcttcgg gcacctcgag ggcatccagc agccgctcat agacgagctg60 gcagaactcg accacgtgtt gggcaagctg ccggacgcct accggatcat cggccgcgcc120 ggcggcatat acggtgactt cttcaacttc tatctgtgtg acatctcact gaaagtcaac180 ggattacagc ctggaggtcc ggtacgcacc gtcaagttgt tcggccagcc gaccggcagg240 tgcacaccgc aatga255<212>类型DNA<211>长度255序列名SEQ ID 73GDC_MTUB_688806序列描述自定义密码子序列名SEQ ID 73GDC_MTUB_688806序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
ttgctggggg cgctgcacca gtacccgcac actcgcatcc agccgggtgc cgttgcggcg60 caccgtgatc gccagcaccc gcgcccggtc tttggcgatg aggcgctcga tgcggcgggt120 gttctcatgc gtacgcacgc agccgatcac cggcaaagtg aggtgtctac ggtcgggctc180 aacgcgcatc gcacccgtgg tgaacgacac gcgatcggcg tcgcggccct tcttcttgaa240 tcgagggaag cccattctct tgccgtcgcg cttgccagca cgcctctgct gccagttcca300 gtacgcgtcg accgcgcccg cgatcccgtc ggcgtaggcc tctttcgagc attccggcca360 ccacacggtg ccagtctcgg cgttgacaca cacctcgtct ttcaccgtgt tccagcgttt420 ccgcagtacc cgaagcgacg gcttcgccgt ctgggcgccg gtcgcgcgcc acgcttggat480 atcggctttc agctgcgcga cggtccagtt gtaggccttg cggcgggcgc cgaaatgccg540 cgccaacgcg tgtgcctgct cggcggtcgg atcgagtgtg aaccggaacg cttgcacaca600 ccagccgttg gggatctcca aacgcggcat ctcaggccgc ctcatgatca tcgacagcgg660 cagccgcgac ggcccgcttg gcccggttct gagcagcacg tttgccatac aaccttgcgc720 acatcgaggt cagaatctcg gtcatatccc ataccaggtc atcgtcaacc tcggccgagt780 ccaccacgac caactcccga ccctgagcgg ccagcgcagc gtggacatac tccgaaccga840 accggcagaa ccgatcccga tgctcaacca caatccgcgt ga882<212>类型DNA<211>长度882序列名SEQ ID 74GDC_MTUB_701762序列描述自定义密码子序列名SEQ ID 74GDC_MTUB_701762序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atggcttcca gtaccgacgt gcggccgaag atcactttgg catgcgaggt gtgcaagcac60 cgtaactaca tcaccaaaaa gaaccgccgc aacgacccgg accggctgga gctgaagaag120 ttctgcccga attgcggcaa acaccaggcg caccgcgaga cgcggtaa168<212>类型DNA<211>长度168序列名SEQ ID 75GDC_MTUB_731710序列描述自定义密码子序列名SEQ ID 75GDC_MTUB_731710序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
ttggtatgcg ccgccgcccc cggtcgacga cgacccctcg gcgtaggcgg acaggtcgaa60 gccggcacag aatccctcgc cgcgaccgga caccagaatg acatgcacgc ctggatccag120 atcggcacgc tccaccagag cagacaactc cagcggggtg tctgcgatga tcgcgttgcc180 cttctccggc cggttgaagg tgatccgcgc aatccgaccg gtgacctcat aggtcatcgt240 cttcaggttg tcgaaatcga ccggcctgat cgcgtgtgtc atcagcggcc gctcagcctt300 ttaccagcgc acgctcgagg atgggcgcga gatccagacc ggccggcatg gtgccgtacg360 ctccgcccca ctggccgccg agccgagtgg ccagaaacgc ctcggcgacg gcgggatgtc420 cgtggcgcac caacaacgat ccctgcaacg ccaggcagat gtcttcggca atcttgcggg480 ctcgataacc gatcgtgtca agatcgccca gctgcggacg cagcctttcg acgtggccgt540 ccagcctggg gtcctggcct gcgctgcggg ccagctcgtc aaacagcacc tcgacgcatg600 cgggccgggt tgccatggcg cgcaaggtat ctagcgcgct ga642<212>类型DNA<211>长度642序列名SEQ ID 76GDC_MTUB_772761序列描述自定义密码子序列名SEQ ID 76GDC_MTUB_772761序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgggtctcg ttgcgccggc aggtgacggt cgcgcagcga aaaagcgacc tgcgggccgc60 cgaggatccg atcgacgccg tcgtatgcgc ctacgtggcg ttgtacgccc aacgccggcc120 cgccgatgtc acgatctatg gggacttcac caccgggtac attgtcacgc cgtcgctgcc180 caccgacttc agaacggcac cggacgctgg tcgacgggcg cgagcacgtc gatgaggtcg240 accaccgtcg ccagcgcagc ggcacgcggg tcccgccctt cgaccagcgc cgagaccacc300 gatccgtcga ccgcacagat caacgtacac accagttcga tctgtgcgga gcggccggag360 cgctcgatgg cctcggccac ggcctcagcg cgctga396<212>类型DNA<211>长度396序列名SEQ ID 77GDC_MTUB_868821序列描述自定义密码子序列名SEQ ID 77GDC_MTUB_868821序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
atgcggtgta gggcggcgtt gagctggcgg ttgcccgagc ggctgagccg catctggccg60 gcggtgttgc ccgaccacac cgggatggga gccactgcgg catggcaggc gaaggcggct120 tcgcttttga accgggtcac tccggcggct tcgccgacga ttttggctgc agtcagctcc180 gcgcagccag ggatttccag cagtgcgggg gcgacctggt ggactcgggc gctgatgcgc240 tgggctaggg tgttgatctc gccggtgagc cggatgatgt cggtcagctc ggcgcgcgcg300 agttcggcga ccaatcctgg ctgggtgtcc agccaggtcc gcagggcctg ctggtgcttg360 gcggcatcga gcgagcgtgc tgccggtgcc cgctcgggat cgagttcatg gacgagccag420 cgcaaccggt tgatcgccga cgtgcgttgg gccacaagga catctcgacg gtcagtcaac480 aacttcaact cccgcgacgt ctcgtcgtgg gtggccaggg gtaggtcggt ttcacgcatc540 accgcccgcg ccaccgccag cgcatcgatc ggatccgact tgccccgact gcgcgccgac600 ttgcgggtct gggccatcag cttggtgggt acccgcacca cctgctggcc ggccgccagt660 aggtcacgct ccagacgcgc cgacatgttg cggcagtcct cgatgcccca gatcagctcg720 aggccgaact gttcacgggc ccacatgatg gctgtggcgt gcccggccgt ggtggccttg780 acggtcttct caccgagttg gcgacccact tcgtcggtgg ccacaaaggt gtggctgtac840 ttgtgcgcat cggttccaac aacaaccatg gtggttgcct ctgaaccgcc ccggtga897<212>类型DNA<211>长度897序列名SEQ ID 78GDC_MTUB_890358序列描述自定义密码子序列名SEQ ID 78GDC_MTUB_890358序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcggcgcc gagccgctgt tcctgttgga ttacatcgcc gtcggtcgga tcgtgccgga60 gcgactcagc gcgatcgtcg ccggtatcgc cgatgggtgc atgcgtgccg gctgtgcgct120 gcttggcggc gagaccgcag aacatccggg cctgatcgag cccgatcact acgatatctc180 tgccaccggc gtcggcgtcg tcgaggcgga caatgtgctg ggtcccgacc gggtcaaacc240 cggcgacgtc atcatcgcga tgggctcgtc gggtctgcat tccaatgggt actcgctggt300 ccgcaaggtg ttgctggaga tcgaccggat gaatctggcc ggtcatgtgg aggagttcgg360 tcgcaccttg ggcgaagagt tattggagcc gactcgcatc tacgccaaag actgtttggc420 cttggccgcc gaaacccgtg tccggacgtt ttgccacgtc accggcggcg ggctcgccgg480 caacctgcaa cgggtcatcc cgcatggcct catcgccgag gtcgaccgcg gcacctggac540 acccgcgccg gtattcacca tgattgccca gcgcggccgg gtcaggcgca cagagatgga600 gaagacgttc aacatgggtg tcggcatgat cgccgtcgtt gcccccgaag acacgacgcg660 cgccctggcc gtcctgaccg cgcggcacct ggactgctgg gtattgggaa ccgtctgcaa720 aggcggaaaa caaggcccgc gggcaaaact ggttgggcag cacccgagat tctaagaacc780 agacctaacc gggtctaa798<212>类型DNA<211>长度798序列名SEQ ID 79GDC_MTUB_904043序列描述自定义密码子序列名SEQ ID 79GDC_MTUB_904043序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtggtagcgg tccggattga agtcgtcggc catcgagtcc accacctggc cggccatctt60 gagttccgcg ggtttgatct ccaccttctg gtccagcacc gggaagtcgg ggtcgcggat120 ctcatcgggc cacagcaacg tgtgcaccat catcacctct cgcttgccga aatccttgac180 gcgcaacgcc gccagcctgg tcttgttgcg cagcgtgaaa tgcacgatcg ccatccggtc240 ggtctcggcg agtgtcttag ccagcagcac atacgatttc gacgacttcg aatcaggctc300 caaaaagtag ctgcggtcga acatcatcgg gtccacgtcg gcggcgggga cgaactccaa360 cacctcgatc tcccggctgc gttcttcagg caagctggcg atgtcgtcgt cggtgatcgc420 caccatttgg ccgtcgccgg actcgtaggc ccgggcaaga tcgcggtagt cgaccacctc480 gccacacgcc tcgcagacgc gcttgtaccg gatgcgtccg ttgtccttgg cgtgcacctg540 gtggaacctg atgtcgtggt ctgcggtagc gctgtacacc ttgaccggca cgttcaccag600 cccgaaggcg atcgaacccg tccaaatggc tcgcatgtaa gtgagtatgc cttgattgtc660 cgcgagcgga acgtcacggc gaaattccac gcgatatttg accgtgacgt tacgctcgcg720 acttgtgtga ccgacaggct acgttga747<212>类型DNA<211>长度747序列名SEQ ID 80GDC_MTUB_1045383序列描述自定义密码子序列名SEQ ID 80GDC_MTUB_1045383序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcgctcgg cgagggtgaa tccgccggcg cgcagtgcgg caagcacgcc atggtaccca60 agcggatcgg tgaccaccgc cgcgctggga tggtttttgg cggcggcccg caccatcgcc120 ggcccgccga tatcaatctg ctcgacgcag tcgtcgacac tggcgccgga ttcgacggtc180 tggctgaacg gatacaagtt gactacaacg agttcgaaag cctcgatccc gagttgctcg240 agggccgcgg cgtgctcgga cttgcgcagg tcagccagca gcccggcatg cactcgtggg300 tgcagtgtct tgacccggcc atcgagcacc tcgggaaagc cggtcagctg ctccacgggg360 gtcaccggaa tcccggtgtc ggcaatggtc ttggccgttg acccagtcga gatgatctcg420 acgccggccg cgctcaggcc ctgtgccagg tctaccagcc cggtcttgtc gtacacgctg480 atcagcgcac ggcggatcgg ccgtcttccg tcgtcggtgc tcatcctatg gttacctttc540 gtcccatcgt cgctgttcgt ccgaccaccg tcacgccatg ggtggccagt gcggccaccg600 ccgctaccaa cagccgtcgt tcggtga627<212>类型DNA<211>长度627序列名SEQ ID 81GDC_MTUB_1068100序列描述自定义密码子序列名SEQ ID 81GDC_MTUB_1068100序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcgcgctg acccgccgac gaccgcctgc aacacgcgat gcacgcccag cgtctgtgtc60 ccgtcgatgt gcggtacatc gaccacctcg atgccgcccc gcagctgcgt cccggaaaaa120 gtcaccttgc tgcagtcttt cccggggctg ggggccggca gcggctggga cgtctccacc180 gcgatgacga cgaaccggtt gccgttgccc tcggcggaga cggcggccat gttgccctgc240 aacccggtcg gcagctgggg cccggccgcc acttgcgcac agttcgccgg atcgaaactc300 agcccgtcgg gcagtttgcg ggcggaaaag aacccgggat cgatggccct gggagtgaca360 tcggtgacgg tgtattcagg tccaaagccc gacttcactt cggccacctt ggcgatgtcg420 ccggtcgagg cggtggtgga gctggcccct gatgagcagc cgacaagcca gcacaccgat480 ccgactgcca gtaccgcctt gcgcatcgtg gtcaatctac ccaacgcagc ccctgagctg540 cgcaacgtcg acaccgtttt gactagcaga tcagcggcga actgcggtgc cagcggcgga600 cgcaccgacc cggggtcggt gatcagccga cggcctcgat cacttgccgg gctacccggt660 tga663<212>类型DNA<211>长度663序列名SEQ ID 82GDC_MTUB_1115707序列描述自定义密码子序列名SEQ ID 82GDC_MTUB_1115707序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgggtactg cgcaagagcg agtccgaagc cgatcaggcc cggttccgca ccacgctcta60 cgtcacctgc gaggtagtcc gcatcgcggc actgctgatc cagccggtga tgccggagtc120 ggccggcaaa attttggacc tgctcggcca ggccccaaac cagcggtcgt tcgccgccgt180 aggtgttcgg ctgacccccg gcacagcgct gccgccgccc accggggtat ttccccgcta240 ccagccgccg caaccacccg aaggcaagtg agcggaccgc agcgacggga aagccaccta300 cgaagcgttg accgcggtct gcgcgtcgcg tgggatgtcg agcgtggcga cgggataaaa360 cccggaatcg tcgcggccgt cgcgggacaa cagcatgggc ggatagttca ccacatggga420 gccgttcggt ttgtgctgtt gccagtcgat cgcggcccgc agcgtgtagt ggcccgcggg480 caagccggac agatcaacgc gaaccgtctc ggcgaccgac gccggtgtcg gctggtcgct540 gctgcgatcg ccgcgctggt cggagaccag cgtcttcagg tccaccgctg ccggcagcgt600 ccgaaccacc tgtccggtgg aatccaccag ccggtagccg ggcacccact tttcggtggc660 ggcagcagcg ccgtagttgg tccaggtgac cgagatcgtc gcgaccttgc ccgctag717<212>类型DNA<211>长度717序列名SEQ ID 83GDC_MTUB_1124996序列描述自定义密码子序列名SEQ ID 83GDC_MTUB_1124996序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgtcgatct ccggaatcga gcgctggtcg gctaccgaga acatccgcat ctcggtgatc60 tcgtcgcccc agaactcgac ccgcaccgga tgttcggccg tcggggcaaa gatgtccaga120 atcccgccgc gcacagcgaa ctcgccgcgc cggccgacca tatccacccg ggtatatgcc180 agctcgacca gccgcgccac cacgccgtcg aagggggatt cgtcgccaac ggtcagcgtg240 aggggctcca tcatgcccag ctgcggcgtc atgggctgca gcagcgagcg caccgaggtc300 accactaccc ccagcggtgg gcccagctgg gcatcgtcgg ggtgggccag ccggcgcagc360 gccatcaggc gagtgccgac ggtgtcaaca ccgggtgaga gccgttcgtg cggcagtgtc420 tcccaggacg gcaacaacgc caccgcatcc ccgaacacac cacgcagttc ggcggccagg480 tcgtcggctt cccgcccggt ggcggtgacc accagcaatg gcccctgccg agccagcgca540 ctggcgacca acagccgcgc gctggccggc gcgatgagcg tcaattcgtc gggtcgaccc600 ccggcgcgct gcatgagctg ttggaatgtc ggcgcgctca gcgccaattc gacgagcccc660 gcgatcgggg tatctgagca ggcaggcccc ggtgcggtca tgatgcggcc attctag717<212>类型DNA<211>长度717序列名SEQ ID 84GDC_MTUB_1138949序列描述自定义密码子序列名SEQ ID 84GDC_MTUB_1138949序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgctggcgt tctaccttcg gccaaggcca gggacgtggt gtacgagtga aggttcctcg60 cgtgatcctt cgggtggcag tctaggtggt cagtgctggg gtgttggtgg tttgctgctt120 ggcgggttct tcggtgctgg tcagtgctgc tcgggctcgg gtgaggacct cgaggcccag180 gtagcgccgt ccttcgatcc attcgtcgtg ttgttcggcg aggacggctc cgacgaggcg240 gatgatcgag gcgcggtcgg ggaagatgcc cacgacgtcg gttcggcgtc gtacctctcg300 gttgaggcgt tcctgggggt tgttggacca gatttggcgc cagatctgct tggggaaggc360 ggtgaacgcc agcaggtcgg tgcgggcggt gtcgaggtgc tcggccaccg cggggagttt420 gtcggtcaga gcgtcgagta cccgatcata ttgggcaaca actga465<212>类型DNA<211>长度465序列名SEQ ID 85GDC_MTUB_1170285序列描述自定义密码子序列名SEQ ID 85GDC_MTUB_1170285序列<213>生物名结核分枝(Mycobacterium tuberculosis)-H37RV
<400>前序列链ttgacgaccg ctggcataag cgggtcaaag ggccggacgg gaacaggcga accgtgcggt60 ctgctgtctg cggcagggtt tcgcgctggc gcgtcaggtg ggttgacggc ggcggagagg120 agcacagcaa gagcttccag cgcaaacctg acgcgcaggt acctgaccca tgccgaactg180 ttgatgctcg ccagggccac gggccggttc gaaacgctca ccttggtgct cggctactgc240 ggcttacggc ggtttacggt tcggtga267<212>类型DNA<211>长度267序列名SEQ ID 86GDC_MTUB_1176592序列描述自定义密码子序列名SEQ ID 86GDC_MTUB_1176592序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgggtcagt gcccacgacc tgtgcggcac tggccgcctg ccgtaattgt ttgtagccga60 actaaattgc ggcgcgcctg cctgcgcgac taccgccgtc ccgccccctc cgacaagaag120 cccaacaagt cgtaccgggt aatgacccca accggcttgc cttcctccac caccatcaac180 gcatcccaat cacgcaacgc cttgccggcc gcactgacca attcaccggc gcctatcatc240 cgcagcggcg ggctcatgtg tgccgacacg gcgtcggcca acttggcgcg gccctcgaac300 acggccgaga gcagctcgcg ttccgagacg ctaccggcga cctcgccggc catcaccggc360 ggctcggcgc cgaccaccgg catctgcgac accccgtact cgcgaagaat cccgatggcg420 tcgcgcacgg tctccgacgg atgggtgtgc accagggcgg gcagcgcgcc ggacttgcgg480 cgcaacacat caccgacggt ggattgctcg gtcgacccgt caaggcggct gcgcaggaac540 ccatag546<212>类型DNA<211>长度546序列名SEQ ID 87GDC_MTUB_1202653序列描述自定义密码子序列名SEQ ID 87GDC_MTUB_1202653序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
ttggcggcga tcccgagaag gtcacgctgt tcggtgaatc cgcgcgggaa tcgtcacgac60 cctgctcgcc accccggcgg ccgcgggtct gttcgcggcg gcgatcgccc agagctcacc120 ggcgacatcg gtctacgacc aggtgagggc tcggcgcgtc gcggtttgcg tcctcgacaa180 gctgggaatc gacccgtccg atgtgcacag gttcatgaag tgccgaccgc ggcaatcctt240 tccgcgtcca gcgaagtgtt caacgaagtg ccggttcgta accccggcac gctggcgttc300 gtcccgatcg tcgacggcga tctgctgccc gactacccgg tcaagctggc gcaggagggc360 cgctcacacc cggttccctt gatcatcggc accaacaagc acgagtcggc gctctttcgg420 ttgatgcgct cgccgctgat gccgatcacc ccgcgcgatc acgtcgatgt tcacccagat480 tgccgccgaa cagcccgatc tgcaagtgcc aaccgaggag cagatcggct ccgcgtactc540 gcgatggcgg cgcaaagcac gctcattgag tatggctacc gacgtcggct tccggatgcc600 gtcggtgtgg ctcgctga618<212>类型DNA<211>长度618序列名SEQ ID 88GDC_MTUB_1231843序列描述自定义密码子序列名SEQ ID 88GDC_MTUB_1231843序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgctggcct tgaggcccca gcgtcatttc acccagagcc ggagcgcccg gcggctacgc60 tgtgtgctcg acgatgacgt atgggtgccc tgggcacggt cagggggttg caggacagca120 acacggcatt tgtcggtgcg ctgcatagcg ggaacctgtt gggggccacc ggtgcggttc180 tgcaggctcc gggcaacgcc gtcaacggtt tcttgttcgg ccagacgtcg atatcgcagt240 cgattgacgt gtcaccggag tacggatacg agttggtcgc tgtcagcgac ccggttggcg300 gaactgctgg ctccgctcga gccggtcacg gttacgttca cgccgacctt cggtgaaccg360 gacatggtcc atctgagtgg cacgaagttc gggggccttg tcccggccct cttcgaaggg420 gtgcgcgccg gcttctaa438<212>类型DNA<211>长度438序列名SEQ ID 89GDC_MTUB_1241031序列描述自定义密码子序列名SEQ ID 89GDC_MTUB_1241031序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
atgaccagct cagcaccgaa gcccgcggcg tcgcgcgcat cggactggcc aactacttcg60 ccggcgcctt cctgctcccc taccgcgaat tccaccgtgc cgcagagcag ttacgctatg120 acatcgacct gctgggccgc cggttcggag tgggcttcga aaccgtctgc caccggctct180 ccacactgca gcgcccgcgg cagcgaggga taccgttcat cttcgtccgc accgacaagg240 ccggaaacat ctcaaagcga cagtccgcga cggcgtttca cttcagccgg gtcggcggca300 gctgcccgct gtgggtggtc cacgacgcgt tcgcccagcc agagaggatc gtccgccagg360 tggcgcaaat gcccgacggc aggtcgtact tctgggtggc caagaccacc gctgccgacg420 ggctcgggta tctgggcccg cacaagaact tcgcggtcgg gctgggctgc gacctcgcgc480 acgcccataa actcgtctac tccaccggtg tcgtcctgga cgacccgagc acggaggtcc540 cgatcggggc gggctgcaag atctgcaacc gaacgtcgtg cgcccaacgt gcgttcccct600 atctcggtgg tcgcgtcgcg gtcgacgaga acgcgggcag cagcttgcct tattcgtcga660 ccgagcaatc ggtttgaccg cccgacgcca cagcagacaa cgaaacccct tatattactg720 tggtttcagc aggctctggg caagcattgt tgtcggtgcc tgcacatagc attcagtcat780 gtgttccact cgggaggaga tcacggaggc cttcgcgtca ttggctaccg cgctgtcccg840 cgtgctgggg ctgacctttg a861<212>类型DNA<211>长度861序列名SEQ ID 90GDC_MTUB_1252888序列描述自定义密码子序列名SEQ ID 90GDC_MTUB_1252888序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgcagcttg gcaatcaaaa cactatgaga ttcgcagggc ggcctcagcg ttttcgccaa60 agcgcttacc ccctgttcaa ccccaacagc gcgatcgcgc ttggccaccc attcggcggc120 tcgggggcac ggttgatgac tacagtgcta caccacatgc cggacaaggg aattcgctac180 ggcttacaga cgatgtgcga gggccgcggc caagccaatg ccaccattgt ggagttgctg240 tga243<212>类型DNA<211>长度243序列名SEQ ID 91GDC_MTUB_1264312序列描述自定义密码子序列名SEQ ID 91GDC_MTUB_1264312序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
gtgacggtat accgtcgagg tatggctgtg ttaacggatg agcaggtcga cgccgcactg60 cacgacctca acggctggca gcgcgccggt ggtgtcctgc gtaggtcaat caagtttccg120 acgtttatgg ccggtatcga cgccgtacgc cgggtggccg agcgagccga ggaggtaaat180 catcatccgg acatcgatat ccgttggcga acagtaactt tcgcgctggt tacgcatgcg240 gtaggtggta tcacggaaaa cgacattgcg atggcgcacg atatcgacgc aatgtttggg300 gcctaa306<212>类型DNA<211>长度306序列名SEQ ID 92GDC_MTUB_1286282序列描述自定义密码子序列名SEQ ID 92GDC_MTUB_1286282序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgggtgcag tacggcttca acctcaccgc atgggcggtg ggatggctgc cctacatcgg60 catactggca ccgcagatca acttcttcta ttacctcggc gagcccatcg tgcaggcagt120 cctgttcaat gcgatcgact tcgtggacgg gacagtcact ttcagccagg cactaaccaa180 tatcgaaacg gccaccgcgg catcgatcaa ccaattcatc aacaccgaga tcaactggat240 acgcggcttc ctgccgccgt tgccgccaat cagcccgccg ggattcccgt ctttgcccta300 acttcggact ag312<212>类型DNA<211>长度312序列名SEQ ID 93GDC_MTUB_1301742序列描述自定义密码子序列名SEQ ID 93GDC_MTUB_1301742序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgccttcgc cggtgagcag cggaccgacc agccatggca caaacaaggg gtgcgggttg60 atcaggtctg agtcgatgaa caccacgatg tcgccgctgg tggccgccag tgaacgccac120 aatgcctcac ctttgccggg ccgtaccggc acctcgggca acgcctgttc acggctgaca180 acccgggcgc cggaggcgat ggcccggatc tcggtgtcgt cggtggaacc ggagtccagc240 acgatcaatt catcgaccag gccatcgacc agcggagaga tgctgtcgat caccgattcg300 atggtcgctt cctcgttgag ggccggcagc accaccgaaa tcgtccgtcc ggcctttgcc360 gcttccaact ccccgatcgt ccagccggga cggtgccaag tagtgtccaa gggcagcgcg420 ccaggggccc tgccaccggc gagatcgccg gcgaccagct ccgatgctgt catgcgagtc480 ctctcaccgt gcgcgtcggc ggccggaccc cctgaatcga tgccaccatt tccagcaccc540 gccgggtggc ggcgacctca tgcacccgaa acatgcgcgc cccggcggcc gcagccaacg600 cggtggctgc cagcgttccc tcaagccgtt cggtcaaatc cacgcccaga gtctccccga660 caacgtcctt gttgctcaaa gccatcagca cgggccaccc ggtcataa708
<212>类型DNA<211>长度708序列名SEQ ID 94GDC_MTUB_1351907序列描述自定义密码子序列名SEQ ID 94GDC_MTUB_1351907序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgctttcag cggttatcct gaccgaacgt ggctatccag cggtgcccct ggcgggacaa60 ctggtgcacc agaggttcgt ccgtcccggt cctctcgtac tagggacagg tttcctcaag120 tttctgacgc gcgcggcgga tagagaccga actgtctcac gacgttctaa acccagctcg180 cgtgccgctt taatgggcga acagcccaac ccttgggacc tgctccagcc ccaggatgcg240 acgagccgac atcgaggtgc caaaccatc ccgtcgatatg gactcttggg gaagatcagc300 ctgttatccc cggggtacct tttatccgtt gagcgacacc ccttccactc gggggtgccg360 gatcactaa369<212>类型DNA<211>长度369序列名SEQ ID 95GDC_MTUB_1476279序列描述自定义密码子序列名SEQ ID 95GDC_MTUB_1476279序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttggtgggac gcagccgcgt actcgtcctg ttcggagcgg gtgaacatgt cgacgtcgtt60 gcgttgctcg gtgagcgcgc ccatcggctg atcggtgaac acgtcgtgca gaccgtcgta120 ggccatgtgg tccaaaaccg taacgtcgcc gtacttgtaa cccgaccggc tattcatcaa180 caggtggggc gccttcgtca tcgactcctg accgccggcc accaccacgt cgaactctct240 ggcccgaatg agttgatcag ccagcgcgat tgcgtcgatg ccggacaggc acatcttgtt300 gatcgtcagc gcagggacat cccaaccgat gccggccgcc actgccgcct gccgtgcggg360 catttgcccg gcacccgcgg tcaacacctg gcccatgatc acgtactcga ccaaggacgc420 cggcacgttg gccttctcca gggcgccctt aatggcgatg gcacccagct cgctggcgct480 gaaatccttc agggagccca tcaacttgcc gatgggtgta cgcgcgccag caacaatcac540 cgatgtcgtt atgactacct cctcagcgca cccgaaagcc gatctgaccg acccggagaa600 gcagattctt tcccttcagg ttaccgttgt gtgatgacga ccgatcaagt ccacgcccgt660 cacatgctgg ctacctcgtt ggtaactgga ctcgatcacg tcggtattgc ggtcgccgac720 ctggacgttg ccatcgagtg gtatcacgac caccttggca tgatcctggt ccacgaggaa780 atcaacgacg atcagggcat ccgcgaggca ctgctggcgg tgccgggctc cgcggcgcaa840 atccagttga tggccccgct cgacgaatcc tcggtgatag cgaagttcct ggacaagcgc900 gggccaggca tccaacagct ggcgtgccgg gtcagcgatc ttgacgccat gtgtcggcgg960 ctgcgctccc agggcgtccg gctggtctac gagacggcca ggcgtggcac cgcgaactca1020 cgga1024
<212>类型DNA<211>长度1024序列名SEQ ID 96GDC_MTUB_1485311序列描述自定义密码子序列名SEQ ID 96GDC_MTUB_1485311序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcgcgcgg caacaaagtc gccatcctcg agctgctggc gcgcctgtgc caccgctgga60 tcgacttcgg tggactcctc ggaactcgct gcgcccttga gctttccggc tgtcgcagac120 aacagggaat ccacccagcg actcagttgg tccgcgggct ggaggccctg gaagctcgag180 atcggctgtc ccgcagccaa ggccaccacg gtcggaaccg cttggacgcc gaatatctgt240 gccaccctgg gtgcgacgtc aacgttaacc gacgccagcg accacttgcc cttagcggca300 gcggccaagc cggacagcgt gtcaagcaag tcgacgcata cctcgctgcg gggtgaccac360 agcaacacca ccaccggcac ttcgtcggac cggacgatca cctcgtcctc gaagttcgcc420 tcggtgatct cggtcacacc ggacggcgtc gacagtgccc ggtcggcatc cgtgctcgcc480 gcagcgtttt gctgggcacg ttgtttgatg ccggagaggt caacagcacc ggccatggcc540 ggcccgagcg ggggtcgcgg acgcgtcacg ccgtcaagtc tgtcatgccg ctgcggtcat600 cgatccaccc ggtggcgccg accctgcggc aggagccgac ataccgcgat cggttggtat660 gaccaagatc acactggccg ccaccgaccc ctcaaccgct atccggcccg caatatcagt720 gcgtcgccct gcccgccagc cccgcacaat gcggcaaccc cgacgcccga tccccggcgt780 gccaactgca gcgccgcatg tagcgtgatt cgcgtccctg acatgccgag gggatgcccg840 acggcaatcg caccaccgtt gacgttgacg atctgggggt tcagcccgag ttcgcgtatc900 gaggccaatg ccaccgcagc gaacgcctcg ttgatctcca ccacgtcgag ctggtccacc960 gagatgccct cgcgatccag cgccttgttg atcgcgttgg ccggctgcga ttgcagtgtg1020 gaat1024<212>类型DNA<211>长度1024序列名SEQ ID 97GDC_MTUB_1486309序列描述自定义密码子序列名SEQ ID 97GDC_MTUB_1486309序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
gtgcggtcac ggcgtctagc acccacccgg ccacggtcgc ggcggacagc cagcccagcc60 acagccacgc gcgctgcggc gcctccccga acaacgccgc catcagcggc accagcaaca120 cggtgcccac cgctcgcgcg acaacggaac aaaacgcgag cagcgcaaag ccgattagcc180 tggcgcggtg gtcgttcgga acaagggcta tccaggtgcg gatcatcggg tgccgtcctg240 cgctgcggcg accgccaccc ggctgccctg gccggtgtcc cacagccggc agtagcgtcc300 gcccgcggca agcaactcct cgtgggtgcc gcgttcgacg atccgaccat gatcgagcac360 gacgatctgg tcggcccggg tgatggtatg cagtcgatgg gcgattacca gcacggtgcg420 gtcccgggtc agccggttaa gcgcctgttg cacaaggtat tccgattccg gatcggcaaa480 cgcggtggcc tcgtcgagga tgaggaccgg agtgtcgccg aggatggcac gggcaatggt540 gagccgctgt cgctccccgc ccgaaagacc actgttggct ccgagcacgg tatcgtagcc600 gtccggcagc cgaagcaccc ggtcgtggatt tgcgcttcg cgggccgcga cctggacctg660 ttcggcgggg gcatccggta ccgccagcgc gatgttttcg gcggcggtgc catgcacaag720 ctgggcttcc tgtag735<212>类型DNA<211>长度735序列名SEQ ID 98GDC_MTUB_1515112序列描述自定义密码子序列名SEQ ID 98GDC_MTUB_1515112序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgagcgcgg tattggcttt gtctgctgcg gtatcggcac gccgcgcaaa ggctgcggag60 gcccacagcg cccccagcag caacggcacg ccggccagtg cagccacgcc gagctgccag120 gagatcggca acagggccag cgcgatcact gccggcagca ggatcgcgct ggtcaacggt180 gtcaccagat taaccaccag gccaacaagt tccggcccgg tggccgcgat cgcctgccgt240 gccgtcgcgg tgttttcggc ggtaaaccaa tccaaccgga caaccggaag ccggtccgcc300 acatcatgtt gggtgtggtt aaggacggcg aaacccagct cgataccgat gcgtgcggtc360 acggcgtcta gcacccaccc ggccacggtc gcggcggaca gccagcccag ccacagccac420 gcgcgctgcg gcgcctcccc gaacaacgcc gccatcagcg gcaccagcaa cacggtgccc480 accgctcgcg cgacaacgga acaaaacgcg agcagcgcaa agccgattag cctggcgcgg540 tggtcgttcg gaacaagggc tatccaggtg cggatcatcg ggtgccgtcc tgcgctgcgg600 cgaccgccac ccggctgccc tggccggtgt cccacagccg gcagtagcgt ccgcccgcgg660 caagcaactc ctcgtgggtg ccgcgttcga cgatccgacc atgatcgagc acgacgatct720 ggtcggcccg ggtga735<212>类型DNA<211>长度735序列名SEQ ID 99GDC_MTUB_1515464序列描述自定义密码子序列名SEQ ID 99GDC_MTUB_1515464序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链atgccatcgg tcattcgcga cccagatccc ggtgcagcgc ccgcaccgac agttgctgat60 cggagcgcag aagtcccatc agtgcttcag cgatcgcgac gctgcgatgc ttaccaccgg120 tacagccgat ggcgattgtc atatagcgct tcccctctcg gcggtagccg tcgacaacca180 gggatagcaa ccgatggtag gactcgagga actcagccgc gcccggccgg tgcagcacat240 agtcgcgcac ggccggatgt tggccggtca gtggccgcaa ctcgtccacc cagtgcgggt300 tcggcaggaa ccgcacgtcc atga324<212>类型DNA<211>长度324序列名SEQ ID 100GDC_MTUB_1596569序列描述自定义密码子序列名SEQ ID 100GDC_MTUB_1596569序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgctacggc ccatacgggc gggccaacct ggccgacatc tggcgccgcc gcgacctgcc60 acgcgacgcc aaggcaccgg tgctggtaca ggtgcccggc ggcgcctggg tactggggtg120 gcgccgcccg caggcgtatc cgttgatgag ccatctggct gcgcgcggct gggtatgcgt180 gtcgctgaac taccgggtgt cgccgcgcca cacctggccc gaccacattg tcgacgtgaa240 gcgcgcgctg gcgtgggtca aggaaaacat cgccgcctac ggcggggatc cgaatttcgt300 tgccatcagc ggcggttcgg ccggcggcca tctgtgcgcc ctggcggcgt tgacccccaa360 cgatccgcga tttcagcccg ggttcgaaca ggtcgacacc tcggtggcgg cagcggttcc420 ggtatacggg cgttacgact ggtttacgac cgatgcgccg gggcgtcggg aattcgtcgg480 gttgctcgaa acgttcgtgg tgaaacggaa attcagcacg caccgcgaca tcttcgtcga540 tgcctcaccg atccaccatg tgcgggccga cgccccaccg ttcttcgttc tgcacggccg600 ccacgactcc ctgatccccg tggccgaagc ccatgcgttc gtcgaggaac tgcgggcggt660 gtcgaagtcg cccgtcgcct acgcggacct gccccacgcc caacacgcct tcgacgtctt720 cggctccccg cgggcgcatc acaccgccga ggccgtggcc cgcttcctgt cttgggtgta780 cgcgaccaac ccgccggcca cgtagtcagc tataggccag ctattgctat tccgcggcac840 gctccagctc ggccagtgcc ggttcgatgg catcggccat ctcgtcgatg tcgttggcca900 cctcgggtgt ggtcaccagg ccgaaatcca gataatcctg gtaggagaag caggtga957<212>类型DNA<211>长度957序列名SEQ ID 101GDC_MTUB_1600905序列描述自定义密码子序列名SEQ ID 101GDC_MTUB_1600905序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
atgacggcca gcaggcgctc ggaccacacg gacgcgacgc gtcgagccct cgtcgacgct60 ggccgttacc tattcgcgcg gcgcgactat ggtgacgtct cgatcgaaga catcgtcacc120 cgtgcccgag tcacccgtgg cgccctggac taccacttcg acagcaagaa agatctgttc180 cagacggtac tcgaggttgt cgaagccgac ctggtcgccg acgtcgaagc cgccatagcg240 aaggtcaccg acgcctggat ctgctggtcg tcggcttcca cgccttcctt gacgcggcga300 ccaaaccgga tgcgctgcag gtcattgcga ttgacggccc gtcagtgctc gggtggggcg360 aatggcgccg gatcgacatg cgctagggct tggtctgctg gtcggggctc tcgaacgcgg420 gatggccgcc ggggtgattc agcgcgtacc gttgccacca ctttcgcatc tgctgctggc480 cgcgctaacc gaatccgcgc tgcagatcgc ggacgcgacg gacaaagacc ggaccagagt540 cgaggtcgaa cgcgcattta tggccctact cgaaggtcta cgggtgtagc acgcccgcga600 tccgctacgg caacggacca ccggccgcaa tcgcggccag cgtcgcgaaa tgctccccgt660 ccagcgacgc cccgccgacc aggccaccat cgacgtcatc ctgggccacg atgtcgccga720 cgtttttggc gttcaccgag ccgccgtaga gcacccgcac cgtatcggca atcctcggcg780 aggccaacga ggccaactct tttcggatcg ccgcacacac ctcctgggcg tcggcggcgc840 tggccacccg cccggtgccg atcgcccaga ccggttcgta ggcgatga888<212>类型DNA<211>长度888序列名SEQ ID 102GDC_MTUB_1616064序列描述自定义密码子序列名SEQ ID 102GDC_MTUB_1616064序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcggttac gctcggaaag cgcgggcctc gcccacgcgg cggatgatgt cagcggggtg60 gtcctcggcg acgacccgga ccacgatcca cccgtagcgg tgctggactt tctcgtgccg120 gaggatgtct ttccggtagt ggtagcgact ggtcagatgg tggtcgccgt catactcggc180 cgcgaccttg atgtcttgcc agcccatatc caaatgggct tccgcccagc cccattcgtt240 gcgcaccgcg atctgcgtct gggggcgcgg aaagccggcg cggatcaaca acaagcgcag300 ccaggtttcc ttgggggact gggcaccgcc gtcgacgagg tccagagcgg ctcttgcggc360 cttcatgcca cggcggcccc gatagcgctc gatcagcggc tcgacgtcgg ccaccttcaa420 atcggtggcc tgtatcaggg cgtcgacggc cgcgacggcg gggtccaatg gaaatcgact480 ggtcaggtcg agcgccgttc gctccggtgt ggtcacgcgc atgccctcga tgacgcagat540 ctcgtcgggc tcgatgcgct cttcccagac ttgcagcccc ggggcacggc ggcggttggt600 gtcgatgatc gcggcgggaa gatccgcgtc gatccacttg gcgccatgga aggcagaagc660 cgagtagccg gccagcacgc cgcggcggcg cgagcgcagc cacagcgctt ttgcacgcaa720 ttgcgcggtc agttccacac cctgcggcac gtacacgtct ttatgtag768<212>类型DNA<211>长度768序列名SEQ ID 103GDC_MTUB_1672449序列描述自定义密码子序列名SEQ ID 103GDC_MTUB_1672449序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgggtgtgc gcgccgccgt cggcgtagat gatgtcaccc gtggtcgccg gcagccagtc60 agacagcagc gcgcacaccg tcttggcgac cggcgtcgca tccttcatgt tccagccgat120 cggagcgcgc tgatcccagc cctcctcgag cagctggatc tgggcgccgg cctcctcgcc180 gagcgcaccg ccgacgatcg cactcatcgc cagcgtccgg atagggcctg cggcaacgag240 attcgaacgc acaccgtact tgccggcctc gcgcgccacg aacctgttga ccgactccaa300 cgcgctcttg gcgaccgtca tccagttgta ggccggcatc gcccggctcg ggtcgaagtc360 catgccgacg atggaacctc cggggttcat gatcggcagc agcgccttgg ccatcgaagc420 atacgaatac gccgagatgt ggatgccctt ggacacatcc gcgtagggcg cgtcgaagaa480 cgggttgatg cccatcccgg tctgcggcat gaacccaatc gaatgcacca ccccgtcgag540 cttgttgccc gccccgatcg cctcggtcac ccggccggcc aagctggcca ggtgctcctc600 gttttgcacg tcgagttcga gcagcggggc ctttgccggc agccggtcgg tgatgcgctg660 aatcagccgc agccggtcga acccggtgag caccagctgg gcgccctgct cctgggctac720 ccgtgcgatg tgaaacgcga tcgacgagtc ggtgatgatt ccgctaacca gaatccgttt790 gccgtccagc agtcctgtca tgtgcgtcct tgtgttgtgt cagtggccca tacccatgcc840 gccgtcgacc gggatgaccg caccggagat atagctcgca tcctcggaag ccaggaagct900 gaccaccccg gcgacctcgg cgggggtgcc gacccgcttc gctgggataa attgcagcgc960 cccctgctga atccgctcat ccagcgcgcg ggtcatatcg gtgtcgatgt agcccggggc1020 cacc1024<212>类型DNA<211>长度1024序列名SEQ ID 104GDC_MTUB_1673708序列描述自定义密码子序列名SEQ ID 104GDC_MTUB_1673708序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atggtgccga gcatgagggt gcgctcggat tgggagccga tcgcccagag ccgctcccgg60 ctcgcggtca cggcaccgcg caacacctcc gggggtcgct tcatctggat tctcctcggt120 tctgcgcgaa acggtagcag agcgccatgg ttgccaacgc ggtcgccggg cagtctagac180 cggatcttcc tcgtggcaac cgacaacagg acgtcgttgc cgaaagggcg ctgggcaccg240 acatctagga tgaacccaca gccacgcccc gacgttatgc catggcgaag agcgaccggc300 aggagcggga acccagtgaa gcgagcgctc atcaccggaa tcacaggacc ggacggctcg360 tatctcgcta agctcccgct gaagggatat gtggccgctg gtagcccggc cgaggtctat420 ttctgctggg cgacacggaa ttatcgcgaa ttgtatgggt tgctcgcggt caacagcatc480 tggttcaatc acgaatcacc gcgtcacggc gagacattca tgactcgtaa tcctgcacca540 tatcgcggtc ggcaacgagg cgctgatcga tgcgcagacg ctgatgcgcc ggcccacccg600 gataggtatc agtattgggg cgttccggcc agcgtacgag gcgtgatcga ccgcgcaatg660 ggtgtttgcg ttgagtaa678<212>类型DNA<211>长度678序列名SEQ ID 105GDC_MTUB_1699549序列描述自定义密码子序列名SEQ ID 105GDC_MTUB_1699549序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgagcggtc agccatcggc tttgcgccga cctacggtgt ccccgtcggc gtgtcgccga60 cctacggtgt cgaagtcaaa gccaaagatc gacaggatga ccagcaggat ggcgccaccg120 actaccgacg gatcggcgac attgaacacc ggccaccagc cgaccgacaa gaaatcgacg180 acgtgcccgc gcagcggccc cggtgcccga aagaagcgat caaccaggtt gcccatggca240 ccgcccagga tcatcccaag acccagcgcc caccacggcg ataccagccg ccgccccatc300 cagaaaattc cgaccacgac acccgtcgca atcagcgtca aaacccaggt gtatccggtc360 gccatcgaga aggccgcccc agaattacgc accagagtcc aggtcaccgt gtcgccgata420 atcgacaccg gctggccggg cggcaacagt tggacagcta ccaccttggt gacaatgtcg480 agtgtgagca ccaccacagc gaccgacagc agcatgcgca gccgtcgcgg cggcgcggga540 gcgttaggtt cccccgcccc cccggcttcc tcggtcgagg tcagcggatc agccgatcct600 gttggttcgt caggcacacc atcatcatcc cctagggccg atatggcccg cccagacccc660 gcggccggat gggagcaaac cacgtgcgca atgatcccat catggcccgc ctcaccgtca720 tcactactgg agggacaatc tcgaccaccg ccggccccga tggggtgcta cggccaaccc780 attgcggggc gacgctga798<212>类型DNA<211>长度798序列名SEQ ID 106GDC_MTUB_1742061序列描述自定义密码子序列名SEQ ID 106GDC_MTUB_1742061序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcccccga ataggccgga acgccggtta gggaaacctc taacagcgcc gcttcgacgc60 gcaccagcac atccccttcg cgacggtccc ggatcggtcg gaaacccacc gaaaacgagt120 cgacgacacc agcttttacg ttcgccaaag cctcgtcgcc gtccggggtg tccgcaatct180 cgaacgcccc gaacaagccg tgaggctcct cccgcaactc aacggcccgg cccaccgggt240 agcgggttcg agcgtcgtga gagaccagca gcttcaattt gtggccgcgc tcggcgatgg300 agcgccgaaa agcgccagga gcgaacattt cctggaactc gccgtcgaag tcgcggacgg360 tggtcgcctc gttgtagggc acgatggtgc cgtgcacggt tcggccttcg ccagaccgca420 gctcggccat gcggaaaagg atgctactca aaattcggcc accacctagc agacgcaaga480 aacgcgcgga atcgcttgtg gcgcatggcg gccgctatcc gggttccagc cgccccgcgg540 cgactgcccg gcgtcagcgg atgccgagat gccaaactcg attgtatcac acacaaaagg600 tcatcaccgg tccggggcaa acgggttgag cccgtcgccg tcgtcgcccg gcgccaccgc660 cagtcgctgc tcggcggccg gggtcaggcc aaactcggag gccaagcgca gcagatgcat720 gcgcgccgtc tccgcaaccg tcaccgccgg gttccggtgc acgacaccgg atttcggtga780<212>类型DNA<211>长度780序列名SEQ ID 107GDC_MTUB_1782153序列描述
自定义密码子序列名SEQ ID 107GDC_MTUB_1782153序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgtggaaat ggaagccgcg cttggcattc caccgggcaa cctggcggcg acgctggacc60 gctacaacgc ctacgccgcg cgcggcgcag atcccgattt ccacaagcag ccggaattcc120 ttgcagcaca agacaacggg ccgtgggggg cgttcgacat gtcgctgggc aaggcgatgt180 atgccggatt cactctgggc gggctggcca cgtcggtgga cggtcaagta ctgcgcgacg240 acggcgcggt ggtggccggc ctgtacgcgg tcggggcatg cgcgtccaat atcgcccagg300 acggcaaggg atatgccagc gggacccagc tgggtgaggg gtcgtttttc gggcgtcgcg360 ccggagcgca tgcggcagcc cgagcgcagg gcatgtaagc ctcctcgcgc cgcgactggg420 aatcctgcga cgcgacacgc cgacaaggcg tcgtga456<212>类型DNA<211>长度456序列名SEQ ID 108GDC_MTUB_2060659序列描述自定义密码子序列名SEQ ID 108GDC_MTUB_2060659序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgtggcccc gtatttccgc ggcgccgtcg aatcggcgat cgacagttgg cggcgtgtgg60 tgtcgacggc ggcccaactg ggtatcccga ccccgggatt ctcgtcggcc ctgtcgtatt120 acgacgcgct gcgcaccgcg cggctgcccg ctgcactcac ccaggcccag cgcgacttct180 tcggcgcaca cacctacggc cggatcgacg aaccaggcaa gttccacaca ctatggagtt240 cagaccgcac cgaagtaccg gtgtagcggg ctagaactaa aagggggtaa aggggtaagt300 gatgagattt ctagacgggc acccacccgg gtacgacctg acatacaacg acgtgttcat360 cgttccgaac cgatccgagg tcgcgtcgcg cttcgacgtc gatttgtcca ccgccgacgg420 ctcgggcacc accattccgg tagtggtcgc caatatgacc gcggtagccg ggcggcggat480 ggccgagacg gtcgcccgcc gcggtggcat cgtaatcctg ccgcaggatc tgccgatccc540 ggcggtaaag cagacggtgg cgttcgtcaa aagccgggac ctggtgctcg acaccccagt600 gacgctggca cccgacgatt cggtgtccga cgccatggcg ctcatccaca agcgcgcaca660 tggcgtcgcg gtggtcatcc tcgagggtcg cccgatcgga ttggtgcgcg aatcgtcctg720 cctgggcgtg gatcgcttca cccgggtgcg cgatatcgcc gtgacggact atgtgaccgc780 tccagcggga accgagccac gcaagatctt cgacctgctg gagcacgccc cggtcgacgt840 tgcggtgctg accgacgccg acggcacgtt ggcgggagtg ctaagccgca ccggggctat900 ccgcgccggt atctacaccc cggccaccga tag933<212>类型DNA<211>长度933序列名SEQ ID 109GDC_MTUB_2093062序列描述
自定义密码子序列名SEQ ID 109GDC_MTUB_2093062序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgggtatat ctcccggcga tcgcggggat cgtgttcgtg gcaatgccgc tggtcgcgat60 cgccatccgg gtcgattggc cgcgtttctg ggcgctgatc actactccgt cttctcaaac120 ggccctgctg ttgagcgtga agaccgccgc ggccagcacg gtgctgtgcg tactgctggg180 cgtcccgatg gcgctggtgc tggcccgcag ccgcggacga ctggtgcggt cgttacgacc240 gctgatcctg ttaccgctgg tgctgccgcc ggtagtcggg ggtatcgcgt tgctctacgc300 gttcggccgg ctcggcctga tcgggcgcta cctggaggcg gccggcatca gcatcgcatt360 cagtaccgcg gctgtggtgc tggcgcagac ctttgtctcg ctgccgtatc tggtgatttc420 cctagagggt gcagcccgca ccgccggagc cgactacgag gtggtggcgg cgacacttgg480 ggcgcggccc ggcactgtct ggtggcgcgt gaccctgccg ttgctgctcc cgggcgtggt540 gtccggatca gtactggcgt ttgcccgctc gctcggagag tttggcgcga ccctaacctt600 tgccggttcc cggcaagggg tcacccgtac ccttccgctg gagatttacc tgcagcgggt660 gaccgatccg gacgcggcgg tggcattgtc actgctgctc gttgtggtag cggcactggt720 ggtgctgggt gtgggtgctc gtacgccgat cgggaccgat accaggtagc cggtcatgag780 caagctgcag ctgcgcgcgg tcgtcgccga ccggcgtttg gacgtcgaat tctcggtgtc840 cgcgggcgag gtgcttgcag tgctcgggcc caacggtgcg ggcaagtcca ccgccctgca900 tgttatcgcg gggctgcttc gccccgacgc gggcttggta cgtttggggg accgggtgtt960 gaccgacacc gaggccgggg tgaatgtggc gacccacgac cgtcgagtcg ggctgctgtt1020 gcaa1024<212>类型DNA<211>长度1024序列名SEQ ID 110GDC_MTUB_2105797序列描述自定义密码子序列名SEQ ID 110GDC_MTUB_2105797序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcccacgc cggtcccagc ccgaactggg acgccgtcgc gcagtgcgaa tccgggggca60 actgggcggc caacaccgga aacggcaaat acggcggact gcagttcaag ccggccacct120 gggccgcatt cggcggtgtc ggcaacccag cagctgcctc tcgggaacaa caaatcgcag180 ttgccaatcg ggttctcgcc gaacagggat tggacgcgtg gccgacgtgc ggcgccgcct240 ctggccttcc gatcgcactg tggtcgaaac ccgcgcaggg catcaagcaa atcatcaacg300 agatcatttg ggcaggcatt caggcaagta ttccgcgctg acggttggcg gcgtgtgcgg360 tctatgacca ggtcgacgta tgtgtttgga tcaggtcatg gaaggttcgg ccacagttca420 catggcagcg ccgccggaca agatctggac attgatcgcg gatgtccgca ataccggccg480 gttctcgccg gaaaccttcg aggccgagtg gcttga516<212>类型DNA<211>长度516序列名SEQ ID 111GDC_MTUB_2133554
序列描述自定义密码子序列名SEQ ID 111GDC_MTUB_2133554序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgcgccggc tccgctcttc agatccacgg tgccatcgcc ttcacgtggg agcacgacct60 gcacctgtat taccgccggg ccaagaccac cgaggcgctt ttcgggagca gcgctcgaaa120 tcgtgcgctg ctcgccgaac gcgcggggct tgtgaaagcc taggcgccca gcgcggccag180 cgccgcttcg tagttgggtt cttgcgcgat ttccggcacc aattccgtgt aggcgacgtt240 gccgtccgcg ccgatcacca cgattgcgcg ggcgagcagc ccggccatcg gcccgtcggc300 gatggtcacg ccgtaatcct cgccgaagct gtcccggaat gccgacgcgg gcatgacgtt360 ttcggtgccc tcggcgccgc agaagcgctt ctgggcgaac ggcagatcct tcgagacaca420 cagcacggta gcgccacttg ccgccgcacg ctcgtcgaag gttcgcacac tcgtcgcgca480 caccggtgtg tccacggatg gaaagatgtt cagcaacacg gacttacccc ggaactggtc540 gctgctgatc acccccagat cgcccccggt cagggtgaag gccggggccg gggatccgac600 agcaggtag609<212>类型DNA<211>长度609序列名SEQ ID 112GDC_MTUB_2183418序列描述自定义密码子序列名SEQ ID 112GDC_MTUB_2183418序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcgcgggt ccgggcggac gcagatacaa gaccacgccg ctgccctgag ccgacatcct60 cgccagcgcg ccgttgagtt cctcgccgca gcggcacgcc gtcgagccga acacgtcgcc120 cgtcaggcac tcgatgtgga cgtgcagcgg cacgggcacc ccggcaccga ccgcacccac180 gatgaccgcc aaatgctcgc cgaggtcgta aacgtcacga aagccgatga cacgcgaggc240 gccggcccag gtgggcagcg tcgctgccgt aaaccggacc acctggggct cgatccgccg300 gcgatacgcc accagctccc cgatcgagac catggccagt ccgtgttcga cggcgaattc360 gaccgactcg gcgtggtgcg ccatctggac gggattatcg ggcgagacga tctcgcagag420 cgcggcggcc ggccgccgtt ccgccaggcg ggccaggtcg acggccgcct cggcgggtcc480 ccgccgaccc agcacaccgt cggcttgcgc ctgcacgggc accacatggc ccggacgttg540 gaaatcggcg gcgacggagg tggccgaagc cagtgccgcg atggtccagg cgcgatcgct600 cgccgagatt ccggtgccgg tgccgcgaac gtcgaccgac acgcaatgcg tggtgtctcg660 gtcacacatg ggcggcaggt gcagtcgctc gcattcggcg cccggcagcg cgacgcgcaa720 ataacccgag gtgtgccgga ccgcaaaggc aaccagccgc ggcgtcgcgg cctgggcggc780 gaagacgaga tagccatcgc cattggggtc gccggtcagg accacggcgt gaccgcccgc840 catcgccgtg atcgcacgac gtacccgcac atcggtcgtc ttcatcgaga ctccaaccgg900 cggaaccggc taccgtga<212>类型DNA<211>长度918
序列名SEQ ID 113GDC_MTUB_2192571序列描述自定义密码子序列名SEQ ID 113GDC_MTUB_2192571序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgaagacag ctatttctct gccggatgag acgttcgatc gggtatcgcg gcgtgcgagt60 gagctcggca tgagtcggtc cgagttcttc acgaaggctg cgcagcgcta cctgcacgag120 ctggacgccc aattgctcac gggccagatc gacagggctc tagagagcat ccatggcacc180 gacgaagcgg aggccctcgc cgtggccaac gcataccgcg tgctagaaac catggacgat240 gagtggtga249<212>类型DNA<211>长度249序列名SEQ ID 114GDC_MTUB_2234641序列描述自定义密码子序列名SEQ ID 114GDC_MTUB_2234641序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgtctacat ccacgacgat tagggtttca acccagactc gggatcgtct ggccgcccaa60 gcccgcgaac ggggaatctc gatgtcggct ctgctcaccg aactggccgc ccaggccgag120 cgccaggcaa tcttccgcgc cgaacgcgag gcctcgcacg ccgagacgac cacccaggca180 gtccgcgacg aggaccgcga gtgggagggc acggtaggcg acggccttgg ctga234<212>类型DNA<211>长度234序列名SEQ ID 115GDC_MTUB_2320829序列描述自定义密码子序列名SEQ ID 115GDC_MTUB_2320829序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtggcgacca gcacctcgcc ggccggtggg ctgccgcagg cccgctcgca gccgacgaaa60 tgccgatgcc cggctgactc cacgttcagt gaccgcgcgg cgtcggcccg tacgtcggcg120 gccgagtgcg cgcagccggg gctgccggtg caggcgctga tgttcagcca gggggagttc180 tcgtcgaaca ccaggcccag cggcgccagc acccgcagcg cggcgtcggc cgtcgcgtcg240 tcgaggtcgc agatcagcac cgatcgccac ggcgtgatca ccagcggggc ctcgatcgcg300 gccaggcatt ccgcgacccg ggcgggcaag acccccagcg gcaccgcggc gcccagcgtt360 acccggctgt catcctgggg tatccagccg acgggcgttt tggtgacggg ccgaacggat420 gggcccagct cgacaccgga ctgcagctcg ccgatatcgg ctaattccgt tactcgccag480 gcggtttcgc ggatcttgac gaaacgcaac gcgacctcga tcagggtctc ggcgacatcg540 gccacccgca cgccggtgtc acgtccggtc aacagcagtc ggggaccgtc ggggaacacc600 tgcacgccga cgtcggcacc caggccggac acgtcggcgc ggccgtcgtc gagaccgaac660 cagaaccggc cgcccagttc cgccagccgg ggctcggcgc ggatcgccgc gtcgagctca720 ccgacccatg cccgcacgtc ggctagcccg ccggcccggc cggacagcgg cgaggcgacg780 atattgcgca cccgctcgtg tgttgccgac ggcagcagcc cggctttggc gaccgcgtcc840 gcgaccgctg ccacgtcgcg gatcccgcgc aactggacat tgccgcgcgc ggtcagtccc900 agtgtcgcgg agccgaagtc gctggcgacg ctggccagcg tcgccagttg tgccgcggtg960 atcatcccgc cgggcagccg gatccgcgcc agcgccccgt cggcggcctg gtgcggccgc1020 aacg1024<212>类型DNA<211>长度1024序列名SEQ ID 116GDC_MTUB_2321250序列描述自定义密码子序列名SEQ ID 116GDC_MTUB_2321250序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgacgggcc gtgtccgaca gaccggcata acccgtctcg tcgtacatca gcggggcccc60 gtccttccac agcgactgat gacagtgcat gccggacccg ttgtcgccga acagcggctt120 gggcatgaac gtgaccgttt tgccgttctg ccaggcggtg ttcttgatga tgtacttgta180 caactgcatg tcgtcggcgg cgtgcagcag cgaattgaac tggtagttga tctcggcctg240 tccgccgctg cccacctcgt ggtggccctt ctccaggatg aagccggagt tgatcaggtt300 ggtcagcatc ttgtcgcgca ggtcgacgta ttggtcgttg ggggccactg ggaaataccc360 gcccttgtgg cggaccttgt agccccggtt gggactgccg tcggcctcgg tcgccgcgcc420 ggtgttccac caccccgaga tggcgtccac ctcgtagaag gagccgttgg cgcgcgagtc480 gaagctcacc gaatcgaaaa tgtagaactc ggcctcggcg ccgaagtatg cggtgtcggc540 gatgccagtg ctgatcaggt agttctcggc cttgcgggcg atgttgcgcg ggtcgcggga600 gtacggctcc agggtgaacg ggtcgtgcac aaagaagttg atattcagcg tcttggccgc660 gcggaacggg tcgatgcgcg ccgtctcggg atcgggaaga agcaacatgt cggattcgtg720 gatcgactgg aacccgcgaa tcgacgagcc gtcaaaggcc aagccgtcgt caaacacgct780 cttgtcaaag gccgaagccg gaatcgtgaa gtgctgcatg atgccaggca ggtcacagaa840 ccggacgtcg acatattcga ccttctcgtc cttggcaagt ttgaagacgt cgtcgggcgt900 cttttccgtc acagaatgct cctttactgt atccgcggcc gacgctatgg agccgatatt960 gcccgtcagt caaccccgtg ttgcgcagac gttactgacc gtgccgccca ccactga1017<212>类型DNA<211>长度1017序列名SEQ ID 117GDC_MTUB_2487508
序列描述自定义密码子序列名SEQ ID 117GDC_MTUB_2487508序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtggcgggcg tttgcgcgct attctccggt gcttcccgct ggccgtctgg tgaacttcgg60 caccgtccac agggttcccg ccggggtccg agccggctac gatgcacctt tccccgacaa120 aacgtatcaa gccggcgccc gggcgttccc acggttggtg ccgacctcac ccgacgatcc180 ggcggtaccg gccaaccgcg cggcatggga agccctgggc cggtgggaca aaccgttcct240 tgccatcttc ggttatcgcg acccgatact cgggcaagcg gacggtccgc tgatcaagca300 cattcccggc gcggcgggtc agccgcacgc ccgca caag gccagccact tcatccagga360 ggacagcgga accgaactcg ccgaacgcat gctctcctgg cagcaggcaa cgtaaccgcg420 acggctgcgg acgaaggatc ggcagaatgg cgatggagat ggcgatga468<212>类型DNA<211>长度468序列名SEQ ID 118GDC_MTUB_2567990序列描述自定义密码子序列名SEQ ID 118GDC_MTUB_2567990序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgaccgaca acgagtgccc ggccgacagc cgacggcgcc atgtcctgcg gctcgccctg60 ttcgccggga ttttgctggg gctgttctac ctggttgcgg tggcacgagt catccacgtc120 gacggggtcc gtagcgcgat cgtggtggcg acgggtccga tcgcacccct ggcgtacgtt180 gtggtgtcgg ccgcactcgg cgcgttgttc gtcccgggcc cgatcctcgc cgccggcagc240 ggggtgctgt tcgggccgct actagacacc tttgtgaccc tgccagcttt ctcggccggc300 gcgcaggccg gaatgacgcc caggcgctgc tgggtgtcga tcgcgcccat cgcctcgatg360 cacagatcga acggcgcgga ttgtgggcgg tggtcggtca gcgcttcgtc cccggcatct420 cggatgcgct ggcctcgtac accttcgggg cgttcggagt tccgttgtgg cagatggtcg480 ttgggtcgtt catcgggtcg gcgccacggg tgttcgtcta caccgcgctg ggcgcgtcga540 tcaccaacct gtcgtcgccg ctggtttact cggcgatcgc ggtgtggtgc gtga594<212>类型DNA<211>长度594序列名SEQ ID 119GDC_MTUB_2577106序列描述自定义密码子序列名SEQ ID 119GDC_MTUB_2577106序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgtggggcgg tggtcggtca gcgcttcgtc cccggcatct cggatgcgct ggcctcgtac60 accttcgggg cgttcggagt tccgttgtgg cagatggtcg ttgggtcgtt catcgggtcg120 gcgccacggg tgttcgtcta caccgcgctg ggcgcgtcga tcaccaacct gtcgtcgccg180 ctggtttact cggcgatcgc ggtgtggtgc gtgaccgcca tcatcggggc gttcgccgcg240 cggcgttggt accggaagtg gcgtgcgcgc ccgcgccggc ggtgcggcct ggctcagctc300 acgaccggta gtcagcaacg ccacacgagt caccggacac cggcgggcgt cgtcatgccc360 ggttcactgt ccgagcaccg ccgtctccgt caagaagcgc cggatcgcat cgagcatcac420 ccgcccatcg agtag435<212>类型DNA<211>长度435序列名SEQ ID 120GDC_MTUB_2577486序列描述自定义密码子序列名SEQ ID 120GDC_MTUB_2577486序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgtctgcgg ttttaccggc tcggtgcatt cgcgcgctag ccgatagggt ctatcgccat60 gtccggtgcc acggtgggtg cgcgcgaaat caccatccgc ggagtcgtcc tgggcgcatt120 gattaccttg gtgttcaccg cggccaacgt gtacctgggg ctaagggttg gattgacatt180 cgccacttcc ataccggccg cggtgatctc gatgggcgtg ctgcggttgt tcgccaacca240 ctcagtggtg gagaacaata ttgttcagac gatcgcgtcg gcggccggca cgctgtcgtc300 gatcatcttc gtgttaccgg cactgctcat gatcggctgg tggagcgggt ttccgtactg360 gacaacggcg gcggtgtgtg cactgggcgg gatccttggc gtcatgtact caattccgtt420 gcgccgcgca ctcgtcaccg gatcagacct gccgtaccca gaaggcgttg ccggagccga480 ggttctcaag atcggtga498<212>类型DNA<211>长度498序列名SEQ ID 121GDC_MTUB_2690012序列描述自定义密码子序列名SEQ ID 121GDC_MTUB_2690012序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链gtgggcccga tgaacgggtt cctgagttgg tgggacggcg tcgagctgtg gctgtccgga60 ctcccgttcg cgctgcaggc gttggcagtc atgccggtcg tgctggcttt ggcctatttc120 accgcggcat tgctggatgc cctgctcggc cgggtcattc agttgattcg ccgcgcccgc180 cgccccgatc aggcgcccag gtag204<212>类型DNA<211>长度204序列名SEQ ID 122GDC_MTUB_2698040序列描述自定义密码子序列名SEQ ID 122GDC_MTUB_2698040序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atggcggacg atgtgagcgg cgcggtgtac cgggccggca cggcccacgg tcggccgacc60 ggtcgcattg aacaccgcga ccgtcaggtc gtgacgcgcc gggcgactga tacgcgcgcg120 gaactggacg ggctgtccga ccatcagctc gccgaagtcc agcgctcgcg cgaaaaccac180 tacccggccg gatgtctcgt catcccgcag ccgttgaacc gtcgcccgga acatcaaccg240 gccccgcccc agcgacactg ggctctcgct gggggtgacc gtgaccagcg cggaggtgcc300 aaatgccacg gtgattgggt ggcgatcgac cgcctcggag cgcaacgcga ccgcaagccc360 gtaccccgcg cccaccatac cgaccgcgac caggccggcg ctgatcgaac ccagtcgcgg420 agcgtgccac gaccggcgcg ccacacacca ccacagtgcg ccgccgccga gggccaccac480 gacgcagcac aaggcacaca cgttgccgat cggccacacg atcccggccg ccgtcacaat540 ccagctgacc agcgccgccg ggaccaggcg tacgtccaaa cgggacgcgc cgaagcccat600 atggcgcacc ggtatcagac acggaccaga ttgcgccgct tgtccagccg cgccggaccg660 atgccgtcga cgtcggcaag ctggtcgacg ctggtgaacc taccattgcg ctgccgccac720 gccacaatcg ctgcggcggt gaccggcccg atgccgggca gggcgtccag ctgctccacg780 gtcgcagtgt tgaggtcgag cacctcagct gtcttaggag ctgtcttagg gcctgtcgtg840 gctgtgcccg aggtacccgc cggtcccggc gtccccgcac cgaccgagct gcccagcacc900 ctcggctgtc ccgagggcgg agctagcccg accacgatct gctcaccgtc accaagctgc960 cgagccatgt tcagtccgac ggtgtccgcg ccgtctaccg ctccgccggc ggcctgtagc1020 gcat1024<212>类型DNA<211>长度1204序列名SEQ ID 123GDC_MTUB_2712275序列描述自定义密码子序列名SEQ ID 123GDC_MTUB_2712275序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
60 ctggccaccg tcgtgcagtg cgtgaccggc gggctggggg tgacactgat tccgcagacc120 gcggccgccg tcgagaccac gcgaagccgg ctggaactcg cccgattcgt cgcccctgcc180 cggcgcgacg aatcggtttg gtgtttagct ctttcggcgg ccgcgagaag tcctaccagc240 gtcttgccgg gattatcggc aagctga267<212>类型DNA<211>长度267序列名SEQ ID 124GDC_MTUB_2725593序列描述自定义密码子序列名SEQ ID 124GDC_MTUB_2725593序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgcgcagag tattcagcgg ttggacaacg ttggtccgct gcagcaccgc agcgaccacc60 gtcacgatca gggcgatgac aaagcacgtc ccggtaatcc actccagcga accgacccgg120 ccgctgacgc cgcgaaagcc ggtggatccg gtgcgtcggt gctgcagcca actgcgtcag180 ccgaatccga ccacactgaa aaccgcgaag agtgccagcg ctaagtcggc cgcggtggtc240 gttcgcatca gcgggtctcc ttcggtgcgt agcagtggtc atgaaccgtt gtggcggttg300 gctcgcaggg ccgcatcgat cgcggcggcg gccggtgcgc agtcgccgac accggacacc360 aaagttgcca gcgcacccgc agcgcaggcc cgccgcaatg cgcgcagtcg ctcggccggc420 gaacctgggt tgcgcggcca attcgcagca aggaccccgg caaatacgtc gccggcgccg480 gcggtatcca ctggcgttac cgttggggcg ggtacctcga acaccccgtc cgcgccgacg540 taccgggcac cgcgcacacc cagggtgatc acgaaatgtg ttggtggcga cggccagtcg600 tttgcctcat gctcgttggc gatcaccacg tcggcgatag cggccaagtc ctgcaaggag660 cttcgatcct ggccggctgg ggaggcgttg accatgacaa ccgcatcggc cgactgggct720 gcccgcgcgg ctgccagcgc ggttgcaaca ggaatctcca actgggtcaa cagtacatcg780 cagttggcga cggccgaggg taccggagtc agatgtgcat tggcacccgg cgccaccagc840 acggtgttct cggcgctggc atcgaccacg ataatcgccg tcccgctcgg tccgggcacc900 gtgacggtcc tgtccagtcc aacggcgttg gcgcgcaggt gggcccgcag ctgggcggcg960 gctggatcgt cgccgaatgc accggagaac tgtacctgcg cgcctgcgcg cgctgcggcc1020 accg1024<212>类型DNA<211>长度1024序列名SEQ ID 125GDC_MTUB_2733212序列描述自定义密码子序列名SEQ ID 125GDC_MTUB_2733212序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
60 aaacagctcg cgtcagcgat tcgcaaccca tacggactcg tccgtgggtg gcgctgtcgc120 atctgtaacg agcaccaagg ccagccggtc aagatggcgc aagaccacga agaggaggtc180 cgcatccgtt ggggcgagac ggtggacgaa ctccacgctg cgctggaccg cgccgggcca240 aggccaggga cgtggtgtac gagtgaaggt tcctcgcgtg atccttcggg tggcagtcta300 ggtggtcagt gctggggtgt tggtggtttg ctgcttggcg ggttcttcgg tgctggtcag360 tgctgctcgg gctcgggtga ggacctcgag gcccaggtag cgccgtcctt cgatccattc420 gtcgtgttgt tcggcgagga cggctccgac gaggcggatg atcgaggcgc ggtcggggaa480 gatgcccacg acgtcggttc ggcgtcgtac ctctcggttg aggcgttcct gggggttgtt540 ggaccagatt tggcgccaga tctgcttggg gaaggcggtg aacgccagca ggtcggtgcg600 ggcggtgtcg aggtgctcgg ccaccgcggg gagtttgtcg gtcagagcgt cgagtacccg660 atcatattgg gcaacaactg a681<212>类型DNA<211>长度681序列名SEQ ID 126GDC_MTUB_2828257序列描述自定义密码子序列名SEQ ID 126GDC_MTUB_2828257序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgggatcgc tcaccgtgtt caccagctcg gcgaggatgt cgcgcacagc ggccaacacg60 tcggcgcgcg cactgcacag catgaccacc gggtcgggcg ggaagagcag aatgctgaac120 acgatagcca gcccaccacc gaccagcgcg tcgaagaggc gttcgaaaac cacactgccg180 ttggacgcga agaccaagac cagcaccgcg gagacggcgg cctggttgat gaacattaag240 ccttgcgcga ccaacccgcg tgcgcacagc accgcgaccg acaacgcgat gaacaccacc300 acacccatgg cgatcggtcc ggaaccaagc agagcatgca cgccagcacc cagcacgatc360 cccagcgcca ccccgacgat catctgttgg gcacgtcgtg cgcgcagcac gttggtcgcc420 gacatgcaca ccacagccga aatcggcgcg aagaacgcct gcggatggtt gaacacgtca480 tgggtgagat accacgcgag gccggcgacg accgatgtct gggtgatcgg ccacagcacg540 gtgcgcaacc gttgggcgac cgcacggccg ccgcaggccg tcctgactag cagcgaagcg600 ctcatgaacg cctatttatt cacactcggg tgcgacgtcg taaccgcaaa gatctggtca660 tgcctgctgg acccgcttgg gctgggcatc tattccggac tccttacgtt gctgagcggt720 aatgggcgcc ggcgcgtcgg tgagcggatc gacgccgccg ccggtcttcg ggaacgcgat780 cacctcacgg atcgagtcca tcccggccag cagcgcggtg gtccggtccc acccgaacgc840 gattccgccg tgcggcggtg cgccaaacat gaacgcctcc aacaggaatc cgaacttttc900 ctccgcctcg gccttgtcca ggcccatcac cgcgaacacc cgttcctgga tatcacggcg960 gtggatacgc accgagccgc caccgatctc gtggccgttg cagacgatgt cgtacgcgtc1020 ggcc1024<212>类型DNA<211>长度1024序列名SEQ ID 127GDC_MTUB_2895354序列描述自定义密码子序列名SEQ ID 127GDC_MTUB_2895354序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgatcggcg atttcgccga gatgctcggc ggccaggacg gcgtcgctga gttggtccaa60 cacgtcgctg tgcacccgtt tgatggcgtt gatgagctcg tcgaggcgga cggggtaggc120 ggtgggtgtg ggctccggca tgacgtcaac agtaggttga cgttatgcat tgtgtcgacc180 gtgattggct gcgtagtggg ttctgcagcg ctgccaggcc gctgcgggca gggtggcgcc240 gatcgcggcc accaggccgg cgtgggcgtc gctggtgacc agcgcgaccc cggacaggcc300 gcgggcgacc aggtcgcgga agaacgccag ccagccggcc ccgtcctcgg cggaggtgac360 ctggatgccc aggatctctc ggtagccctc ggcgttgacg ccggtggcga tcaaggtgtg420 caccccgacg acgcggcctg cctcgcgcac cttgagcacc agggcgtcgg cggcgaggaa480 ggtatacggg ccggcatcga gcgggcgggt ccgaaacgcc tctacggctt cgtcgagctc540 tttggccatg atcgacactt gcgacttgga aagctttgtc acaccaagtg tttcgaccag600 gcgctccatc cggcgagtgg atactcccag caggtagcag gtcgccacca cgctggtcag660 tgcgcgttca gctcgcttgc ggcgctgcag cagccagtcc gggaaatagc tgccctggcg720 cagcttgggg atcgcgacgt cgatggttgc ggcacgggtg tcgaaatcac ggtggcggta780 gccgttgcgc tgattggacc gctcatcgct gcgttcgcgg tagcccgccc cgcacagggc840 gtcggcttca gcccccatca aggcggcgat gaacgtcgag agcagcccgc gcagcagatc900 cgggctcgcc tgtgcgagtt ggtcagccag aagctgctcg gtgtcgataa gatgagaaga960 ggtcattgcg tcatttcctt cgattga987<212>类型DNA<211>长度987序列名SEQ ID 128GDC_MTUB_2983047序列描述自定义密码子序列名SEQ ID 128GDC_MTUB_2983047序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttggatgagc cggcgcaccg cgctcgcccg aaagggaacg gagccaatca tgacggcgct60 caaccgtgct gtggcatcgg cgcgtgtggg aaccgaggtg atccgcgtgc gcgggctcac120 cttccgctac ccaaaggcgg ccgagccggc ggtgcgtggc atggagttca ccgtcggccg180 cggcgaaatc ttcgggcttc taggtcccag cggcgcgggc aagtccacca cccagaagct240 tctcatcggg ctgctgcgcg accacggcgg ccaggccacg gtgtgggaca aagagccggc300 cgagtgggga cccgattact acgagcgcat cggggtctcc ttcgagctgc ccaaccacta360 ccaaaagctc accgggtatg a381<212>类型DNA<211>长度381序列名SEQ ID 129GDC_MTUB_3005316序列描述自定义密码子序列名SEQ ID 129GDC_MTUB_3005316序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgatccctc aaatgacggt gtcctgcccg cccccgtcga cttctgagcg cgaagagcag60 gcgcgggcac tgtgcctgcg cctgctcacc gcgcgatccc gcacccgcgc cgagttagcc120 ggccagctgg ccaagcgcgg ctaccccgaa gacatcggca accgggtatt ggatcggctg180 gccgccgttg gcctggtgga tgacaccgac ttcgccgaac aatgggttca gtccaggcgg240 gcgaacgcag caaagagcaa gcgcgcgttg gctgccgagc tgcacgccaa gggcgtcgac300 gacgacgtga tcaccacggt gctcgggggc atcgacgccg gtgccgaacg ggggcgggcg360 gaaaagctgg tacgggccag gctgcggcgg gaggtgctga tcgacgacgg caccgacgaa420 gcgcgggtga gccgcaggct ggtggcgatg ttggcgcgcc gtgggtacgg ccagaccttg480 gcgtgcgagg tggttatcgc cgagctggcc gccgagcggg agcgccgacg cgtctaa537<212>类型DNA<211>长度537序列名SEQ ID 130GDC_MTUB_3048559序列描述自定义密码子序列名SEQ ID 130GDC_MTUB_3048559序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttggtgacga ctctggcgcc gatcttggac agtgcatcga tgactccgaa gaccgcctcc60 tcgttgccgg ggatcagcga cgacgacaac acgatgagat caccagcagt caacgtgatg120 ctgcgatgct ccccacgcga cattcgcgac aacgccgaca tcggctcgcc ttgggtgccg180 gtggtgatca acacaacttg gtcgggcgcc atcgtttcgg cggcggcgat gtcgatgaga240 tcggaatcag ccactcgtag gaagcccagt tgccttgcga cgcgcatgtt gcgcaccatc300 gatcggccga cgaacgacac tcgccggccc aatgccactg cggcatcgat gatctgctgt360 acccgatcca cgttggaggc gaaacacgca actatcaccc gtccgtcggc accccggatg420 agccggtgca gcgttgggcc cacttcgctt tccgatggcc cgacaccggg gatctcggcg480 ttcgtcgagt cgcacagcaa caggtccacg ccggtgtcgc cgagccgcga catgcccggt540 agatcggtgg gacggccgtc cggtggcaat tggtcgaact tgatgtcgcc ggtgtgcagg600 atggttcccg cgccggtata caccgcgatg gccaacgcgt ccggagtgga atggttgacg660 gcgaagtact cgcactcaaa cacgccgtgc cgggtgctct ggccctcgcg gacctcgacg720 aacaccggtg ttatgcggta ctcacgacat ttctctgcaa ccagagccaa ggtgaacttc780 gagccgacga ccgggatgtc gggtcgcagc ttgagcagaa acggaatcgc cccgatgtgg840 tcctcgtgcc cgtgggtcaa caccagcgcc tcgatgtcgt caagccggtc ttcgacatgg900 cgcatgtccg gcaggatcag atcgacaccg ggctcgtcgt ggccaggaaa caacacaccg960 cagtcgataa tcaacagtcg gcccaggtgt tcgaaaaccg tcatgttgcg gccgatttcg1020 ttga1024<212>类型DNA<211>长度1024序列名SEQ ID 131GDC_MTUB_3065095序列描述自定义密码子序列名SEQ ID 131GDC_MTUB_3065095序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgtccaaga gatcggatgg gccgagcact ggcaatgcga ttcgtgctcg gcatcgcatc60 agcgtgatga ctgcgcagcg atcaacctcg cacgctacga ggacaccagt agcgtcgtcg120 gcccagttgg ggccgccgtc aagcgtggag ccgaccgtaa gacccggcct ggccgggctg180 gtggccgtga agcgcggaag ggaagcagcc gcaaggctgc cgaacaaccc cgagacgggg240 tgcaagtcgc gtgaccacta a261<212>类型DNA<211>长度261序列名SEQ ID 132GDC_MTUB_3100192序列描述自定义密码子序列名SEQ ID 132GDC_MTUB_3100192序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtggcaacga agaacgcggc atggccttca tctacaagct gctcgaacta ctcgccgaac60 gcgacgatcg aatcacaaag gccagatggg tgtacttcct cacgcgcatg cgtaacccca120 ccggtgacac agcgcctttt cagcagtttg ctaaccggct acaccaatgg ttccaagatc180 cgacagacgc caagcaactc aagaccgcgc tgcacctcta catctatcgc actcgcaagg240 aggagtccga atgagcgtca tccaagacga ctatgtgaaa caggccgaag taattcgcgg300 cctgccaaag aaaaagaacg gcttcgagct gaccacaacc cagctgcggg tgctactcag360 cctgaccgca cagctcttcg acgaggcgca gcagagcgcc aaccccacgc tcccgcgtca420 gctgaaggag aaggtccagt acctgcgggt ccggttcgtc taccagtccg ggcgtga477<212>类型DNA<211>长度477序列名SEQ ID 133GDC_MTUB_3129118序列描述自定义密码子序列名SEQ ID 133GDC_MTUB_3129118序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
60 ttccgctggt ggacccgctg ccgagcgttg gagctcggcc tgaccggtta cgcggccaac120 cacgccgacg gacgcgtgct ggtggtcgcc cagggtccgc gcgctgcgtg ccagaagctg180 ctgcagctgc tgcagggcga cacgacaccg ggccgcgtcg ccaaagtcgt cgccgactgg240 tcgcagtcga cggagcagat caccgggttc agcgagcggt aa282<212>类型DNA<211>长度282序列名SEQ ID 134GDC_MTUB_3237815序列描述自定义密码子序列名SEQ ID 133GDC_MTUB_3237815序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgttgcacg acgtcgtcca cggcagacga tgtagtgaga atggccaccg gcgacgaatc60 actcagtacc gaatcggaac gttcatcggt aacgccgcct tgtggaaccg aaagcggcac120 ggcgatgcgc ccggcctgca acgcgccgag aaaggcgacg acgtactcga gtccctgcgg180 agcagagatc accacgcggt cacccgtgga accacaacgg ctcagctcct gtgccacatt240 cagcgttcgc cgatacagct gcgaccacgt cagggttatc gcaacgccgt cccagtcctg300 ttcgtaatcc ataaacgtga aggccgggtc atggggttgc agacgcgcac acgcgcgcaa360 cgcagcggga agggaacgca cactcatggg catcacgtta ccggccacgc ttggagttgt420 cgcagtcgcc gtcggggtgt gctcgcgctc cgcggtctta gccaagtcgc atctggccag480 ctcagcaggg gtttgccggc tcgccatggg tccaccatcg gacacggtcg gatgtga537<212>类型DNA<211>长度537序列名SEQ ID 135GDC_MTUB_3283182序列描述自定义密码子序列名SEQ ID 135GDC_MTUB_3283182序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgcccacca ccaaagccac ccagcgccgt gatgtttcca ccgagatcgc ttacctgaca60 agagcattga aagctcccac cctgcgtgag tcagtgtccc ggctggccga tcgcgcccgc120 gccgagaact ggagccacga agaatacctg gccgcctgcc tgcagcggga agtgtcagcc180 cgggagtccc atggtggtga gggccgcatc cgcgccgccc gcttcccggc tcggaagtcg240 ttggaagagt tcgactttga gcatgctcgt ggcctcaaac gcgacaccat cgcacatctg300 ggcaccctgg atttcatcac cgcccgcgat aacgtcgtgt ttttgggccc cgcctggcac360 cgggaagact catcttgcgg tcggcctggc gatacgcgcg tgtcaggccg gtcatcgggt420 gctgttcgcc accgccgccg aatgggtagc acggctcgcc gaggctcacc acgccgggcg480 catctacgcc gaactcaccc ggctttgccg ctatccgctc ctggtggttg a531
<212>类型DNA<211>长度531序列名SEQ ID 136GDC_MTUB_3289702序列描述自定义密码子序列名SEQ ID 136GDC_MTUB_3289702序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgcagtggg ggtaccgccc gcttgcgggg gacgaagcga tgaggtgggg gtaccgcccg60 cttgcgaggg agagcggcgc acttgacccg gatcatcggc ggtgtcgccg gaggccggcg120 cattgccgtc ccaccacgcg gaaccagacc taccaccgat cgggtgcgcg agtcgctatt180 caacatcgtg actgcgcggc gggatctgac cggtctggcg gtgttggacc tctatgcggg240 ttccggcgcc ctggggctgg aggcgttgtc gcggggagcg gcgtccgtgc tgttcgtgga300 gtccgaccag cgcagcgcgg ccgtcattgc gcgcaacatc gaggccctag gtctctccgg360 tgcgacgctg cgccggggcg cggtggcggc cgtcgtggcg gccgggacca cgtccccggt420 ggatctggtg ttggccgacc cgccctacaa cgtcgactcc gccgacgttg a471<212>类型DNA<211>长度471序列名SEQ ID 137GDC_MTUB_3319076序列描述自定义密码子序列名SEQ ID 137GDC_MTUB_3319076序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgggtgggg ttgccagcac tcggcaggca tccgttcgcc gttggtctgc cgttcacccc60 ctggatgcct cgccggcgtt gccccgtccc ggtcaacgat gtgcgaccgc tcgcgcggtc120 gcgggcccta ccccgagctg gcgtgcggcc gtcaggtcgg cgggggtgtc gacatcgcag180 cgcaggcccg gccaggctcc tgtcagctcg acagcgcccg aacggcggtg ccgcgcggac240 gaatccggcc cgaaccgcgg gtgcagcgcg gtgccgaacg cacacagtac cgcggtgccg300 gtcccaagcc ggtcggcgac gaagctgcgc cgatggtggc gtgcggccga gattgcctcg360 gcgagttcct gtgtctgtaa tgccggcaaa tcgccttgca gcacaacgat gttggaggcc420 ccttcggcaa ccacgcgttc ggcagcggtg atggcggtgt tcagtgggtc gggatcgtct480 tcgggtgtcg ggtcggccag tacatcggcg cccagcccgg ccgccgcagc cgccgcggct540 tcgtcggggg tgataacagt gatcgagcgc agtgaaccga cacccgccgc ggcggtcaac600 gtgtcgacga gcatggccag caccacgttc tcgcgagtct gcgccgagaa caccggggcc660 agcctggttt tggccgcggc caagcgcttg acggcgatga tcaagccgat atcgccgtcg720 tccggtgtgc cgctcatgaa gtcatcctgc cagcgtcgat ccacgcggca cacttcgacg780 gcattgccgc cacggtcgtg gccggggccc aggcacggtc ccgacggcaa ccgcggcgca840 gattag846
<212>类型DNA<211>长度846序列名SEQ ID 138GDC_MTUB_3339006序列描述自定义密码子序列名SEQ ID 138GDC_MTUB_3339006序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcgcggca ggttgatccg atacgcggtg ttgttgtctc cgagcttgcc gctacgtccc60 agcgcgtcgg ccaccggctt ccagtcggca tcggtggtgg tcaccgccga acgagctttg120 ccggcgtggc cgctgcccgc tccacccttg gagcccgaac tgcacgccgc cagtatcacc180 gccgccgcgg tggtgatcgc gacgattctc ccagcatgtt tggcgcccgc catgcgcgtt240 ccctccatcc gttgcatcca cggcgtggat ggcagttcgg ttagccatgg tctatcgggt300 gattatgaaa ccacgatgaa gctcgatcgc accgatccgg gcacggccag acgtcctcat360 cgacgccctg ggcgcgtatc tgctggccgc cgcggctctt cgacccgtgg aacgcatgcg420 catccgcgcc gcgggcatca gcgccaccga cccacatgcc cgtctgccat tgccactggc480 tcgagacgaa atccggtatc ttggaacaac attcaacgac cttctgcagc ggctgcaaga540 cgcgctcgag cgagaacgtc aattcgtcag cgatgcgggc cacgaacttc gcaccccctt600 agcctcctga ccaccgaact cgaactcgcc ctgcggcgtc cacgaagcaa ccccgaactg660 ctcgccgcaa tccgctcggc tctcgcggaa accaccgaca ccgcgcgcac caccggcggc720 accgggcttg gactggccat cgtcgacacc ctcagccaac gcaaccacgc cagcgtcacc780 gcccgaaacc gcgccgcagg cggtgccgaa atctccctcc ggcttgctct tggctga837<212>类型DNA<211>长度837序列名SEQ ID 139GDC_MTUB_3356995序列描述自定义密码子序列名SEQ ID 139GDC_MTUB_3356995序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcttgggc tgcccgaccc ccgccccgtc ccacgcaacc cggctgcccg tcgtcgggcg60 acatcccggt ctctatcggc ggacccgagc agccgcccgg ctagccagtc gcggccaagg120 ccagggacgt ggtgtacgag tgaaggttcc tcgcgtgatc cttcgggtgg cagtctaggt180 ggtcagtgct ggggtgttgg tggtttgctg cttggcgggt tcttcggtgc tggtcagtgc240 tgctcgggct cgggtgagga cctcgaggcc caggtagcgc cgtccttcga tccattcgtc300 gtgttgttcg gcgaggacgg ctccgacgag gcggatgatc gaggcgcggt cggggaagat360 gcccacgacg tcggttcggc gtcgtacctc tcggttgagg cgttcctggg ggttgttgga420 ccagatttgg cgccagatct gcttggggaa ggcggtgaac gccagcaggt cggtgcgggc480 ggtgtcgagg tgctcggcca ccgcggggag tttgtcggtc agagcgtcga gtacccgatc540 atattgggca acaactga558
<212>类型DNA<211>长度558序列名SEQ ID 140GDC_MTUB_3381198序列描述自定义密码子序列名SEQ ID 140GDC_MTUB_3381198序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgattttct gggcaaccag gtactgcacg atctggttgc cgccttcacc ctcgtcggtg60 accttctccc cggcagtctt ggccggtttg ggcgtcgacg ccagcacggt ggatccggcg120 ttggccagcc ccacctcgtc gctctcgaca ccgatctcgg ccagggtcag cacggtaact180 tccttcttct tggcggccat gatgcctttg aaggacggga agcgcggctc gttgatcttc240 tcgttcacgc tgatcaccgc gggcagcgtg gcctcgaggg tgaatacgcc ctcatcggtc300 tcacgctcgc cggtgatctt gccgccctcg atcgacactt tgcgcaggtg ggtgagctgc360 ggcaggccca ggtactcggc gatgatggcc ggcaccgcac cgcccacccc gtcggtcgat420 tcgttgtctg cgatcaccag ctcggtgccc tcgatggtgc ccaacgcgcg cgccaaagcc480 cacccggttt ggatgacgtc cgagccgtgc atgccgtcgt cctttaggtg gacggccttg540 tcggcaccca tcgacagcgc cttgcggatc gcctcggtgg cgcgctcggg gcccgccgtc600 agcacggtta ccgacccttc gatgccgtcg gcggcctctt tctcccgaat ctgtagcgct660 tcctccacgg cgcgctcgtt gatctcgtcc agcaccgcgt cggcggcctc gcggtccagc720 gtgaaatcgc cgtcggtcag cttgcgctcc gaccaggtat ctgggacctg cttgatcagg780 accacgatgt tcgtcatgac tgtggttcgt cctcctcgaa ggcggcccgc agcgctcgac840 tgcggaacct cggtcacacg ttttgcaacc gcacagcgat attactattc ggtaagttcg900 cgtggtgcgc cctcacacca tagcgggtgg tag933<212>类型DNA<211>长度933序列名SEQ ID 141GDC_MTUB_3388071序列描述自定义密码子序列名SEQ ID 141GDC_MTUB_3388071序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgctctcct cctggccaag gccagggacg tggtgtacga gtgaaggttc ctcgcgtgat60 ccttcgggtg gcagtctagg tggtcagtgc tggggtgttg gtggtttgct gcttggcggg120 ttcttcggtg ctggtcagtg ctgctcgggc tcgggtgagg acctcgaggc ccaggtagcg180 ccgtccttcg atccattcgt cgtgttgttc ggcgaggacg gctccgacga ggcggatgat240 cgaggcgcgg tcggggaaga tgcccacgac gtcggttcgg cgtcgtacct ctcggttgag300 gcgttcctgg gggttgttgg accagatttg gcgccagatc tgcttgggga aggcggtgaa360 cgccagcagg tcggtgcggg cggtgtcgag gtgctcggcc accgcgggga gtttgtcggt420 cagagcgtcg agtacccgat catattgggc aacaactga459
<212>类型DNA<211>长度459序列名SEQ ID 142GDC_MTUB_3482312序列描述自定义密码子序列名SEQ ID 142GDC_MTUB_3482312序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgatcagat cgatcgatcg ctgggggtcc gctgccgggg gggcggtcgg cacgcccggt60 gggaccgact gtaatggccg ctcctcccac ccagctcggt ctgcggcgac gaacacatcg120 atctcggccc agggcgccgc gggtccctgg gtcaagaatc gggggcgttc cagttttccg180 gtggcctcat gcagccgcac cgccgccgag acgacctcat catgcctagg ctccggcgcg240 ccggcgacga acgtgtctgc ccgccaacca gacaccacgt accggccgtc ggtcgatcgg300 acgggccgag ccaggcgtac gccgtcgacg aacaacgtct cgcgcacccg ggccgaccag360 gccgcgcggg cgttgtcggc caccatcgac aacaccacct cgccgcatcg ccagccacct420 tcccaaccgg cacccaacag gatgggttgc gcacctgcca aaccgaacgc caccaacacg480 tgctcgggcg gcggctcgac attcacaccg gtcagcctag tagagcccat cggggtgtat540 tgggcctgta tcggtcctag tacatcacca tgtcgggctg catctgcttg gcccacgcga600 cgatcccacc ctgcaggtgt accgcgtcgg agaaaccggc tttcttga648<212>类型DNA<211>长度648序列名SEQ ID 143GDC_MTUB_3581973序列描述自定义密码子序列名SEQ ID 143GDC_MTUB_3581973序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
atgcggtgta gggcggcgtt gagctggcgg ttgcccgagc ggctgagccg catctggccg60 gcggtgttgc ccgaccacac cgggatggga gccactgcgg catggcaggc gaaggcggct120 tcgcttttga accgggtcac tccggcggct tcgccgacga ttttggctgc agtcagctcc180 gcgcagccag ggatttccag cagtgcgggg gcgacctggt ggactcgggc gctgatgcgc240 tgggctaggg tgttgatctc gccggtgagc cggatgatgt cggtcagctc ggcgcgcgcg300 agttcggcga ccaatcctgg ctgggtgtcc agccaggtcc gcagggcctg ctggtgcttg360 gcggcatcga gcgagcgtgc tgccggtgcc cgctcgggat cgagttcatg gacgagccag420 cgcaaccggt tgatcgccga cgtgcgttgg gccacaagga catctcgacg gtcagtcaac480 aacttcaact cccgcgacgt ctcgtcgtgg gtggccaggg gtaggtcggt ttcacgcagc540 accgcccgcg ccaccgccag cgcatcgatc ggatccgact tgccccgact gcgcgccgac600 ttgcgggtct gggccatcag cttggtgggt acccgcacca cctgctggcc ggccgccagt660 aggtcacgct ccagacgcgc cgacatgttg cggcagtcct cgatgcccca gatcagctcg720 aggccgaact gttcacgggc ccacatgatg gctgtggcgt gcccggccgt ggtggccttg780 acggtcttct caccgagttg gcgacccact tcgtcggtgg ccacaaaggt gtggctgtac840 ttgtgcgcat cggttccaac aacaaccatg gtggttgcct ctgaaccgcc ccggtga897<212>类型DNA<211>长度897序列名SEQ ID 144GDC MTUB 3711717序列描述自定义密码子序列名SEQ ID 144GDC MTUB 3711717序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgccggatc tcctcgagtt tgcggccctt ggtctccggc gcaaagcggt acacgaccac60 gaacgcgacg acggcgaacg tgccgaagac cgcgaaaacg cc tgcgccgc cgagcacacg120 cagcatggtg agcgagaagg cggcaacgat cgcgttggcc gtcagtgtcg aggtgagcat180 cgggctcgat cccatcgacc gcagccggga cgggaagctc tccgcggcgt acacccagac240 cagcgagccg aatccgaagt tgaacccgat gatgaacagc agcacgccgg cgaaccccaa300 caccagcccc gtgccaccat cggagtcgtt ggcgaatacg gtgatcagca cggcatctgc360 ggtgatcatc gtcgcgatgc cggacaacag gatcgggcga cggcccagcc gatcgaccag420 aaacagcgag gcacacaccg ccgccaagcc ggcgacttgc accatcgcgg gcagggcaag480 catcgcgaaa tagcccgcga agcccatggc ggcgaaaagt cgcggactgt agtagatgat540 cgcgttgatc ccggtgatct ggacgaggaa gccgagcgcg atgacgaaca gcgtggcccg600 cagatacggc cgccgcacca tttcgccgat accgccgccg cgttcgtcga ccgcggccgc660 catatcggcc agctcggcat cgatgtcggc ctccggctgg atccgccgca gcgcgctacg720 cgcgtcggcg atccggccct tgagcagata ccagcgggcg gtatcgggca tgcgccacaa780 caacggcaac agcagcgtgg ccggcgcggc ggccagcccg aacatcgcgc gccagccgtg840 cgatccggcc aacaggtagc cgaccaggta accgacgacg atgccgctaa gcgtcgccag900 ctgatacgcg gtcaccaacg acccacgcac cgccgccggc gccgactcgg ccacatacac960 cggcaccacc accaccgaca ggccgattgt cacacccagc agcagacgcg ccaccaccag1020 catc1024<212>类型DNA<211>长度1024序列名SEQ ID 145GDC_MTUB_3716987序列描述自定义密码子序列名SEQ ID 145GDC_MTUB_3716987
序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgtctgacg ctacgacagt gttgttcggg ctgccaggag cacgggttga gcgtgtcgag60 cgccgcagtg acgggacccg ggtggtcgat gtgatcaccg atgagccgac ggcggcggcg120 tgcccgtcgt gcgggggtgg tctcgatatc agtgaaggaa tacgcggtta cctcaccgaa180 agatctacct tatggcgaag accgcatcat ggtgcgctgg aacaaaattc gctggcgatg240 ccgagaagac tactgcaagc tggggccgtt caccgaggcc atcacccagg tacctgcccg300 cgtccgcagc acgctgcggc tgcgtcggca gatggccaag gcgatcgggg atgcggcccg360 ctcggtgggc cgaggtcgcc caggctgacg ccgtgtcgtg gccgacggca catcgggcgt420 ttgttgccta cgccgagacg ggtattgacc gagccgttgc ccaccccggt gctgggcgtt480 gaccagacac ggcgaggaaa acccagatgg gagcgctgcg ccaagactgg ccggtgggta540 cgggtcgacc cgtgggatac cgggttcgtc gacctggccg gtgatcaggg gtttatgggg600 cagcatgaag gccgcggcgg cgcggcggtg ctggcatggc tgcaagcgcg cacaccgcag660 ttccgggaga gcatccagta cggtggccat cgaccccgcc gctgcctacg cctcggcgat720 ccgcacgccc gggctgctgc ccaacgccaa gctcgtcgtc gaccacttcc atgtgaccac780 gctggccaac gacgcgctga ccgcggtgcg ccgccgggtg acctgggcgt tccacgaccg840 gcgcggccgc aagatcgacc cgcagtgggc caaccgacgt cgcttgctga ccgcccggga900 acgcttgtcg gacaaaagct tcgccaaaat gcggaatcgg atcaacgccg tcgacccccg960 cgcgcagatt ctctcggcct ggatcgccaa agaggagctg cgcaccctgc tgtcgaccgt1020 gcgc1024<212>类型DNA<211>长度1024序列名SEQ ID 146GDC_MTUB_3754581序列描述自定义密码子序列名SEQ ID 146GDC_MTUB_3754581序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcaggcat tgcccgaaag ccagctgcca gagctggccg tgcagatgcg tcggcggctc60 atagaaacag tgacggctac cggtggccat ctcggcgcgg gacttggcat ggtagagctg120 accatcgcat tgcatcgggt gttcacctcg ccacacgaca tcggtgttcg acaccgggca180 ccaaacctat ccgcacaagc tgctcaccgg ccgcggtaa219<212>类型DNA<211>长度219序列名SEQ ID 147GDC_MTUB_3794808序列描述自定义密码子序列名SEQ ID 147GDC_MTUB_3794808
序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgtcttcag aggggggttg gcccaacgtc ggaaacctcg cgcgcagcgc atcaatgaca60 tcggcagttt catcaagtgc cagggttgtc tgggtcagat acgatagctg ggtaccctcg120 ggcaggttca acgctgccac atcagcgggt gtctgcacca ataatgttga ccgcggagcg180 acgccaagcg tgccttcggt ctcctcatgt ccggcgtgcc cgatgaagac caccgtgtca240 ccgcgcgcgg caaaccgtgc ggcttcagcg tggactttcg ccaccagtgg gcaggtcgcg300 tcgacgacct gcagtccccg ctcatcagcg cccgcgcgca ccgccgggga aaccccatgc360 gcggagaaca ccacgaccgc ccccggcggc ggcggatcgg gaatctcgtc gagatcctcg420 acgaacactg ctccccggtc ccgcaactcg gcaaccacaa cagtgttgtg cacgatttgc480 ttgcgcacat acaccgggcc ttcggccacg tcaagcactc gcttgaccgt ctcgatagca540 cgctctacac cggcgcaaaa cgaccgcggc gacgccaaca gcaccgtgac ttcacccgaa600 gcgtatccct gtgcgaccgg tcccacgaac acctcagcca tcagcactcc cggcgacata660 tcagttgcga caacgcgatc aggtctgggg atcgcaccgc atcgggcagt gccgcaatag720<212>类型DNA<211>长度720序列名SEQ ID 148GDC_MTUB_3796793序列描述自定义密码子序列名SEQ ID 148GDC_MTUB_3796793序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcctgggc atcgtcgggg cacgtcggct tcaagggttc ccggaaatcg accccgtttg60 cggcccagct ggccgcggag aacgccgctc gcaaggccca agaccacggg gtgcgcaagg120 tcgacgtgtt cgtcaagggc ccgggctcgg gccgcgagac cgcgatccgg tcgctgcagg180 ccgccggcct ggaggtgggc gcgatctcgg atgtcacccc ccagccgcat aacggtgtcc240 ggccccccaa gcgccggcgc gtctaggaga gaagatggct cgttacaccg gacccgtcac300 ccgcaaatca cggcggttgc gcaccgacct cgtcggtggc gaccaggcct tcgagaagcg360 tccctacccg cccggccaac acggtcgcgc gcggatcaag gaaagcgaat atctgcttca420 gctgcaggag aagcagaagg cccgtttcac atacggcgta atggaaaagc agttccgccg480 ctactacgaa gaggccgtgc ggcagcccgg caagacgggt ga522<212>类型DNA<211>长度522序列名SEQ ID 149GDC_MTUB_3879013序列描述自定义密码子序列名SEQ ID 149GDC_MTUB_3879013序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgggacgcc gtgatcgcgg tgcacctgcg cggccatttt ctgctcaccc gcaacgccgc60 tgcctactgg cgggacaaag ccaaggatgc cgaaggggga tcggtcttcg gccggctcgt120 caacacctcg tcggaggcgg gtctggtggg cccggtgggg caggcgaatt acgccgccgc180 caaggctggc atcaccgcgc taaccctgtc ggcggcgcgg gcgctcgggc gctacggcgt240 ttgcgccaat gtgatttgtc cgcgggcgcg caccgcgatg acggccgatg tcttcggcgc300 cgcacccgat gtcgaagcgg gccagatcga cccgctgtcg ccgcagcatg tggtaagcct360 ggtccagttt ctggcgtccc cggctgccgc ggaagtcaac ggtcaggtgt tcatcgtcta420 cggtccgcag gtgacgctgg tgtcaccgcc gcacatggag cgccggttca gcgcggacgg480 cacgtcctgg gatcccaccg agctcaccgc gacgctgcgg gactactttg ctggtcggga540 tccggaacag agcttttcgg cgaccgatct gatgcgtcag tgacccgtgg atataggcgg600 ccgattattg gaatcggtgt ccgaatcacc acgccaacat ag642<212>类型DNA<211>长度642序列名SEQ ID 150GDC_MTUB_3921024序列描述自定义密码子序列名SEQ ID 150GDC_MTUB_3921024序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgccttgga cggcatgttg ctccccttat tcgaacgaca accggaccaa acccagcccg60 gtgaagtcgg cgacaaactc gtcgccggcc cgcgcctcga ccgcgaacgt gcatgacccg120 ggtaacacga tgtcgccttt gcgcagccgc acgccgaaac tctcgacctt gccggccagc180 caagccaccg cggtcgccgg gttacccaac accgcatcac tgcggccctc ggccaccacc240 tcgccgttgc gggtcagctt cgcatcgatc gccctgacgt caagatcggc cggcggcacc300 cgggccgcgc ccaacacgaa gcccgccgcc gaggcgttgt cggcgatggt gtcgcagatc360 ttgatctgcc aatccttgat cctggtgtcg atcagctcga tggcgggcac cagggcctcg420 gtggccgcca gcacgtcgtc ctcggtgcag cccgcacccg gtaggtcggc ggccaggatg480 aagcccacct ccacctcaac ccgcggagac aggtaccggg acgcctggac cggcgtgtct540 tcgaacacct gcatgtcgtc gagcaggtgt ccgtag576<212>类型DNA<211>长度576序列名SEQ ID 151GDC_MTUB_3974481序列描述自定义密码子序列名SEQ ID 151GDC_MTUB_3974481序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链gtggttcact ctcggcgctc atgggcgcca tcccgccgcc cgcatcgcgg catcgacgcg60 gccaacgaac gtgccccggc ggtaccagag cagctcactg gtgaccctga tgatcgtcca120 gcccagatcc agcaacgcgg tggaccgctc gatgtcccga gcccgctgcg ccgggtctgt180 ccaatgctgt ggcccgtcat actcgacacc gactcgcaat tgctcgtagc ccaggtcgat240 gcgggcgacg aagtccccgt agtcgtcaaa cactctgatc tgtgtttgcg gcttcggcag300 accggcatcg atcaacacca atcgggtcca cgtctcctgt ggggattccg cacccccgtc360 gatcagcggc agcaccgcac ggaggcggac caggccgcgc gcaccggtat gttcggcaat420 gacggcctgc acgtcggcga ccttgacatc ggtcgaattc gccaacgcgt ccagccgttg480 aacggcctgc agccgcgagg gtgtgcgccg cccgatatcg aaggcggtgc gcgccggggt540 ggttaccgcg acaccgtcaa ccgcaaccgt ctcgtgcggc gccaatcgat ccgtgtgcac600 gacgatgcgc ggcggaggct ttcgattggc gtgcactaa639<212>类型DNA<211>长度639序列名SEQ ID 152GDC_MTUB_3994808序列描述自定义密码子序列名SEQ ID 152GDC_MTUB_3994808序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgtcgcgct accccaacag ctggcgcagg ttgaacaacc ccgatatggc ggtgcccatg60 ttaaacaggc ccgtgttcaa gccgctccgg acggagccaa agagggtgcc cgggacgccg120 atgttgccaa tgcccgaggt ctggccgttg atgacagtgc ccccgctggc cgtgttgaag180 aacccggaga cgtcgacggc taaggggccg gtgggggtgt tgaagaagcc cgagacgtcg240 gtgccggtgt tgccgaagcc cgagttggtc aggccgctgt cggtaatgat cccgaaaccg300 gtgttcacat tgcccgcatt ccacgagccg gtgttgatgt tgcccgagtt cccattgccg360 gtgttgacgt tgccggagtt gtcaaacccc gtgttgacga agcccgcgtt tccgaagccg420 gtgtttaatt cacccgcgtt ccccaagccg gtgttgagga tgctcgcgtt cccgaagccg480 gtgttgagaa cgcccgcgtt cccgaagccg atgttggcgt tgccggaatt cccgacgccc540 aggttgttga ggtcgccagg caccagggta ttggctccgg tgttgaagac gccgatgttg600 ccgctgccgg agttgaacaa gccgatgttg ttggtgccgg agttgccgat gccgatattg660 ccgctgccgg agttcagcag cccggccagg ttgatgccca tctga705<212>类型DNA<211>长度705序列名SEQ ID 153GDC_MTUB_3998938序列描述自定义密码子序列名SEQ ID 153GDC_MTUB_3998938序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链ttgagctcaa atcatgcgat tctgcgtctg ctcgcgccct tgcggctaga tccccagaac60 ctgggcgctg gcccacagcg cgagcaccgc catcgccagg gccgcaggca cggtgcacag120 tcccagtcgg gtgtactcgc cgacgctggc gtcgacgttg tgccggcgca gcacgccccg180 ccacagcagg ttagacagcg aaccggcata ggtcaggttg ggtccgatgt tgaccccgag240 tag243<212>类型DNA<211>长度243序列名SEQ ID 154GDC_MTUB_4021183序列描述自定义密码子序列名SEQ ID 154GDC_MTUB_4021183序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgtgccagg gtgtacccgc ccgattgccg ccggcaaccg acactgttgg tgtagtgacc60 aaatcagcag tgccccgggt gggtcttgac gtgcaaatcg actacagtct tggtgaccgt120 ccggtacccg ggcatgggac tggaacgaac caagaaacct gtgaggccgt ctgctatgga180 gcggttcgac ggtttgcgtc cggccaggct caaggtgggg atcatctcgg ctggccgggt240 cggcaccgcg ctaggggtcg cgctgcagcg cgccgaccat gttgtggtgg cgtgcagcgc300 catctctcat gcgtcccggc ggcgcgcgca gcgccggctg cctga345<212>类型DNA<211>长度345序列名SEQ ID 155GDC_MTUB_4045946序列描述自定义密码子序列名SEQ ID 155GDC_MTUB_4045946序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
atgcggcccg caaaacgggc cgaggaggag ccaggcaatc accccagagc cgggtgcagc60 gggtcgccac catcagcccc gtggcgatcg caaaccccgc gcctggcgac aatgcggccc120 gcaaaacggg ccgaggagga gccaggcaat caccccagag ccgggtgcag cgggtcgcca180 ccatcagccc cgtggcgatc gcaaaccccg cgcctggcga caatgcggcc cgcaaaacgg240 gccgaggagg agccaggcaa tcaccccaga gccgggtgca gcgggtcgcc accatcagcc300 ccgtggcgat cgcaaacccc gcgcctggcg acaatgcggc ccgcaaaacg ggccgaggag360 gagccaggca atcaccccag agccgggtgc agcgggtcgc caccatcagc cccgtggcga420 tcgcaaaccc cgcgcctggc gacaatgcgg cccgcaaaac gggccgagga ggagccaggc480 aatcacccca gagccgggtg cagcgggtcg ccactggcta gaccaacgac cggtagttcc540 cgacggcgtc ggaaaatccg acagctgagc gttcgggtca aacacgcggt gcaccggacc600 tga603<212>类型DNA<211>长度603序列名SEQ ID 156GDC_MTUB_4053033序列描述自定义密码子序列名SEQ ID 156GDC_MTUB_4053033序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atgcgcacta cgatcgacct cgatgacgac atactgcggg cgttgaaacg acgccagcgc60 gaggagcgca aaacgttagg gcagctcgcc tccgaattgc ttgcgcaagc tctggcggcc120 gagcctcctc caaacgttga catccgctgg tcgactgccg acttgcggcc ccgtgtggat180 cttgacgaca aggacgctgt ttgggcgatt ttggaccgtg ggtga225<212>类型DNA<211>长度225序列名SEQ ID 157GDC_MTUB_4140236序列描述自定义密码子序列名SEQ ID 157GDC_MTUB_4140236序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgtcacgtt gtcggattca ctgtcgccgg ctagcgcttt cccgtcagaa gacgagaagc60 ctccccgatc tccaactagc atcgagatcg ggcttgcgaa ggttgggttg caaaatggat120 gtcatcagat gggctcgccg gcttgcggtg gtggcgggca cagcagcggc agtgaccact180 cctgggctac tgagtgcgca cgttccgatg gtctccgccg aaccgtgtcc cgacgtcgag240 gtggtgtttg cccgtggcac cggggagcca cctggtattg gcagcgtcgg aggactgttc300 gtcgacgcac tgcgtttccc aggttggcgc caagtcactc ggggtctacg ccgttaa357<212>类型DNA
<211>长度357序列名SEQ ID 158GDC_MTUB_4169350序列描述自定义密码子序列名SEQ ID 158GDC_MTUB_4169350序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtggatgcat gtcattcccg ggcgcggcgc ggcgtggttg atcgtcgacg tccgagatgt60 ggcggcactg cacgcggcgt tgttggaatc cgggcgtggg ccgcgccgct acactgcggg120 aggtcatcgg attccggtgc ccgagctcgc gaaaattctg ggcgggtcgc cggcaccacg180 atgctggccg tcccggtgcc cgattccgcg ctgcgtgtcg cgggatcggt gctggatcaa240 gccgggccct atctgccttt caatactccg ttcaccgcgg caggtatgca gtactacaca300 cagatgccgg agtccgacga ttcgccgagc gaaaaagaac taggcatcac ctaccgcgat360 ccgcgcgaca ccgtggccga caccgtcacg gccctgcgcg gcctgggcag ctaa414<212>类型DNA<211>长度414序列名SEQ ID 159GDC_MTUB_4170798序列描述自定义密码子序列名SEQ ID 159GDC_MTUB_4170798序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgatgtgga agccgcgctg gcgatggtgt tcgacggctt cggagcggcg aaccaccgcc60 agcccagatg cctgccgcaa cgtatcgcgg tgccggtcac caagcttaag acttgccggc120 tcgggatcac cgtggcatcg gatgcgatcg agatccacgg cggcaatggc tacatcgaga180 cctggccggt ggcccggttg ctgcgtgacg cgcaagtcaa cacgatctgg gagggccccg240 acaacatcct gtgtctggat gtgcggcgcg ggatcgagca gacgcgcgct cacgagacac300 tgttggcgcg gctgcgcgat gcggtgtcgg tgtccgacga tgacgacacc acgcggctgg360 tctcgcgccg cattgaggac ctcgacgcgg cgatcaccgc ttggaccaaa ctcgacaggc420 agctggccga ggcgcggctg ttcccgctgg cccaattcat gggcgacgtc tacgccggcg480 cgttgctcac cgagcaggcc gcctgggaac gggcaacccg cggcaccgac cgcaaggcac540 tcgtcgcccg cctgtacgcg cgccggtatc tcgccgacca aggcccgctg cgcggtatcg600 acgcagattg cgatgaggcg ctgcagcgtt tcgacgaact cgtggcgggc gcgttcactg660 ccgagcagac gtaaaagccc ccaattcgtg gctcttctga cacttccgtg ggtgagtttg720 tgtcctgagt ag732<212>类型DNA<211>长度732
序列名SEQ ID 160GDC_MTUB_4252190序列描述自定义密码子序列名SEQ ID 160GDC_MTUB_4252190序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcgggccc cggcgacccg cgcggccagc cgcggctctt cgaggaattc cgaccagcgc60 ccgtcgggca ggtcggtgat cccgtcgcgg ccttccagca gcgcctgcca ggtctgctcg120 ggggtgttca tctcgcccgg gaagcgggtg gacaagccca cgatcgcgat gtcgacgcgc180 tcggccgggc cggtgcgcga ccagtcttcg gcgtcatcgc ccgctaggtc ggtctccggc240 tcgccctcga tgatccgggt ggccagcgat tcgatggtcg gatgcgcgaa cgccaccgcg300 accgacagcg tgaccccggt caggtcttct atgtcggcgg ccatcgcgac ggcatcgcgc360 gacgacagac ccagctccac catgggcacc gattcgtcga tcgagtccgg tgcctttccg420 acggccttac ccacccagtt gcgcagccac tggcgcatct cggggaccgt tagctcggcc480 ctttcggcgg gggcgttctc ctgggattcc gctacgtcag ccatgggtcc tcagtccgaa540 gtggcgaaga ccgtcgggga acccacgcca ctgcgcaggc tgccgtcgag gtag594<212>类型DNA<211>长度594序列名SEQ ID 161GDC_MTUB_4260620序列描述自定义密码子序列名SEQ ID 161GDC_MTUB_4260620序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcacgagg acccgcacac tggcgtcgag ccgggtgccg ttacggcgca ccgagattgc60 cagcacccgc gcccggcctg tggcgatgag ccgttcaatc cggcgtgtgt tctcgtgcgt120 acggacggtc ccgacgaccg gaagtgtgag atgacggcga tcaggttcga cgcgcatcgc180 tccggtcgtg aatgtcacgc ggtcctgatc gcggcctttc ttcttgaacc gggggaagcc240 cattgtcttg ccctcacgtt taccggatcg ggagttctgc cagttccagt acgcatcgac300 agcgccgcca atgccgtcgg cgtaagcctc tttcgagcac tccggccacc acaccgcccc360 ggtctcggcg ttgacacaca cctcgtcctt gacggtgttc caccgtttac gaagcacccg420 cagcgacggc ttgacagtcc cgataccagt aacgcgccac gcctcgatat cggctttcaa480 agtagcgacc gcccagttgt aggccttgcg gcgagcgccg aaatgccgcg ccagcgcgcg540 ggcctggtcc tcggttgggt ccagcgtgaa ccggaacgcc tgcacacacc agccttctgg600 cacctcgaat ctggccatca agctgcctcc gcgtccccga ccgcagcagc aagggcacgc660 ttggccccgt tctgtgcagc gcgttcacca tag693<212>类型DNA<211>长度693序列名SEQ ID 162GDC_MTUB_4302166
序列描述自定义密码子序列名SEQ ID 162GDC_MTUB_4302166序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链ttgcgcccgt caaggtccac cctgatagcc aaatgcgcca gctggcggca accaccccgt60 tgtcttcgat ccgcagccgt aaaccgtcgt tcgtcggcgc ccgtcgccca acgtgaactg120 agggcggaga atcggccgga atctcgccct cagttcacgc tcggcgccgt ttggcctcac180 ccagtcaatg tgatctgtgc gggcgggcgt tggcgcgtag cgaaccccag tggcgccggc240 ccgccaagca cgccccggcg cggccagctc atcagcggct acgcaagcgc aacggcgccc300 gcgatgggct gtggaagaac ccggaggatc tcaccgaaca ccagaatgcc aagctgtcgc360 gctcatctac tcaaagaagg cctacggcac ctgttttcgg tcaaaggcga agagagtaag420 caggcactgg accggttgat cttctag447<212>类型DNA<211>长度447序列名SEQ ID 163GDC_MTUB_4317863序列描述自定义密码子序列名SEQ ID 163GDC_MTUB_4317863序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链gtgcattcgg ctagctcggt tgccacaccc gtcaggggtt cgacgttggc gggttcggcg60 ggccccagca ccgctgtcac catgcccgcc aagccgacct gcggcgccac caactgcagc120 accagcatgt cgccgtcgcg cgccgcgatc acatggcggt cgcccctgcg gcacacgacg180 aagcgcacca tgacgccgcc aatgtcgcgc cgccaccagc gaccctccaa ggtccgatct240 ggcctgccca gggtttcgac catctccgcg accgtcggtt ggggctcccc gtggaggtcg300 agcacccctt gcgctgtgag gtcacgctgc acctgttccc agacgatgtc tcgcagatcc360 tcttgcggga tattcggccg aatcccaagc gtgacaggga aatcaaccag gtgtaaccga420 tcggcgatca ccaacatgcc gtcgatggtt acctcgacgc cgaccacgtt gtcggcggtg480 cccgcgcggc ctgcagcgga cggacccgtc atgatcaacc gaaaatcttg tcgataa537<212>类型DNA<211>长度537序列名SEQ ID 164GDC_MTUB_4341852序列描述自定义密码子序列名SEQ ID 164GDC_MTUB_4341852序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链atggaccgac tctgcggtgc gccgctatgt caccgacgcc ggggccctac tgccacggct60 gcacaagctg gtgcgcgccg actgcacgac ccgcaacaag cgccgggccg cgcggttgca120 ggccagttac gaccggctgg aagagcggat cgcggagctg gccgcccagg aggatctgga180 tcgggtgcgc cccgacctgg acggcaacca gatcatggcg gtgctcgaca ttccggcggg240 cccgcaagtc ggcgaggcgt ggcgctactt gaaggagctg cggctagagc gcggcccgtt360 gcttgggagt cgcgtcagaa cggttgtgga gtactgcata gccggcgacg acggcagcgc420 cgggatctgg aaccgcccgt tcgacgtcga cctcgacggt ga462<212>类型DNA<211>长度462序列名SEQ ID 165GDC_MTUB_4391527序列描述自定义密码子序列名SEQ ID 165GDC_MTUB_4391527序列<213>生物名Sars冠状病毒(Sars Coronaviris)<400>前序列链gtgacgagct tggcactgat cccattgaag attatgaaca aaactggaac actaagcatg60 gcagtggtgc actccgtgaa ctcactcgtg agctcaatgg aggtgcagtc actcgctatg120 tcgacaacaa tttctgtggc ccagatgggt accctcttga ttgcatcaaa gattttctcg180 cacgcgcggg caagtcaatg tgcactcttt ccgaacaact tgattacatc gagtcgaaga240 gaggtgtcta ctgctgccgt gaccatgagc atgaaattgc ctggttcact gagcgctctg300 ataagagcta cgagcaccag acacccttcg aaattaagag tgccaagaaa tttgacactt360 tcaaagggga atgcccaaag tttgtgtttc ctcttaactc aaaagtcaaa gtcattcaac420 cacgtgttga aaagaaaaag actgagggtt tcatggggcg tatacgctct gtgtaccctg480 ttgcatctcc acaggagtgt aacaatatgc acttgtctac cttga525<212>类型DNA<211>长度525序列名SEQ ID 166GDC_Sars174_refseq序列描述自定义密码子序列名SEQ ID 166GDC_Sars174_refseq序列
<213>生物名Sars冠状病毒(Sars Coronavirus)<400>前序列链ttggacctga gcatagtgtt gcagattatc acaaccactc aaacattgaa actcgactcc60 gcaagggagg taggactaga tgttttggag gctgtgtgtt tgcctatgtt ggctgctata120 ataagcgtgc ctactgggtt cctcgtgcta gtgctgatat tggctcaggc catactggca180 ttactggtga caatgtggag accttga207<212>类型DNA<211>长度207序列名SEQ ID 167GDC_Sars68_refseq序列描述自定义密码子序列名SEQ ID 166GDC_Sars68_refseq序列<213>生物名Sars冠状病毒(Sars Coronavirus)<400>前序列链atggtgactt cttgcatttt ctacctcgtg tttttagtgc tgttggcaac atttgctaca60 caccttccaa actcattgag tatagtgatt ttgctacctc tgcttgcgtt cttgctgctg120 agtgtacaat ttttaaggat gctatgggca aacctgtgcc atattgttat gacactaatt180 tgctag186<212>类型DNA<211>长度186序列名SEQ ID 168GDC_Sars61_refseq序列描述自定义密码子序列名SEQ ID 168GDC_Sars61_refseq序列<213>生物名Sars冠状病毒(Sars Coronavirus)<400>前序列链ttggcacccg caatcctaat aacaatgctg ccaccgtgct acaacttcct caaggaacaa60 cattgccaaa aggcttctac gcagagggaa gcagaggcgg cagtcaagcc tcttctcgct120 cctcatcacg tagtcgcggt aattcaagaa attcaactcc tggcagcagt aggggaaatt180 ctcctgctcg aatggctagc ggaggtggtg aaactgccct cgcgctattg ctgctag237<212>类型DNA<211>长度237
序列名SEQ ID 169GDC_Sars78_refseq序列描述自定义密码子序列名SEQ ID 169GDC_Sars78_refseq申请项目<120>名称<130>申请文件参考<140>当前申请号<141>当前提交日期序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VTSLALIPLK IMNKTGTLSM AVVHSVNSLV SSMEVQSLAM STTISVAQMG TLLIASKIFS60HARASQCALF PNNLITSSRR EVSTAAVTMS MKLPGSLSAL IRATSTRHPS KLRVPRNLTL120SKGNAQSLCF LLTQKSKSFN HVLKRKRLRV SWGVYALCTL LHLHRSVTIC TCLP174<212>类型PRT<211>长度174序列名SEQ ID 170GDC_HINF_5641序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LDLSIVLQII TTTQTLKLDS AREVGLDVLE AVCLPMLAAI ISVPTGFLVL VLILAQAILA60LLVTMWRP68<212>类型PRT<211>长度68序列名SEQ ID 171GDC_HINF_6322序列描述
序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MVTSCIFYLV FLVLLATFAT HLPNSLSIVI LLPLLAFLLL SVQFLRMLWA NLCHIVMTLI60C 61<212>类型PRT<211>长度61序列名SEQ ID 172GDC_HINF_124181序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LAPAILITML PPCYNFLKEQ HCQKASTQRE AEAAVKPLLA PHHVVAVIQE IQLLAAVGEI60LLLEWLAEVV KLPSRYCC78<212>类型PRT<211>长度78序列名SEQ ID 173GDC_HINF_170553序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LLLKGVIMOV SRRKFFKICA GGMAGTSAAM LGFAPANVLA APREYKLLRA FESRNTCTYC60AVSCGMLLYS TGKPYNSLSS HTGTNTRSKL FHIEGDPDHP VSRGALCPKG AGSLDYVNSE120SRSLYPQYRA PGSDKWERIS WKDAIKRIAR LMKDDRDANF VEKDSNGKTV NRWATTGIMT180ASAMSNEAAL LTQKWIRMLG MVPVCNQANT210<212>类型PRT<211>长度210序列名SEQ ID 174GDC_HINF_231874序列描述序列
<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MTNNWVDIKN ANLIIVQGGN PAEAHPVGFR WAIEAKKNGA KIIVIDPRFN RTASVADLHA60PIRSGSDITF LMGVIRYLLE TNQIQHEYVK HYTNASFLID EGFKFEDGLF VGYNEEKRNY120DKSKWNYQFD ENGHAKRDMT LQHPRCVINI LKEHVSRYTP EMVERITGVK QKLFLQICEE180IGKTSVPNKT MTHLYALGFT EHSIGTQNIR SMAIIQLLLG NMGMPGGGIN ALRGHSNVQG240TTDMGLLPMS LPGYMRLPND KDTSYDQYIN AITPKDIVPN QVNYYRHTSK FFVSMMKTFY300GDNATKENGW GFDFLPKADR LYDPITHVKL MNEGKLHGWI LQGFNVLNSL PNKNKTLSGM360SKLKYLVVMD PLQTESSEFW RNFGESNNVN PAEIQTEVFR LPTTCFAEEE GSIVNSGRWT420QWHWKGCDQP GEALPDVDIL SMLREEMHEL YKKEGGQGIE SFEAMTWNYA QPHSPSAVEL480AKELNGYALE DLYDPNGNLM YKKGQLLNGF AHLRDDGTTT SGNWLYVGQW TEKGNQTANR540DNSDPSGLGC TIGWGFAWPA NRRVLYSRAS LDINGNPWDK NRQLIKWNGK NWNWFDIADY600GTQPPGSDTG PFIMSAEGVG RLFAVDKIAN GPMPEHYEPV ESPIDTNPFH PNVVTDPTLR660IYKEDREFIG SNKEYPFVAT TYRLTEHFHS WTAQSALNII AQPQQFVEIG EKLAAEKGIQ720KGDMVKITSR RGYIKAVAVV TKRLKDLEID GRVVHHIGLP IHWNMKALNG KGNRGFSTNT780LTPSWGEAIT QTPEYKTFLV NIEKVGEA808<212>类型PRT<211>长度808序列名SEQ ID 175GDC_HINF_232170序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL60LIPLH65<212>类型PRT<211>长度65序列名SEQ ID 176GDC_HINF_232813序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)
<400>前序列链VFMLYLEFLF LLLMLYIGSR YGGIGLGVVS GIGLAIEVFV FRMPVGKHRL MLCLSFLQW59<212>类型PRT<211>长度59序列名SEQ ID 177GDC_HINF_233190序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MAAAIQQRAE LQRRIWQIAN DVRGSVDGWD FKQYVLGTLF YRFISENFAN YIEAGDESVN60YAQLPDEIIT QMPLKRKATL FTQANYLRML RLMLAAILI99<212>类型PRT<211>长度99序列名SEQ ID 178GDC_HINF_235441序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LNTDLKQIFT DIENSATGFP SEQDIKGLFA DFDTTSNRLG NTVKDKNDRL TAVLKGVAEL60DFGKFEDNHI DLFGDAYEYL ISNYAANAGK SGGEFFTPQS VSKLIAQIAM HGQTSVNKIY120DPAAGSGSLL LQAKKQFDEH IIEEGFFGQE INHTTYNLAR MNMFLHNINY DKFDIALGNT180LMEPQFGDNK PFDAIVSNPP YSVKWAGSDD PTLINDERFA PRRRACTKIQ SGLCLYFTCV240KLSFSKRPRG DCFLPWYFLS WRCRAKNSSI FGG273<212>类型PRT<211>长度273序列名SEQ ID 179GDC_HINF_235913序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)
<400>前序列链MMNDLPPAGV LAPKSKADFA FILHALSYLS AKGRAAIVSF PGIFYRGGAE QKIRQYLVDN60NYVDAVIALA PNLFFGTSIA VNILVLSKHK PNLSMPAVYL NLPLITTF108<212>类型PRT<211>长度108序列名SEQ ID 180GDC_HINF_240336序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VPHLAKSISF EEIAQNDYNL AVSSYVEQKD TREVINIDEL NAQIRETVTN IDHLRAEIDK60IVAEIEG67<212>类型PRT<211>长度67序列名SEQ ID 181GDC_HINF_243018序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MTQYKTIAES NNFIVLDQYN KFVEESNAGY QTERSLEREF IRDLQAQGYE YLQWLNNHDE60LIKNLRAQLQ RLNNVVFSDA EWQRFLEEYL DKPSDNLIEK TRKIHDDYIY DFVFDNGRIQ120NIYLLDKKNL ANNSLQVINQ FKQTGSYDNR YDVTILVNGL PLY163<212>类型PRT<211>长度163序列名SEQ ID 182GDC_HINF_274892序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
MVYPFIELKK RGVAIREAFN QIHRYSKESF NKENSLFKYI QIFVISNGTD TRYFANTTKR60NKNSYDFTMN WATAKNTLIK DLKDFTATFL QKNTLLNVLV NYCVFDVSDT LLIMRPYQIA120ATERILWKIQ ISYLAKNWSN RESGGYIWHT TGSGKTLTSF KASRLATELD FIDKVFFVVD180RKDLDYQTMK EYQRFSPDSV NGSESTAGLK RNIEKDDNKI IVTTIQKLNN LMKSEENLSI240YQKQVVFIFD EAHRSQFGEA QKNLKRKFKK FYQFGFTGTP IFPENALGAE TTASVFGAEL300HSYVITDAIR DDKVLKFKVD YNDVRPQFKA LETEKDPEKL TALEQKQAFL HPERIKEISQ360YLLNNFKQKT HRLNATGKGF NAMFAVSSVE AAKRYYETLQ NLQAEQEYPL KIATIFSFAA420NEEQDAIGDI PDETFEPTAL NSTAKEFLTK AIDDYNHYFG TNYGVDSQSF QNYYRDLAKR480VKNQEVDLLI VVGMFLTGFD APTLNTLFVD KNLRYHGLMQ AFSRTNRIYD TTKTFGNIVT540FRDLEQNTID AITLFGDKNT KNVVLEKSYD SYFNGDDNQR GYAEIVKELK ESFPDPTEIE600TEQDKKEFVK LFGEYLRVEN ILQNYDEFAA LQALQAVDLN DPIAMEKFKQ VHYVNDEQIA660EMLKVPTLPV RAEQDYRSTY NDIRDWLRQR KEGNDKDNSP INWDDVVFEV DLLKSQEINL720DYILALIFEH HKKNQDKEVL IDEIRRTVRS SLGNRAKESL IVDFINQTNL DDIPDKATLI780DSFFLFAQAE QRKEAESLIQ EENLNVDAAK RYISTSLKRE YASENGTALN EVLPKMSLLK840PQYLTKKQKI FQKIAAFVEK FKGVGGKI868<212>类型PRT<211>长度868序列名SEQ ID 183GDC_HINF_276992序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MDIIKPICTG FFYNDNNVLG DLMKNFKYFA QSYVDWVIRL GRLRFSLLGV MILAVLALCT60QILFSLFIVH QISWVDIFRS VTFGLLTAPF VIYFFTLLVE KLEHSRLDLS SSVNRLENEV120AERIAAQKKL SQALEKLEKN SRDKSTLLAT ISHEFRTPLN GIVGLSQILL DDELDDLQRN180YLKTINISAV SLGYIFSDII DLEKIDASRI ELNRQPTDFP ALLNDIYNFA SFLAKEKNLI240FSLELEPNLP NWLNLDRVRL SQILWNLISN AVKFTDQGNI ILKIMRNQDC YHFIVKDTGM300GISPEEQKHI FEMYYQVKES RQQSAGSGIG LAISKNLAQL MGRGFNS347<212>类型PRT<211>长度347序列名SEQ ID 184GDC_HINF_370413序列描述序列
<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL60LIPLH65<212>类型PRT<211>长度65序列名SEQ ID 185GDC_HINF_370747序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VNIHGLAKLN GNVTLIDHSQ FTLSNNATQT GNIKLSNHAN ATVNNATLNG NVHLTDSAQF60SLKNSHFWHQ IQGDKDTTVT LENATWTMPS DTTLQNLTLN NSTVTLNSAY SASSNNAPRH120RRSLETETTP TSAEHRFNTL TVNGKLSGQG TFQFTSSLFG YKSDKLKLSN DAEGDYTLSV180RNTGKEPVTL EQLTLIESLD NKPLSDKLKF TLENDHVDAG ALRYKLVKNK GEFRLHNPIK240EQELLNDLVR AEQAEQTLEA KQVEQTAEKQ KSKAKARSRR AVLSDTPSAQ SLLNALEAKQ300VEQTTETQTS KPKTKKGRSK RALSAAFSDT PFDLSQLKVF EVKLEVINAQ PQVKKEPQDQ360EEQGKQKELI SRYSNSALSE LSATVNSMFS VQDELDRLFV DQAQSALWTN IAQDKRRYDS420DAFRAYQQKT NLRQIGVQKA LDNGRIGAVF SHSRSDNTFD EQVKNHATLT MMSGFAQYQW480GDLQFGVNVG AGISASKMAE EQSRKIHRKA INYGVNASYQ FRLGQLGIQP YLGVNRYFIE540RENYQSEEVK VQTPSLAFNR YNAGIRVDYT FTPTNNISVK PYFFVNYVDV SNANVQTTVN600STMLQQSFGR YWQKEVGLKA EILHFQLSAF ISKSQGSQLG KQQNVGVKLG YRW653<212>类型PRT<211>长度653序列名SEQ ID 186GDC_HINF_628407序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
MKKTVFRLNF LTACVSLGIA SQAWAGHTYF GIDYQYYRDF AENKGKFTVG AKNIEVYNKE60GQLVGTSMTK APMIDFSVVS RNGVAALVGD QYIVSVAHNG GYNDVDFGAE GRNPDQHRFT120YQIVKRNNYQ AWERKHPYDG DYHMPRLHKF VTEAEPVGMT TNMDGKVYAD RENYPERVRI180GSGRQYWRTD KDEETNVHSS YYVSGAYRYL TAGNTHTQSG NGNGTVNLSG NVVSPNHYGP240LPTGGSKGDS GSPMFIYDAK KKQWLINAVL QTGHPFFGRG NGFQLIREEW FYNEVLAVDT300PSVFQRYIPP INGHYSFVSN NDGTGKLTLT RPSKDGSKAK SEVGTVKLFN PSLNQTAKEH360VKAAAGYNIY QPRMEYGKNI YLGDQGKGTL TIENNINQGA GGLYFEGNFV VKGKQNNITW420QGAGVSIGQD ATVEWKVHNP ENDRLSKIGI GTLLVNGKGK NLGSLSAGNG KVILDQQADE480AGQKQAFKEV GIVSGRATVQ LNSTDQVDPN NIYFGFRGGR LDLNGHSLTF KRIQNTDEGA540MIVNHNTTQV ANITITGNES ITAPSNKKNI NKLDYSKEIA YNGWFGETDK NKHNGRLNLI600YKPTTEDRTL LLSGGTNLKG DITQTKGKLF FSGRPTPHAY NHLDKRWSEM EGIPQGEIVW660DYDWINRTFK AENFQIKGGS AVVSRNVSSI EGNWTVSNNA NATFGVVPN709<212>类型PRT<211>长度709序列名SEQ ID 187GDC_HINF_654365序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VGENAMNLSR RDFMKANAAM AAATAAGLTI PVKNVVAAES EIKWDKAVCR FCGTGCAVLV60GTKDGRVVAS QGDPDAEVNR GLNCIKGYFL PKIMYGKDRL TQPLLRMTNG KFDKNGDFAP120VSWDFAVQNN G131<212>类型PRT<211>长度131序列名SEQ ID 188GDC_HINF_661444序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链
LIRTAILRQF LGILPFKTMA EKFKEAFKKN GQNAVGMFSS GQSTIWEGYA KNKLWKAGFR60SNNVDPNARH CMASAAVAFM RTFGMDEPMG CYNDIEQADA FVLWGSNMAE MHPILWSRIT120DRRISNPDVR VTVLSTYEHR SFELADHGLI FTPQTDLAIM NYIINYLIQN NAINWDFVNK180HTKFKRGETN IGYGLRPEHP LEKDTNRKTA GKMHDSSFEE LKQLVSEYTV EKVSKMSGLD240KVQLETLAKL YADPTKKVVS YWTMGFNQHT RGVWVNQLIY NIHLLTGKIS IPGCGPFSLT300GQPSACGTAR EVGSFPHRLP ADLVVTNPKH REIAERIWKL PKGTVSEKVG LHTIAQDRAM360NDGEMNVLWQ MCNNNMQAGP NINQERLPGW RKEGNFVIVS DPYPTVSALS ADLILPTAMW420VEKEGAYGNA ERRTQFWRQQ VKAPGEAKSD LWQLMEFAKY FTTDEMWTED LLAQMPEYRG480KTLYEVLFKN GQVDKFPLSE LAEGQLNDES EYFGYYVHKG LFEEYAEFGR GHGHDLAPFD540MYHKARGLRW PVVEGKETLW RYREGYDPYV KEGEGVAFYG YPDKKAIILA VPYEPPAESP600DNEYDLWLST GRVLEHWHTG TMTRRVPELH RAFPNNLVWM HPLDAQARGL RHGDKIKISS660RRGEMISYLD TRGRNKPPRG LVFTTFFDAG QLANSLTLDA TDPISKETDF KKCAVKVEKA720A 721<212>类型PRT<211>长度721序列名SEQ ID 189GDC_HINF_737160序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VMSRRRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL60LIPLH65<212>类型PRT<211>长度65序列名SEQ ID 190GDC_HINF_775792序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LVMFNDFLAT FSQQLTPQMW GVVATATYET VYISFASTLL AVLVGVPVGI WTFLTGKNEI60LQNNRTHFVL NTIINIGRSI PFIILLLILL PVTRFIVGTV LGTTAAIIPL SICAMPFVAR120LTANALMEIP NGLTEAAQAM GATKWQIVRK FYLSEALPTL INGVTLTLVT LVGYSAMAGT180QGGGGLGSLA INYGRISQYA LCNLGGNHYY CAIRYD216
<212>类型PRT<211>长度216序列名SEQ ID 191GDC_HINF_848166序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL60LIPLH65<212>类型PRT<211>长度65序列名SEQ ID 192GDC_HINF_928073序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LRKDALPAFF TDVNQMYDAL LNKSGATGVF TDFPDTCVEF LKGIK45<212>类型PRT<211>长度45序列名SEQ ID 193GDC_HINF_929037序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL60LIPLH65<212>类型PRT<211>长度65序列名SEQ ID 194GDC_HINF_1018846
序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LPKPEPIPRP RRLALCFAPS AGDRVFKRIS YSSTLTMYET WLIIPRTAGV SINSTVWCIW60RRPRPRKVAL CFGKRAIELR TCVTLIVLAI IHYPKISSTV LPRFAATISG DFIFANASIV120ARTTLIGLVE PYALERTLRT PATSNTARIA PPAMIPVPSL AGCINTREPV170<212>类型PRT<211>长度170序列名SEQ ID 195GDC_HINF_1021582序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LFIYGGINMQ ITLSNTLAND AWGKNAILSF DSNKAMIHLK NNGKTDRTLV QQAARKLRGQ60GIKEVELVGE KWDLEFCWAF YQGFYTAKQD YAIEFPHLDD EPQDELLARI ECGDFVRGII120NEPAQSLTPV KLVERAAEEI LNQADIYNEK SAVSFKIISG EELEQQGYHG IWTVGKGSAN180LPAMLQLDFN PTQDSNAPVL ACLVGKGITF DSGGYSIKPS DGMSTMRTDM GGAALLTGAL240GFAIARGLNQ RVKLYLCCAE NLVSNNAFKL GDIITYKNGV SAEVLNTDAE GRLVLADGLI300EADNQNPGFI IDCATLTGAA KSGCRKRLSF CIIYG335<212>类型PRT<211>长度335序列名SEQ ID 196GDC_HINF_1082407序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VAVGNDYHSV LSMDDELVKN LFQSAQAENE PFWRLPFEDF HRSQINSSFA DIANIGSVPV60GAGASTATAF LSYFVKNYKQ NWLHIDCSAT YRKSGSDLWS VGATGIGVQT LANLMLSRSL120K 121
<212>类型PRT<211>长度121序列名SEQ ID 197GDC_HINF_1144501序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LPIELKVEGL VGKPNEKISA AEFRQKCREY AAEQVEGQKK DFIRLGVLGD WDNPYLTMNF60DTEANIIRTL GKVIENGHLY KGSKPVHWCL DCGSSLAEAE VEYEDKVSPS IYVRFPAESA120DEIEAKFSAQ GRGQGKLSAI IWTTTPWTMP SNRAIAVNAD LEYNLVQLGD ERVILAAELV180ESVAKAVGIE HIEILGSVKG DDLELSRFHH PFYDFTVPVI LGDHVTTDGG TGLVHTAPDH240GLDDFIVGKQ YDLPMAGLVS NDGKFISTTE FFAGKGVFEA NPLVIEKLQE VGNLLKVEKI300KHSYPHCWRH KTPIIFRATP QWFIGMETQG LRQQALGEIK QVRWIPDWGQ ARIEKMVENR360PDWCISRQRT WGVPMTLFVH KETEELHPRT LDLLEEVAKR VERAGIQAWW DLDEKELLGA420DAETYRKVPD TLDVWFDSGS TYSSVVANRL EFNGQDIDMY LEGSDQHRGW FMSSLMLSTA480TDSKAPYKQV LTHGFTVDGQ GRKMSKSIGN IVTPQEVMDK FGGDILRLWV ASTDYTGEMT540VSDEILKRAA DSYRRIRNTA RFLLANLNGF DPKRDLVKPE KMISLDRWAV ACALDAQNEI600KDAYDNYQFH TVVQRLMRFC SVEMGSFYLD IIKDRQYTTK ADSLARRSCQ TALWHIAEAL660VRWMAPILSF TADEIWQHLP QTESARAEFV FTEEFYQGLF GLGEDEKLDD AYWQQLIKVR720SEVNRVLEIS RNNKEIGGGL EAEVTVYAND EYRALLAQLG NELRFVLITS KVDVKSLSEK780PADLADSELE GIAVSVTRSN AEKCPRCWHY SDEIGVSPEH PTLCARCVEN VVGNGEVRYF840A 841<212>类型PRT<211>长度841序列名SEQ ID 198GDC_HINF_1279189序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LENKMTVDYK NTLNLPETSF PMRGDLAKRE PDK33<212>类型PRT<211>长度33
序列名SEQ ID 199GDC_HINF_1347200序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MKITHCKLKK SIQNKLLEFF VLEVTARAAA DLLDI35<212>类型PRT<211>长度35序列名SEQ ID 200GDC_HINF_1347942序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LFLVGNLLRW VWLALFIIAQ IWAYVQTPDS WLAMISGISG ILCVVLVSKG KISNYFFGLI60FAYTYFYVAW GSNFLGEMNT VLYVYLPSQF IGYFMWKANM QNSDGGESVI AKALTVKGWM120TLIVVTTVGT LLFVQALQAA GGSSTGLDGL TTIITVAAQI LMILPLS167<212>类型PRT<211>长度167序列名SEQ ID 201GDC_HINF_1476415序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MFSGEHDACD CYVDLQAGSG GTEAQDWTEM LLRMYLRWAE SKGFKTELME VSDGDVAGLK60SATIKVSGEY AFGWLRTETG IHRLVRKSPF DSNNRRHTSF SAAFVYPEID DDIDIEINPA120DLRIDVYRAS GAGGQHVNKT ESAVRITHMP SGIVVQCQND RSQHKNKDQA MKQLKAKLYE180LELQKKNADK QAMEDNKSDI GWGSQIRSYV LDDSRIKDLR TGVENRNTQA VLDGDLDRFI240EASLKAGL248<212>类型PRT<211>长度248
序列名SEQ ID 202GDC_HINF_1476557序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LLGNEKQAEA QAKYAEDTLK QARDFAKQHH KTAYLARNAD GLQTGQKGSI HTEAMELVGL60ENVAEGEQKG LTQVSMEQLL L81<212>类型PRT<211>长度81序列名SEQ ID 203GDC_HINF_1505851序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LPRIFAACFV GAALACGGAT YQGMFKNPLV SPDILGVSAG AGFGASLAIF YNLPMIYIQF60FAFSGGILAV LCVSLIASRS RTQDPILVLV LSGIAIGSLL GAGISLLKIL ADPFTQLPSI120TFWLLGSLTA INQQDLIQLI PMLLLGIVPI FLLLTDTLAR TIAPIELPLG ILTSACGY178<212>类型PRT<211>长度178序列名SEQ ID 204GDC_HINF_1524561序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LKNSLRELKD YTVVIVTHNM QQATRCSDYT AFMYLGELVE FGQTQQIFDR PKIQRTEDYI60RGKMG65<212>类型PRT<211>长度65序列名SEQ ID 205GDC_HINF_1568974
序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MISLQETKIA VQNLNFYYED FHALKNINLR IAKNKVTAFI GPSGCGKSTL LRSFNRMFEL60YPNQKATGEI NLDGENLLTT KMDISLIRAK VGMVFQKPTP FPMSIYDNIA FGVRLFEKLS120KEKMNERVEW ALTKAALWNE VKDKLHKSGD SLSGGQQQRL CIARGIAIKP SVLLLDEPCS180ALDPISTMKI EELITGVKLY CGYSNS206<212>类型PRT<211>长度206序列名SEQ ID 206GDC_HINF_1586944序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MSQLNIQFPT KFKPLFESIW RFIIFYGGRG SGKSFSIARA LVLRAYQSPV RVLCSVKFRN60RFLIL65<212>类型PRT<211>长度65序列名SEQ ID 207GDC_HINF_1594339序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链VVPEFIIVSL ILVAQSMKLA LNKWLIIFGN AIALHIKYAL LRLNFEGVVG EILEKVDNGQ60MGVVLKRMMV RAASKVAQRF NIEAIVTGEA LGQVSSQTLT NLRLIDEAAD ALVLRPLITH120DKEQIIAMAK EIGTDDIAKS MPEFCGVISK NPTIKAVREK ILKEEGHFNF EILESAVQNA180KYLDIRQIAE ETKAVVEVEA ISVLGENEVI LDIRSPEETD EKPFESGTHD VIQMPFYKLS240SQFGSLDQSK SYVLYCERGV MSKLQALYLK ENGFSNVRVF AKNIH285<212>类型PRT
<211>长度285序列名SEQ ID 208GDC_HINF_1634710序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LAIAIGGGNR GNASGVLRQN FAEDKAKKTA SKLVGVMAHY FGGKSFYLPA GDKIKEALRD60AQIYQEFNGK NVPDLIKKYR LSESTIYAIL RNQRTLQRKR HQMDFNFS108<212>类型PRT<211>长度108序列名SEQ ID 209GDC_HINF_1638626序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LFRWHYLGGF TVMPDTNNTE TNNKIELYLN GKILSGWKSL NLQRSLESMS GRFDLGIAVR60PEDDISVLAA GSPLVLKMGG QTVITGYLDE IKQRVSGNDK TISVSGRDKT CDLVDCAIIH120NSYQFKNQTA KQIAEAICKP FGISVVWQVQ APEANERIPV WQVEPGETAF DNLSKIARHK180GVLVTSDVDG NLLFTEPSNK QVGNLTLGEN LLELEQTDSW LQRFSLYRVI GDAEQGGAKG240DTKTKNKAAK GKEKDDGVVE DPDIYPGPAE GGK273<212>类型PRT<211>长度273序列名SEQ ID 210GDC_HINF_1639409序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链MKVSYRLNNC LSLKLALI PLLILLFVVMGS VLSLIAKLDF YFFQQILFNS ELHFALLMSL60GTSLFSLILA LCIAIPSAWR MSQVRLPFQS FFDTLFDLPM VLPPLVTGLS LLLLFSSQGI120LAELLPFISK WIFSPVGIII AQTYIASSIL LRCSEPLKLR KKTIKTTKIK P171
<212>类型PRT<211>长度171序列名SEQ ID 211GDC_HINF_1660491序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LTKRKNVSFT YENYTVTPFW DTLKLSYSQQ RITTRARTED YCDGNEKCDS YKNPLGLQLK60EGKVVDRNGD PVELKLVEDE QGQKRHQVVD KYNNPFSVAS GTNNDAFVGK QLSPSEFWLD120CSTFNCDKPV RVYKYQYSNQ EPESKEVELN RTMEINGKKF ATYESNNYRD RYHMILPNSK180GYLPLDYKER DLNTKTKQIN LDLTKAFTLF EIENELSYGG VYAKTTKEMV NKAGYYGRNP240TWWAERTLGK SLLNGLRTCK EDSSYNGLLC PRHEPKTSFL IPVETTTKSL YFADNIKLHN300MLSVDLGYRY DDIKYQPEYI PGVTPKIADD MVRELFVPLP PANGKDWQGN PVYTPEQIRK360NAEENIAYIA QEKRFKKHSY SLGATFDPLN FLRVQVKYSK GFRTPTSDEL YFTFKHPDFT420ILPNPNMKPE EAKNQEIALT FHHDWGFFST NVFQTKYRQF IDLAYLGSRN LSNSVGGQAQ480ARDFQVYQNV NVDRAKVKGV EINSRLNIGY FFEKLDGFNV SYKFTYQRGR LDGNRPMNAI540QPKTSVIGLG YDHKEQRFGA DLYVTHVSAK KAKDTYNMFY KEQGYKDSAV RWRSDDYTLV600DFVTYIKPVK NVTLQFGVYN LTDRKYLTWE SARSIKPFGT SNLINQGTGA GINRFYSPGR660NYKLSAEITF670<212>类型PRT<211>长度670序列名SEQ ID 212GDC_HINF_1807963序列描述序列<213>生物名流感嗜血菌(Haemophilus influenzae)<400>前序列链LRERSSLSAL MAKTIEWDFI TENPLKYLEK PKAPAPRTRR YNEHEIERLI FVSGYDVEHI60EPPKTLQNCT GAAFLFAIET AMRAGEIASL TWNNINFEKR TTFLPITKNG HSRTVPLSVK120AIEILQHLTS VKTESDPRVF QMEARQLDHN FRKLKKMEGL ENANLHFHDT RRERLAEKVD180VMVLAKISGH RDLSILQNTY YAPDMAEGYK TKAGYDLTPT KGLSQRNFFF FNENFIVFTT240NPPIVIKL248<212>类型PRT
<211>长度248序列名SEQ ID 213GDC_HINF_1817220序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链MATIIKNGKR WHAQVRKFGV SKSAIFLTQA DAKKWAEMLE KQLESGKYNE IPDITLDELI60DKYLKEVTVT KRGKREERIR LLRLSRTPLA AISLQEIGKA HFREW105<212>类型PRT<211>长度105序列名SEQ ID 214GDC_HPYL_51094序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链MEAVQLDKNQ EPNYKGYSGS LIHPAFQQQT TKREKPSTPL PSLDLLLKYP PNEQRITPDE60IMETSQRIEQ QLRNFNVKAS VKDVLVGPVV TRYELELQPG VKASKVTSID TDLARALMFR120SIRVAEVIPG KPYIGIETPN LHRQMVPLRD VLDSNEFRDS KATLPIALGK DISGKPVIVD180LAKMPHLLVA GSTGSGKSVG VNTMILSLLY RVQPEDVKFI MIDPKVVELS VYNDIPHLLT240PVVTDMKKAA NALRWCVDEM ERRYQLLSAL RVRNIEGFNE KIDEYEAMGM PVPNPIWRLG300DTMDAMPPAL KKLSYIVVIV DEFADLMMVA GKQIEELIAR LAQKARAIGI HLILATQRPS360VDVITGLIKA NIPSRIAFTV ASKIDSRTIL DQGGAEALLG RGDMLYSGQG SSDLIRVHGA420YMSDDEVINI ADDWRARGKP DYIDGILESA DDEESSEKGI SSGGELDPLF DEVMDFVINT480GTTSVSSIQR KFSVGFNRAA RIMDQMEEQG IVSPMQNGKR EILSHRPEY529<212>类型PRT<211>长度529序列名SEQ ID 215GDC_HPYL_155367序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链MNKIFKVIWN VVTQTWVVVS ELTRAHTKRT SATVATAVLA TVLSATVQAI NDAGTFVKVQ60STEDDIEDSA ATKDDNKNQA LKAGDTLTLK AGKNLKAKLD QGGKSVTFAL AKDLDVKTAK120VSDTLTIGGN TPAAGGATPK VSITSTADGL KLAKGTNGDT AVHLNGLAST LPDVTTNTGA180STSVTFSPSD IEKTRAATIK DVLNAGWNIK GAKVAGGNTE NVDLVAGYDN VEFITGDKNT240LDVVLTAKEN GKTTEVKFTP KTSVIKDNNG KLLTGKQLKD ANTGTATNAT EDTDEAMA298<212>类型PRT<211>长度298序列名SEQ ID 216GDC_HPYL_447632序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL60LIPLH<212>类型PRT<211>长度65序列名SEQ ID 217GDC_HPYL_506250序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链MFAVHAAMIT TLKKEVFFLY LYIKSLKIPI PTTLKYMISL GKIRELDVLA NLAKLCPTCH60RALKKGSSEE EFQKRLIRNI LNRNKDNLEF AQLRFETDDF STLIDRICES LK112<212>类型PRT<211>长度112序列名SEQ ID 218GDC_HPYL_583607序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链MIKQTLIILA PFFIATLLYF LGAPDGLRPN AWLYFCIFMG MIIGLILEPV PSGLIALSAL60VLCIALKIGA SDKVASANKA ISWGLSGYAN KTVWLVFVAF ILGLGYEKSL LGKRIALLLI120RFLGQTPLGL GYAIGLSELC LAPFIPSNSA RSGGILYPIV SSIPPLMGST FNNNPDKIGA180YLMWVALAST CITSSMFLTA LAPNPLAMEI AAKMGVNEIS WFSWFLAFLP CGVVLILLVP240LLAYKTCKPT LKGSKEVSLW AKKRN265<212>类型PRT<211>长度265序列名SEQ ID 219GDC_HPYL_583883序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链MSRHRGAKPP RRCELLGEIS LLSPGYLLSF ERWPFHTEPP DHYDRLSSLL DLYVLQSGWL60VPLHSTCDFQ PQ72<212>类型PRT<211>长度72序列名SEQ ID 220GDC_HPYL_665045序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链VQLHCHNLPC VSIDILLGGP PCQSYSTLGK RKMDEKANLF KEYLRLLDLV KPKIFVFENV60VGLMSMQKGQ LFKQICNAFK ERDYILEHAI LNALDYGVPQ MRERVILVGV LKSFKQKFYF120PKPIKTHFSL KDALGDLPPI QSGENGDALG YLKNADNVFL EFVRNSKELS EHSSPKNNEK180LIKIMQTLKD GQSKDDLPES LRPKSGYINT YAKMWWEKPA PTITRNFSTP SSSRCIHPRD240SRALSIREGA RLQSFPDNYK FCGSGSAKRL QIGNAVPPLL SVALAQAVFD FLKG294<212>类型PRT<211>长度294序列名SEQ ID 221GDC_HPYL_953783
序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链LMEFDVTIID ETGRATAPEI LIPALRTKKL ILIGDHNQLP PSIDRYLLEQ LESDDIQNLD60AIDRQLLEES FFENLYKYIP ESNKAMLNE89<212>类型PRT<211>长度89序列名SEQ ID 222GDC_HPYL_954679序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链MPASIGSLVS QLFYKEKLKN GVIKNTSQFY DPKNIIRWIN VEGEHQLEKT SSYNKNQVQK60IIELLEQINR VLNQRKIRKT IGIITPYNAQ KRCLRSEVEK YGFKNFDELK IDTVDAFQGE120KADIIIYSTV KTYGNLSFLI DSKRLNVAIS RAKENLIFVG KKSFFENLRS DEKNIFSAIL180QVCR184<212>类型PRT<211>长度184序列名SEQ ID 223GDC_HPYL_954846序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链LIIETQQDPK ELPESCKITP QKISFNQVVF KKIKRKLNRF IGSILARTEV YKNLVAKYDE60LTGKYESLLA KEANIKETFW ERRADSEKEA FFLEHFYLTS VYVASTAGYY ITPKGAKTFI120EATERFKIIE PVDMFINNPT YHDVANFTYL PCPVSLNKHA FNSTIQNAKK PDISLKPPRK180SYFDNLFYDQ LNTRKCLKAF HKYSRRYAPL KTPKEV216<212>类型PRT<211>长度216
序列名SEQ ID 224GDC_HPYL_955261序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链LMEILVLNLG SSSIKFKLFD MKENKPLASG LAEKIGEEIG QLKIKSHLHH NDQELKEKFV60IKDHASGLLM IRENLTKMGI IKDFNQIDAI GHRVVQGGDK FHAPVLVNEK VMQEIGNLSI120LAPLHNPANL AGIEFVQKAH PHIPQIAVFD TAFHATMPSY AYMYALPYEL YEKYQIRHYG180FHRTSHHYVA KEAAKFLNTA YEEFNAISLH LGNGSSAAAI QKGKSVDTSM GLTPLEGLIM240GTRCGDIDPT VVEYTAQCAN KSLEEVMKML NHESGLKGIC GDNEKHRSQK RKR293<212>类型PRT<211>长度293序列名SEQ ID 225GDC_HPYL_1068602序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链MPNSQVAGQA SVFIFPDLNA GNIAYKAVQR SAKAVAIGPI LQGLNKPIND LSRGALVEDI60INTVLISALQ AQD73<212>类型PRT<211>长度73序列名SEQ ID 226GDC_HPYL_1069456序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链VSLVSSVFLM CLDTQVLVFG DCAIIPNPSP KELAEIATTS AQTAKQFNIA PKVALLSYAT60GDSAQGEMID KINEALTIAQ KLDPQLEIDG PLQFDASIDK SVAKKKCDTA KWLGKLAFLF120SRI123<212>类型PRT
<211>长度123序列名SEQ ID 227GDC_HPYL_1376803序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链LKAAHRLNLM GAVGLILLGD KEAINSKNLN LNLENVEIID PNTSHYREEF AKSLYELRKS6QKGLSEQEAKQ LVLDKTYFAT MLVHSGYVHA MVSGVNHS98<212>类型PRT<211>长度98序列名SEQ ID 228GDC_HPYL_1474291序列描述序列<213>生物名幽门螺杆菌(Helicobactor pylori)-26695<400>前序列链VKQISISCSH RKYFVSFSVE YEQDITPIKN TKNGVGLDLN ILDIACSCEI NNHDKLTDFK60QYQTDMKELL GIEIDEELDT KRLIPTYSKL YSLKKYSKKF KRLQRKQSRR VLKSKQNKTK120LGGNFYKTQK KLNQAFDKSS HQKTDRYHKI TSELSKQFEL IVVEDLQVKN MTKRAKLKNV180KQKSGLNQSI LNASFYQIIS FLDYKQQHNG KLLVKVPPQY TSKTCHCCGN INHKLKLNHR240QYWCLECGYR EHRDINAANN ILSKGLSLFG VGNIHADFKE QSLSC285<212>类型PRT<211>长度285序列名SEQ ID 229GDC_HPYL_1600102序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MKVNKGFKFR LYPTKEQQDK LQHCFFVYNQ AYNIGLNELQ EQYETNKDSP PKERKYKKSS60ELDNAIKQCL RARDLPFSAV IAQQARMNVE RALKDAFKVK NRGFPKFKNS KSAKQSFSWN120NQGFSIKESD DECFKTFTLM KMPLLMRMHR DFPLILK157
<212>类型PRT<211>长度157序列名SEQ ID 230GDC_MTUB_26830序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LIFITHFSTE PLPLPILVSK GLAVKGLSGN TLIHTLPALL MCLVMATLAD SIWRESILPC60SMALIAISPN AMELPRWAFP RLRPFICFLY FVLFGINMII ASLFCFF107<212>类型PRT<211>长度107序列名SEQ ID 231GDC_MTUB_36276序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MSRHRGAKPP RRCELLGEIS LLSPGYLLSF ERWPFHTEPP DHYDRLSSLL DLYVLQSGWL60VPLHSTCDFQ PQ72<212>类型PRT<211>长度72序列名SEQ ID 232GDC_MTUB_76032序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LNAAFKERRF ILVQLDEKID PKEDKSAYDF CLNTLKSPSP SIFDITEERI KRAGAKIKEA60CAHLDVGFRA FEIIDDETHA NDKNLSQAHQ KDLFAYSNLD RMETQTILIK LLGCEGLELT120TPITCLIENA LYLALNTAFI VGDIEMSEVL ENLKDKGVEK ISMYMPAISN DNLCLELGSN180LLDLKLESGD LKIRG195
<212>类型PRT<211>长度195序列名SEQ ID 233GDC_MTUB_80423序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MYIRFYRDSL AEPATDIYAF AYVSFNKEAG TWHTPAQPTR NYGSGTPMTT AATAPLRHAP60MSGRPPKRGS NACAGARSYS SAGVLNTRSS IGWSTAYGPA SSFPAASTES ANSSRQPTTC120CVGLPAARSI PGSSRTMRLC WPATKDSRSP RCPGSWCTCR SHRLAHNRPL DARSASPAVA180KPSVIRLGSR VRRRSGSPDH LPSARICVSS RRSPRRLLWC YRRPLARCSE STIR234<212>类型PRT<211>长度234序列名SEQ ID 234GDC_MTUB_167239序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LMFCASRKEM AMSNSSSSSV INWNSLSESK PRSSTSTWFA VMPRSVRKIR WMVALMASFI60ARLLAGSGPR QGRQTRARPG RGQIVGGRLG SWCGIPNAP PARLGGPPGSH TPRSASAADS120PHAPRSGCPG SPARSRFRDT RPDSPAVPGR WPCTRPRPAP EPAGRVHAD169<212>类型PRT<211>长度169序列名SEQ ID 235GDC_MTUB_214625序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
VPPPIPRCAA ASTSDPMASV KYGATRRWWP PAPSLTTSSC SAACGLCPKS SPGSSIPSDE60PDSTATVGQH STMLTATLMA SPPAEVSLYL VCMSAPVARM VSMTWSRVTR WMPSPRNAIR120AALMALPAEI ALRSMQGICT SPAMGSQVRP RLCSMAISAA FSTCRGVPPR ISANPAAAMA180AAEPTSP187<212>类型PRT<211>长度187序列名SEQ ID 236GDC_MTUB_424142序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MIPMDVIFGC PLYANFCKPS VVRKTLGILA SAVEFGTMPT TRNLRAPTST VSPRCRPIVL60DAATSSGFDG DRPSETRGMP GPCSGAPKTV TFRVDVPSFM IVPTLPNGAA AMTPGSAATR120ARSTSGNGIE PRKGPAAPDL TTNTSTPMES TVCRASTRKP FASPVKTSVI PKISPVLMIV180MTRRRFLHCM SRRAAKSIPR GYQRGALVGP GLDVLWSGRG PLVVEEAFGV VVVVGVGTAV240EVGWRDPFRL AVGPFPCLPA FPD263<212>类型PRT<211>长度263序列名SEQ ID 237GDC_MTUB_459316序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MSRAIRTKPK SASSRGSAGY RVYLGQRLGV AVFAQRDDHP VTGLEDADER AVISGPVGAH60TVAMPLDHYR FTLVDAADEF DVDLEDLLAP LDCSPKRLLV QFRTGDDAPV GEVVAEQREA120FVEISALAEA LQEHPGQFGL RVVERRHHIA ILSRETACGQ LTWSSKRWSP SRGRPASRTP180WRRCVAVSRI HAFGSPVTAL SGGPACCPPG RSPRGSAVLG ATPPVAWRGA AVPRSLSTWR240PPCWAPPTTP AISCRCIRPW PPRTAGCRTC AWAAPARCWK P281<212>类型PRT<211>长度281序列名SEQ ID 238GDC_MTUB_549643
序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VRPGHRQVDG CRRGQPLCGA HERVGLVRVV GAFGLAQQGC DAGQHLVVGH GAKTSGGLRQ60VGSAYNRSVS QATTSSSTWL RSGSLNTSWY SPGYSFSCTS ADPTHSTRRR LPSMGISRSS120VPCSTSSGAV NAGARRGMVS PTCSSARPIP AGTRPWCTSG SVL163<212>类型PRT<211>长度163序列名SEQ ID 239GDC_MTUB_566823序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VCKACLGHHT HHHRTSRPLR NRCQHDQPRP AHRHGFHPNP RFRRQRHRGR VPLRLRLAAE60PGILQLDHNP VVGLLQLRRR WRIGLPQRRR SRRVGPGKRL HRDFGLLQCW RRRNSGFQNF120GNLLSGWANL GNTVSGFYNT SMLDLATQAL ISGFGNHGAR LSGILNNGSG P171<212>类型PRT<211>长度171序列名SEQ ID 240GDC_MTUB_591109序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
VLSLSAGGPE PRMRPGHNPV TFHAEQTRNR TARTSRVRFR VCSSDKSAQD QRVGVGADVD60RHGIAVVHLA GQQHLGQLVT DGLLHQPAQR PRPVHRVESA LRQPALGRQR DLQLQPPLRQ120PLAQLRQLDV DDAHQLFGVE TLKDEHVVEP VDELRLERSA HRGQHLLGAA TRPQVGRQDQ180DGVAEVDRAA VPVGEPALVE DLQQHVEHVR VRLLDLVEQH HRVGTPAHRL GQLTARLVSH240IAGRGADQPS HGVLLAVLAH VDADHRPLVV EQEVGQRLGQ LGLADTGRAE EHERPGGPVG300VGHPGPAAPH RIRDCGNRGL LPDDPLAQLV FHAQQLGGLA FQQPTGRDAG PRRHHVGDVV360GTDLLLEHHL LPGLRLRQRR VELLLHLGDA SVAQLGGLGQ VAVAFGPLGF PAQGFQLLLE420VADDFDRVLL VLPAGGELGQ LLFLVGQLGA QLGQPLRRRL VFFFGQRHLF DLQPAHQPLD480LVDLDGPRVD LHPQPAGRLV DQVDGLVGQE AGGDIPVAQS GSCHQRRVGD AHPVVHLVAV540FEPAQDADGV LHRRLADVHL LETALERGVL LDVLAVFVQR GRPDQP586<212>类型PRT<211>长度586序列名SEQ ID 241GDC_MTUB_663028序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LLADFDVGQH LFQLVVGGLG TQHGFGVQRV ALPDRLGPDR RQLQELVVDV GLDQTARRAG60AHLALVEGEH GEAFQRLVAE VVVGGQHVGE EDVGALAAEF QGDRDQVVRG VLHDQPPRGG120FPGERDLGDA VAGGQRLAGL GAESVDHVDH PGRQQITDQR HQVEHRSGCL LGGFEHRRVA180GRQRRRQLPG RHQDGEVPRN DLAHHAERLV EVVGHGVLVD LAQRALLGAN RRGEVPEVID240RQRDIGGQRF PDRFPVVPDL GHRQRGGVLV DAVGNHVEDR RPFGRCGLAP PRRRRVRGVE300RLVDVGRVGA RHLAERLAGH RRRVLEVAPM DRRDPLAPDE VLVPGFIGHQ RPGGTGTGKD360SHRIRLLVKI M371<212>类型PRT<211>长度371序列名SEQ ID 242GDC_MTUB_688806序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
VYLPPKLIPR RIPAQVRPTM VAPQVPHVLS ITPNGRSGEV CPASGSTRPK LGVQPPAASG60WPLPTRPGPR FSRCHRRPTL PACARSSSAT GSTPKSDNPA NPAGTSSRGG RSSTTRRCWL120PAAIRAALKS RFSARPTDSG AVGRAGRPHP AQA153<212>类型PRT<211>长度153序列名SEQ ID 243GDC_MTUB_701762序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MTSTNGPSAR DTGFVEGQQA KTQLLTVAEV AALMRVSKMT VYRLVHNGEL PAVRVGRSFR60VHAKAVHDML ETSYFDAG78<212>类型PRT<211>长度78序列名SEQ ID 244GDC_MTUB_731710序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VAESVAIRGC LLRCGPRSRP RRRSRRSGIC ACRPRCSATS RPPCPRRSTC PPRRRSMTSA60PSMWPPGRQR SRASRCIATA AGKDRYCPTP RRNRYWRRLT RSSAAAVRAA PASSDGGSHG120ASRRRIAQNQ RF132<212>类型PRT<211>长度132序列名SEQ ID 245GDC_MTUB_772761序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
LLHSSFGHLE GIQQPLIDEL AELDHVLGKL PDAYRIIGRA GGIYGDFFNF YLCDISLKVN60GLQPGGPVRT VKLFGQPTGR CTPQ84<212>类型PRT<211>长度84序列名SEQ ID 246GDC_MTUB_868821序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LLGALHQYPH TRIQPGAVAA HRDRQHPRPV FGDEALDAAG VLMRTHAADH RQSEVSTVGL60NAHRTRGERH AIGVAALLLE SREAHSLAVA LASTPLLPVP VRVDRARDPV GVGLFRAFRP120PHGASLGVDT HLVFHRVPAF PQYPKRRLRR LGAGRAPRLD IGFQLRDGPV VGLAAGAEMP180RQRVCLLGGR IECEPERLHT PAVGDLQTRH LRPPHDHRQR QPRRPAWPGS EQHVCHTTLR240TSRSESRSYP IPGHRQPRPS PPRPTPDPER PAQRGHTPNR TGRTDPDAQP QSA293<212>类型PRT<211>长度293序列名SEQ ID 247GDC_MTUB_890358序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MASSTDVRPK ITLACEVCKH RNYITKKNRR NDPDRLELKK FCPNCGKHQA HRETR55<212>类型PRT<211>长度55序列名SEQ ID 248GDC_MTUB_904043序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
LVCAAAPGRR RPLGVGGQVE AGTESLAATG HQNDMHAWIQ IGTLHQSRQL QRGVCDDRVA60LLRPVEGDPR NPTGDLIGHR LQVVEIDRPD RVCHQRPLSL LPAHARGWAR DPDRPAWCRT120LRPTGRRAEW PETPRRRRDV RGAPTTIPAT PGRCLRQSCG LDNRSCQDRP AADAAFRRGR180PAWG PGLRCG PARQTAPRRM RAGLPWRARY LAR213<212>类型PRT<211>长度213序列名SEQ ID 249GDC_MTUB_1045383序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LGLVAPAGDG RAAKKRPAGR RGSDRRRRMR LRGVVRPTPA RRCHDLWGLH HRVHCHAVAA60HRLQNGTGRW STGASTSMRS TTVASAAARG SRPSTSAETT DPSTAQINVH TSSICAERPE120RSMASATASA R131<212>类型PRT<211>长度131序列名SEQ ID 250GDC_MTUB_1068100序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MRCRAALSWR LPERLSRIWP AVLPDHTGMG ATAAWQAKAA SLLNRVTPAA SPTILAAVSS60AQPGISSSAG ATWWTRALMR WARVLISPVS RMMSVSSARA SSATNPGWVS SQVRRACWCL120AASSERAAGA RSGSSSWTSQ RNRLIADVRW ATRTSRRSVN NFNSRDVSSW VARGRSVSRI180TARATASASI GSDLPRLRAD LRVWAISLVG TRTTCWPAAS RSRSRRADML RQSSMPQISS240RPNCSRAHMM AVACPAVVAL TVFSPSWRPT SSVATKVWLY LCASVPTTTM VVASEPPR298<212>类型PRT<211>长度298序列名SEQ ID 251GDC_MTUB_1115707序列描述序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LRRRAAVPVG LHRRRSDRAG ATQRDRRRYR RWVHACRLCA AWRRDRRTSG PDRARSLRYL60CHRRRRRRGG QCAGSRPGQT RRRHHRDGLV GSAFQWVLAG PQGVAGDRPD ESGRSCGGVR120SHLGRRVIGA DSHLRQRLFG LGRRNPCPDV LPRHRRRARR QPATGHPAWP HRRGRPRHLD180TRAGIHHDCP ARPGQAHRDG EDVQHGCRHD RRRCPRRHDA RPGRPDRAAP GLLGIGNRLQ240RRKTRPAGKT GWAAPEILRT RPNRV265<212>类型PRT<211>长度65序列名SEQ ID 252GDC_MTUB_1124996序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VVAVRIEVVG HRVHHLAGHL EFRGFDLHLL VQHREVGVAD LIGPQQRVHH HHLSLAEILD60AQRRQPGLVA QREMHDRHPV GLGECLSQQH IRFRRLRIRL QKVAAVEHHR VHVGGGDELQ120HLDLPAAFFR QAGDVVVGDR HHLAVAGLVG PGKIAVVDHL ATRLADALVP DASVVLGVHL180VEPDVVVCGS AVHLDRHVHQ PEGDRTRPNG SHVSEYALIV RERNVTAKFH AIFDRDVTLA240TCVTDRLR248<212>类型PRT<211>长度248序列名SEQ ID 253GDC_MTUB_1138949序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LRSARVNPPA RSAASTPWYP SGSVTTAALG WFLAAARTIA GPPISICSTQ SSTLAPDSTV60WLNGYKLTTT SSKASIPSCS RAAACSDLRR SASSPACTRG CSVLTRPSST SGKPVSCSTG120VTGIPVSAMV LAVDPVEMIS TPAALRPCAR STSPVLSYTL ISARRIGRLP SSVLILWLPF180VPSSLFVRPP SRHGWPVRPP PLPTAVVR208
<212>类型PRT<211>长度208序列名SEQ ID 254GDC_MTUB_1170285序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VRADPPTTAC NTRCTPSVCV PSMCGTSTTS MPPRSCVPEK VTLLQSFPGL GAGSGWDVST60AMTTNRLPLP SAETAAMLPC NPVGSWGPAA TCAQFAGSKL SPSGSLRAEK NPGSMALGVT120SVTVYSGPKP DFTSATLAMS PVEAVVELAP DEQPTSQHTD PTASTALRIV VNLPNAAPEL180RNVDTVLTSR SAANCGASGG RTDPGSVISR RPRSLAGLPG220<212>类型PRT<211>长度220序列名SEQ ID 255GDC_MTUB_1176592序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VGTAQERVRS RSGPVPHHAL RHLRGSPHRG TADPAGDAGV GRQNFGPARP GPKPAVVRRR60RCSADPRHSA AAAHRGISPL PAAATTRRQV SGPQRRESHL RSVDRGLRVA WDVERGDGIK120PGIVAAVAGQ QHGRIVHHMG AVRFVLLPVD RGPQRVVARG QAGQINANRL GDRRRCRLVA180AAIAALVGDQ RLQVHRCRQR PNHLSGGIHQ PVAGHPLFGG GSSAVVGPGD RDRRDLAR238<212>类型PRT<211>长度238序列名SEQ ID 256GDC_MTUB_1202653序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
MSISGIERWS ATENIRISVI SSPQNSTRTG CSAVGAKMSR IPPRTANSPR RPTISTRVYA60SSTSRATTPS KGDSSPTVSV RGSIMPSCGV MGCSSERTEV TTTPSGGPSW ASSGWASRRS120AIRRVPTVST PGESRSCGSV SQDGNNATAS PNTPRSSAAR SSASRPVAVT TSNGPCRASA180LATNSRALAG AMSVNSSGRP PARCMSCWNV GALSANSTSP AIGVSEQAGP GAVMMRPF238<212>类型PRT<211>长度238序列名SEQ ID 257GDC_MTUB_1231843序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VLAFYLRPRP GTWCTSEGSS RDPSGGSLGG QCWGVGGLLL GGFFGAGQCC SGSGEDLEAQ60VAPSFDPFVV LFGEDGSDEA DDRGAVGEDA HDVGSASYLS VEAFLGVVGP DLAPDLLGEG120GERQQVGAGG VEVLGHRGEF VGQSVEYPII LGNN154<212>类型PRT<211>长度154序列名SEQ ID 258GDC_MTUB_1241031序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LTTAGISGSK GRTGTGEPCG LLSAAGFRAG ASGGLTAAER STARASSANL TRRYLTHAEL60LMLARATGRF ETLTLVLGYC GLRRFTVR88<212>类型PRT<211>长度88序列名SEQ ID 259GDC_MTUB_1252888序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链MGQCPRPVRH WPPAVIVCSR TKLRRACLRD YRRPAPSDKK PNKSYRVMTP TGLPSSTTIN60ASQSRNALPA ALTNSPAPII RSGGLMCADT ASANLARPSN TAESSSRSET LPATSPAITG120GSAPTTGICD TPYSRRIPMA SRTVSDGWVC TRAGSAPDLR RNTSPTVDCS VDPSRRLRRN180P1<212>类型PRT<211>长度181序列名SEQ ID 260GDC_MTUB_1264312序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LAAIPRRSRC SVNPRGNRHD PARHPGGRGS VRGGDRPELT GDIGLRPGEG SARRGLRPRQ60AGNRPVRCAQ VHEVPTAAIL SASSEVFNEV PVRNPGTLAF VPIVDGDLLP DYPVKLAQEG120RSHPVPLIIG TNKHESALFR LMRSPLMPIT PRDHVDVHPD CRRTARSASA NRGADRLRVL180AMAAQSTLIE YGYRRRLPDA VGVAR205<212>类型PRT<211>长度205序列名SEQ ID 261GDC_MTUB_1286282序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VLALRPQRHF TQSRSARRLR CVLDDDVWVP WARSGGCRTA TRHLSVRCIA GTCWGPPVRF60CRLRATPSTV SCSARRRYRS RLTCHRSTDT SWSLSATRLA ELLAPLEPVT VTFTPTFGEP120DMVHLSGTKF GGLVPALFEG VRAGF145<212>类型PRT<211>长度145序列名SEQ ID 262GDC_MTUB_1301742序列描述
序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MTSSAPKPAA SRASDWPTTS PAPSCSPTAN STVPQSSYAM TSTCWAAGSE WASKPSATGS60PHCSARGSEG YRSSSSAPTR PETSQSDSPR RRFTSAGSAA AARCGWSTTR SPSQRGSSAR120WRKCPTAGRT SGWPRPPLPT GSGIWARTRT SRSGWAATSR TPINSSTPPV SSWTTRARRS180RSGRAARSAT ERRAPNVRSP ISVVASRSTR TRAAACLIRR PSNRFDRPTP QQTTKPLILL240WFQQALGKHC CRCLHIAFSH VFHSGGDHGG LRVIGYRAVP RAGADL286<212>类型PRT<211>长度286序列名SEQ ID 263GDC_MTUB_1351907序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MQLGNQNTMR FAGRPQRFRQ SAYPLFNPNS AIALGHPFGG SGARLMTTVL HHMPDKGIRY60GLQTMCEGRG QANATIVELL80<212>类型PRT<211>长度80序列名SEQ ID 264GDC_MTUB_1476279序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VTVYRRGMAV LTDEQVDAAL HDLNGWQRAG GVLRRSIKFP TFMAGIDAVR RVAERAEEVN60HHPDIDIRWR TVTFALVTHA VGGITENDIA MAHDIDAMFG A101<212>类型PRT<211>长度101序列名SEQ ID 265GDC_MTUB_1485311序列描述
序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VGAVRLQPHR MGGGMAALHR HTGTADQLLL LPRRAHRAGS PVQCDRLRGR DSHFQPGTNQ60YRNGHRGIDQ PIHQHRDQLD TRLPAAVAAN QPAGIPVFAL TSD103<212>类型PRT<211>长度103序列名SEQ ID 266GDC_MTUB_1486309序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MPSPVSSGPT SHGTNKGCGL IRSESMNTTM SPLVAASERH NASPLPGRTG TSGNACSRLT60TRAPEAMARI SVSSVEPESS TINSSTRPST SGEMLSITDS MVASSLRAGS TTEIVRPAFA120ASNSPIVQPG RCQVVSKGSA PGALPPARSP ATSSDAVMRV LSPCASAAGP PESMPPFPAP180AGWRRPHAPE TCAPRRPQPT RWLPAFPQAV RSNPRPESPR QRPCCSKPSA RATRS235<212>类型PRT<211>长度235序列名SEQ ID 267GDC_MTUB_1515112序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MLSAVILTER GYPAVPLAGQ LVHQRFVRPG PLVLGTGFLK FLTRAADRDR TVSRRSKPSS60RAALMGEQPN PWDLLQPQDA TSRHRGAKPS RRYGLLGKIS LLSPGYLLSV ERHPFHSGVP120DH122<212>类型PRT<211>长度122序列名SEQ ID 268GDC_MTUB_1515464
序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LVGRSRVLVL FGAGEHVDVV ALLGERAHRL IGEHVVQTVV GHVVQNRNVA VLVTRPAIHQ60QVGRLRHRLL TAGHHHVELS GPNELISQRD CVDAGQAHLV DRQRRDIPTD AGRHCRLPCG120HLPGTRGQHL AHDHVLDQGR RHVGLLQGAL NGDGTQLAGA EILQGAHQLA DGCTRASNNH180RCRYDYLLSA PESRSDRPGE ADSFPSGYRC VMTTDQVHAR HMLATSLVTG LDHVGIAVAD240LDVAIEWYHD HLGMILVHEE INDDQGIREA LLAVPGSAAQ IQLMAPLDES SVIAKFLDKR300GPGIQQLACR VSDLDAMCRR LRSQGVRKVY ETARRGTANS RINFIHPKDA GGVLIELVEP360AP362<212>类型PRT<211>长度362序列名SEQ ID 269GDC_MTUB_1596569序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LRAATKSPSS SCWRACATAG STSVDSSELA APLSFPAVAD NRESTQRLSW SAGWRPWKLE60IGCPAAKATT VGTAWTPNIC ATLGATSTLT DASDHLPLAA AAKPDSVSSK STHTSLRGDH120SNTTTGTSSD RTITSSSKFA SVISVTPDGV DSARSASVLA AAFCWARCLM PERSTAPAMA180GPSGGRGRVT PSSLSCRCGH RSTRWRRPCG RSRHTAIGWY DQDHTGRHRP LNRYPARNIS240ASPCPPAPHN AATPTPDPRR ANCSAACSVI RVPDMPRGCP TAIAPPLTLT IWGFSPSSRI300EANATAANAS LISTTSSWST EMPSRSSALL IALAGCDCSV ESGPATTPWA PISASQVSPS360SWAFSWFMTT TAAAPSEICD ADPAVMVPSP RNAGFRPASA AAVVLARIPS SSVNCSGSPV420RCGMFTGITS SANTPSFHAA AAFWWDAAAY SSCSERVNMS TSLRCSVSAP IG472<212>类型PRT<211>长度472序列名SEQ ID 270GDC_MTUB_1600905序列描述序列
<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VRSRRLAPTR PRSRRTASPA TATRAAAPPR TTPPSAAPAT RCPPLARQRN KTRAAQSRLA60WRGGRSEQGL SRCGSSGAVL RCGDRHPAAL AGVPQPAVAS ARGKQLLVGA AFDDPTMIEH120DDLVGPGDGM QSMGDYQHGA VPGQPVKRLL HKVFRFRIGK RGGLVEDEDR SVAEDGTGNG180EPLSLPARKT TVGSEHGIVA VRQPKHPVVD LRFAGRDLDL FGGGIRYRQR DVFGGGAMHK240LGFL244<212>类型PRT<211>长度244序列名SEQ ID 271GDC_MTUB_1616064序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VSAVLALSAA VSARRAKAAE AHSAPSSNGT PASAATPSCQ EIGNRASAIT AGSRIALVNG60VTRLTTRPTS SGPVAAIACR AVAVFSAVNQ SNRTTGSRSA TSCWVWLRTA KPSSIPMRAV120TASSTHPATV AADSQPSHSH ARCGASPNNA AISGTSNTVP TARATTEQNA SSAKPISLAR180WSFGTRAIQV RIIGCRPALR RPPPGCPGRC PTAGSSVRPR QATPRGCRVR RSDHDRARRS240GRPG244<212>类型PRT<211>长度244序列名SEQ ID 272GDC_MTUB_1672449序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MPSVIRDPDP GAAPAPTVAD RSAEVPSVLQ RSRRCDAYHR YSRWRLSYSA SPLGGSRRQP60GIATDGRTRG TQPRPAGAAH SRARPDVGRS VAATRPPSAG SAGTARP107<212>类型PRT<211>长度107
序列名SEQ ID 273GDC_MTUB_1673708序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VLRPIRAGQP GRHLAPPRPA TRRQGTGAGT GARRRLGTGV APPAGVSVDE PSGCARLGMR60VAELPGVAAP HLARPHCRRE ARAGVGQGKH RRLRRGSEFR CHQRRFGRRP SVRPGGVDPQ120RSAISARVRT GRHLGGGSGS GIRALRLVYD RCAGASGIRR VARNVRGETE IQHAPRHLRR180CLTDPPCAGR RPTVLRSARP PRLPDPRGRS PCVRRGTAGG VEVARRLRGP APRPTRLRRL240RLPAGASHRR GRGPLPVLGV RDQPAGHVVS YRPAIAIPRH APARPVPVRW HRPSRRCRWP300PRVWS PGRNP DNPGRRSR318<212>类型PRT<211>长度318序列名SEQ ID 274GDC_MTUB_1699549序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MTASRRSDHT DATRRALVDA GRYLFARRDY GDVSIEDIVT RARVTRGALD YHFDSKKDLF60QTVLEVVEAD LVADVEAAIA KVTDAWICWS SASTPSLTRR PNRMRCRSLR LTARQCSGGA120NGAGSTCARA WSAGRGSRTR DGRRGDSART VATTFASAAG RANRIRAADR GRDGQRPDQS180RGRTRIYGPT RRSTGVARPR SATATDHRPQ SRPASRNAPR PATPRRPGHH RRHPGPRCRR240RFWRSPSRRR APAPYRQSSA RPTRPTLFGS PHTPPGRRRR WPPARCRSPR PVRRR295<212>类型PRT<211>长度295序列名SEQ ID 275GDC_MTUB_1742061序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
VRLRSESAGL AHAADDVSGV VLGDDPDHDP PVAVLDFLVP EDVFPVVVAT GQMVVAVILG60RDLDVLPAHI QMGFRPAPFV AHRDLRLGAR KAGADQQQAQ PGFLGGLGTA VDEVQSGSCG120LHATAAPIAL DQRLDVGHLQ IGGLYQGVDG RDGGVQWKST GQVERRSLRC GHAHALDDAD180LVGLDALFPD LQPRGTAAVG VDDRGGKIRV DPLGAMEGRS RVAGQHAAAA RAQPQRFCTQ240LRGQFHTLRH VHVFM255<212>类型PRT<211>长度255序列名SEQ ID 276GDC_MTUB_1782153序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LGVRAAVGVD DVTRGRRQPV RQQRAHRLGD RRRILHVPAD RSALIPALLE QLDLGAGLLA60ERTADDRTHR QRPDRACGNE IRTHTVLAGL ARHEPVDRLQ RALGDRHPVV GRHRPARVEV120HADDGTSGVH DRQQRLGHRS IRIRRDVDAL GHIRVGRVEE RVDAHPGLRH EPNRMHHPVE180LVARPDRLGH PAGQAGQVLL VLHVEFEQRG LCRQPVGDAL NQPQPVEPGE HQLGALLLGY240PCDVKRDRRV GDDSANQNPF AVQQSCHVRP CVVSVAHTHA AVDRDDRTGD IARILGSQEA300DHPGDLGGGA DPLRWDKLQR PLLNPLIQRA GHIGVDVARG HHIRGHVCLR QLAGDRAGHA360NHSGLGGCVV GLVADAPAAG DRTYEYHSTE FVALHAARCP LSHPERPGEV GVDDLLELFL420GHPHEECVRG430<212>类型PRT<211>长度430序列名SEQ ID 277GDC_MTUB_2060659序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MVPSMRVRSD WEPIAQSRSR LAVTAPRNTS GGRFIWILLG SARNGSRAPW LPTRSPGSLD60RIFLVATDNR TSLPKGRWAP TSRMNPQPRP DVMPWRRATG RSGNPVKRAL ITGITGPDGS120YLAKLPLKGY VAAGSPAEVY FCWATRNYRE LYGLLAVNSI WFNHESPRHG ETFMTRNPAP180YRGRQRGADR CADADAPAHP DRYQYWGVPA SVRGVIDRAM GVCVE225<212>类型PRT
<211>长度225序列名SEQ ID 278GDC_MTUB_2093062序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LSGQPSALRR PTVSPSACRR PTVSKSKPKI DRMTSRMAPP TTDGSATLNT GHQPTDKKST60TCPRSGPGAR KKRSTRLPMA PPRIIPRPSA HHGDTSRRPI QKIPTTTPVA ISVKTQVYPV120AIEKAAPELR TRVQVTVSPI IDTGWPGGNS WTATTLVTMS SVSTTTATDS SMRSRRGGAG180ALGSPAPPAS SVEVSGSADP VGSSGTPSSS PRADMARPDP AAGWEQTTCA MIPSWPASPS240SLLEGQSRPP PAPMGCYGQP IAGRR265<212>类型PRT<211>长度265序列名SEQ ID 279GDC_MTUB_2105797序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VPPNRPERRL GKPLTAPLRR APAHPLRDGP GSVGNPPKTS RRHQLLRSPK PRRRPGCPQS60RTPRTSREAP PATQRPGPPG SGFERRERPA ASICGRARRW SAEKRQERTF PGTRRRSRGR120WSPRCRARWC RARFGLRQTA ARPCGKGCYS KFGHHLADAR NARNRLWRMA AAIRVPAAPR180RLPGVSGCRD AKLDCITHKR SSPVRGKRVE PVAVVARRHR QSLLGGRGQA KLGGQAQQMH240ARRLRNRHRR VPVHDTGFR259<212>类型PRT<211>长度259序列名SEQ ID 280GDC_MTUB_2133554序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
LWKWKPRLAF HRATWRRRWT ATTPTPRAAQ IPISTSSRNS LQHKTTGRGG RSTCRWARRC60MPDSLWAGWP RRWTVKYCAT TARWWPACTR SGHARPISPR TARDMPAGPS WVRGRFSGVA120PERMRQPERR ACKPPRAATG NPATRHADKA S151<212>类型PRT<211>长度151序列名SEQ ID 281GDC_MTUB_2183418序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LWPRISAAPS NRRSTVGGVW CRRRPNWVSR PRDSRRPCRI TTRCAPRGCP LHSPRPSATS60SAHTPTAGST NQASSTHYGV QTAPKYRCSG LELKGGKGVS DEISRRAPTR VRPDIQRRVH120RSEPIRGRVA LRRRFVHRRR LGHHHSGSGR QYDRGSRAAD GRDGRPPRWH RNPAAGSADP180GGKADGGVRQ KPGPGARHPS DAGTRRFGVR RHGAHPQART WRRGGHPRGS PDRIGARIVL240PGRGSLHPGA RYRRDGLCDR SSGNRATQDL RPAGARPGRR CGADRRRRHV GGSAKPHRGY300PRRYLHPGHR310<212>类型PRT<211>长度310序列名SEQ ID 282GDC_MTUB_2192571序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LGISPGDRGD RVRGNAAGRD RHPGRLAAFL GADHYSVFSN GPAVEREDRR GQHGAVRTAG60RPDGAGAGPQ PRTTGAVVTT ADPVTAGAAA GSRGYRVALR VRPARPDRAL PGGGRHQHRI120QYRGCGAGAD LCLAAVSGDF PRGCSPHRRS RLRGGGGDTW GAARHCLVAR DPAVAAPGRG180VRISTGVCPL ARRVWRDPNL CRFPARGHPY PSAGDLPAAG DRSGRGGGIV TAARCGSGTG240GAGCGCSYAD RDRYQVAGHE QAAAARGRRR PAFGRRILGV RGRGACSARA QRCGQVHRPA300CYRGAASPRR GLGTFGGPGV DRHRGRGECG DPRPSSRAAV ARPVVVSTPE RGQKRGLRTT360MPSRDVWVRA R371<212>类型PRT
<211>长度371序列名SEQ ID 283GDC_MTUB_2234641序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LPTPVPARTG TPSRSANPGA TGRPTPETAN TADCSSSRPP GPHSAVSATQ QLPLGNNKSQ60LPIGFSPNRD WTRGRRAAPP LAFRSHCGRN PRRASSKSST RSFGQAFRQV FRADGWRRVR120SMTRSTYVFG SGHGRFGHSS HGSAAGQDLD IDRGCPQYRP VLAGNLRGRV A171<212>类型PRT<211>长度171序列名SEQ ID 284GDC_MTUB_2320829序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MRRLRSSDPR CHRLHVGARP APVLPPGQDH RGAFREQRSK SCAARRTRGA CESLGAQRGQ60RRFVVGFLRD FRHQFRVGDV AVRADHHDCA GEQPGHRPVG DGHAVILAEA VPECRRGHDV120FGALGAAEAL LGERQILRDT QHGSATCRRT LVEGSHTRRA HRCVHGWKDV QQHGLTPELV180AADHPQIAPG QGEGRGRGSD SR202<212>类型PRT<211>长度202序列名SEQ ID 285GDC_MTUB_2321250序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
LRGSGRTQIQ DHAAALSRHP RQRAVEFLAA AARRRAEHVA RQALDVDVQR HGHPGTDRTH6QDDRQMLAEVV NVTKADDTRG AGPGGQRRCR KPDHLGLDPP AIRHQLPDRD HGQSVFDGEF120DRLGVVRHLD GIIGRDDLAE RGGRPPFRQA GQVDGRLGGS PPTQHTVGLR LHGHHMARTL180EIGGDGGGRS QCRDGPGAIA RRDSGAGAAN VDRHAMRGVS VTHGRQVQSL AFGARQRDAQ240ITRGVPDRKG NQPRRRGLGG EDEIAIAIGV AGQDHGVTAR HRRDRTTYPH IGRLHRDSNR300RNRLP305<212>类型PRT<211>长度305序列名SEQ ID 286GDC_MTUB_2487508序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MKTAISLPDE TFDRVSRRAS ELGMSRSEFF TKAAQRYLHE LDAQLLTGQI DRALESIHGT60DEAEALAVAN AYRVLETMDD EW82<212>类型PRT<211>长度82序列名SEQ ID 287GDC_MTUB_2567990序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MSTSTTIRVS TQTRDRLAAQ ARERGISMSA LLTELAAQAE RQAIFRAERE ASHAETTTQA60VRDEDREWEG TVGDGLG77<212>类型PRT<211>长度77序列名SEQ ID 288GDC_MTUB_2577106序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链VATSTSPAGG LPQARSQPTK CRCPADSTFS DRAASARTSA AECAQPGLPV QALMFSQGEF60SSNTRPSGAS TRSAASAVAS SRSQISTDRH GVITSGASIA ARHSATRAGK TPSGTAAPSV120TRLSSWGIQP TGVLVTGRTD GPSSTPDCSS PISANSVTRQ AVSRILTKRN ATSIRVSATS180ATRTPVSRPV NSSRGPSGNT CTPTSAPRPD TSARPSSRPN QNRPPSSASR GSARIAASSS240PTHARTSASP PARPDSGEAT ILRTRSCVAD GSSPALATAS ATAATSRIPR NWTLPRAVSS300SVAEPKSLAT LASVASCAAV IIPPGSRIRA SAPSAAWCGR NAPGQASASR VPATRPPYGR360MGRRLAALRS RREAEDQGQG VFDCAHRGGF EGAESLHESG TSDRADAAAH RDAIGSYTF419<212>类型PRT<211>长度419序列名SEQ ID 289GDC_MTUB_2577486序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MTGRVRQTGI TRLVVHQRGP VLPQRLMTVH AGPVVAEQRL GHERDRFAVL PGGVLDDVLV60QLHVVGGVQQ RIELVVDLGL SAAAHLVVAL LQDEAGVDQV GQHLVAQVDV LVVGGHWEIP120ALVADLVAPV GTAVGLGRRA GVPPPRDGVH LVEGAVGARV EAHRIENVEL GLGAEVCGVG180DASADQVVLG LAGDVARVAG VRLQGERVVH KEVDIQRLGR AERVDARRLG IGKKQHVGFV240DRLEPANRRA VKGQAVVKHA LVKGRSRNRE VLHDARQVTE PDVDIFDLLV LGKFEDVVGR300LFRHRMLLYC IRGRRYGADI ARQSTPCCAD VTDRAAHH338<212>类型PRT<211>长度338序列名SEQ ID 290GDC_MTUB_2690012序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VAGVCALFSG ASRWPSGELR HRPQGSRRGP SRLRCTFPRQ NVSSRRPGVP TVGADLTRRS60GGTGQPRGMG SPGPVGQTVP CHLRLSRPDT RASGRSADQA HSRRGGSAAR PHQGQPLHPG120GQRNRTRRTH ALLAAGNVTA TAADEGSAEW RWRWR155
<212>类型PRT<211>长度155序列名SEQ ID 291GDC_MTUB_2698040序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MTDNECPADS RRRHVLRLAL FAGILLGLFY LVAVARVIHV DGVRSAIVVA TGPIAPLAYV60VVSAALGALF VPGPILAAGS GVLFGPLLDT FVTLPAFSAG AQAGMTPRRC WVSIAPIASM120HRSNGADCGR WSVSASSPAS RMRWPRTPSG RSEFRCGRWS LGRSSGRRHG CSSTPRWARR180SPTCRRRWFT RRSRCGA197<212>类型PRT<211>长度197序列名SEQ ID 292GDC_MTUB_2712275序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LWAVVGQRFV PGISDALASY TFGAFGVPLW QMVVGSFIGS APRVFVYTAL GASITNLSSP60LVYSAIAVWC VTAIIGAFAA RRWYRKWRAR PRRRCGLAQL TTGSQQRHTS HRTPAGVVMP120GSLSEHRRLR QEAPDRIEHH PPIE144<212>类型PRT<211>长度144序列名SEQ ID 293GDC_MTUB_2725593序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
LSAVLPARCI RALADRVYRH VRCHGGCARN HHPRSRPGRI DYLGVHRGQR VPGAKGWIDI60RHFHTGRGDL DGRAAVVRQP LSGGEQYCSD DRVGGRHAVV DHLRVTGTAH DRLVERVSVL120DNGGGVCTGR DPWRHVLNSV APRTRHRIRP AVPRRRCRSR GSQDR165<212>类型PRT<211>长度165序列名SEQ ID 294GDC_MTUB_2733212序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VGPMNGFLSW WDGVELWLSG LPFALQALAV MPVVLALAYF TAALLDALLG RVIQLIRRAR60RPDQAPR67<212>类型PRT<211>长度67序列名SEQ ID 295GDC_MTUB_2828257序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MADDVSGAVY RAGTAHGRPT GRIEHRDRQV VTRRATDTRA ELDGLSDHQL AEVQRSRENH60YPAGCLVIPQ PLNRRPEHQP APPQRHWALA GGDRDQRGGA KCHGDWVAID RLGAQRDRKP120VPRAHHTDRD QAGADRTQSR SVPRPARHTP PQCAAAEGHH DAAQGTHVAD RPHDPGRRHN180PADQRRRDQA YVQTGRAEAH MAHRYQTRTR LRRLSSRAGP MPSTSASWST LVNLPLRCRH240ATIAAAVTGP MPGRASSCST VAVLRSSTSA VLGAVLGPVV AVPEVPAGPG VPAPTELPST300LGCPEGGASP TTICSPSPSC RAMFSPTVSA PSTAPPAACS ASAIRAPGAR VTSPGVCTRP360TTLTTTGRPE RSGEPGLADD LGFVGETGST GGSLADITGS VRSRIKVNTV TSTARAAITA420NATAPARPGS ARILSAQPCP REVSGSQRGS SEFGSSRGSS WSGPSSVGSC GSGSKCADAA480CESISGTAPS RLCSRSAGSS VRMGRPQLRG PPEPARTTAS RCPAVDQSEA VDKPLWRWIK540MGQTAPTSPN NQHRAATSIR TRLTAIESVL GNAIREC577<212>类型PRT<211>长度577
序列名SEQ ID 296GDC_MTUB_2895354序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MRGTAYATRR SMLPNTRAVW LATVVQCVTG GLGVTLIPQT AAAVETTRSR LELARFVAPA60RRDESVWCLA LSAAARSPTS VLPGLSAS88<212>类型PRT<211>长度88序列名SEQ ID 297GDC_MTUB_2983047序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MRRVFSGWTT LVRCSTAATT VTIRAMTKHV PVIHSSEPTR PLTPRKPVDP VRRCCSQLRQ60PNPTTLKTAK SASAKSAAVV VRISGSPSVR SSGHEPLWRL ARRAASIAAA AGAQSPTPDT120KVASAPAAQA RRNARSRSAG EPGLRGQFAA RTPANTSPAP AVSTGVTVGA GTSNTPSAPT180YRAPRTPRVI TKCVGGDGQS FASCSLAITT SAIAAKSCKE LRSWPAGEAL TMTTASADWA240ARAAASAVAT GISNWVNSTS QLATAEGTGV RCALAPGATS TVFSALASTT IIAVPLGPGT300VTVLSSPTAL ARRWARSWAA AGSSPNAPEN CTCAPARAAA TAWLAPFPPG VRVNDAASTV360SPGRGSASTT NVRSMFTLPT THTRGAMGPT LVSLAFAMLA VG402<212>类型PRT<211>长度402序列名SEQ ID 298GDC_MTUB_3005316序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
MSASASADKV VCECCELCVP KQLASAIRNP YGLVRGWRCR ICNEHQGQPV KMAQDHEEEV60RIRWGETVDE LHAALDRAGP RPGTWCTSEG SSRDPSGGSL GGQCWGVGGL LLGGFFGAGQ120CCSGSGEDLE AQVAPSFDPF VVLFGEDGSD EADDRGAVGE DAHDVGSASY LSVEAFLGVV180GPDLAPDLLG EGGERQQVGA GGVEVLGHRG EFVGQSVEYP IILGNN226<212>类型PRT<211>长度226序列名SEQ ID 299GDC_MTUB_3048559序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VGSLTVFTSS ARMSRTAANT SARALHSMTT GSGGKSRMLN TIASPPPTSA SKRRSKTTLP60LDAKTKTSTA ETAAWLMNIK PCATNPRAHS TATDNAMNTT TPMAIGPEPS RACTPAPSTI120PSATPTIICW ARRARSTLVA DMHTTAEIGA KNACGWLNTS WVRYHARPAT TDVWVIGHST180VRNRWATARP PQAVLTSSEA LMNAYLFTLG CDVVTAKIWS CLLDPLGLGI YSGLLTLLSG240NGRRRVGERI DAAAGLRERD HLTDRVHPGQ QRGGPVPPER DSAVRRCAKH ERLQQESELF300LRLGLVQAHH REHPFLDITA VDTHRAATDL VAVADDVVRV GQHAAGIGFD AVLPFRFRRG360EGMVHRGPGP RADRDLTGGG RFVGRLEQRR VNDPDECPRI GVNQAQPVGD LDAGRAQQCP420RRFDRTGREE DAIAGFGPDM VGQSGALGLG QVFGHRTAQR AVFGDQHVGQ SAVAALLGPV480LPAVQRAPRL RRPARHHHRA HIRCLEDTKC GVGEEIRAFD ELQPEPQVGF VRTESAHRFG540IADPRDGRRN PVAYQRPQLG QNFLGDRDDV LGVDEAHLHI ELGEFGLAVG AEVLVAVAAG600DLVVAFHPRH HQQLLEQLRA LR622<212>类型PRT<211>长度622序列名SEQ ID 300GDC_MTUB_3065095序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
VIGDFAEMLG GQDGVAELVQ HVAVHPFDGV DELVEADGVG GGCGLRHDVN SRLTLCIVST60VIGCVVGSAA LPGRCGQGGA DRGHQAGVGV AGDQRDPGQA AGDQVAEERQ PAGPVLGGGD120LDAQDLSVAL GVDAGGDQGV HPDDAACLAH LEHQGVGGEE GIRAGIERAG PKRLYGFVEL180FGHDRHLRLG KLCHTKCFDQ ALHPASGYSQ QVAGRHHAGQ CAFSSLAALQ QPVREIAALA240QLGDRDVDGC GTGVEITVAV AVALIGPLIA AFAVARPAQG VGFSPHQGGD ERREQPAQQI300RARLCELVSQ KLLGVDKMRR GHCVISFD328<212>类型PRT<211>长度328序列名SEQ ID 301GDC_MTUB_3100192序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LDEPAHRARP KGNGANHDGA QPCCGIGACG NRGDPRARAH LPLPKGGRAG GAWHGVHRRP60RRNLRASRSQ RRGQVHHPEA SHRAAARPRR PGHGVGQRAG RVGTRLLRAH RGLLRAAQPL120PKAHRV126<212>类型PRT<211>长度126序列名SEQ ID 302GDC_MTUB_3129118序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MIPQMTVSCP PPSTSEREEQ ARALCLRLLT ARSRTRAELA GQLAKRGYPE DIGNRVLDRL60AAVGLVDDTD FAEQWVQSRR ANAAKSKRAL AAELHAKGVD DDVITTVLGG IDAGAERGRA120EKLVRARLRR EVLIDDGTDE ARVSRRLVAM LARRGYGQTL ACEVVIAELA AERERRRV178<212>类型PRT<211>长度178序列名SEQ ID 303GDC_MTUB_3237815序列描述
序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LVTTLAPILD SASMTPKTAS SLPGISDDDN TMRSPAVNVM LRCSPRDIRD NADIGSPWVP60VVINTTWSGA IVSAAAMSMR SESATRRKPS CLATRMLRTI DRPTNDTRRP NATAASMICC120TRSTLEAKHA TITRPSAPRM SRCSVGPTSL SDGPTPGISA FVESHSNRST FVSPSRDMPG180RSVGRPSGGN WSNLMSPVCR MVPAPVYTAM ANASGVEWLT AKYSHSNTPC RVLWPSRTST240NTGVMRYSRH FSATRAKVNF EPTTGMSGRS LSRNGIAPMW SSCPWVNTSA SMSSSRSSTW300RMSGRIRSTP GSSWPGNNTP QSIINSRPRC SKTVMLRPIS LMPPSAVTRN PPEVRGPGGG360RSTSTSGPPF GSPLDHRSTE AARMSAANAS ICSGVAATWG SRGSPTSMPC SRKPALDNVT420PPRRLIALHS GATAMLILRA VAISPEPKAD NNSRSCPAAR WAITLMKPVA PMASQGRLSA480SSPE484<212>类型PRT<211>长度484序列名SEQ ID 304GDC_MTUB_3283182序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MSKRSDGPST GNAIRARHRI SVMTAQRSTS HATRTPVASS AQLGPPSSVE PTVRPGLAGL60VAVKRGREAA ARLPNNPETG CKSRDH86<212>类型PRT<211>长度86序列名SEQ ID 305GDC_MTUB_3289702序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VATKNAAWPS STSCSNYSPN ATIESQRPDG CTSSRACVTP PVTQRLFSSL LTGYTNGSKI60RQTPSNSRPR CTSTSIALAR RSPNERHPRR LCETGRSNSR PAKEKERLRA DHNPAAGATQ120PDRTALRRGA AERQPHAPAS AEGEGPVPAG PVRLPVRA158
<212>类型PRT<211>长度158序列名SEQ ID 306GDC_MTUB_3319076序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MSAPDVRLTA WVHGWVQGVG FRWWTRCRAL ELGLTGYAAN HADGRVLVVA QGPRAACQKL60LQLLQGDTTP GRVAKVVADW SQSTEQITGF SER93<212>类型PRT<211>长度93序列名SEQ ID 307GDC_MTUB_3339006序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MLHDVVHGRR CSENGHRRRI TQYRIGTFIG NAALWNRKRH GDAPGLQRAE KGDDVLESLR60SRDHHAVTRG TTTAQLLCHI QRSPIQLRPR QGYRNAVPVL FVIHKREGRV MGLQTRTRAQ120RSGKGTHTHG HHVTGHAWSC RSRRRGVLAL RGLSQVASGQ LSRGLPARHG STIGHGRM178<212>类型PRT<211>长度178序列名SEQ ID 308GDC_MTUB_3356995序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MPTTKATQRR DVSTEIAYLT RALKAPTLRE SVSRLADRAR AENWSHEEYL AACLQREVSA60RESHGGEGRI RAARFPARKS LEEFDFEHAR GLKRDTIAHL GTLDFITARD NVVFLGPAWH120REDSSCGRPG DTRVSGRSSG AVRHRRRMGS TARRGSPRRA HLRRTHPALP LSAPGG176
<212>类型PRT<211>长度176序列名SEQ ID 309GDC_MTUB_3381198序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MQWGYRPLAG DEAMRWGYRP LARESGALDP DHRRCRRRPA HCRPTTRNQT YHRSGARVAI60QHRDCAAGSD RSGGVGPLCG FRRPGAGGVV AGSGVRAVRG VRPAQRGRHC AQHRGPRSLR120CDAAPGRGGG RRGGRDHVPG GSGVGRPALQ RRLRRR156<212>类型PRT<211>长度156序列名SEQ ID 310GDC_MTUB_3388071序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LGGVASTRQA SVRRWSAVHP LDASPALPRP GQRCATARAV AGPTPSWRAA VRSAGVSTSQ60RRPGQAPVSS TAPERRCRAD ESGPNRGCSA VPNAHSTAVP VPSRSATKLR RWWRAAEIAS120ASSCVCNAGK SPCSTTMLEA PSATTRSAAV MAVFSGSGSS SGVGSASTSA PSPAAAAAAA180SSGVITVIER SEPTPAAAVN VSTSMASTTF SRVCAENTGA SLVLAAAKRL TAMIKPISPS240SGVPLMKSSC QRRSTRHTST ALPPRSWPGP RHGPDGNRGA D281<212>类型PRT<211>长度281序列名SEQ ID 311GDC_MTUB_3482312序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
LRGRLIRYAV LLSPSLPLRP SASATGFQSA SVVVTAERAL PAWPLPAPPL EPELHAASIT60AAAVVIATIL PACLAPAMRV PSIRCIHGVD GSSVSHGLSG DYETTMKLDR TDPGTARRPH120RRPGRVSAGR RGSSTRGTHA HPRRGHQRHR PTCPSAIATG SRRNPVSWNN IQRPSAAAAR180RARARTSIRQ RCGPRTSHPL SLLTTELELA LRRPRSNPEL LAAIRSALAE TTDTARTTGG240TGLGLAIVDT LSQRNHASVT ARNRAAGGAE ISLRLALG278<212>类型PRT<211>长度278序列名SEQ ID 312GDC_MTUB_3581973序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LLGLPDPRPV PRNPAARRRA TSRSLSADPS SRPASQSRPR PGTWCTSEGS SRDPSGGSLG60GQCWGVGGLL LGGFFGAGQC CSGSGEDLEA QVAPSFDPFV VLFGEDGSDE ADDRGAVGED120AHDVGSASYL SVEAFLGVVG PDLAPDLLGE GGERQQVGAG GVEVLGHRGE FVGQSVEYPI180ILGNN185<212>类型PRT<211>长度185序列名SEQ ID 313GDC_MTUB_3711717序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MIFWATRYCT IWLPPSPSSV TFSPAVLAGL GVDASTVDPA LASPTSSLST PISARVSTVT60SFFLAAMMPL KDGKRGSLIF SFTLITAGSV ASRVNTPSSV SRSPVILPPS IDTLRRWVSC120GRPRYSAMMA GTAPPTPSVD SLPAITSSVP SMVPNARAKA HPVWMTSEPC MPSSFRWTAL180SAPIDSALRI ASVARSGPAV STVTDPSMPS AASFSRICSA SSTARSLISS STASAASRSS240VKSPSVSLRS DQVSGTCLIR TTMFVMTVVR PPRRRPAALD CGTSVTRFAT AQRYYYSVSS300RGAPSHHSGW310<212>类型PRT<211>长度310
序列名SEQ ID 314GDC_MTUB_3716987序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LLSSWPRPGT WCTSEGSSRD PSGGSLGGQC WGVGGLLLGG FFGAGQCCSG SGEDLEAQVA60PSFDPFVVLF GEDGSDEADD RGAVGEDAHD VGSASYLSVE AFLGVVGPDL APDLLGEGGE120RQQVGAGGVE VLGHRGEFVG QSVEYPIILG NN152<212>类型PRT<211>长度152序列名SEQ ID 315GDC_MTUB_3754581序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LIRSIDRWGS AAGGAVGTPG GTDCNGRSSH PARSAATNTS ISAQGAAGPW VKNRGRSSFP60VASCSRTAAE TTSSCLGSGA PATNVSARQP DTTYRPSVDR TGRARRTPST NNVSRTRADQ120AARALSATID NTTSPHRQPP SQPAPNRMGC APAKPNATNT CSGGGSTFTP VSLVEPIGVY180WACIGPSTSP CRAASAWPTR RSHPAGVPRR RNRLS215<212>类型PRT<211>长度215序列名SEQ ID 316GDC_MTUB_3794808序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
MRCRAALSWR LPERLSRIWP AVLPDHTGMG ATAAWQAKAA SLLNRVTPAA SPTILAAVSS60AQPGISSSAG ATWWTRALMR WARVLISPVS RMMSVSSARA SSATNPGWVS SQVRRACWCL120AASSERAAGA RSGSSSWTSQ RNRLIADVRW ATRTSRRSVN NFNSRDVSSW VARGRSVSRS180TARATASASI GSDLPRLRAD LRVWAISLVG TRTTCWPAAS RSRSRRADML RQSSMPQISS240RPNCSRAHMM AVACPAVVAL TVFSPSWRPT SSVATKVWLY LCASVPTTTM VVASEPPR298<212>类型PRT<211>长度298序列名SEQ ID 317GDC_MTUB_3796793序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VPDLLEFAAL GLRRKAVHDH ERDDGERAED RENACAAEHT QHGEREGGND RVGRQCRGEH60RARSHRPQPG REALRGVHPD QRAESEVEPD DEQQHAGEPQ HQPRATIGVV GEYGDQHGIC120GDHRRDAGQQ DRATAQPIDQ KQRGTHRRQA GDLHHRGQGK HREIAREAHG GEKSRTVVDD180RVDPGDLDEE AERDDEQRGP QIRPPHHFAD TAAAFVDRGR HIGQLGIDVG LRLDPPQRAT240RVGDPALEQI PAGGIGHAPQ QRQQQRGRRG GQPEHRAPAV RSGQQVADQV TDDDAAKRRQ300LIRGHQRPTH RRRRRLGHIH RHHHHRQADC HTQQQTRHHQ HRYGHRGRAE QGEHCVAGDD360EHHRFLASDR VGEDAAAKRP GDLAEHRRGG QQLLFSSGEF EFLAERQQRT RDGGKVVPVE420DADAGGGEPD EERPAPRSGQ LTGTGALSTS TTRSGSSGAP AGVNPASWYR AVVISMRLPQ480RRHAVNRWSS PDFGADQGRL GCPPANDAEG IGVSS515<212>类型PRT<211>长度515序列名SEQ ID 318GDC_MTUB_3879013序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链
VSDATTVLFG LPGARVERVE RRSDGTRVVD VITDEPTAAA CPSCGGGLDI SEGIRGYLTE60RSTLWRRPHH GALEQNSLAM PRRLLQAGAV HRGHHPGTCP RPQHAAAASA DGQGDRGCGP120LGGPRSPRLT PCRGRRHIGR LLPTPRRVLT EPLPTPVLGV DQTRRGKPRW ERCAKTGRWV180RVDPWDTGFV DLAGDQGFMG QHEGRGGAAV LAWLQARTPQ FRESIQYGGH RPRRCLRLGD240PHARAAAQRQ ARRRPLPCDH AGQRRADRGA PPGDLGVPRP ARPQDRPAVG QPTSLADRPG300TLVGQKLRQN AESDQRRRPP RADSLGLDRQ RGAAHPAVDR AHRRGPPPGA PSPTPLPAWR360IDSQIPELLT LATTID376<212>类型PRT<211>长度376序列名SEQ ID 319GDC_MTUB_3921024序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VQALPESQLP ELAVQMRRRL IETVTATGGH LGAGLGMVEL TIALHRVFTS PHDIGVRHRA60PNLSAQAAHR PR72<212>类型PRT<211>长度72序列名SEQ ID 320GDC_MTUB_3974481序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MSSEGGWPNV GNLARSASMT SAVSSSARVV WVRYDSWVPS GRFNAATSAG VCTNNVDRGA60TPSVPSVSSC PACPMKTTVS PRAANRAASA WTFATSGQVA STTCSPRSSA PARTAGETPC120AENTTTAPGG GGSGISSRSS TNTAPRSRNS ATTTVLCTIC LRTYTGPSAT SSTRLTVSIA180RSTPAQNDRG DANSTVTSPE AYPCATGPTN TSAISTPGDI SVATTRSGLG IAPHRAVPQ239<212>类型PRT<211>长度239序列名SEQ ID 321GDC_MTUB_3994808序列描述
序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LPGHRRGTSA SRVPGNRPRL RPSWPRRTPL ARPKTTGCAR STCSSRARAR AARPRSGRCR60PPAWRWARSR MSPPSRITVS GPPSAGASRR EDGSLHRTRH PQITAVAHRP RRWRPGLREA120SLPARPTRSR ADQGKRISAS AAGEAEGPFH IRRNGKAVPP LLRRGRAAAR QDG173<212>类型PRT<211>长度173序列名SEQ ID 322GDC_MTUB_3998938序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VGRRDRGAPA RPFSAHPQRR CLLAGQSQGc RRGIGLRPAR QHLVGGGSGG PGGAGELRRR60QGWHHRANPV GGAGARALRR LRQCDLSAGA HRDDGRCLRR RTRCRSGPDR PAVAAACGKP120GPVSGVPGCR GSQRSGVHRL RSAGDAGVTA AHGAPVQRGR HVLGSHRAHR DAAGLLCWSG180SGTELFGDRS DASVTRGYRR PIIGIGVRIT TPT213<212>类型PRT<211>长度213序列名SEQ ID 323GDC_MTUB_4021183序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LPWTACCSPY SNDNRTKPSP VKSATNSSPA RASTANVHDP GNTMSPLRSR TPKLSTLPAS60QATAVAGLPN TASLRPSATT SPLRVSFASI ALTSRSAGGT RAAPNTKPAA EALSAMVSQI120LICQSLILVS ISSMAGTRAS VAASTSSSVQ PAPGRSAARM KPTSTSTRGD RYRDAWTGVS180SNTCMSSSRC P191<212>类型PRT<211>长度191
序列名SEQ ID 324GDC_MTUB_4045946序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VVHSRRSWAP SRRPHRGIDA ANERAPAVPE QLTGDPDDRP AQIQQRGGPL DVPSPLRRVC60PMLWPVILDT DSQLLVAQVD AGDEVPVVVK HSDLCLRLRQ TGIDQHQSGP RLLWGFRTPV120DQRQHRTEAD QAARTGMFGN DGLHVGDLDI GRIRQRVQPL NGLQPRGCAP PDIEGGARRG180GYRDTVNRNR LVRRQSIRVH DDARRRLSIG VH212<212>类型PRT<211>长度212序列名SEQ ID 325GDC_MTUB_4053033序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VSRYPNSWRR LNNPDMAVPM LNRPVFKPLR TEPKRVPGTP MLPMPEVWPL MTVPPLAVLK60NPETSTAKGP VGVLKKPETS VPVLPKPELV RPLSVMIPKP VFTLPAFHEP VLMLPEFPLP120VLTLPELSNP VLTKPAFPKP VFNSPAFPKP VLRMLAFPKP VLRTPAFPKP MLALPEFPTP180RLLRSPGTRV LAPVLKTPML PLPELNKPML LVPELPMPIL PLPEFSSPAR LMPI234<212>类型PRT<211>长度234序列名SEQ ID 326GDC_MTUB_4140236序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LSSNHAILRL LAPLRLDPQN LGAGPQREHR HRQGRRHGAQ SQSGVLADAG VDVVPAQHAP60PQQVRQRTGI GQVGSDVDPE80<212>类型PRT
<211>长度80序列名SEQ ID 327GDC_MTUB_4169350序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LCQGVPARLP PATDTVGVVT KSAVPRVGLD VQIDYSLGDR PVPGHGTGTN QETCEAVCYG60AVRRFASGQA QGGDHLGWPG RHRARGRAAA RRPCCGGVQR HLSCVPAARA APAA114<212>类型PRT<211>长度114序列名SEQ ID 328GDC_MTUB_4170798序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MRPAKRAEEE PGNHPRAGCS GSPPSAPWRS QTPRLATMRP AKRAEEEPGN HPRAGCSGSP60PSAPWRSQTP RLATMRPAKR AEEEPGNHPR AGCSGSPPSA PWRSQTPRLA TMRPAKRAEE120EPGNHPRAGC SGSPPSAPWR SQTPRLATMR PAKRAEEEPG NHPRAGCSGS PLARPTTGSS180RRRRKIRQLS VRVKHAVHRT200<212>类型PRT<211>长度200序列名SEQ ID 329GDC_MTUB_4252190序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链MRTTIDLDDD ILRALKRRQR EERKTLGQLA SELLAQALAA EPPPNVDIRW STADLRPRVD60LDDKDAVWAI LDRG74<212>类型PRT
<211>长度74序列名SEQ ID 330GDC_MTUB_4260620序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VSRCRIHCRR LALSRQKTRS LPDLQLASRS GLRRLGCKMD VIRWARRLAV VAGTAAAVTT60PGLLSAHVPM VSAEPCPDVE VVFARGTGEP PGIGSVGGLF VDALRFPGWR QVTRGLRR118<212>类型PRT<211>长度118序列名SEQ ID 331GDC_MTUB_4302166序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VDACHSRARR GVVDRRRPRC GGTARGVVGI RAWAAPLHCG RSSDSGARAR ENSGRVAGTT60MLAVPVPDSA LRVAGSVLDQ AGPYLPFNTP FTAAGMQYYT QMPESDDSPS EKELGITYRD120PRDTVADTVT ALRGLGS137<212>类型PRT<211>长度137序列名SEQ ID 332GDC_MTUB_4317863序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链LMWKPRWRWC STASERRTTA SPDACRNVSR CRSPSLRLAG SGSPWHRMRS RSTAAMATSR60PGRWPGCCVT RKSTRSGRAP TTSCVWMCGA GSSRRALTRH CWRGCAMRCR CPTMTTPRGW120SRAALRTSTR RSPLGPNSTG SWPRRGCSRW PNSWATSTPA RCSPSRPPGN GQPAAPTARH180SSPACTRAGI SPTKARCAVS TQIAMRRCSV STNSWRARSL PSRRKSPQFV ALLTLPWVSL240CPE243
<212>类型PRT<211>长度243序列名SEQ ID 333GDC_MTUB_4341852序列描述序列<213>生物名结核分枝杆菌(Mycobacterium tuberculosis)-H37RV<400>前序列链VRAPATRAAS RGSSRNSDQR PSGRSVIPSR PSSSACQVCS GVFISPGKRV DKPTIAMSTR60SAGPVRDQSS ASSPARSVSG SPSMIRVASD SMVGCANATA TDSVTPVRSS MSAAIATASR120DDRPSSTMGT DSSIESGAFP TALPTQLRSH WRISGTVSSA LSAGAFSWDS ATSAMGPQSE180VAKTVGEPTP LRRLPSR197<212>类型PRT<222>长度197序列名SEQ ID 334GDC_MTUB_4391527序列描述序列<213>生物名Sars冠状病毒(Sars Coronavirus)<400>前序列链LHEDPHTGVE PGAVTAHRDC QHPRPACGDE PFNPACVLVR TDGPDDRKCE MTAIRFDAHR60SGRECHAVLI AAFLLEPGEA HCLALTFTGS GVLPVPVRID SAANAVGVSL FRALRPPHRP120GLGVDTHLVL DGVPPFTKHP QRRLDSPDTS NAPRLDIGFQ SSDRPVVGLA ASAEMPRQRA180GLVLGWVQRE PERLHTPAFW HLESGHQAAS ASPTAAARAR LAPFCAARSP230<212>类型PRT<211>长度230序列名SEQ ID 335GDC_Sars174_refseq序列描述序列<213>生物名Sars冠状病毒(Sars Coronavirus)<400>前序列链
LRPSRSTLIA KCASWRQPPR CLRSAAVNRR SSAPVAQREL RAENRPESRP QFTLGAVWPH60PVNVICAGGR WRVANPSGAG PPSTPRRGQL ISGYASATAP AMGCGRTRRI SPNTRMPSCR120AHLLKEGLRH LFSVKGEESK QALDRLIF148<212>类型PRT<211>长度148序列名SEQ ID 336GDC_Sars68_refseq序列描述序列<213>生物名Sars冠状病毒(Sars Coronavirus)<400>前序列链VHSASSVATP VRGSTLAGSA GPSTAVTMPA KPTCGATNCS TSMSPSRAAI TWRSPLRHTT60KRTMTPPMSR RHQRPSKVRS GLPRVSTISA TVGWGSPWRS STPCAVRSRC TCSQTMSRRS120SCGIFGRIPS VTGKSTRCNR SAITNMPSMV TSTPTTLSAV PARPAADGPV MINRKSCR178<212>类型PRT<211>长度178序列名SEQ ID 337GDC_Sars61_refseq序列描述序列<213>生物名Sars冠状病毒(Sars CoronaVirus)<400>前序列链MDRLCGAPLC HRRRGPTATA AQAGARRLHD PQQAPGRAVA GQLRPAGRAD RGAGRPGGSG60SGAPRPGRQP DHGGARHSGG PASRRGVALL EGAAARARPV VHRGGDNRAA VLVEITGEPL120AWESRQNGCG VLHSRRRRQR RDLEPPVRRR PRR153<212>类型PRT<211>长度153序列名SEQ ID 338GDC_Sars78_refseq序列描述
权利要求
1.一种鉴定用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法,所述方法包括以下步骤;a.用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;b.人工翻译该测试基因组获得每个读框的多肽;c.根据这些寡肽在肽文库的出现情况将每条多肽序列转变为字母数字式序列,其中每条序列对应于一个读框;d.用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;e.解密该测试基因组中的蛋白质编码区;和f.鉴定对大量用作功能标记物的已知基因作图的肽的较长延伸段。
2.如权利要求1所述的方法,其特征在于,所述人工神经网络具有一个或多个输入层、一个或多个具有数目不同的神经元的隐藏层和一个或多个输出层。
3.如权利要求1所述的方法,其特征在于,隐藏层中神经元的数目优选为30。
4.如权利要求1所述的方法,其特征在于,所述‘N’的值是4或更大。
5.如权利要求1所述的方法,其特征在于,所述S形(曲线)学习函数具有5种参数,包括总评分、平均值、零部分。最大连续性非零延伸段和方差。
6.如权利要求1所述的方法,其特征在于,所述鉴定基因的方法利用在其它基因组的ORF中发现的寡肽,所述基因组包括,但不限于流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的基因组。
7.如权利要求1所述的方法,其特征在于,所述肽文库可取自任何生物,但不特别限于本发明所用的生物。
8.用权利要求1所述方法鉴定的SEQ ID No 1-44所示流感嗜血菌的一组基因。
9.对应于用权利要求1所述方法鉴定的SEQ ID No 1-44所示流感嗜血菌基因的SEQ ID No 170-213所示的一组蛋白质。
10.用权利要求1所述方法鉴定的SEQ ID No 45-60所示幽门螺杆菌的一组基因。
11.对应于用权利要求1所述方法鉴定的SEQ ID No 45-60所示幽门螺杆菌基因的SEQ ID No 214-229所示的一组蛋白质。
12.用权利要求1所述方法鉴定的SEQ ID No 61-165所示结核分枝杆菌的一组基因。
13.对应于用权利要求1所述方法鉴定的SEQ ID No 61-165所示结核分枝杆菌基因的SEQ ID No 230-334所示的一组蛋白质。
14.用权利要求1所述方法鉴定的SEQ ID No 166-169所示SARS-冠状病毒的一组基因。
15.对应于用权利要求1所述方法鉴定的SEQ ID No 166-169所示SARS-冠状病毒基因的SEQ ID No 335-338所示的一组蛋白质。
16.对应于SEQ ID No 1-169所示基因的SEQ ID No 170-338所示蛋白质作为药物靶点在防治需要这种防治对象的病原生物所致疾病中的应用。
17.如权利要求16所述的应用,其特征在于,所述病原生物选自SARS-冠状病毒、流感嗜血菌、结核分枝杆菌和幽门螺杆菌。
18.如权利要求16所述的应用,其特征在于,所述应用扩展至真核生物和多细胞生物。
19.如权利要求16所述的应用,其特征在于,所述对象是动物。
20.如权利要求16所述的应用,其特征在于,所述对象是人。
全文摘要
本发明涉及一种利用特别开发的软件GeneDecipher鉴定基因组中可用作药物靶点的蛋白质编码DNA序列(基因)的通用方法,所述方法包括用计算机处理字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得对应于每个读框的多肽;根据与肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中每条序列对应于一个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练为字母数字式序列;解密该测试基因组中的蛋白质编码区;从而鉴定对大量已知基因作图的肽的较长延伸段和它们对应的蛋白质;最后本发明涉及防治病原生物导致疾病的方法,包括通过抑制一种或多种本发明步骤鉴定到的蛋白质功能来评价提出的候选药物。
文档编号G01N33/50GK1914616SQ200480040837
公开日2007年2月14日 申请日期2004年1月9日 优先权日2003年12月5日
发明者S·K·布拉马查里, D·达舍, R·沙尔马, J·K·马赫施瓦瑞 申请人:科学工业研究委员会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1