用于多肽的表达和分泌的果胶酸裂解酶融合体的制作方法

文档序号:3573899阅读:725来源:国知局
专利名称:用于多肽的表达和分泌的果胶酸裂解酶融合体的制作方法
技术领域
本发明涉及利用微生物通过融合蛋白的表达而生产多肽。更具体地,本发明涉及一种能改进融合蛋白的生产的细胞,所述融合蛋白包含与外源多肽融合的天然果胶酸裂解酶,本发明还涉及产生所述融合蛋白和/或所述多肽的方法。
背景技术
蛋白质或多肽目前通过多种方式进行工业化生产,所有方式均涉及能产生该蛋白质的微生物的培养。多种使蛋白质的工业化产量最佳化的方法为本领域已知,并已常规应用,如对培养基进行操作,通过例如突变来改变微生物,使诸如启动子和信号序列等能影响编码所需蛋白的基因表达的遗传元件发生变异,以及对基因本身进行操作以便例如增强蛋白质的稳定性或提高活性。
融合蛋白已被描述为生产用其它方法难以获得的蛋白质的一种途径,这些蛋白质如活性人类抗体(Goshorn,S.C.等,癌症研究,(1993)第53卷(9),第2123-2127页)。
本发明的目的是提高一种利用微生物以高产量生产多肽的方法。
发明简述本发明人鉴定了一种芽孢杆菌果胶酸裂解酶,该酶能以较高产量产生,其由分离的第一DNA片段编码,该DNA片段可与编码外源多肽的第二DNA片段融合在一个开放读码框中,该融合DNA序列编码能在适当条件下以较高产量产生的融合蛋白。
本发明人还发现,特定氨基酸序列可在导入果胶酸裂解酶与外源多肽之间后作为蛋白酶剪切的靶位点。
相应地,本发明第一方面涉及一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽。
本发明人还成功地在果胶酸裂解酶与外源多肽之间导入了一个氨基酸接头,其在特定环境中增强融合蛋白的稳定性。
相应地,本发明第二方面涉及一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,含至少2个氨基酸的接头,用于蛋白酶剪切的靶位点,和外源多肽。
本发明第三方面涉及产生蛋白质的方法,该方法包括以下步骤i)构建合适的细胞,其包含一种能编码融合在一个开放读码框(ORF)内的至少以下依次排列之元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽,ii)在适于生长和分泌的条件下培养步骤i)所构建的细胞,iii)回收所述蛋白,和iv)任选在所述靶位点切割该蛋白。
通过利用本发明的细胞或方法,有可能以较高产量产生所需外源多肽如激素,功能型激素类似物,酶和人工多肽,从而使生产更经济,甚至对特定多肽而言使这类所需多肽的实际利用更经济可行。
附图简述在所附图中

图1显示Western印迹,其放大了如实施例2所述融合多肽果胶酸裂解酶-ASKR-GLP1(7-37)的表达。图注泳道1果胶酸裂解酶-ASKR-GLP1(7-37)的芽孢杆菌培养物;泳道2GLP1标准品100mg/l;图2显示Western印迹,其放大了如实施例2所述融合多肽果胶酸裂解酶-ASKR-GLP1(7-37)的表达。图2的图注泳道1纯化的果胶酸裂解酶-ASKR-GLP1(7-37)的10倍稀释液;泳道2MI3(12.5mg/l)与GLP1(25mg/l)的混合标准品;图3显示Western印迹,其放大了如实施例3所述枯草芽孢杆菌培养物对融合多肽果胶酸裂解酶-AS-PEPTPEPTKR-GLP1(7-37)的表达。图3的图注泳道1培养物(对照);泳道2GLP1标准品(100mg/l);泳道3GLP1标准品(50mg/l);泳道4GLP1标准品(25mg/l);和图4显示Western印迹,其放大了如实施例4所述融合多肽果胶酸裂解酶-AS-PEPTPEPTKR-MI3的表达。图4的图注泳道1MB1009-1(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道2MB1009-1(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道3MB1009-4(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道4MB1009-4(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道5MB1009-7(阴性对照);泳道6MB1009-7(阴性对照);泳道7MB1009-7(阴性对照);泳道8标准MI3,50mg/l;泳道9标准MI3,25mg/l;泳道10标准MI3,12.5mg/l。
图5显示Western印迹,其放大了如实施例5所述融合多肽果胶酸裂解酶-ASKR-GLP1(7-37)的表达以及Kex2p-裂解而对GLP1(7-37)的释放。图5的图注泳道1果胶酸裂解酶-ASKR-GLP1(7-37)的芽孢杆菌培养物用Kex蛋白酶处理;泳道2果胶酸裂解酶-ASKR-GLP1(7-37)的芽孢杆菌培养物;泳道3GLP1标准品(12.5mg/l);泳道4GLP1标准品(25mg/l);泳道5GLP1标准品(50mg/l)。
定义讨论本发明的详细实施方案之前,先就与本发明主要方面相关的特殊术语进行限定。
本文中术语“细胞”或“菌株”指单个活细胞或由单个活细胞的营养生长所得的活细胞群体。
本文中术语“DNA序列”或“DNA片段”或“DNA元件”指4种碱基腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、和胞嘧啶(C)在由序列或片段或元件所定性的特异性脱氧核糖核酸(DNA)链中的依次排列。
本文中术语“基因”或“开放读码框”指可在细胞内表达为多肽或蛋白质的DNA链。相应地,所述基因或开放读码框被限定为始于起始密码子(通常为“ATG”、“GTG”、或“TTG”)而止于终止密码子(通常为“TAA”、“TAG”、或“TGA”)。
本文中术语“多肽”或“蛋白质”指由RNA聚合酶将开放读码框或基因转录为信使RNA,然后由核糖体通过依次添加氨基酸并将它们用肽键相连而进一步翻译,最终所得的表达产物;此过程即本领域的“中心法则”。
本领域已知为了表达基因,该基因必需与一些元件相连,这些元件为该基因在细胞内表达所必需。这类标准元件可包括启动子,核糖体结合位点,终止序列,以及本领域已知的其它元件。
本文中,当至少两个基因及可能还有其它DNA元件连接在一起形成一个开放读码框,且这些元件以与列举它们相同的顺序表达在一个多肽中时,称这些元件“依次融合”,而该多肽则称为“融合多肽”或“融合蛋白”。
术语“果胶”指果胶酸,聚半乳糖醛酸,以及可以酯化至更高级或更低级的果胶。
本文中术语“果胶酶”指能切割果胶(pectic)物质,主要是聚(1,4-α-D-半乳糖醛酸酐及其衍生物(参见Sakai等,果胶、果胶酶和原果胶酶生产、特性及应用,在《应用微生物学进展(Advances in Applied Microbiology)》第39卷,第213-294页,1993)的糖苷键的果胶酶。
术语“果胶酸裂解酶”指能通过转移消除作用催化果胶酸(也称为聚半乳糖醛酸)中α-1,4-糖苷键随机裂解的果胶酶,如聚半乳糖醛酸裂解酶(EC4.2.2.2)(PGL)一类,也称为聚(1,4-α-D-半乳糖醛酸酐)裂解酶,还指已经通过本领域技术人员已知的任何方式改变了的果胶酸裂解酶,所述方式如氨基酸缺失、插入或取代、C末端和/或N末端截短但仍保留上述催化活性。
术语“α-淀粉酶”指能催化寡糖和多糖中1,4-α-葡糖苷键内切水解的酶, 即根据酶学命名法数据库归类为EC 3.2.1.1的酶(http//www.expasy.ch/enzyme/)。
本文中术语“功能型激素类似物”指天然肽激素的衍生物,其通过本领域任何标准方法改变后仍保留了天然激素的生物学活性,所述方法如氨基酸缺失、插入或取代、C末端和/或N末端截短。功能型激素类似物的一个具体实例是人类GLP-1(7-37),其包含SEQ ID 14中348-378位或SEQ ID16中356-386位所示氨基酸序列。
术语“单链人类胰岛素(MI3)”指由SEQ ID 18所示氨基酸序列限定的原胰岛素类似物。该蛋白序列公开在国际专利申请WO 95/34666中,其全文引入作为参考。
术语“核心酶”指一种单结构域酶,其可能已经或尚未被修饰或改变,但其保留了最初的活性;该催化结构域如本领域已知的那样保持完整无损并具有功能。
本文中术语“用于蛋白酶剪切的靶位点”指由蛋白酶识别并被该蛋白酶酶解或通过化学化合物处理而裂解(分子生物学最新方案(Currentprotocols in Molecular Biology)(John Wiley & Sons,1995;Harwood,C.R.,和Cutting,S.M.编))的氨基酸序列。
本文中术语“外源”当与细胞一词连用时指由于所述细胞中外来基因(即已插入所述细胞且在该细胞中并非天然存在的基因)的存在而由该细胞产生的多肽。
与此相反,本文中术语“天然”或“内源”当与特定微生物来源连用时,指由于特定来源中天然基因(即并未重组插入该来源的细胞而是其中天然存在的基因)的存在而由该来源产生的多肽。
术语“接头”或“间隔臂”指含有至少两个氨基酸的多肽,其可能出现在一种多结构域蛋白(如含有核心酶以及结合结构域如纤维素结合结构域(CBD)的酶或任何其它酶杂合体)的结构域之间,或出现在表达为融合多肽(如含有两种核心酶的融合蛋白或作为一个整体出现在本发明的细胞中的融合蛋白)的两种蛋白或多肽之间。例如,可通过将编码第一核心酶的DNA序列、编码接头的DNA序列和编码第二核心酶的DNA序列依次融合在一个开放读码框中并表达该构建体,从而提供两种核心酶的融合蛋白。接头还可包含用于蛋白酶剪切的靶位点。
发明详述细胞本发明的细胞优选革兰氏阳性细胞,更优选芽孢杆菌细胞,甚至更优选选自下组的细胞地衣芽孢杆菌(Bacillus licheniformis)、Bacillus clausii、短芽孢杆菌(Bacillus brevis)、解淀粉芽孢杆菌(Bacillus amyloliguefacienss)、枯草芽孢杆菌(Bacillus subtilis)、迟缓芽孢杆菌(Bacillus lentus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、嗜碱芽孢杆菌(Bacillus alkalophilus)、凝固芽孢杆菌(Bacillus coagulans)、环状芽孢杆菌(Bacillus circulans)、灿烂芽孢杆菌(Bacillus lautus)、苏云金芽孢杆菌(Bacillus thuringiensis)、和Bacillusagaradhaerens。
果胶酸裂解酶由本发明的方法产生的、作为融合蛋白一部分的果胶酸裂解酶优选选自以下果胶酸裂解酶,它们含有选自SEQ ID 2,SEQ ID 4,SEQ ID 6,SEQ ID8,SEQ ID 10的氨基酸序列,和具有与SEQ ID 2,SEQ ID 4,SEQ ID 6,SEQID 8和SEQ ID 10中任何一个至少70%的氨基酸序列相似性的氨基酸序列。
示于SEQ ID 2(其相应DNA序列示于SEQ ID 1)并已证实十分有利于天然酶所结合的多肽异源表达的果胶酸裂解酶与其它四种果胶酸裂解酶密切相关。
那四种果胶酸裂解酶的完整DNA序列示于SEQ ID 3,SEQ ID 5,SEQID 7,和SEQ ID 9。它们在此作为可用作融合配对物以便在芽孢杆菌细胞中表达外源多肽的其它果胶酸序列的实例。这些序列公开在WO 99/27084中。
可将果胶酸裂解酶蛋白序列最小化至某种程度而仍维持其在融合蛋白表达中使用时的有利特性。这种对DNA序列以及因此对所编码的蛋白质序列的最小化可通过分子生物学领域已知的任何方法实现。
其中一个方法是,设计特异性PCR引物,通过PCR构建与目标蛋白融合的果胶酸裂解酶的截短形式,并检验这种新构建体的表达水平。这类构建体可缺失果胶酸裂解酶C末端的一部分,果胶酸裂解酶N末端的一部分,或二种末端都缺失。另一种方法是,用内切核酸酶处理果胶酸裂解酶编码序列,使得编码果胶酸裂解酶C末端的部分被降解至各种程度。携与目标肽融合之果胶酸裂解酶的不同长度N末端部分的克隆组成一个文库,可在该文库中以鉴定最佳表达构建体的方式筛选这些克隆的表达能力。该方法也可应用于果胶酸裂解酶融合构建体,使得果胶酸裂解酶N末端的部分或N末端及C末端均缺失,从而使融合蛋白得到最佳表达。
酶解位点在本发明的一个优选实施方案中,用于蛋白酶剪切的靶位点是由蛋白酶识别并裂解的氨基酸序列。
文献中已描述了数种经策略性定位而能促进融合产物有效裂解的氨基酸序列。这些策略大多数涉及在亲本酶与目标肽之间的接头区中定点进行蛋白酶剪切(Polyak等(1997)蛋白质工程,第10卷(6),第615-619页;Kjeldsen等(1996)基因,笫170卷,第107-112页;Sun等(1995)蛋白表达和纯化,卷6(5),第685-692页;Martinez等(1995)生物化学杂志,第306卷(第2部分)第589-597页)。
为了确保有效裂解,可在亲本酶(本例为果胶酸裂解酶)与外源多肽(编码位点特异性蛋白酶的识别位点)之间插入氨基酸序列。文献中已描述了识别位点和蛋白酶的多种组合。以下我们将显示来自酿酒酵母(Saccharomycescerevisiae)α细胞的Kex2基因编码的膜结合蛋白酶。Kex2蛋白酶能水解具有碱性氨基酸对的肽和蛋白质,在其肽键的C末端裂解(Bessmertnaya等(1997)生物化学,第62卷(8)第850-857页)。在第一和第二方面的一个优选实施方案中,Kex2裂解位点为Lys-Arg(K-/-R)序列,但可插入碱性氨基酸的其它组合从而使Kex2的裂解最优化(Ledgerwood等,(1995)生物化学杂志,卷308(1)321-325;或Ghosh,S.等(1996)基因(AmsterDNA),卷176(1-2)249-255)。
蛋白酶和裂解位点的其它有效组合是优先裂解氨基酸序列X-D-D-D-K-/-X的肠激酶(La Vallie等(1993)生物学化学杂志,第268卷第2311-2317页),优先裂解氨基酸序列X-K-R-/-X的胰蛋白酶(Jonasson等(1996)欧洲生物化学杂志,卷236(2)656-661),优先裂解氨基酸序列X-I-E-G-R-/-X的Xa因子(Nagai等(1985)PNAS,第82卷第7252-7255页),优先裂解氨基酸序列P-X-/-G-P-X-X的胶原酶(Chinery等(1993)欧洲生物化学杂志,卷212(2)557-553),优先裂解氨基酸序列X-G-V-R-G-P-R-/-X的凝血酶(Rahman等(1992)细胞分子生物学,卷38(5)529-542),优先在赖氨酸处裂解的ALP(水解无色杆菌(Achromobacter lyticus)的Lys特异性蛋白酶)(Kjeldsen等(1996)基因,卷170(1)107-112),以及地衣芽孢杆菌的在Glu处裂解的C-组分蛋白酶(Kakudo等(1992)生物学化学杂志,卷267(33)23782-23788)。
另一种在特异性靶位点裂解肽的优选方法是利用化学化合物如能裂解X-M-/-X的溴化氰或能裂解S-N-/-G-X的羟胺(分子生物学最新方案,JohnWiley & Sons,1995;Harwood,C.R.,和Cutting,S.M.编)。
接头在本发明一个优选实施方案中,由本发明方法产生的融合蛋白在果胶酸裂解酶与外源多肽之间插入了一个接头。优选地,该接头包含以下氨基酸序列,该序列中至少25%的氨基酸为脯氨酸。更优选地,该接头包含以下次序的氨基酸的至少一个循环重复Pro-Glu-Pro-Thr(PEPT,EPTP,PTEP或TPEP),更优选该接头包含氨基酸序列Ile-Glu-Gly-Arg(IEGR)的至少一个重复。
外源多肽通常,外源多肽是本发明方法的目标产物。外源多肽可以是能作为由本发明方法产生的融合多肽的一部分而成功表达的任何多肽。
在本发明的一个优选实施方案中,外源多肽选自激素、功能型激素类似物、酶和人工多肽。
人工多肽的一个实例是单链人类胰岛素(MI3),优选包含SEQ ID 18所示氨基酸序列(其由SEQ ID 17所示密码子最优化型人工序列编码)的胰岛素。所述外源多肽甚至可能是包含携SEQ ID 20中356-408位所示氨基酸序列的单链人类胰岛素(MI3)的多肽;或单链人类胰岛素(MI3)的包含SEQ ID42中366-418位所示氨基酸序列的MW变体。
据认为激素可以是本领域已知的任何肽激素,如人类GLP1的全长氨基酸序列。
功能型激素类似物的一个实例是人类GLP-1(7-37)激素类似物,优选包含SEQ ID 14中348-378位或SEQ ID 16中356-386位所示氨基酸序列的类似物。
酶的一个实例是α-淀粉酶。优选的α-淀粉酶包括美国专利5003257;EP 252666;WO/9I/00353;FR 2676456;EP 285123;EP 525610;EP 368341;和英国专利说明书1296839(Novo)所公开的那些。
其它淀粉酶有WO94/18314和WO 96/05295所述的稳定性增强型淀粉酶和在WO 95/10603中所公开的直接亲本的具有额外修饰的第二代变体。EP 277216,WO 95/26397和WO 96/23873中所述的淀粉酶也合适。
在本发明的一个优选实施方案中,所述α-淀粉酶包含SEQ ID 12中350-834位所示的氨基酸序列。
市售α-淀粉酶产物有来自Genencor的Purafect Ox Am和来自丹麦的Novo Nordisk A/S的Termamyl,Ban,Fungamyl和Duramyl。WO95/26397描述了其它合适的淀粉酶通过Phadebasα-淀粉酶活性试验测得在25-55℃,pH8-10的条件下,比活性比Termamyl高至少25%的α-淀粉酶。上述酶的变体也合适,它们述于WO 96/23873。其它在活性水平方面具有改良特性的淀粉分解酶,和即具有稳定性又具有较高活性的淀粉裂解酶述于WO 95/35382。
可由本发明方法产生的优选的淀粉酶有,以商标名Termamyl,Duramyl和Maxamyl出售的淀粉酶,包含SEQ ID 12中350-834位所示氨基酸序列的JP170淀粉酶,和或证实稳定性已增加的、如WO 96/23873中SEQ ID 2所公开的α-淀粉酶变体。
产生蛋白质的方法该方法中一个基本要素是本文所述细胞的应用。能产生所述蛋白的细胞的特异性构建和培养可以是本领域的任何标准方案(Maniatis,T.Fritsch,E.F.,Sambrook,J.“分子克隆实验室手册”,冷泉港实验室,1982;Ausubel,F.M.等(编),“分子生物学最新方案”,John Wiley & Sons,1995;Harwood,C.R.,和Cutting,S.M.(编)“芽孢杆菌分子生物学方法”,John Wiley & Sons,1990)。
相似地,第三方面第iii)项所述蛋白的特异性分离策略可以是本领域技术人员已知的任何分离方案;该分离方案可能包括在如本领域已知的那样进行分离之前或之后以任意多种方式对所述蛋白进行蛋白酶解。
本发明进一步通过以下非限制性实施例举例说明。
材料和方法菌株和供体生物地衣芽孢杆菌ATCC14580包含SEQ ID 1所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 11789包含一种质粒,该质粒携有本发明SEQ ID 1所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 12403包含一种质粒,该质粒携有本发明SEQ ID 3所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 12404包含一种质粒,该质粒携有本发明SEQ ID 5所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 11788包含一种质粒,该质粒携有本发明SEQ ID 7所示DNA序列编码的果胶酸裂解酶。
芽孢杆菌KJ59菌株(DSM 12419)包含SEQ ID 9所示DNA序列编码的果胶酸裂解酶。
枯草芽孢杆菌PL1801。该菌株是携有中断的apr和npr基因的枯草芽孢杆菌DN1885(Diderichsen,B.,Wedsted,U.Hedegaard,L.Jensen,B.R.,Sjholm,C.(1990),对编码短芽孢杆菌胞外酶α-乙酰乳酸脱羧酶的aldB的克隆,细菌学杂志,172,4315-4321)。
枯草芽孢杆菌WB600。该菌株是有6个主要蛋白酶缺失的枯草芽孢杆菌。Wu,X-C.,S-C.Ng,R.I.Near,和S-L.Wong,1993,通过工程化枯草芽孢杆菌表达分泌系统有效产生功能性单链抗地高辛抗体,生物/技术,1171-76。
枯草芽孢杆菌WB600asn。该菌株是amyE基因已被四环素标记中断的WB600菌株。此外,WB600中的氯霉素标记基因已被新霉素标记取代。该菌株抗四环素、新霉素、链霉素和博莱霉素。
枯草芽孢杆菌PL2306。该菌株是具有已被破坏的apr和npr基因的枯草芽孢杆菌DN1885(Diderichsen,B.,Wedsted,U.Hedegaard,L.Jensen,B.R.,Sjholm,C.(1990),对编码短芽孢杆菌胞外酶α-乙酰乳酸脱羧酶的aldB的克隆,细菌学杂志,172,4315-4321),其中已知的枯草芽孢杆菌纤维素酶基因的转录单位中有破坏,导致产生纤维素阴性细胞。所述破坏基本如(A.L.Sonenshein,J.A.Hoch和Richard Losick编(1993),枯草芽孢杆菌和其它革兰氏阳性细菌,美国微生物学协会,第618页)所述进行。
感受态细胞如Yasbin,R.E.,Wilson,G.A.和Young,F.E.(1975)枯草芽孢杆菌溶原性菌株中的转化和转染在感受态细胞中选择性诱导噬菌体的证据,细菌学杂志,121296-304所述进行制备和转化。
质粒pSJ1678(参见WO 94/19454,其已全文引入作为参考)。
pMOL944该质粒为pUB110的衍生物,其主要包含能使其在枯草芽孢杆菌中增殖的元件,卡那霉素抗性基因并具有克隆自地衣芽孢杆菌ATCC 14580的amyL基因的强启动子和信号肽。该信号肽包含一个SacII位点,使得可方便地对与该信号肽融合为一体的蛋白的成熟部分之编码DNA进行克隆。这导致可转移至细胞外的前蛋白的表达。
质粒用常规遗传工程技术构建,简述如下。
pMOL944的构建用唯一限制性酶NciI消化pUB110质粒(Mckenzie,T.等,1986,质粒1593-103)。由质粒pDN1981(P.L.Jrgensen等,1990,基因,96,第37-41页)上的amyL启动子扩增的PCR片段用NciI消化并插入用NciI消化的pUB110以产生质粒pSJ2624。
所用的两种PCR引物具有以下序列#LWN5494(SEQ ID 21)5’-GTCGCCGGGGCGGCCGCTATCAATTGGTAACTGTATCTCAGC#LWN5495(SEQ ID 22)5’-GTCGCCCGGGAGCTCTGATCAGGTACCAAGCTTGTCGACCTGCAGAATGAGGCAGCAAGAAGAT引物#LWN5494(SEQ ID 21)在所述质粒中插入了一个NotI位点。
质粒pSJ2624然后用SacI和NotI消化,由pDN1981上amyL启动子扩增的新PCR片段用SacI和NotI消化,将该DNA片段插入用SacI-NotI消化的pSJ2624中,产生质粒pSJ2670。
该克隆取代了与相同启动子一起克隆但方向相反的第一amyL启动子。用于PCR扩增的两种引物具有以下序列#LWN5938(SEQ ID 23)5’-GTCGGCGGCCGCTGATCACGTACCAAGCTTGTCGACCTGCAGAATGAGGCAGCAAGAAGAT#LWN5939(SEQ ID 24)5’-GTCGGAGCTCTATCAATTGGTAACTGTATCTCAGC质粒pSJ2670用限制酶PstI和BclI消化,由编码碱性淀粉酶SP722(公开于国际专利申请WO 95/26397,其已全文引入作为参考)的克隆化DNA序列扩增的PCR片段用PstI和BclI消化并插入以产生质粒pMOL944。用于PCR扩增的两种引物具有以下序列#LWN7864(SEQ ID 25)5’-AACAGCTGATCACGACTGATCTTTTAGCTTGGCAC#LWN7901(SEQ ID 26)5’-AACTGCAGCCGCGGCACATCATAATGGGACAAATGGG引物#LWN7901(SEQ ID 26)在所述质粒中插入了一个SacII位点。
质粒pMB541(构建如下)供体菌株的增殖将地衣芽孢杆菌菌株ATCC 14580在ATCC(美国典型培养物保藏中心,USA)所特指的液体培养基3中培养。以37℃、300rpm培养18小时后,收获细胞,用下述方法分离基因组DNA。
基因组DNA制备如上述在液体培养基中培养所述地衣芽孢杆菌菌株。收获细胞,用Pitcher等所述方法[Pitcher,D.G.,Saunders,N.A.,Owen,R.J;用异硫氰酸胍快速提取细菌基因组DNA;应用微生物学通信(Lett Appl Microbiol)1989 8151-156]分离。
pMB541的构建。
克隆地衣芽孢杆菌的果胶酸裂解酶地衣芽孢杆菌菌株ATCC 14580的基因组DNA用限制酶Sau3A进行部分消化,通过在0.7%琼脂糖凝胶上电泳而进行分级分离。大小介于2-7kb之间的片段通过在DEAE-纤维素滤纸上的电泳而分离(Dretzen,G.,Bellard,M.,Sassone-Corsi,P.,Chambon,P(1981),一种从琼脂糖和聚丙烯酰胺凝胶中回收DNA片段的可靠方法,生物化学年鉴,112,295-298)。
将所分离的DNA片段连接至已用BamHI消化的pSJ1678质粒DNA中,用此连接混合物转化大肠杆菌SJ2。将来自地衣芽孢杆菌ATCC14580的基因组文库的已转化细胞铺板于包含10μg/ml氯霉素和0.7%聚半乳糖醛酸钠(SIGMA P-1879)的LB琼脂平板上,37℃培养16小时。
将菌落影印至含10μg/ml氯霉素和0.7%聚半乳糖醛酸钠(SIGMA P-1879)的新鲜LB琼脂平板上,37℃培养8小时。将起始主平板用5ml 1MCaCl2淹没,5-30分钟后在假定的聚半乳糖醛酸钠降解克隆周围出现明显的云雾状环。取主平板上的相应克隆进行进一步鉴定。即,从大肠杆菌在TY液体培养基上30℃过夜培养所得的克隆制备质粒DNA,并用Qiagen QiaspinPrep试剂盒按厂商建议(Qiagen,德国)制备质粒DNA,以便进一步鉴定所述克隆。
地衣芽孢杆菌ATCC 14580基因库中的果胶酸裂解酶阳性克隆以DSM11789的名义进行保藏。在对大肠杆菌DSM 11789的质粒进行了引物步行试验后,鉴定出地衣芽孢杆菌ATCC 14580中编码果胶酸裂解酶的DNA的序列SEQ ID 1。
利用活性鉴定阳性克隆平板培养后,将菌落影印至一组LB+6 CAM琼脂平板上,然后再于37℃培养约20小时。将含有1%HSB琼脂糖、0.37%聚半乳糖醛酸钠的适当缓冲液上层倾注在这些影印平板上,40℃培养约20小时。用5ml 1M CaCl2沉淀,5-30分钟后,在存在果胶酸裂解酶阳性克隆之处出现透明环(clearhalo),由此可鉴定果胶酸裂解酶阳性菌落。
果胶酸裂解酶阳性菌落的细胞通过在琼脂上划线分离而分出单菌落,针对所鉴定的每一果胶酸裂解酶生产菌落筛选产果胶酸裂解酶的单菌落。
阳性克隆的鉴定从再划线接种的平板上获得果胶酶阳性克隆的单菌落,用QiagenPlasmid Prep按厂商建议(Qiagen,德国)提取质粒。表型通过大肠杆菌SJ2的再次转化而证实,质粒通过限制性消化来鉴定。
地衣芽孢杆菌ATCC 14580基因库中的果胶酸裂解酶阳性克隆以DSM11789的名义进行保藏。在对大肠杆菌DSM 11789的质粒进行了引物步行试验后,鉴定出地衣芽孢杆菌ATCC 14580中编码果胶酸裂解酶的DNA的序列SEQ ID 1。
枯草芽孢杆菌的再克隆编码本发明果胶酸裂解酶的成熟部分(由氨基酸序列SEQ ID 2表示,其编码DNA序列如SEQ ID 1中所示)的DNA用含有以下两种寡核苷酸的PCR引物对进行PCR扩增Pecl.B.lich.upper.SacII(SEQ ID 27)5’-CTA ACT GCA GCC GCG GCA GCT TCT GCC TTA AAC TCGGGCPecl.B.lich.lower.NotI(SEQ ID 28)5’-GCG TTG AGA CGCGCG GCC GCT GAA TGC CCC GGA CGTTTC ACCSacII和NotI的限制性位点均已下划线。
用上述地衣芽孢杆菌ATCC 14580的染色体DNA为模板,用AmplitaqDNA聚合酶(Perkin Elmer)根据厂商建议,在含dNTP各200μM、AmpliTaq聚合酶(Perkin Elmer,Cetus,美国)2.5个单位以及每种引物各100pmol的PCR缓冲液(10mM Tris-HCl,pH8.3,50mM KCl,1.5mM MgCl2,0.01%(w/v)明胶)中进行PCR反应。
PCR反应用DNA热循环仪(Landgraf,德国)进行。94℃保温1分钟,然后以94℃30秒的变性、60℃1分钟的退火、72℃2分钟的延伸进行30个循环。所扩增产物取5μl在0.7%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。1.0kb的DNA片段的出现表示对基因片段的扩增是正确的。
对PCR片段的再克隆对PCR片段的再克隆如实施例1所述进行,不同的是所纯化的PCR片段用SacII和NotI消化。保留一个包含果胶酸裂解酶基因的克隆,将其命名为MB541,MB541中的质粒因此命名为pMB541。
对应于果胶酸裂解酶成熟部分的DNA通过引物步行法进行DNA测序来鉴定,其中使用Taq脱氧末端化循环测序试剂盒(Perkin-Elmer,美国),荧光标记的终止子,并使用相应寡核苷酸作为引物。
对序列数据的分析如Devereux等(1984),核酸研究12387-395所述进行。克隆化DNA序列在枯草芽孢杆菌中表达,出现在上清中的蛋白对应于SEQ ID 1所示的成熟蛋白。
普通分子生物学方法除非另外指明,DNA操作和转化用分子生物学的标准方法进行(Sambrook等(1989)分子克隆实验室手册,冷泉港实验室,冷泉港,纽约;Ausubel,F.M.等(编)“分子生物学最新方案”,John Wiley & Sons,1995;Harwood,C.R.& Cutting,S.M.(编)“芽孢杆菌分子生物学方法”,John Wiley &Sons,1990)。
用于DNA操作的酶根据厂商说明使用(如,限制性内切核酸酶、连接酶等均得自New England Biolabs公司)。
培养基TY(如Ausubel,F.M.等(编)“分子生物学最新方案”,John Wiley &Sons,1995所述)。LB琼脂(如Ausubel,F.M.等(编)“分子生物学最新方案”,John Wiley & Sons,1995所述)。LBPG是添加了0.5%葡萄糖和0.05M磷酸钾的LB琼脂(pH7.0)。BPX培养基如EP 0506780(WO 91/09129)所述。CAL18-2培养基(1L)酵母提取物(#0127-17-9 Difco实验室,MI,美国)40g;硫酸镁(#5886 Merck,Darmstadt,德国)1.3g;Glucidex 12(Roquette Feres,法国)50g;磷酸二氢钠(#6346 Merck,Darmstadt,德国)20g;EDF-痕量金属(配方如下)6.7ml;Na2MoO4-痕量金属(配方如下)6.7ml;Pluronic PE6100(BASF,德国)0.1ml;用离子交换水调整至1000ml。混合所有物质,调整体积,测量pH并用NaOH将pH调整至6.0。该培养基通过121℃20分钟高压灭菌。EDF-痕量金属(1L)硫酸锰(II)(#5963 Merck,Darmstadt,德国)4.48g;氯化铁(III)(#3943 Merck,Darmstadt,德国)3.33g;硫酸铜(II)(#2790Merck,Darmstadt,德国)0.625g;硫酸锌(#8883 Merck,Darmstadt,德国)7.12g;用离子交换水调整至1000ml。混合所有物质,调整体积。将溶液用滤膜过滤除菌,于4℃保存。Na2MoQ4-痕量金属(1L)钼酸钠(#6521 Merck,Darmstadt,德国)2.0g;用离子交换水调整至1000ml。混合所有物质,调整体积。将溶液过滤除菌,于4℃保存。
α-淀粉酶活性试验α-淀粉酶活性通过用4,6-亚乙基(G7)-对硝基苯(G1)-α,D-麦芽糖庚苷(亚乙基-G7PNP)作为底物(Boehringer Mannheim,Germany art.1442309)经酶比色检验来测定。在特定条件(温度、pH、反应时间、缓冲条件)下,1mg指定的α-淀粉酶将水解特定量的底物并产生黄色。在405nm处测量颜色强度。所测吸光度与目标α-淀粉酶在所给条件下的活性直接成比例。
SDS-PAGE和免疫印迹在Novex(Novex,San Diego)梯度Tricine 10-20%凝胶上进行变性和还原条件(在别处所述(SvH))下的SDS-PAGE。用Hoefer印迹仪将蛋白带印迹至硝酸纤维素膜上。为了对果胶酸裂解酶-胰岛素融合蛋白进行免疫印迹,使用产生于House of Ivan Svendsen,Cell Technology的单克隆抗体F19作为第一抗体,用偶联了过氧化物酶的兔抗鼠抗体作为第二抗体(来自DakoImmunoglobulins,Copenhagen,丹麦)。
对果胶酸裂解酶-GLP1的免疫印迹分别用第一抗体(产生于house of PiaKirschhoff Borre,Cell Technology的单克隆αGLP 26.1)进行。与过氧化物酶标记的第二抗体的结合通过与3-氨基-9-乙基咔唑的反应来显示。
实施例1果胶酸裂解酶与JP170α-淀粉酶的融合蛋白的构建和表达JP170α-淀粉酶的编码DNA序列(公开于国际专利申请WO95/26397,其已全文引入作为参考)用以下两种寡核苷酸组成的引物对进行PCR扩增145424.正向.NheI(SEQ ID 29)
5’-GAC AAT GTC GAC AAT GTA AAA TCA ATC GTC AAG CAAAAT GCC GGA GTC GGC AAA ATC AAT CCA GCT AGC ATT GAA GGCAGA CAT CAT AAT GGG ACA AAT GGG ACG101450.反向(SEQ ID 30)5’-CAT GGT GAA CCA AAG TGA AAC CSalI和NheI的限制性位点均已下划线。在最终构建中,将NheI位点插入果胶酸裂解酶基因最后一个密码子的右侧。
用编码JP170α-淀粉酶的质粒DNA样品(pMOL944)作为模板,用Amplitaq DNA聚合酶(Perkin Elmer)根据厂商建议,在含dNTP各200μM、AmpliTaq聚合酶(Perkin Elmer,Cetus,美国)2.5个单位以及每种引物各100pmol的PCR缓冲液(10mM Tris-HCl,pH8.3,50mM KCl,1.5mM MgCl2,0.01%(w/v)明胶)中进行PCR反应。
PCR反应用DNA热循环仪(MJ Research,PCT-200)进行。94℃保温1分钟,然后以94℃30秒的变性、60℃1分钟的退火、72℃2分钟的延伸进行30个循环。所扩增产物取5μl在0.7%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。约1.6kb的DNA片段的出现表示对基因片段的扩增是正确的。
对PCR片段的再克隆编码JP170的纯化PCR片段和上述pMB541质粒用SalI和NotI消化,1639 bp的JP170片段和5722bp的pMB541载体片段用QIAquick凝胶提取试剂盒(Qiagen,德国)从琼脂糖凝胶中纯化。然后将所述两种片段用T4 DNA连接酶和缓冲系统(Biolab,英国)于16℃连接16小时。将连接反应物用于转化感受态的PL1801,将这些细胞铺板至添加了10mg卡那霉素的LB琼脂平板上。从过夜培养的培养液中分离质粒DNA,对多个克隆进行分析。
将一个这样的阳性克隆于上述所用的添加了10mg/ml卡那霉素的琼脂平板上进行多次划线接种,将该克隆保藏为MOL1578。将MOL1578克隆在TY-10μg/ml卡那霉素中37℃过夜培养,次日取1ml细胞,用Qiaprep SpinPlasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。对纯化的质粒进行DNA测序,结果显示了对应于融合蛋白果胶酸裂解酶-JP170的DNA序列。将该质粒命名为pMOL1578。编码果胶酸裂解酶-JP170的ORF的总DNA序列示于SEQ ID 11,其衍生的蛋白序列见SEQ ID 12。在SEQ ID 12中的氨基酸具有以下起点和特征
a.a.1-29地衣芽孢杆菌的amyL的信号肽。
a.a.30-343地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345衍生自NheI克隆位点的两个氨基酸。
a.a.346-349IEGR接头。
a.a.350-834JP170淀粉酶。
果胶酸裂解酶-JP170融合蛋白的表达和检测编码果胶酸裂解酶-JP170杂合体的MOL1578和两株参照菌株编码JP170的MOL944和编码果胶酸裂解酶的MB541均在BPX培养基上以30℃和300rpm培养5天。将100ml无细胞上清与100ml SDS上样缓冲液混合,取25μl上样至4-20%Laemmli Tris-甘氨酸,SDS-PAGE NOVEX凝胶(Novex,美国)。按厂商建议在XcellTMMini-Cell(NOVEX,美国)上电泳,后续凝胶操作包括用考马斯亮蓝染色,脱色和干燥均按厂商建议进行。
约90kDa的蛋白带的出现表示质粒pMOL1578上所编码的果胶酸裂解酶-JP170融合蛋白已在枯草芽孢杆菌中表达。但凝胶上的主要带分别对应于两种核心酶果胶酸裂解酶(35kDa)和JP170淀粉酶(55kDa),表明融合蛋白在转运期间或刚刚转运之后被加工。
按上述方法分析MOL1578、MOL944和MB541这三种菌株的样品的α-淀粉酶活性,以确定JP170的产量。表1显示,在含有果胶酸裂解酶-JP170融合蛋白的MOL1578菌株中淀粉酶的产量相对于仅编码JP170的MOL944菌株有2.2倍的显著增加。结论是,显然果胶酸裂解酶可作为诸如JP170淀粉酶这样的大分子酶的分泌增强子。
表1菌株酶 单位MOL944a JP170 0.93MOL944b JP170 1.26MOL1578a 果胶酸裂解酶-JP1702.32MOL1578b 果胶酸裂解酶-JP1702.52MB541a果胶酸裂解酶 0.1MB541b果胶酸裂解酶 0.1实施例2果胶酸裂解酶与GLP-1融合蛋白的构建和表达人类GLP-1激素可使2型糖尿病患者体内血糖水平正常化(WO9517510-A1)。GLP-1(7-37)类似物有31个氨基酸长,很难用传统技术从酵母中产生(Egel-Mitani等(inpress),在YPS1已被破坏的酿酒酵母菌株中表达的各种异源多肽的产量增加)。
GLP-1基因用下述重叠引物扩增。将编码特异性Kex2识别位点Lys-Arg(KR)的DNA序列插入紧邻GLP-1(7-37)的第一密码子的上游,使得可在果胶酸裂解酶和GLP-1(7-37)之间进行特异性裂解。(参见关于Kex2的文献,如Ledgerwood等(1995),生物化学杂志,卷308(1)321-325,或Ghosh,S.等(1996)基因(Amsterdam),卷176(1-2)249-255)。以下两种引物用于扩增GLP-1(7-37)-Kex2序列149217.正向.NheI(SEQ ID 31)5’-TGT TTG CTA GCA AAA GAC ATG CCG AAG GAA CAT TTACGT CAG ACG TCT CAT CAT ATT TAG AAG GCC AGG CAG CCA AAG149216.反向.EagI(SEQ ID 32)5’-GCA AAC GGC CGA AAG CTT ATC CCC TGC CTT TGA CTAACC ATG CGA TGA ATT CTT TGG CTG CCT GGC CTT C重叠延伸反应在含dNTP各200μM、AmpliTaq聚合酶(Perkin Elmer,Cetus,美国)2.5个单位以及每种引物各100pmol的PCR缓冲液(10mMTris-HCl,pH8.3,50mM KCl,1.5mM MgCl2,0.01%(w/v)明胶)中进行。
该重叠延伸反应用DNA热循环仪(MJ Research,PCT-200)进行。94℃保温1分钟,然后以55℃1分钟的退火、72℃0.5分钟的延伸进行15个循环。所扩增产物取5μl在2.0%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。129bp的DNA片段的出现指示扩增是正确的。
GLP1片段的再克隆用pMOL1578质粒作为载体,将GLP-1(7-37)序列克隆在同一读码框内以便制备融合构建体。GLP-1(7-37)片段和pMOL1578载体用NheI和EagI消化。如针对pMOL1578的构建所述,纯化119bp的GLP-1(7-37)片段和5779bp的载体片段并克隆。
将一个阳性PL1801转化型克隆于上述所用的添加了10mg/ml卡那霉素的琼脂平板上进行多次划线接种,将该克隆保藏为MOL1635。将MOL1635克隆在TY-10μg/ml卡那霉素中37℃过夜培养,次日取1ml细胞,用Qiaprep Spin Plasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。对纯化的质粒进行DNA测序,结果显示了对应于果胶酸裂解酶-GLP-1(7-37)融合蛋白的DNA序列。将该质粒命名为pMOL1621。
编码果胶酸裂解酶-GLP-1(7-37)的ORF的总DNA序列示于SEQ ID13,其衍生的蛋白序列见SEQ ID 14。在SEQ ID 14中的氨基酸具有以下起点和特征a.a.1-29地衣芽孢杆菌的amyL的信号肽。
a.a.30-343地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345衍生自NheI克隆位点的两个氨基酸。
a.a.346-347Kex2内切蛋白酶加工位点。
a.a.348-378人类GLP-1(7-37)序列。
果胶酸裂解酶-GLP-1(7-37)融合蛋白的表达和检测用质粒pMOL1621转化蛋白酶较弱的枯草芽孢杆菌菌株WB600asn。其中一个携有pMOL1621的WB600asn命名为MOL1636。将该菌株在含有10μg/ml卡那霉素的Cal18-2培养基上培养,在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清,通过传统Western印迹进行分析(见图1和2)。
实施例3带PEPT接头的果胶酸裂解酶与GLP1之融合蛋白的构建和表达为了避免在果胶酸裂解酶与GLP-1(7-37)之间的区域中的蛋白酶剪切性攻击,插入了一个稳定的接头区。所选接头序列为WO 99/01543中报道的PEPT基元。所述接头基元出现在亲本酶与CBD(纤维素酶结合结构域)之间的要求专利权的纤维素酶中,在本发明中,该PEPT接头已证实在枯草芽孢杆菌中针对蛋白酶剪切作用是稳定的。
为确保在果胶酸裂解酶与GLP-1之间有一个正确间隔臂,将该基元重复两次,使之成为PEPTPEPT(2x(PEPT))。将编码特异性Kex2识别位点Lys-Arg(KR)的DNA序列插入紧邻GLP-1(7-37)的第一密码子的上游,使得可于纯化后,在果胶酸裂解酶和GLP-1(7-37)之间进行特异性裂解(参见关于Kex2的文献,如Ledgerwood等(1995),生物化学杂志,卷308(1)321-325,或Ghosh,S.等(1996)基因(Amsterdam),卷176(1-2)249-255)。
用pMOL1621为模板进行两个独立的PCR反应。PCR条件如实施例1所述。两个引物对的序列如下1.引物对159639.正向.NheI(SEQ ID 33)5’-CCA GCT AGC CCA GAA CCA ACA CCT GAG CCC ACA AAAAGA CAT GCC GAA GGA ACA TTT ACG101450.反向(SEQ ID 34)5’-CAT GGT GAA CCA AAG TGA AAC C2.引物对B5456H02.反向(SEQ ID 35)5’-GGT GTT GGT TCT GGG CTA GCT GGA TTG ATT TTG CCG142670.正向(SEQ ID 36)5’-CAG CGA TAA TTA CAA CAG GAC G两种PCR反应物经Qiagen柱(QIAquick PCR纯化试剂盒#28106)纯化为220bp和400bp的片段。在上述PCR条件下用每种片段各10ng进行SOE(序列重叠延伸)。PCR循环为94℃保温1分钟,然后以94℃10秒的变性、55℃30秒的退火、72℃2分钟的延伸进行10个循环。将100pmol侧翼引物142670.正向(SEQ ID 36)和101450.反向(SEQ ID 34)加入该反应中,再进行20轮PCR。所扩增产物取5μl在2.0%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。600bp的DNA片段的出现表示扩增是正确的。
GLP1片段的再克隆用pMOL1578质粒作为载体,将上述2x(PEPT)-GLP-1(7-37)基因克隆在同一读码框内以便制备融合构建体。将含有PEPT-GLP-1(7-37)序列和pMOL1578载体的600bp PCR片段用NheI和EagI消化。如针对pMOL1578的构建所述,纯化137bp的PEPT-GLP-1(7-37)片段和5779bp的载体片段并克隆。
将阳性WB600asn转化克隆于上述所用的添加了10mg/ml卡那霉素的琼脂平板上进行多次划线接种,将该克隆保藏为MOL1698。将MOL1698克隆在TY-10μg/ml卡那霉素中37℃过夜培养,次日取1ml细胞,用QiaprepSpin Plasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。对纯化的质粒进行DNA测序,结果显示了对应于果胶酸裂解酶-接头-GLP1融合蛋白的DNA序列。将该质粒命名为pMOL1698。
编码果胶酸裂解酶-接头-的ORF的总DNA序列示于SEQ ID 15,其衍生的蛋白序列见SEQ ID 16。在SEQ ID 16中的氨基酸具有以下起点和特征a.a.1-29地衣芽孢杆菌的amyL的信号肽。
a.a.30-343地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345衍生自NheI克隆位点的两个氨基酸。
a.a.346-353PEPTPEPT接头区。
a.a.354-355Kex2内切蛋白酶加工位点。
a.a.356-386人类GLP-1(7-37)序列。
果胶酸裂解酶-接头-GLP-1(7-37)融合蛋白的表达和检测编码果胶酸裂解酶杂合体的MOL1698在含有10μg/ml卡那霉素的Cal18-2培养基上培养。在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清,通过传统Western印迹进行分析,取25μl上样至4-20%Laemmli Tris-甘氨酸,SDS-PAGE NOVEx凝胶(Novex,美国)。按厂商建议在XcellTMMini-Cell(NOVEX,美国)上电泳,后续凝胶操作,包括用考马斯亮蓝染色,脱色和干燥均按厂商建议进行(见图3)。
实施例4果胶酸裂解酶和单链人类胰岛素(MI3)的融合蛋白的构建和表达编码人类胰岛素MI3的DNA序列通过将SEQ ID 18所限定的其蛋白序列逆转录而产生。涉及该蛋白序列的专利申请是WO 95/34666。使该DNA序列在密码子应用方面进一步优化,以便接近SEQ ID 1所述果胶酸裂解酶中的密码子应用性。这只需简单通过使用果胶酸裂解酶SEQ ID 1的最优选密码子作为编码SEQ ID 18所示MI3分子的密码子便可实现。本实验的优选DNA序列可在SEQ ID 17中找到。
为了在果胶酸裂解酶和MI3之间具有弹性区(接头),我们使用了由PEPT重复单元组成的接头。我们特别为本实验使用了该PEPT的两个重复单元。再次使密码子最优化至接近果胶酸裂解酶的密码子使用特点。
为了能在从培养细胞的上清中纯化出融合蛋白后,从果胶酸裂解酶上裂解出MI3,将一个Kex2内切蛋白酶加工位点导入紧邻该接头之后以及MI3蛋白之前。(参见关于Kex2的文献,如Ledgerwood等(1995),生物化学杂志,卷308(1)321-325,或Ghosh,S.等(1996)基因(Amsterdam),卷176(1-2)249-255)。这里所用Kex2位点为Lys-Arg(KR)。果胶酸裂解酶-接头-Kex-MI3编码质粒的构建如下设计两个重叠寡核苷酸,使得当它们在PCR反应中使用时将导致形成主要由SEQ ID 17中所示序列、接头编码序列、蛋白酶酶解位点编码序列和再克隆DNA片段所必需的两个限制性内切核酸酶位点组成的DNA片段。
该DNA片段的构建如下两个重叠寡核苷酸Pecl.ISFUS.NheI.upper(#149171)(SEQ ID 37)5′-CAT CATGCT AGCCCG GAA CCA ACA CCA GAG CCG ACC AAA AGG TTCGTC AAC CAG CAT TTA TGT GGC TCA CAT CTG GTA GAG GCC CTG TAT TTAGTC TGT GGA GAG AGG GGA TTC TTT TAT ACA CCGPecl.ISFUS.NotI.Lower(#149172)(SEQ ID 38)5′-GCG TTG AGA CGC GGC CGCTTA GTT GCA GTA ATT TTC CAG CTG ATATAA GCT ACA GAT TGA TGT GCA ACA CTG TTC AAC AAT GCC TTT CGC GGCTTT CGG TGT ATA AAA GAA TCC CCT CTCNheI和NotI的限制性位点均已下划线。
所述寡核苷酸用于PCR反应,该反应在添加了每种dNTP各200μM、HiFidelityTMExpand酶混合物2.6个单位以及每种引物各200pmol的HiFidelityTMPCR缓冲液(Boehringer Mannheim,德国)中进行。
用DNA热循环仪(Landgraf,德国)进行。94℃保温1分钟,然后以94℃15秒的变性、60℃1分钟的退火、72℃2分钟的延伸进行10个循环,再以94℃15秒的变性、60℃1分钟的退火、72℃2分钟的延伸(在此延伸步骤中,每个循环加20秒)进行20个循环。所扩增产物取5μl在1.5%琼脂糖凝胶(NuSieve,FMC)上用ReadyLoad 100bp DNA序列梯(GibcoBRL,丹麦)作为分子量标志进行电泳分析。0.2kb的清晰DNA片段表示所述两个引物的正确装配。
如上述所得的PCR产物取45μl用QIAquick PCR纯化试剂盒(Qiagen,美国)按厂商建议进行纯化。纯化的DNA在50μl 10mM Tris-HCl,pH8.5中洗脱。
5μl pMOL1578和25μl纯化的PCR片段用NheI和NotI消化,消化后的pMOL1578在0.8%的低熔点琼脂糖(SeaPlaque GTG,FMC)凝胶中电泳,从凝胶中切出相关片段,用QIAquick凝胶提取试剂盒(Qiagen,美国)按厂商建议进行纯化。所分离的PCR DNA片段在消化后用QIAquick PCR纯化试剂盒(Qiagen,美国)按厂商建议进行简单纯化。纯化的DNA在50μl10mM Tris-HCl,pH8.5中洗脱。
然后将PCR片段和质粒连接至经过NheI-NotI消化并纯化的pMOL1578上。该连接在16℃,用每种DNA片段各0.5μg、T4 DNA连接酶1个单位、和T4连接酶缓冲液(Boehringer Mannheim,德国)实施过夜。
用该连接混合物转化感受态的枯草芽孢杆菌PL2306细胞。将转化的细胞铺板于LBPG-10μg/ml卡那霉素平板上。37℃培养18小时后,选数个克隆在新鲜琼脂平板上再划线接种,并于含有10μg/ml卡那霉素的TY液体培养基中37℃过夜培养。次日取1ml细胞,用Qiaprep Spin Plasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。用该质粒DNA作为DNA测序的模板。
保留含有对应于果胶酸裂解酶DNA序列的两个克隆,其中所述DNA序列与接头以及MI3基因为一融合体,将这些克隆命名为MB929-1和MB929-3。编码信号肽-果胶酸裂解酶-接头-MI3的ORF的DNA序列如SEQID 19所示,所衍生的蛋白序列见SEQ ID 20。
在SEQ ID 20中的氨基酸具有以下特征a.a.1-29地衣芽孢杆菌的amyL的信号肽。
a.a.30-343地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345衍生自NheI克隆位点的两个氨基酸。
a.a.346-353PEPT接头。
a.a.354-355Kex2内切蛋白酶加工位点a.a.356-408人类单链胰岛素MI3。
从如上所述的相同克隆过程中分离出一个克隆,其不产生全长果胶酸裂解酶-接头-MI3,将该克隆命名为pMB929-5。DNA测序显示,在紧邻PEPT-KRFVN序列之后导入了一个终止密码子。用该克隆作为表达和检测分析中的对照。
果胶酸裂解酶-接头-MI3融合蛋白的表达用pMB929质粒转化蛋白酶较弱的枯草芽孢杆菌菌株WB600asn。将其中一个携有pMB929-1的WB600asn菌株命名为MB1009-1。将一个携有pMB929-3的WB600asn菌株命名为MB1009-4。将其中一个携有pMB929-5的WB600asn菌株命名为MB1009-7并作为阴性对照菌株使用(如上所述)。这些菌株在含有10μg/ml卡那霉素的Cal18-2培养基上培养,在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清,通过传统Western印迹进行分析(见图4)。
实施例5果胶酸裂解酶与GLP-1的融合蛋白的表达以及kex2p裂解蛋白酶较弱的WB600asn菌株用质粒pMOL1621转化,以备过表达和裂解果胶酸裂解酶-ASKR-GLP1(7-37)融合产物。将该菌株在含有10μg/ml卡那霉素的Cal18-2培养基上培养,在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清并分析。Kex2p裂解如下进行a)0.8ml上清b)0.1ml 1M Na2HPO4,pH7.5c)加入0.1ml Kex2p(制剂号KMK0087,Steen B.Mortensen,NovoNordisk赠)d)于37℃水浴中保温2小时e)将样品快速冷冻并保存在-20℃。
将样品立即解冻,然后进行SDS-PAGE。30μl样品用20μl样品缓冲液和5μl PMSF(溶于异丙醇)以及5μl 25%w/v DTT处理,然后煮沸。每孔上样10μl。每份样品均描述在工作单(worksheet)上。所有其它条件如前文材料和方法部分所述。
图5证实,果胶酸裂解酶-ASKR-GLP1(7-37)融合蛋白被Kex2p有效裂解,使GLP1产物被GLP1抗体识别。GLP1的产量在50mg/l的水平上。
序列表<110>诺维信公司(Novozymes A/S)<120>用于多肽的表达和分泌的果胶酸裂解酶融合体<130><140><141><160>38<170>PatentIn Ver.2.1<210>1<211>1026<212>DNA<213>地衣芽孢杆菌(Bacillus licheniformis)ATCC 14580<220><221>CDS<222>(1)..(1026)<400>1atg aag aaa tta atc agc atc atc ttt atc ttt gta tta ggg gtt gtc 48Met Lys Lys Leu Ile Ser Ile Ile Phe Ile Phe Val Leu Gly Val Val1 5 10 15ggg tca ttg aca gcg gcg gtt tcg gca gaa gca gct tct gcc tta aac 96Gly Ser Leu Thr Ala Ala Val Ser Ala Glu Ala Ala Ser Ala Leu Asn20 25 30tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc ttt gcc 144Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly Phe Ala35 40 45gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg gta acc 192Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr Val Thr50 55 60gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag aat gca 240Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys Asn Ala65 70 75 80aat acg cct tta aaa att tat gtc aac ggc acc att aca aca tca aat 288Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr Ser Asn85 90 95aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta tcg att 336Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val Ser Ile100 105 110gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc aaa ata 384Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile Lys Ile115 120 125tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac gag gtc 432Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His Glu Val130 135 140gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct aaa aac 480Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser Lys Asn145 150 155 160att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt gac aaa 528Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val Asp Lys165 170 175gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa tat att 576Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu Tyr Ile180 185 190aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg ctg atg 624Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met Leu Met195 200 205ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc cat cat 672Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe His His210 215 220aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt ttc gga 720Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg Phe Gly225 230 235 240gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac agc gga 768Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp Ser Gly245 250 255att aat tcg agg atg ggc gcg cgc ate aga att gag aac aac ctc ttt 816Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn Leu Phe260 265 270gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca ccg ggc 864Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser Pro Gly275 280 285tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc agt atg 912Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly Ser Met290 295 300ccg act acc tct act aca acc tat aat ccg cca tac agc tac tca ctc 960Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr Ser Leu305 310 315 320gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc gga gtc 1008Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala Gly Val325 330 335ggc aaa atc aat cca taa 1026Gly Lys Ile Asn Pro340<210>2<211>341<212>PRT<213>地衣芽孢杆菌(Bacillus licheniformis)ATCC 14580<400>2Met Lys Lys Leu Ile Ser Ile Ile Phe Ile Phe Val Leu Gly Val Val1 5 10 15Gly Ser Leu Thr Ala Ala Val Ser Ala Glu Ala Ala Ser Ala Leu Asn20 25 30Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly Phe Ala35 40 45Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr Val Thr50 55 60Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys Asn Ala65 70 75 80Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr Ser Asn85 90 95Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val Ser Ile100 105 110Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile Lys Ile115 120 125Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His Glu Val130 135 140Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser Lys Asn145 150 155 160Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val Asp Lys165 170 175Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu Tyr Ile180 185 190Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met Leu Met195 200 205Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe His His
210 215 220Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg Phe Gly225 230 235 240Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp Ser Gly245 250 255Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn Leu Phe260 265 270Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser Pro Gly275 280 285Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly Ser Met290 295 300Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr Ser Leu305 310 315 320Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala Gly Val325 330 335Gly Lys Ile Asn Pro340<210>3<211>1530<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1530)<400>3atg atg aag atg aga aaa gca tta agt gta tta gtg att ttc gga tta 48Met Met Lys Met Arg Lys Ala Leu Ser Val Leu Val Ile Phe Gly Leu1 5 10 15ttc gta tct ttt ttt agt ttt ggt cat caa gga gca gaa gcg gca tca 96Phe Val Ser Phe Phe Ser Phe Gly His Gln Gly Ala Glu Ala Ala Ser20 25 30ttt cag tct aat aaa aat tat cat cta gtg aat gtg aac agt ggc aag 144Phe Gln Ser Asn Lys Asn Tyr His Leu Val Asn Val Asn Ser Gly Lys35 40 45tac tta gaa gtg ggg gct gcc tca aca gag aac ggt gca aat gtc caa 192Tyr Leu Glu Val Gly Ala Ala Ser Thr Glu Asn Gly Ala Asn Val Gln50 55 60caa tgg gaa aat acg aat tgt cat tgt caa caa tgg cga ttg gtg caa 240Gln Trp Glu Asn Thr Asn Cys His Cys Gln Gln Trp Arg Leu Val Gln65 70 75 80aat cag gat ggt tat tat gag att gta aac cga cat agt ggc aaa gca 288Asn Gln Asp Gly Tyr Tyr Glu Ile Val Asn Arg His Ser Gly Lys Ala85 90 95ttg gat gta ttt gaa cgt tct tca gct gat gga gcg aac att gta caa 336Leu Asp Val Phe Glu Arg Ser Ser Ala Asp Gly Ala Asn Ile Val Gln100 105 110tgg gat tcg aat gga cgt agc aat caa caa tgg acg att caa caa gtg 384Trp Asp Ser Asn Gly Arg Ser Asn Gln Gln Trp Thr Ile Gln Gln Val115 120 125ggt tcc tct tat aaa ata gtt agc aga cat agt ggg aag gca ctc gaa 432Gly Ser Ser Tyr Lys Ile Val Ser Arg His Ser Gly Lys Ala Leu Glu130 135140gta ttt aac cat tct aat caa aat gga gca aat gtc gta cag tgg caa 480Val Phe Asn His Ser Asn Gln Asn Gly Ala Asn Val Val Gln Trp Gln145 150 155 160gat ttt ggt aat ccg aat caa ctt tgg aat atc gtc gag gtt ggt tca 528Asp Phe Gly Asn Pro Asn Gln Leu Trp Asn Ile Val Glu Val Gly Ser165 170 175gga caa gct cac gat ttc agt aag ccg ttg ggg tat gcc tca atg aat 576Gly Gln Ala His Asp Phe Ser Lys Pro Leu Gly Tyr Ala Ser Met Asn180 185 190ggc ggg acc act ggc ggt caa ggt gga cga gtc gaa tac gcg agt act 624Gly Gly Thr Thr Gly Gly Gln Gly Gly Arg Val Glu Tyr Ala Ser Thr195 200 205ggc tct caa cta caa aaa tta atc gat gat cga agt cga agc aat aat 672Gly Ser Gln Leu Gln Lys Leu Ile Asp Asp Arg Ser Arg Ser Asn Asn210 215 220ccc aat caa cca ctt acc att tat gta act ggg aaa atc acc ctg caa 720Pro Asn Gln Pro Leu Thr Ile Tyr Val Thr Gly Lys Ile Thr Leu Gln225 230 235 240aac tcc tct gat gat aaa att gaa gtg aaa aat cat cgt gga caa gct 768Asn Ser Ser Asp Asp Lys Ile Glu Val Lys Asn His Arg Gly Gln Ala245250 255cat gaa ata cgt aat ctg tct atc ata ggt caa gga aca aga gga gag 816His Glu Ile Arg Asn Leu Ser Ile Ile Gly Gln Gly Thr Arg Gly Glu260 265 270ttt gat ggc att ggt tta cga tta att aat gcg cac aat gtc att gtg 864Phe Asp Gly Ile Gly Leu Arg Leu Ile Asn Ala His Asn Val Ile Val275 280 285cgt aat ctc tcc att cac cat gta cga gct ggt tca ggt gaa ggt aca 912Arg Asn Leu Ser Ile His His Val Arg Ala Gly Ser Gly Glu Gly Thr290 295 300tca att gaa gtt act caa gga agt aag aat att tgg att gat cat aac 960Ser Ile Glu Val Thr Gln Gly Ser Lys Asn Ile Trp Ile Asp His Asn305 310 315 320gaa ttt tat agt caa ctg gat ggg aat aac aac cct gat ctg tat gat 1008Glu Phe Tyr Ser Gln Leu Asp Gly Asn Asn Asn Pro Asp Leu Tyr Asp325 330 335ggt ctt gtc gat att aaa cgg aat tcg gag tac att acg gtc tct tgg 1056Gly Leu Val Asp Ile Lys Arg Asn Ser Glu Tyr Ile Thr Val Ser Trp340 345 350aac aag ttt gag aat cat tgg aaa acg atg ctc gtc ggc cat acc gat 1104Asn Lys Phe Glu Asn His Trp Lys Thr Met Leu Val Gly His Thr Asp355 360 365aac gca tca tta gca cct gat aaa gtt acg tac cac cac aac ttt ttc 1152Asn Ala Ser Leu Ala Pro Asp Lys Val Thr Tyr His His Asn Phe Phc370 375 380cac aat ctt aat tcc aga gtt ccg tta att cga ttc gca gat gtt cat 1200His Asn Leu Asn Ser Arg Val Pro Leu Ile Arg Phe Ala Asp Val His385 390 395 400atg gtt aac aac tat ttc aaa gat att aaa gat aca gca att aat agt 1248Met Val Asn Asn Tyr Phe Lys Asp Ile Lys Asp Thr Ala Ile Asn Ser405 410 415cgt atg gga gca aga gta ttt gta gaa aat aac tat ttt gag aat gta 1296Arg Met Gly Ala Arg Val Phe Val Glu Asn Asn Tyr Phe Glu Asn Val420 425 430gga tca ggt caa caa gat ccg acc aca cga caa att aaa act gct gtt 1344Gly Ser Gly Gln Gln Asp Pro Thr Thr Arg Gln Ile Lys Thr Ala Val435 440 445ggg tgg ttt tat ggt agt tct agc act gga tat tgg aat tta aga gga 1392Gly Trp Phe Tyr Gly Ser Ser Ser Thr Gly Tyr Trp Asn Leu Arg Gly450 455 460aat caa ttt att aac aca cca tca agc cac ttg tct tcc aca acg aat 1440Asn Gln Phe Ile Asn Thr Pro Ser Ser His Leu Ser Ser Thr Thr Asn465 470 475 480ttc aca cca cct tat cag ttc aac gcc caa tcc gct caa gat gca aag 1488Phe Thr Pro Pro Tyr Gln Phe Asn Ala Gln Ser Ala Gln Asp Ala Lys485 490 495caa gcc gtt gaa cag ttt tcg ggt gta ggg gtt gta cag tag 1530Gln Ala Val Glu Gln Phe Ser Gly Val Gly Val Val Gln500 505 510<210>4<211>509<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>4Met Met Lys Met Arg Lys Ala Leu Ser Val Leu Val Ile Phe Gly Leu1 5 10 15Phe Val Ser Phe Phe Ser Phe Gly His Gln Gly Ala Glu Ala Ala Ser20 25 30Phe Gln Ser Asn Lys Asn Tyr His Leu Val Asn Val Asn Ser Gly Lys35 40 45Tyr Leu Glu Val Gly Ala Ala Ser Thr Glu Asn Gly Ala Asn Val Gln50 55 60Gln Trp Glu Asn Thr Asn Cys His Cys Gln Gln Trp Arg Leu Val Gln65 70 75 80Asn Gln Asp Gly Tyr Tyr Glu Ile Val Asn Arg His Ser Gly Lys Ala85 90 95Leu Asp Val Phe Glu Arg Ser Ser Ala Asp Gly Ala Asn Ile Val Gln100 105 110Trp Asp Ser Asn Gly Arg Ser Asn Gln Gln Trp Thr Ile Gln Gln Val115 120 125Gly Ser Ser Tyr Lys Ile Val Ser Arg His Ser Gly Lys Ala Leu Glu130 135 140Val Phe Asn His Ser Asn Gln Asn Gly Ala Asn Val Val Gln Trp Gln145 150 155 160Asp Phe Gly Asn Pro Asn Gln Leu Trp Asn Ile Val Glu Val Gly Ser165 170 175Gly Gln Ala His Asp Phe Ser Lys Pro Leu Gly Tyr Ala Ser Met Asn180 185 190Gly Gly Thr Thr Gly Gly Gln Gly Gly Arg Val Glu Tyr Ala Ser Thr195 200 205Gly Ser Gln Leu Gln Lys Leu Ile Asp Asp Arg Ser Arg Ser Asn Asn210 215 220Pro Asn Gln Pro Leu Thr Ile Tyr Val Thr Gly Lys Ile Thr Leu Gln225 230 235 240Asn Ser Ser Asp Asp Lys Ile Glu Val Lys Asn His Arg Gly Gln Ala
245 250 255His Glu Ile Arg Asn Leu Ser Ile Ile Gly Gln Gly Thr Arg Gly Glu260 265 270Phe Asp Gly Ile Gly Leu Arg Leu Ile Asn Ala His Asn Val Ile Val275 280 285Arg Asn Leu Ser Ile His His Val Arg Ala Gly Ser Gly Glu Gly Thr290 295 300Ser Ile Glu Val Thr Gln Gly Ser Lys Asn Ile Trp Ile Asp His Asn305 310 315 320Glu Phe Tyr Ser Gln Leu Asp Gly Asn Asn Asn Pro Asp Leu Tyr Asp325 330 335Gly Leu Val Asp Ile Lys Arg Asn Ser Glu Tyr Ile Thr Val Ser Trp340 345 350Asn Lys Phe Glu Asn His Trp Lys Thr Met Leu Val Gly His Thr Asp355 360 365Asn Ala Ser Leu Ala Pro Asp Lys Val Thr Tyr His His Asn Phe Phe370 375 380His Asn Leu Asn Ser Arg Val Pro Leu Ile Arg Phe Ala Asp Val His385 390 395 400Met Val Asn Asn Tyr Phe Lys Asp Ile Lys Asp Thr Ala Ile Asn Ser405 410 415Arg Met Gly Ala Arg Val Phe Val Glu Asn Asn Tyr Phe Glu Asn Val420 425 430Gly Ser Gly Gln Gln Asp Pro Thr Thr Arg Gln Ile Lys Thr Ala Val435 440 445Gly Trp Phe Tyr Gly Ser Ser Ser Thr Gly Tyr Trp Asn Leu Arg Gly450 455 460Asn Gln Phe Ile Asn Thr Pro Ser Ser His Leu Ser Ser Thr Thr Asn465 470 475 480Phe Thr Pro Pro Tyr Gln Phe Asn Ala Gln Ser Ala Gln Asp Ala Lys485 490 495Gln Ala Val Glu Gln Phe Ser Gly Val Gly Val Val Gln500 505<210>5<211>1008<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1008)<400>5atg aga aaa ctc tta tcg atg atg act gcg ctt gta ctc atg ttt gga 48Met Arg Lys Leu Leu Ser Met Met Thr Ala Leu Val Leu Met Phe Gly1 5 10 15atc atg gtt gta cct tct ata gcc aaa ggt gaa agc gat tcc act atg 96Ile Met Val Val Pro Ser Ile Ala Lys Gly Glu Ser Asp Ser Thr Met20 25 30aat gct gat ttt tcc atg caa ggt ttt gcg aca ctt aat ggc gga acc 144Asn Ala Asp Phe Ser Met Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr35 40 45aca gga gga gcc ggc ggg caa acc gta acc gtt tct acc gga gac gaa 192Thr Gly Gly Ala Gly Gly Gln Thr Val Thr Val Ser Thr Gly Asp Glu50 55 60ctg ctg gcg gcc ttg aag aac aaa aac agc aat aca ccc ctg acg att 240Leu Leu Ala Ala Leu Lys Asn Lys Asn Ser Asn Thr Pro Leu Thr Ile65 70 75 80tat gta aac ggt acc ata acg cca tca aat acg tcc gca agc aaa att 288Tyr Val Asn Gly Thr Ile Thr Pro Ser Asn Thr Ser Ala Ser Lys Ile85 90 95gat att aaa gac gta aac gat gtt tcg atc tta ggt gtt ggc act caa 336Asp Ile Lys Asp Val Asn Asp Val Ser Ile Leu Gly Val Gly Thr Gln100 105 110ggc gaa ttt aac ggc att ggc att aaa gta tgg cga gcc aat aac att 384Gly Glu Phe Asn Gly Ile Gly Ile Lys Val Trp Arg Ala Asn Asn Ile115 120 125att ctc cgc aac ttg aaa ata cat cac gtc aat aca ggc gac aaa gat 432Ile Leu Arg Asn Leu Lys Ile His His Val Asn Thr Gly Asp Lys Asp130 135 140gcc att agc att gaa gga cca tcc aaa aac ata tgg gtt gac cac aat 480Ala Ile Ser Ile Glu Gly Pro Ser Lys Asn Ile Trp Val Asp His Asn145 150 155 160gag ctc tac aat agt ctt gat gtc cat aag gat tac tac gat ggt ctt 528Glu Leu Tyr Asn Ser Leu Asp Val His Lys Asp Tyr Tyr Asp Gly Leu165 170 175ttt gat gtc aaa cgg gac gcg gat tac att aca ttc tcg tgg aat tat 576Phe Asp Val Lys Arg Asp Ala Asp Tyr Ile Thr Phe Ser Trp Asn Tyr180 185 190gtt cat gat agc tgg aag agc atg ctg atg gga tct tct gat tcc gat 624Val His Asp Ser Trp Lys Ser Met Leu Met Gly Ser Ser Asp Ser Asp195 200 205tcg tac aac cga aaa atc aca ttc cac aat aac tac ttt gaa aac ctc 672Ser Tyr Asn Arg Lys Ile Thr Phe His Asn Asn Tyr Phe Glu Asn Leu210 215 220aat tca cgt gta cct tcc ata cgc ttt ggc gaa gcc cac atc ttc agc 720Asn Ser Arg Val Pro Ser Ile Arg Phe Gly Glu Ala His Ile Phe Ser225 230 235 240aac tac tac aat ggc att aat gaa acc ggc atc aac tcc cgc atg ggg 768Asn Tyr Tyr Asn Gly Ile Asn Glu Thr Gly Ile Asn Ser Arg Met Gly245 250 255gca aaa gtg cgc atc gag gaa aat cta ttt gaa cgc gca aac aac ccg 816Ala Lys Val Arg Ile Glu Glu Asn Leu Phe Glu Arg Ala Asn Asn Pro260 265 270atc gtc agt cgc gac agt cgc caa gtc ggg tat tgg cac ttg ata aac 864Ile Val Ser Arg Asp Ser Arg Gln Val Gly Tyr Trp His Leu Ile Asn275 280 285aat cac ttt act caa tca acg ggc gaa att cca acg act tca aca atc 912Asn His Phe Thr Gln Ser Thr Gly Glu Ile Pro Thr Thr Ser Thr Ile290 295 300aca tat aac cca cct tat tcc tat caa gct act ccg gtt ggc caa gta 960Thr Tyr Asn Pro Pro Tyr Ser Tyr Gln Ala Thr Pro Val Gly Gln Val305 310 315 320aaa gat gtg gtt cgt gcg aat gct ggt gtt ggc aaa gta aca cct taa 1008Lys Asp Val Val Arg Ala Asn Ala Gly Val Gly Lys Val Thr Pro325 330 335<210>6<211>335<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>6Met Arg Lys Leu Leu Ser Met Met Thr Ala Leu Val Leu Met Phe Gly1 5 10 15Ile Met Val Val Pro Ser Ile Ala Lys Gly Glu Ser Asp Ser Thr Met20 25 30Asn Ala Asp Phe Ser Met Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr35 40 45Thr Gly Gly Ala Gly Gly Gln Thr Val Thr Val Ser Thr Gly Asp Glu50 55 60Leu Leu Ala Ala Leu Lys Asn Lys Asn Ser Asn Thr Pro Leu Thr Ile65 70 75 80Tyr Val Asn Gly Thr Ile Thr Pro Ser Asn Thr Ser Ala Ser Lys Ile85 90 95Asp Ile Lys Asp Val Asn Asp Val Ser Ile Leu Gly Val Gly Thr Gln100 105 110Gly Glu Phe Asn Gly Ile Gly Ile Lys Val Trp Arg Ala Asn Asn Ile115 120 125Ile Leu Arg Asn Leu Lys Ile His His Val Asn Thr Gly Asp Lys Asp130 135 140Ala Ile Ser Ile Glu Gly Pro Ser Lys Asn Ile Trp Val Asp His Asn145 150 155 160Glu Leu Tyr Asn Ser Leu Asp Val His Lys Asp Tyr Tyr Asp Gly Leu165 170 175Phe Asp Val Lys Arg Asp Ala Asp Tyr Ile Thr Phe Ser Trp Asn Tyr180 185 190Val His Asp Ser Trp Lys Ser Met Leu Met Gly Ser Ser Asp Ser Asp195 200 205Ser Tyr Asn Arg Lys Ile Thr Phe His Asn Asn Tyr Phe Glu Asn Leu210 215 220Asn Ser Arg Val Pro Ser Ile Arg Phe Gly Glu Ala His Ile Phe Ser225 230 235 240Asn Tyr Tyr Asn Gly Ile Asn Glu Thr Gly Ile Asn Ser Arg Met Gly245 250 255Ala Lys Val Arg Ile Glu Glu Asn Leu Phe Glu Arg Ala Asn Asn Pro260 265 270Ile Val Ser Arg Asp Ser Arg Gln Val Gly Tyr Trp His Leu Ile Asn275 280 285Asn His Phe Thr Gln Ser Thr Gly Glu Ile Pro Thr Thr Ser Thr Ile290 295300Thr Tyr Asn Pro Pro Tyr Ser Tyr Gln Ala Thr Pro Val Gly Gln Val305 310 315 320Lys Asp Val Val Arg Ala Asn Ala Gly Val Gly Lys Val Thr Pro325 330 335<210>7<211>1077<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1077)<400>7atg act aaa gtc ttt aaa ttg tta ctg gca tta gct ctc gtt tta cca 48Met Thr Lys Val Phe Lys Leu Leu Leu Ala Leu Ala Leu Val Leu Pro1 5 10 15gtt atc tca ttt agt tct cct gcc tcg caa gct gct tca aat cag cca 96Val Ile Ser Phe Ser Ser Pro Ala Ser Gln Ala Ala Ser Asn Gln Pro20 25 30act tct aac gga cca caa ggc tat gcg tca atg aat gga ggg aca acc 144Thr Ser Asn Gly Pro Gln Gly Tyr Ala Ser Met Asn Gly Gly Thr Thr35 40 45ggt ggt gca ggc ggc cgt gtc gaa tat gca agc acc gga gcg caa att 192Gly Gly Ala Gly Gly Arg Val Glu Tyr Ala Ser Thr Gly Ala Gln Ile50 55 60cag caa ttg ata gat aat cgc agc cga agt aat aac cct gat gaa cca 240Gln Gln Leu Ile Asp Asn Arg Ser Arg Ser Asn Asn Pro Asp Glu Pro65 70 75 80tta acg att tat gta aac gga acg att aca caa gga aat tcc cca cag 288Leu Thr Ile Tyr Val Asn Gly Thr Ile Thr Gln Gly Asn Ser Pro Gln85 90 95tcc ctt ata gat gtt aaa aat cac cgt gga aaa gct cat gaa att aaa 336Ser Leu Ile Asp Val Lys Asn His Arg Gly Lys Ala His Glu Ile Lys100 105 110aac atc tct att atc ggt gta gga aca aat gga gag ttt gat ggc att 384Asn Ile Ser Ile Ile Gly Val Gly Thr Asn Gly Glu Phe Asp Gly Ile115 120 125ggg ata aga cta tca aac gcc cat aat atc att atc caa aat gta tca 432Gly Ile Arg Leu Ser Asn Ala His Asn Ile Ile Ile Gln Asn Val Ser130 135 140att cat cat gtg cga gag gga gaa ggc acg gct att gaa gtg aca gat 480Ile His His Val Arg Glu Gly Glu Gly Thr Ala Ile Glu Val Thr Asp145 150 155 160gag agt aaa aac gtg tgg atc gat cac aac gag ttt tat agt gaa ttt 528Glu Ser Lys Asn Val Trp Ile Asp His Asn Glu Phe Tyr Ser Glu Phe165 170 175cca ggt aat gga gac tca gat tat tac gat ggt ctc gta gac ata aaa 576Pro Gly Asn Gly Asp Ser Asp Tyr Tyr Asp Gly Leu Val Asp Ile Lys180 185 190aga aac gct gaa tat att acg gtt tca tgg aat aag ttt gag aat cat 624Arg Asn Ala Glu Tyr Ile Thr Val Ser Trp Asn Lys Phe Glu Asn His195 200 205tgg aaa acg atg ctc gtc ggt cat act gat aat gcc tca tta gcg cca 672Trp Lys Thr Met Leu Val Gly His Thr Asp Asn Ala Ser Leu Ala Pro210 215 220gat aaa att acg tac cat cac aat tat ttt aat aat ctt aat tca cgt 720Asp Lys Ile Thr Tyr His His Asn Tyr Phe Asn Asn Leu Asn Ser Arg225 230 235 240gtc ccg ctt att cga tac gct gat gtc cat atg ttc aat aac tat ttt 768Val Pro Leu Ile Arg Tyr Ala Asp Val His Met Phe Asn Asn Tyr Phe245 250 255aaa gac att aac gat aca gcg att aac agt cgt gta ggg gcc cgt gtc 816Lys Asp Ile Asn Asp Thr Ala Ile Asn Ser Arg Val Gly Ala Arg Val260 265 270ttt gta gaa aac aac tat ttt gac aac gta gga tca gga caa gct gac 864Phe Val Glu Asn Asn Tyr Phe Asp Asn Val Gly Ser Gly Gln Ala Asp275280 285cca acg act ggt ttt att aaa ggg cct gtt ggt tgg ttc tat gga agt 912Pro Thr Thr Gly Phe Ile Lys Gly Pro Val Gly Trp Phe Tyr Gly Ser290 295 300ccg agt act gga tat tgg aat tta cgt gga aat gta ttt gtt aat aca 960Pro Ser Thr Gly Tyr Trp Asn Leu Arg Gly Asn Val Phe Val Asn Thr305 310 315 320ccg aat agt cat tta agc tct aca aca aac ttt aca cca cca tat agt 1008Pro Asn Ser His Leu Ser Ser Thr Thr Asn Phe Thr Pro Pro Tyr Ser325 330 335tac aaa gtc caa tca gct acc caa gct aag tcg tcg gtt gaa caa cat 1056Tyr Lys Val Gln Ser Ala Thr Gln Ala Lys Ser Ser Val Glu Gln His340 345 350tcg gga gta ggt gtt atc aac 1077Ser Gly Val Gly Val Ile Asn355<210>8<211>359<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>8Met Thr Lys Val Phe Lys Leu Leu Leu Ala Leu Ala Leu Val Leu Pro1 5 10 15Val Ile Ser Phe Ser Ser Pro Ala Ser Gln Ala Ala Ser Asn Gln Pro20 25 30Thr Ser Asn Gly Pro Gln Gly Tyr Ala Ser Met Asn Gly Gly Thr Thr35 40 45Gly Gly Ala Gly Gly Arg Val Glu Tyr Ala Ser Thr Gly Ala Gln Ile50 55 60Gln Gln Leu Ile Asp Asn Arg Ser Arg Ser Asn Asn Pro Asp Glu Pro65 70 75 80Leu Thr Ile Tyr Val Asn Gly Thr Ile Thr Gln Gly Asn Ser Pro Gln85 90 95Ser Leu Ile Asp Val Lys Asn His Arg Gly Lys Ala His Glu Ile Lys100 105 110Asn Ile Ser Ile Ile Gly Val Gly Thr Asn Gly Glu Phe Asp Gly Ile115 120 125Gly Ile Arg Leu Ser Asn Ala His Asn Ile Ile Ile Gln Asn Val Ser130 135 140Ile His His Val Arg Glu Gly Glu Gly Thr Ala Ile Glu Val Thr Asp145 150 155 160Glu Ser Lys Asn Val Trp Ile Asp His Asn Glu Phe Tyr Ser Glu Phe165 170 175Pro Gly Asn Gly Asp Ser Asp Tyr Tyr Asp Gly Leu Val Asp Ile Lys180 185 190Arg Asn Ala Glu Tyr Ile Thr Val Ser Trp Asn Lys Phe Glu Asn His195 200 205Trp Lys Thr Met Leu Val Gly His Thr Asp Asn Ala Ser Leu Ala Pro210 215 220Asp Lys Ile Thr Tyr His His Asn Tyr Phe Asn Asn Leu Asn Ser Arg225 230 235 240Val Pro Leu Ile Arg Tyr Ala Asp Val His Met Phe Asn Asn Tyr Phe245 250 255Lys Asp Ile Asn Asp Thr Ala Ile Asn Ser Arg Val Gly Ala Arg Val260 265 270Phe Val Glu Asn Asn Tyr Phe Asp Asn Val Gly Ser Gly Gln Ala Asp
275 280 285Pro Thr Thr Gly Phe Ile Lys Gly Pro Val Gly Trp Phe Tyr Gly Ser290 295 300Pro Ser Thr Gly Tyr Trp Asn Leu Arg Gly Asn Val Phe Val Asn Thr305 310 315 320Pro Asn Ser His Leu Ser Ser Thr Thr Asn Phe Thr Pro Pro Tyr Ser325 330 335Tyr Lys Val Gln Ser Ala Thr Gln Ala Lys Ser Ser Val Glu Gln His340 345 350Ser Gly Val Gly Val Ile Asn355<210>9<211>1047<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1047)<400>9atg gac aaa ctt tat att gaa aaa gga agt gag agt atg atg aga tca 48Met Asp Lys Leu Tyr Ile Glu Lys Gly Ser Glu Ser Met Met Arg Ser1 5 10 15agc atc gtc aaa cta gtt gct ttc agt att gtg ttt atg tta tgg ctc 96Ser Ile Val Lys Leu Val Ala Phe Ser Ile Val Phe Met Leu Trp Leu20 25 30ggt gta tcc ttt caa acg gca gaa gcg aat acg cca aat ttc aac tta 144Gly Val Ser Phe Gln Thr Ala Glu Ala Asn Thr Pro Asn Phe Asn Leu35 40 45caa ggc ttt gcc acg tta aat ggg gga aca act ggt ggc gct ggt gga 192Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr Thr Gly Gly Ala Gly Gly50 55 60gat gta gtg acg gtt cgt aca ggg aat gag tta ata aac gct ttg aag 240Asp Val Val Thr Val Arg Thr Gly Asn Glu Leu Ile Asn Ala Leu Lys65 70 75 80tcc aaa aac cct aat cgg ccg tta aca att tat gtt aac ggt acg ata 288Ser Lys Asn Pro Asn Arg Pro Leu Thr Ile Tyr Val Asn Gly Thr Ile85 90 95acg cct aat aat acg tct gat agt aag atc gac att aag gat gtt tcc 336Thr Pro Asn Asn Thr Ser Asp Ser Lys Ile Asp Ile Lys Asp Val Ser100 105 110aat gta tcg att tta ggg gtt ggc aca aat ggc cga tta aac ggg atc 384Asn Val Ser Ile Leu Gly Val Gly Thr Asn Gly Arg Leu Asn Gly Ile115 120 125ggt att aaa gta tgg cga gcg aat aat atc att att cga aac ttg aca 432Gly Ile Lys Val Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Thr130 135 140atc cat gaa gtc cat aca ggt gat aaa gat gcg att agc atg att agc 480Ile His Glu Val His Thr Gly Asp Lys Asp Ala Ile Ser Met Ile Ser145 150 155 160att gaa gga cca tct cga aac att tgg gtt gac cat aac gag ctt tat 528Ile Glu Gly Pro Ser Arg Asn Ile Trp Val Asp His Asn Glu Leu Tyr165 170 175gcc agc ttg aat gtt cat aaa gat cac tat gac ggc ttg ttt gac gta 576Ala Ser Leu Asn Val His Lys Asp His Tyr Asp Gly Leu Phe Asp Val180 185 190aag cgc gat gct tac aat att acc ttc tct tgg aat tat gtc cat gat 624Lys Arg Asp Ala Tyr Asn Ile Thr Phe Ser Trp Asn Tyr Val His Asp195 200 205ggc tgg aaa gcg atg ctc atg ggg aat tcc gat agt gat aat tat gac 672Gly Trp Lys Ala Met Leu Met Gly Asn Ser Asp Ser Asp Asn Tyr Asp210 215 220cga aac ata aca ttc cac cat aac tac ttc aaa aac tta aac tct cgt 720Arg Asn Ile Thr Phe His His Asn Tyr Phe Lys Asn Leu Asn Ser Arg225 230 235 240gta cct gcg tac cgt ttt gga aag gcg cac ttg ttt agc aat tac ttt 768Val Pro Ala Tyr Arg Phe Gly Lys Ala His Leu Phe Ser Asn Tyr Phe245 250 255gag aac att tta gaa aca ggc atc aat tca cgg atg gga gcg gaa atg 816Glu Asn Ile Leu Glu Thr Gly Ile Asn Ser Arg Met Gly Ala Glu Met260 265 270ctc gtt gaa cat aac gtt ttt gag aat gcc acc aac ccg cta gga ttc 864Leu Val Glu His Asn Val Phe Glu Asn Ala Thr Asn Pro Leu Gly Phe275 280 285tgg cat agc agt cga aca ggt tat tgg aat gta gcc aat aac cgc tat 912Trp His Ser Ser Arg Thr Gly Tyr Trp Asn Val Ala Asn Asn Arg Tyr290 295 300atc aat agc acg ggc agc atg ccg acc act tcc acg acc aat tat cga 960Ile Asn Ser Thr Gly Ser Met Pro Thr Thr Ser Thr Thr Asn Tyr Arg305 310 315 320cct cct tac ccc tat acg gtc aca cct gtt ggt gat gtg aaa tca gtt 1008Pro Pro Tyr Pro Tyr Thr Val Thr Pro Val Gly Asp Val Lys Ser Val325 330 335gtc aca cgt tat gcg gga gtt ggt gtc atc caa ccg taa 1047Val Thr Arg Tyr Ala Gly Val Gly Val Ile Gln Pro340 345<210>10<211>348<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>10Met Asp Lys Leu Tyr Ile Glu Lys Gly Ser Glu Ser Met Met Arg Ser1 5 10 15Ser Ile Val Lys Leu Val Ala Phe Ser Ile Val Phe Met Leu Trp Leu20 25 30Gly Val Ser Phe Gln Thr Ala Glu Ala Asn Thr Pro Asn Phe Asn Leu35 40 45Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr Thr Gly Gly Ala Gly Gly50 55 60Asp Val Val Thr Val Arg Thr Gly Asn Glu Leu Ile Asn Ala Leu Lys65 70 75 80Ser Lys Asn Pro Asn Arg Pro Leu Thr Ile Tyr Val Asn Gly Thr Ile85 90 95Thr Pro Asn Asn Thr Ser Asp Ser Lys Ile Asp Ile Lys Asp Val Ser100 105 110Asn Val Ser Ile Leu Gly Val Gly Thr Asn Gly Arg Leu Asn Gly Ile115 120 125Gly Ile Lys Val Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Thr130 135 140Ile His Glu Val His Thr Gly Asp Lys Asp Ala Ile Ser Met Ile Ser145 150 155 160Ile Glu Gly Pro Ser Arg Asn Ile Trp Val Asp His Asn Glu Leu Tyr165 170 175Ala Ser Leu Asn Val His Lys Asp His Tyr Asp Gly Leu Phe Asp Val
180 185 190Lys Arg Asp Ala Tyr Asn Ile Thr Phe Ser Trp Asn Tyr Val His Asp195 200 205Gly Trp Lys Ala Met Leu Met Gly Asn Ser Asp Ser Asp Asn Tyr Asp210 215 220Arg Asn Ile Thr Phe His His Asn Tyr Phe Lys Asn Leu Asn Ser Arg225 230 235 240Val Pro Ala Tyr Arg Phe Gly Lys Ala His Leu Phe Ser Asn Tyr Phe245 250 255Glu Asn Ile Leu Glu Thr Gly Ile Asn Ser Arg Met Gly Ala Glu Met260 265 270Leu Val Glu His Asn Val Phe Glu Asn Ala Thr Asn Pro Leu Gly Phe275 280 285Trp His Ser Ser Arg Thr Gly Tyr Trp Asn Val Ala Asn Asn Arg Tyr290 295 300Ile Asn Ser Thr Gly Ser Met Pro Thr Thr Ser Thr Thr Ash Tyr Arg305 310 315 320Pro Pro Tyr Pro Tyr Thr Val Thr Pro Val Gly Asp Val Lys Ser Val325 330 335Val Thr Arg Tyr Ala Gly Val Gly Val Ile Gln Pro340 345<210>11<211>2502<212>DNA<213>人工序列<220><221>CDS<222>(1)..(2 502)<220><223>人工序列的描述详见说明书正文<400>11atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt 48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc 96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc 144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg 192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag 240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca 288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta 336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc 384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac 432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct 480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt 528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa 576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tea atg 624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc 672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt 720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac 768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac 816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca 864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc 912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac 960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc 1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335gga gtc ggc aaa atc aat cca gct agc att gaa ggc aga cat cat aat 1056Gly Val Gly Lys Ile Asn Pro Ala Ser Ile Glu Gly Arg His His Asn340 345 350ggg aca aat ggg acg atg atg caa tac ttt gaa tgg cac ttg cct aat 1104Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His Leu Pro Asn355 360 365gat ggg aat cac tgg aat aga tta aga gat gat gct agt aat cta aga 1152Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser Asn Leu Arg370 375 380aat aga ggt ata acc gct att tgg att ccg cct gcc tgg aaa ggg act 1200Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp Lys Gly Thr385 390 395 400tcg caa aat gat gtg ggg tat gga gcc tat gat ctt tat gat tta ggg 1248Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly405 410 415gaa ttt aat caa aag ggg acg gtt cgt act aag tat ggg aca cgt agt 1296Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Arg Ser420 425 430caa ttg gag tct gcc atc cat get tta aag aat aat ggc gtt caa gtt 1344Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly Val Gln Val
435 440 445tat ggg gat gta gtg atg aac cat aaa gga gga gct gat gct aca gaa 1392Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp Ala Thr Glu450 455 460aac gtt ctt gct gtc gag gtg aat cca aat aac cgg aat caa gaa ata 1440Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn Gln Glu Ile465 470 475 480tct ggg gac tac aca att gag gct tgg act aag ttt gat ttt cca ggg 1488Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp Phe Pro Gly485 490 495agg ggt aat aca tac tca gac ttt aaa tgg cgt tgg tat cat ttc gat 1536Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr His Phe Asp500 505 510ggt gta gat tgg gat caa tca cga caa ttc caa aat cgt atc tac aaa 1584Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg Ile Tyr Lys515 520 525ttc cga ggt gat ggt aag gca tgg gat tgg gaa gta gat tcg gaa aat 1632Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp Ser Glu Asn530 535 540gga aat tat gat tat tta atg tat gca gat gta gat atg gat cat ccg 1680Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met Asp His Pro545 550 555 560gag gta gta aat gag ctt aga aga tgg gga gaa tgg tat aca aat aca 1728Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr Thr Asn Thr565 570 575tta aat ctt gat gga ttt agg atc gat gcg gtg aag cat att aaa tat 1776Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His Ile Lys Tyr580 585 590agc ttt aca cgt gat tgg ttg acc cat gta aga aac gca acg gga aaa 1824Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala Thr Gly Lys595 600 605gaa atg ttt gct gtt gct gaa ttt tgg aaa aat gat tta ggt gcc ttg 1872Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu Gly Ala Leu610 615 620gag aac tat tta aat aaa aca aac tgg aat cat tct gtc ttt gat gtc 1920Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val Phe Asp Val625 630 635 640ccc ctt cat tat aat ctt tat aac gcg tea aat agt gga ggc aac tat 1968Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly Gly Asn Tyr645 650 655gac atg gca aaa ctt ctt aat gga acg gtt gtt caa aag cat cca atg 2016Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys His Pro Met660 665 670cat gcc gta act ttt gtg gat aat cac gat tct caa cct ggg gaa tca 2064His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro Gly Glu Ser675 680 685tta gaa tca ttt gta caa gaa tgg ttt aag cca ctt gct tat gcg ctt 2112Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala Tyr Ala Leu690 695 700att tta aca aga gaa caa ggc tat ccc tct gtc ttc tat ggt gac tac 2160Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr Gly Asp Tyr705 710 715 720tat gga att cca aca cat agt gtc cca gca atg aaa gcc aag att gat 2208Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala Lys Ile Asp725 730 735cca atc tta gag gcg cgt caa aat ttt gca tat gga aca caa cat gat 2256Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr Gln His Asp740 745 750tat ttt gac cat cat aat ata atc gga tgg aca cgt gaa gga aat acc 2304Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu Gly Asn Thr755 760 765acg cat ccc aat tca gga ctt gcg act atc atg tcg gat ggg cca ggg 2352Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp Gly Pro Gly770 775 780gga gag aaa tgg atg tac gta ggg caa aat aaa gca ggt caa gtt tgg 2400Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly Gln Val Trp785 790 795 800cat gac ata act gga aat aaa cca gga aca gtt acg atc aat gca gat 2448His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile Asn Ala Asp805 810 815gga tgg gct aat ttt tca gta aat gga gga tct gtt tcc att tgg gtg 2496Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser Ile Trp Val820 825 830aaa cga 2502Lys Arg<210>l2<211>834<212>PRT<213>人工序列<223>人工序列的描述详见说明书正文<400>12Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335Gly Val Gly Lys Ile Asn Pro Ala Ser Ile Glu Gly Arg His His Asn340 345 350Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His Leu Pro Asn355 360 365Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser Asn Leu Arg370 375 380Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp Lys Gly Thr385 390 395 400Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly405 410 415Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Arg Ser420 425 430Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly Val Gln Val435 440 445Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp Ala Thr Glu450 455 460Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn Gln Glu Ile465 470 475 480Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp Phe Pro Gly485 490 495Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr His Phe Asp500 505 510Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg Ile Tyr Lys515 520 525Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp Ser Glu Asn530 535 540Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met Asp His Pro545 550 555 560Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr Thr Asn Thr565 570 575Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His Ile Lys Tyr580 585 590Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala Thr Gly Lys595 600 605Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu Gly Ala Leu610 615 620Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val Phe Asp Val625 630 635 640Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly Gly Asn Tyr645 650 655Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys His Pro Met660 665 670His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro Gly Glu Ser675 680 685Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala Tyr Ala Leu690 695 700Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr Gly Asp Tyr705 710 715 720Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala Lys Ile Asp
725 730 735Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr Gln His Asp740 745 750Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu Gly Asn Thr755 760 765Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp Gly Pro Gly770 775 780Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly Gln Val Trp785 790 795 800His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile Asn Ala Asp805 810 815Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser Ile Trp Val820 825 830Lys Arg<210>13<211>1134<212>DNA<213>人工序列<220><223>人工序列的描述详见说明书正文<220><221>CDS<222>(1)..(1134)<400>13atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt 48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc 96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc 144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg 192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag 240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca 288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta 336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc 384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac 432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct 480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145150 155 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt 528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa 576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg 624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc 672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt 720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac 768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac 816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca 864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc 912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac 960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc 1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335gga gtc ggc aaa atc aat cca gct agc aaa aga cat gcc gaa gga aca 1056Gly Val Gly Lys Ile Asn Pro Ala Ser Lys Arg His Ala Glu Gly Thr340 345 350ttt acg tca gac gtc tca tca tat tta gaa ggc cag gca gcc aaa gaa 1104Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu355 360 365ttc atc gca tgg tta gtc aaa ggc agg gga 1134Phe Ile Ala Trp Leu Val Lys Gly Arg Gly370 375<210>14<211>378<212>PRT<213>人工序列<223>人工序列的描述详见说明书正文<400>14Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335Gly Val Gly Lys Ile Asn Pro Ala Ser Lys Arg His Ala Glu Gly Thr340 345 350Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu355 360 365Phe Ile Ala Trp Leu Val Lys Gly Arg Gly370 375<210>15<211>1158<212>DNA<213>人工序列<220><223>人工序列的描述详见说明书正文<220><221>CDS<222>(1)..(1158)<400>15atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt 48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc 96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc 144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg 192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag 240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca 288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta 336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc 384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac 432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct 480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt 528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa 576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg 624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc 672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt 720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac 768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac 816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca 864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc 912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac 960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc 1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335gga gtc ggc aaa atc aat cca gct agc cca gaa cca aca cct gag ccc 1056Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro340 345 350aca aaa aga cat gcc gaa gga aca ttt acg tca gac gtc tca tca tat 1104Thr Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr355 360 365tta gaa ggc cag gca gcc aaa gaa ttc atc gca tgg tta gtc aaa ggc 1152Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly370 375 380agg gga 1158Arg Gly385<210>16<211>386<212>PRT<213>人工序列<223>人工序列的描述详见说明书正文<400>16Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290 295 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro340 345 350Thr Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr355 360 365Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly370375 380Arg Gly385<210>17<211>160<212>DNA<213>人(Homo sapiens)<220><221>CDS<222>(1)..(159)<400>17ttc gtc aac cag cat tta tgt ggc tca cat ctg gta gag gcc ctg tat 48Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1 5 10 15tta gtc tgt gga gag agg gga ttc ttt tat aca ccg aaa gcc gcg aaa 96Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys20 25 30ggc att gtt gaa cag tgt tgc aca tca atc tgt agc tta tat cag ctg 144Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu35 40 45gaa aat tac tgc aac t 160Glu Asn Tyr Cys Asn50<210>18<211>53<212>PRT<213>人(Homo sapiens)<400>18Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1 5 10 15Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys20 25 30Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu35 40 45Glu Asn Tyr Cys Asn50<210>19<211>1227<212>DNA<213>人工序列<220><223>人工序列的描述详见说明书正文<220><221>CDS<222>(1)..(1227)<400>19atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt 48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc 96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc 144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg 192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag 240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca 288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta 336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc 384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac 432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct 480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt 528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa 576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg 624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc 672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt 720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac 768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac 816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca 864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc 912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac 960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc 1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335gga gtc ggc aaa atc aat cca gct agc ccg gaa cca aca cca gag ccg 1056Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro340 345 350acc aaa agg ttc gtc aac cag cat tta tgt ggc tca cat ctg gta gag 1104Thr Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu355 360 365gcc ctg tat tta gtc tgt gga gag agg gga ttc ttt tat aca ccg aaa 1152Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys370 375 380gcc gcg aaa ggc att gtt gaa cag tgt tgc aca tca atc tgt agc tta 1200Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu385 390 395 400tat cag ctg gaa aat tac tgc aac taa 1227Tyr Gln Leu Glu Asn Tyr Cys Asn405<210>20<211>408<212>PRT<213>人工序列<223>人工序列的描述详见说明书正文<400>20Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala20 25 30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly35 40 45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr50 55 60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65 70 75 80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr85 90 95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val100 105 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile115 120 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His130 135 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145 150 155 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val165 170 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu180 185 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met195 200 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe210 215 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225 230 235 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp245 250 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn260 265 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser275 280 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly290 295 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305 310 315 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala325 330 335Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro340 345 350Thr Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu355 360 365Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys370 375 380Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu385 390 395 400Tyr Gln Leu Glu Asn Tyr Cys Asn
405<210>21<211>42<212>DNA<213>人工序列<220><223>人工序列的描述引物#LWN5494<400>21gtcgccgggg cggccgctat caattggtaa ctgtatctca gc42<210>22<211>64<212>DNA<213>人工序列<220><223>人工序列的描述引物#LWN5495<400>22gtcgcccggg agctctgatc aggtaccaag cttgtcgacc tgcagaatga ggcagcaaga 60agat 64<210>23<211>61<212>DNA<213>人工序列<220><223>人工序列的描述引物#LWN5938<400>23gtcggcggcc gctgatcacg taccaagctt gtcgacctgc agaatgaggc agcaagaaga 60t 61<210>24<211>35<212>DNA<213>人工序列<220><223>人工序列的描述引物#LWN5939<400>24gtcggagctc tatcaattgg taactgtatc tcagc35<210>25<211>35<212>DNA<213>人工序列<220><223>人工序列的描述引物#LWN7864<400>25aacagctgat cacgactgat cttttagctt ggcac35<210>26<211>37<212>DNA<213>人工序列<220><223>人工序列的描述引物#LWN7901<400>26aactgcagcc gcggcacatc ataatgggac aaatggg 37<210>27<211>39<212>DNA<213>人工序列<220><223>人工序列的描述引物Pecl.B.lich.upper.SacII<400>27ctaactgcag ccgcggcagc ttctgcctta aactcgggc39<210>28<211>42<212>DNA<213>人工序列<220><223>人工序列的描述引物Pecl.B.lich.lower.NotI<400>28gcgttgagac gcgcggccgc tgaatgcccc ggacgtttca cc42<210>29<211>105<212>DNA<213>人工序列<220><223>人工序列的描述引物145424.正向.NheI<400>29gacaatgtcg acaatgtaaa atcaatcgtc aagcaaaatg ccggagtcgg caaaatcaat 60ccagctagca ttgaaggcag acatcataat gggacaaatg ggacg 105<210>30<211>22<212>DNA<213>人工序列<220><223>人工序列的描述引物101450.反向<400>30catggtgaac caaagtgaaa cc 22<210>31<211>78<212>DNA<213>人工序列<220><223>人工序列的描述引物149217.正向.NheI<400>31tgtttgctag caaaagacat gccgaaggaa catttacgtc agacgtctca tcatatttag 60aaggccaggc agccaaag 78<210>32<211>70<212>DNA<213>人工序列<220><223>人工序列的描述引物149216.反向.EagI<400>32gcaaacggcc gaaagcttat cccctgcctt tgactaacca tgcgatgaat tctttggctg 60cctggccttc70<210>33<211>60<212>DNA<213>人工序列<220><223>人工序列的描述引物159639.正向.NheI<400>33ccagctagcc cagaaccaac acctgagccc acaaaaagac atgccgaagg aacatttacg 60<210>34<211>22<212>DNA<213>人工序列<220><223>人工序列的描述引物101450.反向<400>34catggtgaac caaagtgaaa cc 22<210>35<211>36<212>DNA<213>人工序列<220><223>人工序列的描述引物B5456H02.反向<400>35ggtgttggtt ctgggctagc tggattgatt ttgccg 36<210>36<211>22<212>DNA<213>人工序列<220><223>人工序列的描述引物142670.正向<400>36cagcgataat tacaacagga cg 22<210>37<211>126<212>DNA<213>人工序列<220><223>人工序列的描述引物Pecl.ISFUS.NheI.upper(#149171)<400>37catcatgcta gcccggaacc aacaccagag ccgaccaaaa ggttcgtcaa ccagcattta 60tgtggctcac atctggtaga ggccctgtat ttagtctgtg gagagagggg attcttttat 120acaccg126<210>38<211>120<212>DNA<213>人工序列<220><223>人工序列的描述引物Pecl.ISFUS.NotI.Lower(#149172)<400>38gcgttgagac gcggccgctt agttgcagta attttccagc tgatataagc tacagattga 60tgtgcaacac tgttcaacaa tgcctttcgc ggctttcggt gtataaaaga atcccctctc 120
权利要求
1.一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽。
2.一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,含至少2个氨基酸的接头,用于蛋白酶剪切的靶位点,和外源多肽。
3.权利要求1或2的细胞,其中所述细胞为革兰氏阳性微生物细胞。
4.权利要求1-3中任一项的细胞,其中所述细胞为芽孢杆菌细胞。
5.权利要求1-4中任一项的细胞,其中所述细胞选自地衣芽孢杆菌、Bacillus clausii、短芽孢杆菌、解淀粉芽孢杆菌、枯草芽孢杆菌、迟缓芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、凝固芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、苏云金芽孢杆菌、和Bacillus agaradhaerens。
6.权利要求1-5中任一项的细胞,其中所述用于蛋白酶剪切的靶位点是由蛋白酶识别并切割的氨基酸序列。
7.权利要求6的细胞,其中所述用于蛋白酶剪切的靶位点是氨基酸序列Lys-Arg(KR)。
8.权利要求6的细胞,其中所述用于蛋白酶剪切的靶位点是氨基酸序列Ile-Glu-Gly-Arg(IEGR)。
9.权利要求1-5中任一项的细胞,其中所述用于蛋白酶剪切的靶位点是当所融合的多肽被所述细胞分泌时被切割的氨基酸序列。
10.权利要求1-5中任一项的细胞,其中所述用于蛋白酶剪切的靶位点是能被化学化合物切割的氨基酸序列。
11.权利要求10的细胞,其中所述化学化合物是溴化氰或羟胺。
12.权利要求1-11中任一项的细胞,其中所述果胶酸裂解酶选自以下果胶酸裂解酶,这些酶含有选自SEQ ID 2、SEQ ID 4、SEQ ID 6、SEQ ID 8、和SEQID 10的氨基酸序列。
13.权利要求1-12中任一项的细胞,其中所述果胶酸裂解酶是一种同系物,其与含有选自SEQ ID 2、SEQ ID 4、SEQ ID 6、SEQ ID 8、和SEQ ID10的氨基酸序列的果胶酸裂解酶具有70%的氨基酸序列相似性。
14.权利要求2-13中任一项的细胞,其中出现在接头中的氨基酸残基至少25%为脯氨酸。
15.权利要求2-14中任一项的细胞,其中所述接头依次包含氨基酸的至少一个循环重复Pro-Glu-Pro-Thr,Glu-Pro-Thr-Pro,Pro-Thr-Pro-Glu,或Th-Pro-Glu-Pro(PEPT,EPTP,PTEP,或TPEP)。
16.权利要求2-13中任一项的细胞,其中所述接头包含氨基酸序列Ile-Glu-Gly-Arg(IEGR)的至少一个重复。
17.权利要求1-16中任一项的细胞,其中所述外源多肽选自激素,功能型激素类似物,酶和人工多肽。
18.权利要求1-16中任一项的细胞,其中所述外源多肽为包含SEQ ID12中350-834位所示氨基酸序列的α-淀粉酶。
19.权利要求1-16中任一项的细胞,其中所述外源多肽为包含SEQ ID14中348-378位或SEQ ID 16中356-386位所示氨基酸序列的人类GLP-1(7-37)激素类似物。
20.权利要求1-16中任一项的细胞,其中所述外源多肽为包含SEQ ID18中所示氨基酸序列的单链人类胰岛素(MI3)。
21.权利要求1-16中任一项的细胞,其中所述外源多肽包含含有SEQID 20中356-408位所示氨基酸序列的单链人类胰岛素(MI3)。
22.一种生产蛋白的方法,该方法包括以下步骤i)构建合适的细胞,其包含一种能编码融合在一个开放读码框(ORF)内的至少以下依次排列之元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽,ii)在适于生长和分泌的条件下培养步骤i)所构建的细胞,和iii)回收含有外源多肽的蛋白。
23.权利要求22的方法,其进一步包括在回收所述外源多肽之前或之后对所述蛋白进行蛋白酶剪切的步骤。
全文摘要
本发明提供了一种能改进融合蛋白的生产的细胞,所述融合蛋白包含一种与外源多肽融合的天然果胶酸裂解酶,本发明还提供了用于生产所述融合蛋白的方法。
文档编号C07K14/62GK1353762SQ00808288
公开日2002年6月12日 申请日期2000年5月31日 优先权日1999年6月2日
发明者迈克尔·D·拉斯马森, 马兹·E·比约恩瓦德, 伊凡·迪尔斯 申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1