合成前导肽序列的制作方法

文档序号:3549040阅读:491来源:国知局

专利名称::合成前导肽序列的制作方法
技术领域
:本发明涉及用于在酵母中分泌多肽的合成前导肽序列。酵母有机体能产生多种蛋白质,这些蛋白质在胞内合成,但具有胞外功能。这种胞外蛋白质被称为分泌性蛋白质。这种分泌性蛋白最初以前体或前蛋白体形式在胞内表达,所述前体带有一个前序列,以确保有效地引导表达产物通过内质网(ER)膜。所述前序列(一般被称为信号肽)通常在转运过程中从目的产物上断裂下来。该蛋白质一旦进入分泌途径,就被转运到高尔基体,再从高尔基体循不同途径进入诸如细胞液泡或细胞膜之类的细胞隔室中,或是排出细胞外,分泌到外部培养基里(Pfeffer,S.R.和Rothman)J.E.Ann.Rev.Biochem.56(1987),829-852)。业已提出了几种在酵母中表达并分泌与之异源的蛋白质的方法。欧洲专利申请公开NO.88632中披露了一种表达、加工和分泌与酵母异源的蛋白质的方法,该方法包括用一种具有编码目的蛋白质和信号肽的DNA的表达载体转化酵母有机体;制备所述转化有机体的培养物;生长该培养物并从培养基中回收所述蛋白质。所述信号肽可以是目的蛋白质本身的信号肽、一种异源信号肽或天然信号肽与异源信号肽的杂合体。采用与酵母异源的信号肽所遇到的问题可能是,异源信号肽不能确保有效转运和/或在该信号肽之后断裂。酿酒酵母(Saccharomycescerevisiae)MFα1(α-因子)是以有165个氨基酸的前原形式合成的,它包括19个氨基酸的信号肽或前肽,接下来是一个有64个氨基酸的“前导序列”或前肽,它包括3个N-连接的糖基化位点,后接(LysArg((Asp/Glu)Ala)2-3α-因子)4(Kurjan,J.和Herskowitz,I.Cell30(1982)933-943)。这种前原MFα1的信号前导序列部分已被广泛用于在酿酒酵母中合成并分泌异源蛋白质。与酵母同源的信号/前导肽的应用披露于下列专利文件中美国专利说明书NO.4,546,082,欧洲专利申请公开号116201、123294、123544、163529和123289,以及丹麦专利申请NO.3614/83。EP123289披露了利用酿酒酵母α-因子前体分泌外源蛋白的方法,而WO84/01153披露了用酿酒酵母转化酶信号肽分泌外源蛋白质的方法,DK3614/83披露了用酿酒酵母PH05信号肽分泌外源蛋白质的方法。美国专利说明书NO.4,546,082、EP16201、EP123294、EP123544和EP163529披露了将来自酿酒酵母的α-因子信号-前导序列(MFα1或MFα2)用于在酵母中表达的异源蛋白质的分泌过程的方法。该方法通过把编码酿酒酵母MFα1信号/前导序列的DNA序列融合在编码目的蛋白质的基因的5′末端,证实了该目的蛋白质的分泌和加工。EP206783披露了一种利用一种α-因子前导序列由酿酒酵母分泌多肽的系统,所述前导序列已被截短,去掉了上述天然前导序列上的4个α-因子单位,留下前导肽本身,通过α-因子加工位点LysArgGluAlaGluAla同一种异源多肽融合。这种结构被证明能导致较小肽(少于50个氨基酸)的有效加工。为了分泌和加工较大的多肽,已经过天然α-因子的前导序列截短,在前导肽和多肽之间留下一或两个α-因子单位。多种分泌性蛋白质都要经由一个蛋白酶解加工系统进行加工,该系统可以裂解位于两个连续的碱性氨基酸的羧基末端的肽键。这种酶解活性发生在酿酒酵母中,由KEX2基因编码(Julius,D.A.等,Cell37(1984b)1075)。为了分泌活性酿酒酵母交配因子α1(MFα1或α-因子),需要由KEX2蛋白酶对所述产物进行加工,但KEX2不参与活性酿酒酵母交配因子α的分泌过程。在培养用一种在上述参考文献中构建的载体转化的酵母有机体时,有时会实现希望分泌的多肽的分泌和正确加工。不过,在多数情况下分泌的水平极低或无分泌,或者上述蛋白酶解加工是不正确的或不完全的。因此,本发明的目的是提供能确保多肽更有效地表达和/或加工的前导肽。令人吃惊的是,业已发现一种能在酵母中以高产率分泌多肽的新型前导肽。因此,本发明涉及一种包括以下序列的DNA表达盒5′-P-SP-LS-PS-*基因*-(T)i-3′其中,P是一个启动子序列,SP是一个编码一种信号肽的DNA序列,LS是一个编码一种具有通式I的前导肽的DNA序列GlnProIle(Asp/Glu)(Asp/Glu)X1(Glu/Asp)X2AsnZ(Thr/Ser)X3(I)其中,X1是一个肽键或一个可编码氨基酸;X2是一个肽键、一个可编码氨基酸或一个有多达4个可编码氨基酸的序列,这些氨基酸可以相同或不同,Z是除Pro以外的可编码氨基酸;和X3是一个有4~30个可编码氨基酸的序列,这些氨基酸可以相同或不同;PS是编码一个加工位点的DNA序列;*基因*是编码一种多肽的DNA序列;T是一个终止序列;而i是0或1。在本文中,“前导肽”这一表述方式是指一种肽,其功能是把表达的多肽从内质网引导至高尔基体,并进一步引导至分泌小泡,以便分泌到培养基里(即表达的多肽被输出到细胞壁外或至少穿过细胞膜而进入细胞的壁膜间隙)。与前导肽连用的“合成”一词是指这种前导肽不是天然存在的。“信号肽”一词是指一种主要呈疏水性的前序列,以在酵母中表达的一种胞外蛋白质的前体的N-末端序列形式出现。该信号肽的功能是让表达的蛋白质分泌到内质网里。信号肽通常就是在这一过程中断裂下来的。该信号肽可以与产生上述蛋白质的酵母有机体异源或同源。“多肽”指一种异源多肽,即不是由宿主酵母有机体天然产生的多肽;也可以指一种同源多肽,即由宿主酵母天然产生的多肽及其任何前体形式。在一个优选实施方案中,本发明的表达盒编码一种异源多肽。“可编码氨基酸”是指可以由核苷酸的三联体(“密码子”)编码的氨基酸。在本说明书的氨基酸序列中,两个氨基酸的三字母密码由一条斜线分开,并在括号中给出,例如(Asp/Glu),它用于表示所述序列中的相应位置上为这两个氨基酸中的一个或另一个。另一方面,本发明涉及一种在酵母中生产一种多肽的方法,该方法包括在合适的培养基中培养一种酵母细胞,该细胞能够表达一种多肽并用一种包括本发明的一个前导肽序列的上述酵母表达载体转化过,以实现所述多肽的表达与分泌,此后,从培养基中回收所述多肽。下面结合附图对本发明做进一步说明。其中图1是质粒pAK492的示意图;图2是编码信号肽/前导序列/MI3胰岛素前体的DNA序列的一部分;图3表示质粒pAK546的结构;图4表示前导序列SEQIDNo.4的氨基酸序列及其编码DNA序列;图5表示酿酒酵母表达质粒pAK546编码YAP3信号肽,前导序列SEQIDNo.4和MI3胰岛素前体的DNA序列和所编码的氨基酸序列;图6表示前导序列SEQIDNo.6的氨基酸序列及其编码DNA序列;图7表示前导序列SEQIDNo.8的氨基酸序列及其编码DNA序列;图8表示前导序列SEQIDNo.17的氨基酸序列及其编码DNA序列;图9表示前导序列SEQIDNo.16的氨基酸序列及其编码DNA序列;图10表示前导序列SEQIDNo.19的氨基酸序列及其编码DNA序列;图11表示前导序列SEQIDNo.20的氨基酸序列及其编码DNA序列;图12表示前导序列SEQIDNo.21的氨基酸序列及其编码DNA序列;图13表示pAK527的DNA片段,它在SEQIDNo.4和6的构建中被用作直接模板;图14表示pAK531的DNA片段,它在SEQIDNo.8的构建中被用作直接模板;图15表示pAK555的DNA片段,它在SEQIDNo.16和17的构建中被用作直接模板;图16表示pAK559的DNA片段,它在SEQIDNo.19和20的构建中被用作直接模板;图17表示pAK562的DNA片段,它在SEQIDNo.21的构建中被用作直接模板;图18表示前导序列SEQIDNo.27的氨基酸序列及其编码DNA序列SEQIDNo.66;图19表示一种N-末端延伸的MI3胰岛素前体的氨基酸序列SEQIDNo.70,及其编码DNA序列SEQIDNo.71;图20表示前导序列SEQIDNo.67的氨基酸序列及其编码DNA序列SEQIDNo.69;图21表示pAK614的DNA片段SEQIDNo.72,它在SEQIDNo.27的构建中被用作直接模板;以及图22表示pAK625的DNA片段SEQIDNo.73,它在SEQIDNo.67的构建中被用作直接模板。当通式I中的X1表示氨基酸时,它最好是Ser、Thr或Ala。当通式I中的X2表示氨基酸时,它最好是Ser、Thr或Ala。当通式I中的X2表示有两个氨基酸的序列时,它最好是SerIle。当通式I中的X2表示有3个氨基酸的序列时,它最好是SerAlaIle。当通式I中的X2表示有4个氨基酸的序列时,它最好是SerPheAlaThr。在一种优选实施方案中,X3是一种通式II的氨基酸序列X4-X5-X6(II)其中,X4是有1~21个可编码氨基酸的一种序列,这些氨基酸可以相同或不同;X5是Pro或是氨基酸序列ValAsnLeu或LeuAlaAs-nValAlaMetAla中的一个;而X6是有1~8个可编码氨基酸的序列,这些氨基酸可以相同或不同。在通式II中,X4最好是一种氨基酸序列,它包括基序Leu-ValAsnLeu、SerValAsnLeu、MetAlaAsp、ThrGluSer、ArgPheAlaThr或ValAlaMetAla中的一个或多个;或者X4是包括序列AsnSerThr或AsnThrThr的一种氨基酸序列;或者X4是包括下述序列的一种氨基酸序列(Ser/Leu)ValAsnLeu,(Ser/Leu)ValAsnLeuMetAlaAsp,(Ser/Leu)ValAsnLeuMetAlaAspAsp,(Ser/Leu)ValAsnLeuMetAlaAspAspThrGluSer,(Ser/Leu)ValAsnLeuMetAlaAspAspThrGluSerIle或(Ser/Leu)ValAsnLeuMetAlaAspAspThrGluSerArgPheAlaThr;或者X4是包括以下序列的一种氨基酸序列Asn(Thr/Ser)ThrLeu,Asn(Thr/Ser)ThrLeuAsnLeu或Asn(Thr/Ser)ThrLeuValAsnLeu;或这些序列的任意组合。在通式II中,X5最好是Pro或是一种氨基酸序列,该氨基酸序列包括序列ValAsnLeu、LeuAlaAsnValAlaMetAla、LeuAspVal-ValAsnLeuProGly或LeuAspValValAsnLeuIleSerMet。在通式II中,当X6表示一个氨基酸时,它最好是Ala、Gly、Leu、Thr、Val或Ser。当通式II中的X6表示有2个氨基酸的序列时,它最好是GlyAla或SerAla。当通式II中的X6表示有3个氨基酸的序列时,它最好是AlaValAla。当通式II中的X6表示有8个氨基酸的序列时,它最好是GlyAlaAspSerLysThrValGlu。由DNA序列LS编码的优选前导肽的例子有SEQIDNo.1GlnProIleAspGluAspAsnAspThrSerValAsnLeuProAla;SEQIDNo.2GlnProIleAspAspGluAsnThrThrSerValAsnLeuProAla;SEQIDNo.3GlnProIleAspAspGluSerAsnThrThrSerValAsnLeuProAla;SEQIDNo.4GlnProIleAspAspGluAsnThrThrSerValAsnLeuProVal;SEQIDNo.5GlnProIleAspAspThrGluAsnThrThrSerValAsnLeuProAla;SEQIDNo.6GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro-Ala;SEQIDNo.7GlnProIleAspAspGluAsnThrThrSerValAsnLeuMetAla;SEQIDNo.8GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro-GlyAla;SEQIDNo.9GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-Ala;SEQIDNo.10GlnProIleAspAspThrGluSerAsnThrThrSerValAsnValPro-Thr;SEQIDNo.11GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnValPro-Thr;SEQIDNo.12GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro-Thr;SEQIDNo.13GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnValPro-GlyAla;SEQIDNo.14GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaProAlaValAla;SEQIDNo.15GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AspLeuAlaValGlyLeuProGlyAla;SEQIDNo.16GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuProGly-Ala;SEQIDNo.17GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-ProGlyAla;SEQIDNo.18GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnLeuPro-GlyAla;SEQIDNo.19GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn-LeuProLeu;SEQIDNo.20GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuAlaAsn-ValAlaMetAla;SEQIDNo.21GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuValAsn-LeuProGlyAla;SEQIDNo.22GlnProIleAspAspThrGluSerPheAlaThrAsnThrThrLeuVal-AsnLeuProGlyAla;SEQIDNo.23GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuVal-AsnLeuProLeu;SEQIDNo.24GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAsp-ValValAsnLeuProGlyAla;SEQIDNo.25GlnProIleAspAspThrGluSerAlaAlaIleAsnThrThrLeuVal-AsnLeuProGlyAla;SEQIDNo.26GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn-LeuAlaAsnValAlaMetAla;SEQIDNo.27GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAspVal-ValAsnLeuIleSerMetAla;SEQIDNo.28GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAsnThrThrGluSerArgPheAlaThrAsnThrThrLeuAspVal-ValAsnLeuIleSerMetAla;和SEQIDNo.67GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAlaLeu-AspValValAsnLeuIleSerMetAlaLysArg.由DNA序列LS编码的特别优选的前导肽是SEQIDNo.15GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AspLeuAlaValGlyLeuProGlyAla;SEQIDNo.16GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuProGly-Ala;SEQIDNo.17GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-ProGlyAla;SEQIDNo.18GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnLeuPro-GlyAla;SEQIDNo.19GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn-LeuProLeu;SEQIDNo.20GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuAlaAsn-ValAlaMetAla;SEQIDNo.21GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuValAsn-LeuProGlyAla;SEQIDNo.22GlnProIleAspAspThrGluSerPheAlaThrAsnThrThrLeuVal-AsnLeuProGlyAla;SEQIDNo.23GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuVal-AsnLeuProLeu;SEQIDNo.24GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAsp-ValValAsnLeuProGlyAla;SEQIDNo.25GlnProIleAspAspThrGluSerAlaAlaIleAsnThrThrLeuVal-AsnLeuProGlyAla;SEQIDNo.26GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn-LeuAlaAsnValAlaMetAla;和SEQIDNo.28GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAsnThrThrGluSerArgPheAlaThrAsnThrThrLeuAspVal-ValAsnLeuIleSerMetAla.SEQIDNo.67GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet-AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAlaLeu-AspValValAsnLeuIleSerMetAlaLysArg.所述信号序列(SP)能够编码任何能确保有效引导表达的多肽进入细胞的分泌途径的信号肽。所述信号肽可以是一种天然存在的信号肽或其功能部分,或者是一种合成肽。已发现的合适信号肽为α-因子信号肽、小鼠唾液淀粉酶信号肽、修饰的羧肽酶信号肽、酵母BAR1信号肽或HumicolaLanuginosa脂肪酶信号肽或其衍生物。小鼠唾液淀粉酶信号肽序列由Hagenbuchle,O.等披露(Nature289(1981),643-646)。羧肽酶信号序列由Valls,L.A.等披露(Cell48(1987),887-897)。BAR1信号肽披露于WO87/02670中。酵母天冬氨酸蛋白酶3信号肽披露于丹麦专利申请No.0828/93中。由DNA序列PS编码的酵母加工位点可以是Lys和Arg的任意成对组合,如LysArg、ArgLys、ArgArg或LysLys,它使得酿酒酵母的KEX2蛋白酶或其它酵母菌种的相同蛋白酶能够加工所述多肽(Julius,D.A.等,Cell37(1984),1075)。如果KEX2加工不方便,例如,由于在目的产物内部出现2个连续的碱性氨基酸而导致该多肽产物断裂的话,可以选择另一种蛋白酶的加工位点,它包括该多肽产物中所没有的氨基酸组合,例如FXa的加工位点IleGluGlyArg(参见Sambrook,J.,Fritssh,E.F.和Maniatis,T.,MolecularCloningALaboratoryManual,ColdSpringHarborLaboratoryPress,NewYork,1989)。由本发明方法生产的蛋白质可以是任何蛋白,该蛋白可有利地在酵母中生产。这种蛋白质的例子有异源蛋白质,如抑蛋白酶肽、组织因子途径抑制剂或其它蛋白酶抑制剂、胰岛素或胰岛素前体、人或小牛生长激素、白介素、胰高血糖素、GLP-1、IGF-I、IGF-II、组织纤溶酶原激活物、转化生长因子α或β、血小板衍生的生长因子、酶或其功能性类似物。在本文中,“功能性类似物”一词是指与某种天然蛋白质具有类似功能的一种蛋白质(是指与天然蛋白质性质有关,而不是生物活性水平)。该蛋白质可在结构上与天然蛋白相似,并可以通过以下方式由天然蛋白衍生而来在天然蛋白的C-末端或N-末端或同时在两末端增加一个或多个氨基酸;在天然氨基酸序列一个或多个不同位点上取代一个或多个氨基酸;在天然蛋白的一端或两端或该氨基酸序列中的一个或几个位点上缺失一个或多个氨基酸;或在天然氨基酸序列中的一个或多个位点上插入一个或多个氨基酸。对上述几种蛋白质来说,这类修饰作用是公知的。而且,还可用本发明方法生产其它蛋白质的前体或中间产物。这种前体的一个例子是MI3胰岛素前体,它包括氨基酸序列B(1-29)AlaAlaLysA(1-21),其中A(1-21)是人胰岛素的A链,而B(1-29)是人胰岛素的B链,B链上缺少了Thr(B30)。编码前导序列的优选DNA结构示于图4-12中,或者是其适当的修饰形式。对上述DNA序列进行适当修饰的例子有核苷酸取代,它不会导致另一种氨基酸序列的蛋白质出现,但会影响插入了该DNA结构的酵母有机体的密码子使用;或核苷酸取代,它会导致不同氨基酸序列的出现,因此,可能出现不同的蛋白质结构。可行修饰的其它例子有将一个或多个密码子插入上述序列中,在该序列的任一端增加一个或多个密码子,以及在该序列的任一端或在该序列中缺失一个或多个密码子。所述重组表达载体带有这样的表达盒5′-P-SP-LS-PS-*基因*-(T)i-3′其中,P、SP、LS、*基因*、T和i的含义与上文相同,它可以是能在酵母有机体内复制的任何载体。该启动子可以是在酵母中具有转录活性的任何DNA序列,并可由编码与酵母同源或异源的蛋白质的基因衍生而来。该启动子最好由编码一种与酵母同源的蛋白质的基因衍生而来。合适启动子的例子有酿酒酵母MFα1、TPI、ADH或PGK启动子。上述序列最好还应是与一个合适的终止子,如TPI终止子可操作连接(参见Alber,T.和Kawasaki,G.,J.Mol.Appl.Genet.1(1982)419-434)。本发明的重组表达载体还包括一个使得该载体能在酵母中复制的DNA序列。这种序列的例子有酵母质粒2μ复制基因REP1-3和复制起点。这种载体还可包括一个选择标记,例如,由Russell,P.R.所披露的粟酒裂殖酵母(Schizosaccharomyces)TPI基因(Gene40(1985)125-130)。用于连接序列5′-P-SP-LS-PS-*基因*-(T)i-3′的方法,以及将其插入带有酵母复制所需的信息的合适的酵母载体中的方法是本领域技术人员所熟知的(例如Sambrook,J.,Fritsch,E.F.和Maniatis,T.,在所引书中)。应当知道,所述载体既可以通过首先制备带有5′-P-SP-LS-PS-*基因*-(T)i-3′完整序列的DNA结构,接着再将该片段插入合适的表达载体构建而成,又可以通过依次将DNA片断插入带有个体因子的遗传信息(如启动子序列、信号肽、前导序列GlnProIle(Asp/Glu)(Asp/Glu)X1(Glu/Asp)X2AsnZ(Thr/Ser)X3、加工位点、多肽,以及终止序列(如果有的话))的合适载体,接着进行连接。本发明方法所用的酵母有机体可以是任何合适的酵母有机体,在培养时这种酵母能产生大量的目的多肽。举例来说,合适的酵母有机体可以是酿酒酵母、克鲁弗酵母(SaccharomycesKluyveri)、粟酒裂殖酵母或葡萄汁酵母(Saccharomycesuvarum)酵母菌的菌株。举例来说,所述酵母细胞的转化可以这样实现先制成原生质体,接着再用已知方法转化。用于培养所述细胞的培养基可以是适于生长酵母有机体的任何常规培养基。可用常规方法从培养基中回收分泌的多肽,这些多肽大部分以正确加工形式存在于培养基中。所述回收方法包括以下步骤通过离心或过滤从培养基中分离酵母细胞;用盐,如硫酸铵沉淀上清液或滤液中的蛋白质成分;随后,用各种层析方法,如离子交换层析、亲和层析等方法进行纯化。在下面的实施例中将对本发明做进一步说明,这些实施例并不构成对所要求保护的发明范围的限定。实施例质粒和DNA材料所有表达质粒都是C-POT型的。这种质粒披露于欧洲专利申请No.171142中,其特征是带有用于质粒选择和稳定的非洲粟酒裂殖酵母丙糖磷酸异构酶基因(POT)。带有POT-基因的质粒可以从一种保藏的大肠杆菌(E.Coli)菌株(ATCC39685)中获取。这种质粒还带有酿酒酵母丙糖磷酸异构酶启动子和终止子(PTPI和TTPI)。除了包括编码信号/前导序列/产物的区在内的由EcoRI-XbaI限制位点所限定的区域之外,这种质粒与pMT242(Egel-Mi-tani,M.等,Gene73(1988),113-120)相同(见图1)。在实施例中所述的构建前导序列的PCR反应中,质粒pAK527、pAK531、pAK555、pAK559、pAK562、pAK614和pAK625被用作DNA模板。用作直接模板的合成DNA片段如图13-17所示。除了所示DNA区域之外,这些质粒与图1所示的pAK492相同。合成DNA片段是在一台自动DNA合成仪(AppliedBiosystemsmodel380A)合成的,采用亚磷酰胺化合物和市售试剂(Beaucage,S.L.和Caruthers,M.H.,TetrahedronLetters22(1981)1859-1869)。其它所有方法和材料在本领域都是公知的(例如,Sambrook,J.,Fritsch,E.F.和Maniatis,T.,MolecularCloningALaboratoryMan-ual,ColdSpringHarborLaboratoryPress,NewYork,1989)。实施例1合成用于在酿酒酵母(菌株yAK546)中表达MI3胰岛素前体的前导序列SEQIDNo.4。前导序列SEQIDNo.4的氨基酸序列如下GlnProIleAspAspGluAsnThrThrSerValAsnLeuProVal合成了以下寡核苷酸#945′-TAAATCTATAACTACAAAAAACACATA-3′SEQIDNo.29#3335′-GACTCTCTTAACTGGCAAGTTGACA-3′SEQIDNo.30#3125′-AAGTACAAAGCTTCAACCAAGTGAGAACCACACAAGTGTTGGTTAACGAATCTCTT-3′SEQIDNo.31#18455′-CATACACAATATAAACGACGG-3′SEQIDNo.32采用GeneAmpPCR试剂盒(PerkinElmer,761MainAvewalk,CT06859,USA),按照生产商提供的使用说明进行以下聚合酶链式反应(PCR)。在反应期间,用100μl矿物油(SigmaChemicalCO,St.LouisMO,USA覆盖在PCR混合物上聚合酶链式反应No.15μl寡核苷酸#94(50pmol)5μl寡核苷酸#333(50pmol)10μl10×PCR缓中液16μldNTP混合液0.5μlTaq酶0.5μlpAK527质粒(图13)作为模板(0.2μgDNA)63μl水总共进行12个循环,一个循环包括94℃下1分钟;37℃下2分钟;72℃下3分钟。然后将PCR混合物加注到2%琼脂糖凝胶上,并采用标准技术电泳(Sambrook,J.,Fritsch,E.F.和Maniatis,T.,见所引书目)。把所得到的DNA片段从琼脂糖凝胶上切下来,并用GeneClean试剂盒(Bio101inc.,POBOX2284,LaJolla,CA92038,USA)按照生产商的使用说明分离DNA片断。聚合酶链式反应No.25μl寡核苷酸#312(50pmol)5μl寡核苷酸#94(50pmol)10μl10×PCR缓冲液16μldNTP混合液0.5μlTaq酶10μl来自PCRNo.1的纯化DNA片段53.5μl水总共进行12个循环,一个循环包括94℃下1分钟;37℃下2分钟;72℃下3分钟。使用GeneClean试剂盒(Bio101inc.,POBOX2284,LaJolla,CA92038,USA)按照生产商的使用说明分离并提纯聚合酶链式反应No.2的DNA片段。将纯化的PCRDNA片段溶于10μl水和限制酶缓冲液中,并按照标准技术(Sambrook,J.,Fritsch,E.F.和Maniatis,T.见所引书目),在15μl的总体积中用限制酶Asp718和HindIII进行酶切。在琼脂糖凝胶上对167bp的Asp718/HindIIIDNA片段进行电泳处理,并用上所述GeneClean试剂盒进行提纯。酿酒酵母表达质粒pAK492(如图1所示)是上述质粒pMT742的衍生物,其中,编码信号/前导序列/胰岛素前体的片段已被图2所示的EcoRI-XbaI片段所取代。该片段是在一台AppliedBiosystemDNA合成仪上按照生产商的使用说明合成的。用限制酶Asp718和XbaI对质粒pAK492进行酶切,并分离10986pb的载体片段。用限制酶HindIII和XbaI对质粒pAK492进行酶切,并分离编码MI3胰岛素前体的一部分的140bp的DNA片段。在标准条件下(Sambrook,J.,Fritsch,E.F.和Maniatis,T.,见所引书目),用T4DNA连接酶将上述三个DNA片段连接在一起。然后,把连接混合物转化入感受态大肠杆菌菌株(R-,M+),并通过氨苄青霉素抗性鉴定转化体。用标准DNA小量制备技术(Sambrook,J.,Fritsch,E.F.和Maniatis,T.,见下文)从所得到的大肠杆菌菌落中分离质粒,并用合适的限制酶,即EcoRI、XbaI、NcoI和HindIII进行检测。采用引物#94对选择的质粒pAK546进行DNA序列分析(Sequenase,U.S.BiochemicalCorp.),结果表明该质粒带有编码前导序列SEQIDNo.4的DNA序列。编码前导序列SEQID,No.4的DNA序列如图4所示。将质粒pAK546转化入欧洲专利申请公开号No.214826中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK546。该表达质粒的蛋白质编码区的DNA序列如图5所示。实施例2合成用于在酿酒酵母(菌株yAK531)中表达MI3胰岛素前体的前导序列SEQIDNo.6。前导序列SEQIDNo.6的氨基酸序列如下GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuProAla合成了以下寡核苷酸#3315′-GAATCTCTTAGCTGGCAAGTTGACAGAAGTAGTGTTAGTTTCAGAGTCGTCAATT-3′SEQIDNo.33按照实施例1方法进行聚合酶链式反应,所不同的是,用寡核苷酸#331代替寡核苷酸#333。按照实施例1方法在琼脂糖凝胶上对168bp的Asp718/HindIIIDNA片段进行电泳和纯化。按照实施例1的方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达载体中。用实施例1的方法对选择的质粒pAK531进行DNA序列分析,证实其带有编码前导序列SEQIDNo.6的DNA序列。关于编码前导序列SEQIDNo.6的DNA序列,见图6。将质粒pAK531转化入披露于欧洲专利申请86306721.1中的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK531。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示序列相同。实施例3合成用于在酿酒酵母(菌株yAK547)中表达MI3胰岛素前体的前导序列SEQIDNo.8。前导序列SEQIDNo.8的氨基酸序列如下GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuProGlyAla合成了以下寡核苷酸#3455′-AACGAATCTCTTAGCACCTGGCAAGTTGACAGAAGT-3′SEQIDNo.34按照实施例1中所述的方法进行聚合酶链式反应,所不同的是,用寡核苷酸#345取代了寡核苷酸#333,并以质粒pAK531(图14)为模板。按照实施例1所述方法,在琼脂糖凝胶上对171bp的Asp718/HindIIIDNA片段进行电泳并纯化。按照实施例1所述的方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。按照实施例1的方法对选择的质粒pAK547进行DNA序列分析,证实其含有编码前导序列SEQIDNo.8的DNA序列。编码前导序列SEQIDNo.8的DNA序列如图7所示。将质粒pAK547转化入欧洲专利申请No.86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK547。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示序列相同。实施例4合成用于在酿酒酵母(菌株yAK561)中表达MI3胰岛素前体的前导序列SEQIDNo.17。前导序列SEQIDNo.17的氨基酸序列如下GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeuProGlyAla合成了以下寡核苷酸#3765′-AACGAATCTCTTAGCACCTGGCAAGTTGACCAAAGTAGTGTTGATAGATTCAGTGTCGTC-3′SEQIDNo.35按照实施例1中所述方法进行聚合酶链式反应,所不同的是,用寡核苷酸#376取代了寡核苷酸#333,并以质粒pAK555(图15)为模板。按照实施例1所述方法在琼脂糖凝胶上对180bp的Asp718/HindIIIDNA片段进行电泳处理并提纯。按照实施例1所述方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。按照实施例1,对选择的质粒pAK561进行DNA序列分析,证实其带有编码前导序列SEQIDNo.17的DNA序列。编码前导序列SEQIDNo.17的DNA序列如图8所示。将质粒pAK561转化入在欧洲专利申请No.86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK561。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示序列相同。实施例5合成用于在酿酒酵母(菌株yAK559)中表达MI3胰岛素前体的前导序列SEQIDNo.16。前导序列SEQIDNo.16的氨基酸序列如下GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAlaAspAspThr-GluSerIleAsnThrThrLeuValAsnLeuProGlyAla合成了以下寡核苷酸#3755′-AACGAATCTCTTAGCACCTGGCAAGTTAACCAAAGTAGTGTTGATAGATTCAGTGTCGTCAGCCATCAAGTTGAC-3′SEQIDNo.36用实施例1的方法进行聚合酶链式反应,所不同的是,用寡核苷酸#375取代了寡核苷酸#333,并以质粒pAK555(图15)为模板。用实施例1的方法在琼脂糖凝胶上对222bp的Asp718/HindIIIDNA片段进行电泳和提纯。用实施例1的方法将Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。用实施例1的方法对选择的质粒pAK559进行DNA序列分析,证实其带有编码前导序列SEQIDNo.16的DNA序列。编码前导序列SEQIDNo.16的DNA序列如图9所示。将质粒pAK559转化入在欧洲专利申请No.86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK559。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示序列相同。实施例6合成用于在酿酒酵母(菌株yAK580)中表达MI3胰岛素前体的前导序列SEQIDNo.19。前导序列SEQIDNo.19的氨基酸序列如下GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAlaAspAspThr-GluSerArgPheAlaThrAsnThrThrLeuValAsnLeuProLeu合成了以下的寡核苷酸#3845′-AACGAATCTCTTCAATGGCAAGTTAACCAAAGTAGTGTTAGTAGCGAATCTAGATTCAGTGTCGTCAGCCAT-3′SEQIDNo.37用实施例1的方法进行聚合酶链式反应,所不同的是,用寡核苷酸#384取代了寡核苷酸#333,并以质粒pAK559(图16)为模板。用实施例1的方法,在琼脂糖凝胶上对228bp的Asp718/HindIIIDNA片段进行电泳和提纯。用实施例1的方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。用实施例1的方法对选择的质粒pAK580进行DNA序列分析,证实其带有编码前导序列SEQIDNo.19的DNA序列。编码前导序列SEQIDNo.19的DNA序列如图10所示。将质粒pAK580转化入在欧洲专利申请No.86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK580。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示序列相同。实施例7合成用于在酿酒酵母(菌株yAK583)中表达MI3胰岛素前体的前导序列SEQIDNo.20。前导序列SEQIDNo.20的氨基酸序列如下GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAlaAspAspThr-GluSerIleAsnThrThrLeuValAsnLeuAlaAsnValAlaMetAla合成了以下的寡核苷酸#3905′-AACGAATCTCTTAGCCATGGCAACGTTAGCCAAGTTAACCAAAGT-3′SEQIDNo.38用实施例1的方法进行聚合酶链式反应,所不同的是,用寡核苷酸#390取代了寡核苷酸#333,并以质粒pAK559(图16)为模板。用实施例1的方法在琼脂糖凝胶上对231bp的Asp718/HindIIIDNA片段进行电泳并提纯。用实施例1的方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。用实施例1的方法对选择的质粒pAK583进行DNA序列分析,证实其带有编码前导序列SEQIDNo.20的DNA序列。编码前导序列SEQIDNo.20的DNA序列如图11所示。将质粒pAK583转化入在欧洲专利申请No.86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK583。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示的序列相同。实施例8合成用于在酿酒酵母(菌株yAK586)中表达MI3胰岛素前体的前导序列SEQIDNo.21。前导序列SEQIDNo.21的氨基酸序列如下GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuValAsnLeuProGlyAla合成了以下寡核苷酸#4015′-AACGAATCTCTTAGCACCTGGCAAGTTGACCAAAGTAGTGTTGATAGCAGATTCAGTGTCG-3′SEQIDNo.39用实施例1的方法进行聚合酶链式反应,所不同的是,用寡核苷酸#401取代了寡核苷酸#333,并以质粒pAK562(图17)为模板。用实施例1的方法在琼脂糖凝胶上对183bp的Asp718/HindIIIDNA片段进行电泳并提纯。用实施例1的方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。用实施例1的方法对选择的质粒pAK586进行DNA序列分析,证实其带有编码前导序列SEQIDNo.21的DNA序列,见图12。将质粒pAK586转化入在欧洲专利申请No.86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK586。编码信号肽和胰岛素前体MI3的DNA序列与图5中所示的序列相同。实施例9用本发明所选择的前导序列表达MI3胰岛素前体。在YPD培养基(Sherman,F.等,MethodsinYeastGenetics,ColdSpringHarborLaboratoryPress,1981)上生长带有上述质粒的酵母菌株。每一菌株有6个5ml的培养物在30℃下摇动培养72小时,使最终OD600大约为15。离心之后取出上清液进行HPLC分析,通过Snel,L.等所披露的方法(Chromatographia24(1987)329-332)测定分泌的胰岛素前体的浓度。在表1中,用本发明选择的前导序列所获得的胰岛素前体MI3的表达水平,是以用pMT742的转化体所获得的表达水平的百分比形式给出的,后者是采用酿酒酵母的MFα(1)前导序列。</tables>实施例10合成用于在酿酒酵母(菌株yAK677)中表达伸展的MI3胰岛素前体的前导序列SEQIDNo.27。前导序列SEQIDNo.27具有以下氨基酸序列GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAlaAspAspThr-GluSerArgPheAlaThrAsnThrThrLeuAspValValAsnLeuIleSerMetAla合成了下列寡核苷酸#4405′-GGTTAACGAACTTTGGAGCTTCAGCTTCAGCTTCTTCTCTCTTAGCCATGGAGATCAAGTTAACAACATCCAAAGTAGTGTT-3′SEQIDNo.64和#4415′-CAAGTACAAAGCTTCAACCAAGTGGGAACCGCACAAGTGTTGGTTAACGAACTT-3′SEQIDNo.65用实施例1的方法进行聚合酶链式反应,所不同的是,用寡核苷酸#440代替寡核苷酸#333,并以质粒pAK614为模板。在另一个聚合酶链式反应中,用寡核苷酸#441取代寡核苷酸#312。用实施例1的方法分离纯化的PCRDNA片段,并用限制酶Asp718和HindIII消化。用实施例1的方法在琼脂糖凝胶上对268bp的Asp718/HindIIIDNA片段进行电泳并纯化。用实施例1的方法把Asp718/HindIIIDNA片段亚克隆到酿酒酵母表达质粒中。所不同的是,140bp的HindIII/XbaIDNA片段是pAK602衍生而来,它编码AspB28人胰岛素。用实施例1的方法对选择的质粒pAK616进行DNA序列分析,证实其带有编码前导序列SEQIDNo.27的DNA序列。编码前导序列SEQIDNo.27的DNA序列SEQIDNo.66如图18所示。从pAK616中分离268bp的Asp718/HindIIIDNA片段,并将其同来自pAK601的10986bp的Asp718/XbaIDNA片段和来自pAK464(编码伸展形式的AspB28人胰岛素)的140bp的HindIII/XbaIDNA片段连接,并命名为pAK625。从pAK625中分离180bp的Asp718/NcoIDNA片段,并将其同来自pJB146(编码伸展形式的胰岛素前体)的221bp的NcoI/XbaIDNA片段和来自pAK601的10824bp的Asp718/XbaIDNA片段连接,所得到的质粒被命名为pAK677。将质粒pAK677转化入在欧洲专利申请86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK677。除了编码前导序列的DNA序列之外,编码信号肽的DNA序列如图5所示。编码伸展的MI3胰岛素前体的DNA序列如图19所示。实施例11合成用于在酿酒酵母(yAK680)中表达伸展的MI3胰岛素前体的前导序列SEQIDNo.67。前导序列SEQIDNo.67的氨基酸序列如下GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAlaLeuAspValValAsnLeuIleSerMetAla合成了下列寡核苷酸#5775′-TCTCTTAGCCATGGAGATCAAGTTAACAACATCCAAAGCCAAAGTAGTGTT-3′SEQIDNo.68用实施例1的方法进行PCR,所不同的是,用寡核苷酸#577代替寡核苷酸#333,并以质粒pAK625为模板,而不进行第二个PCR。按照实施例1的方法用限制酶Asp718和NcoI消化PCR片段。用实施例1的方法在琼脂糖凝胶上对190bp的Asp718/NcoIDNA片段进行电泳和提纯。不同的是,10824bp的Asp718/XbaI载体DNA片段是从pAK601上分离的。用实施例1的方法把上述190bp的Asp718/NcoIDNA片段亚克隆到酿酒酵母表达质粒中,不同的是,221bp的NcoI/XbaIDNA片段(编码伸展形式的MI3胰岛素前体)是从pAK677上分离的,并用它代替HindIII/XbaIDNA片段。用实施例1的方法对选择的质粒进行DNA序列分析,证实其带有编码前导序列SEQIDNo.67的DNA序列,并将其命名为pAK680。编码前导序列SEQIDNo.67的DNA序列SEQIDNo.69如图20所示。将质粒pAK680转化入在欧洲专利申请86306721.1中所披露的酿酒酵母菌株MT663中,所得到的菌株被命名为yAK680。除了编码前导序列的DNA序列之外,编码信号肽的DNA序列如图5所示,而伸展的胰岛素前体MI3DNA序列如图19所示。实施例12用本发明的前导序列SEQIDNo.27和SEQIDNo.67表达N-末端伸展的MI3胰岛素前体。在YPD培养基(Sherman,F.等,MethodsinYeastGenetics,ColdSpringHarborLaboratoryPress,1981)中生长带有上述质粒的酵母菌株。对每一菌株,用6个5ml的培养物在30℃下摇动培养72小时,使最终OD600大约为15。离心以后取上清液作HPLC分析,通过由Snel,L.等所披露的方法(Chromatographia24(1987)329-332)测定所分泌的胰岛素前体的浓度。在表2中,通过使用本发明的前导序列SEQIDNo.27和SEQIDNo.67所获得的一些N-末端伸展的MI3胰岛素前体的表达水平,是以用pMT742的转化体所获得的表达水平的百分比形式给出的,后者使用的是酿酒酵母的MFα(1)前导序列。表2</tables>序列表(1)一般信息(I)申请人(A)名称NovoNordiskA/S(B)街道Novoalle(C)城市DK-2880Bagsvaerd(E)国家丹麦(G)电话+4544448888(H)传真+4544490555(I)电传37173(II)发明名称合成前导肽序列(III)序列数73(IV)有关地址(A)地址NovoNordiskA/SCorporatePatents(B)街道NovoAllé(C)城市DK-2880Bagsvaerd(E)国家丹麦(V)计算机可读形式(A)介质类型软盘(B)计算机IBMPC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentInRelease#1.0,Version#1.25(VI)本申请的资料(A)申请号(B)申请日(C)分类号(VII)优选权申请资料(A)申请号DK0705/94和US08/282,852(B)申请日16-06-1994和29-07-1994(VIII)律师/代理人资料(A)姓名Jrgensen,Dan等(C)资料/案卷号4085-WO,DJ(IX)通讯信息(A)电话+4544448888(B)传真+4544493256(2)有关SEQIDNo1的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo1GlnProIleAspGluAspAsnAspThrSerValAsnLeuProAla151015(2)有关SEQIDNo2的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo2GlnProIleAspAspGluAsnThrThrSerValAsnLeuProAla151015(2)有关SEQIDNo3的信息(i)序列特征(A)长度16个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo3GlnProIleAspAspGluSerAsnThrThrSerValAsnLeuProAla151015(2)有关SEQIDNo4的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo4GlnProIleAspAspGluAsnThrThrSerValAsnLeuProVal151015(2)有关SEQIDNo5的信息(i)序列特征(A)长度16个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo5GlnProIleAspAspThrGluAsnThrThrSerValAsnLeuProAla151015(2)有关SEQIDNo6的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo6GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro151015Ala(2)有关SEQIDNo7的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo7GlnProIleAspAspGluAsnThrThrSerValAsnLeuMetAla151015(2)有关SEQIDNo8的信息(i)序列特征(A)长度18个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo8GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro151015GlyAla(2)有关SEQIDNo9的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo9GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015Ala(2)有关SEQIDNo10的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo10GlnProIleAspAspThrGluSerAsnThrThrSerValAsnValPro151015Thr(2)有关SEQIDNo11的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo11GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnValPro151015Thr(2)有关SEQIDNo12的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo12GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro151015Thr(2)有关SEQIDNo13的信息(i)序列特征(A)长度18个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo13GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnValPro151015GlyAla(2)有关SEQIDNo14的信息(i)序列特征(A)长度21个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo14GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaProAlaValAla20(2)有关SEQIDNo15的信息(i)序列特征(A)长度25个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo15GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AspLeuAlaValGlyLeuProGlyAla2025(2)有关SEQIDNo16的信息(i)序列特征(A)长度33个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo16GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuProGly202530Ala(2)有关SEQIDNo17的信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo17GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu151015ProGlyAla(2)有关SEQIDNo18的信息(i)序列特征(A)长度18个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo18GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnLeupro151015GlyAla(2)有关SEQIDNo19的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo19GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn202530LeuProLeu35(2)有关SEQIDNo20的信息(i)序列特征(A)长度36个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo20GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuAlaAsn202530ValAlaMetAla35(2)有关SEQIDNo21的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo21GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuValAsn151015LeuProGlyAla20(2)有关SEQIDNo22的信息(i)序列特征(A)长度21个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo22GlnProIleAspAspThrGluSerPheAlaThrAsnThrThrLeuVal151015AsnLeuProGlyAla20(2)有关SEQIDNo23的信息(i)序列特征(A)长度36个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo23GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu151015MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuVal202530AsnLeuProLeu35(2)有关SEQIDNo24的信息(i)序列特征(A)长度39个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo24GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu151015MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAsp202530ValValAsnLeuProGlyAla35(2)有关SEQIDNo25的信息(i)序列特征(A)长度21个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo25GlnProIleAspAspThrGluSerAlaAlaIleAsnThrThrLeuVal151015AsnLeuProGlyAla20(2)有关SEQIDNo26的信息(i)序列特征(A)长度39个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo26GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn202530LeuAlaAsnValAlaMetAla35(2)有关SEQIDNo27的信息(i)序列特征(A)长度39个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo27GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAspVal202530ValAsnLeuIleSerMetAla35(2)有关SEQIDNo28的信息(i)序列特征(A)长度39个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo28GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAsnThrThrGluSerArgPheAlaThrAsnThrThrLeuAspVal202530ValAsnLeuIleSerMetAla35(2)有关SEQIDNo29的信息(i)序列特征(A)长度27bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo29TAAATCTATAACTACAAAAAACACATA27(2)有关SEQIDNo30的信息(i)序列特征(A)长度25bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo30GACTCTCTTAACTGGCAAGTTGACA25(2)有关SEQIDNo31的信息(i)序列特征(A)长度56bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo31AAGTACAAAGCTTCAACCAAGTGAGAACCACACAAGTGTTGGTTAACGAATCTCTT56(2)有关SEQIDNo32的信息(i)序列特征(A)长度21bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo32CATACACAATATAAACGACGG21(2)有关SEQIDNo33的信息(i)序列特征(A)长度55bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo33GAATCTCTTAGCTGGCAAGTTGACAGAAGTAGTGTTAGTTTCAGAGTCGTCAATT55(2)有关SEQIDNo34的信息(i)序列特征(A)长度36bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo34AACGAATCTCTTAGCACCTGGCAAGTTGACAGAAGT36(2)有关SEQIDNo35的信息(i)序列特征(A)长度60bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo35AACGAATCTCTTAGCACCTGGCAAGTTGACCAAAGTAGTGTTGATAGATTCAGTGTCGTC60(2)有关SEQIDNo36的信息(i)序列特征(A)长度75bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo36AACGAATCTCTTAGCACCTGGCAAGTTAACCAAAGTAGTGTTGATAGATTCAGTGTCGTC60AGCCATCAAGTTGAC75(2)有关SEQIDNo37的信息(i)序列特征(A)长度72bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo37AACGAATCTCTTCAATGGCAAGTTAACCAAAGTAGTGTTAGTAGCGAATCTAGATTCAGT60GTCGTCAGCCAT72(2)有关SEQIDNo38的信息(i)序列特征(A)长度45bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo38AACGAATCTCTTAGCCATGGCAACGTTAGCCAAGTTAACCAAAGT45(2)有关SEQIDNo39的信息(i)序列特征(A)长度61bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo39AACGAATCTCTTAGCACCTGGCAAGTTGACCAAAGTAGTGTTGATAGCAGATTCAGTGTC60G61(2)有关SEQIDNo40的信息(i)序列特征(A)长度372bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置82..351(xi)序列表达SEQIDNo40GAATTCATTCAAGAATAGTTCAAACAAGAAGATTACAAACTATCAATTTCATACACAATA60TAAACGACGGGTACCAAAATAATGAAACTGAAAACTGTAAGATCTGCGGTC111MetLysLeuLysThrValArgSerAlaVal1510CTTTCGTCACTCTTTGCATCTCAGGTCCTTGGCCAACCAATAGACGAA159LeuSerSerLeuPheAlaSerGlnValLeuGlyGlnProIleAspGlu152025GACAACGACACTTCTTCCATGGCTAAGAGATTCGTTAACCAACACTTG207AspAsnAspThrSerSerMetAlaLysArgPheValAshGlnHisLeu303540TGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGA255CysGlySerHisLeuValGluAlaLeuTyrLeuValCysGlyGluArg455055GGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAGCAATGC303GlyPhePheTyrThrProLysAlaAlaLysGlyIleValGluGlnCys606570TGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAGACGCAGC358CysThrSerIleCysSerLeuTyrGlnLeuGluAsnTyrCysAsn75808590CCGCAGGCTCTAGA372(2)有关SEQIDNo41的信息(i)序列特征(A)长度89个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo41MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspGluAspAsnAspThrSerSer202530MetAlaLysArgPheValAsnGlnHisLeuCysGlySerHisLeuVal354045GluAlaLeuTyrLeuValCysGlyGluArgGlyPhePheTyrThrPro505560LysAlaAlaLysGlyIleValGluGlnCysCysThrSerIleCysSer65707580LeuTyrGlnLeuGluAsnTyrCysAsn85(2)有关SEQIDNo42的信息(i)序列特征(A)长度45bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..45(xi)序列表述SEQIDNo42CAACCAATTGACGACGAAAACACTACTTCTGTCAACTTGCCAGTT45GlnProIleAspAspGluAsnThrThrSerValAsnLeuProVal151015(2)有关SEQIDNo43的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表述SEQIDNo43GlnProIleAspAspGluAsnThrThrSerValAsnLeuProVal151015(2)有关SEQIDNo44的信息(i)序列特征(A)长度297bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..276(xi)序列表述SEQIDNo44ATGAAACTGAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCA48MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015TCTCAGGTCCTTGGCCAACCAATTGACGACGAAAACACTACTTCTGTC96SerGlnValLeuGlyGlnProIleAspAspGluAsnThrThrSerVal202530AACTTGCCAGTTAAGAGATTCGTTAACCAACACTTGTGTGGTTCTCAC144AsnLeuProValLysArgPheValAsnGlnHisLeuCysGlySerHis354045TTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTAC192LeuValGluAlaLeuTyrLeuValCysGlyGluArgGlyPhePheTyr505560ACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATC240ThrProLysAlaAlaLysGlyIleValGluGlnCysCysThrSerIle65707580TGCTCCTTGTACCAATTGGAAAACTACTGCAACTAGACGCAGCCCGCAGGCTC293CysSerLeuTyrGlnLeuGluAsnTyrCysAsn8590TAGA297(2)有关SEQIDNo45的信息(i)序列特征(A)长度91个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo45MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspAspGluAsnThrThrSerVal202530AsnLeuProValLysArgPheValAsnGlnHisLeuCysGlySerHis354045LeuValGluAlaLeuTyrLeuValCysGlyGluArgGlyPhePheTyr505560ThrProLysAlaAlaLysGlyIleValGluGlnCysCysThrSerIle65707580CysSerLeuTyrGlnLeuGluAsnTyrCysAsn8590(2)有关SEQIDNo46的信息(i)序列特征(A)长度51bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..51(xi)序列表达SEQIDNo46CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGCCA48GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro151015GCT51Ala(2)有关SEQIDNo47的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo47GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro151015Ala(2)有关SEQIDNo48的信息(i)序列特征(A)长度54bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..54(xi)序列表达SEQIDNo48CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGCCA48GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuPro151015GGTGCT54GlyAla(2)有关SEQIDNo49的信息(i)序列特征(A)长度57bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..57(xi)序列表达SEQIDNo49CAACCAATTGACGACACTGAATCTATCAACACTACTTTGGTCAACTTG48GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsnLeu151015CCAGGTGCTProGlyAla57(2)有关SEQIDNo50的信息(i)序列特征(A)长度99bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..f99(xi)序列表达SEQIDNo50CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATG48GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015GCTGACGACACTGAATCTATCAACACTACTTTGGTTAACTTGCCAGGT96AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuProGly202530GCT99Ala(2)有关SEQIDNo51的信息(i)序列特征(A)长度105bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..105(xi)序列表达SEQIDNo51CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATG48GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015GCTGACGACACTGAATCTAGATTCGCTACTAACACTACTTTGGTTAAC96AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsn202530TTGCCATTG105LeuProLeu35(2)有关SEQIDNo52的信息(i)序列特征(A)长度108bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..108(xi)序列表达SEQIDNo52CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATG48GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015GCTGACGACACTGAATCTATCAACACTACTTTGGTTAACTTGGCTAAC96AlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeuAlaAsn202530GTTGCCATGGCT108ValAlaMetAla35(2)有关SEQIDNo53的信息(i)序列特征(A)长度60bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1..60(xi)序列表达SEQIDNo53CAACCAATTGACGACACTGAATCTGCTATCAACACTACTTTGGTCAAC48GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuValAsn151015TTGCCAGGTGCT60LeuProGlyAla20(2)有关SEQIDNo54的信息(i)序列特征(A)长度276bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置113..274(xi)序列表达SEQIDNo54TTAAATCTATAACTACAAAAAACACATACAGGAATTCATTCAAGAATAGTTCAAACAAGA60AGATTACAAACTATCAATTTCATACACAATATAAACGACGGGTACCAAAATAATG115Met1AAACTGAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCT163LysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAlaSer51015CAGGTCCTTGGCCAACCAATTGACGACGAAAACACTACTTCTGTTAAC211GlnValLeuGlyGlnProIleAspAspGluAsnThrThrSerValAsn202530TTGCCAGCTAAGAGATTCGTTAACCAACACTTGTGCGGTTCCCACTTG259LeuProAlaLysArgPheValAsnGlnHisLeuCysGlySerHisLeu354045GTTGAAGCTTTGTACTT276ValGluAlaLeuTyr50(2)有关SEQIDNo55的信息(i)序列特征(A)长度54个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo55MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspAspGluAsnThrThrSerVal202530AsnLeuProAlaLysArgPheValAsnGlnHisLeuCysGlySerHis354045LeuValGluAlaLeuTyr50(2)有关SEQIDNo56的信息(i)序列特征(A)长度282bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置113..280(xi)序列表达SEQIDNo56TTAAATCTATAACTACAAAAAACACATACAGGAATTCATTCAAGAATAGTTCAAACAAGA60AGATTACAAACTATCAATTTCATACACAATATAAACGACGGGTACCAAAATAATG115Met1AAACTGAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCT163LysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAlaSer51015CAGGTCCTTGGCCAACCAATTGACGACACTGAATCTAACACTACTTCT211GlnValLeuGlyGlnProIleAspAspThrGluSerAsnThrThrSer202530GTCAACTTGCCAGCTAAGAGATTCGTTAACCAACACTTGTGCGGTTCC259ValAsnLeuProAlaLysArgPheValAsnGlnHisLeuCysGlySer354045CACTTGGTTGAAGCTTTGTACTT282HisLeuValGluAlaLeuTyr5055(2)有关SEQIDNo57的信息(i)序列特征(A)长度56个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo57MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspAspThrGluSerAsnThrThr202530SerValAsnLeuProAlaLysArgPheValAsnGlnHisLeuCysGly354045SerHisLeuValGluAlaLeuTyr5055(2)有关SEQIDNo58的信息(i)序列特征(A)长度282bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置113..280(xi)序列表达SEQIDNo58TTAAATCTATAACTACAAAAAACACATACAGGAATTCATTCAAGAATAGTTCAAACAAGA60AGATTACAAACTATCAATTTCATACACAATATAAACGACGGGTACCAAAATAATG115Met1AAACTGAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCT163LysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAlaSer51015CAGGTCCTTGGCCAACCAATTGACGACACTGAATCTAACACTACTTCT211GlnValLeuGlyGlnProIleAspAspThrGluSerAsnThrThrSer202530GTCAACTTGATGGCTAAGAGATTCGTTAACCAACACTTGTGCGGTTCC259ValAsnLeuMetAlaLysArgPheValAsnGlnHisLeuCysGlySer354045CACTTGGTTGAAGCTTTGTACTT282HisLeuValGluAlaLeuTyr5055(2)有关SEQIDNo59的信息(i)序列特征(A)长度56个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo59MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspAspThrGluSerAsnThrThr202530SerValAsnLeuMetAlaLysArgPheValAsnGlnHisLeuCysGly354045SerHisLeuValGluAlaLeuTyr5055(2)有关SEQIDNo60的信息(i)序列特征(A)长度330bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置113..328(xi)序列表达SEQIDNo60TTAAATCTATAACTACAAAAAACACATACAGGAATTCATTCAAGAATAGTTCAAACAAGA60AGATTACAAACTATCAATTTCATACACAATATAAACGACGGGTACCAAAATAATG115Met1AAACTGAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCT163LysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAlaSer51015CAGGTCCTTGGCCAACCAATTGACGACACTGAATCTAACACTACTTCT211GlnValLeuGlyGlnProIleAspAspThrGluSerAsnThrThrSer202530GTCAACTTGATGGCTGACGACACTGAATCTATCAACACTACTTTGGTT259ValAsnLeuMetAlaAspAspThrGluSerIleAsnThrThrLeuVal354045AACTTGCCAGGTGCTAAGAGATTCGTTAACCAACACTTGTGCGGTTCC307AsnLeuProGlyAlaLysArgPheValAsnGlnHisLeuCysGlySer50556065CACTTGGTTGAAGCTTTGTACTT330HisLeuValGluAlaLeuTyr70(2)有关SEQIDNo61的信息(i)序列特征(A)长度72个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo61MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspAspThrGluSerAsnThrThr202530SerValAsnLeuMetAlaAspAspThrGluSerIleAsnThrThrLeu354045ValAsnLeuProGlyAlaLysArgPheValAsnGlnHisLeuCysGly505560SerHisLeuValGluAlaLeuTyr6570(2)有关SEQIDNo62的信息(i)序列特征(A)长度288bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置113..286(xi)序列表达SEQIDNo62TTAAATCTATAACTACAAAAAACACATACAGGAATTCATTCAAGAATAGTTCAAACAAGA60AGATTACAAACTATCAATTTCATACACAATATAAACGACGGGTACCAAAATAATG115Met1AAACTGAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCT163LysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAlaSer51015CAGGTCCTTGGCCAACCAATTGACGACACTGAATCTATCAACACTACT211GlnValLeuGlyGlnProIleAspAspThrGluSerIleAsnThrThr202530TTGGTCAACTTGCCAGGTGCTAAGAGATTCGTTAACCAACACTTGTGC259LeuValAsnLeuProGlyAlaLysArgPheValAsnGlnHisLeuCys354045GGTTCCCACTTGGTTGAAGCTTTGTACTT288GlySerHisLeuValGluAlaLeuTyr5055(2)有关SEQIDNo63的信息(i)序列特征(A)长度58个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo63MetLysLeuLysThrValArgSerAlaValLeuSerSerLeuPheAla151015SerGlnValLeuGlyGlnProIleAspAspThrGluSerIleAsnThr202530ThrLeuValAsnLeuProGlyAlaLysArgPheVelAsnGlnHisLeu354045CysGlySerHisLeuValGluAlaLeuTyr5055(2)有关SEQIDNo64的信息(i)序列特征(A)长度82bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo64GGTTAACGAACTTTGGAGCTTCAGCTTCAGCTTCTTCTCTCTTAGCCATGGAGATCAAGT60TAACAACATCCAAAGTAGTGTT82(2)有关SEQIDNo65的信息(i)序列特征(A)长度54bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo65CAAGTACAAAGCTTCAACCAAGTGGGAACCGCACAAGTGTTGGTTAACGAACTT54(2)有关SEQIDNo66的信息(i)序列特征(A)长度117bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo66CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATGGCTGACGACACT60GAATCTAGATTCGCTACTAACACTACTTTGGATGTTGTTAACTTGATCTCCATGGCT117(2)有关SEQIDNo67的信息(i)序列特征(A)长度41个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo67GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMet151015AlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAlaLeu202530AspValValAsnLeuIleSerMetAla3540(2)有关SEQIDNo68的信息(i)序列特征(A)长度51bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo68TCTCTTAGCCATGGAGATCAAGTTAACAACATCCAAAGCCAAAGTAGTGTT51(2)有关SEQIDNo69的信息(i)序列特征(A)长度123bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo69CAACCAATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATGGCTGACGACACT60GAATCTAGATTCGCTACTAACACTACTTTGGCTTTGGATGTTGTTAACTTGATCTCCATG120GCT123(2)有关SEQIDNo70的信息(i)序列特征(A)长度65个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(xi)序列表达SEQIDNo70LysArgGluGluAlaGluAlaGluAlaGluProLysPheValAsnGln151015HisLeuCysGlySerHisLeuValGluAlaLeuTyrLeuValCysGly202530GluArgGlyPhePheTyrThrProLysAlaAlaLysGlyIleValGlu354045GlnCysCysThrSerIleCysSerLeuTyrGlnLeuGluAsnTyrCys505560Asn65(2)有关SEQIDNo71的信息(i)序列特征(A)长度219bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(v)片段类型内部片段(xi)序列表达SEQIDNo71AAGAGAGAAGAAGCTGAAGCTGAAGCTGAACCAAAGTTCGTTAACCAACACTTGTGTGGT60TCTCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCT120AAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTG180GAAAACTACTGCAACTAGACGCAGCCCGCAGGCTCTAGA219(2)有关SEQIDNo72的信息(i)序列特征(A)长度348bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo72TTAAATCTATAACTACAAAAAACACATACAGGAATTCCATTCAAGAATAGTTCAAACAAG60AAGATTACAAACTATCAATTTCATACACAATATAAACGACGGTACCAAAATAATGAAACT120GAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCTCAGGTCCTTGGCCAACC180AATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATGGCTGACGACACTGAATC240TAGATTCGCTACTAACACTACTTTGGTTAACTTGGCTAACGTTGCCAACCAACACTTGTG300TGGTTCTCACTTGGTTGAAGCTTTGTACTTATGGCTAAGAGATTCGTT348(2)有关SEQIDNo73的信息(i)序列特征(A)长度379bp(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列表达SEQIDNo73TTAAATCTATAACTACAAAAAACACATACAGGAATTCCATTCAAGAATAGTTCAAACAAG60AAGATTACAAACTATCAATTTCATACACAATATAAACGACGGTACCAAAATAATGAAACT120GAAAACTGTAAGATCTGCGGTCCTTTCGTCACTCTTTGCATCTCAGGTCCTTGGCCAACC180AATTGACGACACTGAATCTAACACTACTTCTGTCAACTTGATGGCTGACGACACTGAATC240TAGATTCGCTACTAACACTACTTTGGATGTTGTTAACTTGATCTCCATGGCTAAGAGAGA300AGAAGCTGAAGCTGAAGCTGAACCAAAGTTCGTTAACCAACACTTGTGTGGTTCTCACTT360GGTTGAAGCTTTGTACTTG379权利要求1.一种DNA表达盒,包括如下序列5′-P-SP-LS-PS-*基因*-(T)i-3′其中,P是一个启动子序列,SP是一个编码一种信号肽的DNA序列,LS是一个编码一种通式I前导肽的DNA序列,GlnProIle(Asp/Glu)(Asp/Glu)X1(Glu/Asp)X2AsnZ(Thr/Ser)X3(I)其中,X1是一个肽键或一个可编码氨基酸;X2是一个肽键、一个可编码氨基酸或一个有多达4个可编码氨基酸的序列,这些氨基酸可以相同或不同;Z是一个除Pro之外的可编码氨基酸;和X3是一个有4~30个可编码氨基酸的序列,这些氨基酸可以相同或不同;PS是编码一个加工位点的DNA序列;*基因*是编码一种多肽的DNA序列;T是一个终止序列;和i是0或1。2.一种如权利要求1的表达盒,其中,通式I中的X1是Ser、Thr或Ala。3.一种如权利要求1的表达盒,其中,通式I中的X2是Ser、Thr或Ala。4.一种如权利要求1的表达盒,其中,通式I中的X2是SerIle。5.一种如权利要求1的表达盒,其中,通式I中的X2是Ser-AlaIle。6.一种如权利要求1的表达盒,其中,通式I中的X2是Ser-PheAlaThr。7.一种如权利要求1的表达盒,其中,通式I中的X3是通式II所示的一个氨基酸序列X4-X5-X6(II)其中X4是一个有1~21个可编码氨基酸的序列;X5是Pro或是包括氨基酸序列ValAsnLeu、LeuAlaAs-nValAlaMetAla、LeuAspValValAsnLeuProGly或LeuAspVal-ValAsnLeuIleSerMet的一个氨基酸序列;以及X6是一个有1~8个可编码氨基酸的序列。8.一种如权利要求7的表达盒,其中,通式II中的X4是包括下列基序中的一个或多个的氨基酸序列LeuValAsnLeu、Ser-ValAsnLeu、MetAlaAsp、ThrGluSer、ArgPheAlaThr和ValAlaMetA-la。9.一种如权利要求7的表达盒,其中,通式II中的X4是一个包括序列AsnSerThr或AsnThrThr的氨基酸序列。10.一种如权利要求7的表达盒,其中,通式II中的X4是一个包括以下序列的氨基酸序列(Ser/Leu)ValAsnLeu,(Ser/Leu)ValAsnLeuMetAlaAsp,(Ser/Leu)ValAsnLeuMetAlaAspAsp,(Ser/Leu)ValAsnLeuMetAlaAspAspThrGluSer,(Ser/Leu)ValAsnLeuMetAlaAspAspThrGluSerIle,或(Ser/Leu)ValAsnLeuMetAlaAspAspThrGluSerArgPheAlaThr。11.一种如权利要求7的表达盒,其中,通式II中的X4是一个包括以下序列的氨基酸序列Asn(Thr/Ser)ThrLeu,Asn(Thr/Ser)ThrLeuAsnLeu,或Asn(Thr/Ser)ThrLeuValAsnLeu。12.一种如权利要求7的表达盒,其中,通式II中的X5是Pro。13.一种如权利要求7的表达盒,其中,通式II中的X5是氨基酸序列ValAsnLeu。14.一种如权利要求7的表达盒,其中,通式II中的X5是氨基酸序列LeuAlaAsnValAlaMetAla。15.一种如权利要求7的表达盒,其中,通式II中的X5是氨基酸序列LeuAspValValAsnLeuProGly。16.一种如权利要求7的表达盒,其中,通式II中的X5是氨基酸序列LeuAspValValAsnLeuIleSerMet。17.一种如权利要求7的表达盒,其中,通式II中的X6是Ala、Gly、Leu、Thr、Val或Ser。18.一种如权利要求7的表达盒,其中,通式II中的X6是GlyAla或SerAla。19.一种如权利要求7的表达盒,其中,通式II中的X6是AlaValAla。20.一种如权利要求7的表达盒,其中,通式II中的X6是GlyAlaAspSerLysThrValGlu。21.一种如权利要求1的表达盒,其中,由DNA序列LS编码的前导肽选自下组SEQIDNo.1GlnProIleAspGluAspAsnAspThrSerValAsnLeuProAla;SEQIDNo.2GlnProIleAspAspGluAsnThrThrSerValAsnLeuProAla;SEQIDNo.3GlnProIleAspAspGluSerAsnThrThrSerValAsnLeuPro-Ala;SEQIDNo.4GlnProIleAspAspGluAsnThrThrSerValAsnLeuProVal;SEQIDNo.5GlnProIleAspAspThrGluAsnThrThrSerValAsnLeuPro-Ala;SEQIDNo.6GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-ProAla;SEQIDNo.7GlnProIleAspAspGluAsnThrThrSerValAsnLeuMetAla;SEQIDNo.8GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuProGlyAla;SEQIDNo.9GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAla;SEQIDNo.10GlnProIleAspAspThrGluSerAsnThrThrSerValAsnVal-ProThr;SEQIDNo.11GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnVal-ProThr;SEQIDNo.12GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-ProThr;SEQIDNo.13GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnVal-ProGlyAla;SEQIDNo.14GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaProAlaValAla;SEQIDNo.15GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAspLeuAlaValGlyLeuProGlyAla;SEQIDNo.16GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-ProGlyAla;SEQIDNo.17GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsn-LeuProGlyAla;SEQIDNo.18GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnLeu-ProGlyAla;SEQIDNo.19GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuValAsnLeuProLeu;SEQIDNo.20GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-AlaAsnValAlaMetAla;SEQIDNo.21GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuVal-AsnLeuProGlyAla;SEQIDNo.22GlnProIleAspAspThrGluSerPheAlaThrAsnThrThr-LeuValAsnLeuProGlyAla;SEQIDNo.23GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsn-LeuMetAlaAspAspThrGluSerArgPheAlaThrAsnThrThr-LeuValAsnLeuProLeu;SEQIDNo.24GlnProIleAspAspThrGluSerIleAsnThrThrLeuVal-AsnLeuMetAlaAspAspThrGluSerArgPheAlaThrAsnThr-ThrLeuAspValValAsnLeuProGlyAla;SEQIDNo.25GlnProIleAspAspThrGluSerAlaAlaIleAsnThrThrLeu-ValAsnLeuProGlyAla;SEQIDNo.26GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeu-ValAsnLeuAlaAsnValAlaMetAla;SEQIDNo.27GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeu-AspVal-ValAsnLeuIleSerMetAla;SEQIDNo.28GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAsnThrThrGluSerArgPheAlaThrAsnThrThrLeu-AspValValAsnLeuIleSerMetAla;和SEQIDNo.67GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeu-AlaLeuAspValValAsnLeuIleSerMetAlaLysArg,由DNA序列LS编码的特别优选的前导肽如下SEQIDNo.15GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAspLeuAlaValGlyLeuProGlyAla;SEQIDNo.16GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-ProGlyAla;SEQIDNo.17GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsn-LeuProGlyAla;SEQIDNo.18GlnProIleAspAspThrGluSerAsnThrThrLeuValAsnLeuProGlyAla;SEQIDNo.19GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeu-ValAsnLeuProLeu;SEQIDNo.20GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerIleAsnThrThrLeuValAsnLeu-AlaAsnValAlaMetAla;SEQIDNo.21GlnProIleAspAspThrGluSerAlaIleAsnThrThrLeuVal-AsnLeuProGlyAla;SEQIDNo.22GlnProIleAspAspThrGluSerPheAlaThrAsnThrThrLeu-ValAsnLeuProGlyAla;SEQIDNo.23GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsn-LeuMetAlaAspAspThrGluSerArgPheAlaThrAsnThrThr-LeuValAsnLeuProLeu;SEQIDNo.24GlnProIleAspAspThrGluSerIleAsnThrThrLeuValAsn-LeuMetAlaAspAspThrGluSerArgPheAlaThrAsnThrThr-LeuAspValValAsnLeuProGlyAla;SEQIDNo.25GlnProIleAspAspThrGluSerAlaAlaIleAsnThrThrLeu-ValAsnLeuProGlyAla;SEQIDNo.26GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeu-ValAsnLeuAlaAsnValAlaMetAla;和SEQIDNo.28GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAsnThrThrGluSerArgPheAlaThrAsnThrThrLeu-AspValValAsnLeuIleSerMetAla;SEQIDNo.67GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeu-MetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeu-AlaLeuAspValValAsnLeuIleSerMetAlaLysArg.22.一种如权利要求1的表达盒,其中,SP是一个编码α-因子信号肽、小鼠唾液淀粉酶信号肽、羧肽酶信号肽、酵母天冬氨酸蛋白酶3信号肽或酵母BAR1信号肽的DNA序列。23.一种如权利要求1的表达盒,其中,PS是一个编码LysArg、ArgLys、ArgArg、LysLys或Ile-GluGlyArg的DNA序列。24.一种如权利要求1的表达盒,其中,所述多肽选自抑蛋白酶肽、组织因子途径抑制剂、或其它蛋白酶抑制剂、胰岛素或胰岛素前体、胰岛素样生长因子I、胰岛素样生长因子II、人或小牛生长激素、白介素、胰高血糖素、类胰高血糖素肽-1、组织纤溶酶原激活物、转化生长因子α或β、由血小板衍生的生长因子、酶、或以上物质的功能性类似物。25.一种酵母表达载体,它包括如上述权利要求中任一项所述的一个表达盒。26.一种酵母细胞,它能够表达一种多肽、并且是用权利要求25所述的酵母表达载体转化过的。27.一种用于在酵母中生产一种多肽的方法,该方法包括在一种合适的培养基中培养一种酵母细胞,这种细胞能够表达目的多肽,而且是用权利要求25所述的酵母表达载体转化过的,以获得所述多肽的表达和分泌,然后,从所述培养基中回收所述多肽。全文摘要本发明涉及用于在酵母中分泌多肽的合成前导肽序列。文档编号C07K14/62GK1154143SQ95194183公开日1997年7月9日申请日期1995年6月16日优先权日1994年6月16日发明者T·B·克杰尔德森,K·瓦德申请人:诺沃挪第克公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1