在酵母细胞中表达n-末端延伸蛋白质的载体的制作方法

文档序号:450275阅读:276来源:国知局
专利名称:在酵母细胞中表达n-末端延伸蛋白质的载体的制作方法
技术领域
本发明涉及在真核细胞(优选的是酵母细胞)中表达和加工的多肽,含有编码这种多肽之DNA序列的构建体、携带所说的DNA片段的载体、用这种载体转化的细胞(包括酵母细胞)、在酵母中产生异源蛋白的方法。
背景技术
酵母有机体能够产生大量的蛋白质,这种蛋白质在细胞内合成,但在细胞外发生作用。这种胞外蛋白质被称作为分泌蛋白质。这些分泌蛋白质最初是在细胞内部以含有前序列的前体或者前体形式(pre-form)表达,所说的前序列可以确保表达的产物通过内质网(ER)膜有效的分泌。这种通常称为信号肽的前序列一般在转移期间从所需要的产物中切割下来。进入分泌途径后,所说的蛋白质被运输到高尔基体中。从高尔基体中这种蛋白质可以通过不同的途径进入细胞的一定区室(如液泡或者细胞膜),或者将这种蛋白质分泌到细胞外的基质中(Pfeffer,S.R.and Rothman,J.E.生物化学年度终述56(1987),829-852。
一些研究报告已经表明,异源蛋白质可以在酵母中表达和分泌。欧洲出版物0088632A中描述了一种可以在酵母中表达、加工和分泌异源蛋白质的方法,这是通过用含有编码所需要的蛋白质和信号肽之DNA的表达载体转化酵母有机体、制备转化的有机体培养物、培养所说的培养物并从培养基中回收所说的蛋白质来完成的。所说的信号肽可以是所需要的蛋白质本身的信号肽、异源信号肽或者天然和异源信号肽的杂交体。
在酵母中使用异源信号肽的问题是所说的异源信号肽不能确保信号肽后边的前体多肽的有效转移和/或切割。
以165个氨基酸的前原体形式合成酿酒酵母MFα1(α-因子),其包含19个氨基酸长的信号或前肽,之后是64个氨基酸长的“前导”或原肽(其包含3个与N连接的糖基化位点,之后是(LysArg(Asp/Glu,Ala)2-3α-因子)4(Kurjan,J.和Herskowitz,I.细胞30(1982),933-943))。已经广泛地使用了前原MFα1的信号-前导部分以便使异源蛋白质在酿酒酵母中合成并分泌。
有关异源信号/前导肽在酵母中的使用可以在没有提到的(i.a.)美国专利4,546,082、欧洲出版物0116201A、0123294A、0123544A、0163529A、0123289A和欧洲专利0100561B中获得。
在EP0123289A中描述了酿酒酵母α-因子前体的使用,而EP100561中描述了酿酒酵母PH05信号的使用,PCT公开WO95/02059描述了YAP3信号肽用于外源蛋白分泌的情况。
美国专利4,546,082和欧洲出版物0016201A、0123294A、0123544A和0163529A描述了在酵母中表达的异源蛋白质的分泌过程中使用酿酒酵母α-因子信号-前导肽(MFαl或者MFα2)的方法。通过将编码酿酒酵母MFαl/前导序列的DNA序列融合到所需要蛋白质之基因的5’末端,来显示所需要蛋白质的分泌和加工。
EP206783描述了酿酒酵母多肽的分泌的系统,因此将α-因子前导序列截短以便除去四个存在于天然前导序列中的α-因子肽,这样就可以使得所说的前导肽本身通过α-因子加工位点Lys-Arg-Glu-Ala-Glu-Ala融合到异源多肽中。已表明这一构建可以导致有效的加工以便产生更小的肽(少于50个氨基酸)。为了分泌和加工更大的多肽,已经将天然的α-因子前导序列截短,在前导肽和多肽之间留下一个或两个α-因子肽。
将大量的分泌蛋白质运输到可以暴露在蛋白水解加工系统的地方,所说的系统可以切割羧基末端两个连续碱性氨基酸之间的肽键。在酿酒酵母中这种酶促活性是由KEX2基因编码的(Julius,D.A.et al.,Cell37(1984b),1075)。KEX2蛋白酶加工所说的产物需要活性酿酒酵母匹配因子α1(MFαl或者α-因子)的分泌,但与活性酿酒酵母匹配因子α的分泌无关。
在有些情况下,当培养用如上文参考文献所述的方法构建的载体转化的酵母有机体时,可以使将要分泌的多肽分泌并正确地加工。然而,在很多情况下分泌水平很低或者没有分泌,或者蛋白水解加工不正确或不完全。如PCT公开WO90/10075所述,这在一定程度上是因为位于前导肽C-末端和所说的异源蛋白质N-末端之间的加工位点不能充分暴露,结果是蛋白的水解切割无法进行,或者至少是进行得不充分。
WO90/10075描述了异源多肽加工已经改进的酵母表达系统,这是通过在前导肽C-末端和/或融合到所说的前导肽的异源多肽的N-末端的加工位点附近进行某些修饰来完成的。这样,与未修饰的前导肽-异源多肽构建相比,可能获得高产量的正确加工的蛋白质。本发明的目的是提供一种新型的融合到所说的前导肽上的异源多肽的N末端修饰,所说的前导肽能够确保异源多肽N末端延伸序列进行更有效的表达和/或加工以及改进其在体外的除去。
发明概述本发明描述了所说的异源多肽的N-末端修饰,这种多肽被设计成含有延伸序列,所说的延伸序列可以在从培养基中纯化此产物的过程中或之后通过体外蛋白水解而切割掉。
本发明涉及编码多肽的DNA构建体,所说的多肽具有下列结构信号肽-前导肽-EEAEPK-异源蛋白质。
在整个说明书和权利要求中,使用按照生化命名IUPAC-IUB委员会批准的规则(1974)的常规的氨基酸一个字母代码。
在本文中,术语"信号肽"应该理解成为是指以N-末端序列存在于在酵母中表达的细胞外蛋白质前体形式上的前序列。所说的信号肽的功能是使将要分泌的异源蛋白质进入内质网。通常在这一过程中切除此信号肽。所说的信号肽对产生此蛋白的酵母有机体来说可以是异源的也可以是同源的。在本发明中优选的信号肽是酵母天冬氨酸蛋白酶3(YAP3)信号肽或者它的任何功能类似物。Egel-Mitani M.等(酵母6p.127-137,1990)已经克隆了YAP3并确定了其性质。
术语"前导肽"应该理解为前肽序列形式的肽,它的功能是使将要分泌的异源蛋白质从内质网直接进入高尔基体中并进入到分泌泡以便分泌到培养基中(即表达的蛋白质或多肽通过细胞膜和细胞壁(如果存在)或至少通过细胞膜进入具有细胞壁的细胞的周质空间)。优选的前导肽是如本文SEQ IDNo.5所公开的LA19前导肽。
术语"异源蛋白质"是指不是由宿主有机体天然产生的蛋白质或者多肽,优选的为不是由酵母天然产生的多肽。然而,对本领域技术人员来说,在哺乳动物细胞中产生异源多肽(如胰高血糖素)是显而易见的,并且所说的多肽也包括在“异源蛋白质”中。
序列EEAEPK在所说的异源多肽的N-末端形成突出端。此突出端不仅增加了发酵产量,而且也保护其免受二肽基氨肽酶(DPAP A)加工,结果产生此多肽的同质的N-末端。以这样的方式构建此突出端,可以使其在发酵过程中抵抗蛋白水解切割作用,结果,例如可以通过胰蛋白酶或者水解无色杆菌蛋白酶I从用于接下来体外成熟的培养基中纯化N-末端延伸的异源蛋白质产物。大概是由于所说的N-末端延伸肽的灵活性,可以很容易地通过胰蛋白酶或者水解无色杆菌蛋白酶I来体外除去N-末端突出端EEAEPK,结果提高了成熟的异源蛋白质的产量。
本发明还涉及能够在真核细胞(优选的是酵母细胞)中复制的重组表达载体,此载体还携带了本发明的DNA构建体。优选地,所说的DNA构建体包含合成的前导肽,优选的是LA19前导肽。此外,本发明涉及本文图2描述的DNA构建体。本发明也涉及能够表达异源蛋白质并可以用本发明的载体转化的真核细胞,优选的是酵母细胞。
此外,本发明涉及在酵母中产生异源蛋白质的方法,这种方法包括在合适的培养基中培养所转化的酵母菌株,以便使所说的异源蛋白质表达并分泌,之后从培养基和/或细胞中分离所说的蛋白质。
附图的简要描述参照附图进一步说明本发明,其中

图1显示出包含表达本发明的N-末端延伸多肽的基因的表达质粒pAK729,并使用了下列符号TPI-PROMOTER是指酿酒酵母的TPI基因启动子序列。
2指编码信号/前导肽的区域(如来源于与EEAEPK N-末端延伸MI3胰岛素前体结合的YAP3信号肽和LA19前导肽)。
TPI-TERMINATOR指酿酒酵母TPI基因终止子序列。
TPI-POMBE指粟酒裂殖酵母-1的TPI基因。
起点指酿酒酵母2μ质粒的序列,包括它在酿酒酵母中的DNA复制起点。
AMP-RpBR322/pUC13的序列,包括氨苄青霉素抗性基因和大肠杆菌的DNA复制起点。
SEQ ID NO1是pAK729中编码YAP3信号肽(氨基酸1-21)、LA19前导肽(氨基酸22-64)、N-末端突出端EEAEPK(氨基酸65-70)、MI3胰岛素前体B链(1-29)-Ala-Ala-Lys-A链(氨基酸1-21)(氨基酸71-123)的DNA和氨基酸序列。
SEQ ID NO2是pAK733的编码实施例2的YAP3信号肽-LA19前导肽EEAEPK-MI1胰岛素前体复合物的DNA和氨基酸序列。
SEQ ID NO3是pAK749的编码实施例3的YAP3信号肽-LA19前导肽EEAEPK-MI5胰岛素前体复合物的DNA和氨基酸序列。
SEQ ID NO4是pAK866的编码实施例4的YAP3信号肽-LA19前导肽EEAEPK-X14胰岛素前体复合物的DNA和氨基酸序列。
SEQ ID NO4是LA19前导肽DNA序列。
本发明的详细描述通过本发明的方法产生的N-末端延伸异源蛋白质可以是任何便于在真核细胞(优选的是酵母细胞)中产生的蛋白质。这些蛋白质的例子是抑蛋白酶肽、组织因子途径抑制剂或者其它的蛋白酶抑制剂、胰岛素或者胰岛素前体、胰岛素类似物、类胰岛素生长因子I或II、人或牛生长激素、白介素、组织纤溶酶原激活物、转化生长因子a或者b、胰高血糖素、类胰高血糖素肽1(GLP-1)、类胰高血糖素肽2(GLP-2)、GRPP、因子VII、因子VIII、因子XIII、血小板衍生生长因子、酶(如脂酶)或者这些蛋白任何一种的功能类似物。在本文中,术语"功能类似物"是指与所说的天然蛋白质具有类似的功能的多肽(这里应理解为是指天然蛋白质的本质,而不是指其生物活性水平)。所说的多肽可以在结构上与天然蛋白质相似,可以由天然蛋白质通过将一个或多个氨基酸加入到此天然蛋白质C-和N-末端或者只加入到一端、在天然氨基酸序列的一个或多个不同位点上取代一个或多个氨基酸、在此天然蛋白质的一端或两端或者在此氨基酸序列的一个或几个位点上缺失一个或多个氨基酸、或者在此天然氨基酸序列的一个或多个位点上插入一个或多个氨基酸而产生。这样的修饰对于几种上述蛋白质是熟知的。
"胰岛素前体"或者“胰岛素类似物前体”应该理解成为单链多肽(包括胰岛素原),这种多肽通过后面的一个或多个化学和/或酶促加工可以转化成为具有正确的如在天然人类胰岛素中发现的3个二硫桥结构的双链胰岛素或者胰岛素类似物分子。可以以此方式产生的胰岛素或者胰岛素类似物的例子是人类胰岛素(优选的是des(B30)人胰岛素、猪胰岛素、至少含有一个Lys或者Arg的胰岛素类似物,优选的是PheB1已经缺失的胰岛素类似物、A-链和/或B链具有N-末端突出端的胰岛素类似物、A-链和/或B链具有C-末端突出端的胰岛素类似物。其它优选的胰岛素类似物是其中的一个或多个氨基酸残基(优选的是它们中的一个、两个或三个)已经由另一个密码氨基酸残基取代的胰岛素类似物。这样在A21位置上亲本胰岛素可以由选自下组的氨基酸残基取代AsnAla、Gln、Glu、Gly、His、Ile、Leu、Met、Ser、Thr、Trp、Tyr或Val,特别是选自下组的氨基酸残基Gly、Ala、Ser、和Thr。也可以通过将上述变化组合在一起来修饰胰岛素类似物。同样地,在位置B28上可以取代亲本胰岛素Pro的氨基酸残基可以是选自下组的氨基酸残基Asp、Lys等等;在位置B29上可以取代亲本胰岛素Lys的氨基酸残基可以是Pro。本文所用的“密码氨基酸残基”是指可以由遗传密码(即核苷酸的三联密码(“密码子”))编码的氨基酸残基。
最优选的胰岛素前体是MI1、B(1-29)-A(1-21);MI3、B(1-29)-Ala-Ala-Lys-A(1-21)(如在EP163 529中所述);X14、B(1-27-Asp-Lys)-Ala-Ala-Lys-A(1-21)(如在PCT公开95/00550中所述);B(1-27-Asp-Lys)-A(1-21);B(1-27-Asp-Lys)-Ser-Asp-Asp-Ala-Lys-A(1-21);B(1-29)-Ala-Ala-Arg-A(1-21)(如在PCT公开95/07931中所述);MI5、B(1-29)-Ser-Asp-Asp-Ala-Lys-A(1-21);和B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21)。
可以通过标准的合成方法制备编码本发明多肽的本发明的DNA构建体,所说的方法如S.L.Beaucage和M.H.Caruthers在“四面体通讯”22,1981,pp.1859-1869中描述的phosphoamidite方法,或者由Matthes等,EMBO杂志3,1984,pp.801-805描述的方法。按照phosphoamidite方法,例如可以在自动DNA合成仪上合成寡核苷酸,并将寡核苷酸纯化、变成双链并连接成合成的DNA构建体。目前制备这种DNA构建体优选的方法是通过聚合酶链反应(PCR),如Sambrook等在“分子克隆”,实验室手册,冷泉港,NY,1989中描述的。
本发明DNA构建体也可以是基因组或者cDNA起源,例如通过制备基因组或cDNA文库、使用合成寡核苷酸探针按照标准方法(参见Sambrook等在“分子克隆”,实验室手册,冷泉港,1989)经杂交筛选编码本发明多肽全部或部分的DNA序列来获得。在这种情况下,可以将编码信号和前导肽的基因组或cDNA序列与编码异源蛋白质的基因组或cDNA序列连接起来,之后在相应于所说多肽的氨基酸序列EEAEPK的位点上按照公知的方法通过插入编码同源重组所需的氨基酸序列的合成寡核苷酸来修饰所说的DNA序列,优选的是使用合适的寡核苷酸通过PCR产生所需的序列。
最后,所说的DNA构建体可以是通过将合成的、基因组或的cDNA起源(合适的)的片段、相当于全部DNA构建体各部分的片段按照标准的技术退火而制备而成的混合型合成和基因组、混合型合成和cDNA、或者混合型基因组和cDNA起源的。这样,可以理解编码所说的异源蛋白质的DNA序列可以是基因组或cDNA起源的,而编码所说的信号及前导肽的序列以及编码N-末端突出端EEAEPK的序列可以是通过合成的方法制备的。
在一个方面,本发明涉及能够在酵母中复制并且携带编码上文限定的多肽的DNA构建体的重组表达载体。所说的重组表达载体可以是在酵母有机体中能够复制的任何载体。在此载体中,所说的编码本发明多肽的DNA序列可以可操作性地与合适的启动子序列连接。所说的启动子可以是任何在酵母中表现出转录活性的DNA序列,并可来源于编码酵母同源或异源蛋白质的基因。优选的是启动子来源于编码酵母同源蛋白质的基因。合适的启动子的例子是酿酒酵母Mα1、TPI,ADH或者PGK启动子。
编码本发明多肽的DNA序列也可以可操作性地与合适的终止子连接,如TPI终止子(参见T.Alber和G.Kawa-saki,分子应用遗传学,1,1982,pp.419-434)。
本发明的重组表达载体包含能够使载体在酵母中复制的DNA序列。这种序列的例子是酵母质粒2μ复制基因REP1-3和复制起点。此载体也可以包含选择标记,如P.R.Russell在“基因40”(1985,pp.125-130)中描述的粟酒裂殖酵母-1TPI基因。
用于将编码本发明多肽的DNA序列、启动子和终止子分别连接的方法以及将它们插入到含有酵母复制所需信息的合适的酵母载体中的方法是本领域技术人员公知的(例如参见Sambrook等op.cit.)。应该理解,可以通过首先制备含有编码本发明多肽的全部DNA序列的DNA构建体,然后将此片段插入到合适的表达载体中来构建所说的载体,或者通过将含有各个元件(如信号肽、前导肽或者异源蛋白质)之遗传信息的DNA片段依次插入,然后进行连接来构建所说的载体。
用于本发明方法中的酵母有机体或者真核宿主细胞可以是任何在培养中产生大量所说的异源蛋白质或多肽的合适的酵母有机体。合适的酵母有机体的例子可以是下列酵母类的菌株酿酒酵母、克鲁弗酵母、粟酒裂殖酵母-1、葡萄汁酵母、乳酸克鲁维酵母、多形汉逊酵母、巴斯德毕赤酵母、Pichia methanolica、克鲁弗毕赤酵、Yarrowia lipolytica、念珠菌属未知种、产朊假丝酵母、可可假丝酵母、地丝菌属未知种、Geotrichumfermentans,优选的是酿酒酵母。选择任何其它的真核细胞(如曲霉属、链霉菌属的细胞、昆虫细胞或者哺乳动物的细胞)作为宿主有机体对本领域技术人员是显而易见的。
例如可以通过制备原生质体之后以本领域公知的方式转化来完成这些酵母细胞的转化。用于培养这些细胞的培养基可以是任何适合于酵母有机体生长的常规培养基。其主要部分以正确加工的形式存在于培养基中的分泌的异源蛋白质,可以通过常规的方法从培养基中回收,所说的常规方法包括从培养基中通过离心或过滤分离所说的酵母细胞、通过盐(如硫酸铵)法沉淀上清液或滤液中的蛋白组分、之后通过各种层析方法(如离子交换层析、亲和层析等等)纯化。当所说的蛋白质分泌到周质空间时,可以通过酶促或机械方法打碎细胞。
在所说的蛋白质分泌到培养基或周质空间后,可以通过各种方法除去序列EEAEPK。
已经发现所说的突出端在发酵过程中与这种异源蛋白质稳定地结合,保护异源蛋白质的N-末端免受酵母蛋白酶(如DPAP)的水解。N-末端突出端存在于异源蛋白质中的作用也是在此蛋白的化学加工过程中保护异源蛋白质的N-末端氨基基团,即它的作用是取代BOC或者类似的保护基团。在这种情况下,可以通过蛋白水解酶(这种蛋白酶对碱性氨基酸(即K(Lys))具有特异性)从回收的异源蛋白质中除去氨基酸序列EEAEPK,以便在K位置上切除末端突出端。这些蛋白酶的例子是胰蛋白酶或者水解无色杆菌蛋白酶I。
通过下列实施例更详细地描述本发明,这些实施例无意于以任何方式限制本发明权利要求所要求的范围。实施例1.表达EEAEPK-MI3胰岛素前体的酵母菌株yAK729的构建使用聚合酶链反应(PCR)构建编码N-末端延伸的胰岛素前体EEAEPK-MI3的N-末端突出端的合成基因。
合成下列2个寡核苷酸#672 5’-TCTCCATGGCTAAGAGAGAAGAAGCTGAACCAAAGTTCGTT-3’#2785 5’-AATTTATTTTACATAACACTAG-3’使用phosphoamidite化学和市售的试剂通过自动DNA合成仪(应用生物系统模型380A)合成寡核苷酸(Beaucage,S.L.和Caruthers,M.H.,四面体通讯22(1981)1859-1869)。
使用Pwo DNA聚合酶(Boehringer Mannheim GmbH,SandhoefterStrasse 116,Mannheim,德国)按照厂商的说明完成下列PCR,并使用100μl矿物油(Sigma化学公司,St.Louis MO,美国)覆盖所说的PCR混合物。
PCR5μl寡核苷酸#672(50 pmol)5μl寡核苷酸#2785(50 pmol)10μl 10X PCR缓冲液8μl dNTP混合物0.5μl Pwo酶以0.5μl pAK680质粒作为模板(0.2μg DNA)71μl蒸馏水总共完成12个循环,一个循环为94℃,45秒;40℃,1分钟;72℃,1.5分钟。然后将所得的PCR混合物加入到2.5%琼脂糖凝胶上,使用标准技术(Sambrook J.,Fritsch EF和Maniatis T,分子克隆,冷泉港实验室出版社,1989)完成电泳。从此琼脂糖凝胶中切除所得的DNA片段,并按照厂商的说明由基因纯化试剂盒(Bio 101公司,PO BOX 2284,LaJolla,CA 92038,美国)分离所得的DNA片段。
将纯化的PCR DNA片段溶解在14μl的水和限制性核酸内切酶缓冲液中,并用限制性核酸内切酶Ncol与Xbal按照标准技术切割(Sambrook J.,Fritsch EF和Maniatis T,分子克隆,冷泉港实验室出版社,1989)。将209个核苷酸碱基对上的Ncol-Xbal DNA片段进行琼脂糖电泳,并使用如上所述的基因纯化试剂盒纯化。
用限制性核酸内切酶BglII和Xbal切割质粒pAK721(参见图1),使用如上所述的基因纯化试剂盒分离10849个核苷酸碱基对的载体片段。使用限制性核酸内切酶BglII和Ncol切割质粒pAK721,并使用如上所述的基因纯化试剂盒分离160个核苷酸碱基对的DNA片段。使用T4 DNA连接酶和标准条件(Sambrook J.,Fritsch EF和Maniatis T,分子克隆,冷泉港实验室出版社,1989)将这3个DNA片段连接在一起。然后将连接混合物转化到感受态大肠杆菌菌株(R-,M+)中,之后通过氨苄青霉素抗性进行选择。
使用标准技术(Sambrook J.,Fritsch EF和Maniatis T,分子克隆,冷泉港实验室出版社,1989)分离所得的大肠杆菌中的质粒,并使用适当的限制性核酸内切酶(即Ncol和Xbal)检测插入物。通过DNA序列分析(测序酶,美国生化公司,美国)确认选择的质粒可编码EEAEPK-MI3胰岛素前体的正确DNA序列,并插入到编码合成LA19前导链DNA的后面。此质粒命名为pAK729。
编码YAP3信号肽-IA19前导肽EEAEPK-MI3胰岛素前体复合物的DNA序列如SEQ ID NO.1所示。
将质粒pAK721转化到如PCT/DK95/00250所述的酿酒酵母菌株MT663中,所得的菌株命名为yAK721。
所说的酵母表达质粒pAK729为C-POT型(参见图1),并且此质粒与WO EP171 142中描述的质粒相似,后者含有用于质粒选择并在酿酒酵母中稳定的粟酒裂殖酵母-1丙糖磷酸异构酶基因(POT)。pAK729也含有酿酒酵母的丙糖磷酸异构酶的启动子和终止子。所说的启动子和终止子与质粒pKFN1003(WO90/100075中描述的)中描述的启动子及终止子相似,除了编码YAP3信号肽-LA19前导肽-EEAEPK-MI3胰岛素前体的EcoRI-Xbal片段间的序列之外,所有的序列都在此质粒中。
实施例2.表达EEAEPK-MI1胰岛素前体的酵母菌株yAK733的构建通过将编码前导肽、突出端和胰岛素前体的各种DNA片段组合在一起来构建编码N-末端延伸胰岛素前体EEAEPK-MI1的N-末端突出端的合成基因。
用限制性核酸内切酶BglII和Xbal切割质粒pAK721(参见图1),并使用如上所述的基因纯化试剂盒分离10849个核苷酸碱基对的载体片段。
用限制性核酸内切酶HindIII和Xbal切割质粒pAK729,并使用如上所述的基因纯化试剂盒分离131个核苷酸碱基对的DNA片段。
用限制性核酸内切酶BglII和HindIII切割质粒pAK729,并如上所述分离229个核苷酸碱基对的DNA片段。
使用T4 DNA连接酶和标准条件(Sambrook J.,Fritsch EF和ManiatisT,分子克隆,冷泉港实验室出版社,1989)将这3个DNA片段连接在一起。然后将连接混合物转化到感受态大肠杆菌菌株(R-,M+)中,之后通过氨苄青霉素抗性进行选择。使用标准技术(Sambrook J.,Fritsch E和Maniatis T,分子克隆,冷泉港实验室出版社,1989)分离所得的大肠杆菌中的质粒,并使用适当的限制性核酸内切酶检测插入物。通过DNA序列分析(测序酶,美国生化公司,美国)确认选择的质粒可编码EEAEPK-MI1胰岛素前体的正确DNA序列,并插入到编码合成的LA19前导链及突出端DNA的后面。此质粒命名为pAK733。
编码YAP3信号肽-IA19前导肽EEAEPK-MI1胰岛素前体复合物的DNA序列如SEQ ID NO.2所示。
将质粒pAK733转化到如PCT/DK95/00250所述的酿酒酵母菌株MT663中,所得的菌株命名为yAK733。所说的酵母表达质粒pAK733为C-POT型(参见图1),并且此质粒与WO EP 171 142中描述的质粒相似,后者含有用于质粒选择并在酿酒酵母中稳定的粟酒裂殖酵母-1丙糖磷酸异构酶基因(POT)。pAK733也含有酿酒酵母的丙糖磷酸异构酶的启动子和终止子。所说的启动子和终止子与质粒pKFN1003(WO 90/100075中描述的)中描述的启动子及终止子相似,除了编码YAP3信号肽-LA19前导肽-EEAEPK-MI1胰岛素前体的EcoRI-Xbal片段间的序列之外,所有的序列都在此质粒中。
实施例3.表达EEAEPK-MI5胰岛素前体的酵母菌株yAK749的构建通过将编码前导肽、突出端和胰岛素前体的各种DNA片段组合在一起来构建编码N-末端延伸胰岛素前体EEAEPK-MI5的N-末端突出端的合成基因。
用限制性核酸内切酶BglII和NheI切割质粒pAK743,并使用如上所述的基因纯化试剂盒分离10757个核苷酸碱基对的载体片段。
用限制性核酸内切酶HindIII和NheI切割质粒pAK405,并使用如上所述的基因纯化试剂盒分离238个核苷酸碱基对的DNA片段。
用限制性核酸内切酶BglII和HindIII切割质粒pAK729,并如上所述分离229个核苷酸碱基对的DNA片段。
使用T4DNA连接酶和标准条件(Sambrook J.,Fritsch EF和ManiatisT,分子克隆,冷泉港实验室出版社,1989)将这3个DNA片段连接在一起。然后将连接混合物转化到感受态大肠杆菌菌株(R-,M+)中,之后通过氨苄青霉素抗性进行选择。使用标准技术(Sambrook J.,Fritsch EF和Maniatis T,分子克隆,冷泉港实验室出版社,1989)分离所得的大肠杆菌中的质粒,并使用适当的限制性核酸内切酶检测插入物。通过DNA序列分析(测序酶,美国生化公司,美国)确认选择的质粒可编码EEAEPK-MI5胰岛素前体的正确DNA序列,并插入到编码合成的LA19前导链及突出端DNA的后面。此质粒命名为pAK749。
编码YAP3信号肽-IA19前导肽EEAEPK-MI5胰岛素前体复合物的DNA序列如SEQ ID NO.3所示。
将质粒pAK749转化到如PCT/DK95/00250所述的酿酒酵母菌株MT663中,所得的菌株命名为yAK749。所说的酵母表达质粒pAK749为C-POT型(参见图1),并且此质粒与WO EP 171 142中描述的质粒相似,后者含有用于质粒选择并在酿酒酵母中稳定的粟酒裂殖酵母-1丙糖磷酸异构酶基因(POT)。pAK749也含有酿酒酵母的丙糖磷酸异构酶的启动子和终止子。所说的启动子和终止子与质粒pKFN1003(WO 90/100075中描述的)中描述的启动子及终止子相似,除了编码YAP3信号肽-LA19前导肽-EEAEPK-MI5胰岛素前体的EcoRI-Xbal片段间的序列之外,所有的序列都在此质粒中。
实施例4.表达EEAEPK-X14胰岛素前体的酵母菌株yAK866的构建通过将编码前导肽、突出端和胰岛素前体的各种DNA片段组合在一起来构建编码N-末端延伸胰岛素前体EEAEPK-X14的N-末端突出端的合成基因。
用限制性核酸内切酶BglII和NheI切割质粒pAK743,并使用如上所述的基因纯化试剂盒分离10757个核苷酸碱基对的载体片段。
用限制性核酸内切酶HindIII和NheI切割质粒pAK602,并使用如上所述的基因纯化试剂盒分离232个核苷酸碱基对的DNA片段。
用限制性核酸内切酶BglII和HindIII切割质粒pAK729,并如上所述分离229个核苷酸碱基对的DNA片段。
使用T4DNA连接酶和标准条件(Sambrook J.,Fritsch EF和ManiatisT,分子克隆,冷泉港实验室出版社,1989)将这3个DNA片段连接在一起。然后将连接混合物转化到感受态大肠杆菌菌株(R-,M+)中,之后通过氨苄青霉素抗性进行选择。使用标准技术(Sambrook J.,Fritsch EF和Maniatis T,分子克隆,冷泉港实验室出版社,1989)分离所得的大肠杆菌中的质粒,并使用适当的限制性核酸内切酶检测插入物。通过DNA序列分析(测序酶,美国生化公司,美国)确认选择的质粒可编码EEAEPK-X14胰岛素前体的正确DNA序列,并插入到编码合成的LA19前导链及突出端DNA的后面。此质粒命名为pAK866。
编码YAP3信号肽-IA19前导肽EEAEPK-X14胰岛素前体复合物的DNA序列如SEQ ID NO.4所示。
将质粒pAK866转化到如PCT/DK95/00250所述的酿酒酵母菌株MT663中,所得的菌株命名为yAK866。所说的酵母表达质粒pAK866为C-POT型(参见图1),并且此质粒与WO EP 171 142中描述的质粒相似,后者含有用于质粒选择并在酿酒酵母中稳定的粟酒裂殖酵母-1丙糖磷酸异构酶基因(POT)。pAK866也含有酿酒酵母的丙糖磷酸异构酶的启动子和终止子。所说的启动子和终止子与质粒pKFN1003(WO90/100075中描述的)中描述的启动子及终止子相似,除了编码YAP3信号肽-LA19前导肽-EEAEPK-X14胰岛素前体的EcoRI-Xbal片段间的序列之外,所有的序列都在此质粒中。SEQ ID NO 11M K L K T V R S A V L SBglII------ATGAAA CTGAAAACTG TAAGATCTGC GGTCCTTTCGTACTTT GACTTTTGAC ATTCTAGACG CCAGGAAAGCS L F A S Q V L G Q P I D D T E STCACTCTTTG CATCTCAGGT CCTTGGCCAA CCAATTGACG ACACTGAATCAGTGAGAAAC GTAGAGTCCA GGAACCGGTT GGTTAACTGC TGTGACTTAGN T T S V N L M A D D T E S R FXbaI------TAACACTACT TCTGTCAACT TGATGGCTGA CGACACTGAA TCTAGATTCGATTGTGATGA AGACAGTTGA ACTACCGACT GCTGTGACTT AGATCTAAGCA T N T T L A L D V V N L I S M ANcoI------CTACTAACAC TACTTTGGCT TTGGATGTTG TTAACTTGAT CTCCATGGCTGATGATTGTG ATGAAACCGA AACCTACAAC AATTGAACTA GAGGTACCGAK R E E A E P K F V N Q H L C G SAAGAGAGAAG AAGCTGAACC AAAGTTCGTT AACCAACACT TGTGCGGTTCTTCTCTCTTC TTCGACTTGG TTTCAAGCAA TTGGTTGTGA ACACGCCAAGH L V E A L Y L V C G E R G F FCCACTTGGTT GAAGCTTTGT ACTTGGTTTG CGGTGAAAGA GGTTTCTTCTGGTGAACCAA CTTCGAAACA TGAACCAAAC GCCACTTTCT CCAAAGAAGAY T P K A A K G I V E Q C C T S IACACTCCTAA GGCTGCTAAG GGTATTGTCG AACAATGCTG TACCTCCATCTGTGAGGATT CCGACGATTC CCATAACAGC TTGTTACGAC ATGGAGGTAG123C S L Y Q L E N Y C N *TGCTCCTTGT ACCAATTGGA AAACTACTGC AACTAGACGC AGCCCGCAGGACGAGGAACA TGGTTAACCT TTTGATGACG TTGATCTGCG TCGGGCGTCCXbaI------CTCTAGAGAGATCTSEQ ID NO 2EcoRI-------901 TTCTTGCTTA AATCTATAAC TACAAAAAAC ACATACAGGA ATTCCATTCAAAGAACGAAT TTAGATATTG ATGTTTTTTG TGTATGTCCT TAAGGTAAGT951 AGAATAGTTC AAACAAGAAG ATTACAAACT ATCAATTTCA TACACAATATTCTTATCAAG TTTGTTCTTC TAATGTTTGA TAGTTAAAGT ATGTGTTATA+1 M K L K T V R S A V L SBglII------1001 AAACGATTAA AAGAATGAAA CTGAAAACTG TAAGATCTGC GGTCCTTTCGTTTGCTAATT TTCTTACTTT GACTTTTGAC ATTCTAGACG CCAGGAAAGC+1 S L F A S Q V L G Q P I D D T E SStyI------1051 TCACTCTTTG CATCTCAGGT CCTTGGCCAA CCAATTGACG ACACTGAATCAGTGAGAAAC GTAGAGTCCA GGAACCGGTT GGTTAACTGC TGTGACTTAG+1 N T T S V N L M A D D T E S R FXbaI------1101 TAACACTACT TCTGTCAACT TGATGGCTGA CGACACTGAA TCTAGATTCGATTGTGATGA AGACAGTTGA ACTACCGACT GCTGTGACTT AGATCTAAGC+1 A T N T T L A L D V V N L I S M AStyI------NcoI------1151 CTACTAACAC TACTTTGGCT TTGGATGTTG TTAACTTGAT CTCCATGGCTGATGATTGTG ATGAAACCGA AACCTACAAC AATTGAACTA GAGGTACCGA+1 K R E E A E P K F V N Q H L C G S1201 AAGAGAGAAG AAGCTGAACC AAAGTTCGTT AACCAACACT TGTGCGGTTCTTCTCTCTTC TTCGACTTGG TTTCAAGCAA TTGGTTGTGA ACACGCCAAG+1 H L V E A L Y L V C G E R G F FHindIII------1251 CCACTTGGTT GAAGCTTTGT ACTTGGTTTG CGGTGAAAGA GGTTTCTTCTGGTGAACCAA CTTCGAAACA TGAACCAAAC GCCACTTTCT CCAAAGAAGA+1 Y T P K G I V E Q C C T S I C S LBsu36I------1301 ACACTCCTAA GGGTATTGTC GAACAATGCT GTACCTCCAT CTGCTCCTTGTGTGAGGATT CCCATAACAG CTTGTTACGA CATGGAGGTA GACGAGGAAC+1 Y Q L E N Y C N *XbaI------1351 TACCAATTGG AAAACTACTG CAACTAGACG CAGCCCGCAG GCTCTAGAAAATGGTTAACC TTTTGATGAC GTTGATCTGC GTCGGGCGTC CGAGATCTTTSEQ ID NO 3EcoRI-------901 TTCTTGCTTA AATCTATAAC TACAAAAAAC ACATACAGGA ATTCCATTCAAAGAACGAAT TTAGATATTG ATGTTTTTTG TGTATGTCCT TAAGGTAAGT951 AGAATAGTTC AAACAAGAAG ATTACAAACT ATCAATTTCA TACACAATATTCTTATCAAG TTTGTTCTTC TAATGTTTGA TAGTTAAAGT ATGTGTTATA+1 M K L K T V R S A V L SBglII------1001 AAACGATTAA AAGAATGAAA CTGAAAACTG TAAGATCTGC GGTCCTTTCGTTTGCTAATT TTCTTACTTT GACTTTTGAC ATTCTAGACG CCAGGAAAGC+1 S L F A S Q V L G Q P I D D T E SStyI------1051 TCACTCTTTG CATCTCAGGT CCTTGGCCAA CCAATTGACG ACACTGAATCAGTGAGAAAC GTAGAGTCCA GGAACCGGTT GGTTAACTGC TGTGACTTAG+1 N T T S V N L M A D D T E S R FXbaI------1101 TAACACTACT TCTGTCAACT TGATGGCTGA CGACACTGAA TCTAGATTCGATTGTGATGA AGACAGTTGA ACTACCGACT GCTGTGACTT AGATCTAAGC+1 A T N T T L A L D V V N L I S M AStyI------NcoI------1151 CTACTAACAC TACTTTGGCT TTGGATGTTG TTAACTTGAT CTCCATGGCTGATGATTGTG ATGAAACCGA AACCTACAAC AATTGAACTA GAGGTACCGA+1 K R E E A E P K F V N Q H L C G S1201 AAGAGAGAAG AAGCTGAACC AAAGTTCGTT AACCAACACT TGTGCGGTTCTTCTCTCTTC TTCGACTTGG TTTCAAGCAA TTGGTTGTGA ACACGCCAAG+1 H L V E A L Y L V C G E R G F FHindIII------1251 CCACTTGGTT GAAGCTTTGT ACTTGGTTTG CGGTGAAAGA GGTTTCTTCTGGTGAACCAA CTTCGAAACA TGAACCAAAC GCCACTTTCT CCAAAGAAGA+1 Y T P K S D D A K G I V E Q C C T1301 ACACTCCTAA GTCTGACGAT GCTAAGGGTA TTGTCGAGCA ATGCTGTACCTGTGAGGATT CAGACTGCTA CGATTCCCAT AACAGCTCGT TACGACATGG+1 S I C S L Y Q L E N Y C N *1351 TCCATCTGCT CCTTGTACCA ATTGGAAAAC TACTGCAACT AGACGCAGCCAGGTAGACGA GGAACATGGT TAACCTTTTG ATGACGTTGA TCTGCGTCGGXbaI------1401 CGCAGGCTCT AGAAACTAAG ATTAATATAA TTATATAAAA ATATTATCTTGCGTCCGAGA TCTTTGATTC TAATTATATT AATATATTTT TATAATAGAASEQ ID NO 4EcoRI-------901 TTCTTGCTTA AATCTATAAC TACAAAAAAC ACATACAGGA ATTCCATTCAAAGAACGAAT TTAGATATTG ATGTTTTTTG TGTATGTCCT TAAGGTAAGT951 AGAATAGTTC AAACAAGAAG ATTACAAACT ATCAATTTCA TACACAATATTCTTATCAAG TTTGTTCTTC TAATGTTTGA TAGTTAAAGT ATGTGTTATA+1 M K L K T V R S A V L SBglII------1001 AAACGATTAA AAGAATGAAA CTGAAAACTG TAAGATCTGC GGTCCTTTCGTTTGCTAATT TTCTTACTTT GACTTTTGAC ATTCTAGACG CCAGGAAAGC+1 S L F A S Q V L G Q P I D D T E SStyI------1051 TCACTCTTTG CATCTCAGGT CCTTGGCCAA CCAATTGACG ACACTGAATCAGTGAGAAAC GTAGAGTCCA GGAACCGGTT GGTTAACTGC TGTGACTTAG+1 N T T S V N L M A D D T E S R FXbaI------1101 TAACACTACT TCTGTCAACT TGATGGCTGA CGACACTGAA TCTAGATTCGATTGTGATGA AGACAGTTGA ACTACCGACT GCTGTGACTT AGATCTAAGC+1 A T N T T L A L D V V N L I S M AStyINcoI------1151 CTACTAACAC TACTTTGGCT TTGGATGTTG TTAACTTGAT CTCCATGGCTGATGATTGTG ATGAAACCGA AACCTACAAC AATTGAACTA GAGGTACCGA+1 K R E E A E P K F V N Q H L C G S1201 AAGAGAGAAG AAGCTGAACC AAAGTTCGTT AACCAACACT TGTGCGGTTCTTCTCTCTTC TTCGACTTGG TTTCAAGCAA TTGGTTGTGA ACACGCCAAG+1 H L V E A L Y L V C G E R G F FHindIII------1251 CCACTTGGTT GAAGCTTTGT ACTTGGTTTG TGGTGAAAGA GGTTTCTTCTGGTGAACCAA CTTCGAAACA TGAACCAAAC ACCACTTTCT CCAAAGAAGA+1 Y T D K A A K G I V E Q C C T S I1301 ACACTGACAA GGCTGCTAAG GGTATTGTTG AACAATGTTG TACCTCTATCTGTGACTGTT CCGACGATTC CCATAACAAC TTGTTACAAC ATGGAGATAG+1 C S L Y Q L E N Y C N *1351 TGTTCTTTGT ACCAATTGGA AAACTACTGT AACTAGACGC AGCCCGCAGGACAAGAAACA TGGTTAACCT TTTGATGACA TTGATCTGCG TCGGGCGTCCXbaI------1401 CTCTAGACTA AGATTAATAT AATTATATAA AAATATTATC TTCTTTTCTTGAGATCTGAT TCTAATTATA TTAATATATT TTTATAATAG AAGAAAAGAA
XbaI------1401 AGGCTCTAGA AACTAAGATT AATATAATTA TATAAAAATA TTATCTTCTTTCCGAGATCT TTGATTCTAA TTATATTAAT ATATTTTTAT AATAGAAGAASEQ ID NO5,LA19前导肽SEQ ID NO5信息(i)序列特征(A)长度43个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型肽(xi)序列描述SEQ ID NO5Gln Pro Ile Asp Asp Thr Glu Ser Asn Thr Thr Ser Val Asn Leu Met15 10 15Ala Asp Asp Thr Glu Ser Arg Phe Ala Thr Asn Thr Thr Leu Ala Leu20 25 30Asp Val Val Asn Leu Ile Ser Met Ala Lys Arg35 40
权利要求
1.一种DNA构建体,这种DNA构建体编码多肽并具有下列结构信号肽-前导肽-EEAEPK-异源蛋白。
2.按照前面权利要求的DNA构建体,其中所说的信号肽是酵母天冬氨酸蛋白酶3(YAP3)信号肽或者它的功能类似物。
3.按照前面的权利要求任一之DNA构建体,其中所说的前导肽是合成前导肽,优选的是本文SEQ ID NO5的LA19前导肽。
4.按照前面的权利要求任一之DNA构建体,其中所说的异源蛋白质选自由抑蛋白酶肽、组织因子途径抑制剂或者其它蛋白酶抑制剂、胰岛素或者胰岛素前体、胰岛素类似物、类胰岛素生长因子I或者II、人或者牛生长激素、白细胞介素、组织纤溶酶原激活物、转化生长因子a或者b、胰高血糖素、类胰高血糖素肽1(GLP-1)、类胰高血糖素肽2(GLP-2)、GRPP、因子VII、因子VIII、因子XIII、血小板衍生的生长因子、酶(如脂酶)、或者这些蛋白质任何一种的功能类似物组成的组。
5.按照权利要求1、2或3任一之DNA构建体,其中所说的异源蛋白质选自由抑蛋白酶肽、组织因子途径抑制剂或者其它蛋白酶抑制剂、类胰岛素生长因子I或者II、人或者牛生长激素、白细胞介素、组织纤溶酶原激活物、胰高血糖素、类胰高血糖素肽1、因子VII、因子VIII、因子XIII、血小板衍生的生长因子、酶、胰岛素或者胰岛素以及这些蛋白质任何一种的功能类似物组成的组。
6.按照权利要求4或5的DNA构建体,其中所说的异源蛋白质是胰岛素或者胰岛素前体,优选的是选自由MI1,B(1-29)-A(1-21);MI3,B(1-29)-Ala-Ala-Lys-A(1-21);X14,B(1-27-Asp-Lys)-Ala-Ala-Lys-A(1-21);B(1-29)-Ala-Ala-Arg-A(1-21);MI5,B(1-29)-Ser-Asp-Asp-Ala-Lys-A(1-21);和B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21)组成的组。
7.按照权利要求4或5的DNA构建体,其中所说的异源蛋白质是胰岛素或胰岛素前体,优选的是胰岛素前体MI3或者它的功能类似物。
8.本文SEQ ID NO.1、2、3或4描述的DNA构建体。
9.一种重组表达载体,这种载体能够在真核细胞中复制,并且携带按照前面权利要求任一之DNA构建体。
10.一种重组表达载体,这种载体能够在酵母中复制,并且携带按照前面权利要求1-8任一之DNA构建体。
11.一种酵母细胞,这种酵母细胞能够表达异源蛋白质并且可以用按照权利要求10的载体转化。
12.一种按照权利要求11的酵母细胞,这种酵母细胞选自下列各物种酿酒酵母、克鲁弗酵母、粟酒裂殖酵母-1、葡萄汁酵母、乳酸克鲁维酵母、多形汉逊酵母、巴斯德毕赤酵母、Pichia methanolica、克鲁弗毕赤酵母、Yarrowia lipolytica、念珠菌属未知种、产朊假丝酵母、可可假丝酵母、地丝菌属未知种和Geotrichum fermentans,优选的是酿酒酵母。
13.一种产生异源蛋白质的方法,这种方法包括在合适的培养基中培养按照权利要求11或12的酵母细胞,以便表达并分泌所说的异源蛋白质,此后从所说的培养基和/或细胞中分离蛋白质。
14.一种产生异源蛋白质的方法,这种方法包括在合适的培养基中培养按照权利要求11或12的酵母细胞,以便表达并分泌所说的异源蛋白质,此后从所说的培养基中分离蛋白质。
15.按照权利要求13或14的方法,其中所说的氨基酸序列EEAEPK通过与对碱性氨基酸是特异的蛋白水解酶处理有关的方法从所回收的异源蛋白质中除去。
16.按照权利要求15的方法,其中所说的蛋白水解酶选自由胰蛋白酶和水解无色杆菌蛋白酶I组成的组。
全文摘要
本发明涉及一种DNA构建体(这种构建体含有编码N-末端延伸蛋白多肽的DNA序列)、含有所说的DNA片段的载体、用此载体转化的酵母细胞和在真核细胞(包括酵母)中产生异源蛋白质的方法。所说的DNA构建体编码下列结构:信号肽—前导肽-EEAEPK-多肽。
文档编号C12N1/19GK1207773SQ96199732
公开日1999年2月10日 申请日期1996年12月18日 优先权日1995年12月20日
发明者T·B·科耶尔德森, P·巴尔史密德特, A·F·彼德森 申请人:诺沃挪第克公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1