产生具有l-天冬酰胺酶活性的分泌的多肽的方法

文档序号:449403阅读:652来源:国知局
专利名称:产生具有l-天冬酰胺酶活性的分泌的多肽的方法
技术领域
本发明涉及一种产生具有L-天冬酰胺酶活性的分泌的多肽的重组方法。
背景技术
L-天冬酰胺酶(E.C.3.5.1.1)催化L-天冬酰胺水解成天冬氨酸和氨。已从不同细菌源获得了L-天冬酰胺酶。
已经证实了来自大肠杆菌的L-天冬酰胺酶具有抗肿瘤活性(Hill等,1967,JAMA 202882;Capizzi等,1971,Ann.Intern.Med.74893)。
Law和Wriston(Archives of Biochemistry and Biophysics 147744-7521971)公开了非分泌的凝结芽孢杆菌(Bacillus coagulans)L-天冬酰胺酶的纯化和性质。Tyul’Panova等(Microbiology 41369-374,1972)公开了肠膜芽孢杆菌(Bacillus mesentericus)43-A L-天冬酰胺酶的性质。Nefelova等(Appl.Biochem.Microbiol.14400-403,1978/1979)公开了多粘芽孢杆菌(Bacilluspolymyxa)L-天冬酰胺酶的生物合成。
Sun和Setlow(Journal of Bacteriology 1733831-3845,1971)公开了非分泌的枯草芽孢杆菌L-天冬酰胺酶的克隆、其核苷酸序列和表达。Kunst等人(1997,Nature 390249)公开了枯草芽孢杆菌的完整基因组序列。
在本领域中,需要重组的分泌的L-天冬酰胺酶以有利于该酶的产生和回收的。
本发明的目的是提供一种具有L-天冬酰胺酶活性的分泌的多肽,以及编码这类多肽的核酸。
发明概述本发明涉及一种产生具有L-天冬酰胺酶活性的分泌的多肽的重组方法,其包括(a)在有利于该多肽产生的条件下培养宿主细胞,其中所述宿主细胞含有核酸构建体,所述核酸构建体含有编码分泌信号肽的第一核酸序列,其中所述第一核酸序列与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接;和(b)回收该分泌的多肽。
本发明还涉及一种具有L-天冬酰胺酶活性的分离的分泌的多肽,其选自(a)具有与SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列的多肽;(b)一种由核酸序列编码的多肽,其中所述核酸序列在中度严谨条件下与以下序列杂交(i)SEQ ID NO1的70-1125位核苷酸,(ii)至少100个连续核苷酸的(i)的亚序列,或者(iii)(i)或(ii)的互补链;(c)(a)或(b)的多肽片段,其中所述多肽片段具有L-天冬酰胺酶活性。
本发明还涉及编码所述分泌的多肽的分离的核酸序列,以及包含该核酸序列的核酸构建体、载体和宿主细胞,和利用该分泌的多肽的方法。


图1显示枯草芽孢杆菌ATCC 6051A L-天冬酰胺酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO1和2)。
图2显示pMDT050的限制性图谱。
图3显示包含“共有序列”amyQ启动子的核酸序列。
发明详述本发明涉及一种产生具有L-天冬酰胺酶活性的分泌的多肽的重组方法,其包括(a)在有利于该多肽产生的条件下培养宿主细胞,其中所述宿主细胞含有核酸构建体,所述核酸构建体含有编码分泌信号肽的第一核酸序列,其中所述第一核酸序列与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接,其中所述信号肽序列指导该多肽进入细胞分泌途径;和(b)回收该分泌的多肽。
本发明的方法有许多优点。所述优点包括L-天冬酰胺酶的分泌使其易于回收和纯化,可高产量产生L-天冬酰胺酶的高表达构建体,以及具有GRAS状态的宿主细胞在生产中的用途。
术语“天冬酰胺酶活性”在本文中定义为L-天冬酰胺的酰胺水解酶活性,即催化L-天冬酰胺水解为L-天冬氨酸和氨。为了本发明的目的,L-天冬酰胺活性根据da Fonseca-Wollheim,F.,Bergmeyer,H.U.& Gutmann,I.(1974)in Methoden der Enzymatischen Analyse(Bergmeyer,H.U.Hrsg.)3.Aufl.,Bd.2,S.1850-1853,Verlag Chemie,Weinheimand(1974)in Methods ofEnzymatic Analysis(Bergmeyer,H.U.ed.)2nd ed.,vol.4,pp 1802-1806,VerlagChemie,Weinheim/Academic Press,Inc.,New York and London;以及Bergmeyer,H.U.& Beutler,H.-O.(1985)in Methods of Enzymatic Analysis(Bergmeyer,H.U.,ed.)3rd ed.,vol.VIII,pp.454-461,Verlag Chemie,Weinheim,Deerfield Beach/Florida,Base所描述的方法进行测定。在谷氨酸脱氢酶和还原型烟酰胺腺嘌呤二核苷酸(NADH)存在的条件下,将在L-天冬酰胺酶将L-天冬酰胺转变为L-天冬氨酸时产生的氨与2-酮戊二酸反应,产生氧化型烟酰胺腺嘌呤二核苷酸(NAD)和L-谷氨酸。该试验在25℃,pH8的条件下进行。1个单位的L-天冬酰胺酶活性定义为在25℃,pH8时,每分钟产生1.0微摩尔的NAD。
术语“核酸构建体”在本文中定义为一种单链或双链的核酸分子,其分离自天然存在的基因,或通过对其进行修饰含有以自然界中不存在的方式连接和并置的核酸片段。当核酸构建体含有编码序列的表达所需的所有控制序列时,术语核酸序列构建体与术语表达盒同义。术语“编码序列”在本文中定义为直接表明其蛋白产物的氨基酸序列的核酸序列。基因组编码序列的界限通常由恰好位于mRNA 5’端的开放阅读框上游的核糖体结合位点(原核生物)和恰好位于mRNA 3’端的开放阅读框下游的转录终止序列来确定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。
在本文中,术语“可操作地连接”定义为一种构型,其中一段控制序列,如信号肽序列,位于与核酸序列的编码序列相关的恰当位置,使该控制序列指导多肽的表达。不言而喻,表达包括多肽产生所涉及的任何步骤,其包括但不限于,转录、转录后修饰、翻译、翻译后修饰和分泌。
在本发明的制备方法中,采用本领域熟知的方法将细胞在适于产生多肽的营养培养基中培养。例如,细胞可在适当的培养基中和允许多肽表达和/或分离的条件下,通过如下方法进行培养摇瓶培养和在实验室或工业发酵罐中的小规模或大规模发酵(包括连续(continuous)、分批(batch)、补料分批(fed-batch)或固态(solid state)发酵)。采用本领域熟知的方法,在含有碳源、氮源和无机盐的适宜营养培养基中进行培养。适宜的培养基可从供应商处获得,或可根据已公开的组合物(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中的组合物)来制备。由于所述多肽被分泌入营养培养基中,所以可直接从培养基中回收所述多肽。
产生的分泌的多肽可采用本领域熟知的方法分离或回收。例如,多肽可采用常规方法从营养培养基中回收,其包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
分离的多肽可通过本领域熟知的多种方法进行纯化,包括但不限于层析(如离子交换层析、亲合层析、疏水层析、层析聚焦和体积排阻色谱(sizeexclusion))、电泳(如制备型等电聚焦电泳)、差异溶解性法(differentialsolubility)(如硫酸铵沉淀)、SDS-PAGE或提取(extraction)(见,如ProteinPurification,J.-C.Janson和Lars Ryden编,VCH Press,纽约,1989)。
如在本文中所定义,“分离的”多肽指基本上不含有其它非天冬酰胺酶多肽的多肽,例如通过SDS-PAGE测定纯度至少约为20%,优选至少约为40%,更优选约为60%,甚至更优选约为80%,最优选约为90%,甚至最优选约为95%。
编码信号肽的核酸序列编码分泌信号肽的第一核酸序列与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接。信号肽编码区编码与具有L-天冬酰胺酶活性的多肽的氨基端相连的氨基酸序列。信号肽指导所编码的多肽进入细胞分泌途径。
任何编码信号肽的核酸序列均可用于本发明的方法中。细菌宿主细胞的有效信号肽编码区可获自芽孢杆菌NCIB11837产麦芽糖淀粉酶基因、嗜热脂肪芽孢杆菌α-淀粉酶基因、地衣芽孢杆菌枯草杆菌蛋白酶基因、地衣芽孢杆菌β-内酰胺酶基因、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌prsA基因。其它信号肽见Simonen和Palva,1993,微生物评论(Microbiological Reviews)57109-137。
在一个优选的实施方案中,编码信号肽的第一核酸序列含有SEQ ID NO1的第1-69位核苷酸(其编码SEQ ID NO2的第1-23位氨基酸)或其编码所述信号肽的一部分的亚序列,所述信号肽的一部分保留了指导所编码的多肽进入细胞分泌途径的能力。在另一个优选的实施方案中,编码信号肽的第一核酸序列是包含在位于大肠杆菌NRRL B-30558中的质粒pCR2.1-yccC中的序列。
编码具有L-天冬酰胺酶活性的多肽的核酸编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可获自任何属的微生物。为了本发明的目的,本文中所用术语“获自”与给定来源相连,是指由所述核酸序列编码的多肽是通过所述来源产生的,或通过其中插入了来自该来源的核酸序列的细胞产生的。
编码具有L-天冬酰胺酶活性的多肽的核酸序列可获自细菌源。例如,核酸序列可获自革兰氏阳性菌源,如芽孢杆菌属(Bacillus)菌株,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacilluscirculans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus.lautus)、迟缓芽孢杆菌(Bacillus.lentus)、地衣芽孢杆菌(Baculluslincheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌菌株(Bacillus thuringiensis);或链霉菌属(Streptomyces)菌株,例如浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)菌株;或革兰氏阴性菌株,例如大肠杆菌属(E.coli)或假单胞菌属(Pseudomonas)菌株。
在一个优选的实施方案中,第二核酸序列编码选自下组的具有L-天冬酰胺酶活性的多肽(a)具有与SEQ ID NO2的第24-375位氨基酸至少70%同一性的氨基酸序列的多肽;(b)一种由核酸序列编码的多肽,其中所述的核酸序列在中度严谨条件下与以下序列杂交(i)SEQ ID NO1的第70-1125位核苷酸,(ii)至少100个连续核苷酸的(i)的亚序列,或者(iii)(i)或(ii)的互补链;(c)(a)或(b)的等位基因变体;(d)(a)、(b)或(c)的片段,其中所述片段具有L-天冬酰胺酶活性。
在一个更优选的实施方案中,分泌的多肽具有与SEQ ID NO2(即,成熟多肽)的第24-375位氨基酸有至少约70%,优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,甚至最优选至少97%同一性的氨基酸序列,所述分泌的多肽具有L-天冬酰胺酶活性(此后称“同源性多肽”)。同源性多肽具有的氨基酸序列与SEQ ID NO2的第24-375位氨基酸有5个氨基酸不同,优选有4个氨基酸不同,更优选有3个氨基酸不同,甚至更优选有2个氨基酸不同,最优选有1个氨基酸不同。为了本发明的目的,通过Clustal方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI),以同一性表和多项比对参数(缺口罚分(gap penalty)为10,缺口长度罚分(gap lengthpenalty)为10),对两种氨基酸序列之间的同一性程度进行测定。成对比对(pairwise alignment)参数为Ktuple=1,缺口罚分(gap penalty)=3,窗(windows)=5,且对角(diagonals)=5。
优选,所述多肽含有SEQ ID NO2的第24-375位氨基酸或其等位基因变体;或具有L-天冬酰胺酶活性的片段。在另一个优选的实施方案中,所述多肽含有SEQ ID NO2的第24-375位氨基酸。在另一个优选的实施方案中,多肽由SEQ ID NO2的第24-375位氨基酸或其等位基因变体;或其具有L-天冬酰胺酶活性的片段组成。在另一个优选的实施方案中,多肽由SEQID NO2的第24-375位氨基酸组成。
SEQ ID NO2的第24-375位氨基酸片段是具有一个或多个从该氨基酸序列的氨基端和/或羧基端缺失的氨基酸的多肽。优选,所述片段包含至少305个氨基酸残基,更优选至少320个氨基酸残基,最优选至少335个氨基酸残基。
等位基因变体指占据相同染色体位点的一个基因的两种或多种可选形式中之一。等位基因变异通过突变自然发生,并可导致群体内的多态性。基因突变可以是沉默突变(在所编码的多肽中无改变)或者可以编码其氨基酸序列发生改变的多肽。多肽的等位基因突变体是由基因的等位基因变体编码的多肽。
在另一个优选的实施方案中,具有L-天冬酰胺酶活性的多肽是具有SEQ ID NO2的氨基酸序列的分泌的多肽的变体,所述变体含有一个或多个氨基酸的取代、缺失和/或插入。
变体多肽的氨基酸序列可通过一个或多个氨基酸残基的插入或缺失和/或一个或多个氨基酸残基被不同氨基酸残基取代,而与SEQ ID NO2的氨基酸24-375不同。优选,氨基酸的改变是一个次要的特性,即为不会显著影响所述蛋白折叠和/或活性的保守性氨基酸取代;通常为1至大约30个氨基酸的小的缺失;小的氨基或羧基端延伸,例如氨基端的蛋氨酸残基;大约20-25个残基的小的连接肽;或者通过改变净电荷或其它功能,例如聚组氨酸域(poly-histidine tract)、抗原性表位或结合结构域而有利于纯化的小的延伸(extension)。
保守性取代的例子在碱性氨基酸(精氨酸、赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小的氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)的范围内。通常不改变比活性的氨基酸取代为本领域所熟知,而且由例如H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,纽约中所描述。最常见的交换为Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,以及反过来进行交换。
在另一个优选的实施方案中,具有L-天冬酰胺酶活性的分泌的多肽由核酸序列编码,所述核酸序列在极低严谨条件,优选低严谨条件,更优选中严谨条件,更优选中高严谨条件,甚至更优选高严谨条件,最优选极高严谨条件下与核酸探针杂交,所述的核酸探针在相同条件下与以下序列杂交(i)SEQ ID NO1第70-1125位核苷酸,(ii)(i)的亚序列,或者(iii)(i)或(ii)的互补链(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor,New York)。SEQ ID NO1的亚序列至少具有100个核苷酸,优选至少200个核苷酸,并且优选为连续的核苷酸。另外,所述亚序列可编码具有L-天冬酰胺酶活性的多肽片段。多肽可为具有L-天冬酰胺酶活性的多肽的等位基因突变体或片段。
按照本领域已知的方法,SEQ ID NO1的70-1125位核苷酸或其亚序列,以及SEQ ID NO2的24-375位核苷酸或其亚序列可被用来设计核酸探针,以从不同属或种的菌株中鉴定并克隆编码具有L-天冬酰胺酶活性的多肽的DNA。具体为,按照标准的Southern印迹方法,可使用上述探针与目的属或种的基因组或cDNA杂交,以鉴定并分离目的属或种中的相应基因。上述探针可以大大短于完整序列,但长度应该至少为15个,优选至少为25个,更优选至少为35个核苷酸。更长的探针也可以使用。DNA和RNA探针都可以使用。为了检测相应基因,通常对探针进行标记(例如,用32P、3H、35S、生物素或抗生物素蛋白)。本发明包括上述探针。
因此,可以对由上述其它生物体制备的基因组DNA或cDNA文库进行筛选,选出与上述探针杂交并编码具有L-天冬酰胺酶活性的多肽的DNA。通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术可对来自上述其它生物体的基因组DNA或其它DNA进行分离。可将来自文库的DNA或者分离的DNA转移并固定于硝酸纤维素或其它适当的载体材料上。在Southern印迹法中使用上述载体材料,以对与SEQ ID NO1或其亚序列同源的克隆或DNA进行鉴定。为了本发明的目的,杂交指在极低到极高严谨条件下,核酸序列与相应于SEQ ID NO1所示核酸序列、其互补链或其亚序列的标记核酸探针杂交。在这些条件下,与核酸探针杂交的分子可通过利用X-线胶片检测到。
在一个优选的实施方案中,核酸探针是编码SEQ ID NO2的24-375位氨基酸的核酸序列或其亚序列。在另一个优选的实施方案中,核酸探针是SEQ ID NO1的70-1125位核苷酸。在另一个优选的实施方案中,核酸探针是包含在质粒pCR2.1-yccC中的核酸序列,所述质粒pCR2.1-yccC包含在大肠杆菌NRRL B-30558中,其中所述核酸序列编码具有L-天冬酰胺活性的多肽,即氨基酸24-375。
对于长度为至少100个核苷酸的长探针,极低到极高严谨条件定义为按照标准Southern印迹法,于42℃在5X SSPE、0.3%SDS、200μg/ml剪切并变性的鲑精DNA中,以及相对于极低和低严谨度、中和中高严谨度、高和极高严谨度分别为25%、35%、50%的甲酰胺中预杂交和杂交。
对于长度为至少100个核苷酸的长探针,载体材料最后用2X SSC、0.2%SDS洗三次,每次15分钟,温度优选为至少45℃(极低严谨度),更优选至少50℃(低严谨度),更优选至少55℃(中严谨度),更优选至少60℃(中高严谨度),甚至更优选至少65℃(高严谨度),最优选至少70℃(极高严谨度)。
对于长度为约15到约70个核苷酸的短探针,严谨条件定义为根据标准Southern印迹法,于约5℃至约10℃,低于根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 481390)所述计算出的Tm下,在0.9M NaCl、0.09M Tris-HCl、pH7.6、6mM EDTA、0.5%NP-40、1X Denhardt′s溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP和0.2mg/ml酵母RNA中预杂交、杂交和杂交后洗涤。
对于长度为约15到约70个核苷酸的短探针,载体材料在添加了0.1%SDS的6X SCC中洗一次,洗涤15分钟,然后于5℃-10℃,计算的Tm下,用6X SSC洗两次,每次15分钟。
在一个优选的实施方案中,第二核酸序列获自嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌的菌株。
这些种类的菌株由多个培养物保藏中心向公众开放,如美国典型培养物保藏中心(ATCC)、德意志微生物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)以及农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection)、北方区域研究中心(Northern Regional Research Center,NRRL)。
此外,利用上述探针可以从其它来源中鉴定和获得所述多肽和核酸,所述来源包括从自然界(例如,土壤、堆肥、水等)分离的微生物。用于从天然生长环境中分离微生物的技术是本领域所熟知的。然后通过类似地筛选另一种微生物的基因组或cDNA文库可以得到核酸序列。一旦用探针检测到编码多肽的核酸序列,可采用本领域熟练技术人员已知的技术(见,如Sambrook等,1989,见上)对该序列进行分离或克隆。
用于分离或克隆编码多肽的核酸序列的技术在本领域是已知的,包括从基因组DNA分离、从cDNA制备或其组合。从此类基因组DNA中克隆核酸序列可例如,通过采用熟知的聚合酶链式反应(PCR)或表达文库的抗体进行筛选,以检测具有共有结构特征的克隆DNA片段来实现。见,例如Innis等,1990,PCR方法和应用指导(PCRA Guide to Methods and Application),Academic Press,纽约。还可以采用其它核酸扩增方法,如连接酶链式反应(LCR)、连接激活的转录(ligated activated transcription,LAT)和基于核酸序列的扩增(NASBA)。核酸序列可克隆自芽孢杆菌属菌株,或者另一种或相关生物体,且因此例如,其可为核酸序列的多肽编码区的等位基因变体或物种变体。
本文中所用的术语“分离的核酸序列”指一种基本上没有其它核酸序列的核酸序列,例如通过琼脂糖电泳测定纯度至少约为20%,优选至少约为40%,更优选约为60%,甚至更优选约为80%,最优选约为90%。例如,分离的核酸序列可以通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆方法来获得。所述克隆方法可包括切除和分离含编码该多肽的核酸序列的目的核酸片段,将该片段插入到载体分子中,并将该重组载体掺入到宿主细胞中,在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述的核酸序列可以是基因组、cDNA、RNA、半合成、合成来源的或者其任意组合。
在一个优选的实施方案中,第二核酸序列选自(a)一种编码多肽的核酸序列,所述多肽具有与SEQ ID NO2的第24-375位氨基酸有至少65%的同一性的氨基酸序列;(b)与SEQ ID NO1的第70-1125位核苷酸有至少65%的同源性的核酸序列;(c)在低、中、中高或高度严谨条件下与以下序列杂交的核酸序列(i)SEQ ID NO1的第70-1125位核苷酸,或(ii)至少100个连续核苷酸的(i)的亚序列,或(iii)(i)或(ii)的互补链;(d)编码SEQ ID NO2的24-375位氨基酸的变体的核酸序列,所述变体含有一个或多个氨基酸的取代、缺失和/或插入;(e)(a),(b)或(c)的等位基因变体;(f)(a),(b),(c)或(e)的亚序列,其中所述亚序列编码具有L-天冬酰胺酶活性的多肽片段。
在一个更优选的实施方案中,第二核酸序列与SEQ ID NO1的70-1125位核苷酸有至少约65%,优选约70%,优选约80%,更优选约90%,甚至更优选约95%,最优选约97%的同源性,其中所述第二核酸序列编码活性多肽。为了本发明的目的,通过Wilbur-Lipman法(Wilbur and Lipman,1983,Proceedings of the National Academy of Science USA 80726-730),利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)以同一性表和多项比对参数(缺口罚分为10,缺口长度罚分为10),对两种核酸序列之间的同源性程度进行测定。成对比对参数为Ktuple=3,缺口罚分=3,窗(windows)=20。
在一个最优选的实施方案中,第二核酸序列获自枯草芽孢杆菌菌株168,例如SEQ ID NO1的70-1125位核苷酸所示的核酸序列。在另一个最优选的实施方案中,核酸序列为包含在质粒pCR2.1-yccC中的序列,其中所述质粒包含在大肠杆菌NRRL B-30558中。本发明所述方法还包括由于遗传密码的简并性而与SEQ ID NO1不同的编码多肽的核酸序列,所述多肽具有SEQ ID NO2的24-375位氨基酸的氨基酸序列。本发明还涉及SEQ IDNO1的具有L-天冬酰胺酶活性的亚序列,其编码SEQ ID NO2第24-375位氨基酸片段。
SEQ ID NO1的第70-125位核苷酸的亚序列是SEQ ID NO1所包含的除了从5′和/或3′末端缺失的一个或多个核苷酸以外的核酸序列。优选亚序列含有至少915个核苷酸,更优选至少960个核苷酸,最优选至少1005个核苷酸。
第二核酸序列还包含含有SEQ ID NO1第70-1125位核苷酸中的至少一个突变的突变核酸序列,其中突变核酸序列编码由SEQ ID NO2的第24-375位氨基酸组成的多肽。
在另一个更优选的实施方案中,如本文中所定义,编码具有L-天冬酰胺酶活性的多肽的第二核酸序列在极低严谨条件,优选低严谨条件,更优选中严谨条件,更优选中高严谨条件,甚至更优选高严谨条件,最优选极高严谨条件下与核酸探针杂交,所述的核酸探针在相同条件下与SEQ IDNO1的第70-1125位核苷酸或其互补链;或其等位基因变体和其亚序列杂交(Sambrook等,1989,见上)。
对第二核酸序列的修饰可能是合成与SEQ ID NO2的第24-375氨基酸所示的具有L-天冬酰胺酶活性多肽基本上相似的多肽所必需的。术语与多肽“ 基本上相似”指所述多肽的非天然存在的形式。这些多肽可能在一些改造的方式(engineered way)上与其天然来源分离的多肽不同,例如,在比活性、热稳定性、最适PH值等方面不同的变体。基于SEQ ID NO1的第70-1125位核苷酸,例如其亚序列来构建所述变体序列,和/或通过引入不造成由该核酸序列所编码的多肽的氨基酸序列改变,而与待用于制备该酶的宿主生物体的密码子的使用相对应的核苷酸取代,或者通过引入产生不同的氨基酸序列的核苷酸取代来构建所述变体序列。对于核苷酸取代的总体描述见,例如Ford等,1991,Protein Expression and Purification 295-107。
显然,对于本领域熟练技术人员来说可以在分子功能的关键区域外进行上述取代,且仍可产生活性多肽。对本发明的分离核酸序列所编码的多肽的活性必不可少,并因此优选不对其进行取代的氨基酸残基,可按照本领域已知的方法,如定点诱变或丙氨酸扫描诱变诱变(见,例如Cunningham和Wells,1989,Science 2441081-1085)进行鉴定。在丙氨酸扫描诱变技术中,在分子中的每一个正电荷残基中引入突变,并对获得的突变分子进行L-天冬酰胺酶活性检测,以鉴定对分子活性而言重要的氨基酸残基。底物-酶相互作用的位点也可以通过例如由核磁共振分析,结晶学或光亲合标记技术确定的三维结构分析来确定(见,例如de Vos等,1992,Science 255306-312;Smith等,1992,Journal of Molecular Biology 224899-904;Wlodaver等,1992,FEBS Letters 30959-64)。
核酸构建体本发明还涉及核酸构建体,其包含编码分泌信号肽并与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接的第一核酸序列,并且所述核酸构建体进一步包含一种或多种可操作地连接于第二核酸序列的控制序列,其中所述控制序列与其相容的条件下,在合适的宿主细胞中指导编码序列的表达。
可以进一步以各种方式操作编码具有L-天冬酰胺酶活性的多肽的分离核酸序列以获得多肽的表达。根据表达载体的不同,对核酸序列在将其插入到载体之前进行操作可以是有利的或必须的。利用重组DNA方法修饰核酸序列的技术在本领域中是众所周知的。
术语“控制序列”在本文中定义为包括对本发明的多肽的表达所必需的或有利的所有元件。每个控制序列对于编码多肽的核酸序列可以是天然的或外源的。所述控制序列包括但不限于前导序列,聚腺苷酸化序列,前肽序列,启动子,核糖体结合位点,信号肽序列和转录终止子。控制序列至少包括启动子,以及转录和翻译终止信号。为了引入特异性限制位点以有利于将控制序列与编码多肽的核酸序列编码区连接,可以为控制序列提供接头。
控制序列可以是适当的启动子序列,即表达L-天冬酰胺酶编码序列的宿主细胞所识别的核酸序列。启动子序列包括介导多肽表达的转录控制序列。启动子可以是在宿主细胞中表现出转录活性的任意核酸序列,包括共有的、突变的、截短的和杂合的启动子,而且可获自与宿主细胞同源或异源的、编码胞外或胞内多肽的基因。
在一个优选的实施方案中,这些启动子序列可荻自细菌源。在一个更优选的实施方案中,这些启动子序列可获自革兰氏阳性菌,如芽孢杆菌属菌株,例如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌(Bacillus.pumilus)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌;或链霉菌属菌株,例如浅青紫链霉菌或鼠灰链霉菌;或得自革兰氏阴性菌,例如大肠杆菌或假单胞菌属。
在本发明的方法中指导第二核酸序列转录的适宜启动子的例子为得自下述基因的启动子大肠杆菌lac操纵子、B.clausii碱性蛋白酶基因(aprH)、地衣芽孢杆菌碱性蛋白酶基因(枯草杆菌蛋白酶Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌拟步甲亚种(Bt.subsp.tenebrionis)CryIIIA基因(cryIIIA)或其部分、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA),以及原核生物的β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of theNational Academy of Sciences USA 753727-3731)。其它启动子包括spol细菌噬菌体启动子和tac启动子(DeBoer等,1983,Proceedings of the NationalAcademy of Sciences USA 8021-25).。更多的启动子参见″Useful proteins fromrecombinant bacteria″Scientific American,1980,24274-94和Sambrook,Fritsch和Maniatus,1989,分子克隆(Molecular Cloning),实验室指南(ALaboratory Manual),第二版,冷泉港(Cold Spring Harbor),纽约。
启动子序列还可以是串联启动子。“串联启动子”在本文中定义为两个或多个启动子序列,其中每一个都可操作地连接于编码序列,并其介导将编码序列转录为mRNA。启动子序列的两个或多个串联启动子可以同时启动核酸序列的转录。此外,串联启动子的一个或多个启动子序列可在宿主细胞,如芽孢杆菌属细胞,生长的不同阶段启动核酸序列的转录。
在一个优选的实施方案中,串联启动子包括至少解淀粉芽孢杆菌α-淀粉酶基因amyQ启动子。在另一个优选的实施方案中,串联启动子至少包含具有“-35”区的TTGACA序列和“-10”区的TATAAT序列的共有序列启动子。在另一个优选的实施方案中,串联启动子包括至少地衣芽孢杆菌α-淀粉酶基因的amyL启动子。在另一个优选的实施方案中,串联启动子包含至少cryIIIA启动子或其部分(Agaisse和Lereclus,1994,见上)。
在一个更优选的实施方案中,串联启动子至少包含amyL启动子和cryIIIA启动子。在另一个更优选的实施方案中,串联启动子至少包含amyQ启动子和cryIIIA启动子。在另一个更优选的实施方案中,串联启动子至少包含具有“-35”区的TTGACA序列和“-10”区的TATAAT序列的共有序列启动子和cryIIIA启动子。在另一个更优选的实施方案中,串联启动子至少包含两个拷贝的amyL启动子。在另一个更优选的实施方案中,串联启动子包含至少两个拷贝的amyQ启动子。在另一个更优选的实施方案中,串联启动子包含至少两个拷贝的具有“-35”区的TTGACA序列和“-10”区的TATAAT序列的共有序列启动子。在另一个更优选的实施方案中,串联启动子包含至少两个拷贝的cryIIIA启动子。
共有序列启动子的构建可通过定点诱变来完成,以产生与枯草芽孢杆菌营养型(vegetative)“sigma A-型”启动子的“-10”和“-35”区的已确认共有序列很好地一致的启动子(Voskuil等,1995,Molecular Microbiology 17271-279)。“-35”区的共有序列是TTGACA,在“-10”区的共有序列是TATAAT。共有序列启动子可来自在芽孢杆菌属宿主细胞中发挥作用的任何启动子。
在一个优选的实施方案中,“共有序列”启动子来自下述基因的启动子大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、B.clausii碱性蛋白酶基因(aprH)、地衣芽孢杆菌碱性蛋白酶基因(枯草杆菌蛋白酶Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌拟步甲亚种CryIIIA基因(cryIIIA)或其部分,或者原核生物的β-内酰胺酶基因spol细菌噬菌体启动子。
在一个更优选的实施方案中,“共有序列”启动子来自解淀粉芽孢杆菌属α-淀粉酶基因(amyQ)。在一个最优选的实施方案中,共有序列启动子是SEQ ID NO5或SEQ ID NO6的第1-185位核苷酸中所含有的“共有序列”amyQ启动子。在另一个最优选的实施方案中,共有序列启动子是SEQ IDNO5的第86-185位核苷酸或SEQ ID NO6中所含有的短“共有序列”amyQ启动子。SEQ ID NO5的“共有序列”amyQ启动子含有包含野生型amyQ启动子(SEQ ID NO6)的核酸序列的如下突变在SEQ ID NO7的-35区(相对转录起始位点)的135位和136位分别发生T到A和T到C的改变,以及在SEQ ID NO7的-10区156位置A转变为T。“共有序列”amyQ启动子(SEQ ID NO6)还含有位于-35区上游约20个碱基处的116位上的由T到A的变换,如图3所示。很明显,由于远离关键的-10和-35区,这种改变并不破坏启动子的功能。
“mRNA加工/稳定序列”在本文中定义为位于一个或多个启动子序列的下游并且位于编码编码序列的上游的一段序列,其中一个或多个启动子序列的每一个都与该编码序列可操作地连接,从而使从每一个启动子序列合成的mRNA均可被加工,产生具有位于转录产物5’端的稳定序列的mRNA转录产物。mRNA转录产物的5’端所存在的这种稳定子序列可延长转录产物的半衰期(Agaisse和Lereclus,1994,见上,Hue等,1995,见上)。mRNA加工/稳定序列与细菌16S核糖体RNA的3’末端互补。在一个优选的实施方案中,mRNA加工/稳定序列产生具有位于转录产物5’端的稳定序列的基本上大小一致的转录产物。
在一个更优选的实施方案中,mRNA加工/稳定序列是WO9425612和Agaisse和Lereclus(1994,见上)所公开的苏云金芽孢杆菌CryIIIAmRNA加工/稳定序列,或其保持mRNA加工/稳定序列功能的部分。在另一更优选实施方案中,mRNA加工/稳定序列是Hue等(1995,见上)所公开的枯草芽孢杆菌SP82 mRNA加工/稳定序列,或其保持mRNA加工/稳定功能的部分。
当将cryIIIA启动子和其mRNA加工/稳定序列用于本发明的方法时,可采用含有WO 9425612和Agaisse和Lereclus(1994,见上)所公开的序列的DNA片段(如核苷酸-635至-22(SEQ ID NO8)所示),或其保持启动子和mRNA加工/稳定序列功能的部分。cryIIIA启动子如核苷酸-635至-552所示,而cryIIIA mRNA加工/稳定序列包含于核苷酸-551至-22之间。在一个优选的实施方案中,cryIIIA mRNA加工/稳定序列包含在含有核苷酸-568至-22的片段中。在另一个优选的实施方案中,cryIIIA mRNA加工/稳定序列包含在含有核苷酸-367至-21的片段中。而且,可用本领域熟知的方法制备仅含有cryIIIA启动子或仅含有cryIIIA mRNA加工/稳定序列的DNA片段,以构建串联启动子和mRNA加工/稳定序列的各种组合。在该实施方案中,cryIIIA启动子及其mRNA加工/稳定序列优选位于构成串联启动子的其它启动子(s)的下游,和编码具有L-天冬酰胺酶活性的多肽的基因的编码序列的上游。含有串联启动子和cryIIIA mRNA加工/稳定序列的各种构建体参见美国专利6,255,076。
在一个优选的实施方案中,核酸构建体含有(i)一个串联启动子,其中所述串联启动子的各启动子序列可操作地连接于单拷贝的编码具有L-天冬酰胺酶活性的多肽的核酸序列,以及可选地还含有(ii)mRNA加工/稳定序列,该mRNA加工/稳定序列位于该串联启动子下游并且位于编码多肽的第二核酸序列的上游。
在另一个优选的实施方案中,核酸构建体包含(i)“共有序列”启动子,其与单拷贝的编码具有L-天冬酰胺酶活性多肽的核酸序列可操作地连接,以及(ii)位于该“共有序列”启动子的下游并且位于编码多肽的第二核酸序列的上游的一个mRNA加工/稳定序列。在一个更优选的实施方案中,“共有序列”启动子是可操作地连接单拷贝的编码多肽的核酸序列的“共有序列”amyQ启动子。“共有序列”启动子具有“-35”区的TTGACA序列和“-10”区的TATAAT序列。
控制序列也可以是适宜的核糖体结合位点,即宿主细胞所识别的mRNA序列,其中核糖体与其结合以起始翻译。核糖体结合位点序列通常位于启动子和编码序列之间。任何在所选宿主细胞中发挥作用的核糖体结合位点序列都可用于本发明。例如,核糖体结合位点序列可获自以下基因B.clausii碱性蛋白酶基因(aprH)、地衣芽孢杆菌碱性蛋白酶基因(枯草杆菌蛋白酶Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌拟步甲亚种CryIIIA基因(cryIIIA)或其部分、天蓝色链霉菌琼脂糖酶基因(dagA),以及原核生物的β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academyof Sciences USA 753727-3731)。在一个优选的实施方案中,核酸构建体包含B.clausii碱性蛋白酶基因(aprH)的核糖体结合位点序列。
控制序列还可以是适宜的转录终止序列,即宿主细胞识别以终止转录的序列。终止子序列与编码具有L-天冬酰胺酶活性多肽的核酸序列的3’端可操作地连接。任何在所选宿主细胞中发挥作用的终止子均可用于本发明。
控制序列还可以是适宜的前导序列,即对于宿主细胞翻译重要的mRNA非翻译区。前导序列与编码所述多肽的核酸序列的5’端可操作地连接。任何在所选宿主细胞中发挥作用的前导序列均可用于本发明。
控制序列还可以是前肽编码区,其编码位于多肽氨基端的一段氨基酸序列。所得多肽被称为酶原(proenzyme)或多肽原(propolypeptide)(或这在某些情况下为酶原(zymogen))。多肽原通常无活性,而且通过催化性或自身催化性裂解将前肽(propeptide)从该多肽原中裂解下来,可以将多肽原转化为成熟的有活性多肽。前肽编码区可获自枯草芽孢杆菌碱性蛋白酶基因(aprE)和枯草芽孢杆菌中性蛋白酶基因(nprT)。
当信号肽和前肽区都存在于多肽的氨基端时,前肽区邻接于多肽的氨基端,且信号肽区邻接于前肽区的氨基端。
可取地添加调控序列,所述调控序列允许调节与宿主细胞生长相关的多肽的表达。调控系统的例子是对化学或物理刺激,包括调节性化合物的存在起反应,而使基因表达开启或关闭的那些系统。在原核生物系统中的调节系统包括lac、tac和trp操纵子系统。
宿主细胞可含有一个或多个拷贝的核酸构建体。在一个优选的实施方案中,宿主细胞含有单拷贝的核酸构建体。
表达载体本发明还涉及重组表达载体,其包含编码分泌信号肽的第一核酸序列、启动子、以及转录和翻译终止信号,其中所述第一核酸序列与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接。上述各种核酸和控制序列可连接在一起产生重组表达载体,其可包含一个或多个方便的限制性位点以允许编码多肽的核酸序列在这些位点进行插入或替代。可选地,编码具有L-天冬酰胺酶活性的多肽的核酸序列可通过将该核酸序列或含有该序列的核酸构建体插入适当的表达载体来表达和分泌。构建表达载体时,编码序列位于该载体中,使该编码序列可操作地连接于表达和分泌的适当控制序列。
重组载体可以是能方便地用于重组DNA法并能使核酸序列表达的任何载体(例如质粒或病毒)。典型地,载体的选择依赖于载体与载体将被导入的宿主细胞之间的相容性。载体可以是线性或闭合环状的质粒。
载体可以是自主复制载体,即该载体以染色体外实体形式存在,其复制独立于染色体的复制,如质粒、染色体外元件、微型染色体或人工染色体。载体可含有任何保证自我复制的工具。此外,载体可以是当导入宿主细胞时整合至基因组并与其整合所进入的染色体一起复制的载体。另外,可以使用单个载体或质粒,或总体包含将被插入宿主细胞基因组的总DNA的两个或多个载体或质粒,或转座子。
本发明所述载体优选含有使得易于对转化细胞进行筛选的一个或多个可筛选标记。可筛选标记是其产物提供了杀生物剂或病毒抗性、重金属抗性、对营养缺陷体(auxotroph)的原养型(prototrophy)等的基因。细菌的可筛选标记的例子包括枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或可赋予抗生素抗性如氨苄青霉素、卡那霉素、氯霉素、四环素抗性的标记。
本发明所述载体优选包含使所述载体可以整合到宿主细胞基因组中,或者使载体可以不依赖于细胞的基因组而在细胞中自主复制的元件。
为整合入宿主细胞的基因组,载体可依赖于编码具有L-天冬酰胺酶活性的多肽的核酸序列或载体的其它元件,通过同源或非同源重组将载体整合至基因组中。此外,载体可含有指导通过同源重组整合至宿主细胞基因组中的其它核苷酸。这些其它的核酸序列使得载体被整合到染色体中的宿主细胞基因组的精确位置上。这些其它核酸序列能使载体在染色体的精确位置整合至宿主细胞中。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100-10,000bp,优选400-10,000bp,最优选800-10,000bp,它们与相应靶序列高度同源以增加同源重组的几率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。而且,整合元件可以是非编码型或编码型核酸序列。另一方面,可以通过非同源重组将载体整合至宿主细胞的基因组。
对于自主复制,载体可进一步含有能使载体在目标宿主细胞中自主复制的复制起点。复制的细菌起点的例子为可在大肠杆菌中复制的下列质粒的复制起点pBR322,pUC19,pACYC177和pACYC184,和可在芽孢杆菌中复制的下列质粒的复制起点pUB110,pE194,pTA1060和pAMB1。复制起点可含有使其在宿主细胞中的功能对温度敏感化的突变(参见,例如Ehrlich,1978,Proceedings of the National Academy of Sciences USA 751433)。
可将多于一个拷贝的编码具有L-天冬酰胺酶活性的多肽的核酸序列插入宿主细胞中从而增加基因产物的产量。获得核酸序列拷贝数的增加可通过将至少一个额外拷贝的序列整合入宿主细胞基因组中实现,或在所述宿主细胞含有扩增拷贝的选择性标记基因的情况下,通过在核酸序列中包含一个可扩增的选择性标记基因,从而可以在合适的选择剂存在的条件下,通过培养宿主细胞选择核酸序列的额外拷贝而实现。
用于连接上述元件以构建重组本发明的表达载体的方法是本领域熟练技术人员所熟知的(参见,例如Sambrook等,1989,见上)。
宿主细胞本发明还涉及一种重组宿主细胞,其包含与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接,并编码分泌信号肽的第一核酸序列,该重组宿主细胞能有利地用于重组制备具有L-天冬酰胺酶活性的分泌的多肽。将含有所述核酸序列的载体导入宿主细胞中,使载体作为如前所述的染色体整合体或自主复制的染色体外载体而保持。术语“宿主细胞”包括由于复制过程中发生突变而与母细胞不完全相同的母细胞的任何后代。宿主细胞的选择很大程度上依赖于编码所述多肽的基因及其来源。
宿主细胞可以是能表达和分泌具有L-天冬酰胺酶活性的多肽的任何细菌细胞。
有用的细菌宿主细胞是革兰氏阳性菌,包括但不限于,芽孢杆菌属菌株,如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌;或链霉菌属的细胞,如浅青紫链霉菌或鼠灰链霉菌;或革兰氏阴性菌,如大肠杆菌或假单胞菌。在一个优选的实施方案中,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选的实施方案中,芽孢杆菌细胞是嗜碱芽孢杆菌。在一个更优选的实施方案中,细菌宿主细胞是枯草芽孢杆菌菌株。
载体可通过如下方法被导入细菌宿主细胞原生质体转化(protoplasttransformation)(见例如Chang和Cohen,1979,Molecular General Genetics 168111-115),使用感受态细胞(见例如Young和Spizizin,1961,Journal ofBacteriology 81823-829,或Dubnau和Davidoff-Abelson,1971,Journal ofMolecular Biology 56209-221),电穿孔法(见例如Shigekawa和Dower,1988,Biotechniques 6742-751),或接合作用(见例如,Koehler和Thorne,1987,Journal of Bacteriology 1695771-5278)。
用途本发明还涉及利用本发明所述的具有L-天冬酰胺酶活性的分泌的多肽的方法。
本发明所述的具有L-天冬酰胺酶活性的分泌的多肽可以用于由天冬酰胺产生天冬氨酸。
本发明所述的分泌的多肽还可以用于治疗白血病,如急性淋巴细胞性白血病(见Asselin in Drug Resistance in Leukemia and Lymphoma III,第621-629页,Kaspers等编辑,Kluwer Academic/Plenum Publishers,New York,1999)。
组合物在另一方面,本发明涉及一种包含具有L-天冬酰胺酶活性的重组分泌的多肽的多肽组合物。优选,所述组合物富含具有L-天冬酰胺酶活性的分泌的多肽。在本文中,术语“富含”指多肽组合物的L-天冬酰胺酶活性增加,如富集因子为1.1。
多肽组合物可以包含作为主要或唯一的酶组分的具有L-天冬酰胺酶活性的分泌的多肽,如单组分多肽组合物。另外,组合物可以包含多种酶活性物,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,α-葡糖苷酶、β-葡糖苷酶、卤过氧化物酶、转化酶、漆酶、脂酶、甘露糖苷酶、氧化酶、溶果胶酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。其它酶可通过下述微生物产生曲霉菌(Aspergillus)属,优选棘孢曲霉(Aspergillus Aculeatus)、泡盛曲霉(Aspergillus awamori)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillusoryzae);或木霉属(Trichoderma);腐质霉属(Humicola),优选Humicolainsolens;或镰孢属(Fusarium),优选杆孢状镰孢(Fusarium graminearum)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum。
在一个优选的实施方案中,组合物包含具有具有L-天冬酰胺酶活性的单一组分的分泌的多肽和可接受的载体。可使用本领域熟知的任何适宜载体。
信号肽本发明还涉及核酸构建体,其包含与由SEQ ID NO1的1-69核苷酸组成的核酸序列可操作地连接的编码蛋白的基因,所述核酸序列编码由SEQID NO2的1-23氨基酸组成的信号肽,其中所述基因对核酸序列是外源的。
本发明还涉及重组表达载体和含有上述这种核酸构建体的重组宿主细胞。
本发明还涉及产生蛋白的方法,其包括(a)在适于产生蛋白的条件下培养所述重组宿主细胞;和(b)回收所述蛋白。
第一和第二核酸序列能以和其它控制序列一起或与其它控制序列组合的形式,分别与外源基因可操作地连接。所述其它控制序列如上所述。如前所述,当信号肽和前肽区都存在于蛋白氨基端时,前肽区邻接于多肽的氨基端且信号肽区邻接于前肽区的氨基端。
蛋白对于宿主细胞可以是天然或异源的。术语“蛋白”在本文中并非指特定长度的编码产物,因此包括肽、寡肽和蛋白。术语“蛋白”还包含组合形成编码产物的两种或多种多肽。所述蛋白还包括杂合多肽,其包含来自至少两个不同的蛋白的部分或全部多肽序列的组合,其中的一种或多种蛋白对宿主细胞可以是异源或天然的。蛋白还包括上面提到的蛋白和杂合蛋白的天然存在的等位基因变体和改造后的变体。
优选地,蛋白是激素或其变体、酶、受体或其部分、抗体或其部分、或报道蛋白(reporter)。在一个更优选的实施方案中,蛋白是氧化还原酶、移转酶、水解酶、裂解酶、异构酶或连接酶。在一个更优选的实施方案中,蛋白是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂酶、甘露糖苷酶、齿斑葡聚糖酶(mutanase)。氧化酶、溶果胶酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
基因可获自任何原核、真核或其它来源。
本发明通过如下实施例进一步描述,这些实施例不应理解为是对本发明范围的限制。
实施例用作缓冲液和底物的化学制品为至少试剂级的商品化产品。
菌株大肠杆菌TOP10,大肠杆菌XL1-Blue,大肠杆菌SURE,枯草芽孢杆菌A164(ATCC 6051A),枯草芽孢杆菌168(Bacillus Stock Center,Columbus,OH)和枯草芽孢杆菌PL1801 spoIIE∷Tn917(amyE,apr,npr)。
引物和寡核苷酸所有引物和寡聚物均在Applied Biosystems Model 394型合成仪(AppliedBiosystemsInc.,Foster City,CA)上按照厂家说明书进行合成。
实施例1.来自枯草芽孢杆菌168的L-天冬酰胺酶基因的分离和鉴定采用QIAGEN细菌基因组DNA分离法(QIAGEN,Valencia,CA),按照厂家说明从枯草芽孢杆菌168中分离基因组DNA。
采用下列寡核苷酸引物1和2通过PCR从枯草芽孢杆菌168基因组DNA扩增L-天冬酰胺酶编码区。引物1在L-天冬酰胺酶编码区的上游并入了SacI位点和芽孢杆菌丝氨酸蛋白酶的核糖体结合位点(SAVINASETM,Novo Nordisk A/S,Bagsvrd,Denmark,下文称为SAVINASETM基因),引物2在L-天冬酰胺酶编码区的下游并入了NotI位点。
引物15′-CGAGCTCTATAAAAATGAGGAGGGAACCGAATGAAAAAACAACGAATGCTCGT-3′(SEQ ID NO3)引物25′-GCGGCCGCAGAGGTCATTATTGGTCCTA-3′(SEQ ID NO4)该扩增反应物(50μl)含有如下成分约200ng枯草芽孢杆菌168的基因组DNA,两种引物各0.5μM,dATP、dCTP、dGTP和dTTP各200μM,1XPCR缓冲液,3mM MgCl2,0.625U的AmpliTaq Gold DNA聚合酶(PE AppliedBiosystems,Foster City,CA)。在RoboCycler 40 Temperature Cycler(StratageneCloning Systems,La Jolla,CA)中循环地进行反应,即95℃以9分钟进行一次循环;95℃以1分钟,55℃以1分钟,72℃以2分钟,各进行30个循环;最后一个循环在72℃进行3分钟。
按照厂家说明书,采用TOPO TA克隆试剂盒(Cloning Kit)(Invitrogen,Carlsbad,CA)克隆PCR产物。按照厂家说明书,利用QIAprep 8质粒试剂盒(Plasmid Kit)(QIAGEN,Valencia,CA)从大肠杆菌TOP10转化物中分离质粒DNA。利用酶EcoRI和NotI,通过限制性分析鉴定含有所需插入物的质粒,并将其命名为pCR2.1-yccC。分离包含pCR2.1-yccC质粒的大肠杆菌TOP10菌落,并按照厂家说明书,采用QIAGEN质粒试剂盒制备质粒DNA用于测序。用该质粒转化大肠杆菌SURE细胞(Stratagene Cloning Systems,LaJolla,CA),其中一个转化物命名为大肠杆菌MDT50(pCR2.1-yccC),并按照布达佩斯条约于2002年2月8日保存于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection)、北部区域研究中心(Northern Regional Research Center),大学街1815号(University Street 1815),Peoria,Illinois,61604,保藏号为NRRL B-30558。
利用染料-终止物化学(dye-terminator chemistry)和基于已公开的yccC基因序列的合成寡核苷酸(Kumano等,1997,Microbiology 1432775-2782),采用Applied Biosystems 377XL型自动DNA测序仪进行DNA测序。DNA测序分析证实pCR2.1-yccC中的L-天冬酰胺酶基因的序列与已公开的序列(Kumano等,1997,Microbiology 1432775-2782)完全一致。
L-天冬酰胺酶克隆具有长度为1125bp的开放阅读框,所述开放阅读框架编码375个氨基酸的多肽。核酸序列(SEQ ID NO1)和推导的氨基酸序列(SEQ ID NO2)如图1中所示。采用信号肽P法(SignalP program)(Nielsen等,1997,Protein Engineering 101-6),预测一个23个残基的信号肽相当于第1-69位核苷酸。
通过Clustal方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI),以同一性表和多项比对参数(缺口罚分为10,缺口长度罚分为10)对L-天冬酰胺酶氨基酸序列的相对比对进行测定。成对比对参数为Ktuple=1,缺口罚分=3,窗(windows)=5,对角(diagonals)=5。
相对比对表明,枯草芽孢杆菌L-天冬酰胺酶与获自菊欧文氏杆菌(Erwinia chrysanthemi)(EMBL X14777)的L-天冬酰胺酶具有55.2%的同一性,与获自大肠杆菌(EMBL M34234)的L-天冬酰胺酶II具有48.6%的同一性。
实施例2构建pMDT050用SacI和NotI消化pCAsub3Δ-Pr“短”共有序列amyQ/PrcryIIIA/cryIIIAstab/SAV(WO01/14534,实施例12),以除去大部分芽孢杆菌丝氨酸蛋白酶基因的编码区,用QIAquick凝胶纯化(Gel Purification)试剂盒凝胶纯化约5030bp的载体片段。用SacI和NotI消化pCR2.1-yccC,并采用QIAquick凝胶纯化试剂盒用凝胶纯化约1220bp的含有L-天冬酰胺酶基因的片段。用快速DNA连接试剂盒(Rapid DNA Ligation Kit)连接该凝胶纯化的片段。将该连接混合物转化大肠杆菌SURE细胞(Stratagene Cloning Systems,La Jolla,CA),并在添加了100μg/ml氨苄青霉素的2X YT平板上筛选具有氨苄青霉素抗性的转化体。按照厂家说明书,采用QIAprep 8质粒试剂盒(QIAGEN,Valencia,CA)从大肠杆菌TOP10转化体中分离质粒DNA。用酶HindIII通过限制性分析鉴定含有所需插入物的质粒,并命名为pMDT050(图2)。
实施例3构建pMDT050整合体用pMDT050转化枯草芽孢杆菌PL1801 spoIIE∷Tn917,并在添加了5μg/ml氯霉素的胰蛋白 血琼脂基础(Tryptose Blood Agar Base)(TBAB)平板上筛选氯霉素抗性转化体(其中推测pMDT050整合在L-天冬酰胺酶基因座)。选择一个这样的整合体,通过在添加了浓度渐增的氯霉素(最高为30μg/ml的氯霉素)的TBAB平板上,对该整合体进行划线(streaking),诱导整合DNA的串联双拷贝。将该菌株命名为枯草芽孢杆菌MDT51。
用pCAsub3(WO01/14534,实施例12)转化枯草芽孢杆菌PL1801spoIIE∷Tn917,并在添加了5μg/ml氯霉素的TBAB平板上筛选氯霉素抗性转化体。选择其中一个这样的整合体,命名为枯草芽孢杆菌MDT52,作为酶分析的对照。
实施例4分泌的L-天冬酰胺酶的制备在含有50ml乳酸杆菌(Lactobacilli)MRS液体培养基(Lactobacilli MRSBroth)(Difco Laboratories,Detroit,MI)的250ml摇瓶中,于37℃,250rpm的条件下,使枯草芽孢杆菌菌株MDT51和MDT52生长24小时。以7000rpm离心5分钟,回收上清。将上清样品加在Novex 10-20% Tricine SDS-PAGE凝胶(Novex,San Diego,CA)上进行电泳,并用考马斯亮蓝将蛋白条带显色。在MDT51样品中,观察到其体积与成熟L-天冬酰胺酶的预期大小(37kDa;氨基酸24-375)相对应的明显条带,而MDT52样品中则没有所述条带。
实施例5重组L-天冬酰胺酶的表征对MDT50和MDT51的摇瓶培养物的上清样品进行L-天冬酰胺酶活性分析。L-天冬酰胺酶购自Hewlett-Packard,(Palo Alto,CA)。AmmoniaEnzymatic Bioanalysis试剂盒购自R-Biopharm(Marshall,MI)(Cat.#1112732)。BioSpin6凝胶过滤柱购自BioRad。
在通过BioSpin 6柱脱盐后,将80μl的MDT51培养物上清液与200μl的0.1M天冬酰胺(在Britton-Roberson缓冲液中,pH8)、20μl水和300μlBritton-Roberson缓冲液,pH8混合。将脱盐的MDT52培养物上清液或缓冲液设为阴性对照。用36μl 0.1M醋酸铵替代培养物上清液作为阳性对照。在20℃孵育4小时后,取等分样品进行NH3检测。温育2天后,冻存溶液,并送到入加州大学戴维斯分校(University of California at Davis)的分子结构设备(Molecular Structure Facility)进行天冬氨酸检测。
采用氨酶生物分析试剂盒(Ammonia Enzymatic Bioanalysis Kit)(R-Biopharm)进行氨分析。如果需要,先将样品用去离子水稀释。在石英槽中,将75μl样品或样品稀释物与625μl H2O以及300μl取自试剂盒的反应混合物#2(含有pH8的三乙醇胺缓冲液、2-酮戊二酸、NADH和稳定剂)混合。通过颠倒将槽内物质混合,于20℃放置5分钟,在340nm测定吸光度。然后,加入6μl取自试剂盒的混合物#3(含有谷氨酸脱氢酶)并混合。样品放置20分钟,测量340nm的吸光度。利用试剂盒中提供的说明进行NH3的计算(单位mg/ml)。
表1显示了MDT51和MDT52的反应之间的NH3含量差异,这是由L-天冬酰胺酶对天冬酰胺的脱酰胺作用所致。观察到40μM/h的表观速率。
表1.检测通过L-天冬酰胺酶的作用从天冬酰胺产生的NH3

1预计从开始的NH4Ac生成100μg/ml。
在加州大学戴维斯分校的分子结构设备上进行氨基酸分析。每次注射,MDT51的分析反应产生0.60nmol天冬氨酸和6.92nmol天冬酰胺,相当于从最初含有33mM天冬酰胺的样品反应产生2.4mM天冬氨酸和27.7mM天冬酰胺。以根据氨检测(ammonia detection)估记的反应时间(约48小时)和速率(约40μM/h)为基础,样品应含有约2mM天冬氨酸(通过酶的作用由33mM天冬酰胺产生),与观测值相符。
生物材料的保藏下列生物材料已经按照布达佩斯条约保藏于农业研究机构专利培养物保藏中心、北部区域研究中心,大学街1815号(University Street),Peoria,Illinois,61604,保藏编号如下保藏 保藏编号 保藏日期E.coli MDT50(pCR2.1-yccC) NRRL B-30558 2002年2月8日该菌株已经进行保藏,并根据37 C.F.R.§1.14和35 U.S.C.§122的规定,在本发明申请的过程中保证专利和商标专员指定的人员能够获得该培养物。所述保藏是所述保藏菌株的基本纯的培养物。在提交本发明副本(counterparts)或其后续申请(progeny)的国家中如果外国专利法规要求,可以提供所述保藏物。但是应该理解的是可获得保藏物并不构成在侵害根据国家法规授予的专利权的情况下获得实施本发明的许可。
在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内,因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上,除了那些在此所示并描述的修改外,本领域的技术人员很容易根据前面的描述对发明作各种修改。这些修改也在所附权利要求的范围内。一旦出现歧义,以包括定义在内的本申请的所有内容对其进行解释。
本文中引用了各种参考文献,其公开内容全部引入作参考。
关于微生物保藏的说明(细则13之二)



PCT/RO/134表(1992年7月)
序列表<110>诺维信生物技术公司(Novozymes Biotech,Inc.)托马斯,迈克尔D(Thomas,Michael D.)思洛马,艾伦(Sloma,Alan)<120>制备具有L-天冬酰胺酶活性的分泌性多肽的方法<130>10289.204-WO<150>US 60/369,192<151>2002-04-01<160>8<170>PatentIn version 3.2<210>1<211>1128<212>DNA<213>枯草芽孢杆菌(Bacillus subtilis)<400>1atgaaaaaac aacgaatgct cgtacttttt accgcactat tgtttgtttt taccggatgt60tcacattctc ctgaaacaaa agaatccccg aaagaaaaag ctcagacaca aaaagtctct 120tcggcttctg cctctgaaaa aaaggatctg ccaaacatta gaattttagc gacaggaggc 180acgatagctg gtgccgatca atcgaaaacc tcaacaactg aatataaagc aggtgttgtc 240ggcgttgaat cactgatcga ggcagttcca gaaatgaagg acattgcaaa cgtcagcggc 300gagcagattg ttaacgtcgg cagcacaaat attgataata aaatattgct gaagctggcg 360aaacgcatca accacttgct cgcttcagat gatgtagacg gaatcgtcgt gactcatgga 420acagatacat tggaggaaac cgcttatttt ttgaatctta ccgtgaaaag tgataaaccg 480gttgttattg tcggttcgat gagaccttcc acagccatca gcgctgatgg gccttctaac 540ctgtacaatg cagtgaaagt ggcaggtgcc cctgaggcaa aagggaaagg gacgcttgtt 600gttcttaacg accggattgc ctcagcccga tatgtcacca aaacaaacac aactacaaca 660gatacattta aatcagaaga aatgggcttc gtcggaacaa ttgcagatga tatctatttt 720aataatgaga ttacccgtaa gcatacgaag gacacggatt tctcggtttc taatcttgat 780gagctgccgc aggttgacat tatctatgga taccaaaatg acggaagcta cctgtttgac 840gctgctgtaa aagccggagc aaaggggatt gtatttgccg gttctgggaa cgggtcttta 900tctgatgcag ccgaaaaagg ggcggacagc gcagtcaaaa aaggcgttac agtggtgcgc 960tctacccgca cgggaaatgg tgtcgtcaca ccaaaccaag actatgcgga aaaggacttg 1020ctggcatcga actctttaaa cccccaaaaa gcacggatgt tgctgatgct tgcgcttacc 1080aaaacaaatg atcctcaaaa aatccaagct tatttcaatg agtattga 1128<210>2
<211>375<212>PRT<213>枯草芽孢杆菌(Bacillus subtilis)<400>2Met Lys Lys Gln Arg Met Leu Val Leu Phe Thr Ala Leu Leu Phe Val1 5 10 15Phe Thr Gly Cys Ser His Ser Pro Glu Thr Lys Glu Ser Pro Lys Glu20 25 30Lys Ala Gln Thr Gln Lys Val Ser Ser Ala Ser Ala Ser Glu Lys Lys35 40 45Asp Leu Pro Asn Ile Arg Ile Leu Ala Thr Gly Gly Thr Ile Ala Gly50 55 60Ala Asp Gln Ser Lys Thr Ser Thr Thr Glu Tyr Lys Ala Gly Val Val65 70 75 80Gly Val Glu Ser Leu Ile Glu Ala Val Pro Glu Met Lys Asp Ile Ala85 90 95Asn Val Ser Gly Glu Gln Ile Val Asn Val Gly Ser Thr Asn Ile Asp100 105 110Asn Lys Ile Leu Leu Lys Leu Ala Lys Arg Ile Asn His Leu Leu Ala115 120 125Ser Asp Asp Val Asp Gly Ile Val Val Thr His Gly Thr Asp Thr Leu130 135 140Glu Glu Thr Ala Tyr Phe Leu Asn Leu Thr Val Lys Ser Asp Lys Pro145 150 155 160Val Val Ile Val Gly Ser Met Arg Pro Ser Thr Ala Ile Ser Ala Asp165 170 175Gly Pro Ser Asn Leu Tyr Asn Ala Val Lys Val Ala Gly Ala Pro Glu180 185 190Ala Lys Gly Lys Gly Thr Leu Val Val Leu Asn Asp Arg Ile Ala Ser195 200 205Ala Arg Tyr Val Thr Lys Thr Asn Thr Thr Thr Thr Asp Thr Phe Lys210 215 220Ser Glu Glu Met Gly Phe Val Gly Thr Ile Ala Asp Asp Ile Tyr Phe
225 230 235 240Asn Asn Glu Ile Thr Arg Lys His Thr Lys Asp Thr Asp Phe Ser Val245 250 255Ser Asn Leu Asp Glu Leu Pro Gln Val Asp Ile Ile Tyr Gly Tyr Gln260 265 270Asn Asp Gly Ser Tyr Leu Phe Asp Ala Ala Val Lys Ala Gly Ala Lys275 280 285Gly Ile Val Phe Ala Gly Ser Gly Asn Gly Ser Leu Ser Asp Ala Ala290 295 300Glu Lys Gly Ala Asp Ser Ala Val Lys Lys Gly Val Thr Val Val Arg305 310 315 320Ser Thr Arg Thr Gly Asn Gly Val Val Thr Pro Asn Gln Asp Tyr Ala325 330 335Glu Lys Asp Leu Leu Ala Ser Asn Ser Leu Asn Pro Gln Lys Ala Arg340 345 350Met Leu Leu Met Leu Ala Leu Thr Lys Thr Asn Asp Pro Gln Lys Ile355 360 365Gln Ala Tyr Phe Asn Glu Tyr370 375<210>3<211>53<212>DNA<213>枯草芽孢杆菌(Bacillus subtilis)<400>3cgagctctat aaaaatgagg agggaaccga atgaaaaaac aacgaatgct cgt53<210>4<211>28<212>DNA<213>枯草芽孢杆菌(Bacillus subtilis)<400>4gcggccgcag aggtcattat tggtccta28<210>5<211>185<212>DNA<213>芽孢杆菌属(Bacillus)<400>5
ggccttaagg gcctgcaatc gattgtttga gaaaagaaga agaccataaa aataccttgt 60ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaaaagga120ataaaggggg gttgacatta ttttactgat atgtataata taatttgtat aagaaaatgg180agctc185<210>6<211>185<212>DNA<213>芽孢杆菌属(Bacillus)<400>6ggccttaagg gcctgcaatc gattgtttga gaaaagaaga agaccataaa aataccttgt 60ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaatagga120ataaaggggg gttgacatta ttttactgat atgtataata taatttgtat aagaaaatgg180agctc185<210>7<211>185<212>DNA<213>芽孢杆菌属(Bacillus)<400>7ggccttaagg gcctgcaatc gattgtttga gaaaagaaga agaccataaa aataccttgt 60ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaatagga120ataaaggggg gttgttatta ttttactgat atgtaaaata taatttgtat aagaaaatgg180agctc185<210>8<211>3050<212>DNA<213>芽孢杆菌属(Bacillus)<400>8tcgaaacgta agatgaaacc ttagataaaa gtgctttttt tgttgcaatt gaagaattat 60taatgttaag cttaattaaa gataatatct ttgaattgta acgcccctca aaagtaagaa120ctacaaaaaa agaatacgtt atatagaaat atgtttgaac cttcttcaga ttacaaatat180attcggacgg actctacctc aaatgcttat ctaactatag aatgacatac aagcacaacc240ttgaaaattt gaaaatataa ctaccaatga acttgttcat gtgaattatc gctgtattta300attttctcaa ttcaatatat aatatgccaa tacattgtta caagtagaaa ttaagacacc360cttgatagcc ttactatacc taacatgatg tagtattaaa tgaatatgta aatatattta420tgataagaag cgacttattt ataatcatta catatttttc tattggaatg attaagattc480caatagaata gtgtataaat tatttatctt gaaaggaggg atgcctaaaa acgaagaaca540
ttaaaaacat atatttgcac cgtctaatgg atttatgaaa aatcatttta tcagtttgaa 600aattatgtat tatgataaga aagggaggaa gaaaaatgaa tccgaacaat cgaagtgaac 660atgatacaat aaaaactact gaaaataatg aggtgccaac taaccatgtt caatatcctt 720tagcggaaac tccaaatcca acactagaag atttaaatta taaagagttt ttaagaatga 780ctgcagataa taatacggaa gcactagata gctctacaac aaaagatgtc attcaaaaag 840gcatttccgt agtaggtgat ctcctaggcg tagtaggttt cccgtttggt ggagcgcttg 900tttcgtttta tacaaacttt ttaaatacta tttggccaag tgaagacccg tggaaggctt 960ttatggaaca agtagaagca ttgatggatc agaaaatagc tgattatgca aaaaataaag1020ctcttgcaga gttacagggc cttcaaaata atgtcgaaga ttatgtgagt gcattgagtt1080catggcaaaa aaatcctgtg agttcacgaa atccacatag ccaggggcgg ataagagagc1140tgttttctca agcagaaagt cattttcgta attcaatgcc ttcgtttgca atttctggat1200acgaggttct atttctaaca acatatgcac aagctgccaa cacacattta tttttactaa1260aagacgctca aatttatgga gaagaatggg gatacgaaaa agaagatatt gctgaatttt1320ataaaagaca actaaaactt acgcaagaat atactgacca ttgtgtcaaa tggtataatg1380ttggattaga taaattaaga ggttcatctt atgaatcttg ggtaaacttt aaccgttatc1440gcagagagat gacattaaca gtattagatt taattgcact atttccattg tatgatgttc1500ggctataccc aaaagaagtt aaaaccgaat taacaagaga cgttttaaca gatccaattg1560tcggagtcaa caaccttagg ggctatggaa caaccttctc taatatagaa aattatattc1620gaaaaccaca tctatttgac tatctgcata gaattcaatt tcacacgcgg ttccaaccag1680gatattatgg aaatgactct ttcaattatt ggtccggtaa ttatgtttca actagaccaa1740gcataggatc aaatgatata atcacatctc cattctatgg aaataaatcc agtgaacctg1800tacaaaattt agaatttaat ggagaaaaag tctatagagc cgtagcaaat acaaatcttg1860cggtctggcc gtccgctgta tattcaggtg ttacaaaagt ggaatttagc caatataatg1920atcaaacaga tgaagcaagt acacaaacgt acgactcaaa aagaaatgtt ggcgcggtca1980gctgggattc tatcgatcaa ttgcctccag aaacaacaga tgaacctcta gaaaagggat2040atagccatca actcaattat gtaatgtgct ttttaatgca gggtagtaga ggaacaatcc2100cagtgttaac ttggacacat aaaagtgtag acttttttaa catgattgat tcgaaaaaaa2160ttacacaact tccgttagta aaggcatata agttacaatc tggtgcttcc gttgtcgcag2220gtcctaggtt tacaggagga gatatcattc aatgcacaga aaatggaagt gcggcaacta2280tttacgttac accggatgtg tcgtactctc aaaaatatcg agctagaatt cattatgctt2340ctacatctca gataacattt acactcagtt tagacggggc accatttaat caatactatt2400
tcgataaaac gataaataaa ggagacacat taacgtataa ttcatttaat ttagcaagtt2460tcagcacacc attcgaatta tcagggaata acttacaaat aggcgtcaca ggattaagtg2520ctggagataa agtttatata gacaaaattg aatttattcc agtgaattaa attaactaga2580aagtaaagaa gtagtgacca tctatgatag taagcaaagg ataaaaaaat gagttcataa2640aatgaataac atagtgttct tcaactttcg ctttttgaag gtagatgaag aacactattt2700ttattttcaa aatgaaggaa gttttaaata tgtaatcatt taaagggaac aatgaaagta2760ggaaataagt cattatctat aacaaaataa catttttata tagccagaaa tgaattataa2820tattaatctt ttctaaattg acgtttttct aaacgttcta tagcttcaag acgcttagaa2880tcatcaatat ttgtatacag agctgttgtt tccatcgagt tatgtcccat ttgattcgct2940aatagaacaa gatctttatt ttcgttataa tgattggttg cataagtatg gcgtaattta3000tgagggcttt tcttttcatc aaaagccctc gtgtatttct ctgtaagctt 3050
权利要求
1.一种产生具有L-天冬酰胺酶活性的分泌的多肽的方法,其包括(a)在有利于该多肽产生的条件下培养宿主细胞,其中所述宿主细胞含有核酸构建体,所述核酸构建体含有编码分泌信号肽的第一核酸序列,其中所述第一核酸序列与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接,其中所述信号肽序列指导该多肽进入细胞分泌途径;和(b)回收该分泌的多肽。
2.权利要求1所述的方法,其中第一核酸序列编码一种分泌信号肽,所述分泌信号肽含有编码SEQ ID NO2第1-23位氨基酸的SEQ ID NO1第1-69位核苷酸,或其编码所述信号肽的一部分的亚序列,其中所述信号肽的一部分保留了指导编码多肽进入细胞分泌途径的能力。
3.权利要求1所述的方法,其中第二核酸序列编码选自下组的具有L-天冬酰胺酶活性的多肽(a)具有与SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列的多肽;(b)一种由核酸序列编码的多肽,其中所述核酸序列在中度严谨条件下与SEQ ID NO1的70-1125位核苷酸或其互补链杂交;(c)(a)或(b)的片段,其中所述片段具有L-天冬酰胺酶活性。
4.权利要求3所述的方法,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列。
5.权利要求4所述的方法,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少80%同一性的氨基酸序列。
6.权利要求5所述的方法,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少85%同一性的氨基酸序列。
7.权利要求6所述的方法,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少90%同一性的氨基酸序列。
8.权利要求7所述的方法,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少95%同一性的氨基酸序列。
9.权利要求3-8中任一项所述的方法,其中所述多肽含有SEQ ID NO2的24-375位氨基酸。
10.权利要求3-9中任一项所述的方法,其中所述多肽由SEQ ID NO2的24-375位氨基酸或其具有L-天冬酰胺酶活性的片段组成。
11.权利要求10所述的方法,其中所述多肽由SEQ ID NO2的24-375位氨基酸组成。
12.权利要求3所述的方法,其中所述多肽由一种核酸序列编码,所述核酸序列在中度严谨条件下与SEQ ID NO1第70-1125位核苷酸或其互补链杂交。
13.权利要求3所述的方法,其中所述多肽由一种核酸序列编码,所述核酸序列在中高严谨条件下与SEQ ID NO1第70-1125位核苷酸或其互补链杂交。
14.权利要求3所述的方法,其中所述多肽由一种核酸序列编码,所述核酸序列在高严谨条件下与SEQ ID NO1第70-1125位核苷酸或其互补链杂交。
15.权利要求3所述的方法,其中所述多肽由包含在质粒pCR2.1-yccC中的核酸序列编码,所述质粒包含于大肠杆菌NRRL B-30558中。
16.权利要求1-15中任一项所述的方法,其中核酸构建体进一步含有(i)串联启动子,其中所述串联启动子的每种启动子序列可操作地连接单拷贝的编码多肽的核酸序列,以及可选地(ii)mRNA加工/稳定序列,该mRNA加工/稳定序列位于该串联启动子下游并且位于编码具有L-天冬酰胺酶活性的多肽的第二核酸序列的上游。
17.权利要求1-16中任一项所述的方法,其中核酸构建体进一步含有(i)“共有序列”启动子,其具有“-35”区的TTGACA序列和“-10”区的TATAAT序列,并与单拷贝的编码所述多肽的核酸序列可操作地连接,以及(ii)mRNA加工/稳定序列,其位于该“共有序列”启动子下游并位于编码具有L-天冬酰胺酶活性的多肽的第二核酸序列的上游。
18.权利要求17所述的方法,其中所述共有序列启动子可获自任何细菌启动子。
19.权利要求18所述的方法,其中所述“共有序列”启动子可获自芽孢杆菌属启动子。
20.权利要求18所述的方法,其中所述共有序列启动子可获自大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、Bacillus.clausii碱性蛋白酶基因(aprH)、地衣芽孢杆菌碱性蛋白酶基因(枯草杆菌蛋白酶Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因,或苏云金芽孢杆菌拟步甲亚种CryIIIA基因(cryIIIA)或其部分。
21.权利要求18所述的方法,其中所述“共有序列”启动子可获自解淀粉芽孢杆菌α-淀粉酶基因(amyQ)。
22.权利要求21所述的方法,其中所述“共有序列”amyQ启动子具有SEQ ID NO26或SEQ ID NO27所示核酸序列。
23.权利要求19所述的方法,其中所述mRNA加工/稳定序列是cryIIIA mRNA加工/稳定序列。
24.权利要求1-23中任一项所述的方法,其中核酸构建体进一步含有对于宿主细胞是异源的核糖体结合位点序列。
25.权利要求24所述的方法,其中所述核糖体结合位点序列可获自大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、B.clausii碱性蛋白酶基因(aprH)、地衣芽孢杆菌碱性蛋白酶基因(枯草杆菌蛋白酶Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)或地衣芽孢杆菌青霉素酶基因(penP)。
26.权利要求1-25中任一项所述的方法,其中宿主细胞是芽孢杆菌属细胞。
27.权利要求26所述的方法,其中芽孢杆菌属细胞选自嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、B.Clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌。
28.一种分离的具有L-天冬酰胺酶活性的多肽,其选自(a)具有与SEQ ID NO2的24-375位氨基酸具有至少70%同一性的氨基酸序列的多肽;(b)一种由核酸序列编码的多肽,其中所述核酸序列在中度严谨条件下与SEQ ID NO1的70-1125位核苷酸或其互补链杂交;(c)(a)或(b)的片段,其中所述片段具有L-天冬酰胺酶活性。
29.权利要求28所述的多肽,其具有与SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列。
30.权利要求29所述的多肽,其具有与SEQ ID NO2的24-375位氨基酸至少80%同一性的氨基酸序列。
31.权利要求30所述的多肽,其具有与SEQ ID NO2的24-375位氨基酸至少85%同一性的氨基酸序列。
32.权利要求31所述的多肽,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少90%同一性的氨基酸序列。
33.权利要求32所述的多肽,其中所述多肽具有与SEQ ID NO2的24-375位氨基酸至少95%同一性的氨基酸序列。
34.权利要求28-33中任一项所述的多肽,其中所述多肽含有SEQ IDNO2的24-375位氨基酸。
35.权利要求28-34中任一项所述的多肽,其中所述多肽由SEQ IDNO2的24-375位氨基酸或其具有L-天冬酰胺酶活性的片段组成。
36.权利要求35所述的多肽,其中所述多肽由SEQ ID NO2的24-375位氨基酸组成。
37.权利要求28所述的多肽,其中所述多肽由核酸序列编码,其中所述核酸序列在中度严谨条件下与SEQ ID NO1的70-1125位核苷酸或其互补链杂交。
38.权利要求28所述的多肽,其中所述多肽由核酸序列编码,其中所述核酸序列在中高严谨条件下与SEQ ID NO1的70-1125位核苷酸或其互补链杂交。
39.权利要求28所述的多肽,其中所述多肽由核酸序列编码,其中所述核酸序列在高严谨条件下与SEQ ID NO1的70-1125位核苷酸或其互补链杂交。
40.权利要求28所述的多肽,其中所述多肽由包含在质粒pCR2.1-yccC中的核酸序列编码,所述质粒包含于大肠杆菌NRRL B-30558中。
41.一种分离的核酸序列,其编码权利要求28-40中任一项所述的多肽。
42.一种核酸构建体,其含有权利要求41所述的核酸序列,所述核酸序列与编码分泌信号肽的核酸序列以及一个或多个控制序列可操作地连接,所述控制序列指导所述多肽在适宜的表达细胞中产生。
43.一种重组表达载体,其含有权利要求42所述的核酸构建体。
44.一种重组宿主细胞,其含有权利要求42所述的核酸构建体。
45.一种核酸构建体,其含有一种编码蛋白的基因,所述基因可操作地连接编码信号肽的由SEQ ID NO1的1-69位核苷酸组成的核酸序列,其中所述基因相对所述核酸序列而言是外源的。
46.一种重组表达载体,其含有权利要求45所述的核酸构建体。
47.一种重组宿主细胞,其含有权利要求45所述的核酸构建体。
48.一种产生蛋白的方法,其包括(a)在有利于所述蛋白产生的条件下培养权利要求47所述的重组宿主细胞;和(b)回收该蛋白。
全文摘要
本发明涉及一种产生具有L-天冬酰胺酶活性的分泌的多肽的重组方法,其包括(a)在有利于该多肽产生的条件下培养宿主细胞,其中该宿主细胞含有核酸构建体,该核酸构建体含有编码分泌信号肽的第一核酸序列,其中该第一核酸序列与编码具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地连接,其中所述信号肽指导该多肽进入细胞分泌途径;和(b)回收该分泌的多肽。本发明还涉及具有L-天冬酰胺酶活性的分离多肽和其核酸。
文档编号C12N1/21GK1705880SQ03812354
公开日2005年12月7日 申请日期2003年4月1日 优先权日2002年4月1日
发明者迈克尔·托马斯, 艾伦·斯洛马 申请人:诺维信生物技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1