信号序列捕获的制作方法

文档序号:585552阅读:599来源:国知局
专利名称:信号序列捕获的制作方法
发明领域
本发明描述了由现有基因文库分离编码分泌性多肽的基因的方法,其中通过体外转座反应来检测内源分泌信号序列,其中转座子包含分泌性报告基因。
背景技术
目前,新工业酶(更具体的说是分泌性酶)地搜索依赖简单的主要功能测定法的有效性。通常,在培养基中使用底物来筛选微生物,通过底物的物理变化(颜色变化、集落周围形成的晕轮、荧光等)来识别底物的降解。对于许多蛋白质而言,不存在简单的功能测定法,但是它们可能具有作为工业酶的潜在应用。
分泌性酶在工业应用中受到高度关注,因而非常期望获得只选择编码分泌性酶的克隆的正选择筛选系统。信号捕获是通过与缺乏自身信号的胞外报告基因的翻译融合来鉴定包含信号肽的基因的方法。为了鉴定新信号序列,文献中已经报道了这种方法(Manoil和Beckwith,1985,TnphoAA transposon probe for protein export signals即TnphoA用于蛋白质输出信号的转座子探针,Proc.Natl.Acad.Sci.USA,828129-8133;H.Smith等人,1987,Construction and useof signal sequence selection vectors in Escherichia coli andBacillus subtilis即信号序列选择载体在大肠杆菌和枯草芽孢杆菌中的构建和使用,J.Bact.,1693321-3328);这种方法还可用于清楚的确定信号肽内实现最佳功能所必需的特定元件(H.Smith等人,1988,Characterisation of signal-sequence-coding regionsselected from the Bacillus subtilis chromosome即选自枯草芽孢杆菌染色体的信号序列编码区的表征,Gene,70351-361)。
许多发表物描述了克隆载体报告系统,即在包含无信号报告基因的筛选载体中构建基因组或cDNA文库。在将缺乏翻译终止位点的cDNA或基因组片段克隆到报告上游时,形成了由此产生的蛋白质-报告基因融合产物。若克隆的cDNA或基因组片段包含信号肽,则融合蛋白将被分泌到胞外。可以通过选择培养基上的生长来检测分泌,如在酿酒酵母中使用转化酶或在大肠杆菌中使用β-内酰胺酶。这些发表物并不涉及用于筛选先前构建的基因文库的方法。
通过筛选包含信号肽的克隆,显著降低了文库中待调查的克隆数目,然而得到的克隆可能只包含不完整基因,即它可能包含或不包含编码酶活性(所述酶活性最初与分离的分泌信号序列相关)所需要的最小DNA信息。
发明概述
本发明要解决的问题是在现有基因文库中鉴定那些编码有效分泌的或表面展示的多肽(甚至具有未知活性的多肽)的克隆,而无需在筛选载体中再次克隆文库且无需在费时费力但只检测已知活性的传统活性测定法中筛选文库。解决了这个问题就能够由先前已构建了基因文库的新生物体快速且有效的在工业上开发分泌的或表面展示的相关多肽。
我们描述了无信号报告基因与体外多核苷酸插入反应用于由先前构建的基因组或cDNA文库鉴定分泌的、部分分泌的、或细胞表面展示的多肽的编码基因的联合使用,如转座子(诸如MuA转座子)中包含的无信号β-内酰胺酶基因的使用。本发明能够通过对先前构建的基因库或文库筛选使用常规筛选方法不太可能分离得到的分泌的、部分分泌的、或细胞表面展示的多肽(诸如酶、受体、细胞因子、肽激素等)的编码基因。
因此,本发明的第一个方面涉及由基因文库鉴定并分离目的基因的方法,其中基因编码携带用于分泌或部分分泌的信号序列的多肽,所述方法包括下列步骤
a)提供基因组DNA文库或cDNA文库;
b)在所述文库中插入包含编码分泌性报告基因的无启动子且无分泌信号的多核苷酸的DNA片段;
c)将包含插入DNA片段的文库导入宿主细胞;
d)筛选并选择分泌或部分分泌有活性的分泌性报告基因的宿主细胞;
e)通过对插入DNA片段侧翼的DNA测序,在选定宿主细胞中鉴定插入了分泌性报告基因的目的基因;
f)分离在步骤e)中鉴定的完整目的基因。
本发明的第二个方面涉及由基因文库鉴定并分离目的基因的方法,其中所述基因编码携带分泌信号序列的多肽,所述方法包括下列步骤
a)提供基因组DNA文库或cDNA文库;
b)在所述文库中插入包含编码分泌报告基因的无启动子且无分泌信号的基因的DNA片段;
c)将携带所述DNA片段的随机插入片段的文库导入宿主细胞群体;
d)筛选表达并分泌分泌性报告基因的宿主细胞;
e)通过对步骤b)的DNA片段侧翼的DNA测序,鉴定插入了分泌性报告基因的目的基因;
f)由步骤a)的文库分离完整目的基因。
术语“多肽”、“分泌的”、或“部分分泌”和“部分分泌的”在本文中可互换使用,指部分多肽或完整多肽穿过细胞(诸如原核、真核、或古细菌(archaeon)细胞)膜的转移。在多肽分泌的非限制性实施例中,可以通过本发明的方法在宿主细胞中作为与本发明“分泌性报告基因”融合的融合多肽来表达膜结合的或跨膜的蛋白质(诸如受体);因而在此内容中,“分泌”指融合多肽穿过宿主细胞膜的转移,其程度至少使得融合多肽的分泌性报告基因部分展示在膜的胞外一侧,且在分泌性报告基因测定法中有功能活性。在其它实施例中,可以将融合多肽完整分泌到培养基中,而与分泌细胞没有任何残留连接。
在本文的非限制性实施例中,将现有cDNA或基因组DNA文库用包含报告基因的转座子做上标签。通过测定有活性的报告基因的表达来检测转座子报告基因与文库中包含信号序列的基因的符合读码框式融合。然后对转座子插入位点上游和下游的侧翼DNA序列测序,并通过序列分析来鉴定插入了转座子的基因。在许多情况中,回收在相同基因的不同核苷酸位置或位点做上标签的大量克隆将有助于获得带标签基因的全长序列。对阳性克隆测序以鉴定呈现相同基因但具有不同转座子插入位点的克隆。可以这种方式通过毗连序列群装配而获得所有或大多数开放读码框(ORF)。若以这种方式不能获得完整ORF(可能是由于基因中转座子插入片段的数目不够或分布不匀),则可以通过经典的引物行走DNA测序来获得全长基因。
然后可以将如此获得的序列信息用于分离包含编码分泌信号序列的序列的完整目的基因,进一步用于构建用于分泌性蛋白质工业生产的最佳表达构建物,所有这些都完全属于本领域技术范围之内,而且表达并回收酶的工业生产过程在本领域已有充分描述,见本文其它部分所示。
因此,本发明的第三个方面涉及通过本发明的方法分离得到的目的基因,优选由基因文库分离得到的基因。本发明的另一个方面涉及通过第一个或第二个方面的方法由基因文库分离得到的目的基因。
本发明的一个方面涉及由上述方面定义的目的基因编码的酶。
另外,本发明的另一个方面涉及包含上述方面定义的目的基因的表达系统。
本发明的还有一个方面涉及包含上述方面定义的表达系统的宿主细胞,或包含上述方面定义的目的基因的至少两个染色体整合拷贝的宿主细胞。
本发明的最后一个方面涉及用于生产酶的方法,包括在适合于表达上述方面定义的目的基因的条件下培养上述方面定义的宿主细胞,其中所述宿主细胞将由所述基因编码的蛋白质分泌到培养基中。



图1大量转座子在编码支链淀粉酶的基因PULL1012中的整合位置的排列示意图。已知支链淀粉酶编码序列表述为“pullulanasetrimmed.SEQ(1>2598)”,指向右边的箭头指示转录方向。用箭头指示转座子的位置(一个箭头指示一个分离克隆),而且左边列出了克隆的名称。分泌β-内酰胺酶分泌性报告基因的克隆在名称中标有减号“-”,而且指向右边的指示性箭头显示分泌性报告基因与PULL1012基因的同向转录。通过常规选择分离得到不分泌β-内酰胺酶报告基因的其它克隆;这些克隆标有“+”或“p”,而且指向左边的指示性箭头显示符合读码框的融合,因而不可能获得分泌性融合多肽。两个克隆“Tn4-12-.ab1”和“Tn4-4-.ab1”在图中标有方框,而且正文指示分泌性融合多肽保留了由PULL1012基因编码的支链淀粉酶活性。
保藏的微生物
2001年2月8日将类芽孢杆菌(Paenibacillus)NN018026菌株保藏于DSMZ,编号DSM 14046。
定义
依照本发明,可以在本领域技术范围之内采用常规分子生物学、微生物学、和重组DNA技术。这些技术在文献中已有充分解释。参阅例如Sambrook、Fritsch和Maniatis,《Molecular CloningA LaboratoryManual》即分子克隆实验室手册,第2版,1989,冷泉港实验室出版社,冷泉港,纽约(在本文中略述为“Sambrook等人,1989”);《DNACloningA Practical Approach》即DNA克隆实践方法,第1和2卷,D.N.Glover编,1985;《Oligonucleotide Synthesis》即寡核苷酸合成,M.J.Galt编,1984;《Nucleic Acid Hybridization》即核酸杂交,B.D.Hames和S.J.Higgins编,1985;《Transcription andTranslation 》即转录和翻译,B.D.Hames和S.J.Higgins编,1984;《Animal Cell Culture》即动物细胞培养,R.I.Freshney编,1986;《Immobilized Cells and Enzymes》即固定化细胞和酶,IRL出版社,1986;B.Perbal,《A Practical Guide to Molecular Cloning》即分子克隆实践指南,1984。
在应用于蛋白质时,术语“分离的”指在除其天然环境外的条件下(诸如除了血液和动物组织以外)发现的蛋白质。在优选形式中,分离的蛋白质基本上不含其它蛋白质,特别是动物来源的其它蛋白质。优选提供高度纯化形式的蛋白质,即超过95%纯,更优选超过99%纯。在应用于多核苷酸分子时,术语“分离的”指分子与其天然遗传环境分开,因而不含其它外来的或不需要的编码序列,而且是适合用于遗传工程蛋白质生产系统的形式。这些分离的分子是那些与其天然环境分开的分子,包括cDNA和基因组克隆。本发明的分离的DNA分子不含它们通常相关的其它基因,但是可以包含天然发生的5’和3’非翻译区,诸如启动子和终止子。相关区域的鉴定对于本领域普通技术人员而言是显然的(参阅例如Dynan和Tijan,Nature,316774-778,1985)。
“多核苷酸”指由5’端读向3’端的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。多核苷酸包括RNA和DNA,可以由天然来源进行分离、体外合成、或由天然和合成分子的组合进行制备。“核酸分子”指核糖核苷(腺苷、鸟苷、尿苷、或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷、或脱氧胞苷;“DNA”分子)的磷酸酯聚合形式,其或是单链形式或是双链螺旋。可能是双链DNA-DNA、DNA-RNA、和RNA-RNA螺旋。术语核酸分子(特别是DNA或RNA分子)只指分子的一级和二级结构,不限于任何特定的三级或四级形式。因而,该术语包括在线性或环状DNA分子(如限制性片段)、质粒、和染色体中发现的双链DNA。在讨论特定双链DNA分子的结构时,本文可以依照常规在描述序列时只给出沿DNA非转录链(即具有与mRNA同源的序列的链)5’向3’方向的序列。“重组DNA分子”指经历了分子生物学操作的DNA分子。核酸构建物
本发明还涉及包含本发明的核酸序列且其可操作连接一种或多种控制序列的核酸构建物,其中控制序列在合适宿主细胞中在与控制序列相容的条件下指导编码序列的表达。表达应理解为包括多肽生成所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。
“表达构建物”在本文中定义为由天然发生基因分离得到的或经修饰包含核酸区段(其联合和并列方式在自然界中并不存在)的单链或双链核酸分子。当核酸构建物包含表达本发明的编码序列所需要的所有控制序列时,术语核酸构建物与术语表达盒同义。术语“编码序列”在本文中定义为直接说明其蛋白质产物的氨基酸序列的核酸序列。编码序列的边界通常由核糖体结合位点(原核生物)或恰好位于mRNA 5’端开放读码框上游的ATG起始密码子和恰好位于mRNA 3’端开放读码框下游的转录终止子序列(真核生物)来确定。编码序列可以包括但不限于DNA、cDNA、和重组核酸序列。
可以多种方式操作编码本发明多肽的分离核酸序列以提供多肽的表达。根据表达载体,可能希望或必需在将核酸序列插入载体之前对其进行操作。利用重组DNA方法来修饰核酸序列的技术在本领域是众所周知的。
术语“控制序列”在本文中的定义包括对本发明多肽的表达而言必需或有利的所有成分。每一种控制序列对于编码多肽的核酸序列而言可以是天然的或外来的。这些控制序列包括但不限于前导序列、聚腺苷酸化序列、原肽序列、启动子、信号肽序列、和转录终止子。控制序列在最低限度包括启动子和转录及翻译终止信号。为了导入便于连接控制序列与编码多肽的核酸序列的编码区的特定限制性位点,可以一起提供接头和控制序列。术语“可操作连接”在本文中定义为将控制序列置于相对于DNA序列的编码序列的适当位置使得控制序列指导多肽表达的结构。
控制序列可以是适当的启动子序列,即得到宿主细胞的识别而表达核酸序列的核酸序列。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在选定宿主细胞中显示转录活性的任何核酸序列,包括突变的、截短的、和杂合的启动子,而且可以由编码胞外或胞内多肽的基因(对于宿主细胞而言可以是同源的或异源的)获得。
尤其适用于在细菌宿主细胞中指导本发明核酸构建物的转录的启动子的范例是得自大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和sylB因、和原核生物β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of theNational Academy of Sciences USA,753727-3731)的启动子,以及tac启动子(DeBoer等人,1983,Proceedings of the NationalAcademy of Sciences USA,8021-25)。Scientific American,1980,24274-94中的“Useful proteins from recombinantbacteria”即来自重组细菌的有用蛋白质和J.Sambrook等人,1989,《Molecular CloningA Laboratory Manual》即分子克隆实验室手册,第2版,冷泉港,纽约描述了其它启动子。
适用于在丝状真菌宿主细胞中指导本发明核酸构建物的转录的启动子的范例是得自米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、和尖镰孢胰蛋白酶样蛋白酶(WO96/00787)的基因的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂合体),及其突变的、截短的、和杂合的启动子。
在酵母宿主中,有用的启动子得自酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶的基因。Romanos等人,1992,Yeast,8423-488描述了可用于酵母宿主细胞的其它有用启动子。
控制序列还可以是合适的转录终止子序列,即得到宿主细胞的识别而终止转录的序列。终止子序列可操作连接于编码多肽的核酸序列的3’末端。可以在本发明中使用能够在选定宿主细胞中发挥功能的任何终止子。
优选用于丝状真菌宿主细胞的终止子得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖镰孢胰蛋白酶样蛋白酶的基因。
优选用于酵母宿主细胞的终止子得自酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。Romanos等人,1992,见上文描述了可用于酵母宿主细胞的其它有用终止子。
控制序列还可以包括合适的前导序列,即mRNA中对宿主细胞的翻译重要的非翻译区。前导序列可操作连接于编码多肽的核酸序列的5’末端。可以在本发明中使用能够在选定宿主细胞中发挥功能的任何前导序列。
优选用于丝状真菌宿主细胞的前导序列得自米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因。
适用于酵母宿主细胞的前导序列得自酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。
控制序列还可以是聚腺苷酸化序列,即可操作连接于核酸序列的3’末端且转录后由宿主细胞识别而向转录的mRNA添加多腺苷酸残基的信号的序列。可以在本发明中使用能够在选定宿主细胞中发挥功能的任何聚腺苷酸化序列。
优选用于丝状真菌宿主细胞的聚腺苷酸化序列得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡萄糖苷酶的基因。
Guo和Sherman,1995,Molecular Cellular Biology,155983-5990描述了可用于酵母宿主细胞的有用聚腺苷酸化序列。
还可能希望添加能够相对于宿主细胞的生长而调控多肽表达的调控序列。调控系统的范例是那些应答化学或物理刺激(包括调控化合物的存在)而引起基因表达的开启或关闭的系统。原核系统中的调控系统包括lac、tac、和trp操纵基因系统。在酵母中可以使用ADH2系统或GAL1系统。在丝状真菌中可以使用TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子作为调控序列。调控序列的其它范例是那些能够进行基因扩增的序列。在真核系统中,它们包括在存在氨甲蝶呤时扩增的二氢叶酸还原酶基因和在存在重金属时扩增的金属硫蛋白基因。在这些情况中,编码多肽的核酸序列将可操作连接调控序列。
本发明还涉及用于改变编码本发明多肽的内源基因表达的核酸构建物。构建物可包含改变内源基因表达所必需的最小数目的成分。在一个实施方案中,核酸构建物优选包含(a)靶向序列、(b)调控序列、(c)外显子、和(d)剪接供体位点。在将核酸构建物导入细胞后,构建物将通过同源重组在内源基因位点插入细胞基因组。靶向序列指导元件(a)-(d)整合到内源基因中,使得元件(b)-(d)可操作连接内源基因。在另一个实施方案中,核酸构建物包含(a)靶向序列、(b)调控序列、(c)外显子、(d)剪接供体位点、(e)内含子、和(f)剪接受体位点,其中靶向序列指导元件(a)-(f)的整合,使得元件(b)-(f)可操作连接内源基因。然而,构建物可包含额外成分,诸如选择标记。
这些成分的导入导致新转录单位的生成,其中内源基因的表达得到改变。新的转录单位在本质上是通过靶向构建物导入的序列与内源基因的融合产物。在内源基因得到改变的一个实施方案中,基因被激活。在这个实施方案中,将同源重组用于取代、破坏、或使通常与亲本细胞的内源基因有关的调控区失效,即通过插入调控序列使得基因以高于相应亲本细胞中显然的水平进行表达。
构建物还包含内源基因的一个或多个外显子。外显子定义为拷贝成RNA且存在于成熟mRNA分子中(使得外显子序列符合内源基因编码区的读码框)的DNA序列。外显子可任选包含编码一个或多个氨基酸和/或部分编码氨基酸的DNA。或者,外显子包含对应于5’非编码区的DNA。当外源外显子编码一个或多个氨基酸和/或氨基酸的一部分时,核酸构建物的设计使得转录和剪接后的读码框符合内源基因的读码框,mRNA中衍生自第二个外显子的部分的适当读码框没有变化。
构建物的剪接供体位点指导一个外显子与另一个外显子的剪接。通常,第一个外显子位于第二个外显子的5’端,而且位于第一个外显子3’侧翼并与其交叠的剪接供体位点识别位于第二个外显子5’侧翼的剪接受体位点。剪接受体位点,像剪接供体位点一样,是指导一个外显子与另一个外显子的剪接的序列。通过与剪接供体位点一起作用,这一剪接装置使用剪接受体位点来消除内含子。表达载体
本发明还涉及包含本发明的核酸序列、启动子、及转录和翻译终止信号的重组表达载体。可以将上文所述各种核酸和控制序列连接在一起而生成重组表达载体,它可以包含一种或多种便利的限制性位点,从而能够在这些位点插入或替代编码多肽的核酸序列。或者,可以通过将核酸序列或包含该序列的核酸构建物插入用于表达的适当载体来表达本发明的核酸序列。在构建表达载体时,将编码序列置于载体中使得编码序列可操作连接用于表达的适当控制序列。
重组表达载体可以是能够方便的进行重组DNA流程且能够表达核酸序列的任何载体(如质粒或病毒)。载体的选择通常取决于载体与其将要导入的宿主细胞的相容性。载体可以是线性或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,它的复制不依赖染色体的复制,如质粒、染色体外元件、微型染色体、或人工染色体。载体可以包含用于确保自身复制的任何手段。或者,载体可以是在导入宿主细胞后整合到基因组中并与其整合的染色体一起复制的载体。另外,可以使用单一载体或质粒或者一起包含将要导入宿主细胞基因组的总DNA的两种或多种载体或质粒、或转座子。
本发明的载体优选包含能够容易的选择转化细胞的一种或多种选择标记。选择标记是其产物提供杀生物剂或病毒抗性、重金属抗性、为营养缺陷型提供原养型、诸如此类的基因。细菌选择标记的范例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因、或赋予抗生素抗性(诸如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性)的标记。适用于酵母宿主细胞的合适标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、trpC(邻氨基苯甲酸合酶),及其等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选包含能够将载体稳定整合到宿主细胞基因组中或能够在细胞中独立于基因组而自主复制载体的元件。
为了整合到宿主细胞基因组中,载体可以依赖编码多肽的核酸序列或载体中用于通过同源或非同源重组将载体稳定整合到基因组中的任何其它元件。或者,载体可以包含用于指导通过同源重组整合到宿主细胞基因组中的额外核酸序列。该额外核酸序列使得载体在染色体的精确位置整合到宿主细胞基因组中。为了增加整合到精确位置的可能性,整合元件应当优选包含与对应靶序列高度同源的足够数目(诸如100-1500碱基对,优选400-1500碱基对,最优选800-1500碱基对)的核酸,以增加同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。另外,整合元件可以是非编码的或编码的核酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞基因组中。
为了自主复制,载体还可包含使得载体能够在讨论的宿主细胞中自主复制的复制起点。细菌复制起点的范例是能够在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184及能够在芽孢杆菌中复制的pUB110、pE194、pTA1060、和pAMβ1的复制起点。用于酵母宿主细胞的复制起点的范例是2μm复制起点、ARS1、ARS4、ARS1与CEN3的联合、及ARS4与CEN6的联合。复制起点可以是具有使之在宿主细胞中以温度敏感方式发挥功能的突变型复制起点(参阅例如Ehrlich,1978,Proceedings of the National Academy of Sciences USA,751433)。
可以将超过一个拷贝的本发明核酸序列插入宿主细胞以提高基因产物的产量。可以通过将序列的至少一个额外拷贝整合到宿主细胞基因组中或通过包含具有核酸序列的可扩增选择标记来实现核酸序列拷贝数目的增加,在后一种情形中,通过在存在适当选择剂时培养细胞来选择包含扩增拷贝的选择标记基因、因而包含额外拷贝的所述核酸序列的细胞。
用于连接上文所述元件以构建本发明重组表达载体的流程对于本领域技术人员而言是众所周知的(参阅例如Sambrook等人,1989,见上文)。宿主细胞
本发明还涉及重组宿主细胞,它们有利的用于本发明第一个方面的方法,及用于由本发明方法鉴定的目的基因编码的多肽的重组生产。将包含本发明目的核酸序列或基因的载体导入宿主细胞,从而作为较早描述的染色体整合体或自身复制染色体外载体来维持该载体。术语“宿主细胞”涵盖因复制过程中发生的突变而与亲本细胞不同的任何后代。为了这些目的而选择的宿主细胞在极大程度上依赖编码多肽的基因及其来源。
宿主细胞可以是单细胞微生物(如原核生物)或非单细胞微生物(如真核生物)。
有用的单细胞细胞是细菌细胞,诸如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞,如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、Bacillusclausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、和苏云金芽孢杆菌(Bacillusthuringiensis),或链霉属细胞,如浅青紫链霉菌(Streptomyceslividans)或鼠灰链霉菌(Streptomyces murinus);或者革兰氏阴性细菌,诸如大肠杆菌和假单胞菌。在一个优选的实施方案中,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌、或枯草芽孢杆菌细胞。在另一个优选的实施方案中,芽孢杆菌属细胞是嗜碱芽孢杆菌。
例如可以通过原生质体转化(参阅例如Chang和Cohen,1979,Molecular General Genetics,168111-115)、使用感受态细胞(参阅例如Young和Spizizin,1961,Journal of Bacteriology,81823-829;或Dubnau和Dayidoff-Abelson,1971,Journal ofMolecular Biology,56209-221)、电穿孔(参阅例如Shigekawa和Dower,1988,Biotechniques,6742-751)、或接合(参阅例如Koehler和Thorne,1987,Journal of Bacteriology,1695771-5278)来实现将载体导入细菌宿主细胞。
宿主细胞可以是真核生物,诸如哺乳动物、昆虫、植物、或真菌细胞。
在一个优选的实施方案中,宿主细胞是真菌细胞。“真菌”在用于本文时包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(见Hawksworth等人的定义,《Ainsworth and Bisby’s Dictionary of the Fungi》即Ainsworth和Bisby的真菌词典,第8版,1995,CAB International,University出版社,剑桥,英国)以及卵菌门(Oomycota)(见Hawksorth等人的引用,1995,见上文,第171页)和其它有丝分裂孢子真菌(Hawksworth等人,1995,见上文)。
在一个更优选的实施方案中,真菌宿主细胞是酵母细胞。“酵母”在用于本文时包括产子囊酵母(内孢霉目(Endomycetales))、产担孢子酵母、和属于半知菌的酵母芽孢纲((Blastomycetes))。由于酵母的分类可能在未来发生变化,因此为了本发明的目的应当如《Biology and Activities of Yeast》即酵母的生物学和活性(F.A.Skinner、S.M.Passmore、和R.R.Davenport编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述来定义酵母。
在一个甚至更优选的实施方案中,酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或Yarrowia属细胞。
在一个最优选的实施方案中,酵母宿主细胞是卡尔酵母(Saccharmyces carlsbergensis)、酿酒酵母(Saccharomycescerevisiae)、糖化醇母(Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、或Saccharomyces oviformis;细胞。在另一个最优选的实施方案中,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的实施方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的实施方案中,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)(见Hawksworth等人的定义,1995,见上文)亚门的所有丝状形式。丝状真菌的特征为由壳多糖、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖、和其它复合多糖组成的菌丝体壁。营养性生长是通过菌丝延伸,碳分解代谢是专性需氧。相反,酵母诸如酿酒酵母的营养性生长是通过单细胞菌体的出芽,碳分解代谢可以是发酵。
在一个甚至更优选的实施方案中,丝状真菌宿主细胞是但不限于顶孢霉属(Acremonium)、曲霉属(Aspergillus)、镰孢属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、链孢菌属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、Tolypocladium属、或木霉属(Trichoderma)物种的细胞。
在一个最优选的实施方案中,丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonious)、构巢曲霉(Aspergillusnidulans)、黑曲霉、或米曲霉细胞。在另一个最优选的实施方案中,丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactidioides)、Fusariumcerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium Sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium spotichioides)、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、或Fusariumyenenatum细胞。在一个甚至最优选的实施方案中,丝状真菌亲本细胞是Fusarium yenenatum(Nirenberg sp.nov.)细胞。在另一个最优选的实施方案中,丝状真菌宿主细胞是Humicola insolens、Humicolalanuginose、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Thielavia terrestris、Trichodermaharzianum、康宁木霉(Trichoderma koningii)、Trichodermalongibrachiatum、Trichoderma reesei、或绿色木霉(Trichodermaviride)细胞。
可以通过涉及原生质体形成、原生质体转化、和细胞壁再生的过程以本质已知的方式来转化真菌细胞。EP 238 023和Yellon等人,1984,Proceedings of the National Academy of Sciences USA,811470-1474描述了适用于转化曲霉属宿主细胞的合适流程。Malardier等人,1989,Gene,78147-156和WO96/00787描述了适用于转化镰孢属物种的合适方法。可以使用Becker和Guarente在J.N.Abelson和M.I.Simon编的《Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology》即酵母遗传学和分子生物学指南,酶学方法,第194卷,第182-187页,Academic出版公司,纽约;Ito等人,1983,Journal of Bacteriology,153163;和Hinnen等人,1978,Proceedings of the National Academy of Sciences USA,751920描述的流程来转化酵母。生产过程
本发明还涉及用于生产本发明多肽的过程,包括(a)培养菌株(野生型形式能够生成所述多肽)以生成包含多肽的上清液;并(b)回收多肽。
本发明还涉及用于生产本发明多肽的方法,包括(a)在适合于生成多肽的条件下培养已经掺入了新转录单位(包含调控序列、外显子、和/或剪接供体位点且其可操作连接编码多肽的内源核酸序列的第二个外显子)的同源重组细胞;并(b)回收多肽。所述方法基于基因激活技术的使用,例如美国专利号5,641,670中所述。
在本发明的生产方法中,使用本领域知道的方法在适合于生成多肽的营养培养基中培养细胞。例如,可以通过摇瓶培养、小规模或大规模发酵(包括连续、成批、分批补料或固态发酵)在实验室或工业发酵罐中在合适培养基中在能够表达和/或分离多肽的条件下培养细胞。在包含碳源、氮源、和无机盐的合适营养培养基中使用本领域知道的流程进行培养。可以由商业供应商处获得合适培养基,或者可以依照发表的组成进行配制(如Amercian Type Culture Collection即美国典型培养物收藏中心的目录)。若多肽被分泌到营养培养基中,则可以直接由培养基回收多肽。若多肽不分泌,则可以由细胞裂解物回收多肽。
可以使用本领域知道的且对多肽特异的方法来检测多肽。这些检测方法可以包括特异抗体的使用、酶产物的形成、或酶底物的消失。例如,可以将酶测定法用于测定本文所述多肽的活性。
可以通过本领域知道的方法回收生成的多肽。例如,可以通过常规流程由营养培养基回收多肽,包括但不限于离心、过滤、抽提、喷雾-干燥、蒸发、或沉淀。
可以通过本领域知道的多种流程来纯化本发明的多肽,包括但不限于层析(如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳流程(如制备性等电聚焦)、差异溶解(如硫酸铵沉淀)、SDS-PAGE、或抽提(参阅例如《Protein Purification》即蛋白质纯化,J.C.Janson和Lars Ryden编,VCH Publishers,纽约,1989)。
发明详述
本发明能够通过对例如先前构建的基因库或文库筛选分泌性多肽或酶(甚至具有未知活性)的编码基因从而无需已知筛选方法。本发明的方法能够筛选具有潜在工业利益但使用常规筛选方法不太可能分离得到的多肽。
用于由基因文库鉴定并分离目的基因的方法,其中基因编码携带用于分泌或部分分泌的信号序列的多肽,所述方法包括下列步骤
a)提供基因组DNA文库或cDNA文库;
b)在所述文库中插入包含编码分泌性报告基因的无启动子且无分泌信号的多核苷酸的DNA片段;
c)将包含该插入DNA片段的文库导入宿主细胞;
d)筛选并选择分泌或部分分泌有活性的分泌性报告基因的宿主细胞;
e)通过对插入DNA片段侧翼的DNA测序,在选定宿主细胞中鉴定插入了分泌性报告基因的目的基因;
f)分离在步骤e)中鉴定的完整目的基因。
可以使用本领域知道的任何基因文库来进行本发明,特别是它还可用于通常在环境样品中看到的可存活但不可培养的生物体的基因文库。本领域已经描述了由包含不可培养的生物体的环境样品构建代表性或标准化基因文库的方法(US 5,763,239)。
因此,本发明的一个优选实施方案涉及第一个方面的方法,其中步骤(f)中的完整目的基因是由步骤(a)的文库分离得到的。
本领域知道将DNA片段插入基因组的几种方法,一个范例是通过转座的插入,然而这通常需要进行费时费力的杂交实验。使用本文例示的商品化体外方案可以容易的进行本发明。
本发明的一个优选实施方案涉及第一个方面的方法,其中步骤(b)是在体外进行的。
在本发明的方法中可能有利的是对其中各种DNA的呈现进行了标准化的文库进行操作,本领域已经描述了用于对DNA文库进行标准化的流程,参阅例如美国专利号5,763,239。
本发明的一个优选实施方案涉及第一个方面的方法,其中cDNA或cDNA文库是标准化的。
本发明的另一个优选实施方案涉及第一个方面的方法,其中基因组DNA文库或cDNA文库衍生自微生物。在一个优选的实施方案中,微生物是真菌、丝状真菌、或酵母。在另一个优选的实施方案中,微生物是细菌,在还有一个优选的实施方案中,微生物是古细菌(archaeon)。用于由多细胞生物体(诸如衍生自昆虫(诸如果蝇)、植物、或驯养动物,甚至人的商品化细胞系)构建DNA或cDNA文库的方法在本领域同样是众所周知的。可能特别感兴趣的是使用衍生自特定组织或器官(诸如糖尿病患者的胰腺或癌性肿瘤的细胞)的文库。
本发明的一个优选实施方案涉及第一个方面的任何方法,其中基因组DNA文库或cDNA文库衍生自多细胞生物体,优选哺乳动物细胞,更优选人类细胞。
正如本文其它部分所述,本领域存在几种方法用于将DNA片段随机插入较大的DNA序列。本发明的一个优选实施方案涉及第一个方面的方法,其中第一个方面的DNA片段包含转座子,优选MuA转座子。
正如本文的一个实施例中所述,可能有利的是使用包含在本发明方法的宿主细胞中有功能的复制起点的本发明DNA片段。
因此,本发明的一个优选实施方案涉及第一个方面的方法,其中DNA片段包含在宿主细胞中有功能的复制起点,优选的是复制起点在大肠杆菌中有功能,更优选的是复制起点衍生自colE1、oriV、P15A、或colDF13,最优选的是复制起点是colE1。
本发明的一个优选实施方案涉及第一个方面的方法,其中分泌性报告基因是在由宿主细胞分泌时使所述细胞能够在原本抑制其生长的物质存在时生长的蛋白质,优选的是分泌性报告基因是β-内酰胺酶或转化酶。
正如本文其它部分所述,在本发明的方法中可能是有利的是步骤(b)的DNA片段的多核苷酸编码携带N端肽接头的分泌性报告基因,所述肽接头包含蛋白水解切割的特异靶位点。因而,在以符合读码框的方式将DNA片段插入编码分泌的或部分分泌的多肽的目的基因时,生成的融合多肽将包含如下成分分泌性多肽-肽接头-分泌性报告基因。因此,在鉴定了特别感兴趣的目的基因后,可直接切割融合多肽并分离不含分泌性报告基因的编码多肽,相似的融合多肽方法在本领域是众所周知的(参阅例如WO00/75344)。在此内容中,在将至少两种基因或者其它DNA元件连接在一起而形成一个单一开放读码框且将这些元件以所列相同顺序表达成一个多肽时,则说各种元件是“顺序融合的”,并将多肽称为“融合多肽”或“融合蛋白”。
术语“接头”或“间隔物”指包含至少两个氨基酸且位于多结构域蛋白质(例如包含核心酶和结合结构域诸如纤维素结合结构域(CBD)的酶或任何其它酶杂合物)的结构域之间或者作为融合多肽(例如包含两种核心酶的融合蛋白或本发明细胞中存在的融合蛋白)表达的两种蛋白质或多肽之间的多肽。例如,通过将编码第一种核心酶的DNA序列、编码接头的DNA序列、和编码第二种核心酶的DNA序列顺序融合成一个开放读码框并表达该构建物来提供两种核心酶的融合蛋白。接头还可包含蛋白水解切割的靶位点。
在本发明的一个优选实施方案中,蛋白水解切割的靶位点是由蛋白酶识别并切割的氨基酸序列。文献中已经描述了几种氨基酸序列,在有效定位时将促进融合产物的有效切割。这些策略中的大多数涉及母酶与所需肽之间的接头区中位点特异的蛋白水解切割(Polyak等人,1997,Protein Engineering,10(6)615-619;Kjeldsen等人,1996,Gene,170(1)107-112;Sun等人,1995,Protein Expressionand Purification,6(5)685-692;Martinez等人,1995,BiochemicalJournal,306(Pt2)589-597)。
为了确保有效切割,可以在母酶与外源多肽(在这种情况中是由本发明方法的DNA片段编码的分泌性报告基因)之间插入编码位点特异蛋白酶识别位点的氨基酸序列。文献中已经描述了识别位点与蛋白酶的几种组合。Kex2蛋白酶水解具有碱性氨基酸对的肽和蛋白质,且切割它们肽键的C端(Bessmertnaya等人,1997,Biochemistry,62(8)850-857)。在依照第一个和第二个方面的一个优选实施方案中使用的Kex2切割位点是Lys-Arg(K-/-R)序列,但是也可以插入其它碱性氨基酸组合以优化Kex2的切割(Ledgerwood等人,1995,J.Biochem.,308(1)321-325;或S.Ghosh等人,1996,Gene(阿姆斯特丹),176(1-2)249-255)。
蛋白酶与切割位点的其它有用组合是肠激酶(La Vallie等人,1993,J.Biol.Chem.,2682311-2317)优先切割氨基酸序列X-D-D-D-K-/-X,胰蛋白酶(Jonasson等人,1996,Eur.J.Biochem.,236(2)656-661)优先切割氨基酸序列X-K-R-/-X,因子Xa(Nagai等人,1985,PNAS,827252-7255)优先切割氨基酸序列X-I-E-G-R-/-X,胶原酶(Chinery等人,1993,Eur.J.Biochem.,212(2)557-553)优先切割氨基酸序列P-X-/-G-P-X-X,凝血酶(Rahman等人,1992,Cell.Mol.Biol.,38(5)529-542)优先切割氨基酸序列X-G-V-R-G-P-R-/-X,ALP(水解无色杆菌赖氨酸特异性蛋白酶)(Kjeldsen等人,1996,Gene,170(1)107-112)优先切割赖氨酸,来自地衣芽孢杆菌的C成分蛋白酶切割谷氨酸(Kakudo等人,1992,J.Biol.Chem.,267(33)23782-23788)。
在特定靶位点切割肽的另一种优选方法是使用化学化合物诸如切割X-M-/-X的溴化氰或切割S-N-/-G-X的羟胺(《Current Protocols inMolecular Biology》即分子生物学通用方案,John Wiley and Sons,1995,C.R.Harwood和S.M.Cutting编)。
本发明的一个优选实施方案涉及第一个方面的方法,其中步骤(b)的DNA片段的多核苷酸编码携带N端肽接头的分泌性报告基因,所述肽接头包含蛋白水解切割的特异靶位点。
可以设想几种宿主细胞将在本发明中较好的发挥作用,唯一的标准是宿主细胞识别目的基因的分泌信号序列且宿主细胞能够合成有功能的分泌性报告基因。
本发明的一个优选实施方案涉及第一个方面的方法,其中宿主细胞是细菌,优选的是细菌细胞是埃希氏菌属(Escherichia)、乳球菌属(Lactococcus)、链霉菌属(Streptomyces)、肠球菌属(Enterococcus)、或芽孢杆菌属(Bacillus)细胞,优选物种大肠杆菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、灰色链霉菌(Streptomyces griseus)、天蓝色链霉菌(Streptomycescoelicor)、粪肠球菌(Enterococcus faecalis)、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillusthuringiensis)。
本发明的一个优选实施方案涉及第一个方面的方法,其中宿主细胞是真菌,优选的是真菌细胞是假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、Yarrowia属、顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球酵母属(Cryptococcus)、Filibasidium属、镰孢属(Fusarium)、腐质霉属(Humicola)、Magnaporthe属、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix属、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Piromyces属、裂褶菌属(Schizophyllum)、Talaromyces属、嗜热子囊菌属(Thermoascus)、梭孢壳属、Tolypocladium属、或木霉属(Trichoderma),更优选的是真菌宿主细胞是物种酿酒酵母(Saccharomyces cerevisiae)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、或米曲霉(Aspergillusoryzae)。
本发明的真菌宿主细胞可以是卡尔酵母、酿酒酵母、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomycesnorbensis)、Saccharomyces oviformis、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉、臭曲霉、日本曲霉(Aspergillus japonious)、构巢曲霉、黑曲霉、米曲霉、杆孢状镰孢、Fusarium cerealis、Fusariumcrookwellense、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢(Fusarium negundi)、尖镰孢、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、Fusarium sulphureum、Fusarium torulosum、Fusarium tricho thecioides、Fusarium venenatum、Humicolainsolens、Humicola lanuginose、米赫毛霉、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉、Trichoderma harzianum、康宁木霉、Trichodermalongibrachiatum、Trichoderma reesei、或绿色木霉。
在还有一个优选实施方案中,宿主细胞是哺乳动物,优选人,更优选HeLa细胞。众所周知的哺乳动物细胞的非限制性范例包括CHO(中国仓鼠卵巢细胞)、NIH3T3、WRL-68、CoLo587、PANC-1、HeLa S3、K562、Raji、SW480、Soares B细胞(人)、Sp2/O-AG14(鼠骨髓瘤细胞)、BHK-21细胞(幼仓鼠肾细胞)、Sf9 Spodoptera frugiperda(昆虫)、D-MEL-2黑腹果蝇(Drosophila melanogaster)(果蝇,昆虫);所有这些都可以通过商业途径由ATCC获得。
正如本文其它部分所示,本发明的方法依赖DNA序列信息来分离目的基因。
因此,本发明的一个优选实施方案涉及第一个方面的方法,其中测序步骤是使用针对第一个方面的DNA片段的至少一种引物或使用针对载体的至少一种引物进行的,其中第一个方面的DNA文库或cDNA文库得到克隆。
本发明的另一个优选实施方案涉及第一个方面的方法,其中完整目的基因的分离是利用第一个方面的测序步骤获得的DNA序列信息进行的。
将要通过本发明方法分离的目的基因可以编码任何多肽,诸如具有药物特性的多肽、肽激素、抗体或抗体片段、受体、或酶。
因此,本发明的一个优选实施方案涉及第一个方面的方法,其中完整目的基因编码由宿主细胞分泌的酶。
细胞因子是通过结合靶细胞上的特定细胞表面受体而介导广泛生物学活性的分泌性调控肽。细胞因子的作用包括对细胞增殖和分化的控制、对造血和免疫的调控、和炎症应答。细胞因子还是宿主防御过程的主要成员,它们涉及对外源以及内源损伤的应答和组织完整性的修复或恢复(Shi等人,2000,J.Biol.Chem.,27519167-19176)。
细胞因子家族新成员及其受体的鉴定是极其重要的,因为它们在调控广泛的生物学应答时发挥关键作用。细胞因子具有高度保守的4螺旋束三级结构,但是一级氨基酸序列同源性低。因此,使用基于同源的克隆方法来鉴定新细胞因子是较为困难的。新细胞因子受体的分子克隆可能有助于理解一些疾病的发病机理从而相应地调整治疗方法。
已经使用配体结合作为方法克隆了I型细胞因子受体家族的大多数成员。或者,将WSXWS基序的寡核苷酸用作杂交探针,并将针对I型细胞因子受体高度保守区的引物用于简并聚合酶链式反应(PCR)。现在,可以在搜索表达序列标签(EST)数据库时因与已知细胞因子受体的同源性(C.A.Sprecher等人,Cloning and characterization of anovel class I cytokine receptor即新的I型细胞因子受体的克隆和表征,Biochem Biophys Res Commun,1998,24682;G.C.Elson等人,Cytokine-lIke factor-1,a novel soluble protein,shareshomology with members of the cytokine type 1 receptor family即细胞因子样因子1(新的可溶性蛋白质)与细胞因子I型受体家族的成员分享同源性,J.Immunol.,1998,1611371)或使用cDNA表达序列标签(EST)的信号序列预测(Y.Shi等人,2000,A novel cytokinereceptor ligand pair即新细胞因子受体配体对,J.Biol.Chem.,27519167-19176)来鉴定一些细胞因子受体。
已经描述了使用信号捕获的称为SST-REX(通过逆转录病毒介导的表达筛选的信号序列捕获)的方法,其中在逆转录病毒载体中构建cDNA文库,转染到宿主细胞中,并筛选将细胞因子受体的组成性有活性突变体重导向细胞表面的能力,从而使原本白介素-3(IL-3)依赖性的Ba/F3细胞能够不依赖IL-3而生长(T.Koj ima和T.Kitamura,1999,Asignal sequence trap based on a constitutively active cytokinereceptor即基于组成性有活性细胞因子受体的信号序列捕获,NatureBiotech,17487-490)。本发明增加了找到编码细胞因子的全长基因的机会且便于基因的测序,从而能够更快速的发现新细胞因子。
本发明的另一个优选实施方案涉及第一个方面的方法,其中完整目的基因编码膜结合受体,优选双成分信号(two-componentsignal,TCS)转导受体,更优选细胞因子受体。
本发明的还有一个优选实施方案涉及第一个方面的方法,其中完整目的基因编码分泌性多肽细胞因子。
来自病原体的表面结构和分泌因子具有作为疫苗的潜在价值。那些是蛋白质的表面结构和分泌因子在致病细胞内合成且分泌至细胞的表面或胞外空间。本发明可用于鉴定这些蛋白质,然后对它们测试抗原性。来自致病细胞且可用于生成疫苗的分泌性蛋白质的非限制性范例是脂蛋白、周质蛋白、内膜蛋白、和外膜蛋白。
选择来自淋病奈瑟氏球菌(Neisseria gonorrhoeae)的几种这样的蛋白质作为潜在的疫苗靶,并对它们测试在疫苗生成中的适宜性(Pizza等人,2000,Nature,2871816-1820)。在全世界,致病奈瑟氏球菌种在儿童和成年人中引起显著的发病率和死亡率。在美国脑膜炎奈瑟氏球菌已经成为儿童和年轻人的细菌性脑膜炎的主要起因。在欧洲和北美洲,脑膜炎球菌疾病分离菌的1/4-2/3是血清群B。与目前已获得多糖疫苗的血清群A和C不同,血清群B的多糖在所有年龄群中的免疫原性较弱(M.C.Bash等人,2000,Genetic and immunologiccharacterization of a novel serotype 4,15 strain of Neisseria即Neisseria菌株15新血清型4的遗传学和免疫学表征,FEMS ImmunolMed Microbiol,29(3)169-176)。
正在研究外膜蛋白(OMP)疫苗以满足提供针对B群脑膜炎球菌疾病的保护的需要(W.D.Zollinger,1997,New and improved vaccinesagainst meningococcal disease即针对脑膜炎球菌疾病的新型和改进疫苗,《New Generation Vaccines》即新一代疫苗,M.M.Levine等人编,第2版,第469-488页,Marcel Dekker,纽约)。
可用于生成疫苗的蛋白质的非限制性优选范例是淋病奈瑟氏球菌的外膜蛋白MtrE(多药抗性)、在BCG(卡介苗)(A.K.Tyagi,2000,FEMS Microbiol Lett,190309-316)中鉴定的一种分泌抗原即来自结核分支杆菌(Mycobacterium tuberculosis)的分泌性蛋白质Ag85、来自铜绿假单胞菌(Pseudomonas aeruginosa)的外膜蛋白OprM(多药抗性)、和下列分泌性蛋白质(《MolekulareInfektionsbiologie》即分子感染生物学,Hacker、.J.Heesemann、J.Heidelberg编,柏林,Spektrum,Adad.Verlag,2000)●耶尔森氏菌(Yersinia ssp.)III型外膜蛋白(YOP),诸如YopE、H、M、O●丁香假单胞菌(Pseudomonas syringae)ArvB蛋白●铜绿假单胞菌ExoS细胞毒素●奈瑟氏球菌IgA蛋白酶、IV型菌毛●大肠杆菌α-溶血素HylA、EPEC Intimin(EaeA)、侵染素、p-fimbrien(Pap)、S-丝束蛋白●肠杆菌(Entobacteria)I型菌毛
病原体的表面结构和分泌因子可用于诊断。它们可用于获得针对病原体结构或分泌因子的抗体。那些为蛋白质的表面结构和分泌因子在病原体细胞内合成且分泌至细胞的表面或胞外空间。本发明可用于鉴定这些蛋白质。上文列出了可用于生成诊断性抗体的分泌性蛋白质的非限制性范例,因为适用于生成疫苗的蛋白质同样适用于诊断性测定法。
本发明的一个应用可以是克隆用于免疫疗法的分泌性变应原。通常,人变应原包括蛋白质。这些蛋白质在分离后可用于诱导对变应原的耐受性,如通过皮下施用变应原(参阅WO93/19178、WO99/34826、US 6,048,962、US 5,558,869、WO98/04274、US 6,147,201、US5,693,495、或US 5,958,891)。
下文列出了由细胞分泌的主要人蛋白质性变应原的非限制性范例人T细胞反应性猫蛋白质;Der f II主要屋尘螨变应原;AMBTv豚草花粉主要变应原;5C黑麦草(Lolium perenne)花粉变应原;cry j2日本ceder变应原;Alt a 1 Alternaria alternata主要变应原;和Ara h 1花生变应原。
通过本发明的转座子辅助信号序列捕获方法,我们可能能够鉴定编码膜结合蛋白的基因,而且如上所述,膜结合蛋白在疫苗开发中可能具有极大潜力。膜结合蛋白包括脂蛋白、用于摄取溶质的受体、quorum感觉受体、和在感染过程中发挥关键作用的双成分细菌调控系统(TCS)的部分。信号转导系统像TCS使细菌病原体能够发动适应应答并应付不利环境压力,包括营养丧失、抗生素攻击、和吞噬作用。
最近在重要的革兰氏阳性和革兰氏阴性病原体中发现的几种重要系统重新点燃了对TCS作为新细菌靶的兴趣(M.J.Macielag、R.Goldschmidt,Expert Opinion on Investigation Drugs,9(10)2351-2369,2000)。
本发明能够克隆受到极大商业关注的细胞壁附着蛋白。由于为了生长而选择性切割承压旧壁的独特化学和必要性,细菌细胞壁已经成为细菌疾病化疗的关键靶(A.L.Koch,Critical Reviews inMicrobiology,26(1)1-35,2000)。目前,许多传染性生物体正在对过度使用的抗生素形成抗性。细胞壁仍然是较好的靶,而且可能存在几种全新类型的抗生素,它们靶向细胞壁新陈代谢和功能的其它部分。必需的自溶素可能是特别相关的靶。
可以使用本发明鉴定的其它蛋白质包括粘附素,诸如尿道致病大肠杆菌的P-菌毛(Pap)、S-菌毛、奈瑟氏球菌的IV型菌毛、肠杆菌的I型菌毛、和侵染素例如EPEC Intimin(EaeA)侵染素(《MolekulareInfektionsbiologie》即分子感染生物学,Hacker、J.Heesemann、J.Heidelberg编,柏林,Spektrum,Akad.Verlag,2000)。
因此,本发明的一个优选实施方案涉及第一个方面的方法,其中完整目的基因编码在人体内引发免疫原性应答的多肽。
细菌素(bacteriocin)是具有针对不同细菌的抗微生物活性的小肽。它们是由一些细菌和真核物种合成的。范例是Leucocin A、片球菌素PA-1、肠菌素A和P、Sakacin A和P、和乳链菌肽。细菌素可用于保护食品免于细菌污染,因而在食品工业中具有潜在的商业价值。由于细菌素大多数是转运至胞外空间的分泌性肽,因此可以通过本发明的信号捕获方法使用合适的宿主生物体和合适的分泌性报告基因来分离其编码基因。为了分离以sec依赖方式分泌的细菌素,可以使用sec依赖性报告基因,如β-内酰胺酶。
最近几年已经表征了大量的细菌素,新细菌素的大多数属于II型细菌素,它们是在翻译后通常不再进行修饰的小型(30-100个氨基酸)热稳定蛋白质。根据共同特性,可以将一些II型细菌素细分成组,诸如片球菌素样和强抗李司特氏菌属细菌素、双肽细菌素、和具有sec依赖性信号序列的细菌素。除了包含sec依赖性信号序列的很少一些细菌素以外,II型细菌素是以包含N端双甘氨酸前导序列的前体形式合成的。包含双甘氨酸前导序列的细菌素的加工伴随着细胞外在化,这是由已经显示具有N端蛋白水解结构域的专性ABC转运蛋白系统进行的(I.F.Nes等人,1996,Int J Gen Mol Microbiol,70113-128)。
本发明的一个优选实施方案涉及第一个方面的方法,其中完整目的基因编码细菌素。
植物致病细菌、真菌、和其它微生物的许多致病性因子是分泌性蛋白质,如根癌土壤杆菌的vir基因编码介导由细菌至植物细胞的tDNA转移的分泌性蛋白质。这种转移是根癌土壤杆菌的致病性所必需的。同样,真菌物种像玉蜀黍黑粉菌(玉米黑穗病的病因)分泌涉及真菌的致病性的蛋白质。其它细菌植物病原体是假单胞菌种、黄单胞菌种、和寡养单胞菌种。本发明的方法可用于分离编码涉及植物致病性的分泌性蛋白质的基因,而且这些蛋白质继而可用于设计分泌性蛋白质的抑制剂。
因此,本发明的一个优选实施方案涉及第一个方面的方法,其中完整目的基因编码植物致病多肽。
如上所述,本发明的方法可用于分离稍后以工业规模表达的目的基因,然而这有可能需要构建表达系统,诸如本领域所描述和本文其它部分所参考的。
本发明的一个优选实施方案涉及第一个方面的方法,其中进行构建表达系统的额外步骤,所述表达系统包含第一个方面中分离的完整目的基因。
通过本发明的方法分离得到的目的基因,优选由基因文库分离得到的基因。
由上述方面定义的目的基因编码的酶。
包含上述方面定义的目的基因的表达系统。
包含上述方面定义的表达系统的宿主细胞。
包含上述方面定义的目的基因的至少两个染色体整合拷贝的宿主细胞。
用于生产多肽的方法,包括在适合于表达上述方面定义的目的基因的条件下培养上述方面定义的宿主细胞,其中所述宿主细胞将由所述基因编码的多肽分泌到生长培养基中。
本发明的一个优选实施方案涉及最后一个方面的方法,其中多肽是酶。
最后,本发明的一个优选实施方案涉及最后一个方面的方法,其中进行纯化多肽的额外步骤。
实施例实施例1包含β-内酰胺酶报告基因的SigA转座子的构建
此实施例利用切除了分泌信号的β-内酰胺酶。β-内酰胺酶只有在被分泌至周质时才赋予大肠杆菌以氨苄青霉素抗性,而β-内酰胺酶的胞质表达不赋予氨苄青霉素抗性。在不含信号序列时,β-内酰胺酶不会转运至周质,因而克隆不会在包含氨苄青霉素的培养基上生长。使用下文所述转座子的体外转座将β-内酰胺酶基因转移至靶克隆。
包含无信号β-内酰胺酶基因的转座子的构建是使用标准分子生物学技术进行的。首先使用校读聚合酶(例如Pfu Turbo)由商品化来源(诸如载体pUC19)PCR扩增无信号β-内酰胺酶基因。生成的PCR片段包含限制性位点NotI和EcoRI以便于克隆。
使用校读聚合酶(Pfu Turbo)和引物MuA-F(SEQ ID NO1)5’-GAAGATCTGAAGCGGCGCACGA由商品化来源(Finnzymes)PCR扩增编码氯霉素抗性的微型转座子MuA。纯化包含PCR片段的转座子,并连接到包含卡那霉素抗性基因的载体pK184中。
将连接混和液电穿孔到大肠杆菌DH10B中,并在包含氯霉素和卡那霉素的LB培养基上选择包含插入了转座子片段的pK184的克隆。回收了许多菌落,并由其中10个分离质粒DNA。测序揭示无信号β-内酰胺酶基因正确插入了质粒pK184中所含的转座子MuA中(M.G.Jobling、R.K.Holmes,1990,Construction of Vectors with the p15a replicon,kanamycin resistance,inducible lacZalpha and pUC18 or pUC19multiple cloning sites即具有p15a、卡那霉素抗性、诱导性lacZα、和pUC18或pUC19多克隆位点的载体的构建,Nucleic Acids Res.,185315-5316)。
无信号β-内酰胺酶基因包含于转座子中的方式使得转座子边界区(在MuA的情况中是大约50bp)与β-内酰胺酶编码区之间存在连续的开放读码框。以这种方式修饰的转座子在转座到编码分泌性蛋白质的基因中后能够引起与靶基因的符合读码框式融合。这导致融合基因产物分泌至大肠杆菌的周质且引起氨苄青霉素抗性。不是分泌基因中的所有转座事件都导致成功的符合读码框式融合,但是在使用正选择时,我们能够进行大量筛选,并由此选择甚至很稀少的事件。实施例2包含β-内酰胺酶报告基因的SigA2转座子的构建
包含无信号β-内酰胺酶基因的转座子的构建是使用标准分子生物学技术进行的。首先使用校读聚合酶(Pfu Turbo,Stratagene,美国)由载体pUC19 PCR扩增无信号β-内酰胺酶基因。生成的PCR片段包含限制性位点NotI和EcoRI以便于克隆。包含Entranceposon和抗生素抗性标记CAT(在转座子中编码氯霉素抗性)的质粒pEntranceposon(Camr)得自Finnzymes,OY(Espoo,芬兰)。将质粒用限制酶NotI和EcoRI消化,凝胶纯化,并连接包含无信号β-内酰胺酶的片段。将连接反应转化到电击感受态DH10B细胞中,并通过限制性分析来鉴定包含插入了无信号B-内酰胺酶的重组质粒的大肠杆菌克隆,称为大肠杆菌SigA2。使用QiaSpin方案由大肠杆菌SigA2分离质粒DNA并用BglII消化。使用GFX方案凝胶纯化包含转座子的DNA片段。该DNA片段即包含无信号β-内酰胺酶的转座子,称为SigA2。实施例3包含无信号β-内酰胺酶的SigA转座子作为报告基因在胞外木糖葡聚糖酶XYG1006的信号捕获中的使用
首先将SigA微型转座子转座到克隆的亚基因组片段中,所述片段包含编码可测定的分泌性基因产物的已知基因。在此实施例中我们使用来自多粘类芽孢杆菌(Paenibacillus polymyxa)的木糖葡聚糖酶。木糖葡聚糖酶是可以由大肠杆菌DSM 13321中的质粒获得的4.6kb亚基因组克隆片段上的大型开放读码框(3036bp)。
步骤1使用Pfu turbo聚合酶(Stratagene公司,美国)通过psigA的PCR制备线性微型转座子,其中使用引物muA-f(SEQ ID NO1)扩增完整的微型转座子。使用GFX柱(Pharmacia)纯化微型转座子,稀释至23ng/μl,并用于标准Finnzyme GPS转座方案。
步骤2依照原始的Finnzymes方案,在Eppendorf管中以适当浓度混和信号捕获微型转座子SigA、质粒pXYG1006、5x缓冲液、和转座酶(transposome)并进行体外转座反应。平行进行使用相同质粒和原始CAM微型转座子的对照实验。在Biorad Gene Pulse装置(50μF,25mA,1.8kV)中通过电穿孔将转座反应物转化到大肠杆菌xL1-blue电击感受态细胞(Stratagene,美国)中。在1ml SOC培养基中稀释细胞,并在37℃摇床中预保温1小时。将适当稀释液涂布在下文所列LB固体培养基上,以测定转化、转座、和信号捕获效率(见表1所示)。固体LB培养基LB-kan(50mg/ml卡那霉素)LB-CAM(10mg/ml氯霉素)LB-CAM-amp(10mg/ml氯霉素、100mg/ml氨苄青霉素)LB-CAM-amp AZCL-木糖葡聚糖(10mg/ml氯霉素、50mg/ml氨苄青霉素、0.07%w/v AZCL-木糖葡聚糖)
将在LB-CAM-AMP上生长的菌落复制涂布到LB-CAM-amp AZCL-木糖葡聚糖上,以获得位于ORF前900bp中的木糖葡聚糖酶结构域的破坏频率。表1进入pXYG1006的转座的典型结果
在氨苄青霉素和氯霉素上选择的大肠杆菌克隆中,β-内酰胺酶报告基因与XYG1006木糖葡聚糖酶基因发生了翻译融合,因而XYG1006信号肽引起β-内酰胺酶转运至大肠杆菌的周质。测序确认了阳性克隆在信号序列下游包含转座子。使用Qiaspin流程(Qiagen)由10个随机的氨苄青霉素抗性菌落制备质粒DNA,并使用对转座子特异的两种引物由质粒测定DNA序列SigA-r(SEQ ID 2)GCACCCAACTGATCTTCAGCA,和SeqB(SEQ ID 3)TTATTCGGTCGAAAAGGATCC;或SigA2up(SEQ ID 4)AGCGTTTGCGGCCGCGATCC,和SeqB(SEQ ID 3).
分析指示SigA转座子位于XYG1006编码区,且符合木糖葡聚糖酶的开放读码框。β-内酰胺酶基因与XYG1006天然信号肽的符合读码框式融合的典型范例如下
作为能够在双重选择平板(LB-CAM-amp)上生长的信号菌落分离克隆pSigA2-11。使用QiaspinTM质粒制备试剂盒(Qiagen GMBH)由该分离菌制备质粒DNA。使用引物SeqA和SeqB(Finnzyme公司)对质粒DNA测序,其中在ABI Prizm 377测序仪中使用ABI测序试剂盒进行反应。克隆pSigA2-11的DNA序列分析指示SigA2转座子在距木糖葡聚糖酶编码基因XYG1006的ATG起始密码子58bp处插入,在该基因与分泌性报告基因β-内酰胺酶基因之间发生符合读码框式融合。这导致19个氨基酸的分泌信号肽与β-内酰胺酶融合,将β-内酰胺酶有效靶向大肠杆菌的周质。实施例4包含无信号β-内酰胺酶的转座子SigA2在胞外支链淀粉酶PULL1012的信号捕获中作为报告基因的使用
首先将SigA2微型转座子转座到克隆的亚基因组片段中,所述片段包含编码可测定的分泌性基因产物的已知基因。在此实施例中,我们使用来自Anaerobranca horikoshii DSM 9786的PULL 1012支链淀粉酶编码基因。支链淀粉酶是由3054bp亚基因组克隆片段上的大型开放读码框(2597bp)编码的。使用GFX柱(Pharmacia)纯化SigA2微型转座子,将纯DNA稀释至20ng/μl,并用于标准Finnzyme GPS转座方案。
依照原始的Finnzymes方案,在EppendorfTM管中以适当浓度混和信号捕获微型转座子SigA2、质粒pPULL1012、5x缓冲液、和MuA转座酶并进行体外转座反应。将在Biorad Gene Pulse装置(设置50μF,25mA,1.8kV)中通过电穿孔将转座反应物转化到大肠杆菌DH10B电击感受态细胞(Stratagene,美国)中。电穿孔后,在1ml SOC培养基中稀释细胞,在37℃摇床中预保温1小时,并涂布到包含卡那霉素、氨苄青霉素、和氯霉素的LB琼脂上。
在卡那霉素、氨苄青霉素、和氯霉素上选择的大肠杆菌克隆中,β-内酰胺酶报告基因与PULL1012支链淀粉酶基因发生翻译融合,使得PULL1012信号肽引起β-内酰胺酶转运至大肠杆菌的周质。DNA测序确认了所有阳性克隆都在PULL 1012信号序列下游包含转座子。使用QiaspinTM流程(Qiagen)由15个随机的氨苄青霉素抗性菌落制备质粒DNA,并使用对转座子特异的两种引物即SigA2up(SEQ ID NO4)和SeqB(SEQ ID NO3)由这些克隆测定DNA序列。结果显示于图1。
在有些情况中,分泌信号报告基因将插入宿主基因组,其插入编码分泌性多肽的基因的方式能使得生成的融合多肽保留分泌性多肽的活性。例如,分泌信号报告基因可以位于基因的较远3’端,正如在此实施例中分离的2个克隆的情况Tn4-12-ab 1(14>777)和Tn4-4-.ab(17>719)。截短的支链淀粉酶与分泌性报告基因β-内酰胺酶的融合多肽在这两个克隆中都保留了实质的支链淀粉酶活性,如图1中以方框所示。
本发明的筛选步骤可以设定成筛选分泌性报告基因和目的酶活性(诸如支链淀粉酶)二者,这将能够非常快速且有效的筛选特定的分泌性蛋白质,而非仅仅筛选这种分泌性蛋白质。在与高通量筛选测定法的联合中,这种技术可作为有力的筛选工具用于分离编码具有特别感兴趣的可筛选活性的分泌性多肽的基因。
另外,可以将本发明方法的DNA片段中所包含的编码分泌性报告蛋白的基因以符合读码框的方式连接在编码特定蛋白水解酶的靶序列的DNA序列的上游,其连接方式能使得插入分泌信号后面之后,提供由下列各项组成的融合多肽1)由本发明的插入DNA片段上游的DNA序列编码的分泌信号和多肽;2)包含蛋白水解靶位点的接头;和3)分泌性报告蛋白。
这种构造在筛选具有目的活性的分泌性融合多肽(像上述两种支链淀粉酶融合体)时或筛选抗体和其它生物学活性分子时尤其有利。在分离得到目的融合多肽后,能够通过培养分离得到的初级克隆快速进行大量生产。可以用特定的蛋白水解酶处理获得的融合多肽以切割连接活性多肽与分泌性报告基因的靶位点,然后几乎立即可以鉴定基本纯的活性多肽。针对分泌性报告基因的抗体可用于初步的纯化或分离步骤,或者本发明的DNA片段可以包含能够进行His/NiTa柱纯化的多组氨酸接头。该概述的流程将规避克隆并表达基因组克隆的通常困难且费时的许多步骤。PCT DK00/00296显示了融合接头的范例,上文也有提及。实施例5使用转座子SigA在基因组文库中鉴定包含信号序列的蛋白质的编码基因
依照实施例2中描述的方法,用信号捕获微型转座子SigA给亚基因组质粒DNA文库做上标签。在此实施例中,我们使用通过标准方法制备的饲料类芽孢杆菌(Paenibacillus pabuli)基因组文库。转化物应当涂布在培养基1、2、和3上(表2)。表2进入饲料类芽孢杆菌基因组文库的转座的典型结果
由在存在氯霉素和氨苄青霉素时(选择培养基3)能够生长的阳性克隆分离质粒DNA,而且可以用靶向位于转座子中的序列的引物进行测序。可以这种方式获得信号捕获基因的DNA序列。在许多情况中,由两种转座子引物读取的序列将获得编码区的大部分遗传序列,或者可以由第一轮获得的序列合成定制引物以完成基因序列。另一种方法是生成比完全覆盖文库所需多3-100倍的转化体。这使得转座子能够在几个独立的转座事件中在每个克隆内到达相同基因,但在该基因的不同位置。可以将计算机毗连序列群装配程序适用于装配呈现相同基因的交叠区的转座体。以这种方式获得许多分泌性基因的完全或几乎完全覆盖。实施例6使用新型转座子SigA2在基因组文库中鉴定具有信号序列的蛋白质的编码基因
在此实施例中我们使用通过标准方法制备的类芽孢杆菌NN018026(2001年2月8日保藏于DSMZ,保藏号DSM 14046)基因组文库。依照实施例2中描述的方法,用信号捕获微型转座子SigA2给亚基因组质粒DNA文库做上标签。具体而言,在标准Finnzymes转座方案中使用1μl(1.85μg)质粒DNA文库、4μl 5x反应缓冲液、1μl(200μg)SigA片段、和13μl水。将转化混和液涂布在培养基1、2、和3上(表3),结果显示于表3。表3进入类芽孢杆菌基因组文库的转座的典型结果
通过QiaspinTM或Qiaprep turboTM mini prep(Qiagne公司)由能够在选择培养基3上在存在氯霉素(CAM)、卡那霉素(kan)、和氨苄青霉素(amp)时生长的阳性克隆分离质粒DNA。用向上读取信号捕获基因的SigA2up引物(SEQ ID NO4)或向下读取捕获基因的SeqB引物(SEQ ID NO3)对质粒DNA进行测序。以这种方式获得信号捕获基因的DNA序列。在许多情况中,只由两种转座子引物读取的序列将得到编码区的大部分序列,或者可以由在第一轮中获得的序列合成定制引物,并通过“引物行走”测序完成序列。
获取完整序列的另一种方法是生成比完全覆盖文库所需多3-100倍的转化体。这使得转座子能够到达相同基因,但在基因的不同位置,从而能够分离得到几个克隆,每一个都代表独立的转座事件。可以将计算机毗连序列群装配程序适用于装配代表相同基因的交叠区的转座体。以这种方法可以完全或几乎完全覆盖许多分泌性基因,例如可以通过图1所示许多交叠序列的毗连序列群装配来推导实施例4的PUL1012支链淀粉酶编码基因的完整序列。
在此实施例中,鉴定了来自编码假定蛋白质的几个不同开放读码框的信号序列,包括显示与分泌酶有序列相似性的几种基因-1种支链淀粉酶-3种纤维素酶-3种几丁质酶-1种纤维二糖水解酶(cellubiohydrolase)-1种异麦芽糖葡聚糖酶(isomaltodextranase)-2种果胶酸裂解酶-1种鼠李糖半乳糖醛酸聚糖酶(rhamogalacturonase)-1种海藻酸裂解酶-1种果聚糖酶
合计鉴定了显示与所述假定分泌性蛋白质有显著序列相似性或包含预测为蛋白质分泌的信号序列的序列的12种基因。鉴定了编码推定分泌性青霉素结合蛋白的2种基因。鉴定了编码推定分泌性溶质结合蛋白的7种基因。2种基因编码推定跨膜蛋白。编码推定整合型膜蛋白、与斯氏梭菌(Clostridium sticklandii)的bmpA相似(50%氨基酸同一性)的abc转运蛋白的底物结合脂蛋白前体和与LPLB蛋白质相似(40%氨基酸同一性)的推定膜蛋白的基因;以及编码位于细胞质膜外侧但通过锚定肽附着于膜的蛋白质(诸如根癌土壤杆菌的推定多种糖结合周质受体chve前体(68%氨基酸同一性)或大肠杆菌的D-木糖结合周质蛋白前体(43%氨基酸同一性))的基因。实施例7使用来自信号捕获计划的信息
第一步是由基因文库获取编码分泌性蛋白质的所有或许多基因的序列信息。大多数捕获的基因代表具有已知或未知功能的分泌性酶。可以将基因相应的分成两类并进行相应的处理。
一类ORF与已知酶在氨基酸水平具有显著相似性。可以将这些ORF亚克隆到最佳表达载体中,而且可以将构建物用于表达显著水平的酶,然后可以在各种应用中进行测试。
另一类ORF与任何已知酶不具有显著同源性,但是同样感兴趣。可以将这些ORF以与已知ORF相同的方式亚克隆到表达载体中并进行表达。然而,由于这些ORF的酶活性(如果有的话)是未知的,因此没有特定的测定法来监控它们的活性,而随机应用测试是适当的。实施例8使用转座子的真核信号捕获
许多真核生物也分泌酶,例如真菌分泌许多类型的酶,包括蛋白酶、纤维素酶、和脂肪酶。由于真核基因组的相对大小和复杂性,通常由cDNA文库表达克隆编码酶的基因,或者在EST(表达序列标签)测序程序中进行鉴定。cDNA文库是由自真核生物的诱导后生物量分离的mRNA生成的。用于在cDNA文库中呈现分泌性酶的广泛多样性的方法在本领域是已知的,这些方法包括合并来自分开的且不同的诱导条件的生物量材料,随后在克隆之前或之后将mRNA或cDNA标准化。
原核生物和真核生物中的信号捕获基本理论本质上是相同的。主要差异如下cDNA文库依赖于由克隆载体提供的启动子。cDNA文库是表达的基因组子集,意味着转座进入编码区的命中率高于原核基因组文库的信号捕获。
信号捕获标记必须是对所筛选的生物体特异的。通常,用于筛选真菌基因的生物体是例如酿酒酵母、黑曲霉、或粟酒裂殖酵母。在此实施例中我们使用K.A.Jacobs,1997,Gene,198289-296中描述的转化酶信号捕获系统。
通过PCR克隆修饰后的转化酶基因以包含NotI和EcoRI位点,用于以符合读码框的方式克隆到pSigA微型转座子中。通过限制性消化切除β-内酰胺酶并凝胶纯化。连接反应能够将转化酶基因克隆到pSigA微型转座子中,使得转化酶以符合读码框的方式融合转座子左界,读码框完全如pSigA的原核版本中所述。完成的克隆pSigB即可用于酵母中的测试。
在包含已经表达克隆的分泌性酶的cDNA编码区的质粒上进行初步测试。cDNA是编码棘孢曲霉(Aspergillus aculeatus)的鼠李糖半乳糖醛酸聚糖酶的rhgA基因(Kofod等人,1994,J Biol Chem,4629182-29819)。完全如上文细菌方法中所述使用23ng SigB微型转座子进行体外转座反应。然后将处理后的rhgA质粒转化到消除了天然转化酶基因的酵母细胞W3124中。以高密度(1000菌落/平板)涂布菌落并复制涂布到包含蔗糖或棉子糖的SC培养基(F.Sherman,1991,Methods Enzymol.,1943-21)上;典型结果显示于表4。表4进入pRhgA的转座的典型结果
通过Strathern和Higgens,1991,Methods Enzymol.,194319-239的方法,将来自能够在蔗糖上生长的酵母菌落的DNA挽救到大肠杆菌中。用Qiaspin方案(Qiagen)分离质粒DNA并用YES2.0载体引物和转座子引物对质粒测序以测定插入片段的序列。在大多数情况中,用上述引物测定的序列足以完成cDNA的序列覆盖,从而能够分析全长基因和构建有活性的表达克隆。实施例9使用携带复制起点的转座子在宿主细胞的基因组中鉴定编码分泌性蛋白质的基因
这种方法的优点是转座子中存在的复制起点能够直接使得由转座子标记的基因组宿主细胞DNA形成转座子-质粒。在此实施例中使用寡核苷酸引物ori-1和ori-2 PCR扩增质粒pBR322中携带colE1复制起点的碱基对1763-3147区域ori-15′-CGCGGATCCTACATCTGTATTAACGAAGCGC(SEQ ID 5).ori-25′-CGCGGATCCCGTAGAAAAGATCAAAGGAT(SEQ ID 6).
用限制性内切核酸酶BamHI在制造商推荐的条件下切割生成的PCR扩增子。用BamHI部分消化包含质粒pSigA2的SigA2转座子(包含两个BamHI位点),并将大约1.4kb的PCR扩增子的片段连接到位于第2149位的单个BamHI切割位点中。然后用酶BglII限制性消化连接构建物,由质粒主链释放期望的转座子-复制子片段。然后对DNA进行额外的连接步骤并转化到大肠杆菌DH5α中。将转化体涂布在LB氯霉素选择培养基上。然后将能够在选择压力下生长的菌落复制涂布到LB氨苄青霉素和LB氯霉素上。选择只在LB氯霉素上生长的几个菌落,用于质粒分离和序列分析。选择经确认在BamHI位置具有正确的ColE1复制起点取代的质粒,命名为pMuori。
可以与先前实施例中所示相同的方式通过凝胶纯化来制备pMuori的转座子片段。纯化后,可以两种方式使用分离的转座子1)可以在体外使用转座子来处理分离自目的生物体且经部分消化和大小分离的基因组DNA。大小分离后的DNA的大小范围应当是1000bp或更大,以提高在随后选择中回收全长基因的可能性。用于这种处理的方案与实施例4(类芽孢杆菌实施例)相同,但是在转座后用DNA连接酶连接生成的混和液,以将线性DNA片段环化。然后将生成的环化后DNA用于转化大肠杆菌筛选宿主。选择方案与实施例4完全相同。
使用Muori转座子的第二种方式是首先用转座子和转座酶生成转座体复合物。这种商品化系统的一个范例是Epicentre technologies(美国)“EZ∷Tn”系统。本质上,在缺乏镁时,可以形成稳定的转座体复合物,它只在镁存在时才插入外源DNA。在转化到靶宿主中之后,细胞中存在的生理镁激活转座体复合物,从而能够在体内转座进入染色体DNA。对于我们的目的,信号捕获转座子也可用于进入靶生物体的体内转座。然后由被处理的生物体分离染色体DNA,通过随机剪切或限制酶部分消化将DNA缩短成片段,并用DNA连接酶进行连接。然后可以将生成的DNA用于转化适当的筛选宿主,在此实施例中是大肠杆菌DH5α。完全如实施例4的筛选也能导致包含转座子的菌落的回收,其中复制起点插入基因组DNA片段,其插入方式使得可提供选择标记(在此实施例中是氨苄青霉素)的抗性。分离并纯化生成的质粒,用引物SigA2up(SEQ ID NO4)和SeqB(SEQ ID NO3)进行测序。序列表<110>Novozoymes A/S
Duffner,Fiona
Wilting,Reinhard
Schnorr,Kirk<120>信号序列捕获<130>10018.204-WO<150><160>6<170>PatentIn version 3.0<210>1<211>22<212>DNA<213>引物MuA-F<400>1gaagatctga agcggcgcac ga 22<210>2<211>21<212>DNA<213>引物SigA-r<400>2gcacccaact gatcttcagc a 21<210>3<211>21<212>DNA<213>引物SeqB<400>3ttattcggtc gaaaaggatc c 21<210>4<211>20<212>DNA<213>引物SigA2up<400>4agcgtttgcg gccgcgatcc20<210>5<211>31<212>DNA<213>引物ori-1<400>5cgcggatcct acatctgtat taacgaagcg c 31<210>6<211>29<212>DNA<213>引物ori-2<400>6cgcggatccc gtagaaaaga tcaaaggat 29
权利要求
1.用于由基因文库鉴定并分离目的基因的方法,其中所述基因编码携带用于分泌或部分分泌的信号序列的多肽,所述方法包括下列步骤
a)提供基因组DNA文库或cDNA文库;
b)在所述文库中插入包含编码分泌报告蛋白的无启动子且无分泌信号的多核苷酸的DNA片段;
c)将包含插入DNA片段的文库导入宿主细胞;
d)筛选并选择分泌或部分分泌有活性的分泌性报告蛋白的宿主细胞;
e)通过对插入的DNA片段侧翼的DNA测序,在选定宿主细胞中鉴定插入了分泌性报告基因的目的基因;
f)分离在步骤(e)中鉴定的完整目的基因。
2.权利要求1的方法,其中步骤(f)的完整目的基因是由步骤(a)的文库分离的。
3.权利要求1或2的方法,其中步骤(b)是在体外进行的。
4.权利要求1-3任一项的方法,其中cDNA或cDNA文库是标准化的。
5.权利要求1-4任一项的方法,其中基因组DNA文库或cDNA文库衍生自微生物。
6.权利要求5的方法,其中微生物是真菌、丝状真菌、或酵母。
7.权利要求5的方法,其中微生物是细菌。
8.权利要求5的方法,其中微生物是古细菌。
9.权利要求1-4任一项的方法,其中基因组DNA文库或cDNA文库衍生自多细胞生物体,优选哺乳动物细胞,最优选人类细胞。
10.权利要求1-9任一项的方法,其中权利要求1的DNA片段包含转座子,优选MuA转座子。
11.权利要求1-10任一项的方法,其中DNA片段包含在宿主细胞中有功能的复制起点,优选的是复制起点在大肠杆菌中有功能,更优选的是复制起点是colE1、oriV、P15A、或colDF13的衍生物,最优选的是复制起点是colE1。
12.权利要求1-11任一项的方法,其中分泌性报告蛋白是在由宿主细胞分泌时使所述细胞能够在原本抑制其生长的物质存在时生长的蛋白质。
13.权利要求12的方法,其中分泌性报告蛋白是β-内酰胺酶或转化酶。
14.权利要求1-13任一项的方法,其中步骤(b)的DNA片段的多核苷酸编码携带N端肽接头的分泌性报告蛋白,所述肽接头包含蛋白水解切割的特异靶位点。
15.权利要求1-14任一项的方法,其中宿主细胞是细菌。
16.权利要求15的方法,其中细菌宿主细胞是埃希氏菌属(Escherichia)、乳球菌属(Lactococcus)、链霉菌属(Streptomyces)、肠球菌属(Enterococcus)、或芽孢杆菌属(Bacillus)细胞,优选物种大肠杆菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、灰色链霉菌(Streptomyces griseus)、天蓝色链霉菌(Streptomyces coelicor)、粪肠球菌(Enterococcusfaecalis)、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacillus circulans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillusthuringiensis)细胞。
17.权利要求1-14任一项的方法,其中宿主细胞是真菌。
18.权利要求17的方法,其中真菌宿主细胞是假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、Yarrowia属、顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球酵母属(Cryptococcus)、Filibasidium属、镰孢属(Fusarium)、腐质霉属(Humicola)、Magnaporthe属、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix属、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Piromyces属、裂褶菌属(Schizophyllum)、Talaromyces属、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、Tolypocladium属、或木霉属(Trichoderma)细胞。
19.权利要求18的方法,其中真菌宿主细胞是物种酿酒酵母(Saccharomyces cerevisiae)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、或米曲霉(Aspergillusoryzae)细胞。
20.权利要求1-14任一项的方法,其中宿主细胞是哺乳动物。
21.权利要求1-20任一项的方法,其中权利要求1中的测序步骤是使用针对权利要求1的DNA片段的至少一种引物或使用针对载体的至少一种引物进行的,其中权利要求1的DNA文库或cDNA文库得到克隆。
22.权利要求1-21任一项的方法,其中完整目的基因的分离是利用权利要求1中的测序步骤获得的DNA序列信息进行的。
23.权利要求1-22任一项的方法,其中完整目的基因编码由宿主细胞分泌的酶。
24.权利要求1-22任一项的方法,其中完整目的基因编码膜结合性受体,优选双成分信号(TCS)转导受体,更优选细胞因子受体。
25.权利要求1-22任一项的方法,其中完整目的基因编码分泌性多肽细胞因子。
26.权利要求1-22任一项的方法,其中完整目的基因编码在人体内引发免疫原性应答的多肽。
27.权利要求1-22任一项的方法,其中完整目的基因编码细菌素。
28.权利要求1-22任一项的方法,其中完整目的基因编码植物致病多肽。
29.权利要求1-28任一项的方法,其中进行构建表达系统的额外步骤,所述表达系统包含权利要求1中分离的完整目的基因。
30.通过本发明的方法分离得到的目的基因,优选该基因是由基因文库分离得到的。
31.由权利要求30定义的目的基因编码的酶。
32.包含权利要求30定义的目的基因的表达系统。
33.包含权利要求32定义的表达系统的宿主细胞。
34.包含权利要求30定义的目的基因的至少两个染色体整合拷贝的宿主细胞。
35.用于生产多肽的方法,包括在适合于表达权利要求30定义的目的基因的条件下培养权利要求33或34定义的宿主细胞,其中所述宿主细胞将由所述基因编码的多肽分泌到培养基中。
36.权利要求35的方法,其中所述多肽是酶。
37.权利要求35或36的方法,其中所述进行纯化多肽的额外步骤。
全文摘要
本发明能够通过对先前构建的基因库或文库筛选在工业上感兴趣而使用常规筛选方法不太可能分离得到的分泌的、部分分泌的、或细胞表面展示的多肽(诸如酶、受体、细胞因子、肽激素等)的编码基因。本发明描述了由现有基因文库分离分泌的、部分分泌的、或细胞表面展示的多肽的编码基因的方法,其中使用体外多核苷酸插入反应来检测内源分泌信号序列,其中插入的多核苷酸包含无启动子且无分泌信号的分泌性报告基因。
文档编号C12N15/09GK1418250SQ0180684
公开日2003年5月14日 申请日期2001年3月22日 优先权日2000年4月7日
发明者F·杜福纳, R·威尔廷, K·施诺尔 申请人:诺沃奇梅兹有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1